Las proteínas NBS-LRR de las plantas son numerosas y de origen antiguo. Están codificadas por una de las mayores familias de genes conocidas en las plantas. Hay aproximadamente 150 genes que codifican NBS-LRR en Arabidopsis thaliana, más de 400 en Oryza sativa , y probablemente muchos más en genomas de plantas más grandes que aún no han sido secuenciados completamente. En la actualidad se han amplificado muchas secuencias que codifican NBS de una gran variedad de especies vegetales utilizando PCR con cebadores degenerados basados en secuencias conservadas dentro del dominio NBS y actualmente hay más de 1.600 secuencias NBS en bases de datos públicas (archivo de datos adicional 1). Se encuentran en plantas no vasculares y gimnospermas, así como en angiospermas; sin embargo, las relaciones ortólogas son difíciles de determinar debido a las duplicaciones y pérdidas de genes específicas de cada linaje. En varios linajes, los genes que codifican NBS-LRR se han amplificado, dando lugar a subfamilias específicas de la familia (Figura 2; Archivo de datos adicional 1) . De las 150 secuencias de NBS-LRR en Arabidopsis, 62 tienen regiones NBS más similares entre sí que con cualquier otra secuencia que no sea de Arabidopsis (Figura 2; Archivo de datos adicional 2). Se han amplificado diferentes subfamilias en las leguminosas (que incluyen las judías), las solanáceas (que incluyen el tomate y la patata) y las asteráceas (que incluyen el girasol y la lechuga) . El espectro de proteínas NBS-LRR presentes en una especie no es, por tanto, característico de la diversidad de proteínas NBS-LRR en otras familias de plantas.

Figura 2
figura2

Árbol de unión de vecinos que muestra la amplificación específica de familias de secuencias NBS. (a) TNLs. (b) CNLs. El árbol completo se basó en 1.600 secuencias (véanse los archivos de datos adicionales 1 y 2 para un árbol ampliado con secuencias individuales y los alineamientos utilizados). Los clados que contenían secuencias de familias de plantas individuales fueron colapsados en ramas individuales y se indica el número de secuencias en cada rama. A los distintos taxones se les asignan colores diferentes; los clados con representantes de varias familias se muestran en negro. La barra de escala representa cinco sustituciones de nucleótidos.

Los genes que codifican NBS-LRR están frecuentemente agrupados en el genoma, como resultado de duplicaciones tanto segmentarias como en tándem . Puede haber una amplia variación intraespecífica en el número de copias debido al cruce desigual dentro de los grupos. Los genes que codifican NBS-LRR presentan altos niveles de variación inter e intraespecífica, pero no altas tasas de mutación o recombinación. La variación se genera por mecanismos genéticos normales, incluyendo el cruce desigual, el intercambio de secuencias y la conversión de genes, más que por eventos genéticos particulares de los genes que codifican NBS-LRR.

La tasa de evolución de los genes que codifican NBS-LRR puede ser rápida o lenta, incluso dentro de un grupo individual de secuencias similares. Por ejemplo, el principal grupo de genes que codifican NBS-LRR en la lechuga incluye genes con dos patrones de evolución: los genes de tipo I evolucionan rápidamente con frecuentes conversiones génicas entre ellos, mientras que los genes de tipo II evolucionan lentamente con raros eventos de conversión génica entre clados. Esta tasa heterogénea de evolución es consistente con un modelo de nacimiento y muerte de la evolución de los genes R, en el que la duplicación de genes y el cruce desigual pueden ser seguidos por la selección purificadora dependiente de la densidad que actúa sobre el haplotipo, lo que resulta en un número variable de grupos de genes R que evolucionan de forma semi-independiente.

El impacto de la selección en los diferentes dominios de los genes individuales que codifican NBS-LRR es también heterogéneo . El dominio NBS parece estar sujeto a una selección purificadora pero no a frecuentes eventos de conversión génica, mientras que la región LRR tiende a ser muy variable. La selección diversificadora, indicada por las proporciones significativamente elevadas de sustituciones de nucleótidos no sinónimas y sinónimas, ha mantenido la variación en los residuos expuestos al disolvente de las hojas β del dominio LRR (véase más adelante). El entrecruzamiento desigual y la conversión de genes han generado una variación en el número y la posición de las LRR, y las inserciones y/o deleciones dentro del marco en las regiones entre las β-hojas han cambiado probablemente la orientación de las β-hojas individuales. Hay, de media, 14 LRRs por proteína y a menudo de 5 a 10 variantes de secuencia para cada repetición; por lo tanto, incluso dentro de Arabidopsis, existe el potencial de más de 9 × 1011 variantes, lo que enfatiza la naturaleza altamente variable de la superficie de unión putativa de estas proteínas.

Hay dos subfamilias principales de proteínas NBS-LRR de plantas, definidas por la presencia de motivos de receptor Toll/interleucina-1 (TIR) o de bobina enrollada (CC) en el dominio amino-terminal (Figura 1). Aunque las proteínas TIR-NBS-LRR (TNLs) y las proteínas CC-NBS-LRR (CNLs) están implicadas en el reconocimiento de patógenos, las dos subfamilias son distintas tanto en la secuencia como en las vías de señalización (ver más abajo) y se agrupan por separado en los análisis filogenéticos utilizando sus dominios NBS (ver archivo de datos adicional 2). Las TNLs están completamente ausentes en las especies de cereales, lo que sugiere que los primeros ancestros de las angiospermas tenían pocas TNLs y que éstas se perdieron en el linaje de los cereales. La presencia o ausencia de TNLs en las monocotiledóneas basales no se conoce actualmente. Los CNLs de monocotiledóneas y dicotiledóneas se agrupan, indicando que los ancestros de las angiospermas tenían múltiples CNLs (Figura 2) .

También hay 58 proteínas en Arabidopsis que están relacionadas con las subfamilias TNL o CNL pero que carecen del complemento completo de dominios . Estas incluyen 21 proteínas TIR-NBS (TN) y cinco CC-NBS (CN) que tienen dominios aminoterminales y NBS pero carecen de un dominio LRR . La función de estas proteínas se desconoce, pero tienen el potencial de actuar como adaptadores o reguladores de las proteínas TNL y CNL.

Los rasgos estructurales característicos

Las proteínas NBS-LRR son algunas de las proteínas más grandes conocidas en las plantas, que oscilan entre unos 860 y unos 1.900 aminoácidos. Tienen al menos cuatro dominios distintos unidos por regiones enlazadoras: un dominio aminoterminal variable, el dominio NBS, la región LRR y dominios carboxi-terminales variables (Figura 1). Se identificaron cuatro subfamilias de CNLs y ocho subfamilias de TNLs en Arabidopsis a partir de la homología de la secuencia, los motivos, las posiciones del intrón y la fase del intrón . No se han determinado estructuras cristalinas para ninguna parte de una proteína NBS-LRR de planta; sin embargo, se dispone de estructuras cristalinas de dominios NBS y LRR de mamíferos como plantillas para enfoques de modelado de homología.

El dominio amino-terminal

Hay poca información experimental sobre la función del dominio amino-terminal. En los animales, el dominio TIR está implicado en la señalización aguas abajo de los receptores tipo Toll. Se cree que muchas proteínas NBS-LRR de las plantas vigilan el estado de las dianas («guardianas») de los efectores de virulencia de los patógenos (véase más adelante). Dada la presencia de motivos TIR o CC, así como la diversidad de estos dominios, se cree que los aminoterminales están implicados en las interacciones proteína-proteína, posiblemente con las proteínas vigiladas o con los componentes de señalización posteriores. El polimorfismo en el dominio TIR de la proteína TNL L6 del lino afecta a la especificidad del reconocimiento de patógenos . Un motivo de alanina-poliserina que puede estar involucrado en la estabilidad de la proteína se encuentra inmediatamente adyacente a la metionina amino-terminal en muchas TNLs (pero no CNLs) en Arabidopsis . Cuatro motivos TIR conservados abarcan 175 aminoácidos dentro del dominio TIR de las TNLs . Un motivo CC es común pero no siempre está presente en los 175 aminoácidos amino-terminales del NBS de los CNLs . Algunas CNLs tienen grandes dominios amino-terminales; la Prf de tomate, por ejemplo, tiene 1.117 aminoácidos amino-terminales del NBS, gran parte de los cuales son exclusivos de esta proteína.

El dominio NBS

Se conoce más sobre la estructura y función del dominio NBS, que también se denomina dominio NB-ARC (adaptador de unión a nucleótidos compartido por las proteínas NOD-LRR, APAF-1, proteínas R y CED4). Este dominio contiene varios motivos definidos característicos de la familia de ATPasas de transducción de señales con numerosos dominios (STAND), que incluye las proteínas NOD de mamíferos. Las proteínas STAND funcionan como interruptores moleculares en las vías de señalización de las enfermedades. Se ha demostrado la unión específica y la hidrólisis de ATP en los dominios NBS de dos CNL de tomate, I2 y Mi . Se cree que la hidrólisis del ATP da lugar a cambios conformacionales que regulan la señalización posterior. El primer informe sobre la oligomerización de la proteína NBS-LRR, un evento crítico en la señalización de las proteínas NOD de mamíferos, es la oligomerización de la proteína N del tabaco (una TNL) en respuesta a los elicitores patógenos . En Arabidopsis, se han identificado ocho motivos NBS conservados mediante el análisis con MEME, un programa para la identificación de motivos . Los dominios NBS de las TNLs y CNLs se distinguen por las secuencias de tres motivos NBS de resistencia (RNBS) en su interior (motivos RNBS-A, RNBS-C y RNBS-D; véase el archivo de datos adicional 3).

El enhebrado de los dominios NBS de las plantas en la estructura cristalina de la APAF-1 humana proporciona información sobre la disposición espacial y la función de los motivos conservados en los dominios NBS de las plantas (Figura 3). El dominio de unión a nucleótidos de APAF-1 consta de tres subdominios: un subdominio α/β de tres capas (que contiene la región de anclaje), un subdominio helicoidal (que contiene el motivo quinasa-2 y el bucle P) y un subdominio de hélice alada (que contiene el motivo MHDV; Figura 3). La unión específica del ADP por parte del APAF-1 humano se consigue mediante un total de ocho enlaces de hidrógeno directos y cuatro mediados por agua; la parte del bucle P del subdominio helicoidal interactúa con los fosfatos α y β del ADP, un residuo de histidina y otro de serina en el subdominio de hélice alada interactúan con un fosfato y el azúcar del ADP, y una pequeña región de anclaje en el subdominio α/β estabiliza la base de adenina .

Figura 3
Figura 3

Estructuras predichas de los dominios NBS. Se generaron modelos estructurales para el dominio NBS de TNL RPS4 y CNL RPS5 de Arabidopsis utilizando una técnica de modelado homológico de campo medio autoconsistente, en ausencia de ADP. El ADP se añadió a los dos modelos de NBS por inferencia del complejo APAF-1-ADP sin un mayor refinamiento de los modelos para ilustrar la posición del nucleótido en relación con los motivos conservados. (a) Las estructuras de los dominios NBS de RPS4 y RPS5, mostrando las posiciones de los motivos conservados. Las estructuras de las proteínas se muestran como diagramas de cinta y el ADP se muestra como un modelo de barra. Los dominios NBS de tipo TIR y CC están formados por motivos, en orden desde el extremo amino: P-loop (o sitio Walker A, azul); RNBS-A (verde); kinase-2 (o sitio Walker B, magenta); RNBS-B (verde); RNBS-C (verde); GLPL (amarillo); RNBS-D (verde); MHDV (naranja). (b) Los sitios de unión de APAF-1 humano (código PDB 1z6tA), RPS4 de Arabidopsis y RPS5, mostrando los residuos que interactúan con ADP y ATP. La coordinación del ADP en las tres proteínas implica tres motivos diferentes conservados. Una pequeña región de anclaje en el extremo amino del dominio NBS coordina la adenina del ADP o del ATP, el bucle P coordina los α- y β-fosfatos, y el motivo MHDV (en el subdominio de hélice alada en APAF-1) coordina el azúcar o el β-fosfato del ADP. Los dos ácidos aspárticos terminales del motivo quinasa-2 están situados en el bolsillo en el que se asentaría el γ-fosfato del ATP. Las imágenes se generaron utilizando PyMol .

El bolsillo de unión y los patrones de unión al ADP están bien conservados en los modelos de rosca de las TNLs (ejemplificados por la proteína RPS4 de Arabidopsis) y las CNLs (ejemplificados por la proteína RPS5 de Arabidopsis; Figura 3) ( y P.K., trabajo no publicado). Los dominios NBS de las TNLs contienen bucles adicionales ausentes en el dominio NBS de las CNLs. Las TNLs y las CNLs tienen cuatro motivos conservados que se localizan alrededor de la hendidura catalítica: el bucle P, la región de anclaje y el motivo MHDV (específicamente el residuo de histidina), todos los cuales sirven para orientar la molécula de ADP, así como el motivo GLPL (los motivos MHDV y GLPL reciben el nombre de sus aminoácidos constituyentes en el código de una sola letra). Aunque no hay un contacto evidente entre el ADP y el motivo GLPL en el APAF-1 humano, la conservación de su posición en la parte superior del sitio de unión en el APAF-1, el RPS4 y el RPS5 indica que puede estar implicado en la unión del ADP. Además, los dos últimos ácidos aspárticos en el motivo de la quinasa-2 están posicionados para interactuar con el tercer fosfato del ATP, lo que concuerda con su papel de coordinación para el ion metálico divalente necesario para las reacciones de fosfotransferencia, por ejemplo el Mg2+ del Mg-ATP (Figura 3). La región de anclaje en el subdominio α/β de APAF-1, que consiste en la secuencia Val-Thr-Arg, está presente como Phe-Gly-Asn en RSP4 y como Val-Gly-Gln en RPS5. Esta región de anclaje, que consiste en un aminoácido hidrofóbico (Val o Phe), un aminoácido pequeño (Gly o Thr) y un aminoácido polar (Arg, Asn o Gln), no había sido reconocida anteriormente, pero está muy conservada en las proteínas NBS-LRR de las plantas (véase el archivo de datos adicional 3). Las mutaciones autoactivadoras en dos CNLs, Rx de patata (Asp460Val) y I2 de tomate (Asp495Val), mapean junto a la histidina en el motivo MHDV; estas mutaciones pueden perturbar la unión del β-fosfato de ADP y dar lugar a una estructura más abierta .

El dominio LRR

El dominio LRR es un motivo común que se encuentra en más de 2.000 proteínas, desde virus hasta eucariotas, y está implicado en las interacciones proteína-proteína y en la unión de ligandos . Las estructuras cristalinas de más de 20 proteínas LRR han revelado que los dominios LRR contienen característicamente una serie de hojas β que forman la cara cóncava con forma de herradura o plátano . Sin embargo, se sabe menos sobre las disposiciones cuaternarias de las proteínas LRR. Se han observado al menos tres tipos diferentes de dímeros, que implican interacciones de sus superficies cóncavas o sus superficies convexas , o por concatenación que implica una hoja β antiparalela en la interfaz . El enhebrado del dominio LRR de Arabidopsis RPS5 en la estructura cristalina de la proteína decorina bovina, un miembro de la familia de proteínas LRR pequeñas (SLRP) con un núcleo proteico compuesto por LRRs , proporcionó un modelo consistente con una superficie curva en forma de herradura de β-hojas (Figura 4; P.K., trabajo no publicado). El número de repeticiones en los dominios LRR en las TNLs y CNLs de Arabidopsis es similar (media 14, rango 8 a 25), pero este número puede ser considerablemente mayor en otras especies. En las proteínas CNL Resistance Gene Candidate 2 (RGC2), un ejemplo de las cuales es Dm3, el dominio LRR parece estar duplicado y puede haber hasta 47 LRRs en total. Cada LRR comprende un núcleo de unos 26 aminoácidos que contiene el motivo Leu-xx-Leu-xx-Leu-xx-Cys/Asn-xx (donde x es cualquier aminoácido), que forma una hoja β; cada región del núcleo está separada por una sección de longitud variable que varía de cero a 30 aminoácidos. En muchas proteínas NBS-LRR, los supuestos residuos expuestos al disolvente (mostrados como x en la secuencia de consenso anterior) muestran proporciones significativamente elevadas de sustituciones no sinónimas frente a sinónimas, lo que indica que la selección diversificadora ha mantenido la variación en estas posiciones. El dominio LRR está implicado en la determinación de la especificidad de reconocimiento de varias proteínas R (por ejemplo ); sin embargo, rara vez se ha demostrado la interacción directa con proteínas patógenas.

Figura 4
figura4

La estructura predicha de un dominio LRR resultante del enhebrado del dominio LRR de Arabidopsis RPS5 en la decorina bovina (código PDB 1xku). (a) Una representación cartográfica de la estructura predicha del dominio LRR de RPS5 generada con PyMol . Las hojas β que forman la cara cóncava de la «herradura» se representan como flechas. Los residuos alifáticos conservados se muestran en azul. N, extremo amino; C, extremo carboxilo. (b) Alineación de las 12 repeticiones ricas en leucina de la decorina y de las 13 repeticiones de RPS5, así como de los nueve aminoácidos aminoterminales. Los residuos alifáticos conservados se muestran en azul.

El dominio LRR puede estar implicado predominantemente en interacciones reguladoras intramoleculares. El dominio LRR de la CNL Rx de la patata interactúa con el dominio NBS incluso cuando se expresa en trans; esta interacción es interrumpida por el elicitor del virus X de la patata, una proteína de la cubierta viral que puede inducir una respuesta de defensa del huésped . Además, la superficie interna y cóncava de las hojas β puede no ser la única superficie de unión. Se predice que el dominio LRR de TLR3, un receptor humano tipo Toll, forma un heterodímero y se une al ARN de doble cadena de los patógenos contra su superficie en forma de bucle, en el lado opuesto a las hojas β .

El análisis mediante MEME identificó pocos motivos en común entre los dominios LRR de TNLs y CNLs en Arabidopsis . El tercer LRR era uno de los pocos que contenía un motivo conservado. La mutación en este LRR del CNL RPS5 da lugar a efectos inhibitorios epistáticos sobre múltiples proteínas NBS-LRR, lo que sugiere que el LRR puede interactuar con componentes de señalización aguas abajo; además, una mutación en este LRR en el CNL Rx de la patata da lugar a una forma constitutivamente activa.

Los extremos carboxílicos

Los CNLs y los TNLs difieren notablemente en el tamaño y la composición de sus dominios carboxi-terminales. Los de las TNLs son más grandes y más variables que los de las CNLs. Las CNLs suelen tener sólo 40-80 aminoácidos carboxi-terminales al dominio LRR, mientras que los terminales carboxilos de las TNLs suelen tener 200-300 aminoácidos adicionales, igualando el tamaño del dominio LRR. Varias TNLs tienen extensiones con similitud a otras proteínas . Una de las TNLs más grandes de Arabidopsis, RRS1, que se localiza en el núcleo en respuesta a la infección, codifica una proteína de 1.388 aminoácidos con una señal de localización nuclear y un motivo WRKY (un motivo que también se encuentra en los factores de transcripción de dedos de zinc y que contiene la secuencia Trp-Arg-Lys-Tyr) en el extremo carboxilo.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.