Proteínas vegetais NBS-LRR são numerosas e de origem antiga. Elas são codificadas por uma das maiores famílias de genes conhecidas nas plantas. Existem aproximadamente 150 genes codificadores de NBS-LRR em Arabidopsis thaliana, mais de 400 em Oryza sativa , e provavelmente muito mais em genomas de plantas maiores que ainda não foram totalmente sequenciados. Muitas sequências de codificação NBS foram agora amplificadas a partir de um conjunto diverso de espécies de plantas usando PCR com primers degenerados baseados em sequências conservadas dentro do domínio NBS e existem actualmente mais de 1.600 sequências NBS em bases de dados públicas (ficheiro de dados adicional 1). Elas são encontradas em plantas não vasculares e gimnospérmicas, bem como em angiospérmicas; as relações ortológicas são difíceis de determinar, no entanto, devido às duplicações e perdas de genes específicos de uma linhagem. Em várias linhagens, os genes codificadores de NBS-LRR se tornaram amplificados, resultando em subfamílias específicas da família (Figura 2; arquivo de dados adicionais 1) . Das 150 sequências NBS-LRR em Arabidopsis, 62 têm regiões NBS mais semelhantes umas às outras do que quaisquer outras sequências não-Brássicas (Figura 2; Ficheiro de dados adicionais 2). As diferentes subfamílias foram amplificadas nas leguminosas (que inclui o feijão), nas Solanáceas (que inclui o tomate e a batata), e nas Asteraceas (que inclui o girassol e a alface) . O espectro das proteínas NBS-LRR presentes em uma espécie não é portanto característico da diversidade das proteínas NBS-LRR em outras famílias de plantas.

Figure 2
figure2

Árvore de junção vizinha mostrando a amplificação específica da família das sequências NBS. (a) TNLs. (b) CNLs. A árvore completa foi baseada em 1.600 seqüências (ver arquivos de dados adicionais 1 e 2 para uma árvore expandida com seqüências individuais e os alinhamentos utilizados). Clades que continham seqüências de famílias de plantas individuais foram colapsados em ramos individuais e o número de seqüências em cada ramo é indicado. Diferentes taxas são atribuídas cores diferentes; clades com representantes de várias famílias são mostrados em preto. A barra de escala representa cinco substituições de nucleotídeos.

NBS-LRR-encoding genes são freqüentemente agrupados no genoma, o resultado de duplicações tanto segmentares quanto tandem . Pode haver uma grande variação intra-específica no número de cópias devido ao cruzamento desigual dentro dos clusters . Os genes codificadores NBS-LRR têm altos níveis de variação inter- e intra-específica, mas não altas taxas de mutação ou recombinação . A variação é gerada por mecanismos genéticos normais, incluindo cruzamento desigual, troca de sequências e conversão de genes, em vez de eventos genéticos particulares aos genes codificadores NBS-LRR .

A taxa de evolução dos genes codificadores NBS-LRR pode ser rápida ou lenta, mesmo dentro de um cluster individual de sequências semelhantes. Por exemplo, o maior aglomerado de genes codificadores de NBS-LRR em alface inclui genes com dois padrões de evolução: os genes tipo I evoluem rapidamente com conversões frequentes de genes entre eles, enquanto que os genes tipo II evoluem lentamente com eventos raros de conversão de genes entre clades. Esta taxa de evolução heterogénea é consistente com um modelo de evolução de genes R de nascimento e morte, no qual a duplicação e o cruzamento desigual de genes pode ser seguido pela selecção purificadora dependente da densidade actuando sobre o haplótipo, resultando em números variáveis de grupos semi-independentes de genes R .

O impacto da selecção nos diferentes domínios dos genes codificadores de NBS-LRR individuais é também heterogéneo. O domínio NBS parece estar sujeito à selecção purificadora mas não a eventos frequentes de conversão de genes, enquanto a região LRR tende a ser altamente variável. A selecção diversificada, como indicado por rácios significativamente elevados de substituições de nucleótidos não sinónimos por sinónimos, tem mantido variações nos resíduos expostos a solventes das folhas β do domínio LRR (ver abaixo) . O cruzamento desigual e a conversão de genes geraram variação no número e posição dos LRR, e as inserções e/ou exclusões nas regiões entre as folhas de β provavelmente mudaram a orientação das folhas individuais de β. Existem, em média, 14 LRRs por proteína e muitas vezes 5 a 10 variantes de sequência para cada repetição; portanto, mesmo dentro da Arabidopsis, existe o potencial para mais de 9 × 1011 variantes, o que enfatiza a natureza altamente variável da superfície de ligação putativa destas proteínas.

Existem duas subfamílias principais de proteínas NBS-LRR de plantas, definidas pela presença de motivos Toll/interleukin-1 receptor (TIR) ou coiled-coil (CC) no domínio amino-terminal (Figura 1). Embora as proteínas TIR-NBS-LRR (TNLs) e as proteínas CC-NBS-LRR (CNLs) estejam ambas envolvidas no reconhecimento de patógenos, as duas subfamílias são distintas tanto em sequência como em vias de sinalização (ver abaixo) e se agrupam separadamente em análises filogenéticas usando seus domínios NBS (ver arquivo de dados adicionais 2) . As TNLs estão completamente ausentes das espécies de cereais, o que sugere que os primeiros antepassados do angiospermas tinham poucas TNLs e que estas se perderam na linhagem cerealífera. A presença ou ausência de TNLs em monocotiledôneas basais não é atualmente conhecida. CNLs de monocotiledôneas e dicotiledôneas se agrupam, indicando que os ancestrais do angiospermas tinham múltiplos CNLs (Figura 2) .

Existem também 58 proteínas em Arabidopsis que estão relacionadas com as subfamílias de TNL ou CNL, mas carecem do complemento completo dos domínios . Estas incluem 21 proteínas TIR-NBS (TN) e cinco proteínas CC-NBS (CN) que têm domínios amino-terminal e NBS, mas carecem de um domínio LRR . A função destas proteínas não é conhecida, mas elas têm potencial para agir como adaptadores ou reguladores das proteínas TNL e CNL.

Características estruturais

NBS-LRR proteínas são algumas das maiores proteínas conhecidas nas plantas, variando de cerca de 860 a cerca de 1.900 aminoácidos. Elas têm pelo menos quatro domínios distintos unidos por regiões linker: um domínio amino-terminal variável, o domínio NBS, a região LRR, e domínios carboxi-terminais variáveis (Figura 1). Quatro subfamílias de CNLs e oito subfamílias de TNLs foram identificadas em Arabidopsis a partir da homologia de sequência, motivos, posições intron e fase intron . Nenhuma estrutura cristalina foi determinada para qualquer parte de uma proteína NBS-LRR vegetal; estruturas cristalinas de domínios NBS e LRR de mamíferos estão, no entanto, disponíveis como modelos para abordagens de homologia-modelagem.

O domínio amino-terminal

Existe pouca informação experimental sobre a função do domínio amino-terminal. Em animais, o domínio TIR está envolvido na sinalização a jusante dos receptores tipo Toll-. Pensa-se que muitas proteínas vegetais NBS-LRR monitorizam o estado dos alvos (“guarda”) dos agentes de virulência patogénica (ver abaixo). Dada a presença de motivos TIR ou CC, bem como a diversidade destes domínios, pensa-se que o amino terminal está envolvido nas interacções proteína-proteína, possivelmente com as proteínas a serem guardadas ou com componentes de sinalização a jusante. O polimorfismo no domínio TIR da proteína TNL L6 do linho afeta a especificidade do reconhecimento de patógenos . Um motivo de alanina-poliserina que pode estar envolvido na estabilidade proteica está localizado imediatamente ao lado da metionina amino-terminal em muitos TNLs (mas não CNLs) em Arabidopsis . Quatro motivos TIR conservados abrangem 175 aminoácidos dentro do domínio TIR dos TNLs . Um motivo CC é comum, mas nem sempre presente nos 175 aminoácidos amino-terminal para o NBS dos CNLs . Alguns CNLs têm grandes domínios amino-terminal; o tomate Prf, por exemplo, tem 1.117 aminoácidos amino-terminal do NBS, muitos dos quais são exclusivos desta proteína.

O domínio NBS

Mais é conhecido da estrutura e função do domínio NBS, que também é chamado de domínio NB-ARC (nucleotide binding adaptor shared by NOD-LRR proteins, APAF-1, R proteins and CED4). Este domínio contém vários motivos definidos característicos da família de ATPases de transdução de sinal com numerosos domínios (STAND) de ATPases, que inclui as proteínas NOD de mamíferos . As proteínas STAND funcionam como comutadores moleculares nas vias de sinalização de doenças. A ligação específica e hidrólise de ATP foi demonstrada para os domínios NBS de dois CNLs de tomate, I2 e Mi . Pensa-se que a hidrólise de ATP resulta em mudanças conformacionais que regulam a sinalização a jusante. O primeiro relatório de oligomerização da proteína NBS-LRR, um evento crítico na sinalização das proteínas NOD de mamíferos, é a oligomerização da proteína N do tabaco (uma TNL) em resposta aos elicitors patogênicos . Na Arabidopsis, oito motivos NBS conservados foram identificados através de análise com MEME, um programa de identificação de motivos . Os domínios NBS das TNLs e CNLs distinguem-se pelas sequências de três motivos NBS (RNBS) de resistência dentro deles (motivos RNBS-A, RNBS-C e RNBS-D; ver ficheiro de dados adicionais 3) .

Entrar os domínios NBS das plantas na estrutura cristalina da APAF-1 humana fornece informações sobre a disposição espacial e a função dos motivos conservados nos domínios NBS das plantas (Figura 3) . O domínio de ligação de nucleotídeos da APAF-1 consiste em três subdomínios: um subdomínio de três camadas em α/β (contendo a região de âncora), um subdomínio helicoidal (contendo o motivo kinase-2 e P-loop) e um subdomínio de hélice alada (contendo o motivo MHDV; Figura 3). A ligação específica do ADP pelo APAF-1 humano é obtida por um total de oito ligações de hidrogênio diretas e quatro mediadas por água; a porção P-loop do subdomínio helicoidal interage com os fosfatos de ADP α- e β-, um histidina e um resíduo de serina no subdomínio hélice alado interage com um fosfato e o açúcar do ADP, e uma pequena região âncora no subdomínio β/β estabiliza a base adenina .

Figure 3

figure3

Estruturas preditas dos domínios NBS. Modelos estruturais para o domínio NBS de TNL RPS4 e CNL RPS5 de Arabidopsis foram gerados usando uma técnica de modelagem autoconsistente de homologia de campo médio, na ausência do ADP. O ADP foi adicionado aos dois modelos de NBS por inferência do complexo APAF-1-ADP sem refinamento dos modelos para ilustrar a posição do nucleotídeo em relação aos motivos conservados. (a)As estruturas dos domínios NBS de RPS4 e RPS5, mostrando as posições dos motivos conservados. As estruturas das proteínas são mostradas como diagramas de fitas e o ADP é mostrado como um modelo de bastão. Os domínios do tipo TIR e do tipo CC da NBS são compostos de motivos, por ordem do amino terminal: P-loop (ou Walker A site, azul); RNBS-A (verde); kinase-2 (ou Walker B site, magenta); RNBS-B (verde); RNBS-C (verde); GLPL (amarelo); RNBS-D (verde); MHDV (laranja). (b) Os locais de ligação de APAF-1 humano (código PDB 1z6tA), Arabidopsis RPS4, e RPS5, mostrando os resíduos interagindo com ADP e ATP. A coordenação do ADP nas três proteínas envolve três diferentes motivos conservados. Uma pequena região de âncora no amino terminal do domínio NBS coordena a adenina do ADP ou ATP, o P-loop coordena os fosfatos α e β, e o motivo MHDV (no subdomínio hélice alada na APAF-1) coordena o açúcar ou o fosfato β do ADP. Os dois ácidos aspárticos terminais do motivo kinase-2 estão localizados na bolsa na qual o γ-fosfato de ATP se situaria. As imagens foram geradas usando PyMol .

A bolsa de encadernação e os padrões de encadernação ao ADP estão bem conservados nos modelos de enfiamento dos TNLs (exemplificados pela proteína RPS4 da Arabidopsis) e CNLs (exemplificados pela proteína RPS5 da Arabidopsis; Figura 3) ( e P.K., trabalho inédito). Os domínios NBS das TNLs contêm loops adicionais ausentes no domínio NBS das CNLs. As TNLs e CNLs têm quatro motivos conservados que estão localizados ao redor da fenda catalítica: o laço P, a região de ancoragem e o motivo MHDV (especificamente o resíduo de histidina), todos os quais servem para orientar a molécula ADP, assim como o motivo GLPL (os motivos MHDV e GLPL têm o nome de seus aminoácidos constituintes no código de uma letra). Embora não haja contato óbvio entre o ADP e o motivo GLPL na APAF-1 humana, a conservação de sua posição no topo do local de ligação na APAF-1, RPS4 e RPS5 indica que ela pode estar envolvida na ligação do ADP. Além disso, os dois últimos ácidos aspárticos no motivo kinase-2 estão posicionados para interagir com o terceiro fosfato de ATP, consistente com seu papel de coordenação do íon metálico divalente necessário para as reações de transferência de fosfato, por exemplo o Mg2+ de Mg-ATP (Figura 3). A região âncora no subdomínio α/β da APAF-1, que consiste na seqüência Val-Thr-Arg, está presente como Phe-Gly-Asn na RSP4 e como Val-Gly-Gln na RPS5. Esta região de ancoragem, que consiste em um hidrofóbico (Val ou Phe), um pequeno (Gly ou Thr) e um aminoácido polar (Arg, Asn ou Gln), não foi previamente reconhecido, mas está altamente conservado em proteínas vegetais NBS-LRR (ver arquivo de dados adicionais 3). Mutações auto-ativadas em dois CNLs, batata Rx (Asp460Val) e tomate I2 (Asp495Val), mapa ao lado da histidina no motivo MHDV; estas mutações podem perturbar a ligação do fosfato de ADP β e resultar numa estrutura mais aberta .

O domínio LRR

O domínio LRR é um motivo comum encontrado em mais de 2.000 proteínas, de vírus a eucariotas, e está envolvido em interações proteína-proteína e ligand binding . As estruturas cristalinas de mais de 20 proteínas LRR revelaram que os domínios LRR contêm, caracteristicamente, uma série de folhas de β que formam a face côncava em forma de ferradura ou banana . Menos se sabe, porém, sobre os arranjos quaternários das proteínas LRR. Pelo menos três tipos diferentes de dímeros foram observados, envolvendo interações de suas superfícies côncavas ou convexas , ou por concatenação envolvendo um antiparalelo β-folha na interface . Enfiamento do domínio LRR da Arabidopsis RPS5 na estrutura cristalina da proteína de decoração bovina, um membro da pequena família de proteoglicanos LRR (SLRP) com um núcleo proteico composto de LRRs , forneceu um modelo consistente com uma superfície curva em ferradura de β folhas (Figura 4; P.K., trabalho inédito). O número de repetições nos domínios LRR em TNLs e CNLs de Arabidopsis é similar (média 14, intervalo de 8 a 25), mas este número pode ser consideravelmente maior em outras espécies. Na alface CNL Resistance Gene Candidate 2 (RGC2) proteínas, um exemplo das quais é Dm3, o domínio LRR parece estar duplicado e pode haver até 47 LRRs no total de . Cada LRR compreende um núcleo de cerca de 26 aminoácidos contendo o motivo Leu-xx-Leu-xx-Leu-x-Leu-xx-Cys/Asn-xx (onde x é qualquer aminoácido), que forma uma folha β; cada região do núcleo é separada por uma seção de comprimento variável que varia de zero a 30 aminoácidos. Em muitas proteínas NBS-LRR, os supostos resíduos expostos a solventes (mostrados como x na sequência de consenso acima) mostram proporções significativamente elevadas de substituições não-sinônimas por sinônimos, indicando que a seleção diversificada tem mantido a variação nessas posições. O domínio LRR está envolvido na determinação da especificidade de reconhecimento de várias proteínas R (por exemplo ); a interação direta com proteínas patogênicas raramente tem sido mostrada, entretanto.

Figure 4
figure4

A estrutura prevista de um domínio LRR resultante do enfiamento do domínio LRR de Arabidopsis RPS5 na decorina bovina (código PDB 1xku). (a) Uma representação cartoon da estrutura prevista de um domínio RPS5 LRR gerada usando PyMol . As folhas β que formam a face côncava da ‘ferradura’ são representadas como setas. Os resíduos alifáticos conservados são mostrados em azul. N, amino terminal; C, terminal carboxil. (b) Alinhamento das 12 repetições ricas em leucina na decoração e das 13 repetições no RPS5, bem como do amino terminal nove aminoácidos. Os resíduos alifáticos conservados são mostrados em azul.

O domínio LRR pode estar envolvido predominantemente em interações intramoleculares regulatórias. O domínio LRR da batata CNL Rx interage com o domínio NBS mesmo quando expresso em trans; essa interação é interrompida pelo elicitor X do vírus da batata, uma proteína do revestimento viral que pode induzir uma resposta de defesa do hospedeiro . Além disso, a superfície interna e côncava das folhas β pode não ser a única superfície de ligação. O domínio LRR de TLR3, um receptor de Toll-like humano, está previsto para formar um heterodímero e para ligar RNA de cadeia dupla de patógenos contra a sua superfície em loop, do lado oposto das folhas de β. .

Análise usando MEME identificou poucos motivos em comum entre os domínios LRR de TNLs e CNLs em Arabidopsis . O terceiro LRR foi um dos poucos que continha um motivo conservado. A mutação neste LRR do CNL RPS5 resulta em efeitos inibidores epistémicos em múltiplas proteínas NBS-LRR, sugerindo que o LRR pode interagir com componentes de sinalização a jusante; também, uma mutação dentro deste LRR no CNL Rx da batata resulta numa forma constitutivamente activa .

The carboxyl termini

CNLs e TNLs diferem marcadamente no tamanho e composição dos seus domínios carboxi-terminais. Os das TNLs são maiores e mais variáveis do que os das CNLs. Os CNLs normalmente têm apenas 40-80 aminoácidos carboxi-terminal para o domínio LRR, enquanto os terminais carboxílicos dos TNLs frequentemente têm um adicional de 200-300 aminoácidos, igualando o tamanho do domínio LRR. Vários TNLs têm extensões com similaridade com outras proteínas . Uma das maiores TNLs em Arabidopsis, RRS1, que se torna localizada ao núcleo em resposta à infecção, codifica uma proteína amino-ácida 1.388 com um sinal de localização nuclear e um motivo WRKY (um motivo também encontrado em fatores de transcrição de zinco-dedo e que contém a seqüência Trp-Arg-Lys-Tyr) no terminal carboxil .

Deixe uma resposta

O seu endereço de email não será publicado.