Proteinele NBS-LRR din plante sunt numeroase și de origine străveche. Ele sunt codificate de una dintre cele mai mari familii de gene cunoscute la plante. Există aproximativ 150 de gene care codifică NBS-LRR în Arabidopsis thaliana, peste 400 în Oryza sativa , și probabil considerabil mai multe în genomurile plantelor mai mari care nu au fost încă secvențiate complet. Multe secvențe care codifică NBS au fost amplificate în prezent dintr-o gamă diversă de specii de plante folosind PCR cu primeri degenerate bazate pe secvențe conservate din domeniul NBS și există în prezent peste 1 600 de secvențe NBS în bazele de date publice (fișier de date suplimentare 1). Acestea se găsesc la plantele nevasculare și la gimnosperme, precum și la angiosperme; cu toate acestea, relațiile ortologice sunt dificil de determinat, din cauza duplicărilor și pierderilor de gene specifice liniei genetice . În mai multe neamuri, genele care codifică NBS-LRR s-au amplificat, rezultând subfamilii specifice familiei (figura 2; fișier de date suplimentare 1) . Dintre cele 150 de secvențe NBS-LRR din Arabidopsis, 62 au regiuni NBS mai asemănătoare între ele decât cu orice alte secvențe care nu sunt din familia Brassica (figura 2; fișier de date suplimentare 2). Diferite subfamilii au fost amplificate în leguminoase (care include fasolea), Solanaceae (care include roșiile și cartoful) și Asteraceae (care include floarea-soarelui și salata) . Prin urmare, spectrul de proteine NBS-LRR prezente la o singură specie nu este caracteristic diversității proteinelor NBS-LRR din alte familii de plante.

Figura 2
figura2

Arborele de îmbinare a vecinilor care arată amplificarea specifică familiei de secvențe NBS. (a) TNL-uri. (b) CNLs. Arborele complet s-a bazat pe 1 600 de secvențe (a se vedea fișierele de date suplimentare 1 și 2 pentru un arbore extins cu secvențe individuale și alinierile utilizate). Cladele care conțineau secvențe de la familii de plante individuale au fost reduse în ramuri unice, iar numărul de secvențe din fiecare ramură este indicat. Taxonilor diferiți li se atribuie culori diferite; cladele cu reprezentanți din mai multe familii sunt reprezentate cu negru. Bara de scară reprezintă cinci substituții de nucleotide.

Genele care codifică NBS-LRR sunt frecvent grupate în genom, rezultat atât al duplicațiilor segmentare cât și al duplicațiilor în tandem . Poate exista o mare variație intraspecifică în ceea ce privește numărul de copii din cauza crossing-over-ului inegal în cadrul clusterelor . Genele care codifică NBS-LRR prezintă niveluri ridicate de variație inter și intraspecifică, dar nu și rate ridicate de mutație sau recombinare. Variația este generată de mecanisme genetice normale, inclusiv crossing-over inegal, schimb de secvențe și conversie genetică, mai degrabă decât de evenimente genetice specifice genelor care codifică NBS-LRR .

Rata de evoluție a genelor care codifică NBS-LRR poate fi rapidă sau lentă, chiar și în cadrul unui grup individual de secvențe similare. De exemplu, clusterul major de gene care codifică NBS-LRR din salată include gene cu două modele de evoluție : genele de tip I evoluează rapid, cu conversii genetice frecvente între ele, în timp ce genele de tip II evoluează lent, cu evenimente rare de conversie genetică între clade. Această rată eterogenă de evoluție este în concordanță cu un model „birth-and-death” al evoluției genelor R, în care duplicarea genelor și încrucișarea inegală pot fi urmate de o selecție purificatoare dependentă de densitate care acționează asupra haplotipului, rezultând un număr variabil de grupuri de gene R care evoluează în mod semi-independent.

Impactul selecției asupra diferitelor domenii ale genelor individuale care codifică NBS-LRR este, de asemenea, eterogen. Domeniul NBS pare să fie supus unei selecții purificatoare, dar nu și unor evenimente frecvente de conversie genetică, în timp ce regiunea LRR tinde să fie foarte variabilă. Selecția diversificatoare, așa cum indică ratele semnificativ ridicate ale substituțiilor de nucleotide nesinonime față de cele sinonime, a menținut variația în reziduurile expuse la solvenți ale foilor β din domeniul LRR (a se vedea mai jos) . Cross-over-ul inegal și conversia genică au generat variații în ceea ce privește numărul și poziția LRR-urilor, iar inserțiile și/sau delețiile in-frame în regiunile dintre foile β au schimbat probabil orientarea foilor β individuale. Există, în medie, 14 LRR-uri per proteină și, adesea, între 5 și 10 variante de secvență pentru fiecare repetiție; prin urmare, chiar și în Arabidopsis, există potențialul pentru mai mult de 9 × 1011 variante, ceea ce subliniază natura foarte variabilă a suprafeței de legare presupuse a acestor proteine.

Există două subfamilii majore de proteine NBS-LRR din plante, definite prin prezența motivelor receptorului Toll/interleukina-1 (TIR) sau a motivelor spiralate (CC) în domeniul amino-terminal (figura 1). Deși proteinele TIR-NBS-LRR (TNLs) și proteinele CC-NBS-LRR (CNLs) sunt ambele implicate în recunoașterea agenților patogeni, cele două subfamilii sunt distincte atât în ceea ce privește secvența, cât și în ceea ce privește căile de semnalizare (a se vedea mai jos) și se grupează separat în analizele filogenetice folosind domeniile lor NBS (a se vedea fișierul de date suplimentare 2) . TNL-urile sunt complet absente din speciile de cereale, ceea ce sugerează că strămoșii timpurii ai angiospermelor aveau puține TNL-uri și că acestea s-au pierdut în descendența cerealelor. Prezența sau absența TNL-urilor la monocotiledonatele bazale nu este cunoscută în prezent. CNL-urile de la monocotiledonate și dicotiledonate se grupează împreună, ceea ce indică faptul că strămoșii angiospermelor aveau mai multe CNL-uri (Figura 2) .

Există, de asemenea, 58 de proteine în Arabidopsis care sunt înrudite cu subfamiliile TNL sau CNL, dar cărora le lipsește completarea completă a domeniilor . Acestea includ 21 proteine TIR-NBS (TN) și cinci proteine CC-NBS (CN) care au domenii amino-terminale și NBS, dar nu au un domeniu LRR . Funcția acestor proteine nu este cunoscută, dar ele au potențialul de a acționa ca adaptatori sau regulatori ai proteinelor TNL și CNL.

Funcții structurale caracteristice

Proteinele NBS-LRR sunt unele dintre cele mai mari proteine cunoscute în plante, variind de la aproximativ 860 la aproximativ 1.900 de aminoacizi. Ele au cel puțin patru domenii distincte unite prin regiuni de legătură: un domeniu amino-terminal variabil, domeniul NBS, regiunea LRR și domeniile carboxi-terminale variabile (figura 1). Patru subfamilii de CNL-uri și opt subfamilii de TNL-uri au fost identificate în Arabidopsis pe baza omologiei secvenței, a motivelor, a poziției intronilor și a fazei intronilor . Nu au fost determinate structuri cristaline pentru nicio parte a unei proteine NBS-LRR din plante; structurile cristaline ale domeniilor NBS și LRR de mamifere sunt, totuși, disponibile ca șabloane pentru abordările de modelare a homologiei.

Domeniul amino-terminal

Există puține informații experimentale cu privire la funcția domeniului amino-terminal. La animale, domeniul TIR este implicat în semnalizarea în aval de receptorii Toll-like. Se crede că multe proteine NBS-LRR din plante monitorizează starea țintelor („de pază”) ale factorilor de virulență ai agenților patogeni (a se vedea mai jos). Având în vedere prezența motivelor TIR sau CC, precum și diversitatea acestor domenii, se crede că terminațiile amino sunt implicate în interacțiuni proteină-proteină, posibil cu proteinele care sunt supravegheate sau cu componentele de semnalizare din aval . Polimorfismul în domeniul TIR al proteinei TNL L6 din in afectează specificitatea recunoașterii agenților patogeni . Un motiv alanină-poli-serină care poate fi implicat în stabilitatea proteinei este situat imediat adiacent la metionina amino-terminală în multe TNL-uri (dar nu și în CNL-urile din Arabidopsis) . Patru motive TIR conservate acoperă 175 de aminoacizi în cadrul domeniului TIR al TNL-urilor . Un motiv CC este comun, dar nu întotdeauna prezent în cei 175 de aminoacizi amino-terminali la NBS al CNL-urilor . Unele CNL-uri au domenii amino-terminale mari; de exemplu, Prf de tomate are 1.117 acizi amino-terminali NBS, dintre care o mare parte este unică pentru această proteină.

Domeniul NBS

Se cunosc mai multe despre structura și funcția domeniului NBS, care se mai numește și domeniul NB-ARC (adaptor de legare a nucleotidelor partajat de proteinele NOD-LRR, APAF-1, proteinele R și CED4). Acest domeniu conține mai multe motive definite, caracteristice familiei de ATPaze de transducție a semnalului cu numeroase domenii (STAND), care include proteinele NOD de mamifere. Proteinele STAND funcționează ca întrerupători moleculari în căile de semnalizare a bolilor. A fost demonstrată legarea specifică și hidroliza ATP în cazul domeniilor NBS a două CNL-uri de tomate, I2 și Mi . Se crede că hidroliza ATP are ca rezultat modificări conformaționale care reglează semnalizarea din aval. Primul raport privind oligomerizarea proteinei NBS-LRR, un eveniment critic în semnalizarea proteinelor NOD de la mamifere, este oligomerizarea proteinei N din tutun (o TNL) ca răspuns la elicitorii patogeni. În Arabidopsis, opt motive NBS conservate au fost identificate prin analiza cu MEME, un program pentru identificarea motivelor . Domeniile NBS ale TNL-urilor și CNL-urilor se disting prin secvențele a trei motive NBS de rezistență (RNBS) din cadrul acestora (motivele RNBS-A, RNBS-C și RNBS-D; a se vedea Fișierul de date suplimentare 3) .

Filarea domeniilor NBS ale plantelor pe structura cristalină a APAF-1 umane oferă o perspectivă informativă asupra aranjamentului spațial și a funcției motivelor conservate în domeniile NBS ale plantelor (Figura 3) . Domeniul de legare a nucleotidelor al APAF-1 este format din trei subdomenii: un subdomeniu α/β cu trei straturi (care conține regiunea de ancorare), un subdomeniu elicoidal (care conține motivul kinazei-2 și bucla P) și un subdomeniu de tip „winged-helix” (care conține motivul MHDV; figura 3). Legarea specifică a ADP de către APAF-1 uman se realizează printr-un total de opt legături de hidrogen directe și patru legături de hidrogen mediate de apă; porțiunea de buclă P a subdomeniului elicoidal interacționează cu fosfații α și β ai ADP, un reziduu de histidină și un reziduu de serină de pe subdomeniul de tip winged-helix interacționează cu un fosfat și cu zahărul din ADP, iar o mică regiune de ancorare din subdomeniul α/β stabilizează baza de adenină .

Figura 3
Figura 3

Structuri preconizate ale domeniilor NBS. Modelele structurale pentru domeniul NBS al TNL RPS4 și CNL RPS5 din Arabidopsis au fost generate utilizând o tehnică de modelare homologică de câmp mediu autoconsistent , în absența ADP. ADP a fost adăugat la cele două modele NBS prin inferență din complexul APAF-1-ADP, fără o rafinare suplimentară a modelelor pentru a ilustra poziția nucleotidei în raport cu motivele conservate. (a) Structurile domeniilor NBS ale RPS4 și RPS5, care arată pozițiile motivelor conservate. Structurile proteinelor sunt prezentate sub formă de diagrame de panglică, iar ADP este prezentat sub formă de model baston. Domeniile NBS de tip TIR și de tip CC sunt alcătuite din motive, în ordine de la terminalul amino: P-loop (sau situsul Walker A, albastru); RNBS-A (verde); kinaza-2 (sau situsul Walker B, magenta); RNBS-B (verde); RNBS-C (verde); RNBS-C (verde); GLPL (galben); RNBS-D (verde); MHDV (portocaliu). (b) Siturile de legare ale APAF-1 uman (cod PDB 1z6tA), Arabidopsis RPS4 și RPS5, arătând reziduurile care interacționează cu ADP și ATP. Coordonarea ADP în cele trei proteine implică trei motive conservate diferite. O mică regiune de ancorare la extremitatea amino-terminală a domeniului NBS coordonează adenina din ADP sau ATP, bucla P coordonează α- și β-fosfații, iar motivul MHDV (în subdomeniul de tip winged-helix din APAF-1) coordonează fie zahărul, fie β-fosfatul din ADP. Cei doi acizi aspartici terminali din motivul kinazei-2 sunt localizați în buzunarul în care ar sta γ-fosfatul de ATP. Imaginile au fost generate folosind PyMol .

Pachetul de legare și modelele de legare la ADP sunt bine conservate în modelele de filetare ale TNL-urilor (exemplificate de proteina RPS4 din Arabidopsis) și CNL-urilor (exemplificate de proteina RPS5 din Arabidopsis; Figura 3) ( și P.K., lucrare nepublicată). Domeniile NBS ale TNL-urilor conțin bucle suplimentare absente în domeniul NBS al CNL-urilor. TNL-urile și CNL-urile au patru motive conservate care sunt localizate în jurul fantei catalitice: bucla P, regiunea de ancorare și motivul MHDV (în special reziduul histidină), toate acestea servind la orientarea moleculei de ADP, precum și motivul GLPL (motivele MHDV și GLPL sunt denumite după aminoacizii lor constituenți în codul cu o singură literă). Deși nu există un contact evident între ADP și motivul GLPL în APAF-1 uman, conservarea poziției sale în partea superioară a situsului de legare în APAF-1, RPS4 și RPS5 indică faptul că acesta poate fi implicat în legarea ADP. În plus, ultimii doi acizi aspartici din motivul kinazei-2 sunt poziționați pentru a interacționa cu cel de-al treilea fosfat din ATP, în concordanță cu rolul lor de coordonare pentru ionul metalic divalent necesar pentru reacțiile de fosfotransfer, de exemplu Mg2+ din Mg-ATP (figura 3). Regiunea de ancorare din subdomeniul α/β al APAF-1, care constă în secvența Val-Thr-Arg, este prezentă ca Phe-Gly-Asn în RSP4 și ca Val-Gly-Gln în RPS5. Această regiune de ancorare, formată dintr-un aminoacid hidrofob (Val sau Phe), un aminoacid mic (Gly sau Thr) și unul polar (Arg, Asn sau Gln), nu a fost recunoscută anterior, dar este foarte bine conservată în proteinele NBS-LRR din plante (a se vedea fișierul de date suplimentare 3). Mutațiile de autoactivare în două CNL-uri, Rx din cartof (Asp460Val) și I2 din tomate (Asp495Val), se află lângă histidina din motivul MHDV; aceste mutații pot perturba legarea β-fosfatului de ADP și pot duce la o structură mai deschisă .

Domeniul LRR

Domeniul LRR este un motiv comun care se găsește în peste 2.000 de proteine, de la viruși la eucariote, și este implicat în interacțiunile proteină-proteină și în legarea ligandului . Structurile cristaline a peste 20 de proteine LRR au dezvăluit că domeniile LRR conțin în mod caracteristic o serie de foițe β care formează fața concavă în formă de potcoavă sau de banană . Cu toate acestea, se știe mai puțin despre aranjamentele cuaternare ale proteinelor LRR. Au fost observate cel puțin trei tipuri diferite de dimeri, care implică interacțiuni fie ale suprafețelor lor concave, fie ale suprafețelor lor convexe , fie prin concatenare care implică o foaie β antiparalelă la interfață . Încrucișarea domeniului LRR al Arabidopsis RPS5 pe structura cristalină a proteinei decorină bovină, un membru al familiei de proteine proteoglicane LRR mici (SLRP) cu un nucleu proteic compus din LRR , a furnizat un model compatibil cu o suprafață curbată în formă de potcoavă a foilor β (Figura 4; P.K., lucrare nepublicată). Numărul de repetări în domeniile LRR în TNLs și CNLs din Arabidopsis este similar (media 14, intervalul 8 – 25), dar acest număr poate fi considerabil mai mare în alte specii. În proteinele CNL de salată CNL Resistance Gene Candidate 2 (RGC2), dintre care un exemplu este Dm3, domeniul LRR pare să fie duplicat și pot exista până la 47 de LRR-uri în total . Fiecare LRR cuprinde un nucleu de aproximativ 26 de aminoacizi care conține motivul Leu-xx-Leu-xx-Leu-x-Leu-xx-Cys/Asn-xx (unde x este orice aminoacid), care formează o foaie β; fiecare regiune de nucleu este separată de o secțiune de lungime variabilă care variază de la zero la 30 de aminoacizi. În multe proteine NBS-LRR, reziduurile putative expuse la solvenți (reprezentate prin x în secvența consensuală de mai sus) prezintă rapoarte semnificativ ridicate de substituții nonsinonime față de substituții sinonime, ceea ce indică faptul că selecția diversificatoare a menținut variația în aceste poziții. Domeniul LRR este implicat în determinarea specificității de recunoaștere a mai multor proteine R (de exemplu ); cu toate acestea, interacțiunea directă cu proteinele patogene a fost rareori demonstrată.

Figura 4
figura4

Structura prezisă a unui domeniu LRR care rezultă din filetarea domeniului LRR al Arabidopsis RPS5 pe decorina bovină (cod PDB 1xku). (a) O reprezentare caricaturală a structurii prezise a domeniului LRR al RPS5, generată cu ajutorul PyMol . Foițele β care formează fața concavă a „potcoavei” sunt reprezentate sub formă de săgeți. Reziduurile alifatice conservate sunt reprezentate în albastru. N, extremitatea amino; C, extremitatea carboxilică. (b) Alinierea celor 12 repetări bogate în leucină din decorină și a celor 13 repetări din RPS5, precum și a celor nouă aminoacizi terminali. Reziduurile alifatice conservate sunt reprezentate în albastru.

Domeniul LRR poate fi implicat predominant în interacțiuni intramoleculare de reglementare. Domeniul LRR al CNL Rx din cartof interacționează cu domeniul NBS chiar și atunci când este exprimat în trans; această interacțiune este întreruptă de elicitorul virusului X al cartofului, o proteină de acoperire virală care poate induce un răspuns de apărare a gazdei . De asemenea, este posibil ca suprafața interioară, concavă, a foilor β să nu fie singura suprafață de legătură. Se preconizează că domeniul LRR al TLR3, un receptor Toll-like uman, formează un heterodimer și se leagă ARN dublu catenar de la agenții patogeni împotriva suprafeței sale în buclă, pe partea opusă față de foile β .

Analiza cu ajutorul MEME a identificat puține motive comune între domeniile LRR ale TNL-urilor și CNL-urilor din Arabidopsis . Cel de-al treilea LRR a fost unul dintre puținele care conținea un motiv conservat. Mutația în acest LRR din CNL RPS5 are ca rezultat efecte inhibitorii epistatice asupra mai multor proteine NBS-LRR, sugerând că LRR poate interacționa cu componentele de semnalizare din aval ; de asemenea, o mutație în cadrul acestui LRR în CNL Rx din cartof are ca rezultat o formă constitutiv activă .

Terminațiile carboxilice

CNL-urile și TNL-urile diferă în mod semnificativ în ceea ce privește dimensiunea și compoziția domeniilor lor carboxil-terminale. Cele ale TNL-urilor sunt mai mari și mai variabile decât cele ale CNL-urilor. CNL-urile au, de obicei, doar 40-80 de aminoacizi carboxi-terminali față de domeniul LRR, în timp ce terminațiile carboxilice ale TNL-urilor au adesea 200-300 de aminoacizi suplimentari, egalând dimensiunea domeniului LRR. Mai multe TNL-uri au extensii cu similaritate cu alte proteine . Una dintre cele mai mari TNL din Arabidopsis, RRS1, care se localizează în nucleu ca răspuns la infecție, codifică o proteină de 1 388 de aminoacizi cu un semnal de localizare nucleară și un motiv WRKY (un motiv care se găsește, de asemenea, în factorii de transcripție cu degete de zinc și care conține secvența Trp-Arg-Lys-Tyr) la extremitatea carboxilică .

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.