Växters NBS-LRR-proteiner är många och har ett gammalt ursprung. De kodas av en av de största kända genfamiljerna hos växter. Det finns cirka 150 NBS-LRR-kodande gener i Arabidopsis thaliana, över 400 i Oryza sativa , och förmodligen betydligt fler i större växtgenom som ännu inte har sekvenserats fullständigt. Många NBS-kodande sekvenser har nu amplifierats från en rad olika växtarter med hjälp av PCR med degenererade primers baserade på konserverade sekvenser inom NBS-domänen, och det finns för närvarande över 1 600 NBS-sekvenser i offentliga databaser (Additional data file 1). De finns hos icke-kärlväxter och gymnospermer samt hos angiospermer. Det är dock svårt att fastställa ortologiska relationer på grund av släktskapsspecifika genduplikationer och genförluster . I flera släktled har NBS-LRR-kodande gener amplifierats, vilket har resulterat i familjespecifika underfamiljer (figur 2; ytterligare datafil 1) . Av de 150 NBS-LRR-sekvenserna i Arabidopsis har 62 NBS-regioner som är mer lika varandra än andra icke-Brassica-sekvenser (figur 2; ytterligare datafil 2). Olika underfamiljer har amplifierats i baljväxter (som inkluderar bönor), Solanaceae (som inkluderar tomater och potatis) och Asteraceae (som inkluderar solrosor och sallat) . Spektrumet av NBS-LRR-proteiner som finns i en art är därför inte karakteristiskt för mångfalden av NBS-LRR-proteiner i andra växtfamiljer.

Figur 2
figure2

Neighbor-joining tree som visar den familjespecifika amplifieringen av NBS-sekvenser. (a) TNL. (b) CNLs. Det fullständiga trädet baserades på 1 600 sekvenser (se ytterligare datafiler 1 och 2 för ett utökat träd med enskilda sekvenser och de använda anpassningarna). Klader som innehöll sekvenser från enskilda växtfamiljer sammanföll till enskilda grenar och antalet sekvenser i varje gren anges. Olika taxa tilldelas olika färger; klader med representanter från flera familjer visas i svart. Skalstrecket representerar fem nukleotisubstitutioner.

NBS-LRR-kodande gener är ofta klustrade i genomet, resultatet av både segmentala och tandemduplikationer . Det kan finnas en stor intraspecifik variation i antalet kopior på grund av ojämlik crossing-over inom kluster . NBS-LRR-kodande gener har höga nivåer av inter- och intraspecifik variation men inte höga nivåer av mutation eller rekombination . Variationen genereras av normala genetiska mekanismer, inklusive ojämnt korsande, sekvensutbyte och genomvandling, snarare än av genetiska händelser som är specifika för NBS-LRR-kodande gener .

Evolutionshastigheten hos NBS-LRR-kodande gener kan vara snabb eller långsam, även inom ett enskilt kluster av likartade sekvenser. Det stora klustret av NBS-LRR-kodande gener i sallat innehåller till exempel gener med två utvecklingsmönster: typ I-gener utvecklas snabbt med frekventa genkonverteringar mellan dem, medan typ II-gener utvecklas långsamt med sällsynta genkonverteringshändelser mellan klasser. Denna heterogena utvecklingshastighet är förenlig med en födelse- och dödsmodell för R-genernas utveckling, där genduplicering och ojämna korsningar kan följas av ett täthetsberoende renande urval som verkar på haplotypen, vilket resulterar i ett varierande antal halvt oberoende utvecklande grupper av R-gener.

Effekten av urvalet på de olika domänerna hos enskilda NBS-LRR-kodande gener är också heterogen. NBS-domänen verkar vara föremål för renande urval men inte för frekventa genkonverteringshändelser, medan LRR-regionen tenderar att vara mycket varierande. Diversifierande urval, vilket indikeras av betydligt förhöjda förhållanden mellan icke-synonyma och synonyma nukleotisubstitutioner, har upprätthållit variationen i de lösningsmedelsexponerade resterna i β-bladen i LRR-domänen (se nedan) . Ojämlik crossing-over och genkonvertering har genererat variation i antalet och positionen av LRR:er, och inframe-insertioner och/eller deletioner i regionerna mellan β-bladen har troligen förändrat orienteringen av enskilda β-blad. Det finns i genomsnitt 14 LRR:er per protein och ofta 5-10 sekvensvarianter för varje upprepning; därför finns det även inom Arabidopsis en potential för långt över 9 × 1011 varianter, vilket understryker den mycket varierande karaktären hos den förmodade bindningsytan för dessa proteiner.

Det finns två stora underfamiljer av NBS-LRR-proteiner från växter, som definieras av närvaron av Toll/interleukin-1-receptor- (TIR) eller coiled-coil-motiv (CC) i den aminoterminala domänen (figur 1). Även om TIR-NBS-LRR-proteiner (TNL) och CC-NBS-LRR-proteiner (CNL) båda är involverade i patogenigenkännedom är de två underfamiljerna olika både i sekvens och i signalvägar (se nedan) och grupperar sig separat i fylogenetiska analyser med hjälp av deras NBS-domäner (se Additional data file 2) . TNL saknas helt i spannmålsarter, vilket tyder på att de tidiga angiospermernas förfäder hade få TNL och att dessa förlorades i spannmålslinjen. Förekomsten eller frånvaron av TNL i basala monokotyler är för närvarande inte känd. CNL:er från monokotylväxter och dikotylväxter grupperar sig tillsammans, vilket tyder på att angiospermernas förfäder hade flera CNL:er (figur 2) .

Det finns också 58 proteiner i Arabidopsis som är besläktade med TNL- eller CNL-underfamiljerna, men som saknar hela komplementet av domäner . Dessa inkluderar 21 TIR-NBS (TN) och fem CC-NBS (CN) proteiner som har aminoterminala och NBS-domäner men saknar en LRR-domän . Funktionen hos dessa proteiner är inte känd, men de har potential att fungera som anpassare eller regulatorer av TNL- och CNL-proteiner.

Karaktäristiska strukturella egenskaper

NBS-LRR-proteiner är några av de största proteiner som är kända i växter, med ett omfång på cirka 860 till cirka 1 900 aminosyror. De har minst fyra olika domäner som förenas av länkregioner: en variabel aminoterminal domän, NBS-domänen, LRR-regionen och variabla karboxyterminala domäner (figur 1). Fyra underfamiljer av CNL och åtta underfamiljer av TNL identifierades i Arabidopsis utifrån sekvenshomologi, motiv, intronpositioner och intronfas . Inga kristallstrukturer har bestämts för någon del av ett växt NBS-LRR-protein; kristallstrukturer av däggdjurs NBS- och LRR-domäner finns dock tillgängliga som mallar för homologimodelleringsmetoder.

Den aminoterminala domänen

Det finns lite experimentell information om den aminoterminala domänens funktion. Hos djur är TIR-domänen involverad i signalering nedströms från Toll-like-receptorer. Många växt NBS-LRR-proteiner tros övervaka statusen hos (”guard”) måltavlor för patogena virulenseffektorer (se nedan). Med tanke på närvaron av TIR- eller CC-motiv samt mångfalden av dessa domäner, tros aminoändarna vara involverade i proteinproteininteraktioner, eventuellt med de proteiner som bevakas eller med signaleringskomponenter nedströms . Polymorfism i TIR-domänen hos linets TNL-protein L6 påverkar patogenigenkännandets specificitet . Ett alanin-polyserinmotiv som kan vara involverat i proteinets stabilitet ligger omedelbart intill det aminoterminala metioninet i många TNL:er (men inte CNL:er) i Arabidopsis . Fyra bevarade TIR-motiv spänner över 175 aminosyror inom TIR-domänen hos TNLs . Ett CC-motiv är vanligt men inte alltid närvarande i de 175 aminosyror som är aminoterminala till NBS i CNLs . Vissa CNL har stora aminoterminala domäner; tomat Prf, till exempel, har 1 117 aminosyror aminoterminalt från NBS, varav en stor del är unik för detta protein.

NBS-domänen

Mer är känt om strukturen och funktionen hos NBS-domänen, som också kallas NB-ARC-domänen (nukleotidbindande adapter som delas av NOD-LRR-proteiner, APAF-1, R-proteiner och CED4). Denna domän innehåller flera definierade motiv som är karakteristiska för ATPas-familjen ”signal transduction ATPases with numerous domains” (STAND), som omfattar däggdjurens NOD-proteiner . STAND-proteiner fungerar som molekylära omkopplare i signalvägar för sjukdomar. Specifik bindning och hydrolys av ATP har visats för NBS-domänerna i två CNL:er från tomater, I2 och Mi . ATP-hydrolys tros leda till konformationsförändringar som reglerar nedströms signalering. Den första rapporten om oligomerisering av NBS-LRR-protein, en kritisk händelse vid signalering från däggdjurs NOD-proteiner, är oligomeriseringen av tobakens N-protein (en TNL) som svar på patogena elicitorer . I Arabidopsis har åtta bevarade NBS-motiv identifierats genom analys med MEME, ett program för motividentifiering . NBS-domäner av TNL och CNL skiljer sig från varandra genom sekvenserna av tre resistens NBS-motiv (RNBS) inom dem (RNBS-A, RNBS-C och RNBS-D-motiv; se Additional data file 3) .

Threading växt NBS-domäner på kristallstrukturen av mänsklig APAF-1 ger informativa insikter i det rumsliga arrangemanget och funktionen av motiven som är bevarade i växt NBS-domäner (Figur 3) . APAF-1:s nukleotidbindande domän består av tre subdomäner: en α/β-subdomän i tre lager (som innehåller ankarregionen), en spiralformad subdomän (som innehåller kinas-2-motivet och P-slingan) och en vingad spiralformad subdomän (som innehåller MHDV-motivet; figur 3). Den specifika bindningen av ADP av humant APAF-1 uppnås genom totalt åtta direkta och fyra vattenmedierade vätebindningar; P-loop-delen av den helikala subdomänen interagerar med α- och β-fosfaterna av ADP, en histidin- och en serinrest på den vingade helix-subdomänen interagerar med en fosfat och sockret av ADP, och en liten ankarregion i α/β-subdomänen stabiliserar adeninbasen .

Figur 3
figur3

Förutsedda strukturer för NBS-domäner. Strukturmodeller för NBS-domänen i TNL RPS4 och CNL RPS5 från Arabidopsis genererades med hjälp av en självkonsistent medelfältshomologimodelleringsteknik , i frånvaro av ADP. ADP lades till i de två NBS-modellerna genom att man drog slutsatser från APAF-1-ADP-komplexet utan ytterligare förfining av modellerna för att illustrera nukleodens position i förhållande till de bevarade motiven. (a) Strukturerna av NBS-domänerna i RPS4 och RPS5, som visar de bevarade motivens positioner. Proteinstrukturerna visas som banddiagram och ADP visas som en stavmodell. NBS-domäner av TIR-typ och CC-typ består av motiv, i ordning från aminoterminus: P-slinga (eller Walker A-plats, blå); RNBS-A (grön); kinas-2 (eller Walker B-plats, magenta); RNBS-B (grön); RNBS-C (grön); GLPL (gul); RNBS-D (grön); MHDV (orange). (b) Bindningsställena för mänsklig APAF-1 (PDB-kod 1z6tA), Arabidopsis RPS4 och RPS5, som visar de rester som interagerar med ADP och ATP. Samordningen av ADP i de tre proteinerna involverar tre olika konserverade motiv. En liten ankarregion vid NBS-domänens aminoterminus samordnar adeninet i ADP eller ATP, P-slingan samordnar α- och β-fosfaterna, och MHDV-motivet (i den vingade helix-subdomänen i APAF-1) samordnar antingen sockret eller β-fosfatet i ADP. De två terminala asparaginsyrorna från kinas-2-motivet är belägna i den ficka där ATP:s γ-fosfat skulle sitta. Bilderna genererades med PyMol .

Bindningsfickan och mönstren för bindning till ADP är välbevarade i trådmodellerna för TNL (exemplifierat av Arabidopsis-proteinet RPS4) och CNL (exemplifierat av Arabidopsis-proteinet RPS5; figur 3) ( och P.K., opublicerat arbete). TNL:s NBS-domäner innehåller ytterligare slingor som saknas i CNL:s NBS-domän. TNLs och CNLs har fyra bevarade motiv som ligger runt den katalytiska klyftan: P-slingan, ankarregionen och MHDV-motivet (särskilt histidinresterna), som alla tjänar till att orientera ADP-molekylen, samt GLPL-motivet (MHDV- och GLPL-motiven är namngivna efter sina ingående aminosyror i enbokstavskoden). Även om det inte finns någon uppenbar kontakt mellan ADP och GLPL-motivet i mänsklig APAF-1, tyder bevarandet av dess position ovanpå bindningsstället i APAF-1, RPS4 och RPS5 på att det kan vara involverat i bindningen av ADP. Dessutom är de två sista asparaginsyrorna i kinas-2-motivet placerade så att de interagerar med ATP:s tredje fosfat, vilket stämmer överens med deras roll som koordinator för den tvåvärda metalljon som krävs för fosfatöverföringsreaktioner, t.ex. Mg2+ i Mg-ATP (figur 3). Ankarregionen i α/β-subdomänen av APAF-1, som består av sekvensen Val-Thr-Arg, finns som Phe-Gly-Asn i RSP4 och som Val-Gly-Gln i RPS5. Denna ankarregion, som består av en hydrofob (Val eller Phe), en liten (Gly eller Thr) och en polär (Arg, Asn eller Gln) aminosyra, var tidigare okänd, men är mycket konserverad i växt NBS-LRR-proteiner (se Additional data file 3). Autoaktiverande mutationer i två CNLs, potatis Rx (Asp460Val) och tomat I2 (Asp495Val), kartlägger bredvid histidinet i MHDV-motivet; dessa mutationer kan störa bindningen av β-fosfatet av ADP och resultera i en mer öppen struktur .

LR-domänen

LR-domänen är ett vanligt motiv som finns i mer än 2 000 proteiner, från virus till eukaryoter, och den är involverad i protein-proteininteraktioner och ligandbindning . Kristallstrukturerna av mer än 20 LRR-proteiner har avslöjat att LRR-domäner karakteristiskt innehåller en serie β-blad som bildar den konkava ytan formad som en hästsko eller en banan . Mindre är dock känt om de kvaternära arrangemangen hos LRR-proteiner. Minst tre olika typer av dimerer har observerats, som involverar interaktioner mellan antingen deras konkava ytor eller deras konvexa ytor , eller genom sammanlänkning som involverar ett antiparallellt β-blad vid gränssnittet . Genom att fästa LRR-domänen från Arabidopsis RPS5 på kristallstrukturen för det bovina decorinproteinet, en medlem av proteinfamiljen små LRR-proteoglykaner (SLRP) med en proteinkärna som består av LRR , fick man en modell som stämmer överens med en böjd hästskoaktig yta av β-blad (figur 4; P.K., opublicerat arbete). Antalet upprepningar i LRR-domänerna i TNLs och CNLs i Arabidopsis är liknande (medelvärde 14, intervall 8 till 25), men detta antal kan vara betydligt högre i andra arter. I CNL-proteinerna av sallat CNL Resistance Gene Candidate 2 (RGC2), som Dm3 är ett exempel på, tycks LRR-domänen vara duplicerad och det kan finnas så många som 47 LRR:er totalt . Varje LRR består av en kärna med cirka 26 aminosyror som innehåller motivet Leu-xx-Leu-xx-Leu-x-Leu-xx-Cys/Asn-xx (där x är en valfri aminosyra), som bildar ett β-blad. Varje kärnregion är åtskild av en sektion med varierande längd som varierar från noll till 30 aminosyror. I många NBS-LRR-proteiner uppvisar de förmodade lösningsmedelsexponerade resterna (som visas som x i konsensussekvensen ovan) betydligt högre andelar nonsynonyma än synonyma substitutioner, vilket tyder på att diversifierande urval har upprätthållit variationen vid dessa positioner. LRR-domänen är involverad i att bestämma igenkänningsspecificiteten hos flera R-proteiner (till exempel ); direkt interaktion med patogenproteiner har dock sällan visats.

Figur 4
figur4

Den förutsagda strukturen av en LRR-domän som uppstår genom att LRR-domänen från Arabidopsis RPS5 träs upp på nötkreaturs decorin (PDB-kod 1xku). (a) En tecknad representation av den förutspådda strukturen för RPS5:s LRR-domän som genererats med hjälp av PyMol . De β-blad som bildar den konkava sidan av ”hästskon” är representerade som pilar. De bevarade alifatiska resterna visas i blått. N, aminoterminus, C, karboxylterminus. (b) Utjämning av de 12 leucinrika upprepningarna i decorin och de 13 upprepningarna i RPS5 samt de nio aminoterminala aminosyrorna. De bevarade alifatiska resterna visas i blått.

LRR-domänen kan vara involverad främst i reglerande intramolekylära interaktioner. LRR-domänen i potatis CNL Rx interagerar med NBS-domänen även när den uttrycks i trans; denna interaktion störs av potato virus X elicitor, ett viralt höljeprotein som kan inducera ett värdens försvarssvar . Den inre, konkava ytan på β-bladen är kanske inte heller den enda bindningsytan. LRR-domänen för TLR3, en mänsklig Toll-like-receptor, förutspås bilda en heterodimer och binda dubbelsträngat RNA från patogener mot dess slingrande yta, på motsatt sida av β-bladen .

Analys med hjälp av MEME identifierade få gemensamma motiv mellan LRR-domänerna för TNLs och CNLs i Arabidopsis . Den tredje LRR-domen var en av de få som innehöll ett bevarat motiv. Mutation i denna LRR i CNL RPS5 resulterar i epistatiska hämmande effekter på flera NBS-LRR-proteiner, vilket tyder på att LRR:n kan interagera med nedströms signaleringskomponenter ; även en mutation inom denna LRR i CNL Rx i potatis resulterar i en konstitutivt aktiv form .

Karboxyterminalerna

CNL:er och TNL:er skiljer sig markant åt när det gäller storleken och sammansättningen av deras karboxyterminala domäner. TNL:s domäner är större och mer varierande än CNL:s domäner. CNLs har vanligtvis endast 40-80 aminosyror carboxyterminalt till LRR-domänen, medan TNLs carboxylterminaler ofta har ytterligare 200-300 aminosyror, vilket är lika stort som LRR-domänen. Flera TNL har förlängningar som liknar andra proteiner. En av de större TNL:erna i Arabidopsis, RRS1, som lokaliseras till kärnan som svar på en infektion, kodar för ett 1 388 aminosyror stort protein med en signal för nukleär lokalisering och ett WRKY-motiv (ett motiv som också återfinns i transkriptionsfaktorer med zinkfinger och som innehåller sekvensen Trp-Arg-Lys-Tyr) vid karboxylterminen .

.

Lämna ett svar

Din e-postadress kommer inte publiceras.