Rostlinné NBS-LRR proteiny jsou početné a prastarého původu. Jsou kódovány jednou z největších rodin genů známých u rostlin. V Arabidopsis thaliana je přibližně 150 genů kódujících NBS-LRR, v Oryza sativa více než 400 , a pravděpodobně podstatně více ve větších rostlinných genomech, které ještě nebyly plně sekvenovány. Mnoho sekvencí kódujících NBS bylo nyní amplifikováno z různých druhů rostlin pomocí PCR s degenerovanými primery založenými na konzervovaných sekvencích v doméně NBS a v současné době je ve veřejných databázích více než 1 600 sekvencí NBS (Additional data file 1). Vyskytují se u nevaskulárních rostlin a gymnospermů i u angiospermů; ortologický vztah je však obtížné určit vzhledem k duplikacím a ztrátám genů specifických pro jednotlivé linie . V několika liniích došlo k amplifikaci genů kódujících NBS-LRR, což vedlo ke vzniku podčeledí specifických pro jednotlivé čeledi (obr. 2; doplňkový soubor 1) . Ze 150 sekvencí NBS-LRR v Arabidopsis má 62 sekvencí NBS oblasti, které jsou si navzájem podobnější než jiné sekvence, které nejsou z rodu Brassica (obrázek 2; doplňkový soubor 2). Různé podčeledi byly amplifikovány u luštěnin (kam patří fazole), Solanaceae (kam patří rajčata a brambory) a Asteraceae (kam patří slunečnice a salát) . Spektrum proteinů NBS-LRR přítomných u jednoho druhu tedy není charakteristické pro rozmanitost proteinů NBS-LRR v jiných čeledích rostlin.
Geny kódující NBS-LRR se v genomu často shlukují, což je výsledek segmentálních i tandemových duplikací . V důsledku nerovnoměrného křížení uvnitř klastrů může docházet k velkým vnitrodruhovým rozdílům v počtu kopií . Geny kódující NBS-LRR mají vysokou úroveň mezidruhové a vnitrodruhové variability, ale ne vysokou míru mutace nebo rekombinace . Variabilita vzniká spíše běžnými genetickými mechanismy, včetně nerovnoměrného křížení, výměny sekvencí a genové konverze, než genetickými událostmi specifickými pro geny kódující NBS-LRR .
Rychlost evoluce genů kódujících NBS-LRR může být rychlá nebo pomalá, a to i v rámci jednotlivých shluků podobných sekvencí. Například hlavní shluk genů kódujících NBS-LRR v hlávkovém salátu zahrnuje geny se dvěma vzorci evoluce : geny typu I se vyvíjejí rychle s častými genovými přeměnami mezi nimi, zatímco geny typu II se vyvíjejí pomalu se vzácnými událostmi genových přeměn mezi klany. Tato heterogenní rychlost evoluce je v souladu s modelem evoluce R genů „narození a smrt“, v němž po genové duplikaci a nerovnoměrném křížení může následovat na hustotě závislá očišťující selekce působící na haplotyp, což vede k různému počtu polozávisle se vyvíjejících skupin R genů .
Vliv selekce na různé domény jednotlivých NBS-LRR kódujících genů je rovněž heterogenní . Zdá se, že doména NBS podléhá očišťující selekci, ale ne častým genovým konverzím, zatímco oblast LRR bývá velmi variabilní. Diverzifikační selekce, jak naznačují výrazně zvýšené poměry nesynonymních a synonymních nukleotidových substitucí, udržuje variabilitu v rozpouštědlu exponovaných zbytcích β-listů domény LRR (viz níže) . Nerovnoměrné křížení a genová konverze vytvořily variabilitu v počtu a poloze LRR a in-frame inserce a/nebo delece v oblastech mezi β-listy pravděpodobně změnily orientaci jednotlivých β-listů. Na jeden protein připadá v průměru 14 LRR a často 5 až 10 sekvenčních variant pro každou repetici; proto i v rámci Arabidopsis existuje potenciál pro mnohem více než 9 × 1011 variant, což zdůrazňuje vysoce variabilní povahu předpokládaného vazebného povrchu těchto proteinů.
Existují dvě hlavní podrodiny rostlinných NBS-LRR proteinů, definované přítomností motivů Toll/interleukin-1 receptoru (TIR) nebo coiled-coil (CC) v amino-terminální doméně (obr. 1). Ačkoli se TIR-NBS-LRR proteiny (TNL) a CC-NBS-LRR proteiny (CNL) podílejí na rozpoznávání patogenů, obě podrodiny se liší jak sekvencí, tak signálními cestami (viz níže) a ve fylogenetických analýzách se shlukují odděleně pomocí svých NBS domén (viz doplňkový soubor 2) . TNL zcela chybí u druhů obilovin, což naznačuje, že raní předkové angiospermů měli málo TNL a že tyto byly ztraceny v linii obilovin. Přítomnost či nepřítomnost TNL u bazálních jednoděložných rostlin není v současné době známa. CNL z jednoděložných a dvouděložných rostlin se shlukují dohromady, což naznačuje, že předkové angiospermů měli více CNL (obrázek 2) .
V Arabidopsis je také 58 proteinů, které jsou příbuzné TNL nebo podčeledi CNL, ale chybí jim plný komplement domén . Patří mezi ně 21 TIR-NBS (TN) a pět CC-NBS (CN) proteinů, které mají amino-terminální a NBS domény, ale chybí jim LRR doména . Funkce těchto proteinů není známa, ale mají potenciál působit jako adaptory nebo regulátory proteinů TNL a CNL.
Charakteristické strukturní rysy
Bílkoviny NBS-LRR jsou jedny z největších proteinů známých u rostlin, mají od přibližně 860 do přibližně 1 900 aminokyselin. Mají nejméně čtyři odlišné domény spojené spojovacími oblastmi: variabilní amino-terminální doménu, doménu NBS, oblast LRR a variabilní karboxy-terminální domény (obrázek 1). Na základě sekvenční homologie, motivů, polohy intronu a fáze intronu byly v Arabidopsis identifikovány čtyři podrodiny CNL a osm podrodin TNL . Pro žádnou část rostlinného NBS-LRR proteinu nebyla stanovena krystalová struktura; krystalové struktury savčích NBS a LRR domén jsou však k dispozici jako předlohy pro přístupy homologického modelování.
Amino-terminální doména
O funkci amino-terminální domény je málo experimentálních informací. U živočichů se doména TIR podílí na signalizaci za receptory podobnými Toll. Předpokládá se, že mnoho rostlinných proteinů NBS-LRR monitoruje stav („hlídá“) cíle efektorů virulence patogenů (viz níže). Vzhledem k přítomnosti motivů TIR nebo CC a také k rozmanitosti těchto domén se předpokládá, že amino terminály jsou zapojeny do interakcí protein-protein, pravděpodobně se střeženými proteiny nebo s následnými signálními složkami . Polymorfismus v doméně TIR proteinu L6 TNL lnu ovlivňuje specifičnost rozpoznávání patogenů . Motiv alanin-polyserin, který se může podílet na stabilitě proteinu, se nachází bezprostředně vedle aminoterminálního methioninu v mnoha TNL (ale ne CNL) v Arabidopsis . Čtyři konzervované motivy TIR pokrývají 175 aminokyselin v doméně TIR TNL . Motiv CC je běžný, ale není vždy přítomen ve 175 aminokyselinách na konci NBS CNL . Některé CNL mají velké amino-terminální domény; například rajčatový Prf má 1 117 aminokyselin na amino-terminálu NBS, z nichž velká část je pro tento protein jedinečná.
Doména NBS
Více je známa struktura a funkce domény NBS, která se také nazývá NB-ARC (nukleotidový vazebný adaptér sdílený proteiny NOD-LRR, APAF-1, R proteiny a CED4). Tato doména obsahuje několik definovaných motivů charakteristických pro rodinu ATPáz „signální transdukce s četnými doménami“ (STAND), do které patří savčí proteiny NOD . Proteiny STAND fungují jako molekulární spínače v signálních drahách nemocí. Specifická vazba a hydrolýza ATP byla prokázána u domén NBS dvou rajčatových CNL, I2 a Mi . Předpokládá se, že hydrolýza ATP vede ke konformačním změnám, které regulují následnou signalizaci. První zprávou o oligomerizaci proteinů NBS-LRR, která je kritickou událostí při signalizaci ze savčích proteinů NOD, je oligomerizace tabákového proteinu N (TNL) v reakci na patogenní elicitory . V Arabidopsis bylo analýzou pomocí programu MEME pro identifikaci motivů identifikováno osm konzervovaných motivů NBS . NBS domény TNL a CNL se liší podle sekvencí tří rezistenčních NBS (RNBS) motivů v nich (RNBS-A, RNBS-C a RNBS-D motivy; viz doplňkový soubor 3) .
Navlečení rostlinných NBS domén na krystalovou strukturu lidského APAF-1 poskytuje informativní vhled do prostorového uspořádání a funkce motivů konzervovaných v rostlinných NBS doménách (obr. 3) . Nukleotidová vazebná doména APAF-1 se skládá ze tří subdomén: třívrstvé α/β subdomény (obsahující kotevní oblast), šroubovicové subdomény (obsahující motiv kinázy-2 a smyčku P) a subdomény s křídlovou šroubovicí (obsahující motiv MHDV; obrázek 3). Specifické vazby ADP lidským APAF-1 je dosaženo celkem osmi přímými a čtyřmi vodou zprostředkovanými vodíkovými vazbami; část P-smyčky šroubovicové subdomény interaguje s α- a β-fosfáty ADP, histidin a serinový zbytek na subdoméně křídlaté šroubovice interagují s fosfátem a cukrem ADP a malá kotevní oblast v subdoméně α/β stabilizuje adeninovou bázi.
Vazbová kapsa a vzorce vazby na ADP jsou dobře konzervovány ve vláknových modelech TNL (příkladem je protein RPS4 z Arabidopsis) a CNL (příkladem je protein RPS5 z Arabidopsis; obrázek 3) ( a P.K., nepublikovaná práce). NBS domény TNL obsahují další smyčky, které v NBS doméně CNL chybí. TNL a CNL mají čtyři konzervované motivy, které se nacházejí kolem katalytické štěrbiny: P-smyčku, kotevní oblast a motiv MHDV (konkrétně histidinový zbytek), které slouží k orientaci molekuly ADP, a také motiv GLPL (motivy MHDV a GLPL jsou pojmenovány podle aminokyselin, které je tvoří, v jednopísmenném kódu). Ačkoli u lidského APAF-1 není zřejmý kontakt mezi ADP a motivem GLPL, zachování jeho polohy na vrcholu vazebného místa u APAF-1, RPS4 a RPS5 naznačuje, že se může podílet na vazbě ADP. Kromě toho jsou poslední dvě asparagové kyseliny v motivu kinázy-2 umístěny tak, aby interagovaly s třetím fosfátem ATP, což odpovídá jejich koordinační roli pro dvojmocný kovový iont potřebný pro reakce fosfotransferu, například Mg2+ z Mg-ATP (obr. 3). Kotevní oblast v subdoméně α/β APAF-1, která se skládá ze sekvence Val-Thr-Arg, je v RSP4 přítomna jako Phe-Gly-Asn a v RPS5 jako Val-Gly-Gln. Tato kotevní oblast, která se skládá z hydrofobní (Val nebo Phe), malé (Gly nebo Thr) a polární (Arg, Asn nebo Gln) aminokyseliny, nebyla dříve rozpoznána, ale je vysoce konzervovaná v rostlinných NBS-LRR proteinech (viz doplňkový soubor 3). Autoaktivační mutace ve dvou CNL, bramborovém Rx (Asp460Val) a rajčatovém I2 (Asp495Val), mapují vedle histidinu v motivu MHDV; tyto mutace mohou narušit vazbu β-fosfátu ADP a vést k otevřenější struktuře .
Doména LRR
Doména LRR je běžný motiv, který se vyskytuje u více než 2 000 proteinů, od virů po eukaryota, a podílí se na interakcích protein-protein a vazbě ligandů . Krystalové struktury více než 20 proteinů LRR odhalily, že domény LRR charakteristicky obsahují řadu β-listů, které tvoří konkávní plochu ve tvaru podkovy nebo banánu . Méně je však známo o kvartérním uspořádání proteinů LRR . Byly pozorovány nejméně tři různé typy dimerů, které zahrnují interakce buď jejich konkávních povrchů, nebo jejich konvexních povrchů , nebo konkatenaci zahrnující antiparalelní β-list na rozhraní . Navlečení LRR domény Arabidopsis RPS5 na krystalovou strukturu hovězího proteinu decorinu, člena rodiny malých LRR proteoglykanů (SLRP) s proteinovým jádrem složeným z LRR , poskytlo model konzistentní se zakřiveným podkovovitým povrchem β-listů (obr. 4; P.K., nepublikovaná práce). Počet opakování v LRR doménách v TNL a CNL Arabidopsis je podobný (průměr 14, rozmezí 8 až 25), ale u jiných druhů může být tento počet podstatně vyšší. U salátových proteinů CNL Resistance Gene Candidate 2 (RGC2), jejichž příkladem je Dm3, se zdá, že LRR doména je zdvojená a celkem může být až 47 LRR . Každá LRR obsahuje jádro o přibližně 26 aminokyselinách obsahující motiv Leu-xx-Leu-xx-Leu-x-Leu-xx-Cys/Asn-xx (kde x je libovolná aminokyselina), který tvoří β-list; každá oblast jádra je oddělena úsekem proměnlivé délky, která se pohybuje od nuly do 30 aminokyselin. V mnoha proteinech NBS-LRR vykazují předpokládaná solventně exponovaná rezidua (v konsenzuální sekvenci výše zobrazená jako x) výrazně zvýšený poměr nesynonymních a synonymních substitucí, což naznačuje, že diverzifikační selekce udržuje v těchto pozicích variabilitu. LRR doména se podílí na určování rozpoznávací specifity několika R proteinů (například ); přímá interakce s patogenními proteiny však byla prokázána jen zřídka.
Doména LRR se může podílet převážně na regulačních intramolekulárních interakcích. LRR doména CNL Rx bramboru interaguje s NBS doménou, i když je exprimována in trans; tato interakce je narušena elicitorem viru X bramboru, virovým obalovým proteinem, který může vyvolat obrannou reakci hostitele . Vnitřní konkávní povrch β-listů také nemusí být jediným vazebným povrchem. Předpokládá se, že LRR doména TLR3, lidského Toll-like receptoru, tvoří heterodimer a váže dvouvláknovou RNA z patogenů proti svému smyčkovitému povrchu, na opačné straně než β-listy .
Analýza pomocí MEME identifikovala několik společných motivů mezi LRR doménami TNL a CNL v Arabidopsis . Třetí LRR byl jedním z mála, který obsahoval konzervovaný motiv. Mutace v této LRR u CNL RPS5 vede k epistatickým inhibičním účinkům na více proteinů NBS-LRR, což naznačuje, že LRR může interagovat s následnými signálními složkami ; také mutace v této LRR u CNL Rx bramboru vede ke konstitutivně aktivní formě .
Karboxylové terminály
CNL a TNL se výrazně liší ve velikosti a složení svých karboxyterminálních domén. Ty jsou u TNL větší a variabilnější než u CNL. CNL mají obvykle pouze 40-80 aminokyselin na karboxyterminálu domény LRR, zatímco karboxylové terminály TNL mají často dalších 200-300 aminokyselin, což odpovídá velikosti domény LRR. Některé TNL mají prodloužení s podobností s jinými proteiny . Jeden z větších TNL v Arabidopsis, RRS1, který se lokalizuje do jádra v reakci na infekci, kóduje 1 388 aminokyselinový protein s jaderným lokalizačním signálem a motivem WRKY (motiv, který se vyskytuje také u transkripčních faktorů se zinkovými prsty a obsahuje sekvenci Trp-Arg-Lys-Tyr) na karboxylovém zakončení .
.