Rostlinné NBS-LRR proteiny jsou početné a prastarého původu. Jsou kódovány jednou z největších rodin genů známých u rostlin. V Arabidopsis thaliana je přibližně 150 genů kódujících NBS-LRR, v Oryza sativa více než 400 , a pravděpodobně podstatně více ve větších rostlinných genomech, které ještě nebyly plně sekvenovány. Mnoho sekvencí kódujících NBS bylo nyní amplifikováno z různých druhů rostlin pomocí PCR s degenerovanými primery založenými na konzervovaných sekvencích v doméně NBS a v současné době je ve veřejných databázích více než 1 600 sekvencí NBS (Additional data file 1). Vyskytují se u nevaskulárních rostlin a gymnospermů i u angiospermů; ortologický vztah je však obtížné určit vzhledem k duplikacím a ztrátám genů specifických pro jednotlivé linie . V několika liniích došlo k amplifikaci genů kódujících NBS-LRR, což vedlo ke vzniku podčeledí specifických pro jednotlivé čeledi (obr. 2; doplňkový soubor 1) . Ze 150 sekvencí NBS-LRR v Arabidopsis má 62 sekvencí NBS oblasti, které jsou si navzájem podobnější než jiné sekvence, které nejsou z rodu Brassica (obrázek 2; doplňkový soubor 2). Různé podčeledi byly amplifikovány u luštěnin (kam patří fazole), Solanaceae (kam patří rajčata a brambory) a Asteraceae (kam patří slunečnice a salát) . Spektrum proteinů NBS-LRR přítomných u jednoho druhu tedy není charakteristické pro rozmanitost proteinů NBS-LRR v jiných čeledích rostlin.

Sousední spojovací strom zobrazující amplifikaci sekvencí NBS specifickou pro jednotlivé čeledi. (a) TNL. (b) CNL. Kompletní strom byl založen na 1 600 sekvencích (viz doplňkové datové soubory 1 a 2 pro rozšířený strom s jednotlivými sekvencemi a použitými zarovnáními). Klady, které obsahovaly sekvence z jednotlivých rostlinných čeledí, byly sbaleny do jednotlivých větví a počet sekvencí v každé větvi je uveden. Různým taxonům jsou přiřazeny různé barvy; kladie se zástupci z několika čeledí jsou zobrazeny černě. Stupnice představuje pět nukleotidových záměn.
Geny kódující NBS-LRR se v genomu často shlukují, což je výsledek segmentálních i tandemových duplikací . V důsledku nerovnoměrného křížení uvnitř klastrů může docházet k velkým vnitrodruhovým rozdílům v počtu kopií . Geny kódující NBS-LRR mají vysokou úroveň mezidruhové a vnitrodruhové variability, ale ne vysokou míru mutace nebo rekombinace . Variabilita vzniká spíše běžnými genetickými mechanismy, včetně nerovnoměrného křížení, výměny sekvencí a genové konverze, než genetickými událostmi specifickými pro geny kódující NBS-LRR .
Rychlost evoluce genů kódujících NBS-LRR může být rychlá nebo pomalá, a to i v rámci jednotlivých shluků podobných sekvencí. Například hlavní shluk genů kódujících NBS-LRR v hlávkovém salátu zahrnuje geny se dvěma vzorci evoluce : geny typu I se vyvíjejí rychle s častými genovými přeměnami mezi nimi, zatímco geny typu II se vyvíjejí pomalu se vzácnými událostmi genových přeměn mezi klany. Tato heterogenní rychlost evoluce je v souladu s modelem evoluce R genů „narození a smrt“, v němž po genové duplikaci a nerovnoměrném křížení může následovat na hustotě závislá očišťující selekce působící na haplotyp, což vede k různému počtu polozávisle se vyvíjejících skupin R genů .
Vliv selekce na různé domény jednotlivých NBS-LRR kódujících genů je rovněž heterogenní . Zdá se, že doména NBS podléhá očišťující selekci, ale ne častým genovým konverzím, zatímco oblast LRR bývá velmi variabilní. Diverzifikační selekce, jak naznačují výrazně zvýšené poměry nesynonymních a synonymních nukleotidových substitucí, udržuje variabilitu v rozpouštědlu exponovaných zbytcích β-listů domény LRR (viz níže) . Nerovnoměrné křížení a genová konverze vytvořily variabilitu v počtu a poloze LRR a in-frame inserce a/nebo delece v oblastech mezi β-listy pravděpodobně změnily orientaci jednotlivých β-listů. Na jeden protein připadá v průměru 14 LRR a často 5 až 10 sekvenčních variant pro každou repetici; proto i v rámci Arabidopsis existuje potenciál pro mnohem více než 9 × 1011 variant, což zdůrazňuje vysoce variabilní povahu předpokládaného vazebného povrchu těchto proteinů.
Existují dvě hlavní podrodiny rostlinných NBS-LRR proteinů, definované přítomností motivů Toll/interleukin-1 receptoru (TIR) nebo coiled-coil (CC) v amino-terminální doméně (obr. 1). Ačkoli se TIR-NBS-LRR proteiny (TNL) a CC-NBS-LRR proteiny (CNL) podílejí na rozpoznávání patogenů, obě podrodiny se liší jak sekvencí, tak signálními cestami (viz níže) a ve fylogenetických analýzách se shlukují odděleně pomocí svých NBS domén (viz doplňkový soubor 2) . TNL zcela chybí u druhů obilovin, což naznačuje, že raní předkové angiospermů měli málo TNL a že tyto byly ztraceny v linii obilovin. Přítomnost či nepřítomnost TNL u bazálních jednoděložných rostlin není v současné době známa. CNL z jednoděložných a dvouděložných rostlin se shlukují dohromady, což naznačuje, že předkové angiospermů měli více CNL (obrázek 2) .
V Arabidopsis je také 58 proteinů, které jsou příbuzné TNL nebo podčeledi CNL, ale chybí jim plný komplement domén . Patří mezi ně 21 TIR-NBS (TN) a pět CC-NBS (CN) proteinů, které mají amino-terminální a NBS domény, ale chybí jim LRR doména . Funkce těchto proteinů není známa, ale mají potenciál působit jako adaptory nebo regulátory proteinů TNL a CNL.
Charakteristické strukturní rysy
Bílkoviny NBS-LRR jsou jedny z největších proteinů známých u rostlin, mají od přibližně 860 do přibližně 1 900 aminokyselin. Mají nejméně čtyři odlišné domény spojené spojovacími oblastmi: variabilní amino-terminální doménu, doménu NBS, oblast LRR a variabilní karboxy-terminální domény (obrázek 1). Na základě sekvenční homologie, motivů, polohy intronu a fáze intronu byly v Arabidopsis identifikovány čtyři podrodiny CNL a osm podrodin TNL . Pro žádnou část rostlinného NBS-LRR proteinu nebyla stanovena krystalová struktura; krystalové struktury savčích NBS a LRR domén jsou však k dispozici jako předlohy pro přístupy homologického modelování.
Amino-terminální doména
O funkci amino-terminální domény je málo experimentálních informací. U živočichů se doména TIR podílí na signalizaci za receptory podobnými Toll. Předpokládá se, že mnoho rostlinných proteinů NBS-LRR monitoruje stav („hlídá“) cíle efektorů virulence patogenů (viz níže). Vzhledem k přítomnosti motivů TIR nebo CC a také k rozmanitosti těchto domén se předpokládá, že amino terminály jsou zapojeny do interakcí protein-protein, pravděpodobně se střeženými proteiny nebo s následnými signálními složkami . Polymorfismus v doméně TIR proteinu L6 TNL lnu ovlivňuje specifičnost rozpoznávání patogenů . Motiv alanin-polyserin, který se může podílet na stabilitě proteinu, se nachází bezprostředně vedle aminoterminálního methioninu v mnoha TNL (ale ne CNL) v Arabidopsis . Čtyři konzervované motivy TIR pokrývají 175 aminokyselin v doméně TIR TNL . Motiv CC je běžný, ale není vždy přítomen ve 175 aminokyselinách na konci NBS CNL . Některé CNL mají velké amino-terminální domény; například rajčatový Prf má 1 117 aminokyselin na amino-terminálu NBS, z nichž velká část je pro tento protein jedinečná.
Doména NBS
Více je známa struktura a funkce domény NBS, která se také nazývá NB-ARC (nukleotidový vazebný adaptér sdílený proteiny NOD-LRR, APAF-1, R proteiny a CED4). Tato doména obsahuje několik definovaných motivů charakteristických pro rodinu ATPáz „signální transdukce s četnými doménami“ (STAND), do které patří savčí proteiny NOD . Proteiny STAND fungují jako molekulární spínače v signálních drahách nemocí. Specifická vazba a hydrolýza ATP byla prokázána u domén NBS dvou rajčatových CNL, I2 a Mi . Předpokládá se, že hydrolýza ATP vede ke konformačním změnám, které regulují následnou signalizaci. První zprávou o oligomerizaci proteinů NBS-LRR, která je kritickou událostí při signalizaci ze savčích proteinů NOD, je oligomerizace tabákového proteinu N (TNL) v reakci na patogenní elicitory . V Arabidopsis bylo analýzou pomocí programu MEME pro identifikaci motivů identifikováno osm konzervovaných motivů NBS . NBS domény TNL a CNL se liší podle sekvencí tří rezistenčních NBS (RNBS) motivů v nich (RNBS-A, RNBS-C a RNBS-D motivy; viz doplňkový soubor 3) .
Navlečení rostlinných NBS domén na krystalovou strukturu lidského APAF-1 poskytuje informativní vhled do prostorového uspořádání a funkce motivů konzervovaných v rostlinných NBS doménách (obr. 3) . Nukleotidová vazebná doména APAF-1 se skládá ze tří subdomén: třívrstvé α/β subdomény (obsahující kotevní oblast), šroubovicové subdomény (obsahující motiv kinázy-2 a smyčku P) a subdomény s křídlovou šroubovicí (obsahující motiv MHDV; obrázek 3). Specifické vazby ADP lidským APAF-1 je dosaženo celkem osmi přímými a čtyřmi vodou zprostředkovanými vodíkovými vazbami; část P-smyčky šroubovicové subdomény interaguje s α- a β-fosfáty ADP, histidin a serinový zbytek na subdoméně křídlaté šroubovice interagují s fosfátem a cukrem ADP a malá kotevní oblast v subdoméně α/β stabilizuje adeninovou bázi.

Předpokládané struktury domén NBS. Strukturní modely pro doménu NBS TNL RPS4 a CNL RPS5 z Arabidopsis byly vytvořeny pomocí techniky homologického modelování se samokonzistentním středním polem , v nepřítomnosti ADP. ADP byl do obou modelů NBS přidán na základě odvození z komplexu APAF-1-ADP bez dalšího zpřesňování modelů pro ilustraci polohy nukleotidu vzhledem ke konzervovaným motivům. (a) Struktury domén NBS RPS4 a RPS5, které ukazují polohu konzervovaných motivů. Struktury proteinů jsou znázorněny jako stuhové diagramy a ADP je znázorněn jako tyčový model. Domény NBS typu TIR a CC jsou tvořeny motivy v pořadí od aminoterminálu : P-smyčka (nebo Walkerovo místo A, modrá); RNBS-A (zelená); kináza-2 (nebo Walkerovo místo B, purpurová); RNBS-B (zelená); RNBS-C (zelená); GLPL (žlutá); RNBS-D (zelená); MHDV (oranžová). (b) Vazebná místa lidského APAF-1 (kód PDB 1z6tA), Arabidopsis RPS4 a RPS5, znázorňující zbytky interagující s ADP a ATP. Koordinace ADP u těchto tří proteinů zahrnuje tři různé konzervované motivy. Malá kotevní oblast na aminoterminálu domény NBS koordinuje adenin ADP nebo ATP, smyčka P koordinuje α- a β-fosfáty a motiv MHDV (v subdoméně křídlaté šroubovice u APAF-1) koordinuje buď cukr, nebo β-fosfát ADP. Dvě koncové asparagové kyseliny z motivu kinázy-2 se nacházejí v kapse, v níž by se nacházel γ-fosfát ATP. Obrázky byly vytvořeny pomocí programu PyMol .
Vazbová kapsa a vzorce vazby na ADP jsou dobře konzervovány ve vláknových modelech TNL (příkladem je protein RPS4 z Arabidopsis) a CNL (příkladem je protein RPS5 z Arabidopsis; obrázek 3) ( a P.K., nepublikovaná práce). NBS domény TNL obsahují další smyčky, které v NBS doméně CNL chybí. TNL a CNL mají čtyři konzervované motivy, které se nacházejí kolem katalytické štěrbiny: P-smyčku, kotevní oblast a motiv MHDV (konkrétně histidinový zbytek), které slouží k orientaci molekuly ADP, a také motiv GLPL (motivy MHDV a GLPL jsou pojmenovány podle aminokyselin, které je tvoří, v jednopísmenném kódu). Ačkoli u lidského APAF-1 není zřejmý kontakt mezi ADP a motivem GLPL, zachování jeho polohy na vrcholu vazebného místa u APAF-1, RPS4 a RPS5 naznačuje, že se může podílet na vazbě ADP. Kromě toho jsou poslední dvě asparagové kyseliny v motivu kinázy-2 umístěny tak, aby interagovaly s třetím fosfátem ATP, což odpovídá jejich koordinační roli pro dvojmocný kovový iont potřebný pro reakce fosfotransferu, například Mg2+ z Mg-ATP (obr. 3). Kotevní oblast v subdoméně α/β APAF-1, která se skládá ze sekvence Val-Thr-Arg, je v RSP4 přítomna jako Phe-Gly-Asn a v RPS5 jako Val-Gly-Gln. Tato kotevní oblast, která se skládá z hydrofobní (Val nebo Phe), malé (Gly nebo Thr) a polární (Arg, Asn nebo Gln) aminokyseliny, nebyla dříve rozpoznána, ale je vysoce konzervovaná v rostlinných NBS-LRR proteinech (viz doplňkový soubor 3). Autoaktivační mutace ve dvou CNL, bramborovém Rx (Asp460Val) a rajčatovém I2 (Asp495Val), mapují vedle histidinu v motivu MHDV; tyto mutace mohou narušit vazbu β-fosfátu ADP a vést k otevřenější struktuře .
Doména LRR
Doména LRR je běžný motiv, který se vyskytuje u více než 2 000 proteinů, od virů po eukaryota, a podílí se na interakcích protein-protein a vazbě ligandů . Krystalové struktury více než 20 proteinů LRR odhalily, že domény LRR charakteristicky obsahují řadu β-listů, které tvoří konkávní plochu ve tvaru podkovy nebo banánu . Méně je však známo o kvartérním uspořádání proteinů LRR . Byly pozorovány nejméně tři různé typy dimerů, které zahrnují interakce buď jejich konkávních povrchů, nebo jejich konvexních povrchů , nebo konkatenaci zahrnující antiparalelní β-list na rozhraní . Navlečení LRR domény Arabidopsis RPS5 na krystalovou strukturu hovězího proteinu decorinu, člena rodiny malých LRR proteoglykanů (SLRP) s proteinovým jádrem složeným z LRR , poskytlo model konzistentní se zakřiveným podkovovitým povrchem β-listů (obr. 4; P.K., nepublikovaná práce). Počet opakování v LRR doménách v TNL a CNL Arabidopsis je podobný (průměr 14, rozmezí 8 až 25), ale u jiných druhů může být tento počet podstatně vyšší. U salátových proteinů CNL Resistance Gene Candidate 2 (RGC2), jejichž příkladem je Dm3, se zdá, že LRR doména je zdvojená a celkem může být až 47 LRR . Každá LRR obsahuje jádro o přibližně 26 aminokyselinách obsahující motiv Leu-xx-Leu-xx-Leu-x-Leu-xx-Cys/Asn-xx (kde x je libovolná aminokyselina), který tvoří β-list; každá oblast jádra je oddělena úsekem proměnlivé délky, která se pohybuje od nuly do 30 aminokyselin. V mnoha proteinech NBS-LRR vykazují předpokládaná solventně exponovaná rezidua (v konsenzuální sekvenci výše zobrazená jako x) výrazně zvýšený poměr nesynonymních a synonymních substitucí, což naznačuje, že diverzifikační selekce udržuje v těchto pozicích variabilitu. LRR doména se podílí na určování rozpoznávací specifity několika R proteinů (například ); přímá interakce s patogenními proteiny však byla prokázána jen zřídka.

Předpokládaná struktura LRR domény vzniklé navlečením LRR domény Arabidopsis RPS5 na bovinní dekorin (kód PDB 1xku). (a) Kreslené znázornění předpovězené struktury LRR domény RPS5 vytvořené pomocí programu PyMol . Šipkami jsou znázorněny β-listy tvořící konkávní plochu „podkovy“. Konzervované alifatické zbytky jsou znázorněny modře. N – amino terminus; C – karboxylový terminus. (b) Zarovnání 12 opakování bohatých na leucin v dekorinu a 13 opakování v RPS5, jakož i devíti amino terminálních aminokyselin. Konzervované alifatické zbytky jsou znázorněny modře.
Doména LRR se může podílet převážně na regulačních intramolekulárních interakcích. LRR doména CNL Rx bramboru interaguje s NBS doménou, i když je exprimována in trans; tato interakce je narušena elicitorem viru X bramboru, virovým obalovým proteinem, který může vyvolat obrannou reakci hostitele . Vnitřní konkávní povrch β-listů také nemusí být jediným vazebným povrchem. Předpokládá se, že LRR doména TLR3, lidského Toll-like receptoru, tvoří heterodimer a váže dvouvláknovou RNA z patogenů proti svému smyčkovitému povrchu, na opačné straně než β-listy .
Analýza pomocí MEME identifikovala několik společných motivů mezi LRR doménami TNL a CNL v Arabidopsis . Třetí LRR byl jedním z mála, který obsahoval konzervovaný motiv. Mutace v této LRR u CNL RPS5 vede k epistatickým inhibičním účinkům na více proteinů NBS-LRR, což naznačuje, že LRR může interagovat s následnými signálními složkami ; také mutace v této LRR u CNL Rx bramboru vede ke konstitutivně aktivní formě .
Karboxylové terminály
CNL a TNL se výrazně liší ve velikosti a složení svých karboxyterminálních domén. Ty jsou u TNL větší a variabilnější než u CNL. CNL mají obvykle pouze 40-80 aminokyselin na karboxyterminálu domény LRR, zatímco karboxylové terminály TNL mají často dalších 200-300 aminokyselin, což odpovídá velikosti domény LRR. Některé TNL mají prodloužení s podobností s jinými proteiny . Jeden z větších TNL v Arabidopsis, RRS1, který se lokalizuje do jádra v reakci na infekci, kóduje 1 388 aminokyselinový protein s jaderným lokalizačním signálem a motivem WRKY (motiv, který se vyskytuje také u transkripčních faktorů se zinkovými prsty a obsahuje sekvenci Trp-Arg-Lys-Tyr) na karboxylovém zakončení .
.