Planternes NBS-LRR-proteiner er talrige og gamle i deres oprindelse. De er kodet af en af de største genfamilier, der er kendt i planter. Der er ca. 150 NBS-LRR-kodende gener i Arabidopsis thaliana, over 400 i Oryza sativa , og sandsynligvis betydeligt flere i større plantegenomer, som endnu ikke er blevet fuldt sekventeret. Mange NBS-kodende sekvenser er nu blevet amplificeret fra en bred vifte af plantearter ved hjælp af PCR med degenererede primere baseret på konserverede sekvenser inden for NBS-domænet, og der findes i øjeblikket over 1.600 NBS-sekvenser i offentlige databaser (Additional data file 1). De findes i ikke-vaskulære planter og gymnospermer såvel som i angiospermer; ortologt forhold er imidlertid vanskeligt at bestemme på grund af slægtsspecifikke genduplikeringer og -tab . I flere slægter er NBS-LRR-kodende gener blevet amplificeret, hvilket har resulteret i familiespecifikke underfamilier (Figur 2; Yderligere datafil 1) . Af de 150 NBS-LRR-sekvenser i Arabidopsis har 62 NBS-regioner, der ligner hinanden mere end andre ikke-Brassica-sekvenser (Figur 2; Yderligere datafil 2). Forskellige underfamilier er blevet amplificeret i bælgplanter (som omfatter bønner), Solanaceae (som omfatter tomat og kartoffel) og Asteraceae (som omfatter solsikke og salat) . Spektret af NBS-LRR-proteiner, der findes i én art, er derfor ikke karakteristisk for diversiteten af NBS-LRR-proteiner i andre plantefamilier.
NBS-LRR-kodende gener er hyppigt grupperet i genomet, resultatet af både segmentale og tandem-duplikeringer . Der kan være stor intraspecifik variation i antallet af kopier på grund af ulige crossing-over inden for klynger . NBS-LRR-kodende gener har et højt niveau af inter- og intraspecifik variation, men ikke høje mutations- eller rekombinationsrater . Variationen skyldes normale genetiske mekanismer, herunder ulige crossing-over, sekvensudveksling og genkonvertering, snarere end genetiske hændelser, der er særlige for NBS-LRR-kodende gener .
Evolutionshastigheden for NBS-LRR-kodende gener kan være hurtig eller langsom, selv inden for en enkelt klynge af lignende sekvenser. F.eks. omfatter den store klynge af NBS-LRR-kodende gener i salat gener med to udviklingsmønstre : type I-gener udvikler sig hurtigt med hyppige genkonverteringer mellem dem, mens type II-gener udvikler sig langsomt med sjældne genkonverteringsbegivenheder mellem klader. Denne heterogene udviklingshastighed er i overensstemmelse med en fødsel-og-død-model for R-genernes udvikling, hvor genduplikation og ulige crossing-over kan efterfølges af en tæthedsafhængig rensende selektion, der virker på haplotypen, hvilket resulterer i et varierende antal semi-uafhængigt udviklende grupper af R-gener .
Selektionens indvirkning på de forskellige domæner af de enkelte NBS-LRR-kodende gener er også heterogen . NBS-domænet synes at være udsat for rensende selektion, men ikke for hyppige genkonverteringsbegivenheder, hvorimod LRR-regionen har tendens til at være meget variabel. Diversificerende selektion, som angivet ved signifikant forhøjede forhold mellem ikke-synonyme og synonyme nukleotid-substitutioner, har opretholdt variationen i de opløsningsmiddeleksponerede rester i β-bladene i LRR-domænet (se nedenfor) . Ulige crossing-over og genkonvertering har skabt variation i antallet og placeringen af LRR’er, og indsættelser og/eller sletninger inden for rammen i regionerne mellem β-bladene har sandsynligvis ændret orienteringen af de enkelte β-blade. Der er i gennemsnit 14 LRR’er pr. protein og ofte 5 til 10 sekvensvarianter for hver gentagelse; selv inden for Arabidopsis er der derfor potentiale for langt over 9 × 1011 varianter, hvilket understreger den meget variable karakter af disse proteiners formodede bindingsoverflade.
Der er to store underfamilier af plante-NBS-LRR-proteiner, defineret ved tilstedeværelsen af Toll/interleukin-1-receptor (TIR)- eller coiled-coil (CC)-motiver i det amino-terminale domæne (figur 1). Selv om TIR-NBS-LRR-proteiner (TNL’er) og CC-NBS-LRR-proteiner (CNL’er) begge er involveret i patogengengenkendelse, er de to underfamilier forskellige både i sekvens og i signalveje (se nedenfor) og grupperes separat i fylogenetiske analyser ved hjælp af deres NBS-domæner (se Yderligere datafil 2) . TNL’er er helt fraværende i kornarter, hvilket tyder på, at de tidlige angiospermeforfædre havde få TNL’er, og at disse gik tabt i kornlinjen. Tilstedeværelsen eller fraværet af TNL’er i basale monokotyper er i øjeblikket ikke kendt. CNL’er fra monokotyper og dicotyper klynger sig sammen, hvilket tyder på, at angiospermeforfædre havde flere CNL’er (figur 2) .
Der er også 58 proteiner i Arabidopsis, der er beslægtet med TNL- eller CNL-underfamilierne, men som mangler det fulde supplement af domæner . Disse omfatter 21 TIR-NBS (TN) og fem CC-NBS (CN) proteiner, der har amino-terminale og NBS-domæner, men mangler et LRR-domæne . Funktionen af disse proteiner er ikke kendt, men de har potentiale til at fungere som adaptorer eller regulatorer af TNL- og CNL-proteiner.
Karakteristiske strukturelle træk
NBS-LRR-proteiner er nogle af de største proteiner, der er kendt i planter, og spænder fra ca. 860 til ca. 1.900 aminosyrer. De har mindst fire forskellige domæner, der er forbundet af linkerregioner: et variabelt amino-terminalt domæne, NBS-domænet, LRR-regionen og variable carboxy-terminale domæner (figur 1). Fire underfamilier af CNL’er og otte underfamilier af TNL’er blev identificeret i Arabidopsis ud fra sekvenshomologi, motiver, intronpositioner og intronfase . Der er ikke blevet bestemt nogen krystalstrukturer for nogen del af et plante-NBS-LRR-protein; krystalstrukturer af pattedyrs NBS- og LRR-domæner er imidlertid tilgængelige som skabeloner for homologimodelleringstilgange.
Det amino-terminale domæne
Der er kun få eksperimentelle oplysninger om det amino-terminale domænes funktion. Hos dyr er TIR-domænet involveret i signalering nedstrøms for Toll-like receptorer. Mange plante-NBS-LRR-proteiner menes at overvåge status af (“vagt”) mål for patogene virulenseffektorer (se nedenfor). I betragtning af tilstedeværelsen af TIR- eller CC-motiver samt diversiteten af disse domæner formodes aminoterminerne at være involveret i protein-protein-interaktioner, muligvis med de proteiner, der overvåges, eller med downstream-signaleringskomponenter . Polymorphisme i TIR-domænet af hør TNL-protein L6 påvirker patogengenkendelsens specificitet . Et alanin-polyserin-motiv, der kan være involveret i proteinets stabilitet, er placeret umiddelbart ved siden af den amino-terminale methionin i mange TNL’er (men ikke CNL’er) i Arabidopsis . Fire konserverede TIR-motiver spænder over 175 aminosyrer inden for TIR-domænet af TNL’er . Et CC-motiv er almindeligt, men ikke altid til stede i de 175 aminosyrer amino-terminalt for NBS af CNL’er . Nogle CNL’er har store amino-terminale domæner; tomat Prf har f.eks. 1.117 aminosyrer amino-terminalt af NBS, hvoraf en stor del er unik for dette protein.
NBS-domænet
Der er mere kendt om strukturen og funktionen af NBS-domænet, som også kaldes NB-ARC-domænet (nucleotide binding adaptor shared by NOD-LRR proteiner, APAF-1, R-proteiner og CED4). Dette domæne indeholder flere definerede motiver, der er karakteristiske for ATPasefamilien “signal transduction ATPases with numerous domains” (STAND), som omfatter pattedyrenes NOD-proteiner . STAND-proteiner fungerer som molekylære omskiftere i sygdomssignalveje. Specifik binding og hydrolyse af ATP er blevet påvist for NBS-domænerne i to tomat-CNL’er, I2 og Mi . ATP-hydrolyse menes at resultere i konformationsændringer, der regulerer downstream-signalering. Den første rapport om NBS-LRR-protein oligomerisering, en kritisk begivenhed i signalering fra pattedyrs NOD-proteiner, er oligomeriseringen af tobaks N-protein (en TNL) som reaktion på patogene elicitatorer . I Arabidopsis er otte konserverede NBS-motiver blevet identificeret gennem analyse med MEME, et program til motividentifikation . NBS-domæner af TNL’er og CNL’er adskiller sig ved sekvenserne af tre resistens-NBS (RNBS) motiver i dem (RNBS-A, RNBS-C og RNBS-D motiver; se Yderligere datafil 3) .
Threading plante NBS-domæner på krystalstrukturen af menneskelig APAF-1 giver informativ indsigt i den rumlige placering og funktion af de motiver, der er bevaret i plante NBS-domæner (Figur 3) . Det nukleotidbindende domæne af APAF-1 består af tre subdomæner: et α/β-subdomæne i tre lag (indeholdende ankerregionen), et helikalt subdomæne (indeholdende kinase-2 motivet og P-loop) og et winged-helix-subdomæne (indeholdende MHDV-motivet; Figur 3). Den specifikke binding af ADP ved human APAF-1 opnås ved i alt otte direkte og fire vandformidlede hydrogenbindinger; P-loop-delen af den helikale subdomæne interagerer med α- og β-fosfaterne af ADP, en histidin- og en serinrest på den vingede helix-subdomæne interagerer med et fosfat og sukkeret af ADP, og en lille ankerregion i α/β-subdomænet stabiliserer adeninbasen .
Bindingslommen og mønstrene for binding til ADP er velkonserverede i trådmodellerne af TNL’er (eksemplificeret af Arabidopsis-proteinet RPS4) og CNL’er (eksemplificeret af Arabidopsis-proteinet RPS5; figur 3) ( og P.K., upubliceret arbejde). NBS-domænerne af TNL’er indeholder yderligere loops, der ikke findes i NBS-domænet af CNL’er. TNL’er og CNL’er har fire bevarede motiver, der er placeret omkring den katalytiske kløft: P-loop’en, ankerregionen og MHDV-motivet (specifikt histidinrester), som alle tjener til at orientere ADP-molekylet, samt GLPL-motivet (MHDV- og GLPL-motiverne er opkaldt efter deres konstituerende aminosyrer i enkeltbogstavskoden). Selv om der ikke er nogen åbenlys kontakt mellem ADP og GLPL-motivet i menneskelig APAF-1, tyder bevarelsen af dets position på toppen af bindingsstedet i APAF-1, RPS4 og RPS5 på, at det kan være involveret i bindingen af ADP. Desuden er de to sidste asparaginsyrer i kinase-2 motivet placeret således, at de interagerer med ATP’s tredje fosfat, hvilket er i overensstemmelse med deres rolle som koordinator for den tosidige metalion, der er nødvendig for phosphotransferreaktioner, f.eks. Mg2+ i Mg-ATP (figur 3). Ankerregionen i α/β-subdomænet af APAF-1, som består af sekvensen Val-Thr-Arg, er til stede som Phe-Gly-Asn i RSP4 og som Val-Gly-Gln i RPS5. Denne ankerregion, der består af en hydrofob (Val eller Phe), en lille (Gly eller Thr) og en polær (Arg, Asn eller Gln) aminosyre, var ikke tidligere anerkendt, men er stærkt konserveret i plante-NBS-LRR-proteiner (se Yderligere datafil 3). Autoaktiverende mutationer i to CNL’er, kartoffel Rx (Asp460Val) og tomat I2 (Asp495Val), kortlægger ved siden af histidinen i MHDV-motivet; disse mutationer kan forstyrre bindingen af β-fosfatet af ADP og resultere i en mere åben struktur .
LR-domænet
LR-domænet er et almindeligt motiv, der findes i mere end 2 000 proteiner, fra vira til eukaryoter, og det er involveret i protein-protein-interaktioner og ligandbinding . Krystalstrukturerne af mere end 20 LRR-proteiner har afsløret, at LRR-domæner karakteristiskvis indeholder en række β-blade, der danner den konkave flade formet som en hestesko eller en banan . Derimod er der mindre viden om LRR-proteiners kvaternære arrangementer. Der er observeret mindst tre forskellige typer af dimere, der involverer interaktioner mellem enten deres konkave flader eller deres konvekse flader , eller ved sammenkædning, der involverer et antiparallelt β-ark ved grænsefladen . Trådning af LRR-domænet af Arabidopsis RPS5 på krystalstrukturen af det bovine decorinprotein, et medlem af proteinfamilien af små LRR-proteoglykaner (SLRP) med en proteinkerne bestående af LRR’er , gav en model, der er i overensstemmelse med en buet hestesko-lignende overflade af β-blade (figur 4; P.K., upubliceret arbejde). Antallet af gentagelser i LRR-domænerne i TNL’er og CNL’er i Arabidopsis er ens (gennemsnit 14, interval 8 til 25), men dette antal kan være betydeligt højere i andre arter. I salat CNL Resistance Gene Candidate 2 (RGC2)-proteinerne, som Dm3 er et eksempel på, ser LRR-domænet ud til at være duplikeret, og der kan være op til 47 LRR’er i alt . Hver LRR omfatter en kerne på ca. 26 aminosyrer, der indeholder Leu-xx-Leu-xx-Leu-x-Leu-xx-Cys/Asn-xx-motivet (hvor x er en hvilken som helst aminosyre), som danner et β-ark; hvert kerneområde er adskilt af en sektion af variabel længde, der varierer fra 0 til 30 aminosyrer. I mange NBS-LRR-proteiner viser de formodede opløsningsmiddeleksponerede rester (vist som x i konsensussekvensen ovenfor) betydeligt forhøjede forhold mellem nonsynonyme og synonyme substitutioner, hvilket indikerer, at diversificerende udvælgelse har opretholdt variationen på disse positioner. LRR-domænet er med til at bestemme genkendelsesspecificiteten for flere R-proteiner (f.eks. ); direkte interaktion med patogenproteiner er dog sjældent blevet påvist.
LRR-domænet kan være involveret overvejende i regulerende intramolekylære interaktioner. LRR-domænet i kartoffel CNL Rx interagerer med NBS-domænet, selv når det udtrykkes i trans; denne interaktion forstyrres af kartoffelvirus X elicitor, et viralt kappeprotein, der kan inducere et værtsforsvarsrespons . Det er også muligt, at den indre, konkave overflade af β-bladene ikke er den eneste bindingsflade. LRR-domænet af TLR3, en menneskelig Toll-like receptor, forudsiges at danne en heterodimer og binde dobbeltstrenget RNA fra patogener mod sin løkkeformede overflade, på den modsatte side af β-bladene .
Analyse ved hjælp af MEME identificerede få fælles motiver mellem LRR-domænerne af TNL’er og CNL’er i Arabidopsis . Den tredje LRR var en af de få, der indeholdt et bevaret motiv. Mutation i denne LRR i CNL RPS5 resulterer i epistatiske hæmmende virkninger på flere NBS-LRR-proteiner, hvilket tyder på, at LRR’en kan interagere med nedstrøms signaleringskomponenter ; også en mutation inden for denne LRR i CNL Rx af kartoffel resulterer i en konstitutivt aktiv form .
Karboxylterminalerne
CNL’er og TNL’er adskiller sig markant i størrelsen og sammensætningen af deres carboxy-terminale domæner. De er større og mere variable hos TNL’er end hos CNL’er. CNL’er har typisk kun 40-80 aminosyrer carboxy-terminalt i forhold til LRR-domænet, hvorimod TNL’ernes carboxylterminaler ofte har yderligere 200-300 aminosyrer, hvilket svarer til LRR-domænets størrelse. Flere TNL’er har forlængelser med lighed med andre proteiner . En af de større TNL’er i Arabidopsis, RRS1, som bliver lokaliseret til kernen som reaktion på infektion, koder for et protein på 1 388 aminosyrer med et nuklearlokaliseringssignal og et WRKY-motiv (et motiv, der også findes i zinkfinger-transskriptionsfaktorer og indeholder sekvensen Trp-Arg-Lys-Tyr) ved carboxylterminus .