Plant NBS-LRR proteins are numerous and ancient in origin. Są one kodowane przez jedną z największych rodzin genów znanych u roślin. Istnieje około 150 genów kodujących NBS-LRR w Arabidopsis thaliana, ponad 400 w Oryza sativa , i prawdopodobnie znacznie więcej w większych genomach roślinnych, które nie zostały jeszcze w pełni zsekwencjonowane. Wiele sekwencji kodujących NBS zostało obecnie amplifikowanych z różnych gatunków roślin przy użyciu PCR ze zdegenerowanymi starterami opartymi na konserwatywnych sekwencjach w obrębie domeny NBS i obecnie w publicznych bazach danych znajduje się ponad 1600 sekwencji NBS (Dodatkowy plik danych 1). Występują one u roślin nienaczyniowych i okrytozalążkowych, a także u okrytozalążkowych; związki ortologiczne są jednak trudne do określenia ze względu na specyficzne dla poszczególnych linii duplikacje i utraty genów. W kilku liniach geny kodujące NBS-LRR uległy amplifikacji, w wyniku czego powstały podrodziny specyficzne dla danej rodziny (Ryc. 2; Dodatkowy plik danych 1). Spośród 150 sekwencji NBS-LRR w Arabidopsis, 62 mają regiony NBS bardziej podobne do siebie niż do jakichkolwiek innych sekwencji spoza Brassica (Figura 2; Dodatkowy plik danych 2). Różne podrodziny zostały amplifikowane w roślinach strączkowych (co obejmuje fasolę), Solanaceae (co obejmuje pomidora i ziemniaka) oraz Asteraceae (co obejmuje słonecznik i sałatę). Spektrum białek NBS-LRR występujących u jednego gatunku nie jest więc charakterystyczne dla różnorodności białek NBS-LRR w innych rodzinach roślin.

Rysunek 2
figure2

Drzewo sąsiedzkie (ang. Nighbor-joining tree) przedstawiające rodzinnie specyficzną amplifikację sekwencji NBS. (a) TNLs. (b) CNLs. Kompletne drzewo zostało utworzone na podstawie 1600 sekwencji (patrz dodatkowe pliki danych 1 i 2 dla rozszerzonego drzewa z poszczególnymi sekwencjami i użytymi wyrównaniami). Klady, które zawierały sekwencje z poszczególnych rodzin roślin, zostały zwinięte w pojedyncze gałęzie, a liczba sekwencji w każdej gałęzi jest wskazana. Różnym taksonom przypisano różne kolory; klady z przedstawicielami kilku rodzin pokazano na czarno. Pasek skali reprezentuje pięć substytucji nukleotydowych.

Geny kodujące NBS-LRR są często zgrupowane w genomie, co jest wynikiem zarówno duplikacji segmentowych, jak i tandemowych. Może istnieć szerokie wewnątrzgatunkowe zróżnicowanie liczby kopii z powodu nierównomiernego crossing-over w obrębie klastrów. Geny kodujące NBS-LRR mają wysoki poziom zmienności między- i wewnątrzgatunkowej, ale nie mają wysokich wskaźników mutacji lub rekombinacji. Zmienność jest generowana przez normalne mechanizmy genetyczne, w tym nierównomierne krzyżowanie, wymianę sekwencji i konwersję genów, a nie zdarzenia genetyczne specyficzne dla genów kodujących NBS-LRR.

Tempo ewolucji genów kodujących NBS-LRR może być szybkie lub powolne, nawet w obrębie pojedynczego skupiska podobnych sekwencji. Na przykład, główny klaster genów kodujących NBS-LRR w sałacie zawiera geny o dwóch wzorcach ewolucji: geny typu I ewoluują szybko z częstymi konwersjami genów między nimi, podczas gdy geny typu II ewoluują powoli z rzadkimi przypadkami konwersji genów między kladami. To niejednorodne tempo ewolucji jest zgodne z modelem narodzin i śmierci genów R, w którym po duplikacji genów i nierównomiernym krzyżowaniu może nastąpić zależna od gęstości selekcja oczyszczająca działająca na haplotypy, w wyniku czego powstaje różna liczba częściowo niezależnie ewoluujących grup genów R.

Wpływ selekcji na różne domeny poszczególnych genów kodujących NBS-LRR jest również niejednorodny. Domena NBS wydaje się być przedmiotem selekcji oczyszczającej, ale nie częstych zdarzeń związanych z konwersją genów, podczas gdy region LRR ma tendencję do wysokiej zmienności. Selekcja różnicująca, na co wskazuje znacznie podwyższony stosunek niesynonimicznych do synonimicznych substytucji nukleotydów, utrzymała zmienność w eksponowanych na rozpuszczalnik resztach β-szkieletów domeny LRR (patrz poniżej). Nierównomierne crossing-over i konwersja genów spowodowały zmienność w liczbie i położeniu LRR, a insercje i/lub delecje w regionach pomiędzy arkuszami β prawdopodobnie zmieniły orientację poszczególnych arkuszy β. Na każde białko przypada średnio 14 LRR i często od 5 do 10 wariantów sekwencji dla każdego powtórzenia; dlatego nawet w obrębie Arabidopsis istnieje możliwość wystąpienia ponad 9 × 1011 wariantów, co podkreśla wysoce zmienny charakter przypuszczalnej powierzchni wiążącej tych białek.

Istnieją dwie główne podrodziny roślinnych białek NBS-LRR, definiowane przez obecność motywów receptora Toll/interleukiny-1 (TIR) lub cewki (CC) w domenie amino-końcowej (Rysunek 1). Chociaż białka TIR-NBS-LRR (TNLs) i CC-NBS-LRR (CNLs) są zaangażowane w rozpoznawanie patogenów, te dwie podrodziny różnią się zarówno sekwencją, jak i ścieżkami sygnalizacji (patrz poniżej) i grupują się oddzielnie w analizach filogenetycznych wykorzystujących ich domeny NBS (patrz Dodatkowy plik danych 2). TNL są całkowicie nieobecne w gatunkach zbóż, co sugeruje, że wcześni przodkowie okrytozalążkowych mieli niewiele TNL i że zostały one utracone w linii rozwojowej zbóż. Obecność lub brak TNL u bazalnych jednoliściennych nie jest obecnie znana. CNL z jednoliściennych i dwuliściennych grupują się razem, wskazując, że przodkowie okrytozalążkowych mieli wiele CNL (Figura 2) .

W Arabidopsis istnieje również 58 białek, które są związane z podrodzinami TNL lub CNL, ale brakuje im pełnego kompletu domen . Należą do nich 21 białek TIR-NBS (TN) i pięć CC-NBS (CN), które mają domeny amino-końcowe i NBS, ale brakuje im domeny LRR. Funkcja tych białek nie jest znana, ale mają one potencjał do działania jako adaptory lub regulatory białek TNL i CNL.

Charakterystyczne cechy strukturalne

Białka NBS-LRR są jednymi z największych białek znanych u roślin, o długości od około 860 do około 1900 aminokwasów. Posiadają co najmniej cztery odrębne domeny połączone regionami łącznikowymi: zmienną domenę amino-końcową, domenę NBS, region LRR oraz zmienne domeny karboksy-końcowe (Rysunek 1). W Arabidopsis zidentyfikowano cztery podrodziny CNL i osiem podrodzin TNL na podstawie homologii sekwencji, motywów, pozycji intronów i fazy intronów. Nie określono struktur krystalicznych dla żadnej części roślinnego białka NBS-LRR; struktury krystaliczne domen NBS i LRR ssaków są jednak dostępne jako szablony dla podejść modelowania homologicznego.

Domena amino-końcowa

Mało jest informacji doświadczalnych na temat funkcji domeny amino-końcowej. U zwierząt, domena TIR jest zaangażowana w sygnalizację downstream receptorów Toll-podobnych. Uważa się, że wiele roślinnych białek NBS-LRR monitoruje status („strażniczych”) celów efektorów wirulencji patogenów (patrz poniżej). Biorąc pod uwagę obecność motywów TIR lub CC, jak również różnorodność tych domen, uważa się, że aminowe zakończenia są zaangażowane w interakcje białko-białko, być może z białkami, które są chronione lub z komponentami sygnalizacji downstream. Polimorfizm w domenie TIR lnianego białka TNL L6 wpływa na specyficzność rozpoznawania patogenów. Motyw alaninowo-poliserynowy, który może być zaangażowany w stabilność białka, znajduje się bezpośrednio przy amino-końcowej metioninie w wielu TNL (ale nie CNL) w Arabidopsis. Cztery konserwowane motywy TIR obejmują 175 aminokwasów w obrębie domeny TIR TNLs. Motyw CC jest powszechny, ale nie zawsze obecny w 175 aminokwasach amino-końca NBS CNL. Niektóre CNL mają duże domeny amino-końcowe; pomidor Prf, na przykład, ma 1117 aminokwasów amino-końcowych NBS, z których duża część jest unikalna dla tego białka.

Domena NBS

Więcej wiadomo o strukturze i funkcji domeny NBS, która jest również nazywana domeną NB-ARC (nucleotide binding adaptor shared by NOD-LRR proteins, APAF-1, R proteins and CED4). Domena ta zawiera kilka zdefiniowanych motywów charakterystycznych dla rodziny ATPaz „ATPaz transdukcji sygnału z licznymi domenami” (STAND), do której należą białka NOD ssaków. Białka STAND funkcjonują jako molekularne przełączniki w szlakach sygnalizacyjnych chorób. Specyficzne wiązanie i hydrolizę ATP wykazano dla domen NBS dwóch pomidorowych CNLs, I2 i Mi . Uważa się, że hydroliza ATP prowadzi do zmian konformacyjnych, które regulują przekazywanie sygnałów. Pierwszym doniesieniem o oligomeryzacji białek NBS-LRR, krytycznym wydarzeniu w sygnalizacji pochodz±cej od białek NOD ssaków, jest oligomeryzacja białka N tytoniu (TNL) w odpowiedzi na elicytory patogenów. W Arabidopsis, osiem konserwatywnych motywów NBS zostało zidentyfikowanych poprzez analizę z MEME, programem do identyfikacji motywów. Domeny NBS TNL i CNL są rozróżniane przez sekwencje trzech opornych motywów NBS (RNBS) w ich obrębie (motywy RNBS-A, RNBS-C i RNBS-D; patrz plik danych dodatkowych 3) .

Narzutowanie roślinnych domen NBS na strukturę krystaliczną ludzkiego APAF-1 zapewnia wgląd w przestrzenne rozmieszczenie i funkcję motywów zachowanych w roślinnych domenach NBS (Rysunek 3) . Domena APAF-1 wiążąca nukleotydy składa się z trzech subdomen: trójwarstwowej subdomeny α/β (zawierającej region kotwicy), subdomeny helikalnej (zawierającej motyw kinazy-2 i pętlę P) oraz subdomeny skrzydlatej helisy (zawierającej motyw MHDV; Rysunek 3). Specyficzne wiązanie ADP przez ludzką APAF-1 jest osiągane przez w sumie osiem bezpośrednich i cztery wodorowe wiązania pośredniczące; część pętli P subdomeny helikalnej oddziałuje z α- i β-fosforanami ADP, histydyna i reszta serynowa na subdomenie skrzydlatej helisy oddziałuje z fosforanem i cukrem ADP, a mały region kotwicy w subdomenie α/β stabilizuje zasadę adeninową .

Rysunek 3
figure3

Predicted structures of NBS domains. Modele strukturalne dla domen NBS TNL RPS4 i CNL RPS5 Arabidopsis zostały wygenerowane przy użyciu techniki samokonsekwentnego modelowania homologii pola średniego, w nieobecności ADP. ADP został dodany do dwóch modeli NBS poprzez wnioskowanie z kompleksu APAF-1-ADP bez dalszego udoskonalania modeli w celu zilustrowania pozycji nukleotydu w stosunku do konserwowanych motywów. (a) Struktury domen NBS RPS4 i RPS5, pokazujące pozycje konserwowanych motywów. Struktury białek są przedstawione jako diagramy wstęgowe, a ADP jest pokazany jako model pałeczkowy. Domeny NBS typu TIR i typu CC składają się z motywów, w kolejności od końca aminowego: Pętla P (lub miejsce Walkera A, niebieski); RNBS-A (zielony); kinaza-2 (lub miejsce Walkera B, magenta); RNBS-B (zielony); RNBS-C (zielony); GLPL (żółty); RNBS-D (zielony); MHDV (pomarańczowy). (b) Miejsca wiążące ludzkiego APAF-1 (kod PDB 1z6tA), arabidopsis RPS4 i RPS5, pokazujące reszty oddziałujące z ADP i ATP. Koordynacja z ADP w tych trzech białkach obejmuje trzy różne konserwowane motywy. Mały region kotwiczący na aminowym końcu domeny NBS koordynuje adeninę ADP lub ATP, pętla P koordynuje α- i β-fosforany, a motyw MHDV (w subdomenie helisy skrzydlatej w APAF-1) koordynuje albo cukier albo β-fosforan ADP. Dwa końcowe kwasy asparaginowe z motywu kinazy-2 znajdują się w kieszeni, w której usadowiony byłby γ-fosforan ATP. Obrazy zostały wygenerowane przy użyciu PyMol .

Kieszonka wiążąca i wzory wiązania do ADP są dobrze zachowane w modelach nitkowania TNLs (na przykładzie białka Arabidopsis RPS4) i CNLs (na przykładzie białka Arabidopsis RPS5; Rysunek 3) ( i P.K., praca niepublikowana). Domeny NBS TNLs zawierają dodatkowe pętle nieobecne w domenie NBS CNLs. TNL i CNL posiadają cztery konserwowane motywy zlokalizowane wokół szczeliny katalitycznej: pętlę P, region kotwiczący i motyw MHDV (a konkretnie resztę histydynową), które służą do orientacji cząsteczki ADP, a także motyw GLPL (nazwy motywów MHDV i GLPL pochodzą od składających się na nie aminokwasów w kodzie jednoliterowym). Chociaż w ludzkim APAF-1 nie ma oczywistego kontaktu pomiędzy ADP a motywem GLPL, to zachowanie jego pozycji na szczycie miejsca wiążącego w APAF-1, RPS4 i RPS5 wskazuje, że może on być zaangażowany w wiązanie ADP. Ponadto, dwa ostatnie kwasy asparaginowe w motywie kinazy-2 są ustawione tak, aby oddziaływać z trzecim fosforanem ATP, co jest zgodne z ich rolą koordynacji dla jonu metalu dwuwartościowego wymaganego w reakcjach fosfotransferu, na przykład Mg2+ z Mg-ATP (Rysunek 3). Region kotwiczący w subdomenie α/β APAF-1, który składa się z sekwencji Val-Thr-Arg, występuje jako Phe-Gly-Asn w RSP4 i jako Val-Gly-Gln w RPS5. Ten region kotwiczący, składający się z hydrofobowego (Val lub Phe), małego (Gly lub Thr) i polarnego (Arg, Asn lub Gln) aminokwasu, był wcześniej nierozpoznany, ale jest wysoce konserwowany w roślinnych białkach NBS-LRR (patrz Dodatkowy plik danych 3). Mutacje autoaktywujące w dwóch CNLs, ziemniaka Rx (Asp460Val) i pomidora I2 (Asp495Val), mapują obok histydyny w motywie MHDV; mutacje te mogą zakłócać wiązanie β-fosforanu ADP i skutkować bardziej otwartą strukturą .

Domena LRR

Domena LRR jest wspólnym motywem występującym w ponad 2000 białek, od wirusów do eukariotów, i jest zaangażowana w interakcje białko-białko i wiązanie ligandu . Struktury krystaliczne ponad 20 białek LRR ujawniły, że domeny LRR charakterystycznie zawierają serię β-szetów, które tworzą wklęsłą powierzchnię w kształcie podkowy lub banana. Mniej wiadomo natomiast na temat czwartorzędowych układów białek LRR. Zaobserwowano co najmniej trzy różne typy dimerów, w których dochodzi do interakcji między ich wklęsłymi lub wypukłymi powierzchniami, albo do konkatenacji z udziałem antyrównoległego arkusza β na styku. Nałożenie domeny LRR Arabidopsis RPS5 na strukturę krystaliczną białka dekoryny bydlęcej, członka rodziny białek SLRP (Small LRR Proteoglycans) z rdzeniem białkowym złożonym z LRR, dało model zgodny z zakrzywioną, przypominającą podkowę powierzchnią β-szkieletów (Rysunek 4; P.K., praca niepublikowana). Liczba powtórzeń w domenach LRR w TNL i CNL Arabidopsis jest podobna (średnia 14, zakres od 8 do 25), ale liczba ta może być znacznie wyższa u innych gatunków. W białkach sałaty CNL Resistance Gene Candidate 2 (RGC2), których przykładem jest Dm3, domena LRR wydaje się być zduplikowana i w sumie może być nawet 47 LRR. Każdy LRR składa się z rdzenia o długości około 26 aminokwasów zawierającego motyw Leu-xx-Leu-xx-Leu-x-Leu-xx-Cys/Asn-xx (gdzie x jest dowolnym aminokwasem), który tworzy arkusz β; każdy region rdzenia jest oddzielony odcinkiem o zmiennej długości, która waha się od zera do 30 aminokwasów. W wielu białkach NBS-LRR, przypuszczalne reszty eksponowane na rozpuszczalnik (pokazane jako x w powyższej sekwencji konsensusowej) wykazują znacznie podwyższony stosunek substytucji nonsynonimicznych do synonimicznych, wskazując, że selekcja różnicująca utrzymała zmienność w tych pozycjach. Domena LRR jest zaangażowana w określanie specyficzności rozpoznawania kilku białek R (na przykład ); rzadko jednak wykazano bezpośrednią interakcję z białkami patogenów.

Rysunek 4
figure4

Przewidywana struktura domeny LRR wynikająca z nawleczenia domeny LRR Arabidopsis RPS5 na dekorynę bydlęcą (kod PDB 1xku). (a) Karykaturalna reprezentacja przewidywanej struktury domeny LRR RPS5 wygenerowana przy użyciu PyMol . Arkusze β tworzące wklęsłą stronę „podkowy” są przedstawione jako strzałki. Konserwowane reszty alifatyczne są zaznaczone na niebiesko. N, końcówka aminowa; C, końcówka karboksylowa. (b) Wyrównanie 12 powtórzeń bogatych w leucynę w dekorinie i 13 powtórzeń w RPS5, jak również końcowych dziewięciu aminokwasów. Konserwowane reszty alifatyczne są zaznaczone na niebiesko.

Domena LRR może być zaangażowana głównie w regulacyjne interakcje wewnątrzcząsteczkowe. Domena LRR ziemniaczanego CNL Rx oddziałuje z domeną NBS nawet przy ekspresji trans; interakcja ta jest zakłócana przez elicitor wirusa ziemniaczanego X, wirusowe białko płaszcza, które może indukować odpowiedź obronną gospodarza. Również wewnętrzna, wklęsła powierzchnia β-szkieletów może nie być jedyną powierzchnią wiążącą. Przewiduje się, że domena LRR TLR3, ludzkiego receptora Toll-podobnego, tworzy heterodimer i wiąże dwuniciowe RNA patogenów z jego zapętloną powierzchnią, po przeciwnej stronie niż β-szety .

Analiza przy użyciu MEME zidentyfikowała kilka motywów wspólnych między domenami LRR TNL i CNL w Arabidopsis . Trzeci LRR był jednym z niewielu, które zawierały konserwowany motyw. Mutacja w tym LRR w CNL RPS5 powoduje epistatyczne hamujące działanie na wiele białek NBS-LRR, co sugeruje, że LRR może oddziaływać z komponentami sygnalizacji downstream; również mutacja w obrębie tego LRR w CNL Rx ziemniaka skutkuje formą konstytutywnie aktywną .

Termininy karboksylowe

CNLs i TNLs różnią się znacznie pod względem wielkości i składu ich domen karboksylowych. Te z TNLs są większe i bardziej zmienne niż te z CNLs. CNL mają zwykle tylko 40-80 aminokwasów na karboksy-końcu domeny LRR, podczas gdy karboksylowe zakończenia TNL często mają dodatkowe 200-300 aminokwasów, równe rozmiarowi domeny LRR. Kilka TNL ma rozszerzenia z podobieństwem do innych białek. Jeden z większych TNL w Arabidopsis, RRS1, który lokalizuje się w jądrze w odpowiedzi na infekcję, koduje 1,388 aminokwasowe białko z sygnałem lokalizacji jądrowej i motywem WRKY (motyw występujący również w czynnikach transkrypcyjnych z palcem cynkowym i zawierający sekwencję Trp-Arg-Lys-Tyr) na końcu karboksylowym .

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.