Wir wählten die 5′-UTR des gut untersuchten CYC1-Promotors von S. cerevisiae. Wir fusionierten pCYC1min (beginnend an Position -143) mit einem hefeverstärkten grün fluoreszierenden Protein (yEGFP) und dem CYC1-Terminator. Im Vergleich zum vollständigen CYC1-Promotor enthält pCYC1min zwei der drei TATA-Boxen und keine stromaufwärts gelegenen aktivierenden Sequenzen. pCYC1min ist ein mäßig schwacher Promotor und scheint aus diesem Grund ein idealer Kandidat für den Nachweis sowohl positiver als auch negativer Auswirkungen von Punktmutationen in der Leader-Sequenz auf die Expression des stromabwärts gelegenen Reporterproteins zu sein. Der CYC1-Promotor 5′-UTR ist 71 Nukleotide lang.

In der folgenden Analyse bezeichnen wir den Teil des CYC1 5′-UTR an den Positionen -1 bis -8 als die erweiterte Kozak-Sequenz und den Teil an den Positionen -9 bis -15 als die stromaufwärts gelegene Region. In der erweiterten Kozak-Sequenz ist Adenin an fünf Positionen stark konserviert, während in der Upstream-Region kein Nukleotid stark konserviert ist. Allerdings ist Adenin an fast jeder Stelle am häufigsten (siehe Hintergrund).

Die erweiterte Kozak-Sequenz

Die ursprüngliche CYC1-Sequenz von Position -15 bis -1 ist CACACTAAATTAATA (im Folgenden als k 0 bezeichnet). Nach Dvir et al. sollte das Vorhandensein eines Adenins an den Positionen -1, -3 und -4 zusammen mit dem Fehlen von Guanin an Position -2 diese Leader-Sequenz für eine hohe Expression nahezu optimal machen. Die Häufigkeit von Thymin an Position -2 und Cytosin an Position -13 liegt jedoch bei hoch exprimierten S. cerevisiae-Genen unter 20 % bzw. 10 %. Wir erstellten unsere erste synthetische CYC1-Leader-Sequenz (k 1), indem wir an jeder Position von -1 bis -15 ein Adenin einfügten.

Die mit k 1 assoziierte Fluoreszenz war um 6,5 % höher als die mit k 0 gemessene Fluoreszenz. Die mit diesen beiden Leader-Sequenzen gesammelten Daten ergaben jedoch keinen statistisch signifikanten Unterschied (p-Wert =0,13). Wir behielten k 1 (die optimierte Leader-Sequenz) als Vorlage für unsere nächsten synthetischen Konstrukte und bauten 57 weitere synthetische 5′-UTRs durch Mutation einzelner oder mehrerer Nukleotide in k 1.

Die erste Gruppe synthetischer Leader-Sequenzen wurde durch eine einzige Punktmutation von Position -1 bis Position -8 hergestellt (siehe Tabelle 1). Es wurde also nur die erweiterte Kozak-Sequenz verändert, während die stromaufwärts gelegene Region in einer für eine hohe Genexpression optimierten Konfiguration mit Adeninen an den Positionen -9 bis -15 belassen wurde.

Tabelle 1 Synthetische CYC1 5′-UTR-Endsequenzen von k 1 bis k 25

Die höchste Fluoreszenz wurde für k 16 (wo ein Guanin das Adenin an Position -5 ersetzte) und die niedrigste für k 9 (wo ein Thymin das Adenin an Position -3 ersetzte) aufgezeichnet. Außerdem unterschied sich der Fluoreszenzwert von k 16 statistisch signifikant von dem von k 0 und k 1. Die Verstärkung der Fluoreszenz durch ein Guanin an Position -5 war ein überraschendes Ergebnis, da Guanin das am wenigsten häufige Nukleotid in den Leitsequenzen der Hefe S. cerevisiae ist. Darüber hinaus wurde in der Arbeit von Dvir et al. kein Guanin an dieser Position in hochexprimierten Genen entdeckt oder löste eine Fluoreszenzverstärkung aus.

Trotz des Fehlens eines statistisch signifikanten Unterschieds zu k 1 waren k 3, k 10 und k 24 die einzigen Konstrukte außer k 16, die zu einem Anstieg von >5 % des Fluoreszenzniveaus von k 1 führten. Insbesondere wurde bei k 3 das Adenin an Position -1 durch ein Thymin ersetzt, und bei k 10 wurde das Adenin an Position -3 zu einem Guanin mutiert. Wie bereits erwähnt, sollte ein Adenin an den Positionen -1 und -3 eine hohe Genexpression gewährleisten. Dennoch scheinen auf einem solchen Adenin-Hintergrund weniger häufige Nukleotide an den Positionen -1 oder -3 erforderlich zu sein, um die Genexpression weiter zu steigern. Im Gegensatz dazu war ein Thymin anstelle eines Adenins an Position -3 (k 9) die einzige Mutation, die eine >5 %ige Verringerung des k 1-Fluoreszenzniveaus bewirkte. Dieses Ergebnis stimmt mit der Beobachtung überein, dass ein Thymin an Position -3 in schlecht exprimierten Genen häufig vorkommt (Abb. 1 a).

Abb. 1
Abb. 1

Auswirkung von Punktmutationen in der erweiterten Kozak-Sequenz auf die Fluoreszenzexpression. Die Fluoreszenzwerte sind relativ zu k 1 (a) und k 0 (b) aufgetragen. Die Kontrolle entspricht einem Hefestamm ohne das yEGFP-Gen. Das Nukleotid, das ein Adenin in k 1 ersetzt hat, und die Position, an der die Mutation stattgefunden hat, sind unter dem Namen jeder synthetischen Leitsequenz angegeben. Sternchen, p-Wert <0,05 gegenüber k 1 (a) oder k 0 (b)

In Bezug auf k 0 enthielten alle 25 neuen synthetischen Leitsequenzen zwischen sechs und acht Mutationen. Abgesehen von k 9 zeigten alle synthetischen 5′-UTRs eine höhere Fluoreszenz als die von k 0, fünf davon waren signifikant höher. Dazu gehörten die Positionen -1, -4 und -5. Wie bereits beim Vergleich mit k 1 festgestellt, schien ein Adenin unmittelbar vor dem START-Codon keinen besonderen Vorteil für die Genexpression zu haben. Hier schnitten ein Cytosin und ein Thymin (k 2 bzw. k 3) wesentlich besser ab als ein Adenin. Im Vergleich zu k 0 gab es jedoch sieben weitere Punktmutationen stromaufwärts. An Position -4 führte ein Thymin (k 12) zu der höchsten Fluoreszenzzunahme, während an Position -5 sowohl ein Cytosin (k 14) als auch ein Guanin (k 16) die Fluoreszenz auf >10 % über der von k 0 erhöhten. Da k 0 an den Positionen -2, -5 und -6 ein Thymin aufweist, war jede der fünf synthetischen 5′-UTRs, die statistisch signifikante Unterschiede zu k 0 aufwiesen, von einer Punktmutation an zwei oder mehr benachbarten Stellen betroffen. Drei weitere synthetische Leitsequenzen (k 10, k 17 und k 24) verursachten einen >10 %igen Anstieg der Fluoreszenz im Vergleich zu k 0, obwohl diese Unterschiede nicht signifikant waren (p-Wert >0,05). k 10 und k 17 wiesen ebenfalls doppelte Punktmutationen an benachbarten Stellen auf (Abb. 1 b).

Mehrere Mutationen zu Guanin

Die Analyse unserer ersten 25 synthetischen 5′-UTR-Sequenzen ergab das überraschende Ergebnis, dass eine einzige Punktmutation zu Guanin – die in der erweiterten Kozak-Sequenz hochexprimierter S. cerevisiae-Gene im Wesentlichen fehlt – die Fluoreszenz von k 1, einer für die Genexpression optimierten Leader-Sequenz, erhöhen kann. Darüber hinaus erhöhten fünf unserer synthetischen 5′-UTRs eindeutig (>9 %) den mit pCYC1min assoziierten Fluoreszenzwert.

Nach unseren Daten kann eine einzige Mutation zu Guanin die Genexpression erhöhen. In zwei früheren Arbeiten wurde jedoch berichtet, dass mehrere Guanine vor einem START-Codon die Proteinsynthese erheblich verringern. Daher haben wir untersucht, wie sich mehrere Punktmutationen zu Guanin auf die Translationseffizienz von pCYC1min auswirken, um festzustellen, ob sie zur Modulation der Genexpression verwendet werden können.

Bei hochexprimierten S. cerevisiae-Genen ist Guanin das am wenigsten häufige Nukleotid zwischen den Positionen -1 und -15, mit Ausnahme von Position -7, wo das am wenigsten häufige Nukleotid Cytosin ist. Wir haben eine synthetische 5′-UTR konstruiert, die diese Sequenz widerspiegelt (k 26; Tabelle 2). Dadurch wurde die Genexpression ausgeschaltet, was sich darin zeigte, dass sich das entsprechende Fluoreszenzniveau nicht signifikant (p-Wert =0,21) von unserer Negativkontrolle (einem S. cerevisiae-Stamm, der das yEGFP-Gen nicht enthielt) unterschied.

Tabelle 2 Synthetische CYC1 5′-UTR-Terminalsequenzen von k 26 bis k 38

Wir testeten, ob Mehrfachmutationen zu Guanin (Cytosin an Position -7) die Genexpression unterschiedlich beeinflussen würden, wenn sie entweder die gesamte verlängerte Kozak-Sequenz (k 27) oder die stromaufwärts gelegene Region (k 28) abdecken. Da die Mutationen in Bezug auf k 1 vorgenommen wurden, enthielten alle nicht mutierten Stellen ein Adenin. Überraschenderweise stellten wir fest, dass die beiden Konfigurationen für die Genexpression gleichwertig waren (p-Wert >0,40) und die k 1-Fluoreszenz um etwa die Hälfte reduzierten.

Ausgehend von k 27 ersetzten wir das Guanin an den Positionen -1 (k 29), -2 (k 30) und -3 (k 31) durch ein Adenin, um festzustellen, ob ein einzelnes Adenin an den drei Positionen unmittelbar vor dem START-Codon die Fluoreszenzexpression verstärken würde, wenn die anderen Stellen der erweiterten Kozak-Sequenz entweder mit einem Guanin oder einem Cytosin besetzt waren. An der Position -1 zeigte ein Adenin keine Verbesserung der Fluoreszenz von k 27. Interessanterweise verursachte ein Adenin an den Positionen -2 und -3 einen Rückgang der Genexpression auf etwa 7 % des k 1-Fluoreszenzniveaus. Diese Ergebnisse zeigen, dass ein Adenin per se die Genexpression nicht verbessern kann, selbst wenn es die Position -3 oder -1 einnimmt. Ganz allgemein können wir daraus schließen, dass die Auswirkung einer einzelnen Punktmutation in der Leader-Sequenz auf die Genexpression stark kontextabhängig ist.

Um schließlich besser zu verstehen, wie wichtig die stromaufwärts gelegene Region für die Genexpression ist, haben wir die Anzahl der Guanine schrittweise von sieben (k 28) auf eines (k 38) reduziert. Ausgehend von Position -9 ersetzten wir bei jedem Schritt ein Guanin durch ein Adenin und stellten fest, dass die Fluoreszenz fast linear mit der Anzahl der Adenine anstieg (Abb. 2 und Additional file 1). Die letzte Sequenz, bei der sich der Fluoreszenzwert statistisch signifikant von dem von k 1 unterschied, war k 36, in der Guanine an den Positionen -13 bis -15 vorhanden waren. Ein Guanin allein an der Position -15 oder zusammen mit einem anderen an der Position -14 führte nicht zu einem signifikanten Unterschied im Fluoreszenzniveau im Vergleich zu k 1. Selbst bei Vorhandensein einer verlängerten Kozak-Sequenz, die für eine hohe Genexpression optimiert ist, haben also Mehrfachmutationen in der stromaufwärts gelegenen Region offensichtliche Auswirkungen auf die Proteinsynthese und können als Mittel zur Einstellung der Proteinhäufigkeit verwendet werden. Eine Erklärung für dieses Ergebnis wird im Abschnitt über die rechnerische Analyse weiter unten gegeben. Interessanterweise verringerten vier mit Adeninen vermischte Guanine (k 33) in der stromaufwärts gelegenen Region die k 1-Fluoreszenz in geringerem Maße als vier Guanine in einer Reihe (k 32), was eine weitere Bestätigung dafür ist, dass die Auswirkungen von Punktmutationen innerhalb der 5′-UTR auf die Genexpression stark vom Nukleotidkontext abhängen (Abb. 2; siehe Additional File). 2; siehe Zusatzdatei 1 für einen Vergleich mit der k 0-Fluoreszenz).

Abb. 2
Abb. 2

Mehrere Punktmutationen an Guanin. Es wird das Verhältnis zwischen dem Fluoreszenzniveau der synthetischen 5′-UTRs von k 26 bis k 38 und dem von k 1 angegeben. Die Anzahl der Adenine oder Guanine in der stromaufwärts gelegenen Region ist unter dem Namen der Leitsequenz (von k 27 bis k 38) angegeben. Die Indizes -1, -2 und -3 zeigen an, dass ein Adenin in der erweiterten Kozak-Sequenz nur an der entsprechenden Position vorhanden ist. Das tiefgestellte i steht für gemischt (siehe Haupttext). Sternchen, p-Wert <0,05 vs. k 1

Die stromaufwärts gelegene Region

Die vorangegangene Analyse bestätigte, dass die Auswirkung auf die Genexpression durch einzelne und multiple Mutationen innerhalb der 5′-UTR stark kontextabhängig ist. Darüber hinaus zeigten unsere Daten deutlich, dass Veränderungen nicht nur in der Kozak-Sequenz, sondern auch innerhalb der stromaufwärts gelegenen Region die Genexpression deutlich beeinflussen. Wir führten daher Punktmutationen an k 1 zwischen den Positionen -9 und -15 durch (Tabelle 3), um zu prüfen, ob ein einzelnes Nukleotid, das sich von Adenin unterscheidet, die Translationsrate verändern kann, wenn es in der stromaufwärts gelegenen Region platziert wird.

Tabelle 3 Synthetische CYC1 5′-UTR terminale Sequenzen von k 39 bis k 58

Alle Punktmutationen (außer der in k 38) führten zu einem höheren Fluoreszenzniveau als das mit k 1 verbundene. In acht Fällen war der Anstieg der Fluoreszenz statistisch signifikant (>10 % höher als die k 1-Fluoreszenz). Diese acht Mutationen umfassten vier zusammenhängende Positionen, von -11 bis -14. Keine davon wurde in der Referenzarbeit von Dvir et al. berücksichtigt.

An Position -11 erhöhte ein Guanin anstelle eines Adenins (k 47) die Fluoreszenzausprägung um >15 %, während Cytosin und Thymin keine signifikanten Auswirkungen hatten. Jede Mutation an Position -12 erhöhte die Fluoreszenz von k 1. Die größte Veränderung (>15 %) war auf ein Guanin (k 50) zurückzuführen. Mutationen an der Position -13 erhöhten die k 1-Fluoreszenz ebenfalls stark. Zwei Punktmutationen – Cytosin (k 51) und Guanin (k 53) – führten zu statistisch signifikanten Unterschieden in der Fluoreszenz von k 1, während ein Thymin (k 52) die k 1-Fluoreszenz um etwa 14 % erhöhte, was jedoch keine statistische Signifikanz erreichte. Es ist anzumerken, dass von allen unseren 58 synthetischen 5′-UTRs k 51 die höchste Fluoreszenz aufwies – fast 17 % höher als die von k 1.

Schließlich führten zwei verschiedene Punktmutationen an der Position -14 zu einer Erhöhung der Fluoreszenz: ein Cytosin (k 54) und ein Thymin (k 55) (Abb. 3; siehe Additional file). 3; siehe Zusatzdatei 1 für einen Vergleich mit k 0).

Abb. 3
Abbildung3

Auswirkung von Punktmutationen in der stromaufwärts gelegenen Region auf die Fluoreszenz relativ zu k 1. Das Nukleotid, das ein Adenin in k 1 ersetzt hat, und die Position, an der die Mutation stattfand, sind unter dem Namen jeder synthetischen Leitsequenz angegeben. Sternchen, p-Wert <0,05 vs. k 1

Gesamt unterstreichen die Ergebnisse dieser letzten Analyse der stromaufwärts gelegenen Region ein weiteres überraschendes Ergebnis: Einzelpunktmutationen stromaufwärts der Kozak-Sequenz, insbesondere an den Positionen -12 und -13, waren diejenigen, die die Genexpression in einem adeninreichen Kontext am stärksten verstärkten.

Computergestützte Analyse

Wir haben Simulationen mit RNAfold durchgeführt, um mögliche Korrelationen zwischen den berechneten mRNA-Sekundärstrukturen und den entsprechenden minimalen freien Energien (MFEs) und den gemessenen Fluoreszenzwerten zu untersuchen. Unsere Analyse liefert eine Erklärung für den Rückgang der Fluoreszenz aufgrund von Mehrfachmutationen von Adenin zu Guanin (und Cytosin) in der Region -15…-1. Im Gegensatz dazu ergaben die Simulationen mit RNAfold keine plausible Erklärung für die Auswirkungen einzelner Punktmutationen auf die Translationseffizienz.

Als Input für RNAfold verwendeten wir mRNA-Sequenzen, die an der Transkriptionsstartstelle von pCYC1min beginnen und an der Poly-A-Stelle des CYC1-Terminators enden. Jede Sequenz war 937 Nukleotide lang. Vorläufige Simulationen ergaben, dass eine Poly-A-Kette mit einer variablen Länge von 150-200 Nukleotiden keine signifikanten Auswirkungen auf die mRNA-Faltung hatte. Alle mRNA-Sekundärstrukturen wurden bei 30 °C berechnet (der Temperatur, bei der wir S. cerevisiae-Zellen für die FACS-Experimente gezüchtet haben).

k 0 und k 1 haben die gleiche MFE: -241,21 kcal/mol. Dies ist die höchste – und die häufigste – innerhalb der Sammlung von 59 Sequenzen, die in dieser Arbeit analysiert wurden (siehe Additional file 1). Die mRNA-Sekundärstruktur, die dieser MFE entspricht, ist durch das Vorhandensein einer riesigen Haarnadel zwischen den Positionen -40 und +10 gekennzeichnet. Die Haarnadelschleife reicht von Position -31 bis Position +1 und enthält den gesamten 5′-UTR-Abschnitt, den wir hier ins Visier genommen haben. Der Haarnadelstamm besteht aus neun Basenpaaren, von denen nur eines eine „Fehlanpassung“ ergab, und zwar wegen eines Adenins an Position -38 und +8 (siehe Abb. 4 a).

Abb. 4
Abbildung4

mRNA-Sekundärstrukturen. a In der mRNA-Sekundärstruktur ist eine Riesenhaarnadel vorhanden, die sowohl der MFE von k 0 als auch von k 1 entspricht. Die Haarnadelschleife enthält die Region -15…-1. Der Teil der 5′-UTR in unserer Analyse ist in seiner Wildtyp-Konfiguration (k 0) und in der theoretisch für eine hohe Proteinexpression optimierten Konfiguration (k 1) frei von jeglichen Paarungsinteraktionen. Die Schleife der Riesenhaarnadel ist in k 4 aufgrund der Basenpaarungswechselwirkung zwischen dem Guanin an Position -1 und dem Cytosin an Position -31 reduziert. In jeder dargestellten mRNA-Struktur zeigt ein grüner Pfeil die Position +1 und ein roter Pfeil die Position -15 an. b Die Unterbrechung der Riesenhaarnadel führt zu einer Abnahme der MFE der mRNA-Sekundärstruktur. k 26 und k 31 sind mit den niedrigsten MFEs verbunden, die in unserer Analyse berechnet wurden. Die beiden Sequenzen enthalten mehrere Guanine in der erweiterten Kozak-Sequenz, die an Paarungsinteraktionen mit dem CDS beteiligt sind. Ein ähnliches Muster findet sich auch in k 30. Hier führt jedoch eine zweite Minischleife um das START-Codon zu einer Erhöhung der MFE. Die MFE von k 26 ist wesentlich niedriger als die von k 30 und k 31, da ein weiterer Stamm vorhanden ist, der durch Paarungswechselwirkungen zwischen der stromaufwärts gelegenen Region und dem CYC1-Terminator entsteht. Dennoch sind die Fluoreszenzwerte von k 30 und k 31 nur etwa 1,2-fach höher als die von k 26

Mehrere Mutationen zu Guaninen entweder in der stromaufwärts gelegenen Region oder in der verlängerten Kozak-Sequenz führen zu Basenpaarungswechselwirkungen zwischen zumindest einem Teil der -15…-1-Region und dem CDS (yEGFP) oder dem CYC1-Terminator. Infolgedessen wird die Riesenhaarnadel zerstört und durch einen oder zwei Stämme ersetzt, die die MFE der mRNA-Sekundärstruktur senken (Tabelle 2). Die meisten MFE-Werte, die kleiner als -241,21 kcal/mol waren, wurden mit Fluoreszenzwerten assoziiert, die niedriger als die von k 1 waren (Abb. 5). Dieses Ergebnis steht im Einklang mit der Vorstellung, dass stabile mRNA-Sekundärstrukturen in der 5′-UTR die Proteinexpression reduzieren. Die von uns gemessenen Fluoreszenzwerte stiegen jedoch nicht proportional zu den Erhöhungen der MFE. Außerdem sagte RNAfold in zwei Fällen (k 32 und k 36) eine Riesenhaarnadel in der mRNA-Struktur voraus, während die Fluoreszenzwerte aus unseren Experimenten deutlich niedriger waren als die von k 1 (Abb. 5 und Additional file 1).

Abb. 5
Abb. 5

Niedrige MFE-Werte sind mit einer reduzierten Fluoreszenzexpression verbunden. Rote Balken, Differenz zwischen den MFEs der entsprechenden 5′-UTR und k 1 (ΔMFE). Blaue Balken, 10-fach vergrößertes Verhältnis zwischen dem Fluoreszenzniveau der angegebenen 5′-UTR und dem von k 1. Abgesehen von k 1 sind die Sequenzen nach zunehmendem ΔMFE sortiert. Alle Sequenzen außer k 4 enthalten mehrfache Punktmutationen in Bezug auf k 1. Sternchen über den blauen Balken, p-Wert <0,05 gegenüber k 1

k 26 wurde durch Auswahl der am wenigsten häufigen Nukleotide zwischen den Positionen -15 und -1 aus einer Reihe von hochexprimierten S. cerevisiae-Genen entworfen. Die entsprechende MFE (-261,39 kcal/mol) war die niedrigste innerhalb des Ensembles der in dieser Arbeit betrachteten Transkriptionseinheiten. Die MFE-Sekundärstruktur der mRNA enthielt keine Riesenhaarnadel, da die Region -15…-1 in zwei verschiedene Stämme abgespalten war. Die Guanine zwischen den Positionen -1 und -6 waren Teil eines langen Stiels und paarten sich mit einem Hexamer am Anfang der yEGFP-Sequenz (Positionen +33 bis +38). Im Gegensatz dazu paarten sich die Positionen -9 bis -15 mit einer Region des CYC1-Terminators an den Positionen +750 bis +758 (Abb. 4 b).

Ein Fluoreszenzniveau knapp über dem von k 26 wurde für k 30 und k 31 registriert. Beide unterschieden sich von k 26 durch die vorgelagerte Region (bestehend aus sieben Adeninen) und das Vorhandensein eines Adenins in der erweiterten Kozak-Region (an den Positionen -2 bzw. -3). Ähnlich wie bei k 26 waren die ersten fünf Nukleotide der verlängerten Kozak-Region von k 30 und die ersten sechs von k 31 in einen Stamm mit dem CDS sequestriert. Im Gegensatz zu k 26 waren die stromaufwärts gelegenen Regionen von k 30 und k 31 jedoch völlig frei von jeglichen Paarungsinteraktionen (siehe Abb. 4 b). Ihre MFEs (-244,28 bzw. -247,26 kcal/mol) waren ebenfalls deutlich höher als die von k 26. Diese drei Sequenzen deuten darauf hin, dass eine Bedingung für die deutliche Senkung der Proteinexpression darin besteht, die Nukleotide an den Positionen -1 bis -5 in eine mRNA-Sekundärstruktur einzuschließen. Außerdem müssen nicht alle diese Nukleotide an Basenpaarungsinteraktionen beteiligt sein. Tatsächlich ist ein Guanin an Position -1 (k 30) oder -2 (k 26 und k 31) „frei“ und für das Vorhandensein einer Mini-Schleife in der mRNA-Struktur verantwortlich.

Diese Hypothese wird jedoch durch k 29 widerlegt. Die MFE dieser Sequenz (-245,97 kcal/mol) ist vergleichbar mit der von k 30 und k 31, und die entsprechende mRNA-Sekundärstruktur ist der von k 31 sehr ähnlich (Abb. 6 a). Dennoch war die mit k 29 assoziierte Fluoreszenz mehr als 6-mal höher als die von k 31 und betrug 45 % derjenigen von k 1.

Abb. 6
Abbildung6

mRNA-Sekundärstrukturen. a k 27 unterscheidet sich von k 29 nur durch ein Guanin anstelle eines Adenins an Position -1. Ihre mRNA-Sekundärstrukturen sind jedoch unähnlich. In k 27 ist die verlängerte Kozak-Sequenz an Basenpaarungsinteraktionen mit dem CYC1-Terminator beteiligt, während in k 29 die verlängerte Kozak-Sequenz in einen Stamm mit dem CDS eingebunden ist. Die mit k 27 assoziierte MFE ist niedriger als die von k 29, aber es gibt keinen Unterschied zwischen den Fluoreszenzwerten der beiden Sequenzen (p-Wert =0,20). b Mehrere Guanine in der stromaufwärts gelegenen Region führen zu mRNA-Strukturen, die durch Basenpaarungsinteraktionen zwischen der 5′-UTR und dem CYC1-Terminator gekennzeichnet sind. k 28 und k 34 haben sechs Guanine in einem Stamm mit dem CYC1-Terminator, während k 35 nur 5 Guanine in einer analogen Struktur hat. Dies führt zu einem Anstieg der MFE und folglich zu einer höheren Fluoreszenz

k 27 hat mit k 29- k 31 eine stromaufwärts gelegene Region, die nur aus Adeninen besteht. Im Gegensatz zu diesen drei Sequenzen enthielt die erweiterte Kozak-Sequenz von k 27 jedoch kein Adenin. Die MFE von k 27 (-247,04 kcal/mol) war mit der von k 29- k 31 vergleichbar, aber die entsprechende mRNA-Sekundärstruktur hatte eine andere Konfiguration. Tatsächlich waren alle Nukleotide der verlängerten Kozak-Sequenz (mit Ausnahme des Cytosins an Position -7) an der Basenpaarungsinteraktion nicht mit dem CDS, sondern mit dem CYC1-Terminator beteiligt (Positionen +755 bis +762; Abb. 6 a). Das Fluoreszenzniveau von k 27 war etwas höher als das von k 29, d.h. fast 7-fach höher als das von k 31.

Die fünf bisher betrachteten Sequenzen (k 26, k 27, k 29- k 31) haben eine ausgedehnte, guaninreiche Kozak-Region gemeinsam, die in der MFE mRNA-Sekundärstruktur in einen Stamm sequestriert wurde. In vier Fällen paarte sich die erweiterte Kozak-Sequenz (teilweise) mit dem CDS, und in einem Fall (k 27) mit dem CYC1-Terminator. Die MFE von k 26 war die niedrigste, da ihre stromaufwärts gelegene Region ebenfalls in einen Stamm eingebettet war. Die anderen vier Sequenzen zeigten sehr ähnliche MFE-Werte, aber recht unterschiedliche Fluoreszenzwerte.

Die andere Gruppe von Sequenzen, die von Mehrfachmutationen in Bezug auf k 1 betroffen waren, hatte nur Adenine in der verlängerten Kozak-Sequenz und eine variable Anzahl von Guaninen in der stromaufwärts gelegenen Region.

k 28, k 34 und k 35 hatten jeweils 7, 6 und 5 Guanine in einer Reihe von Position -15 stromabwärts. Obwohl die MFE von k 35 deutlich höher war als die von k 28 und k 34 (Tabelle 2), ergaben die drei Sequenzen ähnliche mRNA-Strukturen, bei denen mindestens fünf Guanine der stromaufwärts gelegenen Region (plus das erste Adenin stromabwärts) aufgrund von Basenpaarungsinteraktionen mit dem CYC1-Terminator zu einem Stamm verbunden waren (siehe Abb. 6 b).

Interessanterweise waren sowohl die MFE als auch die Fluoreszenz von k 28 mit denen von k 27 und k 29 vergleichbar. Selbst wenn die Kozak-Sequenz frei von Paarungsinteraktionen war, reichte also die Sequestrierung der stromaufwärts gelegenen Region in einen Stamm aus, um einen deutlichen Rückgang der Proteinexpression zu gewährleisten. Dies ist eine weitere Bestätigung für die Rolle, die die Nukleotide stromaufwärts der Kozak-Sequenz bei der Abstimmung der Proteinexpression spielen.

Eine andere MFE-mRNA-Sekundärstruktur wurde für k 33 (vier Guanine, vermischt mit Adeninen) erhalten, bei der die Hälfte der verlängerten Kozak-Sequenz und fast die gesamte stromaufwärts gelegene Region in Basenpaarungsinteraktionen mit dem CDS verwickelt waren, was zu einem langen Stamm führte. Im Vergleich zu k 35, bei dem nur fünf Nukleotide der stromaufwärts gelegenen Region in einen Stamm mit dem CYC1-Terminator eingebunden waren, zeigte k 33 jedoch eine höhere MFE sowie ein höheres Fluoreszenzniveau (Abb. 5 und Zusatzdatei 1).

Schließlich ergab RNAfold für k 32, k 36 und k 37 (mit vier, drei bzw. zwei Guaninen in der stromaufwärts gelegenen Region) die gleiche MFE wie für k 1. Die entsprechenden mRNA-Sekundärstrukturen waren alle durch das Vorhandensein der Riesenhaarnadel gekennzeichnet (siehe Zusatzdatei 1). Verglichen mit unseren experimentellen Daten war dieses Ergebnis nur für k 37 plausibel, stand aber in offensichtlichem Widerspruch zu den Messungen für k 32 und k 36, deren Fluoreszenzwerte deutlich niedriger waren als die von k 1 (Abb. 5). Insbesondere entsprach die Fluoreszenz von k 32 nur etwa 69 % derjenigen von k 1. Daher kann argumentiert werden, dass k 32 und k 1 in vivo die gleiche MFE und mRNA-Sekundärstruktur haben, wie die in silico-Simulationen nahelegen.

Im Gegensatz zu den Mehrfachpunktmutationen verursachte von den Einzelpunktmutationen an k 1 nur k 4 eine Veränderung der Struktur der Riesenhaarnadel und eine daraus folgende Abnahme der MFE. k 4 trägt ein Guanin an Position -1, das sich mit dem Cytosin an Position -31 paart, so dass die Länge der Schleife von 32 auf 29 Nukleotide reduziert wird und die MFE auf -241,42 kcal/mol sinkt (Abb. 4 a). Nach unseren Daten hat diese minimale Änderung keine Auswirkungen auf die Fluoreszenzausprägung. Alle anderen Punktmutationen, die eine deutlich höhere Fluoreszenz als die von k 1 induzierten (nämlich k 16, k 47 – k 51 und k 53 – k 55), waren nach den RNAfold-Simulationen durch dieselbe MFE und entsprechende mRNA-Sekundärstruktur wie k 1 gekennzeichnet.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.