We kozen de 5′-UTR van de goed bestudeerde S. cerevisiae CYC1 promoter . We fuseerden pCYC1min (beginnend op positie -143) met een yeast-enhanced green fluorescent protein (yEGFP) en de CYC1 terminator. Vergeleken met de volledige CYC1 promoter, bevat pCYC1min twee van de drie TATA boxes en geen upstream activerende sequenties. pCYC1min is een matig zwakke promoter en lijkt daarom een ideale kandidaat voor het detecteren van zowel positieve als negatieve effecten van puntmutaties in de leader sequentie op de expressie van het downstream reporter eiwit. De 5′-UTR van de CYC1-promotor is 71 nucleotiden lang.

In de volgende analyse noemen we het gedeelte van de CYC1 5′-UTR op positie -1 tot -8 de uitgebreide Kozak-sequentie en dat op -9 tot -15 de upstream-regio. In de verlengde Kozak sequentie is adenine sterk geconserveerd op vijf posities, terwijl in de upstream regio geen enkel nucleotide sterk geconserveerd is. Toch komt adenine op bijna elke plaats het meest voor (zie Achtergrond).

De uitgebreide Kozak-sequentie

De oorspronkelijke CYC1-sequentie van posities -15 tot -1 is CACACTAAATTAATA (hierna aangeduid als k 0). Volgens Dvir et al. zou de aanwezigheid van een adenine op de posities -1, -3 en -4, samen met de afwezigheid van guanine op positie -2, deze leader-sequentie bijna optimaal moeten maken voor hoge expressie. Echter, thymine op positie -2 en cytosine op positie -13 hebben een frequentie lager dan 20% en 10%, respectievelijk, onder hoog tot expressie komende S. cerevisiae genen. We bouwden onze eerste synthetische CYC1 leader sequentie (k 1) door het plaatsen van een adenine op elke positie van -1 tot -15.

Het fluorescentieniveau geassocieerd met k 1 was 6,5 % hoger dan die gemeten met k 0. Er ontstond echter geen statistisch significant verschil uit de gegevens verzameld op deze twee leader sequenties (p-waarde =0,13). We hielden k 1 (de geoptimaliseerde leider sequentie) als een sjabloon voor onze volgende synthetische constructen en bouwden 57 meer synthetische 5′-UTRs door het muteren van enkele of meerdere nucleotiden in k 1.

De eerste groep van synthetische leider sequenties werd gemaakt door een enkele puntmutatie van positie -1 tot positie -8 (zie tabel 1). Daarom wijzigden we de uitgebreide Kozak sequentie alleen, terwijl de upstream-regio werd gehouden in een geoptimaliseerde configuratie voor een hoge genexpressie met adenines op posities -9 tot -15.

Tabel 1 Synthetische CYC1 5′-UTR eindsequenties van k 1 tot k 25

De hoogste fluorescentie werd geregistreerd voor k 16 (waar een guanine de adenine op positie -5 verving) en de laagste door k 9 (waar een thymine de adenine op positie -3 verving). Bovendien was het fluorescentieniveau van k 16 statistisch significant verschillend van dat van k 0 en k 1. Een verhoging van de fluorescentie als gevolg van een guanine op positie -5 was een verrassend resultaat omdat guanine de minst frequente nucleotide is in leader-sequenties van gist S. cerevisiae. Bovendien werd in het werk van Dvir et al. nooit guanine op deze positie aangetroffen bij hoog tot expressie komende genen of veroorzaakte dit enige fluorescentieverhoging. Ondanks de afwezigheid van een statistisch significant verschil met k 1, waren de enige constructen anders dan k 16 die resulteerden in een toename van >5 % op het fluorescentieniveau van k 1 k 3, k 10, en k 24. Met name in k 3 verving een thymine een adenine op positie -1, en in k 10 werd de adenine op positie -3 gemuteerd in een guanine. Zoals hierboven gemeld, zou een adenine op positie -1 en -3 een hoge genexpressie moeten garanderen. Niettemin lijken op een dergelijke adenine-achtergrond minder frequente nucleotiden op de posities -1 of -3 nodig te zijn om de genexpressie verder te verbeteren. Daarentegen was een thymine in plaats van een adenine op positie -3 (k 9) de enige mutatie die een >5 % verlaging van het k 1 fluorescentieniveau veroorzaakte. Dit resultaat is consistent met de waarneming dat een thymine op positie -3 overvloedig aanwezig is in slecht tot expressie komende genen (fig. 1 a).

Fig. 1
figure1

Effect van puntmutaties in de uitgebreide Kozak-sequentie op de fluorescentie-expressie. De fluorescentieniveaus zijn uitgezet ten opzichte van k 1 (a) en k 0 (b). De controle komt overeen met een giststam zonder het yEGFP-gen. De nucleotide die een adenine in k 1 verving en de positie waar de mutatie plaatsvond staan onder de naam van elke synthetische leadersequentie. Asterisken, p-waarde <0.05 t.o.v. k 1 (a) of k 0 (b)

Wat k 0 betreft, bevatten alle 25 nieuwe synthetische leader-sequenties tussen zes en acht mutaties. Afgezien van k 9 vertoonden alle synthetische 5′-UTR’s een hoger fluorescentieniveau dan dat van k 0, waarvan er vijf significant hoger waren. Hiertoe behoorden de posities -1, -4 en -5. Zoals reeds opgemerkt in de vergelijking met k 1, leek een adenine net stroomopwaarts van het START-codon niet van bijzonder voordeel te zijn voor de genexpressie. Hier presteerden een cytosine en een thymine (k 2 en k 3, respectievelijk) veel beter dan een adenine. Ten opzichte van k 0 waren er echter zeven puntmutaties meer stroomopwaarts. Op positie -4 resulteerde een thymine (k 12) in de hoogste fluorescentietoename, terwijl op positie -5 zowel een cytosine (k 14) als een guanine (k 16) de fluorescentie versterkten tot >10 % boven die van k 0. Aangezien k 0 een thymine op de posities -2, -5 en -6 heeft, werd elk van de vijf synthetische 5′-UTRs die statistisch significante verschillen met k 0 vertoonden, beïnvloed door een puntmutatie op twee of meer aangrenzende plaatsen. Drie andere synthetische leader-sequenties (k 10,k 17, en k 24) veroorzaakten een >10 % toename van de fluorescentie in vergelijking met k 0, hoewel deze verschillen niet significant waren (p-waarde >0,05). k 10 en k 17 hadden ook dubbele puntmutaties op aangrenzende plaatsen (fig. 1 b).

Meervoudige mutaties naar guanine

De analyse van onze eerste 25 synthetische 5′-UTR sequenties gaf het verrassende resultaat dat een enkele puntmutatie naar guanine – die in wezen afwezig is in de uitgebreide Kozak-sequentie van zeer tot expressie komende S. cerevisiae genen – het fluorescentieniveau van k 1, een voor genexpressie geoptimaliseerde leader-sequentie, kan verhogen. Bovendien verhoogden vijf van onze synthetische 5′-UTRs ondubbelzinnig (>9 %) het fluorescentieniveau geassocieerd met pCYC1min.

Volgens onze gegevens kan een enkele mutatie naar guanine de genexpressie versterken. Twee eerdere artikelen meldden echter dat meerdere guanines geplaatst voor een START-codon de eiwitsynthese aanzienlijk zou verminderen. Daarom gingen we na hoe meervoudige puntmutaties naar guanine de translatie-efficiëntie van pCYC1min beïnvloedden, om te bepalen of ze gebruikt zouden kunnen worden om genexpressie te moduleren.

Volgens de gegevens van S. cerevisiae genen met een hoge expressie is guanine de minst frequente nucleotide tussen positie -1 en -15, met uitzondering van positie -7, waarin de minst frequente nucleotide cytosine is. Wij construeerden een synthetische 5′-UTR die deze sequentie weerspiegelt (k 26; Tabel 2). Dit schakelde de genexpressie uit, zoals blijkt uit het feit dat het corresponderende fluorescentieniveau niet significant verschilde (p-waarde =0,21) van onze negatieve controle (een S. cerevisiae stam die het yEGFP-gen niet bevatte).

Tabel 2 Synthetische CYC1 5′-UTR eindsequenties van k 26 tot k 38

We hebben getest of meervoudige mutaties naar guanine (cytosine op positie -7) de genexpressie op een andere manier zouden beïnvloeden wanneer ze ofwel de hele uitgebreide Kozak-sequentie (k 27) of de upstream-regio (k 28) bestreken. Aangezien mutaties werden aangebracht ten opzichte van k 1, bevatten alle niet-gemuteerde plaatsen een adenine. Verrassend genoeg vonden we dat de twee configuraties gelijkwaardig waren voor genexpressie (p-waarde >0,40) en het k 1 fluorescentieniveau met ongeveer de helft verminderden.

Beginnend bij k 27, vervingen we de guanine op posities -1 (k 29), -2 (k 30), en -3 (k 31) door een adenine om te bepalen of een enkele adenine op de drie posities net stroomopwaarts van het START-codon de fluorescentie-expressie zou verhogen wanneer de andere plaatsen van de uitgebreide Kozak-sequentie werden bezet door ofwel een guanine of een cytosine. Op positie -1 gaf een adenine geen verbetering op de fluorescentie van k 27. Interessant is dat op posities -2 en -3 een adenine een daling van de genexpressie veroorzaakte tot ongeveer 7 % van het k 1 fluorescentieniveau. Deze resultaten tonen aan dat een adenine op zich de genexpressie niet kan verbeteren, zelfs wanneer deze positie -3 of -1 inneemt. Meer in het algemeen kunnen we concluderen dat het effect op de genexpressie van een enkele puntmutatie in de leader-sequentie sterk contextafhankelijk is.

Finitief, om beter te begrijpen hoe belangrijk de upstream-regio is voor de genexpressie, verminderden we geleidelijk het aantal guanines van zeven (k 28) tot één (k 38). Beginnend vanaf positie -9, vervingen we een guanine door een adenine bij elke stap en zagen dat het fluorescentieniveau bijna lineair toenam met het aantal adenines (Fig. 2 en Additional file 1). De laatste sequentie waarin het fluorescentieniveau statistisch significant verschilde van dat van k 1 was k 36, waarin guanines aanwezig waren op posities -13 tot -15. Een guanine alleen op positie -15 of vergezeld van een andere op positie -14 resulteerde niet in een significant verschil in fluorescentieniveau met dat van k 1. Zelfs in aanwezigheid van een uitgebreide Kozak-sequentie die geoptimaliseerd is voor een hoge genexpressie, hebben meervoudige mutaties in de upstream-regio dus duidelijke gevolgen voor de eiwitsynthese en kunnen zij gebruikt worden als middel om de eiwitrijkdom te regelen. Een verklaring voor dit resultaat wordt gegeven in het gedeelte Computationele analyse, hieronder. Interessant is dat vier guanines vermengd met adenines (k 33) in de upstream-regio de k1-fluorescentie in mindere mate verminderden dan vier guanines op een rij (k 32), waardoor nog eens bevestigd wordt dat het effect van puntmutaties in de 5′-UTR op de genexpressie sterk afhankelijk is van de nucleotidische context (Fig. 2; zie Additional file 1 voor een vergelijking met k 0 fluorescentie).

Fig. 2
figure2

Meervoudige puntmutaties naar guanine. De verhouding tussen het fluorescentieniveau van de synthetische 5′-UTR’s van k 26 tot k 38 en dat van k 1 worden gerapporteerd. Het aantal adenines of guanines in de upstream-regio wordt vermeld onder de naam van de leader-sequentie (van k 27 tot k 38). De subscripts -1, -2, en -3 geven aan dat een adenine aanwezig is in de uitgebreide Kozak sequentie alleen op de overeenkomstige positie. Subscript i staat voor vermengd (zie hoofdtekst). Asterisken, p-waarde <0.05 vs. k 1

De upstream-regio

De vorige analyse bevestigde dat het effect op de genexpressie als gevolg van zowel enkelvoudige als meervoudige mutaties binnen de 5′-UTR sterk contextafhankelijk is. Bovendien toonden onze gegevens duidelijk aan dat veranderingen niet alleen in de Kozak-sequentie maar ook binnen de upstream-regio de genexpressie duidelijk beïnvloeden. Daarom voerden we puntmutaties uit op k 1 tussen posities -9 en -15 (tabel 3) om na te gaan of een enkele van adenine afwijkende nucleotide de vertaalsnelheid kan veranderen wanneer deze in de upstream-regio wordt geplaatst.

Tabel 3 Synthetische CYC1 5′-UTR eindsequenties van k 39 tot k 58

Alle puntmutaties (behalve die in k 38) resulteerden in een fluorescentieniveau dat hoger was dan dat van k 1. In acht gevallen was de fluorescentie van k 1 hoger dan die van k 1. Met name in acht gevallen was de toename van de fluorescentie statistisch significant (>10 % hoger dan de k 1-fluorescentie). Deze acht mutaties omvatten vier aaneengesloten posities, van -11 tot -14. Geen van deze werden in aanmerking genomen in het referentiewerk van Dvir et al. .

Op positie -11 verhoogde een guanine in plaats van een adenine (k 47) de fluorescentie-uitstraling met >15 %, terwijl cytosine en thymine geen significante effecten hadden. Elke mutatie op positie -12 verhoogde de fluorescentie van k 1. De grootste verandering (>15 %) was het gevolg van een guanine (k 50). Mutaties op positie -13 verhoogden de k 1 fluorescentie ook sterk. Twee puntmutaties -cytosine (k 51) en guanine (k 53)- leidden tot statistisch significante verschillen in fluorescentie van k 1, terwijl een thymine (k 52) de fluorescentie van k 1 met ongeveer 14 % deed toenemen, maar dit bereikte geen statistische significantie. Opgemerkt moet worden dat van al onze 58 synthetische 5′-UTRs, k 51 het hoogste fluorescentieniveau had – bijna 17% hoger dan dat van k 1.

Ten slotte leidden twee verschillende puntmutaties op positie -14 tot een toename van de fluorescentie: een cytosine (k 54) en een thymine (k 55) (Fig. 3; zie Additional file 1 voor een vergelijking met k 0).

Fig. 3
figure3

Effect van puntmutaties in het upstream-gebied op de fluorescentie ten opzichte van k 1. Het nucleotide dat een adenine in k 1 verving en de positie waar de mutatie plaatsvond, staan onder de naam van elke synthetische leader-sequentie. Asterisken, p-waarde <0.05 t.o.v. k 1

Tezamen onderstrepen de resultaten van deze laatste analyse van de upstream-regio een ander verrassend resultaat: eenpuntmutaties upstream van de Kozak-sequentie, met name op posities -12 en -13, waren de mutaties die de genexpressie het meest versterkten vanuit een context die rijk is aan adenines.

Computationele analyse

We voerden simulaties uit met RNAfold om mogelijke correlaties te onderzoeken tussen berekende mRNA secundaire structuren, samen met hun corresponderende minimale vrije energieën (MFEs), en gemeten fluorescentieniveaus. Onze analyse geeft een verklaring voor de daling van de fluorescentie ten gevolge van meervoudige mutaties van adenine naar guanine (en cytosine) in de -15…-1 regio. In tegenstelling, geen plausibele verklaring voor de effecten van single point mutaties op translationele efficiëntie bleek uit simulaties met RNAfold.

Als input voor RNAfold, gebruikten we mRNA-sequenties die beginnen bij de transcriptie startplaats van CYC1min en eindigen op de poly-A site van de CYC1 terminator . Elke sequentie was 937 nucleotiden lang. Van voorlopige simulaties, merkten we dat een poly-A keten met een variabele lengte van 150-200 nucleotiden geen significant effect op mRNA vouwen had. Alle mRNA secundaire structuren werden berekend bij 30 ° C (de temperatuur waarbij we groeiden S. cerevisiae cellen voor de FACS experimenten).

k 0 en k 1 hebben dezelfde MFE: -241,21 kcal/mol. Dit is de hoogste – en de meest voorkomende – in de verzameling van 59 sequenties geanalyseerd in dit werk (zie Additional file 1). De secundaire structuur van het mRNA die met deze MFE overeenkomt, wordt gekenmerkt door de aanwezigheid van een reusachtige haarspeld tussen de posities -40 en +10. De haarspeldlus loopt van positie -31 tot positie +1 en bevat het hele 5′-UTR-gedeelte waarop wij ons hier hebben gericht. De haarspeldstam bestaat uit negen basenparen, waarvan er slechts één een “mismatch” gaf vanwege een adenine op positie -38 en +8 (zie fig. 4 a).

Fig. 4
figure4

mRNA secundaire structuren. a In de secundaire structuur van het mRNA is een reusachtige haarspeld aanwezig die overeenkomt met de MFE van zowel k 0 als k 1. De haarspeldlus bevat de -15…-1 regio. Het gedeelte van de 5′-UTR in onze analyse is vrij van enige pareninteracties in zijn wild-type configuratie (k 0) en in die welke theoretisch geoptimaliseerd is voor hoge eiwitexpressie (k 1). De lus van de reusachtige haarspeld is gereduceerd in k 4 als gevolg van de basenpaarinteractie tussen de guanine op positie -1 en de cytosine op positie -31. In elke gepresenteerde mRNA-structuur geeft een groene pijl positie +1 aan, en een rode pijl positie -15. b De verstoring van de reusachtige haarspeld leidt tot een afname van de MFE van de secundaire structuur van het mRNA. k 26 en k 31 worden geassocieerd met de laagste MFE’s die in onze analyse zijn berekend. De twee sequenties bevatten meerdere guanines in de verlengde Kozak-sequentie die betrokken zijn bij paarsgewijze interacties met de CDS. Een soortgelijk patroon is ook aanwezig in k 30. Hier echter zorgt een tweede mini-lus rond het START-codon voor een toename van de MFE. De MFE van k 26 is aanzienlijk lager dan die van k 30 en k 31 door de aanwezigheid van een andere stengel als gevolg van paarinteracties tussen de upstream-regio en de CYC1-terminator. Niettemin zijn de fluorescentieniveaus van k 30 en k 31 slechts ongeveer 1,2-maal zo hoog als die van k 26

Meervoudige mutaties in guanines in het upstream-gebied of in de verlengde Kozak-sequentie leiden tot basepaarinteracties tussen ten minste een deel van de -15…-1-regio en de CDS (yEGFP) of de CYC1-terminator. Als gevolg daarvan wordt de reusachtige haarspeld vernietigd en vervangen door één of twee stengels die de MFE van de secundaire structuur van het mRNA verlagen (tabel 2). De meeste MFE-waarden kleiner dan -241,21 kcal/mol werden geassocieerd met fluorescentieniveaus lager dan die van k 1 (fig. 5). Dit resultaat is in overeenstemming met de opvatting, ook ondersteund door , dat stabiele mRNA secundaire structuren in de 5′-UTR eiwit expressie verminderen. De gemeten fluorescentieniveaus namen echter niet proportioneel toe met toenames in de MFE. Bovendien voorspelde RNAfold in twee gevallen (k 32 en k 36) een reusachtige haarspeld in de mRNA-structuur, terwijl de fluorescentieniveaus uit onze experimenten aanzienlijk lager waren dan die van k 1 (fig. 5 en Additional file 1).

Fig. 5
figure5

Lage MFE-waarden worden geassocieerd met verminderde fluorescentie-expressie. Rode balken, verschil tussen MFE’s van de overeenkomstige 5′-UTR en k 1 (ΔMFE). Blauwe balken, 10-voudige vergrote verhouding tussen het fluorescentieniveau van de aangegeven 5′-UTR en die van k 1. Afgezien van k 1, zijn sequenties gesorteerd op toenemende ΔMFE. Alle sequenties behalve k 4 bevatten meerdere puntmutaties ten opzichte van k 1. Asterisken boven blauwe balken, p-waarde <0.05 t.o.v. k 1

k 26 werd ontworpen door de minst frequente nucleotiden tussen de posities -15 en -1 te kiezen uit een reeks van sterk tot expressie komende S. cerevisiae-genen. De corresponderende MFE (-261,39 kcal/mol) was de laagste binnen het ensemble van transcriptie-eenheden dat in dit werk in beschouwing is genomen. In de secundaire structuur van het MFE-mRNA was geen reusachtige haarspeld aanwezig, aangezien de -15…-1-regio in twee verschillende stengels was gesekwestreerd. De guanines tussen de posities -1 en -6 maakten deel uit van een lange stengel en waren gekoppeld aan een hexamer aan het begin van de yEGFP-sequentie (posities +33 tot +38). De posities -9 tot -15 daarentegen waren gekoppeld aan een gebied van de CYC1 terminator, op posities +750 tot +758 (Fig. 4 b).

Een fluorescentieniveau net boven dat van k 26 werd geregistreerd voor k 30 en k 31. Beide verschillen van k 26 door de upstream-regio (bestaande uit zeven adenines) en de aanwezigheid van een adenine in de verlengde Kozak-regio (op posities -2 en -3, respectievelijk). Net als bij k 26 werden de eerste vijf nucleotiden van de verlengde Kozak-regio van k 30 en de eerste zes van k 31 samen met de CDS in een stam gesekwestreerd. Echter, anders dan bij k 26, waren de upstream regio’s van k 30 en k 31 geheel vrij van enige pareninteracties (zie Fig. 4 b). Hun MFE’s (-244.28 en -247.26 kcal/mol, respectievelijk) waren ook significant hoger dan die van k 26. Deze drie sequenties suggereren dat een voorwaarde voor het duidelijk verlagen van de eiwitexpressie het insluiten van de nucleotiden op de posities -1 tot -5 in een mRNA secundaire structuur is. Bovendien hoeven niet al deze nucleotiden deel te nemen aan basenpaarinteracties. Een guanine op positie -1 (k 30) of -2 (k 26 en k 31) is immers “vrij” en verantwoordelijk voor de aanwezigheid van een mini-lus in de mRNA-structuur.

Deze hypothese wordt echter tegengesproken door k 29. De MFE van deze sequentie (-245,97 kcal/mol) is vergelijkbaar met die van k 30 en k 31, en de corresponderende mRNA secundaire structuur lijkt sterk op die van k 31 (Fig. 6 a). Niettemin was het fluorescentieniveau geassocieerd met k 29 meer dan 6 keer hoger dan dat van k 31 en bedroeg het 45% van dat van k 1.

Fig. 6
figure6

mRNA secundaire structuren. a k 27 verschilt van k 29 alleen door een guanine in plaats van een adenine op positie -1. Hun mRNA secundaire structuren zijn echter verschillend. In k 27 is de verlengde Kozak-sequentie betrokken bij basepaarinteracties met de CYC1-terminator, terwijl in k 29 de verlengde Kozak-sequentie in een stengel met het CDS is opgesloten. De MFE van k 27 is lager dan die van k 29, maar er is geen verschil tussen de fluorescentieniveaus van de twee sequenties (p-waarde =0,20). b Meervoudige guanines in het upstream-gebied leiden tot mRNA-structuren die worden gekenmerkt door basenpaarinteracties tussen het 5′-UTR en de CYC1-terminator. k 28 en k 34 hebben zes guanines in een stengel met de CYC1-terminator, terwijl k 35 slechts vijf guanines heeft in een analoge structuur. Dit veroorzaakt een toename van MFE en dientengevolge een hogere fluorescentie

k 27 deelde met k 29- k 31 een upstream-gebied dat uitsluitend uit adenines bestaat. In tegenstelling tot deze drie sequenties bevatte de verlengde Kozak-sequentie van k 27 echter geen adenine. De MFE van k 27 (-247,04 kcal/mol) was vergelijkbaar met die van k 29- k 31, maar de corresponderende mRNA secundaire structuur had een andere configuratie. Alle nucleotiden van de verlengde Kozak-sequentie (met uitzondering van de cytosine op positie -7) waren namelijk betrokken bij basenpaarinteractie, niet met het CDS maar met de CYC1-terminator (posities +755 tot +762; fig. 6 a). Het fluorescentieniveau van k 27 was iets hoger dan dat van k 29, d.w.z. bijna 7-voudig hoger dan dat van k 31.

De vijf tot dusver beschouwde sequenties (k 26, k 27, k 29- k 31) hebben een verlengde Kozak-regio rijk aan guanine gemeen, die in een stengel in de secundaire structuur van het MFE-mRNA was gesekwestreerd. In vier gevallen is de verlengde Kozak sequentie (gedeeltelijk) gekoppeld aan de CDS, en in één geval (k 27) aan de CYC1 terminator. De MFE van k 26 was het laagst, omdat zijn upstream-regio ook in een stam was gesekwestreerd. De andere vier sequenties vertoonden zeer vergelijkbare MFE-waarden, maar nogal verschillende fluorescentieniveaus.

De andere groep sequenties met meervoudige mutaties ten opzichte van k 1 had alleen adenines in de verlengde Kozak-sequentie en een variabel aantal guanines in de upstream-regio.

k 28, k 34, en k 35 hadden respectievelijk 7, 6, en 5 guanines in een rij vanaf positie -15 downstream. Hoewel de MFE van k 35 duidelijk hoger was dan die van k 28 en k 34 (tabel 2), gaven de drie sequenties aanleiding tot vergelijkbare mRNA-structuren waarin ten minste vijf guanines van de upstream-regio (plus de eerste adenine downstream) in een stengel waren opgesloten als gevolg van base-pairing interacties met de CYC1 terminator (zie fig. 6 b).

Interessant is dat zowel de MFE als het fluorescentieniveau van k 28 vergelijkbaar waren met die van k 27 en k 29. Dus zelfs als de Kozak-sequentie vrij was van paarsgewijze interacties, was de sequestering van de upstream-regio in een stam voldoende om een duidelijke daling van de eiwitexpressie te garanderen. Dit is een verdere bevestiging van de rol die de nucleotiden stroomopwaarts van de Kozak-sequentie spelen bij het afstemmen van de eiwitexpressie.

Een andere MFE mRNA secundaire structuur werd verkregen voor k 33 (vier guanines, vermengd met adenines), waarin de helft van de verlengde Kozak-sequentie en bijna de hele stroomopwaartse regio betrokken waren bij basepaarinteracties met de CDS, waardoor een lange stam ontstond. Echter, vergeleken met k 35, waar slechts vijf nucleotiden van de upstream-regio waren opgesloten in een stengel met de CYC1 terminator, vertoonde k 33 een hogere MFE evenals een hoger fluorescentieniveau (Fig. 5 en Additional file 1).

Finitief, voor k 32, k 36, en k 37 (met vier, drie, en twee guanines in de upstream-regio, respectievelijk) gaf RNAfold dezelfde MFE terug als voor k 1. De overeenkomstige mRNA secundaire structuren werden alle gekenmerkt door de aanwezigheid van de reus haarspeld (zie aanvullend bestand 1). Vergeleken met onze experimentele gegevens was dit resultaat alleen aannemelijk voor k 37, maar schijnbaar in tegenspraak met de metingen voor k 32 en k 36, waarvan de fluorescentieniveaus aanzienlijk lager waren dan die van k 1 (Fig. 5). In het bijzonder kwam de fluorescentie van k 32 slechts overeen met ongeveer 69% van die van k 1. Daarom kan worden gesteld dat in vivo k 32 en k 1 dezelfde MFE en mRNA secundaire structuur hebben, zoals door de in silico simulaties wordt gesuggereerd.

In tegenstelling tot de meervoudige puntmutaties veroorzaakte van de enkelvoudige puntmutaties op k 1 alleen k 4 een wijziging in de structuur van de reusachtige haarspeld en een daaruit voortvloeiende afname van de MFE. k 4 bevat een guanine op positie -1 die paart met de cytosine op positie -31, zodat de lengte van de lus wordt teruggebracht van 32 tot 29 nucleotiden en de MFE wordt verlaagd tot -241,42 kcal/mol (fig. 4 a). Volgens onze gegevens heeft deze minimale verandering geen effect op de fluorescentie-expressie. Alle andere puntmutaties die een fluorescentieniveau induceren dat significant hoger is dan dat van k 1 (namelijk k 16, k 47- k 51, en k 53- k 55) werden gekarakteriseerd door dezelfde MFE en overeenkomstige mRNA secundaire structuur als k 1, volgens de RNAfold simulaties.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.