Abbiamo scelto il 5′-UTR del promotore CYC1 ben studiato di S. cerevisiae. Abbiamo fuso pCYC1min (a partire dalla posizione -143) con una proteina fluorescente verde potenziata del lievito (yEGFP) e il terminatore CYC1. Rispetto al promotore CYC1 completo, pCYC1min contiene due delle tre caselle TATA e nessuna sequenza di attivazione a monte. pCYC1min è un promotore moderatamente debole e, per questo motivo, sembra essere un candidato ideale per rilevare gli effetti positivi e negativi delle mutazioni puntiformi nella sequenza leader sull’espressione della proteina reporter a valle. Il promotore CYC1 5′-UTR è lungo 71 nucleotidi.

Nella seguente analisi, ci riferiamo alla porzione di CYC1 5′-UTR in posizione da -1 a -8 come la sequenza Kozak estesa e quella da -9 a -15 come la regione a monte. Nella sequenza estesa di Kozak l’adenina è fortemente conservata in cinque posizioni, mentre nella regione a monte nessun nucleotide è fortemente conservato. Tuttavia, l’adenina è la più frequente in quasi tutti i siti (vedi Background).

La sequenza estesa di Kozak

La sequenza originale di CYC1 dalle posizioni -15 a -1 è CACACTAAATTAATA (di seguito indicata come k 0). Secondo Dvir et al. , la presenza di un’adenina nelle posizioni -1, -3, e -4, insieme all’assenza di guanina in posizione -2, dovrebbe rendere questa sequenza leader quasi ottimale per un’alta espressione. Tuttavia, la timina in posizione -2 e la citosina in posizione -13 hanno una frequenza inferiore al 20% e al 10%, rispettivamente, tra i geni altamente espressi di S. cerevisiae. Abbiamo costruito la nostra prima sequenza leader sintetica CYC1 (k 1) mettendo un’adenina in ogni posizione da -1 a -15.

Il livello di fluorescenza associato a k 1 era del 6,5% superiore a quello misurato con k 0. Tuttavia, nessuna differenza statisticamente significativa è emersa dai dati raccolti su queste due sequenze leader (p-value =0,13). Abbiamo mantenuto k 1 (la sequenza leader ottimizzata) come modello per i nostri prossimi costrutti sintetici e costruito 57 più sintetici 5′-UTR mutando nucleotidi singoli o multipli in k 1.

Il primo gruppo di sequenze leader sintetiche è stato fatto da una singola mutazione di punto dalla posizione -1 alla posizione -8 (vedi tabella 1). Quindi, abbiamo modificato solo la sequenza estesa di Kozak, mentre la regione a monte è stata mantenuta in una configurazione ottimizzata per un’alta espressione genica con adenine nelle posizioni da -9 a -15.

Tabella 1 Sequenze terminali sintetiche CYC1 5′-UTR da k 1 a k 25

La più alta fluorescenza è stata registrata per k 16 (dove una guanina ha sostituito l’adenina in posizione -5) e la più bassa da k 9 (dove una timina ha sostituito l’adenina in posizione -3). Inoltre, il livello di fluorescenza di k 16 era statisticamente diverso da quello di k 0 e k 1. Un aumento della fluorescenza dovuto a una guanina in posizione -5 è stato un risultato sorprendente perché la guanina è il nucleotide meno frequente nelle sequenze leader del lievito S. cerevisiae. Inoltre, nessuna guanina è mai stata rilevata in questa posizione tra i geni altamente espressi o ha provocato un aumento di fluorescenza nel lavoro di Dvir et al. .

Malgrado l’assenza di una differenza statisticamente significativa rispetto a k 1, gli unici costrutti diversi da k 16 che hanno portato ad un aumento di >5 % sul livello di fluorescenza di k 1 sono stati k 3, k 10, e k 24. In particolare, in k 3, una timina ha sostituito un’adenina in posizione -1, e in k 10 l’adenina in posizione -3 è stata mutata in una guanina. Come riportato sopra, l’adenina in posizione -1 e -3 dovrebbe garantire un’alta espressione genica. Tuttavia, su un tale sfondo adeninico, nucleotidi meno frequenti nelle posizioni -1 o -3 sembrano essere richiesti per migliorare ulteriormente l’espressione genica. Al contrario, una timina invece di un’adenina in posizione -3 (k 9) era l’unica mutazione che induceva una riduzione >5 % del livello di fluorescenza k 1. Questo risultato è coerente con l’osservazione che una timina in posizione -3 è abbondante nei geni scarsamente espressi (Fig. 1 a).

Fig. 1
figura1

Effetto delle mutazioni puntiformi nella sequenza estesa Kozak sull’espressione della fluorescenza. I livelli di fluorescenza sono tracciati rispetto a k 1 (a) e k 0 (b). Il controllo corrisponde a un ceppo di lievito senza il gene yEGFP. Il nucleotide che ha sostituito un’adenina in k 1 e la posizione in cui la mutazione ha avuto luogo sono indicati sotto il nome di ogni sequenza leader sintetica. Asterischi, p-value <0.05 vs. k 1 (a) o k 0 (b)

Per quanto riguarda k 0, tutte le 25 nuove sequenze leader sintetiche contenevano da sei a otto mutazioni. A parte k 9, tutte le 5′-UTR sintetiche hanno mostrato un livello di fluorescenza superiore a quello di k 0, cinque dei quali erano significativamente più alti. Queste includevano le posizioni -1, -4 e -5. Come già notato nel confronto con k 1, un’adenina appena a monte del codone START non sembrava essere di particolare vantaggio per l’espressione genica. Qui, una citosina e una timina (k 2 e k 3, rispettivamente) hanno funzionato molto meglio di un’adenina. Tuttavia, rispetto a k 0, c’erano sette mutazioni puntiformi in più a monte. In posizione -4 una timina (k 12) ha portato al più alto incremento di fluorescenza, mentre in posizione -5, sia una citosina (k 14) che una guanina (k 16) hanno aumentato la fluorescenza a >10 % sopra quella di k 0. Poiché k 0 ha una timina nelle posizioni -2, -5 e -6, ciascuna delle cinque 5′-UTR sintetiche che hanno mostrato differenze statisticamente significative rispetto a k 0 sono state interessate da una mutazione puntiforme in due o più siti adiacenti. Tre sequenze leader più sintetico (k 10, k 17, e k 24) ha causato un >10 % aumento della fluorescenza rispetto a k 0, anche se queste differenze non erano significative (p-value >0,05). k 10 e k 17 aveva anche mutazioni puntiformi doppio in siti adiacenti (Fig. 1 b).

Mutazioni multiple alla guanina

L’analisi delle nostre prime 25 sequenze sintetiche 5′-UTR ha dato il risultato sorprendente che una singola mutazione puntiforme alla guanina – che è essenzialmente assente dalla sequenza Kozak estesa dei geni altamente espressi di S. cerevisiae – può migliorare il livello di fluorescenza di k 1, una sequenza leader ottimizzata per l’espressione genica. Inoltre, cinque delle nostre 5′-UTR sintetiche hanno inequivocabilmente (>9 %) aumentato il livello di fluorescenza associato a pCYC1min.

Secondo i nostri dati, una singola mutazione in guanina può aumentare l’espressione genica. Tuttavia, due articoli precedenti hanno riportato che più guanine poste davanti a un codone START ridurrebbero considerevolmente la sintesi proteica. Pertanto, abbiamo valutato come le mutazioni puntiformi multiple alla guanina hanno influenzato l’efficienza di traduzione di pCYC1min, per determinare se potrebbero essere utilizzate per modulare l’espressione genica.

Secondo , tra i geni altamente espressi di S. cerevisiae, la guanina è il nucleotide meno frequente tra le posizioni -1 e -15, ad eccezione della posizione -7, in cui il nucleotide meno frequente è la citosina. Abbiamo costruito un 5′-UTR sintetico che riflette questa sequenza (k 26; Tabella 2). Questo ha spento l’espressione del gene, come dimostrato dal livello di fluorescenza corrispondente non essendo significativamente diverso (p-value =0,21) dal nostro controllo negativo (un ceppo di S. cerevisiae che non conteneva il gene yEGFP).

Tabella 2 Sequenze terminali sintetiche CYC1 5′-UTR da k 26 a k 38

Abbiamo testato se mutazioni multiple alla guanina (citosina in posizione -7) avrebbero influenzato l’espressione del gene in modo diverso quando esse coprivano l’intera sequenza estesa di Kozak (k 27) o la regione a monte (k 28). Poiché le mutazioni sono state fatte rispetto a k 1, tutti i siti non mutati contenevano un’adenina. Sorprendentemente, abbiamo trovato che le due configurazioni erano equivalenti per l’espressione genica (p-value >0,40) e riducevano il livello di fluorescenza k 1 di circa la metà.

Partendo da k 27, abbiamo sostituito la guanina nelle posizioni -1 (k 29), -2 (k 30) e -3 (k 31) con un’adenina per determinare se una singola adenina nelle tre posizioni appena a monte del codone START avrebbe aumentato l’espressione della fluorescenza quando gli altri siti della sequenza estesa di Kozak erano occupati da una guanina o una citosina. In posizione -1 un’adenina non ha mostrato alcun miglioramento sulla fluorescenza di k 27. È interessante notare che nelle posizioni -2 e -3, un’adenina ha causato un calo dell’espressione genica a circa il 7% del livello di fluorescenza di k 1. Questi risultati dimostrano che un’adenina di per sé non può migliorare l’espressione genica anche quando occupa la posizione -3 o -1. Più in generale, possiamo concludere che l’effetto sull’espressione genica di una singola mutazione puntiforme nella sequenza leader è fortemente dipendente dal contesto.

Infine, per capire meglio quanto sia importante la regione a monte per l’espressione genica, abbiamo progressivamente ridotto il numero di guanine da sette (k 28) a una (k 38). Partendo dalla posizione -9, abbiamo sostituito una guanina con un’adenina ad ogni passo e abbiamo visto che il livello di fluorescenza aumentava quasi linearmente con il numero di adenine (Fig. 2 e Additional file 1). L’ultima sequenza in cui il livello di fluorescenza era statisticamente diverso da quello di k 1 era k 36, in cui le guanine erano presenti nelle posizioni da -13 a -15. Una guanina da sola in posizione -15 o accompagnata da un’altra in posizione -14 non ha prodotto una differenza significativa nel livello di fluorescenza rispetto a quello di k 1. Quindi, anche in presenza di una sequenza estesa di Kozak ottimizzata per un’alta espressione genica, mutazioni multiple nella regione a monte hanno evidenti ripercussioni sulla sintesi proteica e possono essere utilizzate come mezzo per regolare l’abbondanza proteica. Una spiegazione per questo risultato è presentata nella sezione Analisi computazionale, più avanti. È interessante notare che quattro guanine mescolate con adenine (k 33) nella regione a monte ha ridotto la fluorescenza k 1 in misura minore rispetto a quattro guanine in fila (k 32), fornendo un’ulteriore conferma che l’effetto sull’espressione genica di mutazioni puntiformi all’interno del 5′-UTR è altamente dipendente dal contesto nucleotidico (Fig. 2; vedi file aggiuntivo 1 per un confronto con la fluorescenza k 0).

Fig. 2
figura2

Mutazioni puntuali multiple alla guanina. Il rapporto tra il livello di fluorescenza delle 5′-UTR sintetiche da k 26 a k 38 e quello di k 1 sono riportati. Il numero di adenine o guanine nella regione a monte è dato sotto il nome della sequenza leader (da k 27 a k 38). I pedici -1, -2 e -3 indicano che un’adenina è presente nella sequenza estesa di Kozak solo nella posizione corrispondente. Il pedice i rappresenta intermix (vedi testo principale). Asterischi, p-value <0.05 vs. k 1

La regione a monte

L’analisi precedente ha confermato che l’effetto sull’espressione genica dovuta a mutazioni sia singole che multiple all’interno della 5′-UTR è fortemente dipendente dal contesto. Inoltre, i nostri dati hanno mostrato chiaramente che i cambiamenti non solo nella sequenza di Kozak ma anche all’interno della regione a monte influenzano notevolmente l’espressione genica. Abbiamo quindi eseguito mutazioni puntiformi su k 1 tra le posizioni -9 e -15 (Tabella 3) per valutare se un singolo nucleotide diverso dall’adenina può cambiare il tasso di traduzione quando è posto nella regione a monte.

Tabella 3 Sequenze terminali sintetiche di CYC1 5′-UTR da k 39 a k 58

Tutte le mutazioni puntiformi (tranne quella in k 38) hanno portato a un livello di fluorescenza superiore a quello associato a k 1. In particolare, in otto casi, l’aumento della fluorescenza è stato statisticamente significativo (>10% più alto della fluorescenza di k 1). Queste otto mutazioni comprendevano quattro posizioni contigue, da -11 a -14. Nessuna di queste è stata presa in considerazione nel lavoro di riferimento di Dvir et al.

In posizione -11, una guanina al posto di un’adenina (k 47) ha aumentato la fluorescenza del >15 %, mentre la citosina e la timina non avevano effetti significativi. Ogni mutazione in posizione -12 ha aumentato la fluorescenza di k 1. Il più grande cambiamento (>15 %) era dovuto a una guanina (k 50). Anche le mutazioni in posizione -13 hanno fortemente aumentato il livello di fluorescenza di k 1. Due mutazioni puntiformi – citosina (k 51) e guanina (k 53) – hanno portato a differenze statisticamente significative nella fluorescenza di k 1, mentre una timina (k 52) ha aumentato la fluorescenza di k 1 di circa il 14% ma questo non ha raggiunto la significatività statistica. Va notato che tra tutti i nostri 58 sintetici 5′-UTR, k 51 ha avuto il più alto livello di fluorescenza – quasi il 17% superiore a quello di k 1.

Infine, due diverse mutazioni puntiformi in posizione -14 hanno portato ad un aumento della fluorescenza: una citosina (k 54) e una timina (k 55) (Fig. 3; vedi file aggiuntivo 1 per un confronto con k 0).

Fig. 3
figura3

Effetto delle mutazioni puntiformi nella regione a monte sulla fluorescenza rispetto a k 1. Il nucleotide che ha sostituito un’adenina in k 1 e la posizione in cui la mutazione ha avuto luogo sono dati sotto il nome di ogni sequenza leader sintetica. Asterischi, p-value <0.05 vs. k 1

Insieme, i risultati di quest’ultima analisi della regione a monte sottolineano un altro risultato sorprendente: le mutazioni puntiformi a monte della sequenza di Kozak, in particolare nelle posizioni -12 e -13, erano quelle che più aumentavano l’espressione genica da un contesto ricco di adenine.

Analisi computazionale

Abbiamo effettuato delle simulazioni con RNAfold per studiare le possibili correlazioni tra le strutture secondarie di mRNA calcolate, insieme alle loro corrispondenti energie libere minime (MFE), e i livelli di fluorescenza misurati. La nostra analisi fornisce una spiegazione per il calo di fluorescenza dovuto a mutazioni multiple da adenina a guanina (e citosina) nella regione -15…-1. Al contrario, nessuna giustificazione plausibile per gli effetti di singole mutazioni puntiformi sull’efficienza traslazionale è emersa dalle simulazioni con RNAfold.

Come input per RNAfold, abbiamo usato sequenze di mRNA che iniziano al sito di inizio della trascrizione di pCYC1min e terminano al sito poly-A del terminatore CYC1. Ogni sequenza era lunga 937 nucleotidi. Dalle simulazioni preliminari, abbiamo osservato che una catena poly-A con una lunghezza variabile di 150-200 nucleotidi non aveva alcun effetto significativo sul ripiegamento dell’mRNA. Tutte le strutture secondarie dell’mRNA sono state calcolate a 30 °C (la temperatura alla quale abbiamo coltivato le cellule di S. cerevisiae per gli esperimenti FACS).

k 0 e k 1 hanno la stessa MFE: -241,21 kcal/mol. Questo è il più alto – e il più comune – nella collezione di 59 sequenze analizzate in questo lavoro (vedi file aggiuntivo 1). La struttura secondaria dell’mRNA corrispondente a questa MFE è caratterizzata dalla presenza di una forcina gigante tra le posizioni -40 e +10. La forcina va dalla posizione -31 alla posizione +1 e contiene l’intera porzione 5′-UTR che abbiamo preso di mira qui. Il fusto della forcina è composto da nove coppie di basi, di cui solo una ha dato un “mismatch” a causa di un’adenina in posizione -38 e +8 (vedi Fig. 4 a).

Fig. 4
figura4

strutture secondarie di mRNA. a Una forcina gigante è presente nella struttura secondaria dell’mRNA corrispondente alla MFE sia di k 0 che di k 1. La forcina contiene la regione -15…-1. La porzione del 5′-UTR nella nostra analisi è libera da qualsiasi interazione di accoppiamento nella sua configurazione wild-type (k 0) e in quella teoricamente ottimizzata per l’alta espressione proteica (k 1). Il loop della forcina gigante è ridotto in k 4 a causa dell’interazione di accoppiamento tra la guanina in posizione -1 e la citosina in posizione -31. In ogni struttura di mRNA presentata, una freccia verde indica la posizione +1, e una freccia rossa indica la posizione -15. b La rottura della forcina gigante induce una diminuzione della MFE della struttura secondaria dell’mRNA. k 26 e k 31 sono associate alle MFE più basse calcolate nella nostra analisi. Le due sequenze contengono più guanine nella sequenza estesa di Kozak coinvolte nelle interazioni di accoppiamento con il CDS. Un modello simile è presente anche in k 30. Qui, tuttavia, un secondo mini-loop intorno al codone START provoca un aumento della MFE. La MFE di k 26 è sostanzialmente più bassa di quelle di k 30 e k 31 a causa della presenza di un altro stelo dovuto alle interazioni di accoppiamento tra la regione a monte e il terminatore CYC1. Tuttavia, i livelli di fluorescenza di k 30 e k 31 sono solo approssimativamente 1,2 volte superiori a quelli di k 26

Mutazioni multiple alle guanine sia nella regione a monte che nella sequenza estesa di Kozak originano interazioni di accoppiamento di basi tra, almeno, una parte della regione -15…-1 e il CDS (yEGFP) o il terminatore CYC1. Di conseguenza, la forcina gigante viene distrutta e sostituita da uno o due steli che abbassano il MFE della struttura secondaria dell’mRNA (Tabella 2). La maggior parte dei valori MFE inferiori a -241,21 kcal/mol erano associati a livelli di fluorescenza inferiori a quelli di k 1 (Fig. 5). Questo risultato è in accordo con la nozione, sostenuta anche da , che le strutture secondarie stabili dell’mRNA nella 5′-UTR riducono l’espressione della proteina. Tuttavia, i livelli di fluorescenza che abbiamo misurato non sono aumentati proporzionalmente agli incrementi della MFE. Inoltre, in due casi (k 32 e k 36) RNAfold ha predetto una forcina gigante nella struttura dell’mRNA, mentre i livelli di fluorescenza dai nostri esperimenti erano significativamente inferiori a quelli di k 1 (Fig. 5 e Additional file 1).

Fig. 5
figure5

I valori MFE bassi sono associati a una ridotta espressione di fluorescenza. Barre rosse, differenza tra MFEs del corrispondente 5′-UTR e k 1 (ΔMFE). Barre blu, rapporto ingrandito di 10 volte tra il livello di fluorescenza del 5′-UTR indicato e quello di k 1. A parte k 1, le sequenze sono ordinate per ΔMFE crescente. Tutte le sequenze tranne k 4 contengono mutazioni puntiformi multiple rispetto a k 1. Asterischi sopra le barre blu, p-value <0.05 vs. k 1

k 26 è stato progettato scegliendo i nucleotidi meno frequenti tra le posizioni -15 e -1 tra un insieme di geni altamente espressi S. cerevisiae. La MFE corrispondente (-261,39 kcal/mol) era la più bassa nell’insieme delle unità di trascrizione considerate in questo lavoro. Nessuna forcina gigante era presente nella struttura secondaria dell’mRNA MFE poiché la regione -15…-1 era sequestrata in due steli diversi. Le guanine tra le posizioni -1 e -6 facevano parte di uno stelo lungo e si accoppiavano con un esamer all’inizio della sequenza yEGFP (posizioni da +33 a +38). Al contrario, le posizioni da -9 a -15 si accoppiavano con una regione del terminatore CYC1, nelle posizioni da +750 a +758 (Fig. 4 b).

Un livello di fluorescenza appena sopra quello di k 26 è stato registrato per k 30 e k 31. Entrambi differiscono da k 26 per la regione a monte (composta da sette adenine) e per la presenza di un’adenina nella regione estesa di Kozak (nelle posizioni -2 e -3, rispettivamente). Analogamente a k 26, i primi cinque nucleotidi della regione estesa di Kozak di k 30 e i primi sei di k 31 erano sequestrati in uno stelo con il CDS. Tuttavia, diversamente da k 26, le regioni a monte di k 30 e k 31 erano completamente libere da qualsiasi interazione di appaiamento (vedi Fig. 4 b). Le loro MFE (-244,28 e -247,26 kcal/mol, rispettivamente) erano anche significativamente più alte di quelle di k 26. Queste tre sequenze suggeriscono che una condizione per abbassare marcatamente l’espressione della proteina è quella di racchiudere i nucleotidi nelle posizioni da -1 a -5 in una struttura secondaria dell’mRNA. Inoltre, non tutti questi nucleotidi devono partecipare alle interazioni di base-accoppiamento. Infatti, una guanina in posizione -1 (k 30) o -2 (k 26 e k 31) è “libera” e responsabile della presenza di un mini-loop nella struttura dell’mRNA.

Questa ipotesi è però contraddetta da k 29. La MFE di questa sequenza (-245,97 kcal/mol) è paragonabile a quella di k 30 e k 31, e la struttura secondaria dell’mRNA corrispondente è molto simile a quella di k 31 (Fig. 6 a). Tuttavia, il livello di fluorescenza associato a k 29 era più di 6 volte superiore a quello di k 31 e ammontava al 45% di quello di k 1.

Fig. 6
figura6

strutture secondarie di mRNA. a k 27 differisce da k 29 solo per una guanina invece di un’adenina in posizione -1. Tuttavia, le loro strutture secondarie di mRNA sono dissimili. In k 27, la sequenza Kozak estesa è coinvolta in interazioni di base-accoppiamento con il terminatore CYC1, mentre in k 29 la sequenza Kozak estesa è bloccata in uno stelo con il CDS. La MFE associata a k 27 è inferiore a quella di k 29, ma non c’è differenza tra i livelli di fluorescenza delle due sequenze (p-value =0,20). b Le guanine multiple nella regione a monte danno origine a strutture di mRNA caratterizzate da interazioni di base-pairing tra il 5′-UTR e il terminatore CYC1. k 28 e k 34 hanno sei guanine in uno stelo con il terminatore CYC1, mentre k 35 ha solo 5 guanine in una struttura analoga. Questo causa un aumento della MFE e di conseguenza una maggiore fluorescenza

k 27 ha condiviso con k 29- k 31 una regione a monte fatta solo di adenine. Tuttavia, a differenza di queste tre sequenze, la sequenza estesa di Kozak di k 27 non conteneva alcuna adenina. La MFE di k 27 (-247,04 kcal/mol) era paragonabile a quella di k 29- k 31, ma la sua struttura secondaria di mRNA corrispondente aveva una configurazione diversa. Infatti, tutti i nucleotidi della sequenza estesa di Kozak (con l’eccezione della citosina in posizione -7) erano coinvolti nell’interazione base-pairing non con il CDS ma con il terminatore CYC1 (posizioni da +755 a +762; Fig. 6 a). Il livello di fluorescenza di k 27 era leggermente superiore a quello di k 29, cioè quasi 7 volte superiore a quello di k 31.

Le cinque sequenze considerate finora (k 26, k 27, k 29- k 31) hanno in comune una regione Kozak estesa ricca di guanina che è stata sequestrata in un gambo nella struttura secondaria dell’mRNA MFE. In quattro casi, la sequenza Kozak estesa si è accoppiata (parzialmente) con il CDS, e in un caso (k 27) con il terminatore CYC1. La MFE di k 26 era la più bassa, poiché la sua regione a monte era anche sequestrata in uno stelo. Le altre quattro sequenze hanno mostrato valori MFE molto simili ma livelli di fluorescenza piuttosto diversi.

L’altro gruppo di sequenze affette da mutazioni multiple rispetto a k 1 aveva solo adenine nella sequenza estesa di Kozak e un numero variabile di guanine nella regione a monte.

k 28, k 34, e k 35 avevano, rispettivamente, 7, 6, e 5 guanine in fila dalla posizione -15 a valle. Anche se la MFE di k 35 era chiaramente più alta di quella di k 28 e k 34 (Tabella 2), le tre sequenze hanno dato origine a strutture simili di mRNA in cui almeno cinque guanine della regione a monte (più la prima adenina a valle) erano bloccate in uno stelo a causa delle interazioni di base-accoppiamento con il terminatore CYC1 (vedi Fig. 6 b).

Interessante, sia la MFE che il livello di fluorescenza di k 28 erano paragonabili a quelli di k 27 e k 29. Quindi, anche se la sequenza di Kozak era priva di interazioni di accoppiamento, il sequestro della regione a monte in uno stelo era sufficiente a garantire un netto calo dell’espressione della proteina. Questa è un’ulteriore conferma del ruolo giocato dai nucleotidi a monte della sequenza di Kozak nel regolare l’espressione della proteina.

Una diversa struttura secondaria dell’mRNA MFE è stata ottenuta per k 33 (quattro guanine, mescolate ad adenine), in cui metà della sequenza estesa di Kozak e quasi tutta la regione a monte erano coinvolte in interazioni di base-accoppiamento con il CDS, dando luogo a un lungo stelo. Tuttavia, rispetto a k 35, in cui solo cinque nucleotidi della regione a monte sono stati bloccati in uno stelo con il terminatore CYC1, k 33 ha mostrato un MFE più elevato così come un più alto livello di fluorescenza (Fig. 5 e file aggiuntivo 1).

Infine, per k 32, k 36, e k 37 (con quattro, tre, e due guanine nella regione a monte, rispettivamente) RNAfold ha riportato lo stesso MFE come per k 1. Le strutture secondarie dell’mRNA corrispondenti erano tutte caratterizzate dalla presenza della forcina gigante (vedi file aggiuntivo 1). Rispetto ai nostri dati sperimentali, questo risultato era plausibile solo per k 37 ma in apparente disaccordo con le misure per k 32 e k 36, i cui livelli di fluorescenza erano significativamente inferiori a quelli di k 1 (Fig. 5). In particolare, la fluorescenza di k 32 corrispondeva solo a circa il 69% di quella di k 1. Pertanto, si può sostenere che in vivo k 32 e k 1 condividono la stessa MFE e la stessa struttura secondaria dell’mRNA, come suggerito dalle simulazioni in silico.

In contrasto con le mutazioni puntuali multiple, delle mutazioni puntuali singole su k 1, solo k 4 ha causato una modifica della struttura della forcina gigante e una conseguente diminuzione della MFE. k 4 porta una guanina in posizione -1 che si accoppia con la citosina in posizione -31 in modo tale che la lunghezza del loop si riduce da 32 a 29 nucleotidi e la MFE si abbassa a -241,42 kcal/mol (Fig. 4 a). Secondo i nostri dati, questo cambiamento minimo non ha alcun effetto sull’espressione della fluorescenza. Tutte le altre mutazioni puntiformi che hanno indotto un livello di fluorescenza significativamente più alto di quello di k 1 (cioè k 16, k 47- k 51, e k 53- k 55) sono state caratterizzate dalla stessa MFE e dalla corrispondente struttura secondaria dell’mRNA di k 1, secondo le simulazioni RNAfold.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.