Elegimos el 5′-UTR del promotor CYC1 de S. cerevisiae, muy estudiado. Fusionamos pCYC1min (comenzando en la posición -143) con una proteína verde fluorescente mejorada por la levadura (yEGFP) y el terminador de CYC1. En comparación con el promotor completo de CYC1, pCYC1min contiene dos de las tres cajas TATA y ninguna secuencia activadora aguas arriba. pCYC1min es un promotor moderadamente débil y, por esta razón, parece ser un candidato ideal para detectar los efectos positivos y negativos de las mutaciones puntuales en la secuencia líder sobre la expresión de la proteína reportera aguas abajo. El promotor CYC1 5′-UTR tiene 71 nucleótidos de longitud.

En el siguiente análisis, nos referimos a la porción de CYC1 5′-UTR en la posición -1 a -8 como la secuencia Kozak extendida y a la de -9 a -15 como la región upstream. En la secuencia extendida de Kozak la adenina está fuertemente conservada en cinco posiciones, mientras que en la región ascendente ningún nucleótido está fuertemente conservado. Sin embargo, la adenina es la más frecuente en casi todos los sitios (ver Antecedentes).

La secuencia de Kozak extendida

La secuencia original de CYC1 desde las posiciones -15 a -1 es CACACTAAATTAATA (en adelante denominada k 0). Según Dvir et al, la presencia de una adenina en las posiciones -1, -3 y -4, junto con la ausencia de guanina en la posición -2, debería hacer que esta secuencia líder fuera casi óptima para una alta expresión. Sin embargo, la timina en la posición -2 y la citosina en la posición -13 tienen una frecuencia inferior al 20 % y al 10 %, respectivamente, entre los genes altamente expresados de S. cerevisiae . Construimos nuestra primera secuencia líder sintética de CYC1 (k 1) colocando una adenina en cada posición de -1 a -15.

El nivel de fluorescencia asociado a k 1 fue un 6,5 % mayor que el medido con k 0. Sin embargo, no surgió ninguna diferencia estadísticamente significativa de los datos recogidos en estas dos secuencias líderes (valor p =0,13). Mantuvimos k 1 (la secuencia líder optimizada) como plantilla para nuestras siguientes construcciones sintéticas y construimos otros 57 5′-UTRs sintéticos mutando uno o varios nucleótidos en k 1.

El primer grupo de secuencias líderes sintéticas se realizó mediante una única mutación puntual desde la posición -1 a la posición -8 (ver Tabla 1). Por lo tanto, modificamos sólo la secuencia Kozak extendida, mientras que la región aguas arriba se mantuvo en una configuración optimizada para la alta expresión del gen con adeninas en las posiciones -9 a -15.

Tabla 1 Secuencias terminales sintéticas de CYC1 5′-UTR de k 1 a k 25

La mayor fluorescencia se registró para k 16 (donde una guanina sustituyó a la adenina en la posición -5) y la menor para k 9 (donde una timina sustituyó a la adenina en la posición -3). Además, el nivel de fluorescencia de k 16 fue estadísticamente diferente del de k 0 y k 1. Un aumento de la fluorescencia debido a una guanina en la posición -5 fue un resultado sorprendente porque la guanina es el nucleótido menos frecuente en las secuencias líder de la levadura S. cerevisiae. Además, nunca se detectó guanina en esta posición entre los genes altamente expresados ni provocó ningún aumento de la fluorescencia en el trabajo de Dvir et al. .

A pesar de la ausencia de una diferencia estadísticamente significativa con respecto a k 1, las únicas construcciones distintas de k 16 que dieron lugar a un aumento de >5 % en el nivel de fluorescencia de k 1 fueron k 3, k 10 y k 24. En particular, en k 3, una timina sustituyó a una adenina en la posición -1, y en k 10 la adenina en la posición -3 fue mutada en una guanina. Como se informó anteriormente, la adenina en las posiciones -1 y -3 debería garantizar una alta expresión del gen. Sin embargo, en un fondo de adenina de este tipo, parece que se necesitan nucleótidos menos frecuentes en las posiciones -1 o -3 para aumentar aún más la expresión del gen. Por el contrario, una timina en lugar de una adenina en la posición -3 (k 9) fue la única mutación que indujo una reducción de >5 % en el nivel de fluorescencia de k 1. Este resultado es coherente con la observación de que una timina en la posición -3 es abundante en los genes poco expresados (Fig. 1 a).

Fig. 1
figure1

Efecto de las mutaciones puntuales en la secuencia Kozak extendida sobre la expresión de fluorescencia. Los niveles de fluorescencia se representan en relación con k 1 (a) y k 0 (b). El control corresponde a una cepa de levadura sin el gen yEGFP. El nucleótido que sustituyó a una adenina en k 1 y la posición en la que se produjo la mutación se indican debajo del nombre de cada secuencia líder sintética. Asteriscos, valor p <0,05 frente a k 1 (a) o k 0 (b)

Respecto a k 0, las 25 nuevas secuencias líderes sintéticas contenían entre seis y ocho mutaciones. Aparte de k 9, todas las 5′-UTR sintéticas mostraron un nivel de fluorescencia superior al de k 0, cinco de las cuales fueron significativamente superiores. Entre ellas se encontraban las posiciones -1, -4 y -5. Como ya se observó en la comparación con k 1, una adenina justo antes del codón START no parecía tener ninguna ventaja especial para la expresión del gen. En este caso, una citosina y una timina (k 2 y k 3, respectivamente) funcionaban mucho mejor que una adenina. Sin embargo, con respecto a k 0, había siete mutaciones puntuales más aguas arriba. En la posición -4, una timina (k 12) produjo el mayor incremento de fluorescencia, mientras que en la posición -5, tanto una citosina (k 14) como una guanina (k 16) aumentaron la fluorescencia a >10 % por encima de la de k 0. Dado que k 0 tiene una timina en las posiciones -2, -5 y -6, cada una de las cinco 5′-UTRs sintéticas que mostraron diferencias estadísticamente significativas con respecto a k 0 estaban afectadas por una mutación puntual en dos o más sitios adyacentes. Otras tres secuencias líderes sintéticas (k 10,k 17 y k 24) causaron un aumento de la fluorescencia de >10 % en comparación con k 0, aunque estas diferencias no fueron significativas (valor p >0,05). k 10 y k 17 también tenían mutaciones puntuales dobles en sitios adyacentes (Fig. 1 b).

Múltiples mutaciones a guanina

El análisis de nuestras primeras 25 secuencias sintéticas 5′-UTR dio el sorprendente resultado de que una única mutación puntual a guanina -que está esencialmente ausente en la secuencia Kozak extendida de los genes altamente expresados de S. cerevisiae- puede mejorar el nivel de fluorescencia de k 1, una secuencia líder optimizada para la expresión del gen. Además, cinco de nuestros 5′-UTRs sintéticos aumentaron de forma inequívoca (>9 %) el nivel de fluorescencia asociado a pCYC1min.

De acuerdo con nuestros datos, una sola mutación a guanina puede mejorar la expresión del gen. Sin embargo, dos trabajos anteriores informaron de que múltiples guaninas colocadas delante de un codón START reducirían considerablemente la síntesis de proteínas. Por lo tanto, evaluamos cómo las mutaciones puntuales múltiples a guanina afectaban a la eficiencia de traducción de pCYC1min, para determinar si podían utilizarse para modular la expresión génica.

Según , entre los genes de S. cerevisiae altamente expresados, la guanina es el nucleótido menos frecuente entre las posiciones -1 y -15, con la excepción de la posición -7, en la que el nucleótido menos frecuente es la citosina. Construimos un 5′-UTR sintético que refleja esta secuencia (k 26; Tabla 2). Esto apagó la expresión del gen, como demuestra que el nivel de fluorescencia correspondiente no fue significativamente diferente (valor p =0,21) de nuestro control negativo (una cepa de S. cerevisiae que no contenía el gen yEGFP).

Tabla 2 Secuencias terminales sintéticas de CYC1 5′-UTR de k 26 a k 38

Probamos si las mutaciones múltiples a la guanina (citosina en la posición -7) afectarían a la expresión del gen de forma diferente cuando cubrían toda la secuencia Kozak extendida (k 27) o la región aguas arriba (k 28). Dado que las mutaciones se realizaron con respecto a k 1, todos los sitios no mutados contenían una adenina. Sorprendentemente, descubrimos que las dos configuraciones eran equivalentes para la expresión del gen (valor p >0,40) y redujeron el nivel de fluorescencia de k 1 aproximadamente a la mitad.

Empezando por k 27, sustituimos la guanina en las posiciones -1 (k 29), -2 (k 30) y -3 (k 31) por una adenina para determinar si una sola adenina en las tres posiciones justo antes del codón START mejoraría la expresión de fluorescencia cuando los otros sitios de la secuencia Kozak extendida estaban ocupados por una guanina o una citosina. En la posición -1 una adenina no mostró ninguna mejora en la fluorescencia de k 27. Curiosamente, en las posiciones -2 y -3, una adenina causó una caída en la expresión del gen a aproximadamente el 7 % del nivel de fluorescencia de k 1. Estos resultados demuestran que una adenina per se no puede mejorar la expresión del gen incluso cuando ocupa la posición -3 o -1. En términos más generales, podemos concluir que el efecto sobre la expresión génica de una única mutación puntual en la secuencia líder es fuertemente dependiente del contexto.

Por último, para comprender mejor la importancia de la región aguas arriba para la expresión génica, redujimos progresivamente el número de guaninas de siete (k 28) a una (k 38). Empezando por la posición -9, sustituimos una guanina por una adenina en cada paso y vimos que el nivel de fluorescencia aumentaba casi linealmente con el número de adeninas (Fig. 2 y archivo adicional 1). La última secuencia en la que el nivel de fluorescencia fue estadísticamente diferente al de k 1 fue k 36, en la que las guaninas estaban presentes en las posiciones -13 a -15. Una guanina sola en la posición -15 o acompañada de otra en la posición -14 no dio lugar a una diferencia significativa en el nivel de fluorescencia con respecto al de k 1. Por lo tanto, incluso en presencia de una secuencia Kozak extendida y optimizada para una alta expresión del gen, las mutaciones múltiples en la región ascendente tienen repercusiones evidentes en la síntesis de la proteína y pueden utilizarse como medio para afinar la abundancia de la misma. Una explicación de este resultado se presenta en la sección de Análisis Computacional, más adelante. Curiosamente, cuatro guaninas entremezcladas con adeninas (k 33) en la región upstream redujeron la fluorescencia de k 1 en menor medida que cuatro guaninas seguidas (k 32), lo que supone una confirmación más de que el efecto sobre la expresión génica de las mutaciones puntuales dentro del 5′-UTR depende en gran medida del contexto nucleotídico (Fig. 2; véase el archivo adicional 1 para una comparación con la fluorescencia k 0).

Fig. 2
figure2

Múltiples mutaciones puntuales a guanina. Se informa de la relación entre el nivel de fluorescencia de los 5′-UTRs sintéticos de k 26 a k 38 y el de k 1. El número de adeninas o guaninas en la región ascendente se indica debajo del nombre de la secuencia líder (de k 27 a k 38). Los subíndices -1, -2 y -3 indican que una adenina está presente en la secuencia Kozak extendida sólo en la posición correspondiente. El subíndice i representa que está entremezclado (véase el texto principal). Asteriscos, valor p <0,05 frente a k 1

La región aguas arriba

El análisis anterior confirmó que el efecto sobre la expresión génica debido a mutaciones tanto simples como múltiples dentro del 5′-UTR es fuertemente dependiente del contexto. Además, nuestros datos mostraron claramente que los cambios no sólo en la secuencia Kozak, sino también dentro de la región aguas arriba, afectan notablemente a la expresión génica. Por lo tanto, realizamos mutaciones puntuales en k 1 entre las posiciones -9 y -15 (Tabla 3) para evaluar si un solo nucleótido diferente de la adenina puede cambiar la tasa de traducción cuando se coloca en la región aguas arriba.

Tabla 3 Secuencias terminales sintéticas de CYC1 5′-UTR desde k 39 a k 58

Todas las mutaciones puntuales (excepto la de k 38) dieron lugar a un nivel de fluorescencia superior al asociado a k 1. En particular, en ocho casos, el aumento de la fluorescencia fue estadísticamente significativo (>10 % mayor que la fluorescencia de k 1). Estas ocho mutaciones incluían cuatro posiciones contiguas, de -11 a -14. Ninguna de ellas se tuvo en cuenta en el trabajo de referencia de Dvir et al. .

En la posición -11, una guanina en lugar de una adenina (k 47) aumentó la expresión de la fluorescencia en un >15 %, mientras que la citosina y la timina no tuvieron efectos significativos. Todas las mutaciones en la posición -12 aumentaron la fluorescencia de k 1. El mayor cambio (>15 %) se debió a una guanina (k 50). Las mutaciones en la posición -13 también aumentaron fuertemente el nivel de fluorescencia de k 1. Dos mutaciones puntuales -citosina (k 51) y guanina (k 53)- dieron lugar a diferencias estadísticamente significativas en la fluorescencia de k 1, mientras que una timina (k 52) aumentó la fluorescencia de k 1 en aproximadamente un 14 %, pero no alcanzó significación estadística. Cabe señalar que entre todos nuestros 58 5′-UTRs sintéticos, k 51 tenía el nivel de fluorescencia más alto, casi un 17 % más alto que el de k 1.

Por último, dos mutaciones puntuales diferentes en la posición -14 condujeron a un aumento de la fluorescencia: una citosina (k 54) y una timina (k 55) (Fig. 3; véase el archivo adicional 1 para una comparación con k 0).

Fig. 3
figure3

Efecto de las mutaciones puntuales en la región ascendente sobre la fluorescencia relativa a k 1. El nucleótido que sustituyó a una adenina en k 1 y la posición en la que se produjo la mutación se indican debajo del nombre de cada secuencia líder sintética. Asteriscos, valor p <0,05 frente a k 1

En conjunto, los resultados de este último análisis de la región aguas arriba subrayan otro resultado sorprendente: las mutaciones de punto único aguas arriba de la secuencia Kozak, en particular en las posiciones -12 y -13, fueron las que más potenciaron la expresión del gen desde un contexto rico en adeninas.

Análisis computacional

Llevamos a cabo simulaciones con RNAfold para investigar las posibles correlaciones entre las estructuras secundarias del ARNm calculadas, junto con sus correspondientes energías libres mínimas (MFE), y los niveles de fluorescencia medidos. Nuestro análisis proporciona una explicación para la caída de la fluorescencia debida a múltiples mutaciones de adenina a guanina (y citosina) en la región -15…-1. Por el contrario, de las simulaciones con RNAfold no se desprende ninguna justificación plausible de los efectos de las mutaciones puntuales en la eficiencia traslacional.

Como entrada para RNAfold, utilizamos secuencias de ARNm que comenzaban en el sitio de inicio de la transcripción de pCYC1min y terminaban en el sitio poli-A del terminador de CYC1 . Cada secuencia tenía una longitud de 937 nucleótidos. A partir de simulaciones preliminares, observamos que una cadena poli-A con una longitud variable de 150-200 nucleótidos no tenía un efecto significativo en el plegamiento del ARNm. Todas las estructuras secundarias del ARNm se calcularon a 30 °C (la temperatura a la que cultivamos las células de S. cerevisiae para los experimentos FACS).

k 0 y k 1 tienen el mismo MFE: -241,21 kcal/mol. Este es el más alto-y el más común-dentro de la colección de 59 secuencias analizadas en este trabajo (véase el archivo adicional 1). La estructura secundaria del ARNm correspondiente a este MFE se caracteriza por la presencia de una horquilla gigante entre las posiciones -40 y +10. El bucle de la horquilla va desde la posición -31 hasta la posición +1 y contiene toda la porción de 5′-UTR que hemos analizado aquí. El tallo de la horquilla está formado por nueve pares de bases, de los cuales sólo uno dio un «desajuste» debido a una adenina en la posición -38 y +8 (véase la Fig. 4 a).

Fig. 4
figure4

estructuras secundarias del ARNm. a En la estructura secundaria del ARNm está presente una horquilla gigante correspondiente a la MFE tanto de k 0 como de k 1. El bucle de la horquilla contiene la región -15…-1. La porción del 5′-UTR en nuestro análisis está libre de cualquier interacción de emparejamiento en su configuración de tipo salvaje (k 0) y en la optimizada teóricamente para la alta expresión de proteínas (k 1). El bucle de la horquilla gigante se reduce en k 4 debido a la interacción de emparejamiento de bases entre la guanina en la posición -1 y la citosina en la posición -31. En cada estructura de ARNm presentada, una flecha verde indica la posición +1, y una flecha roja indica la posición -15. b La interrupción de la horquilla gigante induce una disminución del MFE de la estructura secundaria del ARNm. k 26 y k 31 están asociados con los MFEs más bajos calculados en nuestro análisis. Las dos secuencias contienen múltiples guaninas en la secuencia Kozak extendida que participan en las interacciones de emparejamiento con la CDS. Un patrón similar está también presente en k 30. Aquí, sin embargo, un segundo mini-bucle alrededor del codón START provoca un aumento del MFE. El MFE de k 26 es sustancialmente menor que los de k 30 y k 31 debido a la presencia de otro tallo debido a las interacciones de emparejamiento entre la región aguas arriba y el terminador CYC1. Sin embargo, los niveles de fluorescencia de k 30 y k 31 son sólo aproximadamente 1,2 veces mayores que los de k 26

Múltiples mutaciones en las guaninas de la región upstream o de la secuencia Kozak extendida originan interacciones de emparejamiento de bases entre, al menos, una porción de la región -15…-1 y la CDS (yEGFP) o el terminador CYC1. Como consecuencia, la horquilla gigante se destruye y se sustituye por uno o dos tallos que reducen el MFE de la estructura secundaria del ARNm (Tabla 2). La mayoría de los valores de MFE inferiores a -241,21 kcal/mol estaban asociados a niveles de fluorescencia inferiores a los de k 1 (Fig. 5). Este resultado está de acuerdo con la noción, apoyada también por , de que las estructuras secundarias estables del ARNm en el 5′-UTR reducen la expresión de la proteína. Sin embargo, los niveles de fluorescencia que medimos no aumentaron proporcionalmente a los incrementos en el MFE. Además, en dos casos (k 32 y k 36) el RNAfold predijo una horquilla gigante en la estructura del ARNm, mientras que los niveles de fluorescencia de nuestros experimentos fueron significativamente menores que los de k 1 (Fig. 5 y archivo adicional 1).

Fig. 5
figure5

Los valores de MFE bajos se asocian con una expresión de fluorescencia reducida. Barras rojas, diferencia entre los MFE del 5′-UTR correspondiente y k 1 (ΔMFE). Barras azules, relación ampliada 10 veces entre el nivel de fluorescencia del 5′-UTR indicado y el de k 1. Aparte de k 1, las secuencias están ordenadas por el aumento de ΔMFE. Todas las secuencias, excepto k 4, contienen múltiples mutaciones puntuales con respecto a k 1. Asteriscos sobre barras azules, valor p <0,05 respecto a k 1

k 26 se diseñó eligiendo los nucleótidos menos frecuentes entre las posiciones -15 y -1 entre un conjunto de genes de S. cerevisiae altamente expresados. El MFE correspondiente (-261,39 kcal/mol) fue el más bajo dentro del conjunto de unidades de transcripción consideradas en este trabajo. No había ninguna horquilla gigante en la estructura secundaria del ARNm MFE, ya que la región -15…-1 estaba secuestrada en dos tallos diferentes. Las guaninas entre las posiciones -1 y -6 formaban parte de un tallo largo y se emparejaban con un hexámero al principio de la secuencia yEGFP (posiciones +33 a +38). Por el contrario, las posiciones -9 a -15 se emparejaron con una región del terminador CYC1, en las posiciones +750 a +758 (Fig. 4 b).

Se registró un nivel de fluorescencia justo por encima del de k 26 para k 30 y k 31. Ambos se diferenciaban de k 26 por la región ascendente (formada por siete adeninas) y la presencia de una adenina en la región Kozak extendida (en las posiciones -2 y -3, respectivamente). De forma similar a k 26, los primeros cinco nucleótidos de la región Kozak extendida de k 30 y los primeros seis de k 31 estaban secuestrados en un tallo con la CDS. Sin embargo, a diferencia de k 26, las regiones ascendentes de k 30 y k 31 estaban completamente libres de cualquier interacción de emparejamiento (véase la Fig. 4 b). Sus MFEs (-244,28 y -247,26 kcal/mol, respectivamente) eran también significativamente más altos que el de k 26. Estas tres secuencias sugieren que una condición para disminuir notablemente la expresión de la proteína es encerrar los nucleótidos en las posiciones -1 a -5 en una estructura secundaria de ARNm. Además, no todos estos nucleótidos tienen que participar en interacciones de emparejamiento de bases. De hecho, una guanina en la posición -1 (k 30) o -2 (k 26 y k 31) está «libre» y es responsable de la presencia de un mini-bucle en la estructura del ARNm.

Sin embargo, esta hipótesis se contradice con k 29. La MFE de esta secuencia (-245,97 kcal/mol) es comparable a la de k 30 y k 31, y la estructura secundaria del ARNm correspondiente es muy similar a la de k 31 (Fig. 6 a). Sin embargo, el nivel de fluorescencia asociado a k 29 era más de 6 veces mayor que el de k 31 y ascendía al 45% del de k 1.

Fig. 6
figure6

estructuras secundarias del ARNm. a k 27 difiere de k 29 sólo por una guanina en lugar de una adenina en la posición -1. Sin embargo, sus estructuras secundarias de ARNm son diferentes. En k 27, la secuencia Kozak extendida está implicada en interacciones de emparejamiento de bases con el terminador CYC1, mientras que en k 29 la secuencia Kozak extendida está bloqueada en un tallo con la CDS. La MFE asociada a k 27 es menor que la de k 29, pero no hay diferencia entre los niveles de fluorescencia de las dos secuencias (valor p =0,20). b Las guaninas múltiples en la región ascendente dan lugar a estructuras de ARNm caracterizadas por interacciones de emparejamiento de bases entre el 5′-UTR y el terminador CYC1. k 28 y k 34 tienen seis guaninas en un tallo con el terminador CYC1, mientras que k 35 sólo tiene 5 guaninas en una estructura análoga. Esto provoca un aumento de la MFE y, en consecuencia, una mayor fluorescencia

k 27 compartía con k 29- k 31 una región aguas arriba formada sólo por adeninas. Sin embargo, a diferencia de estas tres secuencias, la secuencia extendida de Kozak de k 27 no contenía ninguna adenina. La MFE de k 27 (-247,04 kcal/mol) era comparable a la de k 29- k 31, pero su correspondiente estructura secundaria de ARNm tenía una configuración diferente. De hecho, todos los nucleótidos de la secuencia Kozak extendida (con la excepción de la citosina en la posición -7) estaban involucrados en la interacción de emparejamiento de bases no con el CDS sino con el terminador CYC1 (posiciones +755 a +762; Fig. 6 a). El nivel de fluorescencia de k 27 era ligeramente superior al de k 29, es decir, casi 7 veces mayor que el de k 31.

Las cinco secuencias consideradas hasta ahora (k 26, k 27, k 29- k 31) tienen en común una región Kozak extendida rica en guanina que fue secuestrada en un tallo en la estructura secundaria del ARNmFE. En cuatro casos, la secuencia Kozak extendida se emparejó (parcialmente) con la CDS, y en un caso (k 27) con el terminador CYC1. La MFE de k 26 fue la más baja, ya que su región aguas arriba también estaba secuestrada en un tallo. Las otras cuatro secuencias mostraron valores de MFE muy similares pero niveles de fluorescencia bastante diferentes.

El otro grupo de secuencias afectadas por mutaciones múltiples con respecto a k 1 tenía sólo adeninas en la secuencia Kozak extendida y un número variable de guaninas en la región aguas arriba.

k 28, k 34 y k 35 tenían, respectivamente, 7, 6 y 5 guaninas en una fila desde la posición -15 aguas abajo. Aunque el MFE de k 35 era claramente más alto que el de k 28 y k 34 (Tabla 2), las tres secuencias dieron lugar a estructuras de ARNm similares en las que al menos cinco guaninas de la región aguas arriba (más la primera adenina aguas abajo) estaban encerradas en un tallo debido a las interacciones de emparejamiento de bases con el terminador CYC1 (véase la Fig. 6 b).

Interesantemente, tanto el MFE como el nivel de fluorescencia de k 28 eran comparables a los de k 27 y k 29. Por lo tanto, incluso si la secuencia Kozak estaba libre de interacciones de emparejamiento, el secuestro de la región aguas arriba en un tallo fue suficiente para garantizar una clara caída en la expresión de la proteína. Esto es una confirmación más del papel que desempeñan los nucleótidos aguas arriba de la secuencia Kozak en el ajuste de la expresión de la proteína.

Se obtuvo una estructura secundaria de ARNm MFE diferente para k 33 (cuatro guaninas, entremezcladas con adeninas), en la que la mitad de la secuencia Kozak extendida y casi toda la región aguas arriba estaban implicadas en interacciones de emparejamiento de bases con la CDS, dando lugar a un tallo largo. Sin embargo, en comparación con k 35, en el que sólo cinco nucleótidos de la región aguas arriba estaban bloqueados en un tallo con el terminador CYC1, k 33 mostró un mayor MFE así como un mayor nivel de fluorescencia (Fig. 5 y archivo adicional 1).

Finalmente, para k 32, k 36 y k 37 (con cuatro, tres y dos guaninas en la región aguas arriba, respectivamente) el RNAfold devolvió el mismo MFE que para k 1. Las correspondientes estructuras secundarias del ARNm se caracterizaron por la presencia de la horquilla gigante (véase el archivo adicional 1). En comparación con nuestros datos experimentales, este resultado era plausible sólo para k 37 pero en aparente desacuerdo con las mediciones para k 32 y k 36, cuyos niveles de fluorescencia eran significativamente más bajos que los de k 1 (Fig. 5). En particular, la fluorescencia de k 32 sólo correspondía a cerca del 69% de la de k 1. Por lo tanto, se puede argumentar que in vivo k 32 y k 1 comparten el mismo MFE y la misma estructura secundaria del ARNm, como sugieren las simulaciones in silico.

En contraste con las mutaciones puntuales múltiples, de las mutaciones puntuales únicas en k 1, sólo k 4 causó una modificación en la estructura de la horquilla gigante y una consecuente disminución del MFE. k 4 lleva una guanina en la posición -1 que se empareja con la citosina en la posición -31 de manera que la longitud del bucle se reduce de 32 a 29 nucleótidos y el MFE se reduce a -241,42 kcal/mol (Fig. 4 a). Según nuestros datos, este cambio mínimo no tiene ningún efecto sobre la expresión de la fluorescencia. Todas las demás mutaciones puntuales que indujeron un nivel de fluorescencia significativamente mayor que el de k 1 (a saber, k 16, k 47- k 51, y k 53- k 55) se caracterizaron por el mismo MFE y la misma estructura secundaria del ARNm que k 1, según las simulaciones de RNAfold.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.