Ensamblaje y anotación del genoma de la medusa

Aquí presentamos el primer ensamblaje de novo del genoma de la medusa Nomura (Nemopilema nomurai; Fig. 1b). El resultado fue un genoma de 213 Mb compuesto por 255 andamios y una longitud N50 de 2,71 Mb, que contiene sólo un 1,48% de huecos (Archivo adicional 1: Tablas S2 y S3). El ensamblaje híbrido de Nemopilema se creó utilizando una combinación de tecnologías de secuenciación de lecturas cortas y largas, consistente en 38,2 Gb de lecturas de secuenciación en tiempo real de una sola molécula (SMRT) de Pacific Biosciences (PacBio), junto con 98,6 Gb de lecturas largas sintéticas de Illumina de inserción corta, pareja y TruSeq (Archivo adicional 1: Figuras S3-S5; Tablas S4-S7). El ensamblaje resultante muestra la mayor continuidad entre los genomas de cnidarios (Archivo adicional 1: Tabla S9). Predijimos 18.962 genes de medusas codificadores de proteínas combinando métodos de novo (utilizando los transcriptomas de la campana de la medusa y del tejido del tentáculo) y de predicción de genes homólogos (Archivo adicional 1: Tablas S10 y S11, Archivos adicionales 2 y 3). Este proceso recuperó el mayor número de genes ortólogos de una sola copia entre todos los conjuntos de genomas de metazoos no bilaterianos publicados hasta la fecha (Archivo adicional 1: Tabla S12). Se encontró que un total del 21,07% del genoma de las medusas estaba formado por elementos transponibles, en comparación con los de Acropora digitifera (9,45%), Nematostella vectensis (33,63%) e Hydra vulgaris (42,87%) (Archivo adicional 1: Tabla S13).

Comparamos el genoma de Nemopilema con otros genomas de cnidarios, incluyendo los genomas recientemente publicados de Aurelia aurita y Clytia hemisphaerica , todos los cuales provienen de taxones predominantemente sésiles, para detectar la función única de Scyphozoa (movilidad activa), la estructura física (campana de medusa) y la química (veneno). También realizamos análisis del transcriptoma tanto de Nemopilema nomurai como de la medusa Sanderia malayensis a través de tres tipos de tejido de medusa y cuatro etapas de desarrollo.

Análisis evolutivo de las medusas

Para identificar los rasgos evolutivos específicos de las medusas, examinamos las expansiones y contracciones de las familias de genes a través de un holozoo unicelular y 13 metazoos utilizando 18.458 familias de genes ortólogos (véase el archivo adicional 1: sección 4.1). De éstas, 10.434 se encontraron en Nemopilema y 6764 fueron compartidas por las tres clases de cnidarios disponibles (Scyphozoa: Nemopilema nomurai y Aurelia aurita; Hydrozoa: Hydra vulgaris , Clytia hemisphaerica; Anthozoa: Acropora digitifera y Nematostella vectensis ; Fig. 2a). Una filogenia construida con estos ortólogos reveló un clado monofilético de cnidarios que divergió del tronco de los metazoos antes de la evolución de los bilaterios (Fig. 2b; Archivo adicional 1: Figura S7). Para determinar cuántos genes aparecieron en cada era evolutiva en el genoma de la medusa de Nomura, también evaluamos la edad evolutiva de los genes codificadores de proteínas. Agrupando los genes de las medusas en tres amplias eras evolutivas, observamos que mientras la mayoría (80%) de los genes son antiguos (más de 741 Mya), unos pocos (~ 3%) son de una edad intermedia (741-239 Mya), y algunos (17%) son jóvenes (239 Mya hasta el presente; Fig. 2c; Archivo adicional 1: Figura S10). Curiosamente, la normalización del número de genes por la edad y la duración de la era evolutiva sugiere que el recambio de genes es mayor cerca de la época actual. En total, el genoma de Nemopilema contenía 123 familias de genes ampliadas y 164 contraídas en comparación con el ancestro común de Nemopilema y Aurelia (Fig. 2b; véase el archivo adicional 1: sección 4.2). Los términos de la Ontología Genética (GO) relacionados con la percepción sensorial estaban poco representados en el linaje de Cnidaria en comparación con Bilateria, reflejando con precisión el sistema sensorial menos complejo de los cnidarios (archivo adicional 1: tablas S14 y S15). Sin embargo, el transporte de neurotransmisores (GO:0006836, P = 6,01E- 10) se enriqueció significativamente en el linaje de Scyphozoa en comparación con el ancestro común de Scyphozoa e Hydrozoa (archivo adicional 1: Tablas S16 y S17), probablemente debido al equilibrio y a las estructuras visuales, como el estatocisto y los ocelos, que son más elaborados en la medusa móvil que en los pólipos sésiles . En comparación con el ancestro común de Nemopilema y Aurelia, Nemopilema mostró familias de genes ampliadas asociadas a actividades metalopéptidas (GO:0008237, P = 2,86E- 14; Archivo adicional 1: Tablas S18 y S19). Además, encontramos 1589 familias de genes ortólogos que son específicos de Scyphozoa. Las pruebas de enriquecimiento de los genes específicos de los escifozoos mostraron los términos de transporte de iones de sodio, la actividad de los canales de iones y la actividad de los receptores de neurotransmisores (archivo adicional 1: Tabla S20).

Fig. 2
figura2

Relaciones de familias de genes de especies de cnidarios y metazoos. a Diagrama de Venn del número de familias de genes únicas y compartidas entre tres clases de cnidarios (Scyphozoa: Nemopilema nomurai y Aurelia aurita; Hydrozoa: Hydra vulgaris y Clytia hemisphaerica; Anthozoa: Acropora digitifera y Nematostella vectensis;). b Ampliaciones y contracciones de familias de genes en el genoma de Nemopilema. Los números designan el número de familias de genes que se han expandido (rojo, +) y contraído (azul, -) tras la separación del ancestro común. c La proporción de genes de Nemopilema en cada era evolutiva. La mayoría de los genes de Nemopilema (~ 80%) son antiguos (~ 1877 Mya), unos pocos (~ 3%) son de edad intermedia (~ 659 Mya), y una fracción significativa (~ 17%) son relativamente jóvenes (~ 147 Mya)

Contexto genómico y genes asociados al músculo

Las medusas tienen dos tipos de músculos primarios: las células epiteliomusculares, que son las células musculares predominantes que se encuentran en los cnidarios sésiles, y las células musculares estriadas situadas en la campana de la medusa que son esenciales para la natación. Para entender la evolución de la natación activa en las medusas, examinamos su sesgo de codones en comparación con otros metazoos calculando el contenido de guanina y citosina en la posición del tercer codón (GC3) (Archivo adicional 1: Figura S13). Se ha sugerido que los genes con un alto nivel de GC3 son más adaptables a las tensiones externas (por ejemplo, los cambios ambientales) . Entre los 100 genes con mayor puntuación de GC3, la regulación de la contracción muscular y las vías de señalización de neuropéptidos, los términos GO eran específicos de Nemopilema (archivo adicional 4: tablas S25 y S26). El calcio juega un papel clave en la contracción del músculo estriado en las medusas, y la vía de señalización del calcio (GO:0004020, P = 5,60E- 10) mostró un alto nivel de sesgos GC3 específicos de Nemopilema. Los 500 genes GC3 más importantes de Nemopilema y Aurelia estaban enriquecidos en términos GO asociados a la homeostasis (por ejemplo homeostasis química celular y transporte de iones de sodio), lo que especulamos que es esencial para la activación de las contracciones musculares que impulsan la depredación móvil de la medusa (Archivo adicional 1: Sección 5.1; Archivo adicional 4: Tablas S27 y S28).

Dado que se ha informado que los cnidarios carecen de los complejos de titina y troponina, que son componentes críticos de los músculos estriados de los bilaterios, se ha sugerido que los dos clados evolucionaron independientemente los músculos estriados . Un estudio de los genes que codifican las proteínas estructurales y reguladoras del músculo en los cnidarios mostró una maquinaria contráctil de actina-miosina conservada en el núcleo de los eumetazoos y compartida con los bilaterios (archivo adicional 1: tabla S32). Sin embargo, al igual que otros cnidarios, Nemopilema carece de complejos de titina y troponina, que son componentes clave de los músculos estriados de los bilaterios. También, la γ-sintrofina, un componente del complejo distroglicano, estaba ausente en Nemopilema, Aurelia, e Hydra. Sin embargo, Nemopilema y Aurelia poseen α/β-Dystrobrevin y α/ε-Sarcoglycan, proteínas asociadas al distroglicano, indicando que varios componentes del complejo distroglicano se perdieron después de la división Scyphozoa-Hydrozoa. Se sugirió que Hydra sufrió simplificaciones secundarias en relación con Nematostella, que tiene un mayor grado de especialización del tipo de célula muscular . En comparación con Hydra y Nematostella, Nemopilema y Aurelia muestran una complejidad intermedia de las proteínas estructurales y reguladoras del músculo entre Hydra y Nematostella.

Perfiles del transcriptoma de la campana y el tentáculo de la medusa

La campana y los tentáculos de la medusa son morfológicamente distintos y realizan funciones fisiológicas discretas . Generamos transcriptomas de campanas y tentáculos de Nemopilema y de la más pequeña Sanderia malayensis, que pueden cultivarse en el laboratorio, para evaluar la regulación del desarrollo (Archivo adicional 1: Tabla S29). Las pruebas de enriquecimiento de los genes altamente expresados mostraron que las categorías funcionales asociadas al músculo (por ejemplo, el complejo de miosina muscular y la morfogénesis del tejido muscular) estaban enriquecidas en la campana (Fig. 3a; Archivo adicional 5: Tablas S30-S33). Las miosinas comprenden una superfamilia de proteínas motoras y juegan un papel crítico en la contracción muscular y están implicadas en una amplia gama de procesos de motilidad en Eucariotas. Las proteínas de la familia de la miosina II, que se encuentran en las células del tejido muscular estriado y del tejido muscular liso, son las responsables de producir la contracción en las células musculares. Los cnidarios poseen tanto células epiteliomusculares como células musculares estriadas. El músculo estriado es un componente crítico de la subumbre de la campana de la medusa, donde sus rápidas contracciones impulsan la natación única basada en la propulsión de la medusa. Descubrimos que las familias de genes de la cadena pesada de miosina (MYH) y de la cadena ligera de miosina (MYL) de tipo II se expresan en gran medida en la campana y están estrechamente relacionadas con las células musculares estriadas y lisas. Curiosamente, Nemopilema y Aurelia mostraron el mayor número de copias de los genes MYH y MYL entre los metazoos no bilaterianos (Fig. 3c; Archivo adicional 1: Figuras S14-S17; Tablas S38-40), y seis de los siete genes MYH y 12 de los 21 genes MYL en Nemopilema mostraron una mayor expresión en la campana que en los tentáculos, con un aumento muy elevado de ~ 8,8 y ~ 17 veces de media, respectivamente (Fig. 3d). Estos resultados sugieren que las combinaciones de la expansión del número de copias de las familias de genes de miosina de tipo II y la alta expresión de los genes asociados al músculo confirmaron que los músculos de la campana de la medusa son un determinante importante de la motilidad de la medusa.

Fig. 3
figura3

Patrones de expresión génica de los tejidos de la campana de medusa y de los tentáculos y expansión de los genes de la cadena pesada de la miosina en las medusas. a Mapa de calor del valor P de las categorías GO enriquecidas utilizando genes altamente expresados en el tejido de la campana de medusa. En cada columna se muestra una expresión superior al doble y al cuádruple en la campana de medusa que en los tentáculos. Sólo se muestran las categorías GO compartidas entre N. nomurai y S. malayensis. b Mapa de calor del valor P de las categorías GO enriquecidas utilizando genes altamente expresados en el tejido de los tentáculos. c Árbol modelo JTT no enraizado de los genes de la cadena pesada de la miosina utilizando el método BLAST de mejores resultados. d Patrón de expresión de los genes MYH y MYL en Nemopilema. Se excluyeron los genes que no se expresan tanto en los tentáculos como en la campana de la medusa

A la inversa, los análisis de expresión génica de los tentáculos revelaron altos niveles de expresión de ARN de categorías funcionales asociadas a neurotransmisores (complejo de canales iónicos, postsinapsis y actividad de receptores de neurotransmisores; Fig. 3b; Archivo adicional 5: Tablas S34-S37); en consonancia con la anatomía de los tentáculos de las medusas, que contienen las células sensoriales y un plexo suelto de la subpoblación neuronal en la base del ectodermo .

Patrones corporales en las medusas

Ha habido mucho debate en torno a la evolución temprana del patrón corporal en el ancestro común de los metazoos, en particular en lo que respecta al origen y la expansión de las familias de genes Hox y Wnt . En total, se encontraron 83 homeodominios en Nemopilema, mientras que 82, 41, 120 y 148 de homeodominios se encontraron en Aurelia, Hydra, Acropora y Nematostella, respectivamente (archivo adicional 1: Tabla S41). Cinco de los ocho genes Hox de Nemopilema son de tipo posterior y están asociados al desarrollo del eje aboral y se agrupan con los genes Hox posteriores de Nematostella, HOXE y HOXF (archivo adicional 1: figuras S18-S20). Aurelia tiene seis genes Hox de tipo posterior, pero no tiene los de tipo HOXB, C y D (HOX2 en humanos). Aunque están ausentes en Hydra y Acropora, los análisis de sintenia de los genes ParaHox en Nemopilema muestran que el gen XLOX/CDX está localizado inmediatamente aguas abajo de GSX en la misma orientación en tándem que los de Nematostella, lo que sugiere que XLOX/CDX estaba presente en el ancestro común de los cnidarios y que posteriormente se perdió en algunos linajes (archivo adicional 1: Figura S21). Los genes relacionados con Hox, EVX y EMX, también están presentes en Nemopilema y Aurelia, aunque están ausentes en Hydra. Dada la gran diversidad ancestral de los genes Wnt, se ha propuesto que la señalización Wnt controlaba el desarrollo del plan corporal en los primeros metazoos. Nemopilema posee 13 ortólogos de Wnt que representan 10 subfamilias de Wnt (Archivo adicional1: Figura S22; Tabla S42). Wnt9 está ausente en todos los cnidarios, lo que probablemente representa pérdidas en el ancestro común de los cnidarios. Los cnidarios han sufrido duplicaciones dinámicas de subfamilias Wnt específicas de cada linaje, como Wnt8 (Nematostella, Acropora y Aurelia), Wnt10 (Hydra) y Wnt11 y Wnt16 (Nemopilema y Aurelia). Se ha propuesto que un grupo común de genes Wnt (Wnt1-Wnt6-Wnt10) existió en el último ancestro común de artrópodos y deuterostomas. Nuestros análisis de los genomas de cnidarios y bilaterios revelaron que Acropora también posee este cluster, mientras que Nemopilema, Aurelia e Hydra carecen de Wnt6, lo que sugiere la pérdida del gen Wnt6 en el ancestro común de Medusozoa (Archivo adicional 1: Figura S23). En conjunto, las medusas tienen un número de genes Hox y Wnt comparable al de otros cnidarios, pero el repertorio dinámico de estas familias de genes sugiere que los cnidarios han evolucionado de forma independiente para adaptar sus características fisiológicas y su ciclo vital.

Transición de pólipo a medusa en medusas

La transición de pólipo a medusa es prominente en las medusas en comparación con los otros cnidarios sésiles. Para entender las bases genéticas de la formación de la estructura de medusa en las medusas, comparamos la regulación transcripcional entre los cnidarios y a través de las etapas de desarrollo de las medusas (véase el archivo adicional 1: secciones 7.1 y 7.2). Ensamblamos los transcritos de Sanderia utilizando seis muestras agrupadas de transcriptomas (Archivo adicional 1: Tabla S43). Los transcritos ensamblados tenían una longitud total de 61 Mb y dieron lugar a 58.290 isoformas de transcripción y 43.541 transcritos únicos, con un N50 de 2325 pb. Por término medio, el 87% de las lecturas de ARN se alinearon con los transcritos ensamblados (archivo adicional 1: tabla S44), lo que indica que el ensamblaje de los transcritos representó la mayoría de las lecturas secuenciadas. Además, la composición de los dominios proteicos contenidos en los 20 primeros puestos fue bastante similar entre Nemopilema y Sanderia (archivo adicional 1: tabla S45). Para obtener los genes expresados diferencialmente para cada etapa, comparamos cada etapa con la anterior o la siguiente en el ciclo vital de la medusa. La etapa de pólipo, que representa una etapa sésil en el ciclo vital de la medusa, mostró términos enriquecidos relacionados con la actividad de los canales iónicos y el metabolismo energético (regulación del proceso metabólico, y proceso metabólico de los aminoácidos; archivo adicional 1: Tabla S46). La alimentación activa en el pólipo estimula la proliferación asexual ya sea en más pólipos o en la metamorfosis a estrobila . Dado que los antozoos no forman una medusa, la etapa de reproducción asexual de la strobila es una etapa importante para estudiar la metamorfosis de pólipo a medusa. En esta etapa, los términos GO relacionados con el proceso biosintético y metabólico de las amidas estaban altamente expresados en comparación con la etapa de pólipo (archivo adicional 1: Tabla S47). Se ha informado de que los neuropéptidos RF-amida y LW-amida estaban asociados a la metamorfosis en los cnidarios. Sin embargo, no pudimos confirmar este hallazgo en nuestras comparaciones de estadios de strobila y ephyra. En nuestro sistema, los patrones de expresión génica de los dos estadios son bastante similares. En la ephyra, la etapa móvil liberada, los términos GO que implican procesos biosintéticos y metabólicos de las amidas también se expresaron en gran medida en comparación con la etapa de medusa fusionada (archivo adicional 1: tabla S48). En la medusa, la matriz extracelular, la actividad metalopéptida y los términos del proceso del sistema inmune fueron enriquecidos (Archivo adicional 1: Tabla S49), en consonancia con la fisiología de sus tipos de tejido de campana, tentáculos y brazo oral.

La metamorfosis de pólipo a medusa se demostró previamente que estaba fuertemente asociada con los genes CL390 y del receptor X retinoide (RXR) en la medusa Aurelia aurita . Curiosamente, CL390 no se encontró en Nemopilema ni en otros cnidarios publicados, lo que sugiere que puede ser un gen inductor de la estrobilación específico de Aurelia. Sin embargo, confirmamos que el RXR está presente en Nemopilema y ausente en los cnidarios sin estadio de medusa (archivo adicional 1: figura S24). La señalización del ácido retinoico (AR) desempeña un papel central durante el crecimiento y el desarrollo de los vertebrados, donde regula la transcripción al interactuar con el receptor de AR (RAR) unido a los elementos de respuesta de AR (RAREs) de los genes diana cercanos. De los genes de la vía de señalización del AR, Nemopilema posee las enzimas ADH y RALDH que metabolizan el retinol a AR, y RXR y RAREs para activar la transcripción del gen diana (Fig. 4a). Descubrimos 1630 regiones RARE de Nemopilema con una distancia media de 13 Kbp al gen más cercano (Fig. 4b; Archivo adicional 1: Tablas S50 y S51). Curiosamente, cuatro genes Hox posteriores de Nemopilema y dos genes Hox de Aurelia se encontraban a una distancia de ± 10 Kbp de las RAREs, lo que es único entre los metazoos no bilaterianos (Fig. 4c; Archivo adicional 1: Tabla S52). En conjunto, estos hallazgos sugieren que la señalización del ácido retinoico estaba presente en los primeros metazoos para regular los genes diana con RXR y RAREs y que RXR y RAREs pueden desempeñar un papel crítico para la metamorfosis de pólipo a medusa .

Fig. 4
figure4

Vía de señalización del ácido retinoico y RAREs en Nemopilema. a Esquema de la vía de señalización del ácido retinoico en humanos. El azul denota la presencia del gen y/o elemento en Cnidaria. El rojo denota la presencia sólo en medusas entre los cnidarios publicados. b La distribución de las distancias entre los RAREs y el gen más cercano. La distancia se calculó identificando su proximidad al sitio de inicio de la transcripción (TSS) de los genes. El recuento de genes se calculó para cada bin de 1 Kb no superpuesto a través de un rango de – 100 Kb a 100 Kb. c Los RAREs localizados cerca de los genes Hox posteriores en Nemopilema

Identificación de dominios relacionados con toxinas en medusas

Las medusas producen complejas mezclas de venenos proteináceos para la captura activa de presas y la defensa . Identificamos abundantes dominios de toxinas en Nemopilema cuando se compara con los conjuntos de genes de metazoos no bilaterianos en la base de datos Tox-Prot . En total, 67 de los 136 dominios de toxinas se alinearon con metazoos no bilateros; de estos 67 dominios de toxinas, 52 se encontraron en Nemopilema (Archivo adicional 1: Tabla S53). Como era de esperar, el genoma de Nemopilema contiene el mayor número de dominios asociados a venenos o toxinas de los metazoos no bilaterianos incluidos. Estos dominios incluyen dominios de metaloproteasa de zinc de la familia Reprolysin (M12B) (PF01421), fosfolipasa A2 (PF05826) y Prokineticin (PF06607) (Fig. 5). Además, Nemopilema y Aurelia poseen 8 y 11 dominios tipo ShK (PF01549), respectivamente, que son los más abundantes en estas especies en comparación con otros no bilateros. En particular, las metaloproteasas de zinc de la familia Reprolysin (M12B) son enzimas que escinden péptidos y comprenden la mayoría de las endopeptidasas del veneno de serpiente . Además, se ha informado de que el inhibidor de serina proteasa y los dominios ShK se encontraron abundantemente en los transcriptomas tanto de la medusa bola de cañón (Stomolophus meleagris) como de la medusa caja (Chironex fleckeri) , y la fosfolipasa A2 es una enzima bien caracterizada relacionada con la toxina, que es crítica para la producción de componentes del veneno, que se encuentra en la clase Scyphozoa .

Figura 5
figura5

Análisis filogenético de los dominios relacionados con el veneno en metazoos no bilaterios. Cinco dominios de veneno (PF01421, PF01549, PF06607, PF00068 y PF05826) están representados en cuatro dendrogramas circulares. Dos dominios de fosfolipasa A2 (PF00068 y PF05826) se fusionaron en un dendrograma circular (arriba a la derecha) y los sombreados en las ramas y nodos (azul cielo) de la fosfolipasa A2 denotan el dominio PF05826

.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.