Genom samling og annotation af kvallers genomer

Her præsenterer vi den første de novo-genom samling af Nomura-kvallen (Nemopilema nomurai; Fig. 1b). Det resulterede i et 213 Mb-genom bestående af 255 scaffolds og en N50-længde på 2,71 Mb, der kun indeholder 1,48 % huller (Additional file 1: Tabeller S2 og S3). Nemopilema-hybridassemblingen blev oprettet ved hjælp af en kombination af kort- og langlæs sekventeringsteknologier, bestående af 38,2 Gb Pacific Biosciences (PacBio) single-molecule realtids sekventering (SMRT) læsninger, sammen med 98,6 Gb Illumina short-insert, mate-pair og TruSeq syntetiske lange læsninger (Yderligere fil 1: Figurer S3-S5; Tabeller S4-S7). Den resulterende samling viser den længste kontinuitet blandt cnidarian-genomer (Yderligere fil 1: Tabel S9). Vi forudsagde 18.962 proteinkoderende manetgener ved at kombinere de novo-metoder (ved hjælp af transkriptomerne for medusaklokke og tentakelvæv) og homologe genforudsigelsesmetoder (Yderligere fil 1: Tabel S10 og S11, Yderligere filer 2 og 3). Denne proces genfindes det højeste antal ortologer af enkeltkopierede ortologer blandt alle offentliggjorte ikke-bilateriske metazoer-genomsamlinger til dato (Yderligere fil 1: Tabel S12). I alt 21,07 % af brandmandens genom blev fundet at bestå af transposable elementer sammenlignet med Acropora digitifera (9,45 %), Nematostella vectensis (33,63 %) og Hydra vulgaris (42,87 %) (Yderligere fil 1: Tabel S13).

Vi sammenlignede Nemopilema-genomet med andre cnidarian-genomer, herunder de nyligt offentliggjorte Aurelia aurita- og Clytia hemisphaerica-genomer , som alle er fra overvejende fastsiddende taxa, for at påvise unikke Scyphozoa-funktioner (aktiv mobilitet), fysisk struktur (medusaklokke) og kemi (gift). Vi udførte også transkriptomanalyser af både Nemopilema nomurai og Sanderia malayensis-kvallen på tværs af tre medusavævstyper og fire udviklingsstadier.

Evolutionær analyse af vandmænd

For at identificere vandmandsspecifikke evolutionære træk undersøgte vi genfamilieudvidelser og -kontraktioner på tværs af en encellet holozoan og 13 metazoaner ved hjælp af 18,458 ortologous genfamilier (se Yderligere fil 1: Afsnit 4.1). Af disse blev 10 434 fundet i Nemopilema, og 6764 blev delt af alle tre tilgængelige cnidarian-klasser (Scyphozoa: Nemopilema nomurai og Aurelia aurita; Hydrozoa: Hydra vulgaris , Clytia hemisphaerica; Anthozoa: Acropora digitifera og Nematostella vectensis ; Fig. 2a). En fylogeni, der er konstrueret ved hjælp af disse ortologer, afslørede en monofyletisk cnidarian-klade, der afveg fra metazoernes stamme før udviklingen af de bilaterale organismer (Fig. 2b; Additional file 1: Figur S7). For at fastslå, hvor mange gener der optrådte i hver evolutionær æra i Nomuras brandmandens genom, evaluerede vi også den evolutionære alder af de proteinkodende gener. Ved at gruppere brandmandsgener i tre brede evolutionære epoker observerede vi, at mens størstedelen (80 %) af generne er gamle (ældre end 741 Mya), er nogle få (~ 3 %) af en mellemliggende alder (741-239 Mya), og nogle (17 %) er unge (239 Mya til nutid; Fig. 2c; Additional file 1: Figur S10). Interessant nok tyder en normalisering af antallet af gener efter alder og længde af den evolutionære æra på, at genomsætningen er størst nær nutiden. I alt indeholdt Nemopilema-genomet 123 udvidede og 164 indskrænkede genfamilier sammenlignet med den fælles forfader for Nemopilema og Aurelia (Fig. 2b; se Additional file 1: Afsnit 4.2). Gene Ontology (GO)-termer relateret til sensorisk perception var underrepræsenteret i Cnidaria-linjen sammenlignet med Bilateria, hvilket nøjagtigt afspejler cnidarias mindre komplekse sensoriske system (Additional file 1: Tabeller S14 og S15). Imidlertid var neurotransmittertransport (GO:0006836, P = 6.01E- 10) signifikant beriget i Scyphozoa slægten sammenlignet med den fælles forfader for Scyphozoa og Hydrozoa (Yderligere fil 1: Tabeller S16 og S17), sandsynligvis på grund af balance og visuelle strukturer, såsom statocysten og ocelli, der er mere udførlige i den mobile medusa end i fastsiddende polypper . Sammenlignet med den fælles forfader for Nemopilema og Aurelia viste Nemopilema udvidede genfamilier, der var forbundet med metallopeptidaseaktiviteter (GO:0008237, P = 2,86E- 14; Yderligere fil 1: Tabellerne S18 og S19). Derudover fandt vi 1589 ortologer af genfamilier, der er specifikke for Scyphozoa. Enrichment tests af scyphozoa-specifikke gener viste termerne for natriumiontransport, ionkanalaktivitet og neurotransmitterreceptoraktivitet (Yderligere fil 1: Tabel S20).

Figur. 2
Figur2

Genfamilieforhold mellem cnidarian- og metazoarter. a Venn-diagram over antallet af unikke og delte genfamilier blandt tre cnidarian-klasser (Scyphozoa: Nemopilema nomurai og Aurelia aurita; Hydrozoa: Hydra vulgaris og Clytia hemisphaerica; Anthozoa: Acropora digitifera og Nematostella vectensis;). b. Udvidelser og indskrænkninger af genfamilier i Nemopilema-genomet. Tallene angiver antallet af genfamilier, der er blevet udvidet (rødt, +) og indskrænket (blåt, -) efter opsplitningen fra den fælles forfader. c Andelen af Nemopilema-gener i hver evolutionær æra. De fleste Nemopilema-gener (~ 80 %) er gamle (~ 1877 Mya), nogle få (~ 3 %) er af mellemliggende alder (~ 659 Mya), og en betydelig del (~ 17 %) er relativt unge (~ 147 Mya)

Genomisk kontekst og muskel-associerede gener

Muslinger har to primære muskeltyper: De epitheliomuskulære celler, som er de fremherskende muskelceller, der findes i siddende nældefisk, og de tværstribede muskelceller, der er placeret i meduseklokken, og som er afgørende for svømning. For at forstå evolutionen af aktiv svømning i vandmænd undersøgte vi deres kodonbias sammenlignet med andre metazoer ved at beregne guanin- og cytosinindholdet på den tredje kodonposition (GC3) (Additional file 1: Figur S13). Det er blevet foreslået, at gener med et højt niveau af GC3 er mere tilpasningsdygtige over for eksterne stress (f.eks. miljøændringer) . Blandt de 100 mest scorede GC3-forspændte gener, regulering af muskelkontraktion og neuropeptid-signalveje var GO-termer specifikke for Nemopilema (Yderligere fil 4: Tabel S25 og S26). Calcium spiller en nøglerolle i den tværstribede muskelsammentrækning i vandmænd, og calcium-signalvejen (GO:0004020, P = 5,60E- 10) viste et højt niveau af GC3-forvridninger, der var specifikke for Nemopilema. Nemopilema og Aurelia top 500 GC3-gener var beriget i GO-termer, der var forbundet med homeostase (f.eks, cellulær kemisk homeostase og natriumiontransport), som vi spekulerer på er afgørende for aktivering af muskelsammentrækninger, der driver vandmandens mobile rovdrift (Yderligere fil 1: Afsnit 5.1; Yderligere fil 4: Tabeller S27 og S28).

Da cnidarians er blevet rapporteret til at mangle titin- og troponinkomplekser, som er kritiske komponenter i bilaterale tværstribede muskler, er det blevet foreslået, at de to klasser uafhængigt udviklede tværstribede muskler. En undersøgelse af gener, der koder for muskelstrukturelle og regulerende proteiner i cnidarier, viste et bevaret eumetazoisk kerneaktin-myosin-kontraktile maskineri, der deles med bilaterale dyr (Additional file 1: Table S32). Nemopilema mangler dog ligesom andre nidannere titin- og troponinkomplekser, som er nøglekomponenter i bilaterale tværstribede muskler. Også γ-syntrophin, en komponent i dystroglycan-komplekset, manglede i Nemopilema, Aurelia og Hydra. Nemopilema og Aurelia besidder imidlertid α/β-Dystrobrevin og α/ε-Sarcoglycan dystroglycan-associerede costamereproteiner, hvilket indikerer, at flere komponenter af dystroglycan-komplekset gik tabt efter opsplitningen mellem Scyphozoa og Hydrozoa. Det blev foreslået, at Hydra undergik sekundære forenklinger i forhold til Nematostella, som har en større grad af specialisering af muskelcelletyper . Sammenlignet med Hydra og Nematostella viser Nemopilema og Aurelia en mellemliggende kompleksitet af muskelstrukturelle og regulerende proteiner mellem Hydra og Nematostella.

Medusaklokke og tentakel transkriptomprofilering

Jellyfish medusaklokke og tentakler er morfologisk forskellige og udfører diskrete fysiologiske funktioner . Vi genererede klokke- og tentakeltranskriptomer fra Nemopilema og den mindre Sanderia malayensis, som kan dyrkes i laboratoriet, for at vurdere udviklingsregulering (Yderligere fil 1: Tabel S29). Enrichment tests af højt udtrykte gener viste, at muskel-associerede funktionelle kategorier (f.eks. muskelmyosinkompleks og muskelvævsmorfogenese) blev beriget i klokken (Fig. 3a; Yderligere fil 5: Tabeller S30-S33). Myosiner udgør en superfamilie af motorproteiner og spiller en afgørende rolle i muskelkontraktion og er involveret i en lang række motilitetsprocesser i Eukaryoter. Myosin II-familiens proteiner, der findes i celler i både tværstribet muskelvæv og glat muskelvæv, er ansvarlige for at producere sammentrækning i muskelceller . Cnidarianere har både epitheliomuskulære celler og tværstribede muskelceller. Den tværstribede muskel er en vigtig bestanddel af medusaklokkeens subumbrella, hvor dens hurtige sammentrækninger er drivkraften bag den unikke fremdriftsbaserede svømning hos vandmanden. Vi fandt, at type II Myosin heavy chain (MYH) og Myosin light chain (MYL) genfamilier var stærkt udtrykt i klokken og er tæt forbundet med tværstribede og glatte muskelceller . Interessant nok viste Nemopilema og Aurelia det største antal kopier af MYH- og MYL-gener blandt ikke-bilateriske metazoer (Fig. 3c; Additional file 1: Figures S14-S17; Tables S38-40), og seks af de syv MYH-gener og 12 ud af 21 MYL-gener i Nemopilema viste højere ekspression i klokken end i tentaklerne med henholdsvis meget høj ~ 8,8 og ~ 17-dobbelt stigning i gennemsnit (Fig. 3d). Disse resultater tyder på, at kombinationen af kopiantalsekspansion af type II Myosin-genfamilier og høj ekspression af muskel-associerede gener bekræftede, at musklerne i meduseklokken er en vigtig determinant for vandmandens motilitet.

Fig. 3
Figur3

Genekspressionsmønstre i medusaklokke- og tentakelvæv og ekspansion af myosin tungkædegener i vandmænd. a P-værdivarmekort over berigede GO-kategorier ved hjælp af højt udtrykte gener i medusaklokkevæv. Mere end to gange og fire gange højere ekspression i medusaklokke end i tentakler er vist i hver kolonne. Kun fælles GO-kategorier mellem N. nomurai og S. malayensis er vist. b P-værdivarmekort over berigede GO-kategorier ved hjælp af højt eksprimerede gener i tentakelvæv. c Urodet JTT-modeltræ af myosin tunge kædegener ved hjælp af BLAST-metoden med det bedste resultat. d Ekspressionsmønster af MYH- og MYL-gener i Nemopilema. Gener, der ikke udtrykkes i både tentakler og medusabælte, blev udelukket

Omvendt afslørede genekspressionsanalyser af tentaklerne høje RNA-ekspressionsniveauer af neurotransmitter-associerede funktionelle kategorier (ionkanal-kompleks, postsynapse og neurotransmitterreceptoraktivitet; fig. 3b; Yderligere fil 5: Tabeller S34-S37); i overensstemmelse med anatomien af brandmandens tentakler, som indeholder sansecellerne og et løst plexus af den neuronale subpopulation ved basen af ektodermen .

Kropsmønsteret i brandmænd

Der har været megen debat omkring den tidlige evolution af kropsmønsteret i metazoernes fælles forfader, især vedrørende oprindelsen og udvidelsen af Hox- og Wnt-genfamilier . I alt blev der fundet 83 homeodomæner i Nemopilema, mens 82, 41, 120 og 148 homeodomæner blev fundet fra henholdsvis Aurelia, Hydra, Acropora og Nematostella (Additional file 1: Table S41). Fem af de otte Hox-gener i Nemopilema er af den posteriore type, der er forbundet med udvikling af aboralaksen og klynges sammen med Nematostellas posteriore Hox-gener, HOXE og HOXF (Yderligere fil 1: Figurer S18-S20). Aurelia har seks Hox-gener af den posteriore type, men har ikke HOXB-, C- og D-typen (HOX2 hos mennesker). Selv om de ikke findes i Hydra og Acropora, viser synteseanalyser af ParaHox-generne i Nemopilema, at XLOX/CDX-genet er placeret umiddelbart nedstrøms for GSX i samme tandemorientering som dem i Nematostella, hvilket tyder på, at XLOX/CDX var til stede i den fælles forfader for nilfisk og efterfølgende er gået tabt i nogle slægter (Yderligere fil 1: Figur S21). Hox-relaterede gener, EVX og EMX, er også til stede i Nemopilema og Aurelia, selv om de er fraværende i Hydra. I betragtning af den store ancestrale diversitet i Wnt-generne er det blevet foreslået, at Wnt-signalering kontrollerede udviklingen af kropsplanet i de tidlige metazoer . Nemopilema har 13 Wnt-ortologer, der repræsenterer 10 Wnt-underfamilier (Additional file1: Figur S22; Tabel S42). Wnt9 er fraværende fra alle cnidarier, hvilket sandsynligvis repræsenterer tab i den fælles forfader til cnidarierne. Cnidarianere har gennemgået dynamiske lineage-specifikke Wnt-subfamilieduplikationer, såsom Wnt8 (Nematostella, Acropora og Aurelia), Wnt10 (Hydra) og Wnt11, og Wnt16 (Nemopilema og Aurelia). Det er blevet foreslået, at der fandtes en fælles klynge af Wnt-gener (Wnt1-Wnt6-Wnt10) i den sidste fælles forfader for leddyr og deuterostomer . Vores analyser af cnidarian- og bilaterale genomer afslørede, at Acropora også besidder denne klynge, mens Nemopilema, Aurelia og Hydra mangler Wnt6, hvilket tyder på tab af Wnt6-genet i Medusozoa’s fælles forfader (Additional file 1: Figur S23). Samlet set har vandmænd et sammenligneligt antal Hox- og Wnt-gener som andre nissedyr, men det dynamiske repertoire af disse genfamilier tyder på, at nissedyrene har udviklet sig uafhængigt for at tilpasse deres fysiologiske egenskaber og livscyklus.

Polyp til medusa overgang i vandmænd

Polyp til medusa overgang er fremtrædende i vandmænd sammenlignet med de andre fastsiddende nissedyr. For at forstå det genetiske grundlag for dannelsen af medusastrukturen i vandmænd sammenlignede vi transkriptionel regulering mellem nissedyr og på tværs af vandmandens udviklingsstadier (se Yderligere fil 1: Afsnit 7.1 og 7.2). Vi samlede Sanderia-transskriptionerne ved hjælp af seks sammenlagte prøver af transkriptomer (Yderligere fil 1: Tabel S43). De samlede transkripter havde en samlet længde på 61 Mb og resulterede i 58,290 transkript isoformer og 43,541 unikke transkripter, med en N50 på 2325 bp. I gennemsnit blev 87 % af RNA-læsningerne justeret til de samlede transkriptioner (Yderligere fil 1: Tabel S44), hvilket indikerer, at transkriptsamlingen repræsenterede størstedelen af de sekventerede læsninger. Desuden var sammensætningen af de proteindomæner, der var indeholdt i de 20 øverste rækker, ret ens mellem Nemopilema og Sanderia (Additional file 1: Tabel S45). For at opnå differentielt udtrykte gener for hvert stadium sammenlignede vi hvert stadium med det foregående eller næste stadium i vandmandens livscyklus. Polypstadiet, som repræsenterer et fastsiddende stadium i vandmandens livscyklus, viste berigede termer relateret til ionkanalaktivitet og energimetabolisme (regulering af metabolisk proces og aminosukkermetabolisk proces; Additional file 1: Tabel S46). Aktiv fodring i polyppen stimulerer aseksuel proliferation enten til flere polypper eller metamorfose til strobila . Da anthozoer ikke danner en medusa, er det aseksuelle reproduktionsstadium strobila et vigtigt stadium til at studere metamorfosen fra polyp til medusa. I dette stadium blev GO-termer relateret til amidbiosyntese og metaboliske processer udtrykt i høj grad sammenlignet med polypstadiet (Additional file 1: Tabel S47). Det er blevet rapporteret, at RF-amid- og LW-amid-neuropeptider var forbundet med metamorfose i cnidarier . Vi kunne imidlertid ikke bekræfte dette fund i vores sammenligninger af strobila og ephyra-stadier. I vores system er genekspressionsmønstrene i de to stadier ret ens. I ephyra, det frigivne mobile stadium, blev GO-termer, der involverer biosyntetisk og metabolisk amidproces, også udtrykt i høj grad sammenlignet med det sammensmeltede medusa-stade (Additional file 1: Tabel S48). I medusaen blev ekstracellulær matrix, metallopeptidaseaktivitet og immunsystemprocestermer beriget (Yderligere fil 1: Tabel S49), hvilket er i overensstemmelse med fysiologien i deres klokke-, tentakler- og mundarmvævstyper.

Polyp-til-medusa-metamorfose blev tidligere vist at være stærkt forbundet med CL390- og retinoid X-receptor (RXR)-gener i Aurelia aurita-kvallen . Interessant nok blev CL390 ikke fundet i Nemopilema eller andre offentliggjorte cnidarians, hvilket tyder på, at det kan være et Aurelia-specifikt strobilationsinducerende gen. Vi bekræfter imidlertid, at RXR er til stede i Nemopilema og fraværende hos nidolarier uden medusestadium (Additional file 1: Figur S24). Retinsyresignalering (RA) spiller en central rolle under hvirveldyrs vækst og udvikling , hvor den regulerer transkription ved at interagere med RA-receptoren (RAR) bundet til RA-responselementer (RARE’er) af nærliggende målgener . Af generne i RA-signalvejen besidder Nemopilema ADH- og RALDH-enzymer, der metaboliserer retinol til RA, og RXR og RAREs til at aktivere transkription af målgenet (Fig. 4a). Vi opdagede 1630 Nemopilema RARE-regioner med en gennemsnitlig afstand på 13 Kbp til det nærmeste gen (Fig. 4b; Additional file 1: Tabellerne S50 og S51). Interessant nok var fire posteriore Hox-gener fra Nemopilema og to Hox-gener fra Aurelia placeret inden for ± 10 Kbp fra RARE’er, hvilket er unikt blandt de ikke-bilateriske metazoer (Fig. 4c; Yderligere fil 1: Tabel S52). Tilsammen tyder disse resultater på, at retinsyresignalering var til stede i tidlige metazoer til regulering af målgener med RXR og RAREs, og at RXR og RAREs kan spille en kritisk rolle for polyp-til-medusa-metamorfose .

Figur 4
Figur4

Retinoinsyresignalvej og RAREs i Nemopilema. a Skematisk fremstilling af retinoinsyresignalvejen i mennesker. Blå angiver tilstedeværelsen af genet og/eller elementet i Cnidaria. Rødt angiver kun tilstedeværelse i vandmænd blandt de offentliggjorte cnidarier. b Fordelingen af afstandene mellem RARE’erne og det nærmeste gen. Afstanden blev beregnet ved at identificere dens nærhed til genernes transkriptionsstartsted (TSS). Genantallet blev beregnet for hver ikke-overlappende 1 Kb bin over et område på – 100 Kb til 100 Kb. c RAREs placeret i nærheden af posteriore Hox-gener i Nemopilema

Identifikation af toxin-relaterede domæner i vandmænd

Vandmænd producerer komplekse blandinger af proteinholdige gifte til aktiv bytteindfangning og forsvar . Vi identificerede rigelige toksindomæner i Nemopilema, når vi sammenlignede med de ikke-bilateriske metazoer-gen sæt i Tox-Prot databasen . I alt 67 ud af 136 toksindomæner blev tilpasset til ikke-bilateriske metazoer; af disse 67 toksindomæner blev 52 fundet i Nemopilema (Additional file 1: Table S53). Som forventet indeholder Nemopilema-genomet det største antal gift- eller toksin-associerede domæner blandt de inkluderede ikke-bilateriske metazoer. Disse domæner omfatter zinkmetalloprotease (PF01421) fra Reprolysin (M12B)-familien, fosfolipase A2 (PF05826) og Prokineticin (PF06607)-domæner (Fig. 5). Nemopilema og Aurelia besidder også henholdsvis 8 og 11 ShK-domænelignende (PF01549) domæner, som er de mest hyppige hos disse arter sammenlignet med andre ikke-bilaterianere. Især zinkmetalloproteaser i Reprolysin (M12B)-familien er enzymer, der spalter peptider, og som omfatter de fleste endopeptidaser i slangegift . Endvidere er det blevet rapporteret, at serinproteaseinhibitor- og ShK-domæner blev fundet i rigelige mængder i transkriptomerne fra både kanonkugle- (Stomolophus meleagris) og æskemusling (Chironex fleckeri) , og fosfolipase A2 er et velkarakteriseret toxinrelateret enzym, som er afgørende for produktionen af giftkomponenter, der findes i klassen Scyphozoa .

Figur 5
Figur5

Fylogenetisk analyse af giftrelaterede domæner i ikke-bilateriske metazoer. Fem giftdomæner (PF01421, PF01549, PF06607, PF00068 og PF05826) er repræsenteret i fire cirkulære dendrogrammer. To fosfolipase A2-domæner (PF00068 og PF05826) blev slået sammen til ét cirkulært dendrogram (øverst til højre), og skraveringer på grene og knuder (himmelblå) i fosfolipase A2 angiver PF05826-domænet

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.