Er zijn ongeveer 2000 volledig gesequeneerde mitochondriale genomen beschikbaar uit de NCBI RefSeq data base, samen met handmatig gecureerde annotaties van hun eiwit-coderende genen, rRNAs, en tRNAs. Deze annotatie-informatie, die in twee decennia is verzameld, is verkregen met een uiteenlopende reeks computationele hulpmiddelen en annotatiestrategieën. Ondanks alle inspanningen van handmatige curatie wordt zij nog steeds geplaagd door verkeerde toewijzingen van leesrichtingen, foutieve gennamen, en ontbrekende en fout-positieve annotaties, met name voor de RNA-genen. Alles bij elkaar veroorzaakt dit aanzienlijke problemen voor volledig automatische pijplijnen die tot doel hebben deze gegevens uitgebreid te gebruiken voor studies van dierlijke fylogenetica en de moleculaire evolutie van mitogenomen. De MITOS pijplijn is ontworpen om een consistente de novo annotatie van de mitogenomische sequenties te berekenen. We laten zien dat de resultaten van MITOS overeenkomen met RefSeq en MitoZoa in termen van annotatie dekking en kwaliteit. Tegelijkertijd vermijden we biases, inconsistenties in de nomenclatuur en typefouten die voortkomen uit handmatige curatie strategieën. De MITOS pijplijn is online toegankelijk op http://mitos.bioinf.uni-leipzig.de.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.