Über 2000 vollständig sequenzierte mitochondriale Genome sind in der RefSeq-Datenbank des NCBI zusammen mit manuell kuratierten Annotationen ihrer proteinkodierenden Gene, rRNAs und tRNAs verfügbar. Diese Annotationsinformationen, die sich über zwei Jahrzehnte angesammelt haben, wurden mit einer Vielzahl von Computerwerkzeugen und Annotationsstrategien erstellt. Trotz aller Bemühungen um eine manuelle Kuratierung sind sie immer noch durch falsche Zuordnungen von Leserichtungen, fehlerhafte Gennamen und fehlende sowie falsch-positive Annotationen, insbesondere bei den RNA-Genen, belastet. Zusammengenommen verursacht dies erhebliche Probleme für vollautomatische Pipelines, die diese Daten umfassend für Studien zur Tierphylogenetik und zur molekularen Evolution von Mitogenomen nutzen wollen. Die MITOS-Pipeline wurde entwickelt, um eine konsistente de novo-Annotation der Mitogenomsequenzen zu berechnen. Wir zeigen, dass die Ergebnisse von MITOS in Bezug auf die Annotationsabdeckung und -qualität mit RefSeq und MitoZoa übereinstimmen. Gleichzeitig vermeiden wir Verzerrungen, Inkonsistenzen in der Nomenklatur und Tippfehler, die durch manuelle Kuratierungsstrategien entstehen. Die MITOS-Pipeline ist online zugänglich unter http://mitos.bioinf.uni-leipzig.de.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.