Około 2000 całkowicie zsekwencjonowanych genomów mitochondrialnych jest dostępnych w bazie danych NCBI RefSeq wraz z ręcznie opracowanymi adnotacjami ich genów kodujących białka, rRNA i tRNA. Informacje te, gromadzone przez ponad dwie dekady, zostały uzyskane przy użyciu różnorodnych narzędzi obliczeniowych i strategii anotacji. Pomimo wszelkich wysiłków ręcznej kurateli, nadal jest ona nękana błędami w przypisywaniu kierunków odczytu, błędnych nazw genów, brakujących i fałszywie pozytywnych anotacji, szczególnie dla genów RNA. W sumie powoduje to poważne problemy dla w pełni automatycznych potoków, które mają na celu wszechstronne wykorzystanie tych danych w badaniach filogenetyki zwierząt i molekularnej ewolucji mitogenomów. Potok MITOS został zaprojektowany tak, by obliczyć spójną anotację de novo sekwencji mitogenomicznych. Pokazujemy, że wyniki MITOS dorównują RefSeq i MitoZoa pod względem pokrycia i jakości anotacji. Jednocześnie unikamy błędów, niespójności nomenklatury i literówek pochodzących z ręcznych strategii kuratorskich. Potok MITOS jest dostępny online pod adresem http://mitos.bioinf.uni-leipzig.de.

.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.