Přibližně 2000 kompletně sekvenovaných mitochondriálních genomů je k dispozici v databázi NCBI RefSeq spolu s ručně sestavenými anotacemi jejich protein-kódujících genů, rRNA a tRNA. Tyto anotační informace, které se nashromáždily za dvě desetiletí, byly získány pomocí různorodých výpočetních nástrojů a anotačních strategií. Přes veškerou snahu o ruční kurátorství ji stále trápí chybné přiřazení směrů čtení, chybné názvy genů a chybějící i falešně pozitivní anotace zejména u genů RNA. To dohromady způsobuje značné problémy pro plně automatické pipeline, jejichž cílem je komplexní využití těchto dat pro studium fylogenetiky živočichů a molekulární evoluce mitogenomů. Pipeline MITOS je navržena tak, aby vypočítala konzistentní de novo anotaci mitogenomových sekvencí. Ukazujeme, že výsledky MITOS odpovídají RefSeq a MitoZoa, pokud jde o pokrytí a kvalitu anotace. Zároveň se vyhýbáme zkreslením, nekonzistentnosti nomenklatury a překlepům pocházejícím z ručních kurátorských strategií. Soubor MITOS je přístupný online na adrese http://mitos.bioinf.uni-leipzig.de.

.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.