Sobre 2000 genomas mitocondriais completamente sequenciados estão disponíveis na base de dados NCBI RefSeq juntamente com anotações curadas manualmente dos seus genes codificadores de proteínas, rRNAs, e tRNAs. Esta informação de anotação, que se acumulou durante duas décadas, foi obtida com um conjunto diversificado de ferramentas computacionais e estratégias de anotação. Apesar de todos os esforços de cura manual, ela ainda é atormentada por erros de leitura, nomes errôneos de genes e anotações faltantes e falso positivas, em particular para os genes RNA. Em conjunto, isto causa problemas substanciais para pipelines totalmente automáticos que visam utilizar estes dados de forma abrangente para estudos de filogenética animal e a evolução molecular das mitogenomas. O pipeline MITOS foi concebido para calcular uma anotação consistente de novo das sequências mitogenómicas. Mostramos que os resultados do MITOS correspondem ao RefSeq e ao MitoZoa em termos de cobertura e qualidade da anotação. Ao mesmo tempo, evitamos vieses, inconsistências de nomenclatura e erros de digitação originados por estratégias de cura manual. O pipeline MITOS está acessível online em http://mitos.bioinf.uni-leipzig.de.

Deixe uma resposta

O seu endereço de email não será publicado.