Alrededor de 2000 genomas mitocondriales completamente secuenciados están disponibles en la base de datos RefSeq del NCBI junto con anotaciones curadas manualmente de sus genes codificadores de proteínas, rRNAs y tRNAs. Esta información de anotación, que se ha acumulado a lo largo de dos décadas, se ha obtenido con un conjunto diverso de herramientas computacionales y estrategias de anotación. A pesar de todos los esfuerzos de curación manual, sigue estando plagada de asignaciones erróneas de direcciones de lectura, nombres de genes erróneos y anotaciones faltantes y falsos positivos, en particular para los genes de ARN. En conjunto, esto causa problemas sustanciales para las líneas de trabajo totalmente automáticas que pretenden utilizar estos datos de forma exhaustiva para los estudios de filogenética animal y la evolución molecular de los mitogenomas. El proceso MITOS está diseñado para calcular una anotación de novo consistente de las secuencias mitogenómicas. Demostramos que los resultados de MITOS coinciden con RefSeq y MitoZoa en términos de cobertura y calidad de la anotación. Al mismo tiempo, evitamos los sesgos, las inconsistencias de nomenclatura y los errores tipográficos originados por las estrategias de curación manual. La línea de producción de MITOS está disponible en línea en http://mitos.bioinf.uni-leipzig.de.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.