Circa 2000 genomi mitocondriali completamente sequenziati sono disponibili dalla banca dati NCBI RefSeq insieme alle annotazioni curate manualmente dei loro geni codificanti proteine, rRNAs, e tRNAs. Queste informazioni di annotazione, che si sono accumulate nel corso di due decenni, sono state ottenute con una serie diversa di strumenti computazionali e strategie di annotazione. Nonostante tutti gli sforzi di curatela manuale, sono ancora afflitte da assegnazioni errate di direzioni di lettura, nomi di geni errati e annotazioni mancanti o falsamente positive, in particolare per i geni dell’RNA. Nell’insieme, questo causa problemi sostanziali per le pipeline completamente automatiche che mirano a utilizzare questi dati in modo completo per gli studi di filogenetica animale e l’evoluzione molecolare dei mitogenomi. La pipeline MITOS è progettata per calcolare un’annotazione de novo coerente delle sequenze mitogenomiche. Mostriamo che i risultati di MITOS corrispondono a RefSeq e MitoZoa in termini di copertura e qualità delle annotazioni. Allo stesso tempo evitiamo distorsioni, incoerenze di nomenclatura e errori di battitura derivanti da strategie di curatela manuale. La pipeline MITOS è accessibile online a http://mitos.bioinf.uni-leipzig.de.

.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.