Aproximativ 2000 de genomuri mitocondriale complet secvențiate sunt disponibile în baza de date NCBI RefSeq, împreună cu adnotări manuale ale genelor lor codificatoare de proteine, ARNr și ARNt. Aceste informații de adnotare, care s-au acumulat de-a lungul a două decenii, au fost obținute cu un set divers de instrumente de calcul și strategii de adnotare. În ciuda tuturor eforturilor de conservare manuală, acestea sunt încă afectate de atribuiri greșite ale direcțiilor de citire, nume de gene eronate, precum și de adnotări lipsă și fals pozitive, în special pentru genele ARN. Împreună, acest lucru cauzează probleme substanțiale pentru liniile de lucru complet automate care urmăresc să utilizeze aceste date în mod cuprinzător pentru studii de filogenetică animală și evoluția moleculară a mitogenomurilor. Conducta MITOS este concepută pentru a calcula o adnotare de novo coerentă a secvențelor mitogenomice. Demonstrăm că rezultatele MITOS se potrivesc cu RefSeq și MitoZoa în ceea ce privește acoperirea și calitatea adnotării. În același timp, evităm prejudecățile, inconsecvențele de nomenclatură și greșelile de scriere care provin din strategiile de curatoriat manual. Gazoductul MITOS este accesibil online la adresa http://mitos.bioinf.uni-leipzig.de.

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.