MUSCLE
MUltiple Sequence Comparison by Log-Expectation (MUSCLE) è un software per computer per l'allineamento di sequenze multiple di proteine e nucleotidi ed è di dominio pubblico. Il metodo è stato pubblicato da Robert C. Edgar in due articoli nel 2004. Nel primo articolo, pubblicato su Nucleic Acids Research, l'autore introduce l'algoritmo di allineamento di sequenze[1] mentre il secondo, pubblicato su BMC Bioinformatics, presenta maggiori dettagli tecnici.[2]
MUltiple Sequence Comparison by Log-Expectation software | |
---|---|
Genere | Bioinformatica |
Sviluppatore | Robert C. Edgar |
Sistema operativo | |
Linguaggio | C++ |
Licenza | public-domain software |
Lingua | inglese |
Sito web | www.drive5.com/muscle |
Algoritmo
modificaL'algoritmo MUSCLE consta di tre fasi: draft progressive (progressivo abbozzato), improved progressive (progressivo migliorato) e refinement (perfezionamento). Nella prima fase, l'algoritmo produce una bozza di allineamento multiplo, prediligendo la velocità rispetto alla precisione. Nella fase successiva, la distanza Kimura viene utilizzata per ottenere un allineamento più accurato, perfezionato poi ulteriormente durante l'ultima fase. Gli allineamenti multipli sono disponibili alla fine di ogni fase. Nelle prime due fasi dell'algoritmo, la complessità temporale è O(N²L + NL²), la complessità spaziale è O(N² + NL + L²). La fase di refinement aggiunge alla complessità temporale un altro termine, O(N³L).[1] MUSCLE è spesso usato come sostituto di Clustal, poiché di solito (ma non sempre) fornisce allineamenti di sequenze migliori, a seconda delle opzioni scelte. Inoltre, MUSCLE è significativamente più veloce di Clustal, soprattutto per allineamenti più ampi.[2]
Integrazione
modificaMUSCLE è incluso nei software DNASTAR's Lasergene, Geneious e MacVector ed è disponibile su Sequencher, MEGA, e UGENE come un plug-in. MUSCLE è anche disponibile come servizio web tramite l'European Molecular Biology Laboratory (EMBL) - European Bioinformatics Institute (EBI).[3] A settembre 2016, i due articoli che descrivono MUSCLE sono stati citati in totale più di 19.000 volte.[4]
Note
modifica- ^ a b Edgar RC, MUSCLE: multiple sequence alignment with high accuracy and high throughput, in Nucleic Acids Research, vol. 32, n. 5, 2004, pp. 1792-97, DOI:10.1093/nar/gkh340, PMID 15034147.
- ^ a b Edgar RC, MUSCLE: a multiple sequence alignment method with reduced time and space complexity, in BMC Bioinformatics, vol. 5, n. 1, 2004, p. 113, DOI:10.1186/1471-2105-5-113, PMID 15318951.
- ^ (EN) Multiple Sequence Alignment, su ebi.ac.uk. URL consultato il 24 settembre 2020.
- ^ (EN) Robert C. Edgar, su scholar.google.com. URL consultato il 24 settembre 2020.
Voci correlate
modificaCollegamenti esterni
modifica- Sito ufficiale, su drive5.com.
- Repository sorgenti di MUSCLE, su drive5.com.
- MUSCLE Web Server (EMBL-EBI)