您好,登錄后才能下訂單哦!
這篇文章將為大家詳細講解有關MUSCLE軟件有什么用,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。
1、軟件介紹
MUSCLE(Multiple Protein Sequence Alignment)是一款蛋白質水平多序列比對的軟件,在速度和精度上都優于 ClustalW。在進行多序列比對的時候,大多數情況下可以優先使用 MUSCLE。有本地版和在線版,在線版網址如下:http://www.ebi.ac.uk/Tools/msa/muscle/。
2、算法原理
算法:MUSCLE 先使用漸進式比對(progressive alignment)獲得初始的多序列比對,再使用橫向
精煉(horizontal refinement)迭代提高多序列比對結果。
1)使用數串(k-mer counting)方法構造序列間的全局比對和局部相似度
2)填充序列間距離的三角矩陣
3)使用 UPGMA 或 NJ 法構建序列發生樹,并確定無根樹的根
4)從葉節點開始向上推測父節點的漸進式比對,最后產生根節點的多序列比對
5)根據得到的多序列比對,計算任兩序列間的相似度
6)計算 Kimura 距離矩陣,構建發生樹
7)比較新生成的樹和原來樹的差異,如果有節點的重排,跳轉到步驟 4
8)從樹上砍斷一個枝,產生兩個子樹,每次砍斷的位置是按和根的距離降序排列的
9)分別計算兩個子樹的多序列比對,并對兩個結果比對得到新的多序列比對
10)如果新的比對結果的 SP 分數(sum of pairs)降低,保留這個新的比對結果,反之
丟棄。反復迭代 8->9->10,直到分值不再降低或達到最大迭代次數。
3、使用命令
MUSCLE 使用起來十分方便,大多數情況下用戶只需要指定輸入輸出文件即可
$ muscle -in file1 -out file2
輸入文件截圖:
>a
ATGAGGTAGAGATAGCCGG
>b
ATGGTTAGCCGG
結果文件截圖:
>a
ATGAGGTAGAGATAGCCGG
>b
ATG———-GTTAGCCGG
運行程序log:
MUSCLE v3.8.31 by Robert C. Edgar
http://www.drive5.com/muscle
This software is donated to the public domain.
Please cite: Edgar, R.C. Nucleic Acids Res 32(5), 1792-97.
1 2 seqs, max length 19, avg length 15
00:00:00 11 MB(-1%) Iter 1 100.00% K-mer dist pass 1
00:00:00 11 MB(-1%) Iter 1 100.00% K-mer dist pass 2
00:00:00 12 MB(-1%) Iter 1 100.00% Align node
00:00:00 12 MB(-1%) Iter 1 100.00% Root alignment
4、生物信息中的利用
目前muscle 主要用來在基因組進化部分,因為構建進化樹和計算選擇壓力,都需要將序列對齊,muscle小而快,毋庸置疑是最好的選擇。
關于“MUSCLE軟件有什么用”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,使各位可以學到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。