您好,登錄后才能下訂單哦!
這篇文章給大家介紹IBS在遺傳分析中的運用是怎樣的,內容非常詳細,感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。
遺傳學中,在描述等位基因的同源關系時,會有IBD和IBS兩個概念。
IBD 全稱 Identity By Descent, 又叫做血緣同源,指的是兩個個體中共有的等位基因來源于共同祖先;IBS全稱Identity By Descent, 又叫做狀態同源,指的是兩個個體中共有的等位基因序列相同。
在家系數據中,由于有父代的分型數據, IBD運用的很多,在自然群體中,則通常使用IBS。本篇文章主要介紹IBS在數據分析中的運用。
IBS 本身只是個定性的概念,為了定量, 提出了IBS state的概念。對于一個SNP位點而言,IBS state 的值為兩個個體中相同的allel個數。對于二倍體生物而言,IBS 取值包括0,1,2 三種,示意圖如下
基于SNP分型結果, 我們可以計算樣本間的IBS距離。IBS距離的計算公式如下
距離可以衡量樣本間的相似性,根據IBS distance距離矩陣,可以對樣本進行MDS分析。
以下截圖來自一篇文獻,在該文獻中,基于樣本間的IBS距離矩陣,通過MDS分析,對樣本組成進行了探究。文獻鏈接如下
https://www.ncbi.nlm.nih.gov/pubmed/21347369
通過MDS 分析對樣本構成可以有一個清楚的認識,也可以用于剔除明顯偏離群體的樣本。
在實際的數據分析中,可以借助plink
軟件來計算IBS距離矩陣,用法如下
plink --file hapmap1 --cluster --matrix --noweb
默認情況下會生成plink.mibs
文件,是一個距離矩陣,可以用R語言讀取,然后進行MDS分析。
R語言中MDS分析的代碼如下
m <- as.matrix(read.table("plink.mibs")) mds <- cmdscale(as.dist(1-m)) k <- c( rep("green",45) , rep("blue",44) ) plot(mds,pch=20,col=k) legend("topleft", legend = c("CHB", "JPB"), pch = 20, col = c("green", "blue"))
最終會生成如下的圖片
不同的群體用不同顏色表示,可以看到, 所有樣本分成了兩大類。
享。
關于IBS在遺傳分析中的運用是怎樣的就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。