您好,登錄后才能下訂單哦!
bsseq是如何進行差異甲基化分析,很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。
bsseq
主要用來分析WGBS的數據, 安裝過程如下
source(“http://bioconductor.org/biocLite.R“)
biocLite(“bsseq”)
bsseq
的分析主要包括以下4步:
讀取原始數據
BSmooth
t-test檢驗
DMR
bsseq
要求的原始數據格式如下:
共6列數據,制表符分隔,每一行代表一個甲基化位點,前5列很好理解,描述甲基化位點的染色體位置和類別,默認情況下bbseq
用于分析CpG
類型的甲基化位點。當然其他類型的數據,比如CHG
, CHH
也支持,但是需要調整參數。Cov
代表覆蓋到這個位點的reads數,M
代表其中發生了甲基化的reads數目。
每個樣本一個這樣的原始數據,用來表示該樣本methylation calling
的結果,這樣的數據我們從bismark
的結果中也可以得到。當原始數據準備好之后,首選需要讀取所有樣本的原始數據,然后導入到R中,生成一個bbseq
定義的對象。在bbseq
安裝的路徑下,提供了一個名為get_BS.chr22.R
的腳本,展示了如何從讀取所有樣本原始數據的過程。
代碼如下
這里以mc_imr90_r1_22
和mc_imr90_r2_22
兩個樣本的原始數據為例,詳細展示了讀取過程。我們只需要根據自己的數據,適當修改上述代碼就可以了。主要注意sampleNames
和pData
數據就可以了。
已測試數據BS.chr22
為例,smooth
的過程如下
在實際分析中,由于甲基化位點很多,所以這一步時間特別久,為了提高速度,可以添加mc.cores
參數,這個參數指定了CPU個數,用于并行執行。
BS.chr22.1 <- BSmooth(BS.chr22, mc.cores = 2, verbose = TRUE)
在分析之前,有必要過濾掉覆蓋度較低的甲基化位點。通常保留在所有樣本中覆蓋度大于2的甲基化位點,但是也可以修改這個條件。過濾之后,直接通過BSmooth.tstat
進行分析
下面的代碼基于bsseqData
包中的數據,這個數據包含了6個樣本,分為normal
和cancer
兩組
group1
指定屬于treatment
組的樣本,group2
指定屬于control
組的樣本。
通過dmrFinder
函數進行差異甲基化分析, 代碼如下:
cutoff
指定DMR
的閾值,這個閾值根據t-test
的結果進行調整。subset
對差異甲基化的結果進行篩選,篩選包含甲基化位點個數大于3而且meanDiff
大于0.1的甲基化區域。
看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注億速云行業資訊頻道,感謝您對億速云的支持。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。