亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么使用SICER進行peak calling

發布時間:2021-11-10 10:17:03 來源:億速云 閱讀:159 作者:柒染 欄目:大數據

怎么使用SICER進行peak calling,針對這個問題,這篇文章詳細介紹了相對應的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。

chip_seq數據中peak的長度范圍跨度較大,既有覆蓋幾個核小體的幾百bp的peak, 也有包含多個基因長度在上千kb的peak。比如H3K4me2和H3K4me3這兩種組蛋白修飾中peak在幾百bp左右, 而H3K27me3中則為長度在幾十到幾百kb之間。組蛋白修飾中peak長度跨度大,弱信號分散都特點,使得基于轉錄因子TF結合位點的peak calling軟件在分析這類數據時準確度較差。

SICER是一款專門針對組蛋白修飾的chip數據進行peak calling的軟件,核心思想也是基于滑動窗口和局部泊松分布的方式來識別富集區域,下圖所示為該軟件用默認參數識別到的H3K27me3的peak區域

怎么使用SICER進行peak calling

黑色區域為ENCODE分析得到的peak區域,紅色區域為SICER分析得到的peak區域。該軟件官網如下

https://home.gwu.edu/~wpeng/Software.htm

為例方便使用,有人對該軟件進行了分裝,使用起來更加方便,源代碼托管在github上,網址如下

https://github.com/dariober/SICERpy

基本用法如下

python SICERpy \
-c input.bam \
-w 200 \
-g 3 \
-t ip.bam \
> peak.bed

-w參數表示滑動窗口的大小,默認值為200。數值越小, 識別到的peak區間長度相對越短且越分散;數值越大,會造成過渡擬合,識別到的peak區間過長,丟失掉真實的信息,示意如下

怎么使用SICER進行peak calling

對于轉錄因子,官方推薦滑動窗口設置為50-100bp, 對于組蛋白修飾,推薦設置為200bp。

-g參數代表gap的大小,默認值為3。和windows size類似,該參數也直接影響peak區間的定義,示意如下

怎么使用SICER進行peak calling

對于轉錄因子,官方推薦該數值和滑動窗口數值保持相同;對于組蛋白修飾,推薦值為3。

輸出文件為bed格式,共8列,每列含義如下

  1. chrom

  2. start

  3. end

  4. chip read count

  5. input read count

  6. pvalue

  7. fold_enrichment

  8. fdr


可以最后一列的fdr值,來篩選得到高可信度的peak信息,用法如下

awk '$8 < 0.01' peaks.bed > peaks.01.bed


關于怎么使用SICER進行peak calling問題的解答就分享到這里了,希望以上內容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關注億速云行業資訊頻道了解更多相關知識。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

门源| 龙井市| 保定市| 克什克腾旗| 民县| 大城县| 玛曲县| 泸溪县| 上蔡县| 恭城| 洛阳市| 额敏县| 莱州市| 阿瓦提县| 抚州市| 拉萨市| 包头市| 新野县| 水城县| 新源县| 云和县| 射阳县| 怀远县| 嵊州市| 湘乡市| 曲松县| 台山市| 万年县| 报价| 大足县| 鄢陵县| 扶余县| 宝应县| 工布江达县| 罗平县| 南京市| 沁水县| 岳阳县| 达日县| 屯留县| 鲁山县|