亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何對比vcf文件

發布時間:2022-01-17 11:14:35 來源:億速云 閱讀:264 作者:小新 欄目:大數據

這篇文章將為大家詳細講解有關如何對比vcf文件,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。

如果我們要比較的兩個vcf文件的參考基因組版本不一致,就需要使用CrossMap等軟件進行參考基因組版本轉換,然后里使用  SnpSift 軟件的 Concordance 命令比較它們。其中CrossMap軟件依賴pyBigWig,使用conda進行安裝,代碼如下:

conda create -n py3 python=3.6
conda activate py3
conda install -c bioconda pyBigWig
pip3 install CrossMap
 

進行參考基因組版本轉換的命令如下:

# 需要自行下載 hg19ToHg38.over.chain.gz  文件,以及參考基因組 Homo_sapiens_assembly38.fasta 
python ~/miniconda3/envs/py3/bin/CrossMap.py \
vcf ~/data/liftover/hg19ToHg38.over.chain.gz test.snp.hg19.vcf \
~/data/Homo_sapiens_assembly38.fasta test.snp.hg38.vcf
 

可以把snp和indel的vcf文件都轉換一下,然后拿到的轉換好的文件如下:

1.3M Jul  8 05:16 test.indel.hg38.vcf
 23K Jul  8 05:16 test.indel.hg38.vcf.unmap
1003K Jun 19 11:10 test.indel.vcf
 13M Jul  8 05:18 test.snp.hg38.vcf
245K Jul  8 05:18 test.snp.hg38.vcf.unmap
 13M Jun 19 18:29 test.snp.vcf
 

可以看到轉換的成功率是非常高的!unmap的文件很小,因為確實參考基因組有變化,總有一下基因組片段被修改了。

但是,有意思的是,之前我們的vcf文件是嚴格按照基因組坐標排好序的,但是轉換過后,出現了部分坐標亂序情況,如下:

這個很容易理解,因為同一個物種的不同版本參考基因組肯定是有

chr1    119955031       .       G       A
chr1    148483282       rs7513869       C       T
chr1    144995248       rs6600697       A       G
chr1    144995236       rs6600696       A       C
chr1    144995050       rs1884147       C       T
chr1    144995033       rs1884146       A       G
 

也就是說,人類的參考基因組在由hg19進化到hg38的時候,不僅僅是片段的自然擴充,還包括一些以前組裝順序弄錯了的片段的糾正。

這樣坐標亂序的vcf文件,在很多下游分析都是不友好的,所以可以使用下面的代碼進行簡單過濾

input=test.snps.VQSR.vcf
cat $input | java -jar ~/biosoft/snpEff/SnpSift.jar  filter "( DP > 20 & FILTER = 'PASS' )" | \
perl -alne '{print unless $F[0]  =~  /_/}' | \
awk '$1 ~ /^#/ {print $0;next} {print $0 | "sort -k1,1 -k2,2n"}' | \
grep -v '1/2' >  test.filter.sort.vcf
# 檢查不同染色體分布情況: 
cat new.filter.sort.vcf |grep -v '^#' |cut -f 1 |sort |uniq

# 接下來就可以對干凈的VCF文件進行注釋啦 
java -jar ~/biosoft/snpEff/snpEff.jar GRCh48.86 \
test.filter.sort.vcf  > test.filter.sort.eff.vcf
     

關于“如何對比vcf文件”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,使各位可以學到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

vcf
AI

齐河县| 普兰县| 乌鲁木齐县| 南阳市| 凤台县| 周宁县| 沧州市| 富锦市| 三原县| 赣州市| 九龙城区| 电白县| 宿迁市| 安康市| 东宁县| 林州市| 丰原市| 阿巴嘎旗| 双峰县| 体育| 丰镇市| 安阳县| 仙桃市| 德江县| 小金县| 青川县| 南澳县| 武汉市| 舒兰市| 琼中| 内江市| 和平县| 绥芬河市| 交口县| 股票| 张家界市| 杭州市| 同仁县| 正蓝旗| 东莞市| 岑巩县|