您好,登錄后才能下訂單哦!
本篇文章給大家分享的是有關怎么分析ENCODE project,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。
ENCODE是Encyclopedia of DNA Elements的縮寫,是由美國人類基因組研究中心NHGRI
贊助的一項國際化的合作項目,通過整合DNA, RNA,蛋白質,表觀修飾等多個層次的數據,旨在建立一個全面的人類基因組數據研究的數據庫。
如下圖所示,整合了不同組學的數據
隨著不斷發展,后來又陸續整合了modENCODE
等多個項目的數據,對數據庫進一步擴充,增加了小鼠,果蠅,線蟲等數據。該項目的所有數據可以通過以下鏈接進行查詢
https://www.encodeproject.org/
點擊Data->Matrix
按鈕,可以看到如下所示的結果,在左側的篩選框可以根據多種條件進行篩選
篩選完成后,點擊右側矩陣中的數字,可以查看篩選到的數據集。以轉錄因子CTCF
的chip_seq數據為例,結果如下
對于每個數據集,提供了以下結果
給出了數據類型,樣本對應的細胞系和組織類型,測序平臺等基本信息,示意如下
提供了該數據集所用的分析流程的描述文檔,示意如下
包含了測序的原始序列和分析的結果文件,可以下載,示意如下
ENCODE不僅僅是一個公共數據庫,除了提供數據檢索和查詢服務,還提供了不同組學數據分析的標準pipeline和各種質控標準以供參考。
利用ENCODE,我們可以開展基于公共數據庫的數據挖掘,也可以參考其pipeline進行數據分析。
以上就是怎么分析ENCODE project,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。