亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

motif中PWM矩陣的示例分析

發布時間:2021-12-27 10:41:50 來源:億速云 閱讀:179 作者:小新 欄目:大數據

小編給大家分享一下motif中PWM矩陣的示例分析,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!

通過一致性序列和sequence logo可以直觀的表示某個motif的情況,但是在預測motif結合的位點時,只根據這些信息無法準確的判斷查詢序列上存在對應的motif。 預測輸入序列上是否存在特定motif的位點的分析,稱之為motif scanning, 示意如下

motif中PWM矩陣的示例分析

就是在輸入序列上查找特定motif出現的位置。為了滿足motif scanning分析的要求,對于motif而言,我們必須提供一個有效的能夠代表motif又能夠用于序列查找的一個信息,基于這樣的出發點,提出了PWM矩陣的概念。

PWM矩陣在不同文章中有不同的叫法,以下3種矩陣其實都是PWM矩陣

  1. position weight matrix(PWM)

  2. position-specific weight matirx(PSWM)

  3. position-specific scoring matrix(PSSM)


PWM矩陣是在PFM矩陣的基礎上發展而來,以下圖所示PFM矩陣為例

motif中PWM矩陣的示例分析

根據堿基頻數分布矩陣首先計算出堿基頻率分布矩陣,稱之為position probability matrixa, 簡寫為PPM矩陣,示意如下

motif中PWM矩陣的示例分析

在PPM矩陣中,堿基的頻率被當做概率來使用,不同位置之間可以看做是一個獨立事件。根據PPM矩陣,可以計算某個motif序列的概率。根據上述PPM矩陣,GAGGTAAAC出現的概率為

motif中PWM矩陣的示例分析

在PPM矩陣基礎上,用背景序列的堿基分布頻率來校正對應的值,就可以得到PWM矩陣,公式如下

motif中PWM矩陣的示例分析
就是將PPM矩陣中對應的值除了背景序列中對應堿基的頻率,然后在取log2對數值。大多數情況下,我們認為在基因組上A,T,C,G這4種堿基的含量是相等的,所以每個堿基的背景頻率就是0.25。以PPM矩陣第一行的0.3為例,首先將0.3除以背景序列中A堿基的頻率0.25,然后在取log2對數,最終的取值越為0.26。

通過這種方式就構建出了如下所示的PWM矩陣

motif中PWM矩陣的示例分析

需要注意的是,背景序列中堿基的概率不是都為0.25, 在某些GC含量偏高或者偏低的物種中,4種堿基的分布頻率是不相等的,此時就要根據真實的堿基分布來確定背景序列中的堿基頻率。

根據PWM矩陣,可以對序列進行打分,以最終的得分值來判斷是否為一個潛在的motif。根據上述PWM矩陣,GAGGTAAAC出現的得分值為

motif中PWM矩陣的示例分析

score >= 0, 說明這個序列是一個潛在的功能位點,score < 0, 說明是一個隨機序列。根據PWM矩陣,可以有效的判斷在輸入序列中是否存在真實的motif位點。


看完了這篇文章,相信你對“motif中PWM矩陣的示例分析”有了一定的了解,如果想了解更多相關知識,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

武夷山市| 通渭县| 微博| 海宁市| 巧家县| 电白县| 黄山市| 平泉县| 贡嘎县| 库伦旗| 应城市| 吉隆县| 库车县| 无为县| 安化县| 甘孜县| 商南县| 突泉县| 喀喇| 安岳县| 涞源县| 龙游县| 雷波县| 清水县| 禄丰县| 漯河市| 福建省| 东乌珠穆沁旗| 双牌县| 正阳县| 浙江省| 洞头县| 行唐县| 高陵县| 宁波市| 疏附县| 商城县| 巴楚县| 洛宁县| 隆林| 磐石市|