您好,登錄后才能下訂單哦!
本篇內容介紹了“怎么用R語言進行KM生存”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
R是數據分析常用的軟件之一,通過各種功能強大的R包,可以簡單方便的實現各種分析。在R語言中,能夠進行生存分析的R包很多,survival和survminer是其中最基本的兩個,survival負責分析,survimner負責可視化,二者相結合,可以輕松實現生存分析。具體過程如下
對于每個個體而言,其生存數據會出現兩種情況,第一種是觀測到生存時間,通常用1表示,第二種則是刪失。通常用0表示。survival自帶了一個測試數據lung
, 內容如下所示
每一行代表一個樣本,time
表示生存時間,status
表示刪失情況,這里只有1和2兩種取值,默認排序后的第一個level對應的值為刪失,這里則為1表示刪失。其他列為樣本對應的性別,年齡等基本信息。
這里根據性別這個二分類變量,采用KM算法來估計生存曲線,代碼如下
從fit
中提取結果構成了d
這個數據框,可以看到已經包含了每個時間點的生存概率,刪失等信息,通過這些信息,完全可以自己寫代碼來畫圖。為了方便,我們直接采用survminer
中的函數來進行可視化。
最基本的可視化方式如下
library("survminer")
ggsurvplot(fit)
效果圖如下所示
兩條不同顏色的折線代表不用性別的生存曲線。對于兩組生存數據,通常都需要比較二者之間是否具有差異,最常用的算法是log-rank test。survminer在可視化結果時,也支持進行差異檢驗,并將對應的p值標記在圖上,代碼如下
ggsurvplot(fit, pval = TRUE)
效果圖如下
上圖中的p值小于0.05,說明不同性別的生存曲線存在顯著差異。除了這些基本功能外,該函數還有多個參數,可以靈活的展示結果,比如添加置信區間,代碼如下
ggsurvplot(fit, pval = TRUE, conf.int = TRUE)
效果圖如下
也支持標記生存時間的中位數,代碼如下
ggsurvplot(fit, pval = TRUE, conf.int = TRUE, surv.median.line = "hv")
效果圖如下
該函數還有非常多的參數,可以非常個性化的調整可視化結果,更加詳細的參數用法請參考官方的幫助文檔。
“怎么用R語言進行KM生存”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。