您好,登錄后才能下訂單哦!
這篇文章主要講解了“如何使用R語言中的corrplot來繪制相關系數矩陣熱圖”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“如何使用R語言中的corrplot來繪制相關系數矩陣熱圖”吧!
R語言也是目前常用的數據分析編程語言之一,目前經過使用者、科學家們的開發,其功能也比較強大。本文就使用R語言中的corrplot來繪制相關系數矩陣熱圖進行介紹。
下面以波士頓Boston的房價數據為例,這個數據是數據挖掘、機器學習中常用的數據,可以到UCI的機器學習數據庫去下載:archive.ics.uci.edu/ml/
數據集有506個觀測樣本,14個變量:
首先,將數據導入R軟件中:
> mydata<-read.table('E:/Boston-house-prices.csv',head=T,sep=',',stringsAsFactors = FALSE )
> summary(mydata)
然后計算相關系數,并下載相關系數矩陣corrplot包:
> res <- cor(mydata)
> install.packages("corrplot") #下載相關系數矩陣corrplot包
> corrplot(res, method = "shade",shade.col = NA, tl.col ="black", tl.srt = 45, order = "AOE") # 繪制相關系數矩陣圖
得到圖形:
相關系數圖中顏色越深表示,兩個變量間的相關系數越接近1.圖中可以看到,Boston的中位數房價(MEDV)一列中,與LSTAT、PTRATIO、RM等變量間的相關關系最大。
下面著重說說corrplot這個函數:
在corrplot(res, method = "shade",shade.col = NA, tl.col ="black", tl.srt = 45, order = "AOE") 這條命令中,
res:代表需要可視化的相關系數矩陣;
method = "shade"代表指定可視化的方法,可以是圓形、方形、橢圓形、數值、陰影、顏色或餅圖形,method = c("circle", "square", "ellipse", "number", "shade", "color", "pie");
shade.col = NA:指定圖形展示的顏色,默認以均勻的顏色展示;
tl.col:指定文本標簽的顏色,即圖形的文字標簽是什么顏色的,默認為黑色;
tl.srt = 45,表示文字標簽的大小;
order = "AOE":指定相關系數排序的方法,可以是原始順序(original)、特征向量角序(AOE)、第一主成分順序(FPC)、層次聚類順序(hclust)和字母順序,一般”AOE”排序結果都比”FPC”要好,order = c("original", "AOE", "FPC", "hclust", "alphabet")。
根據corrplot函數不同的屬性,可以變換屬性,繪制不同的相關系數矩陣熱圖:
感謝各位的閱讀,以上就是“如何使用R語言中的corrplot來繪制相關系數矩陣熱圖”的內容了,經過本文的學習后,相信大家對如何使用R語言中的corrplot來繪制相關系數矩陣熱圖這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。