python數據離散化指的是什么

發布時間：2021-05-11 09:26:56 來源：億速云閱讀：286 作者：小新欄目：編程語言

這篇文章主要介紹了python數據離散化指的是什么，具有一定借鑒價值，感興趣的朋友可以參考下，希望大家閱讀完這篇文章之后大有收獲，下面讓小編帶著大家一起了解一下。

python有哪些常用庫

python常用的庫：1.requesuts；2.scrapy；3.pillow；4.twisted；5.numpy；6.matplotlib；7.pygama；8.ipyhton等。

1、概念

連續屬性的離散化就是將連續屬性的值域上，將值域劃分為若干個離散的區間，最后用不同的符號或整數值代表落在每個子區間的屬性值。

2、實現數據的離散化

（1）分組

（2）將分組好的結果轉換成one-hot編碼（啞變量）

3、實例

# 1）準備數據
data = pd.Series([165,174,160,180,159,163,192,184], index=['No1:165', 'No2:174','No3:160', 'No4:180', 'No5:159', 'No6:163', 'No7:192', 'No8:184'])
# 2）分組
# 自動分組
sr = pd.qcut(data, 3)
sr.value_counts()  # 看每一組有幾個數據
# 3）轉換成one-hot編碼
pd.get_dummies(sr, prefix="height")
 
# 自定義分組
bins = [150, 165, 180, 195]
sr = pd.cut(data, bins)
# get_dummies
pd.get_dummies(sr, prefix="身高")

感謝你能夠認真閱讀完這篇文章，希望小編分享的“python數據離散化指的是什么”這篇文章對大家有幫助，同時也希望大家多多支持億速云，關注億速云行業資訊頻道，更多相關知識等著你來學習!

向AI問一下細節

亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

python數據離散化指的是什么

python有哪些常用庫

猜你喜歡

亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

python數據離散化指的是什么

python有哪些常用庫

猜你喜歡

最新資訊

相關推薦

相關標簽