亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

sklearn中怎么實現數據縮放功能

發布時間:2021-08-09 13:54:38 來源:億速云 閱讀:149 作者:Leah 欄目:大數據

今天就跟大家聊聊有關sklearn中怎么實現數據縮放功能,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結了以下內容,希望大家根據這篇文章可以有所收獲。

一、數據縮放

你的預處理數據集中可能包含各種各樣、不同比例的特征字段,比如美元、千克、價格,有的特征列數值范圍在100以內,有的卻達到幾百萬,差異很大。

很多機器學習模型不希望有這樣大的差異,如果數據集各個屬性之間的數值差異越小,則模型表現的會越好。這里不一概而論,具體原因小伙伴們自行探索下。

 

方法1:數據歸一化

數據歸一化是指將原始數據縮放到0和1之間。

對于依賴于值的大小的模型,這種對輸入屬性的縮放很管用。比如在K近鄰模型的距離測量和回歸系數的準備。

接下來用都知道的鳶尾花數據集演示數據歸一化:

# 對鳶尾花數據集進行數據歸一化處理.
from sklearn.datasets import load_iris
from sklearn import preprocessing
# 加載數據
iris = load_iris()
print(iris.data.shape)
# 分離原始數據集,分為自變量和因變量
X = iris.data
y = iris.target
# 歸一化處理
normalized_X = preprocessing.normalize(X)

方法2:數據標準化

數據標準化是指:將數據縮放,改變每個屬性的分布,使其平均值為0,標準差為1。

諸如高斯過程等依賴于特征分布的模型,對特征進行標準化是非常有用的。

依然用鳶尾花的例子:

# 對鳶尾花數據集進行數據標準化處理.
from sklearn.datasets import load_iris
from sklearn import preprocessing
# 加載數據
iris = load_iris()
print(iris.data.shape)
# 分離原始數據集,分為自變量和因變量
X = iris.data
y = iris.target
# 標準化處理
standardized_X = preprocessing.scale(X)

看完上述內容,你們對sklearn中怎么實現數據縮放功能有進一步的了解嗎?如果還想了解更多知識或者相關內容,請關注億速云行業資訊頻道,感謝大家的支持。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

疏附县| 伊金霍洛旗| 钟山县| 潼南县| 金沙县| 金乡县| 阿鲁科尔沁旗| 布尔津县| 石河子市| 改则县| 扎囊县| 黔西县| 应城市| 佛山市| 津市市| 桓仁| 望江县| 尉犁县| 澄江县| 德庆县| 闽清县| 泾源县| 祁门县| 大埔县| 灵武市| 岳普湖县| 陈巴尔虎旗| 横峰县| 城固县| 永昌县| 教育| 文水县| 琼中| 扶风县| 会宁县| 宜兰县| 蓝田县| 利川市| 安阳县| 曲沃县| 瓮安县|