在Scikit-learn中,可以使用特征選擇技術通過sklearn.feature_selection
模塊中提供的方法來選擇最重要的特征。下面是一個簡單的例子來展示如何使用特征選擇:
from sklearn.datasets import load_iris
from sklearn.feature_selection import SelectKBest
from sklearn.feature_selection import chi2
# 加載數據集
iris = load_iris()
X, y = iris.data, iris.target
# 使用卡方檢驗選擇最重要的特征
k_best = SelectKBest(score_func=chi2, k=2)
X_new = k_best.fit_transform(X, y)
# 打印選擇的特征
print(X_new.shape)
在上面的例子中,我們使用了SelectKBest
類來選擇最重要的2個特征,其中我們使用了卡方檢驗(chi2)作為評分函數。最后打印出選擇的特征的形狀。 此外,Scikit-learn還提供了其他的特征選擇方法,如SelectFromModel
和RFE
等,具體可以查看官方文檔以了解更多信息。