要實現隨機森林算法,你可以使用scikit-learn庫中的RandomForestClassifier類。下面是一個示例代碼:
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_iris
# 加載數據集
iris = load_iris()
X = iris.data
y = iris.target
# 劃分訓練集和測試集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 創建隨機森林分類器
rf = RandomForestClassifier(n_estimators=100, random_state=42)
# 在訓練集上訓練模型
rf.fit(X_train, y_train)
# 在測試集上進行預測
y_pred = rf.predict(X_test)
# 輸出預測結果
print("預測結果:", y_pred)
# 輸出準確率
accuracy = sum(y_pred == y_test) / len(y_test)
print("準確率:", accuracy)
在上面的代碼中,我們首先加載了一個經典的鳶尾花數據集。然后使用train_test_split
函數將數據集劃分為訓練集和測試集。接下來,我們使用RandomForestClassifier
類創建一個隨機森林分類器,并設置參數n_estimators
為100,表示森林中樹的數量。然后使用訓練集對模型進行訓練,最后使用測試集進行預測,并計算準確率。