在R語言中,可以使用機器學習包如caret、e1071、randomForest等來應用機器學習算法進行數據挖掘。下面是一個簡單的示例,演示如何使用caret包中的機器學習算法進行數據挖掘:
# 導入數據集
data(iris)
# 加載caret包
library(caret)
# 將數據集劃分為訓練集和測試集
set.seed(123)
trainIndex <- createDataPartition(iris$Species, p = .8,
list = FALSE,
times = 1)
train <- iris[ trainIndex,]
test <- iris[-trainIndex,]
# 使用svm算法進行分類
model <- train(Species ~ ., data = train, method = "svmLinear")
# 在測試集上進行預測
predictions <- predict(model, test)
# 計算準確率
confusionMatrix(predictions, test$Species)
上述代碼中,首先加載iris數據集,然后使用createDataPartition函數將數據集劃分為訓練集和測試集。接著使用train函數訓練svm算法,然后對測試集進行預測,最后計算準確率。這只是一個簡單的示例,實際應用中可以根據具體的數據集和問題選擇合適的機器學習算法進行數據挖掘。