在R語言中,可以使用以下方法剔除異常值:
data <- c(1, 2, 3, 4, 100) # 假設data為數據向量
mean_value <- mean(data)
sd_value <- sd(data)
threshold <- mean_value + 3 * sd_value
filtered_data <- data[data <= threshold]
data <- c(1, 2, 3, 4, 100) # 假設data為數據向量
q1 <- quantile(data, 0.25)
q3 <- quantile(data, 0.75)
iqr <- q3 - q1
lower_threshold <- q1 - 1.5 * iqr
upper_threshold <- q3 + 1.5 * iqr
filtered_data <- data[data >= lower_threshold & data <= upper_threshold]
data <- c(1, 2, 3, 4, 100) # 假設data為數據向量
q1 <- quantile(data, 0.25)
q3 <- quantile(data, 0.75)
iqr <- q3 - q1
lower_threshold <- q1 - 3 * iqr
upper_threshold <- q3 + 3 * iqr
filtered_data <- data[data >= lower_threshold & data <= upper_threshold]
需要根據具體的數據特點和分析需求選擇合適的方法進行異常值剔除。