NumPy(Numerical Python)是一個用于科學計算的Python庫,它提供了高效的多維數組對象和用于處理這些數組的工具。NumPy可以用于進行各種統計分析,包括描述統計、假設檢驗、相關分析等。
以下是使用NumPy進行統計分析的一些常見操作:
import numpy as np
data = np.array([1, 2, 3, 4, 5])
# 平均值
mean = np.mean(data)
# 中位數
median = np.median(data)
# 方差
variance = np.var(data)
# 標準差
std_dev = np.std(data)
# 最小值
min_value = np.min(data)
# 最大值
max_value = np.max(data)
# 單樣本t檢驗
t_statistic, p_value = np.ttest_1samp(data, population_mean)
# 獨立樣本t檢驗
t_statistic, p_value = np.ttest_ind(data1, data2)
# 配對樣本t檢驗
t_statistic, p_value = np.ttest_rel(data1, data2)
# 計算相關系數
correlation_coefficient = np.corrcoef(data1, data2)
# 計算皮爾遜相關系數
pearson_correlation = np.corrcoef(data1, data2)[0, 1]
# 計算斯皮爾曼相關系數
spearman_correlation = np.corrcoef(data1, data2)[0, 1]
以上僅是NumPy進行統計分析的一部分操作,NumPy還提供了更多的函數和方法用于處理數組和進行各種統計計算。