您好,登錄后才能下訂單哦!
這篇文章主要介紹使用python的statsmodels模塊擬合ARIMA模型,文中介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們一定要看完!
導入必要包和模塊
from scipy import statsimport pandas as pdimport matplotlib.pyplot as pltimport statsmodels.api as smfrom statsmodels.tsa.arima.model import ARIMAfrom statsmodels.graphics.tsaplots import plot_predict plt.rcParams['font.sans-serif']=['simhei']#用于正常顯示中文標簽plt.rcParams['axes.unicode_minus']=False#用于正常顯示負號
1.讀取數據并畫圖
data=pd.read_csv('數據/客運量.csv',index_col=0)data.index = pd.Index(sm.tsa.datetools.dates_from_range('1949', '2008'))#將時間列改為專門時間格式,方便后期操作data.plot(figsize=(12,8),marker='o',color='black',ylabel='客運量')#畫圖
#本文所使用的客流量時間序列數據:https://download.csdn.net/download/weixin_45590329/14143811
#時間序列折線圖如下所示,顯然數據有遞增趨勢,初步判斷數據不平穩
2.平穩性檢驗
sm.tsa.adfuller(data,regression='c')sm.tsa.adfuller(data,regression='nc')sm.tsa.adfuller(data,regression='ct')
進行三種形式的ADF單位根檢驗,如部分結果所示,發現序列不平穩
3.對數據作一階差分處理
diff=data.diff(1)diff.dropna(inplace=True)diff.plot(figsize=(12,8),marker='o',color='black')#畫圖
作出數據一階差分后折線圖,初步判斷平穩
4.對一階差分數據進行平穩性檢驗
sm.tsa.adfuller(diff,regression='c')sm.tsa.adfuller(diff,regression='nc')sm.tsa.adfuller(diff,regression='ct')
如圖所示,說明序列平穩
5.確定ARIMA(p,d,q)階數
fig = plt.figure(figsize=(12,8))ax1 = fig.add_subplot(211)fig = sm.graphics.tsa.plot_acf(diff.values.squeeze(), lags=12, ax=ax1)#自相關系數圖1階截尾,決定MA(1)ax2 = fig.add_subplot(212)fig = sm.graphics.tsa.plot_pacf(diff, lags=12, ax=ax2)#偏相關系數圖1階截尾,決定AR(1)
根據自相關系數圖ACF和偏自相關系數圖PACF,將原始數據確定為ARIMA(1,1,1)模型
6.參數估計
model = ARIMA(data, order=(1, 1, 1)).fit()#擬合模型model.summary()#統計信息匯總#系數檢驗params=model.params#系數tvalues=model.tvalues#系數t值bse=model.bse#系數標準誤pvalues=model.pvalues#系數p值#繪制殘差序列折線圖resid=model.resid#殘差序列fig = plt.figure(figsize=(12,8))ax = fig.add_subplot(111)ax = model.resid.plot(ax=ax)#計算模型擬合值fit=model.predict(exog=data[['TLHYL']])
7.模型檢驗
#8.1.檢驗序列自相關sm.stats.durbin_watson(model.resid.values)#DW檢驗:靠近2——正常;靠近0——正自相關;靠近4——負自相關#8.2.AIC和BIC準則model.aic#模型的AIC值model.bic#模型的BIC值#8.3.殘差序列正態性檢驗stats.normaltest(resid)#檢驗序列殘差是否為正態分布#最終檢驗結果顯示無法拒絕原假設,說明殘差序列為正態分布,模型擬合良好#8.4.繪制殘差序列自相關圖和偏自相關圖fig = plt.figure(figsize=(12,8))ax1 = fig.add_subplot(211)fig = sm.graphics.tsa.plot_acf(resid.values.squeeze(), lags=12, ax=ax1)ax2 = fig.add_subplot(212)fig = sm.graphics.tsa.plot_pacf(resid, lags=12, ax=ax2)#如果兩圖都零階截尾,這說明模型擬合良好
8.預測
#預測至2016年的數據。由于ARIMA模型有兩個參數,至少需要包含兩個初始數據,因此從2006年開始預測predict = model.predict('2006', '2016', dynamic=True)print(predict)#畫預測圖及置信區間圖fig, ax = plt.subplots(figsize=(10,8))fig = plot_predict(model, start='2002', end='2006', ax=ax)legend = ax.legend(loc='upper left')
以上是“使用python的statsmodels模塊擬合ARIMA模型”這篇文章的所有內容,感謝各位的閱讀!希望分享的內容對大家有幫助,更多相關知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。