pgsql 两个时间字段相减_如何在Excel做专业的时间序列分析
一、工具產生背景
在生產中我們常會根據歷史數據去預測未來的發展趨勢。比如客戶投訴量、用戶留存率、頁面點擊率等等。
對于預測功能的需求多但是具備相應能力的分析師卻很少。想做出一份精準的預測需要具備很多專業的知識和技能。因此有必要做一個分析工具,即簡單易用又能實現良好的預測效果。因此開發了該ARIMA的預測模型以實現在Excel中輕輕松松即可完成一份準確的預測。
ARIMA是常用的時間序列分析模型,且其預測效果得到了廣泛的公認。因此,可以考慮將該模型可視化,提供給用戶。
二、使用工具
點擊SqlCel選項卡下的“時序分析”按鈕,如下:
將彈出以下對話框:
接下來具體介紹功能的使用:
1、選擇數據集
選擇的數據集需滿足以下條件:
1)首行是字段
2)總共兩個字段,第一個字段是日期時間,第二個字段是對應的數值
如下:
在本例中,我們使用經典的airpassengers數據集。
2、周期
周期是以下所有分析的基礎,默認值是12。周期設置不同對結果有較大影響。
周期體現的是一組數據的周期性。它可以通過用戶的個人經驗來設置。也可以通過相關圖來判斷。現在介紹相關圖判別法。我們先設置一個比較大的周期,然后點擊“相關圖”按鈕將產生時間序列的相關圖,觀察自相關圖(Autocorrelation),一般取相關系數超出置信邊界,且系數較大、階數較大的那一階為周期:
此圖中可以比較明顯的觀察出周期為12。
3、平穩性檢驗
平穩性檢驗用于判斷數據的平穩性。點擊“平穩性檢驗”按鈕可以輸出時序圖和DF檢驗表(單位根檢驗)。如下:
通過時序圖可以觀察數據趨勢和以周期為窗口的滾動平均值及滾動標準差。滾動均值可以消除周期性并體現數據的趨勢性,滾動標準差可以體現數據的波動性大小。
DF檢驗以數字的形式判斷數據的平穩性,可以給出更嚴謹的判斷標準。判斷規則如下:
1)如果P值小于0.05,那么我們即可斷定數據是平穩的;
2)如果P值大于0.05,當統計量大于0且小于關鍵值(1%)或統計量小于0且大于關鍵值(1%),可以酌情接受平穩性假設;
3)如果統計量大于關鍵值(1%)則拒絕平穩性假設;
4)P值并不是越小越好,盡量通過少量的平穩性處理步驟滿足P值可選即可。
4、平穩性處理
ARIMA模型只能用來預測平穩性序列,因此平穩性處理至關重要。每次平穩性處理之后都會自動做一次平穩性檢驗。
1)輸出
如果勾選“輸出”復選框則每次處理后的結果都可以即時輸出到當前工作簿。如果取消勾選則僅做數據處理,不輸出數據。默認情況下是勾選的。
2)分解
分解操作可以自動將原數據分解成趨勢性、季節性和殘差三個部分。如下圖所示:
數據分解會忽略其它所有平穩性處理操作僅處理原始數據,并且數據分解之后不可以再做其它平穩性處理。后續的模型擬合和預測僅在分解后的數據上進行。
如果在分解操作前需要做對數變換,則可在Excel里面先用LN函數處理原始數據,最后用EXP函數還原預測結果。
3)差分
差分是對等周期間隔的數據線性求減,它是最常用的平穩性處理方法,是ARIMA模型的重要組成部分。
差分的期數是線性相減的周期間隔,一般應小于3,或設為周期數。差分復選框可多次勾選或取消勾選,每次勾選都會在原數據的基礎上做一次差分處理。
需要注意的是如果需要做對數變換和移動平均操作需在差分前進行。
4)對數變換
對數變換要求所有的數據均大于0。它可以很好的消除數據的波動性(趨勢性和周期性)。是平穩性處理比較理想的選擇。
5)移動平均
移動平均可以很好的消除周期性。但是它會引起預測結果較大的波動,它對近期的預測具有較好的效果。
5、模型擬合
模型擬合的關鍵是設置AR模型的階數p和MA模型的階數q。選擇階數可以通過觀察相關圖判斷或者通過AIC準則或BIC準則自動判斷。
1)相關圖觀察
完成平穩性處理后,我們可以點擊“相關圖”按鈕生成當前數據的相關圖。自相關圖(Autocorrelation)用于確定MA(q),偏自相關圖(Partial Autocorrelation)用于確定AR(p)。一般從自相關系數超出置信邊界的階數中選取階數較小且系數較大的階數作為p和q的值。然后通過檢驗模型擬合優度適當調整p和q的值
2)AIC準則
AIC準則以嚴謹的統計量選擇p和q的值。首先設定最大階數(maxlags),然后點擊“AIC準則”按鈕。將生成AIC準則列表和AIC選擇結果。AIC準則的判斷標準是AIC值越小對應的p和q階數越合理。如下:
其中最大階數(maxlags)設置的越大,判斷的時間越長。
3)BIC準則
BIC準則的選擇方法與AIC準則相似。當兩者在模型選擇上不同時,我們可以參考殘差DW檢驗從而得出更優的一個選擇。
模型擬合
設定p和q后點擊“開始擬合”按鈕將會輸出擬合優度檢驗報告,如下:
AIC和BIC的值越小說明模型擬合得越充分。殘差DW檢驗的值越接近2說明模型擬合越充分。
同時還會輸出殘差QQ圖,如下:
如果QQ圖中的點基本圍繞著直線分布,說明殘差基本符合正態分布,原數據的信息提取得比較完全,模型擬合較充分。
6、時序預測
模型擬合完畢接下來即可使用擬合好的模型進行預測了。設定向前預測的期數,然后點擊“開始預測”。此時輸出預測結果的時序圖,如下:
同時可向當前工作簿輸出預測的結果值。
三、預測原理
根據平穩性處理方法的不同分兩種預測方法。
1)分解
ARIMA模型僅預測分解后的平穩序列(殘差),趨勢性和季節性則是根據分解后的數據分別預測,之后匯總三部分預測結果即為最終的預測結果。
2)其它平穩性處理
ARIMA模型僅預測處理后的平穩序列(殘差),所作的每一步平穩性處理操作都會進行還原,在還原平穩性操作之前會對平穩性處理前的數據做預測,之后匯總殘差預測和每一步還原結果的預測值即為最終的預測結果。
總結
以上是生活随笔為你收集整理的pgsql 两个时间字段相减_如何在Excel做专业的时间序列分析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: tms570 can 接收大量数据_CA
- 下一篇: docker always_介绍两款Do