《统计学》学习笔记之时间序列分析和预测
鄙人學習筆記
文章目錄
- 時間序列分析和預測
- 時間序列及其分解
- 時間序列的描述性分析
- 時間序列預測的程序
- 確定時間序列成分
- 選擇預測方法
- 預測方法的評估
- 平穩序列的預測
- 簡單平均法
- 移動平均法
- 指數平滑法
- 趨勢型序列的預測
- 線性趨勢預測
- 非線性趨勢預測
- 復合型序列的分解預測
- 確定并分離季節成分
- 建立預測模型并進行預測
- 計算出最后的預測值
時間序列分析和預測
時間序列及其分解
時間序列是同一現象在不同時間上的相繼觀察值排列而成的序列。
- 平穩及非平穩
時間序列可以分為平穩序列和非平穩序列兩大類。
平穩序列是基本上不存在趨勢的序列。這類序列中的各觀察值基本上在某個固定的水平上波動,雖然在不同的時間段波動的程度不同,但并不存在某種規律,其波動可以看成是隨機的。
非平穩序列是包含趨勢、季節性或周期性的序列,它可能只含有其中一種成分,也可能是幾種成分的組合。
趨勢是時間序列在長時期內呈現出來的某種持續上升或持續下降的變動,也稱長期趨勢。時間序列中的趨勢可以是線性的,也可以是非線性的。
季節性也稱季節變動,它是時間序列在一年內重復出現的周期性波動。
當然,季節性中的“季節”一詞是廣義的,它不僅僅是指一年中的四季,其實是指任何一種周期性的變化。
周期性也稱循環波動。是時間序列中呈現出來的圍繞長期趨勢的一種波浪形或振蕩式變動。
它不同于趨勢變動,不是朝著單一方向的持續運動,而是漲落相間的交替波動。
它也不同于季節變動,季節變動有比較固定的規律,且變動周期大多為一年,循環波動則無固定規律,變動周期多在一年以上,且周期長短不一。
時間序列中除去趨勢、周期性和季節性之后的偶然性波動,稱為隨機性,也稱不規則波動。
- 乘法模型和加法模型
時間序列的成分可以分為4種,即趨勢T、季節性或季節變動S、周期性或循環波動C、隨機性或不規則波動I
傳統時間序列分析的一項主要內容就是把這些成分從時間序列中分離出來,并將它們之間的關系用一定的數學關系式予以表達,而后分別進行分析。按4種成分對一時間序列的影響方式不同,時間序列可分解為多種模型,如加法模型、乘法模型。
加法模型:
Yi=Ti+Si+Ci+IiY_i=T_i + S_i + C_i + I_i Yi?=Ti?+Si?+Ci?+Ii?
乘法模型:
Yi=Ti?Si?Ci?IiY_i=T_i * S_i * C_i * I_i Yi?=Ti??Si??Ci??Ii?
時間序列的描述性分析
- 增長率
增長率也稱增長速度,它是時間序列中報告期觀察值與基期觀察值之比減1后的結果,用%表示。由于對比的基期不同,增長率可以分為環比增長率和定基增長率。
環比增長率是報告期觀察值與前一時期觀察值之比減1,說明現象逐期增長變化的程度;
定基增長率是報告期觀察值與某一固定時期觀察值之比減1,說明現象在整個觀察期內總的增長變化程度。
設增長率為G,則環比增長率和定基增長率可表示為:
- 平均增長率
平均增長率也稱平均增長速度,它是時間序列中逐期環比值(也稱環比發展速度)的幾何平均數減1后的結果,計算公式為:
- 增長率分析中應注意的問題
①當時間序列中的觀察值出現0或負數時,不易計算增長率。
②在有些情況下。不能單純就增長率論增長率。要注意將增長率與絕對水平結合起來分析。
增長1%的絕對值表示增長率每增長一個百分點而增加的絕對數量,其計算公式為:
時間序列預測的程序
時間序列分析的一個主要目的就是根據已有的歷史數據對未來進行預測。時間序列含有不同的成分,如趨勢、季節性、周期性和隨機性等。對于一個具體的時間序列,它可能只含有一種成分,也可能同時含有幾種成分。含有不同成分的時間序列所用的預測方法是不同的。
因此,在對時間序列進行預測時,通常包括以下幾個步驟:
確定時間序列成分
- 確定趨勢成分
確定趨勢成分是否存在。
①可以從繪制時間序列的線圖入手,從圖中可以判斷時間序列中是否存在趨勢,以及所存在的趨勢是線性的還是非線性的。
②判斷趨勢成分是否存在的另一種方法是利用回歸分析擬合一條趨勢線,然后對回歸系數進行顯著性檢驗。如果回歸系數顯著,就可以得出線性趨勢顯著的結論。
- 確定季節成分
確定季節成分可以從繪制時間序列的線圖入手,但這里需要一種特殊的時間序列圖,即年度折疊時間序列圖。繪制該圖時,需要將每年的數據分開畫在圖上,也就是橫軸只有一年的長度,每年的數據分別對應縱軸。
舉個例子
數據:
年度折疊時間序列圖:
如果時間序列只存在季節成分,年度折疊時間序列圖中的折線將會有交叉;如果時間序列既含有季節成分又含有趨勢,那么年度折疊時間序列圖中的折線將不會有交叉,而且如果趨勢是上升的,后面年度的折線將會高于前面年度的折線,如果趨勢是下降的,則后面年度的折線將低于前面年度的折線。
選擇預測方法
預測方法的評估
評價的方法就是找出預測值與實際值的差距。這個差值就是預測誤差。最優的預測方法也就是預測誤差達到最小的方法。
預測誤差的計算方法有幾種,包括平均誤差、平均絕對誤差、均方誤差、平均百分比誤差和平均絕對百分比誤差等。
- 平均誤差
設時間序列的第i個觀測值為Yi,預測值為Fi,則平均誤差可以用ME表示,計算公式為:
式中,n為預測值的個數。
由于預測誤差的數值可能有正有負,求和的結果就會相互抵消,在這種情況下,平均誤差可能會低估誤差。
- 平均絕對誤差
平均絕對誤差用MAD表示,其計算公式為:
平均絕對誤差可以避免誤差相互抵消的問題,因而可以準確反映實際預測誤差的大小。
- 均方誤差
均方誤差用MSE表示,其計算公式為:
ME,MAD和MSE的大小受時間序列數據的水平和計量單位的影響,有時并不能真正反映預測模型的好壞,它們只有在比較不同模型對同一數據的預測時才有意義。
- 平均百分比誤差和平均絕對百分比誤差
平均百分比誤差(MPE)和平均絕對百分比誤差(MAPE)則消除了時間序列數據的水平和計量單位的影響,是反映誤差大小的相對值。
平均百分比誤差的計算公式為:
平均絕對百分比誤差的計算公式為:
平穩序列的預測
平穩時間序列通常只含有隨機成分,其預測方法主要有簡單平均法、移動平均法和指數平滑法等,這些方法主要是通過對時間序列進行平滑以消除其隨機波動,因而也稱為平滑法。
平滑法既可用于對平穩時間序列進行短期預測,也可用于對時間序列進行平滑以描述序列的趨勢(包括線性趨勢和非線性趨勢)。
簡單平均法
簡單平均法適合對較為平穩的時間序列進行預測.即當時間序列沒有趨勢時,用該方法比較好。但如果時間序列有趨勢或季節成分,該方法的預測則不夠準確。此外,簡單平均法將遠期的數值和近期的數值看作對未來同等重要。但從預測角度看,近期的數值比遠期的數值對未來有更大的作用,因此簡單平均法預測的結果不夠準確。
移動平均法
移動平均法只使用最近k期的數據,在每次計算移動平均值時,移動的間隔都為k。該方法也適合對較為平穩的時間序列進行預測。應用時,關鍵是確定合理的移動間隔k。對于同一個時間序列,采用不同的移動間隔,預測的準確性是不同的。可通過試驗的辦法,選擇一個使均方誤差達到最小的移動間隔。
指數平滑法
指數平滑法是通過對過去的觀察值加權平均進行預測的一種方法,該方法使t+1期的預測值等于t期的實際觀察值與t期的預測值的加權平均值。指數平滑法是加權平均的一種特殊形式,觀察值時間越遠,其權數也跟著呈現指數下降,因而稱為指數平滑。
一次指數平滑法也稱單一指數平滑法,它只有一個平滑系數.而且觀察值離預測時期越久遠,權數變得越小。
一次指數平滑是將一段時期的預測值與觀察值的線性組合作為t+1期的預測值,其預測模型為:
式中,Yt,為t期的實際觀察值,Ft為t期預測值,a為平滑系數(0<a<1)
使用指數平滑法時,關鍵的問題是確定一個合適的平滑系數α,因為不同的α會對預測結果產生不同的影響。例如.當α=0時,預測值僅僅是重復上一期的預測結果;當α=1時,預測值就是上一期實際值。α越接近1,模型對時間序列變化的反應就越及時,因為它給當前的實際值賦予了比預測值更大的權數。同樣,α越接近0.意味著給當前的預測值賦予了更大的權數,因此模型對時間序列變化的反應就越慢。
一般而言,當時間序列有較大的隨機波動時,宜選較大的α,以便能很快跟上近期的變化;當時間序列比較平穩時,宜選較小的α。
在選擇α\alphaα時,還應考慮預測誤差,確定α\alphaα時,可以選擇幾個值進行預測,然后選擇使預測誤差最小的值。
趨勢型序列的預測
時間序列的趨勢可以分為線性趨勢和非線性趨勢兩大類.
線性趨勢預測
線性趨勢是指現象隨著時間的推移而呈現出穩定增長或下降的線性變化規律。
根據最小二乘法得到的求解b0和b1的公式如下:
非線性趨勢預測
序列中的趨勢通常可以認為是由于某種固定的因素作用同一方向所形成的。若這些因素隨著時間的推移按線性變化,則可以對時間序列擬合趨勢直線;若呈現出某種非線性趨勢,則需要擬合適當的趨勢曲線。
幾種常用的趨勢曲線:
①指數曲線
采取線性化手段將其化為對數直線形式,即兩端取對數得:
然后根據最小二乘法原理,按直線形式的常數確定方法。得到求解lgb0和lgb1的標準方程如下:
②修正指數曲線
修正指數曲線初期增長迅速,隨后增長率逐漸降低,最終以K為增長極限。
一般形式:
Yt^=K+b0b1t\hat{Y_t}=K+b_0 b_1^t Yt?^?=K+b0?b1t?
K,b0,b1K,b_0, b_1K,b0?,b1?為待定系數,K>0,b0=?0,0<b1≠1K>0, b_0 \not= 0, 0< b_1 \neq 1K>0,b0??=0,0<b1??=1
③Gompertz曲線
Gompertz曲線初期增長緩慢,之后逐漸加快,當達到一定程度后,增長率又逐漸下降,最后接近一條水平線。
一般形式:
Yt^=Kb0b1t\hat{Y_t} = Kb_0^{b_1^t} Yt?^?=Kb0b1t??
K,b0,b1K,b_0, b_1K,b0?,b1?為待定系數,K>0,0<b0=?0,0<b1=?1K>0,0 < b_0 \not= 0, 0< b_1 \not= 1K>0,0<b0??=0,0<b1??=1
將等式兩邊取對數:
lgYt^=lgK+(lgb0)b1tlg \hat{Y_t} = lgK + (lgb_0)b_1^t lgYt?^?=lgK+(lgb0?)b1t?
等式取對數后,是不是看起來和修正指數曲線的形式很像。
④多階曲線
復合型序列的分解預測
復合型序列是指含有趨勢、季節、周期和隨機成分的序列。對這類序列的預測方法通常是將時間序列的各個因素依次分解出來,然后進行預測。
分解法預測通常按下面的步驟進行:
確定并分離季節成分
- 計算季節指數
季節指數刻畫了序列在一個年度內各月或各季度的典型季節特征。在乘法模型中,季節指數是以其平均數等于100%為條件而構成的,它反映了某
一月份或季度的數值占全年平均數值的大小。
- 平均趨勢剔除法
第1步:計算移動平均值(如果是季度數據,則采用4項移動平均,月份數據則采用12項移動平均),并對其結果進行中心化處理,也就是將移動平均的結果再進行一次二項移動平均,即得出中心化移動平均值(CMA)。
第2步:計算移動平均的比值,也稱為季節比率,即將序列的各觀察值除以相應的中心化移動平均值,然后計算出各比值的季度(或月份)平均值。
第3步:季節指數調整。由于各季節指數的平均數應等于1,若根據第2步計算的季節比率的平均值不等于1,則需要進行調整。具體方法是:將第2步算的每個季節比率的平均值除以它們的總平均值。
將季節成分從時間序列中分離出去,即用每一個觀測值除以相應的季節指數,以消除季節性。季節因素分離后的序列,反映了沒有季節因素影響下時間序列的變化形態。
建立預測模型并進行預測
對消除季節成分的序列建立適當的預測模型,并根據這一模型進行預測。
計算出最后的預測值
用預測值乘以相應的季節指數,得到最終的預測值。
總結
以上是生活随笔為你收集整理的《统计学》学习笔记之时间序列分析和预测的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 通信设备的“保命秘籍”,请看联合接地
- 下一篇: 《计量经济学》学习笔记之放宽基本假定的模