时间序列的截尾和拖尾_R语言:时间序列(一)
01 解決什么問題
在社會活動中經??梢姲凑諘r間順序記錄下來的隨機事件觀察值,例如每年死亡人數序列,每年糖尿病發病人數序列,醫院門診每日診治病例數序列。這類數據的特性是相鄰時間點的觀察值之間具有明顯的相關性,這一特性不同于獨立隨機觀察資料,因而不能用通常以獨立隨機觀察為假定條件的統計方法分析,而要采用時間序列分析方法分析。
先來看一個時間序列的例子。收集了某市2007年1月1日至2009年12月31日的大氣中顆粒物PM的每日測定值。從圖可見,該市空氣中顆粒物PM10含量的日平均值變化特點是:年初和年末的平均濃度較高,夏秋季的平均濃度較低。
02 時間序列資料的影響因素
一個時間序列資料通??梢苑纸鉃榇_定性部分和隨機部分。確定性部分又可進一步分解為趨勢部分、循環或周期部分以及季節變動部分。
將上圖的時間序列資料分解,形成如下圖,可看到:
第一 趨勢部分:反應長期的變化趨勢,如上升或下降或平穩。下圖的看來,雖然有起伏,但總的趨勢是平穩的。
第二 循環或周期部分:表現為圍繞總體趨勢水平出現有節奏的周期變動,如經濟發展中出現時快時慢的周期變化。
第三 季節變動,指在一個日歷年份內因季節氣候變化的影響發生的變動,每年都重復,一般受氣候或人們生活方式影響的結果,下圖三中表現的每年都呈現一個U型曲線,是一種明顯的季節變動。當然,有的時間序列呈現周期波動,如門診量由于受工作日影響而重復出現星期內波動。
第四 不規則變動,它是除確定性部分之外的隨機波動。如下圖四。
03 幾種時間序列
社會生活中時間序列一般包含上述幾個組分,如果只有不規則變動組成,不包含其他三種成分,那么就是上圖1序列,稱為平穩序列,數據圍繞一個值上下波動,由于不規則變化,則無法預測下個時間是往上還是往下。如果包含一個向上的長期趨勢,如圖2,則為一個趨勢序列。如果在平穩時間序列上加一個季節性變化,則如圖3所示,稱之為季節型序列。季節和趨勢組合就是圖四的形式,有一個向上的趨勢,同時還有周期性變化。一般情況下不規則變化都是存在的。
04 幾個重要的概念
1.自相關函數
在時間序列中,其前期狀態對后續狀態往往有影響,這種影響越大,相關性就越強,這種相關性就叫自相關。它有兩個指標:自相關函數和偏自相關函數,它倆的作用是啥呢?自相關函數用acf表示,它可以檢驗時間序列在時間點t與滯后h期的時間點t-h的觀察值之間是否存在顯著自相關性。通過acf()函數計算自相關函數圖:
該圖的橫坐標Lag表示滯后期數h,縱坐標ACF給出每一滯后期h的自相關函數值。兩條平行的橫虛線分別代表95%可信區間的臨界水平,凡是超過虛線的豎線條都具有統計學意義,原假設是自相關函數等于0,如果落在兩虛線之間,則表示無統計學意義。
從圖可以看出,滯后0階(h=0)恒等于1,這是PM10的自身相關性。將它的每一滯后期的自相關函數值打印出來可看到,前20期豎線都在虛線上面,函數值緩慢降低,各期都有統計學意義和自相關性,屬于拖尾狀態。
2.偏相關性函數
偏自相關函數又稱PACF,它不同于自相關函數,它消除了其他觀察值的影響后yt和y(t+h)單純的相關關系。通過pacf()函數可計算得到:可看到滯后一期的相關函數值為0.72,具有高度統計學意義,之后下降很快,后面偏自相關函數在顯著水平波動,處截尾狀態。
3.時間序列的平穩性
實際工作中,只要滿足①均值E(Yt)=u是與時間無關的常數;②方差是與時間無關的常數,Var(Yt)=γ。③協方差是只與時間間隔k有關,而與時間t無關的常數,Cov(Yt,Yt+k)=γ(0,k)就可以認為是平穩性序列。
4.平穩性檢驗
由于對時間序列資料分析的一個重要假設條件就是平穩性,因此很有必要先判斷是否符合平穩性。
①直接觀察ACF圖,平穩的序列的自相關圖和偏相關圖不是拖尾就是截尾。截尾就是在某階之后系數都為0,看上面偏相關的圖,當階數為1的時候,系數值還是很大是0.72 二階長的時候突然就變成了 0.050. 后面的值都很小,認為是趨于0,這種狀況就是截尾。再就是拖尾,拖尾就是有一個衰減的趨勢,但是不都為 0,看上面自相關圖.如果自相關圖既不是拖尾也不是截尾,這里我們用文章開頭的案例,計算滯后400階的自相關圖,如下圖。下圖的自相關是一個三角對稱的形式,這種趨勢是單調趨勢的典型圖形。這個案例是一個具有季節變動的不平穩時間序列。
①常用一個是tseries包中adf.test()函數做單位根檢驗,p>0.05表示是不能拒絕原假設,不平穩時間序列。檢驗文章開頭的案例,P>0.05,不能拒絕原假設,表明該序列為非平穩時間序列。
5.非平穩性怎么辦呢?
對于非平穩序列,如有具有某種趨勢,則可以采用差分的方法消除這種趨勢,從而達到平穩性。也可以采用對數的方式消除這種趨勢,也可以聯合數學變換和差分的方法消除,后面會詳細介紹差分。
6.幾種基本的平穩時間序列模型
1.自回歸模型(AR)
通常用AR(p)表示p階自回歸模型,用時間序列的一系列過去值和當前值建立自回歸的關系。
2.移動平均模型(MA)
一個q階的移動平均模型用MA(q)表示當前觀察值是當前以及向后過去q階白噪聲的線性組合。
3.自回歸移動平均(ARMA)
實際工作中大部分都是AR和MA的組合,這種模型表示為ARMA(p,q),前面介紹的acf和pacf可以幫助我們識別模型及其階數。
05 總結
本文作為時間序列的第一章,主要介紹時間序列中常用基本概念和術語,以方便對后面的建模深入理解。之后會針對不同的時間序列資料,討論使用的不同的模型。
06 更多閱讀
文章在公粽號:易學統計
文章里的干貨更多喲
歡迎交流,歡迎提問
總結
以上是生活随笔為你收集整理的时间序列的截尾和拖尾_R语言:时间序列(一)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 室内主题元素分析图_2020届室内设计专
- 下一篇: 中统计字符串长度的函数_SQL Serv