时间序列的预处理
目錄
一、特征統計量
1.概率分布
2.特征統計量
二、平穩時間序列的定義?
嚴平穩與寬平穩的關系
三、平穩時間序列的統計性
四、平穩性的重大意義
五、平穩性檢驗
?時序圖檢驗
自相關圖檢驗
R繪圖
一、特征統計量
????????平穩性是某些時間序列具有的一種統計特征要描述清楚這個特征,我們必須借助以下統計工具。
1.概率分布
時間序列概率分布族:
實際應用的局限性
2.特征統計量
- 均值????????
- 方差? ? ? ??
- 自協方差? ? ? ?
- 自相關系數(ρ)? ? ? ?
二、平穩時間序列的定義?
- 嚴平穩:隨機變量族的統計性質完全有它們的聯合概率分布族決定,若任意的t下的聯合概率分布族相等,則認為該序列是嚴平穩的
寬平穩:(使用序列的特征統計量來定義)認為序列的統計性質主要由它的低階矩決定,所以只要保證序列低階矩平穩(二階),就能保證序列的主要性質近似穩定:
滿足如下條件的序列可稱為寬平穩序列?:
嚴平穩與寬平穩的關系
- 一般關系
- 特例
三、平穩時間序列的統計性
1)均值為常數:Ex=μ(μ為常數) 2)自協方差和自相關系數只依賴于時間的平移長度而與時間的起止點無關?自相關系數的4個性質:規范性、對稱性、非負定性和非唯一性
- 非唯一性:一個平穩時間序列一定唯一決定它的自相關函數,一個自相關函數未必唯一對應一個平穩時間序列
四、平穩性的重大意義
- 在平穩序列場合,均值序列變成了只含有一個常量的常數序列。
{ut,t屬于T} ——> {u,t屬于T}
- 原本每個隨機變量的均值(方差,自相關系數)只能依靠唯一的一個樣本觀察值去估計,瞎子你由于平穩性,每個統計量都將擁有大量的樣本觀察值。
- 這極大地減少了隨機變量的個數,并增加了待估變量的樣本容量。極大地簡化了時序分析的難度,同時也提高了對特征統計量的估計精度。
五、平穩性檢驗
- 圖檢驗:
- ?假設檢驗:單位根檢驗
-
?時序圖檢驗
????????根據平穩時間序列均值、方差為常數的性質,平穩序列的時序圖應該顯示出該序列始終再一個常數值附近波動,而且波動的范圍有界、無明顯趨勢及周期特征
????????如果有趨勢或周期,通常是非平穩?
-
自相關圖檢驗
? ? ? ? 平穩序列通常具有短期相關性。該性質用自相關系數來描述就是隨著延遲期數的增加,平穩序列的自相關系數會很快地衰減向零。
? ? ? ? 非平穩序列衰減向零地速度通常比較慢。
R繪圖
在R中,繪制時序圖可用plot()函數,繪制自相關圖可用acf()函數
在后續會詳細介紹相關繪圖的參數,其相關的數據也會在后續上傳。
我們先看一下例2_1,在這里截取部分數據
在這里我們可以看到,數據有標題,且都是每年一個數據
代碼如下:
讀取數據時 要用 /? 或者? \\ ,否則會出錯
a<-read.table("D:/桌面/E2_1.csv") a返回:
然后我們進行時間序列分離變量時會報錯,
如執行代碼:x<-ts(a$sunspots,start=1964)
錯誤如下:
那么該如何解決?
這時就應該回到最初讀取數據時了,如下
a<-read.table("D:/桌面/E2_1.csv",sep=",",header=T) a此時讀取如下:
可以發現,第一列和第二列已經完全分開了,嘿嘿,我們接下來在進行下一步
x<-ts(a$sunspots,start=1964) x在這里,a$是為了選出x所代表的數據,start表示數據的起始時間,原數據的起始時間是1820,在這里我們用的1964,對結果不會有影響,就是所對應的時間會有所改變
結果如下:
接下來,我們進行一下繪圖試試
先畫個時序圖:
plot(x)再畫個自相關圖:
acf(x,lag.max=25)lag.max 也可以用 lag 代替哦
返回結果為:
接下來,我們再舉一個例子2-2
讀取方法跟上面一樣,不再多講了
a<-read.table("D:/桌面/E2_2.csv",sep=",",header=T)返回結果:
仔細看看可知,它們是一年12個月都有的哦
接下來的分離數據就有所不同了,方法如下:
x<-ts(a$co2,start=c(1975,1),frequency=12) xfrequency 代表頻率,這里表示一年有12個月,如果是4個季度就是4
返回結果如下:
繪制時序圖:
plot(x)返回:
繪制自相關圖:
acf(x)返回:
這次,我們介紹到這里,如有問題,歡迎評論區見哦!!
總結
- 上一篇: 【youcans 的 OpenCV 例程
- 下一篇: eda技术试卷_《EDA技术》试题及答案