【量化笔记】时间序列
時間序列指由有時間先后順序組成的一組時間變量。分析時間序列的前提假設是,時間序列具有自相關性, 通過這種自相關性,從而通過過去推測未來,如果某個時間序列沒有自相關性,那么根據過去推測未來就毫無意義。
自協方差
隨機變量 X t X_t Xt?,在時間點 k , k ? l k,k-l k,k?l,取之分別為 X k , X k ? l X_k,X_{k-l} Xk?,Xk?l?, l l l階自協方差的表達式:
γ l = E [ ( X k ? μ k ) ( X k ? l ? μ k ? l ) ] = C o v ( X k , X k ? l ) , l = 0 , 1 , 2... \gamma_l = \mathbb E[(X_k-\mu_k)(X_{k-l}-\mu_{k-l})]=Cov(X_k,X_{k-l}), l=0,1,2... γl?=E[(Xk??μk?)(Xk?l??μk?l?)]=Cov(Xk?,Xk?l?),l=0,1,2...
自相關系數
ρ l = C o v ( X k , X k ? l ) V a r ( X k ) = γ l γ 0 \rho_l = \frac{Cov(X_k,X_{k-l})}{Var(X_k)}=\frac{\gamma_l}{\gamma_0} ρl?=Var(Xk?)Cov(Xk?,Xk?l?)?=γ0?γl??
偏自相關系數
在計算昨天對今天的影響的時候,其實前天對昨天的影響也間接影響了今天,大前天對前天和昨天的影響也間接影響了今天。以此類推,計算t和t-1期的相關性時,不單純是昨天的影響,也包含了之前所有各期的信息對今天的間接影響。所以為了衡量過去單期(一天)對今天的影響,我們引入偏相關性的概念,用于剔除更早之前的信息對現在的影響。
ρ l l = C o r r ( X k , X k ? l ∣ X k ? 1 , X k ? 2 , . . . , X k ? l + 1 ) \rho_ll = Corr(X_k,X_{k-l}|X_{k-1},X_{k-2},...,X_{k-l+1}) ρl?l=Corr(Xk?,Xk?l?∣Xk?1?,Xk?2?,...,Xk?l+1?)
平穩性
如果時間序列的基本特性保持不變,我們就稱該時間序列是平穩的。
強平穩
設 { X t } \{X_t\} {Xt?}為一時間序列,對于任意正整數n,任取 t 1 , t 2 , . . . , t n ∈ T t_1,t_2,...,t_n \in T t1?,t2?,...,tn?∈T, 對任意 τ \tau τ 有:
F X ( x t 1 , x t 2 , . . . x t n ) = F X ( x t 1 + τ , x t 2 + τ , . . . x t n + τ ) F_X(x_{t_1},x_{t_2},...x_{t_n})=F_X(x_{t_{1+\tau}},x_{t_{2+\tau}},...x_{t_{n+\tau}}) FX?(xt1??,xt2??,...xtn??)=FX?(xt1+τ??,xt2+τ??,...xtn+τ??)
即時間序列中任何時段的聯合分布都是相同的,則稱這個時間序列是請平穩的。這個條件過于苛刻,實際中很難應用。
弱平穩
假設 { X t } \{X_t\} {Xt?}是一個時間序列,如果 { X t } \{X_t\} {Xt?}滿足如下三個條件:
(1) 任取 t ∈ T t \in T t∈T,有 E ( X t ) = μ \mathbb E(X_t)=\mu E(Xt?)=μ,即序列的均值為常數
(2) 任取 t ∈ T t \in T t∈T,有 E ( X t 2 ) < ∞ \mathbb E(X_t^2) <\infin E(Xt2?)<∞
(3) 任取 t ∈ T t \in T t∈T,對任意整數h,任意階數l,有 γ l ( t ) = γ l ( t + h ) \gamma_l(t)=\gamma_l(t+h) γl?(t)=γl?(t+h),即t時點的自協方差與t+h時點的自協方差相等。也就是說,l階自協方差不隨t值改變。
一般說樹間序列平穩,都是指弱平穩性。
單位根檢驗
如果一個序列是非平穩的,經過d次差分,可以將其轉換成平穩序列,則稱此序列為 I ( d ) I(d) I(d),其中I指整合(Integrated),d為整合階數。比如:
x t = x t ? 1 + ? t x_t=x_{t-1}+\epsilon_t xt?=xt?1?+?t?
其中 x 0 = 0 , ? t ~ N ( 0 , σ ? 2 ) x_0=0, \epsilon_t \sim N(0,\sigma_\epsilon^2) x0?=0,?t?~N(0,σ?2?)
可以根據計算得到:
E ( x t ) = E ( x t ? 1 ) = . . . = E ( x 1 ) = E ( x 0 + ? 1 ) = 0 \mathbb E(x_t)=\mathbb E(x_{t-1})=...=\mathbb E(x_1)=\mathbb E(x_0+\epsilon_1)=0 E(xt?)=E(xt?1?)=...=E(x1?)=E(x0?+?1?)=0
V a r ( x t ) = V a r ( x t ? 1 ) + σ ? 2 = . . . = t σ ? 2 Var(x_t)=Var(x_{t-1})+\sigma_\epsilon^2=...=t\sigma_\epsilon^2 Var(xt?)=Var(xt?1?)+σ?2?=...=tσ?2?
因為 x t x_t xt?的方差會隨和時間t發生改變,因此該時間序列是非平穩。不過 x t x_t xt?經過一階差分后 Δ x t = x t ? x t ? 1 = ? t \Delta x_t=x_t-x_{t-1}=\epsilon_t Δxt?=xt??xt?1?=?t?,因此 x t x_t xt?為非平穩的I(1)序列。
一個時間序列是否平穩可以借助之后蒜子多項式方差的根來判斷。滯后算子L,比如對時間序列{x_t}運用滯后算子可得 L x t = x t ? 1 , L 2 x t = x t ? 2 , . . . Lx_t=x_{t-1}, L^2x_t=x_{t-2},... Lxt?=xt?1?,L2xt?=xt?2?,...
將一個序列 y t y_t yt?一般化的表示為
y t = γ + ρ 1 y t ? 1 + ρ 2 y t ? 2 + . . . + ρ p y t ? p + ? t y_t = \gamma + \rho_1y_{t-1}+ \rho_2y_{t-2}+ ... + \rho_p y_{t-p}+\epsilon_t yt?=γ+ρ1?yt?1?+ρ2?yt?2?+...+ρp?yt?p?+?t?
? t ~ I I D ( 0 , σ ? 2 ) \epsilon_t \sim IID(0,\sigma_\epsilon ^2) ?t?~IID(0,σ?2?)
借助滯后算子,將上面的模型改寫成:
y t = γ + ρ 1 L y t + ρ 2 L 2 y t + . . . + ρ p L p y t + ? t y_t = \gamma +\rho_1Ly_t+\rho_2 L^2y_t+ ...+\rho_pL^py_t+\epsilon_t yt?=γ+ρ1?Lyt?+ρ2?L2yt?+...+ρp?Lpyt?+?t?
γ + ? t = ( 1 ? ρ 1 L ? ρ 2 L 2 ? . . . ? ρ p L p ) y t \gamma +\epsilon_t = (1-\rho_1L -\rho_2L^2-...-\rho_pL^p)y_t γ+?t?=(1?ρ1?L?ρ2?L2?...?ρp?Lp)yt?
對應的滯后算子多項式方程為:
1 ? ρ ( L ) = ( 1 ? ρ 1 L ? ρ 2 L 2 ? . . . ? ρ p L p ) = 0 1-\rho(L)=(1-\rho_1L -\rho_2L^2-...-\rho_pL^p)=0 1?ρ(L)=(1?ρ1?L?ρ2?L2?...?ρp?Lp)=0
如果 1 ? ρ ( L ) = 0 1-\rho(L)=0 1?ρ(L)=0所有根的絕對值都大于1,那么時間序列 y t y_t yt?為平穩的時間序列。如果 1 ? ρ ( L ) = 0 1-\rho(L)=0 1?ρ(L)=0存在單位根,即L=1,那么時間序列 y t y_t yt?就是非平穩,對該時間序列的未來值的預測就難以進行
常見的單位根檢驗的方法有DF(Dickey-Fuller Test)檢驗,ADF檢驗(Augmented Dickey_Fuller Test),PP檢驗(Phillips-Perron test)。
白噪聲
如果一個隨機過程中任意時點t的變量 X t X_t Xt?的均值和方差,協方差分別滿足以下公式:
E ( X t ) = 0 \mathbb E(X_t)=0 E(Xt?)=0
V a r ( X t ) = σ 2 Var(X_t)=\sigma^2 Var(Xt?)=σ2
γ l = 0 , l > 0 \gamma_l=0,l>0 γl?=0,l>0
則稱這個隨機過程為白噪聲過程。白噪聲過程中各期變量之間的協方差為0,也就是白噪聲過程是沒有相關性的。這種時間序列也可以稱為純隨機序列。
如果白噪聲過程中的個變量獨立同分布,且都服從正態分布,則該序列被稱為高斯白噪聲過程。根據定義,高斯白噪聲過程是強平穩的時間序列,而且各期之間不僅不相關,而且互相獨立。
白噪聲檢驗
通常使用Ljung-Box檢驗,檢驗的原假設為所檢驗的序列是純隨機序列,Q統計量為:
Q ( m ) = n ( n + 2 ) ∑ k = 1 m ρ k 2 n ? k ~ χ m 2 Q(m) = n(n+2)\sum _{k=1}^m \frac{\rho_k^2}{n-k} \sim \chi^2_m Q(m)=n(n+2)∑k=1m?n?kρk2??~χm2?
其中, ρ k 2 \rho^2_k ρk2?是序列的k階自相關系數,n是整個序列中觀測值的個數,m是設定的滯后階數。
在檢驗一個時間序列在m界內是否是白噪聲,只有當Q(1),Q(2),…,Q(m)這m個Q統計量都小于對應的 χ 2 \chi^2 χ2分布的臨界值時,才說嘛這個序列在所檢驗的m階內是純隨機序列。
總結
以上是生活随笔為你收集整理的【量化笔记】时间序列的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Eclipse中使用git提交代码,报错
- 下一篇: PX4 ThoneFlow光流使用