实证会计理论与因果推断13 线性模型概述
實(shí)證會(huì)計(jì)理論與因果推斷13 線性模型概述1
- OLS
- GLS
大部分應(yīng)用微觀計(jì)量模型都在試圖去計(jì)算causal effects,對(duì)這個(gè)causal effects有一個(gè)比較經(jīng)典的定義:Causal effects are the ceteris paribus response to a change in variable or parameter (Marshall [1961] and Heckman [2000])。這個(gè)句子的關(guān)鍵詞是ceteris paribus。它是一個(gè)拉丁語(yǔ)短語(yǔ),ceteris在應(yīng)用微觀計(jì)量的語(yǔ)境下可以理解成除了我們感興趣的解釋變量以外的其他因素,paribus的意思是相等,因此連起來(lái)就是保持除了我們感興趣的解釋變量外的其他因素保持不變。這句話的含義就是causal effects就是在其他因素保持不變的條件下,被解釋變量對(duì)解釋變量變化的響應(yīng)。其中ceteris paribus是保證我們能夠正確估計(jì)出causal effects的核心假設(shè)。
設(shè)計(jì)實(shí)證研究去估計(jì)causal effects有兩種方法,一種是observational study,另一種是experimental study。對(duì)于經(jīng)濟(jì)學(xué)而言,實(shí)驗(yàn)方法還是一個(gè)比較新的領(lǐng)域,主要用來(lái)研究個(gè)體與小型集體的決策行為。究其原因還是因?yàn)榻?jīng)濟(jì)系統(tǒng)比物化生系統(tǒng)復(fù)雜程度更甚,并且?guī)缀醪豢赡軐?duì)其他因素施加控制,也就難以做到ceteris paribus了。所以大部分經(jīng)濟(jì)文獻(xiàn)用的還是observational study的思路。這篇博文會(huì)簡(jiǎn)單梳理一下最基礎(chǔ)的計(jì)量方法,為什么在這些方法的假設(shè)成立的前提下可以做到ceteris paribus,以及大致提一下如果這些假設(shè)不成立有哪些補(bǔ)救措施,后續(xù)的博文就圍繞如何用observational study去計(jì)算causal effects展開。
OLS
假設(shè)DGP(data generating process)是Y=Xβ+?Y=X\beta+\epsilonY=Xβ+?其中Y∈Rn×1Y \in \mathbb{R}^{n \times 1}Y∈Rn×1,X∈Rn×pX \in \mathbb{R}^{n \times p}X∈Rn×p,β∈Rp×1\beta \in \mathbb{R}^{p \times 1}β∈Rp×1,假設(shè)
為了方便做統(tǒng)計(jì)推斷,假設(shè)
這些假設(shè)保證了ceteris paribus,系數(shù)β\betaβ就是我們想要計(jì)算的causal effects。上面的假設(shè)作用不盡相同。無(wú)多重共線性主要是出于計(jì)算上的考量,因?yàn)橄禂?shù)的OLS估計(jì)是β^=LY\hat{\beta}=LYβ^?=LY,其中L=(XTX)?1XTL=(X^TX)^{-1}X^TL=(XTX)?1XT是向線性空間span(X)span(X)span(X)上投影的投影矩陣,如果rank(X)<prank(X)<prank(X)<p,XTXX^TXXTX就會(huì)是不可逆的奇異陣。存在多重共線性時(shí)可以用嶺回歸避免系數(shù)被高估。無(wú)內(nèi)生性的假設(shè)是為確保ceteris paribus所需要的最重要的一條假設(shè),在DGP中,我們關(guān)注的解釋變量只有ppp個(gè),影響被解釋變量的其他變量都在隨機(jī)誤差里面,如果E(?∣X)≠0E(\epsilon|X) \ne 0E(?∣X)?=0,說明誤差中還存在能影響被解釋變量的因素,這時(shí)可以用GMM。其原因可能是存在重要遺漏變量或者互為因果等。如果同方差假設(shè)不成立,OLS的系數(shù)可能會(huì)被高估,可以用WLS來(lái)做;如果誤差項(xiàng)存在自相關(guān),可以用GLS。正態(tài)假設(shè)可以保證系數(shù)估計(jì)量的一些優(yōu)良性質(zhì)可以成立,并且方便用來(lái)做統(tǒng)計(jì)推斷。我們通常討論的數(shù)據(jù)質(zhì)量好不好其實(shí)討論的是能滿足幾條OLS的假設(shè)
系數(shù)的估計(jì)其實(shí)還是隨機(jī)的,正態(tài)性假設(shè)下系數(shù)的OLS估計(jì)量同樣服從正態(tài)分布,這意味著causal effects其實(shí)是隨機(jī)變量。為了獲得對(duì)causal effects的最準(zhǔn)確的估計(jì),我們希望找到的系數(shù)估計(jì)量是UMVUE,并且具有一致性和漸進(jìn)有效性。前者保證causal effects的分布盡可能集中,后者保證大樣本時(shí)causal effects不會(huì)偏離真實(shí)的causal effects并且漸進(jìn)分布也盡可能比較集中。Gauss-Markov定理保證了OLS估計(jì)是BLUE,這里就簡(jiǎn)單證明一下OLS估計(jì)更是UMVUE。
回顧一下Rao-Blackwell定理:如果一個(gè)無(wú)偏估計(jì)可以寫成充分完備統(tǒng)計(jì)量的函數(shù),那么它就是一個(gè)UMVUE。因?yàn)镺LS是BLUE,所以肯定是一個(gè)無(wú)偏估計(jì)了。考慮Y~N(Xβ,σ2In)Y \sim N(X\beta,\sigma^2I_n)Y~N(Xβ,σ2In?),嘗試找一下XβX\betaXβ的充分完備統(tǒng)計(jì)量。
f(Y)=(2π)?n/2σ?nexp?{?12σ2(Y?Xβ)T(Y?Xβ)}=exp?{?YTY2σ2?YTXβσ2?βTXTXβ2σ2?nln?2πσ2}f(Y) = (2\pi)^{-n/2} \sigma^{-n} \exp{\{-\frac{1}{2\sigma^2}(Y-X\beta)^T(Y-X\beta) \}} \\ = \exp{\{-\frac{Y^TY}{2\sigma^2}-\frac{Y^TX\beta}{\sigma^2}-\frac{\beta^TX^TX\beta}{2\sigma^2}-n\ln\sqrt{2\pi \sigma^2}\}} f(Y)=(2π)?n/2σ?nexp{?2σ21?(Y?Xβ)T(Y?Xβ)}=exp{?2σ2YTY??σ2YTXβ??2σ2βTXTXβ??nln2πσ2?}
根據(jù)Neyman-Fisher因子分解定理不難看出充分統(tǒng)計(jì)量為YTXY^TXYTX與YTYY^TYYTY,其中lll為元素全是1的向量。考慮
E[g(YTX)]=∫g(YTX)(2π)?n/2σ?nexp?{?12σ2(Y?Xβ)T(Y?Xβ)}dY=0E[g(Y^TX)] = \int g(Y^TX) (2\pi)^{-n/2} \sigma^{-n} \exp{\{-\frac{1}{2\sigma^2}(Y-X\beta)^T(Y-X\beta) \}} dY = 0 E[g(YTX)]=∫g(YTX)(2π)?n/2σ?nexp{?2σ21?(Y?Xβ)T(Y?Xβ)}dY=0
因?yàn)橹笖?shù)部分肯定是大于0的,而(2π)?n/2σ?n(2\pi)^{-n/2}\sigma^{-n}(2π)?n/2σ?n也是大于0的,所以除非g(YTX)=0.a.s.g(Y^TX)=0.a.s.g(YTX)=0.a.s.否則期望不會(huì)為0,因此YTXY^TXYTX是β\betaβ的充分完備統(tǒng)計(jì)量。因?yàn)?br /> Y=Xβ^+eY = X\hat{\beta} + e Y=Xβ^?+e
其中eee是殘差。因此YTX=(Xβ^)TX+eTX=XTXβ^Y^T X = (X\hat{\beta})^TX + e^TX=X^TX\hat{\beta}YTX=(Xβ^?)TX+eTX=XTXβ^?,顯然OLS估計(jì)β^\hat{\beta}β^?可以寫成XTXβ^X^TX\hat{\beta}XTXβ^?的函數(shù)。根據(jù)Rao-Blackwell定理,OLS估計(jì)是UMVUE。
接下來(lái)簡(jiǎn)單證一下OLS估計(jì)的一致性。定義
SXX=XTXn=1n∑i=1nxixiT∈Rp×pSXY=XTYn=1n∑i=1nxiyi∈Rp×1g=XT?n=1n∑i=1nxi?i∈Rp×1S_{XX} = \frac{X^TX}{n} = \frac{1}{n} \sum_{i=1}^n x_ix_i^T \in \mathbb{R}^{p \times p} \\ S_{XY} = \frac{X^TY}{n} = \frac{1}{n}\sum_{i=1}^n x_iy_i \in \mathbb{R}^{p \times 1} \\ g=\frac{X^T\epsilon}{n} = \frac{1}{n}\sum_{i=1}^n x_i\epsilon_i \in \mathbb{R}^{p \times 1} SXX?=nXTX?=n1?i=1∑n?xi?xiT?∈Rp×pSXY?=nXTY?=n1?i=1∑n?xi?yi?∈Rp×1g=nXT??=n1?i=1∑n?xi??i?∈Rp×1
從而
β^=(XTX)?1XTY=(XTXn)?1(XTYn)=SXX?1SXYβ^?β=(XTX)?1XT?=(XTXn)?1(XT?n)=SXX?1g\hat{\beta} = (X^TX)^{-1}X^TY = (\frac{X^TX}{n})^{-1}(\frac{X^TY}{n}) = S_{XX}^{-1}S_{XY} \\ \hat{\beta} - \beta = (X^TX)^{-1}X^T\epsilon = (\frac{X^TX}{n})^{-1}(\frac{X^T\epsilon}{n}) = S_{XX}^{-1}g β^?=(XTX)?1XTY=(nXTX?)?1(nXTY?)=SXX?1?SXY?β^??β=(XTX)?1XT?=(nXTX?)?1(nXT??)=SXX?1?g
假設(shè)二意味著E[xi?i]=0E[x_i\epsilon_i]=0E[xi??i?]=0,從而ggg依概率趨近于0,假設(shè)一保證SXX?1S_{XX}^{-1}SXX?1?有界,因此β^\hat{\beta}β^?依概率趨近于β\betaβ,或者說,OLS估計(jì)具有一致性。要比較OLS估計(jì)的漸進(jìn)有效性需要計(jì)算其漸進(jìn)方差、另外大樣本情況下的檢驗(yàn)需要方差的估計(jì)也具有一致性,關(guān)于這些推導(dǎo)可以參考陳強(qiáng)的教材第五章的內(nèi)容。
GLS
現(xiàn)在放松第三條假設(shè),如果同方差假設(shè)與自相關(guān)不成立,將假設(shè)修正為
3’. Var(?)=ΣVar(\epsilon)=\SigmaVar(?)=Σ
此時(shí)的估計(jì)叫廣義最小二乘估計(jì)(GLS),GLS估計(jì)也是BLUE
β^GLS=(XTΣ?1X)?1XTΣ?1Y\hat{\beta}^{GLS} = (X^T\Sigma^{-1}X)^{-1}X^T \Sigma^{-1}Y β^?GLS=(XTΣ?1X)?1XTΣ?1Y
推導(dǎo)GLS估計(jì)可以不用最小二乘的思想,可以用Aitken方法將其化歸為OLS,這里給一個(gè)簡(jiǎn)單的思路。對(duì)Σ\SigmaΣ做Cholesky分解,Σ=ΓΓT\Sigma = \Gamma\Gamma^TΣ=ΓΓT,并對(duì)DGP做變換
Γ?1Y=Γ?1(Xβ+?)=Γ?1Xβ+Γ?1?\Gamma^{-1} Y = \Gamma^{-1}(X\beta + \epsilon) = \Gamma^{-1}X\beta + \Gamma^{-1}\epsilon Γ?1Y=Γ?1(Xβ+?)=Γ?1Xβ+Γ?1?
其中Γ?1?\Gamma^{-1}\epsilonΓ?1?的協(xié)方差矩陣為InI_nIn?滿足OLS的假設(shè),因此β\betaβ的OLS估計(jì)為
β^=(XT(Γ?1)TΓ?1X)?1XT(Γ?1)TΓ?1Y\hat{\beta} = (X^T (\Gamma^{-1})^T\Gamma^{-1}X)^{-1} X^T (\Gamma^{-1})^T \Gamma^{-1} Y β^?=(XT(Γ?1)TΓ?1X)?1XT(Γ?1)TΓ?1Y
因?yàn)?span id="ze8trgl8bvbq" class="katex--inline">(Γ?1)TΓ?1X)?1=Σ?1(\Gamma^{-1})^T\Gamma^{-1}X)^{-1}=\Sigma^{-1}(Γ?1)TΓ?1X)?1=Σ?1,所以這個(gè)估計(jì)就是GLS。根據(jù)OLS的性質(zhì),GLS是無(wú)偏的。GLS估計(jì)的方差一般用Eicker-Huber-White漸進(jìn)異方差一致估計(jì)量(heteroskedasticity consistent estimator):
n(XTX)?1S0(XTX)?1n(X^TX)^{-1}S_0 (X^TX)^{-1} n(XTX)?1S0?(XTX)?1
其中S0=∑i=1nxixiTei2/nS_0 = \sum_{i=1}^n x_ix_i^T e_i^2/nS0?=∑i=1n?xi?xiT?ei2?/n,eie_iei?是殘差。
總結(jié)
以上是生活随笔為你收集整理的实证会计理论与因果推断13 线性模型概述的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA MATH574M 统计学习II 二
- 下一篇: UA MATH566 统计理论1 充分统