小白学统计|面板数据分析与Stata应用笔记(一)
小白學統計|面板數據分析與Stata應用筆記(一)
文章首發于公眾號 「如風起」。
 原文鏈接: 小白學統計|面板數據分析與Stata應用筆記(一)
面板數據分析與Stata應用筆記整理自慕課上浙江大學方紅生教授的面板數據分析與Stata應用課程,筆記中部分圖片來自課程截圖。
 筆記內容還參考了陳強教授的《高級計量經濟學及Stata應用(第二版)》
一、面板數據的定義
面板數據(panel data或longitudinaldata),指的是在一段時間內跟蹤同一組個體(individual)的數據。它既有橫截面的維度(n個個體),又有時間維度(T個時期)。是同時在時間和截面上取得的二維數據,又稱時間序列與截面混合數據(polled timeseries and cross section data)。
 一個T=3的面板數據結構如下所示
二、面板數據的分類
面板數據類型通常分為三類,分別為:
a.短面板數據與長面板數據
 b.動態面板數據和靜態面板數據
 c.平衡面板和非平衡面板
(1)短面板數據與長面板數據
當截面數n大于T時,即為短面板數據;
 當截面數n小于T時,即為長面板數據.
(2)動態面板數據和靜態面板數據
如果解釋變量包含別解釋變量的滯后值,則為動態面板數據,反之則為靜態面板。
(3)平衡面板和非平衡面板
當每個個體在相同的時間內都有觀察值記錄,即為平衡面板,反之則為非平衡面板。
三、面板數據的優缺點
1、面板數據的優點
(1)可以處理由不可觀察的個體異質性所導致的內生性問題。
 (2)提供更多個體動態行為的信息。
 (3)樣本量較大,可以提高估計的精確度。
2、面板數據的不足之處
(1)大多數面板數據分析技術都針對的是短面板。
 (2)尋找面板數據結構工具變量不是很容易。
四、面板數據模型
面板數據模型分為非觀測效應模型和混合回歸模型兩類。
 存在不可觀測的個體效應模型即為非觀測效應模型,反之則為混合回歸模型。
(1)非觀測效應模型
a.固定效應模型
 b.隨機效應模型
 Yit=βxit+αi+εiti=1,?,n;t=1,?,T\begin{array}{l} {Y_{it}} = \beta {x_{it}} + {\alpha _i} + {\varepsilon _{it}}\\ i = 1, \cdots ,n;t = 1, \cdots ,T \end{array} Yit?=βxit?+αi?+εit?i=1,?,n;t=1,?,T?
 其中, αi\alpha _iαi?是不可觀測的個體效應。
 如果 αi\alpha _iαi?與某個解釋變量相關,就是固定效應模型;
 如果 αi\alpha _iαi?與所有解釋變量不相關,則為隨機效應模型。
固定效應模型又分為:單向固定效應模型與雙向固定效應模型
 單向固定效應模型: 只考慮個體效應不考慮時間效應;
 雙向固定效應模型: 同時考慮個體效應和時間效應,即
 yit=βxit+λt+αi+εit{y_{it}} = \beta {x_{it}} + {\lambda _t} + {\alpha _i} + {\varepsilon _{it}} yit?=βxit?+λt?+αi?+εit?
 (2)混合回歸模型
如果αi\alpha _iαi?=0,即不存在個體效應,則為混合回歸模型,即
 Yit=βxit+εiti=1,?,n;t=1,?,T\begin{array}{l} {Y_{it}} = \beta {x_{it}} + {\varepsilon _{it}}\\ i = 1, \cdots ,n;t = 1, \cdots ,T \end{array} Yit?=βxit?+εit?i=1,?,n;t=1,?,T?
五、面板數據模型的估計
1、固定效應模型的估計
對固定效應模型的估計有兩種方法:
 固定效應變換(組內變換) 與 LSDV(最小二乘虛擬變量法)
a.固定效應變換(組內變換)
 
 固定效應變換的優缺點
優點: 即使個體效應與解釋變量相關也可以得到一致估計;
缺點: 無法估計不隨時間而變的變量的影響。
#對固定效應變換無法估計不隨時間而變的變量的影響的解決
 固定效應模型的Stata的實現命令為:xtreg y x, fe
 引入時間效應的雙向固定效應的Stata的實現命令為:xi: xtreg y x i.year, fe
 
 == b.LSDV(最小二乘虛擬變量法)==
 LSDV的基本思想
 
 LSDV的Stata的實現命令為:
 不存在時間效應:reg y x i.code
 存在時間效應:xi: reg y x i.code i.year
 
 
2、隨機效應模型
對隨機效應模型的估計方法是廣義最小二乘法
 
 隨機效應模型估計的Stata命令
不存在時間效應:xtreg y x ,re
 存在時間效應:xi: reg y x i.year,re
短面板數據估計的同時,還需要考慮三大問題
即,誤差項的異方差、誤差項的自相關、截面相關問題
 
- 通過在命令中加入選項“robust”可以獲得White穩健標準誤,可以解決異方差的問題。
- 在命令中加入選項“cluster”可以獲得Rogers標準誤或聚類穩健的標準誤,可以同時解決異方差和自相關兩大問題。
- 使用命令xtscc可以同時解決三大問題,提供Driscoll-Kraay標準誤。
總結
以上是生活随笔為你收集整理的小白学统计|面板数据分析与Stata应用笔记(一)的全部內容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: 基于 Python(gma) 的 克里金
- 下一篇: 给中国学生的第三封信:成功、自信、快乐
