门限回归模型的思想_Stata+R:门槛回归教程
來源 | 數量經濟學綜合整理
轉載請聯(lián)系
進行回歸分析,一般需要研究系數的估計值是否穩(wěn)定。很多經濟變量都存在結構突變問題,使用普通回歸的做法就是確定結構突變點,進行分段回歸。這就像我們高中學習的分段函數。但是對于大樣本、面板數據如何尋找結構突變點。所以本文在此講解面板門限回歸的問題,門限回歸也適用于時間序列。
門限效應,是指當一個經濟參數達到特定的數值后,引起另外一個經濟參數發(fā)生突然轉向其它發(fā)展形式的現象(結構突變)。作為原因現象的臨界值稱為門限值。例如,成果和時間存在非線性關系,但是在每個階段是線性關系。有些人將這樣的模型稱為門檻模型,或者門限模型。如果模型的研究對象包含多個個體多個年度,那么就是門限面板模型。
1history&Hansen常見模型如下:門檻回歸模型(threshold regression,也稱門限回歸):
漢森(Bruce E. Hansen)在門限回歸模型上做出了很多貢獻。Hansen于1996年在《Econometrica》上發(fā)表文章《Inference when a nuisance parameter is not identified under the null hypothesis》,提出了時間序列門限自回歸模型(TAR)的估計和檢驗。之后,他在門限模型上連續(xù)追蹤,發(fā)表了幾篇經典文章,尤其是1999年的《Threshold effects in non-dynamic panels: Estimation, testing and inference》(Hansen (1999) 首次介紹了具有個體效應的面板門限模型的計量分析方法, 該方法以殘差平方和最小化為條件確定門限值, 并檢驗門限值的顯著性, 克服了主觀設定結構突變點的偏誤。具體思路是:選定某一變量作為門限變量, 根據搜尋到的門限值將回歸模型區(qū)分為多個區(qū)間, 每個區(qū)間的回歸方程表達不同, 根據門限劃分的區(qū)間將其他樣本值進行歸類, 回歸后比較不同區(qū)間系數的變化。),2000年的《Sample splitting and threshold estimation》和2004年與他人合作的《Instrumental Variable Estimation of a Threshold Model》。
在這些文章中,Hansen介紹了包含個體固定效應的靜態(tài)平衡面板數據門限回歸模型,闡述了計量分析方法。方法方面,首先要通過減去時間均值方程,消除個體固定效應,然后再利用OLS(最小二乘法)進行系數估計。如果樣本數量有限,那么可以使用自舉法(Bootstrap)重復抽取樣本,提高門限效應的顯著性檢驗效率。在Hansen(1999)的模型中,解釋變量中不能包含內生解釋變量,無法擴展應用領域。Caner和Hansen在2004年解決了這個問題。他們研究了帶有內生變量和一個外生門限變量的面板門限模型。與靜態(tài)面板數據門限回歸模型有所不同,在含有內生解釋變量的面板數據門限回歸模型中,需要利用簡化型對內生變量進行一定的處理,然后用2SLS(兩階段最小二乘法)或者GMM(廣義矩估計)對參數進行估計。
2顯著性檢驗門檻回歸模型顯著性檢驗的目的是,檢驗以門檻值劃分的兩組樣本其模型估計參數是否顯著不同。
因此,不存在門檻值的零假設為:Ho:兩個系數相同。同時構造LM統(tǒng)計量:
其中,So是在零假設下的殘差平方和。由于LM統(tǒng)計量并不服從標準的分布。因此, Hansen(2000)提出了通過“自舉法”( Bootstrap)來獲得漸進分布的想法,進而得出相應的概率p值,也稱為 Bootstrap P值。
這種方法的基本思想是:在解釋變量和門檻值給定的前提下,模擬( Simulate)產生一組因變量序列,并使其滿足N(0,e2),其中e是式(4)的殘差項。每得到一個自抽樣樣本,就可以計算出一個模擬的エM統(tǒng)計量。將這一過程重復1000次。Hansen(1996)認為模擬產生的LM統(tǒng)計量大于式(6)的次數占總模擬次數的百分比就是“自舉法”估計得到的P值。這里的Bootstrap P值類似于普通計量方法得出的相伴概率P值。例如,當 Bootstrap P值小于0.01時,表示在1 %的顯著性水平下通過了LM檢驗,以此類推。
3置信區(qū)間以上的檢驗過程為只有一個門檻值的檢驗過程,為了能確定是否存在兩個門檻值或者是更多的門檻值,我們應當檢驗是否存在兩個門檻值,拒絕意味著至少存在一個門檻值。我們可以假設己經估計的第一個門檻值,然后開始尋找第二個門檻值。在確定有兩個門檻值后,再尋找第三個門檻值,方法都和前面的一樣,直至我們不能拒絕零假設。
4門檻回歸及R操作主要使用pdR安裝包,在pdR安裝包中主要使用ptm函數。
ptm函數是估計面板門限模型的一種通用規(guī)范。
此代碼只適用于平衡面板數據。它推廣了Hansen(http://www.ssc.wisc.edu/~bhansen/)的簡單代碼,允許多個(不止一個)依賴于系統(tǒng)的(ind1)變量。
為了更好地適應面板數據中閾值建模的一般需要,我們對原始代碼進行了改進。bootn和trimn是3×1的向量,表示三個相應的體制的數字。這個版本修正了參數max_lag引起的一個小錯誤,Hansen用它來通過lag安排投資數據。
在這個包中,用戶操作數據以使個人研究適合ptm(),因此省略了這個論點,以免自由度會損失N。
Author(s)
Ho Tsung-wu , College of Management, National Taiwan Normal University.
References
Hansen B. E. (1999) Threshold effects in non-dynamic panels: Estimation, testing and inference. Journal of Econometrics,93, 345-368.
語法格式為:
ptm(dep,?ind1,?ind2,?d,?bootn,?trimn,?qn,?conf_lev,?t,?n)選項含義為
dep:表示因變量,即被解釋變量
ind1:Independent variables: regime dependent,意思為區(qū)制變量
ind2:Independent variables:regime independent,其他不受區(qū)制變量影響的變量
d:門檻變量Threshold variable
bootn:Vector of bootstrap repetition,可以理解為stata命令里面的自舉抽樣次數,即表示網格搜索數量
trimn:Vector of trimmed percentage,修整比例,根據門檻個數來確定,具體請看下面案例,1 2 3個門檻時候該選項不一致,請看案例
qn:Number of quantiles to examine,門限變量分割的分割點位數,一般默認為100,
conf_lev:Confidence level,置信度水平,默認為95%
t:Length of time period,時間
n:Number of cross-section units截面?zhèn)€數
案例代碼為,首先查看源碼Stata命令里面xthreg所對應的數據代碼。
例如:
xthreg需要stata13及以上版本
語法格式為:
xthreg depvar [indepvars] [if] [in], rx(varlist) qx(varname) [thnum(#) grid(#) trim(numlist) bs(numlist) thlevel(#) gen(newvarname) noreg nobslog thgiven options]?
depvar被解釋變量,indepvars 解釋變量,qx(varname) is the threshold variable,門限變量,thnum(#) is the number of thresholds,在stata13.0中門檻值是必要項目,需要等于大于1,小于等于3,默認值為1,也就是至少存在三個門檻值。
門檻回歸的案例
use hansen1999
Estimate a single-threshold model?
xthreg i q1 q2 q3 d1 qd1, rx(c1) qx(d1) thnum(1) trim(0.01) grid(400) bs(300)?
Estimate a triple-threshold model given the estimated result above
xthreg i q1 q2 q3 d1 qd1, rx(c1) qx(d1) thnum(3) trim(0.01 0.01 0.05) grid(400) bs(300 300 300)
輸出結果包括四個部分。第一部分輸出門限估計值和自舉法的結果。第二部分列表輸出門限值及置信區(qū)間,Th-1代表單一門限估計值,Th-21 和Th-22代表雙門限回歸的兩個估計值,有時Th-21和Th-1相同。第三部分列出了門限檢驗,包括RSS、MSE、F統(tǒng)計量及概率值,以及10%、5%、1%的置信水平。第四部分是固定效應回歸結果。
那么通過這個例子上面對應的位置就可以很好的理解R操作門檻回歸了!
4.1單門檻回歸及R操作1、單門檻回歸命令代碼
#?R統(tǒng)計分析與應用# 經濟金融數據分析及R應用# # 計量經濟學服務中心# 2018年1月setwd("C:\\Users\\admin\\Desktop")library(readstata13) library(pdR)# 導入數據(計量經濟學服務中心)hansen?"hansen1999.dta")然后進行各個變量設置:
結果為:
4.2雙門檻/三重回歸及R操作結果:注意:上述展現的是雙重門檻的結果,然后自抽樣次數修改為1出來的結果,這樣保證了軟件運行出來的速度。
另外上述結果與Stata出來結果有細小的差別!
總結
以上是生活随笔為你收集整理的门限回归模型的思想_Stata+R:门槛回归教程的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【OS学习笔记】二十四 保护模式七:调用
- 下一篇: Java查看某个类的帮助文档