倾向得分匹配的stata命令_培训对工资是否影响显著:倾向得分匹配法(PSM)及stata实现...
第一部分 ??模型背景
1、研究目的
2、基本思想
第二部分 ??數據介紹以及語法簡介
1、數據介紹
2、語法格式
第三部分 ??案例講解以及stata實現
1、變量介紹以及數據描述性統計
2、傾向匹配得分
3、平衡性檢驗、共同取值范圍、核密度函數圖
在很多情況下,經過一項處理或者政策變化之后,事物發生了一些變化,但是這種變化顯著性如何,效應如何怎樣度量呢?在這里我們介紹傾向得分匹配法(PSM)的模型基礎和stata實現過程。
第一部分 ??模型背景
1、研究目的
檢驗接受該項目(培訓)與不接受該項目(培訓)對工資的影響。
2、基本思想
分析接受培訓組(處理組, treatment group )接受培訓行為與不接受培訓行為在工資表現上的差異。但是,現實可以觀測到的是處理組接受培訓的事實,而處理組沒有接受培訓會怎樣是不可能觀測到的,這種狀態也成為反事實( counterfactual )。
匹配法的根本思想類似于自然科學當中的控制變量法,然而在現實當中無法實現逆向處理,也無法進行絕對的控制變量。匹配法就是為了解決這種不可觀測事實的方法。在傾向得分匹配方法( Propensity Score Matching )中,根據處理指示變量將樣本分為兩個組,一是處理組,在本例中就是在 NSW 實施后接受培訓的組;二是對照組 ( comparison group ),在本例中就是在 NSW 實施后不接受培訓的組。傾向得分匹配方法的基本思想是,在處理組和對照組樣本通過一定的方式匹配后,在其他條件完全相同的情況下,通過接受培訓的組(處理組)與不接受培訓的組(對照組)在工資表現上的差異來判斷接受培訓的行為與工資之間的因果關系。
第二部分 ??數據介紹以及語法簡介
1、數據介紹
Lalonde(1986)使用的數據我們對1978年參加就業培訓計劃對個人收入可能產生的影響感興趣該數據集已被許多作者使用(Abadie et al。2004年,Becker和Ichino,2002年,Dehejia和Wahba,1999年)。
2、語法格式
help psmatch2psmatch2 depvar [indepvars] [if exp] [in range] [, outcome(varlist)pscore(varname) neighbor(integer) radius caliper(real) mahalanobis(varlist) ai(integer) population altvariance kernel llr kerneltype(type) bwidth(real) spline nknots(integer) common trim(real) noreplacement??????????descending?odds?index?logit?ties?quietly?w(matrix)?ate]選項含義為:
depvar因變量 ;
indepvars表示協變量;
outcome(varlist)表示結果變量;
logit指定使用logit模型進行擬合,默認的是probit模型;
neighbor(1)指定按照1:1進行匹配,如果要按照1:3進行匹配,則設定為neighbor(3);
radius表示半徑匹配
核匹配 (Kernel matching)
其他匹配方法
廣義精確匹配(Coarsened ExactMatching)? || help cem
局部線性回歸匹配 (Local linearregression matching)
樣條匹配 (Spline matching)
馬氏匹配 (Mahalanobis matching)
第三部分 ??案例講解以及stata實現
本文使用的是ldw_exper.dta文件
1、變量介紹以及數據描述性統計
*數據調用use ldw_exper.dta*數據描述describe*描述性統計summarize*導出描述統計結果‘mkdir d:/resultscd c:/resultsasdoc?sum*數據分組描述性統計tabulate?t,?summarize(re78)?means?standard分組變量為是否參加工作技能培訓項目,統計變量為1978年實際工資的均值和方差。
2、傾向匹配得分
*產生隨機數種子 ,生成偽隨機數,滿足01的均勻分布set seed 20180105 gen u=runiform() *排序order u*傾向匹配得分local v1 "t"local v2 "age edu black hisp married re74 re75 u74 u75"global x "`v1' `v2' "*1:1 匹psmatch2?t?age?edu?black?hisp?married?re74?re75?u74?u75,?out(re78)?neighbor(1)?ate?ties?logit?common打開數據編輯窗口,會發現軟件自動生成了幾個新變量:
其中_pscore是每個觀測值對應的傾向值;
_id是自動生成的每一個觀測對象唯一的ID(事實上這列變量即是對_pscore排序);
_treated表示某個對象是否試驗組;
_n1表示的是他被匹配到的對照對象的_id(如果是1:3匹配,還會生成_n2,_n3);
_pdif表示一組匹配了的觀察對象他們概率值的差。
3、平衡性檢驗、共同取值范圍、核密度函數圖
*均衡性檢驗,匹配效果是否較好的平衡了數據pstest?$v2,?both?graph*共同取值范圍psgraph*核密度函數圖twoway(kdensity?_ps?if?_treat==1,legend(label(1?"Treat")))(kdensity?_ps?if?_treat==0,?legend(label(2?"Control"))),xtitle(Pscore)?title("Before?Matching")twoway(kdensity?_ps?if?_treat==1,legend(label(1?"Treat")))(kdensity?_ps?if?(_weight!=1&_weight!=.),?legend(label(2?"Control"))),xtitle(Pscore)?title("After?Matching")總結
以上是生活随笔為你收集整理的倾向得分匹配的stata命令_培训对工资是否影响显著:倾向得分匹配法(PSM)及stata实现...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 人脸识别翼闸使用规范_人行通道闸如何搭配
- 下一篇: python 字典键值重复_浅谈pyth