模型与logit_基础方法 | 如何用Logit回归模型写论文?
Logit回歸(又稱邏輯回歸、羅杰斯蒂回歸、Logistic回歸)無疑是社會科學,尤其是社會學研究中使用最廣的方法,沒有之一。這也是因為社會科學中變量的類型所決定的。因變量的類型決定著回歸模型的使用,對于社會科學中常用的類別變量對應的就是Logit回歸。
Logit回歸又不同于一般線性回歸,一般線性回歸的回歸系數以及R方等較容易解釋,但是Logit回歸的數學原理中涉及到了對數轉換等,所以解釋起來與一般線性回歸有著較多的不同之處。
Logit回歸系數有哪些不同一般線性回歸的解釋相對較容易,即x沒變化多少個單位,y的變化。但是,由于Logit回歸進行了Logit轉換,所以就不能像線性回歸一樣解釋,因為因變量已經變成ln(p/1-p),我們不能再說x變化多少個單位ln(p/1-p)變化多少,這樣沒有實際的意義。而logit回歸的本質是針對因變量為分類變量,即相較于另一種情況,某一情況的發生概率。所以針對logit回歸的這一特性,我們需要匯報OR值(odds ratio),也稱發生比。
可能這樣理解起來較為抽象,我們來看一個例子:
上表來源:薛海平. 2015. 從學校教育到影子教育:教育競爭與社會再生產[J]. 北京大學教育評論(03): 47-69+188-189.
該研究的因變量為城鎮學生是否參加補習,是一個典型的二分類變量。作者在報告結果的時候同時匯報了回歸系數和OR值(發生比Exp(B))。在軟件操作時候,SPSS會自動輸出Exp,而Stata需要在命令后面增加or的選項。
從上表中我們可以看出,回歸系數為正值時,發生比為為大于1的數,而系數為負時候為小于1的數。在進行解釋的時候,我們可能更關注發生比。以上表為例,東部地區參加課外補習的概率是西部地區的1.491倍。
Logit回歸如何用Stata操作只輸出回歸系數logit 因變量 自變量以及控制變量 //二分類Logistic回歸
mlogit 因變量 自變量以及控制變量 //多分類Logistic回歸
ologit 因變量 自變量以及控制變量 // 次序Logistic回歸
輸出OR值logit 因變量 自變量以及控制變量,or //二分類Logistic回歸
mlogit 因變量 自變量以及控制變量,or //多分類Logistic回歸
ologit 因變量 自變量以及控制變量,or // 次序Logistic回歸
論文中如何寫?在論文中Logit回歸的寫法可謂是各有千秋,有的直接在表中匯報OR值,有的只匯報系數在行文中寫出關鍵變量的發生比,還有像上文一樣將系數和OR值都列出來的。這些寫法沒有對錯之分,只取決于作者的習慣。
方法1:只匯報系數直接匯報系數的好處是,能夠直觀的看出某一變量對因變量方向上的影響,因為系數是有正負之分的更加直觀。
我們來看一個例子:
注:上表數據非真實數據,只為舉例子使用。(實際上是小編在候機然后遇到機場大面積延誤)
?????? 從上表可知,在控制其他變量的情況下,惡劣天氣對于飛機是否延誤具有正向的影響,相較于費惡劣天氣,惡劣天氣時飛機更容易延誤。風力對于飛機是否延誤也具有正向的影響,風力越大,飛機越容易延誤。機場所在緯度對于飛機是否延誤的影響是負向的,即所在緯度越高飛機越不容易延誤。乘客數量對于飛機是否延誤的影響也是負向的,即乘客數量越多飛機越不容易延誤。票價對于飛機是否延誤的影響不顯著,但也是負向的。購買延誤險的乘客比例越高,飛機越不容易延誤。是否是天合聯盟成員對于飛機延誤沒有顯著影響。
只匯報系數的缺點:不能看出數量的差異,即我們只知道室惡劣天氣具有正向影響,但不知道惡劣天氣對于飛機延誤概率的影響有多大。
方法2:匯報OR值匯報OR值的好處是能夠看出數量的影響。而對于匯報OR值可以有兩種辦法,第一種就是前文關于課外補習的例子,在表中直接給出,在表中直接寫出的相對較容易,直接描述即可。
第二種是在表中依舊只匯報系數,而在行文中寫出,例如:
相較于非惡劣天氣,惡劣天氣導致飛機延誤的概率會提升75.86%(Exp0.565-1=0.7586,p<0.01)。
相較于非惡劣天氣,惡劣天氣導致飛機延誤的概率是非惡劣天氣的1.76倍(Exp0.565=1.76,p<0.01)
有木有覺得這樣寫更高大上一點?而且還能湊點字數。嘻嘻
希望對大家的學習有幫助,我繼續等我的延誤的飛機了~
總結
以上是生活随笔為你收集整理的模型与logit_基础方法 | 如何用Logit回归模型写论文?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 开卡教程_流量卡开卡教程(必看)
- 下一篇: 父子组建传值_父子组件及兄弟组件传值de