R语言与虚拟变量模型
學習筆記
參考書籍:《計量經(jīng)濟學》-李子奈;《統(tǒng)計學:從數(shù)據(jù)到結論》-吳喜之;
虛擬變量模型
許多變量是可以定量度量的,如需求量、價格等,但也有一些因素無法定量度量,如職業(yè)、性別。為了能夠在模型中反映這些因素的影響,并提高模型的精度,需要將它們’量化’,這種’量化’通常是通過引入虛擬變量來完成的。根據(jù)這些因素的屬性類型,構造取’0’或’1’的人工變量。通常稱為虛擬變量,記為D。
例如:反映性別的虛擬變量可取為:
D={1,man0,womanD=\begin{cases}1, man \\0, woman\end{cases} D={1,man0,woman?
一般地,在虛擬變量的設置中,基礎類型和肯定類型取值為1; 比較類型和否定類型取值為0。同時含有一般解釋變量與虛擬變量的模型稱為虛擬變量模型。
- 加法模型
若我們以員工薪金YYY作為因變量,工齡XXX作為一般解釋變量,性別DDD作為虛擬變量構造虛擬變量模型,則在模型中可以將虛擬變量DDD以相加的形式引入模型,則該加法模型為:
Yi=β0+β1Xi+β2D+μiY_i=\beta_0+\beta_1 X_i + \beta_2D +\mu_i Yi?=β0?+β1?Xi?+β2?D+μi?
- 乘法模型
若在模型中將虛擬變量DDD以相乘的形式引入模型,則該乘法模型為:
Yi=β0+β1Xi+β2DXi+μiY_i=\beta_0+\beta_1 X_i + \beta_2D X_i +\mu_i Yi?=β0?+β1?Xi?+β2?DXi?+μi?
- 混合模型(自己起的名字)
我們也可以將虛擬變量DDD同時以相加和相乘的形式引入模型:
Yi=β0+β1Xi+β2D+β3DXi+μiY_i=\beta_0 + \beta_1 X_i + \beta_2 D + \beta_3 D X_i +\mu_i Yi?=β0?+β1?Xi?+β2?D+β3?DXi?+μi?
R語言實現(xiàn)
在個例子中,我們模擬一系列數(shù)據(jù),再用虛擬變量模型去擬合。
模擬數(shù)據(jù):
set.seed(1234) x <- c(-19:20) y1 <- 2*x + rnorm(40, 0, 2) y2 <- -x +rnorm(40, 3, 2)df1 <- data.frame(x = x, y = y1, c = rep('A', 40)) df2 <- data.frame(x = x, y = y2, c = rep('B', 40)) df <- rbind(df1, df2)plot(df$x, df$y, col = df$c, main = "散點圖", xlab = 'x', ylab = 'y')圖像:
回歸:
lm01 <- lm(y ~ x*c, data = df) summary(lm01)控制臺輸出:
Call: lm(formula = y ~ x * c, data = df)Residuals:Min 1Q Median 3Q Max -4.3410 -1.2588 -0.3353 0.8964 5.6449 Coefficients:Estimate Std. Error t value Pr(>|t|) (Intercept) -0.81327 0.31223 -2.605 0.0111 * x 1.97107 0.02702 72.941 < 2e-16 *** cB 3.63159 0.44156 8.225 4.09e-12 *** x:cB -2.92208 0.03822 -76.462 < 2e-16 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1Residual standard error: 1.973 on 76 degrees of freedom Multiple R-squared: 0.9886, Adjusted R-squared: 0.9881 F-statistic: 2194 on 3 and 76 DF, p-value: < 2.2e-16此時,各個回歸系數(shù)均通過顯著性檢驗,則被估計的虛擬變量模型為:
Yi^=?0.81+1.97Xi+3.63D?2.92DXi\hat{Y_i}=-0.81 + 1.97 X_i + 3.63 D -2.92 D X_i Yi?^?=?0.81+1.97Xi?+3.63D?2.92DXi?
注意!此時的虛擬變量DDD取為:
D={1,B0,AD=\begin{cases}1, B \\0, A\end{cases} D={1,B0,A?
總結
以上是生活随笔為你收集整理的R语言与虚拟变量模型的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 散步的正确走路方法 散步走路的正确姿势方
- 下一篇: D-Link DIR-600M 无线路由