R语言-岭回归的代码与案例解读
生活随笔
收集整理的這篇文章主要介紹了
R语言-岭回归的代码与案例解读
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
應用嶺回歸的場景有很多。
本文介紹的是 在應用多元線性回歸時 遇到多重共線性問題,且無法刪除變量或者增加樣本量的情況下,應用嶺回歸的情況。
- 案例:互聯網經濟對中國經濟增長影響
- 基礎模型:C-D生產函數:Y=A*L^α *K^β
- 應用模型:嶺回歸
- 使用工具:r語言
- 使用程序包:‘MASS’、‘xlsx’、‘car’
- 準備數據:Y:國民生產總值、K:固定資產投資;L:年期末就業人數;A:互聯網綜合發展水平
- 數據處理:為了模型的穩定性與計算的簡易性,分別對兩端取對數,變成線性關系,得到最終模型:lnY=γlnA+αlnL+βlnk
- 變量解釋與結果推測:綜合考慮互聯網經濟的指標體系和數據的可得性,采用因子分析的方法估計綜合技術水平A(詳情可點擊)。γ、α、β表示互聯網經濟產出彈性系數、勞動力彈性和資本彈性系數,本文推測,生產彈性系數會符合以下估計:
(1)α+β+γ>1,表示最終經濟規模呈遞增趨勢;
(2)α<1、β<1,表示邊際收益遞減的規律性,γ>1,表示互聯網經濟的邊際收益遞增性,符合互聯網經濟的特征。
對數線性化與多重共線性判別
#加載程序包與數據 library(MASS) library(xlsx) library(car) y <- read.xlsx("D:/RData/sets/Y.xlsx",1,encoding = "UTF-8") l <- read.xlsx("D:/RData/sets/L.xlsx",1,encoding = "UTF-8") a <- read.xlsx("D:/RData/sets/A.xlsx",1,encoding = "UTF-8") k <- read.xlsx("D:/RData/sets/K.xlsx",1,encoding = "UTF-8") dataY <-(y,a,l,k) #得到相關系數矩陣:變量之間呈同向變動的關系,符合經濟發展的規律 scatterplotMatrix(dataY,spread=FALSE,smoother.args=list(lty=2),main="Scatter Plot Matrix") #數據對數化 ly <- log(y) la <- log(a) ll <- log(l) lk <- log(k) dY <-data.frame(ly,la,ll,lk) #做最小二乘回歸 fit <- lm(gdp~a+l+k,data=dataY) fit summary(fit)用最小二乘法建立計量模型,由(表6)看到,雖然模型的擬合優度足夠高,F值也很大,整體擬合效果好,但是模型系數檢驗不顯著。顯而易見考慮模型的多重共線性問題
- 多重共線性是指在除了因變量與自變量的關系外,在解釋變量之間也存在線性相關關系的一種形式。多重共線性導致gdp與互聯網綜合發展水平、勞動和資本之間的關系不顯著。
- 嶺回歸是一種有偏估計,雖然對數據的無偏估計不準確,但是可以更準確的得到α,β,γ之間的系數關系。
結果分析
從系數符號看,符合我們前面對本模型的系數估計。即彈性系數之和大于1,互聯網技術彈性系數大于1,勞動力彈性系數和資本彈性系數小于1。從整體來看,α+β+γ大于1,表明了邊際產量遞增的趨勢,符合當前經濟發展的現狀,當國家投入勞動力和資本和技術時,經濟發展水平總量增加。
(分別具體的每個系數分析在這里不做過多講述)
本文結論為:我國正處于技術推動經濟發展的新時代,應以互聯網技術為核心,結合信息與知識,對我國經濟發展做出貢獻。
總結
本文以具體案例為例子,講解了嶺回歸模型的r語言實現過程,并對案例進行一定程度的分析。希望可以對大家有幫助。
在本文中對互聯網綜合發展指數的因子分析求解可以看該連接:
因子綜合得分求解
總結
以上是生活随笔為你收集整理的R语言-岭回归的代码与案例解读的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 总结VUE控制滚动滑动方法
- 下一篇: java -1%3_Java_SE 流程