r语言线性回归_(R语言)线性回归:机器学习基础技术
線性回歸: 使用最小二乘法預測定量的結果的一種回歸模型。
Anscombe數據集
它由統計學家弗朗西斯·安斯庫姆(Francis Anscombe)建立,用來強調數據可視化和異常值在數據分析中的重要性。這個數據集有4對X變量和Y變量,它們具有相同的統計特性。將其放在統計圖中,就會看到一些極大的差異。
代碼如下:
#調用并查看數據 data(anscombe) attach(anscombe) anscombe #x1與y1的相關系數correlation of x1 and y1 cor(x1,y1) #x2與y2的相關系數correlation of x2 and y2 cor(x2,y2) #話四個變量之間的統計圖 plot(x1,y1,main="統計圖1") plot(x2,y2,main="統計圖2") plot(x3,y3,main="統計圖3") plot(x4,y4,main="統計圖4")運行結果如下:
數據案例分析
1.一元線性回歸分析案例
案例數據
案例代碼
data<-read.csv("J:/應用回歸分析/R版/應用回歸分析R語言版原始數據/new1data2.2.csv",sep=",",head=T) attach(data)#將讀入的數據導入數據框中的探索路勁,方便下方數據框中x與y的探索 a<-c(mean(x),sd(x),mean(y),sd(y))#計算均值與方差 a cor(x,y,method="pearson")#pearson相關系數 cor.test(x,y) lmdata<-lm(y~x,data=data)#線性擬合 anova(lmdata)#計算方差 summary(lmdata)#回歸及顯著性檢驗 SRE<-rstandard(lmdata)#計算學生化殘差 SRE plot(x,SRE,xlab="城鎮居民人均收入",ylab="學生化殘差") plot(x,y,xlab="城鎮人均收入",ylab="城鎮人均支出") #預測人均收入x在800的人均支出y new<-data.frame(x=800)#將x=800導入數據庫 new a<-predict(lmdata,new,interval="prediction",level=0.95)#預測區間(prediction interval) a#查看預測空間以及預測值 b<-predict(lmdata,new,interval="confidence",level=0.95)#置信區間(confidence interval) b#查看置信區間 d<-resid(lmdata,digits=6)#將殘差賦值給d,保留6位小數 d detach(data)#將數據框剔除R路徑運行結果:
結果分析:
由圖可得,城鎮人均收入均值為2241.5950,方差為1572.6231;城鎮人均支出均值為1592.6082,方差為990.8777。
由圖可知,相關系數為0.9963804,樣本量為22,t值為52.419,p值遠遠小于0.05,說明其t檢驗顯著。綜合得到城鎮人均收入與城鎮人均支出有高度相關的線性關系。
由圖可得出,決定系數為0.9928,調整后的決定系數為0.9924,回歸方程的解釋程度為99.28%,回歸標準誤差86.31。
回歸方程為:
由圖可得,SSR=20469619,SSE=148992;F=2747.7.P<2.2e-16,說明解釋變量與被解釋變量之間構成的方程高度顯著。這跟相關系數檢驗一樣。
如圖所示是計算出的殘差值。
由圖可得,當人均收入為800時,人均支出為687.5764,預測空間在499.9982-875.1546之間;置信區間為634.9409-740.2118之間,預測概率為95%。
總結
以上是生活随笔為你收集整理的r语言线性回归_(R语言)线性回归:机器学习基础技术的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python3多线程第三方库_Pytho
- 下一篇: python将二维数组转换为一维数组_p