Python机器学习——线性模型
最近斷斷續(xù)續(xù)地在接觸一些python的東西。按照我的習(xí)慣,首先從應(yīng)用層面搞起,盡快入門,后續(xù)再細(xì)化一 些技術(shù)細(xì)節(jié)。找了一些資料,基本語法和數(shù)據(jù)結(jié)構(gòu)搞定之后,目光便轉(zhuǎn)到了scikit-learn這個包。這個包是基于scipy的統(tǒng)計(jì)學(xué)習(xí)包。里面所涵蓋 的算法接口非常全面。更令人振奮的是,其用戶手冊寫得非常好。然而,其被墻了(或者沒有,或者有時被墻有時又好了)。筆者不會翻墻(請嘲笑吧),筆者只有 找代理,筆者要忍受各種彈窗。因此筆者決定,做一個記錄,把這用戶手冊的內(nèi)容多多少少搬一點(diǎn)到我的博客中來。以備查詢方便。因此,筆者就動手了。
聲明:如何安裝python及其IDE,相關(guān)模塊等等不在本系列博客的范圍。本博客僅試圖記錄可能會用到的代碼實(shí)例。
1.廣義線性模型
這里的“廣義線性模型”,是指線性模型及其簡單的推廣,包括嶺回歸,lasso,LAR,logistic回歸,感知器等等。下面將介紹這些模型的基本想法,以及如何用python實(shí)現(xiàn)。
1.1.普通的最小二乘
由LinearRegression 函數(shù)實(shí)現(xiàn)。最小二乘法的缺點(diǎn)是依賴于自變量的相關(guān)性,當(dāng)出現(xiàn)復(fù)共線性時,設(shè)計(jì)陣會接近奇異,因此由最小二乘方法得到的結(jié)果就非常敏感,如果隨機(jī)誤差出現(xiàn)什么波動,最小二乘估計(jì)也可能出現(xiàn)較大的變化。而當(dāng)數(shù)據(jù)是由非設(shè)計(jì)的試驗(yàn)獲得的時候,復(fù)共線性出現(xiàn)的可能性非常大。
from sklearn import linear_model clf = linear_model.LinearRegression() clf.fit ([[0,0],[1,1],[2,2]],[0,1,2]總結(jié)
以上是生活随笔為你收集整理的Python机器学习——线性模型的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 基于MATLAB的dijkstra算法及
- 下一篇: 【机器学习算法-python实现】扫黄神