【机器学习】分类算法-sklearn转换器和估计器
生活随笔
收集整理的這篇文章主要介紹了
【机器学习】分类算法-sklearn转换器和估计器
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
目標
知道sklearn的轉換器和估計器流程
轉換器
想一下之前做的特征工程的步驟?
-
實例化 (實例化的是一個轉換器類(Transformer))
-
調用fit_transform(對于文檔建立分類詞頻矩陣,不能同時調用)
把特征工程的接口稱之為轉換器,其中轉換器調用有這么幾種形式
-
fit_transform
-
fit
-
transform
這幾個方法之間的區(qū)別是什么呢?看以下代碼就清楚了
In [1]: from sklearn.preprocessing import StandardScalerIn [2]: std1 = StandardScaler()In [3]: a = [[1,2,3], [4,5,6]]In [4]: std1.fit_transform(a) Out[4]: array([[-1., -1., -1.],[ 1., 1., 1.]])In [5]: std2 = StandardScaler()In [6]: std2.fit(a) Out[6]: StandardScaler(copy=True, with_mean=True, with_std=True)In [7]: std2.transform(a) Out[7]: array([[-1., -1., -1.],[ 1., 1., 1.]])從中可以看出,fit_transform的作用相當于transform加上fit。但是為什么還要提供單獨的fit呢,還是使用原來的std2來進行標準化看看。以a的平均值和標準差去轉換b
In [8]: b = [[7,8,9], [10, 11, 12]]In [9]: std2.transform(b) Out[9]: array([[3., 3., 3.],[5., 5., 5.]])In [10]: std2.fit_transform(b) Out[10]: array([[-1., -1., -1.],[ 1., 1., 1.]])估計器(sklearn機器學習算法的實現(xiàn))
在sklearn中,估計器(estimator)是一個重要的角色,是一類實現(xiàn)了算法的API
-
用于分類的估計器:
-
sklearn.neighbors k-近鄰算法
-
sklearn.naive_bayes 貝葉斯
-
sklearn.linear_model.LogisticRegression 邏輯回歸
-
sklearn.tree 決策樹與隨機森林
-
-
用于回歸的估計器:
-
sklearn.linear_model.LinearRegression 線性回歸
-
sklearn.linear_model.Ridge 嶺回歸
-
-
用于無監(jiān)督學習的估計器
- sklearn.cluster.KMeans 聚類
估計器工作流程
總結
以上是生活随笔為你收集整理的【机器学习】分类算法-sklearn转换器和估计器的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 我的图床设置PicGo
- 下一篇: 【机器学习】分类算法-K-近邻算法