sklearn 中的 Iris 数据集
sklearn
· Scikit-learn(sklearn)是機器學習中常用的第三方模塊,對常用的機器學習方法進行了封裝,包括回歸(Regression)、降維(Dimensionality Reduction)、分類(Classfication)、聚類(Clustering)等方法。
· sklearn 中自帶的小型數據集:
 1. 鳶尾花數據集 load_iris():用于分類任務的數據集
 2. 手寫數據集 load_digits():用于分類任務或者降維任務的數據集
 3. 乳腺癌數據集 load-barest-cancer():簡單經典的用于二分類任務的數據集
 4. 糖尿病數據集 load-diabetes():經典的用于回歸認為的數據集,值得注意的是,這10個特征中的每個特征都已經被處理成0均值,方差歸一化的特征值
 5. 波士頓房價數據集 load-boston():經典的用于回歸任務的數據集
 6. 體能訓練數據集 load-linnerud():經典的用于多變量回歸任務的數據集
Iris 數據集
· Iris (/?a?r?s/) 數據集是機器學習任務中常用的分類實驗數據集,由Fisher在1936年整理。
· Iris :Anderson’s Iris data set, 中文名稱:安德森鳶尾花數據集
· Iris 數據集一共包含150個樣本,分3類,每類50個數據,每個數據包含4個特征。4個特征分別為: Sepal.Length(花萼長度)、Sepal.Width(花萼寬度)、Petal.Length(花瓣長度)、Petal.Width(花瓣寬度),特征值都為正浮點數,單位為厘米。根據4個特征預測鳶尾花屬于 Iris Setosa(山鳶尾)、Iris Versicolour(雜色鳶尾),Iris Virginica(維吉尼亞鳶尾)
測試
import numpy as np from sklearn import datasets def load_data():iris = datasets.load_iris()# 數據共 150 行 ,4 列print(iris.data.shape)# 150 行數據 對應 150 個標簽值(種類)print(iris.target.shape) if __name__ == "__main__":load_data()總結
以上是生活随笔為你收集整理的sklearn 中的 Iris 数据集的全部內容,希望文章能夠幫你解決所遇到的問題。
                            
                        - 上一篇: 终于有人将进程间通信讲明白了
 - 下一篇: Linux内核入门之路 (非广告)