花瓣长度和花瓣宽度散点图鸢尾花_基于python的鸢尾花简单聚类模型分析
1、導(dǎo)入數(shù)據(jù)
#導(dǎo)入花萼數(shù)據(jù) from sklearn.datasets import load_iris iris=load_iris() iris.data前四列為花萼長(zhǎng)度,花萼寬度,花瓣長(zhǎng)度,花瓣寬度等4個(gè)用于識(shí)別鳶尾花的屬性
2、建模
#創(chuàng)建kmeans聚類(lèi) from sklearn.cluster import KMeans kmeans=KMeans(n_clusters=3,init='k-means++',random_state=123) #分為三類(lèi) y_kmeans=kmeans.fit_predict(iris.data) y_kmeans可以看出0聚類(lèi)得很好,但是2當(dāng)中夾雜著1,1中夾雜著2,1和2存在混淆
3、可視化聚類(lèi)模型
import matplotlib.pyplot as plt #畫(huà)出了三個(gè)類(lèi)的中心點(diǎn)位置 plt.scatter(iris.data[y_kmeans==0,2],iris.data[y_kmeans==0,3],s=100,c='red',label='Cluter 1') plt.scatter(iris.data[y_kmeans==1,2],iris.data[y_kmeans==1,3],s=100,c='blue',label='Cluter 2') plt.scatter(iris.data[y_kmeans==2,2],iris.data[y_kmeans==2,3],s=100,c='green',label='Cluter 3')plt.scatter(kmeans.cluster_centers_[:,2],kmeans.cluster_centers_[:,3],s=100,c='black',label='Controids') plt.legend() plt.show()從圖上可以看出,第0類(lèi)為花瓣長(zhǎng)度,花瓣寬度較低的類(lèi)別,第1類(lèi)為花瓣長(zhǎng)度,花瓣寬度居中的類(lèi)別,圖中黑點(diǎn)為三個(gè)類(lèi)別的中心點(diǎn)
4、模型優(yōu)化
對(duì)于聚類(lèi)模型,分多少類(lèi)是關(guān)鍵點(diǎn),每類(lèi)數(shù)據(jù)到其中心點(diǎn)的距離之和,值越小據(jù)類(lèi)越好,但是當(dāng)類(lèi)別越多,k自然就越小,值對(duì)應(yīng)的也就越小,因此有一種判定方法當(dāng)快速下降趨于平緩下降的轉(zhuǎn)折點(diǎn),為聚類(lèi)的最好情況。
vess=[] for i in range(1,4):kmeans=KMeans(n_clusters=i,init='k-means++',random_state=42)kmeans.fit(iris.data)vess.append(kmeans.inertia_)#kmeans.inertia_ 每類(lèi)數(shù)據(jù)到其中心點(diǎn)的距離之和 plt.plot(range(1,4),vess) plt.show()可以發(fā)現(xiàn)到橫坐標(biāo)為2時(shí),中心點(diǎn)距離緩慢下降,所以分成兩類(lèi)會(huì)比較好
以上簡(jiǎn)單的聚類(lèi)模型建立完畢啦,后續(xù)再優(yōu)化吧
總結(jié)
以上是生活随笔為你收集整理的花瓣长度和花瓣宽度散点图鸢尾花_基于python的鸢尾花简单聚类模型分析的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: python怎么输入一个数字并调用_py
- 下一篇: linux安装网卡驱动tgz,Linux