机器学习-分类算法-K-近邻算法06
生活随笔
收集整理的這篇文章主要介紹了
机器学习-分类算法-K-近邻算法06
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
K最近鄰(k-Nearest Neighbor,KNN)分類算法,是一個理論上比較成熟的方法,也是最簡單的機器學習算法之一。該方法的思路是:在特征空間中,如果一個樣本附近的k個最近(即特征空間中最鄰近)樣本的大多數屬于某一個類別,則該樣本也屬于這個類別。
我們對應上面的流程來說
1.給定了紅色和藍色的訓練樣本,綠色為測試樣本
2.計算綠色點到其他點的距離
3.選取離綠點最近的k個點
4.選取k個點中,同種顏色最多的類。例如:k=1時,k個點全是藍色,那預測結果就是Class 1;k=3時,k個點中兩個紅色一個藍色,那預測結果就是Class 2
相似的樣本,特征之間的值都是相近的。K-近鄰算法需要做標準化處理。
數據來源:https://www.kaggle.com/c/facebook-v-predicting-check-ins/data?select=train.csv.zip
需調優提高準確度
總結
以上是生活随笔為你收集整理的机器学习-分类算法-K-近邻算法06的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 机器学习-转换器与估计器05
- 下一篇: 机器学习-分类算法-朴素贝叶斯算法07