基于朴素贝叶斯分类器的西瓜数据集 2.0 预测分类_机器学习之朴素贝叶斯
生活随笔
收集整理的這篇文章主要介紹了
基于朴素贝叶斯分类器的西瓜数据集 2.0 预测分类_机器学习之朴素贝叶斯
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1.貝葉斯原理
樸素貝葉斯分類(Naive Bayesian,NB)源于貝葉斯理論,是一類基于概率的分類器,其基本思想:假設樣本屬性之間相互獨立,對于給定的待分類項,求解在此項出現的情況下其他各個類別出現的概率。
樸素貝葉斯分類實現的三階段:
第一階段,準備工作。
根據具體情況確定特征屬性,并對每一特征屬性進行劃分,然后人工對一些待分類項進行分類,形成訓練樣本集合。
這一階段的輸入是所有待分類數據,輸出是特征屬性和訓練樣本。唯一需要人工處理的階段,質量要求較高。
第二階段,分類器訓練階段(生成分類器)。
計算每個類別在訓練樣本中出現頻率及每個特征屬性劃分對每個類別的條件概率估計,并將結果記錄。
其輸入是特征屬性和訓練樣本,輸出是分類器。
第三階段,應用階段。
使用分類器對待分類項進行分類,其輸入是分類器和待分類項,輸出是待分類項與類別的映射關系。
2.R語言貝葉斯網絡實現
- caret中train函數
- e1071包中的naiveBayes函數
- klaR包中的NavieBayes函數
2.1數據準備
我們將在Rstudio中使用這三種樸素貝葉斯函數對威斯康星州乳腺癌數據集進行分類。
#設置路徑
setwd("F:360MoveData甥敳獲Administrator.PC-201704251340Desktop機器學習課程決策樹")#讀入數據
breast#設置class為分類變量
df總結
以上是生活随笔為你收集整理的基于朴素贝叶斯分类器的西瓜数据集 2.0 预测分类_机器学习之朴素贝叶斯的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 两个list关联合并_算法分享---两个
- 下一篇: python数字转对应中文_python