當(dāng)前位置：首頁(yè) > 编程语言 > python >内容正文

python

python调用sklearn中朴素贝叶斯踩坑

發(fā)布時(shí)間：2025/3/15 python 16 豆豆

生活随笔收集整理的這篇文章主要介紹了 python调用sklearn中朴素贝叶斯踩坑小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

??調(diào)用結(jié)構(gòu)：

from sklearn.naive_bayes import MultinomialNB # 從sklean.naive_bayes里導(dǎo)入樸素貝葉斯模型 from sklearn.feature_extraction.text import CountVectorizer # 從sklearn.feature_extraction.text里導(dǎo)入文本特征向量化模塊# change_X_train是訓(xùn)練集樣本，change_Y_train是訓(xùn)練集標(biāo)簽 # 這里面的change_X_train和,change_Y_train必須是str類型的列表 vec = CountVectorizer(analyzer = 'char', lowercase=False) X_train = vec.fit_transform(change_X_train) X_test = vec.transform(change_X_test)#3.使用樸素貝葉斯進(jìn)行訓(xùn)練 mnb = MultinomialNB() # 使用默認(rèn)配置初始化樸素貝葉斯 mnb.fit(X_train, y_train) # 利用訓(xùn)練數(shù)據(jù)對(duì)模型參數(shù)進(jìn)行估計(jì) y_predict = mnb.predict(X_test) # 對(duì)參數(shù)進(jìn)行預(yù)測(cè)#4.獲取結(jié)果報(bào)告 print ('The Accuracy of Naive Bayes Classifier is:', mnb.score(X_test, y_test))

相關(guān)報(bào)錯(cuò)一：AttributeError:‘numpy.ndarray’ object has no attribute ‘lower’
??這個(gè)報(bào)錯(cuò)是因?yàn)閿?shù)據(jù)類型是，numpy下的array類型，需要使用tolist()函數(shù)將變量變成list型。一般是標(biāo)準(zhǔn)化后變成了ndarray，也可取消標(biāo)準(zhǔn)化

相關(guān)報(bào)錯(cuò)二：‘list’ object has no attribute ‘lower’
??這個(gè)報(bào)錯(cuò)是因?yàn)閟klearn中的樸素貝葉斯訓(xùn)練數(shù)據(jù)集必須是[‘1 1 1’, ‘2 2 2’, …, ’ n n n’]這種每項(xiàng)數(shù)據(jù)類型是str的列表。將所有的數(shù)據(jù)換成str就好了

相關(guān)報(bào)錯(cuò)三：ValueError: empty vocabulary; perhaps the documents only contain stop words
??這個(gè)報(bào)錯(cuò)是CountVectorizer參數(shù)設(shè)置的問(wèn)題，不能使用默認(rèn)配置

不能是：vec = CountVectorizer() 需要是：vec = CountVectorizer(analyzer = 'char', lowercase=False)

總結(jié)

以上是生活随笔為你收集整理的python调用sklearn中朴素贝叶斯踩坑的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

python

python调用sklearn中朴素贝叶斯踩坑

??調(diào)用結(jié)構(gòu)：

總結(jié)