python调用sklearn中朴素贝叶斯踩坑
??調(diào)用結(jié)構(gòu):
from sklearn.naive_bayes import MultinomialNB # 從sklean.naive_bayes里導(dǎo)入樸素貝葉斯模型 from sklearn.feature_extraction.text import CountVectorizer # 從sklearn.feature_extraction.text里導(dǎo)入文本特征向量化模塊# change_X_train是訓(xùn)練集樣本,change_Y_train是訓(xùn)練集標(biāo)簽 # 這里面的change_X_train和,change_Y_train必須是str類型的列表 vec = CountVectorizer(analyzer = 'char', lowercase=False) X_train = vec.fit_transform(change_X_train) X_test = vec.transform(change_X_test)#3.使用樸素貝葉斯進(jìn)行訓(xùn)練 mnb = MultinomialNB() # 使用默認(rèn)配置初始化樸素貝葉斯 mnb.fit(X_train, y_train) # 利用訓(xùn)練數(shù)據(jù)對(duì)模型參數(shù)進(jìn)行估計(jì) y_predict = mnb.predict(X_test) # 對(duì)參數(shù)進(jìn)行預(yù)測(cè)#4.獲取結(jié)果報(bào)告 print ('The Accuracy of Naive Bayes Classifier is:', mnb.score(X_test, y_test))相關(guān)報(bào)錯(cuò)一:AttributeError:‘numpy.ndarray’ object has no attribute ‘lower’
 ??這個(gè)報(bào)錯(cuò)是因?yàn)閿?shù)據(jù)類型是,numpy下的array類型,需要使用tolist()函數(shù)將變量變成list型。一般是標(biāo)準(zhǔn)化后變成了ndarray,也可取消標(biāo)準(zhǔn)化
相關(guān)報(bào)錯(cuò)二:‘list’ object has no attribute ‘lower’
 ??這個(gè)報(bào)錯(cuò)是因?yàn)閟klearn中的樸素貝葉斯訓(xùn)練數(shù)據(jù)集必須是[‘1 1 1’, ‘2 2 2’, …, ’ n n n’]這種每項(xiàng)數(shù)據(jù)類型是str的列表。將所有的數(shù)據(jù)換成str就好了
相關(guān)報(bào)錯(cuò)三:ValueError: empty vocabulary; perhaps the documents only contain stop words
 ??這個(gè)報(bào)錯(cuò)是CountVectorizer參數(shù)設(shè)置的問(wèn)題,不能使用默認(rèn)配置
總結(jié)
以上是生活随笔為你收集整理的python调用sklearn中朴素贝叶斯踩坑的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
 
                            
                        - 上一篇: caffe学习路的起点
- 下一篇: Redis 哨兵模式
