python调用imblearn中SMOTE踩坑
                                                            生活随笔
收集整理的這篇文章主要介紹了
                                python调用imblearn中SMOTE踩坑
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.                        
                                ??SMOTE是用來(lái)解決樣本種類不均衡,專門用來(lái)過(guò)采樣化的一種方法。第一次接觸,踩了一些坑,寫這篇記錄一下:
問(wèn)題一:SMOTE包下載及調(diào)用
# 包下載 pip install imblearn# 調(diào)用 from imblearn.over_sampling import SMOTE # 使用SMOTE進(jìn)行過(guò)采樣時(shí)正樣本和負(fù)樣本要放在一起,生成比例1:1 smo = SMOTE(n_jobs=-1) # 這里必須是fit_resample(),有些版本是fit_sample()無(wú)法運(yùn)行 x_sampling, y_sampling = smo.fit_resample(train_x_data, train_y_data)對(duì)于SMOTE函數(shù)API參數(shù)如下:
API介紹imblearn.over_sampling.SMOTE( sampling_strategy = ‘a(chǎn)uto’, random_state = None, ## 隨機(jī)器設(shè)定 k_neighbors = 5, ## 用相近的 5 個(gè)樣本(中的一個(gè))生成正樣本 m_neighbors = 10, ## 當(dāng)使用 kind={'borderline1', 'borderline2', 'svm'} out_step = ‘0.5’, ## 當(dāng)使用kind = 'svm' kind = 'regular', ## 隨機(jī)選取少數(shù)類的樣本 – borderline1: 最近鄰中的隨機(jī)樣本b與該少數(shù)類樣本a來(lái)自于不同的類 – borderline2: 隨機(jī)樣本b可以是屬于任何一個(gè)類的樣本; – svm:使用支持向量機(jī)分類器產(chǎn)生支持向量然后再生成新的少數(shù)類樣本 svm_estimator = SVC(), ## svm 分類器的選取 n_jobs = 1, ## 使用的例程數(shù),為-1時(shí)使用全部CPU ratio=None )參考博客:https://blog.csdn.net/yeziyezi1986/article/details/103202012
問(wèn)題二:ValueError: Unknown label type: ‘continuous’
解決方法:標(biāo)簽類型必須是int型
參考博客:https://blog.csdn.net/qq_41870817/article/details/89419726
問(wèn)題三:ValueError: Expected n_neighbors <= n_samples, but n_samples = 1, n_neighbors = 6
解決方法:
 ??1.調(diào)整k_neighbors參數(shù)值
 ??2.復(fù)制數(shù)據(jù)集,讓數(shù)據(jù)條數(shù)多一點(diǎn)兒
參考博客:https://blog.csdn.net/weixin_45494978/article/details/107669996
 https://blog.csdn.net/LinJing_2020/article/details/104606596
最后留一個(gè)比較清晰的使用文章:
 https://blog.csdn.net/opp003/article/details/89920665
總結(jié)
以上是生活随笔為你收集整理的python调用imblearn中SMOTE踩坑的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
 
                            
                        - 上一篇: C/C++:Windows编程—MFC基
- 下一篇: Redis 与 key 相关的常用命令
