UCI数据集中文介绍:Waveform Database Generator (Version 1) Data Set
看論文用到了該數(shù)據(jù)集,沒找到中文描述,且官網(wǎng)上描述非常簡潔。所以查閱了原版書,將該數(shù)據(jù)集的介紹整理如下。
實(shí)驗(yàn)數(shù)據(jù)集:波形數(shù)據(jù)集(下載網(wǎng)址:UCI Machine Learning Repository: Waveform Database Generator (Version 1) Data Set)
樣本數(shù):5000,特征數(shù)量:21,用于分類,分為三類。
? ? ? ?該數(shù)據(jù)集收集的數(shù)據(jù)來自波形 中任意兩種波形的隨機(jī)凸組合。原始數(shù)據(jù)集用于分類問題,分為三個(gè)類別,每一類都由在添加了噪聲的整數(shù)處采樣的兩種波形的隨機(jī)凸組合組成。(波形圖片在后文)
更具體地說,測量向量是21維的: 。要生成第1類向量 ,需要單獨(dú)生成一個(gè)均勻隨機(jī)數(shù)u和21個(gè)符合正態(tài)分布(均值為0,方差為1)的隨機(jī)數(shù) 。然后設(shè)置:
要生成第2類向量,請重復(fù)上述操作并設(shè)置:
第3類向量由以下公式生成:
附上英文原版書頁面,作者是為了講清楚樹狀分類法舉的這個(gè)例子。所以該數(shù)據(jù)集可以用于分類問題,我看的論文中是將它進(jìn)行了預(yù)處理,做了離群點(diǎn)檢測問題(跑了下代碼感覺效果一般)。
?
總結(jié)
以上是生活随笔為你收集整理的UCI数据集中文介绍:Waveform Database Generator (Version 1) Data Set的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: 查看手机是否安装微信客户端
- 下一篇: halcon资料链接
