.mat,.txt,.csv 数据转换为weka中的arff格式及matlab和Weka之间相互转换格式
在RUSBoost和SMOTEBoost中提供了csv轉換為arff格式的方法,詳見CSVtoARFF.m
http://www.mathworks.com/matlabcentral/fileexchange/37315-rusboost
http://cn.mathworks.com/matlabcentral/fileexchange/37311-smoteboost
該方法的不足之處就是要單獨提供ARFFheader.txt ,很多情況下,該表頭需要人工添加(屬性少時),但當屬性大時,相對較麻煩,還是可以通過程序循環添加。
下面給出一個可以直接將.mat,.txt和.csv格式轉換為weka中的arff格式
http://www.aiseminar.com/bbs/forum.php?mod=viewthread&tid=1058
最后給出關于weka數據處理的簡明介紹。
數據挖掘簡述和weka介紹–數據挖掘學習和weka使用(一)
輸入數據與ARFF文件–數據挖掘學習和weka使用(二)
簡單總結一下:
weka中的arff格式數據是由兩部分組成:頭部定義和數據區。
頭部定義包含了關系名稱(relation name)、一些屬性(attributes)和對應的類型,如
NUMERIC說明其為數字型,屬性class的取值是限定的,只能是Iris-setosa,Iris-versicolor,Iris-virginica中的一個。數據類型還可以是string和data數據區有@data開頭,如:
@DATA 5.1,3.5,1.4,0.2,Iris-setosa 4.9,3.0,1.4,0.2,Iris-setosa 4.7,3.2,1.3,0.2,Iris-setosa 4.6,3.1,1.5,0.2,Iris-setosa 5.0,3.6,1.4,0.2,Iris-setosa 5.4,3.9,1.7,0.4,Iris-setosa 4.6,3.4,1.4,0.3,Iris-setosa 5.0,3.4,1.5,0.2,Iris-setosa 4.4,2.9,1.4,0.2,Iris-setosa 4.9,3.1,1.5,0.1,Iris-setosa因此,完整的一個arff文件如下:
@RELATION iris@ATTRIBUTE sepallength NUMERIC @ATTRIBUTE sepalwidth NUMERIC @ATTRIBUTE petallength NUMERIC @ATTRIBUTE petalwidth NUMERIC @ATTRIBUTE class {Iris-setosa,Iris-versicolor,Iris-virginica}@DATA 5.1,3.5,1.4,0.2,Iris-setosa 4.9,3.0,1.4,0.2,Iris-setosa 4.7,3.2,1.3,0.2,Iris-setosa 4.6,3.1,1.5,0.2,Iris-setosa 5.0,3.6,1.4,0.2,Iris-setosa 5.4,3.9,1.7,0.4,Iris-setosa 4.6,3.4,1.4,0.3,Iris-setosa 5.0,3.4,1.5,0.2,Iris-setosa 4.4,2.9,1.4,0.2,Iris-setosa 4.9,3.1,1.5,0.1,Iris-setosa更多細節可查看
http://weka.wikispaces.com/ARFF+%28stable+version%29#Sparse%20ARFF%20files
weka使用自己的文件格式,叫做ARFF,如果想從*matlab和Weka之間相互轉換,這里有現成的package*:
http://www.mathworks.com/matlabcentral/fileexchange/21204-matlab-weka-interface
不要以為下載下來就能用,你會在如下地方報錯:
if(~wekaPathCheck),wekaOBJ = []; return,endimport weka.core.converters.ArffLoader;import java.io.File;Tricky的事情就是得把weka.jar加入到matlab的classpath.txt列表。classpath.txt在哪兒?到matlab的command窗口敲:
which classpath.txt D:\CMWang\MATLABR2014b\toolbox\local\classpath.txt然后就是到classpath.txt里加入一行,weka.jar的絕對路徑,例如:
C:\Program Files\Weka-3-8 \weka.jar這樣就配置完畢了。
該部分參考 http://blog.sciencenet.cn/blog-248606-433590.html
總結
以上是生活随笔為你收集整理的.mat,.txt,.csv 数据转换为weka中的arff格式及matlab和Weka之间相互转换格式的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 广州银行美团信用卡额度多少?怎么提额?
- 下一篇: 北京银行信用卡制卡要多久能到?卡片审核要