.mat,.txt,.csv 数据转换为weka中的arff格式及matlab和Weka之间相互转换格式
在RUSBoost和SMOTEBoost中提供了csv转换为arff格式的方法,详见CSVtoARFF.m
http://www.mathworks.com/matlabcentral/fileexchange/37315-rusboost
http://cn.mathworks.com/matlabcentral/fileexchange/37311-smoteboost
该方法的不足之处就是要单独提供ARFFheader.txt ,很多情况下,该表头需要人工添加(属性少时),但当属性大时,相对较麻烦,还是可以通过程序循环添加。
下面给出一个可以直接将.mat,.txt和.csv格式转换为weka中的arff格式
http://www.aiseminar.com/bbs/forum.php?mod=viewthread&tid=1058
最后给出关于weka数据处理的简明介绍。
数据挖掘简述和weka介绍–数据挖掘学习和weka使用(一)
输入数据与ARFF文件–数据挖掘学习和weka使用(二)
简单总结一下:
weka中的arff格式数据是由两部分组成:头部定义和数据区。
头部定义包含了关系名称(relation name)、一些属性(attributes)和对应的类型,如
NUMERIC说明其为数字型,属性class的取值是限定的,只能是Iris-setosa,Iris-versicolor,Iris-virginica中的一个。数据类型还可以是string和data数据区有@data开头,如:
@DATA 5.1,3.5,1.4,0.2,Iris-setosa 4.9,3.0,1.4,0.2,Iris-setosa 4.7,3.2,1.3,0.2,Iris-setosa 4.6,3.1,1.5,0.2,Iris-setosa 5.0,3.6,1.4,0.2,Iris-setosa 5.4,3.9,1.7,0.4,Iris-setosa 4.6,3.4,1.4,0.3,Iris-setosa 5.0,3.4,1.5,0.2,Iris-setosa 4.4,2.9,1.4,0.2,Iris-setosa 4.9,3.1,1.5,0.1,Iris-setosa因此,完整的一个arff文件如下:
@RELATION iris@ATTRIBUTE sepallength NUMERIC @ATTRIBUTE sepalwidth NUMERIC @ATTRIBUTE petallength NUMERIC @ATTRIBUTE petalwidth NUMERIC @ATTRIBUTE class {Iris-setosa,Iris-versicolor,Iris-virginica}@DATA 5.1,3.5,1.4,0.2,Iris-setosa 4.9,3.0,1.4,0.2,Iris-setosa 4.7,3.2,1.3,0.2,Iris-setosa 4.6,3.1,1.5,0.2,Iris-setosa 5.0,3.6,1.4,0.2,Iris-setosa 5.4,3.9,1.7,0.4,Iris-setosa 4.6,3.4,1.4,0.3,Iris-setosa 5.0,3.4,1.5,0.2,Iris-setosa 4.4,2.9,1.4,0.2,Iris-setosa 4.9,3.1,1.5,0.1,Iris-setosa更多细节可查看
http://weka.wikispaces.com/ARFF+%28stable+version%29#Sparse%20ARFF%20files
weka使用自己的文件格式,叫做ARFF,如果想从*matlab和Weka之间相互转换,这里有现成的package*:
http://www.mathworks.com/matlabcentral/fileexchange/21204-matlab-weka-interface
不要以为下载下来就能用,你会在如下地方报错:
if(~wekaPathCheck),wekaOBJ = []; return,endimport weka.core.converters.ArffLoader;import java.io.File;Tricky的事情就是得把weka.jar加入到matlab的classpath.txt列表。classpath.txt在哪儿?到matlab的command窗口敲:
which classpath.txt D:\CMWang\MATLABR2014b\toolbox\local\classpath.txt然后就是到classpath.txt里加入一行,weka.jar的绝对路径,例如:
C:\Program Files\Weka-3-8 \weka.jar这样就配置完毕了。
该部分参考 http://blog.sciencenet.cn/blog-248606-433590.html
总结
以上是生活随笔为你收集整理的.mat,.txt,.csv 数据转换为weka中的arff格式及matlab和Weka之间相互转换格式的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: 广州银行美团信用卡额度多少?怎么提额?
- 下一篇: matlab中的类标转换程序