本站首页    管理页面    写新日志    退出



公告


 求真务实打基础,
 宁缺毋滥读好书。

数据挖掘青年(DMman)


我的分类(专题)

日志更新
问君能有几多愁,恰似一群太监上青楼
我和僵尸有个约会:灵异世界或真实存在?
赤壁(下)观后小感:雷人
英科学家:酒精和烟草的危害大于大麻和摇头
只有社会主义才能拯救世界(由金融危机引发
求职心得(非名牌院校 硕士 计算机)
省外就业协议录入
数据挖掘方面的资源、期刊、会议的网址集合
面试心得(摘)
为学
EI收录中国期刊-核心(2008-5)
混沌理论:随机世界的建模
分子计算机已经问世,纳米计算机指日可待?
绝对好用免费的网络电话
NLP:基于机器学习的人类思想及行为建模
Weka中用于组合多个模型的的装袋、提升
数据挖掘在企业中应用的四种途径
(转)几点做人做事的建议
大学计算机软件专业生应该学什么(转)
一个程序员对学弟学妹建议(转)

最新评论

留言板

链接

Blog信息
blog名称:DMman(数据挖掘青年)
日志总数:102
评论数量:564
留言数量:57
访问次数:1764430
建立时间:2007年4月9日




[数据挖掘]Matlab的数据挖掘工具箱spider 
网上资源,  心得体会

数据挖掘青年 发表于 2007/8/19 16:17:35

  一 spider主页http://www.kyb.mpg.de/bs/people/spider/ (也可以在google上搜索spider matlab得到),关于它的介绍可以参考网址资料 二 使用时为matlab+spider+Weka;因为spider中的一些算法引用了Weka,比如j48 安装注意: 1 matlab7(R14)   6.5版本对java的支持不够,还没有开发javaclasspath等函数 ??? Undefined function or variable 'javaclasspath'.??? Undefined function or variable 'javaaddclasspath'. 2 jre1.4.2  matlab7自带的是1.4.2;matlab6自带的是1.3.可以在D:\MATLAB7\sys\java\jre\win32下看到。如果装了matlab7,使用它自带的1.4.2就可以了,尤其不要使用1.6,因为1.6太新了,matlab还不支持。可以在Matlab下使用 version -java查看JVM版本。  如果你想使用1.5的话,C:\Program Files\Java\jre1.5.0_10;把jre1.5.0_10这个文件夹拷贝到D:\MATLAB7\sys\java\jre\win32下,然后增加环境变量MATLAB_JAVA:D:\MATLAB7\sys\java\jre\win32\jre1.5.0_10。这一步如果有问题的话,重启Matlab会给出错误提示。找不到什么什么文件... 3 Weka3.4.10   使用weka版本低一些即可,高的不行,因为高版本的weka可能是用高版本的jvm支持的。 我使用的组合是 matlab7(R14)+jre1.4.2(matlab7自带的,不需要任何设置)+Weka3.4.10 weka 下载:http://www.cs.waikato.ac.nz/ml/weka/ 三 使用方法 1 下载spider,有core和extra两个压缩包,把他们解压到同一个文件夹spider下面,然后放到$matlabroot\toolbox下面 2下载weka3.4.10,找到weka.jar放到$matlabroot\java\jar下面 3 启动Matlab打开$matlabroot\toolbox\spider\use_spider.m运行 提示spider的一些信息和 WEKA support enabled!表示成功了。 然后可以使用 help spider命令查看信息,他的功能列出如附录,然后就可以训练了。 四 一个简单的例子 X=rand(50)-0.5; Y=sign(sum(X,2));dtrain=data(X,Y);%生成训练集,也可以使用load()从文件读取 model=train(svm,dtrain));%使用函数train()训练模型 rtest=test(dtest,model);%使用训练好的模型对验证集dtest测试,返回测试结果 五 附录spider信息 最新spider Version 1.71 (24/7/2006)  Basic library objects.     data         - Storing input data and output results     data_global  - Implementation of data object that limits memory overhead    algorithm    - Generic algorithm object    group        - Groups sets of objects together (algorithms or data)     loss         - Evaluates loss functions    get_mean     - Takes mean loss over groups of algs    chain        - Builds chains of objects: output of one to input of another    param        - To train and test different hyperparameters of an object    cv           - Cross validation using objects given data    kernel       - Evaluates and caches kernel functions    distance     - Evaluates and caches distance functions   Statistical Tests objects.    wilcoxon     - Wilcoxon test of statistical significance of results    corrt_test   - Corrected resampled t-test - for dependent trials   Dataset objects.    spiral       - Spiral dataset generator.    toy          - Generator of dataset with only a few relevant features    toy2d        - Simple 2d Gaussian problem generator    toyreg       - Linear Regression with o outputs and n inputs    Pre-Processing objects    normalize    - Simple normalization of data    map          - General user specified mapping function of data   Density Estimation objects.    parzen       - Parzen's windows kernel density estimator    indep        - Density estimator which assumes feature independence    bayes        - Classifer based on density estimation for each class    gauss        - Normal distribution density estimator                       Pattern Recognition objects.    svm          - Support Vector Machine (svm)    c45          - C4.5 for binary or multi-class     knn          - k-nearest neighbours    platt        - Conditional Probability estimation for margin classifiers    mksvm        - Multi-Kernel LP-SVM    anorm        - Minimize the a-norm in alpha space using kernels    lgcz         - Local and Global Consistent Learner     bagging      - Bagging Classifier    adaboost     - ADABoost method    hmm          - Hidden Markov Model     loom         - Leave One Out Machine     l1           - Minimize l1 norm of w for a linear separator     kde          - Kernel Dependency Estimation: general input/output machine    dualperceptron       - Kernel Perceptron    ord_reg_perceptron   - Ordinal Regression Perceptron (Shen et al.)    splitting_perceptron - Splitting Perceptron (Shen et al.)    budget_perceptron    - Sparse, online Pereceptron (Crammer et al.)    randomforest - Random Forest Decision Trees         WEKA-Required    j48          - J48 Decision Trees for binary        WEKA-Required   Multi-Class and Multi-label objects.     one_vs_rest  - Voting method of one against the rest (also for multi-label)    one_vs_one   - Voting method of one against one    mc_svm       - Multi-class Support Vector Machine by J.Weston    c45          - C4.5 for binary or multi-class     knn          - k-nearest neighbours                  Feature Selection objects.    feat_sel     - Generic object for feature selection + classifier    r2w2_sel     - SVM Bound-based feature selection    rfe          - Recursive Feature Elimination (also for the non-linear case)    l0           - Dual zero-norm minimization (Weston, Elisseeff)    fsv          - Primal zero-norm based feature selection (Mangasarian)    fisher       - Fisher criterion feature selection    mars         - selection algorithm of Friedman (greedy selection)    clustub      - Multi-class feature selection using spectral clustering    mutinf       - Mutual Information for feature selection.         Regression objects.    svr          - Support Vector Regression    gproc        - Gaussian Process Regression     relvm_r      - Relevance vector machine     multi_rr     - (possibly multi-dimensional) ridge regression       mrs          - Multivariate Regression via Stiefel Constraints          knn          - k-nearest neighbours    multi_reg    - meta method for independent multiple output regression    kmp          - kernel matching pursuit    kpls         - kernel partial least squares    lms          - least mean squared regression [now obselete due to multi_rr]    rbfnet       - Radial Basis Function Network (with moving centers)    reptree      - Reduced Error Pruning Tree       WEKA-Required   Model Selection objects.    gridsel      - select parameters from a grid of values     r2w2_sel     - Selecting SVM parameters by generalization bound    bayessel     - Bayessian parameter selection    Unsupervised objects.    one_class_svm - One class SVM    kmeans       - K means clustering    kvq          - Kernel Vector Quantization    kpca         - Kernel Principal Components Analysis    ppca         - Probabilistic Principal Component Analysis    nmf          - Non-negative Matrix factorization    spectral     - Spectral clustering    mrank        - Manifold ranking    ppca         - Probabilistic PCA   Reduced Set and Pre-Image objects.    pmg_mds      - Calculate Pre-Images based on multi-dimensional scaling    pmg_rr       - Calculate Pre-Images based on learning and ridge regression    rsc_burges   - Bottom Up Reduced Set; calculates reduced set based on gradient descent    rsc_fp       - Bottom Up Reduced Set; calculates reduced set for rbf with fixed-point iteration schemes    rsc_mds      - Top Down Reduced Set; calculates reduced set with multi-dimensional scaling    rsc_learn    - Top Down Reduced Set; calculates reduced set with ridge regression    rss_l1       - Reduced Set Selection via L1 penalization    rss_l0       - Reduced Set Selection via L0 penalization    rss_mp       - Reduced Set Selection via matching pursuit


阅读全文(35724) | 回复(15) | 编辑 | 精华
 


回复:Matlab的数据挖掘工具箱spider
网上资源,  心得体会

jessie(游客)发表评论于2007/9/14 18:26:39

我现在也在用spider做一些东西,可是我发现spider存在不少问题,希望能和你多交流,能给我你的联系方式吗 谢谢:-) 以下为blog主人的回复:  太客气了:)


个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:Matlab的数据挖掘工具箱spider
网上资源,  心得体会

烟雨朦胧发表评论于2007/8/31 18:54:54

向你问好1 以下为blog主人的回复:  谢谢~~

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:Matlab的数据挖掘工具箱spider
网上资源,  心得体会

烟雨朦胧发表评论于2007/8/31 18:53:53

来看看你啊。

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:Matlab的数据挖掘工具箱spider
网上资源,  心得体会

datamining(游客)发表评论于2007/8/29 15:09:50

谢谢您的回复,我去看看,哈哈:只是英文太差,以后多关照! 以下为blog主人的回复:  客气了 我英文也不咋地。不过觉得看英文论文有两个好处:质量比较高,也可以学习下英语~~

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:Matlab的数据挖掘工具箱spider
网上资源,  心得体会

DATAMINING(游客)发表评论于2007/8/20 22:50:01

我的研究方向是空间数据挖掘,我刚开始这方面的学习,希望能多多指教! 你可否提供一些遥感影像的栅格数据的挖掘的具体实现的材料,我找了很久都没有结果! 谢谢!我的e-mail: fxlht@163.com 以下为blog主人的回复:  中文的资料少,您可以直接找些英文的看。搜索英文论文的网站(前2个我经常用,文章都是免费的) http://citeseer.ist.psu.edu/ 按照引用次数列出搜索结果 可以查到本领域经典的文章 http://www.sciencedirect.com/按照时间列出搜索结果 可以查到本领域最新的文章http://dblp.uni-trier.de/http://www.computer.org/portal/site/ieeecs/index.jsphttp://smealsearch2.psu.edu/index.html/http://portal.acm.org/portal.cfmhttp://www.vldb.org/

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


» 1 2 »

发表评论:
昵称:
密码:
主页:
标题:
验证码:  (不区分大小写,请仔细填写,输错需重写评论内容!)



站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.379 second(s), page refreshed 144792298 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号