本站首页    管理页面    写新日志    退出



公告


 求真务实打基础,
 宁缺毋滥读好书。

数据挖掘青年(DMman)


我的分类(专题)

日志更新
问君能有几多愁,恰似一群太监上青楼
我和僵尸有个约会:灵异世界或真实存在?
赤壁(下)观后小感:雷人
英科学家:酒精和烟草的危害大于大麻和摇头
只有社会主义才能拯救世界(由金融危机引发
求职心得(非名牌院校 硕士 计算机)
省外就业协议录入
数据挖掘方面的资源、期刊、会议的网址集合
面试心得(摘)
为学
EI收录中国期刊-核心(2008-5)
混沌理论:随机世界的建模
分子计算机已经问世,纳米计算机指日可待?
绝对好用免费的网络电话
NLP:基于机器学习的人类思想及行为建模
Weka中用于组合多个模型的的装袋、提升
数据挖掘在企业中应用的四种途径
(转)几点做人做事的建议
大学计算机软件专业生应该学什么(转)
一个程序员对学弟学妹建议(转)

最新评论

留言板

链接

Blog信息
blog名称:DMman(数据挖掘青年)
日志总数:102
评论数量:564
留言数量:57
访问次数:1763107
建立时间:2007年4月9日




[数据挖掘]数据挖掘的数据集资源收集 
网上资源

数据挖掘青年 发表于 2007/4/16 11:55:39

 DMman按:以下链接转自互联网,链接的有效性与可用价值DMman没有逐个进行测试。  1、气候监测数据集 http://cdiac.ornl.gov/ftp/ndp026b 2、几个实用的测试数据集下载的网站 http://www.cs.toronto.edu/~roweis/data.htmlhttp://www.cs.toronto.edu/~roweis/data.htmlhttp://kdd.ics.uci.edu/summary.task.type.htmlhttp://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-20/www/data/http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/http://www.phys.uni.torun.pl/~duch/software.html在下面的网址可以找到reuters数据集http://www.research.att.com/~lewis/reuters21578.html以下网址上有各种数据集:http://kdd.ics.uci.edu/summary.data.type.html进行文本分类,还有一个数据集是可以用的,即rainbow的数据集http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html 3、找了很多测试数据集,写论文的同志们肯定需要的,至少能用来检验算法的效果可能有一些不能访问,但是总有能访问的吧: UCI收集的机器学习数据集ftp://pami.sjtu.edu.cn/http://www.ics.uci.edu/~mlearn//MLRepository.htm statlib http://liama.ia.ac.cn/SCILAB/scilabindexgb.htmhttp://lib.stat.cmu.edu/ 样本数据库http://kdd.ics.uci.edu/http://www.ics.uci.edu/~mlearn/MLRepository.html 关于基金的数据挖掘的网站http://www.gotofund.com/index.asp http://lans.ece.utexas.edu/~strehl/ reuters数据集http://www.research.att.com/~lewis/reuters21578.html 各种数据集:http://kdd.ics.uci.edu/summary.data.type.htmlhttp://www.mlnet.org/cgi-bin/mlnetois.pl/?File=datasets.htmlhttp://lib.stat.cmu.edu/datasets/http://dctc.sjtu.edu.cn/adaptive/datasets/ http://fimi.cs.helsinki.fi/data/http://www.almaden.ibm.com/software/quest/Resources/index.shtmlhttp://miles.cnuce.cnr.it/~palmeri/datam/DCI/ 进行文本分类&WEBhttp://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html http://www.w3.org/TR/WD-logfile-960221.htmlhttp://www.w3.org/Daemon/User/Config/Logging.html#AccessLoghttp://www.w3.org/1998/11/05/WC-workshop/Papers/bala2.htmlhttp://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/http://www.web-caching.com/traces-logs.htmlhttp://www-2.cs.cmu.edu/webkbhttp://www.cs.auc.dk/research/DP/tdb/TimeCenter/TimeCenterPublications/TR-75.pdfhttp://www.cs.cornell.edu/projects/kddcup/index.html 时间序列数据的网址http://www.stat.wisc.edu/~reinsel/bjr-data/ apriori算法的测试数据http://www.almaden.ibm.com/cs/quest/syndata.html 数据生成器的链接http://www.cse.cuhk.edu.hk/~kdd/data_collection.htmlhttp://www.almaden.ibm.com/cs/quest/syndata.html 关联:http://flow.dl.sourceforge.net/sourceforge/weka/regression-datasets.jarhttp://www.almaden.ibm.com/software/quest/Resources/datasets/syndata.html#assocSynData WEKA:http://flow.dl.sourceforge.net/sourceforge/weka/regression-datasets.jar1。A jarfile containing 37 classification problems, originally obtained from the UCI repositoryhttp://prdownloads.sourceforge.net/weka/datasets-UCI.jar2。A jarfile containing 37 regression problems, obtained from various sourceshttp://prdownloads.sourceforge.net/weka/datasets-numeric.jar3。A jarfile containing 30 regression datasets collected by Luis Torgohttp://prdownloads.sourceforge.net/weka/regression-datasets.jar 癌症基因:http://www.broad.mit.edu/cgi-bin/cancer/datasets.cgi 金融数据:http://lisp.vse.cz/pkdd99/Challenge/chall.htm   另一个人提供的http://www.cs.toronto.edu/~roweis/data.htmlhttp://kdd.ics.uci.edu/summary.task.type.htmlhttp://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-20/www/data/http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/http://www.phys.uni.torun.pl/~duch/software.html在下面的网址可以找到reuters数据集http://www.research.att.com/~lewis/reuters21578.html 以下网址上有各种数据集:http://kdd.ics.uci.edu/summary.data.type.html 进行文本分类,还有一个数据集是可以用的,即rainbow的数据集http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html Download the Financial Data (~17.5M zipped file, ~67M unzipped data) Download the Medical Data (~2M zipped file, ~6M unzipped data)http://lisp.vse.cz/pkdd99/Challenge/chall.htm kdnuggets 相关链接数据集(借花献佛了):http://www.kdnuggets.com/datasets/index.html 你也可以到http://blogger.org.cn/blog/more.asp?name=idmer&id=24017察看kdnuggets 数据集资源的详细介绍。


阅读全文(31951) | 回复(2) | 编辑 | 精华
 


回复:数据挖掘的数据集资源收集
网上资源

dataminer(游客)发表评论于2007/7/5 17:09:57

多谢多谢!!!多向你学习~~~ 以下为blog主人的回复:  客气了,互相交流~@


个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:数据挖掘的数据集资源收集
网上资源

红豆(游客)发表评论于2007/4/17 22:06:22

太好了,省了我的时间了

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


» 1 2 »

发表评论:
昵称:
密码:
主页:
标题:
验证码:  (不区分大小写,请仔细填写,输错需重写评论内容!)



站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.354 second(s), page refreshed 144754444 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号