公告 |
求真务实打基础, 宁缺毋滥读好书。
数据挖掘青年(DMman) |
链接 |
|
Blog信息 |
blog名称:DMman(数据挖掘青年) 日志总数:102 评论数量:564 留言数量:57 访问次数:1763107 建立时间:2007年4月9日 |

| |
[数据挖掘]数据挖掘的数据集资源收集  网上资源
数据挖掘青年 发表于 2007/4/16 11:55:39 |
DMman按:以下链接转自互联网,链接的有效性与可用价值DMman没有逐个进行测试。
1、气候监测数据集 http://cdiac.ornl.gov/ftp/ndp026b
2、几个实用的测试数据集下载的网站
http://www.cs.toronto.edu/~roweis/data.htmlhttp://www.cs.toronto.edu/~roweis/data.htmlhttp://kdd.ics.uci.edu/summary.task.type.htmlhttp://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-20/www/data/http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/http://www.phys.uni.torun.pl/~duch/software.html在下面的网址可以找到reuters数据集http://www.research.att.com/~lewis/reuters21578.html以下网址上有各种数据集:http://kdd.ics.uci.edu/summary.data.type.html进行文本分类,还有一个数据集是可以用的,即rainbow的数据集http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html
3、找了很多测试数据集,写论文的同志们肯定需要的,至少能用来检验算法的效果可能有一些不能访问,但是总有能访问的吧:
UCI收集的机器学习数据集ftp://pami.sjtu.edu.cn/http://www.ics.uci.edu/~mlearn//MLRepository.htm
statlib http://liama.ia.ac.cn/SCILAB/scilabindexgb.htmhttp://lib.stat.cmu.edu/
样本数据库http://kdd.ics.uci.edu/http://www.ics.uci.edu/~mlearn/MLRepository.html
关于基金的数据挖掘的网站http://www.gotofund.com/index.asp
http://lans.ece.utexas.edu/~strehl/
reuters数据集http://www.research.att.com/~lewis/reuters21578.html
各种数据集:http://kdd.ics.uci.edu/summary.data.type.htmlhttp://www.mlnet.org/cgi-bin/mlnetois.pl/?File=datasets.htmlhttp://lib.stat.cmu.edu/datasets/http://dctc.sjtu.edu.cn/adaptive/datasets/ http://fimi.cs.helsinki.fi/data/http://www.almaden.ibm.com/software/quest/Resources/index.shtmlhttp://miles.cnuce.cnr.it/~palmeri/datam/DCI/
进行文本分类&WEBhttp://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html
http://www.w3.org/TR/WD-logfile-960221.htmlhttp://www.w3.org/Daemon/User/Config/Logging.html#AccessLoghttp://www.w3.org/1998/11/05/WC-workshop/Papers/bala2.htmlhttp://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/http://www.web-caching.com/traces-logs.htmlhttp://www-2.cs.cmu.edu/webkbhttp://www.cs.auc.dk/research/DP/tdb/TimeCenter/TimeCenterPublications/TR-75.pdfhttp://www.cs.cornell.edu/projects/kddcup/index.html
时间序列数据的网址http://www.stat.wisc.edu/~reinsel/bjr-data/
apriori算法的测试数据http://www.almaden.ibm.com/cs/quest/syndata.html
数据生成器的链接http://www.cse.cuhk.edu.hk/~kdd/data_collection.htmlhttp://www.almaden.ibm.com/cs/quest/syndata.html
关联:http://flow.dl.sourceforge.net/sourceforge/weka/regression-datasets.jarhttp://www.almaden.ibm.com/software/quest/Resources/datasets/syndata.html#assocSynData
WEKA:http://flow.dl.sourceforge.net/sourceforge/weka/regression-datasets.jar1。A jarfile containing 37 classification problems, originally obtained from the UCI repositoryhttp://prdownloads.sourceforge.net/weka/datasets-UCI.jar2。A jarfile containing 37 regression problems, obtained from various sourceshttp://prdownloads.sourceforge.net/weka/datasets-numeric.jar3。A jarfile containing 30 regression datasets collected by Luis Torgohttp://prdownloads.sourceforge.net/weka/regression-datasets.jar
癌症基因:http://www.broad.mit.edu/cgi-bin/cancer/datasets.cgi
金融数据:http://lisp.vse.cz/pkdd99/Challenge/chall.htm
另一个人提供的http://www.cs.toronto.edu/~roweis/data.htmlhttp://kdd.ics.uci.edu/summary.task.type.htmlhttp://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-20/www/data/http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/http://www.phys.uni.torun.pl/~duch/software.html在下面的网址可以找到reuters数据集http://www.research.att.com/~lewis/reuters21578.html
以下网址上有各种数据集:http://kdd.ics.uci.edu/summary.data.type.html
进行文本分类,还有一个数据集是可以用的,即rainbow的数据集http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html
Download the Financial Data (~17.5M zipped file, ~67M unzipped data) Download the Medical Data (~2M zipped file, ~6M unzipped data)http://lisp.vse.cz/pkdd99/Challenge/chall.htm
kdnuggets 相关链接数据集(借花献佛了):http://www.kdnuggets.com/datasets/index.html
你也可以到http://blogger.org.cn/blog/more.asp?name=idmer&id=24017察看kdnuggets 数据集资源的详细介绍。 |
|
回复:数据挖掘的数据集资源收集 网上资源
dataminer(游客)发表评论于2007/7/5 17:09:57 |
多谢多谢!!!多向你学习~~~
以下为blog主人的回复:
客气了,互相交流~@ |
|
回复:数据挖掘的数据集资源收集 网上资源
红豆(游客)发表评论于2007/4/17 22:06:22 |
|
|