首页(175) 数据挖掘研究(27) 数据挖掘实践(53) 数据挖掘介绍(25) 杂谈(59) 管理页面   写新日志   退出   关于IDMer

 Blog信息
 
blog名称:IDMer (数据挖掘者)
日志总数:175
评论数量:848
留言数量:119
访问次数:2318419
建立时间:2005年6月24日

 日志更新
 

 我的相册
 

It's me!


 最新评论
 

 留言板
 

 链接
 

 联系方式

 日志搜索





 公告
“数据挖掘者”博客已经搬家,欢迎光临新博客网址:http://idmer.blog.sohu.com
我的新浪微博:
@张磊IDMer
 网络日志
笑声中的经典:上班族黑话全接触!!!
数据挖掘者 发表于 2007-1-27 22:22:04
转自:http://cn.bbs.yahoo.com/message/read_%C9%BD%B6%AB%C2%DB%CC%B3_14095.html

  纯属戏说,请勿对号入座!

  如果你在一家大公司工作,那么你很可能会定期接受人事部门的考评,得到一两句简短的评语,但你了解它们的意思吗?

   1.普通员工          (不是太聪明)
   2.格外出色          (目前还没犯错误)
   3.善于社交          (能喝)
   4.观察能力强 

阅读全文(2982) | 回复(1) | 编辑 | 精华 | 删除
SAS公司CEO Jim Goodnight访谈 
数据挖掘者 发表于 2007-1-25 18:05:09
转自:http://sasor.feoh.net/modules.php?name=News&file=categories&op=newindex&catid=1 SAS的创始人和CEO Jim Goodnight,他担任这个职位刚刚超过30年,而他领导的公司创造了统计分析。ZDNet UK采访了在日内瓦参加公司年会的Goodnight,采访中向他问起了 SAS下一个核心软件版本、应用开发的未来、他的计划,以及他的生活计划。 30年前,Jim Goodnight和John Sall成立了一家名为SAS Institute的公司(现名为SAS),并将这家公司培养为一家拥有17亿英镑营业额的大型软件开发和人力资源管理厂商。 在这些年里,Goodnight一直严格地管理着这家公司,让它成长为大型应

阅读全文(2523) | 回复(0) | 编辑 | 精华 | 删除
第24届全国数据库学术会议(NDBC2007)征文通知
数据挖掘者 发表于 2007-1-23 14:36:32
转自:http://www.ccf-dbs.org.cn/ndbc/article_155.html

第24届全国数据库学术会议(NDBC2007)征文通知
2007年10月19 - 21日,海南 海口
http://www.hainu.edu.cn/ndbc2007     第24届全国数据库学术会议(
阅读全文(2808) | 回复(0) | 编辑 | 精华 | 删除
《越狱》(Prison Break)全家福
数据挖掘者 发表于 2007-1-23 13:35:11
《越狱》(Prison Break)应该是我去年至今爱看的一部美剧,紧凑的剧情、鲜明的角色都是值得让人去欣赏的。目前第2季播到13集,期待尽快看到下面将要发生的故事。 BTW:《二十四小时》(24 hours)已经出第6季了,发现我根本提不起兴趣看。相同的套路重复多次,已经没有了初看第一季时的感觉。 《越狱》相关的一些链接: 新浪网影音娱乐:http://ent.sina.com.cn/v/u/f/prisonbreak/index.html
IMDB(The Internet Movie Database):http://www.imdb.com/title/tt0455275/

《越狱》宣传海报:
阅读全文(3283) | 回复(1) | 编辑 | 精华 | 删除
Weka入门教程(3)
数据挖掘者 发表于 2007-1-18 22:35:42
转自:http://bbs.wekacn.org/viewtopic.php?t=9

3. 分类与回归
背景知识
WEKA把分类(Classification)和回归(Regression)都放在“Classify”选项卡中,这是有原因的。
在这两个任务中,都有一个目标属性(输出变量)。我们希望根据一个样本(WEKA中称作实例)的一组特征(输入变量),对目标进行预测。为了实现这一目的,我们需要有一个训练数据集,这个数据集中每个实例的输入和输出都是已知的。观察训练集中的实例,可以建立起预测的模型。有了这个模型,我们就可以新的输出未知的实例进行预测了。衡量模型的好坏就在于预测的准确程度。
在WEKA中,待预测的目标(输出)被称作Class属性,这应该是来自分类任务的“类”。一般的,若Class属性是分类型时我们的任务才叫分类,
阅读全文(49484) | 回复(22) | 编辑 | 精华 | 删除
Weka入门教程(2)
数据挖掘者 发表于 2007-1-18 22:33:01
转自:http://bbs.wekacn.org/viewtopic.php?t=9

3.数据准备

使用WEKA作数据挖掘,面临的第一个问题往往是我们的数据不是ARFF格式的。幸好,WEKA还提供了对CSV文件的支持,而这种格式是被很多其他软件所支持的。此外,WEKA还提供了通过JDBC访问数据库的功能。
在这一节里,我们先以Excel和Matlab为例,说明如何获得CSV文件。然后我们将知道CSV文件如何转化成ARFF文件,毕竟后者才是WEKA支持得最好的文件格式。面对一个ARFF文件,我们仍有一些预处理要做,才能进行挖掘任务。

.* -> .csv
我们给出一个CSV文件的例子(
阅读全文(23347) | 回复(6) | 编辑 | 精华 | 删除
Weka入门教程(1)
数据挖掘者 发表于 2007-1-18 22:29:16
转自:http://bbs.wekacn.org/viewtopic.php?t=9

目录
1. 简介
2. 数据格式
3. 数据获取与预处理
3. 关联规则(购物篮分析)
4. 分类与回归
5. 聚类分析


1. 简介

WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),它的源代码可通过http://www.cs.waikato.ac.nz/ml/weka得到。同时weka也是新西兰的一种鸟名,而WEK
阅读全文(43739) | 回复(11) | 编辑 | 精华 | 删除
[转] ERP的下一个浪潮BI,当SAP遇到SAS
数据挖掘者 发表于 2007-1-18 10:48:27
http://www.amteam.org/static/69388.html ERP的下一个浪潮BI,当SAP遇到SAS
 企业资源管理-ERP>TONY在线>综合 文档号:00.069.388 发布时间:10-08-2005

在管理应用软件市场中,SAP可以说是一个绝对的领导者,从2001年度到2004年度,全球企业管理应用软件厂商TOP 100中,SAP一直稳居
阅读全文(3370) | 回复(0) | 编辑 | 精华 | 删除
« 1 2 3 4 5 6 7 8 9 10 »


站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.063 second(s), page refreshed 144322200 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号