首页(175) 数据挖掘研究(27) 数据挖掘实践(53) 数据挖掘介绍(25) 杂谈(59) 管理页面   写新日志   退出   关于IDMer

 Blog信息
 
blog名称:IDMer (数据挖掘者)
日志总数:175
评论数量:848
留言数量:119
访问次数:2300340
建立时间:2005年6月24日

 日志更新
 

 我的相册
 

It's me!


 最新评论
 

 留言板
 

 链接
 

 联系方式

 日志搜索





 公告
“数据挖掘者”博客已经搬家,欢迎光临新博客网址:http://idmer.blog.sohu.com
我的新浪微博:
@张磊IDMer
 网络日志
自我介绍
数据挖掘者 发表于 2009-1-14 17:27:46
先来个自我介绍: IDMer,男,居住北京,现在某国际数据挖掘领导厂商就职,担任首席咨询顾问职位 教育背景 理学学士(计算数学)、工学硕士(数据仓库)、中科院计算所工学博士(数据挖掘、信息检索) 工作经验 1993年本科毕业后,在中科院任研究实习员,进行数值模拟、神经网络方面研究。 2002年博士毕业后,在某国际数据仓库领导厂商就职,历任Technical Consultant、Technical Manager和Senior Manager,参与了移动通信行业多个DW和DM项目,项目角色分别为数据挖掘专员、技术经理等。作为Team Leader,带领中国区DM团队成功实施了一系列DM专题和项目(客户流失预测、客户价值分析、客户信用度分析、营销预演、交叉销售等等)。 2005年,在某国际数据挖掘领导厂商就职,任Senior Consultant,负责数据挖掘产品及解决方案的售前及项目实施。 2006年,在全球最大餐饮集团开发部就职,任Development Insight Manager,历时7个月后回归北京。 学术研究 博士论文为“个性化信息分发及概念检索的研究” 在JCST、CODAS、全国数据库年会、全国人工智能年会发表过若干论文。 外语能力 大学时的一外为法语,当时听说读写熟练,现在基本忘光了;) 英语通过CET-6级 兴趣爱好 足球(在研究生队、计算所队、公司足球队、小区足球队均为前锋:-) 球类运动基本上都喜欢;旅游(喜欢另辟蹊径)、唱歌、滑雪、游泳 联系方式:500)this.width=500'>

阅读全文(86264) | 回复(64) | 编辑 | 精华
回复:自我介绍
xw(游客)发表评论于2010-3-10 20:40:07
张博士,您好! 我读过您写的介绍weka的文章,知道您对weka非常了解。所以向您请教一个关于weka的小问题。 我从http://www.cs.waikato.ac.nz/ml/weka/上下载了reuters21578-ModApte.tar.bz2,里面都是.arff文件。文件里的类别属性定义如下: @attribute acq {'\'(-inf-0.5]\'','\'(0.5-inf)\''} acq是一个类别的名称,我不清楚的是两个属性值中哪个表示类别“acq”的正例,哪个表示不属于类别“acq”,即反例

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
回复:自我介绍
tavidchen(游客)发表评论于2009-9-19 11:06:05
前辈,您好 我是一个研一的学生,导师给我定的是数据挖掘的研究方向,对数据挖掘不懂,觉得数据挖掘是不是搞理论的呀,曾经想过退学,不知数据挖掘的就业如何呢?想听听您对后辈我的建议,让我不再迷茫了,盼您的回复!谢谢
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
回复:自我介绍
kiwi(游客)发表评论于2009-6-9 15:29:26
老师您好,很高兴能够认识您,很欣赏也很羡慕您的智慧与才能!我有一问题想请教您,希望您能够给我指点迷津!在决策表的预处理中,有四个步骤:属性约简,数量属性值的区化,属性的归类,各型属性值的类化。类化、归类和类化到底有什么作用呢?
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
回复:自我介绍
好孩子boyme(游客)发表评论于2009-6-5 20:09:45
全文通读!!!
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
回复:自我介绍
求知者(游客)发表评论于2009-5-30 17:52:52
老师您好!我在做数据流频繁模式挖掘的研究,现在找到了一种数据流的频繁模式挖掘算法,但是实验测试的时候出现了问题,不知道该怎么用IBM的数据生成器生成数据集,能否介绍一下IBM生成器的具体使用步骤,不好意思我的编程知识较少,最好能介绍一下以C为主的生成器的使用方法!非常感谢! 以下为blog主人的回复: 参考:http://www.baisi.net/viewthread.php?tid=36012 IBM数据生成器 (关联规则 Agrewal R.所用的数据生成器)使用方法 : 在命令行输入参数 >gendata lit -help helpCommand Line Options:-ntrans number_of_transactions_in_000s (default: 1000)-tlen avg_items_per_transaction (default: 10)-nitems number_of_different_items_in_000s) (default: 100)-npats number_of_patterns (default: 10000)-patlen avg_length_of_maximal_pattern (default: 4)-corr correlation_between_patterns (default: 0.25)-conf avg_confidence_in_a_rule (default: 0.75)-fname <filename> (write to filename.data and filename.pat)-ascii (default: False)-randseed # (reset seed used generate to x-acts; must be negative)-version (to print out version info)>gendata lit -ntrans 100 -tlen 10 -ascii
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
前辈请为白纸指点迷经!
DM白纸(游客)发表评论于2009-5-6 12:43:53
前辈您好!跟踪您好久了!真有幸能找到您这块可以常常来学习的宝地!我是海南大学旅游管理的一名学生,今年就要做论文了。我的方向简单说就是通过对中文旅游博客进行文本挖掘,得出对某个旅游地有价值的信息,然后指导实践。针对我的情况,想让您帮我推荐一些合适的工具: 1、由于对编程知之甚少,可能不能对一些工具进行二次开发,所以最好是现成的工具; 2、支持中文文本挖掘:我本想采用ibm,sas或spss的软件,但是,我考察了这些好像只能英文文本挖掘,而我主要是对中文旅游博客的挖掘; 3、适合个人或小规模研究之用即可:同样,如果采用大型商业软件,我怕很多资源利用不上,出现闲置,可能会是种浪费。 白纸期待您的快复~~谢谢了~~~ 以下为blog主人的回复: 嗯,中文文本挖掘,估计你需要自己开发不少代码了。当然可以找些开源的文本挖掘程序作为基础,比如RainBow。这个是文本分类的程序,我以前读书时用过。但它是针对英文的,你需要编写程序来处理中文。 商用软件中SAS是支持中文文本挖掘的,是SAS Text Miner。 下面的链接介绍了一些文本挖掘工具:http://mingo.info-science.uiowa.edu/padmini/22c196/AKSTextTools.ppt
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
请教
挖掘爱好者(游客)发表评论于2009-3-28 21:04:25
博主好!我是一个从事数据分析、数据挖掘的新人,看到您的介绍,很是钦佩,有几个问题想请教:客户价值分析、客户信用度分析,虽然有不少文章谈论这些,但是目前没有发现好的跟实际业务结合起来的,只是在大方向上或者定性的分析一下。实际工作中,我们如何将理论应用在实际行业中,通过业务的哪些层面来很好的度量,譬如说通信行业? 以下为blog主人的回复: 这个话题讲起来就是长篇大论了,实际上在电信行业前几年就已经做过很多这样的项目了,比如移动的经营分析系统,比如中国电信的MR项目等等,建议你到网上搜些相关的材料。
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
回复:自我介绍
kimi(游客)发表评论于2009-3-18 22:36:54
 希望你是一盏明灯 以下为blog主人的回复: 我不算是明灯,还不能做到“燃烧了自己,照亮了别人”。也许我更象一只萤火虫罢,自在地在夜里飞来飞去……
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
» 1 2 3 4 5 6 7 8 »

发表评论:
昵称:
密码:
主页:
标题:
验证码:  (不区分大小写,请仔细填写,输错需重写评论内容!)


站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.063 second(s), page refreshed 144269057 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号