Blog信息 |
|
blog名称:IDMer (数据挖掘者) 日志总数:175 评论数量:848 留言数量:119 访问次数:2488510 建立时间:2005年6月24日 |
我的相册 |
|

|
联系方式 |
 |
|
| |
公告 |
“数据挖掘者”博客已经搬家,欢迎光临新博客网址:http://idmer.blog.sohu.com 我的新浪微博:@张磊IDMer |
网络日志 |
|
自我介绍 |
|
|
|
|
|
数据挖掘者 发表于 2009/1/14 17:27:46 |
|
|
|
先来个自我介绍:
IDMer,男,居住北京,现在某国际数据挖掘领导厂商就职,担任首席咨询顾问职位
教育背景
理学学士(计算数学)、工学硕士(数据仓库)、中科院计算所工学博士(数据挖掘、信息检索)
工作经验
1993年本科毕业后,在中科院任研究实习员,进行数值模拟、神经网络方面研究。
2002年博士毕业后,在某国际数据仓库领导厂商就职,历任Technical Consultant、Technical Manager和Senior Manager,参与了移动通信行业多个DW和DM项目,项目角色分别为数据挖掘专员、技术经理等。作为Team Leader,带领中国区DM团队成功实施了一系列DM专题和项目(客户流失预测、客户价值分析、客户信用度分析、营销预演、交叉销售等等)。
2005年,在某国际数据挖掘领导厂商就职,任Senior Consultant,负责数据挖掘产品及解决方案的售前及项目实施。
2006年,在全球最大餐饮集团开发部就职,任Development Insight Manager,历时7个月后回归北京。
学术研究
博士论文为“个性化信息分发及概念检索的研究”
在JCST、CODAS、全国数据库年会、全国人工智能年会发表过若干论文。
外语能力
大学时的一外为法语,当时听说读写熟练,现在基本忘光了;)
英语通过CET-6级
兴趣爱好
足球(在研究生队、计算所队、公司足球队、小区足球队均为前锋:-)
球类运动基本上都喜欢;旅游(喜欢另辟蹊径)、唱歌、滑雪、游泳
联系方式:500)this.width=500'> |
|
|
|
阅读全文(98159) | 回复(64) | 编辑 | 精华 |
|
|
|
|
|
|
|
回复:自我介绍 |
|
|
|
|
|
飘遥(游客)发表评论于2008/6/2 20:13:56 |
|
|
|
老师您好!我现在刚开始接触数据挖掘方面,导师初步给定的研究方向是绩效评价方面。可现在我还感觉对数据挖掘的了解不是太深刻,有时感觉一头雾水,不知从何处下手。望老师能给一些建议。在此谢谢您了,急盼回复!!
我的邮箱是jjwei2003@yahoo.com.cn |
|
|
|
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除 |
|
|
|
|
|
|
|
回复:自我介绍 |
|
|
|
|
|
BirdOnSky(游客)发表评论于2008/5/11 10:42:23 |
|
|
|
我的QQ: 704082470加我 |
|
|
|
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除 |
|
|
|
|
|
|
|
回复:自我介绍 |
|
|
|
|
|
雪珊飘影(游客)发表评论于2008/5/10 12:57:11 |
|
|
|
您好,很幸运的看到您的blog.我今年考上了人民大学信息学院的研究生,也就是原来的统计学院,师从李翠平老师,研究数据挖掘,现在感觉自己的编程的底子还很差,以后学习上有什么问题还需要前辈多指点,我的msn是xueshanpiaoying@hotmail.com
以下为blog主人的回复:
呵呵,是李翠平的学生啊,那你应该叫我师伯了;)
欢迎交流! |
|
|
|
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除 |
|
|
|
|
|
|
|
回复:自我介绍 |
|
|
|
|
|
神威(游客)发表评论于2008/5/8 14:26:00 |
|
|
|
IDMer:
您好!经常到您的主页查看相关资料,收获颇多,希望多多和你交流!
随着机器学习领域不断的发展,越来越多的人参与该领域的研究!个人博客“神威异度空间”(http://huangbo929.blog.edu.cn)访问量突破71万人,由于博客的种种限制,如上传、下载设置限制等;同时个人的精力也有限,为了更好的网聚资源,给大家一个更好的交流平台!本人特开创“神威智能挖掘中心”:http://www.kankano.cn,旨在为更多的学者提供方便,打造一个全新的智能挖掘平台!为此,特在首页开辟特邀专家栏目,想请您作为本站的专家!一些领域的相关求助问题,希望得到您的帮助和指导!期待得到您的支持!
现已将您的个人主页添加到友情链接!
欢迎登陆“神威智能挖掘中心”网站:http://www.kankano.cn
神威智能挖掘中心 |
|
|
|
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除 |
|
|
|
|
|
|
|
N-gram TFIDF processes design by Rapidminer GUI |
|
|
|
|
|
Jacob L(游客)发表评论于2008/4/11 15:02:47 |
|
|
|
Dear Dr. SunstoneThis is a student in Taiwan(ROC).I will like to design a N-gram TFIDF processes for making aclassification model by Rapidminer GUI environment.
As the followings, I show the rough steps about N-gram TFIDF processes :
Root TextInput StringTokenizer EnglishStopWordFilter TokenLengthFilter ToLowerCaseConverter NGramTokenizer PorterStemmer LibSVMLearner ModelWriter
But I got a bad classifiying results than without ToLowerCaseConverterand NGramTokenizer as the followings :
Root TextInput StringTokenizer EnglishStopWordFilter TokenLengthFilter PorterStemmer LibSVMLearner ModelWriter
Could you be kind enough to give me a hand to design a N-gram TFIDF processes.
Best Regard.
PS:my mail: ukljm.2005@gmail.com
Jacob L
以下为blog主人的回复:
Hi Jacob,
I guess you are trying to make a classifier for English text, is that right? Sometimes ToLowerCaseConverter and NGramTokenizer doesn't run well, because some keywords are case sensitive. So that lowercase and uppercase form have different means, which have negative effects to the classifier.NGramTokenizer maybe is heavily dependent on the text corpus which is used in the training step. So you'd better have a try on larger training sets.Best Regards,Sunstone |
|
|
|
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除 |
|
|
|
|
|
|
|
张博士,你好,请教二个问题. |
|
|
|
|
|
Henry(游客)发表评论于2008/4/7 17:31:30 |
|
|
|
张博士,你好,我是管理学院的老师,信息学院硕士,管理学院博士,现在在做软件风险规则发现的研究。
有几个问题请教:
第一,Weka中的Cost Sensitive是怎么用的。
第二,我们在现实一种Knowledge Based Artificial Neural Network, KBANN的算法,用于发现规则。现在用遗传算法太慢(有一百多个重权要优化),跑一次要二周多。用BP又很麻烦。如果用一些现成的软件,有那些软件可以用户根据自己的需要建立NN的结构,并且,输出权值。这样我们就可以根据权值建立基于KBNN的规则。顺便问一下,在一些好的国际杂志上,必须用交叉验证做实验才可以得到认可?关于NN的规则提取,你有什么建议?
以下为blog主人的回复:
您好!1.关于weka的问题建议您问问Dmman吧,我不怎么用weka。2.网上可以搜索到现成的BP程序,如果找不到,可以给我发mail。NN的规则提取?不太明白。神经网络最大的弱点就是可解释性差,常常被比喻成黑盒子,因为中间有了隐层节点,导致节点连接上的权重已经难以说明是代表了什么含义。所以我觉得想从NN充提取规则,难度太大了。(南京大学的周志华在NN上的研究比较深入,你可以到他的主页上看看) |
|
|
|
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除 |
|
|
|
|
|
|
|
博主,您好,久仰大名啊,有具体的问题想请教!!! |
|
|
|
|
|
veraxxrr(游客)发表评论于2008/3/20 22:42:31 |
|
|
|
您好,呵呵,朋友推荐您的Blog给我,想必一定是高手啊,有个问题想请教:
现在有心脏病人的大量体检数据,囊括各种常见体检指标,我希望能够搭建一个模型,实现对发病概率的预测。比如,来一个病人的体检信息,能够预测他未来1年,3年,5年的发病概率,用曲线图展示出来。
我觉得朴素贝叶斯分类器可能比较适合,因它可得出概率值,但是跟时间没有关联。
暂时没有任何其它思路,您怎样认为呢,盼给出具体的建议,谢谢赐教,盼百忙中能帮忙
我的邮箱veraxxrr@126.com
以下为blog主人的回复:
已经在您另一个留言中回复了。 |
|
|
|
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除 |
|
|
|
|
|
|
|
回复:自我介绍 |
|
|
|
|
|
安(游客)发表评论于2008/3/2 21:59:26 |
|
|
|
您好。很抱歉打扰您。
我是一名大三本科生,专业是电子商务。因为对搜索引擎很感兴趣,所以零零散散的读了一些数据挖掘方面的论文,事实上依旧才疏学浅。因为学校的专业偏重于Web开发(尤其是前端开发),所以也没有切实的机会深入研究数据仓库和数据挖掘,本来是计划去找工作的。如今已经3月分了,却觉得还是很想弄明白那些理论,想深入的了解和学习,也许是带着些不知者无畏的意思吧。最终下定决心,继续考研究生,学习数据挖掘。
事实上,我的专业是攀在管理类下的管理科学与技术,而数据挖掘是攀在计算机科学学科下的,重点专业课和数学方面的差距都是蛮大的。我本身还是女生,给家里的压力也很大,所以做考研这样的决定是很需要勇气的。
不知道您能不能提供一些关于数据挖掘在高校中的研究情况,哪些学校的成果多些或者哪个学者比较优秀。
杂七杂八的说了那么多,抱歉打扰您。无论是否能提供帮助,都万分感谢。
以下为blog主人的回复:
非计算机专业的本科生,建议还是看看在管理类或统计类的专业中找找看有无数据挖掘相关的专业可以报考,否则可能在研究生阶段需要补习不少的计算机专业知识。推荐的院校是人民大学的统计系、北京大学的光华管理学院等。 |
|
|
|
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除 |
|
|
|
|
|
|
| |