Blog信息 |
|
blog名称:IDMer (数据挖掘者) 日志总数:175 评论数量:848 留言数量:119 访问次数:2484536 建立时间:2005年6月24日 |
我的相册 |
|

|
联系方式 |
 |
|
| |
公告 |
“数据挖掘者”博客已经搬家,欢迎光临新博客网址:http://idmer.blog.sohu.com 我的新浪微博:@张磊IDMer |
网络日志 |
|
自我介绍 |
|
|
|
|
|
数据挖掘者 发表于 2009/1/14 17:27:46 |
|
|
|
先来个自我介绍:
IDMer,男,居住北京,现在某国际数据挖掘领导厂商就职,担任首席咨询顾问职位
教育背景
理学学士(计算数学)、工学硕士(数据仓库)、中科院计算所工学博士(数据挖掘、信息检索)
工作经验
1993年本科毕业后,在中科院任研究实习员,进行数值模拟、神经网络方面研究。
2002年博士毕业后,在某国际数据仓库领导厂商就职,历任Technical Consultant、Technical Manager和Senior Manager,参与了移动通信行业多个DW和DM项目,项目角色分别为数据挖掘专员、技术经理等。作为Team Leader,带领中国区DM团队成功实施了一系列DM专题和项目(客户流失预测、客户价值分析、客户信用度分析、营销预演、交叉销售等等)。
2005年,在某国际数据挖掘领导厂商就职,任Senior Consultant,负责数据挖掘产品及解决方案的售前及项目实施。
2006年,在全球最大餐饮集团开发部就职,任Development Insight Manager,历时7个月后回归北京。
学术研究
博士论文为“个性化信息分发及概念检索的研究”
在JCST、CODAS、全国数据库年会、全国人工智能年会发表过若干论文。
外语能力
大学时的一外为法语,当时听说读写熟练,现在基本忘光了;)
英语通过CET-6级
兴趣爱好
足球(在研究生队、计算所队、公司足球队、小区足球队均为前锋:-)
球类运动基本上都喜欢;旅游(喜欢另辟蹊径)、唱歌、滑雪、游泳
联系方式:500)this.width=500'> |
|
|
|
阅读全文(97799) | 回复(64) | 编辑 | 精华 |
|
|
|
|
|
|
|
回复:自我介绍 |
|
|
|
|
|
奔跑大狗(游客)发表评论于2009/2/13 22:17:39 |
|
|
|
IDMER老师您好。看了您的knime相关帖子,能否介绍一下怎样才能获得knime的代码并且构建它们?抱歉发在这里,实在太需要您的指点了,感觉这里您能及时看到。
以下为blog主人的回复:
你需要下载KNIME的开发版,源代码在“C:\Program Files\eclipse\plugins\org.knime.features.base.source_1.3.5\src\”目录下。至于如何构建,我没有仔细研究,你需要自己钻研了。KNIME是用Eclipse作为开发工具,使用Java开发的,所以这个开发版里内含了Eclipse。 |
|
|
|
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除 |
|
|
|
|
|
|
|
回复:自我介绍 |
|
|
|
|
|
lin(游客)发表评论于2009/2/2 12:59:47 |
|
|
|
IDMer老师,您好,很高兴认识您。我在美国念计算机硕士,研究领域是基于数据流的聚类算法(data stream clustering)。在IEEE的国际会议上发表了一篇相关文章。由于对数据挖掘的应用更感兴趣,所以不打算继续在学术界发展,想回国找份相关领域的工作。但由于对工业界不了解,不知如何下手。我想请问目前数据挖掘主要运用于那些行业呢?以我目前的背景在公司做什么样的工作比较适合呢?您可否介绍几个在数据挖掘领域做得比较好的相关公司?很崇拜您,今后也很希望能做一名专业顾问。期待您的答复。
祝新年快乐!
以下为blog主人的回复:
建议你如果有机会的话,还是先在国外工作几年。现在回国的海龟已经很多,用人单位也更重视应聘者的工作经验了。如果是毕业直接回国找工作,说老实话,没有太多优势。
按照SAS公司的全球市场份额的组成,主要的客户分布在银行、电信、制造业、医药等行业中。关于数据挖掘的知名公司,跟踪一下Gartner关于数据挖掘魔力象限的报告就知道了。 |
|
|
|
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除 |
|
|
|
|
|
|
|
回复:自我介绍 |
|
|
|
|
|
hjx_221发表评论于2009/2/2 3:09:10 |
|
|
|
(牛)气冲天!(年)轻有为!(大)庆六十!(吉)祥如意!happy 牛 year
以下为blog主人的回复:
也祝你牛年大吉! |
|
|
|
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除 |
|
|
|
|
|
|
|
回复:自我介绍 |
|
|
|
|
|
Alisa Tan(游客)发表评论于2008/11/19 19:15:53 |
|
|
|
I am headhunter.Wanna looking for Data mining dev.If any one interesting it.Pls contact me:anyt@talentpower.com.cn |
|
|
|
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除 |
|
|
|
|
|
|
|
回复:自我介绍 |
|
|
|
|
|
wutian(游客)发表评论于2008/8/25 22:36:30 |
|
|
|
老师,您好!
我是财经大学07年本科毕业的,所学专业是市场营销。因为我是女生,不太愿意做营销方面的工作,因此,毕业后到一家IT公司做oracle ERP 方面的测试,已有一年时间。粗浅了解了oracle EBS系统财务模块的知识,以及QC\QTP等测试软件的简单运用。
我本人对数据分析很感兴趣,我的数学也比较好,所以到了财经大学学文科感觉有些不得志。但是,我不知道如何走上做数据分析或者数据挖掘这条路。我看到前面的交流,大多情况是考研,专业也是数据挖掘或者统计。但经过我自己的分析,这种方式并不太适合我。
我已经毕业一年,现在也就是第二年了。就算今年考研考上了,硕士毕业也有27岁。那时,再出来找工作,从junior做起,感觉有些晚。同时,我计划后年结婚,因为婚后会以家庭为主,所以,那时再从头做起也会感觉力不从心。何况现在还在工作,加班频繁,回家复习的时间比较少。
我希望的生活状态也就是目标,是以后能做自己喜欢的工作,就潜力而言比较擅长的工作,如数据挖掘。但现在的工作,我也感觉比从前大学的文科好很多,至少我可以接触一下程序方面的东西,我自己也比较喜欢。所以,我也不会辞去现在的工作来考研。
所以,希望老师指点迷津。有什么别的办法能比较快的接触这个行业,或者是考个什么证,在下次找工作的时候,能往数据分析方向靠靠,一步一步地来,慢慢调整方向。
或者,就我的资历(虽然很浅,但我非常愿意一步一步扎实的做)和我的爱好做什么工作比较好,需要做什么准备。
真的非常非常谢谢老师!期待你的回复!万分感谢!
以下为blog主人的回复:
进入这个行业,也许最快的方法是做项目(如果是想进公司)或者发文章(如果是想以后做研究)。但是根据你的情况,似乎并不想从事相关的研究工作,所以可选的方向基本上是做数据挖掘的应用。对于有数据挖掘人才需求的公司来说,一般在招聘时会非常重视工作经验,比如你有没有做过相关的项目、有没有在相关的公司工作过等等。而对于没有这些工作经验的人来说,即便招进来也肯定会从Junior做起。
其实从Junior做起也未必是件坏事,重要的还是看有没有发展。 |
|
|
|
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除 |
|
|
|
|
|
|
|
求助关于WEKA的问题 |
|
|
|
|
|
hnuufish发表评论于2008/8/15 9:19:49 |
|
|
|
在Weka3.5版本里的Apriori算法能不能把运行的起始时间和终止时间的精度提高到百分之一秒,或干脆直接显示运行所花时间,当然也是到百分秒的精度。
另外,能否显示候选项集和频繁项集的数目呢?
以下为blog主人的回复:
Sorry,对Weka不熟悉,请咨询一下DMman。 |
|
|
|
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除 |
|
|
|
|
|
|
|
回复:自我介绍 |
|
|
|
|
|
ant210(游客)发表评论于2008/7/30 13:17:12 |
|
|
|
您好,通过计算机科学论坛找到您的Blog,看了您的文章真是受益匪浅。现在有个问题向您请教:
我想做一个类似http://del.icio.us的网站,每个用户都可以把自己感觉兴趣的网页(只是URL)收藏到该站点上,这有些类似于浏览器的收藏夹,所不同的是浏览器的收藏夹的本地保存,而现在是保存在网站服务器上,而且必须用标签(tag)归类。这个叫社会书签(Socail Bookmark)
原始数据有用户名,保存时间,URL,TAG等,我想挖掘和某个用户同类型的用户,并且给用户推荐符合用户需求的TAG或URL,不知应如何实现。
能否指点实现思路或建议,谢谢!
以下为blog主人的回复:
这个和我原来读博士时选择的研究方向很近,我当时的研究课题是“个性化信息分发和概念检索”。你如果在网上搜索“Personalized Information Dispatch”、“Information Recommendation”等等,可以找到相关的内容。
常见的推荐方法包括:1.对用户进行聚类,把有类似偏好的用户聚在一起,然后把用户群的整体偏好推荐其中的各个用户;2.利用关联分析和序列分析,找出不同TAG之间的关联性,然后再把关联性最强的TAG推荐给特定用户;3.如果你可以收集到用户对推荐内容的评分,还可以建立分类模型,进一步找出哪些推荐是真正让用户感兴趣的。4.Netflix公司刚刚举办了一次竞赛,就是通过数据挖掘来提高向其用户推荐电影的成功率。你可以搜索相关资料,进行借鉴。 |
|
|
|
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除 |
|
|
|
|
|
|
|
回复:自我介绍 |
|
|
|
|
|
努力成】(游客)发表评论于2008/7/11 16:20:23 |
|
|
|
您好!我是一名研二的学生。一直研究数据挖掘。我的专业是计算机软件与理论。
知道您在数据挖掘方面很有成就,想向您请教个问题。我的毕业论文想写关联规则的算法研究及其应用。我已经发表过两篇小论文,是关联规则的算法改进,并用c++实现了算法。打算把小论文融入毕业论文。我想在大论文中加入个实际的应用案例,正在学习SAS。我的问题是我可不可以把我的改进算法和实际案例分开来。也就是说我自己的研究成果就是小论文的改进算法,实际应用的案例我用SAS来做。这样做是不是不合理啊!还有个问题,因为我的专业是计算机软件与理论。我可不可以只研究算法不研究实际案例,但是又担心这样会缺乏经验而找不到和数据挖掘相关的工作!
请专家指点迷津啊! |
|
|
|
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除 |
|
|
|
|
|
|
| |