首页(175) 数据挖掘研究(27) 数据挖掘实践(53) 数据挖掘介绍(25) 杂谈(59) 管理页面   写新日志   退出   关于IDMer

 Blog信息
 
blog名称:IDMer (数据挖掘者)
日志总数:175
评论数量:848
留言数量:119
访问次数:2538378
建立时间:2005年6月24日

 日志更新
 

 我的相册
 

It's me!


 最新评论
 

 留言板
 

 链接
 

 联系方式

 日志搜索





 公告
“数据挖掘者”博客已经搬家,欢迎光临新博客网址:http://idmer.blog.sohu.com
我的新浪微博:
@张磊IDMer
 网络日志
留言板(签写留言)

客户流失
sparkle(游客)发表留言于2007/5/31 18:17:58
您好,我现在在做本科毕设,是关于电信客户流失预测的。虽然题目没什么新意,我还是想做点东西出来。只是我一直没找到可用的数据集,不知道您是否了解哪能找到相关资源?您提供的数据集资源地址我已经看过……多谢!

以下为blog主人的回复:

兄弟,勤快点啊,用Google搜索“churn dataset”之类就可以了。

下面给你个搜索的结果:
http://www.fuqua.duke.edu/centers/ccrm/datasets/download.html#data

| 编辑 | 主人回复 | 删除
数据挖掘中银行方面的应用?
candy(游客)发表留言于2007/5/28 8:37:10
您好:
  有个问题向您咨询下。我正在做数据挖掘中的CRM的应用。我在网上搜索到了一个Finacial 方面的数据,无非是一些帐户的转帐等信息,我就是有点搞不清楚我需要从这方面得到些什么有用的信息。我初步打算做一个简易的银行交易系统,利用那些数据,然后决策树以及K均值算法来分析。可是我们导师老是在我的创新点在哪里。其实国内关于这个问题的研究已经很多,我实在不知道怎么办了,希望你能够指导我下:)

以下为blog主人的回复:

呵呵,“创新”是个很尖锐的问题。以前我帮导师审论文时,给论文评分包括几个要素,分别是理论基础是否坚实、研究问题的重要性、研究成果的创新性等。

所谓创新,就是你解决问题的方法是否和其他人的解决方法有所不同,而这种不同又是否更有利于解决问题。因此,要发现创新点,实际上需要充分的准备和深入的研究。

①充分的准备:既然创新是找出解决问题的更好方法,那么首先你就要发现问题,而且要发现有价值的问题。当找到这种问题时,再去查找有没有人提出了解决这个问题的方法,他们的方法是怎样的,还存在什么不足之处。
这个阶段需要做大量的调查搜集的工作,也是做研究的准备阶段,常常需要通读相关研究领域的经典文献以及最新进展,写读书笔记予以总结。

②深入的研究:当你发现了值得研究的问题,并且知道在这个问题上还没有很好的解决方法时,你就有了创新的机会。找出现有解决方法的不足之处,提出自己的解决思路,并予以验证,通过试验或者推理证明你的方法是有效的,创新点也就产生了。说起来容易做起来难,就象酝酿一个新发明一样,常常会需要大量的试验和周密的思考,而且也有可能忙了很久而一无所获。

希望说到这里没有让你心生惧怕,但我见过的一些认真做研究的人的确投入了很多的时间和精力才有所成就。当然对于国内的研究生来说,我倒是觉得在硕士阶段去追求显著的创新是不切实际的(个人的一管之见),其实把第一步做好已经不错了。如果没有做好第一步,打好基础,就急于找些创新点,那么这些所谓的创新点常常是毫无意义的,写出来的论文最终避免不了被扔到垃圾桶的命运(我以前写的一些论文也是如此)。大家常常说国内的研究论文质量很差,很大程度上也是源于我们现在的教育制度,要求研究生毕业前必须在SCI、EI或核心期刊上发表若干篇论文,重量而不重质,造就了现在的核心期刊完全变成了完成毕业任务的自留地。

话题扯远了,回到你关心的问题-如何找创新点。必要的文献阅读是不可缺的,了解研究现状和背景,才可能发现创新点。如果你想这个阶段快一些的话,也有些捷径,比如你可以到一些研究单位或学者的站点上,察看他们目前的研究动态,一般来说他们正在研究的内容常常是目前还未解决的,这样你可以尽快找到创新点的主攻方向。

很遗憾我无法给你指出具体的方向,因为毕业已经好几年了,工作内容也与研究没什么关系。如果读到我这篇回复的朋友中,和candy有类似的研究方向,欢迎给candy提些建议。

| 编辑 | 主人回复 | 删除
请问有关数据挖掘
anthea(游客)发表留言于2007/5/23 21:12:58

你好,想请教一下,我想了解数据挖掘的一些基本知识,看什么教材比较好(中外文均可),谢谢!

以下为blog主人的回复:

先看《数据挖掘:概念与技术》吧。

| 编辑 | 主人回复 | 删除
如何编写分类算法
wistaria(游客)发表留言于2007/5/22 11:50:43

我要自己写一个分类算法,可是我没有搞清楚那个buildClassifier和ClassifyInstance是如何调用的。另外问一下哪个分类算法是基于关联规则的?多谢了。

以下为blog主人的回复:

关于buildClassifier等的调用,建议你可以到Weka中文论坛(http://bbs.wekacn.org/)问一下。

基于关联规则的分类算法,如CMAR等,你可以通过Google搜索诸如“Classification Based on Multiple Class-Association Rules”即可。

| 编辑 | 主人回复 | 删除
留言数:135  « 11 12 13 14 15 16 17 18 19 20 »
给idmer签写留言:
昵称:
密码:
主页:
标题:
验证码:  (不区分大小写,请仔细填写,输错需重写留言内容!)


站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.750 second(s), page refreshed 144804683 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号