«September 2025»
123456
78910111213
14151617181920
21222324252627
282930

公告

欢迎到我的另一个家:http://haonan917.blog.163.com/ 。You can contact me at 163.com@haonan917.


导航
首页(102)
ComputerBy-talk(5)
商业智能(19)
English(6)
JAVA(5)
数据库(5)
读书笔记(1)
我爱电影(2)
数据挖掘(40)
开心一刻(5)
天下杂谈(14)
网易之道(3)

最新更新
国际版淘宝--速卖通多个职位虚位以待!
我的新浪微博,欢迎关注与交流
互联网产品数据化运营(一)氛围
一个合格数据分析人员的能力
TTNN BI观点 线下活动聚会——北京
网络用户行为挖掘的营销应用小结(转载)
新书介绍:Avinash的《网站分析2.
网站流量数据分析技巧【转】
libsvm-2.88中文帮助文档
2008,商业智能从业者曾如是说

新回复
回复:Apriori-java实现源码
回复:终于成功安装带EM的SAS9.1.
回复:终于成功安装带EM的SAS9.1.
回复:终于成功安装带EM的SAS9.1.
回复:终于成功安装带EM的SAS9.1.
回复:Apriori-java实现源码
回复:终于成功安装带EM的SAS9.1.
回复:互联网产品数据化运营(一)氛围
回复:互联网产品数据化运营(一)氛围
回复:终于成功安装带EM的SAS9.1.

留言
签写新留言

毕业论文
硕士论文写的什么方向,借点光
学习交流
1111
zzzzzz
急死我了
求助
请教
联系
请联系我

blog信息
blog名称:DMFighter(数据挖掘斗士)
日志总数:102
评论数量:527
留言数量:17
访问次数:918215
建立时间:2007年8月22日

链接

 我的HappyFranc

BICubes商务智能社区

     TTNN

SAS中文论坛

数据挖掘者博客

数据挖掘青年的博客

挖掘与人生

神威智能挖掘中心

神威异度空间

陆振波个人空间

Jerome's BI BLOG

Junelf's BLOG

Focus on BI'Blog

weka中文站论坛

weka英文站

数据挖掘讨论组

DataSciencesAnalyticsWebolg

数据挖掘研究院

ACM KDD Group

DataMining Course

中国商业智能网

 
















 


 把数据转化成智慧,并执行之

本站首页    管理页面    写新日志    退出

[数据挖掘]从数据中挖掘价值
DMFighter 发表于 2008/6/18 15:35:11

  从数据中挖掘价值 SAS软件有限公司资深顾问 张磊博士 2007(第五届)中国数据管理技术应用年会     我们今年年会的主题也是数据挖掘与信息整合,我的演讲题目正好切合这个主题。那么什么叫数据挖掘呢,这个名词估计大家不太陌生,已经听说很多次了。数据挖掘英文名字就是Data Mining,我们到底要从数据里面挖掘什么,就是要从数据里面挖掘有价值的东西。      我演讲的报告分为两部分,一,是SAS数据挖掘的简介,包括公司和数据挖掘的简介。二,数据挖掘应用,关于客户细分和交叉销售。      首先为大家介绍一下SAS软件公司,基本上我们一谈到数据挖掘的产品、软件公司的话,大家都会想到SAS这个名字。SAS这三个字母其实是统计分析系统英文的缩写。SAS从1976年开始创办的。2006年SAS营收全球达到了19亿美元,它和其他的IT软件公司不太一样,它把25%的营收放在研发里面,支撑我们业务的增长。我们SAS的客户到底有哪些?2006年财富500强前100位中的97家,2005年财富500强前100位中的96家。这是我们获得的一些奖项,我就不一一述说了,都获得了广泛认可。这个评估报告是最新的,包括我们做商业智能、内容管理、知识管理数据挖掘领域里面作的评比,大家看到数据整合、数据挖掘,多渠道营销管理,商业智能平台、知识管理领域里面我们都是领导者。      SAS1989年进入中国,到今天已经是18年了,北京、上海、广州、香港、台湾都有我们的分公司,在2004年专门成立了SAS中国研究院,也是一个非常大的研发机构。以上这是SAS公司的简介,我们虽然是以统计分析起家,但是现在已经步入到数据挖掘各个领域里了。接下来就是对数据挖掘的见解。     关于数据挖掘,大家听说过这个名词,但实际上大家对数据挖掘有很多的问题,包括什么是数据挖掘,为什么要做数据挖掘,数据挖掘到底可以做什么,然后怎么做,等等这些问题。      首先我们来看为什么数据挖掘现在变成热门的名词,这跟整个用户的需求是密不可分的。刚才胡总也说过,我们拿到的信息是冰山一角,有大量的信息都埋葬在企业里面。很多企业跟我说,我的数据积累越来越多,但是做任何决策的时候,还是像以前那么多困难,为什么?就是我们数据很多,但是从数据里面抓到的有用信息并没有同步增长,我们数据挖掘要做的就是这件事。      数据挖掘进入中国也有好几年了。前几天有人在我的博客上面问我一个问题,他说前一段时间看了一篇文章,数据挖掘是大忽悠,还是有萌动少年?就是数据挖掘说了那么多,但没有什么实际应用。数据挖掘真的没有用吗?      我们给荷兰邮政银行做了一个数据挖掘模型,他们说第一次采用数据挖掘,就使直邮的响应率提升了50%。我们还给美国西部电信公司做了客户流失挖掘,他们说有效避免客户流失,挽回一个老客户所需的成本仅为获取新客户成本的十分之一。     我们还给格洛斯特郡警察局做了犯罪原因数据挖掘系统。这里有个很有意思的故事,在格洛斯特郡那段时间经常发生抢劫案件。我们分析了一下为什么抢劫案发生的频率会上升,结果得到两点,就是说抢劫案的发生跟两个要素相关,第一个要素是这些案犯抢劫之前会服用毒品,然后导致他的行为失控,所以会抢劫。第二个要素,就是很多抢劫案犯是无家可归的,没有固定的住所,不是说一下班就回到温暖的家,是在大街上流浪。发现这个要素以后,警方没有说简单的增加警力之类的,而是一方面控制毒品的市场,另一方面对无家可归的人员进行了更多的管理和疏导。我们要从数据里面挖掘到真正有用的东西,从数据到信息,到知识,到智能,逐步抽象,从里面抓出最精华的东西。     我们现在有的数据挖掘系统在做什么事情?上面这些气泡,基本上是我们现在数据挖掘系统给企业带来的好处。通过分析原始数据,清洗后的数据,标准报表可以知道发生了什么,然后企业希望知道为什么发生?就是即席查询。然后是还想知道将会发生什么,希望发生什么,我们的报表和多位分析都可以提供这些功能。     SAS提供什么样的产品和服务。我们基本上就是这条链,从最好的规划,到数据加载,到分析智能。分析智能给企业带来最高层次的支持,就是我们长矛最锋利的一点。     关于什么是数据挖掘,很多教材里面都有定义,包括行业定义。这地方简单说一下,它就是从海量的数据中,揭示出一些模式和规律,以前通过业务经验和人为简单的分析发现不出来的规律。这是一个数据挖掘的示意流程图。基本上我们会经过数据抽取,抽样,分析,然后对模型进行应用。      具体我们在行业应用上面,数据挖掘可以用来干什么?我们总结为四大部分,整个就是围绕客户关系管理来做的,当然也不仅仅只限于客户关系管理,但这是应用最广泛的范围。     第一部分就是从客户的口袋里面拿到更多的钱。    第二部分,不是我的客户,我把它挖掘成我的客户。    第三部分,就是避免客户的流失,客户保持。    第四部分,Fraud。     我们形象的说数据挖掘可以做什么,特别是在客户关系管理领域,就是这四部分,帮企业打赢战争。SAS作为整个数据挖掘的领导厂商,经过多年的项目实施,总结出一套分析方法,SEMMA。整个做数据挖掘项目经过五步,首先树立一个抽样,然后对数据进行一个探索,看数据质量怎么样,然后会做一个数据转化,大家知道做分析和业务系统是两回事,有时候客户问我,我的业务系统积累了很多,我是不是可以利用业务系统直接做东西,可以是可以,但是你要付出更多的人力做这个事情,因为那个不适合做分析,所以我们要做数据的转换。第四部分就是模型的建立,最后一步,我建了模型,要对模型的性能进行评估,我要选择哪个模型是最好的,拿出来应用。     SAS的数据挖掘解决方案分为三部分:第一个是数据挖掘工具,第二个就是数据挖掘项目实施方法论,第三个,行业解决方案,这里给大家看到的是SAS挖掘产品领导者的建议,它是一个流程化的建议,SAS的数据挖掘工具算法是算法中最深入,最广泛的一个。     SAS是统计分析起家的,但经过30年的发展,我们已经形成了企业智能平台。SAS的产品到底有哪些呢?我们用三个饼图来描述。第一个是企业智能平台,最下面就是数据仓库,数据提示,上面就是商业智能。第二个就是应用智能平台,像客户的挽留,交流、交涉,包括财务的智能,包括供应链的智能。第三个是行业智能解决方案,比如说电信业会有电信业的解决方案,制造业会有制造业的解决方案。     商业智能我们有很多数据库,有报表,有分析。这些系统是企业必须的,以前的数据挖掘,只不过像汽车的后视镜一样,只能告诉你以前发生了什么事情,我统计的数据表现出以前发生的事情。现在的数据挖掘不仅可以看到以前发生过什么,还可以看到以后会发生什么。客户的生命周期,客户从进入你的企业,到流失,分生命周期的几个阶段,客户目标,新客户,稳定客户,已流失客户。从这个上面我们可以看到,生命周期每个阶段应该怎么去做。     SAS客户细分及特征概括解决方案。国内企业客户,像中国移动超过了三亿多,像各大银行也是有很多客户。你有这么多的客户,就对企业提出了一些挑战。比如说哪些客户群对我们的利润底线贡献最大,应该促进哪些客户群的增长,每个户群的特征是什么,客户群间迁移状况如何?像农村里的小卖店,你就是为这附近的人服务,也就二十几户人家,每家人喜欢买什么,是什么样的脾气、个性,时间长了你都可以摸得一清二楚。我们企业客户上百万、上亿,你不可能了解每个客户的习性,我们可以做的就是把客户分为几个大类,然后对不同的客户群做针对性的营销。     为什么要进行客户分群,就是为了有效的细分才能有效的保育。然后深入了解客户的心理、行为和价值,进行有针对性地营销。整个客户细分,可以用一句话概括,就是让组内客户差异更加明显。关于细分的类型,可以按照价值细分,客户的利润贡献和风险进行细分,也可以通过行为细分。     下面是价值细分与流失倾向细分交叉图,然后发现焦点,看是挽留还是不挽留将要流失的客户。区别对待的市场营销策略,比如说移动用户客户细分,喜欢深夜通话的,喜欢发短信的,可以给他推荐套餐,打接电话少的客户可以推荐他没有月租的。接下来我用很短的时间给大家介绍一下交叉销售。     交叉销售要解决的问题,一个就是要推产品给谁;另外一个有一批客户,我要向他卖什么。我会做两方面的挖掘,一个是产品组合分析,哪些产品常被一起购买。一个是直邮响应客户分析,我向他推销,他会不会买。     这里面有一个形象化的例子,假如这个扑克牌是我能卖出的所有产品,最理想的情况就是客户把所有的产品都买到手里,但实际上是不会的。每个客户都会买不同的产品,我们会看到,有三个客户同时买了红色,也同时买了绿色,这地方我们可以得到很强的一个观点,红色和绿色的关联性比其他产品关联性大很多,我们可以把这个进行捆绑销售。     接下来我们用客户细分的技术,把客户分为两组,左边一组,右边一组,大家发现这两组客户有什么差异吗?左边的客户基本上同时拥有红色和绿色的产品,右边是黄色和蓝色的产品,这两个客户群组偏好是不一样的。左边,如果你只有红色,没有绿色,我可以向你推荐绿色,右边也是同样。     那如果我向客户推荐产品,他会不会买,我们要做这个概率预测。我们会做实验性的营销活动,我们会把营销反馈搜集起来。上面是接受我的营销,查询或者直接订购。下面是没有响应的。我们会用一些决策树模型,找出有购买形象的客户,和没有购买形象的客户,有什么差异,对以后的购买做出预测。     我做一个总结,我刚才谈到客户细分、交叉销售等等,这是数据挖掘应用中很小的部分,还有客户流失,时间序列的分析等等,都是数据挖掘的内容。转载自: http://www.ccidconsulting.com/data/default_5.asp

阅读全文(2521) | 回复(0) | 编辑 | 精华



发表评论:
昵称:
密码:
主页:
标题:
验证码:  (不区分大小写,请仔细填写,输错需重写评论内容!)
                                                                                                                                                 
                                                                                                                                     

                                                                      

站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.032 second(s), page refreshed 144783361 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号