|
« | September 2025 | » | 日 | 一 | 二 | 三 | 四 | 五 | 六 | | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | | | | | |
|
blog信息 |
blog名称:DMFighter(数据挖掘斗士) 日志总数:102 评论数量:527 留言数量:17 访问次数:918215 建立时间:2007年8月22日 | |
|
|
[数据挖掘]从数据中挖掘价值 |
从数据中挖掘价值
SAS软件有限公司资深顾问 张磊博士 2007(第五届)中国数据管理技术应用年会
我们今年年会的主题也是数据挖掘与信息整合,我的演讲题目正好切合这个主题。那么什么叫数据挖掘呢,这个名词估计大家不太陌生,已经听说很多次了。数据挖掘英文名字就是Data Mining,我们到底要从数据里面挖掘什么,就是要从数据里面挖掘有价值的东西。
我演讲的报告分为两部分,一,是SAS数据挖掘的简介,包括公司和数据挖掘的简介。二,数据挖掘应用,关于客户细分和交叉销售。
首先为大家介绍一下SAS软件公司,基本上我们一谈到数据挖掘的产品、软件公司的话,大家都会想到SAS这个名字。SAS这三个字母其实是统计分析系统英文的缩写。SAS从1976年开始创办的。2006年SAS营收全球达到了19亿美元,它和其他的IT软件公司不太一样,它把25%的营收放在研发里面,支撑我们业务的增长。我们SAS的客户到底有哪些?2006年财富500强前100位中的97家,2005年财富500强前100位中的96家。这是我们获得的一些奖项,我就不一一述说了,都获得了广泛认可。这个评估报告是最新的,包括我们做商业智能、内容管理、知识管理数据挖掘领域里面作的评比,大家看到数据整合、数据挖掘,多渠道营销管理,商业智能平台、知识管理领域里面我们都是领导者。
SAS1989年进入中国,到今天已经是18年了,北京、上海、广州、香港、台湾都有我们的分公司,在2004年专门成立了SAS中国研究院,也是一个非常大的研发机构。以上这是SAS公司的简介,我们虽然是以统计分析起家,但是现在已经步入到数据挖掘各个领域里了。接下来就是对数据挖掘的见解。
关于数据挖掘,大家听说过这个名词,但实际上大家对数据挖掘有很多的问题,包括什么是数据挖掘,为什么要做数据挖掘,数据挖掘到底可以做什么,然后怎么做,等等这些问题。
首先我们来看为什么数据挖掘现在变成热门的名词,这跟整个用户的需求是密不可分的。刚才胡总也说过,我们拿到的信息是冰山一角,有大量的信息都埋葬在企业里面。很多企业跟我说,我的数据积累越来越多,但是做任何决策的时候,还是像以前那么多困难,为什么?就是我们数据很多,但是从数据里面抓到的有用信息并没有同步增长,我们数据挖掘要做的就是这件事。
数据挖掘进入中国也有好几年了。前几天有人在我的博客上面问我一个问题,他说前一段时间看了一篇文章,数据挖掘是大忽悠,还是有萌动少年?就是数据挖掘说了那么多,但没有什么实际应用。数据挖掘真的没有用吗?
我们给荷兰邮政银行做了一个数据挖掘模型,他们说第一次采用数据挖掘,就使直邮的响应率提升了50%。我们还给美国西部电信公司做了客户流失挖掘,他们说有效避免客户流失,挽回一个老客户所需的成本仅为获取新客户成本的十分之一。
我们还给格洛斯特郡警察局做了犯罪原因数据挖掘系统。这里有个很有意思的故事,在格洛斯特郡那段时间经常发生抢劫案件。我们分析了一下为什么抢劫案发生的频率会上升,结果得到两点,就是说抢劫案的发生跟两个要素相关,第一个要素是这些案犯抢劫之前会服用毒品,然后导致他的行为失控,所以会抢劫。第二个要素,就是很多抢劫案犯是无家可归的,没有固定的住所,不是说一下班就回到温暖的家,是在大街上流浪。发现这个要素以后,警方没有说简单的增加警力之类的,而是一方面控制毒品的市场,另一方面对无家可归的人员进行了更多的管理和疏导。我们要从数据里面挖掘到真正有用的东西,从数据到信息,到知识,到智能,逐步抽象,从里面抓出最精华的东西。
我们现在有的数据挖掘系统在做什么事情?上面这些气泡,基本上是我们现在数据挖掘系统给企业带来的好处。通过分析原始数据,清洗后的数据,标准报表可以知道发生了什么,然后企业希望知道为什么发生?就是即席查询。然后是还想知道将会发生什么,希望发生什么,我们的报表和多位分析都可以提供这些功能。
SAS提供什么样的产品和服务。我们基本上就是这条链,从最好的规划,到数据加载,到分析智能。分析智能给企业带来最高层次的支持,就是我们长矛最锋利的一点。
关于什么是数据挖掘,很多教材里面都有定义,包括行业定义。这地方简单说一下,它就是从海量的数据中,揭示出一些模式和规律,以前通过业务经验和人为简单的分析发现不出来的规律。这是一个数据挖掘的示意流程图。基本上我们会经过数据抽取,抽样,分析,然后对模型进行应用。
具体我们在行业应用上面,数据挖掘可以用来干什么?我们总结为四大部分,整个就是围绕客户关系管理来做的,当然也不仅仅只限于客户关系管理,但这是应用最广泛的范围。
第一部分就是从客户的口袋里面拿到更多的钱。 第二部分,不是我的客户,我把它挖掘成我的客户。 第三部分,就是避免客户的流失,客户保持。 第四部分,Fraud。
我们形象的说数据挖掘可以做什么,特别是在客户关系管理领域,就是这四部分,帮企业打赢战争。SAS作为整个数据挖掘的领导厂商,经过多年的项目实施,总结出一套分析方法,SEMMA。整个做数据挖掘项目经过五步,首先树立一个抽样,然后对数据进行一个探索,看数据质量怎么样,然后会做一个数据转化,大家知道做分析和业务系统是两回事,有时候客户问我,我的业务系统积累了很多,我是不是可以利用业务系统直接做东西,可以是可以,但是你要付出更多的人力做这个事情,因为那个不适合做分析,所以我们要做数据的转换。第四部分就是模型的建立,最后一步,我建了模型,要对模型的性能进行评估,我要选择哪个模型是最好的,拿出来应用。
SAS的数据挖掘解决方案分为三部分:第一个是数据挖掘工具,第二个就是数据挖掘项目实施方法论,第三个,行业解决方案,这里给大家看到的是SAS挖掘产品领导者的建议,它是一个流程化的建议,SAS的数据挖掘工具算法是算法中最深入,最广泛的一个。
SAS是统计分析起家的,但经过30年的发展,我们已经形成了企业智能平台。SAS的产品到底有哪些呢?我们用三个饼图来描述。第一个是企业智能平台,最下面就是数据仓库,数据提示,上面就是商业智能。第二个就是应用智能平台,像客户的挽留,交流、交涉,包括财务的智能,包括供应链的智能。第三个是行业智能解决方案,比如说电信业会有电信业的解决方案,制造业会有制造业的解决方案。
商业智能我们有很多数据库,有报表,有分析。这些系统是企业必须的,以前的数据挖掘,只不过像汽车的后视镜一样,只能告诉你以前发生了什么事情,我统计的数据表现出以前发生的事情。现在的数据挖掘不仅可以看到以前发生过什么,还可以看到以后会发生什么。客户的生命周期,客户从进入你的企业,到流失,分生命周期的几个阶段,客户目标,新客户,稳定客户,已流失客户。从这个上面我们可以看到,生命周期每个阶段应该怎么去做。
SAS客户细分及特征概括解决方案。国内企业客户,像中国移动超过了三亿多,像各大银行也是有很多客户。你有这么多的客户,就对企业提出了一些挑战。比如说哪些客户群对我们的利润底线贡献最大,应该促进哪些客户群的增长,每个户群的特征是什么,客户群间迁移状况如何?像农村里的小卖店,你就是为这附近的人服务,也就二十几户人家,每家人喜欢买什么,是什么样的脾气、个性,时间长了你都可以摸得一清二楚。我们企业客户上百万、上亿,你不可能了解每个客户的习性,我们可以做的就是把客户分为几个大类,然后对不同的客户群做针对性的营销。
为什么要进行客户分群,就是为了有效的细分才能有效的保育。然后深入了解客户的心理、行为和价值,进行有针对性地营销。整个客户细分,可以用一句话概括,就是让组内客户差异更加明显。关于细分的类型,可以按照价值细分,客户的利润贡献和风险进行细分,也可以通过行为细分。
下面是价值细分与流失倾向细分交叉图,然后发现焦点,看是挽留还是不挽留将要流失的客户。区别对待的市场营销策略,比如说移动用户客户细分,喜欢深夜通话的,喜欢发短信的,可以给他推荐套餐,打接电话少的客户可以推荐他没有月租的。接下来我用很短的时间给大家介绍一下交叉销售。
交叉销售要解决的问题,一个就是要推产品给谁;另外一个有一批客户,我要向他卖什么。我会做两方面的挖掘,一个是产品组合分析,哪些产品常被一起购买。一个是直邮响应客户分析,我向他推销,他会不会买。
这里面有一个形象化的例子,假如这个扑克牌是我能卖出的所有产品,最理想的情况就是客户把所有的产品都买到手里,但实际上是不会的。每个客户都会买不同的产品,我们会看到,有三个客户同时买了红色,也同时买了绿色,这地方我们可以得到很强的一个观点,红色和绿色的关联性比其他产品关联性大很多,我们可以把这个进行捆绑销售。
接下来我们用客户细分的技术,把客户分为两组,左边一组,右边一组,大家发现这两组客户有什么差异吗?左边的客户基本上同时拥有红色和绿色的产品,右边是黄色和蓝色的产品,这两个客户群组偏好是不一样的。左边,如果你只有红色,没有绿色,我可以向你推荐绿色,右边也是同样。
那如果我向客户推荐产品,他会不会买,我们要做这个概率预测。我们会做实验性的营销活动,我们会把营销反馈搜集起来。上面是接受我的营销,查询或者直接订购。下面是没有响应的。我们会用一些决策树模型,找出有购买形象的客户,和没有购买形象的客户,有什么差异,对以后的购买做出预测。
我做一个总结,我刚才谈到客户细分、交叉销售等等,这是数据挖掘应用中很小的部分,还有客户流失,时间序列的分析等等,都是数据挖掘的内容。转载自: http://www.ccidconsulting.com/data/default_5.asp | |
|
|
|