CRM中数据挖掘模型及策略

当前位置: 大雅查重 - 范文 更新时间:2024-02-19 版权:用户投稿原创标记本站原创
摘要:本文主要阐述了数据挖掘在CRM中的实现过程、模型建立的步骤以及采用的浅析浅析策略。随着理论的不断发展,数据挖掘技术必定会带给CRM更加广泛的应用前景和市场价值,提高企业竞争力。
关键词:客户关系管理 数据挖掘
客户关系管理(CRM)是当前企业管理的热点不足。在产品同质化严重、电子商务高速扩张的今天,客户价值被提升到一个前所未有的高度。而数据挖掘技术则为有效进行客户信息的挖掘提供了重要的技术支持。
由于CRM要求动态把握顾客需求,因此要建立客户数据仓库,及时更新客户数据,并且根据这些客户数据做出相应的营销决策。客户数据是CRM的灵魂,是企业了解客户的基础。数据中包含的有关商品、现有客户和潜在客户、购买行为等信息,将帮助企业进行客户浅析浅析,从而了解客户需求,确定目标市场,进行销售管理等。然而究竟如何使用客户数据,如何从大量、繁琐的数据中提取有效的信息,如何对收集到的数据进行浅析浅析处理从而满足企业的决策需要?这正是本文所关注的内容。
一.CRM中数据挖掘的实现过程
数据挖掘(Data Mining,DM),是指从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的过程。包括定义挖掘对象、数据选择和准备、模型建立、模型的评估、模型部署与维护五个步骤。
(1).定义挖掘对象
主要任务是定义有关度量标准,理解项目目标(如是要进行客户细分、开发新客户还是要提高客户忠诚度)和客户需求,确定实施对策;
(2).数据选择和准备
数据挖掘的处理对象是大量的数据,这些数据一般存储在数据库系统,是长期积累的结果。但往往不适合直接在这些原始数据上进行挖掘,需要作数据预处理的工作,把数据转换成适合挖掘的形式。数据准备的好坏将影响到数据挖掘的效率和准确度以及最终模式的有效性。数据挖掘包括获取数据、限定数据范围、数据清洗和数据分组几个步骤。首先,获取数据是DM的开始。其次,要限定数据范围。最后,进行数据清洗以保证数据的质量。数据挖掘的成功很大程度上取决于数据的数量和质量,数据的质量越好,则挖掘的结果就越精确。
(3).模型的建立
建立模型是DM的核心,用来确定所需锁定目标的一种手段。通过使用浅析浅析工具从纷繁的数据仓库中发现那些能够影响预期结果准确性、可理解性等性能的数据。例如,为了建立客户行为模型,首先需要确定模型的内生变量(如所购商品、再次购物时间等);其次需要建立客户细分和描述模型轮廓,并利用模型预测客户的行为特点;最后,确定最有影响力的变量。
数据开采是数据挖掘最关键的步骤,也是技术难点所在。采用较多的技术有决策树、分类、聚类和神经网络等。数据开采根据数据挖掘的目标,选取相应的算法和参数,浅析浅析数据,得到并形成知识的模式或模型。
(4).模型的评估
上面得到的数据开采的模型,可能没有实际意义或是没有实用价值,也有可能不能反映数据的真实意义,甚至在某些情况下是与事实相反地,因此需要评估,确定哪些是有效的、有用的模式。可以采用人工评估的策略,有些模式也可以直接用新的数据来检验其准确性。
(5).模型的部署与维护
模型部署的关键是确定最有影响力的变量,例如最能影响客户购买行为的变量,或者客户流失的倾向性变量等。对模型的部署要求建立计算机信息化系统,以便准确地捕捉动态的数据来进行实时预测。
模型维护包括定期或不定期地进行数据更新,根据需要扩展新的模块等等。

一、 模型建立的过程

二.CRM中的数据挖掘策略

1.分类浅析浅析

分类浅析浅析就是通过浅析浅析示例数据库中的数据,为各个类别进行准确地描述、建立浅析浅析模型或找到分类规则,然后用这个分类规则对其他数据库中的数据进行分类。
分类算法有相当多的成员,最常用的有决策树、神经网络、Bayes、粗糙集策略等。

2.关联浅析浅析

其目的是挖掘出隐藏在数据之间的相互关系。它能发现数据库中形如“90%的顾客在一次购买活动中购买商品A的同时也购买了商品B”之类的知识。
关联规则的经典算法是apriori算法[1]。此算法通过多次迭代来找出所有的频繁项目集。后来,又涌现出大量的apriori的改善算法,如利用hash表的DHP算法、基于采样的算法、并行关联规则算法、分布式关联规则算法、多层关联规则算法、数值扩展的关联规则算法、利用关联规则进行分类[2]、具有限制条件的关联规则等等[8]。由于典型的关联规则的算法会产生大量无意义的规则,因此出现了基于兴趣度的规则后处理算法[3]。
另外一些研究采用不同的数据结构进行关联规则的挖掘。例如AndersonB. and Moore采用一种Adtree的数据结构。Amir采用trie树,Pasquier使用项目格,Zaki也使用了一种类似格的形式[4]。
(3).序列模式浅析浅析
序列模式浅析浅析的侧重点在于浅析浅析数据间的前后序列关系。它能发现数据库中形如“在某段时间内,顾客购买商品A,接着购买商品B,而后购买商品C,即序列A-B-C出现的频度较高”之类的知识。序列模式浅析浅析描述的不足是:在给定交易序列数据库中,每个序列是按照交易时间排列的一组交易集,挖掘序列函数作用在这个交易序列数据库上返回该数据库中出现的高频序列。
(4).聚类浅析浅析
聚类浅析浅析的挖掘对象是一组尚未分类的记录数据,并且这些数据应该分成几类事先也不知道,通过浅析浅析数据库中的记录数据,根据一定的分类规则,合理地划分数据集合,确定每个记录所在的类别。它所采用的分类规则是由聚类浅析浅析工具决定的。采用不同的聚类策略,对于相同的数据集合可能有不同的划分结果。
在许多领域,包括数据挖掘、统计学和机器学习都有聚类研究和应用。目前常用的距离策略主要有划分策略、层次策略、基于密度的策略、基于网格的策略以及基于模型的策略。
三.结束语
数据挖掘技术在以客户为中心的客户关系管理中扮演着越来越重要的角色。随着理论的进一步发展和深化,必定会带给CRM更为广泛的应用前景和市场价值,提高企业的竞争力。
参考文献:
[1].Agrawal R .and Srikant,R.Fast. algorithms for mining association rules[C].Proc.Int.Conf.Very Large Database Santiago,Chile,1994,487~499.
[2]. Liu, B., Hsu, W. and Ma, Y. Integrating Classification and Association Rule Mining[C]. KDD98, USA, 1998.
[3]. Klemetinen, M., Mannila, H., Ronkainen, P., Toivonen H. and Verkamo, A.I. Finding Interesting Rules from Large Sets of Discovered Association Rules[C]. In:the 3rd International Conference on Information and Knowledge Management,401 ^40

7. ACM Press, 1994.

[4].曲昭伟,郑 岩,吕廷杰.基于聚类实现客户行为浅析浅析.东北师大学报(自然科学版),Vol.38 No.2,June 2006;
[5].赵玉忠.电子商务环境下的客户关系管理.技术经济与管理研究,2006-4;
[6]. 杨路明,巫宁.客户关系管理理论与实务[M].北京:电子工业出版社.2004.5