APP下载

基于粗糙集-BP神经网络客户群特征与服务映射模型研究*

2013-08-18

关键词:客户群约简粗糙集

曾 珠 王 斌 刘 冬

(武汉理工大学管理学院 武汉 430070)

0 引 言

研究客户特征与服务映射关系是在日益竞争激烈的市场中企业寻求提高客户忠诚度的重要途径,为客户提供更周到、更个性化的服务成为企业管理的重要任务之一[1].BP神经网络基于梯度下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和达到最小,具有优良的分类学习和映射能力,但标准BP算法具有收敛速度慢、局部极小值点、隐含层层数及神经元个数的确定无理论指导等缺陷[2-3].何明等[4]提出基于粗糙集不可分辨关系的粗糙集神经网络模型,但未进行客户属性约简和指定初始化连接权值.万映红等[5]提出基于粗糙集神经网络的客户消费分类模型,具有较好的客户分类效果,但未给出客户分类与服务的映射模型.本文提出有导师学习下的基于粗糙BP神经网络客户特征与服务映射模型,在客户细分的基础上寻求客户特征与服务的映射关系.

提出根据客服历史数据对由客户特征和服务决策构成的决策表进行基于属性重要程度的属性约简,得出各服务决策对各属性的依赖程度,引入该决策支持度改进BP神经网络算法,构建客户群体特征与服务策略的映射模型.并运用该映射模型研究客户群体特征与服务的关系,通过历史数据的分群分组训练,形成多个稳定的BP网络,对客户的服务项目和时间进行预测.改变传统的客户遇到困难找经销商解决的服务模式,变为经销商主动为客户提供定制服务的模式,让每个客户都能体验经销商一对一的服务,提高客户满意度,从而提高客户的忠诚度,增加企业收益.

1 基本理论

1.1 粗糙集理论

粗糙集是继概率论、模糊集、证据理论之后的又一个处理不确定性的数学工具.粗糙集观点认为知识是主体对论域中的客体进行分类的能力,分类能力越强,主体所具备知识的可靠度越高[6].分类能力受主体分辨能力的影响,因此分类具有近似性.影响分类能力的因素很多,不同的因素重要程度不同,其中某些因素起决定性作用.具有相同属性的实体,属性取值的不同对分类能力也产生影响,属性之间存在某种依赖关系[7-8].运用粗糙集理论能发现属性间的完全或部分依赖,简化冗余属性,发现最重要的属性,并计算具体的依赖程度.

1.2 标准BP神经网络算法

BP(back propagation)神经网络算法是模拟人脑思维构建的网络计算结构,通过输出后的误差逐层反传修改各层连接权值和阈值使网络达到预期状态[9],当误差函数及全局均方误差函数达到达到预设精度或学习次数达到设定的最大次数时即为BP网络最终状态.

利用BP神经网络,设客户特征属性集为条件属性,客户服务项为决策属性,进行客户特征与服务内容的映射训练,可以得出基于客户特征的服务策略规则.但BP算法也存在一些不足之处:学习算法的收敛速度比较慢,易陷入局部极小值,网络隐含层的层数以及隐含层神经元数的选取尚无理论指导等[10].

1.3 BP神经网络改进

1)训练方式的改进 在采用BP神经网络进行客户特征与服务映射训练过程中,由于训练网络时的样本数量较多,所以在BP改进算法中,张国翊等提出先把所有P个训练样本分为n组[11],让每组样本经过1次循环学习累积误差后再调整学习率,而不是每输入1个样本就调整1次学习率.其优点是既能使不同学习率在每组样本图像循环训练完成后得到适当调整,又能减小调整学习率的时间.

该方法可以在一定程度上缩短学习时间,使得网络可以较为快速收敛,但对于海量的客服数据,这样随机的毫无明确目标的分组,最后并不能提高BP网络的精确度.本文提出采用分群分组批处理的训练方式,在对m个学习模式对样本进行分组前先采用聚类算法,将样本划分为各具特性的客户群,每个客户群具有自己的共性特征和个性特征,再针对每个客户群随机均分为r组训练,这样可以快速获得多个具有较高准确度的映射网络.

图1 BP网络训练方式改进机制图

此时,不是每输入一个模式对就进行一次误差修正,而是在每训练完一小组样本后再调整,所以输出层各个单元的校正误差函数)对应的改为累积误差函数dt=.

2)网络结构的改进 根据万映红等的研究,提出了基于粗糙集的神经网络拓扑结构,但没有明确BP网络权值确定的依据.本文作者提出基于粗糙集的BP神经网络结构,给出基于典型的3层BP网络隐含层神经元个数及网络权值确定的依据.

图2 基于粗糙集改进三层BP神经网络结构图

样本模式对在进入BP网络训练之前,先进行属性约简,剔除冗余属性,划分每个条件属性对于决策属性的不可分辨关系,获取等价关系.条件属性集中为核的属性个数即为3层BP网络的输入层神经元个数,而隐含层的神经元个数即为各个核心属性的所有等价类数量之和,输出层神经元个数为决策属性所有不同属性值的个数.

2 客户群特征与服务映射模型的构建

基于改进的BP神经网络算法及客户群理论,本文构建如图3所示的客户服务映射模型框架.

图3 基于粗糙BP网络的客户服务映射框架

2.1 客户群体特征分析

客户群体特征包括客户属性、客户行为属性和环境属性.客户属性主要指客户自身的基本特征,如性别、年龄、年收入等特征,客户自身的特征对其使用商品或者服务有着显著的影响.客户行为属性,主要指客户在使用某种商品的时候的习惯性行为,不同的习惯行为对产品造成的影响不同.以汽车客户为例,若驾驶者在驾驶的时候习惯经常猛踩刹车,则汽车的刹车片和轮胎将会很容易磨损.环境属性指客户所处的自然环境、人文环境等,如汽车用户行驶的道路环境,环境属性对客户使用产品会造成客观因素的影响.客户群体特征包含众多属性,每个属性对客户所需要的服务的影响不一样,本文采用粗糙集理论对客户特征进行分析,计算基于属性重要程度的客户特征对服务项目的隶属度.

设由条件属性集C和服务决策属性集D组成的知识表达系统四元组S=(U,A,V,F),U 为对象的非空有限集合,亦称论域;A为属性的非空有限集合,A=C∪D,C∩D=Ø;V表全体属性的值域;f为U×A→V的一个映射,称为信息函数.在客户群体特征与服务项目的映射关系中S表示成一张二维表,其中U是所有服务记录的集合,A是所有客户群特征属性列的集合,V是二维表中服务项目取值的集合.

定义:∀x,y∈U,如果对∀α∈R,R⊆C都有fα(x)=fα(y),且有fD(x)≠fD(y),则称对象x,y在等价关系R下是不可分辨的,否则称对象x,y在等价关系R 下是可分辨的,其中fα(x)是对象x在信息函数f下对应的属性α的值.这种由R决定的不可分辨关系可表示为IND(R),在不产生混淆的情况下记为R:

对于一个客户群体特征与服务项目的决策表,粗糙集理论除了提供知识约简和求核方法外,还具备从决策表中抽取规则的能力,这样就可以在保持服务决策一致的条件下删除多余的客户群体特征属性.此时:

为客户群特征α对客户群特征属性全集C相对于服务决策属性D的重要程度.其中,γC(D)=通过计算客户群特征的重要程度,筛选影响客户服务项目的核心属性,剔除冗余属性,以便构建客户群体特征与服务项目的映射模型.

2.2 BP网络拓扑结构构建

对客户服务历史数据进行数据预处理,运用粗糙集基于属性重要程度的约简算法对客户特征属性进行约简,删除冗余属性和数据,采用K-means算法进行客户群划分.针对划分好的每个客户群,再次运用粗糙集基于属性重要程度的约简算法,重新计算客户特征属性对服务属性的支持度,划分客户等价类,见表1.根据约简后的客户特征核心属性数量确定BP神经网络输入层神经元的个数,根据每个输入层属性特征的等价类的数量确定与对应属性相连接的隐含层神经元数量,输入层每个神经元只与其在隐含层的等价类神经元相连,其连接权值为该属性对服务属性的支持度.

表1 客户服务决策表

2.3 BP网络训练及服务映射

对每个客户群分别建立单独的BP神经网络,并将每个客户群服务样本数据进行分组.在训练的时,只在每一组样本数据训练完后才计算全局误差,直到训练结束.训练完成后,每个客户群形成自己的BP网络,对应相应的客户特征与服务映射模型.当新客户数据到达时,先划分新客户所属客户群,再利用对应客户群的BP网络映射其所需服务.

3 模拟分析

模拟某汽车4S店客户服务的3 000条历史数据,假设汽车某类客户群体特征可分为驾龄、年龄、车辆型号、主要用途、车龄、总行驶里程、月行驶里程、平均车速、道路环境、气候环境、保养意识和保养周期12个方面的特征,以客户是否需要更换刹车片为例,利用Rosetta软件进行数据离散化预处理等,数据离散化结果见表2.

表2 数据离散化

表3 客户属性筛选机隶属度计算

对所有客户服务数据运用Rosetta软件进行基于属性重要程度的约简预处理,剔除年龄、车辆型号、主要用途、平均车速、气候环境及保养周期等重要程度较小的属性,获得结果见表3.依据表3的结果,删除其他列属性,采用K-means算法对服务数据进行聚类分析,本文采用SPSS软件操作,获得如表4所列的聚类结果.

表4 最终聚类中心

根据聚类分析结果,对客户群1(其余各群类似处理)再次运用Rosetta进行属性约简,并计算各个客户群特征对服务决策属性的隶属度,删除客户群特征对服务决策属性隶属度小于0.5的特征获取核心属性,核心属性及其隶属度见表5.

表5 客户群特征核心属性及隶属度

根据表5所列,对于客户群更换刹车片服务决策的核心属性及隶属度分别为驾龄(0.76)、月平均里程(0.90)、平均车速(0.86)、道路环境(0.78)和保养意识(0.76)五个属性特征.再利用Matlab软件编程实现BP网络训练算法,根据前面数据约简的结果确定BP网络结构为5-7-1三层,将客户服务记录输入神经网络,以客户特征为输入,以服务为期望输出,训练BP神经网络,可以得出客户特征与服务项目的映射关系.此时整个收敛且稳定的BP神经网络(包括其神经网络层数、各层神经元个数、各层之间的权值和阈值)构成核心条件属性(驾龄、月平均里程、平均车速、道路环境和保养意识)与决策属性(更换刹车片)之间的映射关系.

通过对模拟数据的约简、BP网络训练发现,改进之前的收敛速度明显低于改进之后的网络.在训练次数同为100的情况下,改进前的全局误差为0.262 753,改进后的全局误差为0.001 136,改进后的训练时间也缩短了0.1s左右.所以采用改进后的BP网络训练方式更能快速收敛,形成稳定的BP网络.同理可以通过该模型训练得出其他各项汽车服务项目和对应服务时间间隔的BP网络结构,从而针对客户群建立客户特征与服务的映射关系.BP网络改进前后训练收敛对比图见图4.

图4 BP网络训练对比图

同理,以客户特征为输入,以服务时间间隔为为输出,可以得出对应服务项目的服务时间映射关系,从而实现根据客户特征预测客户所需服务项目,以有的放矢地为客户提供主动服务,提高客户服务质量.

4 结束语

本文研究了运用粗糙集改进BP神经网络算法和结构,并采用分群分组的方式改进BP网络的训练方式,构建新的BP神经网络模式.运用该BP网络结构,在分析客户属性、客户行为属性和环境属性的基础上,研究了客户特征与服务间的映射模式.

但本文主要针对客户群体而研究的群体特征与服务的映射模式,对于每个独立的客户而言,具有自己的个性特征,其个性特征对所需要的服务项目和时间有较大的影响.所以在之后研究中,将进一步研究客户个性特征与群体特征的差异,及其对服务内容和时间的影响,以调节客户特征与服务的映射关系.

[1]王 虎,喻 立.主动服务导向下的服务挖掘模型研究[J].武汉理工大学学报:信息与管理工程版,2010,32(2):284-288.

[2]李敏生,刘 斌.BP学习算法的改进与应用[J].北京理工大学学报,1999,19(6):721-726.

[3]徐春梅.BP算法改进及在控制系统中应用[J].计算机仿真,2010,27(2):188-191.

[4]何 明,冯博琴,马兆丰,等.一种基于粗糙集的粗糙神经网络构造方法[J].西安交通大学学报,2004,38(12):1240-1242.

[5]万映红,胡万平,曹小鹏.基于粗糙神经网络的客户消费分类模型研究[J].管理工程学报,2011,25(2):142-148.

[6]叶玉玲.模糊粗糙神经网络的结构与参数优化[J].系统工程与电子技术,2009,31(12):2989-2993.

[7]薛 锋,孔 林.粗糙集神经网络系统在商业银行贷款五级分类中的应用[J].系统工程理论与实践,2008,28(1):40-45.

[8]THANGAVEL K,PETHALAKSHMI A.Dimensionality reduction based on rough set theory:A review[J].Applied Sost Computing,2009,9(1):1-12.

[9]MICHAEL C,KEN P,STAN L.Customer satisfaction analysis:identification of key-driver[J].European Journal of Operational Research,2004,154(3):819-827.

[10]李敏生,刘 斌.BP学习算法的改进与应用[J].北京理工大学学报,1999,19(6):721-726.

[11]张国翊,胡 铮.改进BP神经网络模型及其稳定性分析[J].中南大学学报:自然科学版,2011,42(1):115-124.

猜你喜欢

客户群约简粗糙集
基于粗糙集不确定度的特定类属性约简
基于Pawlak粗糙集模型的集合运算关系
基于二进制链表的粗糙集属性约简
实值多变量维数约简:综述
广义分布保持属性约简研究
多粒化粗糙集性质的几个充分条件
双论域粗糙集在故障诊断中的应用
浅析微电影
专注于特殊客户群社交网广告
改进的k—means聚类算法在客户细分中的应用研究