APP下载

基于BP网络的通讯行业客户流失预警模型研究

2016-05-04林明辉

陕西学前师范学院学报 2016年3期
关键词:预测

林明辉

(安徽新华学院,安徽合肥 230031)



■自然科学研究

基于BP网络的通讯行业客户流失预警模型研究

林明辉

(安徽新华学院,安徽合肥230031)

摘要:在通讯行业全业务经营背景下,客户资源成为运营商之间竞争的法宝。如何有效识别客户流失行为,制定相应的挽留与维系对策是运营商降低营销成本,提高核心竞争优势的关键。本文利用BP网络的自适应算法,将代表离网用户行为特征的45个指标进行样本训练,最终得到客户流失行为倾向的判断模型,为通讯行业客户离网动机预测提供了新的解决思路。

关键词:BP网络;客户流失;预测

随着中国第三次通讯行业重组,全业务经营趋势加剧了通讯运营商之间的市场竞争。为了获得更多的市场占有率,运营商想方设法降低客户流失率,减少用户离网现象的发生。研究表明,一个公司的用户流失率降低5%,利润将会增加25%至85%,为此运营商引入了CRM客户关系管理系统运用数据挖掘技术对客户属性进行精准定位,试图挽留存在离网倾向的客户资源。然而,目前运营商对流失用户行为识别仅仅通过综合业务管理系统中出账账单的量化指标进行泛化监控,没有结合用户对企业的贡献度考虑,对流失用户存在的潜在价值也未进行区分,导致挽留与维系成本增加。本研究基于价值分析角度,对流失用户属性进一步探索,对运营商精准启动挽留和维系策略提供决策支持。

一、客户流失行为评价指标体系

(一)客户流失的定义

Keaveney认为客户流失是客户不再重复购买或终止原先使用过的产品或者服务,并认为客户流失不仅使企业失去现有客户,还会造成潜在客户的流失[1]。郭明等从定量角度对客户流失进行了定义:连续3个月(一个季度)没有在该企业进行任何消费的客户,在通讯行业流失客户定义为具有离网倾向,且在未来很短的一段时间(如一周或一个月)内极可能真正离网的在网客户。结合已有离网客户特征分析发现,如果一个客户连续三个月没有通话记录和出帐记录,则其离网的概率将非常大。

(二)客户流失原因

客户流失的原因多种多样,Keaveney通过对消费品用户流失原因分析,将客户流失类型分为价格流失型、产品流失型、服务流失型、技术流失型、便利流失型等。Madden, Savage 和 Coble以澳大利亚 ISP 市场的不同的移动用户消费行为为研究对象,提出定价、不方便性、核心服务失败、服务接触失败、服务失败的反应、竞争对手、道德问题等因素影响客户流失意愿[2]。结合通讯行业特点,客户流失分为主动流失和被动流失。由于被动流失所占比重很小,本研究主要以用户的主动流失行为作为研究对象。

(三)客户流失行为倾向

客户流失行为的产生必然存在一定的诱发动机。根据黑格尔的“刺激——反应”模式,消费者往往通过对外部环境刺激的感受,产生一定的心理变化,最终导致行为倾向。通过客户流失原因分析,结合通信产品的特点,我们提出了以下客户流失行为倾向性关键指标:如连续三个月ARPU移动均值,连续三个月MOU移动均值,连续三个月数据业务使用量移动均值,业务办理变更次数,申请客户服务次数,欠缴费情况,本/异地通话分钟数,主/被叫时长。上述关键行为指标,在消除了季节特征影响后,呈现出来的趋势可以很好地预测客户流失倾向。

客户流失预测是指采用某种方法或技术,对能够体现客户流失状态的指标体系进行探索分析,并对客户流失现状进行评估和预测,识别出潜在的具有流失倾向的客户。目前大部分研究将客户流失预测当作一个模式识别问题,利用统计分析和数据挖掘中的分类算法建立客户流失预测模型。文献[3]中提出了基于C5.0决策树的客户流失分析方法并且证明了神经网络方法完全适用于通讯客户流失分析。此外,数据库技术和Logistic回归[4]等方法在该问题的探索上也取得了良好的效果。然而对于流失客户内在价值的分析较为欠缺。本文结合前人的研究成果,提出基于客户潜在价值和神经网络相结合的算法对通讯行业的流失客户进行分层分析。

二、客户流失预测指标体系

客户流失在一定的时间范围内呈现出消费频率降低,经常性消费支出减少等前期征兆。通过后台数据监控,我们可以很好地发现这些消费行为的变化趋势,为了收集完美的通讯用户离网倾向性行为数据指标,我们通过综合管理业务系统以及专家头脑风暴的方式,归纳统计出三类流失客户指标类型,如图1所示。

图1 客户离网倾向指标体系

(一)个人信息指标

该变量主要反映消费者的基本情况,如年龄、性别、教育程度、收入情况等消费者个人统计信息。具体包括两个方面的信息指标。

1.客户信息。如年龄、性别、学历、职业、年收入,用户类型:是否新用户。

2.业务信息。码号资源,套餐类型,最低消费,用户类型,在网时长。

该类数据来源于用户入网时候的实名登记资料,数据更新时间为最近一年。

(二)消费行为指标

我们以活跃用户作为样本。活跃用户指的是连续出账6个月,且每期消费支出大于等于套餐费用,账户余额大于零的在网用户。这一部分用户在一定时期(1年内)的消费行为趋向稳定性,可以通过连续三个月的消费指标移动平均得出基础消费数据,作为行为标准指标值。如缴费周期、欠费情况、每月通话时长、每月最低消费、移动数据使用量等。

(三)态度意愿指标

消费者态度在一定时期具有稳定性,它可以指导消费行为的发生,体现为对服务的满意度和对品牌的忠诚度,同时消费者态度的形成需要较长时间的积累[5]。通过前期分析我们在筛选的40项服务满意度指标中选择具有代表性的两类指标各5项,作为用户满意度指标。

1.与产品有关的指标:通信套餐内容,性价比,网络信号,品牌形象。

2.与服务有关的指标:投诉处理,礼貌,业务办理及时性,缴费便利性。

通过比较分析,我们发现离网用户在近三个月的消费行为中呈现出一定的规律性。由于用户对产品和服务效用水平的降低,出现了与标准消费行为不同的其他消费行为。例如,欠费次数、欠费周期、预存金额减少、通话时长减少、通话次数减少、ARPU降低、短信数量减少、短信费用降低、移动信息费用降低、移动数据流量减少等。

综上,我们选取了三类指标下的45个代表性特征指标作为BP网络的输入量。为了提高网络学习效率,降低指标之间的统计性差异,我们对连续型的消费支出指标,使用3个月移动平均的方式求得均值。对于大量离散型客户数据,为了避免指标代表的行为属性之间的交叉干扰产生的数据“淹没效应”,我们对数据进行量纲和量值上的数值化处理。考虑到Sigmiod函数的饱和区间范围,我们将数据初始化为[0,1]之间,便于网络输入[6]。如表1、表2所示。

表1 年龄数值化处理结果

表2 收入水平数值化处理结果

三、客户流失预测的BP网络

(一)BP网络基本设计

本研究采用单隐层网络结构,设计45个输入节点,其中包括性别、年龄、收入、职业、在网时长、教育层次等个人信息指标12个;包含主叫时长、被叫时长、ARPU值、MOU值、套餐使用率、出账费用、历史欠费情况等消费行为指标25个;包含投诉率、满意度、回访次数、业务办理和变更次数等态度意愿指标8个。

表3 学习2548次后的网络性能

(二)数据实验

本研究选取2013年某通讯运营商2160个用户数据做初始样本,其中1680个作为学习样本,480个作为测试样本,这些用户数据分为在网用户数据和流失用户数据。为了真实反映用户流失情况,我们将数据进行配比,分为两组同比例的在网用户和流失用户数据,作为学习样本和测试样本。通过一年的出账话单跟踪,收集离网倾向的特征性数据,通过BP网络的自适应学习效应,拟合出一个预测客户流失倾向的指标模型。

通过数据初始化输入,建立45-12-1的BP网络结构,经过2548次输入层和输出层的自适应学习算法,最终达到训练误差和目标阈值的高度拟合,训练结果如图2所示:

图2 BP网络误差收敛曲线

(三)实验结论

我们将随机抽取的1680个数据作为学习样本,经过2548次学习,网络精度达到预设的0.01。与此同时,对剩余的480个样本进行测试,测试误差和学习误差偏合度较高。为了进一步测试模型的可靠性,我们结合实际在网的用户数据对2014年上半年用户离网倾向进行预测,人工统计后台用户实际在网数据,预测准确率达到91.62%。在实际使用客户离网倾向BP网络预测模型时,为了优化网络性能,我们可以选取某一类目标客户的行为数据单独进行网络训练,并结合历史数据和人工统计进行比对,优化数据的分类。例如针对大学生用户群体品牌忠诚度及离网倾向的研究,限于篇幅将作为进一步研究的方向。

对于通讯运营商来说,客户在网时长与客户对企业的实际价值贡献息息相关。为了挽留和维系客户,运营商推出了个性化定制的产品,以更优惠价格和更高的服务标准提供给消费者。正确识别目标客户,预测在网客户的离网倾向,提前预警和启动挽留方案是CRM乃至数据挖掘技术时代的必然要求。本研究以客户在网消费行为特征为主体,构造出客户离网倾向的数据判断模型,通过跟踪监控用户消费行为,预测用户离网趋势,为通讯运营商及时采取补救措施,启动营销预案提供了解决思路。

[参考文献]

[1] OSTERLE H, MUTHER A.Electronic customer care-Neue Wegezum Kunden[J].Wirtschaftsinformatik 1998,40(2): 105-113.

[2]HUNG S Y,YEN D C,WANG H Y.Applying data mining to telecom churn management[J].Expert Systems with Applications,2006,31(3):515-524.

[3]郭明.基于决策树的客户流失分析[J].广东通信技术,2004,24(11):37-40.

[4]周洁如,庄晖.现代客户关系管理[M].上海:上海交通大学出版社,2008.

[5]贾琳、李明.基于数据挖掘的电信客户流失模型的建立与实现[J].计算机工程与应用,2004,40(4):185-187.

[6]汤海霞.移动通信企业客户管理模型与方法研究[D].南京:东南大学,2014.

[责任编辑朱毅然]

Research about Warning Model of Losing Customers in Telecommunication Industry Based on BP Network

LINMin-hui

(AnhuiXinhuaCollege,Hefei230031,China)

Abstract:With the background of full-business, customer resources have become the precious resources in communication industry.How to identify the customer behavior effectively, develop appropriate countermeasures to maintain users has become the important way to reduce marketing costs and improve the core competitive advantage.In this paper, the author use an adaptive algorithm of BP network to train the 45 indicators represented the behavior of on-business customers.Ultimately, the losing customer behavior discovering model will provide a new idea to predicate the customer who is going to lose.

Key words:BP network;customer churn;prediction

中图分类号:F626;F723

文献标识码:A

文章编号:2095-770X(2016)03-0146-04

作者简介:林明辉,男,福建福州人,安徽新华学院讲师,硕士,主要研究方向:客户关系、消费者行为。

收稿日期:2015-10-19;修回日期:2015-11-03

PDF获取: http://sxxqsfxy.ijournal.cn/ch/index.aspxdoi: 10.11995/j.issn.2095-770X.2016.03.035

猜你喜欢

预测
无可预测
基于PCC-CNN-GRU的短期风电功率预测
选修2—2期中考试预测卷(A卷)答案与提示
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
选修2—2期中考试预测卷(B卷)答案与提示
“预测”得准
不可预测