APP下载

电信客户信用评估实证研究

2015-05-12向博文胡振华申美惠

科技创新导报 2015年34期
关键词:主成分分析法熵值法

向博文 胡振华 申美惠

摘 要:目前,我国个人信用理论主要集中应用在金融行业,电信行业的信用管理和实践应用仍处于探索阶段。该文以中国电信某省C网个人客户为研究分析对象,将主成分分析法和熵值法相结合建立客户信用评估模型,从而更加科学合理地得到了用户的信用分数。

关键词:电信客户 信用评估 主成分分析法 熵值法

中图分类号:F626 文献标识码:A 文章编号:1674-098X(2015)12(a)-0023-03

Abstract:At present, the personal credit theory mainly used in the financial industry, the credit management and application practice of the telecommunications industry is still in the exploratory stage. This credit evaluation model use together Principal Component Analysis (PCA) with Entropy Method, based on individual customer data of China telecom C network.

Key Words:The telecom customer; Credit evaluation; PCA; Entropy method

电信行业作为信息服务业的支柱行业,优质客户资源的争夺已然成为了一场不见硝烟的战争。作为客户管理的重点,客户信用的评估与管理越来越得到各大运营商的重视。

国外对信用评估的研究已发展到相当高的水平,有些评估方法、技术、模型已经得到学术界的认可,被广泛应用[1-3]。而国内对信用评估技术的研究还处在起步阶段[4-7],客户信用管理及评估,还没有形成完整的科学研究方法和理论。电信行业的客户信用评价的研究尚处于起步阶段,各运营商之间、运营商集团内部没有形成统一的评价方法论。

该文致力于研究一种较为精准的电信客户信用评估方法,将主成分分析法和熵值法结合使用建立信用评估模型,克服使用单一方法带来的缺陷不足,从而更为科学全面地对客户信用进行评分评级,并针对不同的信用等级提出差异化授信服务建议,实现运营中的服务最优化、利益最大化、风险最小化。

1 信用评估模型的指标体系

综合考虑电信行业个人客户信用的各种影响因素,同时借鉴国内外有关文献的评估指标设计[8-10],在国内外学者的信用评估指标体系研究成果的基础上[11],本文建立了专门针对电信行业设计了一个个人客户信用评估指标体系。该评估指标体系包括社会属性、违约成本、通信需求和支付能力四个维度的指标,并且选择“30天内是否复机”作为验证变量,如表1所示。

2 信用评估模型设计

评估指标体系中设计的变量指标,是根据文献资料、业务常规和经验确定的,主观性较强、缺乏严谨的科学论证。因此,首先利用主成分分析法,找出每个维度内的显著变量、剔除非显著影响变量、排除变量间的相关性影响,从而计算出评价对象各个维度分数。确定主成分,一般取累计方差贡献率超过85%的前p个作为主成分。累计方差贡献率计算公式:

然后,利用熵值法计算维度的权重,其本质是通过各指标的信息价值系数来计算权重,价值系数越高,其对评价结果的贡献就越大。第项指标的权重为:

3 信用评估模型的实证分析

该文建模工具采用SAS 9.3,针对某省中国电信某省4 000条用户数据进行建模评估分析。

3.1 利用主成分分析法计算维度分数

该模型变量分3个维度,共16个输入变量。其中每个维度所包含的具体变量情况各有不同,因此需要对每个维度进行具体分析,分别计算各维度得分。

3.1.1 计算通信需求的维度得分

根据特征值大于1及累计贡献率大于85%的标准,选择前3个主成分来代替原有的11个变量。通信需求得分= 0.722×F1+0.1045×F2+0.0658×F3。

3.1.2 计算支付能力的维度得分

根据特征值大于1及累计贡献率大于85%的标准,选择前2个主成分来代替原有的3个变量。支付能力得分= 0.777×F1+0.1869×F2。

3.1.3 计算社会属性的维度得分

社会属性维度内只包含Age年龄一个变量,且该变量为分类型变量,分为A-F共6类。

根据线性函数转换公式如下:

Age变量用户得分如表2所示。

3.1.4 计算违约成本的维度得分

违约成本维度内只包含R3A_Pay_Amt近三月平均缴费金额一个变量,且该变量为数值型变量。因此,该变量经过标准化后的数据即可作为此维度的得分。

3.1.5 各维度信息效用

通过以上对输入变量4个维度的计算,得到所有用户4个维度的信用得分情况,如表3所示。

3.2 利用熵值法计算维度权重

该文信用评估模型的熵值法计算维度权重步骤,采用SAS编程来实现。

对信息效用值进行公式2的计算,从而到得到各维度的权重,如表4所示。

3.3 计算用户信用分数

根据公式3,计算用户的信用综合评分。同时为了便于对分数的观察和理解,将用户信用的分数归一到[0,1]区间。结果如表5所示。

4 信用评估模型的效果评估

按照公式3信用评估模型,是典型的无监督模型。从以下两点对模型的效果进行评估。

4.1 用户信用分数分布评估

对4 000个建模用户的信用综合评分结果分布情况进行统计分析,结果如透视图1所示,其中横坐标表示用户信用分数。

通过对柱状图结果进行观察,得出用户的信用评分呈现合理的长尾正态分布形态,即信用较好用户的信用评分集中在高分值,信用较差用户的信用评分分散在低分值的尾部。这表明信用差的用户与信用好的用户在信用评分上差异明显。

用户信用分数分布合理性的验证,可以表明用户信用分数可以很好地区分用户的信用状态。

4.2 通过验证变量效果评估

该文信用评估模型使用“用户30天内是否复机”作为模型效果验证变量。通过探讨用户信用分数与验证变量之间的关系,观察复机率的提升度,实现对模型效果的评估。结果如图2所示。

如上图结果,按照用户信用评分由高到低排序,比较不同信用评分用户中30天复机率的大小。发现不同信用分数用户的复机率的提升度均大于1,且信用评分最高的前70%用户的30天复机率比正常情况下的平均复机率高20%。说明信用评分能较好并且正确地反映用户信用的好坏。

5 信用评估模型的结果分析

模型的信用分数分布在0.11~0.71之间,且大致呈现正态分布,中间信用分数的用户多,较大信用分数和较小信用分数的用户较少。结果与统计学常识和业务实际情况相符合。

同时将用户的变量属性与分数结合分析,发现信用分数结果所反映出的信用事实与变量探索阶段的结论相一致。通过模型结果分析,总结信用较好的用户的特征如下。

(1)年龄集中在26~39、43~49阶段,即中年用户。

(2)支付能力处于中等及中等水平以上。

(3)通信需求大,通信行为活跃。

总体可以概括为,信用较好用户多为支付能力稳定、通信需求强烈的中年客户群体。这一部分用户是营销和维护的重点客户群。

通过进一步挖掘分析,发现这部分用户一般有固定的工作、具有稳定的经济来源、存在一定的交往交际圈、对个人行为信用较为重视,因此在实际中具有良好的信用度。

参考文献

[1] Bell T. Neural nets or the logit model: a comparison of each models ability to predict commercial bank failures[J]. Intelligent Systems in Accounting:Finance and Management, 1997(63):249-264.

[2] Tam K Y, Kiang M. Managerial applications of neural networks: the case of bank failure predictions [J].Management Sciences, 1992(38):926-947.

[3] Bell T. Neural nets or the logit model: a comparison of each models ability to predict commercial bank failures[J].Intelligent Systems in Accounting:Finance and Management,1997(63):249-264.

[4] 王海军,范静珥,佟元琪.基于AHP法的农户小额信用贷款风险评价的研究-以吉林省农村信用社为例[J].吉林农业,2009(24):89-91.

[5] 谭民俊,王雄,岳意定.FPR-UTAH评价方法在农户小额信贷信用评级中的应用[J].系统工程,2013(5):55-59.

[6] 王颖.中国农户小额信贷信用风险评估研究-基于模糊综合评价模型[J].金融与统筹城乡,2010(8):60-62.

[7] 刘志戈.农户信用征集与评价机制探析[J].金融理论与实践,2008(12):48-51.

[8] 吴冲,张晓东,田海霞,等.基于模糊神经网络的商业银行信用风险评估模型研究[J].管理观察,2009(3):187-189.

[9] 吴冲,王萤,郭英见.基于支持向量机的个人信用评估模型研究[J].运筹与管理,2008(4):96-99.

[10] 陈良维.决策树算法在农户小额贷款中的应用研究[J].计算机工程与应用,2008(31):242-244.

[11] 张博文.电信运营客户信用评分建模研究[J].信息科技,2009(10):113-114.

[12] 庞素琳,巩吉璋.C5.0分类算法及在银行个人信用评级中的应用[J].系统工程理论与实践,2009(12):94-104.

[13] 蔡丽艳,冯宪彬,丁蕊.基于决策树的农户小额贷款信用评估模型研究[J].安徽农业科学,2011(2):1215-1217.

猜你喜欢

主成分分析法熵值法
“压力—状态—响应”模型下城市土地集约利用水平
应用型高校实践教学质量评价指标体系研究
基于改进突变级数的农产品流通体系建设绩效研究
灰色关联模型在白酒企业财务竞争力评价中的应用
山东省旅游产业竞争力评价研究
中国装备制造业阶段竞争力研究
陕西省各地区人力资本水平综合评价与分析
基于主成分分析的煤层气赋存影响因素分析
基于主成分分析法及熵值法结合的耕地集约利用时空变化
基于主成分分析法的高校财务风险评价指标体系构建