基于k-means算法的保险业数字化变革
2019-08-01张雯玮徐凡黄君杰赵明修
张雯玮 徐凡 黄君杰 赵明修
摘要:私人购车比例不断增加, 汽车保险这一概念逐渐进入百姓视野。目前我国机动车辆保费占全部财产保险业务的高比例在全世界都是罕见的。但事实上,真正能够做到高续保率的保险公司并不占多数。客户留存率低、无法积累长期客户、销售成本和费用居高不下成为了多数以车险为主要业务收入的财险公司的一大难题。根据搜集的65535位客户资料,分析續保事件与续保客户各项资料的相关性基于模糊聚类分析模型对客户资料进行分类;基于回归分析法,得出与续保概率有关的各因素权重,将权重最高的因素作为续保客户精准画像,针对影响不续保客户最高的几个因素分析,重新设计优惠福利方案以改善续保概率。
关键词:车辆保险;聚类分析;K-means算法;R语言
中图分类号:F842.6 文献标识码:A 文章编号:1007-9416(2019)04-0121-02
1 我国车辆保险业现状
1.1 我国车辆保险业现状
中国目前的车险费率制度,大多数符合“从车主义”。即车险保费多少,主要取决于这辆车本身的各项情况,如车的购置价、座位数、排量、购车年限等,根据这些数据计算出一个基本的车险保费价格,再根据这辆车的上年理赔次数来打不同的折扣。这就导致了中国的车险定价模式非常的单调,相似情况的车型,保费也都差不多。
1.2 我国车辆保险业未来发展趋势
1.2.1 车险价格与驾驶行为密切相关
未来的车险定价将逐渐转变为“从人主义”。车险的定价因素将直接与驾驶人的驾驶习惯与行驶里程挂钩,通过驾驶行为来判定车险价格。
1.2.2 同价位车型车险价格完全不同
国内传统的汽车保险定价,通常是以车型和其购置价为主要依据。未来中国车险业,同样的一款车,不同的人开,保费价格会完全不同。这个不同可能是取决于投保人本身的驾驶行为,还可能会以投保人本身的年龄、职业、家庭状况等信息为标准。
2 影响车辆保险续保的因素
2.1 续保客户影响因子分类
根据“从人主义”的思想,寻找出与续保相关的特征并进行分析,将特征分为客户属性以及保险套餐两个类别进行分析,影响因子特征分类如下:
(1)客户属性:被保险人性别、被保险人年龄、客户类别、NCD、渠道、立案件数、已决赔款。
(2)保险套餐:三者险保额、险种、是否投保车损、是否投保盗抢、投保类别、是否投保车上人员、签单保费、风险类别。
2.2 续保客户影响因子个案权重计算
由此可以进行进一步分析,计算影响因子每个个案的权重,即与续保的相关性,设R为个案的权重,如公式(1)所示:
2.3 续保客户分类
通过k-means算法进行客户聚类分析。设置聚簇数量k,遍历所有数据;计算两个元组间的欧几里距离,如公式(2)所示,确定质心,并将其余数据划分到最近的质心(初始k个簇的质心为随机选取的k条记录)中(即临时归类簇集);计算簇集中所有元组的平均值,并更新质心;重复上述操作,通过误差平方和(SSE)的结果,判断这k个质心不再变化(即已收敛),如公式(3)所示计算,或执行了足够多的迭代。
3 提高车辆保险续保概率的对策
通过K-means算法将不续保的客户进行分类。分别总结出续保高的客户、续保低的客户、不续保概率高以及不续保概率低的客户以及从而设计优惠政策。
3.1 针对续保概率较高的客户
续保概率高证明这类用户对该公司车险满意度较高。
福利政策:(1)机构对机构内的个人推荐购买本公司车险,则次年保费可以有所减免。(2)次年保费下降至前年的95%,连续五年。
3.2 针对续保概率较低的客户
续保概率低的客户群,是我们潜在会流失的客户群。通过分析发现普遍是年龄在30岁上下的年轻人,而且大多数为上年未发生有责事故,未曾有过立案记录。
优惠政策:(1)个人用户可在享受原有优惠措施的基础上,总保费享受额外的九五折优惠。(2)与车商建立长期的合作关系,通过车商购买保险享受额外的优惠措施。
3.3 针对不续保概率较高的客户
不续保概率高是对保险极其不满意的人群,这批人的保险渠道多数以个人代理为主,年龄主要分布在30岁左右,上年均未发生有责事故,而且以男性居多。
优惠政策:(1)可以扩大保险有责事故的范围。(2)针对年龄在30岁到35岁客户,进行分期付款。(3)对于“电网销”的客户,提供保险费抵扣券。
3.4 针对不续保概率较低的客户
不续保概率低的客户代表他是潜在客源,通过优惠政策吸引该类客户。
优惠方案:(1)对个人代理的客户,进行奖励金制度。(2)对于1-3年内未出现事故的客户,进行续保打折服务。
参考文献
[1] 张诗军,陈丰,王志英,林火华,李远宁.基于电力大数据的客户立体画像构建及应用研究[J].电气应用,2018,37(08):18-25.
[2] 徐立宁.基于动态精准画像的图书馆个性化推荐服务研究[J].图书馆学刊,2018,40(10):112-116.
[3] 叶立武,吴倩,王玮,王东.数据挖掘方法在保险领域的应用前景[J].保险职业学院学报,2018,32(02):43-46.
[4] 王安瑾.一种基于MinHash的改进新闻文本聚类算法[J].计算机技术与发展,2019,29(02):39-42.
[5] 杨子江,王野,马天诣.影响汽车保险续保率的因素分析[J].企业研究,2011(10):107.
[6] 史新颖,夏元平,毛曦,殷红梅.DBSCAN与Kmeans相结合的手机大数据聚类方法研究[J].北京测绘,2019,33(02):132-137.
[7] 尹宝勇,吴斌,刘建生.一种改进的K-means算法[J].江西理工大学学报,2018,39(05):97-102.