基于数据挖掘技术的汽车保险理赔风险控制研究
2016-03-21崔阳沈阳汽车工业学院
崔阳 沈阳汽车工业学院
基于数据挖掘技术的汽车保险理赔风险控制研究
崔阳 沈阳汽车工业学院
摘 要:本文从数据挖掘技术、数据挖掘技术可以解决的保险问题以及数据挖掘过程等三个方面概述了基于数据挖掘技术的汽车保险理赔风险控制,并通过VPRS模型来分析了汽车保险单相关数据,以数据挖掘技术为基础研究了汽车保险中的理赔风险原则,旨在加强数据挖掘技术在汽车保险理赔风险控制中的应用。
关键词:数据挖掘 汽车保险 风险控制
前言
相较于其他保险种类而言,汽车保险有着客户量大、业务数据和财务数据复杂等特点,在管理的过程中不可避免的会出现海量数据的处理和汇总等问题。汽车风险不仅包括机动车辆本身的风险,还受到驾驶人员因素、社会环境因素的影响。由以上两点可知,对于汽车保险的数据处理至关重要,因此本文简要研究了基于数据挖掘技术的汽车保险理赔风险控制。
一、基于数据挖掘技术的汽车保险理赔风险控制概述
(一)数据挖掘技术概述
随着计算技术、互联网技术的提升,人类社会逐渐走进了大数据时代,所谓数据挖掘,指的就是从海量的、模糊的、随机的数据中挖掘、提取出人们事先不知道但有着重要作用的数据的过程。数据挖掘技术能够以相关数据提取模型为基础,采取有效的分析方法和科学的分析数据来挖掘信息、识别信息,发现数据信息之间的关系[1]。从本质上来讲,数据挖掘是集合人工智能、数据库、数理统计等多方面、多领域的交叉学科,其在金融、保险、零售等各个领域都有着重要的应用,主要的数据分析方法包括关联规则法、数据融合法、统计分析法等等。
(二)数据挖掘技术可以解决的保险问题分析
保险行业是知识密集型行业,在推行数据挖掘技术的过程中有着得天独厚的优势,保险业务一般为保险产品的推广、销售以及相关理赔等等,本文以汽车保险的理赔业务为研究对象,在保险理赔业务中会产生大量的数据,并形成相关的理赔事物型数据库,例如理赔客户数据库、理赔数据库等等,如何从这些数据库中获取有用的数据信息来保证保险理赔业务的顺利进行至关重要,数据挖掘技术作为一种先进的数据提取技术在汽车保险理赔业务中的应用有着重要的意义,其能够帮助客户来分析理赔风险,划分客户群体,发现相关理赔保险问题。
(三)数据挖掘
以CRISP-DM模型为基础,可以将整个数据挖掘的过程分为六个阶段,分别是理解业务阶段、理解数据阶段、准备数据阶段、模型建立阶段、数据评估阶段和部署实施阶段。数据挖掘不单单是指数据的组织和呈现,在数据分析及相关模型的建立之外,还要符合业务的具体要求,以业务的具体要求为基准进行数据的查找和呈现,要对相关业务数据进行有效的理解之后才能够进行数据的准备和模型的建立等过程,且整个过程并不是单向运作流程,而是反复、多次的调整流程,是一个不断修正的过程。
二、基于数据挖掘技术的汽车保险理赔风险控制研究
在汽车保险业务中,理赔风险对于相关保险战略的制定有着重要的指导意义,其对于相关保险单位及企业的生存和发展至关重要,就目前来看,理赔风险的分析与控制已经成为了众多保险企业在相关营销战略制定过程中首要解决的问题之一。在汽车保险理赔风险的分析与控制过程中,数据挖掘技术能够提供风险控制过程中相关投资组合数据,从而能够对理赔风险环境进行有效分析,同时数据挖掘还能够直接对汽车保险的理赔风险进行分析和控制,具体研究如下:
(一)粗糙集理论分析
粗糙集理论的核心指的是对不确定、不完善、不精确数据的处理,此处理方式以分类机制为基础,通过等价关系来对空间进行划分,以此来得出信息系统在不同简化层次上的置信度要求,根据已知信息及相关模型来实现逐层的匹配,之后再按照优先级判定来算出解决问题的最优解[2]。在利用粗糙集理论的过程中并不需要先验信息,在分析不确定性问题上比较适用,这也是数据挖掘技术在汽车保险理赔风险分析中应用的基础。
(二)车险理赔风险规则的挖掘分析
1.数据准备过程。在数据挖掘的过程中,数据准备环节至关重要,数据准备的质量对于数据挖掘的准确性以及有效性有着重要的影响。数据准备包括数据的选择、净化、转换等众多步骤。
2.数据补缺与离散。此过程以数据挖掘工具为基础对数据进行离散处理,汽车的车龄、参加保险的金额等都属于连续的数据,要想实现数据的离散,应当对数据进行等级分类。数据缺失是不可避免的,在发现数据缺失时需要进行补缺,一般补缺方式为组合补缺,通过对缺失数据属性的分析来补充可能失去的属性,形成多条属性记录,这种补缺方式有利于趋向原决策规则。
3.属性约简与风险规则。属性约简指的是对不一致和出现噪音的数据进行约简,以此来提升抗噪声及抗干扰的能力,在属性约简之后,利用数据挖掘工具来产生相关风险规则,产生的规则有一些是有效的风险规则,而有一些是无效的风险规则,此时需要对这些风险规则进行筛选和过滤,对风险规则进行调整,找出最有效风险规则。
4.衡量规则价值。从系统层面来讲,主要是以可信度、支持数及覆盖率三个指标为基础进行规则价值的客观衡量,其中可信度指的是该规则下推理结果的正确率,覆盖率指的是该规则下决策类的比重,支持数指的是该规则下的元素个数,为了避免不同指标之间负关系的影响,在衡量的过程中需要进行有效的权衡[3]。
从用户层面来讲,应用数学方法进行衡量是理论层面的,并没有结合用户的主观因素,因此在得到风险规则之后要与客户沟通,结合客户实际工作进行主观的规则价值衡量和判断。
三、结论
综上所述,数据挖掘技术对于汽车保险业务数据化向知识化的转化有着重要的意义,其能够对汽车保险理赔风险的影响因素进行分析,找出理赔业务规律,在避免理赔风险的同时为汽车保险企业寻求商机,本文简要研究了基于数据挖掘技术的汽车保险理赔风险控制,旨在充分发挥数据挖掘技术的重要作用。
参考文献:
[1]彭俊杰.基于数据挖掘技术的汽车保险理赔风险控制研究[D].吉林大学,2014.
[2]毕建欣.基于数据挖掘技术的保险客户细分管理[J].华南金融电脑,2006,11:9-12.
[3]郁佳敏.车联网大数据时代汽车保险业的机遇和挑战[J].南方金融,2013,12:89-95.