大数据技术在财产保险反欺诈中的应用研究综述
2021-11-23张巍巍吴恒亮
张巍巍,吴恒亮
(山东工商学院 管理科学与工程学院,山东 烟台 264005)
0 引言
据2019 年7 月发布的《财富》世界500 强企业排行榜,我国有9 家保险企业上榜,实现了历史性新突破。在财富管理背景下,各家保险公司通过产品创新不断增强其竞争能力,财产保险已从以前单纯的保障型产品,被开发成集“保障性、储蓄性和投资性”于一身的投资型产品,受到保险市场的广泛关注。但是,财产保险欺诈现象却呈现出逐年递增态势,成为制约我国财产保险行业持续健康发展的重要因素之一。据银保监会统计,2019 年我国财产保险业务保费收入11649 亿元(占比达27%),赔付支出7279 亿元。中国人民大学教授孟生旺曾指出,我国保险公司在每年的赔款中,至少有10%~20%的赔付属于保险欺诈。恶意欺诈行为的存在,一方面给保险公司带来了巨额经济损失,另一方面,也会严重损害投保人享有的正当权益,必将限制财产保险参与社会管理的功能。当前,财产企业保险数据呈现出海量、多样和异构等大数据特点,传统的经验式、数据式欺诈行为检测技术和方法已经无法适应新的大数据环境。因此,在大数据背景下开展财产保险反欺诈研究具有重要的现实意义和应用价值。
1 国内外研究的现状
中国银保监会2018 年24 号文《反保险欺诈指引》中提出,要充分发挥大数据在保险反欺诈工作中的技术优势,不断探索和建立多个险种的保险反欺诈大数据技术平台,为保险行业提供欺诈风险分析和预警监测等服务。同年,由中国保险学会牵头,成立了智能保险风险控制实验室,着力研究云计算、大数据以及人工智能等技术与保险风控的融合问题,重点开展保险行业的反欺诈和反渗漏等相关研究和技术推广活动。
1.1 财产保险欺诈检测方法研究
Picard P(2001)在《Handbook of Insurance》中指出,保险欺诈是指保单所有人(Policyowner)未能真实地报告他们所遭受损失的大小,往往通过扩大损失来获取更多的赔偿;或故意伪造了一个从没有发生的事故索取赔偿;或在签订保单时,未能如实报告相关的信息等行为。从国外来看,有关财产保险欺诈检测的文献比较多,尤其是在欧美一些比较发达的国家,在理论、实证等方面的研究已经比较成熟和完善。其中,理论研究主要围绕社会心理学、博弈论等领域。在实证方面,早期研究多借助于传统的统计方法和模型来检测保险欺诈行为,如Ridit 模型、Probit 模型、AAG 模型和Logistic 模型等。不过,随着机器学习、人工智能等技术的出现,越来越多的学者开始关注神经网络、决策树、模糊聚类等数据挖掘和机器学习方法(如Li 等,2018;Majhi 等,2019),并取得了比较好的欺诈检测效果。
在国内,定性分析研究比较多,涉及保险欺诈类型、形成原因和防范对策等方面,如叶明华(2007)基于信息不对称理论,从心理学角度分析了保险投保人和被保险人进行欺诈的主要心理动因及防范对策等问题。相关的定量研究还比较少,如刘轶(2017)通过建立Logistic 模型探索保险欺诈行为的形成和作用机理,并给出了限制保险欺诈行为的具体对策。陈迪红等(2017)通过构建PSD-LDA 模型对我国保险公司因欺诈类操作风险产生的损失进行了定量分析。近几年,国内一些学者已开始使用数据挖掘、机器学习等技术进行保险欺诈行为检测,相关实证研究逐渐增多,如李秀芳等(2019)对不同Bagging 集成算法和学习器组合在保险欺诈检测中的性能表现进行了实证检验,结果表明,机器学习技术与传统的检测方法相比,具有良好的甄别效果;同时指出,需要根据不同欺诈检测场景选取不同的机器学习算法和方法,以提高欺诈识别效果。
1.2 大数据技术领域相关研究
近几年来,大数据科学与工程技术已发展成为科学界最为热门的研究课题之一,受到学者、政府及业界的高度重视,其应用已深入到金融、工业、医疗、教育等众多领域。从国外来看,学者们对大数据概念的研究相对比较深入,且将研究重点放在大数据技术上,重点关注大数据分析算法及系统效率等问题(NS Islam 等,2015)。从国内看,学界对大数据概念的研究并不是很充分,往往是引用国外的定义进行阐释,研究重点多侧重于云计算、大数据、数据挖掘、并行计算及分布式处理等技术方面的问题。黄宜华(2015)指出,进入大数据环境,为实现高效的机器学习任务,需要一个同时支持大规模数据处理和机器学习算法的大数据机器学习系统;刘志强等(2015)提出了一个基于Spark R 的并行化分类算法,与Map Reduce 性能相比有大幅度的提升;针对大数据环境下的大规模语义数据存储和查询难题,顾荣等(2017)在Spark 分布式计算框架基础上设计开发了一套Goldfish 原型系统。研究表明,传统的数据挖掘和机器学习等技术需要加以改进方能适应今天的大数据计算环境,而且在不同的行业和应用领域也需要不断探索具体的大数据分析技术。
1.3 大数据技术在财产保险反欺诈领域的应用
在财产保险领域,大数据技术已在西方很多国家得到了比较好的运用,涉及财产保险产品的开发、定价、销售及理赔等多个方面。欧洲保险及再保险联盟为促使保险公司之间实现信息共享,组建了一个理赔与承保交换网(简称CUE),加大对投保和理赔环节的审查力度,从而发现和制止那些恶意投保和潜在的欺诈行为;全美反保险欺诈办公署则通过大数据分析技术构建欺诈预测模型,并将模型嵌入到索赔评级系统中,根据评级得分高低来判断索赔是否存在欺诈成分,从而鉴别出保险数据中所隐含的各种欺诈行为。
国内学者对财产保险大数据技术的应用研究起步略微滞后,且以定性研究为主,多涉及大数据给财产保险管理带来的影响、价值和挑战等方面。袁幕琴(2015)分析了我国保险行业存在的主要欺诈行为以及表现、产生的原因和危害,在此基础上提出了利用大数据技术手段应对保险欺诈的相应防范对策。中国人保财产保险公司监察稽查中心梁晓攀(2017)从思维方式、重视程度、数据共享、风险防控体系等多个方面剖析了目前保险行业反欺诈工作存在的问题,提出了大数据分析方法在财险反欺诈中的几个具体应用场景。实证方面,王海巍(2016)利用大数据Hadoop 技术框架和聚类算法,对财险企业在投保、核保、勘查、理赔等环节产生的业务大数据进行聚类分析建模,识别具有高危道德风险的行为主体。目前从我国财产保险行业实践来看,大数据技术在欺诈检测工作中的应用尚处于尝试和起步阶段。2016 年,由保监会组织建设的“车险反欺诈信息平台”正式投入使用,使得车险欺诈信息在行业内首次实现了交互和共享,力图利用大数据欺诈识别模型来辅助保险欺诈稽核工作。虽然取得了一定的成效,但与预期目标仍有很大的差距。党的十九大做出了推动互联网、大数据和人工智能技术与实体经济进行深度融合的战略部署,创新财产保险反欺诈工作模式、提高保险业的大数据反欺诈实战能力已成为研究的热点。
2 研究不足及趋势
总的来看,目前我国各家保险公司在财产保险反欺诈检测时,主要还是依赖人工经验、传统的数据查询分析以及统计分析等方法,学术界尽管提出了一些基于数据挖掘、机器学习等技术的保险欺诈识别方法,但多数停留在理论和实验阶段,在实践中应用得非常少。而且,面对海量的财产保险数据(包括大量的非结构化数据),传统的财产保险欺诈检测模式、模型和方法,以及既有的研究成果已经很难应对。所以,研究大数据环境下的财产保险欺诈检测模式和方法是大势所趋,已经成为保险反欺诈研究领域中的一个新的热点。但是,就目前来看,在财产保险领域尚缺乏比较成熟的大数据技术方案及可循的经验,学界和业界对财产保险反欺诈的大数据技术研究还处于起步、探索阶段,对具体操作层面的研究明显不够,在保险大数据欺诈检测模式相关问题的研究上比较笼统,也不够全面和深入。因此,在未来的研究中,学者们应多关注基于大数据技术的财产保险欺诈检测模式、实施路径以及欺诈模型构建等关键问题。
3 结论
财产保险的反欺诈研究是一个世界性的课题。由于财产保险欺诈行为形式比较多样,操作又非常隐蔽,有效识别欺诈行为是财产保险反欺诈研究的重点和难点。从传统的经验式和数据式欺诈检测模式,到大数据分析技术的引入和大数据欺诈检测模式的提出,财产保险欺诈问题的研究在广度和深度上得到了延伸和拓展。探讨大数据环境下的财产保险欺诈检测模式、具体实施路径以及大数据欺诈模型等关键问题,可为今后开展基于大数据技术的财产保险反欺诈工作奠定理论基础。