APP下载

大数据分析在人身险欺诈风险管控中的探索

2021-11-23泰康人寿总公司运营中心

现代经济信息 2021年8期
关键词:数据模型欺诈流程

史 程 泰康人寿总公司运营中心

通过模型训练让机器智能化,实现流程的线上化、数字化,代替线下流程,减少人工,降低成本,提高效率,其巨大的优势和巨大的商业价值促使各行各业的投保公司,积极开始建设属于自己的大数据应用及人工智能体系,尤以阿里巴巴、腾讯、美团、滴滴、360等拥有明显大数据资源优势的头部互联网企业为代表。当前,区块链、人脸识别、OCR、NLP、RPA、精准预测模型等基于大数据技术的商业化运用,已经逐步成熟,作为对数据极为敏感的金融领域,大数据所能带来的巨大价值,无用多言,所有金融类头部公司,无不把数字化、线上化、智能化作为开始颠覆传统的商业及实现运营管理模式再造的开端。大数据推动的产业升级和流程变革带来的巨大竞争压力,迫使对数据高度敏感的保险、银行、信托等金融机构必须流程重塑,转型升级,在业务全流程积极引大数据和人工智能技术,实现传统线下业务员流程和大数据的高度结合与平衡。通过构建精准的大数据风险预测模型,对于在业务中存在巨大信息不对称,经营风险的保险行业来说,便成了一个极具吸引力的打造公司核心实力的关键切入点。

从人身保险和财产保险的整体应用来看,由于财产险,特别是车险的自身特点,更容易实现底层数据的标准化,同时车险行业的承保、理赔信息的整合和共享程度更好,建设也更早一些,所以财产险领域,特别是车险在大数据风险识别模型的应用上要较为领先。2016年“全国车险反欺诈信息系统”正式上线,面向各市场主体提供保险欺诈线索识别和风险预警功能,初步实现了行业车险欺诈信息的交互共享。车险基于大数据的风险管控和反欺诈效果凸显。而人身保险以人的健康和寿命作为对象,其经营的风险更加复杂多样,健康信息的存在巨大的不对称性,逆选择和道德风险极高,同时,我国的公民个人信息管理较为分散,数据呈现碎片化,尤其是公民健康数据和医疗数据虽然近些年已经取得了巨大的进展,但底层数据依然标准化程度较低,分布较散,非常不利于数据分析和智能化技术的应用,大数据分析技术虽然能够实现一定程度的从非结构化数据中提取关键信息。但很多欺诈的关键信息都是主观性较强的非结构化数据,比如第三方鉴定报告,无法实现批量分析。大数据分析在人身保险风险管控领域的应用还比较滞后。

保险公司可以整合、打通、搭建一个集合内外部数据的集市,实现数据字段的标准化,数据输出的模块化,通过不同模块的组合,适应多种场景的应用。一个数据丰富,维度多样的系统可以提升偶发、新发的欺诈行为和案件的识别概率。风险预测模型等技术可以批量深入分析欺诈实例,通过筛选欺诈风险因子,进一步迭代优化风险识别模型,提升模型的准确性。大数据解决方案可以帮助建立覆盖保单全生命流程的风险管控体系,帮助企业审视全流程风险,逐步实现风险管控前端化,改善客户感受,降低风控成本。通过组织内部信息的有效打通和关联,全流程视角能够获得更好的欺诈检测效果。保险欺诈可以载多个流程节点同时发生:承保、理赔、调查、续期、保全或者与员工行为相关的欺诈或外部欺诈。一个整合了内外部数据源的风险识别模型可以起到更好的风险预测功能。

保险公司能够将已有的内部数据和引入的外部数据相结合,寻找影响保险欺诈最为显著的因素及这些因素的权重和取值区间,建立预测模型,快速的进行欺诈案件分类和调查审核流程管控,并为理赔调查人员的调查方向提供线索,让理赔审核人员根据欺诈风险评分的高低迅速审核处理赔案件,极大提高理赔的时效性,同时,通过大数据技术给线下调查人员提供明确的调查方向和线索,避免调查人员完全依靠个人主观经验判断风险,实现精准发起调查任务,指导调查人员获取异常记录。这种方式可以极大地提高欺诈风险识别的准确性和效率,同时还可以为保险公司节省大量的人力成本。笔者供职的泰康人寿作为国内的头部险企,在人身险领域一直积极尝试及推动大数据分析建模及机器学习。

一、前端认知核保

泰康人寿开发的认知核保系统,将人工智能与医学知识、保险业务紧密结合,打造AI体检数据采集引擎和AI核保决策引擎,使核保更便捷,风控更有效。体检数据采集疫情以客户体检报告影像为输入,自动定位、识别健康数据,依据自然语言和医学语义使其结构化,自动识别异常体检项目;核保决策引擎构建可解释算法模型,预测客户健康风险,并且结合投保产品特征评估承包风险,输出核保结论解释。该核保系统支持超过10类常见疾病患病风险的预测,准确率近80%,同时也将核保环节人工审核的效率提升超过25%。

二、客户风险信息平台

两核风控是寿险行业最重要的风控环节之一,但实际工作中存在着大量简单重复性操作步骤,如跨系统数据查询时的信息复制与填充,日常格式化数据报表的制作等,消耗了大量的工作时间。随着近年来外部数据平台的陆续接入,已有全国同业的两核风险数据、覆盖十余省的医疗数据模型等客户风险信息数据实现了远程线上查询,为两核风控提供了更快速、更全面的审核依据。但在实际工作中,外部数据模型查询面临着查询入口分散、检索条件复杂等多种问题。为解决上述问题,高效利用医疗大数据资源,进一步提升两核环节线上化、智能化水平,泰康人寿利用机器人流程自动化与人工智能技术,建设了服务于两核风控的“客户风险信息平台”,实现统一、便捷的风险模型数据查询。极大提升了两核效率,优化了两核人员的使用体验。

三、两核大数据模型

泰康人寿持续探索新技术、新科技在保险领域的应用,在行业中率先将大数据与人工智能技术应用于两核风控板块,开发了两核大数据模型、反欺诈模型、内部审计模型等多个应用于核保、理赔、调查板块风控工具,在应用中发挥了良好效果,更加有力地捍卫了公司和客户的利益。

大数据模型是利用既往积累的大量数据信息对未知结果进行预测的方式,建模过程主要包含数据标准化,建立数据库,确定目标结果,筛选相关因子,生成模型,模型自主学习优化等。其中生成模型的过程需要使用大数据算法,这也是大数据建模最关键的环节之一。

目前成熟的大数据算法有很多种,例如:决策树算法、随机森林算法、逻辑回归、朴素贝叶斯等。每次建模需根据数据字段类型、数据字段数量、目标结果等因素选择适合的算法,以达到最优的预测结果。

两核风控板块应用有以下几种大数据模型:

(一)两核大数据模型:根据大量核保、理赔信息,选取10余项投保、理赔时的关键字段,使用逻辑回归算法预测核保、理赔结果的模型应用。用于识别客户风险等级,具有核保阶段高风险客户拦截,核保阶段低风险客户无需体检,理赔阶段高风险客户拦截等多种应用场景,减少人工审核量,降低体检成本的同时抵御客户风险。

(二)反欺诈模型:使用XGBoost算法在承保后出险前阶段识别已承保客户的欺诈风险,具有不影响业务承保,时效要求宽松,全流程持续风控等优秀。该模型应用后有效提高了提调精度,提升了工作效果。

(三)审计模型:为防范内部人员风险建立的审计模型,根据工作行为记录识别个人及案件违规风险。

保险行业发展迅速,保费规模不断扩大,随着“保险姓保”的政策逐渐落地,保障性产品,健康险的增加速度迅猛,保险欺诈及各种滥用、套利问题,在信息非对称化下保不断地扩大,在大数据技术的支撑下,互联网保险市场的发展潜力不断被放大,保险欺诈的风险敞口成倍放大。保险反欺诈一直都是保险公司关注的重点,很多公司在大数据及人工智能的应用也进行了尝试。例如平安集团、弘康人寿等保险公司利用只能图像技术进行人脸识别实现更快数投保,防范风险骗保等行为,蚂蚁金服同样利用智能图像技术推出了车险理赔辅助工具定损宝,帮助保险公司快速处理车辆理赔定损,避免虚假理赔。同时各大保险公司都在利用人工智能的学习算法分析自身现有数据或结合医疗、交通及公安等各类大型数据源进行欺诈理赔的识别,进而形成否符合自身特点的动态反欺诈模型,加大对欺诈案件的防空力度。其中保险业大数据一般有以下几个来源:

一是保险公司自身建立数据库。保险公司的数据库是自身经营的历史和现实的记录,主要针对的是自有客户、准客户和已流失客户的承保和理赔信息,以及公司产品设计信息、保险标的风险查勘信息、出险记录、防灾防损记录和客户服务等信息。这些信息除了监管部门要求上报的以外,都是保险公司内部使用的,属于商业秘密,具有较强的封闭性、专业性和秘密性。保险公司可以通过数据挖掘和分析等方式,对自身数据库信息进行充分利用。

二是保险行业自主建立数据库。为加强保险行业信息共享,经国务院批准,由中国保监会依法实施管理,2018年6月意健险风险管理系统试运行,7月正式向行业推出“守护者”系列数据服务,一期产品包含4款数据产品,8个应用场景2020年意健险风险管理系统二期产品,包含6款数据产品,7大类场景,协助保险公司管控风险、提高效率、降低成本、改善服务。

三是与第三方合作利用大数据。随着移动互联网的发展,线上线下的不断融合,出现了一大批掌握巨量信息的平台机构,如阿里、腾讯、百度等。同时,也催生了需要信息的公司与这些平台合作的机会。

科技改变人类生活,大数据及人工智能技术的应用对各行各业产生了颠覆性的深远的影响。当前,大数据技术,智能化、区块链等在保险行业的应用日益广泛,逐渐形成新的保险体系。通过新科技技术与保险行业的融合,改善传统保险的服务模式,保险行业同时也能够不断推出符合时代要求的产品与服务,降低企业成本,优化产业结构。■

猜你喜欢

数据模型欺诈流程
关于假冒网站及欺诈行为的识别
关于假冒网站及欺诈行为的识别
吃水果有套“清洗流程”
警惕国际贸易欺诈
面板数据模型截面相关检验方法综述
加热炉炉内跟踪数据模型优化
本刊审稿流程
析OGSA-DAI工作流程
网购遭欺诈 维权有种法
面向集成管理的出版原图数据模型