大数据时代的保险风控进化论
2019-12-16徐瀚瀚小雨伞保险
徐瀚瀚 小雨伞保险
今天我想给大家分享的主题是大数据时代的保险风控进化论。本人是互联网保险平台小雨伞保险的创始人和董事长。小雨伞主营业务是通过定制加精选保险产品,在互联网在线平台销售,同时运用高科技赋能价值链条。传统的保险售卖主要通过代理人和银行两个渠道。现在由于互联网的高速发展,人们获得信息的方法和手段都发生了一个根本性变化。代理人制度进入中国的时候,发展得非常快速。由于保险产品属于高度专业的金融产品,晦涩难懂,信息不对称加上快速发展引至的人员素质不齐,导致保险给人留下了一些不好的印象。但是随着移动互联网的兴起,大家获取资讯的方式都有所改变。比如说中国内地现在的80后、90后,他们想了解事情,会先去知乎上面看一看。主动获取资讯和互联网的天然透明开放的特质相互匹配。
一、金融业数据价值的演化
(一)金融业数据价值的演化
首先我们来看从金融业传统的数据仓库到大数据的演化。传统的手段实现的数据分析平台利用的主要是结构化数据进行统计分析,已经远远满足不了大数据时代的发展需要,大数据是通过分布式架构设计的,利用分布式计算完成相同的工作内容所需时间更短,主要有五种能力:数据采集的能力、存储的能力、计算的能力、分析的能力和应用的能力。首先来说数据的采集,在讲采集之前,我们看看什么是真正的大数据。在专业术语里,大数据主要是4个V,第一个就是数量(Volume)。大家思考一下,数据量大,是不是一个重要的事情?我们拥有数据当然是越多越好。但是在拥有众多数据的同时,有一个能力是必备的,就是数据分析能力。举个例子,日本作家盐野七生写的《希腊人的故事》,这本书里面讲述了一个关于马其顿国王亚历山大大帝的故事。在亚历山大大帝打仗的时候,有一个特征,他会让他的下属,乔装打扮或是躲在暗处进行敌方信息的收集,比如从房子里走出几个人、手里拿的是什么东西、来来回回几次等,都要事无巨细地记下来,不能出错。这其实可以看作是一个早期的大数据,下属做的事情就是数据的收集。亚历山大大帝懂得数据的价值。这个国王战无不胜的原因也在这里:通过收集的数据来掌握并分析敌人的状况。无独有偶,在辽沈战役时,林彪也让士兵在暗中收集数据,记录小巷的数量、布置了多少士兵等。相比今天,亚历山大大帝和林彪拥有的数据都不算多,二者都成功的原因在于分析数据的能力。第二个V是分析数据的速度(Velocity)。第三个V是数据的多样化(Variety),通过不同的维度来记录数据的多样性,对大数据来说也是非常重要的。最后一个V是数据的价值和真实性(Value)。
关于数据存储这个环节,有一个高效的数据存储架构,叫Hadoop,logo是一只黄色大象。简单来说,这个架构就是存储大数据的,用的是分布式存储。Hadoop把你放在云上的东西分成一个个碎片,进行分布式存储,一个碎片丢掉之后,再利用其他的碎片对丢掉的碎片进行修补,使你放在云上的东西一直存在,不会造成因为数据丢失而引起巨大灾难性后果。数据分析和数据应用能力是各环节中最重要的能力,分析能力中的数据挖掘(Data Mining),即如何在数据的海洋里,把数据的价值挖掘出来,可是一件不容易的事情。要在海量的数据里,通过算法搜索出隐藏在中间的信息。而最重要的一环就是应用,信息可视化、管理精细化,我们看到的医疗、城市管理很多案例都是大数据的应用。
二、保险大数据风控的应用
再看看大数据在金融领域的热点应用,图1中的横轴代表该应用领域价值周期,表明该应用价值速度的快慢,数值越大,价值跨越的周期越长;纵轴代表该应用领域的炒作周期阶段,数值越大表明持续热点时间越久;圆圈代表应用领域的规模,表示该应用领域当前参与方的多少与应用数量。从图片分析,用户画像、精准营销和风险管理在这三方面的应用是目前最为热门的应用。今日头条旗下的抖音,你使用过后会发现,你越刷,出来的越是你喜欢的东西。这其实就是通过精准的用户画像进行的营销。抖音通过你看每个视频的时间发现了你的喜好,之后就给你推荐类似的视频。现在小雨伞也在进行用户画像的精准营销,比如你在浏览医疗险的时候停顿的时间长,那么下次的推送就会多一点医疗险的东西;如果是重大疾病险浏览时间长,之后会增加重大疾病险的东西。简单来讲,应用价值周期加上应用热度,这二者相交的地方,是最热门的应用。
从保险产品开发到营销转化,到理赔管理到资产管理,大数据对保险价值链的影响越来越大。在产品开发方面,小雨伞是以开发定制产品在市场上广受好评的,这里面离不开“市场调研—风险评估定价—市场反馈—迭代优化”这个闭环,随着数据的积累,小雨伞在市场上充分摸清了新生代80后、90后的保障需求点,通过这个闭环不断优化产品,完全差异化了和线下代理人队伍的竞争。在营销转化上,建立客户画像—根据画像拉新—留存—转化,这个数据闭环也帮小雨伞实现了良性的商业可持续盈利。
▶图1 金融领域大数据应用热点图
过去在没有精细化的数据分析和挖掘的情况下,保险公司把很多人都放在同一风险水平之上,客户的保单并没有完全解决客户的各种风险问题。但是,保险公司可以通过自有数据以及客户在社交网络的数据,解决现有的风险控制问题,为客户制定个性化的保单,获得更准确以及更高利润率的保单模型,给每一位顾客提供个性化的解决方案 。基于企业内外部运营、管理和交互数据分析,借助大数据平台,全方位统计和预测企业经营和管理绩效。基于保险保单和客户交互数据进行建模,借助大数据平台快速分析和预测再次发生或者新发生的市场风险、操作风险等。除此之外,保险公司还可以根据代理人员(保险销售人员)业绩数据、性别、年龄、入司前工作年限、其他保险公司经验和代理人人员思维性向测试等,找出销售业绩相对更好的销售人员的特征,优选高潜力销售人员。
三、寿险智能核保与大数据风控的演化与融合
传统的风险维度已经不足以反映世界的复杂性,而大数据大大改善了这一现状。只有拥有越多越全的数据,才能看清这个世界的全貌。根据图1你会发现,在互联网保险欺诈里面有两个特征:第一,好人是分散的,没有共性可寻;第二,坏人是扎堆的,坏人的特性是一样的。一定要获得更多的数据,才能看到事物的本质。接地气地说,就是看事情不能看表面,这句话也可以作为一个警醒。以前的保险风险判断是围绕样本,现在是围绕数据,所以要收集更多的数据。当客户数据足够多的时候,坏账率是较低的,这个反应的关键点是:当你拥有越全的数据的时候,被欺诈的风险就是越低的。这里给大家分享一个医疗保险欺诈案例——无锡医生骗保案。无锡医生高建业凭借自己多年的经验感觉自己甲状腺出了问题,用假名字高飞去体检确诊。于是又用真名字在13家保险公司先后购买了近800万元保额的保险。等过了观察期后,这个医生马上进行理赔,保险公司觉得不太正常,遂报警。民警逐一排查2016年9月前甲状腺就诊人员,大海捞针,甄别了3万余条就诊信息,只为从海量就医信息中识别并揪出高建业隐藏的虚拟身份。这个就是运用大数据的力量破案。再来讲一个大数据应用的案例。该案例发生在美国的一个超市,一位爸爸收到了超市寄来的给女儿的宣传画册,是一辆婴儿车和许多婴儿用品。爸爸很生气,投诉了这个超市,问为什么要给我女儿寄这些呢?她还没有结婚,可是后来这个爸爸发现,女儿真的怀孕了。那么超市是怎么发现的呢?其实就是利用大数据,根据这个女儿在超市网页里浏览的商品推算出这个女孩可能怀孕了,所以寄宣传画册。
智能风控在保险行业的应用也非常丰富。在小雨伞保险的公众号里,有一个疾病预核保的功能,是客户全私密在线和机器对话。小雨伞给这个智能预核保的系统起了个名字,叫“元芳”,其实这就是智能风控的应用。把自己私密的健康问题输入进去,“元芳”就会给出判断和给出核保指导意见,比如说某种产品买不了,但是可以选择另外一款等。这种方式除了减轻了人和人之间需要提及隐私问题的尴尬,还可以缓解因为面对面交流带来的尴尬影响。
在此分享一个量化风险的管理架构,有两个模式,第一个模式是业务目标驱动由上而下。比如,今天老板说这个月收了十亿元的保费,根据财务需求最多可以赔付九亿元,如果赔了九亿一千万元,那就是管理的责任。接到任务后,你需要思考,要如何来完成这个任务呢?策略是什么?要不要来做一个评分卡?十亿元的保险只能赔九亿元,那么说明有一部分人是不能卖给他保险的。所以就用评分卡来看,这个人是否能投保。评分卡的打分依据来自接入的数据池,比如一个优质客户是99分,另外一个客户在P2P平台借了300万元,还有一些已经患病的记录,那么他就可能只有60分。根据分数的不同,给客户推荐不同产品。第二个模式是看风险平台分析,为了达成目标,机构需要哪些数据?这是一个自上而下经营分析的办法,也可以叫数据触动自上而下的迭代。然后根据数据再分析,对客户进行评分,进而做决策。两种办法都可行,关键看业务场景更适用哪种。
四、小雨伞风控平台“啄木鸟PICUS”
大数据的应用场景非常广泛。保险领域利用大数据对健康险赔付率建立模型,模型进行细分维度下精准预测从而锁定利润,提升企业的盈利水平。
啄木鸟Picus是小雨伞保险自2017年开始投入研发的风控平台。为什么叫Picus呢?啄木鸟就是要把坏虫吃掉,让树木保持健康。啄木鸟风控系统有五个方面功能:分别是敏捷作业、复杂的网络智能学习、全流程控制、核保知识的识别、判断和分组。数据的价值是什么呢,举一个例子:在小雨伞保险的平台上,客户和小雨伞就保险的咨询问题已经积累了数亿条,例如,得了纤维瘤,还可以投保吗?小雨伞的“超级玛丽2020”是什么产品?小雨伞开发了复杂的网络智能学习,这有两个好处:第一,下一次还有人问这个问题的时候,机器就可以直接回答;第二,积累形成了海量的知识库。小雨伞跟其他保险公司合作,每个公司都会有一个核保手册,啄木鸟会来学习这个核保手册。还有一些问题,是核保手册里没有的,那就用积累的知识库来回答,基本上可以做到5秒钟回答问题。 随着时间的积累,这也会形成巨大的知识宝库。
“啄木鸟”向恶意欺诈、高额风险、健康风险和续期风险四种风险发起挑战。恶意欺诈在互联网上算是一个比较严重的问题。我们常见的虚假投保的“羊毛党”,这样的人群是定制优质保险产品必须隔离的。健康风险上,保险领域最大的问题就是逆选择,非故意的不如实告知等问题,那么作为保险机构,核心策略是什么呢?我们的做法是多维度深度链接第三方服务商,广覆盖医疗机构,数据不断积累并趋于全面。目前“啄木鸟”已经服务6家保险公司,为好产品守卫站岗。