APP下载

汽车保险中车联网大数据智能分析及应用

2018-08-22

信息通信技术与政策 2018年8期
关键词:行车事故车辆

李少年 中国移动通信集团公司湖南公司大数据专家

周梦飒 中国移动通信集团公司湖南公司工程师

张轶 中国移动通信集团公司湖南公司工程师

1 引言

车联网作为未来人、车、路、平台、应用统一的综合生态系统,具有广阔的应用领域与市场前景。汽车保险公司可以借助车联网大数据进行智能分析,对车辆进行实时监控,判断车辆的驾驶情况,监督驾驶员的异常驾驶行为,培养优良的驾驶习惯,降低交通事故发生概率,避免车险恶意欺诈行为。

据交通部统计,2017年年底汽车保有量达到3.1亿,2017年在公安交通管理部门新注册登记的汽车2813万辆。随着车辆在人们日常生活中的普及,汽车行业也成为金融行业的重要领域,车险收入占到整个财产险收入的70%以上,2017年保费收入超7000亿元。但是车险行业总体亏损,2017年53家保险公司有40家车险业务亏损,亏损的原因主要是渠道费用过高与赔付率过高,渠道费用占到总成本的40%,赔付成本占到总成本的50%。

金融机构对降低获客成本与赔付成本有着强烈的需求,但金融机构对用户的了解渠道有限,对用户了解不全面,无法真实有效地对用户信用及风险进行评价,也无法有效地对用户进行安全监控。

2 建设思路

基于车联网车险大数据分析的目标,建立一种全新的基于驾驶习惯与行驶环境等因素对保费进行定价的车险产品,从而实现对客户的细分,提升保险公司的风险区分能力。车险分析模型能帮助保险公司根据司机驾驶行为识别其风险等级,对高风险司机将通过保费惩罚给予其经济激励,使其减少不良驾驶行为;对低风险司机将为其提供更具有吸引力的价格与服务。通过对风险的合理掌控,保险公司将降低赔付成本,从而使得公司盈利空间上升。

不同的驾驶员、车型、路况发生交通事故的概率不一样,那么可以从车辆的各属性维度进行大数据分析,找到与事故发生概率强相关的因素,进而为保险公司实行差异化保险费率提供数据支持。

随着通信技术的发展推动了车联网的应用普及,大部分的车辆都安装了行车记录仪等车联网设备,同时驾驶员疲劳监控系统、OBD等车联网设备也开始在公交系统等车辆上安装,使得搜集用户驾驶行为特征、车辆行驶环境、驾驶员当前状态成为可能。

3 总体方案建议

3.1 总体目标

湖南移动车联网金融服务平台(简称平台)通过汇聚车联网数据、移动B/O域数据及交警、气象、金融等外部数据,并上传到云端数据平台,数据平台将采集到的原始数据进行清洗加工,能够对用户的驾驶习惯、行车环境、出行偏好进行综合分析,进而对用户风险进行评估,从而为保险、金融机构提供数据支撑,帮助其设计个性化的保险产品,差异化的保险费率。

3.2 系统构成

车联网数据平台的分层逻辑结构从下至上依次为数据源层、接入层、存储层、分析层以及访问层。

(1)源数据层

数据平台的数据来源有多种渠道,包括车联网数据、移动B/O域数据及交警、气象、金融等外部数据,这些数据以实时或批量的方式导入到数据平台中。

(2)接入层

接入层包括采集终端数据接收服务和系统数据文件接收服务。在数据处理中,接收服务会通过模型管理服务提供的接口获取需要执行的模型信息,该信息包括模型间的依赖关系(模型拓扑)、所需参数以及模型加载的路径信息。获得模型信息之后,有数据处理服务基于模型拓扑进行模型调度。接入层在完成数据处理后,对数据进行分类存储。

(3)存储层

接入层的数据需要转存到存储层,存储服务主要包括数据存储、数据管理、数据备份、异构数据交换和数据导出。在数据持久化存储方面,针对原始数据及分析数据不同的特点进行存储。

(4)分析层

分析层需要基于存储层的数据进行模型的训练、迭代更新,同时也会把需要保存的分析结果数据回写数据仓库。分析层对外以分析服务中间件的形式,提供统一的访问接口,便于进行模型扩展以及内部的模型更新,这些变化对上层透明。

图1为分析服务视图。分析服务由模型训练生成环境和模型运行环境两部分构成,模型训练负责基于ETL服务导入的训练和测试数据,进行数据标注、模型训练。生成的文件模型,通过模型管理系统来实现模型发布,对发布过的模型进行版本管理。此外,模型管理系统还包含模型调度模块,提供模型动态加载引擎等服务。

外层的应用服务,通过分析服务提供的模型调用API来实现实时分析和离线分析模型的调用。

图1 分析服务视图

其中,行车环境分析基于对行车的天气、路况、限速、时间等维度,对用户的行车环境做综合评价。驾驶行为通过对运动数据的分析,可以通过3急(急加、急减、急转)发生的频度进行分析。轨迹分析:通过对行程轨迹的分析,可以对用户惯走路线、聚集地等维度进行分析;行车安全评价:通过长期的数据积累,参考多维度数据,可以对用户的行车安全进行综合评价;出行偏好:通过对用户惯走路线的分析,结合POI信息,分析用户的出行偏好;行车数据分析:包括基础的里程、时长、行车轨迹等信息,对用户的行车数据做管理;风险事件分析:通过驾驶激烈程度、碰撞检测等分析,结合违章信息、出险信息,对用户风险做以评估;驾驶习惯分析:通过对用户长期驾驶行为的分析,能够对用户的驾驶风格做以评价;用户画像分析:结合用户自然属性、出行偏好、POI信息,对用户标签化。

(5)访问层

数据访问层通过服务API实现了统一对外的服务访问接口。不同的服务将自身的逻辑处理功能注册到注册中心,实现服务的监听,当有相关请求到达后,相关的服务处理流程会被自动触发。这种设计考虑到了服务的可扩展性,如果需要增加新的服务,只需要将新服务的处理功能注册到消息队列即可。同时,数据平台也提供数据可视化,支持各分析主题数据的页面展示。

(6)平台管理

平台管理包括安全管理、资源管理、计费管理和系统监控。安全管理负责平台的安全认证、角色和用户权限管理;资源管理负责系统资源管理、服务管理等;计费管理负责资源使用情况统计、计费规则维护、不同租户的费用计算等;系统监控则是负责系统各关键环节的存活和性能状态监控,异常情况进行邮件、短信报警,提示及时维护以保证服务的稳定运行。

3.3 关键业务流程

系统关键业务数据流程如图2所示,数据从接入平台到最终对外提供服务,需要经过数据接入、数据处理、数据存储、数据分析、数据访问5个流程。

(1)外部数据通过数据接收服务接入平台。依据数据来源的不同,平台提供支持实时采集终端对接、远程文件传输、定期从第三方API进行数据抓取等几种不同的应对方案。

(2)实时计算分析或ETL任务处理。由于数据来源不同,结构也可能存在差异,所以数据入库之前提供实时计算和ETL,进行数据的清洗、转换、抽取等处理过程,将数据处理为符合标准的格式。

(3)根据数据的不同特征(是否格式化、量级、读写特征)写入不同的数据存储。

(4)通过平台的大数据分析功能,调用已有模型对用户的驾驶习惯、行车环境、出行偏好进行综合分析,进而对用户风险进行评估。

图2 系统关键业务数据流程

(5)最终通过数据API或Web Portal的形式,对外提供结果数据。针对不同的数据来源,平台提供与之相应的处理流程。

3.4 主要算法

汽车驾驶员驾驶行为差错是汽车行驶过程中普遍存在的一种客观现象。统计表明(见图3),汽车驾驶行为差错导致的交通事故占事故总数的85%~92%;相关统计资料也表明,驾驶员因素导致的交通事故占总事故的88.23%,交通事故伤亡人数占总伤亡人数90.6%;由于道路环境因素导致的交通事故占总事故的8%~11.2%。统计资料说明,驾驶员因素与道路环境因素是交通事故的主要原因。

图3 事故发和生概率与驾驶行为状态分布的关系

车辆在行驶过程中司机的驾驶行为受到多方面因素的影响,天气、道路、车况等情况的多变性和复杂性以及驾驶员行车过程中操作熟练程度和对应事件的反应程度都会导致驾驶行为的不同。

(1)AEW-AHP算法

平台采用改进的AEW-AHP算法,熵权法依靠客观数据计算指标权重,与实际情况符合度高,层次分析法中判断矩阵是由经验值进行确定,能灵活地对多目标决策问题进行处理,EW-AHP把熵权法计算得出的客观权重ai与层次分析法计算得出的主观权重φi进行综合考量,结合熵权法和层次分析法的中间计算过程,得出最终指标权重。

●第一步

设有M个标准层,n个指标层,每个标准层对应t1,t2,…,tk个指标,同时满足t1+t2+…+tk=n,判断矩阵为Bij。根据公式Mi分别求出基于层次分析法标准层权重ABi(i=1,2,…,m)和指标层各个指标权重ASj(j=1,2,…,m)。AWj(j=1,2,…,n)表示层次分析法所得权值,为标准层权重ABj和指标层权重ASj乘积。

其中,Mi表示矩阵每一行元素的乘积,即:

●第二步

假设驾驶行为评分机制中评分对象为Ai(i=1,2,…,m),指标集为Xj(j=1,2,…,n),AXij表示驾驶行为评分数据中第i组数据中第j个指标的原始数据值,表示AXij经公示标准化处理后的数据值。根据以下公式计算出基于熵权法个指标权重EWj(j=1,2,…,n):

其中,Pij表示驾驶行为评分数据中第i组数据中第j个指标的比重,即:

●第三步

将层次分析法中指标层权重ASj与熵权法指标权重EWj根据以下公式一一对应结合,初步得出综合指标权重γj(j=1,2,…,n);再根据标准层对指标层重新进行归一化处理得出标准层下的对应指标层的权重Ωij(i=1,2,…,m;j=1,2,…,n);最后将Ωij与层次分析法中标准层权重ABj进行相乘,得出AEW-AHP驾驶行为评分指标权重Wj(j=1,2,…,n)。

(2)风险评估模型

湖南移动与湖南XX保险公司合作,对4000余辆机动车进行跟踪分析,对各种驾驶行为与事故关联性进行分析,找到对应的事故几率,建立车辆风险评估模型,实现对车辆的风险评估(见表1)。

表1 风险评估指标

4 实施效果

湖南移动与XX保险公司湖南分公司合作,在以下方面对车联网金融服务进行了探索:根据用户驾驶行为、出行习惯、行车环境等进行大数据分析,进行差异化保险服务;提供驾驶行为分析服务,持续督促改善驾驶行为,并为保险公司或车队提供实时安全监控;监控客户出险后的事故情况,进行事故重构,以此精准地防欺诈。

车联网金融服务平台提供了全范围的车辆风险对比,包含驾驶者风险、驾驶行为风险、行车习惯风险、行车环境风险及车辆风险5个维度(见图4)。分析结果提供了5个地市的车辆风险总体指数对比及排名,同时包含了各分项风险的得分及排名。识别出邵阳市为风险值较高地区,需要加强管理。

如图5所示,通过对车辆风险指数的聚类分析,车联网金融服务平台为客户在某一省份识别出不同风险指数的客户,作为与保险公司合作的车辆定制化保险的数据依据。分析结果表明,车辆风险指数在56之前为保险公司优质客户,可以作为保险公司重点保留目标。56~60、66~70及 86~90共3个聚类的车辆为风险可转移客户,可通过保险风控策略,监控风险状况,作为后续的发展策略。风险指数90以上为高风险客户,为保险公司谨慎保留客户。

(1)驾驶行为风险评估

通过对车辆的驾驶行为、行车环境、驾驶者分析、车辆状况、行车习惯5个维度对用户进行分析,给出车辆风险评分。目前,与湖南XX保险公司合作已为4243户用户提供驾驶行为风险评估服务,2018年以来,获得低风险评估的用户事故概率相对普通用户低46%。

图4 5个地市的车辆风险总体指数对比及排名

图5 车辆风险指数聚类分析

(2)实时风险监控

●监控驾驶员实时状况,及时发现驾驶员酒架、疲劳等状态。

●为驾驶员发送路况、天气、提示休息等提醒,降低事故发生概率。

●帮助车主关系人及时获取事故信息,有效降低事故伤害。

●为车辆保险提供理赔依据,识别欺诈行为,降低理赔风险。

●为车辆维修/道路救援机构提供事故第一时间数据,及时向车主提供服务。

(3)保险防欺诈

2017年,湖南保监局共接收有效投诉2724件,其中车险理赔纠纷847件,而其中责任争议占了大头,车险理赔纠纷成为焦点。2017年,某保险公司34件车辆保险诈骗案中,有6件是因车主酒后驾车发生事故而想到用各种方式骗保。例如,张某酒后驾车,发生事故致使车辆严重损坏。为能获得保险理赔,便打电话找齐某顶包,齐某到现场后,谎称自己是驾驶员,由车联网金融服务平台根据用户信令数据及通话记录识破,为保险公司挽回损失。

猜你喜欢

行车事故车辆
学中文
废弃泄漏事故
小恍惚 大事故
车辆
冬天路滑 远离车辆
夜间行车技巧
提高车辆响应的转向辅助控制系统
吉普自由光行车制动易熄火
调度调整在地铁行车组织中的应用
从技术上如何保障隧道行车安全