机器学习算法在求解破产概率中的应用
2021-09-09李红,李硕
李 红,李 硕
(昌吉学院 数学系,新疆 昌吉 831100)
0 引言
一次巨额赔付或短期内出现大量小额赔付都有可能使保险企业陷入无法偿还的危机。比如:2001年发生在美国纽约的“911”事件;2002年发生在我国的两起空难;前几年的马航事件,等等,都使保险公司承受了巨额的理赔。再比如:上世纪末亚洲爆发的金融危机,使日本许多大型保险企业倒闭;2008年,全球爆发的“次贷危机”,导致美国保险业巨头集团面临严重债务危机,甚至濒临破产。很显然,任何一家保险公司都难以承受在短期内出现的巨额理赔。随着保险风险的多样化和复杂化以及我国保险市场近几年保费收入的爆发式增长,有效控制和防范保险公司规模扩大所带来的相应风险成为目前学者们研究的热点。
现实中,保险公司因为自身情况不同,所提供的具体保险业务不尽相同,自然所呈现的保费额、投资额、索赔额、盈余额以及分红、再保险等数据特征也不同。在过去的几十年中,风险理论研究者们已经从上述不同角度考虑,研究提出了许多风险模型,有经典风险模型、延迟风险模型、相依风险模型、Erlang(n)风险模型以及带投资、带干扰、扩散型风险模型等,然后根据模型测算和预测保险公司发生诸如盈余在某段时间内或者最终出现负值这样的随机事件的概率,即破产概率,最后利用破产概率值度量保险公司整体风险,达到防范和管控风险的目的。随着研究范围不断扩大,保险风险模型得以不断改进,也更加贴近现实中发生的某些特殊现象。但绝大多数风险模型在根据盈余求解破产概率时,只能得到其所满足的积分-微分方程,而这些方程往往都比较复杂,难以求出它的数值解。如果用传统的方法求解,比如有限元法、有限差分法、Euler法,往往也不能如意,收敛速度慢,计算量还大。一些风险模型只有在索赔额服从指数分布或者离散分布限制时才能求出破产概率的精确值,绝大多数模型在当索赔额条件放宽至服从除指数分布以外的分布时,破产概率的精确值都无法求出,只能估计其可行域。如何能避开风险模型中索赔额所受的各种限制,精确地求解出风险模型在索赔服从任意一般分布和任意时间点破产概率的精确值变得尤为重要。本研究简单介绍保险风险模型,重点阐述Erlang(n)分布风险模型及破产概率的计算,在此基础上介绍ITELM 算法设计原理,为求解索赔额服从任意一般分布和任意时间点破产概率精确数值解做好铺垫。
1 保险风险模型简介
近年来,Waters和Papatriandafylou[5]针对保险公司在第一次理赔发生后,经过随机的一段时间后,可能还会有第二次索赔,即延迟索赔,比如,一起车祸发生后,如果买了第三方保险,担保人在赔付完车的损失,过后一段时间还要为第三方赔付的情形,提出了延迟风险模型:
以上无论是考虑了分红、投资等不确定影响因素的带扰动风险模型,还是考虑了附加索赔的延迟索赔风险模型以及从外部环境角度考虑的风险模型,都是为了更贴近现实当中保险公司所经营的具体保险业务所适合的风险模型,抛开以上因素,Erlang(n)分布的风险模型恰好适用于非寿险保险公司风险模型的索赔过程。而Erlang(n)分布可以逼近任意一般分布,这一性质在某种程度上放宽了前面所述模型的条件限制,因此,研究Erlang(n)分布风险模型的破产概率具有很重要的意义。此外,因为前面所述模型比 Erlang(n)风险模型只是多了若干常量或变量,最终得出的破产概率依然满足积分-微分方程,如果能够掌握求解Erlang(n)风险模型破产概率的数值解的方法,那么前面所述模型的破产概率数值解也便迎刃而解。
2 Erlang(n)分布的更新风险模型及其破产概率
当索赔到达为更新过程,即截止时间t,赔偿次数Nt是一个更新过程时,上述模型被称为更新风险模型或sparre-Andersen风险模型。因为Poisson过程是更新过程的一种特例,因此相较于经典复合Poisson风险模型,更新模型更具一般性,也更逼近于现实[10]。
其密度函数为:
该模型最终破产概率定义如下:
(1)当n=1时,索赔到达服从泊松分布(1-1)为经典风险模型。定义破产时间τ=τ(u)=inf{t≥0:U(t)<0|U(0)=u},则有限时间破产概率为ψ(u,T)=P(τ≤T),当T→∞时,即为保险公司最终破产的概率ψ(u)=P(τ<∞)。此时经典风险模型的破产概率满足如下积分-微分方程:
当n=1时,索赔到达服从参数为(β,1)的Erlang(1)分布,Erlang(1)分布是指数分布,即索赔到达服从指数分布,且均值为1/β,此时得到的破产概率解析式如下:
(2)当n=2时,索赔到达服从参数为(β,2)的Erlang(2)分布。Dickson[11]利用条件概率和其全概率公式推导出了如下Erlang(2)分布的更新风险模型破产概率所满足的方程:
(2-1)
其中,s0>0是如下代数方程(1-7)的解:
(2-1)在假设索赔到达服从指数分布时,许多文献研究中有得到其解析解,但在服从一般的索赔分布时,不容易求解,因而破产概率的解析表达式也不易获得。由文献[12]可知,当假设索赔到达服从Erland(n)分布时,更新风险模型的破产概率微分方程更为复杂,为了方便理解,下面只针对Erland(1)分布和Eland(2)分布的情况作以讨论,Erland(n)分布的情况可以参考Erlang(2)分布下的求解过程。
3 ITELM 算法设计原理
随着大数据和人工智能技术的发展,机器学习算法作为人工智能技术的核心模型已成为研究热点。目前,已有几十种传统的学习型神经网络模型。BP(Back-Propagation)神经网络能模仿非线性输入输出的关系,内部结构单一,训练小样本功效不错,是浅层神经网络的典型代表,但易造成局部极小点偏离全局最优解,收敛较慢,调优过程麻烦,操作并不容易。ELM和SVM网络操作虽然避免了以上缺点,但SVM 网络操作时空开销大且最优核函数不容易找到。ELM网络相较于上述学习算法,执行过程中不需要调整,只需在开始网络初始化、设置好隐藏层的参数,而且训练误差小,只需设置网络的隐节点个数,就可以得到唯一的最优解。学习速度快、泛化性能好,该算法技术在许多领域都得到了广泛的应用。ELM的算法结构示意图如图1所示。
图1 ELM 的算法图
研究索赔到达服从Eland(2)分布更新风险模型的破产概率方程(2-1)的特征,并结合ELM网络算法的优点,尝试用三角函数做前馈神经网络的激活函数,并在ELM算法的求解中将微分方程的初始条件也添加进去,得到一种新的ITELM算法,该算法设计原理如下:
首先,考虑一阶常微分方程初值问题:
(3-1)
假设该函数是微分方程问题(3-1)的解,则应满足:
(3-2)
因此,求解方程(3-1)的初值问题就可以转化成一个优化问题。
假设在条件
(3-3)
4 结论
利用ITELM 算法,建立索赔到达为Erlang(1)分布和Erlang(2)分布时,更新风险模型破产概率所满足的微分方程(2-1)模型,可以分别实现Erlang(1)和Erlang(2)风险模型下的破产概率积分-微分方程的数值解[13]。索赔到达为 Erland(n)分布的破产概率数值解可以类似Erlang(2)分布求得。进一步,还可以通过采取一些数值实验,验证ITELM 算法训练求解的数值解误差非常小,说明ITELM结构性能好,学习效果佳,可信度高,ITELM 算法求解的数值解值得被保险风险管理者采纳参考。
Erlang(n)分布可以逼近于任意一般分布,ITELM 算法实现了保险风险模型在索赔服从任意分布下任意时刻破产概率的精确解,也解决了当索赔到达为重尾分布时,破产概率只有在几个特殊离散点处才能求得数值解的弊端,有利于保险风险管理者及时有效地管控保险风险。