基于藤Copula的GAMLSS模型与非寿险准备金评估
2015-03-26刘新红孟生旺
刘新红 孟生旺
摘要在假设各个业务线的增量已决赔款服从伽玛分布、逆高斯分布和对数正态分布的基础上, 建立了各个业务线增量已决赔款的GAMLSS模型, 并将此模型应用于一组具有明显异方差的车险数据, 拟合效果优于均值回归模型. 另外, 在多个业务线的准备金估计中, 不同业务线之间的相依性通过藤Copula函数来描述. 用D藤Copula描述相依关系的GAMLSS模型对准备金的评估结果既优于独立假设下的GAMLSS模型和链梯法对准备金的评估结果,同时还刻画了不同业务线之间的尾部相依性.
关键词非寿险;准备金;相依风险;藤Copula;GAMLSS模型
中图分类号F222.3 文献标识码A
AbstractUnder the assumption that the incremental paid claims of every line of business follow gamma distribution, inverseGaussian distribution and lognormal distribution, respectively, the corresponding GAMLSS models were established. The models were applied to a heteroscedastic data set of auto insurance claims, and the result shows that GAMLSS models are superior to mean regression models in predicting outstanding claim reserve. In practice, different lines of insurance business are, to some extent and their dependence can be captured by Vine Copula functions. The corresponding Vine Copula and GAMLSS models were established. The result shows that D Vine Copulabased GAMLSS model is superior to independent GAMLSS models and Chain Ladder method in claims reserving, and it also describes the tail dependence of different lines of business.
Key words nonlife insurance; reserve; dependent risks; Vine Copula; GAMLSS
1引言
非寿险公司资产负债表上金额最大的负债项目是赔款准备金. 链梯法、案均赔款法、准备金进展法、BF法和广义线性模型等都是针对单个保险业务的准备金评估方法, 这些方法的一个共同特点是仅对赔款准备金的均值进行预测没有考虑数据中的异方差性. 本文对单个保险业务的准备金评估采用基于位置、尺度、形状参数的广义可加模型(GAMLSS)1, 从而可以处理数据中的异方差现象. GAMLSS模型假定响应变量服从比指数分布族更广的一类分布, 系统部分可建立位置、尺度和形状参数与解释变量的回归模型.
在多个业务线的准备金估计中, 通常假设不同业务线之间相互独立, 事实上它们之间往往存在一定的相依关系. 如Braun、Schmidt、Merz、Zhang等2-5针对累积已决赔款采用多元链梯法、多元加性方法等评估未决赔款准备金. 而针对增量已决赔款, Peng和Frees6通过Copula回归模型解决了两个业务线在相依情况下的准备金评估问题; Jong7通过Copula函数和因子分析法研究了多个业务线的准备金评估问题. Copula是一种通过单个变量的边缘分布构造多个变量的联合分布的数学方法, 可以将多元随机变量的边缘分布和它们之间的相关结构分开研究, 相关结构不受边缘分布的限制. 多元Gaussian Copula和多元t Copula描述的相关结构是对称的, 并且Gaussian Copula没有尾部相依特征;在多元阿基米德Copula函数中, 一个或者两个参数就代表了任意两个变量之间的相关结构, 且相关结构相同. 可见常用的多元Copula函数解决多个变量之间的相依关系存在着很多限制. 又由于多元问题存在着高维灾难, Joe8、Bedford和Cooke9提出了基于二元Copula函数(即PairCopulas)的藤Copula, 它通过将多元分布分解为多个PairCopulas函数, 有效解决了多个随机变量之间的相依性, 结构更加灵活. 藤Copula在实际领域的应用已经受到一定关注, 可参见Aas和Czado10, Brechmann和Schepsmeier11.
本文将藤Copula应用于国内汽车保险的赔款数据. 在汽车保险中, 保险公司通常会同时承保交强险、商业三责险、车损险和其他各种附加险. 由于每个业务线的增量已决赔款都具有异方差性, 本文假设每个业务线的增量已决赔款分别服从伽玛分布、逆高斯分布和对数正态分布的基础上, 建立了两类GAMLSS模型, 并应用藤Copula描述不同业务线之间的相依关系. PairCopulas主要采用Gaussian Copula、t Copula、Clayton Copula、Gumble Copula、Frank Copula、Joe Copula、BB1 Copula、BB6 Copula、BB7 Copula和BB8 Copula以及它们的旋转Copula. 本文将GAMLSS模型与藤Copula结合, 建立了基于藤Copula的GAMLSS模型, 并通过实例验证了此模型的优越性. 目前所知, 在现有的文献中尚未看到基于藤Copula的GAMLSS模型及其对多个业务线准备金进行预测的研究成果.
2单个业务线的准备金评估与GAMLSS模型
2.1准备金评估的基本假设
传统的非寿险准备金评估都是分别对每个业务线建模, 建模的数据通常以流量三角形的形式给出. 本文使用的原始数据是我国某财险公司的车险业务数据, 包括机动车辆法定第三者责任险(简称交强险)、机动车辆商业第三者责任险(简称商业三责险)、机动车辆车体损失险(简称车损险)和机动车辆其他附加险(简称其他附加险). 数据是从2007年1月到2009年12月再保前的已赚保费和累积已决赔款. 评估日为2009年12月, 事故期和进展期的长度都为一个季度.
在上述三个分布中, μ是位置参数, σ是尺度参数. 尺度参数可以用于描述数据的分散程度和厚尾性. 在通常的准备金评估模型中, 仅对均值参数建立回归模型, 而假设尺度参数是恒定的. 但从表1可以明显看出, 四条业务线在各个事故季的样本方差存在明显差异. 若仅对均值参数建立回归模型, 则意味着尺度参数和形状参数都是常数, 这与实际数据的特点不符. 本文将采用GAMLSS模型, 同时建立位置参数和尺度参数的回归模型.在假设交强险、商业三责险、车损险和其他附加险的增量已决赔款分别服从对数正态分布、伽玛分布、对数正态分布和对数正态分布的条件下, 选取拟合效果最好的GAMLSS模型. 在该估计中, 增量已决赔款的回归模型中解释变量包括进展季和事故季, 基准时间是事故季1和进展季1, 回归系数显著不为零. 前23个解释变量为均值提供解释, 后23个解释变量为尺度参数提供解释. 从估计结果可以看出, 随着进展季的发展, 增量已决赔款呈现递减趋势, 而随着事故季的增加, 增量已决赔款呈现出震荡变化形态.
4.24条业务线增量已决赔款的相依关系
在汽车保险实务中, 条业务线之间的增量已决赔款往往是相关的. 随机变量之间的联合分布可以应用藤Copula函数来刻画, 相关性的大小可通过Kendalls τ相关系数来衡量.
对于本文研究的汽车保险赔款数据, 表3的上三角形中给出了4条业务线增量已决赔款之间的Pearson相关系数, 表3的下三角形中给出了4条业务线增量已决赔款的Kendalls τ相关系数. 所有相关系数的值都表明, 4条业务线之间的增量已决赔款是高度正相关的. 这种现象很可能是由于一些共同影响因素造成的, 如日历年的通货膨胀、保险政策等都会导致增量赔款的正向相依性.
增量已决赔款之间的正向相依关系, 可以通过藤Copula函数进行描述. 在不同的藤结构图中,4个业务线都需要6个PairCopulas来描述它们之间的两两相依关系. 通过逐个试验, 本文选取了使似然函数达到最大的6个PairCopulas函数, 如表4所示. 二元Copula函数的名称及括号内的数字表示这两个变量之间的相依关系通过此Copula函数来描述. 根据图1, 在C藤结构中的随机变量1、2、3和4分别表示其他附加险、车损险、交强险和商业三责险的增量已决赔款. 在C藤结构中, 旋转90°的Joe(23|1)表示在其他附加险增量已决赔款给定的条件下, 车损险增量已决赔款和交强险增量已决赔款之间的相依关系通过旋转90°的Joe Copula函数来描述. PairCopulas函数中的参数估计方法使用了序列似然估计法和最大似然估计法. 序列似然估计法是从藤结构的最上层出发, 依次得到每个二元Copula参数的极大似然估计值; 最大似然估计法是直接写出所有样本的似然函数, 在最大化似然函数的条件下估计其中的所有参数. 两种方法的估计结果非常接近, 如表4所示. 由PairCopulas函数中的参数估计值可以得到每对相依关系的kendalls τ值, 即表4中T值. 在C藤结构中, 如果给定其他附加险的已决赔款, 则车损险与交强险、车损险与商业三责险的增量已决赔款之间的kendalls τ值分别为-0.080 4和 -0.047 9. 其他业务线之间存在着一定的正相依关系. 根据图2, 在D藤结构中随机变量1、2、3和4分别表示车损险、商业三责险、交强险和其他附加险的增量已决赔款. 在D藤结构中, 业务线之间都存在着一定的正相依关系.
AIC值分别为-25.227 8、-25.798 6、-25.801 9和-26.050 0. 从AIC的角度看, D藤与C藤没有显著差异, 但考虑到D藤结构比C藤结构更加灵活, 所以本文选取D藤结构描述不同业务线之间的相依关系. 根据Joe等14的结论, 只要第一层的PairCopulas中有反映尾部相依性的Copula函数, 那么藤结构的多元随机变量的相依关系中就能体现出尾部相依. 在C藤结构中, 第一层的PairCopulas中没有反映尾部相依性的Copula函数, 藤结构的多元随机变量的相依关系没能体现出尾部相依. 而在D藤结构中, 第一层的Joe Copula和Survial Gumble Copula都有尾部相关系数. 交强险和商业三责险的增量已决赔款的下尾相关系数为0.270 1, 说明交强险的增量已决赔款出现较小值时, 商业三责险的增量已决赔款出现较小值的概率为0.270 1. 商业三责险和车损险的增量已决赔款的上尾相关系数为0.156 9, 说明商业三责险出现大额增量已决赔款时, 车损险以0.156 9的概率出现大额增量已决赔款.
4.34条业务线未决赔款准备金的评估
联合式(1)、式(2)、表2和表4的结果, 即可得到基于藤Copula的GAMLSS模型, 并可以应用IFM方法15估计藤Copula和GAMLSS模型中的参数. 本文使用两种方法分别对4条业务线的未决赔款准备金进行了预测. 其中“D”表示基于D藤结构的GAMLSS模型II对准备金的预测值, “L”表示链梯法对准备金的预测值. 基于D藤结构的GAMLSS模型结果是通过蒙特卡洛方法模拟100 000组数据得到的. 联合表2和表4的结果,4条业务线的增量未决赔款如表5所示.
若采用GAMLSS模型II, 但不考虑4条业务线之间的相依关系, 使用前文给每个业务线选定的最优分布假设, 可以求得对数正态回归模型对交强险准备金的预测值为59 175千元, 伽玛回归模型对商业三责险准备金的预测值为20 623千元, 对数正态回归模型对车损险准备金的预测值为16 118千元, 对数正态回归模型对其他附加险准备金的预测值为8 850千元. 在相互独立的假设下, 4个业务线的未决赔款准备金之和为104 766千元, 这比基于D藤结构的GAMLSS模型II的预测值少36千元. 若采用GAMLSS模型I, 不考虑4个业务线之间的相依关系, 并使用最优分布假设, 则伽玛回归模型对交强险准备金的预测值为55 696千元, 伽玛回归模型对商业三责险准备金的预测值为21 132千元, 对数正态回归模型对车损险准备金的预测值为17 207千元, 对数正态回归模型对其他附加险准备金的预测值为10 504千元. 在相互独立的假设下, 四个业务线的未决赔款准备金之和为104 539千元, 这比基于D藤结构的GAMLSS模型II的预测值少了263千元. 可见, 忽略业务线之间正向相依关系的准备金预测结果都是偏低的.
对于存在正向相依关系的风险, 各种风险的VaR值之和会大于独立假设下的VaR值之和16. 如果忽略不同业务线之间的相依性, 就有可能低估实际的准备金风险. 基于D藤结构的GAMLSS模型II既考虑了4个业务线之间的相依性, 又考虑了数据之间的异方差性, 因此对准备金的预测结果更加合理.
5结论
在汽车保险中, 如果假设交强险、商业三责险、车损险和其他附加险相互独立, 并且分别估计它们的准备金, 则很有可能会低估保险公司面临的未决赔款准备金风险. 本文通过一个实例验证了汽车保险的4个业务线之间存在正向相依关系, 并利用C藤和D藤结构的PairCopulas函数刻画了它们之间的相依关系. 由于在D藤结构的第一层中存在着反映尾部相依关系的二元PairCopulas, 所以选取D藤结构也体现了4个业务线增量已决赔款的尾部相依性. 本文应用汽车保险的实际赔款数据, 将基于D藤结构的GAMLSS模型II、独立假设下的GAMLSS模型II、GAMLSS模型I和链梯法进行了比较, 结果表明, D藤结构可以较好地描述4个业务线之间的相依关系, 而GAMLSS模型可以解决具有异方差的准备金数据, 因此, 基于D藤结构的GAMLSS模型对准备金的预测结果要优于独立假设下的GAMLSS模型和链梯法.
参考文献
1.R A RIGBY, D M STASINOPOULOS. Generalized additive models for location, scale and shape (with discussion)J.. Applied Statistics, 2005, 54(3): 507-554.
2.Yanwei ZHANG. A general multivariate chain ladder modelJ.. Insurance: Mathematics & Economics, 2010, 46(3): 588-599.
3.M MERZ, M WUTHRICH. Prediction error of the multivariate chain ladder reserving methodJ.. North American Actuarial Journal, 2008, 12(2): 175-197.
4.C BRAUN. The prediction error of the chain ladder method applied to correlated runoff trianglesJ.. Astin Bulletin, 2004, 34(2):399-423.
5.K T HEES, K D SCHMIDT, M ZOCHER. Multivariate loss prediction in the multivariate additive model. Insurance: Mathematics & Economics, 2006, 39(2): 185-191.
6.Peng SHI, E W FREES. Dependent loss reserving using copulasJ.. Astin Bulletin, 2011, 41(2): 449-486.
7.P D JONG. Modeling dependence between loss trianglesJ.. North American Actuarial Journal, 2012, 16(1): 74-86.
8.H JOE. Families of mvariate distributions with given margins and m(m-1)/2 bivariate dependence parametersR.. Hayward: Institute of Mathematical Statistics, 1996.
9.T BEDFORD, R M COOKE. Vinea new graphical model for dependent random variablesJ.. Annals of Statistics, 2002, 30(4): 1031-1068.
10.K AAS, C CZADO, A FRIGESSI, et al. Paircopula constructions of multiple dependenceJ.. Insurance: Mathematics & Economics, 2009, 44(2): 182-198.
11.E C BRECHMANN, U SCHEPSMEIER. Modeling dependence with Cand DVine Copulas: the r package CDVineJ.. Journal of Statistical Software, 2013, 52(3): 1-27.
12.M STASSINOPOULOS, B RIGBY. Generalized Additive Models for Location Scale and Shape(GAMLSS) in RJ.. Journal of Statistical Software, 2007, 23(7):1-46.
13.R B NELSEN. An introduction to copulasM.. New York: Springer,2006.
14.H JOE, H LI, A K NIKOLOULOPOULOS. Tail dependence functions and vine copulasJ.. Journal of Multivariate Analysis, 2010, 101(1): 252-270.
15.H JOE. Multivariate models and dependence conceptsM.. London: Chapman and Hall, 1997.
16.M DENUIT, J DHAENE, M GOOVAERTS, et al. Actuarial theory for dependent risks: measures, orders and modelsM.. New York:John Wiley & Sons Inc, 2005.