保险公司评级方法的现状与未来展望

2019-05-13马海峰上海师范大学商学院

上海保险 2019年4期

林燕马海峰上海师范大学商学院

本文为教育部人文社会科学研究项目“审慎监管视角下问题保险公司的救助决策分析：理论与实证”（17YJA790061）的部分成果。

保险公司评级方法经历了从传统统计方法到现代评级方法、再到人工智能方法的演变过程，其内在逻辑是从参数模型逐步发展到非参数模型、自我学习训练型模型，具体方法包括指标法、回归模型、现代评级模型、人工智能模型等。评级方法的核心内容是指标体系，而回归模型能够产生稳定可靠的评级结果，基于互联网的大数据、云计算等技术则会给评级活动带来颠覆性变革。人工智能模型和区块链技术的应用前景也都很值得期待，但目前还未能取得实质性进展；不同模型的混合使用将是评级方法的发展趋势。

一、引言

公正科学的评级制度和评级结果有利于降低交易成本、信息成本和监管成本，因此被监管机构和市场参与者所重视。保险评级主要包括对保险公司的评级和对其发行产品（主要是债项）的评级，前者又可分为信用评级、偿付能力评级、财务能力评级等。这些分类虽在目标定位上有所不同，但从评级过程和结果来看，本质上却是类同的。因此，本文以保险公司评级方法作为研究对象，同时也会借鉴其他金融业的评级方法。

评级方法经历了从简单到复杂、从传统统计方法到现代评级方法、再到人工智能方法的演变过程。其内在逻辑是从参数模型逐步发展到非参数模型、再到自我学习训练型模型，而对样本数据的要求则是从严格到逐渐放松的过程。公司评级类的文献最早始于1908年Rosendale应用流动比率去评估信用价值；1966年Beaver用单指标方法，后改进为多指标法去评价公司财务能力状况。随着对样本数据统计假设的逐步放开，上世纪80年代以Logistic和Probit为代表的回归模型成为主流方法。在修正回归模型的基础上，基于信息和计算机科学的现代模型开始得到大量应用，例如层次分析方法、网络分析法、决策树方法等。目前，互联网创新方兴未艾，大数据和云计算等技术将促使人工智能技术应用于评级研究，例如神经网络模型、粗糙集理论等。

二、基于指标的评级方法

指标法是依据一个或者多个指标所生成的指数，对公司的财务能力或者偿付能力等进行评级、评价，可分为单指标法和多指标法，其重点在于指标的选择和权重赋值，指标选择的方法包括专家经验法、统计方法等。

（一）单指标法

文献中最早开始使用单指标法可追溯至1908年，Rosendale利用流动比率（current ratio）去评估公司的信用价值。Beaver（1966）是财务风险和信用风险评价领域的开创者，他把单一指标法发展至多指标法，认为现金流与债务总额的比率能很好地预测五年之内财务危机发生的概率。国内单指标法的相关研究有不同选择，如候旭华（1999）采用净资产利润率，何玉梅等（2011）使用总资产净利润率等。

单指标法虽然简单实用、操作性强，但是仅靠一个指标对公司评级评价，未免有所片面不够公允，多指标法可从多个维度去衡量评价公司，评级结果更加科学稳健。因此，多指标法很快得到广泛应用，根据指标选择方法的不同可分为专家经验法和统计方法。

（二）多指标法——专家经验法

多指标的选择方法之一是依靠专家经验，具体包括Z值、ZETA模型、骆驼（CAMELS）模型等。该领域的奠基者Altman（1968）基于五个指标构建著名的Z值模型，指标包括运营资本与总资产的比率、未分配利润与总资产的比率、毛收入与总资产的比率、股权市场价值与总债务账面价值的比率、销售额与总资产的比率。后来，又加进10年期的营收稳定性和流动性比率，基于七个指标建立了ZETA模型。此后，Benjamin et al.（1986）、Kwan et al.（1986）、Kumar et al.（2015）等都利用不同参数指标构建Z值模型。Gasbarro et al.（2002）利用骆驼评级指标对商业银行的财务能力状况进行分析，发现只有营业收入指标能够较好地预警财务能力危机。国内也有类似的研究，如张玲等（2008）构建财务预警Z值模型，贾曼莉（2015）、龙贞杰等（2017）在骆驼评级模型基础上构建信用评价指标体系。

（三）多指标法——统计方法

多指标筛选的统计方法包括多元判别法（MDA）、聚类分析法、主成分分析法、因子分析法等。

判别分析法系按照一定的准则，建立一个或多个判别函数，利用大量数据资料确定判别函数中的待定系数，并计算判别指标。Benjamin et al.（1986）、Kwan et al.（1986）、何玉梅等（2011）都利用多元判别法（MDA）进行评级相关的研究。有些学者混合两种模型，如吕长江等（2006）、张勇（2014）使用MDA和Logistic模型等进行比较分析，取得更优的效果。

聚类分析是将一组研究对象分为相对同质群组的统计技术。主成分分析和因子分析本质上是类同的，区别在于前者是通过坐标变换提取主成分，将主成分表示为原始观察变量的线性组合；而后者是通过构造因子模型，将原始观察变量分解为因子的线性组合。Jensen（1971）、Gupta et al.（1972）基于聚类分析方法进行评级分析。国内的李心愉等（2011）、《中国保险公司信用评价体系研究》课题组（2014）、曹敏杰等（2008）、张晶（2011）、谭中明（2012）、庞如超（2012）等利用因子分析法进行公司评级相关研究。有些学者混合使用两种模型进行研究，如肖北溟（2004）通过因子分析和聚类分析等方法构建内部信用评级模型，寇业富等（2013）运用聚类分析和主成分分析方法对财产保险公司竞争力进行评价分级。

由于简单易操作、高效实用性等优点，指标法至今依然是很多评级机构的主要方法。目前，大多数的评级方法都是基于不同的指标体系展开分析，如何利用先进的方法（例如大数据、深度学习等技术），甄选出高效、科学的指标体系，并构建评级指数函数，将成为指标法的发展方向。

三、基于回归模型的评级方法

回归模型基于回归技术原理，通过选择对评级结果有显著影响的因素指标，然后利用指标体系建立指数，不同的指数值成为分级评价的阈值。主要包括Logit和Probit模型、Ordered Logit和Ordered Probit模型等。其中，Logit和Probit等模型输出二元分类结果，Ordered Logit和Ordered Probit模型可以直接输出多元的分级结果。

1980年，此领域的奠基者Ohlson选择Logit模型，以规模、总负债与总资产比率、经营业绩、流动性等指标预测公司的破产概率，并构建了著名的O指数（O-Score），通过O指数指标对财务能力进行评级。另有Steven et al.（1999）的 Ordered Probit模型、Bert Kramer（1996）的 Ordered Logit模型、Jennifer et al.（2005）的 Ordered Probit模型等其他研究。国内研究有刘畅等（2012）的Logistic模型、许亦平（2007）的 Ordered Probit模型、林江鹏（2016）的有序回归模型、钱水土等（2016）的Logit模型等。

回归模型既可以通过筛选指标来构建评级的指数（如Logit和Probit模型），也可以直接输出评级结果（如Ordered Logit和Ordered Probit），模型的回归系数具有实际经济价值和解释意义，定性指标和定量指标都可以进行分析，评级结果的稳定性和可靠性是回归模型的特征。

四、现代评级模型

现代评级模型大多借助计算机超强的运算能力，对样本进行分类、分级评价，且大多属于非参数模型，主要包括KMV模型、层次分析法、网络分析法、决策树方法等。

KMV模型的基本思想是把公司权益和负债看作期权，而把公司资本作为标的资产，违约概率则是与债务总额和公司资产结构相关的内生变量。张泽京等（2007）、周沅帆（2009）、张宝（2011）、凌江怀等（2013）、谢远涛等（2018）运用KMV模型对信用风险进行评级和度量等的相关研究。

层次分析法（AHP）是将要决策的问题及其有关因素分解成目标、准则、方案等层次，同一层次中的元素必须是独立的，不能互相影响或依赖，进而进行定性和定量分析的决策方法。网络分析法在对其改进的基础上，考虑了不同的层次和同层次元素之间的相互依存关系，这样元素间的关系实际上形成了网络结构。孙文等（2012）、钮中阳等（2018）利用层次分析法构建风险评价体系。方芳等（2005）、梁伟等（2007）、汤凌霄等（2012）基于网络分析法对操作风险进行评级等相关研究。

决策树方法是一种非参数统计方法，由Makowski（1985）率先将其引入信用评估领域。其基本思想是根据样本集决策属性的信息增益比率来创建决策树节点，每个节点循环生成新的子节点，并根据一定的原则和剪枝方法进行简化，最终生成决策树，生成的叶子即属于同一类别的子集。其优点是可以输入数值型和非数值型变量，缺点是只能输出二元的评级结果。Angelis et al.（1994）应用决策树模型去评估保险公司的偿付能力。庞素琳（2009）基于决策树模型建立信用评级模型。辛金国等（2012）、杨胜刚等（2013）、王磊等（2014）基于决策树和神经网络进行绩效和信用风险评估等相关分析。

现代评级模型需要借助计算机超强的运算能力，具体运算方法各有不同。KMV模型通过计算公司的债务和资本市场的信息，以违约概率等作为评级的主要依据；层次分析方法和网络分析法是经过计算与反馈过程，设定公司评级指标的体系和权重；决策树方法是通过计算信息增益比率等来创建节点和分支，最终形成评价的决策树。

五、基于人工智能的评级方法

人工智能是指机器能够像人类的行为一样运行，能够模拟自然界的某种（如大脑、遗传进化等）生物机理（Turban，1990）。人工智能评级方法主要包括人工神经网络模型、遗传算法、粗糙集理论、支持向量机、专家系统等。

人工神经网络（ANNs，Artificial Neural Networks）模型，也称神经网络模型，模型通过模拟大脑的某些机理与机制，尤其是模拟生物神经网络进行信息处理。刘洪等（2004）、任飞等（2007）、张维功等（2009）、刘洪渭等（2009）、邓庆彪等（2011）基于神经网络模型等对财务风险等进行预警研究。庞建敏（2006）基于神经网络进行信用风险度量。杨胜刚等（2013）利用决策树和神经网络技术构建信用评估组合模型。

遗传算法（Genetic Algorithm）是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型，是一种通过模拟自然进化过程搜索最优解的方法，其缺点是无法处理定性指标变量。叶中行等（2006）构建遗传算法和分类树相结合的信用评估方法，实证结果表明比单独使用其中一种方法的准确率高。蒋艳霞等（2010）利用遗传算法分析企业财务能力的影响因素。李竹梅等（2013）基于遗传算法和最小二乘向量机对财务能力风险进行预警分析。

粗糙集理论（Rough Set Theory）基于机器学习和计算的智能技术，从给定问题的描述集合出发，对不完整、不精确数据进行分析处理，其主要思想就是在保持分类能力不变的前提下，通过知识约简，导出问题的决策或分类规则。其优点是能处理离散指标，缺点是不能处理连续变量指标。薛锋等（2008）建立粗糙集与遗传算法相结合的财务能力预警模型。亢平等（2008）基于扩展粗糙集理论对信用风险进行等级评价。贾海涛等（2009）应用粗糙集理论评价商业银行经营绩效和能力。鲍新中（2012）混合粗糙集理论和其他模型综合评价财务能力风险。

支持向量机（SVM，SupportVector Machine）的基本思想是在机器学习训练的基础上，最大化分类之间的距离边际，其优点是能够处理小样本、非线性、离散变量数据，缺点是对大量数据样本的运算过于复杂。杨毓等（2006）、蒋艳霞等（2009）、吴冬梅等（2010）、丁德臣（2011）基于支持向量机和其他模型预测企业破产、财务能力等风险。韩璐等（2017）、张梦男（2017）利用支持向量机进行信用评分研究。

综上，人工智能评级模型的优点在于并行分布式处理、非线性处理、自学习能力等，对数据要求并不严格，可以是定性或者定量指标；缺点在于运算过程类似于“黑箱理论”，得出的参数无实际解释意义。因为需要对样本进行学习训练，大量样本数据是实证的前提。人工智能模型发展的新趋势是不同模型的混合交叉使用，其评级结果往往优于单一模型。Holsapplea et al.（1997）使用多专家系统用于信用评级，评价结果优于单个专家系统模型。Pendharkar（2009）遗传算法和神经网络相结合的方法，能够在企业财务破产预警分析中取得理想效果。郭英见等（2009）基于BP神经网络、支持向量机等理论构建信用风险评估模型。Arash Bahrammirzaee（2010）、Bahrammirzaee et al.（2011）混合使用神经网络和专家系统进行信用评分、信用评级等分析，混合模型能够获得更优效果。

六、存在的问题及未来展望

（一）存在的问题

保险评级的重要意义还未能得到业界的充分认识，相关研究的数量和质量还有待提高。虽然监管机构和商业评级公司会定期发布保险公司的信用评级和偿付能力评级的相关信息，但是关于评级方法和评级模型方面的研究相对于银行等行业还是较少。

回归模型等传统评级方法的精确度不够高，还有提高创新的空间。在评级指标的选择上，对社会经济等外部因素考虑得较少。现有评级技术多考虑公司自身财务指标等因素，对外生变量的研究还不够充分。实际上，评级结果深受经济周期等宏观经济因素的影响，例如利率和投资收益率都随经济周期而波动，不利的外因常常导致保险公司发生偿付能力或者信用危机等。

现有评级结果还有待进一步改进。一方面，由于历史积累等原因，发生偿付能力危机、信用违约等的样本公司数量较少，可靠的公司内部数据获取难度较大，这些数据可得性方面的先天性缺陷会影响到评级结果的准确性和科学性。另一方面，评级方法在简单和复杂两个极端游走，简单的评级方法易于得出结论，但是其科学性和精确度还不足，例如指标法的指标选择和权重赋值还有改进的空间；复杂类模型由于自身模型的抽象性和复杂性，模拟实证过程往往脱离了行业的实际情况，模型参数缺乏经济解释意义，方法和结果同时都令人信服的并不多见。