农业指数保险定价模型的研究进展及改进策略
2020-02-07张译元孟生旺
张译元,孟生旺
(1.中国人民大学 统计学院,北京 100872;2.哈尔滨师范大学 数学科学学院,黑龙江 哈尔滨 150080)
一、引 言
中国是世界上的产粮大国,农业关系着国计民生,农业保险是保障农业风险的重要手段,受到党中央国务院高度重视。最近十余年,中国农业保险发展迅速,尤其是2007年中国政府对农业保险试行费率补贴后,农业保险进入快速发展的新阶段,保费收入逐年增加,保险覆盖面和投保率显著提高,保障水平和服务能力持续增强。但是,与中国农业发展和农业风险管理的现实需求相比,中国农业保险仍然面临着产品粗放、定价粗放和理赔粗放的问题。
中国现有的农业保险产品以成本保险为主,保险责任只覆盖特定的自然灾害,远远不能满足农民扩大再生产和保障生活的需求,尤其随着新型农业经营主体的出现,对农业保险在险种、保障水平等方面提出了新的要求,单一的成本保险需要向产量保险、价格保险、收入保险的方向发展;中国农业保险产品的费率大多是依据经验或者协商而决定的统一费率,专业化和精细化程度不足,科学的费率应该建立在对农业生产风险的评估基础之上。根据风险构成要素不同,农业生产风险的评估方法可以分为基于风险因子的评估法、基于风险机理的评估法和基于风险损失的评估法[1](见表1)。其中,基于风险因子的评估法是典型的定性评估方法、主观性强,无法满足保险定价对风险评估的精度要求;基于机理的评估法对数据的要求较高,建模过程复杂,不易实现;基于风险损失的评估法是非寿险常用的定价方法,它虽然对复杂大气物理现象无法深入分析,但是所需数据比较容易获取,又有数理统计和保险精算等理论做支撑,所得结果稳定、客观,是最适合中国农业保险的风险评估方法[1-2]。
传统农业保险从特定气象条件对特定标的物的影响出发,有针对性地弥补被保人因气象灾害造成的损失。中国农业生产地域分散,查勘定损的成本高、时间长,逆向选择和道德风险问题较为严重,给农业保险的风险度量带来很大的困难。基于损失赔偿的保险方式具有诸多弊端,限制了农业保险的发展,创新型的指数保险成为一种非常有前景的替代方案,受到各界的广泛关注。2014年《国务院关于加快发展现代保险服务业的若干意见》和2016年中央一号文件《中共中央、国务院关于落实发展新理念加快农业现代化实现全面小康目标的若干意见》中明确提出要探索新型农业指数保险,以适应新型农业经营主体需求,丰富农业保险风险管理工具。十几年来,在国家的高度重视下,农业指数保险在中国蓬勃发展,从保险产品的设计与销售到理论研究都取得了丰硕的成果,为农业指数保险早期的发展做出了很大贡献。
新时期,党和国家对农业发展又提出了新要求,党的十九大报告提出“实施乡村振兴战略,坚持农业农村优先发展,加快推进农业农村现代化”的新时代乡村发展方向。“乡村振兴战略”是中国未来“三农”工作的核心,2018年9月中共中央、国务院发布的《乡村振兴战略规划(2018—2022)》中,中央政府对农业保险提出了具体要求,鼓励农业保险服务乡村振兴,提高农业风险保障能力,设计多层次、可选择、不同保障水平的保险产品,并明确提出要探索新型农业指数保险试点,以适应新型农业经营主体需求。2019年中央一号文件《关于坚持农业农村优先发展做好“三农”工作的若干意见》对实施乡村振兴战略进行了全面部署,提出“按照扩面增品提标的要求,完善农业保险政策”,推进农业指数保险试点,扩大农业大灾保险试点。
农业指数保险作为一种新型、客观、低成本、高效率的保险产品受到了党中央和国务院的高度重视。在助推乡村振兴的发展道路上,充分发挥农业指数保险的优势,需要科学优化保险条款,选择恰当的指数,正确认识指数与损失之间的关系,确定合理的赔付阈值和赔付金额,从而控制基差风险;需要精确厘定保险费率,对农业指数保险的风险进行准确的度量,使得保费建立在更加科学、合理的基础上,为农民提供更加有效的保障。定价是保险产品设计的核心,价格科学合理,产品才具有生命力和吸引力,被保险人的利益才能得到保障,保险公司也才能够稳健经营,尤其是对于政策性农业保险,政府替农户缴纳了大部分的保费,费率厘定的合理与否还关系到政府和社会的整体利益。
农业指数保险以特定的指数代替实际损失作为赔偿基础,当实际指数达到合同约定的赔付标准时,保险公司进行赔偿。根据所用指数不同,农业指数保险可以分为区域产量保险、天气指数保险、遥感指数保险和价格指数保险,其中区域产量保险和天气指数保险是应用最为广泛的指数保险,对这两种保险的定价研究也最为迫切,因此本文所讨论的指数保险主要针对这两种类型。
区域产量保险利用拟合的区域产量与保障产量的差额确定保险损失,定价的关键在于区域产量分布的建模。天气指数保险基于作物产量和天气指数之间的相依关系,利用天气指数预测产量,并利用预测产量与正常产量的差额确定保险损失,定价的关键在于天气指数的选取、天气指数分布建模以及天气指数与产量之间关系的构建。
指数保险以客观的、公开的指标作为赔偿基础,具有结构透明、管理成本低、不易发生道德风险和逆向选择等优点,但在风险定价过程中仍然面临着一系列挑战,主要包括:
第一,经验数据不足。农作物的生产周期较长,多为一年,且具有不可重现的特征,经验数据往往不够充足,给产量分布的统计建模带来很大挑战,阻碍了区域产量保险的实施。为了解决经验数据不足的问题,可以通过 “借力”的方法来增加样本量,譬如,借助其他地区的数据,横向扩大样本量;或者借助外部数据,利用天气数据、灾情数据等弥补产量数据的不足,提高建模和预测的准确性。
第二,基差风险较大。指数保险的基差风险主要体现为“有损无赔”和“无损有赔”两种情况。基差风险是指数保险所固有的缺陷,只能控制而无法从根本上消除。根据来源不同,基差风险可以划分为异质性基差风险和设计性基差风险[3]。异质性基差风险来源于被保群体内部的异质性,而设计性基差风险来源于预测保险损失所产生的偏差。设计性基差风险还可以进一步划分为地理基差风险和指标基差风险。地理基差风险是由保险损失的地理位置与保险标的地理位置不一致所带来的风险。指标基差风险是由保险标的未能充分反映保险损失所带来的风险,在天气指数保险中尤为显著。指标基差风险来源于天气指数与产量损失之间的弱相关性或对天气指数和作物产量之间相依关系的错误理解。
第三,风险相依结构复杂。农业生产受天气、地域等客观条件影响,农业风险具有很大的相依性。不同地区同种作物产量、同一地区不同作物产量、作物产量和天气变量之间存在着错综复杂的相依关系。这种相依性本质上可以归结为农业生产对气候条件的依赖,以及农业生产的空间聚集性。
本文基于统计学视角,从指标的构造、保单的设计、风险建模的挑战和基差风险的来源与控制等几个角度全面分析农业指数保险,并对农业指数保险定价的现有研究成果进行系统梳理,指出了现有定价模型存在的不足和未来研究需要重点关注的问题。主要工作如下:
第一,基于统计学视角,分析农业指数保险风险建模所面临的主要挑战及应对措施;
第二,针对农业指数保险风险建模的几个重要步骤,从产量分布建模、天气指数构造、相依风险建模以及基差风险度量和控制等几个角度对国内外最新的相关研究成果进行综述;
第三,针对目前存在的主要问题,提出可能的改进建议,为进一步深化农业指数保险的精算统计模型研究奠定基础。
二、农业指数保险定价模型评析
在构建农业指数保险定价模型时,首先需要建立各种边际分布模型,包括区域产量分布模型和天气指数分布模型,当同时考虑多个地区或者多种指标时,还需要建立它们之间的相依风险模型。
(一)区域产量保险的风险建模
在研究区域产量保险定价模型时,需要对区域产量的分布建模。中国的农业保险多在省级单位开展,从保险公司的视角看,在提取保险准备金、安排再保险或者设计巨灾保险时,需要同时考虑多个地区的产量分布及其相依关系,建立空间相依风险模型。
1.区域产量模型。由于技术进步、气候变化、种质改良等因素,作物产量呈现出较为明显的随时间递增的变化趋势。对农产量进行建模的首要任务就是要识别出其时间变化趋势。常用的产量建模方法有两步法、嵌入式趋势模型法。
(1)两步法
两步法的基本思想是:同一地区不同年度的产量差异主要体现在其随时间的趋势变化上,剔除产量的时间差异后所得的去趋势产量可以看成是来自同一分布的样本。在两步法建模过程中,首先要对产量建立趋势模型,进行去趋势处理,然后对去趋势产量进行分布拟合。
趋势模型包括确定性模型和随机性模型。常用的确定性趋势模型有线性趋势模型、多项式趋势模型、样条趋势模型和直线滑动平均模型;随机性模型主要包括卡尔曼滤波模型和ARIMA模型。此外,Shen等还提出了自适应局部参数趋势模型,该模型的效果要优于样条趋势模型[4]。
对去趋势产量的分布拟合方法包括参数方法、非参数方法和半参数方法。早期的参数方法主要使用正态分布,而产量由于受自然灾害的影响,其分布往往呈左偏性,所以各种偏态分布逐渐受到关注,如伽马分布、对数正态分布、贝塔分布、威布尔分布和逻辑斯特分布等。此外,在参数模型中,还可以使用各种混合分布模型,如混合正态分布,混合Erlang分布,混合伽马分布或混合对数正态分布。与单一分布模型相比,混合模型提供了更大的灵活性,具有更好的样本外性能,缺陷是参数个数过多。一种特殊的参数模型是OLLN分布,该分布可以描述产量的单峰或双峰特征,在产量分布的拟合中具有一定优越性[5]。
参数方法需要假定变量服从某种参数分布,然后利用经验数据估计模型的参数。当变量的真实分布可以确定时,用参数方法进行分布拟合效率很高,但若对变量分布没有充分的先验认知,或者错误地选定了分布类型,会导致拟合分布偏离真实分布,费率厘定结果不准确。与参数方法不同,非参数方法无需对变量的分布类型做出假设,而是直接从数据出发,确定对数据拟合效果最好的分布,具有分布形式自由、分布假设要求宽松、受样本观测错误影响小以及结果准确等特点。用于产量建模的非参数方法有:核密度估计、经验贝叶斯非参数核密度估计、条件密度估计和相似估计。非参数方法可以体现多峰特征,更注重尾部的拟合,因此厘定的费率相对较高。
半参数方法将参数方法与非参数方法相结合,在发挥两种方法优势的基础上弥补了各自的不足。利用半参数方法构建产量分布可以首先用参数方法对产量建模,然后用非参数方法基于数据对参数估计结果进行修正;或者首先用参数方法建立趋势模型,然后用非参数分布对去趋势产量建模。
(2)嵌入式趋势模型
嵌入式趋势模型是一种分层模型,是在假设产量服从某种参数分布的前提下,令参数随时间变化来体现产量的趋势变化。譬如,在产量服从正态分布的假设下,在均值参数中引入时间和产量的自回归函数构建产量的嵌入式趋势模型;或者进一步考虑产量的偏态特征,基于偏正态分布或者混合正态分布等偏态分布,在位置参数中引入时间解释变量构造产量的嵌入式趋势模型。此外,产量分布的异方差性及偏态的时变性在嵌入式模型框架下可以得到更好的呈现,不需要对异方差形式做任何假设,通过在产量分布的尺度参数和形状参数中引入时间解释变量,可以实现对产量的方差、偏度、峰度甚至更高阶矩的同时建模。
2.区域产量的空间相依风险模型。在现有研究中,构建作物产量的空间相依性风险模型主要包括分层模型和Copula模型。
分层模型又称为随机效应模型或混合效应模型,是线性模型或广义线性模型的推广。它通过对模型的参数建模,将相依关系引入模型,用参数之间的相依关系来体现变量之间的相依关系。分层模型通过对数据进行聚类,使得来自不同类别的共同信息聚集,从而实现“借力”。基于分层模型构建产量的空间相依模型,能够缓解区域产量保险经验数据不足的问题。
利用分层模型构建空间相依关系的两种主要方法是条件自回归模型和Kriging模型。条件自回归模型假设只有相邻地区存在相依关系,因为相邻地区的气候条件比较接近,一个地区发生灾害,相邻地区的农业生产也会受一定程度的影响。在基于条件自回归的产量空间相依关系建模中,边际分布通常选择正态分布、偏正态分布或二项混合正态分布,通过在均值中引入时间相关的解释变量、空间随机效应,或者对回归系数引入空间相依的先验分布,来构造产量的时间效应、空间效应和时空交互效应。Kriging模型基于距离构建空间相依关系,所构建的相依关系多是平稳的和连续的,且仅与距离有关,与起点和方向无关。Park等在产量的空间相依关系建模中应用Kriging方法,对去趋势产量的尾部数据用广义帕累托分布进行拟合,并在位置参数和尺度参数中同时引入了空间相依的随机效应[6]。
通过Copula函数,可以基于给定的边际分布来构建多个随机变量之间的联合分布,被广泛应用于风险管理和保险定价中。常用的Copula模型有椭圆Copula(如tCopula,高斯Copula)和阿基米德Copula(如Clayton Copula,Frank Copula,Gumbel Copula)。Copula模型容易陷入“维数灾难”,所以多用于构建二维随机变量的相依关系。基于Copula模型构建农作物产量的空间相依模型时,需要借助地理、气象等外部信息对区域进行聚类,从而划分空间相依的内部结构,并进一步构造基于二元Copula函数的藤Copula或分层阿基米德Copula[7-9]。
(二)天气指数保险的风险建模
天气指数保险通过对产量与天气指数建立统计关系,利用天气指数预测产量损失,并据此计算保险赔付。天气指数保险的风险建模涉及天气指数选取、气象产量提取、天气指数和产量相依关系构建、天气指数分布拟合、产品效果评价等几个步骤,其中气象产量提取的过程本质上就是上述介绍的产量去趋势过程,这里不再赘述。下面从天气指数构造、指数分布拟合、天气指数空间相依建模、天气指数保险的产品评价等几个角度,梳理国内外的相关研究进展。
1.天气指数的构造。天气指数保险的主要目的是估计由于天气因素导致产量偏离预期产量的大小,关键在于指标的选取。常用的天气要素包括降雨、气温、光照、湿度、风速等。通常选择单一气象要素在作物整个生长季的累积值,如累积降雨量或积温等指标。在早期的研究中,历史年度的生长期是固定的,然而由于气候变化,作物在各年度的种植和收获日期并不相同,因此需要根据实际情况,灵活划分生长期[10]。此外,气候要素的累积值并不能够充分反映产量的变化,以降雨量为例,低频率高强度的降雨与低强度高频率的降雨对农产量会产生完全不同的影响,即使两个地区的累积降雨总量相同,如果降雨模式不同,它们的作物产量仍会有较大差异,因此,在设计天气指数时,同时考虑降雨强度和降雨频率,可以更好地反映产量的波动,从而减少基差风险[11]。
单一气象要素与作物产量之间的相关性往往不高,这种低相关性是导致基差风险的主要来源,因此,改善产量与天气指数的相关性对于控制基差风险具有重要意义。在现有研究中,改善相关性的方法主要有三种:使用国内外通用的综合指标、基于多种天气变量的联合分布构建综合指标、定制天气指数。国内外通用指标的影响力和社会认可度较高,但是落实到特定地理位置的具体物种时,相关性可能不太理想;基于多种天气变量的联合分布构建综合指标,是出于各种天气变量之间存在相互影响的考虑,多用于度量干旱等极端自然灾害;定制天气指数是根据作物产量与天气变量之间的相依关系,从多种影响作物生长的天气要素出发,通过建立产量与天气指数的回归模型,将天气指数设定为多种天气变量的加权平均值,但权重的确定方法有所不同,譬如,Vedenov等(2004)通过对产量和各种天气指数建立线性回归模型,以最小化残差平方和作为优化目标来估计权重。
2.天气指数的分布。天气指数的分布,通常基于所研究区域的历史天气数据进行构建。天气数据根据观测的时间尺度不同可以分为日观测数据和年度观测数据。与产量数据不同,温度和降雨量等日观测数据除了具有趋势性,还具有周期性。在建立模型时,首先要对其趋势和季节性建模,此外还要考虑是否具有异方差性,然后再对剔除了趋势性、季节性和异方差性的平稳残差序列建立模型,常用的模型有GARCH[12]和EGARCH[13]。年度天气指数的分布建模,可以首先根据历史年度天气变量的日观测数据计算年度指标,然后对年度指标的时间序列数据进行分布拟合,也可以先对历史年度的日观测数据建模,然后通过随机模拟来预测目标年度的天气指数。不同的天气指数,其分布也有所差异,常见的分布包括威布尔分布、伽马分布和广义极值分布等。极端天气数据通常使用极值分布建模,如广义极值分布(GEV)和广义帕累托分布(GPD),如果天气极值随着时间具有趋势性变化,就需要构建非平稳的广义帕累托分布[14-15]。
3.天气指数的空间相依模型。根据天气指数类型的不同,构建空间相依关系时,可用的工具也有所差异。在现有研究中,构建作物天气指数的空间相依风险模型主要包括分层模型、Copula模型和空间极值模型。其中,基于分层模型和Copula模型的天气指数空间相依建模方法与区域产量类似,这里不再赘述。
在空间极值相依关系的建模中,最大稳定性过程(Max-stable process)的应用最受关注。最大稳定性过程是多维广义极值分布在无穷维空间上的推广。近年来,关于最大稳定性过程的研究进展迅速,基于谱分解的表达,提出了许多新的模型,如Smith模型、Schlather模型、Brown-Resnick模型,Extremal-t模型和Tukey模型。
在天气指数保险中,最大稳定性过程主要用于极端天气变量的空间建模[16]。譬如,在利用最大稳定性过程构建降雨量极值的空间相依关系时,可以对边际分布参数引入时间、经度、纬度、海拔等局部解释变量,分析降雨量极值空间分布的时空变化特征[17],或者进一步分析厄尔尼诺-南方涛动ENSO,北大西洋振荡(NAO)、印度洋偶极子(IOD)、太平洋十年振荡(PDO)等气候指标对降水极值的影响[18]。此外,最大稳定性过程还被应用于暴雨、暴雪、强风、极端温度等空间极值的建模。
最大稳定性过程假定边际极值序列服从广义极值分布,而这种将数据分块取最大值的处理方法浪费了许多有价值的数据,同时也限制了其应用范围。与广义极值分布相比,广义帕累托分布(GPD)对数据的利用更加充分,参数估计的稳定性更好,为此,Ferreira等(2014)将最大稳定性过程的构造原理应用于广义帕累托分布,构造了广义帕累托过程,该过程可以看作是对一维广义帕累托分布在无穷维空间上的推广,在农业保险的空间极值建模中也具有潜在的应用价值。
4.天气指数保险的评价。对天气指数保险的效果进行评价的方法主要有三种:确定性等价值方法[19]、风险缩减度量方法[20]和基差风险量化方法[21]。确定性等价值方法是期望效用理论中的概念,当一个确定的收入与另一个不确定收入的期望效用相等时,可以将这个确定收入作为相应不确定收入的等价代理[22],这种方法从消费者的角度出发,将不同天气指数保险给消费者带来的效用进行比较从而确定最优的保险设计。风险缩减度量方法基于几种不同的风险度量指标(如ES、LPM、CVDR),比较保险前后农户产量(收入)风险度量的相对减少比例,这种方法从风险的角度出发,将不同天气指数保险降低风险的效果进行比较从而确定最优保险。基差风险体现了保险损失与保险赔付之间的偏差,将不同天气指数保险对风险损失的补偿效力进行比较从而确定最优保险。
三、农业指数保险定价模型的改进策略
关于农业指数保险定价模型的研究虽然已经取得了丰富的理论和应用成果,但仍然存在许多问题需要进一步深入研究。下面分别对区域产量保险和天气指数保险定价模型存在的主要问题进行剖析,并探讨可能的改进方法。
(一)区域产量保险
区域产量保险定价模型存在的问题主要体现在区域产量的方差建模,区域产量的尾部拟合,天气变量对区域产量的影响,以及区域产量的空间相依关系建模等方面。
1.区域产量的方差建模。技术进步不仅带来产量均值的趋势变动,还对其方差产生影响,譬如,新农药的使用可以提高作物抵抗虫害的能力,从而使得产量受虫害的影响变小,因此,在对产量建模时既要考虑到均值的时间趋势,又要考虑到异方差性。
在两步法建模中,两种不同的去趋势方法本质上就是不同的方差建模方法,如加法模型假定方差齐次,乘法模型假定产量的标准差与趋势产量成正比,简称比例方差。实证结果表明,对于不同地区和不同作物,产量方差的变化特征也不同,甚至同一种作物在不同的趋势模型下,其残差项也会表现出不同的结构特征,需要根据实际情况选择合适的异方差结构才能提高产量建模的准确性。在实际应用中,往往会忽略对残差的建模,而是主观选择一种模型进行去趋势处理,这将扭曲产量的实际分布。
与两步法相比,嵌入式趋势模型下的方差建模更加灵活,产量的均值和方差都可以通过参数的时变结构来体现,实现趋势建模、异方差建模和参数估计同步进行,减少了不确定性的来源,避免了方差结构的主观性。嵌入式趋势模型是分层模型的一种,通过对参数引入时间解释变量来构建产量的时间趋势。如果基于分层模型构建产量的嵌入式时空模型,在对参数引入解释变量时,不仅要考虑拟合优度指标,还要考虑解释变量的引入方式对保费的影响。譬如,在常用的威布尔分布和对数正态分布假设下,费率只与分布模型的尺度参数有关,此时,如果仅仅对尺度参数引入时间解释变量而未考虑空间异质性,虽然模型的拟合优度可能很好,但将导致所有地区的费率厘定结果完全相同,这显然不符合实际需要。
2.区域产量的尾部拟合。区域产量的分布拟合有参数方法、非参数方法和半参数方法三种。由于区域产量的经验数据往往不足,参数方法以其简洁和高效得到了更多青睐。实证研究表明,产量由于受自然灾害的影响,容易出现极小值,分布呈现左偏甚至是双峰特征。基于参数方法拟合产量分布常用的伽马分布、逻辑斯特分布、威布尔分布、广义贝塔分布对产量左尾的拟合效果不甚理想,而保险赔付主要来自产量的左尾部分,所以左尾数据的拟合对于保险费率的厘定至关重要。混合正态、混合伽马等混合分布虽然能够体现产量的双峰特征,但是参数个数过多,在经验数据不足的情况下,参数估计结果的稳健性会受到影响。因此,在区域产量分布的拟合中,还需探索和尝试新的参数分布,如组合分布、GB2分布、GLD分布和OLL分布等。这些分布具有灵活的偏态和峰度特征,对于改进区域产量尾部数据的拟合效果具有潜在优势。
在区域产量保险中,产量的分布模型对费率厘定结果具有很大影响。当经验数据较为充足时,可以考虑用非参数的方法对产量分布建模。非参数方法由于没有对分布设定任何假设,对产量左尾数据的拟合相对较好。在现有研究中,主要是基于高斯核对区域产量建模,这种对称核用于拟合区域产量数据可能带来偏差,因此,可以考虑替换为伽马核等其他核函数;此外,非参数的产量建模方法多用在两步法中对去趋势产量建模,还没有利用非参数方法对产量数据建模的相关研究,因此,在今后的研究中还可以基于非参数回归理论,引入时间解释变量和其他外部信息,建立非参数的嵌入式趋势产量模型。
3.天气变量对区域产量模型的影响。在现有的区域产量模型中,天气变量主要用于产量的均值预测,而忽略了对方差的影响。此外,在产量均值预测的线性回归模型中,假设区域产量服从正态分布,这与产量的偏态分布特征也不相符合。为了改进现有的区域产量模型,提高区域产量保险费率厘定结果的准确性,可以考虑将时间、降雨、气温、土壤条件、种植面积等外部信息作为解释变量引入模型,从均值、方差、峰度、偏度等多个角度全面描述产量的分布特征,建立GAMLSS模型。在产量分布模型中引入天气解释变量,还需要考虑不同天气变量之间的相依关系,比如气温与降雨量之间的相依关系。这种解释变量之间的相依关系,可以基于分层模型,通过在过程层中对产量分布的参数引入不同的天气指标作为解释变量,并对解释变量的回归系数引入相依的先验分布来实现;还可以基于Copula模型,对产量和多种天气变量的联合分布建模,从而利用联合分布得到产量的条件分布。
(二)天气指数保险
在天气指数保险定价模型的研究中,存在的问题主要体现在作物产量与天气指数之间的相关性建模,基差风险的度量,以及基差风险的控制等方面。
1.作物产量与天气指数之间的相关性建模。在现有文献中,主要通过建立产量与天气指数之间的线性回归模型来刻画它们之间的相依关系,并据此构造关于天气指数的分段线性赔付函数。这种方法建模简单,容易解释,但也伴随着一些问题。线性回归模型假设产量服从正态分布,这与产量的左偏性不符,因此可以考虑在广义线性模型的框架下,用偏态分布代替正态分布,并在参数中引入天气指数解释变量,从而得到给定天气指数条件下的产量分布,以及产量与天气指数之间的相依关系。此外,基于线性回归模型的产量与天气指数之间的相关性在产量的各种分位数水平下恒定不变,忽略了产量与天气指数在尾部相关性上的差异[23]。基于非参数分位回归模型构建产量与天气指数之间的尾部相关性虽然可以避免对产量分布的有关假设,且由此得到的天气指数与产量之间的相依关系随着分位数水平的变化而变化,但是分位数水平的选择存在一定的主观性。此外,上述两种建模方法都假设产量与天气指数之间存在线性相依关系,忽略了天气变量对产量的非线性影响[24]。Copula模型在刻画非对称尾部相依关系时具有明显的优越性,同时还可以避免关于产量分布的错误假设,因此,近年来被广泛应用于产量与天气指数之间相依关系的建模。在现有文献中,所使用的天气指数大部分是单一气象要素在作物生长期的累积值或者国际通用的综合指标,这些天气指标与作物产量之间的相依关系往往较弱,这会给基差风险的控制带来较大挑战。因此,在未来的研究中,应该在指标构造或赔付函数的设计中,同时使用多种天气指数,并考虑不同天气指数之间的相依关系。
2.基差风险的度量。基差风险是阻碍天气指数保险发展的主要障碍。现有文献大多是通过提高天气指数与产量之间的相关系数来实现对基差风险的控制,或者通过基差风险函数最小化来实现最优产品设计。目前,关于基差风险还没有统一定义,基差风险函数也没有统一的表达式,有些研究从频率角度量化基差风险,将基差风险定义为有损无赔的发生概率;有些研究则从强度的角度量化基差风险,将基差风险定义为实际损失大于保险赔付额的某个函数。对基差风险函数的定义不同,对应的量化方法就不同,所得到的结论自然也不同。统一基差风险的定义,规范基差风险函数的表达式,对于完善天气指数保险设计具有重要意义。基差风险有多种不同的来源,完整的基差风险函数应该涵盖所有可能的风险源,并通过对不同的风险源赋予不同的权重来得到基差风险的完整表达式。
3.基差风险的控制。天气指数保险的基差风险主要是由于天气指数与作物产量之间的相关性不强所导致的,因此,为了控制基差风险,可以提高产量与天气指数之间的相关性,即构造与产量强相依的综合天气指数,使得天气指数尽可能反映产量的波动。通常来说,在轻度灾害情况下,容易发生无损赔付的情况,而极端恶劣的自然灾害,其影响往往是剧烈的且系统性的,很难通过人为手段加以补救或者补救效果不明显,因此,利用天气指数保险应对极端的系统性风险所造成的基差风险会小很多。而这种极端系统性风险常常表现出空间相依性,需要对极端天气指数建立空间相依模型。最大稳定性过程专注于空间极值建模,随着其理论的不断完善,应用空间也不断扩大,尤其是对极端系统性风险的建模具有很大的应用前景。在现有研究中,最大稳定性过程主要用于构建降雨量极值的空间相依关系,在以后的研究中还可以考虑对极端气温、极端干旱指标建立空间相依模型,从不同的角度对系统性的农业巨灾风险进行评估;还可以根据指标的不同,构建更加灵活的非平稳最大稳定性过程,引入解释变量,使得极值天气指数的分布随时间、空间及其他各种气候、社会、经济、人力等因素的影响而发生变化。将最大稳定性过程应用于极端天气指数保险,可以构建极端天气指数的空间相依关系,并据此设计保险赔付标准和厘定农业巨灾保险费率。
为了控制基差风险,还可以考虑设计多指标的天气指数保险,即在赔付函数的设计中,将天气要素对产量影响的先后顺序及其相互关系考虑在内;或者设计多触发条件的天气指数保险,使保险赔付不仅依赖于天气指数,还依赖于外部辅助信息,如区域产量,从而降低有损无赔的基差风险[25]。
四、区域产量保险与天气指数保险的综合比较和应用
天气指数保险与区域产量保险的设计基于不同的指标、数据基础和建模方法,因此其特点和功效也不相同(如表2所示)。在实际应用中,开展何种保险,要因地制宜,根据风险的性质、保险的目的、农业生产的实际情况选择最适合的保险类型,有针对性地设计农业指数保险产品。
区域产量保险是多灾因的农业保险,它以聚合产量为保险标的,具有数据易获取,赔付标准客观的优点,尤其在农户级数据获取受限的情况下,用区域产量保险代替农户级或者农场级产量保险,开展农业保险的可行性更高。但是数据聚合的处理方式会导致风险被低估,而低估风险的结果就是保费不足,保险公司可能面临损失。如果能够获取农户级的产量数据,则可以根据农户级产量数据与区域产量数据之间的关系,调整区域产量保险的费率或赔付加以应对,但是受客观条件的限制,农户级甚至农场级的产量数据往往很难获取,且样本量很小,使得区域产量保险的级差风险无法从模型的角度进行控制,只能通过其他政策性的方法来缩减;此外,当区域面积过大,区域内不同农户的土壤条件、地形和种子质量等存在差异时,生产水平低于区域平均水平的农户,有可能发生有损失而未赔付的情况。在设计区域产量保险时,应尽可能减少区域内部的非同质性,选择各方面条件差别不大的地区开发区域产量保险,或者通过事前或事后补贴的方式尽可能缩小农户间的异质性。农民的收入来自农作物的销售,而销售收入取决于产量和价格,中国大部分主粮作物的价格是国家规定的,波动不大,因此,产量就成为度量农户收入的主要指标,以产量为保险标的的区域产量保险是适合中国国情的。
表2 区域产量保险与天气指数保险的综合比较
对于缺乏历史产量数据或者损失数据的地区,很难开发区域产量保险,只能使用天气指数保险。以天气指标代替区域产量作为保险标的,其优点是天气数据更加客观、公正、准确,且数据量大。但是,与区域产量保险不同,天气指数保险多是单灾因的,因此,推广天气指数保险要根据实际情况而定。如果一个地区的气象灾害严重,或者单一气象灾害显著,则天气指数与损失之间具有较强的相依关系,基于合理的相依风险建模工具,基差风险能够得到有效控制。对于情况复杂的地区,很难找到与产量具有强相依的天气指数,基于合理的风险建模工具也无法弥补基差风险所带来的影响。虽然可以构造综合指标以提高相关性,但是过于复杂的指标很难对农户解释清楚,从而会影响农户对天气指数保险的接受程度。面对这种两难局面,一个可行的选择是设计巨灾天气指数保险。利用天气指数保险应对极端天气灾害的效果会更好,这是因为,轻度的天气灾害经常发生,所导致的损失在各种人为补救措施等因素作用下,差距会很大,但是极端恶劣的自然灾害,其影响是剧烈的且系统性的,很难通过人为手段加以补救或者补救效果不明显,此时,基差风险会小很多。
开发农业指数保险,除了采用上述的单一模式外,还可以构建分层的农业保险,譬如,对于一般的农业风险,利用区域产量保险提供保障,而对于极端的巨灾风险,构建巨灾天气指数提供保障;还可以将两者结合,设计多赔付的指数保险,譬如,利用天气指数保险的快捷性提供前期保障,而根据后期统计的区域产量保险作为补充,可以进一步提高农业指数保险的保障水平。
五、总 结
指数保险作为一种新型的农业保险产品,具有简单、透明、成本低、不易发生道德风险和逆选择等优点,受到了各国政府的高度重视,具有较好的政策环境和发展前景。但是,关于农业指数保险定价模型方面的研究还需进一步深化。
本文系统梳理和总结了关于农业指数保险定价模型的主要研究成果,从指标选择、损失预测、相依风险建模、基差风险度量和控制等几个角度进行了比较和评述,指出了现有定价模型存在的主要问题,提出了可能的改进方向,并从统计建模的角度出发对农业指数保险的产品设计提出了建议。
区域产量保险的赔付来自产量分布的左尾,受天气条件和空间聚集性影响,具有明显的空间相依特性,保险费率同时受产量均值、方差和空间相依关系的影响,因此,改善产量分布尾部的拟合效果,加强产量方差建模,完善区域产量空间相依性建模对于区域产量保险定价具有重要意义。天气指数保险高度依赖于气候条件,因此,发展天气指数保险一方面要寻找对产量具有强解释力的天气指标,提高产量与天气指数之间的相关性,另一方面还要优化产品设计,控制基差风险。
总之,农业指数保险具有许多优良性质和广阔应用前景,但其定价模型还存在诸多不完善之处,本文关于农业指数保险定价模型的系统评述和改进建议可以作为未来研究的一个新起点。