基于Copula方法的北京西瓜气象指数保险费率测算
2021-07-07吕端
吕端
(中国财政科学研究院 研究生院,北京 100142)
1 引言
科学厘定农业保险费率是推进农业保险高质量发展的前提和首要任务,也是研究政策补贴、衡量保险保障水平的主要依据,其关乎广大农户的切身利益和保险公司的经营风险。目前,已有研究选择不同方法和数据厘定不同地区的农产品保险费率。姜会飞(2009)根据保险收支平衡原理,运用历年县级作物单产、种植面积和承保年的种植面积来动态测算县级农业保险费率与保费[1]。于洋(2010)采用生存分析精算模型来厘定多保障水平下的政策性作物的保险纯费率,然后根据不同农户的风险偏好,厘定产量保险和成本保险两种MPCI产品的保额[2]。牛浩和陈盛伟(2016)选取玉米生长过程中8个主要风险指标,通过产量保险模型厘定出的山东省各地市玉米费率来衡量玉米实际受灾情况,采用风险区划评估山东省各地市综合受灾风险来衡量玉米的理论受灾风险,并对两者进行排名对比,从而完善了风险区划条件下的产量保险费率厘定[3]。冯文丽和郭亚慧(2017)采用Copula方法对河北省玉米收入保险进行定价,并通过平方欧式距离最小原则来确定最优Copula形式[4]。曲思邈等(2018)采用Weibull分布模型厘定玉米的纯保费率,并建立玉米干旱保险天气指数模型[5]。从现有研究看,研究对象主要以粮食作物为主,很少针对特色农业品种。在厘定方法方面,多数采用线性回归法、多元经验分布方法等来衡量变量间的线性关系。采用Copula方法选择合适的边缘分布来计算变量间非线性关系,区别主要是边缘分布和Copula形式选择不同,多数研究选择边缘分布为Normal、Log-Normal、Burr等常见分布,在Copula方法选择上为Normal Copula、Frank Copula、t-Copula等模型。但事实上,数据分布不同会影响数据拟合估计。本文以北京市特色产业西瓜为研究对象,用Copula模型对北京西瓜指数保险进行费率厘定。在模型的选择上,突破了已有文献中集中估算的常见Copula模型,而是根据AIC准则先在众多的Copula模型中选择最优模型,提高了模型拟合程度,从而使北京市西瓜保险费率费率厘定更精准,有助于有效降低保险定价成本,助推农业保险实现“提标、增品、扩面”。
2 模型与数据
2.1 Copula模型
Copula函数指的是用函数C将随机变量x1,x2,…,xN的联合分布函数F(x1,x2,…,xN)和边缘分布函数F1(x1),F2(x2),…,FN(xN)相连接的函数(Nelsen,1999),即
F(x1,x2,…,xN) =C[F1(x1),F2(x2),…,FN(xN)]
(1)
根据Sklar定理,若F(x1,x2,…,xN)为边缘分布的N元联合分布函数,则将存在一个Copula函数C(u1,u2,…,uN),其能够满足公式(1)。如果边缘分布函数是连续函数,则Copula函数唯一确定。如果边缘分布函数是一元分布函数,则F函数为边缘分布F1(·),…,FN(·)的联合分布函数。也就是说Copula是连接变量的边缘分布,通过确定变量间的联合分布形式便可以计算变量间的非线性、非对称等相依关系。Copula函数种类较多,常见的为椭圆Copula函数和阿基米德Copula函数两大类。前者包括正态Copula和t-Copula函数,后者包括Gumbel Copula、Frank Copula和Clayton Copula等二元Copula函数。
通过Copula模型厘定保险费率,首先需要选择适当的边缘分布,一般是通过AD检验、KS检验和卡方检验加以确定,然后选择Copula联合分布形式,通过AIC、BIC最小来选取。在此基础上,通过蒙特卡罗随机模拟生成特色农产品单产与价格或气候变量的随机数。
2.2 积温产量模型
由于温度对西瓜产量的影响是非线性逐渐累积的过程,西瓜产量与其生育阶段有效积温成比例关系。借鉴Schlenker等(2009)的研究[6],本研究采用非线性函数表示西瓜实际产量与生育期温度间的关系,即地区i第t年的西瓜实际产量yit为
(2)
式(2)中,h为逐小时温度;g(h)为不同温度对应的有效积温;φit(h)为地区i第t年西瓜生育期内不同温度h持续时长;hmax、hmin分别为西瓜生育期温度的上下限;
(3)
通过将一日内的最高气温和最低气温构建正弦曲线,可以模拟气温日变化,从而获得逐小时气温,即
tj=αsinωj+β
(4)
式(4)中,tj为时刻j的气温,ωj为对应的时角,α、β为模型系数[7]。采用分段模拟方法从而获得逐小时温度数据,进而统计出各地区i第t年西瓜生育期不同温度的时长φit(h)。
2.3 数据来源
一般而言,采用不同的栽培技术,西瓜可从1月中旬至7月下旬播种,5~11月均可收获。本文通过羊杏平和徐锦华(2006)、陈春秀(2011)的研究,获得西瓜在不同生育期的适宜温度以及积累的天数,即气温在15~35 ℃为适宜温度,气温小于15 ℃或高于35 ℃以上则会对西瓜生育产生不良影响,如表1所示[8-9]。为此,本文选取北京市气象站点1996~2016年间每年的4月15日至7月10日的逐日气候数据,按照式(4)的方法计算西瓜在15~35 ℃、15 ℃以下和35 ℃以上三个温度区间的时长,并取期间北京市平均气温、降水量的均值进行研究。西瓜单产数据取自《北京统计年鉴》《中国统计年鉴》和中经网数据库,且假设西瓜均为露地栽培,具体数据如表2所示。
表1 西瓜生育时期的温度要求
表2 影响西瓜产量的气候因素
3 研究结果
3.1 数据的趋势项和随机项分解
采用HP(Hodrick-Prescott)滤波方法对北京市西瓜单产进行趋势分解,从而获得其趋势项和随机项。同样,求出气候变量的趋势项,如表3所示。
表3 西瓜有关气候变量分解的趋势项
表3续表
3.2 边缘分布确定
借鉴已有的研究结论,本文选取Normal、Weibull、Beta、Logistic 和 Gamma 等多种常见分布作为候选的分布模型。通过Easyfit5.6软件对西瓜单产数据进行拟合,并通过KS检验、AD检验和卡方检验来选择最优的分布形式。表4的拟合优度检验结果,卡方检验与AD和K-S检验的结果不一致,但AD检验相对比较稳健,因此西瓜单产序列服从Gamma分布。
表4 西瓜单产概率密度函数拟合优度检验结果
采用同样的方法,可以获得气候变量的分布,如表5所示。
表5 西瓜气候变量概率密度函数拟合优度检验结果
3.3 Copula 估计与选择
利用R软件分析北京西瓜单产序列,进行混合Copula函数的构造与参数估计,计算Copula的Kendall秩相关系数τ,并根据所选的Copula与样本经验Copula之间的AIC和BIC最小原则选择最优的Copula形式,如产量和温度15~35 ℃时长最优的Copula形式为Tawn type 1。为了分析单个气候因素对单产的影响,分别求解不同气候因素下的Copula模型,每个模型有2个变量。估计结果如表6所示。
表6 分气候因素西瓜产量保险最优Copula模型的选择
3.4 蒙特卡罗模拟西瓜产量和气候样本数据
确定了西瓜单产和每个气候变量的Copula联合分布形式及参数,分别通过蒙特卡罗模拟方法,模拟出10000对服从所确定边缘分布的产量和气候数据,在此基础上进行费率厘定。具体步骤如下:第一步,Tawn type 1参数θ为5.387,采用蒙特卡罗模拟法抽样10000次,生成符合[0,1]分布的随机序列u、v。第二步,按照西瓜产量Gamma分布中参数a=289.5,b=10.864,温度15~35 ℃时长Gamma分布函数中参数a=3132.6,b=0.38918计算边缘分布反函数,生成新的10000个产量和温度15~35 ℃时长。第三步,将新生成的西瓜产量作为北京市在温度15~35 ℃时西瓜产量样本数据。第四步,按照保费计算公式厘定费率。
本研究费率厘定公式参照刘素春,刘亚文(2018)的做法[10],得出式(5)、式(6):
(5)
(6)
表7 分气候因素西瓜产量保险纯费率厘定结果
由上表可以看到,在70%~100%保障水平范围内,不同的气候变量与西瓜产量间的纯保费费率差异较小,基本上处于3.5%~11.6%范围内。因此,在构建指数保险时,参考简单的气候变量即可,加之采用积温产量模型计算的复杂性,我们可以采用更简单的降水量和平均温度来厘定费率。
为了进一步分析所有的气候变量(温度15~35 ℃时长、温度小于15 ℃时长、温度35~50 ℃时长、降水量和平均温度)对西瓜产量的影响,本研究将所有气候因素和西瓜单产求Copula模型,该模型有6个变量,并且采用常见的t-Copula、Normal Copula、Clayton Copula和Frank Copula进行估计,结果如表8所示。
表8 西瓜单产、气候变量的概率密度函数拟合优度检验结果
费率厘定结果如下表9所示,可以发现,与单个气候变量相比,5个气候变量与西瓜单产的混合Copula测算的费率更高,在70%~100%保障水平范围内,整体气候变量与西瓜产量间的纯保费费率处于4.7%~15%范围内。由此可见,考虑更多的气候影响因子时,西瓜产量保险费率更高,但其并不是这些气候影响因子之和。
表9 不同Copula模型下整体气候因素的西瓜产量保险纯费率厘定结果
4 结论与建议
4.1 结论
本文利用1996~2016年北京市气象站点的逐日资料和西瓜产量年数据,采用Copula模型建立适合北京市西瓜指数保险,在此基础上进行保险纯费率的厘定。得到如下研究结果:一是从Copula的Kendall秩相关系数值来看,除了平均温度与西瓜产量呈现负相关外,其余气候变量均与北京西瓜产量呈现正相关关系,且温度35~50 ℃时长与产量相关最高,其次是温度15~35 ℃时长,温度小于15 ℃时长与产量的相关性很低,这与西瓜伸蔓期、开花坐果期以及膨瓜至成熟期温度小于15 ℃时西瓜停止生长和不开雌花的情况相符。二是不同的气候变量与西瓜产量所构建的Copula模型形式不同,本研究突破了已有文献中集中估算常见的Copula模型,而是根据AIC准则先在众多的Copula模型中加以选择最优模型,进而提高了模型拟合程度。三是由气候变量与西瓜产量组成的二元变量Copula模型所厘定的费率差异很小,在70%~100%保障水平范围内为3.5%~11.6%,全部气候变量与西瓜产量的组成的多元变量Copula模型所厘定的费率较大,为4.7%~15%。
4.2 建议
在当前各地区推进特色现代农业、品牌农业的情况下,亟需推出特色产业保险来“提标、增品、扩面”,从而使各类特色现代农业的主体能够尽快享受到政策性保险所带来的红利。为此,可以从以下几方面着手:
一是积极推进各类农作物气候保险。我国已积累了长期的较为丰富的气候资料,如果将其应用于农业保险,可以充分发挥气象指数保险中气象数据易观测、可量化的特点,有效降低承保成本,进而解决当前费率低所导致的保险公司亏损或违规操作问题。为此,一方面要建立数据共享或采用机制,研究人员或者保险公司可以通过申请或市场化手段较低成本的获得相关部门的完整气候数据以及县、乡级农产品的单产数据;另一方面,鼓励、支持在特色现代农业种植区域内设置气象站点,搜集积累数据,减少指数的基差风险,设计出更科学的气象指数保险产品。同时,要结合各地区的优势特色产业开展气候保险,针对不同区域设计不同的保险费率,从而有效规避逆向选择,提高农民投保的积极性。
二是优化产品设计。气候保险指数设计时应尽量采用农户可理解的、简单易行的指标。根据本文研究,不同气候因子与产量构建指数保险时,费率差异较小,因此可以选择代表性的气候因子,如降雨量和平均温度等,以此来提高农户的投保概率。另外,由于不同分布和模型取舍的差异以及数据的更新会引起气候变量与产量关系的变化,因此在开展具体应用时还要加以修正和完善,从而设计更加合理的产品。
三是加强风险管理。其一,保险机构要持续提升风险管理水平和产品设计,充分利用移动互联网、大数据、云计算、人工智能等技术,通过与专业公司、第三方评估机构等合作,降低损害鉴定、防灾防损、承保理赔等服务环节的费用,提高经营管理效率。其二,完善灾前预警机制,充分利用先进的技术,及时、准确地发布相关气象信息,从而使农业经营主体做好防护,减少受灾损失。其三,要适度强制投保,政府支持保险公司积极推广和加强宣传,通过提高投保率来更大范围地分散风险,降低保险机构的营运费用。