我国农作物保险费率精算最优方法的实证检验
——来自阿克苏市棉花保险的证据
2014-07-12吴垠豪
吴垠豪
(河南省社会科学院,河南 郑州 450002)
我国农作物保险费率精算最优方法的实证检验
——来自阿克苏市棉花保险的证据
吴垠豪
(河南省社会科学院,河南 郑州 450002)
保险费率是保险合同中的核心条款,准确厘定农作物的保险费率是现代农业保险持续、健康发展的基本条件。目前,研究者多采用参数法或非参数法来厘定农作物保险的费率,但国内外研究文献对小样本数据研究应采用参数法还是非参数法存在争议。同时由于历史的原因,国内各地区对农作物生产情况的记录资料匮乏。基于此,通过采用新疆阿克苏市1949—2010年棉花生产的数据来验证参数法和非参数法处理小样本数据的优劣。分析表明,小样本条件下参数法厘定的费率更可靠。
农业保险;小样本数据;参数估计法;非参数估计法;农作物保险;费率精算
一、引言
在全球气候变化的背景下,近几年中国干旱、洪涝、台风、低温、冰雪、高温、沙尘暴、病虫害等灾害风险呈现增加的趋势,并且各种灾害的突发性、异常性、难以预见性将日显突出①国家综合防灾减灾规划(2011—2015年)。;中国农民从事种植业的风险依然很大。在WTO“绿箱”政策的框架下,农业保险的主要功能是将农业易受自然因素影响的先天缺陷转移、分散出去,从而稳定农业生产规模、给予农民长期稳定的平均收入预期;故此世界各国普遍采用农业保险来支持和保护本国的农业生产。2007年中国开始了新一轮政策性农业保险的试点,在各级财政的大力补贴下,中国的农业保险取得了巨大的成就。2007年以来,中国农业保险累计保费收入超过600亿元,年均增速达到85%,共计向7000多万农户支付保险赔款超过400亿元。目前中国农业保险业务规模已跃居世界第二,成为全球最重要、最活跃的农业保险市场之一②http://www.chinairn.com/news/20120409/446224.htm l。。
但是,随着农业保险试点的逐渐深入,缺乏精准费率厘定等一些制约中国农业保险进一步发展的限制因素也逐渐引起相关人士的关注。农业保险推行效果很大程度上取决于保险费率厘定的合理性,而费率的厘定过程其实就是确定风险损失发生概率和损失分布的过程(于洋,2010)[1]。目前,国内外研究者主要采用参数法或非参数法来厘定农作物保险的费率。参数法首先假定农作物单产波动服从某种分布,然后用单产波动数据估算该分布具体参数值;非参数方法不需要事先假定作物单产分布模型,具有分布形式自由、对函数形式分布假设要求较宽松、计算结果准确等优点。为精准厘定不同地区不同农作物的保险费率,推进中国农业保险的深入发展,在中国保监会及各地保监局的支持下,全国许多地区都开展了厘定本地大宗农产品费率的工作。但由于中国县级单位农作物单产、总产、播种面积是从1988年开始统计的,因此,截至目前全部县级农作物的研究期限只有24年,属于小样本。而国内外研究文献对于小样本数据研究应该采用参数法还是非参数法存在争议。基于此,本文采用新疆阿克苏市1949—2010年棉花生产的数据来验证参数法和非参数法处理小样本数据的优劣,为各地的农作物保险费率厘定工作提供研究方法借鉴。
二、文献综述
参数法和非参数法通常用于估计未知分布形态的样本数据的相关分布模型,尤其是在拟合农作物单产分布函数时,运用更为广泛。所谓参数法就是,首先假定作物RSV序列服从某一分布模型,然后用RSV序列估计该分部函数的相关参数,最终得到该序列的概率密度函数。在采用参数法进行估计分析时关键是选择一个合适的分布函数,只有选取比较接近于待分析数据的真实分布形态时,得出的结果才比较可靠。目前,各国学者已提出了60余种概率密度函数(PDF)。同时,关于参数估计法在农业生产风险中的应用方面,国内外学者也进行了大量研究,并提出了多种参数分布模型,如Bate分布(Nelson and Preckel,1989)、Gamma分布(Gallagher,1987)、Weibull分布(Sherrick etal,1997)、Burr分布(Chen and Miranda,2004)、对数正态分布(Goodwin、Roberts and Coble,2000)和双曲线反正旋分布(Ramirez,1997)等。中国学者庹国柱、赵乐等(2010)[2]采用Rayleigh(2P)、Weibull(3P)、JohnsonSB、JohnsonSU(后二者均属于Johnson Family家族分布函数)、Logistic等9种可能的作物单产分布模型,分别拟合了北京市主要的粮食及经济作物的单产分布情况,并在此基础上厘定了北京市县域农作物的保险纯费率,取得了很好的效果。由于在小样本容量中很难发现数据的“规律性”。因此,在小样本数据中事先假定符合某种分布模型,能更好地排除其他分布函数所带来的干扰,即参数估计法在小样本数据容量中具有很好的适应性(张峭、王克,2007,2010)[3]。国内学者刘立新、黄崇福、史培军(1998)[4],邢鹂(2004),于洋、王尔大(2010)[5],叶涛、聂建亮、武宾霞(2012)[6]等也分别先后得出:参数法需要事先假定模型形式,适用于样本数据量较小的情况。而非参数方法不需要事先假定作物单产分布模型,受样本观测错误影响小,但对样本数量要求很高,适用于大样本情况的结论。国外学者Ker,Alan P and Allen M Featherstone&Terry L Kastens(2000)认为在数据容量严重短缺的农业经济领域,尤其是关于农作物年均产量变化方面的研究,参数法依然是最有成效的。Octavio A Ramirezetal(2003)[7]也发现“在小样本数据或者多变量统计中采用非参数估计法进行统计分析时,存在严重且难以克服的问题”。根据Alan PKer&Keith Coble(2003)[8]的工作,“在一个非常小的样本容量中,即便是随意选择一个分布函数,如常见的正态分布,都要比采用标准的非参数核密度函数得到的结论精确”。Goodwin BK& MahulO(2004)甚至更进一步地给出:当样本数据量较少(少于30-40)时采用参数方法;反之则建议采用非参数估计方法。
然而,也有部分学者对此持有不同看法。王丽红、杨汭华、田志宏等(2007)[9],杨汭华、王丽红、鲜祖德(2009),梁来存(2009)[10],李文芳(2012)[11]等先后指出:非参数估计法不限制样本母体的分布形式,在小样本中是稳定的,能够更好地体现区域风险的差异性特点;并在此基础上,他们分别采用非参数核密度法厘定了中国各区域粮食、小麦、玉米、谷物、棉花以及湖北省县域水稻等农作物的保险纯费率。
现有的关于两种方法在小样本农作物保险中运用优劣的讨论主要集中于理论层面,而采用实证方法进行比较、证明的研究成果却比较少。郭兴旭、陶建平、曾小艳(2010)使用四种参数方法与一种非参数方法对湖北省78个县市的油菜单产保险纯费率进行厘定,发现不同分布下厘定的费率明显不同,并对五种分布拟合的效果做出评价。但是,该文没有得出非参数方法厘定出的费率是否优于参数方法的结论,仅从图形上直观地比较了其与其他分布之间的拟合优劣。
为了解决参数法需要事先假定分布形式、主观性强,并且不适合大样本数据统计的缺陷,20世纪70年代初期美国学者率先提出将非参数法运用到农业经济研究之中。随后一些具体的非参数密度估计函数先后被提出,主要有核估计、近邻密度估计及投影寻踪密度估计,这些非参数估计方法统称为PDF。非参数估计法不需要事先假定分布形式,具有分布形式自由,对函数形式假设要求宽松,受样本观测错误影响小,计算结果准确等优点,但同时对样本数据量要求较高,适用于大样本条件下的风险分析。因此,在大样本容量条件下采用非参数法自由拟合样本的分布形态,可以得到更精确的概率密度函数。正如Goodwin Barry K(2000)所指出:在大样本数据容量条件下,估计农作物产量的概率密度分布函数非常容易,研究者只需要简单地选取非参数核密度法就能得到一个合理而准确的估计结果。
基于此,本文将大样本条件下采用非参数(核密度)法得到的农作物保险费率作为参考标准;再在该大样本数据中选取部分小样本数据,分别采用参数法和非参数法厘定农作物保险纯费率。最终,通过对比分析,得到小样本数据下农作物保险纯费率精算的合理方法。
三、实证分析
新疆阿克苏市是“国家级优质商品棉基地”,对棉花作物的单产资料记录比较详细全面,而且数据具有很好的连续性。同时,根据《中国气象大典(新疆卷)》及新疆气象局的农业气象灾害数据分析,阿克苏市棉花生产自1949—1987年和1988—2010年两个时间段的因灾减产情况差异不大,因此,本文采取不同方法对阿克苏市棉花保险费率进行精算,并根据各种模型需要的条件,选取不同大小样本容量的单产数据来进行对比。
本文选取阿克苏市62年的棉花单产数据,其中1949—1987年的数据来自《阿克苏地区志》,1988—2010年的数据来自《新疆统计年鉴》(1989—2011)。在大样本数据中(即1949—2010年的全部数据)采用非参数核密度法精算阿克苏市棉花保险费率,计算结果记为r0,并将r0作为参考标准;在小样本数据中(即1988—2010年的数据)采用参数法和非参数核密度法厘定阿克苏市棉花保险费率,厘定结果分别记为r1、r2。最后,在对比r0和r1以及r0和r2差别大小的基础上,推断参数法和非参数的优劣。
(一)提出理论假设①在大样本容量数据中非参数法是最有效的(由于在大样本中比较参数和非参数估计法的优劣不是本文研究的重点,因此在此不再详述),所以,本文采用在大样本中采用非参数法厘定出的阿克苏市棉花保险纯费率r0作为参考标准,以此来评价小样本中参数及非参数法的优劣。
(1)r1、r2分别与r0相比较,r1更接近于r0,则小样本容量中参数法更有效;
(2)r1、r2分别与r0相比较,r2更接近于r0,则小样本容量中非参数核密度法更有效;
(3)r1、r2分别与r0相比较,r1和r2基本一致,则小样本容量中两种方法没有显著差异。
(二)实证过程及结果
(1)大样本下非参数核密度法实证过程及结果。
首先,根据1949—2010年阿克苏市棉花单产变化的散点图,确定采用四次方程来拟合阿克苏市棉花单产的趋势方程,具体方程如下:
表1 大样本下非参数核密度法厘定纯费率计算表
然后利用MATLAB-R2010a软件的编程功能厘定大样本下阿克苏市棉花单产保障水平λ=100%条件下的期望损失率及保险纯费率,结果见表1。
(2)小样本下参数法实证过程及结果。
首先,根据1988—2010年阿克苏市棉花单产变化的散点图,确定采用三次方程来拟合阿克苏市棉花单产的趋势方程,具体方程如下:
然后,采用K-S、AD、C-S(卡方)三种检验方法判断RSV是否符合某种分布,若三种检验方法得到的最优模型结论一致,则认定该模型为最优;如三种检验结论不一致,但其中两种方法得出的结论一致,则最优模型选为这两种方法得出的共同结论;若三种方法得出结论均不一致,则以AD检验结果为准,比较结果见表2。
表2 小样本下RSV序列单产分布模型的拟合优度检验②在所采用的参数分布模型中只选取综合排名位于前5名的分布模型,同时考虑到正态分布这一常用的分布函数,本研究也将该分布函数列出,供对比参考。
最后,根据单产数据确定各分布函数的相关参数数值,并在此基础上厘定各种分布条件下100%保障水平下的保险纯费率,结果见表3。
表3 小样本下参数法厘定纯费率计算表
(3)小样本下非参数核密度法实证过程及结果。
根据已确定的1988—2010年阿克苏市棉花单产趋势方程,利用MATLAB-R2010a软件的编程功能,厘定小样本下阿克苏市棉花单产保障水平λ=100%条件下的期望损失率及保险纯费率(见表4)。
表4 小样本下非参数核密度法厘定纯费率计算表
(三)模型比较及选择
(1)分别对阿克苏市棉花RSV序列在大样本条件下的非参数核密度分布及在小样本条件下的六种分布函数即:Dagum(4P)分布、Johnson SU分布、Laplace分布、Log-Logistic(3P)分布、Cauchy分布、Normal分布进行拟合,如图1和图2。
图1 大样本条件下非参数核密度拟合阿克苏市棉花RSV序列概率密度分布
图2 小样本条件下六种不同密度函数对阿克苏市棉花RSV序列拟合图
(2)从上图可以看出,六种概率分布模型均能在一定程度上很好地拟合出阿克苏市棉花RSV序列的概率分布。但是,采用Dagum(4P)、Johnson SU或者Laplacen等形式的单产损失分布函数厘定出的纯费率r1(分别为3.78%、4.13%、3.96%)和参考费率r0(3.49%)比较接近;而采用非参数核密度法厘定出的纯费率r2(5.09%)却与r0相差较大。因此,小样本条件下采用参数法厘定农作物保险费率更可靠。
四、进一步研究展望
(1)比较参数法和非参数法的优劣需要首先确定一个标准,然后拿参数法、非参数法厘定的结果与标准进行比较,结果接近的为优,因此,标准的选定十分重要,选取一个更为精确的标准是今后农作物保费精算的重点研究领域之一。
(2)目前,参数法有60多种分布,但只有一部分可以采用K-S、AD、C-S来检验优劣,这可能遗漏正确的分布模型,造成结果失真,因此,研究判定尽可能多的分布模型优劣的检验模型是今后农作物保费精算的研究方向之一。
[1]于洋.基于保险精算原理的政策性作物保险定价研究[D].大连理工大学,2010.
[2]庹国柱,赵乐,朱俊生,等.政策性农业保险巨灾风险管理研究——以北京市为例[M].北京:中国财政经济出版社,2010:156-158.
[3]王克,张峭.农作物单产生产风险分布对保险费率厘定的影响——以新疆3县(市)棉花单产保险为例[J].中国农业大学学报,2010,(2):114-120.
[4]刘新立,黄崇福,史培军.对不完备样本下风险分析方法的改进及应用——以湖南省农村种植业水灾为例[J].自然灾害学报,1998,7(2):10-16.
[5]于洋,王尔大.政策性补贴对中国农业保险市场影响的协整分析[J].中国农村经济,2009,(3):20-28.
[6]叶涛,聂建亮,武宾霞,等.基于产量统计模型的农作物保险定价研究进展[J].中国农业科学,2012,45(12):2544-2551.
[7]Octavio A Ramirez,Sukant Misra,and James Field.Crop-Yield Distributions Revisited[J].American JournalofAgricultural Economics,2003(85)1:108-120.
[8]Alan P Ker and Keith Coble.Modeing Conditional Yield Densities[J].American Journal of Agricultural Economics,2003(85)2:291-304.
[9]王丽红,杨汭华,田志宏,等.非参数核密度法厘定玉米区域产量保险费率研究——以河北安国市为例[J].中国农业大学学报,2007,(1):90-94.
[10]梁来存.我国粮食单产保险费率厘定的实证研究[J].统计研究,2010,(5):28-38.
[11]李文芳.基于非参数信息扩散模型的湖北水稻生产灾害风险评估[J].江西农业大学学报(社会科学版),2012,(1):58-62.
(责任编辑:贾伟)
1003-4625(2014)02-0085-04
F840.66
A
2013-11-20
本文为国家自然科学基金项目:《金融视角下的新疆棉花种植业风险管理研究》(70863009);新疆高校科研基金重点项目:《新疆特色林果业生产风险评估与保险精算研究》(XJEDU2012I32)。
吴垠豪(1986-),男,河南许昌人,河南省社会科学院科研人员,研究方向:金融工程及保险精算。