APP下载

基于马尔可夫预测模型的农村居民农业收入预测研究

2013-04-29王琪

金融经济 2013年6期

王琪

摘要:农村居民收入主要来源于农林牧渔业,包括现金收入和实物收入。由于作物收成易受天气因素及其他外界不可抗力影响而难以预测,况且实物收入的具体数据也不易准确测量,最终难以预测和统计真实的农民农业收入数据。本文以马尔可夫齐次矩阵预测法作为理论依据试图测量未来几年农村居民的农业收入,可以为提前统计数据和制定政策作参考。

关键词:马尔可夫链 转移概率矩阵 农业收入预测

一、导言及文献综述

随着我国经济的高速发展,我国的居民收入水平呈现出增长的趋势,发展的不平衡使我国面临“高储蓄率、低消费率”的現状,收入差距明显。近年来,许多学者探讨了关于扩大我国居民消费水平、寻找“消费之谜”的问题。收入是消费的一个重要因素,城乡间收入差距也越来越得到重视,但由于城镇居民的货币收入比较容易测量、数据易找,相反农村居民因其收入的多来源、不稳定、易受外界因素影响等原因难于准确预测。

马尔可夫模型是用来测量或者估计随着时间的推移而发生的移动,它是高等数学中一项应用广泛的预测数据模型之一,其巧妙的利用矩阵理论和概率原理,用简单的矩阵模型来处理数量多且复杂的数据,化繁为简。许多学者根据马尔可夫模型的原理,预测了许多不确定因素下的数据,如焦中信、李小芳(2008)利用齐次马尔科夫链,以单只股票在过去一段时间内交易日的价格为对象来预测其在未来某天交易日的价格走势,方法简便却未能给出预测结果的显著性检验,只适用于预测个股走势而无法判别整个股市的大走势;陈敏,魏金明(2006)利用人民币兑美元的周汇率数据基于马尔可夫链模型预测了2006年下半年后中长期人民币汇率走势,得出人民币会定在1美元兑换8.01元以下、具有较大的升值空间的结论,就目前来看,人民币汇率状况已经得到了证实。以上是根据马尔可夫链模型做出的简单预测实例,最终结果都只是作为一个简单的参考,误差的存在使其并不能用作真实数据来分析。查秀芳(2003)先通过假设几个前提条件,再合理运用马尔可夫链模型预测市场占有率,最后得出的预测数据与真实数据有一定的误差,分析认为由于激烈的市场竞争和促销策略的改变导致转移概率矩阵发生变化,因此并不能完全符合假设条件,从而进一步提出有关于企业预测市场的建议。

综上所述,本文也试图借鉴马尔可夫链的原理来探寻和预测农村居民的收入数据,以便进一步探索消费—收入模型。按收入来源分,农村居民的纯收入核算包括四个方面:工资性纯收入、家庭经营纯收入、转移性收入以及财产性收入。其中工资性收入主要来源于农村居民的劳务所得,这部分数据以现金实数来表现;转移性收入和财产性收入主要受制于政府的财政支农政策以及其他的投资、财产租赁等因素。鉴于我国的历史状况,我国属于以农业为基础的农业大国,故以“农林牧渔”为主要来源的家庭经营性纯收入构成了农村居民收入的基本部分。为了简便探究,我们只考虑简单的农产品买卖收入即农业收入。

二、马尔可夫预测法的基本原理及适用性检验

概括来说,在事件的发展过程中,每次状态(记为Et)的转移都仅与前一时刻(Et-1)的状态有关,而与过去的任一状态无关,具备这个性质(无后效性)的离散型随机模型称为马尔可夫链。我们可以基于马尔可夫链,根据事件的目前状况预测其将来各个时刻(或时期)的变动状况,这样的一种预测方法就是马尔可夫预测法。用马尔可夫预测模型来推知预测对象的未来发展,要求预测对象在预测期间满足过程随机性、无后效性、有限的或可列的且相互独立的状态、转移概率矩阵保持稳定不变这几个条件。为了简便,我们把一个马尔可夫过程用[E、P、Q]表示,其中:

(1)E是系统所有可能的状态所组成的非空的状态集,有时也称之为系统的状态空间,它是有限的、可列的集合或任意非空集。用E2、E1......来表示。

R2=0.96766,Et-2的t值在给定置信水平下小于2.145,则拒绝原假设,说明滞后两期的数据对本期没有显著影响。

通过比较可以发现,模型①优于模型②,由此说明本期农业收入水平与前一期农业收入水平显著相关,而与其他滞后期显著不相关,满足无后效性。其经济意义解释是,该年收入数据具有这样的性质:以粮食收入为例,受群体效应影响,一种粮食品种当年的收成容易受到去年的市场行情影响,即去年供不应求,今年农民会选择多多供应;而一旦去年市场行情不容乐观,许多农民则选择改种行情好的农产品品种,因此由该产品的成交价格和产量最终得到的农业收入会取决于上一期的状况,这就符合了无后效性。

此外,该农业收入数据是一族依赖于时间的随机变量,其变化过程是一个随机过程,每年的收入都不相同,任何有关的因素都会影响当年的数据。显然,每一年农产业的收入状况都是独立的状态,数据可列、有限,只在这些可列个时刻发生状态转移,故它们符合马尔可夫链。

最后,我们分别考虑了农业收入和收入区间作为预测对象,假设无论从什么时刻开始,农产品价格、价格区间以及成交量的状态变化过程的一步转移概率只与时间差有关,故状态转移概率矩阵是保持稳定不变的。所以农业收入、收入区间变化过程符合马尔可夫预测法的条件,其变化过程构成马尔可夫过程。下面我们就用马尔可夫预测模型来预测农业收入的未来走势。

三、用马尔可夫预测法预测农业收入模型

理论上农业收入数据是符合马尔可夫预测模型的,但由于外生变量的不确定性,极易产生误差。为了便于分析,我们假设不考虑极端天气的影响,也不考虑优惠政策和财政补贴,因为极端天气容易使得某一年的农产品产量异常,而政策影响会使得产品价格和产量脱离市场,对总收入有一定影响。此外,假设不考虑外出务工和农业信贷量的突然增加等相关因素的影响;最后假定,农业收入的无后效性满足齐次性。

1.以农业收入为预测对象

选取表1中的每一年作为离散的时间单位,分为三种状态:E1表示收入上升,E2表示收入下降,以1996年为基年,以后各年状态收集情况下:

表1 1996年-2011年状态转移情况

从表1中我们可以看出,16个年份中,上升的数据有12个,下降的有3个,第15个数据(2010年)后无转移状态,我们选取前15年数据,把2011年数据作为分析预测,这样上升的记11个。其中,由上升到上升状态转移的有10次,由上升到下降状态转移有1次,由下降到上升状态转移有1次,由下降到下降状态转移有2次。下面建立狀态转移概率矩阵,矩阵的每一行表示由一个状态转移到其他每一个状态的概率:

表2状态转移概率表

根据预测结果,2011年农业收入上升的概率为90.91%。事实证明,2011年农业收入确实增加了。

2.以状态区间为预测对象:

用本年(t)数据减去上一年(t-1)数据,根据差额的范围划分为6个区间状态,列表如表4:

由此推断2011年与2010年农业收入数据差额处于状态E5的概率为1,经表1演算可知确实如此。预测2012、2013年的农业收入数据状态区间:

E(2)=E(1)·P(*)= E(0)·=(0,1,0,0,0,0)

E(3)=E(2)·P(*)= E(0)·=(0.2,0.4,0.2,0,0.2,0)

根据结果计算,2012年与2011年农业收入数据差额位于状态E2的概率为1,推测具体数据为1497.93-1547.939(元)之间;而2013年与2012年农业收入数据差额位于状态E2的概率最大为40%,小于50%,不能做出准确的推测,为了进一步准确预测,我们取2009年与2008年数据数值差额作为初始状态,重复上述过程,可知E(0)=(0,0,1,0,0,0),故

E(1)=E(0)·P(*)=(0,0,0,0.5,0,0.5),说明2010年与2009年数值差额处于状态E4或状态E6的概率分别为50%,实际数据处于状态E6;

E(2)=E(1)·P(*)= E(0)·=(0,0,0.25,0.25,0.5,0),说明2011年与2010年数值差额处于状态E5的概率最大,为50%,我们推测为状态E5,这与初始状态取为E(0)=(0,0,0,0,0,1)的演算方法得到的数据一致。

用matlab数据软件计算,当n=10000时, P(*)是趋于稳定收敛的:

中,要根据实际情况作出相应的调整,以符合变化规律从而提高本模型的拟合度。

四、马尔可夫模型的不足及调整

由《中国统计年鉴》数据我们可以直观观察到,近年来由于我国经济的发展和政府宏观调控政策的实施,农民总收入和农业收入都逐年增长,但增长率不同,我们期望通过发达的科学技术和预测风险能力预测农业收入以便政府调控政策的制定。然而马尔科夫预测模型的无后效性使得只能在单纯的市场机制下的分析预测最有效,故我们的假设前提抛弃了外在的影响变量,这在实际中并不可行。

此外,我们仅仅得到的是未来的预测概率和预测值,与真实值之间的误差的存在不可置否,因为在真实进行数据统计时也会有相应的误差,况且目前样本数据容量太小,我们只能将此结果作为概率参考,仍要与其它因素综合起来考虑,例如政府在不同时期的调控政策,这样也就限制了此模型只能求得未来几年的数据。本模型的不足还在于无法预测极端天气以及务农人员等相关因素对农业收入数据的影响,这样我们在应用此模型时应当注意季节变动的因素,还要尽量缩小数据间隔周期。

参考文献

[1]焦中信,李小芳,利用齐次马尔科夫链预测股票价格走势,中国商界,2008(11)

[2]陈敏,魏金明,基于马尔可夫链模型的人民币汇率预测,理论探讨2006(10)

[3]查秀芳,马尔科夫链在市场预测中的作用,江苏大学学报,2003(1)

[4]韦丁源,股市大盘指数的马尔科夫链预测法,广播电视大学学报,2008(09)