浅谈提高统计预测精度的策略
2015-10-21聂晓斌
聂晓斌
摘 要:在统计预测中,统计预测精度是非常重要的,很多预测工作者都对统计预测精度给予高度重视。为有效提高统计预测精度,本文提出了一些策略。
关键词:统计预测精度;修正;剔除;模型;无偏性调整;组合预测
引言
统计预测,就是通过将统计资料作为基础,将经济发展的趋势、经济现象中存在的联系作为依据,选用合理的数学模型,对研究对象在某一条件中所达到的水平、规模进行预计。在统计预测中,包括直觉性判断、数学计算等。通过对已有的资料进行充分利用,提炼出相关的信息、内在的规律、事物在发展过程中的关系,在社会经济领域中采用有效的统计预测方法,进而为制定计划、政策带来一定的科学依据,因此,统计预测具有非常重大的意义。
因此,提高预测精度对统计预测来说是非常重要的,很多预测工作者都对统计预测精度给予高度重视。为提高统计预测精度,本文进行了相关探析。
1.异常数据的修正和剔除
统计资料是统计预测的重要依据,然而不是任何统计资料都能运用在统计预测中,同时进行统计预测后获得的较高精度的预测结果。自然灾害、政策变动属于偶然因素,因为受到偶然因素的影响作用,进而生成异常数据,尽管这些异常数据具有一定的真实性,不过,统计预测精度会深深受到统计预测工作的影响,在实际中,为确保经济的发展趋势能够通过数据序列客观的表现出来,同时运用统计数据构建数学预测模型而获取的预测成果更加接近实际情况,则统计预测工作一定要剔除、修正统计资料中存在的异常数据。例如,自我国成立以来,通过对钢产量时间序列进行分析后可以发现,钢产量呈逐步上升趋势,但是,有两个阶段的数据是非常不正常的,即1958-1962年阶段、 1967-1968年阶段。因此,如果我国选用趋势预测法来预测我国的钢产量时,首先应剔除、修正这几年中的异常数据。为确保数据序列的完整性,可以修正异常数据,其中,主要修正的方法为将外插值、内插值运用到数据发展趋势线中,尽管初始数据经过修正后,数据的真实性受到了一定的影响,但是数据时间序列发展趋势表现效果将会变得更好,而异常数据的剔除,可以采用的多方法也有很多,如格拉布斯法、威廉斯—肖维纳法等。对异常统计数据进行修正和剔除以后,再建立相应的数据统计预测模型,则获得的预测精度就会变得更高。
2.统计数据预测数学模型的选择
统计数据预测数学模型的选择,必须要有足够的科学依据,选择的统计数据预测数学模型应符合客观规律、相关经济理论,可以将相关经济现象准确的表现、描述出来,可以在事物的发展状况充分的反映出来。在选择统计数据预测数学模型时,应将实际考察结果作为依据,这样才能对原始数据进行精确的外推、模拟、拟合。例如,运用数据时间序列对数据发展趋势进行外推时,在选择统计预测模型时,应采用阶差计算、散点图。其中,一些常见的统计数据预测数学模型及其特点,如下所示:
(1)直线:y=a+bt
(2)抛物线:y=a+bt+ct2
(3)指数曲线:y=a+bt
(4)饱和指数曲线:y=a+bt
(5)龚珀兹曲线:y=kabt
在实际工作中进行统计预测时,为选择有效、合理的统计数据预测数学模型,获取更好的数据发展趋势外推效果,应从数据时间序列的阶差、散点图着手进行。如果在进行统计预测工作中选用因果分析预测模型,则选取的自变量必须是事物发展变化的主要影响因素,该自变量应符合相应的客观规律、经济理论,选取的数学模型一定要合理,因变量和自变量的相关性系数要比较高,并具有明显的回归效果。要想获取高度精确的预测结果,选择一个有效、恰当的统计数据预测数学模型是非常重要的额。
3.统计数据预测数学模型的无偏性调整
3.1无偏性调整原理
对于全部的统计数据预测数学模型,我们均假设该模型的预测误差ei-N0,σ2是为一个正态随机变量,Eei=0,Dei=σ2。但是,在大部分情况中,尤其是对统计数据预测数学模型进行线性化处理以后,所获得的拟合误差平均值并非为0,甚至远远偏离0。一旦出现这种情况,首先应适当对统计数据预测数学模型进行无偏性调整,直至拟合误差平均值为0,具有无偏性,同时不会影响到原来数学模型的有效性。其中,统计数据预测数学模型的无偏性调整原理为:在原来的统计数据预测数学模型上 加上 e,相应得,预测数学模型曲线將会向上平 移e,不难看出,无偏性调整法是非常简单的,统计数据预测数学模型预测结果的精确度将会得以提高。
3.2举例说明
浙江省在2000-2010年期间的社会商品零售总额资料,如表1所示。 ( 单位:亿元 )
根据统计数据而构建的指数曲线预测模型为y′1t=110.782e0.1403t,其拟合误差平均值 e=0.5222。对曲线预测模型进行无偏性调整,即将原曲线预测模型加上0.5222,相应的,指数曲线向上平移0.5222,则曲线预测模型调整之后变为y1t=110.782e0.1403t+0.5222,其拟合值及其误差,如表1所示。通过对曲线预测模型进行无偏性调整之前和之后的数据进行比较后可以发现,误差平方和有所降低,即由 428.2 4 8 7降低至4 2 5.2 4 88,由于调整之后的预测模型是无偏的,进而大大提升了统计预测的精度。
4.组合统计预测模型
4.1组合预测原理
在统计预测工作中,可以采用多种统计预测方法对同一个预测问题进行预测,为了使统计预测精度变得更高,可以适当组合各种统计预测方法为一体,形成一种组合统计预测方法。假设同时存在多种统计预测方法可以对同一个统计预测问题进行预测,分别用来表示获得的统计预测值,则组合统计预测模型为
yt=k1y1t+k2y2t+…+knynt
其 中K=k1,k2,…,knT为组合预测系数向量,且k1+k2…+kn=1。
由于组合统计预测模型的预测精度深受组合预测系数向量K的影响,因此,K的确定对提升统计预测精度起着决定性的作用。 组合预测系数K 的确定方法有很多,如递归方差倒数法、方差倒数法、误差平方和最优最小组合法、等权法等,而前三种方法确定的合统计预测模型,其得到的预测精度相对更高。
4.2举例说明
仍以浙江省在2000-2010年期间的社会商品零售总额为例,构建抛物线数据统计预测模型y1t=1.73t2+17.0918t+105.2364,其拟合值及其误差
运用最优组合预测系数公式,能够求得出两种预测方法参与的组合统计预测模型,且或得的组 合预测系数分别为:
k1=∑e22t-∑e1te2t∑e21t+∑e22t-2∑e1te2t=157.2283-110.4547425.2488+157.2283-2×110.4547=0.1294
k2=∑e22t-∑e1te2t∑e21t+∑e22t-2∑e1te2t=425.2488-110.4547425.2488+157.2283-2×110.4547=0.8706
则组合统计预测模型为:
yt=0.1294y1t+0.8706y2t=91.6864+14.8801t+1.506t2+14.3352e0.1403t
运用该组合统计预测模型所得到的拟合值及其误差,组合预测误差平方和为151.1784。和上述两个预测模型相比,采用该组合预测模型进行预测,能够使预测精度变得更高,假若将更多的预测模型组合在一起,得到的的预测精度就会变得更高一些。
4.小结
本文主要从异常数据的修正和剔除、统计数据预测数学模型的选择、统计数据预测数学模型的无偏性调整,这几个方面来提高统计预测精度,希望能够对统计预测工作者的工作带来一定的帮助。(作者单位:北京银行)
指導老师:郑治华
参考文献:
[1] 周庄,夏瑛瑄. 我国古代成功预测范例及启示[J]. 统计与决策. 2012(11)
[2] 程振源. 时间序列分析:历史回顾与未来展望[J]. 统计与决策. 2010(09)
[3] 吴载斌,王斌会. 数据挖掘软件的介绍及其评价[J]. 计算机时代. 2011(07)
[4] 谢煜,张智光. 预测支持系统的发展趋势研究[J]. 预测. 2014(03)
[5] 王应明. 基于相关性的组合预测方法研究[J]. 预测. 2012(02)