APP下载

我国出国留学人数的预测

2016-02-02杨彩华段玲晓

科技经济市场 2016年1期
关键词:模型

杨彩华+段玲晓

摘 要:本文采用时间序列预测法中的趋势外推法来预测我国出国留学人数的变化情况,利用统计软件SPSSstatistics17.0,做出散点图,结合散点图进行模型估计选择,根据最小二乘法算出估计参数,进而对模型的拟合优度检验和F值显著性检验以及对标准误的估计,最后经过比较分析,选择出一个合适的模型,并预测出2014年我国的出国留学人数(2015年目前还没有统计出2014年的出国留学人数)。

关键词:时间序列预测;趋势外推法;出国留学人数;模型

0 引言

随着人们生活水平的不断提高,出国留学人数不断增长,出现留学热现象,我国出国留学人数逐年增加,而对于未来我国出国留学人数走向的准确预测,毫无疑问,对把握人才流动趋势,推动教育改革,政府因地制宜的制定相关教育政策等起到很重要的作用。

1 文献研究

进年来,我国学者对出国留学人数进行了多方面的研究,程希等对1949-2009年间中国留学政策的发展、现状以及未来的趋势进行了回顾与思考。逢丹则对出国留学中介进行客观的评价,张早玲对我国家庭自费出国留学教育投资的决策进行了深入的研究,柯普等的基于GM(1.1)模型的出国留学人数预测研究,但是其模拟效果不是很准确,冯志平等不仅仅对我国出国留学人数进行预测研究,同时进一步研究其对居民消费的影响。

通过以上的研究,我们可以看出GM(1.1)模型预测的并不是很准确,同样,冯志平等的ARIMA(2,2,2)模型对我国出国留学人数的预测也是不准确的,存在很大的误差。例如其预测的结果为:2013年的出国留学人数为46.864人,而2013年实际的出国留学人数为41.39。

2 研究方法

本文的研究方法主要是时间序列预测法中的趋势外推法,以及采用回归分析法对其模型进行检验。

时间序列预测法是撇开数据变化的根源分析,假定数据变化的趋势会由过去延伸到未来,依据已获得的不规则时间序列数据建立预测模型,从而预测未来发展趋势,确定变量预测值的一种方法。它的适用条件为:当预测对象依时间变化呈现某种上升或下降趋势,没有明显的季节波动,且能找到一个合适的函数曲线反映这种变化趋势时,就可以用趋势外推法进行预测。我之所以尝试采用趋势外推法主要是因为,首先,目前还没有一个更好的预测模型,能够准确的预测出我国出国留学人数,或者说是存在误差很小的预测模型;其二,这种方法简单易操作;其三,是采用的数据的整体情况,符合趋势外推法的特点。

总之,本文试图通过时间序列预测法中的趋势外推法进行相关的研究,利用中国统计年鉴自2003年至2013年相关的数据,结合统计软件和统计方法进行我国出国留学人数的预测。

3 模型的构建

通过绘制散点图、参数估计、对模型有效性检验从而确定模型。

2003年至2013年我国出国留学人数数据,数据均来自《中国统计年鉴》,如表1所示:

(一)绘制散点图

(1)根据已知数据,作出我国出国留学人数散点图,如图1.1 所示。

以上是从2003年至2013年的我国出国留学人数变化的情况,可以看出从2008年起,我国出国留学人数开始增多。

(2)模型趋势图,图2所示

以上是2003-2013年时间序列趋势图。

(二)参数估计

通过散点图和建立的模型趋势图可以看出2003-2013年的我国出国留学人数变化,故选择拟合二次曲线趋势模型。

(1)二次曲线趋势模型:Y=a+bt+ct2

上述方程中的三个未知参数a、b、c,可以根据最小二乘法计算得出。即对时间序列拟合一条趋势曲线,使之满足下面的条件:实际值Yt与趋势值Y^t的离差平方和为最小,即,

Σ(Yt -Y^t)2=最小值,得到标准求解方程:

ΣY= na + bΣt +cΣt2,

Σt Y=aΣt +bΣt2+cΣt3,

Σt2Y=aΣt2+bΣt3+cΣt4,

其中n为样本数,当取时间序列的中间时期数为原点时,有Σt=0

上式简化为:

ΣY=na +cΣt2,

Σt Y=bΣt2,

Σt2Y=aΣt2+cΣt4,

为了简化计算,在 t 的取值上做特殊考虑: 当样本数 n 为奇数时,取t = …,-3,-2,-1,0,1,2,3,…,当样本数 n 为偶数数时,取t = …,-5,-3,-1,1,3,5,… , 这样做可使Σt2i+1=0(i=0,1,2),使计算大为简化。经过代入计算,得到2003-2013我国出国留学人数时间序列拟合的二次曲线模型为:

Y^ t=19.1+3.34t+0.341t2

(2)通过散点图我们还可以看出从2008年至2013年这一时间段,我们可以假设其为线性模型,线性模型为:Yt= a + bt

同理,上述方程中的二个未知参数a、b,也是根据最小二乘法的原理计算得出,

b=nΣtY-ΣtΣY/nΣt2-(Σ) t2

a=1/n (ΣY–bΣt)

同样,为了计算方便,当取时间序列的中间时期数为原点时,Σt=0

上式简化为:b=Σt Y /Σt2,a=1/nΣY

经过计算,得到2008-2013年我国出国留学人数时间序列拟合的线性模型为:

Y^t=30.78+2.48t

(三)对模型的有效性进行检验

对模型的拟合优度检验和显著性检验,我们可以利用统计软件或者计算公式得出。

(1)对模型1的拟合优度检验、显著性检验以及估计的标准误

①对模型1的拟合优度检验

拟合优度检验方程式:

记总离差平方和 TSS=■Y■-■■

回归平方和 ESS=■■-■■

剩余平方和 RSS=■Y■-■■

则:TSS=ESS+RSS

可决系数:R■=■=1-■

可决系数越接近1,模型的拟合优度越高。

经过统计计算得出:

TSS=31599.73,ESS=30901.927,RSS=697.803

R2=ESS/TSS=0.978

在现实情况下,需要加以调整:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响:

调整校正决定系数■■=1-■

其中n为样本数,k为自变量数,n-1为总离差自由度,n-k-1为残差自由度,R称复相关系数

调整后的决定系数为:0.978。

②F旨在对模型中自变量与因变量之间的线性关系在总体上是否显著成立作出检验。

F检验方程为:

F=■

通过计算得出:

F≈5414.45

给定显著性水平a,可查得到临界值Fa (k,n-k-1),与由样本求出统计量F值比较:若 F>Fa(k,n-k-1),则自变量与应变量间的线性关系显著成立。若 F≤Fa(k,n-k-1),则自变量与应变量间的线性关系不显著。给定显著性水平为241,得出F≈5414.45> F241(1,9),则方程通过显著性检验,拟合效果较好。

③估计的标准误

估计的标准误=■=■

得出的估计的标准误为1.689。

(2)对模型2的拟合优度检验、显著性检验以及估计的标准误

①对模型2的拟合优度检验

同理,代入数值分别得出:TSS=437.819,ESS=430.726,RSS=7.093

R2=ESS/TSS=0.984

模型2在现实状况下也需要加以调整,调整后的决定系数为:0.980

②F显著性检验

F检验方程为:

F=■

计算得出:F≈242.912

给定显著性水平a,可查得到临界值Fa(k,n-k-1),与由样本求出统计量F值比较:若F>Fa(k,n-k-1),则自变量与应变量间的线性关系显著成立。

若F≤Fa(k,n-k-1),则自变量与应变量间的线性关系不显著。

给定显著性水平为225,得出F≈242.91>F225(1,4),则方程通过显著性检验,拟合效果较好。

③估计的标准误

经过计算得出模型2的标准误为:1.33。

4 预测模型的分析结果

通过以上建立的模型,进而对其预测的结果进行分析,以及对趋势的预测。

(一)预测模型的分析结果

采用时间序列外推法的模型预测结果,如表2所示。

从上表可以看出,线性模型拟合度相对较好,相对误差均小于5%,而曲线模型的相对误差有在2007年达到了11.81%,可见,简单的线性模型也可以对我国出国留学人数趋势进行较为准确的预测。

(二)我国出国留学人数2014-2016年趋势预测

通过采用线性模型进行计算,可以预测出我国2014年至2016年的我国出国留学人数的速度与趋势,见表3。

从表2和表3可以看出,我国出国留学人数在2014-2017年还将继续增多,年增长率分贝别为16.3%、10.3%、9.3%、8.5%,增幅逐渐降低。

5 结语

经过以上的分析检验比较,我们很容易可以得出一些简单的线性模型也可以很好的预测数值,并不是我们通常所认为的越复杂的模型预测的越准确。对于我国出国留学人数的趋势进行较为准确的预测,可以提高教育决策与规划的科学性,进而可以对某些趋势进行把握,做出相关决策。

未来几年,我国出国留学人数还是呈现不断上升的趋势,但是增幅有所下降,从对我国出国留学人数的趋势预测中,可以分析出很多更深层次的内容,以后关注的焦点就很可能是如何让出国留学人才回国发展,以及对出国留学人才质量评价等方面的问题。

参考文献:

[1]胡海青,晏富宗.基于BP 神经网络的区域高等教育规模预测研究——以江西省为例[J]. 教育学术月刊.2013(12).

[2]程希,苗丹国.出国留学六十年若干问题的回顾与思考(1949-2009年)[J]. 东南亚研究,2010(01).

[3]逢丹.公正看待中介机构正确评价留学中介[J].中介实录.26-27.

[4]柯普.基于GM(1.1)模型的出国留学人数预测研究[J].价值工程.2012(25).

[5]冯志平,余东.我国留学生人数的预测及其对居民消费的影响[J].南京信息工程大学学报,自然科学版,2014(04):369-373.

[6]温品人.时间序列的实际应用分析[J].扬州市广播电视大学学报,2001(6).

猜你喜欢

模型
一种去中心化的域名服务本地化模型
适用于BDS-3 PPP的随机模型
p150Glued在帕金森病模型中的表达及分布
函数模型及应用
重要模型『一线三等角』
重尾非线性自回归模型自加权M-估计的渐近分布
AVB网络流量整形帧模型端到端延迟计算
考虑初始损伤的脆性疲劳损伤模型及验证
3D打印中的模型分割与打包
离散型随机变量分布列的两法则和三模型