APP下载

运用ARIMA模型对中国赴美留学人数增长的初步探究

2013-04-29祁冠文

考试周刊 2013年60期
关键词:ARIMA模型时间序列

祁冠文

摘 要: 随着中国经济的迅猛发展,中国对外开放的程度不断加深,体现在教育行业中很显著的一点便是中国留学生人数增加、规模扩大,掀起了一股留学热潮。本文运用统计学的原理和时间序列分析的基本理论,选取每年赴美留学人数作为观测值,对这一现象进行基本的探究和分析,拟构建合适的模型,做出科学的预测,为定量研究这一社会现象提供依据和思路。

关键词: 时间序列 ARIMA模型 中国赴美留学人数

一、引言

中国作为世界上最大的发展中国家,正在日新月异地提升其各方面的软硬实力。无论是经济、政治还是社会领域,整个社会和国民都在不断进步、发展,视野和心态越来越理性、开阔、兼容并包。在教育领域,科学和技术日益受到重视,人们对知识和学术更尊重和推崇,对政治和经济的稳定进步与发展,知识的作用都愈发明显,知识经济甚至可以算老生常谈了。

本文在反映留学热潮的各种数据和信息中,选取了比较具有代表性的——1996年至2012年每年中国学生赴美留学的人数作为观察值序列,应用课程学习的时间序列分析的理论,对其进行归纳和研究,并以此构建ARIMA模型,对所收集的数据进行拟合。一方面从更本质更基础的层面上认识时间序列理论,另一方面对所学内容做一次基本的实践应用,并对数据进行预测。经过具有代表性的数据和模型的构建,可以更充分更全面地了解近年的留学趋势,对留学的形势有一个更客观的把握。

2.模型的理论基础

2.1时间序列分析理论基础

时间序列分析是将某种统计指标,或在不同时间的不同数值,按时间顺序排列起来,以便于研究其发展变化,并能以此预测未来的一种统计方法。

在拿到一个观察值序列后,首先要对它的平稳性和纯随机性进行检验。非平稳序列,由于它不具有二阶矩平稳的性质,因此对它的统计分析要周折一些,通常要进行进一步的检验、变换或处理,才能确定适当的拟合模型。如果序列平稳,则进行纯随机检验。如果序列值彼此之间没有任何相关性,就意味着该序列是一个没有记忆的序列,过去的行为对将来的发展没有丝毫影响,从统计分析的角度而言,这种序列没有任何分析价值。只有这些序列值之间具有密切的相关关系,历史数据对未来的发展有一定影响的序列,才值得我们花时间挖掘其中的有效信息,预测序列的未来发展。

2.2模型构建的理论基础

一个序列经过预处理被识别为平稳非白噪声序列,那就说明该序列是一个蕴含相关信息的平稳序列。在统计上,我们通常建立一个线性模型拟合该序列的发展,借此提取该序列中的有用信息。ARMA(Auto Regression Moving Average)模型是目前最常用的平稳序列拟合模型。

ARMA(p,q)模型的结构为

x■=Φ■+Φ■x■+…+Φ■x■+ε■-θ■ε■-…-θ■ε■Φ■≠0,θ■≠0E(ε■)=0,Var (ε■)=σ■■,E(ε■ε■)=0,s≠tEx ?摇■ε■=0,?坌s

式中,p为自回归模型的阶数,q为移动平均模型的阶数。在用ARMA模型拟合观察值序列时,要根据样本自相关系数和偏自相关系数的性质进行估计。这就是模型的识别过程即定阶过程。

实际上,在自然界中绝大部分序列都是非平稳的,因而对非平稳序列的分析更普遍、更重要,人们采用的分析方法更多。由确定性导致的非平稳,通常显示出非常明显的规律性,比如有显著的趋势或者有固定的变化周期,这种规律性信息通常比较容易提取,而由随机因素导致的波动则非常难以确定和分析。确定性因素分解方法不能充分提取观察值序列中的有效信息,导致模型拟合精度不够理想。随机时序分析方法的发展弥补了确定性分解方法的不足。差分运算具有强大的确定性信息提取能力,许多非平稳序列进行差分运算后会显示出平稳序列的性质,这时我们称这个非平稳序列为差分平稳序列。对差分平稳序列可以使用ARIMA(Auto Regressive Integrated Moving Average)模型拟合。

ARIMA(p,d,q)模型的结构为

Φ(B)?荦■x■=Θ(B)ε■E(ε■)=0,Var (ε■)=σ■■,E(ε■ε■)=0,s≠tEx ?摇■ε■=0,?坌s

其中,Φ(B)=1-Φ■B-Φ■B■-…-Φ■B■为平稳可逆ARMA(p,q)模型的自回归系数多项式;?荦■=(1-B)■,d表示x■的差分阶数;Θ(B)=1-θ■B-θ■B■-…-θ■B■为平稳可逆ARMA(p,q)模型的移动平滑系数多项式。ARIMA模型的实质就是差分运算与ARMA模型的组合。这说明任何非平稳序列只要通过适当阶数的差分运算实现差分后平稳,就可以对差分后序列进行ARMA模型拟合。

3.结语

社会科学文献出版社近日发布的《国际人才蓝皮书:中国留学发展报告》显示,2012年中国出国留学人数已占全球人数的14%,而成为全球输出留学生最多的国家。“进入新世纪以来,最突出的新情况就是自费出国群体激增,低龄化、大众化、选择多样化、地域分布广,专业选择更实用,出国方式更多”。中国与全球化研究中心主任王辉耀如是总结。在全球教育水平发展各异的各个国家中,美国以其最权威的学术水平、最高端的科研能力及汇集了顶尖的名校、教授和人才的特征成为对中国学生最有吸引力的国家。美国是我们研究留学发展趋势最有代表性的国家。近几年中国赴美国留学人数激增,成为美国第一国际生源国。自中美两国建交以来,美国成为中国开展教育对外交流最重要的国家。

留学的大潮势必会对未来的国际国内形势造成巨大影响。随着出国留学从精英教育向大众教育的转变,留学会越来越受到各界的关注。不断升温的“留学热”不仅是中国社会发展的必然结果,还是加快中国发展进程的积极力量。

本文确定了一个较合适的ARIMA模型,对历年赴美留学人数进行了相对简单的拟合和预测,定量分析了留学发展的基本情势。但是留学的“大众化”只是近一二十年才日渐显著的,数据明显不足。时间序列分析可以提供一种分析思路。众多留学机构、部门及专家学者都是基于非常有限的信息,但通过更复杂、全面的数据与模型对今后数年的留学人数做了更科学的估计与预测。2013年后,每当新的一年的留学生数据产生的,本模型可以不断修正、完善,并因观测值的增加而具备更精准的预测能力,从而得出更有价值的预测结果。

参考文献:

[1]王燕.应用时间序列分析[M].北京:中国人民大学出版社,2008.

[2]王辉耀.中国留学发展报告(2012)[M].北京:社会科学文献出版社,2012:37-47.

[3]邓晖,崔琦,贾远琨.出国留学人数激增莘莘学子究竟为了啥[N].中国改革报,2012-10-17(4).

猜你喜欢

ARIMA模型时间序列
基于时间序列模型的中国出口总额分析及预测
基于R软件的金融时间序列的预测分析
基于Eviews上证综合指数预测
上证综指收益率的影响因素分析
基于指数平滑的电站设备故障时间序列预测研究
基于时间序列的我国人均GDP分析与预测
基于线性散列索引的时间序列查询方法研究
基于ARIMA模型的沪铜期货价格预测研究
对我国进出口总额的预测
组合预测法在我国粮食产量预测中的应用