基于多元线性回归模型的澜沧江—湄公河客运量预测
2015-07-10谭家万等
谭家万等
【摘 要】 选取2005―2013年澜沧江流域客运量及云南省相关统计数据为样本数据,建立澜沧江-湄公河客运量多元线性回归预测模型,对模型精度进行检验。根据澜沧江水路客运量预测结果,历史实际值与拟合值贴合较好,表明所建立的模型具有较高的实用性和可靠性,对澜沧江-湄公河水路客运及相关行业的发展具有一定的导向作用。
【关键词】 澜沧江;水路客运量;多元线性回归预测模型
0 背 景
水路客货运量预测分析工作是航运生产经营活动的重要环节,是航运规划、统计工作的重要组成部分。加强水路客运量预测分析工作,及时掌握水路运输市场发展动态和需求,是水路运输业积极适应市场环境、在竞争中找准发展方向的有效途径,也是实现跨越式发展、制定相应措施、使有限的水上运输资源发挥更大作用的基础和重要环节。
澜沧江-湄公河作为一条流经东南亚6个国家的重要国际河流,不仅是我国通向中南半岛乃至东南亚的中轴线,而且是连接东盟与我国的重要水路通道,又是发展潜力最大、运输成本最低的黄金水道。澜沧江-湄公河区域各国之间的经济、文化合作如火如荼地开展,水上运输发展迅速,加快该水运大通道建设对促进沿岸各国深化合作、巩固长久的睦邻友好关系具有重大而深远的意义。因此,为了满足该区域经济社会发展对水上交通运输的需求,科学、准确地预测客运量成为一项重要的研究课题,可以作为我国加快澜沧江航运开发建设决策、综合交通运输布局的重要依据,可以为区域水运交通规划和管理提供必要的依据。
本文通过建立澜沧江-湄公河客运量多元线性回归模型,利用模型进行预测,并对模型精度进行检验。
1 澜沧江-湄公河客运量多元线性 回归预测模型的构建
目前,预测水运客运量的方法有很多种,如回归分析法、指数平滑法、灰色预测法等。多元线性回归预测模型因具有模型简洁、预测精度较高等优点而最为常用,本文将利用多元线性回归模型预测澜沧江-湄公河客货运量。
1.1 自变量选取
某一区域水上客货运输需求常常与该区域社会、经济、环境等多种因素相关。澜沧江-湄公河航道与印度洋连接,形成内河与海洋互联的水运大网络,将我国与太平洋、印度洋国家连通,对大湄公河次区域经济发展产生深远的影响,且具有重要的战略地位。区域经济总量的增长将带动航运需求的增长,同时航运发展速度与国内生产总值(GDP)的发展速度成正比,尤其是与第二、第三产业GDP关系密切。因此,本文选取云南省GDP、第一产业总值、第二产业总值、第三产业总值、固定资产投资、社会消费品零售总额为自变量。
1.2 样本数据
澜沧江-湄公河航运资源的开发带动了当地旅游业的发展,2005―2013年澜沧江流域客运量逐年增长(见表1)。
通过对澜沧江流域的实地调研,获取了云南省航务管理局、统计局、商务局、海关等部门的相关数据(见表2)。
1.3 相关性分析
为了保证线性模型的合理性,首先需要分析自变量和因变量之间的相关性,皮尔森相关系数(Pearson correlation coefficient)可以较为准确地反映变量之间的线性相关程度。用r表示相关系数,r的绝对值越大,表明相关性越强。
1.4 澜沧江-湄公河客运量多元回归预测模型的建立
现假设用于建立多元线性回归预测模型的自变量为x1,x2,x3,x4,x5,x6;因变量为y。采用2005―2013年澜沧江客运量历史统计数据,建立客运量多元线性回归预测模型
1.5 模型检验
通过运用数理统计的理论和方法,对所建立的预测模型进行检验,相关参数取值的可靠性检验主要包括拟合优度、方程显著性、变量显著性等。利用MATLAB软件对上述指标进行分析,统计结果见表4。
通过表4可以看出,当9组自变量自由度为7且显著度为0.05时,R2>99%,因此,可以认为多元线性方程拟合优度很好,具备合理性。通过分析近9年客运量实际值、拟合值和残差值关系发现,实际值与拟合值贴合较好(见图1)。
2 澜沧江-湄公河客运量的预测
2020年客运量的预测可通过自变量在本时间段内的预测值计算得到。预测云南省 2014―2020年间GDP年均增长率为12%,2020年GDP年均增长率为8%,利用指数曲线回归拟合方法得到自变量x1,x2,x3,x4,x5,x6的预测值(见表5)。
根据式(2)得到澜沧江-湄公河客运量预测值,预计到2020年客运量达150万人次。
3 结 语
本文通过建立澜沧江-湄公河客运量多元线性回归预测模型,对该水域客运量进行短期预测,并对模型进行精度检验。从对澜沧江-湄公河水路客运量预测的结果来看,实际值与拟合值贴合较好,表明所建立的模型具有较高的实用性和可靠性。