APP下载

国家公路里程预测模型建立与研究

2024-04-15张思琪

河南科技 2024年4期
关键词:预测模型

张思琪

摘 要:【目的】在交通强国建设背景下,交通发展由依靠传统要素驱动向注重创新驱动转变,前瞻规划、科学预测成为国家交通建设的前提和基础。【方法】以2006—2020年国家统计局发布的公路里程为基础数据,运用指数法、对数法、多项式法、幂函数法建立预测模型。【结果】经过对比与检验,结果表明,6次多项式拟合预测模型最优,通过增加新增年度数据可对其进行优化。【结论】添加年度新增数据的6次多项式预测模型可以为国家公路建设规划提供参考。

关键词:公路里程;多项式;预测;模型

中图分类号:U412.1     文献标志码:A     文章编号:1003-5168(2024)04-0071-04

DOI:10.19968/j.cnki.hnkj.1003-5168.2024.04.013

Establishment and Research of National Highway Mileage Prediction Model

ZHANG Siqi

(Chang'an Dublin International College of Transportation at Chang'an University, Xi'an 710086, China)

Abstract: [Purposes] Under the background of building a powerful transportation country, the transportation development has changed from relying on traditional factors to focusing on innovation. Forward-looking planning and scientific forecasting have become the premise and foundation of national transportation construction. [Methods] Based on the data of highway mileage published by the National Bureau of Statistics from 2006 to 2020,the prediction models are established by index method, linear method, logarithmic method, polynomial method and power function method. [Findings] After comparison and testing, the results show that the 6-degree polynomial fitting prediction model is the best, and it is optimized by adding new annual data.[Conclusions] The 6-degree polynomial prediction model with added annual new data can providereferencefor national highway construction planning.

Keywords: highway mileage; polynomial; forecast; model

0 引言

2019年9月19日,中共中央、國务院印发了《交通强国建设纲要》,对我国新时期交通建设与发展提出了两个阶段的发展目标,并指明了方向。在这一背景下,我国交通建设由追求速度规模向注重质量效益转变,由各种交通方式相对独立发展向更加注重一体化融合发展转变[1]。公路交通具有快捷、方便、地域适应性强等显著特点,在物资短途运输、民众生产生活、带动与刺激经济发展等领域发挥着重要作用。但现实中也存在规划建设中路线重复、过度占用浪费土地资源等现象。构建安全、便捷、高效、绿色、经济的现代化综合交通体系,科学规划和预测是其重要前提,公路建设的规划和预测也是其重要组成部分。本研究利用已有数据建立预测模型,对国家未来公路建设里程进行科学预测,以期为国家公路建设规划提供参考。

1 概念界定与国家公路里程2006—2020年统计数据

国家统计局网站对公路里程的解释为:报告期末公路的实际长度,统计范围包括城际、城乡间、乡(村)间能行驶汽车的公共道路,公路通过城镇街道的里程,公路桥梁长度,隧道长度,渡口宽度。公路里程不包括城市街道里程、断头路里程、农(林)业生产用道路里程、工(矿)企业等内部道路里程。统计原则是按已竣工验收或交付使用的实际里程计算,两条或多条公路共同经由同一路段的重复里程,只计算一次[2]。根据国家统计局网站公布的数据显示,2006—2020年国家公路里程统计数据见表1。

2 预测模型建立与筛选

公路里程的预测与确定是公路网规划的重要内容。本研究以国家统计局发布的2006—2015年公路里程为基础数据,运用指数法、对数法、多项式法、幂函数法等4种方法进行对比研究,以获得国家公路里程较为准确的预测模型[3],其对应的预测公式及R?值见表2。

统计学中对变量进行回归分析,在采用最小二乘法进行参数估计时,R?为回归平方和与总离差平方和的比值,表示总离差平方和中可以由回归平方和解释的比例,这一比例越大,所建立的模型就越精确,回归效果越显著。R?介于0~1之间,越接近于1,拟合效果越好,一般认为超过0.8的模型,其拟合度较好[4]。由表2可知,4种预测模型的R?均大于0.9,上述方法所建立的模型均符合理论要求。但不难看出,4种预测模型仍有优劣之分。其中多项式模型最优,其R?为0.999 6,指数模型、幂函数模型次之,对数模型最差。为了更好地建立国家公路里程的预测模型,选取多项式模型作为研究方法,并采用进一步的数据处理方案,以获得更高精度的模型。

3 国家公路里程预测模型的建立

3.1 多项式拟合基本原理

曲线拟合是根据一组已有数据拟合出一条曲线或者函数的过程,是求近似函数的一种数值方法,该方法不要求近似函数在每个节点处与函数值相同,只要求尽可能地反映给定数据点的基本趋势和某种意义上的无限逼近。通过曲线拟合方式拟合出的函数曲线,可以将没有出现的点代入函数中获得该点对应的值,也可以反映该数据集数据的趋势或者数据之间的关系。

最常用的曲线拟合方法是最小二乘法,即通过求取最小的误差平方和获得某一函数,使之求得的数值与原始值的误差平方和最小。给定序列观测值{(xi,yi), x=0,1,2,…,n},在这些观测值的基础上,通过最小二乘原理,求得变量x和y之间的关系f(x,A),使函数f符合数据集合的特性。其中f(x,A)是拟合函数,A=(a0,a1,…,an)是将要获得的拟合函数的最佳参数。最小二乘法的原理是在无限多组A=(a0,a1,…,an)参数组中,利用误差平方和衡量原始观测值与拟合函数求出拟合值之间的差值,该差值反映了该拟合函数和理想函数的差值。找出一组参数组A,根据拟合函数求出y值,使其与真实y值的误差平方和最小。对所有候选函数均计算差值,取其中差值最小的函数为最终拟合函数[5]。其计算公式见式(1)。

[i=0mωxi][f'(xi)-yi2=]

[mini=0mωxif(xi)-yi2] (1)

函数[f'](xi)是期望求得的拟合函数,在数据集中,每一个观测x值都对应一个观测y值,而根据函数[f'](xi),可以求得每一个x值对应函数的y值y′。

拟合函数公式有的是一次方程,有的是多次方程,一次方程的称为线性拟合,多次方程的称为多项式拟合,多项式拟合的公式见式(2)。

[y=a0+a1x+a2x2+…+anxn] (2)

对于多项式拟合,最终的参数组合(a0,a1,…,an)也是由最小二乘法确定的,其公式见式(3)。

[RSS=i=0m(y'i-yi)2=]

[i=0m(a0+a1xi+a2x2i+…+anxni-yi)2] (3)

残差平方和RSS可以看作是参数组合(a0,a1,…,an)的函数[?](a0,a1,…,an),则令每一个参数的一阶偏导数为0,则有式(4)。

[?φ?aj=2i=0m(a0+a1xi+a2x2i+…+anxni-yi)]=

[0( j=0,1,2,…,n)] (4)

根据此公式可得矩阵方程见式(5)。

[m+1i=0mxi…i=0mxnii=0mxn+1ii=0mx2i…i=0mxn+1i…………i=0mxnii=0mxn+1i…i=0mx2ni×a0a1…an=i=0myii=0mxiyi…i=0mxniyi] (5)

把此矩阵方程简化为XA=Y,则矩阵A的算法为A=X?1Y。

根据最小二乘法,求出误差平方和最小的一组多项式拟合的系数,从而获得拟合方程。

3.2 模型建立

同一组数据,不同次多项式拟合结果也会有区别,为获取理想的预测模型,需要对不同次多项式拟合模型的预测精度进行统计。本研究仍以2006—2015年国家公路里程数据为实测数据建立模型(其中自变量[x]为自2006年为起点1,时间间隔为1年的年度数,2007—2015年分别对应2—7,依次类推。),各不同次多项式拟合模型的预测公式及R?值见表3。

由表3可知,2—6次多项式预测模型的模型精度结果都较好,其中6次模型精度最优,考虑到预测值与实际观测值的统计差值小于万分之三,本研究以6次多项式预测模型作为最终的预测模型。

3.3 模型预测与验证

采用6次多项式预测模型对国家公路里程2016—2020年数据进行预测,其预测公式及R?见表3。预测获得的数据结果统计见表4。

由表4可知,利用国家公路里程2006—2015年数据对后续2016—2020年数据进行预测,2016年的预测值与实际值偏差很小(0.30%)。但是随着时间的推移,二者的差值越来越大,2020年时差值竟超过50%,这说明该模型对于短时间内的预测适用,随着时间延长,模型的精度快速下降。

在实际应用中,为了克服上述因素带来的影响,尝试将每年新增的实际统计数据加入模型建立过程中,不断增加模型数据的时间序列,能够提高模型滚动预测精度。本研究模拟将2016—2020年每年获得的统计数据加入模型中,对后续年度进行滚动预测,其预测公式及R?值见表5。

由表5可知,随着实际数据的获取,并添加到模型中,采用6次多项式拟合建立的模型,其精度良好。添加每年度新增数据后,得到预测模型获取的预测值、预测值与实际值的差值统计见表6。

由表6可知,添加年度新增数据后,滚动预测获得的预测值与实际值的差值在可控范围内,连续5个模型最近一年的预测值与实际值的差值最小为1.39万km、最大为15.26万km,其差值的百分比分别为0.30%、2.94%,都在3%以内,由此可见,采用该方式,可以获得较高精度的预测结果。最终的模型预测值与实际值的曲线如图1所示。

4 结语

建设交通强国是国家的重大战略决策,是建设现代化经济体系的先行领域。随着国家交通建设事业的全面推进,公路作为立体交通网络中重要的基础设施,在经济发展中起着至关重要的作用,必须把路网规划纳入国家总体规划之中。本研究采用指数法、对数法、多项式法、幂函数法等4种预测方法建立国家公路里程预测模型,获得各模型精度,确定多项式法建立的模型最优。运用多项式拟合模型原理,对比不同次多项式模型,本研究发现6次多项式拟合模型更适合国家公路里程的预测。针对6次多项式拟合模型时间序列精度不足的问题,通过运用滚动加入新增年度数据模型的手段,提高了后续年度数据预测精度。公路里程作为路网规划的重要参数,应该对其进行科学研究与预测,本研究提出的添加年度新增数据的6次多项式预测模型,可以为持续性路网规划提供基础数据支撑。

参考文献:

[1]中共中央、国务院.交通强国建设纲要[M].北京:人民出版社,2019.

[2]国家统计局.公路里程[EB/OL](2021-05-09)[2022-04-10]. http://data.stats.gov.cn/easyquery.htm.

[3]李夢婉,沙秀艳.基于GM(1,1)灰色预测模型的改进与应用[J].计算机工程与应用,2016,52(4):24-30.

[4]陈健勋.城市供水管网漏失特性模拟及评价[D].哈尔滨:哈尔滨工业大学,2020.

[5]何岸青.基于多项式拟合与支持向量机的股票关键拐点预测[D].长春:吉林大学,2016.

猜你喜欢

预测模型
无可预测
适用于BDS-3 PPP的随机模型
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
p150Glued在帕金森病模型中的表达及分布
重要模型『一线三等角』
重尾非线性自回归模型自加权M-估计的渐近分布
不可预测
不必预测未来,只需把握现在