APP下载

基于熵权法的农村公路线网规模组合预测

2020-05-14王雪梅秦连群鲍雨婕周希灿

华东交通大学学报 2020年2期
关键词:权重规模人口

王雪梅,郭 旷,秦连群,鲍雨婕,周希灿

(1.同济大学浙江学院交通运输工程系,浙江 嘉兴314000;2.浙江省安吉县交通运输局,浙江 湖州313300;3. 上海理工大学管理学院,上海200093;4. 宁波诺丁汉大学土木工程系,宁波315100)

农村公路是由县道、乡道和村道组成的[1]。农村公路线网规模主要与公路网的区域面积、人口分布、社会经济发展水平、交通需求和主要节点分布有关。 农村公路线网布局规划的基本控制量是线网规模。 因此,农村公路线网规模应该有一个适度的值, 使之与人口、经济和社会发展水平相协调, 从量和度上反映农村公路的发展水平。

Bate 和Granger[2]在1969 年提出了组合预测理论,将多种预测模型合理组合,并且最大化地提高了多种预测样本信息的利用率,使得这比单一模型更系统、更全面。 所以,组合预测理论成为了一个重要的研究方向。 例如,文献[3-4]使用层次分析法来分配权重,在公路货运周转量和电力负荷预测方面取得了较好的效果;文献[5-7]通过熵权法分配权重,在干线公路通车里程、公路货运量和光伏输出功率的预测方面得到了较好的效果;文献[8]利用遗传算法分配权重, 在预测交通流中得到了较好的效果;文献[9]则提出了4 种基于相关性的组合预测方法,并验证了其方法的有效性;文献[10]引入指数加权移动平均模型对不同时刻的电力负荷数据进行权重分配,改进后的电力负荷预测模型获得了较高的精确度。

文献[11-13]采用了国土系数法、综合系数法、人口经济密度法、连通度法、弹性系数法、公路周转量分析法等方法对农村公路线网总规模进行了预测。本文通过对上述预测方法的对比分析,拟选取国土系数法、人口经济密度法、连通度法三个方法对农村公路线网规模进行预测,这三种预测方法均属于回归分析方法,选取与线网规模相关的区域面积、人口、经济、交通节点等因素,拟合自变量与因变量的相关关系,并对各自模型中的系数构建线性和对数回归方程,从而实现对农村公路线网总规模的估计和预测。同时,选取绝对平均误差(MAE,mean absolute error)、绝对平均百分比误差(MAPE,mean absolute percent error)、均方根误差(RMSE,root mean square error)三种误差指标全面评价预测效果。 再基于熵权法理论,计算单一方法的权重系数,以此构建组合预测模型,从而得到更加科学、客观的预测结果。

1 预测方法

1.1 单一预测方法

1.1.1 国土系数法

国土系数法是指在综合考虑公路网所处区域的人口、面积、经济发展水平基础上,计算得到这个区域内合理的理论道路长度。 该理论认为“道路长度与人口和面积的平方根及其经济指标成正比”,见式(1)

式中:L 为道路长度,km;P 为人口数,万人;A 为国土面积(平方公里);K=f(GDP):K 是人均GDP 的函数,单位为元,K 单位为公里/(万人×平方公里)0.5。

1.1.2 人口经济密度法

人口经济密度法是指在综合考虑所处地区的人口密度和经济强度基础之上,根据所预测的道路面积密度,从而得出公路网的总规模。 人口密度是人口数量与土地面积的比值,经济密度是单位土地面积的国内生产值的产出。 可以看出,道路面积密度与经济密度、人口密度之间有一定的相关关联度,见式(2)

1.1.3 连通度法

连通度法也可以称为节点模型法, 是体现所处公路网中各个节点之间依靠公路交通来连接的连通强度,反映了规划区域内各交通节点之间的连通状况,体现其通达深度。 网络几何学是连通度法的理论依据,通过分析网络几何形状结构来构建合理规模的公路网连通度模型,见式(3)

式中:L 为公路线网规模,km;n 为区域内的节点数;A 为区域面积(平方公里);δ 为线网非直线系数; C 为公路线网连通度。

通过模型可以看出,在确定所处区域面积及其节点数的情况下,路网的连通度和变形系数是影响公路线网规模的主要变量。 其中,路网的变形系数受到路线所处区域的地形分布影响,若是区域内的地势起伏较大,山地数量多,与之相对应的路线也会有较大的弯曲程度,则该路网的变形系数也较大;反之,则较小。 路网连通度的值越高,代表各节点间的连接程度也越高,相应的路网规模越完善。 对于不同的路网形式有不同的连通度计算方法。

1.2 组合预测方法

1.2.1 组合预测的基本原理

式中:yit为第i 个预测方法的预测值;wi为第i 种预测方法的权重。

确定各个预测方法在组合预测中的权重分配是组合预测的核心,权重系数优化标准的不同形成了组合预测方法的不同。

1.2.2 基于熵权法的组合预测方法

在信息论中,熵表示不确定性的量度,指标的信息熵越小,则该指标提供的信息量越多,其作用在综合评价中也越大,相应的权重占得越高。 熵权值代表评价指标在竞争意义上的激烈程度,具有较强的客观性,是确定组合预测模型组合权重系数并提高组合预测模型精度的有效方法之一[14]。

文献[15-16]分别对熵的基本原理进行了理论研究。 当系统可能处于几种不同状态,每种状态出现的概率为pi(i=1,2,…,m)时,该系统的熵定义为

m 种单项预测方法,n 项误差评价指标,形成的原始指标矩阵R=(rij)m×n,对于某个指标rj,有

其中

本文基于熵权法理论,根据每个单一预测模型在系统中的信息熵,为每个单一预测方法分配权重,由此构建一个组合预测模型,达到客观、准确的对农村公路线网规模进行预测的目的。

1.3 误差指标

本文为了对各个预测方法得到的结果更好的评价、分析、比较,选取3 个相关评价指标

1) 绝对平均误差

2) 绝对平均百分比误差

3) 均方根误差

式中:N 为预测样本数;yt为在t 时刻所得到的测量值;yˆt为在t 时刻所得到的预测值。

2 实例分析

本文以浙江省湖州市安吉县农村公路线网规模预测为例, 安吉县域面积1 886 km2, 选取2014—2018年农村公路通车里程,GDP,人口以及人均GDP 数据,如表1 所示。

表1 安吉县2014-2018 年农村公路通车里程、GDP、人口以及人均GDP 数据Tab.1 Data of rural road mileage, GDP, population and per capita GDP of Anji county from 2014 to 2018

2.1 单一预测模型构建

2.1.1 国土系数法模型标定方法步骤,如下:

图1 国土系数法拟合K 值Fig.1 Fitting K value of the land coefficient method

③整合模型。

依据式(1)反推K 值,采用线性和对数模型对国土系数法K 值进行拟合。分析得到的数学模型如下,拟合K 值见图1 和表2。

1) 线性模型

K=0.000 01AGDP+5.716,R2=0.803 显 著 相关。

2) 对数模型

K=0.916ln(AGDP)+3.647,R2=0.834 显著相关。

2.1.2 人口经济密度法

模型标定方法:

④整合模型。

依据式(2)反推K 值,采用线性和对数模型对人口经济密度法K 值进行拟合。 分析得到的数学模型如下,拟合K 值见图2 和表2:

1) 线性模型

K=4.575APGDP+0.735,R2=0.864 显著相关。

2) 对数模型

K=0.308ln(APGDP)+1.877,R2=0.878 显著相关。

2.1.3 连通度法

综合考虑连通度模型中山区以及平原地形所产生的影响, 确定非直线系数δ=1.3,A=1 886 km2,n=185个,依据式(3)反推C 值。本文采用线性和对数模型对连通度C 值进行拟合。根据分析得到的数学模型如下,见图3 和表2。

1) 线性模型

K=0.036X+2.441,R2=0.946 显著相关。

2) 对数模型

K=0.092 1lnX+2.462,R2=0.992 显著相关。

图2 人口经济密度法拟合K 值Fig.2 Fitting K value of the population and economic density method

图3 连通度法拟合C 值Fig.3 Fitting C value of the connectedness method

通过分析经济社会发展对公路线网连通状况的需求,本路网介于方格网状与三角网状之间,其临界状态的连通度计算方法如下,参考上述路网连通临界状态的分析,得到此区域的连通度值C 在2~3.22 之间为合理的。

1) 对于结构是方格形的路网,如图4 所示。 取边长s=1,则N=(n+1)(n+1),L=2n(n+1),A=n2,可得

对n→+∞取极限,得到C=3.22。

图4 方格形结构路网Fig.4 Grid structure road network

图5 正三角形结构路网Fig.5 Equilateral triangle structure road network

2.2 拟合结果及误差评价

依据表2 所示的国土系数法K 值、人口经济密度法K 值、连通度法C 值的拟合结果,分别带入式(1)~式(3),得到如表3 所示的三种单一预测方法对应的农村公路线网规模拟合值,采用MAE,MAPE,RMSE 三个误差指标衡量预测方法的拟合精度,见表3,三种单一预测方法精度均较高,说明本文所采用的方法均适用于农村公路线网规模的预测,其中连通度法的拟合精度最高。

表2 三种单一预测方法的系数拟合结果Tab.2 Coefficient fitting results of three single forecasting methods

表3 三种单一预测方法和组合预测方法拟合结果及误差指标评价Tab.3 Fitting results and error index evaluation of three single forecasting methods and combination forecasting method

2.3 组合预测模型构建

用三个误差指标来评价三种预测方法,进而得到评价矩阵为

具体计算熵权法的权重步骤,如下:

根据上述步骤得到,国土系数法(Y1)、人口经济密度法(Y2)和连通度法(Y3)的权重系数分别为{0.115 4,0.240 3,0.644 3},其中连通度法的权重系数最高, 说明其预测值更接近实际情况。依据公式(4),得到组合预测模型公式为

Y=0.115 4Y1+0.240 3Y2+0.644 3Y3

利用上述公式,可求得组合预测模型的拟合值,误差指标见表3,与实际值对比如图6 所示。虽然组合预测模型的拟合精度较连通度法低些,但精度相较国土系数法和人口经济密度法都有提高。 一方面,本文选取节点数量和非直线系数较合理,确定C 值较精确,连通度法获得较好的拟合精度;另一方面,后续对未来特征年农村公路线网规模预测中发现(见表5),连通度法计算出的预测值过于保守,与历年来公路实际里程的涨幅不匹配。所以,通过实例证明,本文基于熵权值理论,提出的组合预测方法能有效避免单一预测方法的局限性,降低单一预测方法的风险。

图6 三种单一预测方法和组合预测方法拟合值与实际值对比Fig.6 Comparison between fitting values and actual values of three single forecasting methods and combination forecasting method

2.4 预测结果

依据2.1 和2.2 中构建的模型,计算得到如表4 所示的国土系数法K 值、人口经济密度法K 值、连通度法C 值的预测结果,分别代入式(1)~式(3),得到如表5 所示的三种单一预测方法对应的农村公路线网规模预测值,代入式(4),计算得到如表5 所示的组合预测值。 不难发现,人口经济密度法预测的线网规模较大,增长速度偏快,国土系数法预测的线网规模适中,但增长速度过快,连通度法预测的线网规模较小,且增长速度过慢。组合预测方法规避了三种单一预测方法的风险,获得较好的预测结果和增长速度,符合安吉县农村公路线网规模发展趋势。

表4 三种单一预测方法的系数预测结果Tab.4 Coefficient prediction results of three single forecasting methods

表5 三种单一预测方法和组合预测方法预测结果Tab.5 Forecasting results of three single forecasting methods and combination forecasting method

3 总结

在农村公路的布局规划中,其前提和首要工作是合理地确定农村公路网发展规模。 本文在充分掌握安吉县现有公路线网建设状况以及预测理论方法的基础上,为避免单一预测方法的局限,基于熵权法理论,提出组合预测方法。 计算结果得出,国土系数法、人口经济密度法和连通度法的权重系数分别为0.115 4,0.240 3,0.644 3,其中连通度法的权重系数最高,这与连通度法的误差指标最低相符,也验证了熵权法能够客观地分配权重系数。研究结果表明,国土系数法、人口经济密度法、连通度法和组合预测方法均适用于农村公路线网规模,拟合精度均较高。 组合预测方法预测结果更合理,降低了单一预测方法的风险,符合农村公路线网规模发展趋势,可为各地“四好农村路”的建设提供切实可行的依据,使之更好地与区域社会经济平衡、协调、有序的发展。

猜你喜欢

权重规模人口
《世界人口日》
人口转型为何在加速 精读
权重望寡:如何化解低地位领导的补偿性辱虐管理行为?*
科学创新人才的适度规模培养
50亿元!目前规模最大的乡村振兴债券发行
2020年我国机器人产业规模达1000亿元
权重常思“浮名轻”
为党督政勤履职 代民行权重担当
人口最少的国家
1723 万人,我国人口数据下滑引关注