居民出行调查数据扩样及校核方法应用研究
2021-09-06陈梓星庄义彬
吴 焕, 陈梓星, 庄义彬, 吴 璠, 覃 矞
(深圳市城市交通规划设计研究中心股份有限公司(广东省交通信息工程技术研究中心,深圳市交通信息与交通工程重点实验室), 深圳 518021)
0 引言
居民出行调查是城市综合交通规划中一项重要的基础性工作,通过调查可全面了解城市居民的总体出行特征和规律,为科学制定交通发展战略、政策和技术性法规提供重要依据[1-2]. 然而,居民出行调查组织往往难以做到随机均匀[3],此外还存在被调查者漏填的沉默需求;另一方面,公交IC卡等交通大数据分析给扩样结果校核带来了新的数据支撑,因此,要准确把握居民出行总体特征,最大程度地降低抽样不均匀和漏填信息的影响,制定有效的调查数据扩样和校核方法显得尤为重要. 目前已有一些居民出行调查数据扩样及校核方面的研究[4-8],对居民出行调查数据扩样及校核有较大指导意义,但在方法系统性和应用上还有所欠缺,本文系统地提出了居民出行调查数据扩样和校核方法,并应用到佛山市顺德区居民出行调查数据扩样和校核中.
1 总体技术路线
居民出行调查扩样往往会存在误差,误差来源于2个方面:一方面是多个约束量的综合平衡结果,例如要控制人口数量、从业人口、学生数、年龄结构、性别及各种拥车等符合统计数据的约束,需要在扩样系数上进行折衷,保证各控制约束量的综合误差最小,单个约束量会存在误差;另一方面,居民出行调查数据存在抽样质量、填写质量2方面的问题,会导致扩样误差,甚至导致扩样错误. 在抽样质量方面,每个村居或交通小区是否为均匀抽样,如果抽样集中在某些小区,直接扩样会导致扩样结果偏差较大,无法反映整体数据特征;在填写质量方面,被调查者在填写信息时是否属实,例如家庭人数、拥车情况等,每个人的出行次数是否都记录完整,一般情况下出行次数会存在漏填情况,需要考虑沉默出行需求. 为了尽可能减少扩样误差,本文采用组合扩样和出行扩样校核方法,具体总体技术路线如下:
整个扩样过程分为户扩样、人扩样、出行扩样3个方面,户扩样以按照统计部门提供的分村居、分家庭户/集体户总人数与实际调查样本家庭户/集体户人数的比值,作为户扩样系数. 并根据所提供小汽车、摩托车数量,对户扩样进行调整. 人扩样在户扩样系数基础上,按照分户籍/非户籍总人数,结合性别、年龄结构及学生数、就业人口等统计年鉴数据,调整得到人扩样系数. 出行扩样在人扩样系数基础上,考虑分目的沉默需求比例及公交IC卡OD数据,得到最终出行扩样系数. 总体技术路线如图1所示.
图1 总体技术路线
2 组合扩样
2.1 户扩样
(1)
(2)
2.2 户拥车调整
户拥车调整是依据车管所提供的机动车保有量数据,调整户扩样系数,使得扩样后的小汽车和摩托车数量跟实际相吻合.由于居民户中可能同时拥有摩托车或小汽车,调整户扩样系数时,难以同时实现小汽车和摩托车数量同时达到精度要求,因此采用循环调整方法,直至小汽车和摩托车数量都符合误差精度要求,具体原理流程如图2所示.
图2 户拥车循环调整方法
第i个交通小区有车户、无车户扩样系数分别如式(3)(4)所示.
(3)
(4)
2.3 人扩样
(5)
(6)
2.4 人扩样调整
针对年龄结构、性别、学生数及岗位数等因素进行调整,采用循环调整方法,直至上述因素均符合误差精度要求,具体原理流程如图3所示.
图3 人扩样循环调整方法
(7)
(8)
同理,进行性别、学生数和岗位数等因素的人扩样系数调整,需要注意的是,学生数和岗位数一般没有户籍和非户籍的数据,因此不需要细分户籍和非户籍,所有常住人口一起调整即可.
3 出行扩样及校核
在上层估计所得最终人扩样系数基础上,乘以沉默需求比例调整系数,计算得到出行扩样系数. 通过处理公交IC卡刷卡数据得到公交OD分布,对出行扩样系数进行校核调整,得到最终出行扩样系数,判断符合要求后,输出居民出行特征,方法原理如图4所示.
图4 出行扩样及校核原理
(9)
(10)
4 实际应用
以佛山市顺德区居民出行调查数据扩样为例,对上述方法进行了应用. 在户扩样基础上,对拥车进行了2次循环调整,小汽车的和摩托车全区总体误差均为0,各镇街小汽车保有量误差均为2%以下,效果良好,具体户调整扩样结果如表1所示.
表1 户调整机动车扩样结果
人扩样调整中结果如下,各年龄结构人数及性别比例误差都在2.5%以下,效果良好,具体如表2、3所示.
表2 户籍人口年龄结构和性别扩样结果
表3 非户籍人口年龄结构和性别扩样结果
学生数和岗位数扩样后误差在1%以下,满足精度要求,如表4所示.
表4 学生数和岗位数校核调整
参照国内其他城市沉默需求比例,分析得到顺德区各目的沉默需求比例如表5所示.
表5 各目的沉默需求比例
利用公交IC卡数据分析得到公交OD,结合公交客流量数据进行扩样,得到各个镇街之间的公交OD矩阵,如表6所示.
表6 公交IC卡大数据处理所得公交OD分布
以公交OD对出行方式进行校核,得到最终出行扩样系数,在此基础上分析得到居民出行特征见图5~图9.
图5 交通方式结构
图6 出行目的
图7 出行时长
图8 出行时间分布
图9 出行距离
5 结束语
本文系统地提出了扩样思路技术路线,给出了组合扩样方法,提出了户拥车调整和人扩样调整的循环调整方法,考虑了沉默需求及公交IC卡数据,提出了出行扩样及校核方法,并在佛山市顺德区居民出行调查数据扩样和校核中得到了应用,效果良好,为以后城市居民出行调查数据处理提供了参考和借鉴. 本文的主要创新点是提出了基于沉默需求比例及公交IC卡OD的扩样调整方法,针对沉默需求比例的取值和估算方法进行了阐述,提出了基于公交IC卡的交通小区公交出行OD矩阵的估算方法. 下一步研究方向是如何利用手机信令大数据来计算各出行目的的沉默需求比例.