道路客运实载率分层抽样的估计方法
2012-09-26岑晏青
岑晏青,董 静
0 引言
道路客运实载率是交通运输行业节能减排的重要考核指标,也是运输主管部门合理调控运力的重要依据。在计划经济的“单车→车队→企业→行业”分级管理模式下,运输主管部门通过全面统计报表制度,对包括实载率在内的所有旅客运输生产指标进行全面调查并层层汇总。随着道路客运市场化程度的不断提高,运输主管部门的职责由直接经营管理转变为宏观政策调控,掌握每一辆载客汽车的基础信息已经不再可能也没有必要。此时,调查成本较低、推算精度有保证的抽样调查在全国范围内逐渐推广应用。但由于调查经费等原因,以往的公路运输量抽样调查主要是针对客运量和旅客周转量等核心指标进行设计和实施,使得实载率等运输效率指标无法进行科学、合理的调查和推算。
因此,本文将基于道路客运实载率的定义和计算公式,结合交通运输部2008年组织开展的全国公路水路运输量专项调查,提出实载率指标抽样估计值及其精度的估计方法,以期对规范实载率指标的调查和推算、支撑交通运输行业的相关工作有所裨益。
1 定义和计算公式
现行的实载率定义、统计调查方式和计算方法遵循的是2002年交通运输部颁布的《公路、水路、港口主要统计指标及计算方法规定》,是基于原计划经济条件下“单车→车队→企业→行业”的全面调查方式而设计的。根据定义,道路客运实载率是指报告期内载客汽车完成的旅客周转量占总行程载客量的比重,用以反映总行程载客量利用程度,计算公式为:
设ki,yi,xi分别为第i辆载客汽车的实载率、旅客周转量和总行程载客量,则对于单车而言,其实载率ki的计算公式为:
对于车队、企业或行业而言,实载率的计算公式为:
其中,N为车队、企业或行业拥有载客汽车的数量。可见,在全面统计报表制度下,只要掌握了所有载客汽车的旅客周转量 yi和总行程载客量 xi(即i=1,2,3,……N),利用上述计算公式就可以得出总体N(如全行业)或者任何一个子总体Nj(如车队或企业)的实载率k或者kj。但在抽样调查中,由于只获取了部分载客汽车(即样本车辆)的相关数据,此时i=1,2,…,n(n<N),要计算出总体N或者某一子总体Nj的实载率k或者kj,就必须要遵循抽样调查方法对目标变量的均值和方差进行推算。
2 两种估计方法
为提高抽样效率,2008年全国公路客运专项调查以地市、车辆类型、线路类型和标记客位等指标作为分层标志,采用了较为复杂的多重分层抽样方法。这里为方便讨论,我们假设只进行了一次分层。下面讨论实载率指标的两种估计方法。
2.1 定义法
所谓定义法,就是严格按照实载率的计算公式,先分别估计旅客周转量Y和总行程载客量X两个中间变量的估计值,再利用计算公式实载率K=Y/X得到K的估计值。
根据抽样方案设计,旅客周转量Y采用逐层推算的模式。设yhi为第h层第i个样本车辆的旅客周转量,nh和Nh分别为对应层的载客汽车样本数和总体数,Yh为对应层的旅客周转量。
根据分层抽样调查的推算原理,第h层样本车辆的平均旅客周转量为:
第h层旅客周转量的估计值Ŷh为:
Ŷh的方差估计值 v(Ŷh)为:
由此可得,旅客周转量Y的估计值Ŷ为:
在正态分布假定条件下,Ŷ的置信水平为1-∝时的置信区间为:
按照同样的步骤,可以获得总行程载客量X的置信水平为1-∝时的置信区间为:
其中,X̂为总行程载客量X的估计值,v(X̂)为 X̂的方差估计值。
显然,根据现有抽样技术理论,估计值K̂的方差是无法进行科学计算的。但按照精度估计的稳健性原则,可以根据Ŷ和X̂的置信区间来估计出K̂的近似置信区间。实载率K̂的置信水平为(1-∝)2时的近似置信区间为:
2.2 变量替换法
所谓变量替换法,就是根据调查数据计算出每一个样本车辆的实载率ki=yi/xi,然后将ki视为目标变量进行分层简单估计,得到K的估计值及其方差。
根据抽样方案设计,实载率K同样也采用逐层推算的模式。设khi为第h层第i个样本车辆的实载率,nh和Nh分别为对应层的载客汽车样本数和总体数,kˉh为对应层的实载率。
根据分层抽样调查的推算原理,第h层样本车辆的平均实载率 kˉh为:
第h层总体车辆的实载率估计值K̂h为:
K̂h的方差估计值 v(K̂h)为:
由此可得,实载率K的估计值K̂为:
K̂ 的方差估计值 v(K̂)为:
在正态分布假定条件下,K̂的置信水平为1-∝时的置信区间为:
3 实例分析
以2008年陕西省班线客车运输量调查为例,为简化计算,假设仅按经营线路类型分为县内班线客车、跨县班线客车、跨地市班线客车和跨省班线客车4层(即h=1)。已知:N1=7427,N2=5210,N3=3646,N4=1308,n1=784,n2=443,n3=341,n4=155;可得 f1=0.1056,f2=0.0850,f3=0.0935,f4=0.1185,W1=0.4222,W2=0.2962,W3=0.2073,W4=0.0744。
采用上述两种方法对该省班线客车实载率进行估计,设Y为日均旅客周转量,X为日均总行程载客量,K为客运实载率。根据调查数据计算出来的有关结果见表1。
表1 根据调查数据计算出来的有关结果
3.1 采用定义法
实载率的估计值K̂为:
实载率K̂的(1-∝)2=90.25%的置信区间近似为:
3.2 采用变量替换法
实载率的估计值K̂为:
实载率K̂的1-∝=95%的置信区间为:
上述结果表明,采用定义法和变量替换法计算得到的实载率估计值K̂基本相同,分别为53.69%和53.77%,两者相差不到0.1%;但估计的置信区间显示出变量替换法的精度要明显高于定义法。
4 结论
本文基于抽样调查的理论和方法,从道路客运实载率的定义和计算公式出发,研究提出了分层抽样条件下实载率的两种估计方法,即定义法和变量替换法;并以2008年陕西省班线客车运输量调查为例,对两种估计方法进行了实证分析。结果表明,适用于全面统计报表制度的定义法同样也适用于抽样调查方法,但其估计精度和操作简易性方面却远不及变量替换法,尤其是采用多重分层抽样时,变量替换法的优势将更为突出。事实上,本文提出的估计方法不仅可用于实载率的推算,同时也可以应用于里程利用率、客位利用率等其他运输效率指标的推算,为道路运输统计调查提供了新的思路和方法。
[1]中华人民共和国交通部.公路、水路、港口主要统计指标及计算方法规定[M].北京:人民交通出版社,2002.
[2]冯士雍等.抽样调查——理论、方法与实践[M].上海:上海科学技术出版社,1994.
[3]杜子芳.抽样技术及其应用[M].北京:清华大学出版社,2005.