出租汽车计价器计量预警标准
2022-02-01陈康王琳珠陆君一胡文华上海市计量测试技术研究院上海市市场监督管理局行政服务中心
陈康 王琳珠 陆君一 胡文华 / .上海市计量测试技术研究院;.上海市市场监督管理局行政服务中心
0 引言
在数字时代,计量工作需要充分运用数据分析技术,探索建立新型计量监督模式和标准。诸如:面向出租汽车计价器贸易结算用途的民生需求,围绕计量供给不全面问题,发展计价器误差预警标准的计量新模式,提升政府主管部门与企业质量控制与智慧管理水平。
出租汽车计价器是列入《实施强制管理的计量器具目录》的工作计量器具,根据JJG 517-2016《出租汽车计价器》检定规程[1]要求,计价器检定周期为1 a且计量性能必须满足检定规程要求。在周期检定中,计程误差是比较重要的检定项目,如果其不满足计程最大允许误差要求-4%~+1%,则本次检定为不合格。授权的计量技术机构用适当的统计分析方法[2][3],对收集的大量计程误差检定数据进行详细研究和概括总结,从而提取有用信息,形成结论。例如,根据不同企业、地区以及器具型号等分类,挖掘检定合格的计价器计程误差分布情况,按照相应标准对接近超差临界的器具发出预警信息[4][5]。这样不仅为行业主管部门非现场监管提供技术支撑,同时协助企业提高计量器具的质量管理。
1 计程误差的数据处理分析
1.1 数据收集
由上海市政府主管部门授权检定机构统计,上海地区的巡游出租汽车近年来高峰总量达到5万辆,安装在巡游出租汽车上的计价器作为计算并显示乘客应付车费的工作计量器具,为保障乘客合法权益,保证贸易结算的公正准确,每年都需要进行检定。依据国家以及地方检定规程[6]对计程误差项目的要求,检定点至少为3个,需要采样3次并记录计算,装车后计价器计程误差计算公式:
式中:Dw——计程误差,%;
D——计价器示值,m;
C——轮胎修正值,%;
Jd——检定装置测量的计程值,m
每台计价器的检定数据可表示为集合A,其中Dw1,Dw2,Dw3为3个检定点的计程误差:
在上海地区每年巡游出租汽车因周期检定产生的检定数据高峰总量达到15万条,授权检定机构在业务数据库中存储相关检定数据,这是计程误差数据处理分析所需的重要资源库。
1.2 数据处理
数据处理分析需要对收集到的计程误差检定数据进行加工整理,形成合适的数据分析样本,其目的是从大量的、繁琐的数据中提取对政府主管部门和企业有价值、有意义的数据。数据处理常用步骤为数据清洗、数据变换、数据规约等[7]。
首先对每台计价器的检定数据集合A进行数据清洗,主要方法是数据去重。由于计程误差涉及多条数据记录,而这些数据记录都在规程要求范围内,因此,不会直接影响实际检定结果,可通过取均值或者挑选特定值方法把多条记录整合为一条数据记录。考虑到乘客权益优先,本文采用取集合A中最大值(最接近最大允许误差上限)作为该台计价器的计程误差数据记录,集合B为该分类下所有计价器的计程误差数据,An(n是自然数)为单台计价器检定数据的集合:
其次,需要对集合B进行数据变换,使采集到的数据转换为建模需要的特征形式。利用最小-最大规范化(又称归一化)方法,即把数据值缩放至最终范围为0~1,再使用线性变换公式:
式中:B'——变换后的集合;
b——集合B中的任意数据;
Dwmin——计价器最大允许误差下限-4%;
Dwmax——计价器最大允许误差上限+1%
该方法既保留原始数据值之间的联系,也能降低授权机构检定数据外泄风险。
最后需要通过数据规约降低数据集合规模,从庞大的原数据集中获得一个精简的数据集,既保证原数据集的完整性,也提高数据挖掘效率。利用直方图这种无参数化数值规约方法可近似描述数据分布情况,通过分组方式把数据分布划分为不相交的子集,每个子集表示计程误差的一个连续区间,然后统计出各子集所含数据的个数,即为频数。频数与数据总量之比,称为频率(%),其代表数据集具体分布情况。计价器最大允许计程误差区间中值为-1.5%,规程要求检定测得的计程误差分布在中值附近,而误差区间两侧极端数据较少,即直方图数据集接近统计学正态分布情况最佳,因此,建议六等分误差区间,即组数为6,组距为1/6,子集区间分组如表1所示。
表1 计价器最大允许计程误差区间分组
1.3 数据可视化呈现
展现分析结果数据时,优先使用直观生动的图形可视化展示,有效地传递信息,帮助政府主管部门和企业从计价器检定数据中发现规律和趋势[8]。
通过直方图方法获得计程误差数据集各区间的数据占比,并利用柱形图的柱子长短差异进行判断,清晰显示各区间的频率比较情况。图1中X轴代表计程误差数据集6个归一化值的区间,不同区间之间用不同颜色加以区分,而Y轴代表频率并在Y轴上标注预警临界线。政府主管部门及企业可对比历年直方图可视化图形,总结该地区内或各企业内的计价器工作计量状态变化情况,在预警信息出现后采取相应措施。
图1 计价器计量预警模拟
当前适合数据分析以及可视化处理的编程语言主要有Python、R、Java等。Python是一种开放的自由软件,可以阅读并改动它的源代码,在数据分析及可视化方面有非常成熟的开源代码库,能快速完成数据的可视化。图1是使用Python语言完成的计价器计量预警模拟参考图。
2 预警标准
2.1 预警等级
根据计价器计程误差数据处理分析结果,计程误差分布在区间两侧数据量越多,意味着该类别的计价器面临超差风险越大。靠近区间下限的类别有负超差风险,会损害出租汽车驾驶员和运营企业相关利益,导致营业利润下降。靠近区间上限的类别有正超差风险,会损害乘客相关利益,同时造成出租汽车计程收费类投诉增加,导致政府主管部门和企业产生负面的民生形象。计程误差分布集中在区间中值附近,既符合相关规程要求,也能维持企业和消费者计量方面的平衡。因此,将预警标准划分为三个等级,分别为正常状态、负超差预警、正超差预警,并给予不同颜色加以区分,如表2所示。
表2 计价器计量预警等级划分
2.2 具体标准
根据计价器最大允许计程误差区间分组,第1区间的频率大小是研判负超差预警的决定因素,而第6区间的频率大小是研判正超差预警的决定因素,其余区间频率之和是研判该类别计价器工作状态是否处于正常状态的标准。由于各区间组距相等,按统计学均匀分布假设以及相关质量管理要求,计价器计量预警具体参考标准可设置为:1)正常状态信号标准为第2至第4区间,频率之和达到60%及以上;2)负偏差预警信号标准为第1区间,频率达到20%及以上;3)正偏差预警信号标准为第6区间,频率达到20%及以上。图2是计价器计量预警各等级可视化的模拟图。
图2 计价器计量预警各等级模拟
政府主管部门和企业管理的计价器在当年检定后,利用授权机构发布的计价器计量预警等级可采取相应改善措施。对于正常状态信号的类别,政府主管部门可在企业资质考核中给予肯定,企业需注意第2至4区间计程误差分布,避免向两侧滑动趋势。对于负超差预警信号的类别,企业需及时维护保养车辆和计价器;对于正超差预警信号的类别,政府主管部门可督促企业维修更换使用年限较大的车辆和计价器,保障计量公平公正。
3 结语
基于数据处理分析的应用技术,本文探究计价器这种强制检定计量器具的计量预警标准与机制。授权机构结合数据分析和统计学方法,对检定数据进行二次分析。根据相应的预警标准,授权机构利用数据可视化呈现直观的计程误差分布情况。在计价器计量法制管理方面,为政府主管部门和企业提供技术支撑和建议。本文总结的数据处理分析方法期望适用于其他具备量大面广特点的工作计量器具的预警标准相关研究。