机动车排放多源数据融合及应用研究
2023-12-22马冬肖寒王宏丽付明亮
马冬,肖寒,王宏丽,付明亮
(中国环境科学研究院 国家环境保护机动车污染控制与模拟重点实验室,北京 100012)
随着社会经济的发展,我国机动车保有量持续增加,2022 年机动车保有量达到4.2 亿辆,其中汽车保有量达到3.2 亿辆[1]。机动车排放的大气污染物包括一氧化碳、碳氢化合物、氮氧化物及颗粒物等。2021 年,全国机动车这四项污染物排放总量为1557.7 万吨[2]。大气污染物源解析显示,机动车排放已成为我国大气污染的重要来源。
与固定点源排放不同,机动车点多面广、流动性强,为排放监管带来巨大挑战。随着信息网络及大数据技术的不断发展,我国在机动车环保信息公开、环保定期检验、遥感监测、车载自动诊断系统(OBD)远程监控等领域积累了大量的数据,通过对多源大数据进行分析处理,对加强机动车污染控制,改善城市大气环境具有重要意义。
1 机动车排放多源数据发展现状
1.1 数据现状
研究机动车排放需要对机动车排放污染物进行准确测量,分析污染物排放的物化原理和数学统计规律,研究从微观到宏观的排放分析方法,从而发现高排放车辆,对车辆超标原因进行溯源分析,为制定更新排放标准和政策法规提供技术支持。
自2001 年以来,我国在新车、在用车检测及监管方面积累了大量的数据,对加强机动车排放监管、开展机动车排放政策法规和标准制定及评估等工作提供了重要数据基础。
(1)为强化企业主体责任,根据《关于开展机动车和非道路移动机械环保信息公开工作的公告》,机动车和非道路移动机械生产、进口企业应当向社会公开其生产、进口机动车和非道路移动机械的排放检验信息和污染控制技术信息,并对信息公开的真实性、准确性、完整性负责。《中国移动源环境管理年报(2022 年)》显示,截至2021 年年底,全国共有1287 家机动车企业33 809 个车型进行了环保信息公开,其中,轻型车型6191 个、重型车型23 854 个、摩托车型1368 个、新能源车型2396 个。
(2)为加强在用车环境管理,我国建立了机动车环保定期检验制度,发布实施了在用车检验标准,对排放检验不达标的车辆,不得上路行驶[3]。《中国移动源环境管理年报(2022 年)》显示,截至2021 年年底,全国31 个省(自治区、直辖市)均已开展了机动车排放定期检验工作,共有检验机构13 380 家,其中汽油车(含燃气车)简易工况法检测线30 397 条,柴油车加载减速检测线24 310 条,OBD 检测线41 752 条。基本建成国家-省-市三级联网的机动车定期排放检验机构监控平台,实现机动车排放检验机构全国联网监控。2021 年,各地通过国家-省-市三级联网平台报送机动车定期检验数据8896.6 万条。其中,汽油车(含燃气车)稳态工况法、简易瞬态工况法、双怠速法检测首检合格率分别为95.5%、97.3%、96.2%。柴油车加载减速工况法、自由加速法检测首检合格率分别为95.6%、98.9%。
(3)《大气污染防治法》要求在不影响正常通行的情况下,可以通过遥感监测等技术手段对在道路上行驶的机动车的大气污染物排放状况进行监督抽测,公安机关交通管理部门予以配合。为贯彻落实《大气污染防治法》要求,加强机动车实际道路排放监测,我国制定实施了在用柴油车遥感检测标准,对道路行驶的车辆进行监督抽测,如果车辆在6 个月内发现连续超标两次,即可认定为排放不合格,必须进行维修治理。截至2021 年年底,全国已完成建设遥感监测(含黑烟抓拍)点位并与国家-省-市三级联网平台联网2590 个,累计报送19.9 亿条监测数据,对有效筛查高排放车辆、加强在用车排放控制发挥重要作用。
(4)OBD 是监控机动车排放状态的重要装置,一旦车辆有可能引起排放超标的情况,会点亮车辆仪表板上的故障指示灯提醒车主及时进行维修。重型柴油车国六标准中增加了远程监控要求,要求国六重型车具备OBD 数据采集和发送功能,可实时对车辆的排放状况进行监测,并要求和生态环境主管部门联网,确保监管部门能够实时监控重型柴油车排放状况,有效降低实际道路排放。目前,北京、杭州和唐山等地已经开展了重型车远程监控示范项目,根据《柴油货车污染治理攻坚战行动计划》规定,2019 年年底前重点区域50%以上具备条件的重型柴油车将安装远程在线监控并与生态环境部门联网,2020 年1 月起,重点区域将未安装远程在线监控系统的营运车辆列入重点监管对象。
此外,还有一些机动车排放检验相关的方法,如跟车尾气收集检测,采用上路跟随的方式,采集几分钟内的汽车排放污染物进行分析;交通道路微站动态检测方法,主要部署在主要交通道路旁,目前还处于研究开发阶段。
通过对检测数据进行汇总归类可以发现,多源数据从数据种类上来说可以分为车辆参数(含车型、控制单元OBD 信息)、排放检验结果(含OBD 检查)、车辆工况数据(速度、加速度、比功率、负载)及气象参数(大气压、温度、湿度)、环境数据(道路类型、坡度等),而车辆参数中的号牌号码、车辆型号、车辆识别代号、信息公开编号具备一定程度的唯一性,可以用来作为数据融合处理的依据。
1.2 存在的问题
由于影响机动车排放的因素众多,除了车辆本身采用的发动机和后处理技术等核心因素外,驾驶人驾驶习惯、气象条件、车辆驾驶状态、车辆运行模式、车辆负载、道路条件等会影响机动车的污染物排放水平。另外,检测使用的检验设备、检验设备维护校准状态等也会干扰排放检验的结果。仅通过一种机动车排放检验方法,难以综合考虑所有的影响因素,测算一辆车的真实排放水平,必须综合处理多种机动车排放检验相关数据进行测算评价。
随着信息网络和大数据技术的快速发展,我国机动车排放检验信息化水平逐步提高,各省(自治区、直辖市)均建立了相应的信息化系统,积累了大量的检测和监管数据。但是,由于数据来源、频率和数据格式等存在差异,导致数据种类繁多、质量参差不齐,难以进行有效的综合利用。如何对种类繁多的机动车排放检验相关数据进行综合处理和分析,正确的计算和评估机动车污染排放水平,是机动车污染排放控制的关键环节。
2 机动车排放多源数据融合分析
2.1 数据处理
受检测设备性能、检测人员、设备运行和维护的影响,原始业务数据往往不能满足数据综合处理和分析的需要,数据的完整性、规范性和异常都会影响最终的数据分析结果[4],所以在对多源数据进行分析处理前,需要进行数据的预处理工作,按照图1 设定的多源数据处理和分析流程,将不同来源的数据提取和转换后,对数据进行诊断修复,按照数据关联度对数据进行置信分析,将带有数据置信度的数据利用车辆参数中包括的号牌号码、车辆型号、车辆识别代号和信息公开编号作为依据进行融合处理后存入数据仓库。按照评价分析的方向对数据进行离线预算,计算结果进入数据集市,数据集市可以为机动车道路排放综合评价、发现高排放车辆和低排放车辆、超标原因溯源分析、关键污染控制装置和检验设备的评价提供稳定的数据支持。
图1 多源数据分析处理和应用流程
机动车多源数据主要包括了新车型式检验、遥感监测、定期检验等,这几种主要的检测技术由于监管运行模式、运行主体存在较大差异,特别是定期检验和遥感监测,基本都是通过各省(自治区、直辖市)自建的信息化系统进行,需要把不同数据源的数据进行预处理,转化为标准的多源数据格式,多源数据的预处理包括了数据单位标准化、数据项目标准化、标准当量折算三个步骤。
(1)测量单位标准化
对不同来源但物理含义相同的测量单位进行标准化统一,如环境参数的温度、湿度、大气压分别统一为℃、%、kPa;车辆工况数据的速度、加速度分别统一为m/s,m/s2;一氧化碳浓度、氮氧化物浓度、碳氢化合物浓度、颗粒物浓度、颗粒物数浓度分别统一为%、ppm、ppm、μg/m3、个/m3;排放因子统一为g/km。车辆参数最大总质量、累积行驶里程分别统一为kg、km 等。
(2)数据格式标准化
对不同来源但物理含义相同的数据项目进行标准化,如号牌号码统一为带发牌机关中文缩写;号牌颜色、排放标准阶段统一用代码表示,如1 代表黄色车牌,Ⅰ代表国Ⅰ排放标准阶段等;测量日期与时间格式分别统一为YYYY/MM/DD、24h:mi:ss。燃料种类统一用代码标识,如A 代表汽油、B 代表柴油。
(3)污染物标准当量折算
多源数据中不同的机动车排放检测由于检测原理不同,对污染物浓度的测量结果也不相同,如一氧化碳、碳氢化合物、氮氧化物、颗粒物的排放结果应按标准测量单位进行标准化处理,转换为同一量纲。
多源数据经过预处理后,为便于后续开展数据应用和评价,还需要对数据进行分析和处理,才能最终形成标准的多源数据格式。分析和处理主要包括数据质量诊断、数据修复、置信度分析和数据融合,最后数据存储进入数据仓库。数据仓库可以提供给最终的应用场景,按照设定的数据主题进行计算,最后进入数据集市。
2.2 数据融合
多源数据融合是指利用技术手段将获取到的所有信息综合到一起并对信息进行统一的评价。多源数据融合方法主要有数据级融合、特征级融合和决策级融合三种。数据级融合属于最底层的数据融合,其是对原始数据进行简单预处理之后直接进行关联和融合,融合之后才作数据特征提取;特征级融合是先对数据进行特征提取,再对数据进行关联融合;决策级融合是先对各数据源进行决策,然后再将这些决策进行关联融合,最终获得整体一致性的决策结果。
机动车检测源数据经过预处理和分析处理后,先要进行数据级的融合,将各数据源的原始数据进行链接整合,进入数据仓库。车辆参数是进行融合处理的关键项目,如图2 所示,型式检验数据源用于融合的车辆参数为1-信息公开编号、3-车辆型号;新车下线检验用于融合的车辆参数为1-信息公开编号、2-车辆识别代号;定期检验(含新车注册登记检验)用于融合的车辆参数为1-车辆识别代号、3-车辆型号、4-号牌号码;遥感检测、跟车检测、道路微站检测用于融合的车辆参数均为4-号牌号码。另外,测试时间和地点作为附件融合关键项目可以用于道路微站检测、遥感检测、跟车检测。
图2 多源数据级融合
经过第一次数据融合后可以得到车型综合检验数据和车辆综合检验数据,存入数据仓库,可用来映射不同主题的数据集市,为多源数据的评价应用提供数据支撑。
3 机动车排放多源数据应用
经过对多源数据进行预处理、分析、融合后,可以得到大数据样本的机动车排放检验数据库。通过对多源大数据进行分析,可为机动车环保达标监管、排放标准制定、政策实施效果评估等提供重要数据支撑。
3.1 环保达标监管
从车辆的设计、生产、下线,直至卖到消费者手里、再到车辆达到其有效寿命期之前,企业需要建立完整的自查体系,确保每辆车的排放水平满足标准的要求。监管部门有权对新发动机、新生产车和在用车进行达标抽查,如果不满足标准要求,生产企业需要采取整改措施。如果企业故意弄虚作假、以次充好,还有可能因违反《大气污染防治法》而被停产整治、环保召回、行政处罚。通过环保检验、路检路查等大数据分析,可以追溯超标排放车辆生产或进口企业、污染控制装置生产企业、登记地、排放检验机构、维修单位、加油站点、供油企业、运输企业等,从而实现全链条环境监管。2017 年12 月,原环境保护部通报了对山东凯马汽车制造有限公司和山东唐骏欧铃汽车制造有限公司违反大气污染防治制度的行政处罚决定,迈出了机动车环保处罚的第一步。
《大气污染防治法》第五十八条要求国家建立机动车和非道路移动机械环境保护召回制度。生产、进口企业获知机动车、非道路移动机械排放大气污染物超过标准,属于设计、生产缺陷或者不符合规定的环境保护耐久性要求的,应当召回;未召回的,由国务院市场监督管理部门会同国务院生态环境主管部门责令其召回。2021 年4 月,国家市场监督管理总局、生态环境部组织发布了《机动车排放召回管理规定》,进一步明确机动车生产者的责任义务、缺陷调查及召回实施程序等相关内容。机动车环保召回在信息收集、缺陷判定等方面存在一定的难度。在现有的环保监管制度下,通过对机动车环保检验信息、污染控制技术信息、有关维修信息和投诉举报信息等进行系统分析,能够更快更准确地发现、获取排放缺陷的相关信息。
3.2 法规标准制定
排放标准对机动车污染防治具有重要意义。标准中影响最大、难度最高的就是合理确定机动车排放测试方法及限值。标准测试方法及限值过严,不利于行业的健康发展;标准测试方法及限值过松,不利于行业节能减排。通过对新车型式检验数据及在用车环保检验数据进行分析统计,可为标准测试方法及限值的确定提供重要的参考。
随着机动车保有量的快速增长及排放控制水平的不断提高,为满足新形势下环境保护工作的需求,生态环境部、国家市场监督管理总局对《车用压燃式发动机和压燃式发动机汽车排气烟度排放限值及测量方法》(GB 3847—2005)及《点燃式发动机汽车排气污染物排放限值及测量方法(双怠速法及简易工况法)》(GB 18285—2005)进行了修订[5,6]。修订过程中,充分利用了新车型式检验数据及在用车环保检验数据的统计结果,为测试方法及限值的确定提供了重要依据。
在确定新车下线检测方法及限值时,主要以汽车企业环保型式检验申报数据为基础,通过对10 762 个国五汽油车型的检验数据统计分析发现,双怠速法分析仪器误差范围已经远远超过车辆的实际排放水平,已不适合国五排放标准及以上车辆的下线检测,从而在标准中建议采用更为严格的瞬态工况法。通过对1000 个轻型柴油车车型和6900 个重型柴油发动机机型的检验数据统计分析发现,轻型柴油车第四阶段和第三阶段排放水平相差不大,平均值接近。重型柴油机随着排放标准的下降,排放水平不断降低。结合轻重型柴油机排放差异,确定新车下线检测限值为0.6m-1。
在用车排放检验的目的主要是筛选高排放车辆,大数据分析表明,车队中排放最差的10%—20%的车辆,其污染物排放量可占到整个车队的40%—50%。以地方生态环境部门机动车环保定期检验数据为基础,将高污染车辆控制在10%—25%,其中限值a 以控制高污染车辆10%—20%为目标,限值b 以控制30%—40%高污染车辆为目标。通过对北京、广州、深圳、厦门、杭州、南京、沈阳、长春、重庆、贵阳、西宁等11 个城市共计1000 多万条的环检数据进行统计分析,结合各地实际情况,确定了在用车排放检验方法及限值要求。
3.3 政策效果评估
机动车排放清单对全面掌握机动车排放现状、科学评估不同控制措施的减排效益、准确预测机动车排放趋势具有重要意义。机动车排放因子及活动水平是排放清单模型中的重要参数[7]。通过机动车环保检验、遥感监测等大数据分析,可以对不同城市的排放因子、年均行驶里程等进行修正,更加科学合理的评估城市机动车排放状况,为机动车排放清单建立、污染物总量核查等工作提供数据支持。
机动车定期检验、道路遥感监测一方面可以快速有效筛查高排放车辆,加强在用机动车排放监管,另一方面还可以积累统计相关数据,了解机动车实际排放水平及变化规律,为机动车排放控制政策的制定及评估提供支持[8]。通过定期检验、遥感监测等数据分析,可以得到不同类型车辆的实际排放因子及分布特征,重点分析高排放车辆排放因子及超标比例,从而为精细化管理提供重要的数据支撑。
机动车年均行驶里程数据对机动车排放有重要影响,也是计算排放量的重要参数。目前行驶里程主要是通过对当地机动车进行实际调查获得,数据样本受到一定限制[9]。随着机动车定期排放检验机构国家-省-市三级联网监控平台的建设,为机动车活动水平的获得增加了新的途径。通过对排放检验中的行驶里程数据进行统计分析,可以得到330 多个地级市的不同类型车辆的实际活动水平特征及变化趋势,为区域和城市开展交通运输结构调整和减排效果评估提供支持。
4 结语
“十四五”期间,建议以国家-省-市三级联网为基础,整合机动车信息公开数据、总量核查数据、环保定期检验数据、遥感监测数据及违法违规信息等,建立“一车一档”的机动车环保档案系统,进一步加强大数据在机动车环保监管、政策法规制定及评估等方面的应用。研究建立基于环保监管数据的机动车区域联防联控机制,利用新车信息公开、在用车年检、遥感监测、远程OBD 监控等信息,建立机动车污染防治联动和追溯机制,对机动车生产、进口企业、检验机构、用户等开展区域联防联控,加强机动车实际排放控制,提升机动车环境管理水平,为改善区域和城市大气环境质量,深入打好污染防治攻坚战提供重要的技术支撑。