高速公路大数据分析与应用创新平台建设探析
2020-08-05孙兰军
孙兰军
(山东省交通运输厅 数据应用和收费结算中心,山东 济南 250002)
1 需求分析
1.1 高速公路在交通运输中的地位
公路出行是我国民众出行的主要方式之一,也是人们最喜欢的出行方式,出行距离在200 km以内和800 km以上利用公路出行的比例最高,分别为33.5%和30.1%。数据证明,公路交通运输在国家经济中起重要作用,高速公路作为公路运输中的交通骨干网络,预计2020年末,高速公路建成里程将达到15万公里。
1.2 大数据与高速公路
大数据是世界范围内被广泛关注的热点领域,其强大的颠覆性将会深刻改变人类社会的生产生活,通过大数据技术与分析方法挖掘高速大数据背后的联系与规律,能够为相关职能部门的管理决策提供强有力的数据支持,加快推进智能交通的落地。
高速公路收费系统中就蕴藏了大量高价值数据,是交通大数据中的重要的、核心的数据资产。特别是2019年底,全国高速公路取消省界收费站工程的实施,高速公路收费产生的数据更加多样化,数据量是原先的10倍以上。此外,随着ETC拓展应用的开展,ETC无感停车缴费、ETC加油等应用的开展,ETC系统产生的数据更加多样,此类信息是交通大数据分析的重要数据来源。
1.3 山东省高速公路大数据建设现状
目前,山东省大数据分析和应用系统建设起步晚,高速公路大数据建设相对滞后,存在部分不足:(1)重视程度不足、投入不足,尚未将大数据分析作为管理决策和路网运营的主要手段和工具。(2)数据采集不足,数据单一。目前仅采集了收费相关的业务数据,大量数据未采集和利用。(3)数据共享壁垒多,不能跨部门、跨行业数据采集,数据关联分析少,政务协作还不顺畅。(4)数据标准不统一,无数据标准体系,数据交换和共享方式无统一规范、统一接口、安全控制手段和管理制度。(5)数据分析和挖掘力度不够、数据展现能力弱、运营和管理可视化弱。(6)数据应用创新少,数据支撑能力不足。
2 建设目标
2.1 建设目标
山东省高速公路大数据建设中应当充分总结外部成功经验和吸取外部教训,建设高质量的大数据分析与应用系统,有效支撑交通运输管理的决策和运营、交通强省战略的实施和落地。大数据分析与应用创新平台顶层设计见图1。
2.1.1 制定标准、统一规范
制定全省行业内统一的元数据标准,统一数据定义和数据格式,形成行业标准和地方标准。
制定全省行业内统一的数据交换和数据共享制度、规范、接口,实现数据共享、交换的统一接口、统一标准和安全可控。
2.1.2 安全、高效的数据采集
数据只有大规模、实时、多类型、高价值数据采集,才能保障大数据平台有效性和高价值。
2.1.3 建立统一的数据资源平台
数据资源平台包括基础、业务、历史、分门别类的交通主题数据,共享和交换的数据。建立安全、统一、标准、高效的数据资源平台,实现公共数据和业务数据共享。
2.1.4 建设稳定、高效的大数据计算平台
平台包括数据采集、清洗、存储、分析,进行实时和离线数据计算,建设成为开放平台,向各个业务系统开放,为交通运输行业提供有力支撑。
2.1.5 建设全面的数据分析平台
(1)建设全面的数据分析模型,包括高速公路收费、运营、管理相关模型,高速迁徙、高速交通仿真、车辆信用、特情分析等模型。(2)建立统一的大数据GIS平台,有效支撑省厅相关GIS展示服务、数据地图可视化,并具备为运营单位、其他业务单位提供云GIS服务的能力。(3)建立图形特征识别平台,提供车牌识别、车辆行驶特性提取功能,从海量图像数据中提出高价值的结构化数据,有效支撑执法、稽查对车辆和行驶特征提取的要求,并具备为运营单位、其他业务单位提供云服务的能力。
2.1.6 大数据分析平台业务创新应用
(1)建设商业智能分析、大数据综合分析和业务创新应用平台。商业智能分析包括大数据展示,完成数据价值的呈现。为高速公路综合收费、运营分析、高速迁徙、运营车辆分析、特征车辆分析、节能减排等,能够提供支撑管理决策。(2)为数据科学家、数据工程师、维护人员提供数据分析接口,对大数据进行探索和挖掘;提供交通行业的关联分析、交通仿真、大数据报告和特情分析等功能。(3)业务创新孵化。针对ETC拓展应用、ETC客户服务、高速公路服务区应用、政务协同、政企协同、应急协同、特情保障、数据变现、北斗导航和下一代高速公路收费系统开展创新和孵化。
图1 大数据分析与应用创新平台顶层设计
2.2 建设思路与原则
大数据分析和应用平台是一个长期、不断完善、开放、有决策人员、业务人员和技术人员广泛参与的系统建设,能够为领导辅助决策、企业降本增效、业务创新提供支撑平台。
3 系统设计
3.1 数据采集
高速公路数据类型多样,数据资源丰富,高速出行过程中产生大量的数据。高速公路大数据分析和应用系统建设,不仅涉及收费数据,更要广泛采集交通运输环节中的各类数据,跨业务、跨部门、跨行业对交通数据进行广度和深度采集。
3.1.1 高速公路收费数据
高速公路收费数据包括ETC发行、清分结算、门架通行、ETC充值、入口治超、部中心、跨省交易等结构化数据;包括高速公路通行、治超执法检查、服务区进出站等非结构化数据。
3.1.2 ETC拓展应用数据
ETC拓展应用逐步开展,目前主要有ETC停车和ETC加油数据。
3.1.3 交通运输行业数据
打通行业内数据壁垒,采集两客一危、绿通车、特种运输等营运车辆基础数据和GPS/北斗实时位置数据,以及所有智能联网设备产生的业务和运行数据。
3.1.4 车辆基础数据
广泛采集车企、工信部发布的车辆、车型数据,公安交警车辆、车主等数据。
3.1.5 互联网公共数据采集通过互联网获取高速公路实时路况、实时气象数据,通过各地公安违章查询接口,获取车辆违章等数据。
3.1.6 应用软件运行日志采集
通过应用软件运行过程中产生的大量业务日志获取运行情况及用户访问习惯数据。
3.2 大数据平台建设
3.2.1 数据资源平台建设
采用HTAP数据库技术和产品,建立统一的数据资源平台。根据数据属性分为不同类型数据库,建立ODS数据库、历史库、基础信息库、业务库、交通主题库和数据共享库。
3.2.2 大数据计算平台
采用开源、开放、主流的大数据计算技术,完成大数据采集、清洗、存储,对数据进行实时和离线计算。
平台应具备高性能计算力,对大数据进行快速计算,缩短数据分析时间,保障各类应用对时效性要求。
大数据平台集成机器学习,具备分布式机器学习能力,支撑高速公路收费中车辆画像、特情分析等应用分析。
3.2.3 数据治理平台
建设数据治理平台,建立统一数据标准、规范数据体系,实现统一规范管理,形成山东省交通行业内标准。
3.2.4 数据支撑服务平台
结合山东省实际业务运营、交通运输管理需要,建立不同主题的大数据分析模型。(1)多元轨迹还原分析模型。当前高速公路收费主要依赖OBU/CPC的通行记录信息,还原车辆行驶轨迹。在大数据平台中通过引入多元素多类型数据,实现精准还原行驶轨迹,参与还原路径的数据包括:OBU/CPC通行标识数据+图像抓拍提出的结构化数据+特殊车辆的定位数据+大数据路径参考模型数据。(2)ETC出行特征分析模型。通过对ETC用户出行行为使用分类、回归、聚类等大数据算法进行分析,从宏观和微观上分析ETC出行特征。(3)车辆画像与车辆信用模型。通过对车辆通行轨迹、车辆违章、车辆信息、车辆信用等综合数据分析,构建车辆全面、精准、多维车辆画像体系。对车辆信用进行多维评级,建立车辆在本省的通行信用信息。(4)迁徙分析模型。通过ETC/CPC通行记录数据和车辆定位数据,建立车流迁徙态势感知平台,分析城市车流迁徙趋势、区县级行政区车流来源地、以及区县级行政区的热门车流迁入道路;分析各个城市之间往来关系,辅助政府及交通管理部门对交通进行研判和决策,辅助分析区域经济的关联关系。(5)OD分析与拥堵分析模型。运用大数据技术进行OD分析。进行货流OD、客运OD等分析,为交通管理、交通规划、经济评价等相关人员提供更科学、更可靠的计算方法,为公众提供更有价值的交通信息。(6)运行支撑分析模型。重点对门架天线、摄像头、PSAM等关键设施建立分析模型。建立全省CPC卡流通模型,辅助现有的CPC卡调拨,并对卡丢失、卡损坏等、补卡缴费等事件进行关联分析模型。(7)特情分析模型。针对突发事件、重大活动保障活动建立专题分析模型,辅助领导决策。重点对绿通车、在途卡、超时车、临界车型、异常收费金额、异常行驶路线、异常进出站行为、异常天线标识、异常图像抓拍、异常CPC卡丢失等进行分析。通过相关数据分析模型,自动输出相关异常行为后由人工审核,辅助收费和追缴偷逃费。(8)交通仿真数据分析模型。为交通仿真提供数据模型支持。
3.2.5 共享交换平台
(1)大数据GIS平台。建立全省高速公路大数据GIS平台,为省厅大数据分析与应用平台提供GIS展示服务、数据地图可视化服务,构建全省高速公路“一张图”。(2)图像识别平台。2019年底全国取消省界收费站后,全路网建设了大量的高清摄像头,系统中存储大量图像数据,为更好挖掘数据资源,采用AI技术,建立统一的车辆特征识别平台,对输入抓拍图片分析车辆的车牌、品牌、车款、类型、颜色、特征,提出为结构化数据,支撑收费稽核等业务开展。行驶证中的车辆识别号码(VIN)中存储了大量车辆特征,通过该特征开展辅助收费和相关业务。
3.3 业务层建设
依托大数据分析平台,整合山东省高速公路管理、运营单位、科研院校、车企、运输企业和应用创新企业,开发智慧交通、智慧协同、数据变现和下一代技术应用研发,助力交通强省战略。
3.3.1 ETC拓展应用
以大数据为支撑,把握1 800万ETC用户优势,探索“ETC虚拟交易”应用,大力拓展ETC停车、加油、ETC绑定消费、ETC绑定缴费、ETC消费积分活动、ETC自驾游、ETC车险、ETC红包等应用,借助互联网+ETC,让OBU-ID作为新“ID”,让ETC作为新支付方式。
3.3.2 ETC客服应用
建立以客户为中心的服务理念,全面提升服务质量,提供电话、微信语音、直播、无线广播等多种形式的客服支撑,服务车主,提升ETC用户活跃度。
3.3.3 高速服务区应用
以数据为支撑,互联网+为手段,优化高速服务区资源配置,加强全省高速公路服务区信息化服务能力,建设特色服务区。
3.3.4 协同应用
开发与公安、应急、旅游、气象、住建等跨部门的协同应用,提升政务协同能力。联合车企、交通运输企业,联合开发智慧交通应用。以大数据为支撑,为应急事件处理开发相关应用,提供应急快速支撑能力。
3.3.5 重大活动、特情保障应用
开发重大活动保障应用和特情保障应用,为领导决策提供支撑。
3.3.6 数据变现应用
积极探索数据金矿,依法依规用数据变现。
3.3.7 北斗应用创新交通运输行业是北斗系统应用的重要领域,全国大量道路营运车辆、邮政和快递运输车辆已经安装使用或兼容北斗系统,基于大数据分析平台和云GIS平台,开发相关北斗创新应用。
3.3.8 下一代高速收费系统
依托数据平台支撑,探索符合山东省经济发展的高速公路收费模式,积极探索差异化收费、ETC优惠政策、自动驾驶和车联网时代的高速公路收费模式,开发下一代高速公路收费的模拟测试应用。
4 结语
山东省高速公路大数据建设必须立足实际、不盲目追随,做好顶层设计和规划,将大数据分析和应用平台建设成为支撑业务发展、业务创新的决策服务平台。