城市交通安全监管大数据系统设计
2022-12-16郑博熊姗姗
郑博 熊姗姗
南京莱斯信息技术股份有限公司 江苏 南京 210014
随着城市化进程的加快,机动车保有量激增,各类交通事故频发,城市交通安全形势严峻,如何有效地提高交通安全水平是迫切需要解决的课题。在这样的背景下,利用大数据技术分析发现存在交通安全隐患的车辆、违规处理的事故和违法业务等,是一种行之有效的手段,可以指导交警部门合理的制定交通安全管理措施、规范交警的执勤执法行为。
1 需求分析
公安交警部门承担着城市交通安全的管理工作,提高交通安全风险预防能力一直是交警部门的核心需求。因此大数据技术的应用,能够为交警部门构建“一车一档、一驾一档、一路一档”信息丰富的交通管理基础数据库,并在此基础上,结合卡口过车、车辆定位数据,对在城市内行驶的车辆的运行规律进行分析,指导交警开展事故预防工作。
同时,为了加强对警员队伍的监管、提升交警工作的规范性,交警部门也需要利用大数据技术,对民警执法执勤、车驾管业务办理、考试业务情况、违法处理、事故处理等业务数据进行分析,发现异常情况并预警,及时纠正错误、防止问题扩大化。
2 大数据基础平台设计
2.1 大数据存储
搭建HDFS通用的分布式文件存储系统,基于具有高稳定性、高容错性等特点,实现结构化大文件的存储。并提供了WebDAV、Thrift、FTP和FUSE等众多的访问接口。采用多副本的存放策略,将副本分别存放在本地机架节点、同一个机架的另一个节点、不同机架的节点,减少了机架间的数据传输,提高了写操作的效率。
搭建全文检索存储,构建可扩展的分布式大规模搜索引擎,实现大规模数据的快速搜索,以及海量数据上的统计分析能力。并具备标准的SQL接口。并具备标准的SQL接口,以及兼容Oracle扩展标准的全文检索的SQL扩展。
基于NoSQL列式数据库存储半结构/非结构化数据,提供支持SQL语法的批处理和高并发查询。并提供智能索引功能提高查询效率,满足半/非结构化数据存储与检索的需要。采用JSON/BSON数据格式存放半结构化数据,操作人员可以直接将JSON/BSON格式的数据存储在分布式NoSQL数据库之中,并对JSON/BSON的任意字段进行查询,创建索引以及删改。对于非结构化的文档类数据,分布式NoSQL数据库通过对象存储技术可以将海量的小文件作为表中的一列进行存储,并通过支持二级索引以及全文索引技术,使得用户可以通过SQL由文档中关键字或者相关文件属性,综合搜索得到对应的文档。
采用Redis内存数据存储,支持key-value、list、set、zset、hash等数据结构的存储。既保留key-value数据库简单快捷特点,又吸收了关系数据库的部分优点,完成数据快速的检索和访问。
2.2 大数据计算引擎
提供低延时高吞吐的分布式消息队列Kafka,支持对主题生产或消费数据整个生命周期的监控,同时能够监控队列运行过程中的资源使用情况、延时情况等。
搭建实时流计算引擎。通过对完整SQL的支持,帮助用户更方便的构建实时数仓业务。提供实时引擎上的流程控制,帮助用户开发复杂的业务流程,实现从业务流程控制到底层计算逻辑的全覆盖;提供高效可扩展的计算引擎来应对大数据量计算;提供实时引擎上的复杂事件处理和规则引擎,帮助用户更方便的定义业务规则和处理逻辑[1]。
搭建离线计算引擎。提供SQL语法支持以及PL/SQL过程语言扩展,并且可以自动识别HiveQL、SQL2003和PL/SQL语法,在保持跟Hive兼容的同时提供更强大的SQL支持。支持在事务中执行一个或多个子事务。提供两种执行子事务的方式:嵌套事务和自治事务。
提供基于图形化的工作流调度设计与管理工具。支持Shell、SQL、JDBC、HTTP等任务类型,以及自定义Java任务。支持对任务的启动、执行到结束整个生命周期的监控。支持多种调度策略,如定时调度、依赖调度、实时调度等。
2.3 元数据管理
采用元数据采集适配技术,接收、解析各种不用类型数据源的数据,将有效的元数据存入模型并建立关系。可以接入Hive、HDFS、Hbase、Mysql、Oracle、SqlServer、DB2、Inceptor、TeraData、Hyperbase、Teradata、SmartBI、FineReport等数据源。提供元数据常规管理能力,包括元数据基本信息、关系、版本的管理维护,以及元数据检核。
2.4 数据标准管理
提供对基础标准、维度标准、指标标准等数据标准的维护、施行和监控功能。
2.5 数据质量管理
定义数据质量检核规则,可包括空值、值域、规范、数据集比对、分组检查、记录一致性、逻辑、自定义等。质量任务执行后会生成质量报告,质量报告包括质量规则、增长趋势、规则类型分布、规则明细等内容。
2.6 数据目录管理
对信息资源目录、指标目录、数据标准词典目录、DBMS目录、信息资源建议标准目录、数据采集对应关系目录、数据采集规则目录、数据质量规则目录、服务资源目录、服务更新情况、服务订阅情况、元数据采集源目录等信息进行管理和展示。
3 交管大数据库设计
3.1 数据主题库
主题库主要包括机动车、人员、事件、道路、企业等主题数据库建设。
1)机动车主题主要记录机动车相关基本信息和轨迹信息,并通过与驾驶人、交通违法、交通事故、气象等多维数据碰撞关联。
2)人员主题包括与道路交通管理信息系统产生关联的驾驶人或者法人机构等。其中针对驾驶人,可从多个方面对其划分,从驾驶人类别上,可以将其分为自然人,与非自然人,从组织形式上,驾驶人又可分为国内及非国内等。
3)事件主题记录了当事人在某地发生的行为信息。通过事件主题,可以了解到是谁,在什么时间,通过什么物品,发生了哪些行为或活动。
4)道路主题记录与道路相关的信息,如道路拥堵信息、交通事故信息等,是分析道路运行状态非常重要的一类数据。
5)企业主题记录企业的各项信息,包括企业的名称、法人、地址、经营主题、营业执照信息、违法记录、企业名下所属车辆检验率、报废率、所属驾驶人违法率、审验率、违法率、事故率等情况,对企业、企业名下的车辆、驾驶人等信息进行全面管理。
3.2 数据专题库
专题库主要包括车辆积分、车辆行为分析、交通态势研判分析、隐患排查分析等专题数据库建设。
1)车辆积分专题库建立针对重点车辆、重点驾驶人、重点客货企业的积分模型。基于重点车辆基本信息(客货运、报废日期、荷载人数/荷载承重等),以及关联的驾驶人、违法、事故、卡口过车等数据,建立重点车辆积分体系;基于重点驾驶人驾驶证基本数据(驾驶人年龄、驾龄、驾照类型、违法积分、教育约谈次数等)、以及关联的机动车、违法、事故等数据,建立重点驾驶人积分体系;基于重点客货运企业基本数据(经营范围、法人信息等),以及企业名下的驾驶人、机动车、关联违法、事故等数据,建立重点客货运企业积分体系。
2)车辆行为分析专题库主要基于卡口过车、车辆卫星定位等数据,对车辆轨迹进行分析,发现车辆常走路线、出发点、落脚点、驻留区域、出入城记录等行驶轨迹规律,以实现对车辆运行轨迹的预测。
3)交通态势研判分析专题库主要基于卡口过车、车辆卫星定位等数据,分析卡点之间不同时间段(高峰/平峰/低峰)的车辆旅行时间、识别高峰期车辆出行O/D规律、不同时段/不同类型/不同归属地车辆的迁徙规律等。并可以结合历史拥堵数据、实时卡口流量、车辆定位等数据,对路段当前拥堵状态进行分析。
4)隐患排查分析专题库基于车辆出行轨迹,对夜间红眼运营车辆、频繁出入指定区域车辆、疲劳驾驶车辆、区间超速车辆、高危地运行车辆等进行分析。
4 车辆监管大数据应用设计
4.1 缉查情报分析
对涉醉驾的驾驶人及其机动车、吸毒人员及其机动车、套牌假牌车辆、多次违法车辆、高污染车、非法营运的营转非车辆、报废车辆的出行轨迹特征进行研判,包括出行区域、出行时段、停留地点等信息,形成执勤执法、警力部署的对策。
4.2 执勤执法安全监管
按照“整合执法数据、强化监督考核、提升分析研判”为目标,“以执法监督与执法数据应用为主线,开展个人综合考核评价,提升执法基础数据的综合应用效能,推动交警执法大监督体系的建立。基于警员基本信息、警员定位数据、违法查出记录、执法视频、执勤工作记录等,对民警执法规范、履职能力、违法处罚记录、执法视频记录、警员工作勤奋度、执法质量等方面工作进行监管和考评[2]。
4.3 车驾业务安全监管
1)考试业务:对考试系统时间异常、项目考试时间过短、非工作时间考试科目一、考试5分钟内合格、考场考试合格率异常、考试设备重叠、考试误判率异常、异地驾驶人,满分学习考试比例异常等情况进行监管分析和异常预警。
2)驾驶人业务:对于驾驶人业务办理数据进行关联核查分析,包括领证后短期转出的涉嫌驾驶证数据分析、考试合格率数据分析、异地驾驶证审验业务数据分析、军警驾驶证换证业务数据分析、业务归档数据分析、驾驶人手机电话重复数据分析、驾驶人档案异常情况数据分析等。
3)机动车业务:对于机动车业务办理数据进行关联核查分析,包括违规替检车辆数据分析、异地车辆检验率数据分析、初检通过率数据分析、异地车辆报废率数据分析、核发临时号牌异常数据分析、逾期未报废车辆数据分析、车辆异地报废数据分析、车辆行驶轨迹查询、业务归档数据分析、档案更正数据分析、同一人员岗位流程操作数据分析、号牌补领数据分析、机动车车主手机号码重复数据分析、机动车档案异常数据分析。
4.4 违法处理安全监管
对违法的驾驶人、机动车的违法信息进行不同维度进行数据分析,可查看监管违法处理事项(如2次超分处罚、超20分处罚、一车三证处罚、满分未扣证、满分继续使用、一年一证五车、一年一车五证、人像未采集等),同时对窗口、窗口自助、银行自助等业务办理渠道的业务总量数据进行统计。
可以根据单位、预警量、处置量、审核量、完成率、属实量、不属实量、属实率数据项统计分析
4.5 事故安全监管
事故处理安全监管覆盖接警、处警、简易程序,一般程序、刑案、归档、复核等完整的事故流程。通过采集接处警系统、事故快处系统、公安交通管理综合应用平台、警务信息综合应用平台等系统的业务数据,同时采集警车警员定位数据、执法记录仪数据、酒精检测数据等与事故处理业务有关的各类数据,对这些数据中的关键监管点进行统计分析,生成监管点状态和监管点预警。
4.6 交通安全情报
对重点车辆、“两客一危一货”车、网约车、超员面包车等机动车、驾驶人及其违法、事故等基础数据统计及其同比、环比、排名变化情况分析,掌握交通安全形势宏观情况及变化趋势;对事故违法行为、交通事故高发区、交通事故成因、重点违法事故、交通违法车辆类型、大公安涉车案件、跨区域车辆特征轨迹等的大数据统计分析,以把握交通事故诱因。建立对人、车、路等交通因素的安全风险等级研判模型,开展事故预防重点区域、路段、时间、车辆、天气等影响因素特征及规律分析。主要包括:“两客一危一货”车辆运行安全分析、网约车辆运行安全分析、超员面包车运行安全分析、事故违法行为分析、交通事故高发区分析、交通事故成因分析、重点违法事故分析、交通违法车辆类型分析等[3]。
4.7 交通拥堵情报分析
对道路路网的整体拥堵趋势分析、交通拥堵时段分析、交通拥堵日分析、高峰时段拥堵分析、各圈层交通运行概况分析、各等级道路交通运行概况进行分析,包括城区交通、周边高速、景区商圈、重点区域等交通路网的运行情况,形成路网拥堵指数分析。
结合智能交通数据、浮动车数据、社会渠道交通资源数据等,对城区主干道、城市快速路、高架桥等主要路段及重点区域进行拥堵评判,并结合预测性分析、可视化分析、实时性分析方式,对于工作日高峰期、平峰期以及节假日情况进行拥堵评判。
4.8 交通安全设施应用分析
通过对各类交通安全设施的设备数量、设置点位、故障上报、故障处置以及交安设施施工进度等相关数据进行综合性分析研判,整合交安设施设备资源的同时,以便对交安设施综合性规划合理布置,掌握交安设施故障上报、交安设施问题处置情况并对施工单位施工进程进行监督管理[4]。
4.9 交通组织应用分析
1)尾号限行交通组织应用分析:根据机动车数据、过车数据等,对尾号限行机动车的注册区域分布、行驶区域分布、行驶路径、车辆在途量等进行研判分析。并结合车辆用途,分析城市交通出行、城市通勤等规律,对尾号禁行、限行措施的政策实施进行评估。
2)异地车辆交通组织应用分析:根据过车数据,对异地车辆的行驶区域、行驶时段、行驶路径进行研判分析,对异地车辆的交通管理政策实施进行评估。
3)专用车道管理应用分析:对公交车道、单行道、潮汐车道、HOV车道等交通组织情况进行研判分析,包括禁限措施分析、车道分配情况分析、左转待转分析、直行待转分析、非机动车管理分析等。
5 结语
本方案利用大数据技术对机动车、驾驶人、事故、违法、过车、车辆定位等数据进行分析,发现问题车辆和驾驶人,并评估交通安全风险,指导交警部门开展治理行动,提升城市交通安全水平。同时,针对事故处理、违法处理、车驾管业务办理等进行全流程监管预警,发现警员队伍内部问题,推动交警监督管理体系的升级。