基于源点的铁路统计系统设计与实践
2020-10-09张春来
摘 要 本文介绍了2018年以来建设的铁路统计系统,基于源点信息超级汇总、联网直报、一体化集成的设计理念,项目建设情况,分析了实施中存在的问题,提出相关建议。
关键词 铁路统计;信息系统;设计;实践
引言
为进一步提升铁路统计工作效率,及时、广泛地汇聚运输生产、客货营销、运力资源、人员管理等业务领域的信息,提高统计数据的广度、深度以及质量,加强将信息快速转化为分析报告的能力,彻底解决原统计信息系统标准、共享、服务等方面存在的不足,2011年铁路总公司开始研究设计新的信息系统,2013年立项研究综合统计信息系统标准及关键技术,提出基于源点、高度共享的方案,2018年5月批复系统建设可研,经过两年的建设,部分应用已投入试运行,逐步发挥作用。
1系统设计的要点
统一基础编码,规范治理、完善源点数据信息,建立完备的统计数据仓库,搭建统一的共享平台,在此基础之上开发指标生成、信息发布、数据分析、预警预测、辅助决策等统计应用功能,即要建成一个完全融合、高度共享、应用丰富的铁路统计综合信息系统,推动统计变革,实现流程再造,促进决策科学化和管理现代化。
1.1 以报表为核心变为以源点信息为核心
源点直接采集。新系统的设计,改变以往以报表为核心的统计体系,只从最基层采集报表所需最小颗粒度原始信息,各级统计人员可以从原始信息抽取数据、指标,很便捷地自由组表。数据采集通过标准化应用实现,源点信息从产生的设备、人员或相关信息系统直接获取,采集内容包括对象唯一永久编码、属性、数值等信息,其中部分属性信息虽然已包括在相关编码字典中,但仍需从源点获得,用于准确性和一致性的校验。数据采集接口可通过字典实现定义修改,提高对源点信息变化的适应能力。
数据自动获取。在技术具备的情况下,最大限度地实施原始信息的自动获取,减轻一线统计人员的工作压力。相关业务应用系统信息已集中到总部数据服务平台上的,直接在总部共享,如12306、95306系统中客票、货票信息,原则上不再从铁路局或站段采集;优先从智能设备获取信息取代手工录入,如列车监控记录仪中运行时刻、智能电表中电量;对于暂不能满足统计需要的数据源,向信息化主管部门提出需求,依托国铁集团统一规划建设共享数据的采集点。
信息联网直报。以原始信息为基础的模式下,不再需要经过车间、站段、路局等逐级上报,从数据源点直接通过网络传输至总部。铁路大部分信息源点建设在内部网络上,对于部分在外部互联网络上运行的业务,如物资采购、工程管理、公安系统等源点,考虑了网关+安全证书模式采集。
1.2 信息分散存储变为集中存储
数据集中存储。铁路各类源数据及公路、航空、水运等相关行业信息,以及国民经济、人口等相关资料将集中存储至国铁集团,形成统一的数据中心,原则上路局、站段不再保存全量数据。所有采集的信息纳入数据库前,将由人工、智能相结合的方式进行审核、校正、容错处理。
核心链条聚合。在细颗粒度获取源点数据的基础上,以铁路主营运输业务为核心进行关联,聚合形成旅客、货物由发至到全过程贯通的链条,以强结构化的数据,支撑全方位、多角度、精细化的运输生产和经营分析。
历史数据转换。铁路统计部门积累了数十年历史数据,分布于各专业统计系统中,部分还保存于铁路局,如固定资产投资统计,需按新编码和结构标准编制转换加载程序,将珍贵的资料迁移到新系统中。同时研究纸制存档资料转换,如统计资料汇编等,逐步进行扫描识别,经过质量校验后,存入数据平台。
1.3 一体化的数据服务平台
查询功能集成。在数据完备、指标完善的基础上,构建集信息管理、处理、应用为一体的统计数据应用平台,实现以需求为导向的数据管理,全部指标数据的在线汇总、查询、分析和图表生成,以及数据、文字、图片等各类统计信息的高度共享。
三级一体应用。新系统的设计为总部、铁路局、站段三级一体化信息系统,通用功能开发由国铁集团负责,按照用户授权给各级用户使用,个性化功能按照路局和站段需求自行开发。
专业融合服务。新系统的设计不再区分统计专业,不以报表服务为重点,通过中央数据库中不同原始数据和字典关联,直接产生不再区分专业的统计指标,为铁路运输生产和经营管理决策提供信息服务[1]。
2系统建设实践
新的统计系统建设单位为中国铁路信息技术中心,施工单位为铁道科学研究院电子计算机所。2018年5月原铁路總公司批复可行性研究报告,工程启动,8月10日完成施工图设计,进入实质性建设阶段。
2.1 建设计划
可研批复工程总工期按24个月安排,分两个阶段建设。
第一阶段(9个月)建立统计编码管理体系、搭建系统框架,初步实现原始记录综合应用,融合转换总公司级历史统计数据。建立系统的基础环境,初步建成数据仓库,实现部分原始数据的采集、清洗、校正、整合、计算、分析和展示全过程处理,初步构建统计工作门户。在新系统上实现既有系统功能。
第二阶段(15个月)基于已经建成的基础环境,扩大数据采集范围,提升数据采集的自动化程度。增加更多的专题分析,增加辅助决策功能,设计多样的数据产品服务环境。完善展现交互层、统计门户,建设综合监控功能,增加更多的物理展现方式。建立规范标准的信息交换机制,获得互联网渠道的大量信息,提升决策分析的全面性、科学性。深化铁路统计大数据应用。在已获得较完整数据的基础上,提高数据质量,实现部分数据实时更新,进一步拓展和深化统计应用,实现深度分析、实时辅助决策支持的强大功能。
2.2 完成情况
2019年3月硬件安装完成,6月相关数据仓库调试完毕,进入系统开发阶段。2019年10月,统计系统主页上线,部分功能模块试运行,系统初步建成。
基本完成主要原始统计数据的集中共享。客票货票等铁路各类统计相关原始数据已按目前能获取的最小颗粒度采集,并传输至总部数据库集中存储,目前正在建立相应的分析模型,形成铁路统计基础性数据资源的“一次采集、多次使用”。近10年的统计资料汇编已入库,新中国成立以来各年度铁路里程、客货运量等主要统计指标也已转换成电子数据。
基本的数据分析及展现应用初步形成。新系统部署了帆软BI数据分析工具,根据不同的需求获取统计信息,提供友好、多样、直观的数据展现界面,具备以数字、图形等展示各类分析指标的能力。对于大宗品类点到点运输、线路能力利用情况等专题,开发了基于GIS地图展示的应用。
部分领域的大数据应用建设初显成效。在新系统基础数据的支持下,完成了部分研究专题,如:动车组客座率的分区域(东中西)、分车次类型(高铁城际动车)研究;铁路货运分品类、分发到站的价格指数研究。这些专题研究成果的取得也进一步推动了系统应用的建设。同时,利用当前流行的大数据技术,正在开展旅客、货主画像研究的基础应用建设。
2.3 难点和重点
信息系统建设需与相关业务升级相结合。数据整合是基础,业务整合是关键,没有业务流程升级的前提,信息系统只能仍按原样分专业开发,目前仅分析应用按照基于源点的思路建设。只有进一步推进各业务融合,才能有效、深入地整合数据,也只有专业的深度融合,才能推进基础编码的进一步统一。
信息共享是推动系统建设的重中之重。共享是信息服务的基础和起点,只有将新系统中的各种基础数据和指标提供给客运、货运、运输、调度、机辆、工电、规划、投资、经营、财务等用户使用,让参与人员享受到方便,才能有推动系统建设和完善的积极性。这种积极性也能促进业务基础数据的接入,目前总部级数据接口协调基本完成,但数据准确性、完整性需要在实际运用中进一步检验并完善,铁路局级接口数量多、差异性大,下一阶段协调工作难度更大,如能让铁路局从系统中获得更多有用信息,将会促进相关工作的推进。
数据链条整合尚需进一步推进。虽然大数据技术可以大幅提升非结构化数据的价值挖掘能力,但对业务数据结构、关系的强化和聚合度提升,不仅相对容易,而且可以更加直接、有效地提高系统建设的成效。货运链条在新系统开建前已基本形成,按照设计方案,需进一步关联设备、人员等相关成本信息,而客运从发至到链条尚未启动。
3相关建议
3.1 业务流程再造与系统建設相互助力
推进以源点为基础的统计业务系统建设,对既有各专业、各类统计信息系统进行整合,统一上报、收审、存储,同时根据年度汇编、指标手册、定期统计分析等需求,构建以服务决策支持为核心的重要统计指标体系。通过将每一个指标向下追溯到数据源点,从上至下实现与源点系统的对接,逐渐形成以基本单位、运输设备、从业人员为视角,服务于运输生产和经营管理的统计体系升级再造。
3.2 通过加强信息共享推动系统建设
在收集整理各业务部门数据同时,要主动加强与各级各业务部门的沟通,共享基础数据和各类指标,提高业务部门获得感和参与的积极性,加快推动统计系统建设。
3.3 进一步推进数据链条整合
加快旅客从发至到链条建设,逐步在货运链条上增加设备、人员等信息,并向出发、到达两端驳接转运、接取送达等环节延伸,推进铁路主营业务全过程的效率和效益分析数据基础形成和深化。
4结束语
坚持扩大成果共享,努力推动基础编码进一步统一和数据链条完善,并对相关应用根据用户需求持续迭代升级,2~3年内必将形成源点信息更加丰富、服务更加完善的铁路统计信息系统。
参考文献
[1]李想.基于100G OTN技术的X市城域网组网方案研究[D].长春:吉林大学,2018.
作者简介
张春来(1975-),男,河南南阳人;学历:大学本科,职称:高级统计师,现就职单位:中国国家铁路集团有限公司,研究方向:铁路统计信息化。