铁路工务基础数据可视化管理研究
2024-06-30曾祥富王修历
曾祥富 王修历
摘 要:该文分析工务基础数据管理、铁路工务管理信息系统应用以及台账主管人员数据素养水平现状,针对基础数据不准确、难以捕捉异常、与本地数据关联不足、台账主管人员数据素养水平存在差异等问题,在铁路工务管理信息系统导出数据的基础上,结合本地生产管理数据,提出基于Tableau的基础数据可视化分析实现路径,并给出台账主管人员数据素养提升策略。
关键词:铁路工务;基础数据;可视化分析;Tableau;大数据
中图分类号:C37 文献标志码:A 文章编号:2095-2945(2024)19-0143-04
Abstract: This paper analyzes the basic data management of public works, the application of railway public works management information system and the current situation of data literacy level of account managers. In view of the problems such as inaccurate basic data, difficult to catch anomalies, insufficient association with local data, differences in data literacy level of account managers, and so on, on the basis of data derived from railway public works management information system, according to local production management data. This paper puts forward the realization path of visual analysis of basic data based on Tableau, and puts forward the strategy to improve the data literacy of account managers.
Keywords: railway public works; basic data; visual analysis; Tableau; big data
铁路工务基础数据众多,传统基础数据主要通过铁路工务管理信息系统(以下简称PWMIS)进行管理,并导出Excel统计数据开展二次分析,但日常管理存在数据不准确、分散不关联、动态更新不及时和可视化展示不足等问题。同时,工务设备台账管理人员在数据意识、数据知识、数据技能等方面也存在差异。
大数据时代,需要管理者快速、高效理解与挖掘数据背后的信息[1],需要在PWMIS系统导出数据的基础上,结合本地生产管理数据,对工务基础数据进行深度挖掘和关联分析。以Tableau为代表的商业自助式BI工具在大数据可视化管理方面优势明显[2],可以此为载体开展本地数据可视化管理。同时,相较于传统数据而言,大数据不仅体量庞大、类型复杂,还具备时效性强、价值密度低的特征,大数据的诞生促进了人们工作思维及生活方式的转变[3],对数据管理人员的数据能力提出了更高的要求,因此亟需提升工务基础数据台账管理人员的数据素养。
1 工务基础数据管理现状
1.1 工务基础数据组成及应用情况
1.1.1 基础数据组成
PWMIS包含工务基础数据管理、工务安全生产管理、工务地理信息应用、工务检测监测数据管理和工务修理辅助决策管理五大子应用模块。其中工务基础数据管理包括线路设备、桥隧设备、路基设备、运营情况、专题图(综合图、配线图及速度图)、LKJ数据(车站、股道、道岔、线路允许速度、坡度、曲线、桥梁、隧道、道口、正线里程信息表和线路里程断链表等)。系统组成如图1所示。
1.1.2 PWMIS基础数据应用现状
铁路工务专业通过多年信息化建设,建立了基于PWMIS的工务基础台帐信息化管理。特别是PWMIS2.0升级版应用以来,一定程度上解决了长期以来工务基础设施图纸资料、技术档案以及图形图像等数据分散管理,未与基础台账信息建立关联等问题,有利于专业管理人员及现场作业人员全面掌握设备设施状态,为工务精细化管理及现场问题处置提供了便利。但在实际应用中还存在如下问题:
数据不准确。每年线路新建、大修、更改数量较多,且运营一段时间后线路线型也在发生变化,加之铁路局集团公司、站段、车间及工区各层级信息不对称、设备管理单位与施工单位技术交接不到位等原因导致数据不准确[4]。
数据异常难以捕捉。PWMIS导出的设备基础信息仍以Excel表格统计为止,数据缺少可视化展示,出现数据异常很难被发现。
数据与本地数据关联不足。目前工务生产管理仍存在大量信息需在本地进行管理,特别是临时性、突发性工作任务,单靠PWMIS数据分析查询功能无法完成深度分析。
1.1.3 基础数据可视化分析必要性
针对数据不准确问题可通过建立完善相关制度,加强专业管理加以解决。针对数据异常难以捕捉、与本地数据关联不足等问题可通过商业BI工具可视化分析来实现。通过可视化分析将帮助决策者快速思考,获取信息,做出判断[5]。
通过系统化规则或算法识别异常数据。一是基于固定数值的异常判断。如结合年度大维修任务完成情况统计发现年度设备变化异常处所,反推设备台账记录。二是基于相对数值的异常判断。如同比和环比情况,将现有设备与历史设备数量进行对比分析。三是基于统计分布的异常判断。比如可通过盒须图、分布区间、标准偏差等方式分析异常偏离值。
管理本地数据实现数据深度挖掘。单项工作需在PWMIS基础数据上关联实际需求,从业务出发寻求合理的专业解释,洞察事物变化规律。通过可视化分析有助于全面精准定位问题,制定针对性措施。
鉴于专业管理人员日常管理需求和工务基础数据量大、时效性高、数据关联性强等特点,亟需在PWMIS导出数据基础上,开展工务基础大数据可视化分析研究,以便及时发现异常,洞察规律。
1.2 台账主管人员数据素养水平现状分析
1.2.1 数据感知意识淡薄
数据意识通常是指对数据和数据问题的感受力,以及对数据价值的洞察力和判断力,它决定了获取、判断和利用数据的自觉度[6]。部分工务基础管理人员因长期从事某个单项工作,所处层次不同,不能及时从数据视角来捕捉生产管理行为带来的变化,不会主动搜集、分析安全生产管理所带来的基础数据变化,从而在主观上导致基础数据得不到及时更新。
1.2.2 数据知识储备不足
一是统计学基础知识欠缺。部分台账管理人员对描述性统计中离中趋势、集中趋势以及分布特征各项指标混淆,理解不到位,不会运用基本的描述性统计指标对数据进行分析。二是不注重可视化原理运用,错误选择图表类型。比如在表达趋势型、占比型、对比型图表类型上选择错误。在研究某一区段线路设备数量随时间变化趋势时可以选择柱状图和折线图,但却不能清晰地鉴定柱状图和条形图的区别。通常如果观测的时间是离散型变量,如1月、3月、5月、7月这样的时间序列,且柱子不超过12个时,可以选择柱状图。但是如果观测的时间是连续性变量,如1月15日、2月21日、3月24日等,观测的时间点甚至多于12个时,此时优先选择折线图。
1.2.3 数据分析能力欠缺
一是展示手段不足。目前基础数据分析各类展示报告中,传统的三图一表仍是主要的可视化展现方式。所谓三图一表,即条形图、折线图、饼图和交叉表。而大数据分析通常强调大数据样本的宏观特征、分布规律和相互关系,对应的直方图、盒须图和散点图等高级图形应用较少。至于基于地图统计分析、互联网元素的文字云、树状图、气泡图等应用则更少。二是分析问题解析与层次研究。通常的数据分析为迎合决策者个人需求,比如上级要求哪方面内容,则提供哪方面内容。台账管理人员的个人思考受限于其掌握的工具,通常编制的报告罗列了大量的数据,并花费大量时间用在文字修饰和排版上。
1.2.4 辅助决策能力不足
一是缺少数据交互分析。台账管理人员所依赖的定制数据分析手段缺少数据交互,不利于快速决策。数据交互是自定义分析的前提。经常台账管理人员只能被动地接受分析结果,而不同的决策层所关注的重点又有所不同,对比的层次也不尽相同,这时候就需要一些假设性检验,所以也需要更多的交互。如何让管理者用感性直觉的思维快速做出理性正确的决策也是摆在台账管理人员面前的问题。二是未遵循基本表达分析逻辑。基本的分析逻辑包括区分用户、真实准确、符合大众认知与审美、适度原则和五秒原则等。区分用户主要指基础数据提供给集团公司经理层、站段管理层和车间执行层的内容和角度应该是不一样;真实准确则是对数据分析的时候必须真实客观地反映,避免人为去粉饰掩盖问题,避重就轻去分析原因;符合大众认知与审美指的是要尊重行业表达逻辑和审美习惯;适度原则即适度即可,过犹不及;五秒原则是指数据分析的结果让人能快速准确获得作者想表达的信息。
2 基于Tableau的基础数据可视化分析
2.1 基础数据可视化方案设计
2.1.1 功能需求设计
基于自定义地图的基础数据可视化展示。主要对管辖范围内基础设施设备进行统计分析,快速定位薄弱区段、问题设备,设备质量整体把握,并关联人员、机具、材料等生产生活设施。
自助式数据统计分析。利用BI工具的交互特性以及数据分析灵活性,依据不同维度不同统计指标,自助式开展各类统计分析工作。
异常数据识别。分别从基于固定数值、相对数值和分布特点3个方面对异常值进行提醒识别。
2.1.2 基础信息设计
各类工务基础数据表。包括线路设备、桥隧设备、路基设备、运营情况、专题图和LKJ等基础数据以及本地管理的业务数据。
2.1.3 可视化设计
首先准备好数据展示的各类图表,注意依据数据可视化设计原则选择合适的图表[6],常用的图表类型选择见表1。
各类构成仪表板元素的图表确定后,需要确定合适的屏幕分辨率和设计稿尺寸,根据工务基础数据日常分析需求,抽取业务场景关键的指标,明确主次关系,提取业务中用户最关心、最核心数据进行展示,对于次要的数据源和控件可以适当弱化设计。
2.2 数据准备
数据准备包括数据处理和数据建模2个阶段。数据处理主要是读取本地数据及PWMIS导出基础数据,在TableauPrep Builder和Tableau Desktop中完成数据处理。数据建模主要利用Tableau Desktop联接和混合功能建立星型数据模型。
2.2.1 数据处理
利用Tableau Prep Builder进行数据预处理,常用数据处理内容包括字段重命名、字段筛选、清除异常值及重复项、数据转置、聚合计算和数据合并等。
2.2.2 数据建模
针对基础数据管理的多张表,使用不同的关系、联接和并集组合建立数据关系模型。主要通过2个层次来建立数据关系模型。一是在物理层,通过联接、并集形式对各类基础信息数据进行处理,如将不同站段的人员生产管理信息通过数据并集形式进行合并生成新的总表。二是在逻辑层,不同表之间通过关键字段建立关系。如在TableauPrep Builder中对车站信息表、股道信息表进行表间联接操作,将线编号、车站名等字段作为关键字段放入联接子句,通过右侧联接方式快速识别两表不匹配处所,及时核对更改。
2.3 可视化实现
2.3.1 全局设备概览
主要对局管内线管辖线路里程、车站总数、股道条数、曲线条数、道岔组数、桥梁隧道座数和道口个数等基本情况进行统计。如图2所示,某局管内工务设备总体概览。
2.3.2 各类设备统计分析
根据业务需要对某单项设备自助式分析。如图3所示,某局管内所有道岔分布按线别、按车站、按图号进行统计分析。安排大修计划需要淘汰某种型号道岔时,可通过交互快速定位到其分布车站,也可与大维修历史数据关联其大维修信息。
3 台账管理人员数据素养提升策略
3.1 推进数据意识培养
一是在工务系统内部积极营造数据分析氛围。定期组织专题培训,提升台账管理人员的数据意识,增强对数字信息的敏感度,开展类似Excel等基础数据分析工具的培训工作。通过以比促学等方式增强台账管理人员对数据知识的求知欲,锻炼利用检索网络数字资源分析和解决问题的能力,并不断提升自身的数据资源应用水平和利用能力。
二是重视数据分析思维模式的培养。数据分析思维是在数据分析过程中,一套完整的发现、思考、解决问题的方法论,通过建立一套科学合理的数据监测与评价体系来总结规律、发现异常、提出建议。数据分析思维通常包括结构化思维、公式化思维和业务化思维,台账管理人员可从不同维度加以提升,见表2。
3.2 分层分类开展培训
一是加强数据知识学习。台账管理人员应熟练获取各类数据,了解数据源、数据获取途径,掌握检索与收集数据的基础能力,能够对数据的格式、类型、特点做出精准解读。能用基本描述统计量描述基础数据的平均值、中位数、标准差和分布特征等,合理选择图表表达解释数据。
二是提升数据分析技能。如通过开展软件使用培训,让台账管理人员可以灵活选择工具处理分析原始数据,利用统计分析软件对获取的数据做出恰当统计分析,结合经验与实际对统计分析结果做出精准解释。如结合生产实际构建多元化数据应用场景,提升数据理解能力及迁移能力。
4 结束语
工务基础数据管理工作重要且繁杂,大数据时代对数据管理者的数据意识、数据知识、数据技能提出了更高的要求。通过开展基于Tableau的铁路工务基础数据可视化管理实践,助力台账管理人员提升数据素养,提升了大数据应用能力,提高了工务基础数据管理水平。
参考文献:
[1] 李擎,张秋艳,白磊.一种基于文本挖掘的铁路基础设施设备风险隐患识别模型[J].铁路计算机应用,2018,27(2):1-4.
[2] 雷元.34招精通商业智能数据分析·Power BI和Tableau进阶实战[M].北京:电子工业出版社,2021:1-2.
[3] 吴明宇.大数据时代下高校教师数据素养能力的提升路径[J].经济研究导刊,2023(13):127.
[4] 王丽洁.工务线路设备技术台账失准的原因及对策[J].铁道技术监督,2013(5):30-32.
[5] 喜乐君.数据可视化分析·业务可视化分析[M].北京:电子工业出版社,2021:8-10.
[6] 郝媛玲,沈婷婷.高校文理科研究生数据素养比较[J].图书馆论坛,2016(8):126-132.