铁路货运承运清算原始记录数据容错纠错处理方法研究

2018-01-25郭晓黎阎胜勇高志远高小珣

铁道货运 2018年8期

郭晓黎，阎胜勇，高志远，高小珣

(1.中国铁道科学研究院集团有限公司运输及经济研究所，北京 100081；2.中国铁道科学研究院集团有限公司北京经纬信息技术公司，北京 100081)

1 概述

随着铁路货运组织改革以及现代物流精细化管理的进一步深化，中国铁路总公司大力推动创新运输统计工作，逐步形成由传统逐级上报统计报表转变为以原始记录综合应用为核心的方式，同时运输生产全过程统计分析的实现也成为货运承运制模式下《铁路货物运输进款清算办法(试行)》(铁总财[2017] 333号)[1]实施的重要前提与基础。根据新的清算办法，取得全程货物运费进款的承运企业按计费工作量和对应清算单价逐票向提供服务企业支付机车牵引费、线路使用费、车辆服务费、到达服务费和综合服务费等5项费用，同时提供服务企业按车流工作量、中国铁路总公司调度命令实际完成工作量和对应清算单价清算承运企业的付费[2]。由于中国铁路总公司依据成本及市场变化情况适时调整全路统一的清算单价，因此，构建一套科学合理的原始记录数据容错纠错处理方法对于准确统计工作量、计算运输企业盈亏结果至关重要。

铁路货运承运清算原始记录数据主要来自清算运统1、货物运单和司机报单。其中，清算运统1涉及列车、车辆基本信息，来源于货运列车编组统计信息系统；货物运单涉及货物、车辆基本信息，来源于货运制票系统；司机报单涉及机车、列车基本信息，来源于机车统计信息系统。现阶段货运承运清算仍处于初期试行阶段，虽然货运制票、货运列车编组统计、机车统计、车站管理、集装箱管理等运输生产及统计信息系统随着逐票清算需求日益完善，各系统内部与系统之间的数据传输共享、校对核验等保证了运输全过程数据处理的高效性、及时性，然而以清算运统1、货物运单和司机报单为核心的原始记录由于受到运输生产组织本身的错综复杂条件、基层业务人员手工填报缺乏规范性、审核管理流程不完备，以及主观人为干预等因素的影响或限制[3]，导致三大原始记录本身在不同程度上存在一定数据质量问题，使得每张货物运单对应机车、列车和车辆实际走行轨迹的确认存在错误或不连续的情况。

为实现逐票货运承运清算，需要将清算运统1与货物运单、司机报单进行关联匹配，而存在数据质量问题的原始记录将会在关联匹配环节中产生连带负面效应，影响运输全过程统计分析的客观性、连续性与准确性，最终可能导致货物运输进款分劈的精准性有所下降、铁路运输企业收入与成本匹配的失衡性，以及市场营销积极性的减弱。为此，重点基于提供服务企业以实际走行径路为依据的清算收入工作量统计环节，通过清算运统1与货物运单和司机报单的关联匹配、逐票实际走行径路分析，以及违流货物运单判定3个方面，系统分析原始记录数据容错纠错处理方法，尽可能地降低或克服数据质量问题，实现提供服务企业工作量的准确统计。

2 原始记录数据容错纠错处理方法

2.1 清算运统1与货物运单、司机报单匹配

中国铁路总公司按照整车、零担、集装箱等运输类别，通过发站、到站、制票时间、发车时间、货物品类、票据号码、空重标识、车辆使用属性等关键信息，将货物运单与清算运统1进行关联，实现货物与车辆的绑定。铁路局集团公司通过列车车次、发车时间、编组辆数、列车总重、列车载重、列车换长等关键信息，将清算运统1与司机报单进行关联，实现列车与机车的绑定。两者均采用“先严格、后宽松、再放弃”的原则进行多轮迭代匹配，即首先按照各项关键属性信息严格进行相互匹配；其次对某些不重要的属性信息增加冗余度，在此基础上继续匹配；最后放弃某些不重要的属性信息再继续匹配；如果信息仍未能匹配，则只能通过人工指定的方式进行关联。实际匹配过程中的关键处理方法如下。

（1）车站名称推断。由于司机报单每条记录的起讫点为站场，并为手工输入较为随意的车站电报码、车站名称，如“丰西一场”“丰一”等。该类形式仅为机车司机或所属机务段统计人员所熟悉，无法达到与清算运统1列车信息匹配的标准。因此，为了准确反映出发或到达车站，需构建标准化的站场对应车站电报码、车站名称及车站推断方法，避免由于统计人员笔误或业务不熟悉造成站场与标准车站对应关系错误的问题。按照机车交路建立大区段与统计区段的对应关系，通过司机报单中的区段编码找到相应大区段码，并找出线路统计区段中的分界站。分界站是判断编组中出发站的重要依据，通过区段编码、区段分界站，结合站间里程推出与区段分界站相邻前方车站。如果在同一统计区段内该站前方还有相邻站，则继续利用站间里程推算前方站，依次类推。

（2）司机继乘站设置。发生司机继乘情况时，司机报单在继乘站会产生一条记录。虽然按照《铁路货车统计规则》(铁总计统[2017] 195号)[4]要求，车站在继乘站也应报告出发清算运统1，但由于各种原因使得继乘站报告完整性始终无法保障，造成司机报单漏匹配问题。因此，需要引入继乘站字典，由机务段根据实际业务情况明确继承站。

（3）匹配参数冗余设定。除了继乘站问题，车站漏发清算运统1、错填基本参数信息，司机报单错填基本参数信息及交路区段字典、站名字典不完善等原因均会造成司机报单与清算运统1的匹配异常。因此，按照开行车次、发车时间、编组辆数、总重和载重由严格条件至引入一定浮动范围的参数设定以进行迭代处理。

（4）“总对总”审核。按照关键参数信息建立清算运统1和司机报单摘要库，着重从列车出发角度而非车辆角度，利用同列分组和视同匹配对走行过程进行处理，完成全部司机报单和全部清算运统1的关联匹配。其中，同列分组是指在同一个运输企业内，将其清算运统1列车编组状态不发生变化的，即列车辆数、列车总重、列车换长、首尾车号完全一致的记录使用同一标识进行分组处理；对其司机报单中同一机型机车号牵引的所有货运记录，如果列车编组辆数、总重、换长等均未发生变化，使用同一标识进行分组处理；以上同一组内的清算运统1和司机报单视为同一列车。视同匹配是指在同列分组的基础上，只要同一组内有一条清算运统1或司机报单完成匹配，即视为该组所有记录均被匹配。该方法可以解决分界口通过、车次变更站、机车继乘站等冗余记录的匹配问题，进而提高整体匹配的完整性。

2.2 逐票实际走行径路分析

经过货物运单与清算运统1关联匹配、清算运统1与司机报单关联匹配，实现了货物与车辆关联、车辆与列车关联、列车与机车关联，进而可以进行每张货物运单全程走行过程的分析。通过对处理过程中关键环节的容错纠错，实现准确计算每张货物运单的实际径路。

（1）区段走行里程超限处理。当机车牵引列车通过全程区段时，其走行里程与区段字典里程保持一致。由于区段里程通常采用营业里程，而司机报单中的走行里程一般为手工填记，为避免最终计算得出的机车牵引总重吨公里误差较大，该功能通常用来检查司机报单填记走行公里的准确性。由于业务操作系统之间允许存在一定误差，但是超出规定的比例之后，中国铁路总公司级原始记录综合应用系统会强制修正，统一使用标准字典里程进行处理。

（2）全程走行里程差异处理。对货物运单全程走行计费径路里程、实际径路里程对比，分析实际走行过程存在的差异及原因，同时对差异占比超过10%货物运单进行实际径路走行过程检查[5]。

（3）车辆连续性处理。车辆走行过程是按照机车走行过程进行反映的，除去始发车辆及货物终到车辆以外，其他车辆的走行轨迹均应在同一车站有到、有发。从车辆有到、有发的角度，对每张货物运单的走行过程进行修正。例如，对于有到、无发的情况，从漏发清算运统1、运用转为非运用状态、车辆报废、现在车系统车号重复、出发时间错误等角度进行处理；对于有发、无到的情况，从漏做列车到达、非运用转运用状态、新造车辆、现在车系统车号重复、出发时间错误等角度进行处理。

（4）机车与列车走行一致性处理。对机车走行站序和列车走行站序进行对比分析，分别从车站、运输企业、铁路局集团公司的走行顺序检查数据质量。

（5）始发车辆丢失处理。对异地制票装车、地方铁路公司未做司机报单或清算运统1、专用线调车等情况进行检查。该类主要由运输生产组织造成的问题，因纠正起来需要协调修改相关部门的规章制度较为困难，可以通过建立异地装车字典、设置地方铁路公司固定区段径路等直接进行工作量的补充。

（6）终到车辆审核处理。主要原因基本与上述始发车辆丢失类似，涉及异地卸车、分流卸车、区间卸车、地方铁路公司内卸车、铁路专用线内卸车等情况，处理方式也是依靠建立工作量字典进行补充。

（7）全程走行连续性处理。从铁路局集团公司统计颗粒度连续的角度对每张货物运单走行过程进行梳理，按照是否在相关对应字典、是否在相邻统计区段、是否在同一统计区段、是否在同一车务站段、是否无任何关系等方面分类检查，同时提示出发生不连续的所在位置，使铁路局集团公司和车务段管理人员快速发现问题根源、及时调整修正。

（8）清算运统1补充处理。对于一些始终无法发现问题原因的情况，如货物运单与清算运统1的关联匹配，中国铁路总公司级原始记录综合应用系统利用手工干预的方式指定货物运单车辆装载信息，直接进入实际径路的计算。

2.3 违流货物运单判定

货物运单实际走行过程与车流径路不一致的均为违流，违流分为有令违流和无令违流。其中，实际走行过程符合中国铁路总公司调度命令要求的，视为有令违流，按其实际走行过程确认清算工作量；实际走行过程不符合中国铁路总公司调度命令要求的，视为无令违流，按其车流径路确认清算工作量。违流货物运单的处理主要依据局间分界口准许迂回的调度命令，在中国铁路总公司级数据处理平台利用调度命令筛选出实际违流的货物运单，并按实际径路或车流径路计算这些违流货物运单的走行过程。具体处理方法如下：从调度部获取调度命令，通过程序智能分析并经人工审核后，形成调度命令信息分析表。一般情况下，局间分界口准许迂回的调度命令格式符合“自XXXX年XX月XX日XX时XX分至XX月XX日XX时XX分止，原经XXXX站/地区经由XX分界口去往XX地区/局的车流，准许途经XX分界口迂回运输”。照此格式进行文本分析，同时结合相关基础字典信息，在系统页面提示调度命令分析结果，要求人工审核确认。

按照调度命令信息分析表，从基础货物运单数据库中，筛选出符合调度命令描述的货物运单，作为预违流货物运单。例如，调度命令为“成都局达州支点产生的原经宜万线凉雾口运输的到武汉局凉雾至宜昌东间车流及宜昌东以远车流，准经达州、胡家营口迂回运输”，则从货物运单数据库中，查找调度命令有效日期前后15日以内，始发站为达州、到达站为字典中定义“凉雾至宜昌东间车流及宜昌东以远车流的所有车站”的货物运单，作为该调度命令对应的预违流货物运单。逐一审核预违流货物运单实际走行过程。凡在调度命令有效日期内，在准许迂回局间分界口的清算运统1中出现过的视为有令违流，否则视为无令违流。

3 结束语

通过基于清算运统1与货物运单和司机报单匹配、逐票实际走行径路分析、违流货物运单判定的原始记录数据容错纠错处理方法，能够反映每一张货物运单、每一台机车、每一辆货车和每一批货物的全程运输动态，切实满足了逐票承运清算对于原始记录数据提出的要求，实现了清晰明确、合理分配货物运输进款的清算目标。货运承运清算是中国铁路总公司不断深化货运组织改革，强化运输企业市场主体地位的一项重大财务清算制度变革，对于满足运输生产指挥和财务清算需要具有重要意义。为进一步完善承运制工作量统计方法、实现准确反映运输企业经营效果的目标，中国铁路总公司相继制定并实施了《铁路货运承运制工作量统计管理办法》(铁总发改[2017] 335号)[6]、《关于进一步做好货运承运制统计工作的通知》(发改统计电[2018] 7号)[7]和《关于做好货运清算统计工作量审核处理的通知》(发改统计电[2018] 22号)[8]等。由于货运承运清算制度刚刚起步，还需要进一步落实运输生产及统计信息系统建设、完善清算价格形成机制、强化综合管理水平等，切实保障货运承运清算顺利实施，满足市场化经营管理需要。