上海局高铁智能化配餐分析和对策研究

2019-11-15张剑霞中国铁路上海局集团有限公司上海华铁旅客服务有限公司

上海铁道增刊 2019年2期

张剑霞中国铁路上海局集团有限公司上海华铁旅客服务有限公司

1 现状分析

1.1 背景描述

近些年，中国的高铁发展迅猛，得到提升的不仅仅是出行速度，还有旅程的数字化、信息化程度。同时，随着生活水平的不断提高，人们对于出行方式的快速便捷化要求也越来越高，乘坐高铁出行已经成为了大多数人的出行首选，而高铁盒饭则为不少旅客解决了出行途中的“吃”问题。

2017年7月18日，中国铁路总公司推出了“12306网上订餐”服务，在动车上只要拿出你的手机，登录12306网站或者手机APP，就可以预定自己路过地方的当地美食，美食做好将提前送到车站，列车一到站由工作人员送到车厢。此外，列车还陆续推出了“高铁点外卖服务”、“高铁扫码选餐服务”等，让旅客在座位上享受一键下单、美食即刻到身边的便捷服务。

1.2 问题分析

目前，高铁不同车次盒饭的配餐数都是根据以往数据和业务经验来制定的，大都是主观判断，缺少科学依据，且不同价位、不同口味、不同供应商、不同交路、季节变化等因素都需要综合考虑，相关业务人员工作量很大。

2 总体设计

2.1 目标

通过系统实现智能化预测不同线路、不同车次、不同价位和不同口味的个性化配餐需求，完成列车配餐的智能化决策。

2.2 总体思路

（1）高铁点餐服务的便捷性和多样化，使得高铁餐饮数据随着列车里程的不断积累越来越丰富，因此我们可以通过这些海量销售数据进行深度分析挖掘，找出旅客餐食需求的变化趋势和规律特征，从而实现智能化配餐的目标。

（2）在算法选择上，可以采用已经成熟的大数据智能分析算法，如RBF神经网络、BP神经网络、时间序列模型、先知模型等对数据进行智能化分析预测。

3 系统设计

3.1 数据采集

（1）对列车运行过程中产生的实时销售数据进行实时采集，主要包括列车乘务员的手持终端以及扫码点餐的移动端APP的数据等进行实时抽取对接。

（2）采集方式：存放实时数据的关系型数据库，如MySQL，与高铁配餐智能化预测大数据平台做实时数据同步。

3.2 数据处理

利用智能算法处理异常记录、缺失数据等。常用的数据预处理的技术主要包括缺失值填充技术、数据抽样技术、变量处理技术、数据重构技术、数据无量纲处理技术等。

3.2.1 缺失数据处理

缺失值填充是针对带有缺失值的数据进行处理，因为有的分析算法在进行数据分析前要求数据是无缺失的，所以数据的缺失值填充是非常关键的一步，对后续的分析影响很大。一般的缺失值填充方法见表1。

表1 缺失值填充方法列表

本系统根据数据特征进行缺失值填充处理，主要采用线性插值法进行填充处理。

3.2.2 异常值处理

异常值处理用来发现“小的模式”(相对于聚类而言)，即数据集中显著不同于其它数据的对象，也称为孤立点。

Hawkins(1980)给出孤立点（outlier）的定义：孤立点是在数据集中与众不同的数据，使人怀疑这些数据并非随机孤立点，而是产生于完全不同的机制。孤立点可能在聚集运行或者检测的时候被发现，比如一个人的年龄是999，这在对数据库进行检测的时候就会被发现。还有就是outlier可能是本身就固有的，而不是一个错误，比如CEO的工资就比一般员工的工资高出很多。

孤立点算法是基于距离的：设Dk（p）表示点p和它的第k个最近邻居的距离。直观地看，Dk（p）越大，p越有可能成为孤立点。给定d维空间中包含N个点的数据集、参数n（孤立点个数）和k（偏差距离），如果满足Dk（p'）＞Dk（p）的点p'不超过n-1个，那么称p为Dnk孤立点。如果对所有数据点根据其Dk（p）距离进行从大到小排序，那么前n个点就被看作是孤立点。

最后，我们可以根据数据特征将异常值进行剔除。

3.2.3 预测建模

将神经网络模型、时间序列模型与先知模型分别带入该预测模型中，根据模型精度进行优化调整参数，并选取预测精度最高的作为本次建模的算法。

按照实际训练效果，采用先知模型的效果最好，模型精度最高。

Prophet模型是指将经济社会增长与节假日等影响因素加入到模型中，具体模型如下：