APP下载

一种改进的企业差旅国内机票推荐算法

2020-04-21

广东通信技术 2020年3期
关键词:差旅商旅舱位

1 引言

中国商旅管理于2000年外资TMC(Travel Management Company,商旅管理公司)进入中国市场后兴起[1],前期目标客户多为大型企业。2014年后,中小企业的商旅管理意识逐渐觉醒,商旅行业进入快速发展期。2018年,中国商旅行业的年复合增长率达20%[2]。商旅行业的参与者除了专业的TMC外,还存在OTA(Online Travel Agency,在线旅行社)、传统旅行社、机票代理商等非专业化差旅机构。2018年中国商旅管理市场前8位的差旅管理公司,占比为21.4%[2]。TMC的产品结构丰富、差旅管控智能、结算方式灵活、服务项目多样,能帮助企业实现降本增效的目标,优势明显。随着商旅管理理念的深入,商旅管理市场将越来越集中于大型的TMC。

TMC的SaaS(Software-as-a-Service)系统优势在于差旅标准在线管控,个性化的流程配置,差旅数据报告分析等。随着企业费用控制、成本管理意识的加强,大企业对TMC系统的要求越来越高,除越来越个性化的差旅标准、审批流程外,还希望能与企业内部办公系统、报销系统对接,完成全流程管控。不少大企业开始自建差旅系统,打造完整的出差申请、差旅预订、费用管控、费用报销全流程。自建的差旅系统的难点之一在于整合商旅的产品资源。因存在系统成本、行业壁垒及专业性问题,企业更希望与TMC合作,由TMC提供产品资源接口。商旅行业一般性的产品如国内机票、国际机票、国内酒店、国际酒店、租车等,都属于非标准产品。其中国内机票产品最规范。由TMC提供合乎公司差旅标准,同时又能满足员工需求的机票选项,企业可以免除在自建的差旅系统中完成整个机票全流程的开发。

国内机票热门航线一天可能存在30多个航班,每个航班下可能会有20多个舱位价格,组合起来用户会难以选择。推荐机票时既需要考虑公司差旅标准,也需要考虑员工出行体验。本文提出了一种改进的机票混合推荐算法,以乘机人为基准,在员工常飞航线上,过滤超过差旅标准机票,采用基于航线的用户偏好推荐算法向用户推荐。针对不常飞的航线,或无飞行历史航线,即冷启动问题,考虑可解释性,采用了基于差标的近邻推荐算法。

2 背景介绍

随着经济的不断发展,企业的差旅费用逐渐增高,企业差旅费用已经成为企业继人力资源费用外的第二大可控费用。越来越多的企业聚焦企业差旅费用控制,统一管理,集中采购。企业差旅费用主要包括机票费用、住宿费用、火车票费用、用车费用等,其中以机票费用最高。2018年中国商旅管理市场中,机票的交易规模占总商旅支出的比例为81.2%[2]。企业目前对TMC(Travel Management Company,商旅管理公司)的需求主要以机票为主。国内机票因行业规范,是各大TMC系统中的基础产品。按员工职级的不同设置好国内机票的不同差旅标准,由企业员工或企业行政人员登录TMC系统预订机票,根据差标选择适合自己的机票,是TMC系统中的基础功能。

中国民航信息网络股份有限公司为有资质的机票代理人提供了标准的IBE(Internet Booking Engine)接口,通过该接口,可实时查询某条航线下的航班、舱位价格、剩余座位数,并可为旅客订座及出票。航司在每条航线都设有一个经济舱全价,一定时期内稳定,在此基础上,建立舱位价格体系,不同的舱位代码(如Y、W、P、H、B等)代表了不同的折扣,对应了不同的价格、不同的退改签政策、不同的行李额度。国内机票的定价体系决定了机票选择的复杂性。自建差旅系统的企业,普遍不具备行业资质,通过与TMC的合作,可获取实时机票接口,并希望通过TMC对差旅的管理,得到精准又能让员工满意的机票推荐。

OTA因发展早、宣传力度广、用户体验好及会员体系等多方面的原因,成为企业在选择TMC的一个重要参考标准,尤其是中国OTA市场的领头者携程。以下介绍OTA与TMC系统在现有的一些机票推荐方法及遇到的一些问题。

2.1 时间排序与价格排序

目前OTA(如携程、飞猪)及TMC(如携程商旅、阿里商旅)的机票航班的推荐排序规则仅有两个:时间排序和价格排序。所有用户点击查询航线后显示的界面均一致,是从登录用户的角度而非乘机人的角度显示。机票的推荐与电商平台不一样,从以下的两个图中也可以看出,每张机票的信息有航班信息,同时也有航班下对应的舱位价格信息。查询航班和航班舱位价格如图1和图2所示。查询航线,先显示航班,再显示航班舱位价格是目前OTA与TMC系统常用的UI交互。

图1 查询航班

图2 航班舱位价格

此种推荐方法损害了用户体验,增加了开发难度,不符合企业的需求。员工查询机票需要操作两次点击流程,第一次选航班,第二次选舱位价格,并且需要自主甄别出哪些是符合差旅标准的机票。如果在选中乘机人后,发现该机票超标后需要重新进行选择。从企业自建差旅系统角度来看,这两个界面融合了航线查询、航班查询、比价以及差旅标准的管控提醒等,增加了系统的开发难度。

2.2 基于差标的低价推荐

文献[3]中提出了行业内采用的一种差旅行程安排推荐方法,由员工填写好具体的机票需求信息(如出发机场、到达机场、出发日期、出发时间段),按照价格升序排列做推荐。这其中可以加入一些差标需求(如必须是经济舱,折扣必须低于8折等)。核心算法仍然是低价推荐。

在差旅管控中,有7种常用的使员工遵守公司差旅政策的策略,其中,“强制性顺从”是Travel Managers(差旅负责人)采用优先级排名第4的策略[4]。这说明,很多企业并不强制要求员工服从公司差旅政策。仅以低价的方式推荐,忽略员工感受,并不是一个好的差旅推荐。

另外,退改签费用也是公司差旅费用控制的一项重要指标。低价的机票退改签费用更高。如果公司差旅行程变动较大,推荐低价可能会适得其反,并不会带来差旅费用的节省。

2.3 OTA的用户偏好推荐

文献[5]中提出了OTA机票的个性化推荐,对用户的历史订单统计,将订单中的变量离散化,并以信息熵表示权重,形成用户的个人偏好标识。在此基础上,计算每次搜索出来的航班与用户个人偏好的相似度进行推荐排序,也是一种基于内容的推荐。针对冷启动问题,提出了基于航线的协同过滤算法,在当前用户遇到无历史记录的航线时,分析其他用户在该航线的历史订单,分析该航线上的一个偏好分布,再与当前用户有历史记录的航线做迁移学习,将相似航线上的偏好整合到目标航线。

此种推荐方法是在中国OTA市场占有率第一的携程数据上测算得来,偏好的计算值得借鉴。该算法目前已申请专利。但在携程网站上尚未应用。

OTA与TMC的差别很明显。OTA的用户仅指注册人,也称为预订人,预订人可能与实际的乘坐航班的用户,即乘机人并不是一人,有多个常用旅客的更为如此。在企业中,不同乘机人的差旅标准不一样,以预订人的身份统计其订单偏好,不准确,误差概率高。

OTA中的用户平均活跃度远远低于TMC中的客户。文献[5]在做OTA用户个性化推荐的数据分析时,将两年内的出行次数大于10次的用户数据去掉,因为这类数据不像是真正订票的直客,而更像是一个集中采购第三方,如代理商的预订。用户的订单量非常少,在同一条航线上的订单更少,而采用所有历史订单预测所有航线上的偏好存在难度。主要是不同航线下的航班不一样,对用户的偏好有影响。如用户在A航线下有4个南航的订单,在B航线下有2个深航的订单,该用户总的偏好中,南航的权重高于深航。实际上A航线下无深航的订单,这种情况得出的用户偏好有一定误差。同时在TMC中,用户在历史订单中呈现的偏好被差旅标准影响,不同差标时期的订单表现出来的偏好不一样。冷启动时,采用基于航线的协同过滤算法,将目标航线上的订单与用户的历史订单偏好分布做比较并学习,存在可解释性差的问题。

3 推荐方案

针对上述这些问题,本文提出了以下推荐方案。

员工输入出发地、到达地、出发日期等基础查询条件后,点击查询,直接向企业自建差旅系统推荐出具体的航班舱位,不再需要先选择航班,再选择舱位价格。

TMC单个用户的年平均飞行次数大于OTA的用户,出行更高频,高频使得用户的行为更为集中可预测。TMC用户因公司业务往来,飞的航线一般比较集中。针对有历史机票订单的乘机人,基于航线计算历史机票订单的偏好,采用基于航线的用户偏好推荐。

从某TMC的订单数据中可以看出,热门航线的订单数远远高于非热门航线。对于单个差旅用户,这种差别更大,一般只有固定的几条航线,大部分航线都无订单记录。冷启动问题非常明显。这种情况下,我们采取了基于用户的内容推荐,利用KNN(K-NearestNeighbor)算法计算基于差标的近邻。从用户的属性中,计算出与当前用户差旅标准相似度高的TOP K位用户。汇总该K位用户在当前差标期间内在相同航线内的机票选择,推荐重复率较高的机票。该推荐方法可解释性强。

具体流程如图3所示机票混合推荐算法流程图。

图3 机票混合推荐算法流程图

4 算法实现

4.1 协同过滤算法--基于航线的用户偏好推荐

以航线(出发机场-到达机场)为基础,分析用户名下是否有该航线的历史机票订单,此处的用户指的乘机人,非注册用户。若航线下历史订单>3,根据历史订单的相似性,推荐符合差标的机票。此处的历史订单有限制:订单发生时期的差标与当前用户的差标一致;相同航线下的订单。

机票的偏好特性有:出发时间、航司、舱位等级、舱位代码、舱位折扣、特殊舱位、机型大小。

在机票的偏好特性中,未加入价格与退改签政策。这主要是因为差旅用户对价格不敏感。机票的价格实时动态变化,难以把握,公司通常采用舱位等级、舱位代码、舱位折扣来控制差旅费用。退改签政策基本由航司+航位代码固定,不同的舱位代码对应了不同的退改签政策。

出发时间、折扣为连续变量,需要做离散化处理。出发时间划分为7个时间段:0点-6点、6点-9点、9点-12点、12-14点、14-18点、18点-21点、21点-24点。将舱位折扣划分为4个区域:0-4折、4-6折、6-8折,8-10折。

采用文献[5]中偏好的权重公式及相似函数,计算实时查询得出的当前航线的机票与用户历史订单中的机票相似度,按相似度大小倒序排,推荐排名前N的机票。

相似函数Similarity(i,j)见公式1。

实时查询到的机票集合为T,t为其中的一条航班舱位记录;历史机票集合为U,u为其中的一条航班舱位记录。数组Arr[],用于临时存储相似度值。数组Arr_score,用于存储相似度评分。算法如下。

4.2 KNN算法-基于差标的近邻推荐

差旅标准制度有:提前N天预订、预订N小时内最低价提醒、不允许预订N小时内最低价、是否需要价格授权、是否允许预订头等/公务舱、最高可预订折扣、是否绿色通道、是否有项目预算管控、是否强制预算管控。

按照乘机人差旅标准计算乘机人相似度。因存在部分差旅标准为空的情况,故采用欧氏距离公式测量相似度,如公式5。

其中,i为差标制度的一项特征值。I为差旅制度集合。x、y为不同的乘机人。

根据差标相似度获取的前K位邻居算法如下。

当前用户为a,算法如下。

5 方案验证

我们选取了某TMC公司2019年4月到10月的国内机票数据作为历史订单数据,11月的国内机票数据为测试集。因机票为实时查询,无预订时其他的实时机票舱位价格数据,因热门航线一般价格较为稳定,且订单较多,本文采用热门航线预订一段时间内所有订单里的航班舱位价格汇总,去掉重复的数据,模拟出当时的舱位价格列表。采用本文的算法对机票进行预测排序,再与实际的订单比较,计算平均准确率MAP(Mean Absolute Precision)。测试数据的MAP是其中每个订单的MAP的平均值。MAP计算公式见公式(6)。

本次测试,选用了热门航线深圳—北京、深圳—上海虹桥、广州—北京一段时间内的订单。模拟得出的深圳—北京实时舱位价格列表数约30条,深圳—上海实时舱位价格列表数约30条,广州—北京实时舱位价格列表数约15条。因实时航班数据为模拟数据,本次评测存在一定的系统误差。

表1列出了评测MAP值,其中第四列基于用户偏好的算法,采用的是预订人的偏好,计算所有历史订单的偏好。故改进的企业差旅机票混合推荐有效。基于用户偏好的推荐效果非常不理想的原因是,样本数据里,代订的比例较高,而不同的员工差旅标准相差较大,导致预订人身上的偏好标签太散。代订的这类公司差旅虽然有集中管理,但是仍由行政人员统一预订。

表1 评测MAP值表

6 小结

针对企业自建差旅系统的需求,本文在OTA的基础用户偏好算法上,添加了以航线为基础的区分,同时以乘机人分析,而非预订人分析,更为准确。在员工无历史订单的航线上,采用了可解释更强的基于差标的近邻推荐,推荐理由如“80%的员工选择了该机票”。但改进后的企业差旅机票混合推荐算法还是存在一些不足。表现在以下几个方面。

(1)因TMC订单存在航线集中的情况,或航司开辟新航线,对于无任何订单历史记录的航线,仍然会存在冷启动的问题。对这类行程,我们难以去判断出准确的偏好。

(2)该算法对于新产品不友好。若航空公司想推出新的产品,相同的价格基础上,新的产品有增值服务项,且给机票代理人的代理费用更高。既能给用户带来收益,也能给TMC带来利润。用此算法难以推荐出新产品。

(3)企业差旅管控与员工出行体验某些情况下是相悖的。在做企业机票推荐时,需要时刻关注企业本身的需求,如某些企业强制要求员工必须购买低价,此种情况下,在差标范围内的低价推荐更为合适。在实际运用过程当中,应该根据企业的实际需求定制。

综上,企业差旅的国内机票混合推荐算法在实际应用中,后续会根据员工反馈与差旅报告分析数据,不断调整与改进。

7 致谢

本文所涉及到的方案验证实验在大湾区未来网络试验与应用环境(PCL2018KP001)、深圳市科创委项目号(JSGG20170824095858416,JCYJ201908081556 07340)的项目中进行。感谢老师在选题方向的指导,感谢项目组成员对论文的审阅并提出重要修改意见。

猜你喜欢

差旅商旅舱位
COLA CAN-MINI 蒸汽挂烫机
数据驱动航空收益管理舱位分配研究*
嘉惠国际:商旅管理业迎来变革新形势
第三十八周:每个人的舱位都是单人舱
基于联盟互租战略的近洋航线班轮舱位互租与分配优化
中国石化差旅平台建设初探
太想念
商旅进行时
澳旅局的商旅会奖大时代
多省公布干部差旅食宿标准