APP下载

基于大数据的西成高铁增值服务目标旅客识别研究

2019-06-28魏宝红

新丝路(下旬) 2019年7期
关键词:心理需求质量

摘 要:与既有线普通铁路线相比较,高铁所吸引的旅客群体主要为高中端旅客,他们在旅行需求和心理存在较大的差异。本文以西成高铁为例,对旅客进行大数据分析,旨在找出他们之间的关联度,都有利于西成高铁对当前的系统与服务进行改进,更好地提升用户对西成高铁服务的利用率。

关键词:客运服务;心理需求;质量

一、引言

西成高铁自2017年12月全面投入运营后,西部地区重庆、成都和西安三个主要城市之间距离被大大缩短,据中国铁路总公司发布发消息,截至到2018年12月4日18时,西成高铁客运专线所共开行的高铁/动车列车达到了4.3万趟,自该线路开通以来平均每天开行的列车约有117趟;发送的专线沿线旅客超过了1720万人次,平均每天发送旅客数量达到了4.7万人次。

二、基于K-means方法的西成高铁旅客用户行为与需求挖掘

1.数据获取与数据处理

本研究于2018年11月和12月期间,收集了西成高铁在该年的11月1日至11月30日铁路客户服务中心系统后台日志数据,该系统的日志数据详细记录了旅客乘坐西成高铁的出行及获得相关服务的信息,如旅客证件信息、旅客进出站记录、购票记录、改签及退换票记录、接入网络的IP地址及终端信息、乘坐车次、列车发车时间、旅客使用高铁订餐相关服务的记录等。

2.数据分析流程

对西成高铁旅客行为与需求进行挖掘和分析所采取的方法为大数据分析中常用的K-means算法,在具体执行该算法的过程中,考虑到西成高铁旅客的用户对象主要以学生、老人及各行各业的商务人士为主,用户虽然具有比较大的异质性,但所设置的聚类簇数也不宜过多,否则会导致聚类效果较差。我们根据西成高铁旅客用户的大致分类情况,将拟采用的K-means算法所获得的聚类簇数设置为6个,其具体分析过程包含原始数据获取、数据筛选、高铁服务使用类别数量、出行次数比较、使用增值服务的行为比重、使用一般服务的行为比重、数据类型设置、数据过滤、K-means聚类等环节。

3.聚类分析结果

本研究通过K-means聚类分析算法所得出的聚类分析结果如表2所示。由于将K-means聚类簇数设置为6个,我们可以因此获得六个聚类结果。在这六个类中,聚类3仅包含两个记录,且该聚类下的增值服务使用次数、一般服务使用次数、活动次数、活动持续时间、利用西成高铁服务数量的值均要远大于其他五个类,说明聚类3所包含的26个记录存在异常的情况,因此我们不需要对该类的相关信息进行更进一步的分析。

聚类1所包含了记录数最多,记录数占所有数据总量的18.57%,该类下聚集了大量用户,共有8273个用户,是包含用户数最多的类该类用户在数据采集期间在铁路服务系统中的出行记录数量平均值为3.025个,在出行过程中所包含的活动行为数量平均有55.764个,在所有类中处于中等水平,说明该类旅客用户乘坐西成高铁的行为活动及其使用相关服务的行为比较正常。该类旅客用户使用西成高铁一般服务的行为比重相对较低,这些旅客的增值服务使用次数、一般服务使用次数都处于比较中间的水平,说明这类用户利用西成高铁服务目的比较统一和集中,主要利用的是西成高铁的某一个服务,通常主要是购票服务。总体来看,该类旅客用户对西成高铁服务的利用处于中等水平,其目的主要以购票为主,利用西高铁提供的其他增值服务的次数并不高,因此西成高铁可重点关注这类用户在出行目的地及其在出行过程中的服务使用记录,有针对性地为这些旅客推荐一些出行或休闲相关的信息,以使满足这类旅客用户的出行需求。

聚类2所包含的记录数其次多,记录数占到了所有数据总量的12.42%,该类下包含的用户数量为4435个,是用户数量其次多的类。在该类下使用智能设备的用户数量比较并不算高,只有26%,说明该类用户大多使用的是桌面端的设备接入到西成高铁的铁路服务系统。该类用户使用西成高铁的出行次数平均值为2.049次,比聚类1的出行次数相对要少,该类用户一般服务使用的比重也比较高,达到了58%,该类旅客用户的增值服务使用行为比重也不算低,达到了24.6%,要高于聚类1,说明该类用户在使用高铁一般服务的同时,也会发起比较多的增值服务行为。

聚类4和聚类5所包含的记录数占所有数据记录的比重分别为6.63%和4.27%,这两类用户属于两类行为相反的用户群。其中,聚类4的用户属于以一般服务使用为主要目的,主要利用桌面端设备进行操作,会在铁路服务系统中留下比较多的服务使用记录,以获取精确的服务项目的用户群,该类用户进行其他的情况相对较少;聚类5的用户属于更愿意利用铁路服务系统中其他服务的用户,这类用户以利用智能设备为主。另外,聚类6的用户在一般服务行为和增值服务使用行为的频次上都不算,但其活动记录的次数却达到了117.54次,说明这类用户喜欢比较喜欢漫无目的在铁路服务系统进行相关无关操作,这类用户利用西成高铁出行的需求并不明确,需要为之提供必要的指导。

三、讨论

总体来看,本研究运用K-means算法对西成高铁旅客用户的出行及其活动行为进行分析,揭示了西成高铁旅客用户行为与需求进行了挖掘。通过通过K-means算法进行聚类分析,我们得出了六个类:第1类用户对西成高铁增值服务的使用频次并不高,因此西成高铁可重点关注这类用户在出行目的地及其在出行过程中的服务使用记录,有针对性地为这些旅客推荐一些出行或休闲相关的信息,以使满足这类旅客用户的出行需求;第2类旅客用户增值服务使用行为所占的比重相对较高,其桌面端的用户占多数,这与本研究之前所得出的结论保持一致。针对这类用户,西成高铁在进行高铁服务精确推送的同时,还可通过铁种系统服务平台与短信等渠道为其推荐更多的服务、资源供其选择;第3类存在异常的情况,故而舍去;第4类和第5类用户属于两类行为相反的用户群,第4类的用户属于以一般服务使用为主要目的,主要利用桌面端设备进行操作,会在铁路服务系统中留下比较多的服务使用记录,而第5类的用户属于更愿意利用铁路服务系统中其他服务的用户,这类用户以利用智能设备为主;第6类用户一般服务行为和增值服务使用行为的频次上都不算,这类用户利用西成高铁出行的需求并不明确,需要为之提供必要的指导。

另外,从西成高铁旅客用户数据聚类结果揭示的各项服务之间的关联规则来看,车票查询和自助售票两项服务之间的关联性最强,其次是列车运行和车票查询两项服务,再次是自助售票和自助检票,说明旅客用户利用西成高铁出行最基本的几项服务之间具有比较高的关联性,并且也是置信度最高的几项关联规则。置信度比较高的关联规则还有便捷通道和托运服务之间关联规则,说明西成高铁的许多旅客用户在选择通过车站提供的便捷通道进入候车区域后,还会选择将使用车站提供的托运服务使自己享受到进一步的便捷服务。这些关联规则的揭示,都有利于西成高铁对当前的系统与服务进行改进,更好地提升用户对西成高铁服务的利用率。

参考文献:

[1]赵淇.高速铁路客运服务质量评价体系的研究[D].大连:大连交通大学,2017

[2]王莉莉.铁路客运服务文化建设评价体系的研究[D].北京骄傲同大學.2018:75-83

[3]曹阳.世界健康调查项目中国预调查的测量方法及质量评估[J].复旦大学,2014(12):63-64

[4]张秀敏.旅客服务心理指标综合评价方法[J].铁道运输与经济,2015(10):35-39

[5]张秀敏.基于旅客心理需求的铁路客运服务综合评价模型研究[J].企业技术开发,2015(10):35-39

作者简介:

魏宝红(1979—)女,陕西西安市人,硕士研究生,西安铁路职业技术学院交通运输学院讲师,研究方向:高铁客运乘务。

猜你喜欢

心理需求质量
质量守恒定律的应用
二年级下册期末质量检测(一)
满足职工心理需求在思想政治工作中的作用
基于老年人居住行为与心理需求的居住区景观设计初探
老年电子产品中的人性化考虑
高三语文高效课堂之有为有不为
学生心理需求角度下的管乐训练教学研究
如何搞好期末复习
睡个好觉