基于商业智能的高校食堂消费数据的研究
2018-05-15吕露林家钦
吕露 林家钦
一、引言
校园一卡通系统以学校校园网为载体进行建设,是集身份识别、校内消费、校务管理、金融服务为一体的新型数字化校园核心应用,它不仅是数字化校园系统的重要的有机组成部分之一,是数字化校园的基础工程,是教育信息化建设的基础支撑点之一,也是学校“数字化校园”建设的切入点。校园卡可以作为就餐卡、借书卡、上机卡、医疗收费卡、洗澡卡、购物卡、门禁卡、乘车卡等。随着数字化校园的迅速发展,国内外很多高校具备了比较成熟的“校园卡”网络设施,校园卡时刻都会产生大量的数据,隐藏着对高校管理有用的消费规则和信息。
校园卡作为数字化校园建设的主要载体,通过数据挖掘技术从中挖掘出隐含信息是极其有价值的。以上海大学为例,除开寒暑假和国定节假日,在校期间平均每日的学生食堂刷卡消费达六万余次,金额在40万左右。庞大的数据背后隐藏着很多有规律有价值的信息,有了消费流水信息,我们就能从中获取学生消费偏好、消费水平,通过数据挖掘,提供食堂管理建议,提高食堂管理效率,更好地为全校师生服务。
二、研究思路
高校食堂作为广大师生在校期间用餐的主要提供,安全可口的菜品、良好的用餐环境和便捷的服务是食堂管理工作的主要任务。为了分析现阶段食堂的服务水平,本文将运用商业智能工具,根据食堂流水数据包含的信息,结合学校数据库的学生信息,考虑从消费人员类型、消费时间、空间等多个角度去分析食堂消费数据。
因此,在数据收集时,学生信息表收集有包含性别和年级的字段,食堂消费流水表收集包含有区分消费时间的字段,食堂设备表包含将每一笔消费对应到具体食堂的字段。按照数据挖掘的过程,本文研究分为数据选取,数据预处理、数据分析和建模、结果分析和改进四个阶段。
三、食堂学生消费数据挖掘应用
(一)数据选取
2017年上海大学所有食堂消费金额及刷卡次数的时间序列图如图1所示。
从图1中可以看到有3个明显特征:1、寒暑假和国庆中秋长假期间,食堂刷卡次数和金额明显减少;2、除去寒暑假,以一周为周期,呈现出周末刷卡次数和金额明显少于周一至周五的规律,经查实,主要由于很多本地学生周末不在校,只有部分食堂在周末开放;3、除去节假日和寒暑假,食堂总体消费的数据整体比较平稳,起伏不大。
根据上述分析,本文选取了2017年9月11日(本学年开学时间)至2017年11月30日中周一至周五,共计54天的食堂消费流水数据。
(二)数据预处理
第一步,选取各个表中的有用字段。
1、选取的食堂消费流水表的字段有:持卡人姓名、学/工号、刷卡日期、刷卡时间、金额、食堂消费终端POS机;
2、选取的人员信息表的字段有:姓名、学/工号、性别、持卡人员类型、身份证号码;
3、选取的食堂设备表的字段有:食堂消费终端POS机、食堂、校区、座位数。
第二步,数据清理和转换。将食堂消费流水表中这54天的数据筛选出来,选取消费数据,去除里面的充值数据,刷卡时间改为数值格式,通过数值区间选取来区分早中晚餐。
第三步,建立相关字段的关联关系,如图2所示。
(三)数据分析和建模
本文主要采用FineBI商业智能产品来进行食堂数据的挖掘分析。为了达到从消费人员类型、消费时间、空间等多个角度去分析食堂消费数据的目的,下面从四个方面去进行数据挖掘。
1、早、中、晚三餐分别最受学生欢迎的食堂
本文根据选取的时间区间内的每个食堂的所有POS机刷卡次数之和来定义该食堂受欢迎程度,次数越多说明学生更喜欢在该食堂就餐。为了便于分析,统一将上午10点之前的消费认为属于早餐,10点至下午3点的消费认为属于中餐,下午3点之后的消费认为属于晚餐。筛选出消费主体为在校本科生和研究生的消费记录,部分结果展示在表1。
结果显示有以下几点特征:1、益新食堂在早、中、晚都排名第一;2、中餐和晚餐前十名的餐厅相同,只是排序上有差别,说明总体来看,学生在中餐和晚餐上的餐厅选择上主要集中在这几个食堂3、早餐和晚餐有多功能餐厅、能量小站、服务站点这些店面的消费,说明早、晚餐有部分同学可能由于上课原因、个人原因等,会選择不在食堂消费,而是在这种学校便利餐厅解决,中餐时间学生则更倾向去食堂就餐;4、中餐刷卡次数要多于早餐和晚餐,说明早餐和晚餐不在食堂就餐的学生人数要多于中餐。
2、男、女生分别最喜欢的食堂
分析对象为在校本科生和研究生,在选取将食堂消费流水表于人员信息表中的学号字段做关联,在性别栏对结果进行分别展示,部分结果展示在表2。
结果显示有以下几点特征:1、益新食堂在男、女都排名第一;2、男生刷卡总次数多于女生,说明男生比女生更倾向于在食堂就餐;3、男女刷卡次数最多的前五个食堂中有4个相同,说明总体上,男女在选择的上有相似性;4、女生比男生更偏爱尔美一楼、尔美二楼、得月这三个食堂、而男生比女生更偏爱益新、吾馨。其中尔美二楼和得月食堂是学校食堂中价位偏高、种类更丰富的食堂,益新和吾馨食堂是更偏向大众化的食堂。
3、不同年级学生分别最喜欢的食堂
考虑到研究生在校时间不稳定,对分析结果会造成偏差,这部分的分析针对本科生展开,部分结果展示在表3。
结果显示有以下几点特征:1、大四刷卡次数显著少于其他三个年级,刷卡总次数不到大一的一半,说明可能由于校外实习,课程较少,大四学生在食堂消费次数就少很多;2、大一学生在益新食堂的消费要明显高于其他三个年级;3、各年级食堂消费次数排名相似性低,说明各年级学生的喜好有一定差异。
4、食堂早、中、晚餐高峰期客流量分析
这部分的分析不限制人员类型,所有持卡人员刷卡记录都要被考虑在内。根据观察,早餐高峰期在7:00-8:00,中餐高峰期在11:30-12:30,晚餐高峰期在17:00-18:00。为了便于客流量分析比较,将刷卡次数与座位数之比作为一个度量参数,将此参数称作食堂坐席率,记为α,那么,坐席率越大,说明食堂越拥挤。
通过FineBI中加入计算指标α,得到食堂坐席率的折线图分析,结果显示有以下几点特征:1、益新食堂三餐在高峰期都达到拥挤程度;2、有些食堂不提供早餐,因此早餐座位利用率为0;中餐和晚餐高峰都达到严重拥挤的食堂,经了解,这些食堂的特点是座位数少,造成了座位利用率α值高。
(四)结果分析和改进
据了解,益新食堂处在学生宿舍区与教学楼之间,位于学校中心地带。而益新食堂在四部分的分析中刷卡次数和人数的统计都占据大部分的比例,这充分说明,食堂的地理优势会直接影响学生的选择。那么根据这个分析结果,学校在扩建食堂上可以考虑在学生的宿舍楼和教学楼的必经之路上,同时这些食堂的安全和服务水平要得到有效管理。
另外,对于三餐中出现早、晚餐有部分学生不吃或在校外吃,还有部分同学早餐和晚餐会选择去便利店消费而不会去食堂的这种情况,校方可以思考早餐和晚餐在服务方式和菜品上有所创新来吸引学生,并可通过微信推送菜品营养分析数据给学生。
通过区分学生性别的分析,男生在食堂的选择上地理位置好的食堂会很大程度影响他们的选择,而女生在食堂的选择上除了食堂地理位置的影响,比男生更追求食堂的口感和品质。这个分析结果可用于食堂管理区分男女喜好提供特色服务。
最后,针对食堂拥挤可以采取相关策略,可以从两方面考虑:一是在几个严重拥挤的食堂增加座位数,通过推送给学生食堂实时拥挤程度的情况,让学生可以提前灵活选择就餐食堂;二是,管理开发智能结算功能,集成射频读写装置、读卡器、显示屏等多个设备,实现結算区餐具的批量快速识别,学生自主完成核对和支付,提高结算效率和准确性。这样,便可极大缓解高峰期的排队时间浪费,菜品和座位的供应不足。另外,对于三餐都不拥挤的食堂,可以深入了解原因,提高服务质量,合理分配资源。
四、结语
分析高校食堂的消费不仅仅是通过数据分析结果为食堂的管理服务水平提供建议,同时也可从中找到信息来让学校发现学生的行为习惯,帮助学生解决问题。例如,根据食堂数据的挖掘分析,学校可以考虑查找连续3天以上不在学校食堂就餐的学生,长时间有早餐或中餐或晚餐不在学校吃的学生,分别了解原因,了解他们的需求,帮助他们解决困难。