基于大数据的学生食堂消费画像构建及其应用
2021-01-14章翰源
曹 芳,章翰源
(广东邮电职业技术学院,广东广州510630)
高校餐饮经营服务是学校后勤保障的重要部分,是检验学校综合水平的重要指标,不仅担负着提供饮食的功能,还是高校精神文明的窗口[1]。目前高校餐饮存在一些问题,如就餐时间集中、人多排队,菜品不受欢迎,剩菜严重,大学生的外卖消费日渐增多,学生的个性化需求得不得满足等。如何精准地描述学生在食堂的消费情况,本研究借鉴大数据中用户画像方法论及技术,利用大数据对学生在食堂消费行为、消费水平分布、消费喜好等维度进行消费画像,用数据分析的结论作为决策的参考依据。
用户画像(User Profile)作为实现精准信息服务的一种工具,近年来在图书馆、电子商务、健康医疗、旅游管理、精准营销等领域得到了较为广泛地应用[2],但用户画像在学生食堂消费方面应用较少,大数据在食堂管理中的应用大多数探讨的是几个维度的数据分析和相关性分析,缺乏整体的全方位的分析和科学的方法论,本研究用数据画像的方法,进行数据挖掘和过滤,从大量的食堂消费数据及相关数据中筛选隐藏数据,发现不同类型用户消费特征,提出并建立了学生食堂消费画像的标签体系,从而构建用户画像。该用户画像不仅可用于食堂管理提升,也可用于学生管理工作精准化。
1 用户画像内涵及特性
关于用户画像的概念,普遍认为最早是由“交互设计之父”Cooper 提出来的,他认为用户画像是真实用户的虚拟表示,是基于一系列真实数据的目标用户模型[3]。用户画像通常包含用户属性、用户特征、用户标签三个基本要素[4]。用户属性可分为静态属性和动态属性两种,静态属性即用户的基本属性,如姓名、性别、年级、班级、生源地等;动态属性即用户行为属性,如在食堂消费中的消费时间,消费金额,消费地点等。用户特征是在用户属性基础上提炼出的共性特征,用户标签是对用户特征精炼后的标签化符号表示,画像构建的核心即为标签体系的建立,根据主体区分的原则,用户画像又可分为个体用户画像和群体用户画像,本研究将重点针对群体用户开展用户画像的研究与应用。
2 用户画像构建
用户画像的构建流程通常包含数据采集、数据处理与挖掘、特征提取,建立标签体系,生成画像等步骤。构建方法包括了获取用户属性数据的方法、将属性数据转换为特征的方法、将特征转换为标签的方法,以及画像的可视化表现方法。
2.1 数据采集
数据采集过程即从多个子系统中抽取数据,并完成数据的清洗、加工、汇总,最后形成用户画像构建的原始数据。本研究以G 高校为例,从“一卡通”食堂消费系统中导出2019 年11 月、12 月两个月的学生食堂消费数据作为分析对象,数据表模型见表1,该数据含消费学生3274 人,消费记录72.5 万条。从教务处学籍管理系统导出的学生基本信息表(数据表模型见表2),由于消费机号是固定在相应位置的,及消费机号和食堂窗口是有一一对应关系的,为本文描述方便,将窗口位置号等同消费机号。
表1 学生食堂消费交易记录数据模型表
表2 学生基本信息数据模型表
2.2 数据挖掘与特征提取
在特征提取阶段,首先根据学生用户的基础属性特征,重点提取了年级、性别、省市3 个典型基本特征;在消费习惯方面,根据消费交易时间属性重点提取了用户消费月份、日期,每周的周几、就餐时段(早餐/ 午餐/ 晚餐/ 宵夜)、当天消费时间5 个特征指标;由于学生每打一个菜要刷一次卡,就产生一条消费记录,即每一餐的消费金额由好几条消费记录组成,所以按相同学号和同一用餐时段通过分组聚合得出每位学生每餐消费金额的特征;根据交易机号对应食堂窗口,及交易机号和饭菜单价,可得出消费喜好特征。以上特征提取及每餐消费金额用Power Query程序对数据进行拆分和分组聚合实现,就餐时段的划分,先定义早午晚餐分别对应时间范围,采用VLOOUP 函数实现数据分组,通过对原始数据的预处理与转换环节,使其成为易于分析的事实数据,将数据存储在消费记录事实数据表里,如表3 所示,另外每餐消费金额存储在每餐消费事实数据表中。
表3 学生食堂消费事实数据模型表
2.3 学生画像标签体系设计
用户画像建模其实就是对用户“打标签”,从对用户打标签的方式来看,一般分为统计类标签、规则类标签、机器学习挖掘类标签[5],统计类标签是最为基础也最为常见的标签类型,例如月平均消费额,月消费次数等,规则类标签基于用户行为及确定的规则产生,例如平均每餐单价超过12 元以上定义为高消费、每个月消费30 次以下的学生定义为校内消费次数低,机器学习挖掘类标签通过机器学习挖掘产生,用于对用户的某些属性或某些行为进行预测判断。
良好的画像标签能够满足清晰的可视化效果,画像标签即为用户特性划分结果的形象化表示,因此需要依据学生不同维度数据特点以及分类结果制定画像标签[6]。在不同场景下侧重不同,在食堂消费的场景下,用户画像的服务对象主要是食堂管理人员及学生工作管理人员。本文主要从以下三个维度考虑标签的设置,一是从消费水平的维度,即学生平均每月食堂消费是多少,低消费与高消费占比,平均每餐消费多少;二是学生消费习惯的维度,例如喜欢在什么时间打饭,喜欢在学校就餐还是外出就餐或点外卖,平时是否吃早餐,周末是否在学校就餐;三是学生就餐喜好的维度,例如最喜欢在哪个窗口打饭,不同生源地的学生对不同窗口的喜欢,哪些菜式受欢迎。根据以上考虑,设计学生食堂消费画像标签体系,见图1。
图1 学生食堂消费画像标签体系图
针对设计的学生食堂消费画像标签体系,利用统计方法计算出的月平均消费金额、月平均消费频次,就餐时间分布、各类型消费的金额分布、交易机号消费频次等,利用聚类算法分析出的学生消费水平等标签。
2.4 整体用户画像及可视化呈现
整体用户画像主要从学生的消费水平、消费习惯、消费喜好三个维度展示出学生食堂消费的整体特征,图2 所示。通过数据分析生动地呈现学生食堂消费画像,在消费水平方面,学生每月平均消费为323元,男生每月食堂消费是女生的1.77 倍,人均每餐消费8 元;在就餐习惯方面,人均每月在校就餐次数40次,53%的学生每月有一半时间不在食堂吃早餐,有3.7%学生从不在食堂吃早餐,33%学生人均每月在校就餐次数少于30 次,即平均每天在学校吃一餐,周一至周三在本校就餐学生较多,周四、周五略低,周六、周日就餐人数是周一的一半,大部分学生喜欢在11:35- 11:53 去吃午餐,在17:53- 18:11 去吃晚餐;就餐喜好方面,47、158、14 号窗口最受欢迎,男生大多在157号窗口打4 两米饭,女生大多在16 号窗口打2 两米饭,154 号窗口的2 元菜式、23 号的4 元菜式、133 号的5 元菜式最受欢迎,生源地G 城市、J 城市学生最喜欢去47、53 号窗口消费,M 城市、Z 城市学生喜欢去158、14 号窗口。
图2 学生食堂消费整体用户画像
通过数据可视化分析技术,可制作出学生消费群画像的展示页面,例如学生每月平均消费情况分布图,每月在校就餐次数分布图,学生平均每餐消费分布情况,午、晚餐不同时间段就餐人数分布图,各消费机消费次数统计图等。
2.5 典型群体用户画像
根据不同维度的消费特点,制定一定的规则生成数据标签,将学生分成不同的群体,进一步对不同群体进行画像,使消费特点更加准确和明显,更适合进行精准管理。本研究对如下消费群体进行了画像。
2.5.1 贫困生消费群体画像
南京理工大学教育基金会通过数据分析,把每个月在食堂吃饭超过60 顿,一个月总消费不足420 元的学生,列为受资助对象[7]。按此标准挖掘出该消费情况的贫困生,占比3.1%,并进一步分析得出该类学生平均每餐消费5.6 元,其中早餐平均每餐3 元,午晚餐每餐平均6.7 元,在校月平均就餐次数66 次,经常消费的是4 两或3 两米饭,菜式是158、157 号窗口的纯青菜,154、153 号窗口的菜炒肉,早餐在158 号窗口的0.5 元豆浆或粥居多。
2.5.2 高消费群体画像
按平均每餐单价超过12 元以上定义为高消费,分析得出该人群占比5%,平均每餐消费13.3 元,其中早餐平均每餐8.6 元,午晚餐每餐平均14.6 元,在校月平均就餐次数29 次,喜欢23 号窗口纯肉菜与47 号机3.5 元菜式。
2.5.3 经常点外卖或外出就餐学生群体画像
按平均每天在校就餐一次即每个月消费30 次以下的学生定义为校内消费次数低的学生,该类学生经常点外卖或外出就餐,该人群占比33%,平均每餐消费8.33 元,平均每月就餐次数16.8 次,高年级占比58%,新生占比52%。
3 用户画像应用
构建用户画像之后,即可更加清晰地了解用户的消费情况、消费习惯、消费喜好等,从而制定更有针对性的食堂管理改进方案,为个性化学生管理提供参考依据,针对大数据分析结果,可有以下几个方面的应用。
3.1 食堂管理方案的制定更有针对性
1)针对每日用餐时间段人流量分布等数据进行分析,在高峰期和高峰窗口增加人手或增设设备,或提前引导学生避开高峰期就餐,使广大师生得到良好的用餐体验。
2)每隔一段时间根据消费次数最多的消费机号和菜式,评选最受欢迎窗口、最受欢迎菜品等,同时还可细分最受欢迎的早、午、晚餐,最受男生欢迎的窗口,最受女生欢迎的窗口等,并且可以和食堂厨师的激励挂钩,提高饭菜质量,创新菜式。
3)利用大数据节约资源,针对周一到周五及周末食堂用餐人数分布进行科学预测,据此准备相应的食材,减少浪费,做好食堂员工的休假时间安排,节约人力资源。
4)聚焦在校就餐次数较少的同学,针对性地发放就餐调查问卷,进一步调研外出就餐或点外卖原因,改进食堂管理,增强他们的在校就餐黏度。
5)分析不同地域同学的人数分布和饮食爱好,开设地域风味菜式专窗等。
3.2 学生管理工作更加精准化
1)利用大数据技术甄别出贫困生,可作为贫困生界定的依据之一,或直接对饭卡充值补贴。
2)对吃早餐次数少的同学可进一步统计所在年级及院系分布,针对性开展早睡早起的活动,宣传早餐重要性,开展饮食营养及用餐搭配讲座等,引起同学对早餐的重视。
3)可进一步综合上课打卡数据,学生食堂的消费频次、消费金额和消费时间、上课打卡时间等多项信息,设定公式模型进行计算,得出学生生活规律指数。将生活规律指数与预警机制挂钩,加强学生管理,早提醒、早介入。
3.3 加强个人消费管理
利用大数据技术生成每个人的个人消费画像,学生可以看到自己的消费数据,例如每月消费金额及累计消费金额,早午晚餐的平均消费金额及次数等,早餐次数过少还可以有温馨提示等,让学生更了解自己消费,做好消费计划,同时毕业后也可查阅,保存学生时代的回忆。
4 结束语
对食堂消费大数据的应用,可促进食堂管理工作从传统经验直觉模式向数据决策模式的转变,通过对数据分析挖掘出潜在的价值,[8]优化食堂管理工作。
另外可进一步将校园一卡通数据结合学生学习成绩、学生工作系统等数据,把学生的成绩、消费、借书、上课打卡考勤、参加校园活动情况、获奖情况等多维度属性分析出来,形成更加全面、生动、直观的学生画像,该画像能够帮助学校更及时准确地了解学生情况,对开展个性化教育、科学决策制定、及时做出问题预警等工作起到至关重要的作用。[9]而且通过个人画像能帮助学生关注自己的生活动态,及时发现自己在生活中不易察觉的变化,从而做出评价和改善。