校园一卡通消费行为数据分析与研究
2019-09-10张四海李珊珊
张四海 李珊珊
[摘要]以南开大学校园一卡通交易流水数据为研究对象,通过对原始数据的清洗、整合与统计分析,实现数据可视化,满足学校直观管理的需要。从一卡通原始数据库中提取3 719 570条历史交易数据,数据清洗、分类、一致性检验和统计分析采用Matlab、SPSS和Origin。首先,对南开大学一卡通总体消费状况进行分析;然后,通过对时间离散化处理,对师生在食堂的就餐规律进行分析。深入研究一卡通流水数据,有助于全面掌握师生的行为规律,为学校优化资源配置和科学决策提供数据依据。
[关键词]一卡通;交易流水;数据挖掘;消费行为分析
[中图分类号]TP 31113[文献标志码]A[文章编号]10050310(2019)0100
6405
Consuming Behavior Data Analysis and Research Based on
Campus ECard System
——Taking Nankai University as an Example
Zhang Sihai, Li Shanshan
(Office of Informatization Construction and Management, Nankai University, Tianjin 300071,China)
Abstract: In this paper, the consuming transaction data in Ecard system is studied. Data visualization is realized by cleaning, integration and statistical analysis of the original data. Visualized managerial demand for university is satisfied by this way. 3 719 570 of historical transaction data were extracted from Ecard original database. First, the basic consuming condition for Nankai University Ecard system was analyzed. Then the dining pattern of faculty and students was studied by using the method of time discretization. The deep research for the Ecard transaction data can help us to understand the behavior pattern of faculty and students. And it is also significant to optimize allocation of resources and for the related administrative departments to make scientific decisions.
Keywords: Ecard; Consuming transaction data; Data mining; Consuming behavior analysis
0引言
圖1一卡通交易流水数据分类
Fig.1Classification for Ecard consuming transaction data
作为校园生活数字化、智慧化的载体,一卡通系统扮演着极其重要的角色[19]。校园一卡通系统是信息技术与通信技术的完美结合,是ICT技术在校园场景中的成功应用。一卡通不仅极大地方便了广大师生的学习和生活,而且也有效提升了学校的管理水平[1011]。随着时间的推移,校园一卡通系统累积了大量的消费和行为数据,一卡通数据具有数据量大、交易流水详尽、真实可靠的特点。基于数据挖掘理论,从大量繁杂、无序的原始数据中提取有价值的信息,通过分析和建模来实现知识发现,将有助于学校全面掌握师生的行为规律,对学校优化资源配置和科学决策具有重要意义[1215]。
本文以南开大学校园一卡通交易流水数据为研究对象,通过对原始数据的清洗、整合、分类与统计分析,实现数据的可视化,满足学校的直观管理需要。首先,对一卡通原始数据进行系统地分类;对校园卡两种不同充值方式的占比、消费类型占比,以及不同身份群体在食堂消费的占比和金额进行了统计分析。其次,对南开大学校区搬迁前的食堂历史消费数据进行详细分析,得出交易次数随日期变化的就餐规律曲线。最后,对食堂每天的营业时间进行离散化,得出工作日和节假日每天不同时段的就餐规律。根据上述分析结果,对学校膳食中心资源优化配置提出建议。
1校园一卡通交易流水数据的分类
南开大学一卡通系统始建于2007年,是一个基于C/S架构的多应用集成系统。目前,它能够为全校师生提供食堂餐饮、超市、洗浴、图书借阅、门禁、学籍注册、自助文印及体测等多种服务。经过10余年的发展和不断完善,南开大学一卡通系统已形成了以专用网络为基础,以一卡通平台为核心,具有较高安全性、健壮性和扩展性的应用系统。
经过多年的建设和运营,一卡通系统中沉淀了大量的交易流水数据。原始数据杂乱无章,各种交易流水数据和行为数据无规律地混杂在一起。因此,首先我们需要对原始数据进行清洗、整合与分类。如图1所示,一卡通原始数据包括交易类数据和其他行为类数据两大类,其中交易类数据主要包括食堂、超市、洗浴、图书超期、网费、自助文印等消费数据,其他行为数据主要包括宿舍、图书馆和学院的门禁,报到注册以及体育场馆使用等数据。经过数据的清洗与分类,我们可以作进一步的深入分析,得出师生的消费与行为规律,对异常行为进行预警,对资源优化提出建议,以及对师生行为进行预测,等等。
食堂消费是校园一卡通最重要的应用,因此本文的研究重点是食堂消费的交易流水数据。从一卡通原始数据中提取出食堂消费数据,进行深入分析,能够挖掘师生的就餐规律,从而为学校相关部门科学决策提出合理建议。
2数据挖掘结果及分析
21总体消费情况分析
北京联合大学学报2019年1月
第33卷第1期张四海等:校园一卡通消费行为数据分析与研究
南开大学拥有在校师生近4万人,每天产生的交易流水数据为7万条左右,每年产生的数据量为数千万条。我们采用抽样的方法对一卡通历史消费数据进行分析,提取了2015年4月和5月的3 719 570条交易流水数据。选取这两个月的数据,主要有两个原因:一是从行为规律一致性的角度来考虑的,3月份刚刚开学,学生要选课,然后逐步适应校园生活;6月份是考试月,学生要复习备考;而4~5月
师生的教学活动和生活都比较有规律,因此消费行为具有更好的一致性。第二个原因是因为南开大学从2015年9月开始部分搬迁到新校区,因此我们计划对搬迁前的总体消费状况进行详细分析。
由师生操作的交易流水数据主要包括充值和消费两大类,其中充值包括银行卡转帐和现金两种方式,消费类操作包括食堂和超市的小额消费、网络缴费、洗浴及自助文印等。
图2给出了不同充值方式所占的比例。银行卡转帐包括3种方式:圈存机自助转账、网上转账和手机APP转账。由图2可知,银行卡转帐已经成为南开大学一卡通主流的充值方式,占到总数的8754%;而现金充值方式比例为1246%,使用这种方式充值的主要是退休教职工以及部分无法正常绑定银行卡的师生。随着时间的推移,银行卡转帐方式所占的比例会越来越高。
图2一卡通两种充值方式占比
Fig.2Proportion of two prepaid ways in
Ecard system
图3给出了各类交易流水数据的占比。如图所示,食堂消费流水数据的比例最高,达5291%,对这部分数据将在后面进行详细分析;其次是洗浴数据,占3127%,这部分数据占比大的原因,是因为南开大学为节约能源,采用计水量收费,学生一次洗澡可能会多次刷卡;超市消费数据占1454%;占比最少的是网络缴费数据,仅占129%,这主要是南开大学每个月赠送5 GB免费流量,且校内流量免费,因此网费流水数据占比较少。
图3一卡通消费类型占比
Fig.3Proportion of different Ecard
consumption types
图4给出了不同身份群体食堂消费所占的比例。由图可知,本科生的食堂消费比例最高,达6655%;硕士和博士研究生消费比例接近,分别为1481%和1227%;而教职工的食堂消费比例最低,仅为636%。
图4不同身份群体食堂消费占比
Fig.3Proportion of
canteen consumption for
different groups
表1給出了不同身份人群三餐的平均消费和标准差。早餐的平均消费最低,在160~203元之间。午餐和晚餐的平均消费在618~724元之间。教职工一日三餐的消费最高。
22食堂就餐规律分析
为分析师生在食堂的就餐规律,我们统计了2015年4~5月
,师生每日在食堂的刷卡消费次数,从而得出就餐规律曲线,如图5所示,就餐规律曲线波动非常有规律。在工作日,食堂周一至周四就餐人数较多,周五人数有些减少。休息日(周六、日)的就餐人数明显减少,约为工作日的一半。就餐曲线的两个最低点分别出现在清明和“五一”小长假,就餐人数仅为工作日的1/3。该结果能够为学校膳食中心优化资源配置提供一定的参考,依据用餐消费数据,食堂在工作日、休息日及节假日可以分别按需准备适量食材,或增减部分窗口,以提高资源利用率。
为研究师生每天的消费习惯和规律,我们对时
表1不同身份人群三餐的平均消费和标准差
Table 1Average consumption and standard deviation of three meals for different groups
餐
别
本科生
硕士研究生
博士研究生
教职工
平均消费
/元标准差平均消费
/元标准差平均消费
/元标准差平均消费
/元标准差
晚餐709528618528690575724596
午餐708490661444672474719674
早餐203169180134160124191195
图5师生食堂就餐规律曲线
Fig.5Consuming frequency distribution graph in canteen for faculty and students
间进行离散化处理,每半小时为1个时段,一天共
分为48个时段。食堂的营业时间是从早6:00至晚9:00,因此
仅对这期间的30个时段进行分析。为研究方便,我们用字母编号代表每个时段,表2表示将食堂营业时间离散化后,字母编号和时段的对应关系。
表2食堂营业时间离散化——字母编号和
各对应时段的关系
Table 2Discretization for canteen open time—the
relationship between letter code and period
编号时段编号时段
A16:00—6:30H213:30—14:00
A26:30—7:00I114:00—14:30
B17:00—7:30I214:30—15:00
B27:30—8:00J115:00—15:30
C18:00—8:30J215:30—16:00
C28:30—9:00K116:00—16:30
D19:00—9:30K216:30—17:00
D29:30—10:00L117:00—17:30
E110:00—10:30L217:30—18:00
E210:30—11:00M118:00—18:30
F111:00—11:30M218:30—19:00
F211:30—12:00N119:00—19:30
G112:00—12:30N219:30—20:00
G212:30—13:00O120:00—20:30
H113:00—13:30O220:30—21:00
统计每个时段刷卡交易次数,就可以对师生每日在食堂的就餐规律进行详细分析。由图5可知,师生在工作日和节假日的刷卡消费次数有较大差异,因此我们需要对工作日和节假日的就餐规律分别进行分析。图6给出了在工作日和节假日的师生就餐规律曲线。可以看出,两条曲线具有相同的趋势,在早、中、晚都同样出现了3个用餐高峰,但两条曲线在每日高峰时段具有较大差异,节假日的总体就餐人数远少于工作日。节假日早餐的就餐高峰右移,从7:00—7:30后移至7:30—8:00,这说明师生在节假日用早餐的时间要晚于平时,因此膳食中心可以考虑在节假日适当延长早餐供应时间。
图6工作日、节假日的师生就餐规律曲线
Fig.6Consuming frequency distribution graph in workdays and holidays for faculty and students
工作日早餐高峰時段(7:00—7:30)平均刷卡次数为2 322次,节假日早餐高峰时段(7:30—8:00)平均刷卡次数为755次,仅约为工作日的1/3。工作日午餐刷卡次数最多的时段为11:00—11:30,平均刷卡次数为3 415次;节假日午餐刷卡次数最多的时段为11:30—12:00,平均刷卡次数为1 383次,不到工作日的一半。晚上刷卡次数最多的时段为17:00—17:30,其中工作日平均刷卡次数为2 135次;节假日平均刷卡次数为1 078次,约为工作日的一半。
3结束语
本文以南开大学校园一卡通交易流水数据为研究对象,通过数据的清洗、整合与统计分析,实现数据的可视化。对食堂消费数据进行了详细分析,
给出师生的就餐规律曲线,满足了学校直观管理的需要,并对膳食中心优化资源配置提出了建议。
随着大数据时代的到来,对校园历史沉淀数据进行挖掘、分析与建模具有极其重要的意义。对校
园卡数据进行消费与行为分析属于一卡通系统的二次开发,深入分析师生的一卡通数据,有助于学校掌握师生的行为规律,优化资源配置,对高校管理部门科学决策具有重要意义。
[参考文献]
[1]许鑫.南京大学数字化校园建设架构[J].教育信息化,2002(8):44-45.
[2]徐为民,徐兵,朱显灵,等.校园一卡通和数字化校园[J].教育信息化,2002(S1):50-51.
[3]苏文胜,马千军.基于数字化校园的校园一卡通构建[J].武汉理工大学学报(信息与管理工程版),2005,27(1):99-101.
[4]顾金娣,席琳琳.校园一卡通系统的应用与思考[J].上海第二工业大学学报,2005,22(3):71-76.
[5]张升平.数字化校园之校园一卡通的建设[J].重庆工商大学学报(自然科学版),2008,25(1):56-59.
[6]孟昆鹏.数字校园如何向智慧校园转型的探讨——以开封技师学院为例[J].中国培训,2016(11):52-54.
[7]樊铁成,高路,管晶,等.智慧校园一卡通未来发展研究[J].郑州大学学报(工学版),2017,38(S1):25-28.
[8]田丽.智慧校园环境下的校园一卡通建设[J].华东师范大学学报(自然科学版),2015(S1):530-535.
[9]许鑫,苏新宁,姚瑶.数字化校园一卡通平台研究[J].现代图书情报技术,2005(7):54-59.
[10]李淑娟,周伟强,宓詠.如何实现校园一卡通高效的运行管理探索[J].实验技术与管理,2011,28(6):7-10.
[11]张九娟.校园“一卡通”在学校管理中的应用研究[J].高校后勤研究,2014(2):63-65.
[12]李珊娜.基于校园一卡通平台的数据挖掘应用研究[J].铁路计算机应用,2010,19(6):55-58.
[13]张兵兵,王建,张建威,等.数据挖掘在校园一卡通系统中的应用初探[J].数理医药学杂志,2009,22(5):572-575.
[14]陈锋.基于校园一卡通系统的高校用户就餐消费行为分析与数据挖掘[J].中国教育信息化,2014(9):47-49.
[15]薛黎明,栾维新,李志淮,等. 数据挖掘在校园一卡通消费数据分析中的应用[C]//中国高等教育学会教育信息化分会.中国高等教育学会教育信息化分会第十二次学术年会论文集.北京:中国高等教育学会教育信息化分会,2014:8.