基于大数据分析的餐饮业防损管理系统
2018-04-23周鸿屹孙钦东罗作民
王 倩,周鸿屹,孙钦东,罗作民
(1. 西安理工大学 研究院,西安 710048;2. 西安理工大学 计算机科学与工程学院,西安 710048)
0 引言
餐饮行业作为促进国民经济增长的重要支柱产业,一直以来都得到了社会各界的广泛关注。近年来,我国餐饮行业发展迅速,从巨型连锁企业到小型门店餐馆众多餐饮企业不断涌现。行业发展的同时,产业规模和经营领域的扩大也使得企业之间的竞争状况日趋激烈,再加上食品原材料成本、劳动力成本提升,管理人才匮乏等多方面问题,导致餐饮行业净利润率大幅下降。仅通过扩大经营规模,所取得的利润效益不会有质的改变,企业的核心竞争力已经从规模竞争转向运营竞争,忽略运营过程中的非必要损耗会对餐饮企业发展带来极大的负面影响[1]。因此,建立完善的餐饮业防损管理系统,不仅可以规范餐饮企业服务行为,提高管理效率和内控机制,降低企业运营成本,增强企业竞争力,而且能够在降低企业不必要损失的同时增加营业收入,这对企业可持续发展有重要意义。
目前针对防损相关的研究,大多都是通过管理者多年的管理经验,或者大量的调研和统计分析进行的。Eriksson等人对瑞典零售店的食品浪费模式进行研究,通过建立合理的存储记录来减少和预防零售食品的浪费[2]。Lebersorger等人研究的是食品零售业防损,对食品损失潜在的影响因素和原因进行调查研究,为食品损失预防措施的制定提供依据[3]。童光森等人就连锁超市防损管理的重点与难点入手,从防损区域的划分、分流管理等环节阐述了对损耗的控制与管理工作,并介绍了各岗位控制损耗的具体工作内容[4]。
而餐饮行业由于其属于劳动密集型产业,其内容和经营方式都具有多样化的特征,针对餐饮业的防损研究少之又少。本文提出的餐饮业防损管理系统,可以从“节流”角度减少企业内部由于管理缺失,规章制度不完整等因素造成的损失。通过分析企业运营数据,从服务、经营过程发现各类异常事件并建立相应的异常事件识别模型。同时为了保障模型识别的准确性,方便管理者的调查,我们采取异常事件关联定位,视频回放验证等方法尽可能地还原损失发生的场景,让管理者随时随地获取损失数据,查看损失情况,减少管理者审计流水数据的工作量,降低管理成本,间接地增加营业额和利润,促进企业健康发展。
1 防损管理系统框架
餐饮企业中,客户的账单数据和内部计件数据包含大量反映企业经济状况的重要信息。本文所使用的相关研究数据都来源于2016年3月1日到2016年10月31日某连锁餐饮企业的具体运营数据,其中包括的所有账单流水,付款流水,服务员详细计件数据,视频监控数据等。
防损管理系统基于企业运营期间的各种数据,针对目前企业服务不规范导致的企业非正常利润损失问题,首先对餐饮数据非结构化、形式多样的数据进行预处理,其次在优化处理后的数据基础上研究企业服务流程,分析服务过程各类异常事件产生的原因,建立异常事件识别模型,最后再通过视频监控回溯的方法对异常事件的场景进行定位回放,查看当时的损失具体情况,为管理者对运营过程中的异常处理提供可靠的证据支持。系统框架如图 1所示。
2 基于机器学习的异常事件识别模型
2.1 服务流程与特征分析
通过仔细审阅门店人工稽查确认的异常账单数据和服务员计件数据,并与相关经理人员讨论后,我们总结了以下三种类型异常事件:
(1)漏记油碗:油碗是火锅中重要的调味品。由于自助油碗的存在,用餐时油碗的数量是需要服务员来记录的。当就餐人数较多,服务员可能会漏记中途新来的顾客或者口述不需要油碗但依然使用的顾客。
图1 防损管理系统框架Fig.1 Framework of the loss prevention management system
(2)优惠吃单:打折和优惠是餐饮企业常用的促销手段。但是在具体实施过程中,有的服务员会利用自己的权限以及结账流程中的一些漏洞,将本应该优惠给顾客的利益据为己有。
(3)虚增计件:员工工资的一部分是按工作量来计算的。餐饮企业运营过程中,有一些工作量是通过员工自行打卡统计的,比如传菜次数,服务次数,洗碗时间,参与活动次数等。因此会出现员工为牟取更多工资而虚增自己的工作量。
根据业务流程和异常事件以下列出了一些异常事件的真实案例说明。漏记油碗常发生于顾客就餐时期,最典型的案例就是,起初只有两位顾客用餐,中途又来了两位顾客,由于服务员工作失误,忘记增加新来顾客的自助油碗费用,结果导致餐饮利润损失。虚增计件,大多表现为服务员会自行虚报就餐人数以及服务次数,从而增加自己的工作量。优惠吃单异常事件常发生于餐后,不同服务员拥有不同的优惠权限,若顾客看完预结账账单后将钱交给服务员后匆匆离开,服务员便有可趁之机,使用自己的优惠权限对账单进行优惠后再去结账台结账,将本应该是顾客享受的优惠金额纳为己有。
通过对业务流程的分析是为了更加深刻地理解三种异常事件产生的原因和时期,有助于熟悉应用场景和特征选择。用于数据分析的原始数据可能包含十几项属性,其中一些属性与分析不相关,遗漏相关属性或留下不相关属性都是有害的,通过删除不相关的属性即特征选择过程[5]。特征选择不仅可以减少特征数量,使模型泛化能力更强,减少过拟合,而且好的特征选择能够提升模型的性能,更能增强我们对特征和特征值之间的理解。特征选择过程如图2所示。具体步骤如下:
图2 特征选择过程Fig.2 Featur e selection process
(1)初步预处理原始数据后,根据餐厅经理提供的先验知识和与数据属性,可通过人工筛选得到一组特征全集。
(2)从特征全集中产生出一个特征子集,然后用评价函数对该特征子集进行评价,评价的结果与停止准则进行比较,若评价结果比停止准则好则停止,否则就继续产生下一组特征子集,继续进行特征选择,直到选出最佳特征集为止。选出来的特征子集一般还要验证其有效性。
一个最优的特征属性子集会为后续的评价过程提供良好的基础。搜索的算法分为完全搜索,启发式搜索,随机搜索3大类。完全搜索包括广度优先搜索(BFS),分支限界搜索(BAB)[6],定向搜索(BS),最优优先搜索(BFS)[7]等;启发式搜索包括序列前向选择(SFS),序列后向选择(SBS),双向搜索(BDS),增L去R选择算法(LRS),序列浮动选择(SeqFS),决策树(DTM)等;随机算法包括随机产生序列选择算法(RGSS),模拟退火算法(SA),遗传算法(GS)[8]等。评估函数一般分为五类:相关性,距离,信息增益,一致性和分类错误率。常用的有平方距离、欧式距离、非线性测量、Minkowski距离、信息增益[9]、最小描述长度、互信息[10]、一致性度量、分类错误率、分类正确率等。根据需求,本文目前所使用的搜索算法是最优优先搜索(Best First Search),也就是回溯的贪婪搜索算法进行特征子集的选择。评估函数则通过相关性度量,综合考虑每一个属性的预测能力和他们之间的关联性进行评估。
特征选择结果对后续的异常事件识别至关重要。根据前面提出的特征选择方法,针对每一种异常事件,我们筛选的最终特征集如表1所示。由表中可以看出,最终特征集中的特征都来自于原始数据属性或者他们的组合。
表1 不同异常事件的特征集Tab.1 Features of each exceptional event
2.2 异常事件的分类识别
选择好合适的特征之后,要挑选适当的分类模型来识别具体的异常事件。不同的分类模型适用于不同的数据情况和应用场景,有不同的优缺点。比如决策树易于理解和解释,它能够在相对短的时间内对大型数据源做出可行且效果良好的结果,但是对于各类别样本数量不一致的数据,信息增益的结果偏向于具有更多数值的特征[11];人工神经网络分类的准确度高,并行分布处理能力强,而且能充分逼近复杂的非线性关系,具备联想记忆的功能,但大量的调参工作会影响到结果的可信度[12];SVM(支持向量机)可以解决小样本情况下的机器学习问题,可以解决高维问题,但它对缺失数据很敏感[13-14];朴素贝叶斯发源于古典数学理论,有坚实的数学基础和稳定的分类效率,它的优点需要设定的参数很少,对缺失数据不太敏感,算法也易于理解[15];KNN算法简单有效,重新训练的代价较低,对类域的交叉或重叠较多的待分样本集来说,较其他方法更为合适,但不适用于样本容量较小的类域[16]。集成学习是对多种分类方法的融合,它通过连续调用单个学习算法,获得不同的基学习器,然后根据规则组合这些学习器来解决问题,这需要分配合适的权值[17-18]。通过对比多种分类算法,本文选择使用朴素贝叶斯模型。
进行了多组对比实验来说明朴素贝叶斯方法的合理性,表2是朴素贝叶斯方法与其他分类模型的实验比较结果。由实验结果可看出,朴素贝叶斯模型分类效果比其他分类模型更好。在数据规模不是特别大的场景下,该分类模型准确率较高而且对异常值不敏感。因此,采用朴素贝叶斯模型来识别异常事件。
表2 朴素贝叶斯与其他分类模型的实验比较结果Tab.2 Comparison between different methods
3 基于快速视频回溯的防损查证方法
合理的防损查证方法是防损管理系统中的关键环节,在建立好防损模型以后,对经营数据进行实时处理,通过防损管理系统对异常事件进行预警,管理者在需要确认损失是否发生时通过关联数据的源头视频,查看任意时间段经营视频,验证防损预警的真实性,保障企业以及服务人员合理利益。防损查证主要包括三方面内容:
(1)异常预警机制。通过防损建模过程对经营数据进行定量分析,通过消息提醒、信息推送等多种方式,对企业运营过程中产生的异常事件进行预测并向管理者发出预警信息。
(2)异常事件定位与处理。根据模型识别出的异常事件,将处理后的数据与产生损失场景模型进行比较,匹配实际损失数据,快速定位异常事件场景。
(3)回溯验证方法。为了验证抛出的异常事件确实造成企业经营损失,利用基于自适应流媒体技术视频监控系统,通过关联数据的源头视频,对产生损失的场景进行视频回放,实现异常事件有源可查。
目前,各类餐饮企业门店都安装有视频监控系统,由于视频内容的文件大小等原因,具有快速回溯功能的查证方法是防损系统的关键。现有基于像素域的关键帧提取方法大多建立在视频完全解压的前提下,计算量较大,效率较低,难以满足实时性。
为了保证在任意网络环境下取证视频的清晰播放,基于H.264对实时视频播放质量进行改善[19],在保证播放流畅性与准确性的前提下解决网络情况较差情况的视频播放问题。本文采用基于邻近 I帧DC图像相似度的压缩域关键帧提取方法,可以快速准确地完成网络视频关键帧提取过程,解决现有关键帧提取方法存在的只能处理单一视频标准的缺点,有效减少视频处理的数据量,降低计算的时空复杂度,提高视频内容分析的效率[20]。图3为关键帧提取流程。
图3 关键帧提取流程图Fig.3 Flowchart of the key frame extraction
本方法在压缩域上直接进行关键帧提取,根据相邻 DC图像之间的相似度,将图像聚类成不同的簇 Class(簇内相似度接近,簇间差异较大),随机提取簇内任意帧组成关键帧序列。能够提高视频内容分析的速度,可以快速完成网络视频关键帧提取过程,并保证结果的有效性和准确性。
4 防损管理系统设计
防损管理系统主要分为三大部分:
(1)异常事件判断。主要功能为系统将收到的事件数据根据模型进行筛选,当事件被识别为异常时,将该异常事件抛出;
(2)异常事件数据接收。主要功能为实时接收抛出的异常事件数据,进行存贮,这些数据能够按照不同时间、类型选择进行统计展示;
(3)异常事件产生时对应的视频数据。主要功能为当稽查人员对异常事件进行分析时,系统能够将对应信息的视频数据进行回放取证。
图4为店面总览页面,此页面可以实时查看各店交易事件和异常事件的状态,分店连接状态等。
图5为分店巡视页面。此页面可以查看指定异常事件以及对应的处理情况,并且可以按时间或事
件对指定异常事件进行影像回放,也具有支持画面截图功能。
图4 店面总览页面Fig.4 Page of store overview
图5 分店巡视页面Fig.5 Monitor page of individual store
图6 为统计分析页面,以图形化或报表方式展示各种统计数据,支持用户自定义统计类型,方便管理者的分析使用。
5 结语
未来餐饮行业发展趋势要求中提高企业管理水平与竞争力,借助信息化技术提高人员效率、降低企业运营成本以及标准化、规模化发展是企业未来发展过程中的核心要求。本文实现的餐饮业防损管理系统,可以帮助餐饮行业的管理者及时发现异常事件,尽可能地还原损失发生的场景,并通过视频查证的方法定位损失的具体内容,让管理者随时随地获取损失数据,查看损失情况,减少管理者审计流水数据的工作量,降低管理成本,间接地增加营业额和利润,促进企业健康发展。
图6 统计分析页面Fig.6 Page of statistical analysis
[1] Zhang L. Model projections and policy reviews for energy saving in China's service sector[J]. Energy Policy, 2013, 59:312-320.
[2] Eriksson M, Strid I, Hansson P A. Food losses in six Swedish retail stores: Wastage of fruit and vegetables in relation to quantities delivered[J]. Resources, Conservation and Recycling,2012, 68: 14-20.
[3] Lebersorger S, Schneider F. Food loss rates at the food retail,influencing factors and reasons as a basis for waste prevention measures[J]. Waste Management, 2014, 34(11):1911-1919.
[4] 童光森, 肖威. 连锁超市防损分区与分流管理浅析[J]. 商场现代化, 2014(7): 93-93.
[5] 毛勇, 周晓波, 夏铮, 等. 特征选择算法研究综述[J]. 模式识别与人工智能, 2007, 20(2): 211-218.
[6] 王春梅. 分支限界算法的研究与实现[J]. 现代电子技术,2011, 34(9): 121-123.
[7] Dechter R, Pearl J. Generalized best-first search strategies and the optimality of A*[J]. Journal of the Acm, 1985, 32(3):505-536.
[8] 吉根林. 遗传算法研究综述[J]. 计算机应用与软件, 2004,21(2): 69-73.
[9] 钟宁, 尹旭日, 陈世福. 基于信息增益的最佳属性集发现方法[J]. 小型微型计算机系统, 2002, 23(4): 444-446.
[10] 徐峻岭, 周毓明, 陈林, 等. 基于互信息的无监督特征选择[J]. 计算机研究与发展, 2012, 49(2):372-382.
[11] 王小巍, 蒋玉明. 决策树ID3算法的分析与改进[J]. 计算机工程与设计, 2011, 32(9): 3069-3072.
[12] 毛健, 赵红东, 姚婧婧. 人工神经网络的发展及应用[J].电子设计工程, 2011, 19(24): 62-65.
[13] 丁世飞, 齐丙娟, 谭红艳. 支持向量机理论与算法研究综述[J]. 电子科技大学学报, 2011, 40(1): 2-10.
[14] Xiao xiao, Xu Qihua. A Comparative Research on the Classification and Regression Based on SVM and BP[J]. The Journal of New Industrialization, 2014, 4(5): 48-53.
[15] 王国才. 朴素贝叶斯分类器的研究与应用[D]. 重庆交通大学, 2010.
[16] 闭小梅, 闭瑞华. KNN算法综述[J]. 科技创新导报,2009(14): 31-31.
[17] Polikar R. Ensemble Learning[J]. Scholarpedia, 2012, 4(1):1-34.
[18] 王兵. AdaBoost 分类算法的数学分析[J]. 软件, 2014,35(3): 96-97.
[19] 蒋敏, 周亚建, 张斌. 一种基于量化的H.264视频水印算法[J]. 软件, 2013, 34(8): 46-51.
[20] 孙钦东, 王倩, 郭晓军等. 基于邻近I帧DC图像相似度的压缩域关键帧提取方法[P]. 中国, ZL200910022941.4, 2011.