一种评估网络餐饮商家风险的方法
2019-10-21郭承湘刘姝王思宇
郭承湘?刘姝 王思宇
摘 要:近年来,网络餐饮的快速发展给人们的用餐提供了更丰富的选择和极大的便利。但同时,对网络餐饮商家的监管也面临着全新的挑战。本文提出一种用于评估网络餐饮商家风险的方法。首先通过爬虫从三大点餐平台(饿了么、美团和百度)爬取商家基本信息、证照信息和评论信息。然后通过基于深度学习的图像和文本识别技术,判断商家是否存在违规行为。最后使用层次分析构建商家违规风险的整体评价模型。
关键词:网络餐饮监管;风险评估模型;食品安全;深度学习
1 网络餐饮服务概述
近年来,“互联网+餐饮服务”等新兴业态快速发展,网络餐饮服务在促进了餐饮业发展的同时,也对食品安全监管提出了重大挑战。党的第十九次全国代表大会报告中明确指出“实施食品安全战略,让人民吃得放心”。国家十三五食品安全规划也明确指出“严格互联网食品经营、网络订餐等新业态监管。加强互联网食品经营网上监测能力建设,实施‘ 互联网+食品安全监管项目,推进食品安全监管大数据资源共享和应用,提高监管效能。”针对网络餐饮的快速发展所带来的诸多问题,国家食品药品监督管理局相继出台了《网络食品安全违法行为查处办法》《网络餐饮服务监督管理办法》征求意见,并于2017年11月10日正式颁布《网络餐饮服务食品安全监督管理办法》。各项政策均明确指出要加强网络餐饮服务食品安全监督管理、规范网络餐饮服务经营行为、保证餐饮食品安全。
CNNIC第41次《中国互联网络发展状况统计报告》显示,2017年中国网上外卖增长明显,用户年增长率达到64.6%,中国餐饮O2O行业市场规模已达7 799.6亿元,较去年同期增长87%[1],网络餐饮市场规模快速扩张带动行业发展的同时也埋下了不少食品安全隐患。2016年央视“3.15晚会”上对无证商户利用第三方平台从事网络订餐服务,且餐饮实体店在制售过程中的食品安全隐患进行了“大揭底”,在全社会引起了不小轰动。由于网络餐饮服务第三方平台责任落实不到位、入网餐饮服务提供者良莠不齐、网络餐饮虚拟性和跨地域特点等原因,网络餐饮的监管难度较大,传统监管模式难以应对海量、复杂的监管需求。
针对我国现在网络餐饮商家存在的种种问题,研究者们更多地从责任主体、政策应对措施和防范方法等方面进行讨论和研究[2-5],却鲜有研究针对如何及时发现商家违规问题。综上所述,文本提出一种用于对网络餐饮商家违规风险的评估模型,旨在帮助监管单位及时发现存在违规可能性的高风险商家。本文提出的商家违规风险评估模型从证照是否公示、评论情感、是否超范围经营和平台店铺评分四方面进行评价。首先使用网络爬虫从“美团”“百度外卖”(已更名为“星选”)“饿了么”三大外卖平台爬取餐饮商家的基本信息(包含店铺评分、售卖商品名称、店铺名等)、证照信息和评论信息。使用ResNet深度神经网络构建证照分类模型,判断商家是否上传了相关证照;使用TextCNN算法对评论进行情感分析,计算评论差评率;使用改进的RNN算法判断是否存在超范围经营。最后使用层次分析法来综合上述四方面得到商家违规风险。
2 证照未公示检测算法
按照我国相关法律法规要求,网络餐饮商家需要公示“食品经营许可证”或“餐饮服务许可证”。检测网络餐饮商家证照是否公示的基本方法是:通过使用构建的证照分类模型,识别网络餐饮商家公示的所有证照的类型,再判断其中是否包含“食品经营许可证”或“餐饮服务许可证”。为此,采用ResNet网络进行证照分类。
与通常的DCNN(Deep Convolu-
tional Neural Network,深度卷积神经网络)相比,ResNet将网络的基本构成模块替换为残差模块,其示意图如图1所示。
残差模块中的跳跃连接能够大大降低因为网络层数增加而导致的梯度消失问题。因此通常ResNet网络的层数很深,且效果也较一般卷积网络要好。本文使用ResNet34模型。模型训练采用20 000张经人工标注的证照数据,标注类型包括六大类:营业执照、食品经营许可证、网络餐饮许可证、三小备案证、食品流通许可证和其他(如药品经营许可证)。在模型训练完成后,使用另外7 388张经人工标注的证照进行模型测试,其准确率达99.419%。
为了判断商家是否存在证照未公示情况,对商家的所有证照使用模型进行类别判断,只要其中包含“食品经营许可证”或“网络餐饮许可证”,则判断为“证照已公示”;否则将商家判断为“证照未公示”。
3 超范围经营检测算法
超范围经营检测算法用于检测网络餐饮商家售卖的商品是否超出了其许可证规定的范围。根据国家相关法律法规规定,网络餐饮商家售卖的商品分为以下几类:预包装食品、散装食品、热食类食品、冷食类食品、生食类食品、糕点类食品和自制饮品。超范围经营检测算法的基本原理为:通过使用店铺名和其售卖的商品名称来确定商品所属类别,进而判断店铺的经营范围,然后与其许可证允许范围进行比较,判断是否存在超范围经营情况。
因为店铺名和售卖商品名通常仅包含数个中文字符,因此直接以单个字符对店铺名和商品名进行分割。在此基础上,使用word2vec算法对数据集中的每个中文字计算其字表示向量。word2vec使用语言学中的分布式假设,即认为文字的语义信息能够从其上下文中推断出来。为此,将每一个中文字表示为一个固定维度大小的向量,并用公式(1)表示两个词的條件概率。
其中vw表示词w的词向量,V表示整个词表。Word2vec的优化目标为给定一个词w,使得其上下文context(w)出现的联合概率最大化,即(如图2所示)。
max p(context(w)|w)(2)
在假设任意两个条件概率相互独立的情况下,上式可改写为:
优化式(3)等价于优化其对数函
使用梯度下降优化上述目标函数,即可得到每个中文字的向量。为了判断商家p售卖的商品q所属的类别,首先使用训练好的字向量使用连续词袋模型来对其进行表征,然后使用店铺p的表征向量与商品q的表征向量进行拼接,得到最终表征。
最后使用一个包含两层隐层的多层感知器来训练商品名类型识别模型。对于每个店铺,使用训练好的模型来判断其每个商品所属的类别,最后与其许可证的经营范围进行比较,若存在超出许可证范围的商品,则判断商家存在超范围经营行为。
4 评论情感分析算法
本文采用TextCNN来实现评论情感分析。TextCNN的网络结构如图3所示。
在TextCNN中,一条评论被表示为一个M×N的矩阵,其中M为该评论中单词的数量;N为单词的词向量维度。词向量的计算方法与第3节中介绍的字向量的计算方式一致。评论矩阵经过卷积核后得到多个特征图,通过对特征图中的元素进行最大池化操作得到具有较强表征能力的特征。最后通过全连接softmax实现分类。
TextCNN对于处理评论情感分析有效的主要原因在于评论的情感通常仅仅由句子中的几个关键词来表征,因此只要能够让算法自动捕获住这些表征情感的关键词,就能得到较好的效果。而TextCNN使用较小的卷积核,这能让算法更加容易发现短词语与评论情感之间的关系。TextCNN与经典的N-Gram模型具有相似的效果,但无需事先建立所有词的Gram词组,因此更加高效。为了训练TextCNN模型,首先挑选出3万条评论数据,将其标注为好评、中评和差评中的一类。然后通过TextCNN算法进行学习,得到评论情感分析模型。
5 网络餐饮商家风险评估
对网络餐饮商家进行风险评估需要用到四个因素:证照是否公示、是否超范围经营、负面评论占比和店铺评分。其中证照是否公示为取值0或1的布尔量,记为f1,其取值为0表示商家已将所需证照进行了公示;反之则未公示。同理,是否超范围经营也为取值0或1的布尔量,记为f2,其取值为0表示商家没有超范围经营的情况;反之商家存在超范围经营。负面评论占比为取值0到1的比值,记为f3,店铺评分的原始值为1到5,将其采用如下公式转换至0到1的区间。
其中s为商家原始的平台打分值。风险评估算法采用上述4个因素的线性加权求和来表示网络餐饮商家的整体风险。
risk=α1 f1+α2 f2+α3 f3+α4 f4(6)
其中权重和满足:
α1+α2+α3+α4=1(7)
采用层次分析法来计算上述权重。层次分析法的一个核心思想是:如果直接赋予多个因素权重比较困难,那么在不同因素之间两两比较则是相对容易的。因此首先构建比较矩阵,采用表1所示的比较标度。比较矩阵如表2所示。通常,比较矩阵可由多个行业专家一起讨论得到。
为了求解每个因素的权重,采用方根法计算。其具体计算步骤如下。
(1)首先对比较矩阵的每行元素计算它们的乘积,得到行元素乘积。以比较矩阵第一行为例,可得其行元素乘积为1×3×9×5=135。
(2)然后对计算得到的每个行元素乘积计算n次方根,n为因素数量,这里为4。
(3)最后对所有因素的四次方根进行归一化得到其对应的权重值。
对表2中的比较矩阵按照上述计算得到的结果见表3所示。
那么,式(6)即为:
risk=0.568f1+0.223f2
+0.042f3+0.167f4(8)
这样计算得到的风险指数取值为0到1,其值越大,表示风险越高。针对不同情况,可以通过对该区间进行缩放来达到限定风险指数取值在任意区间的目的。
6 结语
本文提出了一种对网络餐饮商家风险进行评估的方法。该方法使用机器学习、人工智能技术,通过对网络餐饮商家证照进行智能识别、评论情感分析、超范围经营发现,并使用层次分析法来确定各因素的权重占比,从而评估商家风险。本文提出的方法能够辅助网络餐饮大数据靶向监管平台的建立,提升网络餐饮监管效能,降低监管部门、网络餐饮主体、消费者间的信息不对称,提升食品安全精细化管理和社会共治水平。
参考文献
[1]姜素芳,茅鸯对,卢子木.基于PEST的网络餐饮食品安全现状及监管对策[J].中国食物与营养,2018,24(7):29-33.
[2]国家食品药品监督总局.食品经营许可管理办法(国家食品药品监督管理总局令第17号)[Z].2015.
[3]李雨桐,杜海玲.我國网络餐饮服务平台存在的问题与对策[J].对外经贸, 2017(3):92-94.
[4]王三虎,贾娅玲.网络餐饮平台食品安全管理的责任、挑战和对策[J].食品科学技术学报,2018,36(5):17-22.
[5]吕永卫,霍丽娜.网络餐饮业食品安全社会共治的演化博弈分析[J].系统科学学报,2018(1).
作者简介:郭承湘(1978—),男,湖南常德人,硕士研究生,高级工程师。研究方向:计算机应用技术。