多维数据分析在食品监管中的应用
2019-08-23郭承湘吴帅陈宁江
文/郭承湘 吴帅 陈宁江
各食品监管部门在政务信息化工程的引领下,基于各部门的监管职能,建设了很多业务系统,这些业务系统使食品监管部门大幅度提升了监管效率,同时也积累了大量、类型多样的食品监管大数据。这些数据只有很少一部分被开发利用,应用方向主要有监管业务执行历史情况追溯[1-2]、建设决策系统或数据统计分析系统。如何利用大数据技术挖掘食品监管数据,解决食品监管数据的分析问题,开展食品安全监管监测预警工作[3],是食品监管部门面临的巨大挑战。
余学军[4]提出利用大数据技术,实现食品数据的自动处理分析和食品安全信息共享数据库的智能化处理,形成智慧食品安全管理系统。章德宾等[5]构建基于BP神经网络的食品安全预警模型,能够有效识别、记忆、预测食品安全日常监测数据中的危险特征。陈恺[6]利用改进关联规则-改进摘权AHP-BP神经网络对食品抽检数据进行重金属污染等预测。郭承湘[7]等利用关联规则算法Apriori挖掘投诉举报数据监察投诉热点问题和热点地区。这些食品监管数据挖掘研究主要针对特定的食品监察专题数据,没有对多源的食品监管数据进行数据挖掘。食品监管数据包括日常监管、抽检监测、投诉举报、执法办案、舆情监测、食源性疾病监测等专题数据,具有数据的多源性和多维度性。因此,跳出单一思维模式,基于多源食品监管数据,利用多维数据分析挖掘食品监管数据,是本文的研究重点。
本文基于行政审批、日常监管、投诉举报、食品安全抽检和稽查办案等食品监管专题数据,从食品案底企业分析、食品稽查办案案件趋势分析、食品安全抽检专项分析、食品安全日常监管分析等多个方面,探讨了多维数据分析在食品监管中的应用价值,构建了多种多维数据分析模型,并构建了原型系统。
表1:“案底企业办理许可”分析
1 多维数据分析模型
多维数据分析模型一般是建立在数据仓库之上的。数据仓库是用来分析数据并且从现有数据中发现新的价值,主要用于预测未来的情况。数据仓库必须集中于某一问题领域。加入仓库中的数据经过了数据净化、数据准确性检查的过程,数据仓库中的数据本身是稳定增长的,具有低复杂性和强读取性。数据仓库的数据主要采用多维数据分析模型方式设计数据库。多维数据模型是为了满足用户从多角度多层次进行数据查询和分析的需要而建立起来的基于事实和维度的数据库模型。多维数据分析可实现数据展示、查询和获取。同时,通过数据仓库可以根据不同的数据需求建立起各类多维数据模型,并组成数据集市开放给不同的用户群体使用,也就是根据需求定制的各类数据商品摆放在数据集市中供不同的数据消费者应用[8]。
多维数据分析已经应用在价格监测、城市出行等领域,具有较强的监管应用价值。王世春[9]等构建商品价格多维数据分析模型计算商品生产、批发等环节价格指数,预测现货价格后期趋势并进行分析预警。蔡正义[10]建立基于多维数据分析模型的出行非负张量分解模型,对多维出行信息进行模式识别,揭示出行的时空模式,提出考虑居民出行OD的公交服务评价指标和路网在运车辆估计方法。
2 多维数据分析在食品监管中的应用
以行政审批、日常监管、投诉举报、食品安全抽检和稽查办案等食品监管专题数据为研究对象,建立多维分析模型,探讨数据分析为部门在食品监管业务开展中的作用,研究的架构图如图1所示。
2.1 案底企业分析
图1:面向食品监管应用的多维数据分析架构
图2:“案底企业办理许可”多维数据分析模型
图3:“案件趋势分析”多维数据分析模型
基于地域、案底类型、时间、单位、许可办理等维度,构建“案底企业办理许可”多维数据分析模型如图2所示。
“案底企业办理许可”多维数据分析模型进行各类案底企业进行行政审批事项办理的进程分析,监察食品企业的市场准入。
2.2 案件趋势分析
基于案件来源、案件缘由、时间、单位、地域等维度,构建“案件趋势分析”多维数据分析模型,模型如图3所示。
“案件趋势分析”多维数据分析模型计算出未取得许可证从事生产经营案件的高发时段,对行政审批办事窗口、监管部门工作成员的工作负荷起到一个风险监测、主动预防的作用。
2.3 抽检专项分析
基于检验目的、食品类别、检验项目、时间、抽检环节、地域等维度,构建“抽检专项分析”多维数据分析模型,模型如图4所示。
“抽检专项分析”多维数据分析模型既可实现对不合格食品的溯源,也可利用历史检查分析预测食品安全。
2.4 日常监管分析
基于企业类型、检查类型、检查模板、时间、单位、地域等维度,构建“日常监管分析”多维数据分析模型,模型如图5所示。
“日常监管分析”多维数据分析模型分析检查模板使用频率,为制定监管计划提供辅助决策;同时,提供食品日常监管多维报表,为监管部门的精细化监管、主动防控决策、统计决策提供数据支撑。
3 系统实现
本文实现了多维数据分析在食品监管中的应用模型的验证原型。系统使用Mondrian多维数据分析引擎,采用Echarts图表作为数据展现工具,可视化展示个模型的分析结果,包括案底企业分析、案件趋势分析、抽检专项分析、日常监管分析、投诉举报分析、企业画像等模块。系统的主界面如图6所示。
3.1 “案底企业办理许可”分析
利用“案底企业办理许可”多维数据分析模型,对从2016年1月至2018年12月3年的广西食品药品行政审批和稽查办案数据进行分析,如表1所示。
监管部门可快速掌握监察结果:2017年有10家案底企业完成了行政审批事项办理,如图7所示;系统应用后,没有存在吊销许可证等案底企业办结行政审批事项。
3.2 企业画像
图4:“抽检专项分析”多维数据分析模型
图5:“日常监管分析”多维数据分析模型
图6:系统主界面
企业画像是综合各多维数据分析模型,利用企业名称、行业、类型、是否存在案底、是否存在检查违规、是否存在抽检不合格以及是否有被投诉历史情况等条件,对企业精确画像。同时,描绘企业生命线,展示企业从注册到当前在食药监监管过程中的每一次监管情况,如图8所示。从而实现对企业的全生命周期的监管概览,监管部门即可制定重点监管单位名录以及为其”对症下药”。
4 结束语
多维数据分析在食品监管中具有多方面的应用价值,可建立多种分析主题,对食品监管数据进行深度挖掘,为食品监管部门提供多维度的监察和预防,提供食品监察决策依据,加快食品大数据分析平台建设,促进实现智慧食品监管。下一步,我们将进行基于深度学习的食品监管预警研究,实时监测食品安全,让食品安全红线主动响起警报,防范于未然,保障人民的食品安全。
图7:2017年存在案底企业申请许可办结情况
图8:企业画像