面向食品安全的电子追溯国家平台设计
2018-08-27国家食品药品监督管理总局信息中心金志刚江苏省质量和标准化研究院王健俊复旦大学雪中博信息技术研究院有限公司
□ 王 超 国家食品药品监督管理总局信息中心 金志刚 江苏省质量和标准化研究院 王健俊 刘 毅 钱 侃 复旦大学 林 雪中博信息技术研究院有限公司
1 背景介绍
食品安全是当前全球关注的热点问题。我国幅员辽阔、人口众多,食品安全问题更加复杂多样。食品安全问题不但威胁人民的健康和生命安全,而且极易通过社交媒体的放大效应引起不良社会影响。
2015年10月起施行的修订后的《中华人民共和国食品安全法》,明确了食品安全追溯的重要性,规定企业在食品生产、加工、流通各环节都要能够实现追溯,强化了“从农田到餐桌”的全程监管。我国食品安全电子追溯平台的建设发展势头迅猛发展的同时,也存在以下不足。
(1)数据标准格式不统一,影响数据对接效率。例如:在定义某批次食品时,有的平台使用“批次号”,有的平台使用“生产日期”,出现数据不统一现象[1]。
(2)缺乏对监管工作的有效支撑。省级追溯平台功能侧重于台账查询、物料进出平衡预警、食品追溯链条分析等应用场景,缺乏与公开性抽检检测数据的有机结合。综合分析的功能较弱,对监管工作的缺乏有效支撑。
(3)平台可扩展性不足。现有追溯平台建设模式在开发新功能时普遍耗时较长,易出现第三方机构由于平台建设周期长、成本高而放弃长期建设运维的风险。
本文致力于设计构建基于物联网技术的食品安全电子追溯服务平台,实现食品从原料生产到销售的全程溯源信息共享,有效服务于食品安全监管,具有良好的可复制、可扩展性能,利于快速部署推广,符合食品安全电子追溯监管的趋势要求。
2 系统设计
2.1 技术背景
食品安全电子追溯服务国家平台(以下简称:国家平台)主要采用的主要技术如下。
(1)数据交换技术
用以解决数据的获取以及数据统一化处理的问题,具体采用ETL(Extract-Transfor-Load)技术。ETL是随着数据仓库兴起而发展,它将各系统数据按照主题重新进行合成保存,以解决异构数据源、数据不统一的问题[2]。
(2)数据服务引擎
实现电子追溯数据与监管需求的紧密结合。引擎是采用数据挖掘技术,通过对海量的数据信息进行有目的提取、分拣、归类,挖掘隐含的有用信息,用于提供决策支持信息[3]。平台封装多种数据服务引擎,对电子追溯数据与公开抽检数据进行分析。
(3)应用组件
实现某种业务功能的独立模块,用以解决平台可扩展的问题。通过应用组件的组合可以快速、高质量地构建各种应用。
2.2 系统构架
国家平台由数据共享系统、数据接口中间件、平台数据库、服务引擎、应用组件、监管应用构成,如图1所示。
3 系统主要功能
3.1 数据共享系统
实现国家平台与省级平台、第三方平台间的数据交换,同时可对获取的数据进行预处理。
3.2 数据服务引擎
图1 食品安全电子追溯国家平台构架图
完成某种具体的数据处理业务,并将结果提供给应用组件使用。国家平台拥有了可扩展的服务引擎池,可方便地扩充或删减服务引擎[4]。
3.3 监管应用
网站形式呈现,向监管用户提供直观的功能界面。每项功能界面都是通过应用组件组合而成,以综合提供查询、分析、预警等多项功能,进而提供辅助监管决策的服务。
4 系统主要功能的实现
4.1 数据共享系统的实现
国家平台的数据共享系统使用Kettle ETL工具集,实现从各地省级监管平台进行数据采集、转换和装载,最终将抽取的数据保存到国家平台前置数据库中。为确保数据传输的安全,防止数据在传输时被窃取和篡改,数据共享系统在省级监管平台和国家平台之间搭建了虚拟专用网(VPN)。
4.2 数据服务引擎的实现
数据服务引擎具有可灵活扩展的特性。随着业务发展变化,平台可以随时增加和修改引擎。另外,只需向第三方软件开发商公开引擎的使用方法、接口定义、访问地址,即可以方便地实现引擎的功能复用。目前,国家平台提供的代表性数据服务引擎如下。
4.2.1 信息推送引擎
为用户提供信息订阅和信息推送功能。目前,主要的信息推送技术模式有两种:时间触发推送和事件触发推送。其原理是在某一时间点或者发生某一个事件时,服务器自动触发信息推送[5]。
信息推送引擎允许用户自行设定订阅规则,支持时间触发和事件触发。时间触发通常用于提供每日统计报告等信息,帮助用户按时了解所需要的信息;事件触发则用于需要快速处理的信息,如传感数据异常、突发食品安全事件、国家平台服务出现故障等。
推送功能通过调用第三方接口提供手机短信、电子邮件形式的推送。使用第三方服务可以有效地控制信息推送的成本,降低平台的部署难度。
4.2.2 LBS服务引擎
基于地理位置的信息服务(Location based service,LBS)是通过 GPS位置信息在地理信息系统(GIS)平台的支持下为用户提供的服务。
来自省级平台的数据中,附带了大量包含物理地址信息或GPS位置信息的事件数据。LBS服务引擎通过调用第三方服务,可将各类地址信息转换GPS经纬度信息,实现数据格式的统一。
此外,LBS服务引擎使用K最近邻算法(K-NearestNerghbor,kNN)提供附近兴趣点查询。用户可查询当前位置附近指定条件的食品生产经营企业,获得所关注的信息。
4.2.3 监测数据分析引擎
监测数据分析引擎充分使用了来自省级监管平台的业务数据和检验检测平台的抽检报告信息,通过统计、综合分析等方式,提供了企业相似度分析和不合格率预测功能。企业相似度分析,通过分析历史数据,从历史数据中找出多个由相似企业构成的聚类(簇),每个聚类挑选出一个最典型的代表,为该聚类画像,从而使监管者通过对代表企业的了解为相似企业采取针对性的策略。不合格率预测,通过分析省级监管平台上传的数据,预测某特定企业在未来的某一时段的产品不合格概率。
4.3 监管应用的实现
基于上述子系统构建Web应用网站,供国家级监管用户使用。监管应用的研发充分考虑人机交互需求,综合采用移动互联网和跨平台展示交互技术,保证良好体验。
部分功能的效果如图2所示。
5 结论与展望
本文设计的食品安全电子追溯国家平台由多个模块组成,数据共享系统为省级平台提供了数据交互的可信通道;可扩展的服务引擎池具有灵活的增加和移除数据处理引擎,实现不同数据处理需求的功能;监管应用将对上述技术进行验证,并提供给监管者查询、分析、预警等功能,进而对食品安全监管提供辅助决策。
未来可扩展更多的服务引擎,完善支撑平台的用户交互功能。此外,随着平台数据库的数据信息积聚,可通过人工智能、数据挖掘等技术分析数据并提供更专业全面的风险预警。
图2 监管应用功能效果图