探析食品安全数据分类编码
2020-06-18中国物品编码中心福建分中心
中国物品编码中心福建分中心 杨 林
食品安全数据分类编码不统一,是当前食品安全数据难以融合共享的最大障碍。
当前亟需改变基于条块业务和监管权限所形成的封闭、孤立系统现状,建立一套符合中国特色的食品安全数据分类编码系统。
随着信息技术蓬勃发展,与食品安全、营养、健康相关的数据得到了一定的积累。在信息共享阶段,应将这些数据转化为可分析利用的大数据,赋予数据以生命力,为政府决策、经济发展和科学研究提供技术支撑。实施食品安全数据分类编码标准化是实现食品安全数据跨界融合、形成大数据的必要前提。
食品安全大数据来源与特征
食品安全大数据来源
在当今信息化时代,食品安全数据来源范围较广,日常生活中人们能够接触到的与食品相关的数据都包括在内,主要包括:(1)各种食品安全检测装置的结果;(2)RFID传感器的食品质量检测数据;(3)企业和监管部门;(4)移动互联网、社交媒体等。
食品安全数据涵盖图像、视频、信号、图表、文字等多种形式,数据量随时间的积累变得越来越大。
食品安全大数据特征
食品安全大数据除具有大数据的4V(大量、高速、多样、真实性)特性外,还受错综复杂的食品安全环境、消费人群、监测数据飞速增长等因素的影响,表现出以下具体特征:(1)数据容量大。来自食品安全监测点和哨点的数据、各个地方上报的食品污染物数据、食品安全环境监测数据和其他食品企业自身生产的数据,这些数据聚集在一起就形成了十分庞大的数据库;(2)更新速度迅速。食品安全信息中包含大量的在线或实时数据分析和处理要求;(3)种类多。食品安全数据包含各种结构化数据、非(半)结构化数据和其他多种数据存储形式;(4)成本低、价值大。食品安全大数据中存在着大量无用的、冗余的信息,但这些信息具有很大的挖掘和应用价值,与个人生活、食品行业、国民经济息息相关。
食品安全数据内容
以食品健康链为主线,食品安全大数据主要包括:农业大数据、食品工业大数据、食品属性大数据、膳食健康大数据、食品相关产业大数据和公共媒体数据等的完整食品安全数据库。
以食品为导向,食品安全数据分类编码主要包括:食品分类代码、食源性疾病分类代码、生物污染物分类代码(细菌、寄生虫、病毒、毒素)、化学污染物分类代码、农药分类代码、天然毒素分类代码、金属分类代码等。
国内外食品安全数据分类编码现状
国外食品安全数据分类编码现状
目前,国际上食品安全相关分类编码体系有国际物品编码组织(Globle Standard 1,GS1)的GS1系统 ;国际食品法典委员会(CAC)的食品分类编码体系、兽药残留标准的食品分类编码、食品添加剂使用标准的食品分类编码;世界卫生组织(WHO)、联合国粮农组织(FAO)与联合国环境规划署共同建立的食品污染物监测评估规划(GEMS/Food)的食品分类体系、食品消费数据库的食品分类。发达国家的食物分类编码系统,主要有欧盟FoodEx2食品分类编码体系(EFSA)、美国农业部国家营养数据库食物编码系统(USDA)、德国食品法典与营养数据库食物编码系统、澳大利亚和新西兰的食品分类系统等。
国际上,食品编码方式注重食品分类的规律性和链条式信息的科学性,方便食物的提取和利用,特别是美国农业部国家营养数据库,它是由多个部门和企业配合,专门由美国农业部营养数据实验室制定,并通过专门的网站进行发布。其中的数据基本上每年均在更新,同时也及时公布新添加食品的编码和营养成分的数据。
总体来说,国外食品安全数据分类编码系统各有特色,能够较好地满足各自需求,同时对我国食品安全数据分类编码系统建设具有参考借鉴意义。
国内食品安全数据分类编码现状
为了提升我国食品安全信息化水平,在过去几年我国已经建成了多类信息系统,包括:农产品质量安全监管追溯系统、食品安全抽检监测信息系统、食品微生物污染监测系统、食品化学污染物监测系统、食源性疾病病例监测系统、食源性疾病爆发事件系统、食源性疾病分子溯源系统、食品安全舆情监测系统、膳食消费量系统等,这些信息系统在各自领域发挥着重要作用。近几年来,我国对食品分类编码工作高度重视,各领域根据各自需要梳理食品分类,形成了多个食品分类编码体系,例如,食品生产许可证审查细则的食品分类、农产品分类与代码、全国食品污染物监测网络的食品分类、中国居民营养与健康状况调查中的食品分类、中国食物成分表、总膳食研究中的食品分类等,这些食品分类编码体系中,存在食品分类相互交叉且编码不统一的现象,使现有各信息系统之间很难进行数据融合共享。
在食品安全数据标准化方面,涉及食品分类编码体系的标准有:GB 2760-2011《食品添加剂使用标准》、GB 2762-2017《食品中污染物限量》、GB 2763-2016《食品中农药最大残留限量》等,这些标准中食品分类编码体系不尽相同,存在较大差异,为食品抽检工作带来许多困扰。
原国家食品药品监督管理总局已经制定了部分食品安全数据标准,例如,食品抽检系统中,所制定的标准已涵盖食品安全数据部分内容,使各级食品药品监督管理部门的食品检验机构均使用统一的标准出具检验报告,实现了对食品分类、食品检验项目、食品检验方法、食品判定的数字标准化。但是我国在跨部门之间的食品数据标准尚未建立。以小麦为例,GB 7635.1-2002《全国主要产品分类与代码》中小麦类食品类代码组成为5+3格式,而在原国家食品药品监督管理总局发布的关于食品生产许可证分类目录的公告(2016年第2号)中,小麦粉的食品分类代码却为4位固定代码。目前,同一食品的代码,在不同条件下不兼容,而不同实验室之间的数据代码差异更大。
我国食品安全数据分类编码中存在的问题
食品安全数据分类编码不统一,是当前食品安全数据难以融合共享的最大障碍。由于历史原因,当初食品安全信息系统建设时缺乏整体规划,各部门采用不同的分类编码规则,甚至同一部门信息化系统中的分类编码也不统一,导致各信息系统互不兼容,“信息孤岛”问题严重,无法对不同系统所产生的数据进行整合、综合利用与分析。因此,当前亟需改变基于条块业务和监管权限所形成的封闭、孤立系统现状,建立一套符合中国特色的食品安全数据分类编码系统。
食品安全数据分类编码标准化策略
食品分类基本原则
通过对国内外各食品分类体系的分类原则分析,得知对食品进行分类时,基本遵循以下原则:(1)各分类体系的主要作用是为农残、食品添加剂等限量的制/修订服务;(2)各分类体系均将具有相似特征和相同风险的食品归为一类;(3)各分类体系均将食品分为植物来源的食品和动物来源的食品;(4)同类食品具有相同的理化特征或相似的农业耕种特征;(5)同一类型的食品包括的食品细类范围较窄。
食品安全数据编码思路
我国有专家学者在研究国内外食品安全数据分类编码现状和编码系统框架设计的基础上,提出了一套具有中国特色的食品安全大数据智能编码系统设计架构:(1)梳理现有食品安全相关信息系统,初步编写数据字典。(2)以数据融合共享为导向,科学分类,将错乱缺失的分类树梳理成标准的分类树。(3)确定数据颗粒度,建立编码解码规则。在编、解码方面,欧盟食品分类与编码系统FoodEx2具有较强的适用性,可作为重要参考。(4)食品安全相关数据系统与标准食品分类树编码进行映射。采用“柔性编码对接体系”方式进行映射,进行关键词概率匹配,实现自动化智能映射,再辅以人工核实,提高映射匹配的准确度和工作效率。