数据去重、VLOOKUP函数和透视表在食品安全抽检监测数据处理和分析中的应用
2018-01-17黄丽娜辽宁省食品检验检测院
□ 黄丽娜 辽宁省食品检验检测院
食品安全抽检监测是食品监管部门普遍采用的食品安全管理措施之一,其既是履行《食品安全法》赋予的重要职责,也是系统掌握食品安全状况,加强食品安全监管,及时发现和处置食品安全问题,防范系统性、区域性风险的重要手段[1]。自食品安全抽检监测实施以来,各级监管部门已在抽检监测信息系统中积累了大量的数据,而如何有效的分析利用这些数据并为科学监管提供数据支持也是抽检监测工作中非常重要的环节。
1 抽检监测数据特点
抽检监测数据具有以下特点,一是权威性高:国家食品安全监督抽检覆盖的食品种类多、地域范围广、抽检数量大,所获得的抽检数据具有很高的权威性和应用价值[2]。二是内容全面:食品安全抽检监测数据内容包含了抽样信息(如抽样时间、地点、被抽样单位等)、样品信息(如样品名称、生产日期、标识生产者等)、检验检测信息(如承检机构、检验检测项目、检验检测标准等)、结果信息(如检验检测结果、不合格食品核查处置结果等)等,即涵盖了从抽样到结果的全面信息。三是结构稳定:从抽检监测信息系统导出的数据表中主要包含两种结构信息——重复信息(主要是样品相关信息)和非重复信息(主要是项目相关信息)。
2 抽检监测数据去重
从信息系统中导出的抽检监测数据,由于既包含了重复的样品相关信息,又包含了非重复的检验项目相关信息,数据量巨大。如仅对样品进行分析时,需要对数据进行去重处理,制作样品信息分析简表,提高分析效率。关于去重操作,WPS中自带去重功能(“数据→删除重复项”)。应用在抽检监测数据处理中可以按以下步骤进行样品信息分析简表的制作:第一步“删除数据表中的非重复数据列”,第二步“选中去重ID数据列(一般为抽样编号列)”,第三步“去重操作:数据→重复项→删除重复项→扩展选定区域→删除重复项→删除重复项→确定”,即可得到样品信息简表,用于样品信息的统计分析。
3 抽检监测数据关联
VLOOKUP是一个按列查找函数——给定一个查找目标就能从指定的查找区域中按列查找返回想要查找到的值[3],它的基本语法为:VLOOKUP(查找值,区域,列序号,逻辑值)。其中,查找值为需要在数组第一列中查找的数值,它可以是数值、引用或文字符串;区域即数组所在的区域,如“B1:E100”,也可以使用对区域或区域名称的引用;列序号是希望区域(数组)中待返回的匹配值的列序号,为1时,返回第一列中的数值,为2时,返回第二列中的数值,以此类推;逻辑值则是FALSE或TRUE,它可指明函数VLOOKUP返回时是精确匹配还是近似匹配[4]。运用VLOOKUP函数功能可以实现抽检监测样品相关信息或检验项目相关信息在不同工作表数据的自动匹配、整合,这种方法灵活、简单、高效,在抽检监测数据处理过程中具有很强的实用性。
4 抽检监测数据透视分析
数据透视表(Pivot Table)是一种交互式的表,可以进行某些计算,如求和与计数等;所进行的计算跟数据透视表中的数据排列有关;可以动态地改变透视表的版面布置,以便按照不同方式分析数据,也可以重新安排行标题、列标题和数值,每一次改变版面布置时,数据透视表会立即按照新的布置重新计算数据[5]。将数据透视表应用于抽检监测数据分析工作,可极大地方便对大量数据的汇总、筛选、分析,进一步提高抽检数据分析工作效率。具体操作步骤如下:第一步“在WPS中Ctrl+A全选要进行分析的抽检监测数据源”,第二步“透视操作:数据→数据透视表→确定”,第三步“在数据透视表区域根据统计需要选择统计字段作为行标、列标和计数项”。
5 注意事项
样品信息去重时要注意是否去重完全,可以用ID数据列(如抽样编号列)单独进行去重操作,检查是否已去重完全。使用VLOOKUP函数进行关联操作时如果“逻辑值”为TRUE或省略,则返回近似匹配值;如果“逻辑值”为FALSE,函数VLOOKUP将返回精确匹配值;如果找不到,则返回错误值#N/A;“查找值”为文本时,“逻辑值”一般应为FALSE[3]。透视分析中需要注意用于分析的行标、列标字段的统一规范性。