标准化的商品源数据:新零售数据的基础
2020-01-10
随着互联网技术的发展,中国作为互联网大国,一直非常重视数字经济的发展,党的十八届五中全会明确提出十三五时期要“拓展网络经济空间,实施‘互联网+’行动计划,发展物联网技术和应用,促进互联网和经济社会融合发展。实施国家大数据战略,推进数据资源开放共享。”国务院《促进大数据发展行动纲要》(国发(2015)50号)明确要求:“建立标准规范体系,推进大数据产业标准体系建设,加快建立数据标准体系。”
零售业作为传统经济的重要组成部分,很多传统零售企业伴随着数字经济发展的脚步进化为对线上服务、线下体验以及现代物流深度融合的新零售模式,他们依托互联网,通过运用大数据、人工智能等先进技术,对商品的生产、流通与销售全过程进行升级改造。
新零售的实现关键点必是要走数据赋能之道。这其中商品的数据采集的重要性、准确性成为重中之重。目前,商品条码作为商品全球流通的唯一身份证,每天扫描商品条码的次数达500亿次。在我国已超过40多万家企业成为中国商品条码系统成员,零售业中95%以上的快速消费品采用商品条码,涉及20多个行业领域。商品条码作为最简单实用的自动识别技术虽然使商品能够在全球范围流通,但每个用户及商业零售POS店都是独立的系统,商品的信息是封闭的;在我国通过GS1全球数据同步网络(GDSN)发布的商品信息达1.5亿条,但这些以商品条码为关键字的商品信息由产品生产企业自行备案通报,信息量大却存在商品属性信息描述不规范等问题。而这些问题在新零售时代迫切需要解决,以适应大数据时代的发展需要。
新零售在数字经济时代转型升级的核心就是“商品数字化”,准确、规范、一致的商品数据是所有零售业数据中的基础,其真实性和准确性直接决定着数据分析的结果、数据共享的效果。
标准化的商品源数据
2016年,中国物品编码中心(以下简称编码中心)相继与京东集团、阿里巴巴签署战略合作协议,共同促进GS1全球化标准,推动我国商品信息标准化、数字化和国际化发展;就商品基础属性标准、推进“可信数据源”标识应用、加强产品安全追溯等方面开展积极深入的合作,正式启动商品源数据项目。
什么是商品源数据
商品源数据(Trusted Source of Data,简称TSD),通过标准化采集处理将商品实物的相关信息数字化,主要是通过对产品标签文字提取、图片拍摄、尺寸重量测量等方式获取商品信息形成以商品条码为关键字的商品属性信息。
商品源数据的数据模型
商品源数据采用GS1全球数据模型(Global Data Model,GDM),GDM是在GS1全球主数据(Global Master Data,GMD)标准中的元数据结构和内容不变的基础上,对GMD标准中的4000多个商品属性及关联属性进行重新梳理和分类,形成针对不同品类的应用模型,缩小属性选择范围,降低应用难度,提高应用效率,是实用型应用模型(商品属性模板),方便商业应用和统一主数据交换。采用“洋葱模型”概念,其中的数据属性分为四个层级:
核心层适用于所有品类的全球通用属性,均为必填属性,如GTIN(条码)、产品分类(GPC)、品牌名称、产品描述(产品名称)、目标市场(销售国/地区)等属性;
全球品类层按品类划分的全球通用属性,分为必填属性和条件必填属性,如食品成分、过敏原、营养素、食用/使用说明等属性;
区域品类层按品类划分的区域通用属性,分为必填属性和条件必填属性,如包装材料、规范化品名、产地声明等属性;
地方层适用于单个国家/地区的按品类划分的属性,如各国/地区税收税率、包装标志、葡萄酒年份、葡萄酒等级等属性。
商品源数据的构成
经文字信息录入、图片拍摄、尺寸重量测量,形成以商品条码为关键字的商品属性信息。包括单品核心层属性、生产信息、配料/成分、其它说明、规格型号、监管信息、税务信息、装卸储运信息。
核心层属性
包括有商品标识、商品分类、商品描述、商品图片、贮藏说明、业务信息、测量信息、包装信息、中包信息、外包信息。
生产信息
生产信息:品牌商名称、原产国(地区)、生产厂家信息等。
配料/成分
原料信息、配料信息、成分信息、营养成分信息。
其它说明
主宣传语、注意事项/警示语、食用方法/使用方法。
规格型号
净含量规格、尺寸规格、型号。
监管认证信息
执行标准、生产许可证编号、批准文号、认证标志/合格标识、认证标志/合格标识说明。
税务信息
税务编码、进项税率。
装卸储运信息
堆叠层数、装卸储运说明。
商品源数据的质量标准
商品属性信息的质量要求主要包含文字信息、商品图片、包装测量三个方面,应符合以下要求:
规范性:符合数据构成和内容要求;
完整性:按照数据规则要求,数据字段数值完整;
准确性:准确表示其所描述的商品真实值;
精准度:尺寸重量的数值精确。
标准化的商品源数据具有来源可靠、准确及时、发布权威、全球通用的特点。商品源数据是利用标准化的方式将商品属性信息数字化,而在这一过程中,商品信息数据的规范性和一致性对于整个供应链的贸易各方实现增产提质、降本增效、线上线下融合以及各环节信息的互联互通等方面都至关重要。具体来说,通过商品信息数据的规范化、标准化,一是净化商品品质,消费者更放心、更明白、更安全,帮助消费者做出正确的购物决策;二是促进企业发展和品牌建立,提高生产者和商品展示信息的可信度;三是品控、仓储、物流等环节降本增效,商超、电商结合准确、精准的商品源数据进行采购、品控、仓储管理,承运商运用精准的商品尺寸重量等包装信息进行智能算法,优化配送、提高效率、降低成本;四是强化消费维权和政府监管,为政府监管部门提供强有力的监管渠道,也为国家监管机构提供可信、全面的数据闭环反馈。因此,以标准化手段作为技术支撑,是维护我国数字经济发展秩序的有利手段。
截止2020年7月底,编码中心已在全国成立了38个源数据采集服务工作室,已采集商品源数据近35万条数据。随着商品源数据工作推广和标准化程度的提高,商品源数据在物联网、电子商务、现代物流、大数据等中的应用成为强有力基点,促进应用领域实现无缝连接,提高企业经济效益与政府的管理效能,助力数字经济发展。