提高数据质量 增强供应链互操作——应用国际标准ISO 22745
2010-08-24邹山花
邹山花
ZOU Shan-hua1,2
(1.东南大学 软件学院,苏州 215123;2.江南大学 太湖学院,无锡 214000)
0 引言
面对激烈的市场竞争,企业纷纷采用ERP(Enterprise Resource Planning)管理系统来提高自身的竞争力和整个供应链上的管理水平,但是ERP应用的效果取决于供应链上各个环节的集成的有效性,这种有效性使供应链过程保持同步、应用之间能够互操作。这种有效性取决于供应链中流动的数据。数据不能流畅的流动,整个系统就不能运转,所以数据的质量是供应链安全、有效的保证。
典型的劣质的数据是随心所欲的使用词汇,这些词汇将造成一物可由多个词汇描述,或者一个词汇代表多物的现象。这种不一致性使得数据流动的过程中产生阻力,轻则使业务流程减速,重则会造成极大的问题,尤其是在各类账目的统计中。
为了保证企业数据的质量,优化主数据是关键。主数据是企业中用来描述企业自身的、独立的、基础的实体;主数据通常存储在数据库中,在事物处理中通过标识符被引用[1,2]。例如,零件号是制造商给零件指定的标识符,同时,零件号也标识了这个零件的主数据。一个数据是否是主数据由企业决定,也就是说一个数据在A企业是主数据,可能在B企业就不是主数据[2]。规范和优化主数据可以降低运行的费用、降低签订合同的费用、改进价格,增加物流中数据交换的柔性。
ISO 22745 国际标准给出了表示、处理和交换主数据的描述技术[2]。它提供了工具使得企业能够保证输入和输出的主数据足够优质,改进内部数据的质量;在整个供应链上进行富有语义的、数据粒度级的信息交换,实现直接、正确、有效的协同。
1 ISO 22745
1.1 开放的技术字典
ISO 22745 的核心是开放的技术字典(the Open Technical Dictionary ,OTD),它是一组词条的集合,每一个词条描述一个概念/元数据,包含概念/元数据的标识符、术语和定义文本、注释、样例、图像、超链接到源标准。一个概念可以与任何数目的术语、定义、缩略语和图像关联。一个概念可以与同一个语言中的几个术语关联。这些术语都是同义词。这些元数据用来描述企业中统称为物件(item)的主数据(个人、组织、位置、商品,服务,规则章程[2]),提供统一的、与语言无关的对主数据编码的方法。
OTD的概念跨越整个供应链,从供应商->客户->材料->存储->服务;概念包含整个数据生命周期,从设计(CAD/CAM/CAE/PDM)->设备->制造/生产;概念包括整个ERP的主数据。概念的类型包括:类、特征、描述、测量单位、测量的限定符、特征值、货币值和语言。
类是一组具有相同特性的实体的集合。例如,‘服装’、‘计算机’、‘车床’。通常,类中包含概化、泛化的关系,构成类的层次结构。但是OTD不包含类的层次结构,它是一个扁平的概念集。这是因为OTD中的类可以来源于多个数据源(供应商)抽取的类,其中每一个类可以链接到一个或者更多的外部的类层次(它们可能属于不同的邻域、学科)。例如,眼镜可以属于不同的类:
图1 OTD中一个类可以属于不同的外部类
可以是医疗类的泛化,也可以是安全装备类的泛化。如图1所示。数据源越多,合并这些层次结构成为一个的可能就越小、越困难。
特征指物件的属性,例如:螺纹级别、直径、材质,强度等。测量单位包括测量单位的国际系统和英制系统。测量的约束,如:极小值、极大值、正常值。特征类型指物件特征的类型,可以是枚举类型, 例如,一周中的日子有(Monday, Tuesday, ...)七天,螺纹的方向有("right hand" or "left hand")两种,材料有(steel,aluminum, ...)等多种,这些特征值注册在OTD中作为概念,给定标识符。货币的名称,例如,美元、欧元等,也给定OTD 标识符。语言标识符是指对不同的语言给定标识符,以便对与语言相关的术语、缩略语和定义进行语义识别。例如,US说"elevator"而UK 说 "lift",US说"truck"而UK说"lorry"。这些差别出现在很多语言里。为了使得OTD能够处理这样的语言变化,ISO 22745 指定了语言标识符。表1给出了一个螺栓[3]相关的概念的标识符。
表1 概念的标识符的样例
可以根据OTD术语的来源把OTD 分成两组:
1)内容创建OTD:OTD中的术语是由 ‘数据维护组织’(Dictionary Maintenance Organization,DMO)标准化的,OTD是该术语的源。
2)内容收集OTD:OTD中的术语是OTD之外标准化的术语信息的复制。任何人都可以请求把已经标准化了的术语添加到OTD中。OTD中的每个术语项都有链接指向源文件。用户可以跟随链接获取更多的信息。如图2所示。
图2 OTD 中术语项都有链接指向源文件
1.2 主数据
ISO 8000-110定义了“主数据是企业中的数据,它们用来描述那些企业自身的、独立的、基础的实体,而且在执行事务处理时会用到它们”[2]。任何一条主数据记录描述的都是“物件”(item),它可以是各种现实中具体的物体(如,某车辆,标识号为"XYZ66089"),也可以是同样物体的集合(如,东芝 Portege 3300 M909—现实世界中有很多这样的电脑)。主数据记录主要包含一个或多个特征值。每个特征值表示描述物件的一个特性。例如,“特征项—值”为“螺纹直径—1.0英寸”、“材料—铝”和“直径—1.5厘米”等。ISO 22745表示主数据的原则是“语义编码”(Semantic Coding),也就是用机器可读的标识符代替人可读的文本。
主数据中类的标识符是一个指针,指向OTD中的概念;主数据中的特征、测量单位、测量的限定、控制值等的标识符是指针,指向OTD中的概念。例如,某螺栓的参数[3]如表2所示。
表2 “螺栓”的信息
OTD 为主数据的编码提供了支持,如图3所示。
用OTD编码后,“螺栓”的主数据如表3所示。
采用机器可读的标识符的好处是:
图3 OTD支持主数据编码
表3 “螺栓”的主数据
1)使得主数据的语言中性,主数据可以解码(译码)成任何OTD支持的语言;
2)使得编码唯一,降低了单一物件可能的冗余的主数据。
1.3 标识模式
标识模式[2](Identification Schema)如下:
其中,
1)RAI,注册权威标识符 Registration Authority Identifier
2)ICD,国际码标志符International Code Designator
3)OI,组织标识符Organization Identifier
4)DI,数据标识符 Data Identifier
5)CSI,码空间标识符Code Space Identifier
6)CC,概念码 Concept code
7)VI,版本标识符Version Identifier
1.4 标识指南
ISO 22745为了支持对主数据的编码,还提供了一个标识指南IG(Identification Guide)eOTD-i-xml(参考ISO 22745-35)[2]。IG是基于OTD中的概念、提供给买家用来描述主数据的一个母模板、一组基本规则。按照IG来描述物件,可以提高数据质量,减少所需的时间。
2 标准化数据
2.1 提高主数据质量
提高数据质量首先着眼于提高ERP中主数据的质量,尤其是那些用于多个应用软件组件/单元之间需要交换的数据。以供应链中最常用的商品为例,
1)首先是能够唯一确定商品的代号,包括:
(1)有效的商品的标识符(零件号)和供应商的标识符(名称, 地址, 电话,e-mail等);
(2)物件的类型,必须指明:
(3)唯一的、典型的、有设计控制的,或担保的物件;
(4)竞争的,来自某制造商的物件可能从多个厂家获取;
(5)可替代的,多个制造商可生产相同的物件(相同的适合度、形状和功能);
2)其次是为竞争的物件确定物件标识符,为可替代的物件确定适合性、形状和功能。多个竞争供应商可能成组地存在于物件的一条记录中,而多个可替代供应商也可能成组地存在于物件的一条记录中。那么在构建订购单时就要对他们进行分离,给出优先次序,以便从网络上自动的搜索;
3)然后是确定其他所需要的特征业务数据。尤其是在网络自动搜索竞争供应商或可替代供应商时,需要动态添加的一些特征补充信息。
图4 构建主数据
基于IG构建主数据时,必须参考OTD,其关系如图4所示。图中
(1)构建主数据的用户向OTD请求相关的概念信息:给定一个标识符,从OTD中提取关于该物体(对象)的信息,或者给定一个搜索的模板(特征值),在OTD中寻找与该模板匹配的对象;
(2)OTD 返回信息,或者源信息地址;
(3)调用源数据;
(4)获得源数据;
2.2 供应链的搜索过程
供应链中信息的搜索过程如图5所示。
图5 订购的搜索过程
首先,购买者或用户作为数据的请求者定义它们对数据的需求:物件的名称(例如,球状轴承,环状轴承)、可能的供应商、特征值(例如,内径、外径、宽度、行数、速率等)表述成eOTD-i-xml(参考ISO 22745-30)[2]形式;
其次,购买者或用户作为数据请求者创建一个请求,发送给数据提供者的供应商或制造商,请他们按照标识了零件号的物件验证特征数据,或者按照指定的特征值提供零件号。这个请求写成eOTD-q-xml(参考ISO 22745-35)[2]文件;
然后,供应商或制造商作为数据提供者向数据请求者(购买者或用户)应答。应答文件为eOTD-r-xml(参考ISO 22745-40)[2]格式。如果供应商或制造商作为数据提供者不具有所请求的数据,那么他们以同样的数据格式、按照竞争者供应商或可替代供应商的优先次序通过供应链发送请求。
3 结论
数据质量是保持供应商和制造商长期关系的重要因素,ISO 22745及其核心的OTD和标准的特征数据交换的格式是提高数据质量的基础性使能工具,它可以满足工业界的需求,在整个供应链上进行数据粒度级的信息交换,实现直接、正确、有效的协同。
[1] Salomon de Jager,Ph.D.Solving Data Quality Problems Using Data Standards Oct-De2007 http://findarticles.com/p/articles/mi_qa3766/is_200710/ai_n27997243
[2] Gerald Radack, Ph.D ISO 22745:The Standard for Master Data 28 Nov,2009.http://findarticles.com/p/articles/mi_qa3766/is_200710/ai_n27997247/.
[3] Donald Hillman A Global Standard Descriptive Language for Cataloging--Implementing the NCS/eOTD http://www.eccma.org.