基于ISO/IEC 11179的规范化概念系统模型研究
2016-07-20闫震李鸿阳王睿达苏淼
闫震 李鸿阳 王睿达 苏淼
摘 要:基于ISO/IEC11179-3:2013(E)标准中概念系统模型的组织模式,对概念系统模型中的相关元素进行组织。从形式概念分析的角度出发,分析概念规范化的实质、概念与概念间的关系,并将这些通用概念与ISO/IEC11179系列中的概念相结合,提出规范化的概念系统模型构建方法SCCS,以解决概念模型中信息难以有效地集成与共享的问题。SCCS方法包括,规范化概念描述、DEC构建规则、DEC逻辑关系生成算法、规范化的概念系统构建过程。最后开发DEC注册系统,验证SCCS方法的可行性与有效性。
关键词:概念模型;规范化;数据元;11179;形式概念;MDR
中图分类号:TP391 文献标识码:A
1 引 言
概念模型本质上是一种对现实世界进行抽象描述的工具,从构建的角度出发,概念模型所描述信息的准确性是衡量概念模型构造方法优劣的重要指标。在当前众多的概念模型构造方法中,例如UML、OWL、ER等建模方法都可以构建概念模型,但是在语义表达程度上却各不相同,也就是准确性上存在差异。从管理的角度出发,随着概念模型规模的不断扩大,不同概念模型之间信息可共享性是衡量概念模型的另一重要指标。由于当前并没有统一规范的概念模型构建方法论,所以依据不同构造方法所建立的概念模型之间信息共享困难,例如在UML建模方法中是以面向对象思想为理论依据,最主要的特性就是抽象,也就是说关注的重点是对属性进行操作[1]。OWL建模方法以本体理论为基础,不仅描述概念之间的关系,还重点对概念之间的关系进行约束、验证,而这个特点在UML中却没有体现,因此在进行信息交互时,需要开发相应的转换接口进行转换。ER模型构造方法,可以说是一种最简单的本体语言,支持概念和概念之间的关系,只是描述语义很弱而已。
因此,建立一个规范的、具有通用性的概念模型构建方法是本文的根本出发点。规范性、通用性的实现不仅需要通用的基础理论作为支撑,也需要依据相关标准作为指导。在信息领域中,由JTC1(ISO/IEC共同建立的联合技术委员会JTC 1)起草的ISO/IEC 11179-3:2013(E)标准[2]就是这样一部具有权威性、准确性、独立性的信息标准,其独立性体现在该标准的实现不依赖于任何现有的技术。从2003年开始,该标准经历了两个版本的变化。
本文依据ISO/IEC 11179系列最新的ISO/IEC 11179-3:2013(E)标准,以形式逻辑为基础,对概念模型进行深入研究,给出概念的定义、概念之间逻辑关系的形式化定义,以及数据元素概念(DECData Element Concept)的表示方法;参照UDEF(Universal Data Element Framework)框架[3],给出了规范的概念系统模型构建方法(SCCSStandardized Construction of Concept System),并建立DEC注册系统。
2 规范概念系统模型构建方法
ISO/IEC 11179-3:2013(E)是11179-3的最新标准,对概念系统模型的各个组成要素进行了详细的定义。在标准中指出,概念系统模型由概念与概念之间的关系两部分构成。概念部分由概念、DEC、概念域三个部分组成;关系包括逻辑关系与非逻辑关系两个组成部分。
2.1 概念的定义
金岳霖先生在形式逻辑中指出,概念由内涵与外延两部分组成,概念的内涵就是概念所反映的事务的特有属性,概念的外延是客观世界中具有概念所反映的特有属性的事务[4]。而定义是揭示概念内涵的逻辑方法。因此,定义就是明确概念特有属性的方法,同样,也可以通过特有属性确定概念的定义。
定义1 概念的定义:
由定义可以发现,概念的标准化工作的重点就是要对概念的属性进行规范化,需要如下几个元数据对该属性进行描述,注册时间、注册人、定义、指称、编码等。
2.2 概念之间关系
概念与概念之间的关系按大类可划分为逻辑关系与非逻辑关系,其中逻辑关系包括相容关系与不相容关系,这里的相容关系包括同一关系、包含关系和交叉关系;不相容关系包括矛盾关系、反对关系和并列关系。非逻辑关系包括继承关系、整体部分关系、工具关系和因果关系等[5]。由于逻辑关系作为概念中主要存在的关系,因此,只给出逻辑关系的定义。相容关系进行定义如下:
定义1同一关系:设A与B是两个概念,若A = B则A与B为同一关系。
定义2包含关系:设A与B是两个概念,若AB则A与B为包含关系且B为A的上位概念,A为B的下位概念。
定义3交叉关系:设A与B是两个概念,若A∩B ≠则A与B为交叉关系。
不相容关系进行定义如下:
定义4矛盾关系:设A与B是两个概念,Ω为A与B的上位概念,若A∩B ≠∧A∪B = Ω 则A与B为矛盾关系。
定义5反对关系:设A与B是两个概念,Ω为A与B的上位概念,若A∩B ≠ ∧A∪BΩ 则A与B为对立关系。
定义6并列关系:设Ai是一个概念,Ω为Ai的上位概念,若Ai∩Aj =∧UAi = Ω(i≠j)则概念Ai在Ω上为并列关系。
2.3 DEC与数据元的关系
在ISO/IEC 11179-3:2013(E)标准中,数据元素由四个组成部分:DEC、概念域(CDConceptual Domain)、数据元素(DEData Element)、值域(VDValue Domain)。
DEC是一个由对象类与特性之间的语义关系所构成的一个概念集合[2]。从定义中可以看出,DEC由对象类与特性两部分构成。DEC在描述上独立于具体的表示,不包含任何具体的数据。在功能上,为数据元素提供语义支持。CD对概念的描述性定义进行性管理。VD是一个数据元素允许值的集合,例如对数据类型,格式,单位,最大字符数量等元数据进行管理,为数据元素提供表示支持。endprint
2.3.1 DEC构建规则
2.3.2 DEC逻辑关系生成算法
DEC本质上是一个概念,根据概念的定义可以确定,如果概念之间的属性存在共性,那么在概念之间必然会存在着相应的逻辑关系。通过对DEC属性之间进行运算操作,可以确定如下关系生成算法。
上述数据元素概念逻辑关系生成算法,有助于实现计算机的自动识别、评价。此外,对于概念之间的推理,具有重要意义,例如,如果两个DEC之间存在交叉关系,通过DEC的交运算可以很容易判断出,两个DEC拥有一个共同的属概念。
2.4 概念系统模型
2.4.1 概念系统模型定义
概念系统模型是一个逻辑概念,类似于数据库中的表空间,对所属的概念以及概念之间的关系进行管理。在企业概念模型中,DEC是确保DE语义完整的最小的、不可分割的概念。下面给出如下二元关系以及概念系统模型的形式化定义。
定义9 二元关系:Rb = {Rr1,Rr2},其中Rb表示一个二元关系,Rr1、Rr2分别表示二元关系中的不同关系角色。
定义10 概念系统:CS =
2.4.2 规范化的概念系统的构建过程
在整个概念系统中,如何有效的组织对象类,特性,成为了概念系统构建的关键一环。UDEF框架能够将DEC从定性描述转变为定量表达,它的树形层次框架结构使得DEC的组成变得结构清晰,大量的减少了数据的重复定义、重复描述[6]。此外UDEF具有在词汇表等价映射的特点,可以满足不同的语言之间的语义交互问题。因此,在对DEC进行构建时,仅需要将对象类与特性分别作为UDEF的两颗子树进行组织即可,UDEF提供的 “超类—子类”的分类法,在理论上能够为任何一个企业的任何一个领域提供任意一种DEC。
通常企业的数据建模过程需要历如下几个阶段:对所需业务划分主题区域、提取业务过程、确定业务活动、最终梳理数据元素。
概念系统构建位于数据建模的前三个阶段,首先需要确定所有的对象类与特性,继而根据概念关系,确定DEC以及DEC之间的关系,完成整个概念系统注册。规范化的概念系统的构建过程如图1所示。
Link代表一个具体的存在关系(Relation),RR表示一个关系角色(Relation Role),LE(Link End)表示具体关系的应用实例,DEC表示一个数据元素概念[7]。
2.5 数据元素
数据元素本质上是DEC的应用,数据元素由数据元素概念与值域两部分共同组成。
定义11
DE = {DEC×VD}
DE表示一个数据元素概念集合,分别由数据元素概念与值域进行笛卡尔积运算生成,DEC表示数据元素概念集合,VD代表值域集合。
3 建立DEC注册系统
为了验证数据元素概念模型在企业中的可应用性,建立了DEC系统。在该系统中实现了相关概念的注册功能。在图2所示的系统中,选择井下为主题概念系统,对所有相应的井下概念进行管理。在对象类与特性类中指称表示概念的标识名称,属性编码(UDEF)表示该属性的编码规则是按照UDEF的规范进行编码。其中属性类型表示的是要进行注册的元素,是否是DEC类型。在DEC注册中,包括了注册人、描述定义、注册日期等描述属性的注册。
图1 规范化的概念系统构建过程
图2 DEC注册系统
4 结 论
本文依据ISO/IEC11179-3:2013(E)标准,提出了SCCS概念模型构建方法。该方法的实施,不仅解决了概念模型中的信息集成与共享问题,而且对概念模型标准化工作做出了探索。此外,规范化的概念系统不仅可以应用于概念模型的标准化,还可以实现对逻辑数据模型、元数据字典、数据交换模式的标准化,以至于未来知识表示模型标准化。进一步的研究工作主要是概念搜索算法等方面进行深入研究。
参考文献
[1] 王洪伟. 基于本体的元数据模型的建立研究[D].上海:上海交通大学,2004.
[2] ISO/IEC 11179-3 Information technologyMetadata registries (MDR) Part 3 Basic attributes and registry metamodel [S]. (3nd edition), 2013.2.12.
[3] [EB/OL]http://www.opengroup.org/udef/.
[4] 金岳霖. 形式逻辑[M]. 北京:人民出版社, 2006-6-1.
[5] 冯志伟.术语学中的概念系统与知识本体[J]. 术语标准化与信息技术. 2006,(1):20-28.
[6] 郭晓丽.企业数据元素目录及其语义模型的构建与应用[D]. 大庆:大庆石油学院,2010.
[7] Sukhoon Lee, Dongwon Jeong, Jangwon Gim, DooKwon Baik. Canonical sensor ontology builder based on ISO/IEC 11179 for sensor network environments: a standardized approach. International Journal of Distributed Sensor Networks[J].Volume 2014, Article ID 790918, 14 pages:http://dx.doi.org/10.1155/2014/790918.