基于结构化数据源的本体建模及组织业务优化
2014-10-20朱强生朱晓娟罗雨欣
朱强生 朱晓娟 罗雨欣
摘要:该文研究了基于结构化数据源的本体建模方法,提出了从关系数据库数据库出发,对组织业务进行本体建模并优化方法,以达到组织业务的本体建模、业务流程简化优化的目的。
关键词:结构化数据源;关系数据库;本体建模;组织业务;优化
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)25-5822-03
Ontology Modeling and Organization of Business Optimization Based on Structured Data Source
ZHU Qiang-sheng1, ZHU Xiao-juan2 , LUO Yu-xin1
(1.College of Information Engineering, Nanjing University of Finance and Economics, Nanjing 210046, China;2.College of Electronic & Photoelectric Technology,Nanjing University of Science and Technology,Nanjing 210094, China)
Abstract:This paper studies the ontology modeling method based on structured data source, puts forward ontology modeling and optimization method from the relation database, to achieve the business purpose of simplified optimization and ontology modeling .
Key words:structured data source; relational database; ontology modeling; organization of business; optimization
1 概述
随着经济的飞速发展和企业不断壮大,现代企业的中心已经从组织转变到流程,对流程的分析优化已经成为主要问题。传统的业务优化大都采用人工优化,需要对企业现有的业务流程、组织结构等信息进行分析,且需要时刻了解当前的业务流程,适时提出调整。国外的研究学者们提出企业业务流程重组(Business Process Reengineering,BPR)[1],主要分为两类,一类是在现有的业务基础上进行改造;另一类是重新考虑业务,零起点设计业务。
本体,作为一种“共享概念模型的形式化规范说明”,能够很好的描述业务特征与业务之间的关系,及业务特征与业务特征之间的关系,已经广泛用于现代信息系统。目前,在许多领域中,本体的构建大多为手工构建。这种方式费时费力,同时还需要领域专家及时参与。该文从企业数据库出发,通过数据库逆向工程,构建企业组织业务的本体模型,通过分析模型其中的活动、目标、角色、信息资源等流程的基本要素,在确保活动都能实现的前提下,精简流程,提高效率。
2 结构化数据源的本体建模方法
本体的质量决定了基于本体构建的应用的质量,所以选择合适的数据源并从其出发构建高质量的本体模型是很重要的[2],当前万维网上大量的数据资源主要就是以关系数据库的方式存储[3]。在企业中,企业的人员、机构等信息基本是存入数据库。数据源(数据库、XML文档、Web表格等)的结构化程度有所不同,但是均能够构建高质量的本体模型。
通过已有的数据库,我们可以获取数据库模式信息,根据设计好的映射规则,完成RDM到OWL本体的转换[4],示意图如图1。
图1 RDM到OWL示意图
2.1 关系数据库数据模型的抽取
目前,网络上大量的数据仍然主要以关系数据库的方式存储,其中,我们通过构建关系数据库模式和本体间映射来解决数据库与本体之间的数据互操作性。该文使用Power Designer[5]这个工具,并通过使用其具有的数据库逆向功能,来抽取数据库中的逻辑数据模型以及概念数据模型。
在软件工程界,作为一个比较新兴的领域,逆向工程已经得到广泛的应用。在本文中,我们使用的Power Designer是Sybase公司的CASE工具集,使用它可以方便的对管理信息系统进行分析,它几乎包括了数据模型设计的全过程。可以将目前所有流行的后端数据库(包括Sybase、DB2、Oracle等)的结构信息通过逆向工程加入到Power Designer的物理数据模型和概念数据模型中,包括表、索引、触发器、视图等。
2.2 关系数据库的本体构建规则
利用Power Designer的逆向工程特性,可以直接得到关系数据库的逻辑数据模型和概念数据模型,从而可以得到基本的E-R图。根据我们定义的规则[6],将我们通过逆向工程得到的概念数据模型中的各种关系模式可以映射到本体,得到OWL本体概念或关系。
关系数据模型中的规范关系,我们定义的主要映射规则如下。
R1:如果数据库中有表T1,那么,我们将T1映射到OWL本体模型中,且本体模型中得到的映射类具有相同的名字。T1中的描述转换为同名类的中说明。
R2:如果数据库中有两个表T1,T2,且两表之间具有“父子”关系(T2为T1孩子),那么,我们则将表T1、T2分别映射到OWL本体模型中,分别为作为父类和子类。
R3:如果数据库中表T1存在字段A,且该字段不是外键,那么我们将该字段映射到OWL本体模型中,作为同名数据类型的属性。其中,属性的定义域和值域分别为数据库中表T1对应的类、字段A的数据类型,同时,字段A的描述对应的映射为属性的说明。
R4:如果数据库表T1存在字段A,且字段A为非空、非外键,那么对应于该字段所的数据类型的属性,其基数(cardinality)限制的值是“1”。
如果A的值可以为空,那么对应于该字段所的数据类型的属性,其基数限制(MaxCardinality)的值是“1”。
R5:如果数据库表T1存在字段A不可以为空,且A为外键,那么对于该字段所对应对象,其属性的基数限制(MinCardinality)的值是“1”。
如果字段A的取值可以为空,那么对于该字段所对应的对象,其属性的基数限制(MinCardinality)的值是“0”。
R6:如果关系数据库中有表T1,该表的主键为Aa 与Ab,且字段Aa与Ab 均为外键,Aa 与Ab分别是表Ta与Tb的主键,且该表仅包含主键字段,那么把字段Aa与Bb映射为同名对象的属性,同时存在逆向的(inverse-of)关系。
2.3 关系数据库的本体构建方法
1) 搜集现有的企业关系数据库,或根据企业的需求关系创建自己的关系数据库。由于该数据库已经包含了企业中的各种关系和行业的信息,对于缺乏领域专家或者专家参与不足这样的问题,可以在一定程度上得到解决。
2) 使用Power Designer的逆向功能。从数据库出发,我们将数据库中的索引、表、视图等各种关于数据库结构的信息,通过使用Power Designer的逆向功能,生成物理数据模型(PDM)。通过分析物理数据模型,我们可以得出各个表的主键、外键关系,同时,删除无用的状态属性、冗余表以及扩展属性等,然后对实体表进行合并,获得概念模型,最终获得E-R模型。
3) 定义概念模型到OWL模型的转换规则。根据已定义的转换规则,我们可以将概念模型中的各个表及其数据类型、表-表的关系、属性等模式转换为OWL本体中相对应的模式。
4) 有效性的检验。当用OWL语言描述领域本体模型以后,我们需要评估和检验来判断创建的本体模型的有效性。
方法的流程图如图2所示。
3 基于本体的组织业务优化方法
从企业的关系数据库出发,由概念模型到本体模型转化,建立领域本体,实现领域内知识概念或术语的一致性描述,得到的领域本体模型,该本体模型其反映了企业的组织关系及业务流程可视化的本体模型,可以直观的反映组织业务流程,有利于删除、简化、重排、合并组织业务,但对于结构庞大、处理过程复杂的系统,很难全部人工来实现流程的优化。我们从本体出发,采用U/C矩阵研究组织业务的优化[7]。
3.1U/C矩阵
对于过程和数据之间的关系,我们可以用U/C矩阵来表达,其中,矩阵的行表示数据类,矩阵的列表示功能。在矩阵中,我们用大写字母U(User)来表示数据的使用,字母C(Cerate)来表示数据的产生。U/C矩阵作为一种重要的工具,在管理信息系统(MIS)开发的系统分析阶段得到了重要的应用。U/C矩阵的形式是一张表格,我们可以存在数据库中,这样我们可以通过对数据库的操作,来对其进行操作,分析其正确性。同时,可以利用分析的结果,对U/C矩阵进行子系统的划分。
3.2 利用U/C矩阵研究组织业务优化
1) 根据企业信息系统的业务流程,繪制业务流程图,明确业务数据流向。同时,根据数据流向,确定关系数据库E-R模型中各个实体之间的数据流向,明确时序。
2) 由E-R模型到本体模型的转换。
3) 结合数据流程图和数据流图,建立U/C表,检验U/C矩阵的正确性。我们可以从三个方面来检验U/C矩阵的正确性:完备性、一致性、无冗余性。通过这三个方面的检验,我们可以整理U/C矩阵,对矩阵中行或列的进行移动,使字母“C”尽可能的靠近矩阵对角线,这样我们得到一个新的矩阵排列。
4) 根据得到的新U/C矩阵,划分子系统。
5) 生成通过U/C矩阵优化后的模型,生成新的本体。
3.3结论
1) 对根据企业流程所建立的U/C矩阵,可以对矩阵进行正确性检验和分析。通过检验和分析,其前段调查工作和分析工作中各种疏漏和冗余,可以及时的被我们发现,进而分析出新的改革方案。
2) 通过对U/C矩阵的求解过程,获得子系统的划分。这样,可以降低业务流程的耦合性。
3) 子系统划分完成后,由于各个子系统之间的数据产生和使用相对独立,我们可以根据这个划分结果,对目前组织机构的设置、业务流程的规划进行评价。这样,我们可以改进组织机构设置、完善精简业务流程,进而提高企业的管理质量,降低企业成本。
4 结束语
本文分析了结构化数据源到本体模型的对应关系,这种形式化对应关系包括数据库的结构模型与本体概念框架模型之间的转换关系。给出了一个从概念数据模型到OWL本体模型的转换规则,给出了一种基于结构化数据源的本体建模方法。最后,利用U/C矩阵的相关特性,研究了组织业务优化的方法。
本文仅对基于结构化数据源的本体建模问题进行了研究,同时对利用U/C矩阵来进行组织业务优化的问题进行了探索,设计完善的转换规则和更好组织业务优化方法等工作需要进一步研究。
参考文献:
[1] Hamer M, Champy J.Reengineering the Corporation: A Manifesto for Business Revolution[M].New York:Nicholas Brealey,1993:113-115.
[2] CHANG K C,HE Bin LI Cheng-kai,et al.Structured databases on the Web:observations and implications [J].ACM SIGMOD Record,2004,33(3):61-70.
[3] 车成逸,马宗民,焦晓龙.基于结构化信息源的本体构建方法综述[J].计算机应用研究,2012(7).
[4] 余霞,刘强,叶丹.基于规则的关系数据库到本体的转换方法[J].计算机应用研究,2008,25(3):767-770,785.
[5] 顾平.数据库设计工具Power Designer的研究与实践[J].计算机应用与软件,2004,11(12).
[6] 杜冬霞,谢红薇,刘畅.基于关系数据库的应急预案领域本体构建研究[J].微计算机应用,2010,31(1).
[7] 张建.U/C矩阵在信息系统功能划分中的优化与研究[J].贵州大学学报,2008,25(1).