校园信息化中数据共享问题的研究及解决方案
2015-12-15王春杰朱保锋
王春杰, 朱保锋
(1.郑州大学第一附属医院 病案管理科,河南 郑州 450002;
2.河南教育学院 信息技术系,河南 郑州 450046)
校园信息化中数据共享问题的研究及解决方案
王春杰1, 朱保锋2
(1.郑州大学第一附属医院 病案管理科,河南 郑州 450002;
2.河南教育学院 信息技术系,河南 郑州 450046)
摘要:通过分析目前校园网存在的问题,提出了一个新的校园网信息化设计方案,即利用共享数据库实现各个业务管理部门数据的共享.共享数据库实现的重点是共享数据的整合和订阅,利用Oracle提供的工具,使数据在共享库和业务库中传递.校园网在引入共享库后,能够把全校的公共信息集中起来,通过各种标准的引入,能够实现全校数据的统一管理,为各个业务部门提供数据支持,为今后进行数据挖掘打好基础.
关键词:信息化;共享数据库;数据整合;数据订阅;数据传递
0引言
在信息化建设过程中,很多学校没有意识到整体规划的重要性和必要性,没有基于整个学校考虑的统一的信息系统.各个业务部门根据自己的需要进行部门级的信息系统开发,由于各个部门信息化程度不同,所使用的数据库系统也不同,这就造成了资源的浪费和共享的困难.具体来讲,主要有以下几个问题:(1)学校的业务管理信息系统平台不同,数据类型各异,导致大多数应该共享的数据重复录入,无法统一使用和共享;(2)学校对信息的规范没有统一,缺少统一规划,导致信息标准混乱,信息不能交流和共享;(3)业务系统只注重其自身业务方面的信息,不能提供教师或学生所涉及的全面信息的查询服务[1].
由此,笔者引入了共享数据库,将各个业务部门的基本数据进行集中整理,实现统一管理,保证数据的权威和准确,为各个业务应用系统、服务系统和电子校务系统提供数据支持.
1共享数据库平台
共享数据库平台是校园信息化各应用系统之间信息共享的平台,为整个学校的信息查询和决策分析提供全面的数据.按照共享数据库平台各个模块的功能,系统可以分成以下3个组成部分:共享数据结构、数据存储模块,即共享数据库;共享数据库功能设计开发模块;共享数据库客户展示模块.
2共享数据库
共享数据库在整个共享数据库平台中是核心,建立在学校业务系统或业务数据之上.它向下从业务库集成数据并保持同步更新,成为各个业务系统之间的共享数据通道;向上作为统计分析服务的数据源,向统计分析服务提供从各个业务系统集成过来的共享数据[2].
在整个校园网中,共享库是唯一的,而业务库则有多个,共享库通过各个业务系统与各个业务库相联系.共享库集中存储了公共字典和共享数据,其中公共字典存储了参照标准(国家标准、教育部标准及其他标准)和执行标准(学校当前实际执行的标准),为数据的标准提供了依据.
共享库与业务库之间的关系如图1所示.共享库管理员利用数据建模工具对公共字典和共享数据结构进行定义,利用公共字典管理工具对公共字典进行管理或维护;共享库DBA(Database Administrator)向业务系统提出共享数据输出要求,业务系统管理员按照共享库要求组织数据(模式和共享库提供的模式一致);业务系统管理员向共享库提出数据订阅申请,共享库DBA对订阅申请进行确认,并提供订阅输出.
3共享数据库功能设计开发
图1 共享数据库与业务数据库关系Fig.1 The relationship between shared database and services database
共享数据库功能设计开发模块是共享数据库与各业务库连接的桥梁,它的主要操作方式是通过ETL(Extract、Transform、Load)将预先定义好的数据加载到共享数据库中,抽取主要内容对共享数据进行整合和订阅.
综合考虑原始决策表的离散化过程与最终得到的极小决策算法,得到的按路径2离散化后故障分级的决策规则用自然语言可解释为:当评价指标a2的量化值处于86~93之间时,决策对象应划分为关键故障灰类;当评价指标a2的量化值处于70~85之间,且评价指标a3的量化值不低于72时,决策对象应划分为主要故障灰类;当评价指标a2的量化值低于86,且评价指标a3的量化值低于72时,决策对象应划分为次要故障灰类。
3.1共享数据的整合
共享库要获得业务库中的数据,就要使用数据整合工具(Oracle公司提供的Oracle WareHouse Builder,OWB),将业务库中可以提供的共享数据,按照共享库中的数据模式,抽到共享库中,从而形成可供业务系统订阅的共享数据.通过OWB能很容易地把各个业务库中的数据整合到共享库中.比如,整合教务数据库中的学生信息表,其详细内容如表1所示.
表1 学生信息表T_XSXXB
学生信息表的内容要想进入到共享库中,就必须被拆分、整理为两张表:学生基本信息表和学生详细信息表(表2、表3).对学生信息表中的部分字段进行select查询,将结果生成学生基本信息表(图2);同样,可以生成学生详细信息表.
表2 学生基本信息表T_XSJBXXB
表3 学生详细信息表T_XSXXXXB
在拆分的过程中,如遇到以下情况,需要单独处理.
(1)出现空缺值.录入人员在进行数据录入时,可能认为某些属性不重要而将之忽略了,但在数据提取和决策分析中可能要用到这些数据,因而需要为属性填上空缺的值.一般的做法是使用一个全局常量填写空缺值.
图2 学生基本信息表的生成Fig.2 The generation of student’s detailed information table
(2)数据类型的不一致.如果出现学生基本信息表中 “学号”在有些数据库中用的是变长字符型,而在另外的数据源中用的是整型,在共享库中用的则是定长字符类型,这时一般采用数据库本身提供的转换函数就能够解决,如DB2中的CHAR(INTERGER)函数可以将整型转换成字符串类型[3].
(3)属性值的表示方法不同.对于同一属性值在不同的数据库中有不同的表示方法.例如性别的表示,有些数据源采用的是“男”和“女”,而另外一些数据源则采用的是“m”和“f”,此时可以用标准SQL语句case…when实现转换:
when xb=‘女’ then ‘f’
end xb from student.
3.2共享数据的订阅
共享数据订阅是指业务系统通过数据订阅服务对共享库中的共享数据进行订阅,从而获得共享库中可供共享的数据.共享数据库是借用数据建模中权限设置的功能,按照权限组对共享数据进行访问.共享数据库提供了一套访问共享数据的访问接口,包括Java程序接口和XML(Extensible Markup Language)数据包接口,用户通过数据访问服务访问共享数据库.
在各个业务系统中,业务系统通过数据订阅的方式,在自己的权限内获得共享库中的数据.根据共享库与业务库之间数据库的不同,数据订阅可分为同构方式和异构方式.同构方式是共享库与业务库采用相同的数据库,异构方式是系统库与业务库采用不同的数据库.同构环境下数据的订阅线路图如图3所示.
图3 同构环境下数据订阅线路图Fig.3 Date subscriber line graph isomorphism environment
教务库(数据库采用Oracle 9)要订阅共享库中的国家地区字典,具体步骤如下:
(1)教务系统提出订阅要求并进行数据订阅.教务系统通过管理员向共享库提出订阅的要求:订阅共享库中的国家地区字典信息.
(2)共享库进行订阅审核.共享库通过DBA对教务系统订阅的国家地区字典信息进行审核.
(3)共享库为教务系统提供表结构和访问账号.在共享库中首先为教务系统建立一个访问用户并为该用户授权.授权包括对象权限——国家地区信息表T_BZGB_GJDQ的读权限和系统权限(CREATE SESSION),其中前者确保业务系统可以从表中读出内容,后者确保业务系统可以该用户的身份创建dblink连接到共享库.共享库管理员为教务系统建立好用户并授权以后,将用户名和密码、国家地区信息表T_BZGB_GJDQ的表结构提交给教务系统.
(4)教务系统库通过访问账号将信息订阅到本地教务系统,收到共享库管理员提供的信息后,开始实现对公共字典——国家地区信息表的订阅.先由教务系统管理员创建连接到共享库的dblink,然后通过dblink取出源表中的信息创建实体化视图.至此,业务库就拥有了从共享库订阅的国家地区代码信息,其中创建实体化视图DDL(Data Definition Language)中的“USR_SYS.T_BZGB_GJDQ”,是教务系统中所建的实体化视图的方案(USR_SYS)和名称(T_BZGB_GJDQ),可以替换成应用中所需要的方案和名称.
4共享数据库客户展示模块
此模块的主要功能是展现数据库中的数据及其结构,并可进行数据分析,对数据和结构进行修改,主要内容是OLAP(On-Line Analytical Processing)库,同时还提供了一些数据工具.
在共享库中存储了大量的共享信息,某些情况下数据有可能成为历史数据,如学生毕业离校或教职工调出本单位时,这些不再需要的共享数据就要放入历史数据库.历史数据库在整个共享数据中心有两个作用,一是对历史数据进行备份,二是作为共享数据库和OLAP库的中间数据集成地.
OLAP库是此模块的基础,它对历史数据进行再次抽取提成,获得查询、统计、分析的基础数据,形成整个数字化校园的核心数据集.联机分析处理是针对特定的分析主题,设计多种可能的观察形式,设计相应的分析主题结构(即进行事实表和维护表的设计),使管理决策人员在多维数据模型的基础上进行快速、稳定的交互访问,并进行各种复杂的分析和预测工作.
5结论
本文阐述了共享数据库的概念及实现方法,为校园网中信息系统数据共享提供了解决方案.在校园网中引入共享数据库后,通过引入各种标准,保证数据的一致性.各业务系统可以从开发平台获得所需的共享数据[4],实现统一管理,极大地方便了数据的使用.
参考文献
[1]郭永生.基于共享数据库的多数据源集成[J]. 微机发展, 2004,14(2): 49-51.
[2]李兆廷.高校教育共享数据库的构建[J].技术与市场,2010,17(12):142-143.
[3]李卫玲.多维分析的OLAP模块设计与实现[J].计算机与数字工程,2011,39(5):164-166.
[4]程凯,董雪.校园网流量监测及控制策略研究[J].河南教育学院学报:自然科学版,2014,23(2):41-44.
Research on Date Sharing Problem and
Solution in Campus Information
WANG Chun-jie1, ZHU Bao-feng2
(1.DepartmentofMedicalArchives,TheFirstAffiliatedHospitalofZhengzhouUniversity,Zhengzhou450002,China;
2.DepartmentofInformationTechnology,HenanInstituteofEducation,Zhengzhou450046,China)
Abstract:Based on the analysis of existing problems in campus networks, a scheme, which can implement the aim of data sharing among the departments by shared-database, is put forward. The points in such a shared database are the subscription and the integrity of the shared data. In order to achieve the aim of both integrity and subscription of the data, tools offered by Oracle are used to transmit data among the shared-database and business-databases. When the shared-database is introduced into campus, all the public data in the campus can be concentrated. And the unified management of the data of the whole school as well as the support to every department can be achieved by the introduction of different kinds of criterion. Meanwhile, it can also be a base for data mining in the future.
Key words:informatization; shared-database; data integrity; data subscription; data transfer
中图分类号:TP392
文献标识码:A
文章编号:1007-0834(2015)02-0042-04
doi:10.3969/j.issn.1007-0834.2015.02.012
作者简介:王春杰(1979—),男,河南荥阳人,郑州大学第一附属医院病案管理科工程师.
基金项目:河南省基础与前沿计划项目(132300410033)
收稿日期:2014-10-28