基于元数据的检察机关与政法部门信息共享方法研究*
2016-03-15张显政张华秋
张显政,张华秋
基于元数据的检察机关与政法部门信息共享方法研究*
张显政,张华秋
(甘肃省人民检察院网络信息处,甘肃兰州730000)
基于元数据的检察机关与政法部门信息共享方法研究是分析检察机关信息共享实际业务,提出并建立基于检察业务信息共享实际的元数据字典,在元数据字典的基础上建立数据交换平台,对各单位提供交换数据进行检测、清洗、分类、入库,对各单位交换请求进行数据相应。数据交换平台负责对元数据进行存储、管理和共享,同时广播发布交换数据格式,对各单位应用系统提供信息资源共享接口。系统交换平台根据各单位数据交换内容定义各元数据实体,通过元数据实体提取中心库的元数据信息,生成相应交换数据包。为确保数据安全性,系统平台对各交换数据包采用3DES加密算法进行加密控制,防止系统数据泄密。
元数据;信息共享;检察信息;数据加密
随着信息化的发展,政法机关各单位逐步建立起比较完善的办案系统;但是在不同单位之间存在信息交叉点、信息共享点和信息协同处理点,由于各自建设的信息系统无法实现信息共享和交换,形成了各自信息孤岛[1]。在此条件下,检察机关对外信息共享的需求也日趋明显,全国各检察机关为此遇到了很多现实的问题和困难,如何解决检察机关对外信息共享的需求,是检察机关急需解决的问题。在此基础上研究制定具有兼容性和实用性的对外信息共享方法,具有非常重要的意义。
基于元数据的检察机关与政法部门信息共享通过检察机关对外信息共享业务需求进行定位、分析、研究,对检察机关元数据和元数据元素进行设计,以满足检察机关与政法机关之间数据共享,同时结合现有成熟异构数据信息共享方法,实现异构数据间信息的存储、管理和交换共享。
1 元数据字典定义
1.1元数据标准规范
检察机关和政法部门信息共享的关键在于元数据标准,特别是核心元数据的定义和扩展。元数据即数据的数据元素,用以标识、管理及维护共享交换的基本数据项[2]。元数据元素是在系统中定义一组说明在检察机关和政法部门之间共享数据项的元数据元素,元数据元素在系统中具有唯一性,在本交换方法中元数据元素包含元数据的中文名称、英文名称、数据类型、取值范围、短名、注解。在元数据元素定义规则的基础上建立用于检察机关和政法部门信息共享的元数据,作为交换平台的数据保障。
1.2检察机关元数据扩展原则和方法
检察机关元数据随着业务需求的增加进行扩展,通过元数据实体,扩充元数据表,元数据的扩展遵循元数据元素定义规则。当元数据元素不能满足元素扩展需要时,系统将定义新的元数据代码表,并自动生成新的元数据实体,创建新的元素,默认值域为“自由文本”,同时通过对最大出现次数限制和取值范围的定义,来实现对现有元数据可选性进行严格限制。
检察机关元数据扩展原则:根据实际检察业务与政法部门信息共享特点,在确定共享元数据时,充分考虑业务复杂度、数据权值,充分满足数据共享、业务办理、信息查询。同时考虑业务数据的复杂性,可定义元数据实体为复合实体,即可将现有元数据实体作为新实体的组成部分,允许在元数据代表代替值域为自由文本的现有元数据元素值域。同时可对代码表中参数的数量进行增加,但扩充后的代码表需和扩充前具有逻辑一致性。同时可对元数据元素取值范围进行缩小,对现有元数据的可选性和最大出现次数进行严格限制。
1.3数据交换标准
检察机关与政法部门间信息共享采用定义数据交换统一格式,实现部门间异构数据交换和业务流程对接。通过数据对接平台,实现全量、增量数据在各个平台之间的交换,数据对接平台对各单位业务需求数据进行数据清洗,清洗后数据按照平台元数据格式进行入库,同时生成相应系统接口及对应实体。数据对接平台支持XML、Excel、CSV、Txt、Access等,可实现各个应用系统间的数据核查比对、数据挖掘及分析等[3]。交换时对文件名和核心字段数据进行校验,同时应提供共享所需的元表结构,数据项顺序应保持一致。
2 检察机关与政法部门间信息共享实现
检察机关与政法部门信息共享中,可根据数据交换类型分为加载更新类、查询检索类、数据比对类、广播通知类等[4]。其中加载更新类主要适用于XML、CSV和Access格式的交换数据,由信息共享交换部门主动向信息交换平台发生数据更新操作。查询检索类适用于XML、CVS和Txt格式的交换数据,数据交换由各共享单位主动发起,信息交换平台被动响应,完成数据交换。广播通知类适用于XML、Excel和Access格式的交换数据,由信息交换中心主动发起,检索数据库发现各应用单位系统,进行数据广播通知。
在系统交换平台中,系统按照元数据标准,对各交换数据包格式进行检测,生成数据对比日志记录,系统交换平台根据记录日志进行响应。对于符合数据格式的数据包进行数据解析,完成数据清洗和入库,同时对需要交换的数据,根据元数据实体调用交换平台中交换数据,生成相应数据格式文件,完成数据交换操作[4]。
检察机关与政法部门间信息共享数据交换流程如下:
(1)首次加载时,系统采用集中上传加载方式,交换对象为系统数据交换标准规定的基本信息,系统交换平台根据需要加载其他系统提供的全量信息,数据格式统一采用XML文件方式上传。
(2)在首次加载后,系统平台采用批量上传方式加载,各单位系统根据业务变更,定时完成增量数据包的上传,同时对增量数据包格式进行定义,来约束和维护其他单位系统交换数据。
(3)在数据加载入库时,系统对数据进行检测,避免脏数据生成,检测重复数据和格式错误数据时,系统自动跳过该条数据的入库,并进行日志记录。根据日志反馈信息,各单位系统对数据检验校对,修改后重新处理上传。
交换文件数据结构示意如下:
<?xmlversion=”1.0”encoding=”UTF-8”?>
<Package>
<Head>
<BBH>1.00</BBH>
...
</Head>
<Data>
<Record>
<XM>...</XM>
...
</Record>
...
</Data>
</package>
包体部分由数据包描述和交换数据组成[5]。包体部分的所有内容放置在标记<Package>...</package>之间;数据包描述中的所有内容放置在标记<Head>...</ Head>之间。所用的交换数据放置在标记<Data>...</ Data>之间;每一条数据记录放置在标记<Record>...</ Record>之间;每一个交换数据项放置在该数据项的标记之间,各数据项标记符合本部分交换数据包数据项内容所规定。交换数据由多条数据记录组成,数据包头描述部分包含版本号、单位代码、单位名称、记录数、文件名等内容。
3 结束语
基于元数据的检察机关与政法部门信息共享通过采用构建元数据字典方式,构建自身的参考文献:
数据交换平台,一方面用于对各单位共享数据进行清洗、分类、入库,另一方面由系统定义元数据实体方式,生成个单位所需的交换数据,从而在元数据层面完成异构系统间数据的共享及访问控制。各单位用户向系统交换平台发出请求后,交换平台自动进行相应,对各单位请求信息进行格式检测和数据比对,提取交换平台元数据,并将数据结果发送给用户,完成数据交换。为确保数据安全性,系统平台对各交换数据包采用3DES加密算法进行加密控制,防止系统数据泄密。
[1]肖珑,赵亮,冯项云,等.专门元数据规范设计指南[EB/ OL].[2010-03-05].http://cdls.nsd.gov.cn/cdls2/w3c/2003/ SpcMetadata/
[2]张晓林.元数据开发应用的标准化框架[EB/OL].http:// 202.96.31.113/sztsg/POWERPIONT/zhangxiaolin/1.htm,2002-3-8.
[3]樊胜.C/S与B/S的结构比较及web数据库的访问方式[J].情报科学,2001,19(4).
[4]戴蓓洁,余双,金蓓弘.基于DOM解析器的XML编辑器研究[J].计算机工程与设计,200711,28(22):5334-5338.
[5]邓子云.精通J2EE网络编程[M].北京:清华大学出版社,2007.
TP393
A
10.3969/j.issn.1672-6375.2016.09.005
2016-5-10
最高人民检察院2015年基本科研业务费专项资金课题“检察机关与政法部门信息共享方法研究”,项目编号:JBKY20150401。
张显政(1983-),男,汉族,山东滕州人,研究生,主要从事检察机关应用系统的研发工作。