APP下载

电子文件管理系统的架构、核心算法及其实现

2015-11-23

图书馆理论与实践 2015年11期
关键词:调用管理系统算法

●孙 莉

(1.东华大学旭日工商管理学院,上海200051;2.宁夏大学数学计算机学院,银川750021)

电子文件管理系统的架构、核心算法及其实现

●孙 莉1,2

(1.东华大学旭日工商管理学院,上海200051;2.宁夏大学数学计算机学院,银川750021)

电子文件管理;算法

以政务部门信息资源整合为背景,从各种文书、凭证类电子文件在生成、办理、交换、共享、归档保存等关键环节的统一管理和有效利用的实际需求出发,提出了电子文件管理系统的基础架构和主要业务流程,并以电子文件的捕获和移交等核心模块为例,给出了系统实现所需的流程和算法。

1 概述

政务部门在信息资源应用整合过程中需要对大量重要的电子文件进行安全可靠的统一管理,本研究旨在改变电子文件管理现存的四种状态:①电子文件资源在不同应用系统和不同部门之间的共享和协同使用困难,使大量电子文件处在“失用”状态;②电子文件基本采用正文与标识(属性)信息分开存储,文件本身缺少过程管理和背景信息,处在“失真”状态;③在目前复杂的网络环境下,部分电子文件被人为篡改,处在“失信”状态;④随着时间的推移和电子文件读写工具的升级换代,大量文件在格式转换过程中损坏,存在“失存”的危险状态。

2 系统框架

基于电子签章的电子文件管理系统属于电子文件全生命周期的中间系统,处于各业务应用系统与档案管理等系统之间,具有承上启下的作用。

如图1所示,在总体框架设计上,分为IT基础设施层、信息资源层、应用支撑层、业务应用层、数据利用层。其中,信息资源层主要是按照不同的用途,将实现电子文件管理系统的数据分为通用文件、专用文件、元数据等进行管理和储存;应用支撑层为系统提供安全可靠的电子文件版式转换、加盖签章、真伪验证等支持。

为了实现电子文件的收集与归档,电子文件管理信息系统在制定统一电子文件标准和操作流程规范的基础上,需要实现相关各部门、各机构电子文件的分类、格式、标识、登记与著录,通过标准的数据接口规范和业务流程规范实现各类业务系统和电子文件管理信息系统的数据交换与共享,形成各类电子文件,并对电子文件的内涵进行充分揭示,以支持电子文件的高效利用。将电子签章技术和版式文件技术相结合,保证电子文件交互与存储管理的可信、可控、保真、防篡改,从而实现电子文件的凭证作用和长期保管。[1]

系统需要提供将捕获来的电子文件进行补录、分类、案卷整理的功能,记录电子文件的所有操作过程及操作过程中形成的电子文件,实现对电子文件的全生命周期的管理,主要业务流程见图2。

图1 系统总体框架

3 核心算法及实现

3.1 电子文件捕获的功能及流程

电子文件捕获主要实现电子文件形成及其元数据捕获的功能,[4]支持文件管理员手工录入,指定文件夹自动抓取和系统自动捕获。在捕获电子文件的同时,系统还向文件管理人员提供电子文件登记功能,登记的对象包括文件及其组成部分,如组合文件、单份文件、文件说明、文件分类、文件的关联等。[3]自动捕获方式的运行流程是:①业务系统将上传的电子文件放在电子文件管理系统的捕获目录中;②系统程序定时扫描捕获目录;③解压zip文件;④将电子文件上传到存储服务器;⑤根据电子文件的属性XML生成电子文件的描述性写入数据库;⑥提交文件审核,完成对文件的捕获。具体来讲,在系统启动时,一个线程定时扫描自动捕获的文件目录,若有文件存在,将其解压处理;解压后校验文件中XML的合法性,校验完成后,上传组件到存储服务器;在数据库中写入元数据信息、分类信息、关联信息、组件信息,完成自动捕获任务;如捕获过程中出现错误,系统会记录错误日志供业务系统调用(见图3)。

图2 主要业务流程

图3 自动捕获的基本业务流程

3.2 电子文件捕获功能算法和程序实现

在电子文件列表界面上,触发添加按钮,弹出登记电子文件的界面;填完元数据信息和组件信息之后,触发保存按钮,提交到CaptureAction的save方法里;save方法调用CaptureService的save接口,在save接口里调用checkData校验数据的完整性;有问题直接返回,没有问题则上传电子文件到存储服务器,再调用RecordDAOImpl的save方法将元数据写入到数据库。

人工捕获主要算法是将电子文件通过FTP上传到电子文件的存储系统里保存,上传之前需申请存储接口位置,根据上传用户所在单位就近原则选择上传的存储接口,上传成功之后才将元数据信息、分类信息、组件信息、关联信息写入到数据库。

自动捕获的主要算法是:系统起动后有一个线程自动扫描捕获的目录,如果目录里有文件,起动捕获程序;解压zip文件,解析XML文件,将XML文件解析成Record对象;再调用人工捕获的程序处理。

3.3 数据存储说明

与电子文件封装标准类似,[4]电子文件封装标准中将电子文件以BASE-64的方式存储在XML里,这种做法对于比较小的文件是可以的,但如果文件很大,XML就很难读出来了。所以为了支持所有的电子文件,本系统将电子文件以引挂的方式引入到XML,方框区域表示电子文件的元数据信息,其中包括题名、年度、保管期限、文号、责任者等,path-docx表示以外挂路径的方式引入组件。[5]

3.4 移交功能实现

移交通常是将满足移交条件的文件移交到档案馆或第三方机构,移交的电子文件按照国家档案局的相关标准进行封装。机构移交文件后可根据自身需要在本地续存文件拷贝。移交前要进行鉴定处置,主要是针对已经归档的文件进行管理,包括文件鉴定提醒、文件鉴定申请、文件鉴定审核、文件鉴定管理、文件移交处置、文件续存处置、文件销毁申请、文件销毁审核、文件销毁查询等。

电子文件鉴定主要分为文件保管期限鉴定和文件开放鉴定。[6]其中,文件保管期限鉴定主要是对到期的文件提交鉴定申请,以便对到期的文件做处置,处置结果分为移交、销毁和续存三种。文件开放鉴定是针对文件需要开放,以便大家都可以查询的鉴定处置。

生成移交包的业务流程:取得移交包中文件的结果集,遍历结果集,下载相应的电子文件,将元数据属性信息与电子文件一起封装在XML里,之后对内容做数字签名,签名信息和签名证书也写入xml;xml生成后,产生移交清单、进行压缩,生成压缩包(见图5)。

3.5 移交功能算法和程序实现

图4 数据存储中的XML语言

图5 生成移交包程序流程

系统根据移交包的ID,调用RecordDAO的findAll的方法得到要移交的所有文件信息,第一个文件调用EEPService的generateEEP的方法生成长期保存格式文件,生成eep时需要调用addAttribute生成属性信息,调用addComponents生成组件信息,调用addBehaviour生成业务行为信息,调用addAgent生成机构人员信息;再将这些信息生成签名信息,将签名结果放在xml里,最后生成长期保存格式文件;将所有的EEP打包成zip包,添加文件清单等信息,生成一个完整的移交包。系统根据移交包的文件内容生成eep的标识信息,再将eep的签名内容用电子证书作签名,将证书内容与签名结果内容写到eep文件里,主要用到签名的算法用RSA算法。再生成保管期限处置表、移交明细、再将每个eep文件和相关的文件压缩成一个移交包。

4 结论

本文研究实现的电子文件管理系统,结合电子签章等技术,实现了在政务内网上电子文件捕获、电子文件整理、电子文件鉴定处置、电子文件统计、电子文件检索与利用、长期保存转换等目标。通过电子文件管理系统的应用,可以规范政务业务,实现电子文件信息资源的内部共享和外部协同,有效提升行政效率,降低行政运行成本。对于整合资源、提高安全、实现电子文件的全生命周期管理等方面具有重要的意义。

[1]郭理桥.政务信息资源共享及业务协同——深化电子政务建设应用的有效途径[J].中国建设信息,2009(15):50-51.

[2]冯惠玲.我国电子文件管理国家战略的特点[J].档案学通讯,2009(5):9-12.

[3]刘越男.提升电子文件管理系统质量的路径分析[J].档案学研究,2010(5):82-86.

[4]陈勇.电子文件管理若干前沿理论探微[J].湖北档案,2008(6):8-10.

[5]章燕华.电子文件管理规范体系框架研究[J].档案学通讯,2010(5):39-43.

[6]刘越男,等.电子文件管理系统实施过程中元数据方案的设计[J].档案学研究,2012(2):56-64.

G255.76

B

1005-8214(2015)11-0067-03

孙莉(1975-),女,宁夏大学数学计算机学院讲师,东华大学旭日工商管理学院在读博士,研究方向:计算机科学与技术。

2015-08-10[责任编辑]刘丹

猜你喜欢

调用管理系统算法
基于James的院内邮件管理系统的实现
核电项目物项调用管理的应用研究
Travellng thg World Full—time for Rree
系统虚拟化环境下客户机系统调用信息捕获与分析①
进位加法的两种算法
基于LED联动显示的违停管理系统
海盾压载水管理系统
一种改进的整周模糊度去相关算法
一种基于L-M算法的RANSAC图像拼接算法
基于RFID的仓储管理系统实现