基于分布式技术的数字档案信息管理系统设计
2020-06-03曾裕涵杨立敏刘小西
曾裕涵 杨立敏 刘小西
摘 要: 从湖南涉外经济学院档案管理实际出发,采用B/S架构,使用Hadoop分布式技术以及web service技术,结合Sql Server数据库,设计并实现了数字档案信息管理系统,实现了学生信息采集、管理、电子档案管理等功能,保证了数据的高效存取,大大提高了档案管理的效率。
关键词: 档案管理; 信息系统; B/S架构; Hadoop分布式技术
中图分类号:TP392 文献标识码:A 文章编号:1006-8228(2020)04-58-03
Design of digital archives information management system using distributed technology
Zeng Yuhan1, Yang Limin2, Liu Xiaoxi1
(1. Hunan International Economics University, Changsha, Hunan 410205, China; 2. Hunan Vocational College of Foreign Languages)
Abstract: Based on the reality of the archives management of Hunan International Economics University, using B/S architecture, Hadoop distributed technology and Web service technology, combined with SQL Server database, a digital archives information management system is designed and implemented, which realizes the functions such as student information collection and management, electronic archives management etc., to ensure the effectiveness of data access, and greatly improve the efficiency of archives management.
Key words: archives management; information system; B/S architecture; Hadoop distributed technology
0 引言
高校數字档案信息资源建设,对于高校档案信息资源的利用、开发具有重要意义[1-2]。湖南涉外经济学院作为全国最早的民办本科院校之一,现有全日制本/专科学生29000余人,累计为社会培养应用型人才10万余人,档案管理任务繁重,如何结合学校实际提高档案管理信息化水平十分重要。论文采用采用B/S架构,使用Hadoop分布式技术以及Web service技术以及Sql Server数据库,设计并实现了数字档案信息管理系统,对提高学校档案管理效率具有重要的现实意义[3-5]。
1 需求分析
以现代信息技术为基础,通过利用数字化手段,将纸质档案数字化,同时将电子档案归档,管理数字档案信息资源,并结合高速带宽网络等设施,实现信息的连接和利用,设计资源共享的分布式、规模相对较大的数字档案管理信息系统。纸质档案工作流程主要包括档案收集、分类、交接、拆分、扫描、图像处理、质量检测和案卷整理等流程,电子档案工作流程主要包括档案捕获、迁移、归档、鉴定和索引著录等流程。系统用户大致可划分为档案管理员、系统管理员和普通用户三种。
2 数字档案信息系统设计
2.1 系统体系架构设计
该系统体系结构图如图1所示。系统主要包括档案采集、档案管理、档案利用和系统管理四个部分。
档案采集主要是在本系统中实现对不同渠道文件的导入,并自动对上述文件进行编目操作。结合数据接口,按照相应的采集流程,采用数据交换平台,实现OA等信息系统文件向统一格式转换,并最终导入到系统内。当对统一格式档案进行获取以后,需要自动对档案进行编目,在完成编目操作以后,最终在数据库内存放。
档案管理对实现档案统计、销毁及鉴定。其中,统计是统计档案以及分析和整理数据;鉴定则是结合相应规范,针对档案开展归档、技术、内容鉴定等相关操作;档案销毁,则是结合相关规定,销毁已超过期限、或者是无效的档案。
档案利用主要包括档案的检索以及借阅管理。检索是能够让不同系统均可便捷的对档案信息进行提取并可结合相应要求展现。借阅管理具体包括借阅档案、催还等功能;
系统管理主要是对系统相关的权限、角色等进行增加、删除、查看和修改等功能。
2.2 总体功能结构设计
图2是系统功能结构图,总体功能主要包括后端档案业务管理和前端信息服务网站两个部分。档案业务管理部分主要涵盖档案采集、档案管理以及系统管理三个部分,主要涉及到一些基础数据的维护以及系统维护等内容。信息服务网站主要涉及到档案利用方面的内容。图3是系统存储功能结构图。高校档案数字化管理信息系统对数据的存储运用的体系结构为目录—文件,采取目录数据的形式,对档案属性信息进行存储,而与之对应的原文件,则在相应的服务器内存储。二者一一对应。结合如上的存储体系结构,各类型的信息,可在相应的存储位置中存放。结合这一方式,看实现对日渐增长的档案信息的扩充要求的满足。
图4是档案管理系统数据E-R模型,在开发过程中,对档案信息表、用户信息表、档案管理制度信息表等在内的多种表进行了设计。数据库逻辑设计选用的逻辑结构,和DBMS产品支持的模型相符,以此实现对数据冗余的去除、数据需求等,以便于实现高效、便捷的存取。结合需求分析,系统中涉及的数据库表包括如下,用于在线借阅、查询档案、存储数字档案光盘的查询、归档上架等诸多功能。实体表包括角色表、用户查看档案权限表、用户表、角色—用户关系表、日志表、档案分类表、文件信息表、档案状态表、馆藏地表、档案信息表、借阅信息表、档案销毁表、借阅状态表和档案鉴定表。
3 系统测试
图5是所设计的数字档案管理信息系统学生信息查询界面图,我们对所设计的数字档案管理系统进行了功能测试和性能测试。功能测试主要是测试系统前台页面的数据展示,以及后台文件管理模块、档案管理模块、查询统计模块和系统图管理模块的核心功能是否实现。性能测试主要测试系统并发用户数量较大对系统CPU占用率、响应时间等性能指标的压力测试。对50名用戶的并发操作进行模拟,最终通过的项目达到1万多,仅有1项事务失败,响应的平均时间为3秒,最长的为9秒,CPU的使用率达到16%;在对100名用户的并发操作进行模拟时,通过的事项达到1.2万多项,仅有4项失败;响应的平均时间是7秒,最长需要14秒,CPU使用率达到68%。结合性能测试结果,系统具有较好的事务成功执行率,响应时间约为5秒到10秒,最大响应时间超过20秒,CPU可正常运行,达到了预期。
4 结论
本文对高校数字档案管理体系结构进行了深入研究,采用B/S架构,使用Hadoop分布式技术以及Web service技术以及Sql Server数据库技术,设计并实现了数字档案信息管理系统,并通过了功能测试和性能测试。本文仅以分布式架构为基础提出了信息交互协议,若能将区块链技术等新技术应用到数字档案管理系统中来,实现真正的分布式信息交互,必将极大地推动高校档案数字化工作的发展。
参考文献(References):
[1] 张慎武,高艳霞,王玉霞.电子公文档案管理系统方案设计[J].兰台世界,2013.20:48-59
[2] 刘英俊.我国数字档案室建设研究[D]安徽大学,2017.
[3] 谭培勇,王晶,史蓓蕾,郭晶晶.基于.NET平台的通信器材档案管理系统的设计与实现[J].计算机与数字工程,2012.12:42-57
[4] 陈卸女,屠友军.基于ASP.NET平台的新警档案管理系统的设计[J].计算机光盘软件与应用,2012.20:43-56
[5] 何蒲,于戈,张岩峰等.区块链技术与应用前瞻综述[J].计算机科学,2017.44(4):1-7