高校数字化档案馆建设构想
2015-08-12程靖
程靖
目前人类已经进入大数据时代,大数据应用在生物信息、智能交通、金融、医疗等领域都取得了可喜的成绩。大数据时代的到来,为档案信息化建设也带来了新的挑战和新的机遇。在欧美等发达国家,在档案领域通过依托档案公众网站建设“网上档案馆”,已成为了各国开展档案公共服务的重要形式。在国内,本世纪初以来,档案信息化建设也受到各级档案部门的高度重视,然而,由于我们起步晚,技术欠成熟,还处在学习、借鉴、起步阶段,尽管如此,实现档案数字化建设也已成为了全国档案信息化建设的发展趋势。作为高校档案从业人员,实现高校档案数字化和数字档案馆是我们所追求目标,所以,我们就建设我国高校“网上档案馆”网站建设方案提出自己的构想,不成熟之处,敬请批评指正。
一、建设方案
档案的保管和利用是档案馆的两大功能,如何安全保管和有效利用是档案管理者的两大任务。档案数字化无疑是目前保护档案实体安全、促进对外开放利用、实现档案信息资源社会共享的有效技术手段。为此,如何构建和构建怎么样的一个数字化档案馆技术平台将是实现上述档案馆两大功能和任务关键所在。面对大数据容量大,种类多、处理快、价值高的特点,在建设数字档案馆和档案数字化过程中就要特别重视基础设施的完善、前沿技术的应用、档案资源的构建和管理。本文结合我们熟悉的高校档案目前的保管和利用的情况,以及我们对数字化档案馆网络平台的技术的认识,谈谈我们对构建高校数字化档案馆的思考和设想。要在网络上实现“网上档案馆”平台的实时开放和有效利用,关键是要应用聚类分析、语义分析、数据挖掘将档案信息资源转化为结构化数据,并合理开放数据,为社会需求服务。高校数字化档案馆平台建设应包含主要三个部分:档案网站的建设、文献检索系统的建设、档案地理信息系统建设。
1、通过广泛的资料查阅、专家咨询、走访调查,对平台做出总体设计。
2、选择某个高校做试点,综合、整理现有的高校档案资料,分门别类,特别是无需保密的档案资料都做好归类处理。
3、对已整理核实好的高校档案资料进行数字化处理,建设档案馆网站,对各种档案资源做多模态的展示。
4、用GIS技术,建立全国高校档案地理信息系统,对各高校档案馆做广泛系连。
5、利用网络交互技术建立与用户的互动平台,使广大用户既是平台资源的受用者,也是平台资源的提供者。
6、在平台上建立文献检索系统,向国内外提供档案文献的特色服务。
二、功能设计
从现有的国内外数字化平台建设的类型来看,其最大的特点都采用功能设计突出用户导向,立足用户需求开展信息检索、利用互动、用户分类、信息更新、公共教育、在线帮助、网上展览、网上购物等多重服务,以满足众多用户的需要。根据这一服务理念,我们初步设计了如下的建设方案:
1、前台页面
面向最终用户的页面表现。优先考虑效率问题,以提高用户体验。包括缓存策略、功能性界面设计、搜索引擎设计、用户个性化界面等。
2、后台管理
内容管理和表现的分离是网络程序的常见设计方式。内容一般用数据库存储,后台各种子系统可以根据需要来调取各项内容。表现模板则和后台各种子系统设计分开,控制后台各个子系统数据的取舍和表现,与后台各个子系统之间只是数据传递的关系。而后台的各个子系统也都非常容易插拔。表现模块以脚本语言或标记语言保存在数据库中,可以自行设计修改。页面表现一般就是各种后台子系统模块的各种组合,这种页面表现的组合逻辑是非常丰富的。
后台管理主要是业务子系统模块的管理。如:信息录入子系统、信息分类子系统、信息讨论子系统、信息提取子系统等。针对不同的子系统方便管理者的内容录入;所见即所得的编辑管理界面等,清晰的业务逻辑;各种子系统的权限控制机制等。
3、数据库结构设计
(1)设计方案
①数据字典
分离内容的管理和设计。页面设计存储在模板里,而内容存储在数据库或独立的文件中。当一个用户请求页面时,各部分联合生成一个标准的HTML页面。每个模型都可以自定义扩展字段,由用户自定义属性字段,以适应未来的拓展要求。
②信息条目相关关系
信息条目的相关关系有:同义、近义、反义、上下义。主要的目的就是便于统计,用于信息提取。搜索引擎设计,有一个字段专门用于标明是同义关系,还是近义关系、反义、上下义。有了这个关系标识,信息提取就非常方便。
(2)安全保密设计
通过后台数据管理,分不同的管理员确保数据的安全性。其次,也采取了词语过滤,IP策略保障信息数据的安全性。
(3)数据库结构
数据库表信息结构如下表所示:
序号 数据表英文名 数据表中文名
1 DepartmentInfo 部门信息表;2 UserTypeInfo 用户类型表;3 UserInfo 用户信息表;4 AreaInfo 地域信息表;5 UniversitiesInfo 高校信息表
6 CategoryInfo 分类信息表;7 TsarchivesInfo 特色档案信息表;8 TsArchivesAreaInfo 特色档案地域单位表;9 TsArchivesInfo 特色档案关联表;10 ArchivesInfo 档案信息表;11 ArchivesReference 档案参考资料;12 ArchivesPicInfo 档案图片信息表;13 ImageAlbumInfo 图册信息表;14 ArchivesAuInfo 档案音频信息表;15 ArchivesAvinfo 档案视频信息表;16 ArchivesTagInfo 档案标签信息表;17 ArticleTag 文章标签表;18 Comment 文章评论表;19 CommentReport 文章评论回复表;20 FilterWords 系统敏感词过滤表;21 IpControl 系统IP过滤表;22 MailConfig 邮件配置信息表;23 ScoreLevel 系统积分等级表;24 SysConfig 系统基本配置表;
(4)接口设计
①用户接口
a)各级别的用户登录接口。
b)各级别的管理员登录接口。
②外部接口
a)WIKI接口:强大的信息采集功能,可挂接插件。能够从其它网页上导入进来,作为我们的信息条,然后加工它。
b)GIS接口:URL。地图上的显示,可以跳转出去,因为GIS系统是我们自己开发的。
c)文献接口:URL,获取大量的电子文献内容,也可以是跳转出去,能够检索出一些相关的内容。文献系统也是我们自己开发的。
d)大数据接口:预留,将来可以获取大量丰富的档案资源数据,例如查看档案原件模型,也是跳转出去。
2、数据与材料的搜集与整理
数据与材料是本平台的最核心内容,分两个步骤进行。
第一步,试点单位档案管整理已经过鉴别的非保密的馆藏档案材料,经过数字化处理,做成数据库,导入我们已建成的数字化档案馆平台进行示范展示。
第二步,扩大参与单位,增加数字化档案馆档案材料。本数字平台涉及的档案数据和研究面大,必须采用大协作的方法,协同攻关。初步设想是以本平台为蓝本,国内其他高校均参与到档案网站建设中来,最终建成全国高校档案资源数字化网络档案馆。为我国实施大数据战略在档案领域做开拓性的探索。
综观国内外数字化档案馆的功能设计无不围绕用户的需求而展开,所以,本建设设计方案以突出用户为导向,强化高校数字化档案馆平台建设即数字化档案网站前后平台以及数据库的建设,这是数字化档案馆的核心部分,如果光有技术平台而无可以查询利用的数据、档案,那就达不到建设的目的,但如果只有数据、档案等文献,其检索功能单一低效,那么也不会吸引利用者查询或因为麻烦而不愿意使用,也还是达不到建设的目的和效果。为此,我们着重开发功能强大的文献检索系统,接口设计详尽周到,以期为用户提供丰富而详细的检索条件和互动利用,方便用户检索利用。我们还受地理信息系统的启示,在数字化档案馆的建设中引入档案地理信息系统建设,这样更为直观明了,不仅给使用者找到历史的时空感,还能把使用者带入地理的空间,可以更为直观地了解该档案事件发生的时间地点,给人更多的感悟和理解。
(作者单位:广东技术师范学院档案馆)