以信息技术为基础实现民国档案事业改革与创新
2013-08-07林周佳
林周佳
(中国第二历史档案馆,江苏南京,210016)
2010年末,时任中共中央书记处书记、中央办公厅主任令计划在出席全国档案工作座谈会时强调,各级档案部门和广大档案工作者要适应当今时代的新发展、适应党和国家的新要求、适应人民群众的新期待,大力推进档案事业改革创新,努力实现档案工作科学发展,为服务党和国家工作大局作出更大贡献。这一指示为档案事业的发展指明了前进的方向,全国各级档案部门认真思考,积极探索档案事业改革与创新之路。当今,是信息化时代,随着信息技术的不断发展,各行业对它的依赖程度也越来越高,信息化程度在一定意义上体现了一个行业综合实力的高低。所以档案事业的改革与创新必须以信息技术为基础、为依托,笔者试就民国档案管理为例从以下三个方面阐述信息技术与档案馆的基础工作相结合,实现档案馆原先工作模式的改革与创新。
1.物联网技术与档案保管
物联网是新一代信息技术的重要组成部分,其英文名称是“The Internet of things”。由此,顾名思义,“物联网就是物物相连的互联网”。它有两层含义:第一,物联网的核心和基础仍然是互联网,是在互联网基础上的延伸和扩展的网络;第二,其用户端延伸和扩展到了任何物品与物品之间,进行信息交换和通信。物联网通过智能感知、识别技术与普适计算、泛在网络的融合应用,被称为继计算机、互联网之后世界信息产业发展的第三次浪潮。物联网是互联网的应用拓展,与其说物联网是网络,不如说物联网是业务和应用。
国际电信联盟(ITU)发布的ITU互联网报告,对物联网做了如下定义:通过二维码识读设备、射频识别(RFID)装置、红外感应器、全球定位系统和激光扫描器等信息传感设备,按约定的协议,把任何物品与互联网相连接,进行信息交换和通信,以实现智能化识别、定位、跟踪、监控和管理的一种网络。在物联网环境下,没有生命的物体植入各种微型感应芯片后,借助网络就能实现互相通信,人与物体可以“对话”。
目前,国内虽有一小部分档案馆(室)已经开始借助数据库与互联网辅助人工进行档案保管,但由于技术力量薄弱、资金缺乏、保管条件受限、规章制度不完善等多方面原因,此项工作进度缓慢、利用面窄。而大部分国家级、省市级档案馆均未开展物联网技术应用于档案保管这项工作。美国权威咨询机构Forrester Research公司预测:到2020年,世界上物与物互联的业务相比于人与人通信的业务将达到30:1,因此,物联网被称为下一个万亿级的通信业务。物联网作为按约定的协议,把任何物品与互联网连接起来,进行信息交换和通信,以实现智能化识别、定位、跟踪、监控和管理的一种网络。无疑,在档案保管这一领域拥有广阔的应用前景。
物联网的关键技术是RFID(Radio Frequency Identification射频识别)和WSN(wireless sensor network无线传感器网络)。利用RFID和WSN技术,在档案库房和特藏室等实体档案保管部门安装各种感应芯片,并在芯片中存储设定信息,包括温度、湿度、酸碱度等。由处在自然环境中的芯片自动搜集档案保管环境的信息,并传递给中心服务器,可以避免人为干预环境参数测量所产生的误差,测量过程更为安全,数据结果更加准确。同时,给每件实体档案植入RFID标签,并在标签中存储该件档案存放地点、来源、内容等要素,这样档案保管员通过读取电子标签轻易即可获知该实物档案的目前存放的位置,确认它是否在原位,还是被移动,被调阅。保管员可以实时跟踪每件档案的入库、出库、经手和使用情况,档案的实时动态数据将被传到中心服务器,所有被贴上电子标签的档案,其每刻“行踪”都可以通过中心服务器查询。物联网及其相关技术的应用给实物档案保管带来了前所未有的机遇,它赋予了实物档案更高的“智能”,物联网智能化识别、定位、跟踪、监控和管理的功能不仅最大程度上保障了实体档案的安全,更从根本上解决了档案保管员清点和保管海量档案的难题。
2.档案整理与档案数字化
档案数字化工作是一项顺应潮流、适应时代发展的新工作。它把传统载体的档案经过档案整理等前处理工作和档案数字化加工工作形成数字档案,通过局域网、政务网、互联网进行计算机检索和电子档案查阅,为信息化时代的档案利用提供了新的服务模式,增强了档案业务部门的服务水平和工作效率。
笔者供职的中国第二历史档案馆正在进行的馆藏档案数字化工程主要分为历史档案整理和数字化加工两个组。历史档案整理划分为:承接登记、档案入库、拆分编号、档案鉴定、托裱修补、填写卷皮、装订还原、质量检查、移交入库等9个工序;数字化加工划分为:扫描、扫描质检、图像处理、图像质检、著录、著录质检、制作目录、批量挂接、数据检查验收(总质检)、数据备份、成果管理等11个工序。
同时,借助数字化加工软件和档案著录挂接软件实现将纸质载体中记录的传统档案信息转化成可以被计算机识别和处理的数字信息。
数字化加工软件能提供专业的图像获取、处理和管理技术,将档案的数字化加工从扫描、图像处理、图像质检、统计监控等进行全程的管理和控制,各种自动化技术(自动图像倾斜校正、批量图像清理)能够保证图像标准、规范、整洁。
档案著录挂接软件符合档案著录规范要求,并且能够进行著录扩展。软件具有自动生成序号、继承著录、档号自动生成等快速著录设置,并能够进行重复性、一致性、唯一性、必填性等多种校验方式,能够准确、快捷的完成档案条目的录入,并确保质量;挂接功能能够自动实现著录条目和扫描的图像之间的匹配关系,并保证100%的正确率。
档案数字化与传统的档案管理模式相比,具有不可替代的优越性:
第一,增强了对历史档案原件的保护。历史档案经过数字化之后,查档过程中可以减少对档案原件的使用,甚至可以封存原件,对一般的利用者用电子档案替代原件使用。
第二,提高了查档的工作效率。数字化后的档案被导入中心数据库,与目录挂接。查档过程中可通过对数据库检索实现利用,与人工翻阅纸质档案相比,大大提高了查询效率。
档案整理具体流程
第三,为未来互联网上的档案利用提供数据保障。
3.云计算技术与档案利用
3.1 概述
云计算是分布式处理(Distributed Computing)、并行处理(Parallel Computing)和网格计算(Grid Computing)的发展,是这些计算机科学概念的商业实现。从本质上讲,云计算是指用户终端通过远程连接,获取存储、计算、数据库等计算资源,云计算在资源分布上包括“云”和“云终端”。
图书馆行业对云计算的发展给予了高度重视,对其技术进行了较多的论述与尝试,并在部分单位进行了试点。与图书馆界相比,由于档案工作涉及安全性、保密性等诸多问题,档案界对云计算的应用尚处于理论研究层面。国家档案局提出“大档案、大服务、大安全”的观念,这对档案利用服务,提出了全新的要求,如何改变原有独立且分隔的民国档案信息资源存储、利用及服务模式,如何有效整合民国档案分布式资源,消除单个民国档案信息孤岛问题,实现保存在各省、市、县档案馆的民国档案信息的资源体系整合共享,将是未来民国档案管理的重点工作。
构建全国民国档案云服务平台,有利于整合全国范围内民国档案资源,加快民国档案资源体系、利用体系和档案安全体系建设,推进档案工作自身的科学发展、提高档案工作的服务效能。因此,档案界应直面新技术带来的挑战,在充分把握、理解各种云计算服务特性的基础上,综合考虑当前云计算模式与民国档案云服务平台管理间存在的观念差异,密切结合民国档案云服务平台自身的战略定位与业务实际、创新服务理念,研究分析在云计算时代档案数字化建设中的全新管理与服务模式。
数字化加工流程
目前全国各级档案馆都在紧锣密鼓地进行档案数字化工作,这一契机为民国档案全文检索创造了有利条件。中国第二历史档案馆以全国档案馆资源整合建设实践为基础,结合云计算基础设施即服务(IaaS),平台即服务(PaaS)和软件即服务(SaaS)的服务理念,在国家档案局“三大战略、三个体系”的建设要求指导下,以数据整合、统一服务为基本目标,研究探索全国范围内民国档案资源管理和利用建设思路,明确先进可行的数据存储模式、协同工作模式、应用服务模式、信息共享模式,拟探索建设全国民国档案云服务平台,为国内其他档案馆的云平台建设提供一种参考思路与方法。
3.2 云服务平台的开发策略
云服务平台主要是由云上的各档案馆管理应用程序数字管理节点、计算机专用网络及安全防火墙、各档案馆的硬件设施等构成。云服务平台上的档案信息是分布式的,以数据流的形式分布存储在各个数字档案管理节点上。在基于云的档案管理系统里面,核心的还是数字档案信息的组织形式,也是基于云计算下的一个基本的组织模式。其架构如下:
参与云的各档案馆将其民国档案数据上传至云服务器,用户通过在云平台上的检索即可查找到其所需的分布在全国各地的民国档案信息。对于全国民国档案管理来说,基础设施、基础服务的统一管理可以节约信息化成本,避免重复建设,重复投资,最大限度发挥国家财政的作用;对于各家档案馆来说,能够减少对硬件设备的投入,减少对传统管理模式的投入,通过对不同设备、不同地域的数据和应用的共享为查档者提供更加便捷、高效、全面的服务;对于用户来说可以避免为了查询某个档案信息跑遍全国所有相关档案馆逐家查档的窘境,可以充分享受云平台上分布式计算带来的高效,不必再担心某一时段客户端上超负载带来的困扰。
3.3 云计算服务风险
美国专门从事信息技术研究和咨询的Gartner公司,在2008年发布的《云计算安全风险评估》中总结了目前云计算技术存在的7个安全风险:特权用户访问风险;法规遵守风险;数据位置不确定风险;共享存储数据风险;数据恢复风险;调查支持(数据跟踪功能)风险;长期发展风险。
大致可归结为三个层面的安全问题:云计算用户的数据安全和应用安全;提供云计算服务的平台自身的安全和服务的持续性;云计算资源的安全。基于档案信息的敏感性,为确保档案信息不因偶然的或者恶意的原因遭到破坏、更改、泄露,保证云环境下档案服务平台能够持续、可靠、正常地运行,法律法规的制定、技术人员的配备、软硬件的保障、服务商的选择都显得尤为重要。
4.结语
按照《数字档案馆建设指南》中的定义,数字档案馆是指各级各类档案馆为适应信息社会日益增长的对档案信息资源管理、利用需求,运用现代信息技术对数字档案信息进行采集、加工、存储、管理,并通过各种网络平台提供公共档案信息服务和共享利用的档案信息集成管理系统。数字档案馆作为传统档案馆利用计算机软件、存储及网络技术形成的全新的展现方式,是当今知识经济时代基础信息资源不可替代的部分,能够为广大用户提供科学研究、知识普及及智能化服务的全新途径。物联网、档案数字化、云计算作为多种计算技术和服务理念的合成,将对数字档案馆资源建设与服务运作方式、经营成本、创新方式、支持服务系统等方面产生积极影响,给新时代的数字档案馆的管理与服务发展带来了巨大的机遇。
当然,信息化技术的应用是一把双刃剑,它给我们档案管理带来便捷、高效的同时,也使更多的档案信息存储在计算机硬件上,暴露在开放的网络环境中,于是计算机安全、网络失泄密又成为我们不得不深入探讨的另一个课题。
[1]令计划出席全国档案工作座谈会:大力推进档案事业改革创新努力实现档案工作科学发展,中国档案,2011(1).
[2]马建.物联网技术概论.机械工业出版社,2011:1-12.
[3]崔海莉,张惠达.云计算环境下档案信息管理系统风险分析,档案学研究,2013(1).
[4]国家档案局.数字档案馆建设指南,2010.