APP下载

大数据时代的数字档案室建设初探
——以南京市建邺区为例

2016-11-28安鹰

档案与建设 2016年10期
关键词:建邺区档案室全区

安鹰

(南京市建邺区档案局,江苏 南京,21001710017)

大数据时代的数字档案室建设初探
——以南京市建邺区为例

安鹰

(南京市建邺区档案局,江苏 南京,21001710017)

大数据(BIG DATA)已成为当下最流行的一个词汇,在这个流行词汇的背后蕴含了一次颠覆性的革命,这一切可以从以下四个方面得以体现:一是大数据技术是继分布式云计算、全流程物联网技术之后互联网产业又一次颠覆性的技术进步和应用的变革;二是大数据的收集、积累、数据发掘和应用对国家的政策决策、公共治理模式、技术创新、一路一带的具体实施战略都具有根本的、不可替代性的作用;三是大数据的发掘应用为企业的业务方向、创新方向、运作模式、组织和业务体系架构流程指明了方向;四是大数据的发掘和应用必将对每个人的生活都将产生巨大的、颠覆性的影响。

具体到档案管理工作,从其专业性和技术实现性的特点上来分析,大数据时代必将给档案管理工作带来翻天覆地的变化。

一、大数据的概念及其与档案管理工作的关系

最早提出“大数据时代”到来的是麦肯锡公司。随着计算机和存储技术的成熟与发展,特别是数据库技术、搜索引擎和算法技术的发展,自2012年开始,大数据一词越来越多地被提及。

从美国开始,各个国家开始建设IDC中心,用它来满足信息爆炸时代产生的海量数据的存储和应用,并且用大数据这个概念来描述和定义并命名与之相关的技术发展与创新。

大数据指的是随着智能设备和智能终端广泛性的应用,广泛性的貌似无序的数据成几何级数地快速增长,且由于其特殊性、分散性、无序性、爆炸性,已不能使用传统的技术对这类数据进行管理和分析。

对这类数据进行分析和处理的最大困难是由于各类型数据的量增长过快,连续性和关联性差,分布性和离散性高,变化速度快,数据格式种类繁多。因此大数据不仅仅是指数据的量,同时还具有多样性、巨量化、高速率、价值密度低等特征。

档案在本质上就具备了以上所说的大数据的这些特征。档案本质是各类型的原始性符号的记录,它包含着文本、数字、图形、声音和影像等各种格式和类型的记录信息,同时也包含了这些记录信息变化的过程记录。虽说随着计算机和存储技术的发展和不断地成熟,现在档案资料已经实现了数字化,以数字形式存储,同时也实现了信息化和互联网化,档案资料可以使用户很方便进行检索和查阅,但是由于档案本身就具有大数据根本特征,所以随着各类型电子档案存储数据量逐年地爆发性增加,就必须使用新的技术与手段来实现档案信息的管理。

二、大数据时代,南京市建邺区档案工作的现状以及面临的发展机遇与挑战

1.建邺区档案工作现状

(1)全区档案室建设情况

截至2015年12月31日,全区档案立档单位共有231家。其中机关部门单位共计65家(57家进馆序列部门),其他11个系统单位(即教育、卫计、人社、社管、房产、建设、交通、城管、文化旅游、民族宗教、社区等)共计166家。

(2)“建邺区数字档案室管理系统”运用情况

2004年,区档案局与区信息中心联合建设“建邺区数字档案室管理系统”,一期建设已完成,并在全区机关各部门单位推广应用。

建邺区召开创建省星级、省A级档案室总结表彰会

2005年,区档案局依托区政务网络平台和区政府协同办公系统,与相关软件开发企业共同研制了“建邺区数字档案室管理系统”。该项目通过了南京市科技局市科技成果鉴定并获得“省档案局优秀科技成果四等奖”。

2007年,“建邺区数字档案室管理系统”在全区全面使用。档案应用系统采用B/S架构,系统架设在建邺区政务网上运行。该系统部署于区信息中心,由区信息中心统一维护。实现了区办公自动化系统与数字档案室系统对接,实现电子文件目录和原文从办公自动化系统流转到数字档案室系统的目标。

2009年,配合建邺电子印章的推广和应用,建邺区对“建邺区数字档案室管理系统”进行了二期升级。引入电子印章功能,集网上收集、整理、编目、统计、原文挂接、电子印章于一体,符合国家档案局《档案管理软件功能要求暂行规定》的要求和江苏省《文书档案文件级目录数据库交换格式》的技术标准,具备了电子文件归档和管理功能,实现在线接收、查看、打印加盖电子印章电子公文的功能(可在线验证电子印章的真伪)。将档案应用系统纳入到建邺区统一身份认证平台,实现基于CA的身份认证体系。

2014年,建邺区对“建邺区数字档案室管理系统”第三次升级。依据《江苏省A级数字档案室(馆)建设规程》《江苏省电子档案基础元数据库结构和封装格式》和《江苏省档案数字化转换操作规程》,在继承原有系统功能优点的基础上,新增了“电子文件数据封包、文件封包数字签名和数字认证、规范元数据”等功能,升级了导入、原文批量上传挂接、多媒体档案管理、数据批量处理、跨类检索和跨字段检索等功能,能够较好满足现代档案数字化管理要求。实现电子文件元数据信息的网上采集和在线封装功能,同时实现基于江苏省CA证书的电子文件封装包数字签名和基于电子文件封装包的档案在线移交与接收。

依托现有的政务网环境,2016年“建邺区数字档案室管理系统”又在原来江苏省5A级数字档案室建设基础上,通过进一步的硬件、软件、资源及组织制度建设,力争建设成首批国家级数字档案室,以实现加强元数据捕获支持、完善电子文件可用性支持、档案四性检测支持、智能化档案管理的四项目标。

截至2015年12月31日,全区各部门单位室藏档案数字化工作纳入“十二五”智慧建邺信息化专项规划中,完成了全区65个部门单位档案的扫描和挂接任务,为档案数字化、信息化管理提供基础保障,档案数字化成果及时为各部门单位资料长编等工作提供了数字化服务,得到了很好的反响,也更好地为全区经济和社会发展提供服务。全区共通过省A级数字档案室测评31家。其中区信息中心、区档案馆成功通过省5A级数字档案室(馆),其余全部通过省4A级数字档案室,成为全市完成数字档案室数量最多的区,为全区数字档案室建设开了好头、做了表率,在全市起到了引领和示范作用。

2.大数据时代,建邺区档案工作面临的机遇与挑战

(1)大数据技术的应用必将给现有的档案管理应用和相关性数据挖掘带来根本性的改变。

传统的档案管理以文档管理为主,档案基本处于模式单一的被动利用。沉淀下来的档案由于数量巨大、种类繁多、关联性差,没有相应的技术手段,根本无法实现人工有效管理和相关性分析。

在大数据时代,档案系统中除保存了大量的实物文档之外,还具有海量的、结构化的各类型数据文档,在应用了大数据技术后必将大大地提高档案的利用效果。

建邺区档案部门在收集大数据之后,通过主动调查利用者的需求,建立各种数据模型,对海量数据进行聚类、分类、相关性分析,找到数据之间的关系,提高档案价值,将原来的“死档案”变成“活信息”,为高层决策提供参考。

(2)大数据技术的应用也必将给档案管理系统可扩展性带来了机遇。

随着档案数据的不断增多,传统的档案管理系统与其他的管理系统一样,会在根本上受到各种技术装备和技术手段的制约,无法进行连续性的无缝动态扩展,大大地制约了档案管理系统的更新和发展。大数据时代产生的IDC中心,分布式数据库技术的应用,最终到云平台的产生,都必将给档案管理系统带来革命性的变化。以IDC中心为基础,运用云平台技术手段,就可以实现根据档案管理系统的需要对计算资源、存储资源进行动态扩展、按需分配,与此同时也实现连续性的无缝动态扩展。

对于“建邺区数字档案室管理系统”,如果是应用大数据的技术,基于云计算的技术架构概念,进行整体的框架性设计,就可以实现根据档案室数量和档案门类动态变化去调整计算资源、存储资源,满足档案数据的数据量、数据格式、数据关联性、连续性等几个方面快速变化的需求,同时大幅降低IT系统投资及维护成本。

(3)大数据技术的应用也必将使档案信息安全受到威胁。

当前档案管理系统中所应用的数据库,一般为相对封闭的关系型数据库。从计算机技术的角度来看,这类档案管理系统的数据库在数据的存储上为本地化,使用的智能化终端设备为专属化,同时在保证数据安全方面也设置严格的访问控制和隐私管理工具。因此可以说,无论是在管理系统的硬件上还是在软件上,都是相对安全和可控的。

而大数据技术的应用,却完全打破现在依托的硬件和软件技术基础,在成熟度和可控性方面都不如现在的系统可控性高,因此对档案信息安全管理提出了更高的要求。

三、大数据时代,建邺区数字档案室建设初探

目前大数据技术的发展和应用,已经渗透到当今社会的各个方面,今天的人们已经无法想象没有大数据技术的存在和应用会给人们带来怎样的情景,它已成为一个社会不可缺少的、重要的组成部分。档案管理系统的建立也不会置身事外,毋庸置疑,未来档案馆建设的核心竞争力很大程度上取决于大数据技术的应用,也就是说将档案数据转化为信息和知识的速度与能力。建邺区档案部门作为全区存储信息、提供信息服务的数据中心,必须主动创新,推动档案工作向“知识化、信息化、技术化、市场化”变革,利用大数据技术实现战略发展以满足未来需求。

1.数字档案室试点先行。为做好试点工作,建邺区档案局与区信息中心专门成立了项目组,多次召开会议研究方法和相关要求,制定下发了《建邺区数字档案室试点实施方案》,并设立了业务指导和技术服务两个组,全程跟踪为试点部门单位提供指导和服务。

2.加强数字档案室的规范化管理。目前建邺区65家数字档案室在基础设施、技术力量和管理水平上都存在一定的差距,为尽快整体推进和全面提高全区数字档案室建设的工作水平,要找准与“国家数字档案室建设试点”工作差距的短板,对照国家档案局《数字档案室建设指南》,尽快出台《数字档案室考评标准细则》。下一步我们将采取示范引路、全面提高的工作方式来整体推进试点工作。

3.全面升级“建邺区数字档案室管理系统”。为保障建邺区“国家数字档案室建设试点”工作的开展,今年6—8月间全面升级“建邺区数字档案室管理系统”,充分发挥计算机管理档案的功能,以保证此系统在全区政务网环境和全区各机关部门单位档案室的高效运行,为各部门单位提供档案维护利用支持。同时在档案专业培训、技术指导、制度建设、安全防范方面提供更有力的保障。

4.数字化档案的“收”要做到全流程控制。建邺区档案管理工作从前端进行控制,确保档案管理的规范,将档案管理融入到办公系统、科技创新管理、网络支撑等管理系统中,将文件、数据归档流程写入发文环节、验收环节等,抓好文档的前端控制。针对不同数据采取不同处理方法,各业务系统与档案系统建立实时接口,实现电子文件自动采集。

5.加强档案工作考核。“建邺区归档文件整理综合检查评分标准”是以百分制的形式,从组织管理、业务建设、信息化建设及开发利用四个方面列出具体的检查内容,并逐条对照确定标准分和评分细则,通过5次修改,检查内容从原先的20条增至30条。特别是“十二五”期间,根据档案工作形势任务的需要,建邺区档案局将档案信息化要求作为对各部门单位档案工作考核重点。在每年的档案年度检查之前,根据前一年的检查情况重新制定年度检查打分表,使纸质档案的质量逐年提高,保障了档案数字化加工的基础。

6.加强数字档案室资源集群建设,打造数据资源平台。大数据时代,各档案室之间互联互通,实现室藏资源共享,打造集群档案资源和数据平台意义重大。尤其在当前,许多档案室本身室藏数据都分散在互不联通的数据库中,如何将这些数据库打通,实现各数据库乃至各档案室间资源共享,这是建邺区档案局需要下大力气思考与解决的问题。唯有如此,才能提升档案工作的大数据水平,才能充分体现出馆藏室藏数据的价值。

四、大数据时代,建邺区数字档案室应用优势

大数据的发展给数字档案室建设带来了新的机遇,充分利用大数据优势能够解决许多数字档案室建设中存在的问题。建邺区作为全国首批低碳、生态、智慧新城的南京河西新城的重要组成部分,在大数据成果应用方面具备先天基础和优势。

1.依托建邺区打造的智慧新城平台,可以实现档案基础信息资源共享。以前相当一段时间,全区各档案室所保管的档案资源具有独特性,在没有特殊备份的情况下,不存在第二份相同的档案,这就需要想办法使得档案信息资源在保证安全的前提下,实现全区资源共享。依托区信息中心强大的技术支持力量,未来可以共享硬件设施、共享信息资源、共享计算,并生成新的知识资源,组建“档案云”,实现“一站式检索”,更大程度上实现跨时间、跨空间的档案信息资源共享。

2.智慧新城平台能够保障档案信息资源的安全。大数据是一种安全性比较高的技术,它采取数据集中存储,同时提供一整套数据备份恢复体系和访问控制体系,因而更有效地保障数据的安全。建邺区信息中心构建的智慧城市集成平台,将公安部门的网监力量纳入其中,集中发挥多部门技术优势。信息中心有专业的管理团队对数据进行统一管理、资源分配、安全控制,并进行可靠的实时监测。使用数据多副本容错、计算机节点同构可更换等措施,保障信息服务的高可靠性。

3.依托智慧城市建设,建邺区数字档案室可以提供更加个性化的档案信息服务。智慧城市构建的大数据涵盖全区各行各业,形成的云计算模式在提高档案信息资源个性化服务方面具有很大的优势。在智慧城市云计算模式下,运用云网超强的计算能力和几乎无限的宽带,可以为档案信息资源共享提供一个良好的交互环境,可以整合各类传播手段,实现以客户为中心的服务理念,满足广大档案利用者的个性化需求,从而实现档案信息资源个性化服务。

大数据时代档案管理将朝着知识管理、信息集约化服务的方向发展。新的形势需要我们以创新开放的互联网思维,充分运用新技术,推动建邺区档案事业的跨越式“数字崛起”,力争早日建成全国首批国家级数字档案室。

[1]施永利.大数据时代背景下的档案利用服务探讨[J].商,2012(11):145.

[2]樊伟红,李晨晖等.图书馆需要怎样的“大数据”[J].图书馆杂志,2012(11):66.

[3]张欣.解读大数据下档案管理的价值提升[J].理论观察,2014(5):31-33.

猜你喜欢

建邺区档案室全区
南京建邺区举行执法业务培训班
南京建邺区扎实开展安全生产大检查
第十届“我是小画家”全区中小学生书画大赛获奖作品选登
勘测设计单位数字档案室建设探讨
南京建邺区三举措抓好冬季安全生产工作
内蒙古自治区召开全区统战部长会议
全区统战部长会议召开
南京建邺区全周期运行“五大导则”
数字档案馆建设思考
数字档案馆建设思考