基于非结构化数据管理平台的企业数字档案馆建设研究
2019-11-12蒋术
蒋术
近年来,越来越多的企业开始建设数字档案馆,旨在集中统一管理企业数字信息资源,尤其是2017年国家档案局发布《企业数字档案馆(室)建设指南》后,企业数字档案馆建设可谓如火如荼。经过近两年数字档案馆建设实践,笔者发现通过传统的做接口归档的数字档案馆建设模式存在很多问题,已经不再适合企业数字档案馆建设实际。为有效解决现存问题,本文提出了一种基于非结构化数据管理平台的数字档案馆建设模式。
一、近年来国家相关要求
近年来,中央办公厅、国务院办公厅、国家档案局等单位相继印发了系列电子文件和电子档案管理相关文件。从这些文件中,我们可以归纳出电子文件和电子档案管理发展的新趋势,也能洞悉企业数字档案馆建设的新要求。
1.“单套制”归档更近一步
2018年7月,海关总署、财政部、国家税务总局、国家档案局联合发文决定,企业、单位满足《会计档案管理办法》(财政部、国家档案局令第79号)第八条、第九条所列条件的,可以电子《海关专用缴款书》为依据进行会计处理并仅以电子文件形式归档保存,即实行“单套制”。2018年12月,国家档案局修改《电子公文归档管理暂行办法》,将第七条修改为:“符合国家有关规定要求的电子公文可以仅以电子形式归档。”这是国家最高档案行政管理部门首次明确电子公文可以单套制归档。2019年4月,国务院印发《国务院关于在线政务服务的若干规定》(第716号令),其中第十二条规定“政务服务机构应当对履行职责过程中形成的电子文件进行规范管理,按照档案管理要求及时以电子形式归档并向档案部门移交。除法律、行政法规另有规定外,电子文件不再以纸质形式归档和移交。符合档案管理要求的电子档案与纸质档案具有同等法律效力。”这是国家层面首次明确在政务服务过程中施行单套制。同时,一些企业已走在单套制发展的前列,比如2019年3月,国家档案局印发《企业电子文件归档和电子档案管理试点验收企业名单(第一批)的通知》(档函〔2019〕35号),确定了13 家企业完成所选业务系统的电子文件归档和电子档案管理试点工作,通过国家档案局验收,形成典型经验,可向全国推广。
2.“一切归档”成为要求
2017年9月,国家档案局印发《企业数字档案馆(室)建设指南》(档办发〔2017〕2号),明确企业电子文件归档范围应包括各业务活动中形成的各种结构化和非结构化数据,以独立文档形式存储的具有保存价值的信息记录,包括办公自动化系统、产品或业务系统、财务会计管理信息系统、人力资源管理信息系统、门户网站、微博、微信、公务邮件系统及本企业其他职能活动业务系统中形成的电子文件,以及从外部接收的电子文件。企业已实施的支撑主营业务的信息系统均应具有归档功能。随着企业信息化进程的推进,存储、网络技术的升级,“一切归档”成为可能与发展趋势。
3.商密防护不可或缺
2015年4月,国资委印发《中央企业商业秘密安全保护技术指引》,要求各中央企业对集团层面载有商业秘密的信息系统在1-3年内部署完成有关安全保密措施,并结合本单位实际,利用3-5年时间,在本企业系统内分步部署完成相关安全保密措施。数字档案馆作为企业数字信息资源的聚集地,成为商业秘密防护的关键。
4.安全可控成为趋势
近期,中央办公厅、国务院办公厅联合印发文件,要求大力推进党政机关电子公文系统安全可靠应用,早日实现国产化替代;大力推进安全可靠应用试点,带动国产基础软硬件迭代升级,促进关键核心技术不断进步。不久的将来,电子公文等业务系统将面临一次比较大的升级改造,企业数字档案馆应提前做好相应承接准备工作。
二、企业数字档案馆建设历程
企业数字档案馆是指企业运用现代信息技术固化档案工作业务流程,对本企业或与其具有资产隶属关系企业的电子档案或其他数字资源进行收集、整理、保存,并通过网络提供档案信息服务和共享利用的集成管理系统平台。它是一个由软件、硬件、数据、人和制度规范等组成的人机系统。企业数字档案馆的发展经历了以下5个阶段:
1.启蒙阶段
我国企业档案信息化与企业信息化同步发展,始于20世纪80年代末,成长于20世纪90年代。尤其是办公自动化系统出现后,企业档案人员也逐步了解和接触计算机,出现了单机版档案目录数据库,可进行档案数量统计和制作卷内、案卷目录,这个阶段也称为单机应用阶段。
2.起步与探索阶段
20世纪90年代,为适应档案事业发展需要,企业档案信息化工作开始起步,一些企业率先开发建设单机版档案管理信息系统。但囿于全国档案信息化基础设施薄弱、档案信息化建设理念滞后、档案人员知识结构单一,档案信息化也仅仅停留在计算机辅助管理和探索性研究阶段。1997年,深圳市档案馆提出建设数字档案馆构想,几年后,深圳市档案馆成为全国档案工作示范单位。
3.建设与成长阶段
1995-1999年,全国档案工作进入了更大范围信息化基础设施建设和稳步成长的初级阶段。档案管理系统也由单机版向客户端/服务器(C/S)模式转换,但是这个阶段档案信息化标准、规范比较滞后,企业档案信息系统仍然是目录数据的统一管理和局域网内的共享应用,尚未涉及档案全文收集、保管和利用工作。
4.发展与应用阶段
进入21世纪,企业档案信息化建设进入快车道。2000年,国家档案局将加快信息化建设列为全国档案事业“十五”规划重点任务,深圳市率先开始数字档案馆建设。2003年青岛市数字档案馆正式启用,成为国内首家投入使用的数字档案馆。档案管理系统功能也逐步完善,并进一步发展到浏览器/服务器(B/S)模式。
5.深化集成阶段
随着电子文件数量越来越多,企业数字档案馆向集成化方向发展,档案管理也由传统档案管理转向电子档案管理。国家档案局发布《數字档案馆建设指南》《数字档案室建设指南》《企业数字档案馆(室)建设指南》等指导性文件,数字档案馆建设成为企业档案信息化建设的方向和主要内容。
三、企业数字档案馆建设存在问题
为落实上级单位文件精神,提升企业档案信息化水平,不断总结试点经验。2018年4月,国家档案局确定北京市保障性住房建设投资中心等35家企业为企业数字档案馆(室)建设试点单位。笔者所在单位有幸成为试点单位之一。在近2年的开发建设过程中,笔者发现企业数字档案馆建设存在如下问题:
1.接口归档模式不适合企业信息化建设实际
按照国家档案局《企业数字档案馆(室)建设指南》要求,企业已实施的支撑主营业务的信息系统均应具有归档功能。现阶段,归档模式通常为开发接口。因业务系统各式各样,系统中的各类结构化数据、非结构化数据纷繁复杂,接口开发数量多、难度大、周期长、费用高,通过接口归档的数据后期还需要处理和校验,工作量、难度也很大。笔者所在的单位,有各类信息系统40余个,仅一个办公自动化系统(OA系统)归档接口开发和后期数据迁移处理,用时近八个月。由此估算,笔者认为通过开发接口实现全业务系统电子文件归档已不符合企业信息化工作实际。
2.电子文件归档“四性”检测成为难点
《电子公文归档管理暂行办法》明确要求,电子公文形成单位应在电子公文归档时按照国家有关要求对其真实性、完整性、可用性和安全性进行检查。接口开发的归档模式,本质上是将应归档电子文件从一个信息系统迁移到另一个信息系统,迁移过程中,电子文件的“四性”难以保证或保证的成本很高。
3.商密防护难以落地
企业数字档案馆的建设,不仅需要落实国家档案局的要求,还要落实國家保密局、国家信息部门等要求。按照上级单位关于商密防护的要求,各企业应对存储的包含商业秘密的电子文件或数据进行防护,以实现“保数据、保核心、保安全”的目标,最终达到“进不来、拿不走、打不开、赖不掉”的效果。实施途径往往是各业务系统与商密系统深度集成。这就造成了在业务系统中防护正常的商密数据,进入数字档案馆后打不开,用不了的问题。
4.数据不一致,信息烟囱林立
企业信息化建设的通病是条块分割、缺少统一的规划,各业务部门根据自身具体业务相对独立开发各类信息系统,往往“头痛治头,脚痛医脚”,这就造成一个企业内部信息孤岛遍地、信息烟囱林立,各系统不相互兼容,升级难,基本没有数据共享体制机制,甚至同一个数据在不同的业务系统中不一致。作为相对后端的企业数字档案馆,这些不一致数据都要归档,给后期档案资源开发利用带来挑战。
5.数据存储问题
笔者所在的单位数字档案馆采用大集中部署方式,全系统400多个全宗,电子档案全部统一存储在北京总部。以普发性的公务电子文件为例,总部数字档案馆存一份,50多个二级单位数字档案馆各存一份,300多个基层单位数字档案馆再存一份。即同一份电子档案,在数字档案馆中可能重复存储了近400遍,造成对存储资源的极大浪费。
四、解决方案
为解决企业数字档案馆建设痛点,我们开展了非结构化数据治理与防护研究软科学项目。在调研公司总部23个部门近40个业务信息系统和有关基层单位需求的基础上,课题组提出建设一个贯通公司全业务系统的非结构化数据管理平台(如图1所示),以实现非结构化数据的统一存储、集中管理、深化应用与归档保存,形成了非结构化数据管理平台的架构、技术路线、部署方式、推广方案、商密防护等系列解决方案。
所谓非结构化数据管理平台,即统一管理各类非结构化数据的底层系统。企业所有业务系统产生的非结构化数据都存储在底层平台上,各业务信息系统只有工作流。我们认为只有建立了这样的底层平台,才能从源头上解决企业数字档案馆建设瓶颈,(下转34页)(上接41页)实现数据共享、商密防护和一切归档目标,打造数字档案馆核心竞争力。归档方面,因为所有非结构化数据全生命周期均在平台上产生,因此不需要开发接口,不需要数据迁移,不会数据丢失,一键即可归档;商密文件防护方面,由多源防护到单一防护,防护住平台,即可实现商密防护的目标;存储方面,因为所有数据均存储在一个平台上,能够实现数据的查重、去重,节省存储空间;利用方面,平台本身就是一个企业各类数据的聚集地,基于平台的数字档案馆将更方便用户的检索与利用,也将更好的实现档案利用的远程化及多元化。
五、结语
基于非结构化数据管理平台的企业数字档案馆建设模式在企业数字档案馆建设领域尚属新鲜事物,但它却能从根源上解决一切归档、四性检测、数据共享和商密防护等问题。随着企业信息化进程的加快、信息技术的进步,或许这种模式将成为日后企业数字档案馆建设的主流模式。
注:本文系中国华能集团有限公司软科学研究项目“华能集团非结构化数据治理与防护研究”“华能集团电力科技档案管理模板构建研究”阶段性成果之一。
(作者单位:中国华能集团有限公司 )