电子档案单轨制管理助力抗疫—以国家自然科学基金项目电子档案为例*
2020-07-17陈恬李东张丽萍毕建新
陈恬 李东 张丽萍 毕建新
(1.苏州大学社会学院 苏州 215123;2.国家自然科学基金委员会信息中心 北京100085;3.国家自然科学基金委员会计划局 北京 100085)
0 引言
新冠病毒的主要传播途径是呼吸道飞沫和密切接触,且人群普遍易感[1],这就要求社会尽量避免人员流动,并做好感染者的隔离工作。对此,国家采取了严密的疫情防控措施,各级政府纷纷启动突发公共卫生事件一级响应[2],相关措施的直接结果就是停工停产,社会停摆。面对传染性极强的新冠病毒,“非接触”、“不见面”成为疫情期间各项工作的基本要求。本文以我国国家自然科学基金委员会(以下简称基金委)项目电子档案单轨制管理为例,介绍其信息技术应用、管理理论与方法创新以及制度体系设计,以全流程电子化管理为目标,实施“不见面审批”,从而在客观上助力抗击疫情的相关经验。
1 国内外电子档案单轨制管理探索
早在1998年,美国政府就通过了《政府文书工作消减法案》(Government Paperwork Elimination Act,GPEA),要求联邦机构在2003年以前尽可能运用电子表单、电子文件归档以及电子签名来开展政府业务[3]。2012年,美国行政管理与预算局和国家档案与文件署联合颁布《政府文件管理指令》(Managing Government Records Directive,M-12-18),要求2019年12月31日前,联邦机构所有的永久电子文件要最大限度地以电子形式管理,并以电子形式最终移交到国家档案馆[4]。2019年,行政管理与预算局和国家档案与文件署又联合发布了M-19-21备忘录,要求到2022年,联邦机构要以电子格式管理所有永久电子文件,并提供合适的元数据[5]。澳大利亚也在2011年的《政府数字转型政策》(Digital Transition Policy)中提出政府应由纸质文件管理转 向数字信息管理[6],其《数字连续性2020政策》则要求各部门机构逐渐过渡到完全数字化的工作流程,并实现信息的集成共享[7]。加拿大图书档案馆于2006年开始规划并建设的可信数字仓储(Trusted Digital Repositories,TDR)项目为加拿大数字资产的长期保存提供了重要手段[8]。我国《全国档案事业发展“十三五”规划》与《国家电子文件管理“十三五”规划》均提出要开展电子档案“单套制”、“单轨制”管理试点。相关试点工作也早已开展,如自2014年8月起,上海海关对在自贸试验区进口属于自动进口许可管理的有关货物开展通关无纸化应用试点,并将试点范围逐步扩大至全部通关业务现场[9],到2015年8月,试点海关由上海自贸区扩展至天津、上海、南京、宁波、福州、厦门、广州、深圳、拱北、黄埔海关等10个海关。2015年4月,上海市档案局结合上海自贸试验区实践,在自贸区开始探索电子档案“单套制”管理,研发电子文件在线归档和电子档案管理的原型系统,制定相关配套制度,落实数字签名、电子签章等技术,并于2016年正式在整个上海自贸试验区范围内推广实施电子文件归档和电子档案“单套制”管理[10]。2018年8月,南京市公共资源交易中心开始实行所有施工类进场交易项目远程“不见面”开标方式,实现了“线下不见面,线上面对面”,电子文件网上流转,流程与数据可溯可查[11]。在科技项目申请方面,从2014年开始,浙江省自然科学基金委员会开始尝试基金申请无纸化运作。2020年度四川省科技计划项目申报中,也已实现无纸化申请[12]。
2 国家自然科学基金项目电子档案单轨制管理实践
2.1 理论与技术创新
2.1.1 档案鉴定理论创新
相较于传统的档案鉴定工作,单轨制背景下的电子档案鉴定思想应在部分领域有所突破。随着档案信息服务的移动端化、档案信息传输实时化,以及档案信息服务的个性化和多元化,若依然选择将大量档案划分为定期保管,仅仅对永久保存的档案进行数据挖掘与分析,极易错失隐藏于海量档案信息间的关联关系,同时也极易导致重要“科学记忆”的丢失。这对于科研类电子档案而言显得尤为重要。例如,基金委曾经资助过我国自然科学领域第一位诺贝尔奖获得者屠呦呦一项主任基金项目,但是按照以往的鉴定标准,该项目类型保管期限被鉴定为定期,因此该项目档案保管到期后便被销毁。造成今天我们无法追溯屠呦呦当年的详细科学思想。因此,自2020年起,国家自然科学基金委将项目档案归档范围内所有类型项目保管期限全部确定为“永久”,不再设置“定期”保存项目电子档案。
2.1.2 新兴信息技术应用
2008年9月,“大数据”的概念由美国《自然》杂志第一次正式提出[13],具有数据体量大、数据类型多、价值密度低、处理速度快等四个特点。海量原始数据经过存储、清洗、挖掘、分析等多个环节,最终产生价值。传统数据库的IT架构和数据处理方式无法有效地应对大数据环境。而云计算出现后,数据存储服务衍生出了新的模式。云计算可以提供容纳大数据流的空间,以及大数据分析所需的分布式并行计算能力。同时,人工智能程序作为SaaS平台进入云计算,使得领域内长期积累的数据能够得到充分的理解和有效的处理。云计算、大数据和人工智能等新兴信息技术的出现,为电子档案单轨制管理提供了强有力的技术支撑。目前已经体现出两个明显的趋势。第一,电子档案加速向云端迁移。电子档案迁移至云端有利于提高档案信息服务的效率,可以为公众提供优质的用户体验,继而推动档案资源社会共享目标的实现。例如,英国国家档案馆为了能够更好地管理英国政府网页档案,将数据量120TB的网页档案全部迁移到云端,并通过基于云的检索功能设计提供查询利用服务,大大提高了其运营管理效率,同时也减轻了工作负担[14]。国内也有相关成功经验,2018年底厦门市档案馆际共享服务平台建设项目正式通过验收,该平台构建于厦门市政务云中,实现了其开放档案数字资源的网络共享[15]。基金委也已将大量项目电子文件迁移至云端。第二,运用大数据与人工智能技术加快电子档案资源与服务体系建设。基金委积累了丰富的数据资源,包括170多万项目申请人,4000多家依托单位,1200多万参与人,34万个项目,185余万份申请书,510余万份同行评审信息等。基金委自2016年起开始开发国家自然科学基金大数据知识管理服务平台,2018年上线试运行,2019年正式投入运行。借助科学基金大数据知识管理服务平台,充分利用已有科学基金项目电子档案,基于开放协议汇聚多源数据,采用图数据模型实现多元数据融合管理,基于数据立方体对数据进行多维分析,基于网络关系对数据进行分析挖掘,最终形成集数据存储、管理、分析、共享于一体的基于云存储的大数据平台,其总体架构如图1。
图1 科学基金大数据知识管理服务平台
2.2 科学基金项目电子档案元数据方案构建
元数据是描述文件的背景、内容、结构及其管理过程的数据,是保障电子档案“四性”的重要手段。但是,目前我国档案行业标准中只有文书类、照片类、视频音频类电子档案元数据方案,缺少科技类电子档案元数据方案。为了确保科学基金项目电子档案的“四性”,就必须建立一套具有高度适应性的元数据方案,以系统有效地记录其内容和形式特征、申请评审及资助的过程信息以及管理全过程所蕴含的相关背景信息。笔者参照《信息与文献 文件管理》(ISO 15489)、《信息与文献 文件管理过程 文件元数据第1部分:原则》(GB/T 26163.1—2010)、《档案著录规则》(DA/T 18—1999)、《文书类电子文件元数据方案》(DA/T 46—2009)、国际档案理事会标准《国际标准档案著录规则(总则)》,结合国家自然科学基金管理实际,制定了基金委项目电子档案元数据方案。科学基金项目电子档案元数据概念模型如图2。
2.3 完善科学基金项目档案管理制度体系
2.3.1 重新制定科学基金项目档案归档范围及保管期限
参照《科学技术档案案卷构成的一般要求》(GB/T 11822—2008)、《国家重大建设项目文件归档要求与档案整理规范》(DA/T 28—2002)等标准,并根据基金委项目指南所列项目类型,本项目制定了新版《国家自然科学基金项目档案归档范围》。基金委在进行相关存储备份技术升级后,在技术层面完全可以承担起项目电子档案全流程单轨制管理,故所有类型项目电子档案保管期限在正式实施单轨制管理后均确定为“永久”。
2.3.2 制定科学基金项目电子档案管理规范及长期保存规范
参照《电子文件归档与电子档案管理规范》(GB/T 18894—2016),根据基金委的工作实际,从总体原则、各部门工作职责、科学基金业务系统、科学基金项目电子档案管理系统、科学基金项目电子档案存储备份及元数据维护、处置、移交与销毁等方面制定了详细的科学基金项目电子档案管理规范及长期保存规范。
图2 科学基金项目电子档案管理主要实体及其相互关系
2.3.3 制定基金委项目档案管理办法
基金委曾经颁布过三项与项目档案有关的档案管理办法,分别是1987颁布的《国家自然科学基金委员会科学技术档案管理暂行办法》、1992年颁布的《国家自然科学基金委员会资助项目档案管理暂行办法》和2014年颁布的《国家自然科学基金委员会档案管理办法》,但是前两项已经废止,2014年颁布的《国家自然科学基金委员会档案管理办法》在基金委档案工作职责划分上不尽合理,并且对项目档案管理缺乏指导意义。本项目在上述三项老办法的基础上,制定了新版《国家自然科学基金委员会资助项目档案管理办法》作为基金委现有档案管理办法的重要补充。
3 后续优化策略
近年来,基金委的电子档案单轨制管理工作一直处于试点阶段,如自2018年起,首先选取两类项目实施无纸化申请,2019年扩大了无纸化申请的范围。原本计划2020年度进一步扩大试点范围,待部分关键支撑性工作完成后再全面实施无纸化申请和项目电子档案单轨制管理。但是,由于突如其来的新冠疫情的影响,基金委决定自2020年度起便全面实施无纸化申请,相关关键支撑性配套措施在全面无纸化申请进程中同步开展。具体措施如下:
3.1 电子签名、电子印章及电子证照
数字签名、电子印章及电子证照是电子档案单轨制管理相关信息系统必备的功能模块。根据《机关档案管理规定》第三十六条规定,“归档文件材料应当为原件。电子文件需要转换为纸质文件归档的,若电子文件已经具备电子签名、电子印章,且电子印章按照规定转换为印章图形的,纸质文件不需再行实体签名、实体盖章”。《国务院关于在线政务服务的若干规定》(国令第716号)也规定,“政务服务中使用的符合《中华人民共和国电子签名法》规定条件的可靠的电子签名,与手写签名或者盖章具有同等法律效力”,“电子印章与实物印章具有同等法律效力,加盖电子印章的电子材料合法有效”,在全面无纸化申请工作中,基金委尚未完成业务系统中电子签名、电子印章、电子证照等相关功能的开发和系统升级工作,并且该问题还涉及到相关技术选型、基金委对依托单位的管理办法的修订。因此,后续的工作中应当做到:做好依托单位调研,摸清目前基金委所有依托单位电子印章、电子证照应用情况;做好科研人员调研,摸清科研人员对电子签名的接受程度。在此基础上,做好电子签名技术选型,对《国家自然科学基金依托单位注册管理实施细则》予以修订,将电子印章和电子证照作为依托单位注册时的必要条件。同时,尽快完成基金委业务系统中第三方签章管理系统及CA认证服务功能的开发。
3.2 开发基金委数字档案室,实现从业务系统到数字档案馆的互联互通[16]
基金委的核心业务系统——科学基金信息系统涵盖了各类项目电子文件从提交申请书、生成网络评审意见到提交实施过程计划书、年度进展报告、结题报告等各个环节,实现了前端核心业务的全流程电子化运转。但在电子档案管理阶段,尚未建成数字档案室,缺少这一沟通前端业务系统与数字档案馆的“桥梁”,故而无法实现真正意义上科学基金项目电子档案全流程单轨制管理。因此,后续的工作中应当尽快按照《数字档案室建设指南》,从基础设施、应用系统、资源建设及保障体系几方面建设高水平的国家自然科学基金委员会数字档案室,实现科学基金信息系统到数字档案室再到中央档案馆的互联互通。科学基金项目电子档案管理流程如图3。
图3 科学基金项目电子档案管理流程图
3.3 项目电子档案的长期可靠保管
根据《电子文件归档与电子档案管理规范》(GB/T 18894—2016)的要求,“应结合单位电子档案管理和信息化建设实际,在确保电子档案的真实、完整、可用和安全基础上,统筹制定电子档案备份方案和策略,实施电子档案及其元数据电子档案管理系统及其配置数据,日志数据等备份管理”。基金委项目电子档案向中央档案馆移交前,需要基金委数字档案室暂存。在此期间,可采用私有云并辅之以第三方数据保全的方式加以保管。其中,以私有云的方式实现项目电子档案在基金委内部保存,第三方数据保全方式则可以参考苏州大学近年来实施产学研一体化的最新成果——档案数据保全。该保全方法采用“三角动态模型比对”方案,对海量数据进行“实时监测、实时预警、实时保全、实时修复”,可以解决电子档案数据在保管过程中出现的数据状态无法获知、丢失数据无法恢复、数据篡改无法溯源等问题。同时,针对传统档案数据备份保管模式所带来的法律证据价值的丧失风险,设计了高安全性的数据管控和验证机制,可满足档案数据在利用过程中的双向数据原始性验真,确保数字档案的证据价值。
4 结语
新冠疫情给经济社会的正常运转带来了极大的麻烦,但是由于基金委早在2017年就已经开展了“互联网+政务服务”、无纸化申请和电子档案单轨制管理的相关委托研究工作,使其早已形成一套应急预案。新冠疫情发生后,基金委果断决定在2020年自然科学基金集中申请期,全面实施无纸化申请。根据基金委的统计,这一决定使得近三千家依托单位基金管理人员在疫情期间无需直接前往基金委报送纸质申请书,避免了近4000人的大规模聚集,在客观上对于抗击新冠疫情发挥了积极作用。