数据态电子档案可信管理研究
2019-01-10王子鹏江苏开放大学
王子鹏 潘 虹/江苏开放大学
近年来,以信息化为基础的科技创新正在深刻影响各个行业的发展,档案工作的对象和环境已经从“纸与铁”的传统时代迈向“数与网”的互联网时代[1]。随着文件形成领域技术环境的巨大变化,档案工作的管理对象亦随之改变。在纸媒时代,档案具有载体和信息统一的特质,“白纸黑字”是这一特点的形象诠释,档案管理的重心在于档案实体的有序化管理。数字时代,载体和信息可分离的电子文件成为档案工作的管理对象。经过多年的研究、探索与实践,电子文件管理已经进入“答案多于问题的阶段,在战略、法律规范、管理体系、技术工具等方面都有了长足的发展和进步”[2],如浙江省“一键归档、单套保存、一站查询”的行政审批电子文件归档管理模式即是典型例证。目前,人类正在进入大数据时代,越来越多的信息以低维度的数据形态存在,档案工作的管理对象出现了数据态电子档案。所谓数据态,是指以数据颗粒存在并持续运转形成的状态,处于数据态的各系统其运转、接收、输入、中间办理等都是以数据交互方式进行,数据态管理空间的主要管理对象为数据、规则、模型和本体等类型[3]。
2017年8月,加州大学尔湾分校(University of California, Irvine)取消了500多名中国留学生的入学资格(占录取中国学生总数的45%),其中有290名学生因为成绩证明有问题[4]。学生成绩等学籍信息以数据态存储于教务系统中,数据容易被篡改,使成绩伪造、学籍造假成为可能。近年来,中国留学生因上述原因被取消入学资格的事件时有耳闻,且这类事件的数量持续攀升,足见加强数据态电子档案可信管理的迫切性。笔者以高等院校档案管理为案例,分析数据态电子档案管理存在的问题,以及加强可信管理的思路与方法。
1 数据态电子档案管理存在的问题
第一,业务系统未按归档要求设计构建。目前高等院校使用的业务系统,横向上主要是为了推进智慧校园建设而研发或采购的信息系统,纵向上则为上级部门配发、用于数据统计与上报的业务系统。在业务系统建设过程中,除非高校档案部门强势介入,一般来说业务部门没有意识、更没有动力解决数据归档问题。除了办公自动化(OA)和档案管理系统外,档案部门很少参与其他业务系统的研发和管理工作。对于数据态电子档案的管理问题,高校档案部门要么尚未予以关注,要么对这个问题感到困惑。
第二,传统归档方法不适用。笔者结合工作实践,并通过访谈、调研等方式了解其他高校数据归档情况,尚未发现有效的数据归档模式。在实践中,如果档案收集范围表涵盖的归档内容业务系统已经实现无纸化处理,高校档案部门通常要求业务部门打印相关页面、加盖印章后归档,这种借助传统纸质档案归档思路、试图通过加盖印章确保文件法律效力的做法,凸显了数据态电子档案管理的困境。其一,数据态电子档案以数据库格式存储,离开业务系统无法读取,无法按照传统版式电子文件管理模式归档。其二,上述归档模式可作为权宜之计,但经不住推敲:在纸质档案形成前,信息通过数据库临时抽取的方式呈现在屏幕上,缺乏真实性、完整性保障;形成纸质档案后,未经起草、流转、审批等流程直接加盖印章,有违传统的档案工作理念和方法。其三,业务系统数据有随时改动的可能性,一旦发生与归档纸质档案内容不一致的情况,以哪一方为准将成为难题。
第三,缺乏凭证性保障。由于未按档案管理要求设计构建,各业务系统数据没有进行全生命周期管理,亦未能在关键节点形成版式文件,从而缺乏凭证性保障。以教务系统为例,其设计目标里就没有考虑数据归档问题;系统里不保存相关人员在关键业务环节中的真实签名,仅仅通过系统本身难以判断和证明学生成绩、论文查重、导师审核等关键信息的真实性和有效性。在实际工作中,数据态电子档案打印后加盖印章,被当作具有凭证价值的文件使用,为其凭证性“背书”的仅仅为业务机构的权威性。权威的背后,行政上缺乏传统业务流程审批程序,技术上缺乏数字签名、时间戳等保障手段,客观上存在安全隐患。
2 数字态电子档案可信管理的思路与方法
一是区分档案的凭证与参考价值。档案的价值主要在于凭证与参考。高等院校凭证价值突出的数据态电子档案,主要是教务系统、学籍系统、学分银行、师资系统、学工系统等产生的与教师和学生密切相关的数据;而参考价值突出的主要是各类登记统计系统,如“人才培养工作状态数据采集与管理系统”“高等教育基层统计报表系统”“高校社科和科技统计年报系统”等产生的数据。由于人力、物力、财力的限制,高校档案部门应该区分数据态电子档案的凭证和参考价值,因为前者注重可信管理、后者注重收集存储。
二是重塑归档流程。文件连续体理论是文件生命周期理论在电子文件时代的补充和发展,其主要内容是构建多维坐标体系,用“文件保管形式轴、价值表现轴、业务活动轴和形成者轴”4个坐标轴描述电子文件的运动过程[5]。高校各业务系统管理的数据会经历创建、形成、办理、确认、交换和输出等关键环节,可借鉴文件连续体理论,从文件连续体理论的四个维度出发,研究数据态电子档案的保管形式的变化、关键业务节点凭证性保障手段、业务逻辑、参与人员及时间等要素,制定各业务系统数据归档流程,将档案管理系统与各业务系统对接,降低人工干预的风险,实现数据态电子档案的自动归档。
三是利用技术保障手段。安全可靠的业务系统,是数据态电子档案凭证性保障的生态环境。从电子文件管理的经验出发,需要确保将各业务系统数据在关键节点自动生成版式文件。同时高校档案部门需要关注信息安全技术的发展,将CA认证、数字签名、时间戳等先进的技术手段集成到各业务系统中,确保数据的非篡改性,实现数据态电子档案的可信管理。目前,最契合的技术手段为区块链,国际档案界已开展相关实践探索。如奥地利理工学院开展了“区块链与奥地利数据市场”项目,旨在通过区块链技术确保奥地利数据市场数据的真实性和完整性,推动奥地利数据市场项目可持续发展[6];再如美国旧金山的霍伯顿软件工程学院已采用区块链记录学生的学业完成情况,逐步替代传统的学籍档案管理模式[7]。
四是构建在线服务的工作模式。可构建在线服务的工作模式,尤其对于凭证价值需求量大、利用率高的数据态电子档案,应该重点加强检索服务平台建设,一方面满足利用需求,另一方面倒逼高校数据态电子档案管理体系建设。以学籍类档案为例,其因凭证性价值突出而成为高校利用率最高的档案资源,据有关学者不完全统计,学籍档案的利用人次占87%以上[8]。中国高等教育学生信息网(学信网)[9]开通后,提供权威的学籍、学历信息查询、验证及认证服务,成为提供数据态电子档案在线服务利用的典型例证。当然,因为学信网尚未涵盖必修选修课程、课业成绩、论文情况等信息,在提高服务利用效能方面仍有很大的提升空间,建议由教育部牵头、由各高等院校协同参与,规划和设计电子学籍全面管理系统,推行电子学籍证书认证制度,建立学业证书的可信服务体系[10]。除了学籍类数据,凡具有凭证价值的数据态电子档案均可参考学信网模式,面向全社会提供更科学、更有效的在线检索服务利用。
综上,笔者认为来源原则适用于数据态电子档案可信管理。无论数据来源多杂多乱,其生成主体必然可以划归至某一组织机构或多个部门的牵头机构。高校档案部门要深入考察各业务部门数据管理现状,参照档案分类方案制定数据态电子档案的收集范围和保管期限,做到与纸质文件、其他类型电子文件同步归档。还要考虑到数据态电子档案以数据库格式存储、离开软件无法读取的特性,为此要把数据库文件、系统软件安装包同步归档并制作电子备考表,记录系统的运行环境及需要关注的问题。同时,数据库本质上是表格的集合,可以利用技术手段将数据库格式文件提取成一组表格文件(如后缀为“.xlsx”的Excel文件),进而转换成版式文件,再将表格文件与版式文件同步归档,前者有利于检索、后者有利于凭证。对于重要的档案,亦可考虑打印成纸质载体同步归档。