APP下载

数据治理与实践图景:新时代高校档案工作的历时性演变

2023-09-22杜勇

兰台内外 2023年24期
关键词:数据治理数据管理档案

摘 要:信息技术的发展推动了档案工作模式的转变。档案数据信息呈爆发式增长,传统的档案数据信息管理模式已经不能适应当前档案管理需求。本文引用数据治理理念,从高校档案数据信息管理的困境出发,提出构建以档案馆为主导的档案数据治理制度框架,协同多主体分权限数据管理的机制,以智能提取、在线编研、知识资源共享、智慧利用档案数据平台的档案数据整合资源库等策略,最大效度发挥档案数据资源的价值。

关键词:档案;数据治理;数据管理;档案数据资源

基金项目:2023年安徽省高等学校档案工作协会基金研究一般项目(2023YB007)

伴随信息技术的发展与广泛应用,档案工作的模式正在经历一个从接收保管纸质档案到接收保管电子档案,从管理档案实体信息到管理档案数据信息的转变期。档案数据信息呈现爆发式增长、海量式集聚,信息量的剧增给档案工作带来了挑战。在浩如烟海的数据信息中,如何高效高质量地提取、利用数据信息,成为当前档案工作急需解决的一大难题。在信息社会,数据的核心地位和价值将日益凸显,应转变当前档案数据管理模式,从档案数据的提取走向数据的治理。

1 档案数据治理的概念

2017年,国家发布《信息技术大数据术语》(GB/T35295-2017),将数据治理定义为对数据进行处置、格式化和规范化的过程。同年,我国的数据治理模型也应运而生——《信息技术服务治理》(GB/T34960)。该治理模型从顶层设计、数据治理环境、数据治理域、数据治理过程四部分进行了阐述,为组织在实现数据价值的过程中做到运营合规和风险可控提供了方法和思路[1]。档案数据治理是指档案部门、社会组织和公众等多元主体合作,对档案数据生成、采集、加工、存储、利用等整个生命周期进行的全程管理。档案数据治理的出现并非偶然,而是在信息技术发展、数据价值凸显和档案治理理念普及等背景下发展而来[2]。高校档案数据治理是高校档案部门、信息中心和其他部门等基于一定的规则,共同对档案数据的全生命历程(生成、管理、储存、利用)整个周期进行科学、规范的全程管理,促进高校档案事业的发展。

档案数据治理主要是对不同生命周期的档案数据进行质量管控、组织管理、开发利用等活动,需要从技术、制度等方面构建相应的保障体系,以提高档案数据治理能力和水平。档案治理内容更加廣泛,涉及与档案相关的一切事物[3]。档案数据治理能力的提升,有利于更好地开发档案数据资源,减少各部门不必要重复性的所耗费的人力、物力和财力,提高档案利用的效率,符合时代对档案事业发展的需求,也契合国家治理现代化的整体要求。

2 高校档案数据提取的局限

2.1 以“人工方式”分类为主的数据整理

当前高校档案部门对档案数据的提取是建立在传统档案工作模式上,先对纸质档案进行人工分类、整理,再进行数字化加工和利用。这种以人工分类组织数据的方式,效率低下,忽略了数据内容之间的关联性。现有高校使用的档案管理软件,一般只对档案数据信息只能进行简单的罗列与基础的统计分析,数据库的设计依赖于档案人员的经验,具有一定的不确定性和不科学性。这种传统的数据管理无法满足智能、智慧化档案管理的要求,在一定程度上还会阻碍对海量数字化档案数据进行快速、准确的分类、查找,也不能对档案信息资源进行充分有效利用,进而产生了一些低价值档案、死档案的情况,这些问题是高校档案管理领域所面临的一项重大挑战。

2.2 以“单一“部门为主的数据管理

大数据时代,高校档案数据来源主要是学校科研、电子政务、教务、人事、学生管理等各类系统产生的信息资源。各部门按照归档范围,将归档的文件材料主要以纸质和电子两种载体移交给档案部门。档案部门对这些“办理完毕”的数据进行管理。这种管理是“单一”性管理,在单一职能部门管理下的数据与档案管理软件、电子文件中心的匹配性不高,在一定程度上造成信息数据的丢失或者资源的浪费。传统的“单一”部门为主的数据管理模式,还容易造成数据孤岛,不利于档案信息的提供利用。

2.3 重量不重质的数据信息的重复提取

近些年来,信息化、网络化办公的普及,使得各种应用系统应运而生。以高校为例,各类应用系统高达20个,档案数据来自于不同的管理系统,每个系统数据基础标准、安全技术标准、运行平台标准等是不一致的,获取的归档数据准确性和完整性不高,数据的关联性也不强。为了确保电子数据信息的完整性,数据中也包括大量非结构及半结构数据,其中有大量重复性数据和垃圾数据,占据太多数据存储空间,导致档案存储空间不足,系统运行速度慢,从而影响数据资源整体的质量性、整体性、可用性和安全性。这与2009年发布的《电子文件管理暂行办法》(中办、国办厅字〔2009〕39号)所强调的对档案数据的“真实性、完整性、可用性和安全性”要求不符,导致档案数据利用速度缓慢,利用率不高,影响档案工作效率。

2.4 低配置的档案系统不能承载高效的档案利用

对比国家档案局2006年发布的8号令《机关文件材料归档范围和文书档案保管期限规定》和2011年发布的9号令《各级各类档案馆收集档案范围的规定》,不难发现,国家越来越重视档案资源体系的扩充,要求各级各类档案部门做到应收尽收,档案部门库存量不断攀升,尤其是电子文件和音视频文件。以安徽师范大学档案馆为例,校档案馆每年呈递增趋势,与2020年相比,2021年归档量增加了1万卷件。校档案部门一般都处于“边缘”位置,在资金投入上,与其他部门相比,不会作为优先支持的部门。很多高校档案管理系统只能提供简单的目录检索和全文检索,不能提供高配置的档案编研和个性化的网上档案查询、展览。尤其是面对不断攀升的档案数据,低配置的档案系统无法满足高效精准的档案利用,导致很多档案数据成为“死数据”,甚至在一定程度上延缓、阻碍档案利用、编研等工作,反而在一定程度上增添了档案工作人员的工作负担。

3 档案数据治理效力的提升策略

3.1 构建以档案馆为主导的档案数据治理制度框架

2014年,中共中央办公厅、国务院办公厅印发《关于加强和改进新形势下档案工作的意见》,明确提出“要科学整合档案信息资源。建立以档案行政管理部门为主导、各行业主管部门密切配合、档案馆(室)集中统一管理的档案资源管理架构”。在大数据时代,要求数据全量储存与档案鉴定的有用性储存之间的冲突如何破、非数据化的格式文件如何实现档案数据治理、电子文件的法律效应等问题,都是需要行业制度和技术规范来解决。档案数据治理工作需加强前期规划,做好顶层设计、分步实施的规划。其中制度是数据治理工作的基础,科学、规范、合理的制度建设有利于保证数据治理工作顺利推进。

档案数据治理工作是一个以制度为基础的框架,它包含数据的决策权和职责的分配,还包含档案数据要素特点。其他数据应用系统在设计之初,需要考虑档案本身要素特点,不同领域的应用系统,其要素特点有所不同。就高校而言,包含十几个类别的档案分类,如文书类则需要文号、时间、单位、正文等要素,科技类则需要项目名称、类别、主持人等要素,声像类则需要时间、地点、人物、事由、背景、拍摄者六要素。如何将数据库中的数据自动提取到档案数据库,进行高效治理,这就需要档案部门根据国家、地方和高校档案特点,考虑数据与数据之间的关联性、连续性,融合数据对象、技术、理念、环境等要素,编制数据管理的规则、技术要求和相关制度,让数据进入到制度的规范中,形成一条科学有序的治理程序。

3.2 构建以档案馆为主,协同多主体分权限数据管理的机制

档案数据治理包括数据的产生与采集、分類与整理、归类与传输、开发与利用、数据的清理等五个程序。在单纯的档案数据治理过程中,数据治理主体至少需具备这五个程序相应的能力[4]。数据治理是高层次的管理,需要多部门来管理。高校应该设立档案数据治理小组,以档案馆为主,协同学校其他部门为辅,信息中心做好数据内部技术把控的,分工明确的组织体系。

高校信息中心需要把控各应用系统在基础数据标准、安全技术标准、运行平台标准、安全管理标准等方面的部署和要求,保持一致性,有利于档案部门的采集。各应用系统的主管部门需要考虑档案数据要求,完善信息的完整性,有利于档案应用系统进行直接提取。档案部门需要分配好各应用系统的权限,档案系统对各应用系统中的数据进行层层筛选、提取、储存,在档案利用环节以区块链技术对各部门进行访问权限分配、数据开放管理等,方便校内各部门利用,提高办公效率。

3.3 构建以智能提取的在线电子档案数据编研体系

众所周知,高校档案部门目前依据的是国家教育委员会1994年实施的《高等教育档案实体分类法》《高等学校档案工作规范》,保证了馆藏档案的完整性、档案内容的系统性和档案分类的统一性,促进了高校档案事业的发展。伴随信息化时代办公方式和载体的巨大变化,产生的愈来愈多的电子文件、媒体信息等,原生数据、衍生数据大量存在,如何将《电子文件归档与管理规范(修订)》与《高等教育档案实体分类法》有效结合,不在数据库中多次重复出现,是值得我们探讨的问题。馆藏档案和电子文件的剧增,虽然丰富了档案编研的基础数据,但档案数据的不联系、不完整,重复等情况,又给档案编研带来挑战,仅靠传统的人工方式去搜索、归类,从浩如烟海的大数据中寻找所需的信息将耗费更多的时间和精力,大大降低档案编研的进度。

对档案数据进行治理,可以有效提升档案编研的能力。以基础数据为基础,通过全文搜索、人脸搜索、以图搜图等,提取所需档案关键信息,对搜索的档案信息进行在线分类,自动生成参考素材,在线电子编研档案数据,大幅度提升档案编研进度。同时可以满足共性档案与个性档案的需求,在基础档案基础上,增加个性化、专题化档案数据库,创建名师档案、口述校史、红色档案、主体图片档案等,既丰富档案的资源,又拓宽档案利用的途径和平台,真正为学校做到决策参考、凭证依据、育人平台等方面的服务功能,实现档案数据治理的最终目标。

3.4 构建以知识资源共享的档案数据整合资源库

档案数据治理的终结目标就是实现档案资源的共享利用和档案数据的增值。高校档案部门保管的大量科研、教学、社会服务等方面档案数据,如果不能合理重组和融合,就会变成只进不出的“数据垃圾填埋场”。

档案是赋能知识社会的底层数据,档案是治理知识社会的智能工具,档案本身也可以作为治理工具[5]。把握档案数据的保密与开放,加快档案数字化进程,利用人工智能技术,将各类具有开放权限的档案资源按需整合,适时对广大师生提供开放利用,这样不仅使档案资源流动起来。让广大师生利用开放的档案资源进行研究和挖掘,会衍生出更多的档案编研作品和文化产品,提升高校校园文化建设,丰富高校文化资源。

3.5 构建以便捷服务为主的智慧利用档案数据平台

近些年来,人们的档案利用意识不断提升,档案利用需求越来越多,高校档案大多为师生、校友提供学历学位成绩翻译、毕业生成绩打印、学籍档案补办、人事档案查阅利用、研究生论文查询、各类文件及财务凭证查询等服务。档案利用率居高不下,安徽师范大学档案馆基本每周接待查档量高达110人次,查档量居高不下,高校档案部门人员一直紧缺,档案利用工作占据了档案工作人员的大部分精力。疫情环境中,档案数据的智慧利用越来越迫切,很多档案部门都提供远程档案利用服务平台,避免用档人员无法现场办理业务,这种远程利用也是处于比较低端的利用,有时还需要邮政快递作为辅助,从而延迟了档案利用的时效,增加了档案利用的成本。

国家档案局原局长杨冬权针对档案数据化的问题这样回答:“档案数据化就意味着我想利用档案了,不要求我自己去查询,而是资料能够自动推送过来。”通过数据治理技术建立智慧利用档案数据平台,查档者可以通过虹膜识别技术对人脸进行识别,在线核对查档者身份信息,填写档案利用需求的关键信息,系统自动根据输入的关键信息在档案数据利用系统自动检索,档案工作人员根据检索信息,锁定最终信息,以PDF格式,盖上档案部门档案利用专用电子签章,在线发给档案利用者;同时高校应考虑档案载体、档案个性化内容和用户个性化需求的变化等因素,对档案数据挖掘、统计、汇总、关联,以适应档案编研、数据分析等其他个性化需求的用户,让档案数据流动起来,充分发挥它的利用价值,提升档案服务的质量。

参考文献

[1][2]姚恒.大数据环境下的高校档案数据治理路径研究[J].办公室业务,2010(10):124.

[3]赵跃,孙寒晗.“数据”范式演进中的档案数据治理多维解析[J].档案管理,2021(5):108.

[4]王树娴.高校档案数据治理能力提升路径探究[J].兰台内外,2021(1):74.

[5]谭必勇,邵亚伟,李跃.谭必勇老师谈档案数据治理与电子证据——2020年“国际档案周学者谈”第五期.中国档案研究,2021(6):10.

[6]张玉昭.新冠疫情防控背景下档案数据治理效能提升策略研究[J].山东档案,2021(3).

作者简介:杜勇(1981— ),研究生学历,安徽师范大学档案馆副研究馆员,研究方向为档案管理。

猜你喜欢

数据治理数据管理档案
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
海洋环境数据管理优化与实践
CTCS-2级报文数据管理需求分析和实现
基于本体的企业运营数据治理
云端数据治理初探
档案的开发利用在供电公司全面管理中的作用
浅谈北京卫视《档案》的叙述方式
新常态下高校档案工作发展研究
大数据治理模型与治理成熟度评估研究