APP下载

大数据时代数字档案馆建设的实践与思考

2024-01-06孙焕英

兰台内外 2023年36期
关键词:数字档案馆实践探索大数据

摘 要:建设数字档案馆是推动档案资源高效管理与利用的重要契机。目前,各地正在积极打造富有特色的数字档案馆,本文分析建设过程中面临的新形势,通过案例解析阐释了数字档案馆建设的不足,并提出了改进的意见建议,以期为创建工作提供参考。

关键词:大数据;数字档案馆;实践探索

近年来,数字档案馆建设的环境发生显著变化。深入分析新形势下数字档案馆建设的新特征,能够总结数字档案馆建设中的成绩和不足,并提出有针对性的建议,为数字档案馆的系统架构和整体设计提供有益帮助。

1 大数据时代数字档案馆建设面临的新形势

1.1 数字档案馆建设战略化

从国家层面来看,中办、国办印发的《“十四五”全国档案事业发展规划》明确指出:加强大数据、人工智能等新一代信息技术在数字档案馆(室)建设中的应用,推动数字档案馆(室)建设优化升级。数字档案馆(室)的升级势在必行。数字档案馆建设也是数字中国建设的题中之义,按照《数字中国建设整体布局规划》建设要求,数字档案馆建设要与国家战略保持同频共振,搭乘数字中国建设的发展快车,推进全国档案信息化建设快速发展。

从地方层面来看,各地相继出台了推动数字档案馆建设的规划或方案。《“十四五”山东省档案事业发展规划》明确指出,“十四五”末新增12家高水平数字档案馆,鼓励有条件地档案馆向智慧档案馆发展。从这规划来看,数字档案馆主要是要实现以数字资源为基础、安全管理为保障、远程利用为目标的现代化档案管理体系。

1.2 档案资源管理数字化

虽然我国数字档案馆建设已实现了从纸质到电子的跨越,但是依然无法全面满足人民群众个性化的利用需求。青岛档案馆的杨来青就认为要针对档案内容的细粒度管理与开发,实现信息化建设的2.0时代。具体而言,档案数字化管理的核心是档案內容的数据化,其显著特征是档案层级的深化和扩展,从传统的以“卷”为单元的目录管理向档案内容细化转变,将档案语义内容深化为数据,使海量的数据实现跨文件、跨全宗关联,为用户提供更优质的服务和实现深度的档案价值开发利用。

1.3 档案服务方式多样化

大数据赋能数字化档案馆向智慧档案馆迈进,实现了档案服务的知识化、多元化[1]。一是个性化自助。通过数据技术手段,用户可在馆内的自助查阅终端进行档案资料的查阅操作,同时在档案云端可一站式查询检索档案信息。数据化管理也借助语义、本体、知识图谱等技术对档案内容进行语义拆分、清洗、合并、可视化处理,最终呈现出丰富全面的档案知识成果。二是知识共享性。通过大数据分析技术对档案信息进行挖掘和整合,获取更深层次的价值,进而转换为知识提供给用户,通过档案服务平台实时共享,用户可轻松获取精准、科学的档案信息。三是服务精准化。大数据技术能够实现对用户的“精准画像”、靶向推送,以用户的档案利用“小数据库”形成档案海量资源利用的基础,提高信息推送的个性化和满意度。

2 大数据时代数字档案馆建设的实践探索

2.1 基础层建设

一是明确目标规范。将数字档案馆建设纳入全市信息化建设发展长远规划,将其作为“数字中国”落实的重要攻关项目,纳入政府“重点民生实事”之一,以高点定位推动档案信息化建设。坚持标准化引领,细化《数字档案馆建设指南》《数字档案馆系统测试办法》,将建设标准和规范落实到建设全过程。二是强化应用平台建设。构筑安全稳定的数字化运行平台,包括信息存储设备包括主机等硬件设备和操作系统,合理组建局域网、政务内网和外网,同时实行三网隔离,采购的硬软件设备符合创建要求。

2.2 数据层打造

数据层包括各类数据总库,主要有资源建设库、数据接收库、档案专题库、数据利用库、多媒体影像库、照片档案库等是数字档案馆建设的核心部分[2]。从网络构架来看,数据库布局了多个网络通道,根据不同的档案需求在相应的网域内进行。档案馆内局域网链接档案特藏库、档案利用库、档案数字接收库等。政务内网主要接收OA系统自动归档数据、政务内网利用数据库,实现与OA系统的无缝对接,保障电子文件的完整性,避免电子文件在不同系统之间转换可能出现的元数据被修改或缺失问题等。从档案数据保存和传输安全角度进行有效设计。

2.3 平台层建设

平台层建设以档案信息归档、利用需求为导向,形成以档案馆为核心、各部门横向互联互通,实现资源建设一体化的档案业务平台。从功能上看,业务系统建设主要包括档案收、管、存、用全流程业务、全过程安全、高效无缝隙的数字信息全覆盖,同时也囊括档案数字资源的采集、加工、处理、存储、管理和利用等方面。从功能上看,平台层建设实现档案收、管、存、用全流程业务、全过程安全、高效无缝隙的数字信息全覆盖,提高档案管理的效率和水平,确保档案的安全保管,促进档案信息资源的共享和利用。从建设模式上来看,按照“先行先试、大胆探索、稳步推进”完成全部软硬件的适配改造,使用国产正版软硬件设施设备,打造基于国产化环境下的数字档案馆系统。

2.4 资源层建设

一是加强档案数据质量建设。加强档案数字化加工过程中的质量管控,最大限度地提升存量档案数字化的质量,是数字档案馆建设的重要数据基础。为确保数据质量,开展馆藏档案数字化加工项目时,同步实施数据第三方质检项目,通过“自检+质检查”的数据质量验收流程,档案数据整合前进行三轮数据核验和清查,重点对涉密档案进行鉴定[3]。在涉密档案保管中存在混合组卷、混合保管、混合提供的现象,在目录上也没标有“秘密”“机密”“绝密”档案,造成了扩散机密的漏洞。在数字化加工过程中,按照《涉密档案整理归档和保管利用规定》,只能由单位职工扫描,外包公司不能扫描,档案管理员必须先将涉密档案清理出来,才能移交给外包公司扫描,确保数字化成果安全性。二是丰富档案资源。数字档案馆综合性、多样性的定位决定了需要丰富数字资源作为基础。针对不同数字载体形式,制定统一的档案数字化标准,明确数据格式、元数据、存储要求等,与大数据管理、民生服务、审批服务等部门建立联系,提升涉民生类档案的归集、整理力度,研发数据接口,提升档案资源检索与应用效率,实现数据资源的优化分配,构筑数字档案新生态。

2.5 应用层规划

应用层作为数字档案馆的核心部分,是数字档案馆建设的关键环节,主要包括档案的收、管、存、用的全流程管理与利用。一是局域应用层。主要为档案馆内部数字档案资源的实现高效管理,在大数据环境下,档案数据化逐步向智能化转向,比如,管理系统实现对数据自主采集、存储、分析;对疑难字体进行自主翻译、自主编研;同时,对涉密档案在划控规则下进行自主解密,为不同用户提供泛在化、细微化、个体化、差异化的档案查阅和展览展示的服务模式。二是政务应用层。政务应用层包括政务外和政务内应用,政务外应用为各单位提供档案电子化服务,或实现档案馆际共享利用,政务内为各单位提供涉密档案利用和传输。政务应用层是实现数字档案流转、存放和利用并自动化智能化采取措施,实现档案的有效保管和使用。三是公众应用层。为社会和人民群众提供优质服务是数字档案馆建设的初衷,公众层主要是为提供公开信息查阅、档案文化服务、档案征集利用等,是数字档案馆为民服务的窗口。目前应用层建设已经突破了传统物理空间的限制,比如手机App自主查询、互联网信息查询等,数字档案馆的广域服务更加多元化。

3 大数据时代数字档案馆建设的主要成效和存在问题

3.1 主要成效

一是数字化治理体系初步建立。通过建设数字档案馆,实现档案数字化管理和档案安全保护的一体化协同,实现局域网、互联网、政务网的一体化推进和接收库、管理库、保存库、利用库、采集库的为核心的档案数字化管理治理体系,数字化档案的安全性、便捷性和档案的利用效率及服务质量有了进一步提升。二是档案服务利用效能显著提升。数字档案馆建设为档案部门和社会团体架起沟通桥梁,为社会公众提供更加便捷、高效的档案服务。在政府运行过程中,数字档案馆可以实现政务公开和信息共享,提高政府服务质量。在推进文化软实力建设中,数字档案馆可以保护和传承文化遗产,推动文化发展。在社会服务中,数字档案馆的数据共享能力可以提高管理效率,實现社会事项办理“零跑腿”。三是实现电子文件的有效管理。通过构建以接收库和利用库为核心的政务网、以鉴定和长期保存为核心的局域网和以公众利用为核心的因特网,为公众提供高质量共享 的档案信息服务。

3.2 存在问题

一是电子档案管理能力尚需提高。在落实电子档案全流程管理方面还有差距,专业电子档案系统与局域网档案管理系统衔接不顺畅;在电子档案归档范围和档案保管期限、归档单位、归档格式、归档时间上标准不统一;对电子文件归档等环节进行真实性、完整性、可用性、安全性检测能力不足;定期开展电子档案备份,做好电子档案登记、日常检查、转换、迁移、鉴定、销毁等工作上执行不到位。二是新一代信息技术应用不足。如数据挖掘技术的破解服务能力不足问题,区块链技术的破解档案管理安全性问题。三是档案信息化人才较为缺乏。在基层档案系统计算机人才不足,有的档案部门没有计算机专业人才,无法满足档案信息化建设的需要。同时,存在基层档案人员观念落后、畏难情绪较重的问题,认为数字馆建设是先进地区的事,思想上对信息化建设不重视,难以在工作中锻炼能力水平,无法培养出信息化所需要的复合型人才。

4 大数据时代数字档案馆建设的几点思考

4.1 加强电子档案全生命周期管理

一是建设标准化、全面化的收集体系。持续推动电子档案单套制管理,实现OA、政务服务事项、业务系统等各类电子文件标准化在线归档接收。二是建设流程化、智能化的管理体系。搭建平台提供流程化服务,实现档案业务全流程跟踪、全业务监管、全方位管控。三是建立中心化、永久化的存储体系。打造区域性大档案管理中心,保障区域内各类档案数据长久保存与安全管理。四是建设价值化、精准化的利用体系。充分挖掘档案价值,精准把握用户需求,提供高效利用服务;及时主动提供针对性强、内容丰富充实、利用价值高的档案知识图谱。

4.2 加强“三合一”目录文件收集机制

建立涵盖全部馆藏文件目录级数据  (下接41页)

(上接38页)库是数字档案馆建设的必然要求。随着“三合一”制度的推进,要从源头抓好机关档案的形成与收集,优化档案资源结构,提升档案资源质量,规范开展电子文件的收集、审核和归档管理。在基础性文件、账外文件、业务系统电子文件、专题库文件方面拓展收集范围,实行“目录树”管理。持续加强共建共享一体化管理平台建设,在归档配置、数据接收、归档整理和移交等方面,按照“三合一”制度要求,实现文件收集的全方位、系统性的重塑,确保收集齐全、整理规范有序。

4.3 加强新一代信息技术应用

《“十四五”全国档案事业发展规划》明确提出,“积极探索知识管理、人工智能、数字人文等技术在档案信息深层加工和利用中的应用。”一是加强AI+档案技术应用。综合利用智能分类模型、文字处理技术、模式识别技术等手段,对档案管理工作的任务和流程进行程式化的改造,形成自动化、一体化的机器操作模式,推动工作增速提质。二是以区块链技术推动多跨共享平台建设。突破档案利用的空间、时间、部门限制,构建基于区块链联盟的档案信息资源共享模式,通过组建区域档案馆联盟链,获得链上出证、在线验证等功能,为利用者提供“一站式”服务;进一步保证档案在共享利用中的安全性、不可篡改性,做到来源可查、利用可控、责任可究,促进档案信息资源整合和共享服务。三是创新服务方式,构建全省档案信息资源共建共享新格局,为基层群众提供更加便捷、更高质量的档案服务。

4.4 持续强化档案安全建设

把档案信息化安全摆在数字档案馆建设的突出位置,配足配齐防火墙、漏洞扫描、入侵监测、安全审核等网络安全设施。加强涉密档案的审核鉴定,坚持“开放档案不涉密,涉密档案不上网”的原则,建立涉密台账,对数字化过程的数据采集、处理、存储等环节全流程监管,确保档案数据的安全。

参考文献

[1]于英香,滕玉洁.大数据背景下档案管理数据化转型探析[J].中国档案,2021(01):20.

[2]田奕姗,高露雄,刘宝雄.长江水文数智档案管理研究与实践[N].水利水电快报,2022(12):30.

[3]郑金月.将数字档案馆纳入政府数字化转型大格局中统筹建设——浙江省档案馆全国示范数字档案馆创建工作综述[J].浙江档案,2019(10):31.

作者简介:孙焕英(1968— ),大学学历,中共宁阳县委党史研究中心(宁阳县档案馆)副研究馆员;研究方向:档案管理。

猜你喜欢

数字档案馆实践探索大数据
浅议企业数字档案馆建设
台湾数位典藏计划对内地数字档案发展的启示
政治课堂教学中提高学生主体参与的实践探索
新形势下完善国有资产管理工作的实践探索
浅谈新时期煤矿员工教育培训的实践探索
基于大数据背景下的智慧城市建设研究
《机电传动控制》课程实验教学改革探讨
基于Enterprise Library的数字档案管理系统设计
国际数字档案馆元数据标准及其项目研究