“数智”为目标的数字档案馆迭代升级实践
——以浙江省档案馆为例
2023-06-16李轶昶林空浙江省档案馆
李轶昶 林空/浙江省档案馆
党的十八大以来,以习近平同志为核心的党中央高度重视数字化发展,作出了一系列重大部署,擘画了数字中国建设的宏伟蓝图。《“十四五”全国档案事业发展规划》明确:加强大数据、人工智能等新一代信息技术在数字档案馆(室)建设中的应用,推动数字档案馆(室)建设优化升级。
档案数据化生存与数据档案化管理日益明显,档案工作环境、内容、模式发生深刻调整,迫切要求档案事业“数智化”蜕变。2020年,浙江省档案馆正式启动省档案数据中心建设项目,建设的主要内容包括档案数据共享服务和档案业务智慧治理两方面,全面开启以“数智”为目标的数字档案馆向档案智能化管理系统的迭代升级。
1 目标定位
利用先进的计算机技术,加强系统集成、管理集成、技术集成,优化档案接收征集、档案资源管理、档案开发利用等方面的工作流程,加强内部管理协同,促进档案实体管理和档案数据管理一体化、智能化,档案业务流程自动化、可留痕。在档案接收征集方面,加强档案接收工作过程管理、档案数字复制件质量检测、实体入库过程管理等工作的智能化;在档案资源管理方面,加强全宗、目录、涉密筛查等智能化;在档案开发利用方面,优化调卷、自助查档、外借审批、智能编研等应用。着力推动档案工作与大数据、人工智能等新一代信息技术深度融合,实现档案服务创新性变革,助力数字档案馆建设从“数字”向“数智”的目标迈进。
2 档案智能化管理系统整体架构
迭代升级后的档案智能化管理系统整体采用“3+2”的架构设计,“3”是前置接收子系统、长久保存子系统和数字档案馆子系统共行支撑档案资源收管存用的全方位管理;“2”是档案资源治理和档案业务治理并重形成全新的档案馆管理体系。
2.1 系统平台
2.1.1 前置接收子系统。前置接收子系统部署在馆内政务外网,与部署在政务云上的接收系统进行对接,通过接口实现电子档案的在线接收与移交,是电子档案的“总收发室”。
2.1.2 长久保存子系统。长久保存子系统用于保存原始存档信息包和数字档案馆系统中转换为长期保存格式后形成的返回信息包,以ZIP包为管理单位进行长久保存管理,采用可信时间戳、数据保全、OFD 格式转换等技术策略,优化数据监测、监管和保真功能,做到实时检测、实时预警、实时保全,真正实现档案资源的存、用分离。
2.1.3 数字档案馆子系统。数字档案馆子系统结合工作人员与查档用户长期使用的实际情况提出的意见建议,作了大量的适用性改造和优化,各项功能进一步满足开展数字档案资源移交、接收、整理、编目、审核、管理、保存、编研、利用、统计等工作的需要。
2.2 管理体系
2.2.1 档案资源治理体系。为实现档案实体管理和档案数据管理一体化、智能化的目标,打造档案资源治理体系。顺应浙江省数字化改革的大趋势,结合浙江省档案馆实际需求,既考虑传统档案数字化成果的管理利用问题,又充分考虑电子文件归档、电子档案移交、接收、保存和共享利用的规定与流程,着力打造存量数字化和增量电子化并重的档案资源治理体系。
2.2.2 档案业务治理体系。为实现档案业务流程自动化、可留痕的目标,打造档案业务治理体系。以“定准核心业务—确定业务模块—拆解业务单元—梳理业务事项—确定业务流程—明确协同关系—建立指标体系—汇总数据需求”为路径,从梳理馆内核心业务出发,逐层拆解到最具体最基本的单元,以各职能处室为主体,逐一明确业务流程的数据指标,实现事项的标准化、数字化。
3 迭代升级重点
3.1 档案管理
3.1.1 新增AI辅助开放审核功能,采用NLP技术结合专家训练和机器学习,探索AI辅助档案开放审核核心算法引擎,从成熟的审核样本中寻找规律,并运用这些规律对各类档案的内容价值进行判断,作为档案人员审核的参考,在一定程度上统一开放审核标准,从而有效提高开放审核工作效率;开发正文拆分模块,针对开放审核时认定全文中部分不能开放的内容,可以对全文进行拆分,生成新的全文进行开放,利用和导出时,可只导出可以开放的部分;开发复审理由记录功能,工作人员可以记录敏感词库和规则库中不存在的词条,并在人工审定后将规则和敏感词增加到规则库和敏感词库中;预警提醒功能也能同时对到期需要开放审核的馆藏档案进行开放审核提醒。
3.1.2 新增档案多维分类管理功能,通过定义档案数据标签并对馆藏档案进行赋值标签的操作,对馆藏档案添加自定义标签进行分类,打破传统数字档案馆档案管理的固有模式,对复杂档案数据资源进行简易化统计、筛选、加工、沉淀,通过可视化线索分析精准定位,实现海量档案数据资源的多维分类管理,为后续的工作提供更有力的支撑。
3.1.3 新增系统纠错功能,工作人员或查档用户可以在日常的查档用档过程中发现错误,并上报错误,以便系统数据管理员对错误数据进行修改,不断提高馆藏档案的数据质量。
3.2 档案利用
3.2.1 优化全文搜索功能,在基于关键字搜索全文内容的基础上新增音视频检索,采用人脸识别技术,在视频档案存储过程中,检测提取人脸,建立视频人脸库,支持“1vN”人脸库信息检测,关联视频所在事件文本信息,打破视频文件传统存储模式,打造“视频+音频+文字+人脸+目录”创新存储模式,加速视频文件内容的快速检索利用。
3.2.2 新增档案编研功能,采用NLP技术探索建设档案智能检索场景,形成档案知识图谱,建立档案编研“中央厨房化”,初步探索档案智能挖掘、档案智能检索、档案智能关联等档案利用新模式,并支持多人同时在线编研。
3.3 档案业务管理
3.3.1 新增流程管理功能,根据档案资源管理收管存用的总体要求对档案接收(含实体档案接收、数字化成果接收、电子档案接收等)、档案开放审核、档案查阅、馆藏档案数字化扫描、档案修复、档案数转模、档案征集编研、档案展览等核心业务流程进行拆解重组、逐项明确,每项流程均涵盖任务制定、任务执行、任务完成等环节,形成闭环式管理,所有环节按需定制功能点,适应多部门、多应用、多业务场景的需求。
浙江省档案馆档案智能化管理系统迭代升级明细表
3.3.2新增流程监控中心功能,记录流程管理模块中所有业务流程流转的系统日志,并根据日志中记录的返回状态来实时监控各流程实例的全流程周期,包括待办监控、队列监控、消息监控、接口监控、缓存监控等,通过视图可快速查看当前异常流程、告警信息,可供管理人员快速发现问题,定位问题,实现流程的执行全过程管理和监控。同时集成核心业务完成情况的统计及工作量统计的功能。
3.4 系统功能
优化用户权限管理模式,以“用户—角色”替代“用户—模块”权限控制方式。多年实践经验表明,档案智能化管理系统中的用户(主要指工作人员)数量众多且工作岗位经常变动应该,这就增加了权限授权管理的难度,通过根据调研核心业务流程建立的《智能化管理系统模块角色对应表》和《智能化管理系统权限分配表》,引入角色(与特定业务工作流程相关的一个功能模块集合)这一中介,实现了用户与功能模块的逻辑分离,采用“用户—角色”的权限控制方式。当用户改变工作岗位时只需进行角色的撤销和重新分配即可。采用这种权限控制方式的优势在于,从系统管理员的视角来看,管理用户对应的角色代替用户对应的功能模块,权限管理的压力减小;从用户视角来看,无需了解自己在系统所需使用的功能模块,而只需要定位自己的业务流程中的角色,系统的学习成本降低。
4 创新思路
4.1 业务驱动倒逼数字档案馆管理体系重构
以馆内核心业务流程重塑为基础,从单向以档案数字资源的收管存用驱动发展为“档案资源+档案业务”双向驱动的档案智能化管理模式,将传统线下业务和以数字档案馆为载体的线上业务相结合,实现数字环境下档案业务工作的流程自动化、可留痕。
4.2数据管理推动数字档案馆管理对象转变
在馆藏档案高数字化率(突破90%)的基础上,转而关注馆藏档案的“数据化”工作。通过数字档案资源的“数据化”,打破版式文档、图片、音频、视频等数字档案资源格式对计算机理解档案内容的限制,实现维度跨越与知识互通,实现档案价值从数据向信息乃至知识的跃升。
4.3 技术赋能实现数字档案馆管理能力提升
将大数据、人工智能等信息技术应用在数字档案资源建设中,推动档案数据化与智能化之间紧密融合,档案数据与智能技术相互嵌入。以AI辅助开放审核、辅助音视频档案管理利用,建设档案编研“中央厨房化”、档案多维分类管理等,实现档案管理和利用层面的技术赋能与能力提升,充分延伸档案价值空间。
5 下一步努力方向
5.1 持续加速档案资源“数据化”进程
档案智能化管理系统的核心在于云计算、大数据、人工智能等信息技术在数字档案资源建设中的应用,数据化与智能化之间紧密融合,档案数据与智能技术相互嵌入。前文所提到的场景诸如AI辅助开放审核、AI辅助音视频档案管理利用、档案编研“中央厨房化”、档案多维分类管理等很大程度上依赖于数字档案资源“数据化”程度,可以说,数字档案资源“数据化”的数量和质量决定了这些场景的应用前景。
5.2 持续提升档案管理“智能化”水平
随着现代信息技术的广泛应用,档案馆从传统的手工管理模式逐步走向数字化、智能化、智慧化,档案服务也从被动接待走向主动提供和推送档案信息的新境界。迭代升级后的档案智能化管理系统将继续通过自然语言处理、音频转译、人脸识别等技术对馆藏档案数据进行聚合处理,实现档案管理系统的互通融合、档案信息资源的深度挖掘,全方位满足用户个性化、精准化、知识化的档案利用需求。