面向长期保存的核电企业数字档案信息管理平台设计
2022-05-30杨强查凤华胡心宇
杨强 查凤华 胡心宇
摘要:该文对当前数字档案信息管理存在的不足进行了分析,提出了核电企业数字档案信息管理平台的设计目标和设计原则,形成了平台的整体架构,阐述了业务系统预归档子系统、数字档案资源管理子系统和数字档案长期保存子系统的定位和功能,提出了具有通用性和前瞻性的设计方案。
关键词:数字档案 信息长期保存 预归档
随着新一代信息技术被广泛应用在核电企业工程建设和生产运行的各个方面,数字档案在核电企业各个业务系统中大量快速产生,长期保存是保障数字档案资源长期有效性和使用价值的重要手段。核电企业开展基于长期保存的企业数字档案信息管理平台的研究与设计的需求愈发强烈,相关工作对于档案信息化建设具有重要的引领和示范作用。
一、现有档案信息管理系统存在的主要问题
建设核电企业数字档案信息管理平台是提高馆藏资源建设水平、优化与提升数字档案资源服务质量的重要手段,[1]一般而言,核电企业数字档案信息管理平台与内部业务系统进行融合对接,有助于核电企业提高档案归档率、归档质量、档案开发编研能力。[2]目前,核电企业数字档案相关管理系统存在一些问题,迫切要求开展全新设计,提出更为完整和全面的数字档案信息管理平台设计。[3]
(一)业务系统缺乏预归档及四性检测功能
业务系统对接归档的规范性不足,责任划分不明晰;缺少预归档平台或者模块,文件来源与交接数量含糊不清;四性检测功能不齐全,业务系统归档没有对电子文件进行相关四性检查,无法确保其被导入电子档案管理系统前是否符合四性要求。
(二)档案管理系统功能不完善
核电企业一般都建立电子档案管理系统,具备基础档案管理功能,但未开发在线鉴定处置功能;搜索工具性能不够,无法满足用户灵活需求;档案统计功能不足,如数字档案统计分析及可视化程度低,难以为业务和决策提供高智力支撐。
(三)电子档案长期保存系统尚未成熟
核电企业数字档案管理平台软硬件国产替代进程较慢,长期保存系统涉及档案数据保存安全,不能依赖国外软硬件产品,亟待开发建设拥有国内自主知识产权的电子档案长期保存系统,完善相应的长期保存功能。
二、企业数字档案信息管理平台的整体设计
数字档案信息管理平台的设计目标是遵循实用性、稳定性、扩展性、安全性、先进性、开放性等原则,建设满足核电企业各部门文档管理需要并支持数字档案管理全流程的信息系统,解决数字档案管理系统现存问题,包括建设业务系统预归档子系统、数字档案资源管理子系统和数字档案长期保存子系统。
(一)业务系统预归档子系统为长期保存提供可信数据来源
核电企业业务系统覆盖工程项目、生产运营、质量安全、供应链、人力资源、财务管理等主要业务类型,为相关业务的有效开展提供了支撑。这些业务系统作为日常业务使用的系统平台,源源不断地产生大量电子文件。业务系统中需要归档的电子文件由业务部门兼职档案人员采用手工或自动的方式进行整理、四性检查,非单套制系统还需建立电子文件与纸质文件的关联关系,待检查合格后进行实时或定期归档,并对归档过程进行日志记录确保未来可以进行核对。业务系统预归档子系统主要包括以下功能模块。
1.格式转换模块的功能要求是根据档案管理系统要求,将业务系统中各类结构化、非结构化数据的格式转化成档案管理系统所接受的、符合长期保存要求的格式。可参考《企业档案工作规范》及相关国际、国家与行业标准,结合企业情况制定企业档案格式保存要求。
2.四性检查模块的功能要求是结合单套制归档要求,根据业务相应管理规范,在业务系统端定制化设计相应的四性检查功能,确保电子数据在归档前的真实性、完整性、可用性和安全性。四性检查功能提供可视化规则配置及可视化监控预警,以便档案人员及时发现问题并进行处理。
3.文件管理模块的功能要求是以上级文件为基础,结合企业业务情况,编制各业务部门精细化文件清单、分类方案、组卷方法,并将其作为执行标准,嵌入预归档模块。平台提供可视化的文件分类和元数据设定方法,并在文件数据预归档时同步采用OCR技术识别,提取非原生文件的数据信息。
4.文档操作及文档状态显示模块的功能要求是记录各业务部门兼职档案人员的人员信息、操作时间、操作对象等相关信息,同时,将归档的数据标记为整理完成、传输中、未归档、已归档、已打回等不同数据状态,以便之后对数据进行核对和处理。
5.归档数据统计核查模块的功能要求是统计相关业务系统对数据归档的情况,以便业务部门和档案部门对归档数据进行核对,支持平台根据预制规则自动化核查,并提供不同系统间、不同模块间的具体明细条目数据用作核查对比。
(二)数字档案资源管理子系统为长期保存提供资源输入和多元化利用
数字档案资源管理子系统实现档案的收集、整理、鉴定、借阅、编研、销毁、统计等全面业务流程管理功能,并通过网络对不同用户提供相应信息服务,实现档案的“收、管、存、用”一体化。该子系统建立业务系统数据归档标准接口,实现业务系统数据在线自动化归档并输入长期保存子系统中;建立归档数据存储架构,归集到统一的档案管理平台上,并保证归档的电子原文及转换后的数据便于迁移和环境升级;实现档案智能化管理与企业智能库房系统集成,文件出入库关联智能密集架自动打开关闭、库房温湿度监控等功能;建立档案资源的网络化、多元化服务利用,包括实现网页端在线查档以及触摸屏自助查档。数字档案资源管理子系统主要包括以下功能模块。
1.数据采集模块的功能是将业务系统生成的“电子文件归档信息包”直接传入档案管理系统,利用Web Service接口传输数据,利用加密传输协议传输电子文件,经档案管理系统数据校验后写入档案管理系统接收平台,校验不通过的数据,将错误信息返回给来源系统处理。
2.移交归档模块的功能是完成各个部门以及业务系统数据的移交、审核、归档操作,使归档后的数据进入正式档案库。其中,归档过程采用RPA机器人技术,无须人工干预。
3.档案管理模块主要包括档案数据管理、统计报表、档案鉴定、库房管理、电子资源库管理、多媒体文件管理等功能。档案管理模块提供接口,支持数据抽取到数据中台用于后续的数据分析挖掘和智能化应用。
4.档案利用模块主要包括档案资源检索利用、在线借阅管理、专题推送,实现对档案内容的高效检索、扫描文件信息的自动提取、OCR文字识别,以及音视频档案在线播放等功能。该模块可以通过PC、APP、企业微信、自助服务屏等不同渠道为用户提供档案服务,可以提供自助式数据分析平台,由用户根据自身需求筛选所需要的档案数据,按照用户定义的格式进行输出。
5.业务系统数据归档标准接口模块提供Web Service标准数据接收接口,由业务系统调用后用于数据归档。
6.数据处理模板需要实现的功能主要包括文件PDF格式封装、文件FLV格式封装、OCR识别、全文索引等。
7.系统维护模块需要实现的功能主要包括组织机构维护、权限管理、日志审计、流程管理、运营监控、初始化参数配置等。
(三)数字档案长期保存子系统提供长期保存领域的系统性功能支撑
数字档案长期保存子系统的定位是按照数字档案长期保存关键业务与数据质量要求,通过对长期保存数据、流程、策略和设备的有效管理,保障数字档案在相当长的时间范围内不失真、不失效,始终处于可被读取利用状态。为确保对进入档案保存库中的数字档案提供全面的长期保存功能支持,需建立一套长期保存的计划、策略和实施方法,在此基础上由系统自动或人工干预,按照长期保存计划开展长期保存业务,在功能层面提供入库接收、利用导出、档案检索与浏览、档案质检等功能。档案长期保存子系统主要包括以下功能模块。
1.长期保存计划与管理模块的功能主要包括:对长期保存档案的用户及其权限、档案环境参数和数据、备份数据、档案保存格式,以及长期保存的策略与自动执行的触发机制进行配置等。
2.档案入库管理模块的功能主要是对进入长期保存库的档案进行登记、质量检测、加盖时间戳和生成入库时的凭证。这是档案综合管理子系统与长期保存子系统之间的接口功能,主要采用离线交互方式。
3.AIP管理模块的功能主要是对保存在长期保存系统中的档案数据包进行组织分类、对类目数据进行维护,并对长期保存过程中系统自动生成的各项过程数据进行记录和管理。
4.检索统计模块的功能主要是按照时间、类型等对入库、出库和在库档案进行数量、存储容量、管理过程中异常情况方面的统计并以可视化方式显示。
5.出库管理模块的功能主要是按照利用、迁移、管理库恢复等相关要求,生成出库数据包。这是长期保存库与其他子系统之间交换数据的接口功能,主要采用离线方式进行。
6.档案备份与管理模块的功能主要是与相应硬件设备进行集成,用于对系统数据和档案数据的备份,对于备份的数据需要进行动态更新或历史备份版本的删除处理。
三、平台创新设计及功能预测
在大数据、人工智能等新一代信息技术广泛应用的背景下,企业数字档案信息管理平台将更为适应技术环境的复杂多变及支撑企业业务的多元化发展。相较于传统平台,该平台在设计、功能、技术上存在一些创新之处,并对系统功能进行了初步预测。
(一)设计上注重数据化特征,推动企业档案资源价值挖掘和业务创新
作为企业数据资产的重要组成部分,数字档案信息管理平台扮演了非结构化数据资产的保管者等角色。在档案生产和转换的形态变化过程中,注重数据化元素的采集和利用,包括覆盖数据全生命周期的数据采集、数据传输、数据存储、数据利用等各个环节。在数据逐步成为生产要素的背景下,企业数字档案信息管理平台将扮演更多的数据管理者的角色,平台设计从充分发掘企业已有信息化环境的技术价值出发,推动企业数字档案的集中式管理和智能化利用。
(二)功能上关注用户自主性,推动企业档案从数字化向数据化利用转变
该平臺并未过多从档案管理人员的业务视角来开发功能,而是注重从业务部门不同工作人员的使用需求出发,提供用户的多渠道、多位置、多场景利用,提供自助式搜索、分析功能,更为灵活地满足主题分析、业务审计、数据报表报送等场景需求。在大数据、人工智能技术的加持下,核电企业数字档案信息管理平台可以将档案内容进行提纯、过滤、升华成为多样式的知识,从知识的角度为使用者传递价值。平台不断收集核电行业专业知识,结合已有档案数据,完成知识总结和沉淀,深入利用知识图谱等技术解决数据关联、数据语义、数据智能等方面的问题,构建核电行业知识图谱,为业务场景的智能化分析和运作优化提供支撑。
(三)技术上体现集成性融合,推动企业档案管理多技术融合和综合利用
该平台在技术上广泛引入大数据分析、人工智能等新一代信息技术,实现以平台为核心的多技术融合和综合利用。考虑到平台整合及集约化,一些功能模块借助企业内其他技术平台,例如数据中台、数据可视化平台、人工智能数据挖掘平台的专业性技术来实现,避免档案平台过于复杂化。平台出于对分布式应用和多源、多端等互联网化业务的支持,注重使用微服务架构来替代以往的单体应用开发模式。
总之,随着数字档案长期保存技术的成熟以及逐步落地推广,数字档案单套制必将顺利实施,数字档案管理将围绕具体业务领域开展知识开发利用,通过知识来支撑企业的数字化转型和高质量发展。
注释及参考文献:
[1]蒋冠.国家综合档案馆数字档案资源建设策略探析[J].档案学研究,2017(3):48-53.
[2]蒋建峰.与智慧城市“数字底座”融合的档案管理平台构建[J].档案与建设,2020(11):56-9;66.
[3]谢永宪,王巧玲,闫格.我国档案形成机构数字档案信息长期保存现状调查[J].北京档案,2019(2):28-31.
作者单位:江苏核电有限公司