APP下载

基于数字技术的水利工程档案信息化管理路径分析

2023-11-23张广振

兰台内外 2023年30期
关键词:路径分析数字技术

摘 要:数字经济具有高创新性、强渗透性、广覆盖性,已成为推动档案工作高质量发展重要推动力。新形势下,必须充分了解数字技术的内涵和作用,以新技术助推水利档案工作提档升级。本文分析了数字技术的概念和作用,提出要积极运用大数据、人工智能和区块链等技术,以期加速水利工程档案流程再造,推动档案管理效率的提升。

关键词:数字技术;水利工程档案;路径分析

以大数据、互联网+、云计算、人工智能为代表等新一代信息技术引发了经济社会的巨大变革,使数字技术成为高质量发展的关键性因素。当前,数字技术已加速融入档案管理的各环节和流程,成为推动档案治理体系和治理能力提升的主要推动力。水利工程档案作为国家社会发展进程的重要见证,在提高经济发展质量、惠及人民幸福上发挥着不可替代的作用,档案管理部门应顺势而为,借助数字技术的红利提升档案管理质量,更好地为中心大局、人民群众服务。

1 数字技术概述

1.1 定义

数字技术是一种可以将各种信息转化为计算机可以识别的语言进行加工、储存、分析以及传递的技术。数字技术在许多领域都有广泛的应用并取得了良好效果,其中最具代表性的是计算机技术、网络技术和数字媒体技术。计算机技术是数字技术的核心,实现了数据处理、存储和传输的自动化,为各种数字化应用提供了基础平台。网络技术则是数字技术的支撑,实现了计算机之间的连接和信息交换,为数字化应用提供了广阔的应用空间。数字媒体技术则是数字技术的体现,涵盖了图像、音频、视频等多种形式的数字媒体,为人们提供了丰富的数字化娱乐和信息服务。

1.2 数字技术在水利工程档案管理中的应用

当前,数字技术已经成为水利工程档案管理的重要支撑,彻底改变了档案管理的面貌,推动了水利工程档案管理效力的提升。在档案收集与分类上,数据挖掘技术能够推动不同类别和属性的信息在短时间内按照规则分类,满足用户的查询利用需求,并能分析用户的个人爱好,提供更为精准的档案服务。在開放利用上,人工智能技术为解决海量档案的开放审核压力、有限的在线检索和获取渠道、单一形式的开发成果等问题提供了全新的思路与方案。在档案安全上,可利用区块链不可篡改、安全可信的特点,通过数据区块的“哈希值”代码,确保区块链上的每个区块数据都不能随意被篡改、删除或破坏。

2 数字技术在水利档案管理应用中的优势

2.1 节约档案管理的人力成本

人工智能等技术的引入,使得档案管理工作的人力成本降低。据有关统计,新一代信息技术引入后,档案管理的人力成本缩减了80%,高效地档案管理使得档案人员从烦琐的流程性事务解脱出来,有更多的精力从事档案开发与服务工作。比如,人工智能管理系统引入后,通过制作专业化的知识地图和程序设置,可自主进行辅助性编研工作,编撰水利大事记、制度汇编等。

2.2 档案文件管理与存储更加便利

大数据和区块链技术使档案管理更加规范性、标准性、系统性。智能系统的引入使立卷归档工作流程化,能够全方位保管存好水利单位在活动中形成的文件材料,为单位决策和服务人民群众提供更有效的服务。在档案移交环节,通过人工智能辅助,能够做到数据完整、内容准确、利用安全、编目规范、账目清晰一致,使水利工程档案从立项、招标、勘探、施工、结项等环节档案应归尽归。

2.3 档案共享性和安全性得到加强

从共享性上来讲,大数据共享平台建设形成了档案资源数据湖,档案数据被共享到各个部门,水利数据的查询实现了一键直达,实现了跨区域、跨时空,消除了信息孤岛。从安全性上来讲,信息化保护了档案实体安全,特别是对于历史悠久的水利档案材料,经过数字化处理无疑是更好的保护,而且档案经过数字化处理后,可以避免部分档案篡改。

3 数字技术在水利档案管理应用中的困境

3.1 应用成本较高

一是软硬件的成本高。目前档案信息系统进入智能化管理时代,水利档案管理软件购入成本也有所增加,还要购置与之相匹配的硬件设施等,编制各种数字化软件、建设平台等,都需要财政给予大力支持。二是隐形成本较高。人员的培训、数据安全和维护成本、信息技术团队的成本等,需要财政给予常态化支持。

3.2 数据化管理难度大

水利工程建设包括勘察、招标、立项等,有文书、科技、会计等常规档案,也包括图纸、生态等特殊档案,这些档案需要进行科学分类,以实现更为高效地管理,同时分类方式还需要具体问题具体分析。因此,进行档案数据化管理的难度较大。

3.3 相关技术标准缺乏

随着新技术的应运而生,档案行业的普遍性标准较多,但是缺乏与水利部门档案管理相匹配的新技术应用标准。水利档案大多涉及国家政策、核心技术等,属于国家核心竞争力,需要更为高标准的档案安全管理规范,这方面尚未出台有关规定。

4 水利工程档案信息化管理的路径分析

4.1 大数据技术赋能水利工程档案资源建设

4.1.1数据挖掘技术提升档案分类管理精准度。数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘技术中决策树算法已广泛应用于档案管理中,它是一种常用于预测模型的算法,通过将大量数据有目的分类从中找到一些有价值的、潜在的信息,其主要优点是描述简单,分类速度快,特别适合大规模的数据处理[1]。水利工程档案具有复杂性、成套性、周期性长的特点,传统的人工方法耗时长、出错率高、效率低下,应用决策树算法能够高效地进行分类和管理,提高工作效率。一是根据水利工程档案利用实际,将利用率较高的档案整合到数据集合中。二是档案管理人员按照《水利工程建设项目档案管理规定》对数据集进行初次分类,参照点主要是用户的查询偏好。三是基于数据库的分析计算为用户推荐实用的水利档案数据信息。通过有针对性的数据挖掘分析,提升了档案利用者的查询效率,释放档案数据的潜在价值。同时,数据分析技术能够深入分析访问者的查询内容、停留时间、下载情况等,并进行系统的科学分析,掌握利用者对数据的偏好,进一步提升档案数据服务的质量。

4.1.2物联网技术提升水利实体档案管理效率。物联网是指按约定的协议,任意物品通过射频识别(RFID)、红外感应器、GPS等传感设备与互联网相连,进行智能化识别、定位、跟踪,以实现在任何时间、任何地点,人、机、物的互联互通。物联网具有三个基本特征:一是全面感知。物联网上部署了多种类型传感器,包括射频识别、二维码、智能传感器等各种感知设备,能够获取物体的各种信息。二是互联互通。物联网融合了互联网、电信网等网络,能够实时、准确地传送、分享物体的信息,实现不限时间、地点、任何物体的互联互通。三是智能处理。通过采用云计算、人工智能、模糊识别等各种智能技术,分析处理感知和传送到的数据、信息,实现智能化地监测与控制[2]。目前,射频识别(RFID)技术已经在水利库房建设中得到广泛应用,保证水利档案的保密性,有利于保障密级档案的防泄漏安全。水利工程建设环境复杂,该技术可工作于各种环境,信息传导适应无线、有线两种模式,便利相关工作人员的操作管理。RFID技术可识别高速运动物体并可同时识别多个标签,避免了传统档案录入流程的单一重復性,使得档案的入库、盘库、借阅、归还等流程操作快捷方便。RFID技术的出现并成功运用到档案管理上,实现了档案管理的数字化、自动化、智能化和高效化。

4.2 以人工智能技术赋能水利工程档案开放利用

4.2.1智能语音技术助力水利音像档案文本化。智能语音技术是人工智能应用最成熟的技术之一,并拥有交互的自然性,能够让智能识别人类语音内容。智能语音解决的问题就是使得设备可以用听觉感知周围的世界,用声音和人做最自然的交互,让操控和生活更为便捷。目前,人工智能技术广泛应用于音视频档案管理中,取得了良好的管理效果。浙江省档案馆就将人工智能技术应用于音视频档案的处理中,通过文本内容检索音视频、通过人脸识别检索音视频,由原来的4小时查询缩短到10分钟,大大提高了可用性和检索效率。水利档案中,一些重要的音视频档案资料,在整理过程中,需要打开文件逐一听取或观看才能区分内容;在著录过程中,题名著录项至少需要完整观看或听取一遍才能判定;在特定档案的查询中,需要通过人工才能精准查询和定位。因此,语音识别技术为水利音像档案文本化打开了新的空间。该技术通过搭建智慧利用系统,同时结合水利档案利用实际,可预先设置转换规则和条件,将视频档案分成不同主题,利用转写技术和文本分析技术,将音视频档案内容进行自动提取、机器标注、著录项写入;系统也对视频进行人像数据提取,为后期视频档案查询利用奠定基础。

4.2.2光学字符识别技术助力水利档案数字化。光学字符识别技术实质上就是文字、符号的转化技术,通过专门的档案软件,将文字、图像、符合分成不同的识别单元,运用计算机识别技术,判断图像在数据库中的编码,从而进行识别、文字转换和文本输出、呈现的过程。2020年1月档案行业标准《纸质档案数字复制件光学字符识别(OCR)工作规范》(DA/T 77—2019)开始施行,为该技术在档案管理中的应用指明了方向。水利工程档案中包括大量的图片、特殊符号、标注等,应用OCR能够使档案利用更加精准。OCR的工作流程为:影像输入、影像前处理、文字特征抽取、比对识别、人工校正,最后将识别结果输出保存。虽然一张图像真正用于软件识别的时间不到一秒,但前期和后期的加工处理不可小视,尤其是前两个环节的操作,往往决定了OCR软件的识别率,乃至整个OCR工作的效率,而后期人工校正环节,则是保证OCR工作质量的最直接环节[3]。因此,在前期环节上,在前期扫描的时候就应设置适合OCR识别的扫描参数,根据《纸质档案数字复制件光学字符识别(OCR)工作规范》要求,结合水利档案实际,图像分辨率300dpi在OCR识别中最为合适,能够确保导出数据的精准度。

4.3 以区块链技术赋能水利工程档案安全建设

4.3.1数字加密技术保障水利工程档案数据链安全。数据加密是保障区块链数据隐私和安全的重要手段之一,在区块链上存储的数据通常采用加密算法进行加密,确保只有授权的用户才能解密和访问数据。主要的算法类型是对称加密算法和非对称加密算法[4]。对称加密算法使用同一个密钥进行加密和解密,速度快但安全性相对较低;非对称加密算法使用公钥和私钥进行加密和解密,安全性更高但速度较慢。通过合理选择和使用加密算法,可以有效保护区块链上存储的数据的隐私和安全。对于水利工程档案来说,将哈希算法应用于实践是较为成熟的做法。哈希算法能够生成“数字指纹”,水利档案数据进行哈希处理后,能够得到唯一的哈希值,并将其保存在区块链上,任何微小的更改比如标注数值的变化、参数的修正等,都能引起哈希值大幅度的变化。同时,该技术也可应用于数据录入的校对,当新增数据的哈希值与初始哈希值有较大出入时,数据系统能够自动掌握录入的准确性并进行调整,使整个水利档案信息完整准确。

4.3.2分布式技术确保档案管理互联安全性。“去中心化”是区块链技术的显著特点,区块链没有中央机构控制,而是由网络中的多个节点共同维护和验证数据的一致性。每个节点都存储完整的数据副本,没有单一的控制点。通过“分布式”技术,能够使数据主体都拥有相同的数据模块,即使某个节点收到攻击,其他节点依然保存有完整的数据值,防止数据被非法篡改或单点被攻击造成的安全风险,维护了网络数据的绝对安全。水利工程档案管理部门多、节点分散、网络主体复杂,应用分布式技术能够保障数据的原始性和真实性。对于某一个水利工程建设项目来说,就包括勘察、设计、监理、施工、总承包、检测、供货等单位,这些单位的档案资料按照《水利工程建设项目档案管理规定》都应及时归档,形成了多个网络节点和主体。应用分布式技术后,能够将各节点的主体链接起来,每个建设单位通过不断的交互、验证和复制,将同样的数据副本分散存储在网络中多个节点上,具有相关权限的建设工程机构就能够进行利用。同时,一旦某个节点的数据被篡改,整个网络就会自动排除该节点的数据,并将其视为无效数据,极大提高了水利档案数据的安全性和可靠性。

参考文献

[1]张志恒,陈旭.数据挖掘技术在会计信息系统中的应用研究[J].中国管理信息化,2016(02):01.

[2]张中宇.应用大数据构建智慧城建档案馆[J].城建档案,2020(05):25.

[3]许呈辰.档案数字化过程中OCR技术的应用[J].档案管理,2021(01):15.

[4]王少辉,蒋季宏,肖甫.基于重路由匿名通信系统的设计[J].计算机科学,2016(10):15.

作者简介:张广振(1981— ),研究生学历,山东省海河淮河小清河流域水利管理服务中心馆员,研究方向:文书档案和水利工程建设项目档案管理、数字档案室建设与管理。

猜你喜欢

路径分析数字技术
我国民营企业融资困境分析
数字化技术在高校博物馆中的应用
舞蹈创作技术的运用与研究
浅析产业化模式对中国动画发展的重要性
多球训练在高校乒乓球教学中的路径分析
我国供给侧结构性改革路径选择
浅谈中国民间舞蹈的文化传承
数字媒体艺术在虚拟展示空间中的应用探究
数字技术在工业电气自动化中的研究应用
工业自动化中数字技术创新应用