大数据时代档案安全的思考
2023-06-07张雅芳
张雅芳
[摘 要]在信息技术飞速发展的今天,档案的电子化应用逐渐扩大,数据资源不断丰富。随着存量档案数字化加工的实施、增量数字档案归档的推广实行,档案数据量快速增长,如何在网络环境下确保这些数据的安全显得尤为重要。在大数据环境下,电子档案的信息采集安全、信息利用安全、日常归档安全都是对档案工作的巨大考验。文章从大数据环境下的信息安全入手,介绍档案工作中可能面临的信息安全威胁,并提出日常档案工作安全的应对措施。
[关键词]档案数据;数据安全;信息安全
[中图分类号]G27文献标志码:A
在信息技术飞速发展的今天,大数据的应用已经融入各个行业,像政务服务一网通办的运用,它通过整合政务数据,开展各方面的线上服务,以往需要前往实地办事的业务如今可以直接在网上按需办理,不用再四处奔走。一网通办的应用真正优化了市民的办事流程,为群众办事带来了极大的便利。在疫情防控期间,通过采集的随申码颜色筛查疫情风险在抗疫战中功不可没,通过大数据采集的随申码颜色让我们在第一时间得到疫情预警,为后续的疫情防控工作带来了极大的帮助。现在各地都在陆续建立疫情档案,庞大的疫情数据资料在收集整理后需要存档,在日益成熟的信息技术水平下,通过电子档案来归档保存是一个很好的选择,数字档案应运而生。数字档案的出现极大地方便了当下人们对信息资源的查阅利用,它是相对于传统档案的新型功能扩展,是数字环境下新时代的产物,它在归档和保存上也有全新的要求。
现今,在档案数字化和数字档案的双重运用下,电子数据量在急速地增长,邵晶晶、韩晓峰研究认为:国际数据公司(IDC)预测2025年全球数据量将高达175ZB,其中,中国数据量将增至48.6ZB,占全球数据量的27.8 %,将成为全球最大的数据圈[1]。在这样的飞速发展下,数据的安全问题需要特别引起重视。作为档案工作者,要想在大数据的海洋里守护好信息资源,保护数据的合法合规的正确利用,建立好完备的档案数字化建设,确保数字档案的安全尤为重要。
1 档案数据安全的研究背景
2021年,上海市档案局发布了《上海市档案事业数字化转型工作方案》,以促进上海市档案数字化改进工作,帮助推动上海的档案数字化转型需求,助力上海打造具有全球影响力的国际数字之都。随着“互联网+政务”服务的推进,社会的数字化治理、政务信息的共享建设推动档案工作进入了大数据时代。
金波、杨鹏指出,关于档案数据的定义,广义上是指各级各类档案机构所收集保存的具有档案性质的数据记录包括各类数据形态的资源信息,如数据文件、多媒体资料,也包括在档案管理系统使用过程中产生的各类数据,如上网的访问信息、系统的运行日志、用户的查阅数据、系统软件的统计数据等[2]。对于这些数据安全,它们的风险主要表现在不法分子利用网络系统的漏洞对数据内容的完整性、保密性以及可用性进行破坏。习近平总书记在2018年的全国网络安全和信息化工作会议上就阐述过网络强国战略思想,“十三五”规划中明确提出了“互联网+”行动计划,“十四五”规划则强调了提高发展数字经济、加快培育发展数据要素市场,应把保障数据安全放到突出位置。现今在大数据背景下资源为王,数据赋能,档案的增量电子化、存量的数字化为档案共享利用提供了便捷,同时也对档案的数据安全提出了更高的要求。
2 大数据下档案的信息安全威胁
信息安全是档案工作的第一要務,在网络环境下,数字档案资源的信息安全有可能会面临到威胁,常见的威胁有信息泄露、黑客攻击、DDOS攻击、安全漏洞、网络病毒等。回顾近几年国内外网络的安全事件可以看到,信息数据泄露事件和网络攻击事件频发,而它们带来的危害极大。以2022年1月美国Broward Health医疗中心数据泄露为例,黑客通过入侵网站窃取了病人的个人信息,这些信息含有出生日期、家庭住址、电话号码及银行账号等,有超130万人的隐私受到了影响。2022年的“3·15信息安全实验室”上披露了涉及网络安全相关的案件,其中就有骚扰电话、儿童手表安全防护的案件。
对于网络的安全管理,西方发达国家都制定了法律加以规范。2017年,加拿大国家图书档案馆发布了“面向2020信息战略计划”,其主要目标就是解决加拿大图书与档案馆数字信息资源的管理、保存、利用与再利用等方面的问题。中国也在2017年6月1日开始施行《中华人民共和国网络安全法》,标志着我国网络安全工作已经有了基本的法制架构,也意味着中国在构建互联网强国的制度保障工作上踏出了坚定的第一步。配合网络安全法的最新规定,中国网络信息安全等级保护工作也步入了“2.0时代”。在网络安全法的影响下,网络空间安全法治建设在抵御网络空间各种不确定性因素和未知风险环境中发挥了重要作用。即便如此,在大数据下的信息安全,特别是档案数据仍有许多地方需要引起重视。
2.1 物理设备安全
档案资料的数据信息呈现是依赖于载体的,其承载的设备包括光盘、电脑、扫描仪等,这些设备对数据的存储环境要求很高,细小的灰尘、氧化性气体、酸碱气体都会影响到电子资料的误码率。此外,这些硬件设备本身也需要考虑到其特有的安全性,例如,设备的存储位置,设备周围是否有强磁场、供电设备和电缆等威胁,档案存放是否具备防火、防水、防盗、防雷等安全措施。在档案设备报废或重复使用时,数据安全等因素也时刻威胁着电子档案实体的安全。
2.2 数据采集安全
档案信息的数据化是指利用信息技术将纸质档案和纸质资料数字化图像及录音录像等信息全部转化为计算机可以查询检索的电子数据,从而进行统计、计算、科学研究、数据分析以及主动推送,在平台上实现对数据信息的利用。
档案数据采集的安全有通过网页浏览进行采集时的信息泄露风险,也有采集人专用账号被滥用的风险。在信息采集确保内容完整的同时,还需要充分考虑到因为重复采集造成的数据冗余问题。现今的档案工作除了纸质档案的资料收集,在电子档案工作开展过程中不仅有存量档案的数字化,还有增量档案的电子化,这些档案数据信息量大且来源更加分散,形式各样,这就对采集工作带来了更大的考验。作为档案工作者,除了需要思考它们的收集范围和形式,还要分理出冗余信息,对于这些冗余信息还要反查出归档的源头,以明确好这些文件资料的归档单位。
2.3 数据网络安全
说到数据网络安全,首先想到的就是操作系统安全、联网软件的信息安全。在大数据环境下,网络数据一直都是黑客攻击的主要目标之一。正版操作系统具有较强的安全性和稳定性,能有效防止系统泄漏和后门。工作者要远离盗版软件,确保应用软件在使用中的信息安全,避免安全隐患。当今,随着越来越多的企业引进档案管理系统,数字档案数据库系统的安全性显得格外重要。
关于使用电子档案系统中的数据安全,王臻认为,在互联网环境下,有可能会面临数据篡改风险、信息删除风险、数据泄露风险等,恶意攻击者也可能会通过输送高级别的信息应用请求来影响数据库应用的响应速度,降低系统的工作效率,甚至限制档案系统资源的使用,严重干扰正常用户对电子档案的信息利用[3]。在平时工作中,要加强对信息技术运用的监管,养成定期使用安全可靠的监控软件对数据库进行扫描和监控,以便及时发现并修复数据库系统中可能存在的安全漏洞。
3 应对措施
为了最大限度地保障档案的数据安全,在大数据背景下,可以从以下几个方面入手,提前发现信息安全存在的风险,保障档案的信息安全。
3.1 提高档案安全意识,加强安全控制水平
档案的唯一性和原始性的特点意味着一旦发生缺失将很难恢复至原样,这有可能会造成有的工作因为缺少重要的参考资料而做出不科学的决策。在档案管理过程中,管理人员的安全意识是极其重要的,它直接影响到档案管理的工作成效。相信所有的档案工作者都有纸质档案的安全管理意识,但是在数字网络环境下,对于电子档案的安全考虑有很多人都没有意识。档案数据在网络环境中的存档利用是非常需要考虑到其安全性的。由于大部分档案工作者长期接触纸质档案,对电子档案领域不太熟悉,没有网络风险意识,缺乏网络安全知识,对档案信息在大数据时代下可能会出现的网络安全风险没有深刻的认识,极容易造成不可挽回的损失。没有安全保障的数字档案就像是皇帝的新衣,在电脑高手面前所有的数据一览无余,如果不法分子窃取了这些信息,将会造成非常严重的影响。
要提高档案管理人员的信息安全思维和风险意识,通过自学互联网知识、参加网络安全培训来强化信息安全的业务水平。在平时的工作中,还需要结合实际情况从细微入手,补全平时管理中对于数字档案安全方面的制度。在制度修改后需要严格按照要求执行,并做好对管理档案专用电脑内的档案信息定期检查工作,做好备份,防止信息的丢失与损坏 。档案管理者需要严格把控好不可公开的信息数据,当存储档案数据的电脑不得不需要外送修理时,档案工作人员要做到及时将电脑里的数据信息内容全部清空、删除,如有条件可直接摘除硬盘。对于送修的电脑,要做好详细的修理情况记录,并归档备案。
3.2 健全信息安全制度,做好应急预案
对于电子档案信息安全的制度保障,在《国家信息化领导小组关于加强信息安全保障工作的意见》中对电子档案信息安全保障的基本原则与具体内容都做了规定。建立大数据发展背景下的电子档案信息安全保障制度框架,要着重从电子档案信息安全应急处理机制、电子档案信息安全监控机制、电子档案信息安全标准化管理制度、电子档案信息安全技术研发标准等方面入手。在工作中,要从使用正版系统软件做起,及时为安全漏洞打上补丁,有效利用好新的技术手段保证信息的安全。在档案数据安全风险评估方面,要对安全风险信息进行分析、研判和预警。在电子档案数据的应急处置机制上,要有应急预案,有异地备份,并做好应急演练。档案信息的应急预案遵从预防为主、档案为主、应急联动的工作原则。对于数据档案存储使用的相关软件,其保密口令应有指定专人负责,非档案管理人员不得接触档案系统。在软件系统的使用过程中,需要定期对数据库进行备份,做好归档日志记录。当数据库发生崩溃时,应通过本单位的信息中心人员指定专人进行数据库修复,必要时需联系档案系统开发公司予以协助。修复后,档案工作人员在开始使用系统前应先对备份的数据进行检查,确保备份数据正确可用。在网络环境下,档案的数据安全不容小觑,一旦发现异常需立即启动预案,在第一时间向分管领导汇报,当发生重大黑客攻击事件认定情况严重时还需要向公安机关报警。
3.3 提高信息安全的技术支持
在网络环境下,档案信息在采集过程中的安全也很重要。关于档案采集环节的内容安全,孙宁认为,可以通过基于秘密信息的系统身份验证来设置安全访问密码[4]。从大数据的信息安全保障技术角度来看,可以采用在数据后附加MAC码进行消息认证的方式来确保信息的完整性,而电子密钥技术能够提高信息数据的保密性。对于数字信息在数据传输过程中可能遇到的信息窃取、恶意篡改等风险,还可通过引進SSL VPN技术,对需上传的文件数据进行加密、协议封装、协议再嵌套处理,在信息源与目的端建立起安全可靠的信息通道,从而保障信息采集安全。在档案整理及存储阶段,要防范档案在信息归类处理时的非授权访问、非法入侵的风险。建立好防火墙、安全监测机制,强化电子档案数据云存储安全性保护,可采用动态数据加密技术以确保数据不会被轻易读取,引入raid独立磁盘冗余阵列技术,降低因磁盘损坏造成的数据损失,引入数据镜像或快照技术备份数据,可以确保本地硬件设备发生难以恢复的损坏时能够迅速恢复。在档案使用中通过引入基于日志的审计技术,能够很好地掌握各方对本地访问的行为监控。新兴的数据溯源、数字水印嵌入能快速定位出现信息问题事件的环节,从而实现对档案数据的保护。
4 结语
大数据环境下对数字档案的采集整理归档是传统档案工作方式的重要升级,网络环境下的海量数据为档案工作的信息采集提供了更为丰富的归档内容。我们要深刻认识到信息时代下数据安全的重要性,学习大数据环境下的网络安全知识,重视计算机技术在档案工作中的重要作用,不断提高档案管理人员的理论知识和技术水平,把大数据安全技术和信息技术切实运用到档案安全工作中。在保证档案资料内容完整的同时确保信息安全可用,不断提升档案数据信息安全防控的质效。
参考文献
[1]邵晶晶,韩晓峰. 国内外数据安全治理现状综述[J]. 信息安全研究,2021,7(10):922-932.
[2]金波,杨鹏. 大数据时代档案数据治理研究[J]. 档案学研究,2020(4):29-37.
[3]王臻. 数据转型背景下的电子档案信息安全研究[J]. 兰台世界,2022(4):109-111.
[4]孙宁. 大数据视域下的档案安全管理体系构建及可引入技术分析[J]. 档案管理,2020(3):12-13.