基于数据安全过程的档案数据安全治理能力分析
2022-12-08满雪萍
■满雪萍
(广东省地质局第五地质大队,广东 肇庆 526000)
据统计,每年全球数据泄露事件频发,数据安全问题已经成为全球范围内的重大问题。各个国家均非常重视数据安全,甚至都逐步细化各个行业的数据安全。以档案行业为例,2016年的《关于进一步加强档案安全工作的意见》提出保障档案信息数据真实安全;2020年的《中华人民共和国档案法》提出保障档案数字资源的安全保存;2021年的《“十四五”全国档案事业发展规划》提出提升档案数字资源安全管理能力。
档案数据作为价值丰富的档案资源,是确凿的事实存照和重要的社会记忆。档案数据安全关乎国家安全、社会安全和个人安全,必须高度重视档案数据安全。根据档案数据安全治理能力成熟度模型,维护档案数据安全就要切实提升数据安全过程的档案数据安全治理能力。本文将基于档案数据安全治理能力成熟度模型的数据安全过程,探究档案数据安全治理能力问题,主要是在评价能力指标的基础上提出有益建议。
一、研究设计
(一)研究方法
结构方程模型是一种综合评估方法,兼顾了因子分析方法的因果关系和路径分析方法的影响关系,能够实现多个变量之间的关系量化研究,能够对潜在变量与潜在变量之间,潜在变量与测定变量之间的关系进行定量判断,是有效的多变量分析方法。本研究将采用结构方程模型,分析基于数据安全过程的档案数据安全治理能力指标。
(二)研究指标
基于数据安全过程,可以界定一级潜在变量为档案数据安全,二级潜在变量为档案数据采集安全、档案数据处理安全、档案数据存储安全、档案数据利用安全、档案数据传播安全。测量变量为采集源头、采集范围、采集流程、数据脱敏、数据清洗、数据抽取、数据集成、数据变换、数据纠正、存储数据库、存储备份、储存监管、数据公开、数据共享、数据访问、内网-外网传播、整体-部分传播、自由-限制传播。具体指标体系见表1。
表1 指标体系
(三)问卷与数据
问卷采用5级李克特量表形式进行指标评估,测定表量为档案数据安全,潜在变量为档案数据采集安全、档案数据处理安全、档案数据存储安全、档案数据利用安全、档案数据传播安全,二级潜在变量为采集源头等。主要针对各个指标进行1~5分评分,分值越高,表示指标正面评价越高。
样本数据来自于网络问卷调查。基于研究视角为数据安全过程的档案数据安全治理能力,要求调查对象必须对档案数据安全具有一定的了解,为了确保调查对象的合理性,主要通过图书馆论坛和经管之家平台的“档案数据”主题获取调查读者,随机抽取200名能够获取有效联系方式的网友,进行网络问卷调查,整理问卷结果得到176份有效问卷,问卷有效率为88%。
二、基于数据安全过程的档案数据安全治理能力指标分析
(一)数据有效性检验
1.信度检验
信度检验的目的是评估问卷数据是否可靠。一般来说,可以通过Cronbach's a系数值进行评估。如果Cronbach's a系数值大于0.7,就可以说明问卷数据可靠。本研究采用SPSS软件进行信度检验,Cronbach's a系数值见附表1。档案数据采集安全、档案数据处理安全、档案数据存储安全、档案数据利用安全、档案数据传播安全的 Cronbach's a 系数值分别为 0.817、0.778、0.823、0.807、0.759、0.810,整体 Cronbach's a 系数值为 0.844,均大于0.7,说明问卷数据通过信度检验。
附表1 Cronbach's a系数
2.效度检验
效度检验的目的是评估问卷数据是否有效。一般来说,可以通过KMO值和Bartlett球度检验进行评估,如果KMO值大于0.7,并且Bartlett球度检验显著性水平小于0.05,就可以说明问卷数据有效。本研究采用SPSS软件进行效度检验,KMO值和Bartlett球度检验结果见表2。KMO值为0.917,大于0.7,且Bartlett球度检验的显著性水平为0.012,小于0.05,说明问卷数据通过效度检验。
表2 KMO检验和Bartlett球度检验
(二)结构方程模型拟合度
结构方程模型是否合理有效需要进行验证,常用的验证方法为拟合优度指标,具体包括绝对拟合指标、增值拟合指标和简约拟合指标三种类型,拟合优度系数指标只有符合一定条件,模型才有效,本研究采用AMOS软件进行结构方程模型分析,拟合系数值见附表2。绝对拟合指数、增值拟合指数、简约拟合指数的拟合情况均表现为良好。
(三)结构方程模型分析路径
结构方程模型分析路径可以反映影响关系,T值能够反映显著性水平,一般来说,T>3表示P<0.01,表示潜在变量对测定表量具有非常显著影响,T>1.96表示P<0.05,表示潜在变量对测定表量具有显著影响,如果T<1.96,表示潜在变量对测定表量没有影响。基于AMOS软件进行结构方程模型分析,统计路径系数及T值的附表3。
附表3 拟合系数统计
附表4 路径系数及T值
档案数据安全治理能力方面。档案数据采集安全指标、档案数据处理安全指标、档案数据存储安全指标、档案数据利用安全指标、档案数据传播安全指标的路径系数分别为 0.841、0.8466、0.899、0.837、0.822,均大于 0,T值分别为 6.214、6.375、6.891、6.211、6.138,均大于 3。说明档案数据采集安全、档案数据处理安全、档案数据存储安全、档案数据利用安全、档案数据传播安全对档案数据安全治理能力均具有非常显著的正向作用。
档案数据采集安全方面。采集流程指标的路径系数为0.763,大于0,T值为5.471,大于3;而采集源头指标、采集范围指标的T值分别为1.552,1.543,均小于1.96。说明仅有采集流程对档案数据采集安全具有非常显著的正向作用。
档案数据处理安全方面。数据脱敏指标、数据清洗指标、数据抽取指标、数据集成指标、数据变换指标、数据纠正指标的路径系数分别为 0.752、0.749、0.732、0.724、0.774、0.798,均大于 0,T 值分别为 5.342、5.269、5.174、5.043、5.789、5.889,均大于 3。说明数据脱敏、数据清洗、数据抽取、数据集成、数据变换、数据纠正对档案数据处理安全均具有非常显著的正向作用。
档案数据存储安全方面。存储数据库指标、存储备份指标、储存监管指标的路径系数分别为0.652、0.699、0.531,均大于 0,T 值分别为 4.768、4.823、4.552,均大于3。说明存储数据库、存储备份、储存监管对档案数据存储安全均具有非常显著的正向作用。
档案数据利用安全方面。数据访问指标的路径系数为0.621,大于0,T值为4.445,大于3;而数据公开指标、数据共享指标的T值分别为1.402、1.413,均小于1.96。说明仅有数据访问对档案数据利用安全具有非常显著的正向作用。
档案数据传播安全方面。内网-外网传播指标、整体-部分传播指标、自由-限制传播指标的路径系数分别为 0.576、0.555、0.523,均大于 0,T 值分别为 3.696、3.673、3.421,均大于3。说明内网-外网传播、整体-部分传播、自由-限制传播对档案数据传播安全均具有非常显著的正向作用。
三、结论与建议
综上所述,基于档案数据安全过程视角,档案数据安全治理能力要求做到档案数据采集安全、档案数据处理安全、档案数据存储安全、档案数据利用安全、档案数据传播安全。结合数据采集、处理、存储、利用和传播安全的具体影响指标,提出档案数据安全治理能力提升路径如下。
档案数据采集方面。一方面,规范化档案数据的采集渠道,在信息数据爆炸时代,档案数据的采集要注重权威性和可靠性,不仅要避免重复性的多头采集,也要规避超范围的过度采集,严把数据采集来源,确保采集到档案数据的真实性与有效性;另一方面,标准化档案数据采集格式,在现代化信息工具下,档案数据的呈现形式丰富多样,既有文字,也有图片,还有音频视频,应当按照不同类型的档案数据进行统一化采集,不仅要制定统一的采集程序,也要通过标准化编码转化数据类型,确保采集到档案数据的可比较性和可用性。
档案数据处理方面。一方面,加强档案数据的科学化分类,当前的档案数据不仅存在残缺冗余的情形,也存在多源异构的情况,对繁杂的档案数据应当进行有效分类以便于存储和统计,可以按照档案数据的属性与特征,或者是按照档案数据的功能与应用,进行科学合理的多元分类;另一方面,加强暗杆数据的有效化清洗,当前的档案数据不仅存在死数据的问题,也存在冷数据的不足,对低质量的档案数据应当进行必要清洗以便于应用和使用,可以针对多方位收集到的档案数据进行比对校验,更正明显错误数据,剔除明显重复数据,注重档案数据清洗脱敏,得到高质量档案数据。
档案数据存储方面。一方面,优化档案数据安全存储机制,基于档案数据的重要性程度和保密性质,制定安全有效的档案数据存储制度和保密制度,注重存储数据库的选择与完善,选择安全性能稳定的存储数据库,并结合档案数据特征不断完善存储数据库,确保档案数据的安全存储与长期存储;另一方面,健全档案数据安全监测机制,基于档案数据的存储要求和丰富类型,选择使用寿命长且容量大的存储介质,注重档案数据的加密与备份,构建存储档案数据的安全监测系统,加强数据实时监控与监测,杜绝存储档案数据可能存在的安全隐患,确保档案数据的安全存储与有效存储。
档案数据利用方面。一方面,严格规范档案数据的访问权限,根据档案数据的保密性质和保密程度,设置不同等级的访问权限,对于一般安全的档案数据,可以公开共享,设置无门槛或者是低门槛访问权限,对于中高度安全的档案数据,则应当规范落实身份授权,设置高门槛访问权限,只允许限定的用户进行访问;另一方面,严格把控档案数据的使用应用,根据档案数据的隶属部门,针对具有知识产权的档案数据要加强使用监督,不仅要有效防范档案数据的滥用行为,也要坚决处置档案数据未经许可和非授权使用的行为,还要重度预防档案数据的泄露行为,推动档案数据的正当使用。
档案数据传播方面。一方面,区分内网和外网传播,对于机构组织的内部档案数据,设置安全的防火墙确保内网传播,对于大众开放的档案数据,积极推进外网平台的共享与传播,同时要做好内外网的物理隔离,在必要的内外网档案数据传播交换过程中,确保安全有序;另一方面,区分整体和部分传播,对于不同传播范围的档案数据,做好分域控制,对于不同用户对象的档案数据,做好分级控制,对于不同敏感程度的档案数据,做好分类防护,对于不同保密等级的档案数据,做好划控处理,选择性地选取部分档案数据进行传播。