浅析大数据技术下的公共资源交易信息安全风险
2021-12-03任仁
任仁
(通化市公共资源交易中心(通化市政府采购中心),吉林 通化 134001)
0 引言
目前我国公共人力资源主要通过各种信息化交易手段直接进行数字交易,各地的各类公共资源数字交易市场管理和信息服务经营机构基本上都自己建立了电子数字交易平台,以公开资源信息化交易为技术主导的数字交易经营理念虽然是我国公共资源数字交易市场管理者的普遍共识,但一切都是具有两面性的,公共资源数字交易系统是完全电子化的,对公开信息化的技术依赖度高。特别是近年来各种大数据分析技术的不断出现,信息安全风险越来越严重,大数据分析技术主要是一种功能性很强的数据分析技术算法,从各种大容量的交易信息中快速获取所需要的交易数据[1]。
1 大数据的基本特征
1.1 容量巨大
十年前,对企业数据空间容量能够认知的单位仅限于mb,t和gb,但现在很多业务中所使用的最基本的企业数据空间容量认知单位已经发展到m和tb。百度、腾讯、阿里等网络科技公司规模已经达到万亿zb(1zb=1万亿gb)。目前,全球云数据量仍在快速增长,年增长率已经超过40%。
1.2 种类复杂
整体数据划分是一个整体性的数据概念,按照不同的数据划分处理方式,数据通常可以被准确划分分成多种类型,最常用和最基本的一种就是如何利用这些数据中的关键词来进行数据划分,有完全结构化的大数据、半完全结构化的小数据和非完全结构化的大数据。在以前小数据分析时代基本以完全结构化的大数据分析为主,随着现代数据分析技术的不断进步才逐渐出现了半完全结构化和非完全结构化的大数据。
1.3 处理速度快
大数据信息时代中的数据处理速度快是基本技术要求之一。如今,在物质数据走向资源化的发展趋势下,物质数据已然发展成为一种物质资源,但物质数据同现实生活中的物质数据资源不同,物质数据资源本身是不会完全消失和直接失去自身物质价值的。由于物质数据自身具有一定时效性,所以自身所能及时挖掘的物质价值可能稍纵即逝,如果大量的物质数据资源不能及时处理,可能会直接变成大量数据中的垃圾[2]。
1.4 价值密度低
价值性高是大数据最接近本质的重要特性之一。大数据之所以能够得到各行各业的高度重视,主要原因就是其背后巨大的潜在应用价值,但是它的潜在价值性和密度却很低。价值链的密度通常可以将其理解为构成有用户的数据在用户总数据中所对应占的最大比例。价值数据密度低的主要原因是庞大的统计数据量和复杂的数据类型,基数过大直接带来的不仅是有价值的有用数据,更多的是一些垃圾信息数据和带有无用值的数据[3]。
2 大数据的技术应用及风险
2.1 利用数据挖掘技术拼接出专家评委库
利用大数据挖掘分析技术,挖掘出以网上交易公共采购资源的通过电子商务平台交易为主要目的采购方向性,可以快速获得有效准确的采购信息。如根据国家政府采购管理活动过程中的相关要求,审核采购活动成果结束后就会公开采购专家委员名单,利用大数据挖掘分析技术,建立一个场所[4],如果积累了足够的交易项目样本,就可以逐个选出审查专家名单,之后利用数据清洗技术预测出投标人名单。
2.2 利用数据沉淀技术判断出投标习惯
数据信息沉淀分析又称为数据分析探查,一般定义是说泛指通过分析算法从大量分析数据中进行搜索得到隐藏在其中的大量信息的一个过程,与传统数据分析挖掘最大的区别在于数据沉淀分析技术,它可以根据传统相关计算规则将分散的大量数据进行集成化。不仅是停留在“挖掘”数据阶段,还可以实现智能化,自动分析形成有价值的数据分析报告。实际上,数据挖掘、数据合理清洗和数据合理沉淀等三个智能有机体系的相互配合已经发挥出了巨大作用,可以将数据挖掘沉淀初期技术应用到企业数据挖掘智能化的发展阶段。而这三个有机体系又可比喻为“开采”过程,“挖掘机”如何才能在数据挖掘矿山中挖掘出有价值的原料矿山,首先,通过分析数据对“过滤网”矿石进行合理清洗,其次对加工提取出的产量大、质量好的原料半成品矿石进行合理筛选,然后根据沉淀分析数据,利用“自动分选机”对不同的高质量矿石数据以及矿物原料进行合理分类并进行数据保存。如果企业建立了一套符合企业需求的数据维修管理模式,那么对于数据挖掘沉淀的直接评价结果也就可以直接判断为是投标评委企业的直接评价偏值习惯,确定直接评价的合理偏值区间,分析投标评委的直接评价偏值倾向等。
2.3 大数据的潜在风险
利用网络数据中心劫持网络技术非法窃取本次投标申报文件,数据被截取(或HTTP被截取)通常意味着来自网站的服务器数据在到达用户浏览器的途中被截取和更改,该数据出现在通过HTTP协议传输数据的网站上,具有广泛的意义。数据包是数据检测的变形形式之一,属于网络犯罪的一般类型,利用数据包技术可以窃取包括招标文件在内的许多秘密信息。
大数据技术还有另一个丰富的公共技术资源分支(被广泛认为大数据是新时代的技术衍生新技术而不是基于大数据的专属技术分支),这些都可能是公共资源,比如交易类的电子商务平台,使用rrsqls等注入方法攻击用户数据库等,会带来不同程度的安全威胁,如果攻击用户不确定如何输入攻击数据的真实合法性,用户甚至可以直接提交输入数据库并点击返回首页搜索源代码,获得想要知道的数据[5]。
3 数据公共信息资源
3.1 数据亟待确权
以企业数据安全主权体系为控制代表的“公共权力”和以企业数据安全权力体系为控制核心的“私权”共同组合构成了“数据权”的主权体系,数据安全主权体系有助于加强国家级企业对数据库的安全控制,但如果强调主权而忽视产业经济发展,会引起国家之间的信息对立。另外,公权力容易因为排斥和破坏国家私有权,受益将得不到有效法律保障。数据安全主权建设为国家有效保障网络数据安全主权提供了必要的政策法律依据,而实际网络数据安全控制力和分析处理能力最终直接体现了网络数据安全主权的有效实现,因此,维护国家网络数据安全主权的关键在于提高数据源的掌握力和分析处理能力。
3.2 加强数据专业化处理
当城市公共安全出现突发事件时,需要多个主管部门同时调动人力物力进行配合维护。所以,在构建城市联动公共安全行动预警系统中就需要充分利用大数据信息技术综合进行城市公共安全预警信息整合共享,统一指挥,快速管理形成城市联动安全行动预警体系。在完全进入紧急公共安全紧急处理状态后不同职能部门都需要始终能够保持紧密的配合练习与沟通协调[6]。
3.3 建立安全防护系统
3.3.1 加强病毒防护能力
病毒攻击防范管理系统已经是网络业务人员接入互联网网络架构中不可或缺的一部分。大数据管理平台为了进行统一的自有病毒设备防范系统管理,一般都会采用在啊客户端自动安装防病毒设备,这就要求防病毒设备软件系统能自动实现对使用大数据管理平台的自有病毒设备软件进行自动集中管理设置和自动安装,并同时可自动分发防病毒防护代码和软件引擎,实现相对集中的自有病毒防护代码和软件引擎的自动升级。
3.3.2 进行审计操作
针对目前大数据库各平台的违规数据库交互,需对不同平台数据库的违规SQL语义进行实时分析,提取统计出来与SQL语义中密切相关的数据要素(包括用户、SQL语义中的操作、表、字段、视图、索引、过程和调用函数等),实时分析所有来自各个应用层面的大数据库的请求活动,包括所有来自整个应用程序系统用户发起的整个数据库远程操作命令请求和来自整个数据库系统客户端管理工具的远程操作命令请求,以及通过远程命令登录整个服务器后的远程操作命令请求等以及通过远程操作命令行自动执行的违规SQL语义操作命令,并对这些违规的远程操作请求进行实时阻断。
4 结语
共享交易数据、公开共享信息的市场透明度一直是我国公共资源管理交易经营活动的基本法律要求和行业发展重要方向,我国公共人力资源管理交易的企业运营和信息服务管理机构大多已经拥有资源交易中的数据共享资源,但由于相关法律法规的严重缺失,数据共享的适用范围以及界限还没有公开。因此,随着公开的相关信息被公开,防止利用技术手段来非法获取利益的同时,公共资源市场交易监督管理局等部门也受到了高度关注。