基于人工智能的大数据安全技术应用研究
2023-02-26张文宝
[摘 要]当今社会已经进入了大数据时代,各行各业的数据规模都在呈TB级别增长,为了有效利用这些规模庞大的数据,越来越多的企业逐渐开始搭建自己的数据平台,并向着数字化企业转型。在此背景下,如何确保企业IT安全,如何保障企业大数据的完整性、可用性和保密性,不受信息泄露和非法篡改的安全威胁影响,已成为政府部门、事业单位、国有企业与民营企业所考虑的核心问题。大数据安全技术的研发和应用,是保证大数据安全的关键,然而传统的数据安全技术如今已难以防范和应对数据威胁手段,而人工智能技术因其智能化、高效率的优势,在近几年迅速发展并得到广泛应用,将其应用到大数据安全技术中,能够大幅提升数据安全性,进一步降低数据安全风险。本文主要探讨基于人工智能的大数据安全技术,以期通过不断完善技术性能,保障数据安全,促进各行各业的蓬勃发展。
[关键词]人工智能;大数据安全技术;发展前景;技术性能
doi:10.3969/j.issn.1673-0194.2023.19.046
[中图分类号]TP308 [文献标识码]A [文章编号]1673-0194(2023)19-0153-05
1 大数据时代背景下影响大数据安全的因素
大数据时代背景下,数字化企业想要有效利用大数据,需要不断地收集、存储、加工和分析数据,各类大数据应用导致数据变得更加集中,数据集中虽然增大了其业务价值,但是也会带来更大的风险。影响大数据安全的风险因素可分为网络安全风险因素、数据库安全风险因素和人为安全风险因素三类,这些风险因素会使得数字化企业的安全边界消失,数据资产遭受严重损失。
1.1 网络安全风险因素
大数据时代下,传统的基于防火墙、IPS构建的企业网络安全边界失效,因为海量数据被企业主动收集,致使防火墙的防护性能受到冲击,再加上数据本身吸引着不法分子的觊觎,使得企业的网络防护时刻处于防御状态,久而久之漏洞越发明显,自然无法有效保护数据,可见网络安全风险是對大数据安全影响较大的因素之一[1]。
1.1.1 计算机病毒
随着计算机技术的不断发展,计算机病毒的等级不断提高,危害也在逐渐加大,其复制能力、创新能力和感染能力得到大大加强。借助互联网的传播,计算机病毒会传播得越来越快,传统的网络防护手段的发展很难跟得上病毒的进步,致使企业数据有很大可能受到病毒的威胁。
1.1.2 黑 客
很多企业的大数据具有很高的利用价值,不论是商业对手,还是数据贩卖方,都有可能采取不法手段获取数据,比如雇佣黑客恶意攻击企业网络平台、非法入侵企业数据库等,从而盗取、篡改甚至是删除关键数据,传统的网络防护手段很难应对黑客层出不穷的入侵方法,会导致企业数据资产受到较大损失。
1.2 数据库安全风险因素
除了网络安全风险因素之外,数据库本身的安全风险也会导致大数据出现泄露和损毁状况。
1.2.1 硬件损坏
大数据需要存储在物理硬件设备中,这些硬件设备如磁盘驱动器、数据存储介质和数据库机房等很容易受到自然灾害、电磁干扰、电源故障等因素的影响,如果企业没有采用合适的监控和处理办法,将会造成计算机数据被破坏[2]。
1.2.2 数据库设计
很多企业为了节省开销,往往会省略建立物理数据库的过程,转而租赁云端数据库,但是云端数据库很有可能因为设计问题导致数据出现泄露和损毁的情况,比如云服务器分为公有云和私有云,公有云与应用程序对接、私有云与存储设备对接,在数据上传后还未存储到私有云之前的这段时间里,数据库很容易受到外部攻击而出现数据泄露的情况。
1.3 人为安全风险因素
人为安全风险因素是除了以上两种因素之外,对大数据安全影响最大的因素,通常,规模越庞大的企业越容易受到人为安全风险因素的影响。
1.3.1 员工组成
很多企业习惯于雇佣外包团队,让外包团队负责一些机械性、复杂度较低的工作,如果企业数据平台使用权限管理不够严格,就会导致企业的一部分重要权限对外包团队放开,外包团队的员工构成复杂,员工素质良莠不齐,甚至还有可能存在商业间谍,对企业的大数据安全管理有一定程度的危害。
1.3.2 员工素质
企业自身招聘的员工也存在一定的数据库操作风险,比如新来的员工出现人为操作失误,致使某些重要数据被误删或是修改某个系统参数致使某些重要数据没有被利用等;再比如内部员工收受外界的贿赂,违规泄露重要数据;又或是内部员工对公司不满,恶意外泄数据。总而言之,员工素质对大数据安全的影响必定存在,且传统的数据防护技术很难防范这类数据威胁手段。
1.3.3 第三方合作者
企业与第三方合作时,双方需要交换一些数据,很多情况下,这些商用数据对双方都非常重要,如果企业没有采取有效的监管措施,将会让数据处于非常危险的环境,第三方合作者往往不了解数据对本企业的重要性,很有可能造成数据被泄露和篡改。
2 人工智能技术对大数据安全保障的重要性
人工智能技术可以有效应对上文提到的各类大数据安全风险,因此在提高大数据的安全保障方面有非常重要的作用。
2.1 人工智能与大数据安全技术较为适配
人工智能出现于20世纪90年代,成熟于2010年前后。早期的人工智能更多利用模板法、机器学习等算法工作,对数据量要求不大。随着技术的发展,当前的人工智能主要是通过构建模型、喂入训练数据、不断迭代训练、经历多轮测试而形成的神经网络模型技术。由此可知,目前的人工智能想要训练成熟,需要提前准备大量的有关数据,而且数据越精准,人工智能模型将会越智能。大数据安全技术本身便是与海量数据打交道,因此不论是哪种技术都能够提供多种类、多数量的数据,因此适合将人工智能应用其中[3]。
2.2 人工智能可以提升大数据安全技术
大数据安全技术来自数据安全技术,后者包括数据加密、数据库加密、数据传输安全、通信身份认证、数据备份、数据迁移、异地容灾、磁盘阵列等从线上到线下的数据防护技术,而这些技术只是大数据安全技术的基础。当人工智能与这些数据防护技术结合在一起时,会大幅提升数据安全技术的防护能力。比如身份认证技术,可以保障通信双方在传输数据前鉴别对方的身份,从而让不该看到数据的人看不到数据,但是通信双方一旦变成一对多(比如云服务),又或是通信双方变成自然人对机器(比如企业员工想要浏览数据库),就会出现未经授权的人仿冒有权限人的身份的情况,传统的身份认证技术如数字签名、公钥与私钥密码、口令认证等方式存在一定的局限性,而人工智能则提供了诸如声纹验证、虹膜验证、面部识别等智能化身份验证手段,大大提升了大数据安全技术的防护能力。
2.3 人工智能可以从多个角度保障大数据安全
前文列举了传统数据安全技术的几个方法,它们能够从线上到线下多个角度保障数据安全,但是如今的数据威胁手段数量大、种类多、攻击频繁,如果单纯靠人工防护或自动化防护,难以覆盖大部分风险,将人工智能与大数据安全技术配合在一起,能够智能化防护大部分已知威胁,还能预测未知风险,从而从多个角度防范各类数据威胁手段,足以见得人工智能的重要性[4]。
3 基于人工智能的大数据安全技术应用
基于人工智能的大数据安全技术应用将不再只面向数据,而是面向人和数据。如图1所示,新的面向人和数据的安全模型将从人/行为与数据两方面出发,将基于人工智能的大数据安全技术应用于人员行为解析、数据综合管理、身份认证、网络安全等工作。
3.1 在人员行为解析中的应用
基于人工智能的大数据安全技术在人员行为解析中的应用主要是为了应对前文提到的人为安全风险因素,综合企业员工、外包员工和第三方合作企业的所有风险行为,大致包括以下几点:Web上网、收发邮件、数据蓝牙共享、文件打印、数据库操作、项目开发代码操作等,可将其划分为网络行为、协议行为、事件行为和终端行为。
使用大数据分析技术可以将上述操作中的异常部分送入模型中训练,通过对准确定义的策略场景進行基于用户行为的深度分析,完成精准威胁行为模式预测,从而预测出员工的离职倾向、离职泄密风险、感染木马病毒的概率、恶意感染病毒的泄密风险、异常数据传输倾向、邮件转发的恶意泄密风险、不良信息扩散风险等。
大数据分析技术具有非常广阔的应用前景,只要预定义数据足够充分,便能够对数据进行有效分析,并且数据种类越复杂,模型的抗噪声干扰能力将会越强。大数据分析技术用于员工异常行为检测,能够帮助企业降低员工管理难度,及时发现潜在行为威胁,而且还能生成威胁情报分析报告、用户可信度分值计算报告等,从人的角度完成数据安全防护的任务。
3.2 在数据综合管理中的应用
基于人工智能的大数据安全技术在数据综合管理中的应用主要是为了应对前文提到的数据库安全风险因素。使用智能监控技术能够及时发现数据库物理设备是否出现损坏状况,还能够提前预测物理设备的使用寿命、使用情况、周遭风险等,对自然灾害如水、火、地震等灾害预测尤为精准,而且智能监控技术还可以提供必要的解决方案,帮助企业做好及时应对,从而减少数据和财产的损失[5]。
另一方面,大数据脆弱性检测技术可以周期性扫描数据库和数据平台的漏洞,包括风险展示、脆弱性检查、智能报表管理等;大数据资产梳理技术可以自动识别敏感数据,并对敏感数据进行分类;大数据应用访问控制技术可以对数据库用户进行统一管控和集中授权,提供了细粒度级的访问控制能力。这些大数据安全技术都能够帮助企业进行数据综合管理,有效防范数据被损坏、泄露、篡改的风险。
3.3 在身份认证中的应用
基于人工智能的大数据安全技术在身份认证中的应用主要是为了解决未授权人仿冒有权限人进行数据操作的问题,传统的数据安全技术一般采用密码、密钥、口令等非智能识别手段,一旦密码被他人得知,便有数据泄露等风险,而且还会损害当事人的财产,而声纹识别技术、虹膜识别技术、面部识别技术等动态智能识别技术能够有效保证有权限人的身份唯一性,只有有权限人亲自操作,才能通过系统认证,从而杜绝了他人仿冒的可能。
3.4 在网络安全中的应用
如图2所示,当传统面向边界的网络安全模型不再有效的时候,传统基于好坏的鉴别机制将不再有效,并且围绕传统数据防护技术的网络安全工程将不再适用,如今新的网络防护技术手段需要融入人工智能技术,最终形成多个大数据安全技术,并很好地应用于大数据时代的网络安全防护中。
3.4.1 新一代防火墙
新一代防火墙能够很好地防护当前复杂、繁多的病毒和木马,并且由于加入了人工智能技术,防火墙将会变得更加智能,不但能够识别已知的病毒和木马,还能够有效预测未知的病毒和木马,并且病毒和木马越多,防火墙的训练数据也会越多,网络防护能力将会更强,使得其在攻击与防护的“军备竞赛”中,始终处于强势地位。
3.4.2 Web安全网关防御
Web安全网关防御主要是起到检测、杀毒、扫描漏洞等网络防护作用,让数据库或数据平台始终处于立体的防护状态中,通过应用这种智能监测防护手段,系统计算能力将得到快速提升,病毒和黑客即使绕过防火墙,入侵到系统内部,也会被及时发现并清除,让危险因素只能短暂停留,无法造成大的损害。
3.4.3 反恶意软件
反恶意软件的主要作用是防范垃圾邮件、木马软件、钓鱼网站等具有一定伪装能力的恶意软件,这些软件可以在用户不知情的情况下造成数据损害,而人工智能技术通过反恶意软件能够实时监测系统用户的网络操作,并给出风险提示,引导用户正确上网,从而确保大数据网络的安全性。
主要参考文献
[1]林雨佳.人工智能技术应用中数据安全的刑法保护[J].东南学术,2022(6):135-142.
[2]高德胜,季岩.人工智能时代个人信息安全治理策略研究[J].情报科学,2021,39(8):53-59.
[3]丁康健,刘立栋. 人工智能技术在高职院校网络安全防御中的应用研究[J]. 软件,2021,42(12):71-73.
[4]汤曦. 人工智能技术在大数据网络安全防御中的应用探
究[J]. 智慧中国,2022(3):83-84.
[5]冀冠楠.大数据挖掘技术在网络安全中的应用与研究[J].信息技术与信息化,2020,36(10):248-249.
[收稿日期]2023-06-05
[作者简介]张文宝(1978— ),男,黑龙江克山人,工程师,主要研究方向:信息技术。