大数据云计算环境下的数据安全分析与对策研究
2020-07-18王凤领
◆王凤领
(贺州学院数学与计算机学院 广西 542899)
随着互联网技术的不断发展,网络行业的信息量不断增加,人们越来越依赖网络,利用信息技术完成的事情越来越多,信息传输的速度也越来越快。大数据云计算作为新时代的产物,主要用于大量数据的处理,为互联网的资源交互提供了重要途径,提高了计算机的工作效率,在实际使用过程中,大数据作为海量的数据库,由于分布式、开放性的特点所带来的数据安全问题,在大数据云计算环境中,如何保证数据的可靠性和安全性,成为当前需要考虑的关键问题。
1 大数据云计算的概述
大数据云计算是现代社会出现的一种新的计算模式,它主要是将原有的计算机技术与网络技术,如网络存储、网格计算、负载平衡、分布式处理、虚拟化等相结合而产生的一种计算方式,是将大量的计算机虚拟化技术集成到计算机系统中,借助相应的服务模式SaaS、IaaS、PaaS,实现计算机资源的远程配置,以满足用户对实际信息资源的需求,方便用户自己与计算机远程系统连接,利用该技术,用户可以实现自身需要的相关数据计算[1]。
2 大数据和云计算的关系及优势
2.1 大数据和云计算的关系
随着新时代的到来,大数据技术和云计算技术是新时代的应用技术。大数据是传统数据库软件工具在数据采集、管理和分析能力之外的数据集合,数据量相对较大,数据流动相对较快,数据类型多样,通过大数据处理加工可以实现增值的目标[2]。云计算的计算速度快,是互联网技术支持的一项新技术,在实践中得到了广泛应用。随着云计算的出现,人们对大数据的关注越来越多,大数据和云计算之间的关系也越来越密切,由于大数据必须有专门的技术支持,才能对数据进行有效的处理,实时大数据集分析被用来分配工作给多台计算机,需要分布式处理,它的主要特点是分布式挖掘海量数据,通过云分布式处理和分布式数据库以及云存储完成的,如图1所示。
图1 大数据与云计算
2.2 大数据云计算的优势
大数据云计算与传统的数据管理方式相比,具有不可替代的优势使用大数据云计算服务平台,主要包括:
(1)数据处理速度较快
随着科学技术的飞速发展,云计算服务平台的应用可以处理大数据时代的信息,提高计算机的整体性能。过去,虽然信息处理速度很快,但没有得到充分利用,造成了实际工作中资源的浪费,利用大数据云计算服务平台可以提高计算机的使用效率,快速完成信息处理[3]。
(2)处理能力强,成本低
大数据云计算与传统的计算机数据处理技术相比,将所有的计算机数据和信息集中到一个系统平台上,集成了最新的计算机网络技术,便于实际用户信息处理。大数据云计算在实践中是分布式处理设备、网络技术、集群技术等综合性工作,与实际终端连接,访问实际的信息资源,用户可以登录到相应的云客户端来实现最终的用户操作,用户可以在更短的时间内获得大量的数据和信息资源,该方法突破了原始资源的局限性,提高了资源搜索的效率[4]。
(3)使用管理方便
采用虚拟技术,大数据云计算将所有的数据资源连接起来,用户在搜索数据资源的过程中不需要考虑时间因素的影响,由数据处理软件或人工对其进行管理,自行完成信息资源的搜索工作。用户在实际资源查询中,可以在现有的虚拟技术平台的帮助下自由使用资源,虚拟技术的使用不会对硬件有太多的要求,只需将实际用户需求交给大数据云,不需要关心资源信息的来源,就可以获得所需的资源,在实际资源信息查询中用户会更加方便使用,同时也在一定程度上降低了用户的成本。
(4)灵活性的服务平台
大数据云计算服务平台本身可被视为一个相对封闭的网络空间,在互联网开放的情况下,只有使用正确的登录密码才能访问,因此,在大数据云计算服务平台的实际应用中,它可以降低对计算机性能的需求,提高计算机使用的有效性[5]。
3 大数据云计算环境下数据安全重要性和数据安全问题
3.1 大数据云计算环境下数据安全重要性
随着科学技术的飞速发展,大数据云计算环境下的数据安全问题变得越来越重要,不仅对科学技术和经济发展产生了负面影响,而且对计算机网络技术的普及也产生了影响。由于计算机网络技术在我国应用较晚,没有完善的网络安全防御机制的支持,很容易受到攻击。基于网络计算和分布式处理的大数据云计算作为一种新的计算机技术,其扩展更为方便,在这种情况下,与传统计算机技术相结合,显示出动态的发展趋势,只有不断更新大数据云计算技术,提高安全管理的效果,才能提高大数据云计算环境下的数据安全性[6]。
3.2 大数据云计算环境下数据安全问题
从数据安全问题可以看出,大数据云计算环境中的数据安全问题反映在许多方面,主要的数据安全问题包括以下几个方面,如图2所示。
图2 数据安全问题
(1)数据访问安全问题
在大数据云计算环境下,数据访问安全问题十分突出,用户非法访问数据的现象十分明显,这种安全包括内部安全和外部安全。当用户将所有数据输入云平台时,内部人员没有做好相关的安全防御系统,数据可以通过远程控制访问,云平台会受到黑客攻击,很难保证数据和信息的完整性。用户为企业内部员工不按规定操作,在应用大数据云计算方式时,也会影响数据安全。因此,有必要通过一定的政策和内部人员的管理限制来限制用户的数据访问,如果不严格遵守数据安全管理规定和大数据云计算的操作要求,也会对数据安全产生一定的影响[7]。
(2)数据隔离安全问题
随着技术的发展和人们需求的提高,数据隔离安全问题已经成为人们关注的问题,是大数据云计算环境中的重要安全问题。从使用的角度来看,大数据云计算是企业或政府部门的集体用户,主要是出现在大部分用户共享操作中,由于数据共享往往发生在企业的运作过程中,当数据传输和共享过程中,数据加密处理不好,或者企业的大部分数据没有与外部计算机隔离,就会给黑客破坏数据安全的机会,造成资源信息泄露。目前,还没有真正建立隔离系统,是当前企业组织利用大数据云计算环境进行数据隔离需要重点关注的问题[8]。
(3)数据销毁安全问题
在使用大数据云计算平台时,为了提高数据的安全性,有时会出现数据损坏安全问题,有必要做好根源预防工作,所以在数据的使用和读取中,为了防止数据泄露,最好是立即删除,但如果数据不在终端清理,数据就容易被盗窃和泄漏,对数据量大的需要一定时间来破坏数据,此时数据可能被盗,而数据残留又很容易给入侵者提供利用的机会,还有一些用户通过技术手段恢复数据时,导致数据泄露,另外,网络系统本身就有漏洞,数据存储在云端后,存在数据完整性安全问题,大量数据的移动也增加了网络负担,黑客利用漏洞进行攻击,从而导致数据信息泄露[9]。
(4)监控回应问题
随着数据业务的不断增加,当大数据为更多的企业与个人服务后,大数据的系统和应用将发生变化,数据安全问题也会发生一些变化。例如,中间的恶意攻击人员通过相应的干扰操作,阻断了实际用户之间的良性合作,对大数据系统造成了一定的影响。当数据系统出现问题时,需要管理人员进行不断维护,将消耗大量的人力物力来查找出实际的问题,由于系统的具体问题不明确,无法及时采取有效的政策,实施相应的救助措施,从而增加了实际检测的难度,最终造成了用户和系统的双重影响[10]。
(5)访问路径多问题
在用户资源使用过程中,由于网络存储路径的前端相对较多,以便于下一次信息搜索,数据资源通常是为了方便下一次查询而存储的,而网络存储设备的前端也会包含各种不同的设备存储服务,恶意入侵者可以通过不同的路径来发现漏洞,以便攻击整个服务系统,虽然实际用户操作方便,但对这么多的网络访问方式,也给用户的实际资源数据安全带来了一定的威胁。
4 大数据云计算环境下的数据安全策略
4.1 建立完善的数据隔离防护系统
为数据存储提供良好的服务,首先要改进云的后端服务器,根据用户类型设计处理范围,对于数据类型隔离传输,有针对性地进行数据处理。设置好安全密钥,对于数据进行加密解密,提高用户访问限制,设置有限审查数据访问,对网络保护系统进行定期检查、漏洞检测,提高云数据环境的安全性[11]。
4.2 做好数据的备份与恢复
随着科学技术的发展,数据存储方式也在逐渐增加,数据存储量的增加造成的破坏风险也在增大,有些数据破坏后很难恢复或无法恢复,为了避免系统故障造成的数据丢失,有必要对数据进行分类和备份。此外还要在系统里追加恢复已销毁数据,这个功能由主机实现,特别是重要的数据恢复至少要设计多个密码,加以防止有人窃取重要信息,另外,为了防止将来出现突发情况,重要数据要加密备份,使用后要及时销毁。云计算服务平台就是要养成随时备份数据的习惯,为了减少信息被盗的可能性,利用物理隔离可以确保数据安全,利用不同服务供应商的云端平台用户可互相备份数据,避免因云端运算平台的数据丢失而造成严重后果[12]。
4.3 加密储存数据
通过加密存储数据来防止用户信息被访问和篡改。即使它被访问,由于加密的信息是乱码,查看不到具体内容。在加密管理方面,应采用集中式用户分发机制和密钥管理,在选择加密算法时,采用具有较高加密性能的对称加密方法,实现对用户信息存储的高效、安全的管理和维护。对于虚拟机服务,用户在上传数据之前对数据进行加密。对于云存储服务,云计算支持加密服务来加密数据存储,以防止其他人非法窃取信息。
4.4 避免所有数据在“云”端处理
为了保证数据在实际使用中的安全性和稳定性,在数据处理过程中需要对数据进行关键数据、重要数据等分类,需要对重要数据进行备份,即不仅可以在云中保存一份副本,而且还必须采用传统的数据管理方法保存另一份副本,加以确保数据不会丢失。如果存储在云端的数据有问题,使用另一份数据进行工作,同时,应开设带有个人身份识别的云端数据进行管理和处理,保证信息不会被泄露,以确保数据的安全性[13]。
4.5 强制执行非法访问
为确保大数据云计算平台对于任何想要获取信息以识别用户身份的人来说,一旦身份不能满足需要,他们就不能登录到云计算服务平台。为了避免现有云计算服务平台的非法入侵,需要提醒其他用户迅速管理和保存数据,除了要求用户确认账号、密码等外,还可以将其绑定到电子邮件手机上,采用不同的方式在登录过程中来提高云计算服务平台的安全性,使数据的管理和云计算服务平台更加安全,避免信息被盗的风险。
4.6 做好身份认证
随着组织网络、系统和应用的扩展,在大数据云计算中,一些权限逐渐分散,数据控制模型和信息管理也出现了问题,这个问题如果不能有效地解决,将影响云计算服务的正常使用,身份认证是基于身份体系结构的,通过对账户口令进行认证,保存用户的账户信息,而不是在所有系统中使用,为了实现最终的访问,有必要建立专门的身份认证模型。因此,为了更好地满足用户的身份认证需求,云计算系统应建立相应的身份认证和系统授权,不断改进和完善身份认证技术。
4.7 增强数据访问控制
在复杂的大数据云计算环境中,需要改进访问控制技术以便于更好的控制,不同维度的数据需要分别处理,以确保数据的完整性。为了控制对数据的访问,必须结合专业技术,访问控制技术主要有自主访问、角色访问和受控访问。自主访问技术主要由客体控制,用于小用户,权限相对稳定、简单;角色访问的主体是实际用户,用于机构的执行阶段;受控访问能够做好主客体的分类工作,与以前解决方案相比,该方案更适合云计算系统[14]。
4.8 完善审计与监控措施
作为网络管理部门,需要加强对所有云计算平台的监控和管理,当用户向大数据云计算系统提交数据时,他们必须向专业的第三方认证,快速提醒,确保云数据的安全,并定期更新云计算平台和安全系统的更新,以确保安全系统及时对市场出现的病毒进行防御,确保云平台使用的安全。为确保大数据云计算平台的使用安全,所有平台服务供应商在向用户提供服务前,均须接受国家有关部门的一系列审核,除了云计算服务平台的硬件设施外,也须审查服务供应商的管理及安全应变机制,以确保大数据云计算平台投入社会使用后,具有一定的稳定性及安全性[15]。
5 结束语
随着社会和计算机技术的发展,为人们的生活提供了方便,大数据云计算解决了大规模数据分析和处理的平台,是在计算机应用的基础上创建的,大数据在现代数字信息时代的应用已经成为一种趋势,从目前的整体发展来看,大数据云计算环境下的数据安全仍然存在许多隐患。为此,应该从现有技术出发,通过对不同时期、不同阶段的数据安全问题的不断分析和探索,找出相应的安全保护措施,提高数据安全性,使大数据云计算能够更好地为人类服务。