大数据治理与安全技术理论及实践研究
——评《大数据治理与安全:从理论到开源实践》
2019-12-12夏汛,陈玲
书名:大数据治理与安全:从理论到开源实践
作者:刘驰,胡柏青,谢一,等
出版社:机械工业出版社
ISBN: 9787111579977
出版时间:2017年8月
定价:79元
在当今的时代背景下,大数据已经逐渐成为人们日常谈论的热点话题。大数据是伴随互联网与信息技术发展而产生的一类新兴技术,在各个行业的应用均具有广阔前景。但需要注意的是,在大数据应用为人们提供便利的同时,在具体使用过程中也带来不少安全问题。关于大数据治理以及安全技术的相关问题,已有学者从理论到开源实践进行了专门的分析和研究。
《大数据治理与安全:从理论到开源实践》一书共7章,主要分为2个部分,分别是理论篇和实现篇,除介绍相关基础理论以外,十分重视技术平台的搭建与部署。书中对相关内容的介绍本着“从简单到复杂,逐步深化”的原则。对于涉及到的其他相关知识点和难点都给予了比较细致的解释。该书作者结合一些实际的情境,分析相关方案的设计与实现过程,为一些学习者的实践提供有效的参考。本书理论章节主要包含前2章,第1章介绍大数据治理技术,包含基本概念、大数据治理的意义和重要价值,治理框架、治理的原则、范围、实施和评估;第2章介绍大数据的安全、隐私保护以及审计技术,具体内容包含:大数据安全的意义和重要作用,面临的问题与挑战,大数据安全防护技术,大数据隐私保护的意义作用,面临的问题和挑战,大数据审计的相关内容概述。在开源实现篇当中,包含其余5章,第3章阐述Apache Falcon技术的概况、发展近况、技术优势以及架构和使用情况,同时涵盖这一技术的场景设计和实现、性能与优化分析;第4章介绍大数据治理当中的Apache Atlas技术,对该技术的整体发展情况、技术优势、架构以及发展近况、配置和使用情况进行阐述,在使用当中具体介绍添加或者修改、配置Hive、配置Sqoop、配置Storm、配置Falcon等,同时也包含相关的场景设计、优化和性能分析等;第5章介绍大数据安全当中的Apache Ranger,对该技术的整体情况、发展史、概况、特点和作用、应用场景、架构和安装布置等内容进行介绍,包含其功能配置和优化、性能分析;第6章介绍大数据安全内容当中的Apache Sentry,具体分析其技术基本情况、发展历程、技术优势和架构、安装配置等内容;第7章介绍大数据安全当中的Kerberos认证内容,同样对该技术的基本概况、发展历史、近况以及认证流程、风险缺陷和实际应用举例等内容进行分析。
作者认为,在大数据日益快速发展的时代背景下,信息量呈现出快速的增长趋势,数据价值得到更多人的关注和认可。但是大数据在得到快速发展的过程中也带来了不少的问题,比如怎样对数据进行管理,让数据价值可以在安全的背景下实现最大化,这些问题还都没有得到比较完美的答案。在不同的时间段当中,结合业务需求的具体差异,数据也会呈现出差异化的价值。为了让数据价值得到最大化实现,互联网数据之间的共享也是不可避免的。但是,因为不同的企业和部门之间是一种相互独立的关系。在数据系统当中,所采用的存储结构也会存在着十分明显的差别,数据之间想要实现共享的目标很难,因此也就导致出现了信息孤岛的情况。互联网拥有十分庞大的群体,不仅需要推动数据共享发展的进程,同时还要确保数据和信息的安全性,让用户的隐私得到最大限度的保护。为了让这些问题得到有效解决,大数据的安全性维护和治理内容就成为了当前工业领域和学术领域的研究热点之一。大数据的治理目标就是为了构建起足够统一和标准的平台,从不同的数据体系当中获得相关的数据。作者认为,在采用生命周期理论对数据进行管理时,应允许不同主体针对数据开展相关的操作,比如数据的审计、筛选或者数据迁移等,让数据的价值可以得到更大程度的发挥。在数据业务流程处理的过程中,如果可以构建起比较标准的平台,可以针对用户、地点以及IP地址的差异,针对元数据的差异设置具体的对应权限,让数据的安全性能得到切实有效的保障。
综上,该书对大数据的治理和安全相关内容进行了深入分析,采用理论与实际应用相结合的方式,让读者对于大数据的安全以及治理有更加全面和详细的了解与认识,也为今后实际应用奠定坚实的基础。