云计算技术在计算机大数据分析中的运用
——评《云计算与大数据》
2020-09-10梁昊
书名:《云计算与大数据》
作者:孙宇熙
出版社:人民邮电出版社
ISBN:978-7-115-43572-9
出版时间:2016年12月
定价:49.8元
云计算本质上是一种分布式计算,即通过将需要处理的海量数据信息分割成大量“小块”,再交给无数个小程序分别处理后合并结果,最后反馈给用户。其优点在于计算速度快、计算量大。而大数据则刚好相反,大数据并不直接对数据信息进行处理,而是从近乎没有确切边界定义的“泛化”海量数据中发掘或者说“提纯”目标信息,这对网络架构和数据处理能力有着相当高的要求。就目前而言,大数据无法仅靠单台计算机完成海量数据处理,它还需要借助分布式体系架构来实现,于是云计算与计算机大数据处理的融合“联动”顺理成章。
由孙宇熙著,人民邮电出版社2016年出版的《云计算与大数据》一书,从云计算简史及其发展历程出发,细致、深入地讨论了当前大数据所面临的五大问题,厘清大数据与云计算之间错综复杂的关系,从公有云、私有云、混合云等多个角度解读行业内软硬件定义、硬件回归的趋势。同时,该书还引入两大经典平台建设案例,即大数据平台搭建、混合云平台搭建,帮助读者进一步理解该书理论要旨。该书取材新颖独特,十分贴合当前云计算、大数据前沿发展,兼之用语凝练通俗,行文流畅自然,立意新奇、引人入胜,可作为高校计算机信息处理相关专业教学以及大数据专题讲座培训教辅材料,也可作为云计算、大数据相关领域爱好者及研究机构参考借鉴资料。
近年来,得益于大数据算法和云计算技术的广泛渗透和应用,社会劳动力得到很大的解放,办公效率得到显著提升,促进各领域资源优化配置。但是从目前来看,我们对云计算技术的应用开发仍处于探索阶段,云计算技术本身的实践和进阶优化都有待持续推进。鉴于计算机对人们生产生活影响持续深入,笔者在扬州市科技局2019年市级政策引导计划“软科学研究”(YZ2019169)基金项目的帮助下,并借鉴《云计算与大数据》中对大数据体系架构和云计算实践的深刻阐述和细致分析,尝试对云计算技术与计算机信息处理、大数据分析应用等进行探索,希望可为当前云计算、大数据以及计算机应用开发等方面研究提供一定参考。
计算机大数据处理是提升企业决策力、洞察力、行业发展趋势以及提升自身综合竞争力的重要途径,也是企业提升自身信息资产的重要方式。当前云服务已非单纯的分布式计算,而是兼容了如效用计算、并行计算以及虚拟化计算等多种计算机应用技术的优势并实现多次跃升进阶的“融合体”,其运营核心仍是计算能力。信息时代,无论是云计算还是大数据分析,都要面对复杂、多样且不断变化的海量数据,计算机大数据分析处理在进行数据提取和“挖掘”工作时,可以充分利用云计算超高速计算的优势功能,对不同类别、不同属性的数据资源进行快速而精准的分类,方便计算机进行网络数据资源分类;利用云计算的高效计算,提升计算机大数据分析中对挖掘高维度数据和高速数据流的能力。
访问抓取是大数据分析不可避免的问题。在实际的计算机大数据分析中,信息数据越庞大,计算机进行数据访问、抓取的频率就会越高,要想提升计算机大数据分析的精准性,就需要提高数据识别精准度。利用云计算的标记特性,计算机可以快速抓取目标数据,并挖掘其隐藏数据,此举还有助于云端数据损毁的恢复。
计算机大数据分析需要根据相关网络规则对网络资源数据进行“精准放置”,这是大数据分析的一大战略重点。但是计算机依靠云计算技术进行大数据分析时,由于储存介质的多样性,所构建的网络储存系统必然复杂化,这就让数据的精准放置实施成为困难。利用云计算的快速、稳定计算以及根据需求部署计算机资源的功能,明确数据放置的储存类型,并制定相应数据放置的具体协议,优化计算机访问精准性,减少云端资源的不必要浪费,也提升大数据分析的效率。
此外,云计算的加密技术为计算机大数据处理分析提供了数据的安全性、可靠性。数据的伪装性和隐藏性是运用云计算技术“联动”计算机大数据分析的关键,对云端数据采取加密算法处理,并将信息数据与密钥上传云端,在获得用户申请且成功的前提下,用户才可以下载文件,文件在下载过程中也会采用加密算法处理,为数据信息提供全程安全保障。