大数据时代计算机信息处理技术探讨
2017-05-20李丽
李丽
摘 要:科学技术的发展使得计算机的信息处理技术也呈现出好的发展势头,网络技术也快速发展。当前人们的接受的信息量逐渐增大,信息的储存需求也扩大。以互联网为主要内容的计算机发展十分快速,微信、微博、物联网、电子商务等提出使得人们的生活发生了极大的改变,同时也带来了海量的数据。大数据时代的到来使得计算机处理技术成为重要关注的内容,能够更好地促进网络技术发展。本文就大数据时代计算机信息处理技术进行简要的阐述分析。
关键词:大数据时代;计算机信息处理;技术
中图分类号:TP311.13 文献标识码:A 文章编号:1671-2064(2017)08-0035-02
如今数字化、信息化的发展水平逐渐提高,信息数据快速增长,计算机技术在社会生产生活各个领域都有广泛的应用,能够实现信息的有效交换,检索和储存信息,并利用计算机技术科学的处理数据信息,实现资源的优化配置,促使社会效益的顺利提升。在大数据背景下,信息数据的数量增多,形式多样化,计算机信息技术技术也遇到了较高的要求,因此需要科学的研究大数据时代的计算机信息处理技术,更好地满足人们的实际需要。
1 大数据概述分析
大数据,从直观上理解就是数据信息量十分巨大,在大数据背景下,信息海量,这就要求计算机硬件以及软件设备也有较强能力,但是对于目前的计算机硬软件设备而言,还不能在短时间内对行数据进行读取、储存和处理,也不能将准确、全面的数据服务提供给用户。一般而言,数据量达到10TB(约1.0x104GB)到1PB(约1.0x108GB)以上时,就可以被叫做大数据。从2005年到2015年,10年间的全球数据量总130EB增长到7910EB[1]。(1EB=1024PB=1018)如下图1所示。
大数据中包含庞大的信息量,能够快速的处理信息,并且呈现出多样化的结构形式。大数据时代下的计算机信息量能够超過1ZP(约1.0x1012GB)的数量级。与传统1TB(约1.0x103GB)数量级相比,是呈几何式翻倍的[2]。而且大数据中的信息流都是实时储存,传输速度比较快,要使用大数据处理设备才能够对这些信息流进行实时高速的处理。大数据中有很多组成内容,如视频、音频、图像、网页等,格式存在差异,因此在信息处理过程中难度也比较大。
2 大数据时代计算机信息处理技术
2.1 数据感知以及获取
Deep Wed是一种网络深层的空间利用技术,在数据过程中有着自身的特点,数据规模比较大,呈现出高频率的动态性变化,并且分布的范围也比较广。实用Deep Wed技术能够高效的利用数据信息,集成数据信息,使得数据信息能够被科学的抽取以及整合,保证数据信息能够实现综合性的利用,并进行动态化的处理。
2.2 分布式的储存处理数据信息
这种对数据信息进行分布式的处理方式是Google公司提出的,将GPS技术作为代表,并在IBM、百度等数据企业都有着广泛的应用,有助于实现持续化的发展。分布式的数据信息处理储存技术将列作为基础单位,进而储存数据,对数据信息进行压缩操作,实现快循环,保证不同服务器间数据信息能够实现快速的传输与处理。利用这种形式能够使得行列混合的数据储存结构在一定程度上得到改善,能够在短时间内加载大量的数据信息,在对数据信息处理查询时不会花费大量的时间,并且也能够提高磁盘空间的利用率。
2.3 数据索引技术
BigTable是Google设计的一种分布式数据存储系统,能够对海量数据进行处理的一种非关系型的数据库。是当前最为主要的一种网络数据索引技术。利用互补式聚簇索引和聚簇索引动态化的索引数据。以索引顺序对数据结构进行储存的是聚簇索引。将副本作为索引列的,在互补的形式下进行索引的就是互补式聚簇索引。结合不同的查询结果估算方式,保证数据信息能够得到很好的查询与规划。
2.4 数据挖掘技术
以信息知识内容作为主要依据的数据挖掘技术主要涉及两个方面,网络信息搜索技术和实体关联技术。网络中的搜索信息主要是通过排序学习算法,将媒体信息量作为关注数据,将此作为样本学习算法数据,实现数据的排序,实现逐点、逐对、逐列,利用生物界的进化发展搜索信息,从而使得平台需要得以满足。关联分析要提取信息需要,并对这些数据进行科学的处理,从而能够获得潜在的知识与数据,从而更好地应用。比如在市场销售管理中,条码技术的发展使得数据收集更加容易,并且也比较快速,条码中储存了大量的交易资料。如,关联规则可以表示“购买了项目A和B的顾客中有95%的人又购买了C和D”[3]。这种关联能够将信息数据提供给商品的销售、布置、生产等,使这些环节有科学的依据作为指导,促使市场销售更具针对性。
2.5 数据接口
ALE-Idoc数据接口技术的数据支撑系统是分布——集成式SAP系统,将数据接口提供给SAP的中间环节,保证不同空间的系统也能够建立起关系,强化系统间的联系性。利用接口技术中的ALE处理,实现同步或异步传输,能够集中化的处理分布式的数据信息,能够使不同SAP数据库之间的数据实现同步的服务。同步服务中,将Idoc格式作为主要的数据格式,从而提高数据的完整性,并保证不同SAP系统间的数据有可识别性,在每一个系统中都可以使用。Idoc结构涉及很多部分,如数据控制头、状态记录以及数据段等。使用ALE-Idoc技术处理数据,能够将Idoc数据及时输入到外部系统数据中,并对转变格式,并实现Idoc数据的储存、显示等[4]。
3 结语
在大数据时代背景下,数据信息的容量大,来源广泛,并且以多样化的形式存在,传统的计算机技术已经不能满足其发展需要,引出需要计算机技术进一步发展。要科学的对信息数据进行采集、储存以及管理,深入计算机技术研究,使得计算机信息处理技术得以有效的完善,能够更好地为社会生产以及发展提供服务。
参考文献
[1]何骞,曾川,张金榜.大数据时代的计算机信息处理技术分析[J].无线互联科技,2014(12):147.
[2]张轲.“大数据”时代的计算机信息处理技术探讨[J].计算机光盘软件与应用,2015(01):126-127.
[3]石玉芳.基于“大数据”时代剖析计算机信息处理技术探究[J].科技创新与应用,2015(31):90.
[4]詹少强.基于“大数据”时代剖析计算机信息处理技术[J].网络安全技术与应用,2014(08):49-50.