APP下载

大数据环境下计算机信息处理技术研究

2024-11-29蒲海红

电脑知识与技术 2024年27期

摘要:大数据技术与计算机信息处理技术的迅猛发展,推动了信息时代的到来。在信息时代,海量结构化和非结构化数据的涌现,使得计算机信息处理技术愈发显得重要。该技术通过数据收集、存储与分析,确保了网络的高效运转,并推动了科技的进步。文章阐述了大数据及计算机信息处理技术的内涵,分析了大数据背景下计算机信息处理技术的种类、特点及其应用问题,进而提出了相应的提升路径,以供参考。

关键词:大数据;信息处理技术;数据挖掘;数据安全

中图分类号:TP311 文献标识码:A

文章编号:1009-3044(2024)27-0066-03

随着信息技术的快速发展,互联网应用日益普及,海量数据不断涌现。如何高效地进行数据处理,已成为信息时代亟待解决的关键问题。计算机信息处理技术能够有效挖掘信息数据的价值,实现数据的合理应用。面对大数据时代数据量激增的挑战,我们必须不断优化和创新计算机信息处理技术,以提高信息处理效率和质量,从而增强数据的服务能力。

1 核心概念

1.1 大数据

大数据(Big Data) ,又称巨量资料,指的是数据规模庞大到传统处理软件难以应对,且在合理时间内难以实现有效提取、管理和处理的,对行业决策具有辅助作用的资讯集合。大数据是科技发展背景下的热点技术之一,其具备数据体量(Volume) 大,数据形态多样(Variety) 、价值(Value)密度较低、数据处理速度(Velocity) 快以及数据真实性(Veracity) 存疑等特性。利用大数据技术可以充分利用特性鲜明的数据进行应用场景的精准定制和预测,如依据用户网络行为数据进行个性化推荐。

在信息时代,随着网络信息技术的发展,依托网络平台产生的虚拟数据越来越多。这类数据资源利用率高、价值密度低、增长速度快,能够被有效记录和存储,进而引导社会的发展方向[1]。大数据技术可用于精准定制和预测,例如根据用户网络行为数据进行个性化推荐。大数据技术则包括大数据建模技术和大数据安全技术。大数据建模技术主要是依托批处理和流处理的方式进行数据建模,以形成数据库。其中,批处理主要是对整理过的信息进行加工,旨在提高数据的存储率和利用率;而流处理则主要是先进行数据分析,尤其在金融领域应用广泛,能显著加快信息的处理速度。

1.2 计算机信息处理技术

计算机信息处理技术是利用计算机进行信息的收集、存储、分析,以将人与硬件、软件结合,以为决策提供数据支持。计算机信息处理技术具备信息采集功能、数据存储功能和信息安全功能,且灵活性强、精准度高。计算机信息处理技术能通过网络平台进行信息的采集,之后再对采集到的信息进行存储,最后再通过信息分类和分析等找到有价值的信息,通过对信息进行保密处理保证信息的安全性,以为政策的决策等提供数据支持。利用高性能计算信息处理技术,大数据技术可以更好地进行深度数据分析挖掘,海量数据分析检索以及人工智能的研究与应用。

2 大数据背景下计算机信息处理技术的种类及特点

2.1 大数据环境下计算机信息处理技术类型

在大数据时代,计算机信息处理技术包括分布式处理技术、数据高效索引技术、神经网络技术、数据挖掘技术等[2]。首先,分布式处理技术。分布式处理技术主要是利用存储列概念,以列为单位进行数据的存储,且数据压缩速度快,能实现数据的循环利用。分布式处理技术能使用户在最短的时间内完成数据的查询,能在用户的查询指令发出后快速加载大量相关信息,进而构建行列混合式存储结构。其次,数据高效索引技术。数据高效索引技术主要是通过创建多个数据索引表,以保证用户在查询信息时实现最优信息的提供。数据高效索引技术能够在全面分析数据的基础上对数据信息进行抽取,并进行重新排列,以通过动态的形式最大化抽取高质量数据。再次,神经网络技术。神经网络技术是对生物神经系统运行的借鉴和模仿,是依据生物的探索规律构建的数据处理系统,在物流选址的应用比较普遍。神经网络技术能模仿生物神经的探索原理,进而实现海量数据的快速处理。最后,数据挖掘技术。数据挖掘技术是根据用户的数据挖掘指令,在技术手段的支持下对数据库的数据资源进行搜索和分析,以联系不同数据的特点对相关信息进行搜索,挖掘到有用信息。

2.2 大数据环境下计算机信息处理技术特点

在大数据背景下计算机信息处理技术具备灵活性、模块性、开放性、数量大、速度快等特点。第一,灵活性。随着科学技术的发展,计算机依托技术支持实现了处理信息功能的日益完善,能满足不同用户的数据需求。用户能在开放的数据平台上通过指令下达完成数据的查询和浏览,进而解决问题。第二,模块性。在多元技术的支持下,传统的计算机信息处理模式被打破,不同平台的数据信息实现了共享和共用,且不同数据模块的不同功能在相互独立的基础上相互支持,以协调处理复杂的数据,以提高系统的效率。第三,开放性。在技术平台的支持下,数据获取环境更加开放和公开。计算机信息处理技术能第一时间收集数据,并在技术的支持下快捷处理数据,再通过数据传输扩大数据的应用范围。第四,数量大。在信息时代,数据呈现的一个重要特点是数量大,互联网根据人们的浏览记录进行需求数据信息的推送,进而使网络平台上产生庞大的数据信息。现在的数据存储量以泽字节(ZB) 记录,与传统的太字节(TB) 增长速度惊人[3]。第五,速度快。在大数据时代,信息快速传播的趋势成为信息发展的方向。人们在快节奏生活的影响下快速进行信息的浏览和交流。人们希望第一时间获得最新资讯,计算机信息处理技术能快速将信息传递给网络平台的受众,以满足人们的需要。

3 大数据背景下计算机信息处理技术存在的应用问题

3.1 数据安全性问题

大数据时代,海量信息存储于互联网平台,加剧了数据安全风险。病毒攻击可能导致隐私信息泄露,进而威胁人身和财产安全。特别是大型企业,如果平台数据信息被恶意泄漏,会造成极大的经济损失。另外,互联网平台上的不良信息会对青少年的身心健康产生影响,只有提升计算机信息处理能力,才能甄别有价值的信息,并通过信息的筛选保证信息传输和应用的安全[4]。

3.2 恶意攻击识别性问题

大数据时代,技术的限制使企业难以识别来自网络的恶意攻击。企业的信息化平台包括客户信息、财务报表、人事变动等的企业信息资料上传到平台利于企业办事效率的提升。但随着网络技术的升级,恶意攻击程序也越来越技术化,如果计算机信息处理技术未识别到危险攻击的可能性,未建立漏洞库和病毒库等,将无法第一时间识别风险,无法第一时间进行系统漏洞的补充,也无法提升信息的安全性。

3.3 海量数据处理技术瓶颈

大数据时代海量数据的快速涌现使计算机处理技术遇到了瓶颈。虽然在科技手段的支持下,计算机信息处理技术越来越成熟,并构建了数据处理体系。计算机信息处理技术能获取数据、分析数据,并根据数据提供决策方案,以助力企业稳定发展。但随着数据信息量的增大,必须采用科学的数据传输方式以避免数据安全隐患。现有的技术虽然在进步,但有时还是无法有效识别恶意信息,技术性的问题导致数据在传输及应用时存在一定的安全隐患。

3.4 技术人才问题

在大数据环境下,社会培养的人才难以应对海量数据的计算机处理需求,出现了高端人才供不应求的人才问题。互联网已经成为其他技术不可分割的一部分,但受硬件及软件的影响,计算机处理技术也受到限制。在技术的支持下,大数据技术与计算机技术迅速发展,并相辅相成。但计算机信息处理技术的人才培养与行业需求脱节,人才的技术能力未走到科学技术的前沿,无法对计算机信息处理技术的发展提供人才支持。

4 大数据背景下计算机信息处理技术的应用提升路径

4.1 优化数据处理技术架构

在信息爆炸的数据时代,计算机处理技术的优化至关重要,具体架构如图1所示。第一,分布式框架处理技术。分布式框架处理技术是计算机将收集到的海量数据根据类型分成小类,再根据数据传输的节点进行数据的分析和处理,以提升数据处理效率。分布式处理技术最为常用的是Spark和Hadoop,其中Spark 的特点是处理数据的速度快,Hadoop的特点能处理大规模数据[5]二者协同能使信息处理技术更为优化。第二,依托深度学习算法等进行数据的挖掘和预测。深度学习算法能通过模型进行数据的挖掘,并掌握数据的规律,进而进行数据走向的预测。深度学习算法能进行数据的聚类和分析,再通过图像识别等进行数据信息的处理,以挖掘人们需要的信息。第三,依托图数据库构建数据库系统,以高效处理数据的复杂关系。图数据库多用于社交网络数据信息的处理,能帮助平台用户掌握实体的关联,以了解网络图的结构。基于此,人们可以依托自然语言处理(NLP) 对信息文本进行分析和翻译等,以获取有用信息。第四,依托推荐系统对用户的历史数据行为进行分析以总结出喜好,进而进行针对性内容的推荐。推荐系统在大数据背景下能根据用户的浏览历史进行个性化产品的推荐,进而提高用户的信息浏览体验。

4.2 提升数据存储与访问效率

在大数据时代,信息的存储和访问效率对计算机信息处理能力的提升有重要影响。第一,构建分布式信息存储系统,以提高信息的存储和访问效率。分布式数据存储系统是由不同模块组成,能依托模块节点进行不同类型数据的存储。分布式数据存储系统利用数据分析技术将用户需要的数据存储在不同节点上,使数据呈现更为可靠。分布式数据存储系统能实现对数据的压缩,进而降低数据存储空间,能在提高数据传输速度的基础上提高访问效率。依托数据分区索引技术提高数据的访问效率。分区索引技术能将海量数据分成不同的小数据块,之后再对小数据块进行分区索引,能减少数据的传输时间,能提升数据的查询效率。第三,依托内存数据库提高数据的读取效率。内存数据库主要是将数据存储在内存上,内存的缓冲能延迟数据的访问申请,进而给系统提供数据处理时间。对于用户急用的数据信息,内存会通过场景写入的模式存储,目的是提高访问效率。第四,依托数据压缩技术降低存储空间。数据压缩技术能实现类似数据的选择与压缩处理,之后再将压缩后的数据存储于数据库,能有效拓展存储空间,也能减少数据传输过程中对渠道的占用。通过LZ77等数据压缩算法等能使数据不丢失的情况下减小体积,以减少空间的占用,以提高传输效率[6]。NoSQL数据库提供高可伸缩性、灵活性的技术手段,可以更好地支持大规模数据存储和访问。

4.3 改进信息处理算法和模型

在大数据时代,优化信息处理的算法和模型对计算机信息处理技术的应用提升至关重要。第一,在传统信息处理算法的基础上进行创新,以改进数据的计算方式和存储方式。新的信息处理算法可依托并行计算和多线程计算等提升信息处理速度,在此基础上对数据结构进行优化处理,对算法的参数进行调整处理,以提高算法的效率。第二,研发新的算法和模型。在改进传统算法的基础上也要进行新算法的研发,目的是针对海量数据建立信息处理模型,以提高算法的数据处理能力。对于非结构性的数据,可利用自然语言(NLP) 和图像识别算法处理,对于复杂的数据关系,可基于深度学习等进行关系挖掘,以提高信息处理的精准度。第三,开发定制化算法和模型。结合专业领域的数据处理需求,可结合特定专业领域的知识进行定制化算法和模型的开发,以提高信息处理效果。医疗领域可以开发疾病预测模型,金融领域可以开发风险评估模型。通过不同领域的专业需求开发定制化模型,能为行业的发展提供理科学更合理的计算方法,进而提高计算机信息处理能力。第四,提高算法的迁移性。随着科技的发展,越来越多的算法被应用于计算机信息处理中,但一种算法或模型的应用可能会限制其他算法的可解释性,因此要提高算法的迁移性,利用可视化技术等使一种算法更容易理解、应用和迁移[7]。Hadoop和Spark计算框架支撑下的移动计算可以大幅度提升海量数据处理算法效率。

4.4 强化数据安全与隐私保护

计算机信息处理技术要保证数据的安全性和个人信息的隐私性。第一,通过加密算法保护数据信息的安全,避免数据信息泄漏。以AES为代表的对称加密算法和以RSA为代表的非对称加密算法都能根据数据安全等级的需求筛选出最适用的算法,以有效保护数据的安全。第二,依托身份验证和访问控制等保护个人信息安全。对于数据库的信息,浏览者需要进行登录注册,之后再依托访问令牌或密码等在管理人授权的前提下浏览数据库信息,这样能限制非法用户的访问和信息篡改。第三,要通过数据监测对数据库的访问进行监管,以及时发现未经授权的强制访问和数据转移的行为。必要时可利用检测系统和防御系统的双重保护确保数据信息的安全。Hadoop的分布式文件系统(HDFS) 采用多备份透明存储技术,很大程度上提升了数据的安全性。

5 结束语

总之,大数据时代,计算机信息处理技术面临机遇与挑战并存。计算机信息处理技术的应用依托数据的收集、整理和分析等为数据访问奠定基础。面对不断增多的数据信息,需要优化信息处理技术,目的是通过优化数据处理架构、提升数据存储及访问效率、改进信息的算法和模型、强化数据安全与隐私保护等提高数据处理的高效性和安全性,最终实现以使计算机信息处理技术与大数据共存共发展,以为社会各行业各领域提供优质服务。

参考文献:

[1] 丁常慧.大数据背景下的计算机信息处理技术分析[J].通信电源技术,2024,41(8):243-245.

[2] 马瑾.大数据时代计算机信息处理技术探讨[J].通讯世界,2024,31(4):181-183.

[3] 翟爱平.大数据时代下的计算机信息处理技术分析[J].科技资讯,2024,22(1):5-8.

[4] 张澜曦.大数据背景下计算机信息处理技术发展研究[J].佳木斯职业学院学报,2024,40(5):181-183.

[5] 武竞.大数据背景下计算机信息处理技术探究[J].信息系统工程,2023(7):133-136.

[6] 姚轶峰.大数据时代计算机信息处理技术的应用分析[J].信息记录材料,2023,24(4):116-118.

[7] 雷小婷.大数据背景下的计算机信息处理技术研究[J].数字通信世界,2023(10):26-28.

【通联编辑:光文玲】