APP下载

浅谈数学在大数据挖掘中的运用

2018-12-20傅显然

赢未来 2018年23期
关键词:大数据数学

傅显然

摘要:随着我国信息技术水平的不断进步,通讯等数据信息系统在各个领域的影响力度逐渐扩大,信息量的积累使得大数据概念随之出现,更加促进了信息技术的快速发展。如何从海量的数据中提炼出有效的数据资源,挖掘大数据的信息价值成为当前急需解决的重要问题,本文通过对大数据出现的背景、数据的来源和处理挖掘进行研究,探讨数学在大数据挖掘中的运用方式。

关键词:大数据;数学;挖掘信息;

全球信息化时代的步入,使得信息技术渗透到生活的各个角落,逐渐成为提升生产力水平的重要因素,随着支付宝、微信支付等第三方支付手段的进步,人们也开始改变传统的消费模式,这也进一步推动了大数据的发展。在大数据时代,海量的数据提炼和挖掘一直是各行各业关注的重点和难点,数学作为数据分析处理过程的主要手段,在数据的挖掘中发挥着极其重要的作用。合理运用数学知识可以提升大数据的分析效率,辅助管理者和决策者从海量数据中获取高价值的信息,这也逐渐成为了当前众多专家和数据处理人员研究的方向。

一、大数据的主要特征

大数据的产生是基于计算机技术的发展和全球互联网融合度的不断提高,各行各业产生的数据信息不断的汇集到互联网信息中,通过数十年的积累,成为了海量的大数据,当然,不同行业的数据信息有着不同的价值,人们需要从数据信息中挖掘出高价值信息,帮助管理者和决策者做出科学判断。其实,大数据的实质是指无法通过常规的数据收集手段如调查、收集等方式获取的信息集合,具有数据量庞杂、数据类型多样、数据价值低、数据真实性不明等多个特征,与传统的数据储备相比,大数据数据分析中最大的难点就是数据检索和处理的难度高,有效信息的提取需要借助先进的处理技术,优化数据的处理能力。在大数据的研究中,数据挖掘是核心,其原理是对复杂、多样、无规律的海量数据进行分析处理,挖掘有价值的信息。当前,大数据已经广泛应用在通讯、工程、营销、制造等多个信息行业中,在大数据的信息挖掘应用中,数学知识的应用至关重要,计算机信息处理的基础就是在计算机中写入数学公式,通过计算机的快速计算能力缩短人们的信息处理时间,因此,数学专业知识融入到大数据的挖掘工作中,可以有效解决大数据信息分析难的问题,提高对数据的分析处理效率[1]。

二、大数据挖掘的必要性

数据挖掘工作是随着大数据的发展而出现的新兴产业,对于数据挖掘的侧重点不同,其运算方法和运算规律也有一定的差异。最早的数据挖掘是指全面的数据分析处理,但是因我国步入信息化时代已经有数十年,数据的信息储备达到了空前的规模,而且还在不断的增加中,这就造成了传统的全面数据处理难度和耗费的资源巨大,不利于管理层的决策。现如今,在海量的大数据信息资源中筛选出适用于各个行业、领域的相关信息,将其进行归纳分类,如:市场营销、教育科研、工程管理等类别,进而在这些同类信息中提出潜在的有价值的信息,为决策者提供更为客观的数据参考具有十分重要的现实意义。

三、数学在大数据挖掘中的应用

(一)数据处理中的应用

大数据的初步处理是数据挖掘中的重点,因大数据具有时效性强的特点,在对数据进行挖掘处理的过程中对处理时效的要求较高,在有限的时间内,通过对大量数据的初步处理,既要保持数据处理的效果,还要确保处理时间上的有效性。如果原始数据不完整或有残缺,就需要对数据进行预处理,筛选出其中的重要数据进行研究。数学在数据处理中的应用,最常见的就是线型回归分析和相关分析法,通常,我们将这两种方法相互结合,通过观察多个变量的变化关系,找出其中的规律,再建立数学模型,进而通过数学模型推导出未知变量,达到数据预测的效果,为管理者和决策者提供风险判断依据,有效的降低决策风险。当然,数学模型的建立不能仅仅是静态模型,还需要在模型中加入动态数据的计算方式,以模型指导算法,结合获取到的有效信息对模型进行修正,通过反复的计算、修正来达到算法与模型的平衡[3]。

(二)数据挖掘中的应用

大数据通过初步的数据处理,就需要进行数据的挖掘,数据挖掘具有集合性、应用性等多个特点。在数据的挖掘过程中,数学的作用无可替代,常用的数学挖掘方法有聚类分析法、关联分析法等,其中最主要的还是聚类分析法,目前,该方法已经广泛的应用在医学、统计、营销等多个行业。聚类分析法,其实质是将同类或相似的数据归纳到一起,划分不同的数据集合,再通过对不同数据集合的分析处理,最后将各个集合内经过处理的数据汇集到一起,从而提取出不同数据中的高价值信息,达到数据挖掘的目的。实际上,聚类分析法常常在我们的日常生活中出现,各种数据分析、图像处理中都会将关键性的数据进行分类,再通过逐个对数据集合的处理汇总达到提取有效数据的目的。另外,区间值算法也是大數据挖掘处理找那个的常用数学方法,其主要是针对不完整信息的处理。大数据具有数据来源庞杂,数据价值低的特征,区间值算法就是提取残缺信息中的有效数据,对其有效区间值进行确定,当获取这些信息后,既可以通过统计学方法进行确定,也可以由经验丰富的专家确定,由专业的技术人员对数据价值进行进一步分析,达到高效、准确的信息分析和数据挖掘目的[4]。

结束语:

综上所述,大数据时代给我们的生活带来的极大的便利,逐渐融入到人们生活中的方方面面,当前社会的发展也离不开大数据的支持,数学作为支撑大数据挖掘分析的基础,如何利用数学知识处理海量的数据已经成为大数据发展的关键,数学在数据处理中有着不可替代的作用,研究人员要善于运用数学方法,发挥出数学专业的价值作用,优化数据处理中的模型建立技术,利用大数据的发展带动社会步入人工智能和智慧城市的信息时代。

参考文献:

[1]林潘能.浅谈大数据挖掘中数学的运用[J].现代交际,2018(09):253+252.

[2]吴雨伶,夏敏.基于极课大数据的高中数学教学优化策略研究[J].江苏教育研究,2018(01):76-79.

[3]马梓程.浅议大数据分析中统计学知识的运用[J].数学大世界(中旬),2018(02):37-38.

猜你喜欢

大数据数学
我们爱数学
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
我为什么怕数学
数学到底有什么用?
错在哪里