基于大数据分析下的机器学习模型设计方法
2018-10-25陈强
陈强
摘 要:随着科技和经济的持续进步,人工只能技术已经逐渐变成目前我们国家十分重视的对象之一。现如今我们国家已经进入了信息化时代,每个人在日常生活中都将接触到大量的信息资讯。早期的信息处理主要通过人工的方式,显然这一模式现如今已经显得十分过时,无法满足人们的正常需要。基于这一情况,大数据就此诞生,其能够直接从海量的数据资料中提取人们需要的内容,不仅高效,而且精确度高。而大数据本身有何机器学习之间有着非常重要的联系。为此,相关工作人员理应对于其模型设计方面提高重视。本篇文章将阐述机器学习模型的设计种类,并低于具体分类方面提出一些合理的见解。
关键词:大数据 机器学习 设计方法
引 言
从现阶段发展而言,机器学习一直都属于人工智能技术中的一类,主要是指让电脑能够像人体的思维模式一样自主展开知识学习,以此提升数据的处理速度。这种方式能够有效帮助大数据平台完成分析的工作,并且提升计算的精确性和速率。
一、支持向量机
早在上世纪90年代,科学研究者便创建了支持向量机,又被称作SVM,其主要是一种全新的机器学习模型,具有很强的学习能力,能够自主完成知识分析和提取。当该模型刚一诞生,便立刻在智能科技领域中掀起了巨大的浪潮,引起了全球媒体的关注。这一模型主要是在VC维理论的基础上创建,并将结构风险最小原理融入其中。在实际操作的时候,将样本提供的数据作为基础点,以此可以在模型本身的复杂性特点以及学习能力之间能够找出其中存在的平衡点位置,进而确保其效果能够充分展现出来。由于当时还没有大数据存在,因此该模型往往能够在小样本、分线性以及高维模式中得以应用,以此完成识别、检测以及翻译的工作[1]。
目前来看,SVM可以算是全世界应用率最高的学习模型。例如在爱进行线性可分的问题处理时,其可以将其中间隔最大的一个平面提取出来,以此将两种完全不同的样本分开。该平面本身具有很强的泛化能力。线性不可分一直都是一种十分普遍的情况,因此经常由于对偶的问题导致目标函数难以确定。为了处理这一问题,通常需要采取两种方法,分别是软间隔优化以及核技巧。软间隔优化主要是依靠对于输入空间采取一定限制的方式,以此将一些简单的错误全部忽略。但是,如果有线性不可分的问题出现,这种方法的效果便无法发挥。而核技巧主要是通过寻找核函数的方式,以此促使原本的低维空间全部转变成高位空间,从而使得原来的数据全部能可分。这种方法的应用范围同样有限,因此在实际操作的时候,通常需要将这两种方法结合在一起共同使用。
二、人工神经网络
所谓人工神经网络,也就是ANN,其主要是指对于人体大脑实际运行的方式进行学习,通常也会被简称为神经网络。这种方式与数学概念中的统计学十分相似[2]。
一般而言,此类模型主要具备三方面优势。其一,其能够自主完成学习任务。例如,人工神经网络通过人脸识别的方式,可以将无数个脸部信息输入到模型机器之中,此时网络本身便能够有效掌握这一方面的技能。通常情况下,此类技能在预测工作中有着非常好的应用效果,以此完成灾难预测以及风险预测。其二,其本身具有联想存储的效果,主要依靠内部的反馈系统,以此完成信息的获取与分析,进而实现信息反馈。其三,能够迅速找出具体问题所在,并提出有效的处理措施。如果采取人为的方式,在寻找最佳方案的时候,往往需要将所有方式全部都尝试一次,显然十分浪费时间。然而,计算机模型具有很强运能力行和计算速度,促使原本十分复杂的内容逐步简单化,进而提升工作效率[3]。
相比于支持向量机,人工神经网络本身具有自己独有的优势。主要体现在对于非线性问题的处理方面,其效果更加,且拥有良好的适应能力,以此对早期模式在模拟、识别以及信息处理方面的缺陷,扩大具体的应用范围。如果将神经网络和其他多种不同的模型結合在一起,可以有效提升信息处理的效率,促使其向人工智能层们的发展更进一步。现如今信息技术的发展速度越来越快,人工神经网络也找到自身的发展方向,其实际运行的模式越来越人性化。例如,近些年出现的模糊系统、遗传算法以及进化机制等,这些都是未来继续研究的主要方向。一旦有所突破,数据分析的效率将会进一步加快。但是,人工神经网络同样有着自身缺陷,因此理应将其和其他技术形式结合在一起,提取其内部净化,将糟粕全部提出,进而提升具体应用的效果。
三、机器学习模型的分类
在大数据背景下,机器学习模型的种类有很多。目前来看,最为常见的便是支持向量机以及人工神经网络。从算法的角度思考,模型通常可以分成三种。其一是监督学习,主要是依靠计算机从大数据之中将相关信息内容全部提取出来,并对其具体结果展开验证。这种方式能够有效增强模型的学习能力,从而使其更好地完成后续的工作。其二是无监督学习,主要是指计算机本身基于大数据背景,将相关信息全部截取下来。这种方式的目标往往具有一定的不确定性特点。其三是强化学习,主要是基于没有大数据验证的前提下,以此促使计算机完成自主评估工作。
四、结束语
综上所述,在大数据背景下,越来越多的机器学习模型不断出现。为此,相关人员理应对其优势和特点展开分析,并将其结合在一起,以此应用到不同的领域之中,进而改变人们的生活。
参考文献:
[1] 焦嘉烽,李云,JIAOJiafeng,等.大数据下的典型机器学习平台综述[J].计算机应用,2017,37(11):3039-3047.
[2] 菅保霞,姜强,赵蔚,等.大数据背景下自适应学习个性特征模型研究——基于元分析视角[J].远程教育杂志,2017,35(4):87-96.
[3] 孙存一,龚六堂,马达铪,卢友明等.大数据思维下的利率定价研究——以机器学习为视角的实证分析[J].金融理论与实践,2017(7):1-5.