APP下载

基于机器学习算法人工智能技术的发展与应用

2019-09-17余涛贾如春

数学学习与研究 2019年13期
关键词:回归机器学习深度学习

余涛 贾如春

【摘要】机器学习是人工智能中最重要的部分,人工智能区别于普通的大数据分析之处就在于具备了机器学习的特点.本文基于机器学习人工智能算法进行简析其原理及应用场景,更加理性深入对人工智能技术进行全面的分析,对人工智能技术背后数学理论及实际应用的分析基础上,对机器学习算法主要任务、深度学习发展动因、深度学习算法应用进行梳理和分析,提取出人工智能算法主要能够完成的三类任务,并在技术层面针对人工智能下一步发展与应用做出了分析和展望.

【关键词】人工智能;机器学习;深度学习;回归;分类;聚类

伴随网络及计算机技术的长足发展,人工智能随着深度学习技术应用的突破取得极大进展,各种落地应用及概念产品层出不穷,人们对其在生产生活中的革命性创新充满期待.机器学习的算法很多,其中大部分算法都是一类算法,而有些算法又是从其他算法中延伸出来的.本文从两个方面来分析算法,一方面,通过学习的方式,另外一方面,是算法的类似性;通过人工智能算法脉络,解析基本算法应用场景,使我们对人工智能技术有一个更为理性深入和全面的理解及思考.

一、机器学习方式

根据数据类型的不同,数学建模也有不同的方式,在机器学习或者人工智能领域中,人们首先会考虑算法的学习方式,在机器学习中,不同的学习方式将算法按照学习方式进行分类,在建模和算法选择的时候考虑能根据输入数据来选择最合适的算法来获得最好的结果.

(一)强化学习

强化学习模式下,输入数据作为对模型的反馈,输入数据直接反馈到模型,模型必须对此立刻做出调整.在企业数据应用的场景下人们最常用的可能就是监督式学习和非监督式学习的模型,在图像识别等领域,由于存在大量的非标识的数据和少量的可标识数据,目前半监督式学习是一个很热门的话题,而强化学习更多地应用在机器人控制及其他需要进行系统控制的领域.

二、人工智能算法分类

根据算法的功能和形式的类似性可以把算法分类,比如,基于树的算法,基于神经网络的算法等等.当机器学习的范围非常庞大的时候,有些算法很难明确归类到某一类,而对有些分类来说,同一分类的算法可以针对不同类型的问题把常用的算法按照最容易理解的方式进行分类.

(一)回归算法

机器算法分类中最常见的机器学习及其常用算法首当其冲是回归,回归算法采用对误差的衡量来探索变量之间的关系的一类算法,在机器学习领域,回归算法也有很多种,其中最为常用的算法线性回归是最简的形式,用一个连续的超平面来拟合数据集;而回归树(集成方法)通过将数据集重复分割成不同的分支来最大化每次分离的信息增益,从而让回归树很自然地学到非线性关系,集成方法包括随机森林(RF)或梯度提升树(GBM);除此之外,还有最邻近算法和深度学习.

(二)分类算法

分类算法用于分类变量建模及预测的监督学习算法,许多回归算法都有其对应的分类形式,分类算法往往适用于类别(或其可能性)的预测,而非数值.其中最为常用的算法主要有五种.

(1)(正则化)逻辑回归,逻辑回归通过逻辑函数将预测映射到0到1的区间,因此,预测值可被视为某一类别的概率.

(2)分类树(集成方法),对应于回归树的分类算法是分类树.通常它们都是指决策树,更为严谨的说法是“分类回归树”,也就是非常有名的CART算法.

(1)支持向量机,支持向量机使用一个名为核函数的技巧,来将非线性问题变换为线性问题,其本质是计算两个观测数据的距离.支持向量机算法所寻找的是能够最大化样本间隔的决策边界,因此,又被称为大间距分类器.

(2)朴素贝叶斯,基于条件概率和计数的简单算法,其本质是一个概率表,通过训练数据来更新其中的概率.其核心的特征条件独立性假设(例如,每一项输入特征都相互独立)在现实中几乎是不成立的.

(三)聚类算法

聚类算法基于数据内部结构来寻找样本自然族群(集群)的无监督学习任务,使用案例包括用户画像、电商物品聚类、社交网络分析等.而在机器学习领域内,两个最为重要的概念是维度及特征选取.其中“维度(DIMENSIONALITY)”通常指数据集中的特征数量(即输入变量的个数).而特征选取是从数据集中过滤掉不相关或冗余的特征.

三、人工智能深度学习的发展及应用

传统机器学习算法在语音识别、物体识别方面无法有效展开应用,其重要原因之一就是这类算法无法使用语音及图像的高维度数据(High-dimensional Data)在高维空间学习复杂的函数,即使算力极为丰富的现阶段也无法有效满足其算力需求;因此,深度学习方法应运而生,传统机器学习算法所面临的问题被称作维度诅咒(Curse of Dimensionality),高维度数据的参数设置需求随着变量的增加呈指数型增长,对计算能力提出了极大挑战,近乎无法完成.而深度学习采用多层调参,层层收敛的方式,将參数数量始终控制在一个较为合理的水平,使得原本不可计算的模型可运算.深度学习CNN及RNN两类网络的基本原理在多种识别、感知任务中应用实施,表现优异.作为人工智能技术未来重要发展方向之一的迁移学习,人工智能技术的快速发展,相关知识沉淀,面对当前深度学习算法及网络发展日新月异,人工智能技术发展将广泛应用于中国2025制造及未来工业4.0中.

猜你喜欢

回归机器学习深度学习
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
基于网络搜索数据的平遥旅游客流量预测分析
前缀字母为特征在维吾尔语文本情感分类中的研究
深度学习算法应用于岩石图像处理的可行性研究
基于支持向量机的金融数据分析研究