浅谈机器学习与深度学习的概要及应用
2019-10-21宁志豪周璐雨陈豪文
宁志豪 周璐雨 陈豪文
摘 要:在20世纪五六十年代,“人工智能”这个术语就早已被正式提出。经历了几十个年代的发展,在AlphaGo击败李世乭时,人工智能(Artificial Intelligence)又受到了学者们的广泛关注和研究,同时机器学习(Machine Learning)和深度学习(deep learning)也相应的被提及到,甚至作为了人工智能其中的一个发展方向去拓展。本文对机器学习和深度学习的概念进行了解释与区分,从实际应用出发阐述了机器学习和深度学习的方向与应用,以及机器学习算法的分类。鉴于没有系统的学习过,可能在许多地方会有出入,还望更多的人能够有自己的思考。
关键词:机器学习;深度学习;算法
1 定义与区分
随着愈来愈多的学者对机器学习领域的深入探索,机器学习这个词的不同解释也出现了很多。其中,Arthur Samuel对机器学习的定义是指在没有明确的设定情况下,使计算机具有学习能力的研究领域。计算机程序从经验E中学习,为了解决某一任务T进行某一性能度量P,通过P测定在T上的表现因经验E而提高,这是Tom Mitchell对机器学习的定义。[1]其实简单来说,它是对数据分布进行建模,然后从大量看似无规律的数据中抽象出共性的模式。而深度学习是机器学习的一个子类,可以把它看作一种特殊的机器学习。深度学习的概念源于人工神经网络的研究。深度学习是机器学习中一种基于对数据进行表征学习的方法,是一种能够模拟出人脑的神经结构的机器学习方法。
先举个例子来区分机器学习和深度学习,比如在识别猫和狗时,机器学习需要人工的将区别猫、狗的一些特征进行提取,而深度学习则自动找出分类问题的特征。因此,对于大量数据,使用深度学习较好,数据量少时,传统机器学习更适用。机器学习在解决问题时需把问题的步骤分解,而深度学习直接得到结果,可以实现实时的效果。当然,深度学习在具备高效能的优点时,它对硬件的要求也很高,尤其对GPU的要求。
2 机器学习算法分类
机器学习算法分为监督学习、无监督学习、强化学习以及推荐系统四大类。监督学习(Supervised Learning)是给出带有正确答案的数据集,通过算法得出更多的正确答案;无监督学习(Unsupervised Learning)是不提前告知算法,只给出一堆数据集。监督学习主要用于解决回归问题(预测连续的数据值)和分类问题(预测离散值输出)。如预测房价是回归问题,根据某些已有的数据可以得出直线、二次函数或二阶多项式。预测肿瘤的良性、恶性,只有两种结果,是离散值的输出,所以是分类问题。无监督学习中的聚类算法是将数据分簇,比如谷歌的新闻推送。
除了以上介绍的两种分类,还有半监督学习,也就是强化学习。所谓的半监督学习其实就是在其算法中可能会有一些Y值,刚开始你的训练模型可能训练的结果并不好,但是如果训练样本增多,模型的结果也会更好。
3 机器学习应用领域
机器学习是當前的热门话题,它应用于各个领域,同时也具有着巨大的潜力。在工业和基础科学等很多领域都涉及了它的相关内容。
3.1 数据挖掘
数据挖掘是在大型数据库中自动发现有用信息的过程,并将这些处理过的数据加以分析。数据挖掘是一门用数据发现问题,再去解决问题的学科。大部分数据挖掘中的算法是机器学习的算法在数据库中的优化。数据挖掘中用到了大量的机器学习提供的数据分析技术和数据库界提供的数据管理技术。[2]在医疗方面,通过数据挖掘处理患者的医疗记录,得到重要的数据;在生物学研究中,通过对DNA序列数据的挖掘,找到相应的基因;能对信用卡风控进行评估,实行用户流失的干预等。
3.2 自然语言处理(NLP)
自然语言处理,即是通过将用户自然语言输入计算机,再内部进行算法的加工和计算等步骤,来模拟人类对自然语言的理解,最后将接近人类所实现的结果呈现给用户,其目的是用计算机来代替人工处理大规模的自然语言信息。自然语言处理技术在语音识别中有非常重要的作用,现在,不论是电脑还是手机都配有语音识别的功能,将机器学习中深层神经网络(DNNs)技术引入语音识别,极大地降低了错误率、提高了可靠性。
3.3 图像识别处理
将机器学习运用于图像处理,通过分类并提取重要特征而排除多余的信息从图像中识别出相关的模式,例如百度识图、手写字符识别、车牌识别等等应用。通过这种用深度卷积神经网络CNN用来识别图像中物体的方法可以实现将图像中的对象转换成对图像场景进行描述的语句。[3]
4 总述
机器学习应用的领域很多,像大型互联网公司的推荐类功能、人脸识别相关功能、以及无人驾驶等都是利用机器学习技术实现的,我们的生活也在随着这些相关技术而改变。机器学习和深度学习的发展也带动着人工智能的进步,深度学习模拟了人脑构造,采用了现在应用广泛的神经网络技术。深度学习真正实现了人工智能的突破,在机器中融入了神经网络的思想,让机器人时代更有可能到来。在其他各个行业,也将更需要机器学习和深度学习的相关技术。
参考文献:
[1]机器学习[M].机械工业出版社,2003.
[2]苏磊.数据挖掘在院校信息资源管理中的应用[J].电脑知识与技术,2016,(5):224-225.
[3]黄毅晟.基于移动端图像识别的题库采集模型实践研究[J].中国信息技术教育,2016,(12):75-78.