深度学习在模式识别中的应用
2018-05-14廖干洲曾霞
廖干洲 曾霞
摘要:本文首先对机器学习和模式识别下了定义,强调它们之间的主要区别位研究的核心问题不同,机器学习研究重点是在于模型上,模式识别的研究重点是在于输入数据上。然后介绍了机器学习中的深度学习的研究方法,并应用在模式识别的任务上,获得良好的结果。
关键词:模式识别;深度学习;卷积神经网络
中图分类号:TP18 文献标识码:A 文章编号:1007-9416(2018)02-0229-02
机器学习在当前的人工智能[1]研究中处于一个非常核心的地位。得益于近十年来机器学习中的深度学习技术[2]的飞速发展。本文主要阐述利用机器学习的方法解决模式识别[3]的若干问题。
1 机器学习定义
机器学习是一门多领域交叉学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
2 深度学习的研究方法
深度学习其原型是多层神经网络[4](Multilayer Neural Network)傳统神经网络中,采用的是BP算法[5]进行训练,简单说来就是采用迭代的算法来训练整个网络,随机设定初值,计算当前网络的输出,然后根据当前网络输出与标签之间的差值去改变前面各层的参数,直至收敛。
深度学习把传统机器学习的寻找特征参数问题转化为构建深度网络问题,在众多方法当中,最著名的可算是卷积神经网络(CNN)方法。CNN方法通过图像卷积以及池化的步骤,可较为容易地构建一个多层神经网络,对于手写辨识和图像辨识具有非常好的效果。
3 卷积神经网络在模式识别中的应用
卷积神经网络应用在手写辨识上具有非常好的效果,本次卷积神经网络使用传统LeNet-5[6]的基础上,结合Alex-Net[7]的新方法,在nmist数据集上进行实验,训练模型如下图1所示。
3.1 训练模型
如图1所示,本次模型采用和LeNet-5的相同的层数,但是在第一层卷基层上采用16个3×3的卷积核,并采用relu激活函数;第三层卷基层上也采用较多的24个3×3的卷积核,也采用了relu激活函数,所以在最后的Flatten层上,数据量有864个,而且是连接层,所以可以预计在训练时间上会比LeNet-5长。
3.2 训练、测试结果
两个模型均采用128的Batch,20次Epoch,结果如下表1所示。
从结果可以看出,本模型在训练时间是经典模型的3倍左右,但是在训练的精度以及测试精度上分别提高了1.35%和1.02%。
从这些结果里拿出一组训练过程,如图2所示。
其中图2(a)是传统LeNet-5下的结果,2(b)是本模型的结果。从两图比较可以看出,无论在训练或者测试,本模型从第一次Epoch开始,精度就已经非常高,分别达到了81%和96%,进一步说明了本模型在手写识别上具有一定的实用性。
4 结语
本文尝试了以机器学习上建立模型的方法解决模式识别的分类任务,并用一个实际的深度建模例子进行说明。本文的主要意义在于强调机器学习及模式识别之间区别,以使得的在模式识别中强化模型建立的作用,为模式识别提供更多的研究方法。
参考文献
[1]卢妙娜,王润.人工智能综述[J].智能计算机与应用,2010,(2):3-4.
[2]郭丽丽,丁世飞.深度学习研究进展[J].计算机科学,2015,42(5):28-33.
[3]赵志宇,常健.模式识别概述及其应用[J].信息与电脑:理论版,2010,(10):27-27.
[4]冯帅.合作型模块化神经网络的研究与应用[D].武汉理工大学,2008.
[5]张铃,张钹.神经网络中BP算法的分析[J].模式识别与人工智能,1994,(3):191-195.
[6]Krizhevsky A, Sutskever I, Hinton G E. ImageNet classification with deep convolutional neural networks[J]. Communications of the Acm, 2013,60(2):2012.