深度学习在图像处理领域的探究
2020-04-22刘士豪姜博厚
刘士豪 姜博厚
摘要:新时期下,计算机网络时代的到来,让深度学习网络结构成为社会讨论的重点,并且在图像处理领域中发挥除了极大优势。为了能够进一步发挥深度学习在图像处理领域中的效用。该文首先提出图像处理和深度学习的含义,进而探究深度学习在图像处理领域中的应用。
关键词:深度学习;图像处理;应用;含义
中图分类号:TP18 文献标识码:A
文章编号:1009-3044(2020)06-0189-02
在信息时代下,数字图像成为最为常见的信息载体,可以说社会生产、人类生活中都已经充满了数字图像信息。信息技术的发展衍生出了大数据,让数字图像的产生速度、规模成几何形式增长,传统技术已经无法满足图像信息处理任务要求,社会更加迫切需要高效率、智能化的处理方案。对于图像处理来说,特征表达是重中之重,传统特征设计主要是人工完成,但由于过程十分复杂,对操作者自身要求非常高,所以自动化的高效图像处理是必然发展趋势。深度学习作为新时期的新概念,更多是在数据当中自动提取多层次特征信息,采用了数据驱动方法,通过相关的非线性转换,在原始数据中提取多层特性,让数字图像更具表达力、泛化力,从而满足图像处理高效陛的发展要求。
1图像处理技术
图像处理是将图像信息转化为数字信息,从而更好地被计算机识别、处理的一项现代化技术。图像处理大致上可以划分为图像分类、压缩、增强、编码、特征提取等一系列过程,为了保证图像足够清晰以及有效识别信息,图像处理要有多方面技术支撑提高图像分辨率与质量。
人工智能技术的发展也促进了图像处理技术发展,这样让图像处理技术在模式识别、机器视觉、多媒体技术等领域被广泛应用。智能技术的到来,让图像处理技术广泛融人人们的工作与之中,如二维码支付、车辆检测、指纹识别等,不仅方便了人们生活,也让人们对图像处理质量提出了更高要求。
2深度学习
深度学习是一种模仿人脑思考能力分析并解决问题的神经网络系统,通过深度学习对文字、图像、文本等信息进行提取和识别的一项技术。
2.1发展背景
在20世纪50年代,国外就提出了神经网络的概念,但由于当时缺乏网络训练算法理论、训练样本不足、计算机能力较差等影响,阻碍了神经网络进一步发展。新时期下,大数据、云计算等技术等到来,计算机性能得到了大幅度提升,延缓了训练低效性,大幅度增加训练数据可以有效降低拟合风险,根据无监督逐层训练策略和BP算法,让深层神经网络训练成为可能,这也让人们开始重点关注深度学习。
本质上深度学习模型就是深层的神经网络。整个系统为多隐层堆叠,每层都要处理上一层的输出信息,将初始输入、输出关系不大的数据,转变为更加紧密的数据关系,这样最后一层输出映射难以完成的任务成为可能,我们也可以将这种学习模式称之为“特征学习”。
2.2卷积神经网络架构
图像识别作为深度学习最早尝试的方式,其中最为重要的就是卷积神经网络。卷积神经网络可以分为三个层级堆叠,包括卷积层、池化层、全连接层,不同层次有着不同的特性和作用。(1)卷积层。主要负责提取数据特征,通过输入特征图x以及K个二维滤波器,通过卷积运算输出K个二维特征图。卷积运算具有很大的优势,首先可以提取相邻像素间的局部关系,其次是可以对图像进行平移、旋转、尺度等变换具备一定鲁棒性。(2)池化层。负责对卷积层输出结果进行处理,压缩所输出的特征图,这样可以降低特征图体积,减少网络计算复杂性,同时能够让特征图更加精简,有助于提取主要特征,降低特征表达维度,还能够对针对较小平移、变形具有鲁棒性。(3)全连接层。负责将所有特征连接起来,并将最终的连接结果(输出值1传输给分类器。
2.3神经网络的优化
在科学技术不断发展中,神经网络模型层数也越来越深,增加了训练数据集,模型内部结构也变得十分复杂。网络训练当中通常都会涉及拟合、梯度消失、梯度爆炸等问题,因此相关学者也针对性提出了几种神经网络的优化方法。首先,dropout优化技术。该项技术能够在深度学习网络训练当中,对神经网络单元按照相关概率将其从网络中暂时丢弃。这种丢弃是暂时性的,因此在使用随机梯度下降方法训练网络中,不同批量数据都在训练不同网络。该项技术在很大程度上打破了节点之间的关联性,提高了网络学习的泛化性,避免出现过度拟合等问题。其次,批量标准化(BN算法)。GooSe在2015年提出了BN算法理论,可以对深层次神经网络训练。BN算法能够规范所有层或某些层的输入,固定每一层输入信号均值和方差,这样即可避免出现梯度消失或梯度爆炸等问题。
3深度学习在图像领域中的应用
3.1图像识别
图像识别领域最早应用了深度学习技术,并且取得了非常高的成就,如早期都是AlexNet网络,就是在图像识别领域中的深层卷积神经网络,后续所发展的深度学习也都是以MexNet为基础。AlexNet实现了CNN结构的升级,网络变得更宽、更深,整个MexNet网络包括5个卷积层和3个全连接层。时至今日,在图像识别领域MexNet依然占据着统治地位,也决定了图像处理中深度学习的主题架构,即所前馈卷积神经网络,特征提取器为卷积层、池化层相互堆叠而成,并和多层全连接层相互连接,分类器信息流方向固定而单一。其主要应用表现在:
3.1.1网络结构局部修改
AlexNet发展下也衍生出了VGGNet网络。相比最初的MexNet网络,VGGN~网络采用了多个小型卷积核串联得加替换一个大型卷积核的方式。这样不仅不会影响卷积效果,还增加了很多非线性操作,在网络中提取更多、更丰富特征,减少了其中的参数量。VGGNet网络也证明了网络层次越深、特征越丰富,所得到的图像识别效果越好。
NIN网络再次对卷积核做出了调整,将单一线性卷积核转化为多层感知机MLP。CNN高层特征主要是由低层特征多种运算组合得到的结果,非线性运算组合可以让高层特征更具泛化性。MPL卷积核让NIN中一次卷积操作相当于之前多个卷积核操作的结果,所以在NIN网络中可以用较少层数实现更深的網络图像识别效果。
这些创新和发展措施,可以有效地提高特征表达能力,提升了网络深度或卷积层操作复杂化,但都是局部的改变,前馈卷积神经网络的主体架构依然没变,依然是单一的特征图流向方式,一层连着一层,从而导致深层处理无法获取浅层特征图、浅层处理无法获取深层传来的梯度,网络模型训练难度大。
3.1.2网络结构主体变化
为了解决局部变化带来的负面影响,部分学者通过借鉴highway networks阀门控制信息流理论,提出了ResNet网络模型,改模型彻底改变了特征信息流向,如第Y层输出不再单一影响Y+I层,同时还会影响Y+2层,所以由两层组成一个残差学习块,改变了学习目标。ResNet网络中由多个残差块堆叠组成,中间夹杂着池化层,训练中只需学习输入、输出差别,可以保障信息整体完整性,降低了学习难度、简化了学习目标。
基于ResNet网络还衍生出了DenseNet网络,也是采用了类似残差块的方法,并且构建了稠密块。DenseNet网络中,每层的输出都之后层级的输入,数据聚合应用了拼接方法,并非是ResNet的相加方法,可以保障每组输入特征图维度保持一致性,这样更有助于网络信息交流。DenseNet网络的出现,缓解了梯度消失情况,强化了特征传播,简化了参数量。
这两种图像识别深度学习模型直接改变了特征信息流传输方向,可以实现跨层传输,并非是单一的前馈卷积神经网络,大大提升了图像识别的精度,符合当代人的思维模式,可以更好地识别物体。
3.2图像取证
3.2.1简单迁移
图像取证中应用深度学习的研究相对较少,部分学者尝试将深度学习融人相机源取证问题中,但是在获取图像中不同相机拍摄会遗留指纹特征,因此采用了AlexNet网络结构进行了学习,来提取了指纹特性,可以实现94%以上的相机模式分类精度。
3.2.2网络输入
图像取证和识别之间的差异主要是在区分图像内容的差异性,并且这个差异可以直接用人眼看到,取证主要是用于区分图像中微弱信号的操作指纹,形态差异非常小,无法用人眼直接看到。因此普通的深度學习模型难以胜任图像取证。部分学者通过对深度学习模型进行完善,以AlexNet网络为基础增设了预处理层,将取证指纹特征放大。通过改进实验结果精度提升了7%。图像取证难,必须改变网络输人,通过放大指纹特征,才能够更好地发挥特征提取、分类器的价值。
3.2.3适应取证结构
图像预处理作为取证的必要条件,额外增加预处理层也会让整个模型变得臃肿,因此部分学者采用了一种隐写分析取证的深度学习模型,在网络结构中整合了预处理。通过将30个空间模型滤波器初始化第一层卷积核,这样卷积核就具备了预处理功能。虽然取证和识别是两个方面,但学习模型简化也是必然发展趋势。图像取证上深度学习还处于初期发展阶段,未来会有更多的适用于图像取证的深度学习模型。
4结束语
综上所述,图像领域中的深度学习主要是以卷积神经网络为主,但在整个网络模型中需要有庞大的计算量,增加了网络训练时间,所以卷积运算形式简化会是一大发展趋势。再者,当今图像领域主要是研究灰度图像,彩色图像涉及较少,而将四元数与深度学习知识融合势必会提取更加丰富的彩色图像,进一步实现图像处理领域的一次突破。