复杂光照下挂篮监控图像识别技术分析
2022-08-01郑孝强
郑孝强
四川龙光泸贵高速公路有限公司,四川 泸州 400037
0 引言
在识别图像与视频方面,需要重点关注图像对比度、光源方向等,然而,如何看待照片并消除其对识别的负面影响是计算机领域尚未解决的问题之一,通常采用矩形平衡法、同态滤波器、GR 来解决照明问题。常用的算法有直方图对齐法、Retinex 算法、同态滤波法等[1]。在实践运用中,这些算法都存在不足,局限性较强。例如,直方图对齐法忽略了图像频率信息;Retinex 算法强调了图像频率信息的重要性,但是图像过滤信息没有得到充分利用,导致图像边界模糊;同态滤波法需要高空采样,对图像参数的要求较高[2]。
图像局部值的变化,以及照片对物体元素和纹理的扭曲,将极大地影响识别的有效性和准确性[3]。在此基础上,很难进一步识别图像与视频。为了突破瓶颈问题,人脸识别、条纹控制等领域的科学家们进行了研究。人们试图弱化光辐射的影响,希望逐渐提高识别的精准性。在现有识别方法的基础上将深入学习的方法推广到光领域,利用神经网络中光束动态平衡效应,是解决复杂光照条件下识别分类问题的可行方案[4]。
1 挂篮结构简介
某桥梁上部结构共5 跨:(95+3×180+95)m。桥面为单向2%横坡;左幅梁体位于半径为4 050 m 的左偏曲线上,右幅梁体位于半径为6 500 m 的右偏曲线上;桥梁纵坡为1.95%上坡。下部结构30#~35#为连续梁桥墩,单肢空心薄壁结构,墩台基础采用桩基础及承台。
挂篮系统主要由主桁系统、行走系统、锚固系统、底篮系统、提吊系统、平台及防护系统、模板系统等组成。各系统既独立又联系,满足了悬浇施工的需求。挂篮设计结构如图1 所示。
图1 挂篮设计结构图(单位:mm)
2 挂篮监控图像存在的问题
挂篮监控图像的光线复杂,因此照片处理难度较大[5]。挂篮监控图像最常见的问题是图像照明过多或过少,导致图像清晰度较低,可利用价值较差。在图像观测中,光源种类、光源位置、反射程度、对能见度的影响、反射光可能完全不同。在这样复杂的照明条件下,传统的光处理方法难以满足图像识别的要求。因此,有必要找到一种能够对复杂的光条件进行处理的方法[6]。
3 光照补偿方法
传统的光补偿法以直方图或Retinex 算法为主,这些方法在部分场景下具有良好的应用效果,但是在实践中,图像的特征往往复杂多样,这些算法难以满足图像识别需求。
针对复杂照明中的照明补偿问题,文章介绍了一种改进的网络—CycleGAN,并介绍了具体的结构。从本质上讲,这种方法需要借助CycleGAN 迁移样式,把光照当成特殊的物体进行传输,能高效处理复杂照片,使之产生正常光照图像的效果。
3.1 对抗网络的建立
对抗网络是GAN 网络的变形。与基本的GAN 网络相比,每个网络有2 个发电机和1 个鉴别器。对抗结构在训练过程中,图像可以单独使用,不必成对出现,从而在应用上有更好的适应性。完整的对抗网络由2 个单向网络组成,组成方式如图2 所示。两个单向网络共用2 个生成器,各自有1 个判别器。图中X与Y分别表示要进行转换的两个类中的真实输入,G、F分别是由X类真实样本转换成Y类样本和由Y类真实样本转换成X类样本的生成器。在生成样本之后,分别通过D(X)和D(Y)对生成的样本的真实性进行判断。
图2 单向网络组合方式
3.2 图像的生成
生成器共由3 个通道构成了图像输入格式,彩色图像分辨率为256×256。输入图像被发送到卷积层提取元素;提取元素后,将通过包含11 层的残差块执行转换,以确保其他元素在样式转换过程中不会受到影响;然后将元件移至反向卷积层,将高维元件还原为低维元件;最后,将获得的属性发送到卷积层以创建新图像。
4 挂篮监控图像的识别
考虑到挂篮监控事件变化缓慢、动态事件与静态事件并存的特点,文章设计了利用卷积神经网络进行图像提取的方法,然后将一系列图像特征引入神经网络,实现挂篮图像的精确识别。
4.1 模型训练流程
文章将光照挂篮中复杂观测事件的识别过程分为训练和识别两部分。训练部分包括三个数据采集设备,用于监视图像集、图像对抗数据集和图像特征集;在识别部分中,从一个观测点均匀识别出的五个帧被传输到三个模型中的照片处理、特征提取和分类模块中,最终获得图像识别结果。模型训练部分的主要流程如图3 所示。
图3 训练部分的算法流程
4.2 模型识别过程
在识别过程中,需要用到三种模型:Cyclegan 模型、CNN 模型、RNN 模型。除了第一种模型,后面两种模型都是根据需求调整模型结构。
CycleGAN 模型使用复杂光照和正常光照图像对抗数据集进行训练,以得到一个能够有效处理光照的收敛模型;然后,将挂篮监控图像数据集输入CycleGAN模型进行光照处理,减弱光照的影响,为下一步的特征提取做准备;其后,使用光照处理后的挂篮监控图像数据集训练CNN,使其能更准确地提取图像的高级特征;训练完成后,将光照处理后的挂篮监控图像数据集按5 个一组输入CNN 提取特征,得到挂篮监控图像特征数据集,该数据集包含图像的特征变量,且保留了连续图像的时序信息;最后利用挂篮监控图像特征数据集,再训练RNN 模型,得到训练后的RNN模型;训练完成后,开始图像识别。需要把数据输入CycleGAN 模型中,分三次处理:首先使用Cyclegan 模型(按时间顺序排列的5 个控制图像)进行图像处理;然后将处理后的图像依次传输到CNN 模型中提取特征;所获得的特征将被导出到RNN 模型中进行分类。识别过程如图4 所示。
图4 识别部分的算法流程
5 连续监控图像识别
首先,创建一个数据集,每个数据集包含多个视频图像;其次,将收集到的数据输入训练模型,利用RESnet 提取特征,使用LSTM 进行训练;最后,将视频按两种训练模式进行分类,一次性从视频中提取帧,将其发送到RESnet 中提取特征,并将其发送到LSTM进行最终分类。识别过程如图5 所示。
图5 连续监控图像识别过程
6 结束语
文章首先介绍了挂篮图像存在光照复杂的问题,然后介绍了光照补偿过程,之后详细介绍了挂篮监控图像的训练和识别过程,并分析了连续监控图像识别过程。文章有望为提高图像识别效果提供参考。