基于BAS-BP神经网络的交通图像压缩*
2021-04-28罗山
罗 山
(攀枝花学院交通与汽车工程学院,四川 攀枝花 617000)
0 引言
BP神经网络已成为一种新的图像压缩模型,但由于随机产生的初始权值和阈值,导致网络收敛速度慢、易收敛到局部最优、模型计算精度不高等缺陷。文献[1]设计并实现了基于遗传算法的BP神经网络压缩算法,压缩性能有所提高。文献[2]提出一种基于遗传算法的混合智能学习算法,克服了BP算法收敛速度慢和易局部收敛的缺陷,取得了很好的压缩效果。但遗传算法存在运算量大、易早熟收敛,重建图像质量差等缺陷。而天牛须搜索(Beetle Antennae Search,BAS)算法[3,4]是受天牛觅食行为的启发而提出的一种智能优化算法,具有计算量小、寻优速度快、算法简单等优点。文献[5]提出BAS-BP模型并用于风暴潮灾害损失预测,该方法克服了训练时间长、收敛速度慢等缺点。文献[6]提出了采用BAS优化BP神经网络拟合测距模型,克服了对数衰减模型易受环境干扰、参数取经验值等问题,该方法收敛速度快,定位精度更高。
在前人研究的基础上,本文首次将BAS用于BP神经网络的图像压缩中。利用BAS求得BP神经网络最优的初始权值和阈值,建立BAS-BP网络压缩模型,实现交通图像的压缩与重建。最后进行仿真实验,对压缩方法进行比较分析,验证了本方法的有效性。
1 BP网络图像压缩原理
BP(Back Propagation)神经网络[7]是一种典型的前向神经网络,其结构包括输入层、隐含层和输出层。其基本原理为:首先信号从输入层输入到隐含层,经过非线性运算后输入到输出层,再经过输出层处理后得到前向传播的输出;然后计算输出层的输出与期望输出的误差,如果误差不满足设定的精度要求,则将误差由输出层经隐含层反向传回输入层,并利用梯度下降算法对输入层到隐含层、隐含层到输出层的权值和阈值进行修正,结束一次训练。这两个过程不断循环进行,直到网络误差满足要求或达到设定的训练次数为止。
图1为BP神经网络的交通图像压缩模型。将输入图像分成大小为n×n的块,块中的每一个像素点对应一个神经元,因此输入层和输出层神经元个数等于块的大小。压缩的基本原理是输入图像到网络中训练得到最优的网络,再根据输入图像、权值和阈值计算隐含层的输出,输出结果即为压缩数据,并将其保存;解压时,加载压缩数据,根据压缩数据、权值和阈值计算输出层的输出,即为重建图像。隐含层的神经元个数比输入层和输出层的神经元个数要少才能实现压缩。可见,压缩比和重建图像的质量随隐含层神经元个数的变化而变化,隐含层神经元个数越少,压缩比越高,但重建图像的质量会下降。
图1 BP网络的交通图像压缩模型
2 BAS-BP神经网络模型
2.1 BAS算法
BAS算法的基本原理为:当天牛寻找食物时,并不知道食物的具体位置,而是依据它的两只触须感知到食物气味的强弱来觅食,如果左边触须感知到的气味比右边强,则天牛往左边搜索,反之,则向右边搜索。按照这一原理不断搜索下去,最终天牛可以准确地找到食物。其主要步骤[3]如下:
1) 创建表示天牛须朝向的单位随机向量:
(1)
式中,rands()为产生随机数的函数;n为搜索空间的维数。
2) 建立天牛左右须的坐标为:
(2)
式中,xlt、xrt分别为第t次迭代时天牛左须、右须的坐标;xt为第t次迭代时天牛质心的坐标;d为天牛两须间的距离。
3) 设计适应度函数f(x),并计算左右须的适应度函数值f(xlt)和f(xrt)。
4) 比较适应度函数值的大小以确定搜索方向,并更新天牛质心的坐标:
xt+1=xt+δt*m*sing[f(xlt)-f(xlt)].
(3)
式中,δt为第t次迭代时的步长;sign()为符号函数。
5) 更新距离和步长:
dt+1=eta_d*dt+0.01.
(4)
δt+1=eat_δ*δt.
(5)
式中,eta_d为距离衰减系数;eat_δ为步长衰减系数;均在(0,1)间取值。
2.2 BAS-BP网络模型
BP神经网络训练过程中依靠误差的变化率来调整权值和阈值,当误差的变化率趋于零时,训练结束,从而获得最优的权值和阈值。但初始权值和阈值是随机产生的,若选择不当会对网络性能带来不利影响。很多研究表明,采用优化算法对网络的初始权值和阈值进行优化,可极大避免网络收敛到局部最优的问题,有效提升网络的性能。本文利用BAS算法寻找网络的最优初始权值和阈值,并赋予给网络,从而建立BAS-BP网络模型,步骤如下:
1) 创建BP网络并设置参数;
2) BAS算法参数初始化;
3) 产生[-1,1]间的随机数作为天牛质心的初始坐标;
4) 将网络预测输出值与样本的实际值的均方误差作为适应度函数,即:
.
(6)
式中,K为训练集样本个数;si、yi分别为第i个样本的预测输出值和实际值。根据式(6)计算初始坐标的适应度函数值;
5) 设网络结构为L-M-N,则搜索空间维数为n=M×L+N×M+M+N,利用式(1)创建天牛须朝向的单位随机向量;
6) 根据式(2)确定天牛左、右须的坐标;
7) 根据式(6)求左、右须的适应度函数值,并比较其大小,利用式(3)更新天牛质心的坐标;
8) 计算当前质心坐标的适应度函数值,若此时的适应度值小于前一次迭代的适应度值,则更新适应度值和质心坐标;
9) 根据式(4)和式(5)更新距离和步长;
10) 如果迭代进行到最大次数或者适应度值达到预设的精度,则进入步骤11),否则,返回步骤5);
11) 迭代结束时,搜寻到的最佳质心坐标即为网络的最优初始权值和阈值,将其赋予网络,得到BAS-BP模型。
3 基于BAS-BP模型的交通图像压缩
基于前述研究,BAS-BP模型的交通图像压缩算法步骤为:
1) 对图像分块,并归一化处理,得到训练输入数据;
2) 输入分块图像到BAS-BP模型中,获得最优的初始权值和阈值;
3) 根据最优的初始权值和阈值对网络进行训练,得到最优的网络;
4) 计算隐含层的输出,并保存压缩数据;
5) 载入压缩数据,计算输出层的输出;
6) 对输出数据反归一化,由数据块重建图像。
4 实验结果与分析
这里采用256×256的图像,分成4×4的块,将所有块按行从左向右依次转换为列向量,依次排列构成矩阵作为训练输入数据。BAS参数设为:距离衰减系数与步长衰减系数均为0.75,初始步长为30,两须间的初始距离为6,迭代次数为50,适应度值的精度为0.001。神经网络结构为16-7-16,目标误差为0.001,训练步数为3000。实验结果如图2、3所示,其中(b)、(c)为重建图像。
图2 不同压缩算法效果对比(一)
为进一步证实BAS-BP压缩算法的性能,表1给出不同压缩算法重建图像的峰值信噪比(PSNR)和压缩率(Rate)[8]。
表1 不同压缩算法的性能比较
对比图2、图3的结果,BP算法的重建图像中出现少许方块效应,细节较模糊,有一定失真;而BAS-BP算法重建图像效果良好,细节清晰。从表1可以看出,与BP算法相比,BAS-BP算法的压缩率减少了0.12以上,峰值信噪比也有所提高,最高6个dB,极大提高了压缩性能。可见,BAS-BP算法在重建图像质量与压缩率方面均表现出优越的性能,克服了BP算法的缺点,并且运算量小,为算法的实际应用提供支撑。
图3 不同压缩算法效果对比(二)
5 结束语
针对BP算法的不足,利用BAS算法易于实现、运算量小等优点,将其优化BP网络的初始权值和阈值,将优化的网络用于交通图像压缩,通过实验及对比分析证实了本算法的有效性。建立的BAS-BP压缩模型能良好地实现交通图像压缩,压缩性能有较大提高,但BAS的参数设置没有理论依据指导,要通过多次实验才能确定合适的值,并且压缩性能还有待进一步提高。因此在BAS算法和压缩性能方面还值得进一步研究。