APP下载

铁路货车装载状态图像质量客观评价方法研究

2023-12-05罗奕凯

铁道货运 2023年11期
关键词:清晰度货车亮度

罗奕凯

(中国铁路南宁局集团有限公司 货运服务中心,广西 南宁 530029)

铁路货车装载状态图像是货检人员对货物装载状态的复现,可以直观地展现货物在运输过程中的情况,在现代化的铁路货检中,往往会采用先进的技术手段来生成高精度的货车装载状态图像。在铁路货车装载状态图像采集系统建成验收、维护验收中,图像质量评价是非常重要的,能够直接影响到后续运行情况的判断和决策。当前铁路领域尚未开展图像质量评价的定量研究,尚未形成一种有效、客观、权威的图像质量评价方法,在评估设备性能的过程中,容易出现评估结果与实际表现不符的情况,影响铁路货车装载状态图像采集系统的运行效率和运行安全。因此,建立标准图像质量客观评价机制,要求设备新建、更改后通过评价指标要求,是非常值得研究探讨的方向。

1 图像质量评价理论

图像质量是比较图像处理算法性能及优化机器视觉应用系统参数的重要指标,图像质量评价就是量化机器视觉应用系统生成图像质量的优劣程度,在不同场景下存在着不同的评价指标和评价标准。铁路货车装载状态图像采集系统通过采集运行中货物列车的图像信息,供铁路工作人员对货车装载加固安全状态进行细致检查,属于机器视觉检测应用,因此铁路货车装载状态图像质量的优劣,取决于该图像是否能够较好地呈现局部细节。

图像质量的评价方法主要可以归纳为主观评价与客观评价2 类[1]。主观评价方法是从人类的主观感知角度对图像质量进行评判,然而这一评价过程不仅耗时且成本较高,在缺乏图像评价领域权威专家参与的情况下,其说服力也相对较弱。客观评价方法则采用数学模型对图像质量进行量化评估,受人为因素影响较小,通过结合图像特征并应用相适宜的数学模型,可以在一定程度上较好地实现预期效果。从客观评价方法所需参考图像信息的依赖程度来看,又可以划分为全参考型、部分参考型和无参考型3 类[2]。全参考型方法需要原始图像以及经过处理的图像进行比较,部分参考型方法仅需要原始图像的部分信息,而无参考型方法则无需任何参考图像。

在铁路货车装载状态图像质量评价场景下,采集到的图像是列车阶段状态性的图像,无法获得原始图像信息作为参考,因而研究主要集中于无参考型客观评价方法,在保证铁路货车装载状态图像质量评价结果更具客观性的同时,也能提高评价效率,降低评价成本。

2 铁路货车装载状态图像质量客观评价方法

根据《铁路货车装载状态标准图像设备暂行技术条件》(TJ/KH 040—2022),铁路货车装载状态标准图像是指“能够完整、准确反映铁路货车车体、货物、货物装载加固状态的无明显变形、噪点、模糊的高清图像”,同时还要求“图像明亮清晰、亮度均匀”。可见清晰度、畸变度和亮度对图像细节信息的展示产生重要影响。其中,清晰度是指图像中物体轮廓的清晰度和边缘的锐利程度,一张清晰的图像能够呈现出更多的细节和纹理,提高图像的可视性和辨别度,让人们更容易识别图像中的目标物体;畸变度是指图像中物体形状和大小与实际物体的偏差程度,畸变度高的图像可能会失真或变形,从而影响人们对图像中物体的识别和分析;亮度是指图像的明暗程度,过高或过低的亮度会使图像出现过曝或欠曝的情况,从而降低图像的可视性和细节表现能力。综上,研究将以铁路货车装载状态图像为基础,从清晰度、畸变度和亮度3 个方面研究图像质量客观评价方法。

2.1 清晰度评价方法

再模糊理论方法是一种专门针对图像清晰度评价的方法,其思想是将待评价图像通过滤波形式进行再模糊,构造一张模糊程度更大的参考图像,然后运用全参考型评价方法,比较参考图像与待评价图像间的信息损失程度。信息损失程度可以作为图像清晰度的评价指标,信息损失越大,代表图像越清晰;信息损失越小,则图像越模糊[3]。分析基于再模糊理论的无参考结构清晰度评价方法[4](NRSS)、结构相似性方法[5](SSIM),研究适用于货车装载状态图像的清晰度评价方法,计算步骤如下。

(1)将原图进行灰度化处理,作为待评价图像。通过灰度化处理,可以使得图像中的彩色信息转化为亮度信息,为后续进一步处理提供所需信息的同时,能够显著降低处理的复杂性和计算量。研究使用加权平均法进行彩色图像灰度化处理,将红色、绿色、蓝色分量的权值设置为0.30,0.59,0.11,以模拟人眼对于颜色的亮度感知,其表达式为

式中:g为输出的灰度化图像;r,g,b分别为输入彩色图像的红、绿、蓝3 个通道子图像;(x,y)为图像的像素坐标。

(2)对待评价图像进行平滑处理,作为参考图像。参照NRSS 算法,采用7×7 大小、标准差平方σ2为6 的高斯滤波器进行平滑处理,则高斯卷积核G为

对待评价图像进行高斯平滑处理的表达式为

式中:Ir为参考图像;I为待评价图像;⊗为图像的卷积运算。

(3)提取图像待评价图像I、参考图像Ir的梯度图像,分别记为X,Y。基于Canny 算子能在噪声干扰的条件下较好地提取出目标边缘[6],研究采用Canny 算子提取梯度图像,在生成梯度图像时应尽量滤除噪点,避免过多噪点被当做边缘信息参与信息损失程度的计算。并采取Otsu 阈值分割法确定Canny算子的双阈值[7],设L为输入图像灰度级,有正整数t∈(0,L-1),可以将输入图像像素值分为[0,t]和[t+1,L-1]2个集合,则有

式中:μ1,μ2分别为2 个集合的平均灰度值;Pi为各灰度值的出现概率。

设f2(t)为上述2个集合的间类方差,则有

对t进行遍历,使得f2(t)取得最大值时,对应的t则作为阈值上限,阈值下限取阈值上限的0.5倍。

(4)计算图像X,Y的结构相似度SSIM(X,Y)。SSIM(X,Y)是处于0 至1 之间的数,用于衡量X,Y2幅图像相似度的指标。SSIM(X,Y)越大,2幅图像的差异越小,说明模糊化处理后的信息损失越小,代表图像越模糊。其表达式为

式中:μX,μY分别为图像X,Y的像素均值;σX,σY分别为图像X,Y的像素方差;σXY为图像X,Y的像素协方差;C1,C2为常数,是为了避免分母为0 的情况,在计算时,通常取C1=(K1×L)2,C2=(K2×L)2,其中K1,K2为远小于1 的正数,L为灰度等级,一般取K1=0.01,K2=0.03。

(5)计算铁路货车装载状态图像清晰度指标S。S值处于0 至1 之间,越接近于1,则清晰度评价指标越好。清晰度指标计算公式为

2.2 畸变度评价方法

在不采用参考图像的前提下,对特定图像畸变度的评价主要是通过获取图像特征物轮廓的长宽比,再与实际物的长宽比进行比较,求出待评价图像的形变率,因而计算前提为特征物的选取及其轮廓的提取方式。

在特征物选取上,考虑到铁路货车车型繁多且各异,而主流车型如棚车、敞车、平车、保温车和双层运输汽车专用车等均标记有铁道车辆用路徽。同时,路徽的绘制须遵循1987 年铁道部印制的《铁道车辆用路徽标记》(TB/T 1838—1987),即标准路徽标记的底长与边长的比值应为20:23,铁道车辆用路徽标准规格如图1 所示。因此研究选择路徽作为目标特征物,具有覆盖车型广、特征明显和标准可靠的优点。

图1 铁道车辆用路徽标准规格Fig.1 Standard emblem for railway vehicles

在特征物轮廓提取方式上,鉴于YOLO算法检测效率高、耗费资源少等优点[8],研究采用基于YOLOv8 的目标检测模型,自动提取图像特征物定位框坐标信息,以此来代表特征物的轮廓信息。

考虑到列车运行时车辆在垂直方向的运动幅度不大,可以认为线阵相机的成像中,拍摄物体在高度上基本不会发生畸变,仅在水平方向可能发生压缩或拉伸[9]。在此基础上,在将路徽图像缩放至边长与实际路徽的边长相等时,用图像中路徽的底长与实际路徽的底长进行比较,以此计算畸变率,计算步骤如下。

(1)训练最优检测模型。从新丰镇站、南宁南站铁路货车装载状态图像采集系统历史过车图像中选取样本图像195 张,按照800 像素×800 像素大小依次剪裁包含路徽的子图像,避免训练时压缩幅度过大。划分训练集图像180张,验证集15张,采取预训练模型YOLOv8 Nano 进行训练,控制压缩后的输入图像大小为640 像素×640 像素,设置BATCHS_SIZE 为4,epoch 为100,初始学习率为0.000 1,得出最优检测模型,用于检测待评价图像中路徽定位框的坐标信息。

(2)使用训练得到的最优模型,预测输入的待评价图像,获取路徽定位框左上角及右下角的坐标,并用坐标差值来代表图像中路徽的底长和边长的数值,表达式为

式中:Ax,Ay分别为图像中路徽的底长和边长的数值;(x1,y1),(x2,y2)分别为路徽定位框在图像中的左上角和右下角的坐标值。

以某幅货车装载视频状态图像为例,在预测图像上绘制定位框和坐标信息并保存后,最优模型验证预测结果和信息展示如图2 所示。可见定位框左上角坐标值为(245,319),右下角坐标值为(376,458),则底长为376-245=131,边长为458-319=139。

图2 最优模型验证预测结果和信息展示Fig.2 Prediction results validated by optimal model and information presentation

(3)将图像中路徽缩放至边长与实际路徽的边长相等,用图像中路徽的底长与实际路徽的底长的相对误差来代表畸变度评价值D。D值处于0 至1 之间,越接近于1,代表图像中车辆的长宽比越接近于实际车辆的长宽比,则畸变度评价指标越好。其表达式为

式中:M为缩放倍率;Bx,By分别为实际路徽的底长和边长。

2.3 亮度评价方法

在统计分析图像中的像素灰度值时,所产生的直方图被称为图像直方图,图像直方图不仅能够用于评估图像亮度,也可以用于分析场景目标[10]。基于图像直方图与亮度信息的关系,研究通过图像直方图的方式评价亮度,主要思路就是计算直方图的峰值距离中心点的偏离程度,偏离程度越高,其亮度评价值越低。计算步骤如下。

(1)获取直方图信息,图像的直方图可以用以下离散函数hist(rk)表示为

式中:rk为第k级的灰度值;nk为灰度值为rk的像素个数。

(2)进行归一化计算,归一化后的直方图可以表示为

式中:R(rk)为灰度值为rk的像素在图像中出现的概率,所有灰度值出现概率之和等于1;M×N为图像的分辨率。

(3)以像素灰度值出现概率为权重,计算每个灰度值偏离中心点的程度值dk,表达式为

(4)以每个像素灰度值的加权偏离程度值为基础,综合计算图像亮度评价值B。B值处于0 至1 之间,越接近于1,代表图像各像素点灰度值越接近于直方图的中心,则亮度评价指标越好。其表达式为

2.4 铁路货车装载状态图像质量整体评价指标

基于清晰度、畸变度、亮度3项评价指标,可以融合得到一个综合的货车装载状态图像质量评价指标E。E的值处于0至1之间,越接近于1,代表图像质量评价结果越好。其表达式为

式中:a,b,c为参数,a>0,b>0,c>0,且a+b+c=1,用于调整3项评价指标的权重值。

3 案例分析

为了验证图像质量评价算法,筛选5 张质量差异较大的铁路货车装载状态图像作为本次评估的试验数据,分别用Pic1 至Pic5 来代表,并使用剪裁的方法对前景图像进行提取,避免背景图像的影响。测试图像集如图3所示。

图3 测试图像集Fig.3 Test image collection

清晰度、畸变度、亮度3 项指标都对货车装载状态图像质量产生影响,根据实际工作经验,随着应用的不同,其重要程度也不同。例如,在人眼识别情况下,过低的清晰度和亮度会给人眼观察带来困难,并且会产生疲劳感,对图像的辨识影响较大。相反,在智能识别情况下,机器对清晰度和亮度的适应能力更强,而对畸变的图片则很可能将关键信息识别错误。目前全路大部分货检站采取人检为主、机检为辅的作业模式,少部分货检站运用了图像智能识别模块,正在向“到达作业机检为主、人检为辅,出发作业人检为主、人机结合”的作业模式转换,并且运用图像智能识别推动少人化作业是发展趋势。因此,在权重系数的设置上,应根据不同测点的应用情况,以及图像智能识别应用的推广程度进一步研究确定。研究暂设置a=b=c,即3项指标同等重要来进行验证。

以测试图像为例,运用研究提供的方法对5 张铁路货车装载状态图像质量进行整体评价,整体评价值计算结果如表1 所示。由表1 可知,清晰度评价结果为Pic2>Pic3>Pic4>Pic5>Pic1,畸变度评价结果为Pic1>Pic2>Pic4>Pic5>Pic3,亮度评价结果为Pic4>Pic3>Pic2>Pic5>Pic1,综合评价结果为Pic2>Pic4>Pic3>Pic5>Pic1。

表1 整体评价值计算结果Tab.1 Calculation results of overall evaluation value

以图像的局部细节是否可以较好地呈现作为图像质量评价依据,从人眼主观感受对5 张测试图像进行观察,显然Pic1 基本无法通过人眼判断货车装载状态,需要安排人员现场复检,因而判定质量最差;Pic5 可以明显感受到模糊,给人眼判断带来困难,因而判定质量仅较Pic1 稍好;Pic2,Pic3 和Pic4 可以从单项指标辨清区别,但各有优劣势,难以通过主观感受来评判整体图像质量,因而综合评价值差异并不大,需要从人检、机检2 个方面,结合工作实际合理调节单项指标的权重值,进一步提高综合评价值的准确性。

4 结束语

从测试图像的验证结果上看,研究提出的评价方法与人眼主观感受实现了较好的一致性。从清晰度、畸变度和亮度3 个方面建立铁路货车装载状态图像整体评价指标,对铁路货车装载状态图像采集系统的性能表现进行科学、客观的评价判断,有助于为设备管理部门提供决策依据,找准后续补强方向。同时,也为铁路各系统健全图像质量评价机制提供理论基础,通过对图像采集设备进行客观的评估,要求设备符合硬性指标条件,提高成像质量,以保证设备具有良好的可靠性,帮助铁路企业管理部门通过检测图像及时发现问题、分析问题和解决问题。

猜你喜欢

清晰度货车亮度
货车
鲜明细腻,拥有更好的清晰度 Ascendo Immersive Audio CCRM-12 MKII/CCRM-6P/SMS-15
亮度调色多面手
货车也便捷之ETC新时代!——看高速公路货车ETC如何实现
亮度一样吗?
推货车里的爱
基于斩波调制的LED亮度控制
人生的亮度
治超新规实施在即 深究货车非法改装乱象
听音训练对汉语单音节听感清晰度的影响