APP下载

基于SVM算法的焊缝射线图像重复性检测研究

2020-07-09杨湘粤伍希志黄雪优

现代信息科技 2020年21期

杨湘粤 伍希志 黄雪优

摘  要:针对特种设备监督检查过程中焊缝射线图像复制、伪造等问题,对图像进行重复性检测研究,防止企业对图像进行人为作假。文章采用了SVM算法对焊缝射线图像的图像复制、图像编号篡改和图像重复拍摄三种重复类别进行检测研究,研究结果表明,该算法对复制和编号篡改类型的图像检测准确率为100%,对产品重复拍摄类型的图像检测准确率为93.3%,通过与差异哈希算法检测结果进行对比后发现,SVM算法有着更准确地识别效果。

关键词:射线图像;重复性检测;SVM算法;差异哈希算法

中图分类号:TP391.41      文献标识码:A 文章编号:2096-4706(2020)21-0155-05

Research on Repeatability Detection of Weld Radiographic Image

Based on SVM Algorithm

YANG Xiangyue1,WU Xizhi1,2,HUANG Xueyou3

(1.School of Materials Science and Engineering,Central South University of Forestry and Technology,Changsha  410004,China;2.Guangzhou Tech-Long Packaging Machinery Co.,Ltd.,Guangzhou  510530,China;

3.Hunan Special Equipment Inspection and Testing Institute,Changsha  410117,China)

Abstract:In view of the duplication and forgery of weld radiographic images in the process of special equipment supervision and inspection,the repeatability detection of images is carried out to prevent enterprises from artificially falsifying images. The article uses the SVM algorithm to detect and research the three repetitive categories of image duplication of weld radiographic images,image number tampering,and image repeated shooting. The research results show that the algorithm has 100% accuracy in detecting duplication and number tampering types of images. The accuracy rate of image detection for the repeated shooting type of the product is 93.3%. By comparing with the detection result of the different hash algorithm,it is verified that the SVM algorithm has a more accurate recognition effect.

Keywords:radiographic image;repeatability detection;SVM algorithm;different hash algorithm

0  引  言

隨着科学技术的飞速发展,射线成像技术得到了广泛应用。由于射线图像易产生、成像快、成本低的特点,该成像技术在工业、医疗等领域得到了广泛应用[1,2]。在特种设备监督检查过程中,某些企业或个人,为了减低焊缝检测成本,通过人为篡改射线图像,将一幅图像修改为多个产品的图像,逃避监检机构的检查,这给产品安全使用带来了严重的隐患。文章以焊缝射线图像为研究对象,通过对设备的射线图像进行重复性检测,排除有伪造、篡改的图像,从而提高设备的性能与质量。在湖南省特种设备检验检测研究院的技术支持下,作者对射线成像技术进行了学习与研究,并在中南林业科技大学材料科学与工程学院与广州达意隆包装机械股份有限公司博士后科研工作站的指导下,使用射线成像设备对实验图像进行了采集。

目前针对图像重复检测已经有许多方法。唐坚刚[3-5]等描述了一种基于Hash值的检测方法,通过将图像特征投影得到降维后的特征向量,生成这些向量的Hash值来查找不同版本的重复图像,该方法实现了图像快速查重,但当数据较大时该算法的鲁棒性差;杜振龙等[6,7]提出了基于Wasserstein重心坐标作为描述子的图像盲检测算法,通过生成图像欧式重心坐标初步筛选重复区域,利用PatchMatch算法进一步确定重复区域特征从而实现对复制、篡改、尺度变化等重复图像的检测,该方法有良好的鲁棒性,但对于特征相似度较高的图像识别率较低;甘玲等[8-10]描述了一种基于点匹配模型的复制图像识别方法,通过提取图像的特征点来定位出重复区域的特征信息,从而完成对重复图像的检测,该方法对于复制-粘贴篡改的重复图像有着良好的检测效果,但当图像重复类型较多时该方法往往很难达到检测要求。

本文采用SVM算法作为框架,结合HOG(Histogram of Oriented Gradient)算子检索出焊缝射线图像的特征区域,然后对图像进行重复性检测并输出重复类型结果。

1  本文算法

1.1  算法流程

本文提出的焊缝图像重复检测算法主要包括以下部分:读取图像信息并对样本进行去噪、增强、灰度化,在SVM空间中将图像信息转变为支持向量、用平面对向量进行划分,计算向量点到平面间的距离,使得分类间隔最大,HOG特征提取,设定分类标准使得满足要求的点分布在超平面两侧。算法流程图如图1所示。

本文SVM算法检测重复图像的主要步骤为:

(1)导入数据,对图像进行预处理,其过程为:灰度化处理、去噪、图像增强。

(2)图像数据转为支持向量,超平面划分向量点,最大化分类间隔。

(3)HOG提取,设置分类参数并选取多分类模型。

(4)SVM分类训练,检验结果。

1.2  图像预处理

1.2.1  灰度化

灰度化是图像处理的必经步骤,能够为后续的图像识别做铺垫。常用的灰度化处理方法有:最大值法、平均值法、加权平均法,本文采用加权平均法,选用合适权值对图像进行灰度化处理,加权公式为:

Gray=0.299×R+0.578×G+0.114×B

其中,R、G、B为图像在该颜色通道的像素值。

1.2.2  去噪

图像的采集、传输过程中可能会伴随噪声的出现,噪声的类型也有许多种,如椒盐噪声、高斯噪声等,针对不同类型的噪声,采取不同算法进行处理。

焊缝图片噪声的产生来自图像的采集和传输过程。射线采集设备在工作时可能受到各种因素的影响,如在使用射线拍摄工件时,光照强度和温度可能是产生噪声的主要原因,针对不同的噪声采用不同算法处理。

高斯噪声是图像采集中最常见的噪声,也称为正态噪声。它的概率密度函数为:

其中,随机变量z为灰度值,u为该噪声的期望,σ2即为噪声的方差。

椒盐噪声也是灰度图像中常见的噪声,又称为双极脉冲噪声,其概率密度函数为:

图像中出现的噪声只有两种灰度值,分别是a和b,这两种灰度值出现的概率分别是Pa和Pb。

在MATLAB中通过调用函数可以得到噪声图像与直方图,通过对噪声模型以及直方图的分析,可以明确去除噪声的方法,图2为含有噪声的焊缝图像,图3为噪声的模型与直方图。

滤波器可以对噪声进行去除,通过对噪声模型及直方图的分析,选取合适的滤波方法。常用的滤波复原器包括算术均值滤波器和几何均值滤波器,在坐标点(x,y),大小为m×n的矩形窗口表示为Sxy,算术平均值是窗口Sxy中被干扰图像g(x,y)的平均值,即:

几何均值滤波器在去除噪声时的表达式为:

对含有噪声的图像采用上述两种滤波方式,效果如图4所示。

1.2.3  图像增强

图像增强的主要目的是提高图像的质量和辨识度,使得图像的边缘特征、轮廓信息更为清晰,便于后续的特征提取操作。

1.3  超平面划分

预处理操作之后,将图像数据在SVM空间中转化为支持向量,SVM支持向量机的基本型为:

s.t.yi(WTxi+b)-1≥0,i=1,2,…,n

其中,yi(WTxi+b)为超平面方程,y为数据点的标签,其值一般取1或-1。如果数据点在平面的正方向,即(y=+1类),那么向量点到超平面yi(WTxi+b)距离为一个正数,而当数据点在平面负方向时(y=-1类),距离依然为一个正数,这样就能够保证距离一直大于0。所以向量机的基本型可以等价于:

s.t.yi(WTxi+b)-1≥0,i=1,2,…,n

对于多维数据样本集,SVM算法会随机产生一个平面并对其训练,直到样本中满足不同条件的点刚好位于平面的两侧。

1.4  HOG提取

HOG是在计算机视觉里用来进行目标检测的特征描述子,通过计算和统计图像局部区域的梯度方向直方图来构成特征,在一幅图像中,局部目标的表象和形状能够被梯度或边缘的方向密度分布很好地描述,所以该方法能够很好地提取到焊缝图像的特征信息。图5为HOG算子对不同重复类型图像的特征提取结果。第一幅图为原图像,其余依次为HOG算子对图像复制、图像编号篡改、产品重复拍摄的重复图像特征提取。

1.5  SVM分类训练

SVM是定义在特征空间上的间隔最大线性分类器,它将数据点作为向量映射到高维空间中,并在空间中建立一个最大间隔超平面将这些向量点划分开,向量点距离超平面的距离越大则分类误差越小。焊缝图像的重复类型主要有:图像复制、图像编号篡改和产品重复拍摄。本文通过SVM算法将焊缝图像转化为向量点,并在SVM系统里对不同类型的点进行归类,从而检测出重复图像。

2  算例结果与分析

下面主要从两方面进行阐述:一是射线图像的SVM重复性检测研究;二是与差异哈希算法(dHash)重复性检测进行对比。

算例是在一台配置i7-9750H CPU与16 GB RAM的PC机上在MATLAB 2018环境中实现。射线图像拍摄来自德国进口设备,由企业提供支持,射线采集设备如图6所示。

在算例中,图像标准库为120张不含重复类型的图片。本算例旨在检测出与标准库中图像复制、图像编号篡改和产品重复拍摄这三种重复类别的图片,同时,为了排除无关变量的影响,增加一组无重复的图片作为对照组,保证检测结果的准确性。

2.1  SVM重复性检测

SVM算法检测主要分为两个步骤:训练模型和图像重复性检测。训练模型过程为:采集训练集图像。训练集包含图像复制、图像编号篡改、产品重复拍摄三种重复类型的图片各20张,以及无重复图片20张,总计80张图片;对训练集图像进行预处理,并将图像尺寸缩放为256×256像素;用HOG算子對所有训练图片进行特征提取;对特征图像进行训练;在SVM算法中选用fitcecoc训练模型对图像进行分类训练。训练结束后,使用测试集图像进行实验检测。测试集总计60张图片,其中图像复制、图像编号篡改变换、产品重复拍摄、无重复四种类型各15张。将测试集图像输入到检测模型中进行分类预测,并显示分类结果。

SVM算法重复性检测结果如表1所示,从表可以看出,SVM算法对于图像复制、图像编号篡改的重复性检测准确率均为100%,对于产品重复拍摄类的重复性检测准确率达到93.33%,同时对于无重复的图片识别率在100%。因此,SVM算法对图像重复性检测效果良好。

2.2  与差异哈希算法对比

差异哈希算法是根据图片相邻像素间的亮度梯度生成图像的哈希值,然后对图像间的哈希值进行异或运算得到汉明距离,通过判别汉明距离大小来进行图像间的重复性检测。用该算法对图像复制、图像编号篡改和产品重复拍摄三种重复类型进行检测。

不同重复类型的图片,汉明距离也不同。针对不同重复类型的图片,计算多组图像的汉明距离,确定该重复类型的汉明距离值。每种重复类型选取6组图像,汉明距离统计结果如表2所示。从表可以看出,图像复制类的汉明距离均为0,编号篡改类的汉明距离在1~5之间分布,重复拍摄类的汉明距离在20~25之间分布,而无重复的图像汉明距离在35~45之间分布。

根据分布规律,对图像复制、图像编号篡改和产品重复拍摄、无重复这四类图像的汉明距离做出如下规定:约定复制图像重复性检测的汉明距离为0,编号篡改图像重复性检测的汉明距离为1~5,产品重复拍摄图像重复性检测的汉明距离为10~25,无重复类型图像的汉明距离大于25。

根据上述汉明距离的规定,使用差异哈希算法对本算例的焊缝图像进行重复性检测。差异哈希算法的检测过程为:采集检测图像,三种重复类别的图片各采集15张,无重复的图像采集15张,总计60张图片;将检测图像與标准库中的图像两两进行差异哈希运算,生成每组图像的汉明距离;根据图像汉明距离值进行重复图像检测和分类。

差异哈希算法检测结果如表3所示,从表中可以发现,差异哈希算法对复制类型的图片检测准确率为100%,对编号篡改类型的图像检测准确率为86.67%。对重复拍摄类型的图片识别效果一般,准确率为60%,对于无重复的图片能够100%检测。相比SVM算法,差异哈希算法对于编号篡改、重复拍摄类型的检测鲁棒性较低。

将SVM算法与差异哈希算法检测结果进行对比,如图7所示。从图中可以发现,SVM对于各种重复类型的识别均有良好效果,平均识别率达到98.33%。差异哈希算法对图像复制、编号篡改类型的检测效果与SVM算法接近,而对于产品重复拍摄的图像检测效果较差;且差异哈希算法需要分组进行图像检测,检测时间也略高于SVM算法,所以SVM算法更适用于重复图像类型的检测。

3  结  论

论文采用SVM算法和差异哈希算法对焊缝射线图像重复性检测进行了研究,主要研究结论如下:SVM算法对图像复制、图像编号篡改和产品重复拍摄的重复性检测均有良好效果,平均识别率达到98.33%。差异哈希算法对图像复制类型的重复性检查准确率为100%,对图像编号篡改和产品重复拍摄类型的重复图像检测准确率均小于90%,且差异哈希算法的检测时间也略高于SVM算法,因此,SVM算法更适用于重复图像类型的检测。

参考文献:

[1] 杨斌,李艳艳,李洪英.基于双目视觉的待涂装焊缝的识别 [J].现代信息科技,2020,4(17):149-151+154.

[2] 牛志忠,杨坤.一种基于多尺度Retinex的夜间图像增强算法 [J].现代信息科技,2020,4(17):66-68+71.

[3] 唐坚刚,孙龙杰,杨生远.SIFT结合改进的Harris的图像匹配方法 [J].计算机应用与软件,2013,30(7):126-131.

[4] 唐坚刚,刘丛,张丽红.基于形状边缘点夹角直方图的图像检索研究 [J].上海理工大学学报,2010,32(6):564-568.

[5] 唐坚刚,王泽兴.基于Hash值的重复图像检测算法 [J].计算机工程,2009,35(1):183-185.

[6] 杜振龙,叶超,李晓丽,等.基于Wasserstein直方图欧氏度量的图像重复区域盲检测算法 [J].光学与光电技术,2018,16(6):25-32.

[7] 杜振龙,杨凡,李晓丽,等.基于复合特征的复制粘贴伪造图像盲检测 [J].计算机工程与设计,2012,33(11):4264-4267.

[8] 甘玲,王凯.基于HSV和HE的复制粘贴篡改检测算法 [J].重庆邮电大学学报(自然科学版),2019,31(3):400-406.

[9] 甘玲,张鹏飞.一种基于点匹配的图像重复区域检测方法 [J].微电子学与计算机,2015,32(8):62-66.

[10] HAJIALILU S F,AZGHANI M,KAZEMI N. Image copy-move forgery detection using sparse recovery and keypoint matching [J].IET Image Processing,2020,14(12):2799-2807.

作者简介:杨湘粤(1995—),男,苗族,湖南湘西人,硕士研究生,研究方向:图像处理;通讯作者:伍希志(1985—),男,汉族,湖南娄底人,讲师,博士,研究方向:机器视觉,工程机械,复合材料结构。