基于分形纹理特征的侧扫声呐图像沉船识别方法研究

2021-08-17董凌宇单瑞刘慧敏于得水杜凯

海洋地质与第四纪地质 2021年4期

董凌宇，单瑞，刘慧敏，于得水，杜凯

1.中国地质调查局青岛海洋地质研究所，青岛266071

2. 青岛海洋科学与技术国家实验室海洋矿产资源评价与探测技术功能实验室，青岛266071

水下目标识别技术被广泛应用于水下搜救、天然气水合物探测、石油勘探、沉船搜寻、水下考古等领域[1]。其中，水下沉船识别技术在航道疏浚和安全保障、水下考古和文物发掘等多应用领域有着重要的意义。侧扫声呐系统具有测量范围大、分辨率高等优点，可高效完成大面积海域的水下目标探测，广泛应用于水下沉船识别工作。受复杂海洋环境影响，侧扫声呐的目标影像往往存在图像模糊、畸变以及与其他成像体（如鱼群或悬浮物等）相似度高等问题[2]。因此，高精度的侧扫声呐图像分类提取算法是对沉船等目标进行有效识别的关键。

目前，侧扫声呐图像的目标识别算法通常基于图像分割法、支持向量机法、卷积神经网络法、纹理特征分类法等。其中，基于图像分割的方法主要根据声呐图像中遮蔽物体存在反射区与阴影区临近的现象识别沉船，但其聚类往往受到岩体、海脊和沙波的干扰而出现误识别[3]；支持向量机法使用沉船轮廓的不变矩进行沉船目标识别[4]，但由于其声呐图像多由测量实验池获得，缺失海底复杂地形与底质类型的特性，其运用于复杂海底环境存在一定局限性；卷积神经网络法基于像素重要性值，通过提取图像内点特征及其聚集度来识别目标，但由于声呐图像数据量较小，导致卷积神经网络在分类时易存在过拟合的现象，错将非目标物体识别为目标物体[5]。

受载体运动状态及海洋环境噪声影响，侧扫声呐图像多存在目标边界残缺及目标被部分遮挡的问题，目标的形状往往与实际有较大差异。对图像中的特定目标识别时，同一类目标的轮廓存在多样性且在不同的成像条件下其轮廓形状也存在差异。由于人工目标不具有自然景物的自相似性纹理，纹理特征分类法对轮廓多样的人工目标具有更好的识别效果。常用于侧扫声呐图像目标识别的纹理特征有灰度共生矩阵GLCM（Gray-level Cooccurrence Matrix）和Tamura纹理。灰度共生矩阵基于图像邻域像素灰度值的概率分布提取纹理特征[6-7]，能较好描述具有方向性和灰度差异大的纹理图像，但统计特征量的计算量庞大且特征量之间大多存在统计相关，寻找统计无关的特征量组合是一件繁杂的工作。基于人类对纹理视觉感知的心理学研究，Tamura在1978年提出图像的六个特征值来描述图像纹理[8]，其具有良好的旋转不变性与尺度不变性，但对于图像局部纹理特征难以描述。分形纹理基于图像像素灰度值的空间分布与自相似性描述提取图像纹理特征。Hausdorff提出分形维数用于定量描述图像表面的空间复杂程度，能够定量描述目标的纹理特征。Grassberger进一步使用多重分形谱用于描述不同测度子集下的局部图像纹理特征，能够结合整体纹理与局部纹理的相对关系描述目标特征。同时分形纹理特征提取避免了人工干预的低效，因而是一种良好的目标识别方法。

本文针对三种分形纹理特征提取，实现了盒计数分形算法、双毯覆盖模型分形算法与多重分形谱分形算法。针对侧扫声呐小样本目标识别易过拟合、分类精度低等问题，采用解释性好、抗干扰强的Adaboost级联分类器，构建基于分形纹理特征的Adaboost级联分类器沉船目标识别流程，并采用精确率和召回率的调和平均值F1作为沉船识别精度评价标准。结合实测数据进行沉船识别实验，分析比较了三种分形纹理特征的识别效果，并与灰度共生矩阵GLCM和Tamura纹理特征的识别结果进行对比，验证了本文方法的有效性。

1 分形理论与分形纹理特征

近年来，分形理论在图像处理领域中取得了广泛的应用，包括边缘检测、目标识别、压缩编码等[9-12]，其中已在遥感图像、医学图像以及交通图像分类识别中取得一定成果[13-15]。分形是用于描述集合的空间复杂程度的一种度量，能够定量地描述图像表面的复杂性和不规则度。因此分形维数可以用于描述图像纹理特征。Grassberger提出了多重分形谱来描述不同测度子集下的局部图像纹理特征，能够从局部到整体全面地描述目标特征，这也为更准确的目标识别提供了理论依据[16]。

分形维数可用于描述二维图像表面纹理的复杂程度，Hausdorff定义了分形理论中关于测度和维数这二者的概念[17]。Hausdorff测度外延了在传统欧几里得几何学中所描述的长度、面积和体积的概念，其所能描述的对象既可以是欧氏几何图形，也可以是分形。定义H s（F）为F的s维Hausdorff测度，随着s的变化，存在使H s（F）从∞变化到0的临界值s0，其定义为Hausdorff维数，记作dH（F），即：

Hausdorff维数对于任何集合都适用，因此具有很高的理论价值，但Hausdorff维数难于直接计算，本文采用下面的盒维数和毯维数进行简化计算。

1.1 盒维数

Gangepain和Roques-Carmes在1986年提出基于盒计数（Box-counting）的分形维数，通过计算覆盖图像表面的最小盒子数来度量[18]。将M×M的图像分为N×N的子块，图像（x,y）处的灰度值为f（x,y），总的灰度级为G。此时将图像看作三维物体的表面灰度集（x,y,f（x,y））。XY平面上是N×N的网格，Z轴为网格内像素灰度值，每个网格上有若干个盒子叠加，盒子高度h=[G×N/M]。

若在第（i,j）个网格中，第m个盒子中包含网格内灰度最小值，第l个盒子包含网格内灰度最大值，则覆盖第（i,j）个网格的盒子数nr（i,j）为：

覆盖整个图像的盒子数Nr为：

其中r=M/N，由此可求分形维数D为：

通过改变网格N的大小计算一组Nr，然后计算点对{log（1/r）,log（Nr）}的线性回归，其斜率即是分形维数D。

1.2 毯维数

Mandelbrot在计算英国海岸线长度时提出了毯维数算法。近年来，国内也有应用毯维数进行海岸线长度计算的案例，取得了较好的效果[19-20]，其后衍生出可用于描述图像纹理的基于双毯覆盖模型的分形算法。图像的“毯子”由各像素灰度值作Z轴所形成的三维曲面上下ε处构建，其厚度为2ε，表面积为体积除以2ε。

令f（i,j）表示灰度函数，με表示“毯子”的上表面，bε表示“毯子”的下表面，初始情况设为：

“毯子”生长算法如下：

其中，d（i,j,m,n）为（i,j）与（m,n）两点间的距离。则“毯子”的体积为：

表面积为：

由于分形表面积为A（ε）=Fε2-D，其中D为分形维数，令c1=2-D，则

改变尺度ε的大小，可以计算得到一组logA（ε）的值，然后计算点对{ε,logA（ε）}线性回归，得到回归方程的斜率c1，即可求出分形维数D。

1.3 多重分形谱

多重分形常用来描述图像的奇异性几率分布，其能够量化测度的奇异结构，以及在尺度发生变化时以伴随有不同范围幂定律的现象建立模型，因此能够用于描述图像的纹理特征[21]。设α为Lipschitzholder指数，又称奇异性指数，其决定了概率密度的奇异性。首先计算图像上每个点的奇异指数α，将具有相同奇异指数的像素点作为一个点集；然后计算具有不同奇异指数像素点集的分形维数，即可以得到多重分形谱图像α-f（α）[22]，计算过程如下：

（1）用尺度为δ的盒子覆盖图像，将像素点落在第i个盒子概率定为pi（δ），即得到概率测度分布为：

其中，∑i[pi（δ）]q为所有盒子概率的q阶矩之和。

（2）对于概率测度分布的q阶矩，理论上q的取值范围为-∞＜q＜+∞。当q＞0时，在概率测度求和中具有较大概率的子集对分形维数的贡献较大；当q＜0时，具有较小概率的子集对分形维数的贡献较大。

此时，奇异指数α（q）为：

分形维数f（α（q））为：

（3）取一组不同的q值重复上述计算过程，绘制每个奇异指数α（q）对应的分形维数f（α（q））即得到了多重分形谱α-f（α）。其中α-f（α）曲线包括最小奇异指数αmin、最大奇异指数αmax、最小分形维数值fmin、最大分形维数值fmax、多重分形谱宽Δα=αmax-αmin和多重分形谱高Δf=fmax-fmin。

多重分形谱能够用来描述纹理图像的层次特征，即具有不同奇异指数的局部图像纹理。在区分自然场景中的人造物体时，人造物体本身不具有自相似性结构的特点，不满足分形模型，而自然景物存在自相似性，满足分形模型[23-24]。因此，沉船目标与海底表面的分形维数不同，便可以实现分形纹理对沉船识别的特征描述。多重分形方法通过奇异指数考虑了图像的局部与不同层次的纹理特征，因而能够全面且准确地描述图像分形结构，从而区分自然场景与人工造物，提高沉船目标识别的有效性。

2 基于分形纹理特征的Adaboost目标识别

级联分类器Adaboost是一种基于boosting算法的改进算法，即是把“弱学习算法”提升为“强学习算法”，在人脸识别、交通标志检测、医学影像识别中均取得了良好的效果[25]。如图1所示，其通过选取多个弱分类器按照给定的样本集进行训练，每一个弱分类器的分类结果按照不同的权重对最终分类结果进行贡献。

图1 Adaboost级联分类器Fig.1 Adaboost cascade classifier

2.1 Adaboost分类器介绍

本文采用简单决策树为弱分类器的Adaboost级联分类器作为侧扫声呐图像沉船识别分类器，主要计算过程如下：

（1）设训练样本集为S=（x1,y1）,（x2,y2）,···（xm,ym），若yi取值为-1或+1，则为二分类问题，其中1,···,m为样本编号，ym为样本类别的标记。初始化样本权值w1,i=1/m，迭代次数为t=1,2,···,T。

（2）首先调用弱分类器学习算法，计算加权分类误差，再通过最小化加权分类误差ε选取一个最佳的分类器h（x,f,p,θ），其中p为不等号方向，f为特征向量，θ为阈值参数。

（3）令ht（x）=h（x,ft,pt,θt）,ft,pt,θt为使εt最小时的因子，则更新下一轮迭代权重为，wt+1,i=wt,iexp（-atytht（xi））/Zt，其中Zt为归一化因子。

（4）输出强分类器at=ln（（1-εt）/εt）。

Adaboost算法的工作机制是从训练集初始权重训练出弱分类器1，根据其分类误差来更新训练样本的权重，使得误差较高的样本在弱分类器1中的权重变高，从而在接下来的弱分类器2中得到更多重视，如此重复进行直到指定的T个弱分类器训练完毕，通过集合策略进行整合得到最终的强分类器。因此，Adaboost分类器具有分类精度高、弱分类器可用多种回归分类模型构建、结构简单易理解、更能抵抗过拟合等优点。其他常用于二分类的分类器中，卷积神经网络容易发生过拟合、中间过程不可解释；K最近邻算法每一次分类均会重新全局运算，效率较低且需要人工K值选择；支持向量机对于小样本分类具有优势，但核函数可解释性较差。因此本文采用简单决策树为弱分类器的Adaboost级联分类器作为侧扫声呐图像沉船识别分类器。

在机器学习和目标分类等领域中，如何评估分类结果的精度是一个重要的工作，本文引入Fmeasure评价模型[26]。F-score是精确率P和召回率R的加权调和平均，当参数α增大时，召回率的权重增加，精确率的权重降低；当参数α减小时，召回率的权重降低，精确率的权重增加。

当参数α=1时，即认为精确率和召回率的权重是一样的。此时F1值就是精确率和召回率的调和平均值，能够较为准确地评价分类器分类结果，即：

2.2 Adaboost目标识别流程

本文构建了基于分形纹理特征的Adaboost目标识别流程，如图2所示。

图2 基于分形纹理特征的Adaboost目标识别流程Fig.2 Adaboost target recognition procedure based on fractal texture features

第1步，将样本分为训练样本和测试样本两部分（均已人工标定其类别标签），训练样本与测试样本中均包含若干沉船图像和非沉船图像。

第2步，根据盒维数、毯维数与多重分形谱计算流程，计算训练和测试样本的分形纹理特征向量。

第3步，将训练样本的分形纹理特征向量输入级联分类器Adaboost中进行训练，然后输入测试样本的分形纹理特征向量，预测每一个测试样本的类别。

第4步，根据分类器分类结果计算F1值。

针对侧扫声呐小样本目标识别易过拟合、分类精度低的问题，常用分类器在使用中存在一定问题难以解决，如支持向量机解释性较差，卷积神经网络容易过拟合，K最近邻算法计算效率低且参数需人工干预。因此本文采用解释性好、抗干扰强的Adaboost级联分类器，构建基于分形纹理特征的Adaboost分类器沉船目标识别流程，并使用精确率和召回率的调和平均值F1作为沉船识别精度评价标准。

3 实验与讨论

3.1 基于分形纹理特征的Adaboost识别实验

本文通过选取各个侧扫声呐仪器厂商网站以及沉船搜寻网站上展列的侧扫声呐图片为包含沉船目标的正样本，共47张，通过截取普利茅斯湾侧扫数据不包含沉船目标的负样本（鱼和海底表面）共105张图片，图片大小为128×128。随机选取正样本28张、负样本71张作为训练数据来训练分类器，余下的正样本19张、负样本34张作为测试数据来测试分类器的训练效果（图3）。

图3 目标识别中的正样本与负样本左为正样本示例[27]，右为负样本示例。Fig.3 Positive and negative samples in target recognitionLeft is positive sample,right is negative sample.

（1）盒维数分类结果

根据1.1节提出的盒维数计算方法计算得到每张图像对应的盒维数值。图4展示了部分沉船目标和非目标的盒维数。

图4 盒维数计算左为正样本结果，右为负样本结果。Fig.4 Box dimension calculationLeft is positive sample result,right is negative sample result.

（2）毯维数分类结果

对于给定的毯子厚度ε可以求出其毯维数值，在此通过对比不同毯子厚度ε对分类结果的影响来寻找最佳毯子厚度，如图5所示。

由图5可知，随着毯子厚度的增大，沉船识别的精确率大体逐渐上升，而沉船的召回率逐渐下降，表明当毯子厚度大于100时，召回率较低，表示毯维数对沉船图像纹理特征描述过拟合，从而降低了对不同情况下沉船目标的描述程度，即识别沉船的能力不足。此时F1值在毯子厚度为90时取得最大值83.3%。因此本文选择毯子厚度为90时的毯维数作为其最优纹理特征。

图5 不同毯子厚度的分类结果比较Fig.5 Comparison of classification results of different blanket thicknesses

（3）多重分形谱分类结果

根据1.3节提出的多重分形谱计算公式，本文绘制了沉船正样本和其他非沉船负样本的α-f（α）多重分形谱，如图6所示。部分沉船及非沉船目标多重分形谱参数见表1。

表1 沉船及非沉船目标的多重分形谱参数Table 1 Parameters of multifractal spectrum of shipwrecked and non-wrecked targets

图6 不同样本的多重分形谱结果左为正样本，右为负样本。Fig.6 Multifractal spectrum of different samplesLeft is positive samples,right is negative samples.Horizontal axis α is singularity index,and vertical axis f（α）is fractal dimension.

3.2 三种分形纹理特征识别结果与讨论

比较了盒维数、毯维数、多重分形谱三种分形纹理特征提取方法对侧扫声呐图像沉船目标的识别效果，如表2所示。

表2 分形纹理特征识别结果Table 2 Recognition of fractal texture feature

在三种分形纹理特征中，多重分形谱特征的精确度和召回率均远高于盒维数与毯维数两种分形纹理特征，其F1值为97.4，高于盒维数的61.2与毯维数的83.3，因而多重分形谱的侧扫声呐图像沉船目标识别效果最好，这表明多重分形谱纹理特征对沉船目标的描述全面性和分辨沉船目标与非目标区的区分能力较其他两种方法要好。

单一分形维数（盒维数和毯维数）盒维数纹理特征识别效果最差，其原因是其仅仅反映的是单一尺度下整张图像的纹理复杂程度，无法描述图像局部纹理信息，对于一些整体纹理较为复杂的非沉船目标，如含有鱼群的声呐图像，往往会误判为沉船图像，因此其从非沉船目标中对沉船目标的区分性不足，识别的精确率较低。

多重分形谱纹理特征的优点在于对不同的图像概率测度子集分别计算其分形维数，有效地描述了图像局部纹理特征，即使存在某些鱼群或海底地表的纹理在整体上和沉船目标上较为相似，其局部纹理特征也往往存在明显的差异，且不同种类的目标其多重分形谱的性质区别很大，因而多重分形谱获得了很好的沉船识别效果。

3.3 其他纹理特征识别结果与讨论

为了验证分形纹理特征在侧扫声呐图像沉船目标识别中的效果，本文拟采用两种常用的纹理特征提取方法作为对比实验，即灰度共生矩阵GLCM与Tamura纹理特征。GLCM选择最常用的6个特征值即角二阶距、逆差距、熵、对比度、非相似性、相关性。计算特定距离d下的4个方向的灰度共生矩阵，用6种特征值的均值与方差作为其特征向量，以抵消沉船的方向性对于目标识别的干扰。Tamura选择六特征值作为图片的特征向量，即粗糙度、对比度、方向度、线性度、规整度和粗略度。实验数据与分类器选取均与3.1节相同，沉船目标识别结果见表3所示。

表3 多重分形谱、GLCM、Tamura三种纹理特征识别结果Table 3 Recognition results of multifractal spectrum,GLCM and Tamura

从图像尺度的角度考虑，Tamura纹理特征所提取的六特征值仅有规整度一个值能够描述图像的局部特征，其他5个特征值均是对整张图像的尺度进行灰度统计的结果，因而很难全面描述沉船图像的纹理特征；而GLCM对距离参数d的取值不同可以理解为统计不同尺度下的图像局部特征（像素点对灰度值出现频率）来描述沉船图像的纹理特征，因此，当寻找到最佳距离参数d时则表明在该尺度下获取的纹理特征对沉船描述最好，因而识别效果较好；在多重分形谱方法中，通过不同奇异指数将图像划分为不同测度子集，统计每一个子集的纹理特征形成多重分形谱。从多尺度的角度将沉船图像整体到局部的纹理特征结合起来描述沉船目标，取得了最优的识别结果。

4 结论

（1）在三种分形纹理特征中，多重分形谱特征的识别精度F1远高于单一分形维数（盒维数与毯维数）。单一分形维数识别效果差，其原因是其仅仅反映单尺度下整张图像的纹理复杂程度，无法描述多尺度局部纹理信息。多重分形谱纹理特征对图像中不同的概率测度子集分别计算其分形维数，有效地描述了图像局部纹理特征。某些负样本整体纹理和沉船目标较为相似，但其局部纹理特征也往往存在明显的差异，在不同种类目标的多重分形谱上的谱型区别很大。多重分形谱能够从多尺度角度将正负样本进行区分，因此获得了最优的沉船识别效果。

（2）Tamura纹理特征六特征值中仅有规整度描述图像的局部特征，其他5个特征值均是对整张图像的尺度进行灰度统计的结果，因此识别精度F1优于单一分形维数，但弱于灰度共生矩阵和多重分形谱特征。灰度共生矩阵通过调整距离和方向参数来寻找识别效果最好的图像局部纹理特征，但此方法对每张图像都要重新寻找最佳参数，时间成本更高。因此相对常用的纹理特征，多重分形谱特征具有能够描述多尺度局部纹理，避免人工干预，识别效率高等优点，在沉船识别中也获得了最优的识别精度和识别效率。