近岸4种鱼的声散射特征提取及融合实验研究*
2023-11-23王永贤司纪锋王耀宾刘伟涛慈国庆王志民徐小亮
王永贤 司纪锋 王耀宾 刘伟涛 慈国庆 王志民 徐小亮
(中国科学院声学研究所北海研究站 青岛 266114)
0 引言
随着现代化海洋牧场建设的推进,鱼类资源的时间和空间变化动态监测需求日益迫切[1]。基于声学的鱼种分类识别技术因其速度快、探测范围广等优点,逐渐成为牧场鱼类资源监测与管理的重要手段。该技术的核心在于声散射特征的提取及分析,其特征参数的选择直接影响识别的速度与准确性。因此,有必要对鱼声散射信号的特征提取及融合方法进行深入研究。
当发射的声波传播至目标处时,目标会将部分入射声能转化为散射声能并向四周辐射,散射声波的特性与目标的物理属性和结构形状有关[2]。鱼的声散射特性是由鱼组织器官的声阻抗与水的声阻抗存在差异所决定的。对于有鳔鱼种,影响声散射的因素主要是鱼本身的种类、鱼鳔、体长以及形状[3]。另外,鱼在不同发射声波频率和入射角度设定下,其散射特性也不同。
鱼声散射信号中含有大量鱼种固有属性信息,一部分研究人员通过分析信号的时频域统计特征实现鱼类识别。例如:许枫团队[4-5]将声散射信号的时域质心和Walsh 谱作为鱼类识别特征量,使用BP 神经网络分类器实现了3 种鱼的分类。杜伟东等[6]将信号的小波包系数奇异值、时域质心和离散余弦变换系数特征进行融合,支持向量机(Support vector machine,SVM)分类准确率达92%。Brundage 等[7]则通过分析信号的归一化频率响应谱实现了底层鱼类的识别。另一部分研究人员将接收到的多频声数据进行处理,依据频响差异判别鱼种类。例如:Sunardi 等[8]通过归纳38 kHz 和120 kHz 声呐接收信号的目标强度(Target strength,TS),从底层鱼类中识别出牛眼凹肩鯵(Selar boops)和鲢(Hypophthalmichthys molitrix)。
海洋中大多数鱼类喜欢群居,鱼群主要是由同种类的鱼组成。受水深和换能器开角影响,声呐难以保证同时探测到整个鱼群的声散射信号,所接收到的大多是单条鱼和多条鱼重叠的声散射信号。因此,本文将研究重点放在不同种类间个体鱼声散射特征差异上,通过建立鱼声散射特征数据库,达到对目标鱼种声散射信号的分类识别目的。本文以近岸4 种经济鱼类为研究对象,通过绳系法实验研究了鱼声散射信号的特征提取及融合方法,以期为实际渔业资源分类评估工作提供技术支撑。
1 鱼声散射信号特征
不同鱼种的外部形态各异,即使外部形态相似,其生理结构也会有所差别。为了解决鱼种的分类识别问题,本文尝试从鱼的频率响应特性和鱼声散射信号的时频域信息中提取能较好表征鱼种间差异的声学参数。
1.1 频率响应差异
TS是反映目标反射声波强弱的物理量,鱼类的TS 是应用水声学方法对渔业资源评估的重要参数,影响鱼类TS 的主要的因素是鱼鳔、体长、换能器频率和姿态角。
鱼类TS一般定义为[9]
式(1)中,σbs为鱼的后向散射截面(即鱼体对入射声波产生散射的等效面积),单位为m2。在远场条件下,鱼的后向散射截面等于鱼鳔散射截面和鱼体散射截面的叠加。
实验中鱼探仪直接测量的是反射电压值,经标准球校准的鱼体TS计算公式为
式(2)中,Vf为鱼体的反射电压值,Vb为标准球的反射电压值,TSb为标准球的TS,TSb=10 lg(r2/4),r为标准球的半径,r=11.5×10-3m。
频率响应特性是指系统信号的振幅和相位受频率变化而变化的特性,同种鱼在行为和生理学特征上具有相似性,频率响应特性能一定程度上反映该种鱼的固有属性,文中用不同频率下鱼的TS 差值ΔTS表征鱼的频率响应差异。
式(3)中,TSf1和TSf2分别为f1、f2 频率下鱼的TS。
1.2 时频特征
时域质心是一种描述信号在时间上集中程度的指标,可以反映鱼声散射信号在时间轴上的能量分布特性。时域质心的计算公式为[4]
式(4)中,T为信号长度,x(t)为信号在t时刻的幅值。
假设目标回波的时间跨度为[0,T],通过计算整个目标回波的质心C11,得到第二层的两个时间段[0,C11]和[C11,T];分别对第二层两个时间段计算质心C21和C22,得到第三层3 个时间段[0,C21]、[C21,C22]、[C22,T];以此类推,完成对信号能量集中区的精细划分。时域质心分段示意图如图1所示。
图1 时域质心分段示意图Fig.1 Time domain centroid segment diagram
小波包分解技术是将信号无冗余、正交的分解到独立的频带内,子频带内能量比例的变化可以反映不同目标回声信号在频域上的差异。小波包分解同时对原始信号和分解后的子信号的高频和低频部分进行分解,假设原始信号x(t)的数据长度为N,则分解频带中离散信号xk,m(i)的数据长度缩减为2-kN,第m个子频带的能量可表示为[10]
式(5)中,k表示分解次数,m=0,1,2,···,2k-1,表示子频带的位置序号。
为了方便应用,子频带能量采用归一化相对能量,第m个子频带的相对能量为
式(6)中,E(x(t))为总频带能量。
Hilbert 边际谱能反映整个时间跨度内信号在每个频率点上的能量积累分布情况,将Hilbert谱在时间轴上进行积分即可得到能量-频率关系式[11]:
式(7)中,H(t,f)为Hilbert谱。
1.3 多特征降维方法
1.2 节表述了多种鱼声散射信号时频特征提取方法,每种特征中的每个特征量对鱼种分类识别的贡献不同,提取出对分类贡献大的特征量重新组合成一个新的特征量对提高运算速率和识别准确率具有十分重要的意义。
为了得到对分类贡献较大的特征量,本文使用Fisher 判别函数评估两个类别之间的距离[12-13],Fisher判别函数可表示为
其中,D为判别比,j、k为物种类别,μj、?、μk、分别为第j、k物种的均值和方差。分子项表示该特征在两物种间的整体差异,分母代表该特征的离散性。将两两鱼种间时频特征分别进行Fisher 判别,筛选出贡献大的特征量组成新的特征向量。
2 实验及数据处理
2.1 绳系法实验
课题组通过设置绳系法实验采集近岸4 种经济鱼类的声散射信号,绳系法实验布置示意图如图2所示。影响鱼声散射的主要因素是鱼鳔、体长、姿态角以及换能器频率,实验设定如下。
图2 绳系法实验示意图Fig.2 Schematic diagram of tethered experiment
实验地点:为了首先实现北方海洋牧场等近岸海域的鱼种分类评估,实验地点选在海州湾海域的日照顺风阳光国家级海洋牧场示范区。
实验用鱼:实验用鱼选取4 种近岸常见经济鱼类,分别为花鲈(Lateolabrax maculatus)、许氏平鲉(Sebastes schlegelii)、黑鲷(Acanthopagrus schlegelii)、斑石鲷(Oplegnathus punctatus),叉长分别为42 cm、30 cm、22 cm、20 cm;假设鱼鳔等于鱼体的1/3[14],花鲈、许氏平鲉、黑鲷、斑石鲷的鱼鳔大小分别为14.0 cm、10.0 cm、7.3 cm、6.7 cm。实验用鱼如图3所示。
图3 实验用鱼Fig.3 Fish used in experiments
姿态角:考虑实际应用中的垂直鱼探仪主要照射鱼体背部,实验中设置鱼体背对换能器(即鱼的姿态角设定为0°),主要分析背部的回波。将鱼线系在鱼鳃上,鱼线两端分别固定于网箱两侧渔网上,调整鱼线,保证个体鱼位于换能器开角范围内。由于鱼线较细,文中忽略鱼线的影响。
换能器频率:渔业资源评估中常用的换能器频率是38 kHz、120 kHz 和200 kHz[9],考虑近岸海域中小型鱼类居多,选用较高频率的换能器能获得更好的中小型鱼检出率和更多的鱼体细节信息。实验中选用中心频率为200 kHz 和450 kHz 换能器,换能器主要参数见表1。在实验前,根据国际通用TS校准法[15],用直径23 mm 的标准铜球对自研双频鱼探仪进行现场校正。
表1 自研双频鱼探仪主要技术参数Table 1 The main technical parameters of the self-developed dual-frequency fish detector
2.2 水声数据处理
根据单回波检测准则[16]:单次回波的最小和最大长度一般为发射脉冲长度的0.6倍和1.8 倍,对应的单程最大增益补偿为3 dB。设定最小检测门限值为-60 dB,自动提取大于门限值的回波。以200 kHz换能器采集数据为例,4 种鱼回波信号的时域波形差异明显,中心频率未发生明显偏移,如图4所示。
图4 鱼声散射信号Fig.4 Acoustic scattering signal of fish
2.2.1 TS测定
200 kHz 和450 kHz 换能器激励下花鲈声图如图5(a)所示,鱼体回波清晰,上下网箱底面反射信号明显,背景噪声较小。上下网底及花鲈TS如图5(b)所示,TS值通过式(2)置换法计算。
图5 花鲈声散射信号示例Fig.5 Examples of acoustic scattering signal of Lateolabrax maculatus
在200 kHz 和450 kHz 换能器激励下,4 种鱼声散射信号的平均TS 如图6 所示。200 kHz 换能器激励时花鲈、许氏平鲉、黑鲷、斑石鲷平均TS 分别为-36.81 dB、-43.86 dB、-45.17 dB、-44.11 dB,450 kHz 换能器激励时花鲈、许氏平鲉、黑鲷、斑石鲷平均TS 分别为-39.37 dB、-45.41 dB、-46.71 dB、-45.65 dB。
图6 4 种鱼TS 频数分布Fig.6 Target strength frequency distribution of four fish species
统计结果显示,鱼的叉长与TS 值呈正相关,鱼在200 kHz 换能器下的TS 大于450 kHz 换能器下的TS。同一实验条件下鱼TS 值的波动主要是由鱼呼吸时鱼鳔的变化和鱼体在水流作用下的微小摆动引起的,斑石鲷的TS 波动范围大于其他3 种鱼,认为与斑石鲷外形的“体侧扁而高”特点有关,体侧较小幅度的倾斜会引起较大的TS 值波动。4 种鱼在两种频率设置下TS 分布差异明显,有利于鱼种分类。
2.2.2 时频特征
对提取的个体鱼声散射信号进行6 层时域质心分割,时域质心在波包中位置分布如图7(a)所示。从图中可以看出,许氏平鲉与花鲈的时域质心分布差异最大,斑石鲷和许氏平鲉时域质心分布较接近。
图7 鱼声散射信号时频域特征分布(200 kHz)Fig.7 Time and frequency domain characteristics distribution of fish acoustic scattering signal (200 kHz)
为了得到更多的频域细节信息,对个体鱼声散射信号进行6 层小波包分解,共64 个特征量,信号采样频率为10 MHz,每个频段宽度为78.125 kHz。个体鱼声散射信号各频段能量占比如图7(b)所示,从频段能量分布中可以看出斑石鲷和许氏平鲉一致性较好,黑鲷和花鲈一致性较好。
200 kHz 换能器接收信号能量主要分布在200 kHz 附近,统计Hilbert 边际谱在180~220 kHz间能量分布(间隔5 kHz),如图7(c)所示,许氏平鲉回波能量最强,黑鲷回波能量最弱,4 种鱼边际谱特征在视觉上较易区别。
以上3 种时频特征共包含78 个特征值,特征值数量过多会导致深度学习算法难以收敛,因此需要对其进行降维处理。两两鱼类间样本特征判别比如图8 所示,从图中可以看出许氏平鲉和其他3 种鱼之间特征判别距离整体上大于其他鱼种间判别比,说明许氏平鲉与其他3 种鱼间声散射差异较大。判别阈值设置为3 时,两两鱼种间判别比之和大于阈值所对应的特征值总数为6 个(包括1 个时域质心特征、4 个小波包频段能量特征和1 个Hilbert 边际谱特征),通过Fisher 判别函数有效降低了特征值数量。
2.3 鱼声散射信号分类识别结果
神经网络多分类方法采用3 层BP 神经网络分类器,学习过程采用自适应学习方法[17]。输入层神经元数为特征个数,隐含层包含25 个神经元,输出层为4个神经元,代表4类目标。
SVM 多 分 类 方 法 采 用“one-against-rest”方法[18],通过构造4 个两分类器,第i个SVM 用第i类中的训练样本做正样本,其他样本为负样本,测试时让每个训练样本都经过4 个分类器。
将采集的个体鱼回声数据分为两组:第一组为训练样本,每个类包含400 个样本,共1600 个样本;第二组为测试样本,每个类包含100 个样本,共400个样本。
特征向量是由1 个频差特征值和6 个时频特征值组成的组合特征向量,分别基于频差特征、时频特征、频差-时频组合特征选用SVM 分类器对测试集进行识别,识别结果如表2所示,识别准确率分别为71%、84%、93%,组合特征识别准确率远高于单一特征。
表2 3 种特征的SVM 分类器识别准确率统计Table 2 Statistical table of recognition accuracy of SVM classifier with three characteristics
分别使用BP 神经网络和SVM 分类器对训练集进行训练,基于组合特征的测试集数据识别结果如表3 所示,BP 神经网络分类准确率为90%,其中斑石鲷85%、黑鲷96%、许氏平鲉98%、花鲈82%;SVM 分类准确率为93%,其中斑石鲷94%、黑鲷96%、许氏平鲉98%、花鲈83%。
表3 基于组合特征的鱼种类识别准确率统计Table 3 Statistical table of fish species identification accuracy based on combination features
3 讨论
3.1 实验方法
当前,鱼类声学特征量的测量方法主要有两类:一类是通过搭建声学实验平台测量行为受控鱼类的声学特征量,有绳系法、悬垂法和网箱法;另一类是通过建立模型来计算鱼类声学特征量,有经验统计模型和物理模型[14]。本文选择绳系法实验测量鱼的声学特征量,该方法能够较好地控制鱼的姿态,但由于测量时鱼体处于非自然状态,,无法真实反映声波散射情况,会使测量结果产生一定偏差。而且在自然海域中,鱼的游向、姿态以及鱼鳔尺寸的改变也会导致接收信号声学特征量的变化。因此,在后续的研究中,实验可以从以下几个方面进行改进:(1) 将实验地点改为消声水池,以消除水流动、环境噪声及海底声反射对信号采集质量的影响。(2) 在现有实验装置基础上增加机械旋转结构,获取鱼在不同声波入射角下的声数据,进一步研究鱼体姿态变化对声散射的影响。(3) 文中只对近岸4 种经济鱼类的声散射特征进行了研究,若要实现更广泛的鱼类目标识别,还需要增加目标样本数和特征样本数。(4) 通过量化鱼在声轴至声束上下边界处的衰减,对声信号进行补偿,同时,整合更多有效特征信息,例如宽带特性、多频特性,提升声信号分析的准确性与鲁棒性。
3.2 特征提取方法
传统声散射信号分类方法中特征的提取主要基于信号的时域特性、频域特性、相位特性及特殊声音[5]。近年来,鱼探仪在多波束、宽带和多频方向上发展迅速,这使得利用多元声特征信息实现鱼种的分类识别成为可能。Rogers 等[19]采用中心频率为153.6 kHz 的换能器采集3 种鱼宽带声散射信号,基于信号的宽带特征对鱼种进行分类,但现场识别效果并不理想,分析认为仅提取宽带回波频谱特征可能会使神经网络识别不可靠,宽带声信号的识别还需要包括其他特征。本文中同时提取了鱼回波信号的时频特征和频差特征,将其组合特征作为鱼种分类的判别依据,这种特征提取方法不仅可以反映鱼在时域和频域中的信息,还可以体现鱼类在不同频率下的声散射差异信息,是利用多元声特征信息实现鱼分类的一次成功尝试。
4 结论
本文通过绳系法实验研究了近岸4 种经济鱼类声散射信号的特征提取及融合方法,得出如下结论:
(1) 姿态角为0°时,4 种实验用鱼(花鲈、许氏平鲉、黑鲷、斑石鲷)的平均TS 分别为-36.81 dB、-43.86 dB、-45.17 dB、-44.11 dB (200 kHz)/-39.37 dB、-45.41 dB、-46.71 dB、-45.65 dB(450 kHz)。
(2) 基于频差特征、时频特征、时频和频差组合特征的SVM 鱼类识别准确率分别为71%、84%、93%,说明组合特征识别准确率远高于单一特征,有效地增加判别依据可以明显提高不同鱼种间区分度。
(3) 所提方法对文中4 种鱼类的识别效果较好,但作为鱼类的识别还需要进一步开展工作。