北海狮水下声信号类型分析
2020-04-01莹吕连港刘宗伟黄龙飞杨志国杨春梅
姜 莹吕连港刘宗伟黄龙飞杨志国杨春梅
(1.自然资源部 第一海洋研究所,山东 青岛266061;2.青岛海洋科学与技术试点国家实验室 区域海洋动力学与数值模拟功能实验室,山东 青岛266237;3.自然资源部 国家深海基地管理中心,山东 青岛266237)
北海狮(Eumetopias jubatus)属于海狮科(Otariidae)、北海狮属(Eumetopias),别称为北太平洋海狮、斯氏海狮、海驴等,因在颈部生有鬃状的长毛,叫声也很像狮吼而得此名。北海狮是海狮科中体型最大的一种,体型瘦长;头顶略凹;颈长;面部短宽,眼大;具有外耳廓,外耳廓相对较短并紧贴在头侧;前后肢均呈桨状,前肢长于后肢;全身主要为黄褐色,胸部至腹部颜色较深。北海狮是我国二级保护动物,被列入《世界自然保护联盟》(IUCN)2016年濒危物种红色名录中易危物种[1]。北海狮一般栖息于寒温带沿岸水域,其主要分布于太平洋(白令海、鄂霍次克海、阿拉斯加、堪察加、阿留申群岛和北干岛等)海域,在我国江苏启东的黄海海域和辽宁大洼的渤海海域亦可见。北海狮白天一般在水中捕食或活动,夜间则回到岸上睡觉。
北海狮属于鳍足类哺乳动物。据研究[2],鳍足类哺乳动物虽然视觉较差,但拥有强大的生物声呐系统,能够通过发射声信号来检测和识别目标的大小以及形状,因此,研究者可以通过研究北海狮的水下声信号特征来了解其生活特性。目前,已有研究者通过被动声学观测方法,开展了同属于鳍足类哺乳动物的海豹水下声信号特征的研究,包括环纹海豹[3]、格陵兰海豹[4]、威德尔海豹[5]等。近年来,北海狮科动物水下声信号特性方面的研究逐渐增多。Schusterman等研究了同属于北海狮科的加利福尼亚海狮的水下声信号,认为加利福尼亚海狮的水下声信号可以分为5种类型:clicks,barks,whinnies,buzzing以及bang(或者crack sounds)[6],并指出click信号是其最常见的水下声信号类型[7]。尽管如此,迄今关于北海狮的相关报道却仍然很少,只有clicks和growls两种类型的水下声信号被报道过[8-11],研究指出,北海狮可以通过降低growls声信号的发声频率来产生click信号串[8]。
为了研究北海狮水下声信号的特征,本文使用一套便携的自容式水下声学记录设备连续记录水族馆内的北海狮水下声信号,通过分析记录信号的时频谱,对信号的声学特性参数进行了统计,并将北海狮的水下声信号进行分类,以期为掌握北海狮的水下发声情况奠定基础,为北海狮的声行为研究提供数据支撑,并为进一步的野外被动声学监测提供科学依据。
1 数据采集与处理方法
1.1 数据采集
2015-11在青岛极地海洋世界的北海狮饲养池中进行了水下声信号观测。池中水深约为6 m,直径约为3 m,池壁为普通水泥材料。池中驯养了3头北海狮,一雄两雌,雄海狮约6岁,两头雌海狮略小,分别为5岁和4岁。数据记录时间为2015-11-19T09:55—20T15:15,共计约29 h。采用一套自制的自容式数据采集设备LoPAS-H(图1)记录水下声信号。该设备由记录器和水听器两部分组成,其中记录器包含16 bit分辨率的低噪数模转换模块、能供电38 h的电源模块和容量可达1 028 GB的数据存储模块。它具有5个采样频率可供选择,分别为49,96,128,260和524 k Hz。为了保证对北海狮声信号在频率上的全覆盖,本次记录选用的采样频率为524 k Hz。配用的水听器灵敏度为(-198±3)dB(0 dB≙1 V/μPa),平坦的频率响应区间为50 Hz~120 k Hz。采集系统被固定在一钢架上,吊放于水下1 m处,钢架外面用一层铁丝网罩住,防止动物触碰。
1.2 处理方法
首先利用adobe audition CS5.5(Adobe Systems Incorporated,San Jose CA)对数据进行初始的时频谱分析,选取在视觉和听觉两方面均具有良好质量的数据用于进一步的分析[12]。数据质量的判断标准有2个:1)清晰的轮廓(对应高信噪比);2)没有与其他信号发生混叠。
采用MATLAB(The Mathworks Incorporated,Natick,MA,USA)对选取的信号进行进一步的时频分析,并计算特征参数。时频分析时,对数据加hann窗进行平滑,窗长和傅里叶变换的点数均为4 096,且重叠率为50%。获得的特征参数包括时长、最小频率、最大频率以及峰值频率。时长为包含95%能量的窗长对应的时间[13],峰值频率是指频谱图中幅度最大点对应的频率值,而最小频率和最大频率分别对应着信号时频图上频率轮廓中的最低点和最高点。
利用聚类分析法分析信号特征参数,通过计算每个样本信号欧几里德距离的平方确定层次关联,采用组间全连接方法对信号进行分类。最后对信号的时频谱进行视觉和听觉两方面的人工检验,评估分类结果的有效性。每个信号类型应该具有的特征[14-15]包括:1)一个类型中的相似度应>90%;2)该信号形式出现的次数超过10次;3)该类型所有信号之间的差异较小;4)该类型信号的轮廓是千篇一律的,具有显著的、可识别的特征。
图1 自容式数据采集设备LoPAS-HFig.1 The self-contained data acquisition module(LoPAS-H)
2 结果与分析
从采集到的北海狮水下发声数据中,共检测出22 689个信号。根据聚类分析方法将其中的21 010个信号(其中的1 679个为无法分类的剩余信号)分成10种信号类型,分别为单脉冲(SP)、哨声(WS)、咕咕声(GG)、咚咚声(DS)、狗吠声(BK)、吼叫声(WY)、嗡嗡声(BZ)、撞击声(BG)、单频声(SF)以及咩咩声(BT)。信号类型的命名参照Schusterman等[6]。各类型信号的特征参数结果见表1。可以看出:信号时长方面,DS的最长,而SP的最短;最小频率方面,WS和SF的较高,而GG,BK和WY的则较低;最大频率方面,WS,SP,WY,GG和BT的较高,而SF和DS的则较低;峰值频率上,WS和GG的较高,而BZ的最低。
表1 10种声信号类型的特征参数结果Table 1 Physical characteristics of the 10 categories of signals used by captive Steller Sea Lions
每种信号类型的时域信号和时频谱的分布如图2和图3所示,可见:SP信号(图2a和图3a)表现为宽带、短时的脉冲信号,持续时间约2~20 ms,频率分布在15 k Hz以下,主要能量集中在5 k Hz以下,峰值频率为3 k Hz处;WS信号(图2b和图3b)类似于鲸豚类动物发出的哨声信号,具有调频的音调特性,持续时间较宽,频率分布较散,范围通常为100~500 ms和3~16 k Hz;GG和DS信号都属于嘀嗒声脉冲串的形式,表现为短时、宽带的脉冲信号组合,持续时间一般为0.5~3 s,脉冲重复率(1 s内出现的脉冲个数)最低为5,最高可达100。GG(图2c和图3c)的频谱范围在15 k Hz以下,能量分布较均匀,脉冲重复率通常较高,持续时间较短;DS(图2d和图3d)的频谱范围为0.5~6 k Hz,能量主要集中在3 k Hz附近,脉冲重复率一般不超过50,持续时间相对较长。BK信号(图2e和图3e)听起来像是狗叫的声音,频谱范围在10 k Hz以下,主要能量集中在5 k Hz以下,单个BK信号的持续时间为60~200 ms,但通常会多个信号连续出现;WY信号(图2f和图3f)听起来像是吼叫的声音,持续时间约0.3~1.3 s,频谱分布在15 k Hz以下,通常该信号被认为是海狮科动物在遇到挑衅时发出的声音[6];BZ信号(图2g和图3g)表现为密集出现的脉冲信号的组合,听起来像是“嗡嗡”的声音,多与BK信号伴随出现,持续时间约0.3 s,能量分布在8 k Hz以下,集中于0.5~4 k Hz;BG信号(图2h和图3h)的频谱范围在10 k Hz以下,但主要能量分布于0.5~2 k Hz,持续时间较短,约150 ms;SF信号(图2i和图3i)跟WS信号类似,听起来也像哨声,属于调制较弱的窄带调频信号,频率范围为2~5 k Hz,多集中在3 k Hz附近,持续时间通常为0.05~0.10 s;BT信号(图2j和图3j)听起来像是羊叫的声音,持续时间一般在0.5~1.5 s,频谱分布于0.5~10 k Hz。
统计分析10类水下声信号所占比例(图4)可以看出,BK,BT和BG信号的发声频率较高,占比分别为23%,22%和21%;SP,WS和BZ信号次之,占比均为6%;而GG发声频率最低,占比仅为2%。
图2 10种类型信号时域波形及时间分布Fig.2 Temporal waveform and time representations of the 10 categories of signals
图3 10种类型信号时域波形及频率分布Fig.3 Temporal waveform and frequency representations of the 10 categories of signals
图4 21 010个信号中不同类型水下声信号使用比例Fig.4 Proportions of each category of signals among all 21 010 calls
3 讨 论
关于北海狮种和其亚种的水下声信号的研究报道十分稀少[2]。有研究报道[8,10],北海狮、南美、澳洲以及新西兰海狮可以发出growl,snort,bleat以及嘀嗒声信号,北部皮毛海狮也能够发出bleat信号。但目前,尚未见关于北海狮水下声信号类型的报道。本文通过对水族馆内北海狮观测数据的分析,对北海狮水下声信号进行了分类,并分析了各类型声信号的特征参数和使用比例。这些结果能够提高人们对北海狮声信号的认知水平,为进一步研究北海狮的声行为奠定基础。
本文通过水下声信号特征参数的聚类分析方法,将北海狮的水下声信号分成10种类型,该种分类方式共分析了21 010个信号,占全部检测信号的92.6%,基本覆盖全部检测信号,说明这10种声信号类型基本涵盖北海狮的全部水下声信号形式。文中获得的分类结果与前期的研究有一定的相似之处[9-11]。获得的新的信号类型可能是由不同的分类方法引起的,不一定是新的信号。比如,GG和DS信号非常相似,只有峰值频率这一参数决定了它们属于不同的类别。如果使用条件更宽泛的分类方法,它们可能就会被归为一类。同样倘若使用更多的声信号特征参数,例如声压级、起始频率和结束频率,或许有助于剩余7.4%信号的分类,这一点有待进一步研究。
加利福尼亚海狮(Zalophus californianus)分布从阿拉斯加东南部到墨西哥中部,包括加利福尼亚湾,与北海狮的分布范围基本重合。有研究报道过水族馆内加利福尼亚海狮的水下声信号[6,16]。通过与本文结果比较发现,这2个物种有5种同样名称的发声类型,分别是click,bark,whinny,buzzing以及bang,相同名称的声信号类型具有相似的时频分布形式,可以认为是同种声信号。这2个物种同名称信号的峰值频率范围接近,但加利福尼亚海狮的时长较长,频率范围较窄,而北海狮的时长更短,频率范围更宽,这种不同点可能反映了2个物种在水下声信号上的种群差异性。
北海狮水下声信号的社会功能决定了其使用比例。BK,BT和BG信号使用频率较高,3种信号的使用频率占全体信号的66%,说明这3种信号是北海狮水下声信号的基本构成。本文研究结果发现WY信号的使用频率较低,仅为5%。对于熟悉的环境和固定的同伴,海狮很少受到挑衅,进而WY信号的使用频率较少。通常鲸豚类哺乳动物以嘀嗒信号作为回声定位信号,用于导航、觅食、探测等行为活动中[2]。根据分类结果,GG和DS信号都属于嘀嗒信号的形式,这两类信号的使用频率占所有信号的7%,整体较少,说明在熟悉的环境下,海狮不需要频繁地进行探测或导航等行为,GG和DS信号的使用频率就较低。
本文研究结果表明,北海狮水下声信号的频率分布基本低于15 k Hz。Schusterman和Moore对北部皮毛海狮(Callorhinus ursinus)水下听觉进行了研究,发现这个物种的最佳听觉频率范围为2~33 k Hz,高于本文中发声频率结果[17]。假设同亚种的动物具有相近的听力阈值的话,推测北海狮相对更高的听觉频率是为了发现其天敌如虎鲸和大白鲨的声音,而较低的发声频率则更有利于种群间的长距离通讯。
4 结 语
基于青岛海昌极地海洋世界北海狮的水下声观测数据,提出了10种类型的分类方式,该分类方式可以基本覆盖北海狮全部的水下发声信号,有利于北海狮的被动声学观测。结合北海狮的行为反应本文讨论了对不同类型声信号的社会功能,发现WY是应对挑衅时的信号,而GG和DS具有探测、导航的功能。由于本文采用的实测数据比较有限,还需要进一步选取野外的声观测数据来进行完善,进一步提高分类形式的完备性。
致谢:青岛海昌极地海洋世界为数据观测提供了大力支持;自然资源部第一海洋研究所的杨光兵、陈钊和张超等为数据获取提供了帮助。