砂糖橘主要害虫声音识别研究
2024-07-26潘玉娟吴红生钟美萍唐艳娜刘凤秋聂火莹吴菊芳
摘要:我国是农业大国,但是每年我们的农作物都会因为害虫的入侵而产量下降,目前发现砂糖橘中的害虫多采用的是人工观察,这种方法不仅消耗人力物力财力,还无法及时地进行虫害发生的早期预警。虽然图像识别是较为先进的技术,但是在害虫图像识别上还是有一定局限性的,如一些藏得较隐蔽的害虫,是很难用图像识别来识别出来的。基于此,本文针对砂糖橘主要害虫将探索研究一种声音识别技术。首先,了解砂糖橘主要害虫的发声原理,然后通过设备获取砂糖橘主要害虫的声音,进而通过害虫声音预处理、害虫声音特征参数提取、害虫声音模式建立、害虫声音模型训练、害虫声音模式匹配等步骤来完成对砂糖橘主要害虫的声音识别,从而减少砂糖橘作物受虫害的风险。
关键词:声音识别;声音特征参数提取;声音模型训练;模式匹配
中图分类号:TP391.41文献标识码:A
1概述
砂糖橘皮薄味甜,十分受广大人民的喜爱,但在其种植过程中由于虫害造成了产量下降,人工除虫又十分损耗人力财力,由此,研究利用声音识别来进行害虫识别、预防虫害发生对砂糖橘产量的提升有十分重要的意义。本文就砂糖橘虫害类别分析及昆虫发声原理、主要害虫声音识别原理展开害虫声音识别的研究。
2砂糖橘的主要虫害的发声原理
2.1砂糖橘主要虫害
在砂糖橘生长过程中,会对其造成危害的害虫主要有以下几种:桔小实蝇、蚜虫、柑橘红蜘蛛、潜叶蛾、矢尖蚧、吹棉蚧等。
2.1.1桔小实蝇
桔小实蝇雌性成虫将在果皮内产卵,长出的幼虫会危害果肉,造成果实变黄脱落,留在树上的砂糖橘因幼虫的存在在贮藏期也会腐烂。砂糖橘因桔小实蝇的生长容易得溃疡病,会引起落叶、落果现象,枝干枝梢在严重时会枯死,果实大量腐烂,也容易得炭疽病。
2.1.2蚜虫
蚜虫主要危害砂糖橘的嫩枝梢,在枝梢上吸食枝梢的营养液,嫩枝梢受到蚜虫的吸食后,形成凹凸不平的皱缩;蚜虫排泄的蜜露经常导致煤烟病发生,影响果实品质和产量。因蚜虫所带来的疾病,严重影响了树木光合作用的正常进行,导致树梢生长减缓,产量大减,砂糖橘品质下降。
2.1.3柑橘红蜘蛛
柑橘红蜘蛛的成虫和幼虫经常聚集在叶片两面的叶脉附近,对其造成损害。柑橘红蜘蛛用口针扎入砂糖橘的叶子、树枝和果皮来吸取汁液。叶片被刺破的区域最初是浅绿色的,后来变成了灰白色的斑点。在严重的情况下,叶子会变成灰白色并失去光泽,导致落叶和枯枝。如果果实受损,则表明柑橘红蜘蛛聚集在了果柄至果萼下面,受影响的幼果表面形成浅绿色斑点。成熟果实受损时,表面会出现淡黄色斑点,因为砂糖橘果蒂受损造成果实掉落。
2.1.4潜叶蛾
潜叶蛾主要危害砂糖橘的嫩芽、叶和果实。幼虫以幼叶后部的叶肉和新芽表皮为食,形成许多弯曲的银白色条状痕迹。被取食的叶子通常会收缩、变硬、容易脱落。严重时,所有嫩芽几乎都会卷缩,严重影响砂糖橘的生长和产量,导致溃疡病和炭疽病。
2.1.5矢尖蚧
矢尖蚧主要危害砂糖橘的叶、嫩枝和果实。一般来说,成虫和幼虫聚集在叶子的背面和果实的表面来吸食汁液。黄色斑点出现在叶子上被吸食的地方。在严重情况下,过量的汁液被吸食后会导致叶片弯曲变形,卷曲枯萎,影响砂糖橘树枝的生长,导致叶片和果实掉落,影响产量和果实质量,引起煤烟病。
2.1.6吹棉蚧
吹棉蚧主要以吸食果树汁液,损伤枝条、树叶和危害果实。它吸食周围区域呈黄绿色,排出的蜜露可导致砂糖橘引发煤烟病,引起枝条、树叶、果实等表面呈煤烟状。较严重的话,会形成覆盖树枝、叶子、水果等表面的一层黑皮。严重时,叶片会焦枯掉落、枝干枯死,果实不易着色,果小变酸,影响果实品质和产量,影响砂糖橘生长,甚至可导致砂糖橘树枝局部或整体死亡。
2.2昆虫的发声原理
自然界中的昆虫发声主要通过以下五种方式进行发声:(1)摩擦发声;(2)气流震动发声;(3)振翅发声;(4)碰击发声;(5)非专门发声器产生的鸣声。不同种类的昆虫发声的强度、声频等有不同的差异,不同年龄、体型等昆虫也有不同的差异。不仅是成年昆虫可以通过以上发声方式进行发声,某些幼虫、蛹也可以发出声音[1]。
3砂糖橘主要害虫声音识别原理
3.1砂糖橘主要害虫声音识别技术概述
声音识别技术是指将获取得来的声音信号进行一系列的处理,最终能识别出该声音信号的特征的一种技术。砂糖橘主要害虫声音识别技术的基本原理即是将获取到的害虫声音通过预处理、声音特征提取、模型训练、模式匹配等步骤来完成声音识别的。
砂糖橘主要害虫声音识别技术的原理概述如图1所示。
图1害虫声音识别技术方框图
3.2砂糖橘主要害虫声音预处理
声音预处理是完成声音识别的前提,是必不可少的步骤。砂糖橘主要害虫声音预处理的目的是消除由害虫本身发声带来的干扰以及外界采集设备带来的干扰信号,只有把干扰信号过滤或切除掉才能降低对后续步骤造成的干扰,为后续的信号参数提取提供高质量的参数。沙糖橘主要害虫声音预处理的步骤一般分为预加重、分帧、加窗等。
预加重意为保持害虫声音低频信号不变而要提高害虫声音信号的高频部分。由于没有处理过的声音信号的高频段频谱是很难求取的,故要通过预加重来实现。它的目的就在于消除低频干扰尤其是50Hz的工作频率干扰,将对语音识别更为有用的高频部分的频谱进行提升[2]。经过预加重后使得害虫声音信号频谱变得更加平稳,然后在整个频带内以相同的信噪比得到频谱,便于频谱分析。
预加重将会用到如下式(1)所示的传递函数。
H(z)=1-μz-1(1)
其中μ的取值一般接近于1。
分帧旨在使害虫声音信号变得平稳,一般来说声音信号都是不平稳的,只有经过分帧处理后才能使得信号在帧内处于平稳状态便于后续处理。同时,为了有利于帧与帧之间能平滑地过渡,前一帧与后一帧之间会有堆叠的部分,称为帧移。帧移与帧长之比一般取50%。
帧长与帧移关系如图2所示:
图2帧长与帧移关系图
分帧后,提取的害虫声音会变成很多小段,之后对波形进行变换。经过变换的每一帧波形成为一个多维向量,而这个向量包含着害虫声音内容信息。
加窗的目的是进行傅里叶展开,使原本不具有周期性的害虫声音信号表现出一些周期函数的特征,从而使整个声音信号更加连续,避免出现吉布斯效应。加窗的具体做法是把上一步预加重得出的害虫声音信号与一个窗函数做乘积,而一般来说声音信号处理中常用的窗为矩形窗和汉明窗。
其中矩形窗的表达式为:
w(n)=1,0≤n≤N-10,else(2)
汉明窗的表达式为:
w(n)=0.54-0.46cos[2πn/(N-1)],0≤n≤N-10,else(3)
其中式(2)和式(3)的N为声音信号帧长。
3.3砂糖橘主要害虫声音特征参数提取
对沙糖橘主要害虫声音特征参数进行提取的方法可有两种,分别是线性预测倒谱系数和梅尔倒谱系数。线性预测倒谱系数LPCC(LinearPredictionCepstrumCoefficients)是基于发生系统模型提取的,梅尔倒谱系数MFCC(MelFrequencyCepstrumCoefficients)是基于听觉模型提取的[3]。线性预测倒谱系数提取法有优点,但也有一定的局限性。线性预测倒谱系数LPCC的优点是其计算量较小,但不太符合害虫听觉的敏感性;而梅尔倒谱系数MFCC就不会有此局限性。故经过对比分析,本文将采取梅尔倒谱系数这种提取方法。
经过预处理后的害虫声音信号即可用梅尔倒谱系数MFCC进行害虫声音特征参数提取,提取时必须满足三个条件:要能充分地表征出害虫声音信号特性;要有相互独立的特征参数;要保证害虫声音信号具有实时性。
使用梅尔倒谱系数MFCC对害虫声音特征提取的步骤为:在进行害虫声音预处理后,首先,分析每一窗的声音信号,并通过傅里叶变换(FFT)得到相应的频谱;其次,通过Mel滤波器组获得Mel谱;再次,取Mel谱上的对数,通过反演得到Mel频率倒谱系数;最后,通过倒谱分析得到害虫声音特征参数。其中梅尔倒谱系数MFCC提取的关键是梅尔频率分析和倒谱分析。害虫声音信号的倒谱分析即是求信号倒谱特征参数的过程,可以通过同态处理来实现,即可以将频谱看成频谱包络与频谱细节的乘积,对其求log,将其转化为加性关系。其中频谱包络可以视为“低频信号”、频谱细节可以视为“高频信号”,然后通过离散余弦变换(DCT)将“低频信号”和“高频信号”分离,我们称为“倒谱”。离散余弦变换(DCT)的表达式如式(4)所示:
X(K)=∑N-1n=0x(n)(cos2kπnN)-j∑N-1n=0x(n)(sin2kπnN)(4)
其中N为信号长度,而K=0,1,2…N-1。
3.4砂糖橘主要害虫声音识别模式
3.4.1识别模式系统建立
一个完善的识别模式系统通常由预处理、信息特征样本提取、分类器的选择设计、模式分类这四部分组成。
预处理:预处理对于模式识别系统尤为重要,一个完善的识别模式系统能否建立成功首先取决于预处理是否处理得好。对害虫声音信号进行预处理能获得更多有效的害虫声音片段,排除一些无用的干扰声音片段,如外界因素的影响的声音片段等。
信息特征样本提取:由于采集到的原始害虫声音信息量较大,其中包含着有用信息的同时,还会存在着大量的无用信息,所以就需要从害虫声音信号中提取出能表征该害虫声音信号特征的样本,便于后面的识别效率的提高。
分类器的选择设计:根据分类判别的规则设计构造出判别函数,让样本进行训练,学习出分类判别函数,使之能够最终识别出最佳的效果。
模式分类:依据分类器输出识别的结果,不同的结果即为不同的模式分类。
3.4.2模式识别的方法
砂糖橘主要害虫的模式识别方法按顺序依次进行模型训练、模式匹配和模式统计识别,以达到较准确的害虫判别。
模型训练即首先为采集到的不同的害虫的声音建立好发音模板,建立害虫声学模型,在识别时将害虫发出的未知声音特征与害虫声学模型不断地进行匹配和比较训练。若害虫声音信号与建立好的害虫声学模型匹配度达到99%即算模型训练成功。
模式匹配即是将提取出来的害虫声音特征参数序列放入模型库中,建立出参考模板,形成特定的匹配模式。在砂糖橘主要害虫声音识别中,从害虫声音中提取的特征参数向量按照特定的匹配方式与所有参考模板进行匹配,匹配结果为每个特征向量之间的最小距离之和,距离越小说明匹配度越高。该方法的优点是实时性好、速度快;缺点是对系统模型的存储量要求大,如果系统的干扰量大,规模大,则会增加计算量,不利于识别率的计算。
模式统计识别即是以模式样本视为多维特征空间中的点,然后将不同类型的标本基于特征空间的不同概率分布来创建决策标准和类型接口来确定分类统计。简单来说该方法就是能够反映砂糖橘主要害虫个性特征的特征向量,然后计算其分布特征。识别过程通常使用统计数据,如平均值和方差以及概率密度函数来进行决策。这种方法的优点是识别性能稳定,抗噪声性能好,易于实现,可以更好地了解不同砂糖橘主要害虫的声音信号中不同的特性信息分布。
结语
在我国,每年砂糖橘的产量是很大的,市场需求广泛,但砂糖橘的产量会在很大程度上受到害虫的影响,因此只有找到砂糖橘主要害虫识别,才能进行更好的预防和干预。本文探讨的基于砂糖橘主要害虫声音识别技术的研究,不仅能大大地减少人力物力的投入,还能提高害虫监测效率,实现较高质量的砂糖橘种植生产。
参考文献:
[1]曹凤勤,程立生.昆虫鸣声的研究进展及其应用概述[J].华南热带农业大学学报,2004(01):2933.
[2]达钊,李倩,郭霞生,等.不同录音系统对声纹检测的影响[J].南京大学学报(自然科学版),2011(02):201207.
[3]杜丹.蓝莓典型虫害声信息特征与种类自动识别研究[D].贵州大学,2019.
基金项目:2022年广西科技师范学院大学生创新创业训练立项项目——害虫识别器(国家级)(项目编号:202211546018)
作者简介:潘玉娟(2003—),女,汉族,广西昭平人,本科,广西科技师范学院职业技术教育学院学生,主要对机器人工程专业课程的学习与研究。
*通讯作者:吴红生(1980—),男,汉族,安徽枞阳人,工程师,讲师,广西科技师范学院职业技术教育学院教师,主要从事机器人工程专业课程的教学与研究。