APP下载

小波分析在语音信号处理中的应用

2020-11-18赵长昊

中国电气工程学报 2020年14期
关键词:小波分析处理应用

赵长昊

摘  要:对于信息处理过程来说,信号分析是非常关键的一项技术,早期处理主要依托于傅里叶变换,可是其也只能是针对频域实施分析,这就使信号分析不够全面,想要改变这一状况,就需要将时域窗融入到小波变换当中,从而有效提升信号分析处理效果。和普通的信号相比较而言,语言信号的复杂性更高,存在更加明显的局部稀疏性特征,而这点刚好和小波处理特点相吻合,所以在语言信号处理过程中合理运用小波分析技术体现出非常明显的积极作用。

关键词:小波分析;语音信号;处理;应用

引  言

小波分析作为一种新的时频分析方法,实现了泛函数、傅里叶分析调和分析以及数值分析之间的完美结构,成为继傅里叶变换分析方法后,另一个重要的信号分析方法,受到很多研究人员的研究,在理论和应用上得到了极大地扩充。语音信号作为一种典型的非平稳信号类型,应用小波分析对应的效果要相比传统的方法具有更显著优势,目前已取得了显著的成果。基于此,本文重点分析小波分析在语音信号处理中的应用。

1 基本原理

小波分析是一种强有力的信号分析工具,它是时间和频率的局部变换,能有效地从信号中提取信息。例如,在信号的高频域部分,运用小波分析可以取得较好的时间分辨率;在信号的低频域部分,则取得较好的频率分辨率;在提取识别特征前,用小波进行预处理,能够选取语音信号的有用信息,并且有效抑制无关信息对信号识别所产生的干扰。

2 当前语音识别技术的难点

目前,国内已有科大讯飞、云之声等为代表的高新技术企业以及高校、科研院所等单位,在语音识别技术研究领域取得了不少成果,但是依然面临着产业化发展的技术瓶颈,主要表现在以下几个方面:(1)语音识别系统的适应性差;(2)高噪声环境下语音识别进展困难;(3)如何把语言学、生理学、心理学方面的研究成果量化、建模并用于语音识别,还需深入研究[1];(4)我们对人类的听觉理解、知识积累和学习机制以及大脑神经系统地控制机理等分面的认识还很不清楚;(5)若将语音识别系统商品化,还有识别速度、拒识问题以及关键词/句检测技术等细节问题需要解决。

3 小波分析在语音基音周期检测中的应用

语音基音周期是语音信号识别中的重要参数,对后期信号识别处理意义重大。声门在闭合时引发了语音信号锐变,使得周期检测效果不佳。而小波分析具有较好的频率分辨率,尤其是在时域上。据此,对语音信号进行小波分析,在多尺度下對应系数模值的极大值就会出现在锐变位置,因此能够很容易检测出声门闭合时间,然后结合声门开启时间的统计就能便捷地计算出语音基音周期。

在小波分析的多分辨分析中,基音频率在50-500赫兹时,可通过逐级逼近方式对频率精确聚焦,由此得到对应音频特征的提取。对于提取基音周期而言,一般采用小波变换中的奇异点检算法。

基音周期检测的具体步骤为:选取光滑函数的一阶导数作为母小波;进行峰值点检测来估计语音基音周期。在实际中,小波分析方法检测范围较大,应对场景多,应用也越来越普及[2]。

4 小波分析在语音信号去燥和增强中的应用

当前,语音信号压缩编码主要采用离散小波变换,其步骤为:以重构误差以及信噪比最大化为选择标准来确定对应的小波类型;进行小波分解,尽可能将信号分解到较少子系数空间以提升压缩效率;分解后,可设定阈值选择小波系数以实现裁剪;小波系数编码。在编码过程中,将部分含有较少信息的信号分量去除,实现最小化小波系数。虽然存在一定程度的信号损失,但由于人们对缺失部分不敏感,因此依旧能够获得很好的效果。

其主要依据是:小波变换特别是正交小波变换具有很强的去数据相关性的能力,它能使信号的能量在小波域集中于一些大的小波系数;而噪声的能量却分布于整个小波域内,因此经小波分解后,信号的小波系数幅值要大于噪声的小波系数幅值,幅值较大的小波系数一般以信号为主,而幅值较小的在很大程度上是噪声。于是,采用阈值去噪的方法可以把信号系数保留,而使大部分噪声系数减少为零。

4.1 语音信号的小波增强的阈值选择

无论是使用小波变换对语音信号增强或者是压缩的,阈值的选择都是关键。压缩时:阈值过大,信号会有较大的失真;阈值过小,则压缩的意义不大。去噪时:阈值过大,虽然可以减少信号中的噪声,会除去信号的一部分能量,重构信号也会有较大的失真;阈值过小,则重构信号中将包含过多的噪声分量,达不到去噪的目的[3]。

小波分析进行消噪处理一般有3种方法:默认阈值消噪处理、给定阈值(软阈值或硬阈值)消噪处理、强制消噪处理。小波变换后传统的阈值处理方法有硬阈值(hard shrinkage)和软阈值(soft shrinkage)处理方法。采用硬阈值,就是把绝对值小于阈值的小波系数设为0,其他的系统不变;采用软阈值就是用小波系数的绝对值减去小于的小波系统设为0。一般来说,硬阈值比软阈值处理后的信号更加粗糙。

4.2 小波对语音信号去噪的仿真结果和分析

本列中对原始信号加入高斯白噪声,去噪时用小波‘sym6执行分解,使用启发式阈值选择(heursure),然后再通过软阈值方法去噪。去噪效果如图1所示。从图像中可以看出,增强后的语言信号很光滑,基本不含噪声分量,显示了原始信号的大量信息,但是也去掉了原信号的一些细节信息,而且想要提高去噪时的效果通过改变小波基或者提高层数,其改进的效果不大,所以传统的小波去噪的算法还存在很大的改进空间,但是其前景不容小觑。

5 小波分析在语音信号压缩编码中的应用

压缩编码是语音信号处理中的重要组成部分,其重点是降低语音信号编码速率。目前,方法主要分为波形编码、参数编码以及混合编码等。波形编码设计简单,精度高,但数码率较高,压缩效率低。参数编码虽然能显著降低数码率,但复杂度高,精度也难以保证。混合编码则结合了上述两类方法的优势,有效改善了数码率和精度。

基于小波变换的编码方式本质是一种变换域编码方式,主要将输入的信号离散化和正交化处理,然后量化编码系数进行压缩。典型的小波变换编码框图如图2所示。

上述的符号2表述为小波系数分解。通过上述流程,小波分析编码可实现平滑和细节的信号描述形式。然后对平滑信号进一步分解,在整个变换域中获得完全的重叠正交变换过程。从矢量的角度可知,K空间中,有限子集映射,因此经过编码处理后可得到矢量化映射码,而复杂度降低可通过二叉树来实现。

当前,语音信号压缩编码主要采用离散小波变换,其步骤为:以重构误差以及信噪比最大化为选择标准来确定对应的小波类型;进行小波分解,尽可能将信号分解到较少子系数空间以提升压缩效率[4];分解后,可设定阈值选择小波系数以实现裁剪;小波系数编码。在编码过程中,将部分含有较少信息的信号分量去除,实现最小化小波系数。虽然存在一定程度的信号损失,但由于人们对缺失部分不敏感,因此依旧能够获得很好的效果。

结束语

总而言之,小波变换作为一种新的信号处理手段,是继傅里叶变换后的另一重要的信号变化方式。本文探讨了小波变换基本理论,并综述了小波变换在音频信号处理中的具体应用,如小波分析在语音基音周期检测、语音信号去燥和增强、语音信号压缩编码的应用等,以此为相关研究人员提供参考。

参考文献

[1]杨建斌,陶薪竹.基于小波框架方法的信号重构[J].高校应用数学学报A辑,2019,34(03):364-372.

[2]洪民江.基于小波变换的语音信号去噪算法研究[D].南京邮电大学,2018.

[3]张瑞博.时频分析在语音信号增强中的应用[D].重庆邮电大学,2018.

[4]陈妙.湍流信道中语音信号自适应小波快速去噪技术研究[D].电子科技大学,2018.

猜你喜欢

小波分析处理应用
小波分析在桥梁健康检测中的应用探析
桥梁软土基础处理应用
GM(1,1)白化微分优化方程预测模型建模过程应用分析
煤矿井下坑道钻机人机工程学应用分析
气体分离提纯应用变压吸附技术的分析
会计与统计的比较研究
球床反应堆内气—液两相流压差波动信号时域特性研究