小波变换实现语音压缩研究
2017-04-26潘茜茜
潘茜茜
(信阳广播电视大学,河南 信阳 464000)
小波变换实现语音压缩研究
潘茜茜
(信阳广播电视大学,河南 信阳 464000)
在确保信号质量的条件下,为了减少存储空间,文章提出了用小波变换实现语音压缩的方法。根据信号能量高,置零系数的百分比也要高的原则,寻求最适合的压缩方式。实验结果表明:对自己录制的Windows PCM格式的wav文件,在保留的信号能量达到96%以上时,用Haar小波进行5层分解,能有效地完成语音压缩。
语音压缩;小波变换;能量;置零系数百分比;Haar小波
随着通信技术的快速发展,语音信号的传输和应用占据了重要的地位。语音信号需要转换成数字信号才能存储在数字存储设备中,在很多情况下,由于存储设备的存储空间是有限的,所以对数字语音信号的压缩变得尤为重要。
虽然人们正在探索运用自己定义的小波基函数进行有效的语音压缩,但对于涉及领域稍浅的方面,研究在常用的小波函数下,语音压缩的效果与小波分解层之间的关系,并能通过直观操作和实验结果分析,找到用小波变换实现语音压缩的较恰当的方法具有现实可行性意义。
小波变换(Wavelet Transform,WT)是一种新的变换分析方法,它继承和发展了短时傅立叶变换局部化的思想,同时又克服了窗口大小不随频率变化等缺点,能够提供一个随频率改变的“时间-频率”窗口,是进行信号时频分析和处理的理想工具。它的主要特点是通过变换能够充分突出问题某些方面的特征,能对时间(空间)频率的局部化分析,通过伸缩平移运算对信号(函数)逐步进行多尺度细化,最终完成高频处时间细分,低频处频率细分。
1 小波变换的定义及特点
小波,即小区域的波,是一种特殊的长度有限、平均值为0的波形。它有两个特点:一是“小”,即在时域都具有紧支集或近似紧支集;二是正负交替的“波动性”,也即直流分量为零。小波分析是将信号分解成一系列小波函数的叠加,而这些小波函数都是由一个母小波函数经过平移与尺度伸缩得来的。用不规则的小波函数来逼近尖锐变化的信号显然要比光滑的正弦信号来逼近要好。
小波变换的定义是把某一被称为基本小波的函数做位移后,再把不同尺度a下与待分解的信号x(t)做内积。
2 用小波变换实现语音压缩的原理
一个比较规则的信号是由一个数据量很小的低频系数和几个高频系数组成。对低频系数的选择有一个要求,需要在一个合适的分解层上选取低频系数,根据小波分析的特点可知,小波变换能实现信号的压缩过程。
2.1 小波分解
信号可以利用小波变换分解为近似和细节。近似主要是系统大的、低频的成分,而细节往往是信号的局部、高频的部分。小波变换的一级分解过程是,原始信号分别进行低通、高通滤波,再分别进行二元下抽样,就得到低频、高频两部分系数;而多级分解则是对上一级分解得到的低频系数再进行小波分解,是一个递归过程。信号的分解过程还可以反复进行,信号的低频部分还可以被继续分解。
2.2 阈值选取规则
一般来说,噪声信号多包含在具有较高频率细节中,在小波分解之后,去噪就显得尤为重要。因为阈值的选取直接影响去噪的质量,所以在系数上作用阈值是去噪的核心步骤。在matlab的小波工具箱中,给出了4种阈值的选取方法,即:固定阈值(sqtwolog)、自适应阈值(rigrsure)、启发式阈值(heursure)和极大极小阈值(minimaxi)。
2.3 小波重构
小波重构是小波分解的逆过程,对高频系数和低频系数分别进行上抽样和低通、高通滤波处理。
3 用小波变换实现语音压缩的过程
3.1 语音信号的录制
3.1.1 关于试麦
开始—控制面板—声音和音频设备—语声—测试硬件。
3.1.2 录音准备
开始—控制面板—声音和音频设备—音量—设备音量—高级,如果出来的对话框里面没有麦克风,选项—属性—分别在“播放”和“录音”里面选择“麦克风”。确定退出后回到“音量控制”的界面,分别在“播放”和“录音”的界面里面勾选“麦克风”,音量大小自己调节。
3.1.3 录音
用电脑自带的录音功能进行录音,在麦克风旁播放歌曲“最初的梦想”,进行录音。此录音文件为Windows PCM格式的wav文件,保存在可移动磁盘H盘中,文件名为majuan.wav。
3.2 压缩过程
4 结语
本文采用两种实现方式,其中图形接口方式比较易于操作和实现,具有一目了然的效果,在其图形界面窗口中,能恰当的找出所使用尺度数的阈值和进行有效压缩。本文的难点是录音信号的调用,由于音频信号的格式不同,需要找出适合格式的信号。对于在matlab7.0环境下,实验表明用Windows PCM的wav格式文件,能完成在图形接口方式中进行信号的调用。通过仿真操作和简单编程,掌握了根据语音压缩与小波函数分解层之间关系,选择合适的压缩方式的方法。
[1]吴镇扬.数字信号处理[M].北京:高等教育出版社,2004.
[2]飞思科技产品研发中心.Matlab 6.5辅助小波分析与应用[M].北京:电子工业出版社,2003.
[3]苏晓生.掌握Matlab 6.0及其工程应用[M].北京:科学出版社,2002.
[4]陈桂明,张明照,威红雨.应用Matlab语言处理数字信号与数字图像[M].北京:科学出版社,2002.
[5]何强,何英.Matlab扩展程序[M].北京:华中理工大学出版社,2002.
[6]秦前清,杨宗凯.实用小波分析[M].西安:西安电子科技大学出版社,2002.
[7]陈亚勇.Matlab信号处理详解[M].北京:人民邮电出版社,2001.
[8]李强,赵伟.Matlab数据处理与应用[M].北京:国防工业出版社,2002.
[9]GOLD B, RADER C M. Digital processing of signals[M].New York:Mc Grew-Hill Book Company, 2005.
[10]关肇直,许文源,贾沛璋.信号分析处理[M].北京:科学出版社,2003.
Research on voice compression through wavelet transformation
Pan Xixi
(Xinyang Radio and TV University, Xinyang 464000, China)
Under the condition of ensuring the quality of signal, the paper proposes to realize the voice compression through wavelet transformation to reduce storage space.According to the principle that the percentage of the zero coefficient must be in line with that of the high signal energy,it finds out the most suitable compression method. The results of the experiment show that:when the reserved signal energy is over 96%,we can have the WAV document in the format of Windows PCM recorded by oneself decomposed 5 times with the help of Haar wavelet to successfully achieve the voice compression.
voice compression; wavelet transformation; energy; percentage of zero coefficient; Haar wavelet
潘茜茜(1987— ),女,河南固始,本科,助教。