面向助听器的语音信号处理算法开发平台设计*

2015-02-23梁瑞宇王国伟薛万里

电子器件 2015年4期

关键词：维纳滤波嵌入式系统助听器

梁瑞宇，王国伟，薛万里，倪　烨

(南京工程学院通信工程学院，南京211167)

面向助听器的语音信号处理算法开发平台设计*

梁瑞宇*，王国伟，薛万里，倪烨

(南京工程学院通信工程学院，南京211167)

摘要:综合考虑助听器体积小，功耗低等特点，设计了一种基于嵌入式系统的实时语音处理算法的开发平台。该平台的硬件核心主要由CortexA8嵌入式处理芯片和FPGA芯片综合构成，共包含4个关键模块:音频输入模块、内部时钟模块、FPGA控制模块和信号处理模块。为了提高系统的处理效率，系统设计了基于FPGA的多路语音处理转换模块。为验证平台性能，设计并实现了基于维纳滤波的助听器语音增强算法，并进行了主观测试，实验效果良好。

关键词:助听器;语音信号;维纳滤波;嵌入式系统

听力损失会严重影响听障患者的身心健康，佩戴助听器是目前听障患者改善听力最有效的手段。在中国，庞大的老龄听损人口、落后的助听器技术、以及汉语与英语本身的差异性，都使得汉语数字助听器技术研究面临严峻的挑战［1］。因此，研究面向汉语，面向老龄患者的助听器算法具有急迫的现实意义。

我国助听器研究起步较晚，软硬件条件都落后于欧美等发达国家。目前从事助听器算法研究的科研人员多局限在PC机上的仿真，由于缺少合适的硬件开发测试平台，导致所研究的成果离产业化仍有不少的距离。为此，面向助听器需求，在多年助听器算法研究的基础上，本文设计并实现了一种基于嵌入式系统的多路麦克风语音信号处理开发平台。平台以高性能的Cortex－A8微处理器作为主处理器，利用FPGA设计灵活的语音信号采集与预处理模块，以实现实时语音处理算法。相比于基于DSP的硬件平台［2］，嵌入式系统更灵活，更便于科研人员进行算法验证。

在助听器算法中，降噪算法是最基本的助听器算法。目前的单通道的降噪算法主要分为4类:小波变换法［3］、模型类语音增强算法［4］、短时谱估计类语音增强算法(维纳滤波算法［5］等)和基于听觉掩蔽效应的语音增强算法［6］。因此，为了验证平台性能，本文研究并设计了一种基于维纳滤波的语音增强算法。算法采用基于先验信噪比估计的维纳滤波器［7］进行语音增强处理，信号的噪声功率谱估计采用最小值统计算法估计，从而得到增强后的语音。实验表明，与传统维纳滤波法相比，该方法能更有效地抑制残留噪声，提高语音可懂度，具有较高的实用价值。

1　系统硬件架构及模块设计

本文语音信号处理实验平台的硬件平台如图1所示。各模块具体参数与指标如下:(1)麦克风:一路驻极体麦克风/耳机接口，用于常规语音信号采集、处理和回放实验，8路硅微麦克风阵列输入，用于声源定位、语音增强等实验; (2)A/D转换模块:不使用编解码芯片(CODEC)，采用CS5368高速8路音频AD转换器; (3)D/A转换模块:采用CS4382芯片将串行数字信号转换成8路音频模拟信号; (4)Cortex－A8微处理器模块:采用Samsung公司出品，业界广泛使用的S5PV210微处理器; (5)计算机接口:UART串口、I2S音频接口以及其他接口; (6)数据存储模块:FLASH闪存本地存储，或者通过计算机接口存储在计算机上; (7)立体声D/A转换模块:CS4382; (8)扬声器:将经过处理的音频信号转换为可以感知的声信号。

图1　系统架构框图

1.1系统关键模块设计与实现

在平台设计中，音频模块和信号处理模块相对比较重要，本平台的关键模块框图如图2所示。系统关键模块主要包括音频输入模块、内部时钟模块、FPGA控制模块和信号处理模块。音频输入模块采用Cirrus Logic公司推出的一款模拟数字音频转换器集成芯片，完成8路差分模拟输入信号的同步采样; FPGA控制模块主要用于实现模数转换芯片的采样控制、采样数据的串并转换处理以及数据的缓存和传输;信号处理模块主要完成采样数据的处理和各种算法的实现;时钟模块则负责为各个模块提供准确的时钟信号。设计中采用ASIC+FPGA的设计理念，其好处在于利用FPGA的并行处理能力，提高数据的吞吐率;同时保证ASIC只负责信号的运算处理，提高系统的运算效率。

数据采集板的核心逻辑控制芯片采用ALTERA公司CycloneII系列的EP2C5，其内部功能模块设计主要包括时钟控制模块、串并转换模块、先入先出(First In，First Out，FIFO)模块和DSP接口模块，如图3所示。串并转换模块也是FPGA与模数器件的接口模块，与模数转换器的采样时钟和FIFO的写时钟同步; DSP接口模块则与FIFO的读时钟同步。所以，为了实现数据的缓存和传输，系统在两者之间加入异步FIFO。

图2　数字助听器研发平台组成框图

图3　FPGA功能模块设计

1.2系统同步设计及抗干扰设计

在多通道数据采集处理系统中，信号的同步和抗干扰设计对于系统性能起到至关重要的作用。因此，本系统在硬件电路设计上采用以下措施来提高系统性能。(1)为了避免各个信号之间的串扰和保证信号的完整性，印制电路板设计采用4层板结构。大面积的电源和地层使信号线与地平面或电源平面之间形成一个紧耦合层，从而减少了信号线之间的串扰。同时，电路设计根据元器件位置将电源平面分割为独立的模拟区和数字区。模拟和数字信号在各自的区域内走线，互不交叉; (2)综合使用滤波电容、滤波电感，减少电源扰动; (3)使用泪滴焊盘和圆弧拐角布线技术减少信号线的辐射和反射，降低串扰; (4)保持多路时钟和触发信号之间的延迟尽量一致; (5)系统的模拟部分和数字部分分别采用隔离独立电源进行供电，而且数字部分采用低压差电源，模拟部分则采用低噪声的线性稳压电源; (6)在去耦降噪设计上，每个芯片的电源引脚，用0.1 μF 和0.01 μF的贴片瓷片电容进行去耦。在系统电源的输入端，使用10 μF～100 μF的电解电容器对电源进行滤波; (7)如图4所示，采用镜像法设计8通道语音处理电路，使每通道的元件相对位置与间距相同，从而保证信号在电气连接上的同步性。

图4　八通道语音信号采集板

2　基于先验信噪比的维纳滤波算法

2.1算法原理

传统的维纳滤波法需要估计出纯净语音信号的功率谱，一般用类似谱减法的方法得到，即用带噪语音功率谱减去估计到的噪声功率谱，这种方法会存在残留噪声大的问题。本文采用改进的维纳滤波器进行子带语音增强，即基于先验信噪比的维纳滤波器［8］，且子带噪声谱的估计采用最小值统计方法，算法实现框图如图5所示。

图5　维纳滤波原理框图

对于第m帧带噪语音信号:

式中，sm(n)是第m帧纯净语音信号，nm(n)为第m帧噪声信号，维纳滤波器就是在最小均方误差准则(MSE)下实现对语音信号sm(n)的估计。在sm(n)与nm(n)不相关且均为平稳随机过程条件下，对式(2)进行离散傅里叶变换，得:

式中:ξ(m，k)(SNRpriori)为先验信噪比，m为帧号，k为频点。则第m帧增强语音可表示为:

采用直接判决(Decision-Directed)法来估计先验信噪比SNRpriori:

谱增益函数为

式中:SNRpost表示后验信噪比，^S2(m－1，k)表示估计的第m－1帧纯语音功率谱，^N2(m，k)表示估计的第m帧噪声功率谱，α一般取0.98。

采用基于先验信噪比的维纳滤波算法的关键在于对噪声功率谱进行估计。传统的噪声谱的准确估计。传统方法是使用语音激活检测技术(VAD)来判断带噪语音中的有声段和无声段，通过无声段的功率谱来估计噪声功率谱。但实际应用中会经常遇到背景噪声是非平稳的噪声和低输入信噪比的情况，此时的VAD的准确率会较低，很难保证估计出来的噪声的准确性。为此，本文采用一种快速的噪声谱估计方法［9］，该方法基于Doblinger的最小值统计方法，引入了语音出现的概率，根据语音出现概率来更新噪声谱。

2.2实验与仿真

利用MATLAB对基于先验信噪比的维纳滤波算法进行测试，并与传统维纳滤波法进行对比。实验语音为录制的一段语音，噪声选自NOISEX－92噪声库中的White、Speech babble和Destroyer engine噪声，输入信噪比分别为0 dB、5 dB、10 dB。实验中语音信号的采样率为8 kHz，帧长为256点，帧移50%。增强后的语音从输出信噪比和MOS得分两个方面来评价增强效果(MOS得分在0～5之间，得分越高表示语音质量越好)。测试结果见表1。

表1　传统维纳滤波法与本文方法的测试结果对比表

3　结论

受限于助听器硬件和算法实用性的特殊性，本文设计了一种基于嵌入式系统的语音算法处理平台。该硬件平台基于多路麦克风设计，并采用高性能的Cortex－A8微处理器实现语音处理算法。在硬件实现上，算法综合考率了硬件的可靠性，并采用FPGA对硬件性能进行了优化。最后，基于该平台，本文实现了基于先验维纳滤波的语音增强算法，并进行了主客观测试。实验结果显示，同传统的维纳滤波算法相比，该算法的实际性能更好。

参考文献:

［1］Ruiyu Liang J X，Jian Zhou，Cairong Zou，et al.An Improved Method to Enhance High-Frequency Speech Intelligibility in Noise ［J］.Applied Acoustics，2013，74(1):71－78.

［2］戴红霞，王剑，赵力.麦克风阵数字助听器实验平台研究与设计［J］.电子器件，2012，34(6):723－726.

［3］Ghamry N.An FPGA Implementation of Hearing Aids based on Wavelet-Packets［J］.Journal of Computers，2012，7(3):680－684.

［4］Ma N，Bouchard M，Goubran R A.Speech Enhancement Using a Masking Threshold Constrained Kalman Filter and Its Heuristic Implementations［J］.Audio，Speech，and Language Processing，IEEE Transactions on，2006，14(1):19－32.

［5］Spriet A，Moonen M，Wouters J.Robustness Analysis of Multichannel Wiener Filtering and Generalized Sidelobe Cancellation for Multimicrophone Noise Reduction in Hearing Aid Applications［J］.Speech and Audio Processing，IEEE Transactions on，2005，13(4):487－503.

［6］Virag N.Single Channel Speech Enhancement Based on Masking Properties of the Human Auditory System［J］.Speech and AudioProcessing，IEEE Transactions on，1999，7(2):126－137.

［7］Hasan M K，Salahuddin S，Khan M R.A Modified a Priori SNR for Speech Enhancement Using Spectral Subtraction Rules［J］.Signal Processing Letters，IEEE，2004，11(4):450－453.

［8］张亮，龚卫国.一种改进的维纳滤波语音增强算法［J］.计算机工程与应用，2010，46(26):126－131.

［9］焦人杰，侯丽敏.一种快速自适应噪声谱估计方法［J］.声学技术，2007，26(4):735－740.

梁瑞宇(1978－)，男，南京工程学院，副教授，研究方向为语音信号处理，助听器信号处理;

王国伟(1992－)，男，南京工程学院，本科，研究方向为语音信号处理。

Design of Hardware and Software of FXS Voice Gateway Based on CM5000*

HUANG Xueda*，LIN Feng
(Chongqing University of Posts and Telecomminications，Chongqing CYIT Communication Technologies Co.，Ltd.，Chongqing 400065，China)

Abstract:We developed IP telephone voice gateway devices on H.323 protocol and MGCP Protocol，then there are very complicated to do for us，which resulted in a lot of problem.In order to improve design of IP telephone，a portable design of FXS terminal devices is put forward on CM5000，which may be implemented by using simple SIP protocols，not only ensure QoS of telephone operation，but also MOS value of 4.5，so telephone operation interface accorded with correlative criterion; How to design and implement the hardware and software of FXS terminal device on CM5000 was described; Performance testing result of telephone interface indicated the design doing all right on Internet.

Key words:IP Telephone; voice gateway; Session Initiation Protocol; Foreign Exchange Station; Foreign Exchange Office

doi:EEACC:645010.3969/j.issn.1005－9490.2015.04.037

收稿日期:2014－03－24修改日期:2014－04－15

中图分类号:TN912.34

文献标识码:A

文章编号:1005－9490(2015)04－0898－05

项目来源:国家自然科学基金项目(61301219，61375028，61301295);江苏省自然科学基金项目(BK20130241);江苏省大学生实践创新训练计划项目(201411276019Z)