APP下载

基于正弦+噪声模型的语音分析合成技术

2019-05-24孙俊海

电脑知识与技术 2019年7期

孙俊海

摘要:语音信号分析合成技术是语音信号处理的一个重要组成部分,一直是近年来研究的热点,特别是,近年来随着多媒体通信技术的迅速发展,人们对语音重建质量提出了更高的要求。为此,该文通过采用正弦模型和噪聲模型相结合的分析合成方法,通过提取每一帧信号的幅度、频率、相位和残差等参数,合成每一帧语音信号,然后通过叠加的方式重建语音。研究表明,该模型是一种很好的语音分析合成模型,能合成高质量的语音。

关键词:语音重建;正弦模型;噪声模型;语音分析合成

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2019)07-0195-02

Abstract:Speech signal analysis and synthesis technology is an important part of speech signal processing and has been a hot topic in recent years. In particular, with the rapid development of multimedia communication technology in recent years, people have put forward higher requirements for the quality of speech reconstruction. To this end, this paper combines the sinusoidal model and the noise model to analyze the synthesis method, extracts the amplitude, frequency, phase and residual parameters of each frame signal, synthesizes each frame of speech signal, and then synthesizes the speech by superposition. Research shows that the model is a good synthesis model of speech analysis, which can synthesize high quality speech.

Key words: Speech reconstruction; Sinusoidal model; Noise model; Speech analysis synthesis

1绪论

语音是语言的声学表现,它承载的一定的意义,是人类交换信息最方便、最快捷的一种方式[1]。近年来,随着通信技术的迅猛发展,语音信号处理技术[2]也不断地进行更新。语音信号处理的目的是通过提取某些语音特征参数来达到某种用途的要求,它包括语音编码、语音合成、语音识别等。

语音合成作为语音信号处理技术中的重要组成部分,其目的主要是让计算机能够产生高清晰度、高自然度的连续语音。基于正弦+噪声模型[3]的语音分析合成技术通过把原始语音信号分成正弦波和噪声部分,通过提取每一帧音频特征参数,然后叠加合成,能很好地重建原始语音。与传统语音模型相比,该模型既保持了原始语音信号波形的主要特性,又具有较好的抗噪性,同时又能很好地保持原始语音信号的特点。

1正弦模型表示

2正弦分析合成

2.1参数估计

正弦分析合成最重要的问题是参数估计[5],只有提取合适的参数,才能重建较好的语音信号。一般在频域实现参数估计,通过在频域分析频谱的峰值信息来提取参数。我们可以通过以下步骤得到一帧语音信号的频域参数。首先,对原始语音信号进行分帧加窗处理,取得若干短时语音信号;接着进行高通滤波,滤除直流信号等低频信号;然后对每一帧信号做快速傅立叶变换;因为正弦模型的参数估计都是频域参数,所以要把时域信号变换为频域进行处理,通过分析原始信号的频谱图,对峰值进行检测,选取合适的峰值信息[6]提取参数频率、幅度和相位。

2.2正弦模型合成

5结束语

本文通过对基于正弦+噪声模型的研究,改进了语音合成的处理过程,提高了参数估计的准确性,降低了语音信号的失真性,改善了语音的合成质量。

参考文献:

[1] 吕亮亮. 基于正弦模型的语音编码算法研究[D].西安电子科技大学,2013.

[2] 张雪英.数字语音处理及MATLAB仿真[M].北京:电子工业出版社,2010

[3] 宋少鹏.基于正弦+噪声模型的带宽音频信号的表示与压缩.华南理工大学,2003

[4] R.J.McAulay ,T.F.Quatieri, “SPEECH ANALYSIS/SYNTHESIS BASED ON A SINUSOIDAL REPRESENTATION OF SPEECH”, MIT Lincoln Laboratory Lexington

[5] 戴礼荣.基于正弦模型的参数语音合成研究[D].中国科学技术大学硕士学位论文.2008

[6] 范苏云. 基于正弦模型的音乐信号合成技术研究[D].苏州大学,2017.

[7] 应娜. 基于正弦语音模型的低比特率宽带语音编码算法的研究[D].吉林大学,2006.

[8] 李美玲. 一种正弦谐波模型语音转换算法的设计与实现[D].西安电子科技大学,2017.

[9] 黄鹤. 基于正弦模型的线性预测低速率语音编码算法研究[D].北京工业大学,2002.

【通联编辑:唐一东】