APP下载

基于MatlabGuide藏语语音参数提取平台的设计与实现

2018-01-09刘明卓嘎王泽年

电脑知识与技术 2017年34期

刘明+卓嘎+王泽年

摘要:目前,藏语语音参数提取相关研究相对较少,藏语语音处理过程中的重要环节是对藏语语音中的参数提取,其准确性直接影响到系统的性能。语音信号的特征参数主要指的是语音信号的基音频率和共振峰频率。基于MATLAB GUI创建一个平台将语音信号提取、预处理、分窗加帧可提高系统辨认度,让其准确性增加从而更好地提高系统的性能。

关键词:藏语语音;基音频率;MATLAN GUI

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2017)34-0212-03

Abstract:At present, there are relatively few researches on the extraction of Tibetan speech parameters, and the extraction of Tibetan speech parameters is an important part in the process of Tibetan speech processing, and its accuracy directly affects the performance of the system. The characteristic parameters of speech signal are the pitch frequency and formant frequency. Based on the MATLAB GUI to create a platform to voice signal extraction, pretreatment, window frame can increase the system identification, so that the accuracy of the system to improve the performance of the better.

Key words: Tibetan speech; base tone frequency; MATLAN GUI

语音特征参数是人说话识别系统的关键组成部分,直接影响了系统的性能。藏语语音信号是冗余度相对较高的不稳定信号,将其特征参数提取并加以处理可以减少语音识别时所要处理的数据量,尽量能够完整、准确地表达语音信号。语音信号的特征参数主要指的是语音信号的基音频率和共振峰频率。基音检测作为藏语语音处理的关键环节直接影响整个语音处理系统的性能,基音检测是根据浊音语音的周期性进行周期或频率估算[1]。国内的藏语语音方面一般都在MFCC参数提取的理论基础上进行运算与提取[2],本文运用MATLAB Guide藏语语音参数提取平台的设计以及实现还是比较具有创新和实用的。

1 语音提取与函数处理

1.1 语音提取

藏语语音中浊音信号具有明显的周期性,所以用Matlab wavread函数将语音中浊音部分提取出来。

1.2语音预处理[3-4]

语音信号的预处理中的预加重,主要是为了实现对语音的主要高频部分进行加重和减小口唇辐射的一些影响,可以提高语音高频部分的分辨率。大部分通过传递函数为[H(Z)=1-az-1]一阶FIR高通数字滤波器来完成预加重,其中a是预加重的系数,0.9

1.3 分帧加窗[5]

进行了预加重数字滤波之后,信号就要进行加窗分帧的处理,因语音信号具有短时平稳性的特点(10-30ms内可以认为语音信号近乎不变),所以就可以把语音信号分为一个一个的短段来进行处理,这就是分帧,语音信号的分帧可以采用对可移动的一定长度的窗口用加权的方法来实现的。大多数每秒的幀数约为33~100帧,因情况而定。一般的分帧方法是交叠分段,前一帧和后一帧的交叠部分称作帧移,帧移与帧长的比值大致为0~0.5。

汉明窗的时域与频域波形,窗长N=61,如图2所示。

2 MATLAB GUIDE界面设计[6-9]

Matlab Guide是使用者与计算机程序之间的交互方式,是使用者与计算机进行信息交流的方式。通过GUIDE界面使用者不需要输入命令,也不需要了解其内部是如何运行的。计算机在屏幕中显示图形和文本,而使用者可以通过输入设备与计算机通信,用户界面的功能是根据使用者来具体设定的。图形用户界面或GUI中包含多个图形对象例如图像窗口、图轴、菜单、按钮、文本框等组成的用户界面,使用者点击具体的对象,使其该功能被激活使用。Matlab guide既可以嵌入已有的仿真程序,又能把仿真之后的图形化的结果以人机交互的动态形式直观呈现出来,对于熟练使用MATLAB而又不想编写大量VC代码的人员来说,MATLAB GUI是一个最好的选择。

MATLAB提供了两种创建GUI的方法,一种是直接用编程的方法来开发创建整个GUI;另一种方法是通过MATLAB中GUI向导来开发创建GUIDE环境进而形成相应文件.GUIDE 给用户提供了一个方便高效的集成运行环境,主要可分为菜单栏和工具栏、向GUI中添加控件还有用户界面函数编辑窗口三部分,在使用GUIDE创建GUI时,可以把设计好的GUI界面保存成为一个用户界面窗口定义文件(FIG),同时又可以自动生成对应的源程序文件(M).该M文件中包含了GUI的初始化代码以及界面布局的控制代码.因为这种GUI向导来开发创建GUIDE环境进而形成相应文件的方法比较简单直观,以及在M文件的管理和程序代码的修改上相对比较方便,所以本文使用MATLAB中GUI向导来完成界面设计,设计过程主要包含两大部分,分别为GUI界面设计和对象的响应。

图形用户界面的具体设计制作步骤如下:

① 分析用户界面的主要功能,明确设计的主要任务;

② 绘出使用者想要的界面草图,从使用者的角度来进行审查;

③ 启动GUIDE,选择相应的操作模版,按照之前设计好的草图绘制静态界面,并向GUI中添加相应的控件,以及对相应控件的属性进行设置;

④ 编写和调试相应对象的响应函数,从而实现用户界面的动态功能;

⑤ 运行图形用户界面,进行功能的测试。在设计过程中,步骤之间一般都是交叉反复进行的,设计和实现过程都不可能一步到位的,因此我们要不断进行调试,直到使我们满意为止。

⑥ GUI藏语语音参数提取平台包含了以上功能,实现了语音提取,预处理,分帧加窗等功能,使得语音信号辨认度更高,准确性增加。

3 结束语

藏语语音处理过程中的重要环节是对藏语语音中的参数提取,其准确性直接影响到系统的性能。但是藏语语音参数提取相关研究相对较少,语音信号的特征参数主要指的是语音信号的基音频率和共振峰频率。语音信号提取、预处理、分窗加帧可提高系统辨认度,让其准确性增加从而更好地提高系统的性能。基于MATLAB GUI藏语语音参数提取平台将满足提高系统辨认度,使得基因频率和共振峰频率的准确性得到提高。藏语语音参数提取更容易。

参考文献:

[1] 卓嘎,边巴旺堆.基于Matlab的藏语语音基音检测算法研究[J].现代电子技术,2015,38(10):20-22.

[2] 卓嘎,姜军,边巴旺堆.基于Matlab的藏语语音MFCC参数提取研究[J].西藏大学学报:自然科学版,2017,32(1):58-62.

[3] 耿李广.语音信号的短时频域分析[D]. 安徽财经大学,2012.

[4] 王璐.基于模块化的语音信号预处理实现[D].大连理工大学,2009.

[5] 郑中华.噪音环境下汉语连续数字识别与研究[D].合肥工业大学,2013.

[6] 王光艳,赵晓群,王霞.基于MATLAB GUI的语音信号特征提取系统设计[J]. 河北工业大学学报,2010,39(4):14-18.

[7] 杨超,聂仙娥,王锋,等.基于GUI的声信號采集系统界面设计[J].电声技术,2012,36(3):66-68.

[8] 李俊旺,孙传尧.基于MATLAB/GUI的矿物浮选动力学研究平台设计[J].化工矿物与加工,2012,41(2):4-8.

[9] 薛山.MATLAB基础教程[M].2版.清华大学出版社,2013.endprint