APP下载

一种基于MATLAB的智能语音识别系统设计

2020-08-12陈后全

科学技术创新 2020年21期
关键词:波形图特征参数语音

陈后全

(西北民族大学电气工程学院,甘肃 兰州730030)

本文设计的目的是使得机械可以进行语音识别,从而帮助人们方便快捷又安全有效的生活。人机之间的语言识别系统在现今社会要求会更高,对其准确性和及时性的规定也更严苛,对语言信号的识别进行相关仿真实验,从实验中的结果得出正确结论[1],使其能根据语音信息接收人的思想意图,执行相关的操作步骤。本文采用MATLAB 来进行语音信号的识别过程,利用MATLAB 强大的数学运算能力,分析语音信号,提取语音信号的特征参数,再对参数进行DTW 算法的匹配,从而具有规定模板的数据库对比,完成数据的相似度呈现。在MATLAB 的仿真界面上显示声音的具体波形图,通过录入和输出的波形图差异对比,就可以完成语音识别系统的智能设计。

1 语音信号分析

语音信号的接收是人们口中说出的词语,包括孤立词语,连接词语和连续语音等,这些词语需要进行特定的分门别类,得到它们相关的特征参数然后进行对应识别。自然界中,不管是人类的声音还是其他的声音,声音的传出都具有音色,音调和响度这3 个特性,根据声音的这3 个特点和人们说话的行为方式来判断系统提取的特征因素,从而再更进一步地进行准确的语音识别。声音的普遍四声图如图1:

图1 声音的普遍四声图

由图分析,声音有阴阳上去(1234)四个声,系统通过采集声音信号进行语音识别。在系统的识别过程中,对采集的语音信号进行预处理,包括采样,量化和滤波等。其次是对声音的特征提取,声音的特征参数必须有效地反应该声音的语言特性,使之能够区分出其他的语音信号。同时特征参数要具备相互独立性和便于计算这两种特点,这样才能保证系统在语音识别的过程丽准确且高效,实时且流畅。

这里提出的两点是口音和噪音的干扰,这些我们都可以视作噪声来对待,由于我国的地域和文化风俗性差异,普通话的普及还有所欠缺,人们的语言特点也不尽相同,因此噪声是本文系统所要克服的一个难点。采用语音数据库的对比方法,可以改善口音的识别问题,进一步在系统内建立声学模型机制同样可以提高语音识别的成功率,对系统发展有益。噪音的干扰会使得语音信号收集受到影响,信号的收集很有可能会掺杂进扰动因素,形成无法消除的噪声,造成语音识别成功率的下降。对系统的降噪处理需要更深一步的语音模型构造,更好的数学建模方法和更强的噪声抑制功能。对这些改进方法同样可以借鉴声音的四种模式,声音简单四模式图如图2:

图2 声音简单四模式图

根据声音的音长和频率,我们可以分析出一二三四声的大致区别,图中的声调曲线是声音信号辨别的关键[2-4]。通过对曲线走势的判断,我们可以得到声音的波形幅度和顺延周期,这些参数为系统的语音识别提供了可靠的数据支持。

2 系统模型和算法实现

根据声音信号的特点,对声音信号的捕捉作出一个框架模型,其中包括基本音频,干扰噪声,声道控制和特征分析等模型,系统模型图如图3:

图3 系统模型图

基本音频通过输入基本的语音信号,提取声音的频率等特征,将收集的语音信号经过周期性处理,得到周期性的波形信号传输到声道模型中。声道模型中同时会接收到系统判定的干扰噪声,不可避免,在对声道模型中的语音信号进行采样,量化等预处理后,对语音信号的识别操作开始进行,通过算法和数据库的对比,最后成功完成人们与机器之间的语音识别功能。

DTW 算法针对孤立词语进行计算,从而得到简单高效的正确结果。DTW 算法基于DP 的思想进行相应建构,匹配语音的相关模板,计算量不是特别庞大,所有DTW 算法在现今社会中仍然具有很广泛的运用。

算法初始确定语音的开始点和结束点,对模板库的各个词条进行相关划分,将划分出来的模板作为参考依据,一个参考的划分区域可以表示为A 或B 的行组,如A={A(1),A(2),A(3),A(4),A(5),……},A(1)是开始点的语音特征矢量,A 组的最后一个元素为结束点的语音特征矢量。同理可以设置测试的划分区域,并定义相关的语音特征矢量,算法将参考和测试两方面因素进行MFCC 系数、帧变换和窗函数的对应计算,最终得到语音信号数据的正确结果。

3 MATLAB 的仿真及结论

本文使用MATLAB 进行系统的仿真实验,经过采集志愿者的声音,录入音频信号“A-Z”26 个英文字母的语言发音,并为这26 个英文字母的实验对象分别命名,命名表如表1:

表1 命名表

通过对声音信号进行分析处理后,提取相关特征参数以及选取模板,将模板存入数据库中,建立相关的数据库模型,为实验的仿真奠定数据支持。将语音信号随机选取进行MATLAB 仿真可以看到相应的波形图,单字母波形图如图4:

图4 单字母波形图

经过录入相关字母的波形显示对比,可以对比出26 个字母的相同波形,因此语音识别系统可以正确应用。简单字母“A-Z”的26 个比较完全成功,拓展到孤立词语,连接词语和连续语音等的数据库比较,从而完成更好的语音识别系统[5]。

本文利用MATLAB 软件作为仿真工具,运用其强大的数学运算能力以及其庞大的数据库构造能力,成功建构出基于MATLAB 的智能语音识别系统,帮助人们更好的生活。语音识别技术过程中,运用到了DTW 算法和仿真中的各种函数,在不断试错中也不断改进和完善,进而使得语言的处理能够在统计学和模式识别等相关学科中相融合,起到理论联系实际的一大奠基。人们需要不断地探索,不断地创新和不断的进步,才能在科技快速发展的同时也充实自己。

猜你喜欢

波形图特征参数语音
重载车辆轮胎模型参数辨识与灵敏度分析
基于视频图像序列的船用雷达目标检测和目标特征参数提取
由波形图领悟声音特性
浅析CH-γ方程中解的求法
融合LPCC和MFCC的支持向量机OSAHS鼾声识别
魔力语音
基于MATLAB的语音信号处理
基于交通特征参数预测的高速公路新型车检器布设方案研究
基于MQ3与MP3的价廉物美的酒驾语音提醒器
对方正在输入……