APP下载

基于深度学习的语音识别方法

2021-01-15滕海坤李伦彬王诗莹黑河学院计算机与信息工程学院

环球市场 2021年22期
关键词:端点噪音语音

滕海坤 李伦彬 王诗莹 黑河学院计算机与信息工程学院

智能化的深度开发和研究,使其与语言识别的整合更加紧密,机器学习模型构建也显得更加重要。随着信息化技术的优化与发展,智能化研究的语音识别已经成为可能,对深度学习的语音识别方法研究也显得更加重要。

一、人工智能语音识别技术现状

现阶段随着科学技术的发展促使人工智能语音识别技术广泛普及,成为广大人民日常生活中不可缺失的一部分[1]。这种语音识别技术主要接受到语言输入信号后,通过计算机把语言信号转换成对应的文字技术。由于人工智能语音识别技术广泛被应用到人们常用的电子产品当中,极大的提升人们生活效率,这项技术的开发给人们生活带来了巨大改变。并且语音识别技术还可以在计算器转换语音信号输入时获取并立即执行获得的指令。但由于国内现阶段人工智能语音技术刚处于发展阶段,拥有一些缺点,正在逐步发展并完善提供给人们更优质的服务。

(一)噪声干扰问题

噪声干扰目前还未有人找到有效解决方法,由于在收集语音信号过程中有噪音干扰,导致语音识别系统无法有效识别接受到的信号,甚至无法识别语音信号。

(二)端点检测技术有待提高

端点检测技术在语音识别信号过程当中占据着举足轻重的位置,但端点检测器技术有待提升,因为端点检测器在没有噪音并且非常安静的环境下,出现的语音识别失误大多来自检测器。可以看出如果想大幅度提升语音识别技术,必须加大对端点检测技术的研发与改进,而提升端点检测技术的本质就是稳定性更高的语音参数[2]。

二、基于人工智能深度学习的语音识别方法分析

(一)语音识别方法中的语音拾取和提取特征

语音拾取在语音识别方法中具有端点检测与采样两个非常重要的环节。在进行端点检测环节时,主要是用来收集在外界环境干扰下的语音样本,也就是拥有噪音的环境下,这种方法具有可以分辨出噪音下的语音样本,通过缩减通信带宽、设备能耗并压缩语音编码的实际的速率,来确保加强语音识别率的功效,并且这种识别方法也被人们叫作语音活动检测,或语音边界检测。在这一语音收集识别过程中主要利用语音活动检测器来达到语音收集并识别方法功能[3]。

我国现阶段对于端点检测方法还有两个非常重要的问题无法有效解决,第一个问题是收集语音信息后的前后沿剪切问题,这一问题主要表现在语音检测整体过程中的头尾与实际人声之间拥有时间差的问题,无法完全同步,为此,对于语音波形的开头和结尾都会人为进行删减,结果会导致翻译文字与实际语音波形两者间拥有出入;第二个问题是外界环境中存在的噪音问题,现阶段的问题是如何精确有效的区分出接受到的信号源中的噪音,为此提升语音参数的稳定性是最为有效的解决方法,找寻稳定性强的以此来准确提取语音特征。

采样环节作为语音拾取过程中的初试环节,其本质就是收集语音样本,再把收集到的语音样本通过转换器进行转换。在这一过程中,为有效避免由于频率低导致低频发生失真现象,为此应在采用声卡进行收集信号过程中,确保整体过程中采用的频率是最高录制频率的两倍或两倍以上。

(二)语音识别方法中的模拟训练和语音识别判断

模拟训练和语音识别判断主要包括三方面内容:

1.要想更好的完成语音识别工作,可以多进行模拟训练,训练的过程可以对照已有的识别方法进行。训练的主要目的是获得语音参数,将其作为模板保存和其他模板一起用于建立参考模板库,之后的语音识别可以以此为标准。

2.将识别样本按照参考模板的标准进行挑选,挑选出与模板最为接近的样本,将其作为识别字。对比方法有以语音特征训练的提取结果为标准进行筛选。识别时,主要以待识别字的向量序列进行区分,可以输入训练特征与语音信号来获得,接着要将得到的序列与模板进行对比[4]。

3. 提高语音系统对特征的识别。语音识别系统中往往需要对声学模型进行分析和处理,进行这一步骤的前提是将语音信号中所包含的信息进行量化,并从中提取出特征用于代表语音信号本省,由此可见,在整个语音识别系统中最为关键的环节就是提取语音信号特征。通过在图像识别中使用深度学习方法,发现其对于图像识别有很大帮助,之后在语音识别系统中使用,也效果显著。与传统方法不同,深度学习通过其独特的训练方式能够让神经网络具有更佳的初始权值和偏重,避免了训练过程中神经网络局部最优解情况的发生。深度神经网络更为贴近原始音素数据的本质特征,使数据更易于区分,优化语音识别系统,让语音识别系统更为精确。

三、结束语

在信息技术与智能化技术不断发展完善的今天,深度学习的语音识别方法也得到了优化,本文对基于人工智能的深度学习语音识别方法进行研究,旨在为相关技术人员与相关工作领域研究提供助力。

猜你喜欢

端点噪音语音
噪音,总是有噪音!
例谈求解“端点取等”不等式恒成立问题的方法
无法逃避的噪音
不等式求解过程中端点的确定
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
对方正在输入……
噪音的小把戏
白噪音的三种用法