APP下载

基于时间规整算法在神经网络语音识别中的应用

2020-09-10郭川玉吴荣茂

科学咨询 2020年36期
关键词:规整录音数据挖掘

郭川玉 吴荣茂

(1.深圳航天科创实业有限公司 广东深圳 518000;2.深圳航天科创智能科技有限公司 广东深圳 518000)

前 言

语音识别系统的设计和运行需要有较多高新技术作为支撑。神经网络的分类能力较强,能够有效解决模式分布中复杂的分类问题,在语音识别中发挥着积极作用。神经网络语音识别活动进行中,难点在于时间规整这一方面。高度重视时间规整的内容,能够使神经网络语音识别设计和运行取得良好效果。

一、神经网络语音识别的基本情况

语音识别(Automatic Speech Recognition,ASR),是借助于分析和理解转变语音信号,使其成为相应的命令或者文本的尖端技术。语音识别技术在实际应用过程中,本身属于一种交叉学科,关系到概率论和信息论、人工智能、信号处理、发声机理和听觉机理以及模式识别等方面。在语音识别技术的支持下,有效结合语音合成技术,能够实现人机语音通信。在建立语音系统的过程中,听觉能力和讲述能力这两项技术是重要基础。

神经网络语音识别技术的有效应用,要具备较多应用功能,主要是实现语音测听和语音搜索两个方面。支持语音识别活动的顺利实施,主要包含以下几个方面:

1.语音搜索。这一功能在应用中,用户能够输入多种信息,包含情绪检测信息、关键词信息以及长时静音信息。这一功能可以快速筛选出索引文件,还能够返回给用户所关注到的语音,使用户能够反复听这些检索信息。语音在搜索过程中,可以搜索到任意关键词,实现高级搜索、不同时间段搜索,并能够测听结果录音流水号。

2.语音测听。质检员能够测听语音搜索出的录音文件。在语音测听活动进行中,质检员主要使用录音播放器,通过对话方式高亮展现出录音文本内容,使用不同颜色表示出违规类型情况。这可以支持点击跳转活动。

3.构建语音语言训练模式。神经网络语音识别系统进行中,涉及到多个行业的语音语言训练模型,可以提高语音支持率。

4.数据挖掘。开展数据统计和分析,积极利用MapReduce并行计算框架及数据挖掘算法,全面整理和归纳好各项结果,寻找其中潜在的运行模式,给决策者提供重要的信息支持,避免决策失误的情况发生[1]。

二、基于时间规整算法在神经网络语音识别中的应用

(一)时间规整算法

根据这一公式开始重复计算,从i=0开始,一直计算到i=n-N-1为止。

时间规整算法在实际应用过程中,能够有效避免以往算法在神经网络语音识别中出现的不足,可以减少语音段错误真正划分的情况发生,从而有效增强后端分类器的实际识别率[3]。时间规整算法的具体应用,具有较强的实效性。从规整次序角度出发,时间规整网络可以把握到语音信号的局部位置,针对各项语音信号加以合理合并,依次完成合并作业。这是针对最小帧间距离语音分析帧进行的。整个过程中,可以在各个音素段中融入语音过渡段,在这一条件下,讲话人的发音特点,不会对最后识别情况产生不良影响,从而提升语音识别系统的总体应用效果[4]。

(二)动态时间规整(DTW算法)

DTW算法(Dynamic Time Warping),是针对两个长度不同时间序列相似度的方法,能够应用在模板匹配之中,可以作为数据挖掘和信息检索的重要支持。在神经网络语音识别环节,DTW算法是表示数据中较为常见的形式。这是利用时间规整函数W(n),针对测试模板和参考模板的时间对应关系加以描述,从而求解出匹配这两个模板时最小距离所应对的规整函数,有效支持语音识别活动,保证识别率[5]。

三、结束语

现代语音识别系统在当前生产生活中占据重要地位,给人们的日常生活提供极大便利。时间规整算法在神经网络语音识别中,能够发挥前端时间规整和动态时间规整(DTW算法)的优势和作用,应用效果良好。

猜你喜欢

规整录音数据挖掘
Funny Phonics
探讨人工智能与数据挖掘发展趋势
funny phonics
300kt/a硫酸系统规整填料使用情况简介
Colorful Seasons多彩四季
A New Term
基于并行计算的大数据挖掘在电网中的应用
提高日用玻璃陶瓷规整度和表面光滑度的处理方法
电梯的建筑化艺术探索
一种基于Hadoop的大数据挖掘云服务及应用