AI技术背景下语音识别技术研究现状与途径
2019-03-30罗国强方斌李家华
罗国强 方斌 李家华
摘要:AI技术的问世为现代社会经济带来了较大的进步与发展,现阶段语音识别技术在准确率以及速度上还需要进一步完善,而深度学习依旧停留在理论层面的研究,未应用到实际产品中。另外,深度学习技术可以将云计算和数据资源整合到一起,提高对数据资源的识别速度和精确性。为了促使语音识别技术朝向更高层次发展,需要从语音收集与特征筛选、模拟训练和语音识别两方面进行。
关键词:AI技术;语音识别技术;现状;途径
中图分类号:TP18;TN912.34 文献标识码:A 文章编号:1007-9416(2019)12-0224-01
0 引言
在現代科学技术水平不断提升的背景下,社会的科技实力逐步增强,促进着我国社会慢慢的朝向智能化方向发展,智能领域包含的内容丰富多彩,机器学习就是其中的一种,并成为了智能领域研究的关键项目,在促进我国智能领域的发展上也起到了重大的作用。目前,科学家在语言识别以及互联网搜索等项目上取得了较大的突破,在依托AI技术的帮扶下,可以达到机器与人类的语言交流以及汽车自动驾驶的层面,同时在不断发展的背景下,机器人慢慢的具备了人类无法达到的功能。为了更好的促进AI技术的发展,必须要加强对语音识别技术的研究,本文从AI技术背景下语音识别技术研究现状与途径,以此为语音识别技术的进一步发展提供帮助。
1 基于AI技术的语音识别技术研究现状
在20世纪50年代中后期,AI技术也称为人工智能技术正式被人类提出来,并在当时引发了相当大的反响,许多科学家以及专家学者都参与到机器模拟智能方面的研究上,与此同时AI技术依据自身独特的优势在各个行业领域中获得广泛应用,推动着许多行业领域的改革创新,也促进着社会经济的快速发展,特别是对语音识别技术的研发。
1.1 语音识别技术理论层面的研究
现阶段,我国的科学技术实力得到较大的增强,以往比较陈旧的语言识别技术已经不能够满足现代社会的发展速度,尽管现在许多智能终端设备上都带有语音识别功能,能够完成人类与机器之间的信息交流,但是语音识别的准确率以及速度还有待加强,而目前的语音识别算法与相关技术已经很难再继续发展[1]。在这样的背景下,深度学习成为了语音识别技术进一步发展的重要方式,能够像人类大脑一样进行模式学习以及信息感知等,并且具备了大量的理论研究。然而,深度学习大多停留在理论阶段,还没能广泛的应用到实际产品中。为了解决这一的问题,促进理论和产品的相互融合,更好的满足现代社会发展的需求,必须要加强语言识别功能中关键部位的研发,如语音信号产生与传播等,从而促进语音识别技术能够获得更好的发展[2]。
1.2 语音识别技术应用方面的研究
伴随着我国科学技术水平以及互联网技术的迅速发展,促使我国逐渐的从信息化社会过渡到智能化社会,加强语音智能技术的研究也是时代发展的必然需求,能够很好的满足人类的使用需求,帮助人们可以从多种方式与手段得到初始语音信息。对现有的关于语音识别技术的研究进行整合,大部分研究项目都处于理论辩证阶段与简单算法方面,从而很难真正发挥出数据资源的优势。现如今随着深度学习技术的应用,可以很好的将云计算和数据资源整合到一起,从而提高对数据资源的识别速度和精确性,使得语音资源能够得到较好的应用,并促使语音识别技术能够朝向更高层面发展。
2 AI技术背景下语音识别途径
2.1 语音收集与特征筛选
系统在进行语音信息资源的收集过程中,需要经历采样与端点测试两个环节。首先,采样环节通常是依托声卡来实现对语音信息资源的归纳与整合,并将收到的信息进行相应的处理使之呈现出数字化形态[3]。其次,端点测试环节通常是对语音信息出现的初始与末尾阶段进行核实,是进行信息资源处理前的重要准备工作。一般情况下端点检测功能的实现是基于能量与过零率相联系的算法方式。此外,要确保语音识别系统能够正常工作,还必须要解决信息特征筛选问题,信息特征筛选结果的准确性以及筛选速度直接影响到语音识别的精确性和效率,这是因为只有实现了信息特征的精准筛选才能够将庞大的语音信息进行区分,提取出有用的信息,同时将不完整、无用的信息排除掉,从而确保语音信息资源采集环节的有序运行[4]。
2.2 模拟训练和语音识别
在这个部分重点涉及到两个方面的内容,分别是训练以及识别。首先训练是根据系统的要求选择一项适宜的识别路径,并通过训练和聚类的措施来得到这些汉字的相关信息,同时将这些信息资源作为初始应用值储存到系统中。在进行数据信息辨别时,必须要将待辨别的汉字资源存储到系统文件中,以此来建立参考模板资源库。其次识别主要是将需要进行识别的文字和参考模板数据库中的文字信息进行比对,并根据比对的相似度确定被识别文字的内容,目前主要有三种识别方式[5]:以模拟训练阶段获取的语言信息为基础并存储到系统中,当要进行文字识别时,选取计分与距离最小的文字;利用计分求法的途径将需要识别的文字信息通过态图模型开展计算,从而得到输出概率;根据语言特征的差异性进行适宜的划分,然后对每个区域特征中的平均值进行计算。
3 结语
综上所述,AI技术的应用对促进我国社会经济快速发展具有重要作用,必须要加强智能机器人技术的研发,并推广到语音识别等领域研究中,促进语音识别技术的创新与进步,最终带动社会各行各业的革新。
参考文献
[1] 房爱东,张志伟,崔琳,等.基于人工智能的语音识别系统及应用研究[J].宿州学院学报,2019,34(08):62-65.
[2] 王婉琦.人工智能在语言服务业中的应用现状与前景研究[J].南方论刊,2018(05):22-23.
[3] 何波.基于单片机的人工智能语音识别机器人的设计分析[J].电子世界,2018(08):72+74.
[4] 陳凯泉,沙俊宏,何瑶,等.人工智能2.0重塑学习的技术路径与实践探索——兼论智能教学系统的功能升级[J].远程教育杂志,2017,35(05):40-53.
[5] 胡郁,袁春杰,王玮.人工智能技术在传媒领域的应用——以智能语音技术为例[J].新闻与写作,2016(11):15-17.
Research Status and Approaches of Speech Recognition Technology under the Background of AI Technology
LUO Guo-qiang1,FANG Bin2,LI Jia-hua1
(1.College of Information Engineering, Guangzhou Vocational and Technical University of Science and Technology, Guangzhou Guangdong 510550;2.School of Information Engineering, Guangzhou City Construction College,Guangzhou Guangdong 510925)
Abstract:The advent of AI technology has brought great progress and development to modern society and economy. At this stage, speech recognition technology needs to be further improved in terms of accuracy and speed. Deep learning still stays at the theoretical level and has not been applied to actual products. in. In addition, deep learning technology can integrate cloud computing and data resources to improve the speed and accuracy of identifying data resources. In order to promote the development of speech recognition technology to a higher level, it needs to be conducted from two aspects: speech collection and feature screening, simulation exercises, and speech recognition.
Key words:AI technology; speech recognition technology; status quo; way