论基于机器人的语音识别技术

2014-04-29王顺利夏长春付嘉铭

电脑迷 2014年11期

王顺利　夏长春　付嘉铭

摘要语音识别技术是一个涉及多种学科的集成技术，目前已在工业、军事和医疗部门，产品检验和人机语音通信等领域取得了广泛的实际应用。语音识别技术长期以来一直是研究热点，但现有的语音识别系统运行缓慢，成本高，不方便使用。这些缺点影响了语音识别的速度，系统的硬件实现和应用。特别是在吵闹的环境中应用智能机器人语音识别更是非常困难。用于识别的工业智能机器人技术研究也越来越受到人们的关注。

关键词机器人语音识别声学模型语音特征参数

中图分类号：TP242 文献标识码：A

1语音识别技术的研究意义

人们使用的声音语言是一种人在特定高度思维和意识活动下的产品。语言是人类最直接以及最理想的交流方式，也是人机通信是最方便的方式。在机器人发展的高级发展阶段中，机器人的智能语音识别与人类的活动是密切相关的，有声语言的人机交互信息成为重要的手段。例如，语音识别获取外界信息很自然，没有特殊的训练方法，随着机器人技术的发展和广泛应用，有越来越多的机会来接触人类和机器人，所以人们希望通过语音识别和机器人去处理，不管谁能能准确安全，方便地操纵机器人。机器人和人类之间的信息交互，表现在两个方面，一是对更高层次的机器人操作，方便软件的设计开发，这种多为教学机器人，另一种是在实际操作的要求下完成信息交互任务的机器人。智能机器人作为机器人技术发展的高级阶段，其发展趋势是：不仅要求机器人具有高度的自治能力，还要使机器人和人类之间的协调也具有一定的智能性。这就要求机器人具有不同的高性能主动做事能力，而不是被动地接受任务，为了实现这一目标，自然语言作为人机信息交换将发挥越来越重要的作用。目前，智能机器人已成为机器人研究领域的一个热点。工业机器人是智能机器人的一个重要研究领域。当今，工业机器人的发展方兴未艾，巨大的市场潜力，使真正的工业机器人的已经在市场上崭露头角，以满足人们日益增长的需求，我们不能没有一个高性能的语音识别系统。由于工业机器人是面向生产实际的需要，最好的工作方式是让机器人能顾听懂最常见的人类语言，完成指定的工作，并能与人交流。机器人语音识别是机器人研究领域中的语音识别应用，最终的目标是让机器人了解人们的口头语言，然后按照人们的命令来行动或反应，从而形成一个良好的人机对话系统。为了能够进一步推动智能机器人的开发应用，因此，在语音识别机器人的研究领域中，机器人语音识别系统是工业机器人的实际推广应用，具有重要的意义。

语音识别技术在智能机器人中的应用已经有很多年的历史，作为智能机器人的一个分支，工业机器人得到了迅速发展，工业机器人通过语音识别从工业噪声中提取有效的语音命令。为了实现机器人在一些特殊工业环境中工作的目的，机器人要能够识别命令意图。语音识别技术，可以实现人机对话，从而让机器能模仿人类完成所有工作的分配，使其在各行各业中能够得以应用。目前所面临的实际问题是：噪声和干扰环境下对大型工业机器人的语音识别有严重的影响。在机器人识别领域，工业环境中的实时性是一个非常重要的任务。机器人在工业环境下应用的听觉识别是使智能机器人发展速率低的瓶颈。

2语音识别系统的发展

2.1语音识别系统的发展方向

语音识别系统是基于一套应用软件系统的硬件平台和操作系统的一些。语音识别一般分为两个步骤。第一步是学习或培训。这一阶段的任务是建立基本单元的声学模型来进行识别和模型的语音语法分析等。第二步是识别或测试。根据识别系统的类型可以满足一个识别方法的要求，使用语音分析的方法来分析语音特征参数，并建立了比较和测量系统模型，根据一定的标准，鉴定结果。

语音识别系统的应用可分为两个发展方向，其中一个是大词汇连续语音识别系统，主要应用于计算机的听写机，以及结合电话网或互联网的语音信息服务系统，这些系统是在计算机平台上的一个重要发展方向。其次是应用的小型化，便携式音频产品，如无线移动电话的拨号，语音控制车载设备，智能玩具，家用电器和其他方面的应用的远程控制，这些应用系统大多采用特殊的硬件系统来实现，特别是语音信号处理芯片和语音识别芯片，最近几年快速发展，为其广泛应用创造了极为有利的条件。

2.2语音识别系统的模型与模式

语音识别系统的核心是声学模型和模式分类。首先通过学习算法，训练语音声学模型的特点是通过学习过程来生成声学模型，这是识别潜在的模型的前提，是最关键的语音识别系统的一部分。声学模型的目的是提供一种有效的方法来计算特征向量的声音序列和每个发音模板之间的距离。人的发音在每一刻发音之前和之后都会受到影响。

为了模仿自然连续的协同发音和识别不同的发音，通常需要使用复杂的声学模型。声学模型和语言的发音特点的设计是密切相关的。声学模型单元大小与单词发音，音节模式和音位语音训练数据大小有关，故要求其系统识别具有很大的灵活性。大词汇量语音识别系统，通常采用较小的单元和少量的计算，该模型只有较小的存储容量，减少训练数据的数量，但相应的声音定位和分割问题就显得更加困难，规则识别模型变得越来越复杂。通常大型模型中识别单元包括协同发音，这有利于提高系統的识别率，但训练数据也相对增加。必须根据不同语言的特点来识别词汇，词汇量大小决定单位大小。

参考文献

[1] 李昌禄，苏寒松.？基于单片机平台下语音识别技术的应用方式[J].实验室科学，2009（06）.

[2] 薛同泽，陈书旺.？语音识别的智能门控系统设计[J].微计算机信息，2008（14）.