关于人工智能与语音识别技术的研究

2017-05-30何婉榕

科技尚品 2017年3期

何婉榕

摘要：伴随着我国社会经济的不断进步，科学技术水平越来越高，信息化的人工智能技术得以应运而生，尤其是其中的语音识别技术已经成为人工智能领域当中一项不可分割的重要组成部分，被广泛运用在各行各业当中。为此，本文将通过对人工智能的关键要素进行简单分析，结合语音识别技术的具体内涵及相关原理，以传媒领域为例，着重围绕人工智能与语音识别技术进行分析研究。

关键词：人工智能；语音识别技术；传媒领域；具体运用

0 引言

自从物联网出现以来，一直是社会大众广泛关注的焦点，而作为与其他事物进行有效链接的关键，人工智能以及语音识别技术也同样掀起了一股全新的关注热潮。人工智能也正在逐渐同各行各业相互融合，其中以语音识别技术为代表，在我国教育、医疗、家居、金融等各领域当中均能够看见语音识别技术的“身影”。而随着近些年来我国传媒领域的不断发展，人工智能与语音识别技术也同样得到了广泛运用。

1 人工智能的关键要素分析

作为计算机科学的一大分支，人工智能简单来说就是模拟人类思维意识的信息过程，并产生出一种全新的、能够做出类似人类思考及反应的智能机器。而包括机器人、语音识别、图像识别等在内的各领域均属于人工智能的研究范围，本文将对构成人工智能的三大要素进行简要分析。

1.1 深度神经网络

深度神经网络被看做是统计模式识别中的一个分支，但当前其已经逐渐同互联网和IT产业进行有机融合，并逐渐成为人工智能的关键核心。其作为一种感知智能模型能够对生物视觉皮层当中负责识别的腹侧通路进行高度模拟，同时使用成千上万各神经元与突出连接权参数，使其与皮层功能柱等生物系统不断趋近。在大数据以及GPU计算硬件的帮助下，能够自动提取原始数据中的分层特征，从而为人工智能的深入发展奠定良好基础。

1.2 大数据

大數据简单来说就是一个庞大的数据集合，通过借助云计算优化整合、分析处理海量的信息数据，完成对传统数据研究及应用的深化。当前，大数据的数据量已经升级至PB甚至达到EB级别，数据来源越来越广泛、类型也越来越多，同时其高速的处理速度以及较高的安全性和可靠性也成为大数据的强大优势。在人工智能当中，大数据与深度神经网络同样发挥着至关重要的基础作用。

1.3 涟漪效应

涟漪效应具体而言指的就是每一位用户的个人经验、知识数据等能够在互联网以及移动网络的强势介入下加入到人工智能技术研究当中。譬如说在最初的语音识别系统当中，其实际真实率只有半成左右，但在系统上线运行的过程当中不断有用户贡献出相关数据信息，就像水波纹扩散一般帮助系统进行不断地优化和完善，从而有效推动人工智能的可持续发展。

2 语音识别技术的简要概述

2.1 具体内涵

语音识别技术也常常被人们称之为自动语音识别，旨在利用案件、二进制编码等将人类语音中的词汇及内容转换为计算机可读输入。目前该项技术主要包括了语音拨号及导航、室内设备控制、语音文档检索等，而将其与机器翻译、语音合成等其他相关自然语言处理技术相互结合之后能够构建出例如语音到语音翻译的更为复杂的应用。

2.2 技术原理

首先，语音识别技术需要提取语音的特征参数，也就是语音信号中的有效数据信息，之后与语音基音、鼻辅音的元音、频谱，擦音的频谱等重要参数进行充分结合，使其能够完全匹配音频模型或模式。而人工智能网络、动态时间规整技术以及HMM模型技术则构成了完整的音频训练模型。人工智能网络可以模拟人类的大脑活动，并能够完成语言学习、判断、概括等功能，从而使得语音识别能够更加智能化。而动态的时间规整技术则能够统一音频口令的时间特征，并维持口令单词时间轴走向的稳定性，使口令特征完全匹配于模型特征，进一步提高语音识别的准确性和有效性[1]。

3 人工智能与语音识别技术的具体运用——以传媒领域为例

3.1 提升采编效率

以专门用于整理录音的转写平台为例，记者将一小时音频上传五分钟后即可收到转写文本，而这将比手动听打方式整理录音的效率高出整整47倍。通过使用语音识别技术，记者只需在听审系统当中预先设置好禁忌词，并输入需要听审的节目后，系统将会自动进行听审而其一旦检测到禁忌词后便会发出警报，从而有效提升听审成效。

3.2 优化传播形式

在通过运用语音识别技术之下，其中的VAD端点检测、分段以及语义理解技术能够帮助工作人员自动生成字幕，而工作人员在进行简单的修正与审核之后即可直接使用其作为电视节目、音频节目等相应配套字幕。尤其是各种转写网站的相继出现，能够实现将音频自动转写为文本并直接转化成字幕格式，大大提升了制作字幕的效率。另外在人工智能的发展之下，包括听书、荔枝FM等各种新型APP相继出现，在语音识别技术的帮助之下不仅能够随意添加字幕，而且有效扩展了传播形式，进一步扩大传播范围。

3.3 实现机器写作

以15年出现的自动写作机器人“快笔小新”为例，其在经过获取和分析数据之后，自动从中提炼出观点并生成相应的格式与结构，即可完成初版发布。从本质上来说，机器写作就是将大数据分析和处理技术以及自然语言生成技术进行有机结合下的产物，目前机器写作的内容主要集中在需要较强数据分析性的财经新闻、体育赛事、气象预测等方面，而具有明显个性化、叙事性特点的娱乐新闻、时政要闻等还需要结合人工智能等技术进行深入研究。

4 结语

总而言之，伴随着人工智能与语音识别技术研究的不断深入发展，我国正稳步走在发展人工智能的康庄大道上，在这一良好的发展势头之下，人工智能与语音识别技术的相关研究人员，还需要进一步加大研究力度，坚守用人工智能建设美好世界的初衷，努力带领人类走向真正的人工智能时代。

参考文献

[1]杨震，杨宁，徐敏捷.面向物联网应用的人工智能相关技术研究[J].电信技术，2016，（5）：16-19，23.

（作者单位：清华附中创新1班）