以“微软小冰”为例浅析人工智能的应用
2019-08-04刘颜东
刘颜东
摘 要 在人工智能飞速发展的同时,人们不由得对人工智能的未来充满了期待,文章以微软小冰为例,介绍了它的三大系统:文字对话系统、图像识别系统及语音合成系统,并针对其目前的应用方向分析了人工智能未来的应用趋势。
关键词 人工智能;微软小冰;应用
中图分类号 TP3 文献标识码 A 文章编号 1674-6708(2019)236-0113-03
人工智能,作为计算机学科的重要分支之一,目前在世界上已经成为了一项重要的尖端技术。这个领域主要是研究如何使计算机拥有人类的智慧并做人类能做到的事情。人工智能的诞生与成熟,标志着人类已经步入新信息时代,并且达到了认识世界和改造世界的一个高峰。“微软小冰”是由中国人自主研发并且进入国际市场的一款人工智能系统,该系统得到了比尔盖茨等计算机界人士的肯定。从初代的小冰开始,微软小冰已经过六次版本更新,每一次都有较新的改良和突破。微软小冰主要是一个聊天机器人,但又不仅仅具有智能聊天的功能,它也具有图像识别、游戏交互、语音交流、文艺创作等多种多样的其他功能。
1 人工智能概述
人工智能是一门研究、开发一些可以模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的科学[ 1 ]。它是属于计算机科学,而它的目的则是分析人类智能的本质,并根据人类的思维方式去创造出一种类似于人类智能的智能机器人。它主要研究方向有机器人、语音识别、图像识别、自然语言识别和专家系统等。一些危险或比较复杂的任务,人类往往难以对其进行处理,因此人工智能的出现具有很大的意义,它们可以替代人类去完成这些任务。
1.1 人工智能的发展历程
人工智能从产生到现在经历了很长的发展历程[2]。1936年,图灵首先提出了计算机能否思维这个问题,随后在1956年美国召开的达特茅斯会议上首次提出了人工智能这个概念,从此,对人工智能的研究拉开了序幕。20世纪50年代起,人工智能技术成为了当时的热点研究问题,人工智能研究进入了一个蓬勃发展的时期。一些研究者对人工智能的很多领域都进行了很深入的探讨和研究,但随后人工智能就进入了低谷阶段。20世纪90年代,人工智能再度逆袭,IBM公司研发的“深蓝”机器人在比赛中以3.5:2.5的比分击败了国际象棋世界冠军卡斯帕罗夫,这不仅在世界上引起了轰动,同时也将人工智能的发展带入“春天”。随后,人工智能飞速发展,直到2017年围棋人工智能AlphaGo以3:0完胜围棋冠军柯洁,这再度让人们对人工智能的未来充满了期望。
1.2 人工智能的分类
人工智能主要有强人工智能和弱人工智能两大类,而目前我们所能制造的几乎都是弱人工智能。“弱”主要是因为目前我们的人工智能还没有自主意识,不能真正意义上的达到“智能”。强人工智能则不同,它具有多项自主能力。而强人工智能也可以细分为类人人工智能和非类人人工智能。当人工智能的思考与行动方式和人类非常相近或者相同时,这种人工智能就被称为类人人工智能;当人工智能拥独特的、自我的推理方式,且这种方式与人类思维方式不同时,这种人工智能就被称为非类人人工智能。前者的自主性很强,既可以按照事先设定好的程序行动,也可以在特定条件下根据情况自己决定任务和方式。
1.3 人工智能的应用
人工智能是综合了多种学科领域的一门新兴学科。它目前主要应用在三个方面:一是智能检索。与传统检索不同,智能检索是结合了人工智能的新型检索方式。它即可以像传统检索那样快速地检索并对相关的内容进行排序,还可以对用户角色进行登记、自动识别用户的个人兴趣,并对内容的含义进行理解、智能信息化过滤和推送,使信息的搜索更加的个性化。二是模式识别。模式识别不仅对科学研究有所帮助,还极大地方便了人们的生活。目前,模式识别已在测绘遥感领域发挥了一定的作用。在文字和语音的识别中,模式识别也是非常重要的一种技术。三是智能推理。我们熟知的下棋程序就是其中一个典型的例子,在下围棋的过程中,人工智能不仅能较好地解决问题,还掌握了大量假设、推理和直觉的技巧。除此之外,人工智能在方法面面都发挥了巨大的作用。从人脸识别到国家安全,人工智能给我们的生活与工作带来了极大的方便。
2 人工智能的应用
“微软小冰”是微软(亚洲)互联网工程院基于2014年提出建立的情感计算框架,通过算法、云计算和大数据的综合运用,采用代际升级的方式,逐步形成向EQ方向发展的完整人工智能体系。作为微软人工智能三大全球产业线之一,它的产品形态涉及到各种层次,如可对话的智能文字聊天机器人、智能語音助手、人工智能创造内容提供者和一系列垂直领域解决方案[3]。
2.1 “微软小冰”的主要交互系统及其技术原理
微软小冰的交互系统主要分为文字对话系统、图像识别系统和语音合成系统三大系统,它们的主要交互方式和原理如下。
2.1.1 文字对话系统及其原理
微软小冰的文字对话系统是接受用户发出的自然语言信息并进行处理,随后再生成语言进行反馈回复的系统。而在该系统中主要用到了自然语言处理技术和自然语言生成技术等技术[4]。
自然语言处理技术(NLP)主要是使计算机识别书面文字,或是从将语音信息转化为文本,或是从文件中读取相关的信息。随后再针对信息的含义去执行对应的动作[5]。目前NLP已经被应用到了许多地方。例如,智能手机上的智能语音助手用它来处理我们发出的语言信息,谷歌亦用它来了解用户所查询的内容的更深层的含义。这意味着它能识别出我们以不同方式提出的问题,但这并不等同于它就能完全地理解我们人类的语言。它只是能接受我们发出的信息并做出相应的回复,这种反馈机制的深度是有限的,所以我们并不能期望能与它们进行一定深度的对话。
2.1.2 图像识别系统及其原理
图像识别技术是人工智能研究中的一项很重要的技术。从第三代开始,微软小冰增加了这项技术的应用[6]。从文字识别到图像处理识别,再到物体识别,图像识别技术经历了漫长的发展。在面对大量的图像信息时,人的肉眼往往难以分辨,但图像识别技术可以识别和处理大量的文字信息,能有效地解决人的肉眼识别率低的问题[7]。
其实图像识别与人眼识别在本质上是一样的,只不过机器没有人的情感和意识罢了。人脑在初次看见一张图片时,会立刻对其特征进行分类,寻找有没有具有相似或相同特征的图像。或许我们并没有察觉,但我们的大脑一直都在做着这些事情。并且,人脑在第一次看见一张图片时,会立刻在大脑中搜寻以前有没有看见过该图片或类似的图片,所以人脑对图像的识别和处理具有相似性。计算机也是如此,在识别和处理图像信息时,它通过对图像的关键特征进行识别和提取,从而达到图像识别和处理的目的。所以若图像的特征比较明显,计算机的识别效率就高,反之,若图像的特征不明显,那计算机的识别效率也就会降低。
2.1.3 语音合成系统及其原理
语音合成系统,就是将文本转化为语音的形式输出,从而使人工智能像人一样可以正常交流。它包括了多个学科技术,像声学、语言学、数字信号处理、计算机科学等,在我国的信息处理领域是十分先进的。为了更好的合成高质量的语音,合成的过程中不仅要遵守多个规则像语义学的规则、词汇的规则、语音学的规则等,还要较好的理解文本的内容。
然后还要针对文本进行一系列的处理。首先,要进行语言处理。语言处理主要被用于模拟、还原人类在语言运用时对自然语言的处理与理解过程,它包含文本的规整、词汇的切分、语法的分析和语义分析四部分内容。经过这一处理过程,计算机可以完全理解给定的文本。其次,要进行韵律处理。韵律处理的目的是规划音段特点和保障语句的自然度。最后,要进行声音处理,根据前面的处理结果进行语音合成,输出最终语音结果[8]。
2.2 “微软小冰”引发的舆论评价
伴随着微软小冰的出现,引发的问题也逐渐凸显。首先,不少网友反映在于小冰交谈的过程中小冰有时会使用不文明用语,造成不良的影响。其次,微软小冰的人物设定是一个女生,这可能会助长男性物化女性的心理倾向。并且我们如果与微软小冰交谈的过于亲密,或许就会对其产生依赖的心理,这就会使我们沉迷于廉价易得的虚拟关系,来逃避现实社会。
当然,小冰也有诸多好的方面。目前小冰在社会上已经具有了较高的名气,甚至还参加了一些综艺活动,在各个领域都有些成绩。不仅这样,它还有多种才艺,不仅发行了专辑,它的一些诗作也被《北京晨报》《长江诗歌》等报媒收录,还出版了专门的诗集《阳光失了玻璃窗》。除此之外,它在社交方面也表现地十分突出,不仅可以进行跨平台、多场景的语言交流和游戏互动,还可以与第三方合作平台进行定制化对接,在诸多软件平台中都表现出色[9]。
3 总结与展望
总的来说,目前人工智能的发展已经初见成果。就像微软小冰,它的文字对话系统,图像识别系统和语音合成系统等都已经较为成熟,虽然现在人工智能还不具有自主意识,但也在社会的许多领域发挥着不可忽视的作用。而如何让人工智能拥有自主意识则变成了人工智能发展的一道障碍,目前许多科学家都致力于让人工智能可以有自己的思想,这也是未来人工智能发展的一个重要的方向。
在致力于让人工智能更加智能的同时,還可以扩大人工智能的应用领域,让人工智能可以应用在更多的地方,比如说教育领域。人工智能教学在未来或许也是一个重要的应用趋势。
参考文献
[1]本刊编辑部.人工智能概述[J].保密科学技术,2017(11):8-9.
[2]邹蕾,张先锋.人工智能及其发展应用[J].信息网络安全,2012(2):11-13.
[3]陆飞.第六代微软“小冰”正式发布[J].计算机与网络,2018,44(15):73.
[4]蒋茜谦.人工智能已经掌握人类语言了吗[J].计算机与网络,2018,44(24):16-17.
[5]张建华,陈家骏.自然语言生成综述[J].计算机应用研究,2006(8):1-3,13.
[6]张文彬.微软小冰进化第三代拥有图像识别能力[J].计算机与网络,2015,41(15):14-15.
[7]陈银萍.基于人工智能中的图像识别技术的分析[J].信息与电脑(理论版),2019(1):165-166.
[8]冯哲,孙吉贵,张长胜,等.汉语语音合成的研究进展[J].吉林大学学报(信息科学版),2007(2):198-206.
[9]李枫,谢鹏飞.AI机器人媒介角色的拟人化现象与思考——以微软小冰为例[J].现代视听,2018(2):60-63.