APP下载

聊天机器人问答系统发展探讨

2021-03-27

中文信息 2021年1期
关键词:聊天机器人用户

(中移互联网有限公司,广东 广州 510000)

引言

近年来,科学技术的不断进步,科技影响着人类生活的生活方方面面,与此同时,聊天机器人技术也随之发展,许多科技公司纷纷投入聊天机器人技术的研发,探讨聊天机器人技术,对于理解对话与问题和推进人机交流具有重大意义。

一、聊天机器人问答系统技术的背景

在互联网大数据时代,人们获取信息的主要来源是搜索引擎,作为搜索引擎的一种延伸,问答系统可依据用户输入的关键词提供一份明确的答案,问答系统可根据答题范围可区分为闭域问答系统和开域问答系统。开域回答设计的范围较广,回答也丰富多样,闭域回答的是用户提出的较为固定领域的问题。过去,被限制的数据资源导致问答系统多为闭域,同时系统为专门的任务而设置,因此也称之为任务式作答系统,深度学习技术与大数据的广泛应用的同时非任务型开域聊天机器人也随之发展,产业界和学术界也愈发关注聊天机器人相关技术。

21世纪是信息化与数据化飞速发展的时代,Nature在2008年推出《BigData》与Science在2010年推出《DealingwithData》,都充分证明大数据时代的到来,人们在大数据时代惯用数据形式时文本数据。文本数据主要由人类对话数据组成,人类每天大量的对话数据都经由互联网产生,聊天机器人的产生以对话数据为基础,如,在著名的社交网络豆瓣社区收集了豆瓣对话语料,是关于豆瓣用户真实而准确地对话文本数据,其中涉及一百多万种关于各种主题对话的问答数据。在经过人工的标示以后,可由聊天机器人广泛应用此语料。因而,聊天机器人相关技术的研究是由于大数据时代推进的。

二、聊天机器人问答系统发展现状

1.国内发展现状

聊天机器人技术在国内的研究尚未成熟,加之与国外的研究相比起步较晚。有两方面的难题需要解决,首先是语言造成的难题,由于在信息处理上中文的特殊性,在中文语言系统里不能直接运用国外优秀或已经成熟的研究成果。其次,对于语言处理机制的相关研究比较匮乏,例如相关的知识库、评价机制、语料库等。但由于当代科技进步,聊天机器人技术也随之有了较大的发展,与此同时聊天机器人技术在国内也有显著进展。微软于2014推出的聊天机器人小冰一举成为当年的热门话题,大量的语料相关资料累计于聊天机器人和用户的对话中。与此同时,由于在自然语言分析、深度神经网络、机器学习和大数据等方面技术的进步,微软公司又对小冰进行了升级修复,提高了小冰与人沟通对话能力。此后,其他企业研究机构也纷纷效仿,各种聊天机器人由此诞生,例如,公子小白、holoera、百度度秘等。

2.国外发展现状

在国外,聊天机器人相关研究比较成熟,许多科研机构和大学对于聊天机器人的研究都有较为深入的研究。对聊天机器人的研究最初可以追溯到一位著名英国数学家图灵于1950年在《Mind》上发表的论文《计算机器与智能》。“机器智能”的命题于这篇著名的论文中提出,关于计算机能否进行智能实验的方法图灵测试也在此文中提出。真正开发出世界上第一个命名为Eliza聊天机器人是在1966年来自麻省理工学院的科学家JosephWeizenbaum,Eliza可以对精神病人开展辅助治疗,此后聊天机器人的时代被正式开启。在一系列关于聊天机器人竞赛与人工智能竞赛的推动下,聊天机器人相关研究愈发受到科学家以及研究人员的关注,人工智能机器人ALICE在1995年诞生,获得了多项竞赛的奖项,并在修复改进以后,可实现用中文进行沟通对话。在线聊天系统Talk-Bot在1998年发布,促进了聊天机器人研究的发展。

在21世纪,科技的进步为聊天机器人的发展提供支撑,聊天机器人的市场不断扩大,更多企业商业巨头开始了聊天吗机器人的研制,例如,IBM沃森系统、谷歌的GoogleNow、苹果语音助手Siri、亚马逊的Alexa、Rasa等。Rasa作为聊天机器人,是一个基于机器学习实现多轮对话的开源机器人框架,包括Rasa-Core与Rasa-Nlu两个模块,Rasa-Core是关于对话管理的平台,它主要用于决定接下来及其该返回什么内容给用户,Rasa-Nlu是自然语言理解模型集合,主要包括实体识别、意图识别,将用户的输入转换为结构化的数据。

三、关键技术及未来发展展望

基于生成的技术和基于检索的技术是建构聊天机器人的主流技术,关于检索的聊天机器人研究的难点与热点是基于检索的多轮对话建模技术,因为模仿了人类学习语言过程的基于生成的对话技术而受到广泛关注。虽然聊天机器人问答系统在当代的发展尤为迅猛,但仍未达到相关用户和普及推广的要求,相关技术依旧面临着挑战,例如怎样用好未标注数据、如何在问答系统中加入常识库等。

笔者认为,基于现有聊天机器人应用情况与市场需求来看,其未来发展方向包括以下几个方面:(1)预训练,在问答系统中加入关于常识的部分,利用未标注数据,是未来的可行趋势之一;如google的bert的预训练模型为NLP带来里程碑式的改变。(2)通用模型,问答系统需要掌握处理多方面领域问题的能力,学会主动式学习和学习迁移是相关技术发展的趋势之一;(3)深度推理,未来聊天机器人需获取用户对话的真实含义,不再只停留于字面也是其发展需要突破的重要问题。

结语

本文在聊天机器人现有的发展成果上,对聊天机器人问答系统发展的背景、影响因素及国内外发展现状进行总结。聊天机器人是在大数据的催化下迅速发展的,并在当前信息化时代中具有良好的发展前景。就发展现状比较来看,国外的聊天机器人技术发展更为成熟,但是国内外相关技术的发展仍有需要改进的方面,其与理想仍存在一定差距,但只要继续加大研究力度,未来聊天机器人一定会朝着人类的多元需求发展。

猜你喜欢

聊天机器人用户
我就是不想跟你聊天了
敞开门聊天
关注用户
关注用户
关注用户
机器人来帮你
认识机器人
机器人来啦
认识机器人
如何获取一亿海外用户