APP下载

基于微信公众号的智能语音问答系统应用与研究

2019-02-12陆世尧

无线互联科技 2019年24期
关键词:语音识别微信公众平台知识库

摘 要:人工智能技术在高校的应用场景越来越多,其中,语音识别和智能问答技术的实现,使得计算机可以与人类通过自然语言的方式进行交流。微信公众平台具有大量用户和信息获取的便捷性,奠定了微信公众平台最佳且可靠的载体地位。文章基于微信公众号对智能语音问答系统进行研究。

关键词:智能问答;人工智能;语音识别;微信公众平台;知识库

1 高校建设智能语音问答系统的必要性

通过大量的需求调研发现:首先,高校内事务缺乏明确的办事流程,遇到问题不知道该找谁、需要什么材料、怎么办理;其次,学校有很多办事指南,但是不规范,也不知道如何整理维护,办事指南缺乏高效的触达通道,如何实现让师生便捷获取是需要解决的问题。校园的各类信息不统一,唯一获取信息的方法是到不同的地方、登录不同的系统进行相应的操作。即便通过多媒体数字终端查询,也存在着操作复杂、功能不全、使用率不高等问题。

人工智能技术在高校的应用场景越来越多,其中,语音识别和智能问答技术的实现,使得计算机可以与人类通过自然语言的方式进行交流。不仅如此,微信公众平台具有大量用户和信息获取的便捷性,奠定了微信公众平台最佳且可靠的载体地位。高校建设智能语音问答系统,不但为师生提供方便、快捷的校内资讯和信息咨询服务,而且从管理者的角度出发,还包含了更深层次的含义:(1)有利于统计和收集师生提出的各类问题,掌握师生目前的需求和所关心的问题,从而为师生提供更优质的服务。同时师生的需求和所关心的问题也能为学校的决策规划、政策制度的制定提供依据和参考。(2)有利于促进高校信息管理模式的变化,使得信息管理从松散型模式逐步转向集约型模式。智能语音问答系统必须有丰富的知识库作为储备,才能提供快速、精准的查询。目前知识是松散分布在各个平台中的,通过建设智能语音问答系统搭建知识仓库,有助于将松散的知识都集中起来进行高效且统一的管理。

本文依托南京城市职业学院作为实验环境平台,将该系统安装部署在了南京城市职业学院微信公众号中,目前已正式运行。该系统结合AI,通过大量校园语料及文本积累,建立符合高校的算法模型,帮助用户通过口语化语言获取校内事务。通过文献调查和问卷调查等多种方法,调研了在高校情景中,师生获取信息的途径及获取的内容,从而精准定位师生需求,再有针对性地提供帮助。随着人工智能在算法上优化和进步,智能语音问答系统不仅能在语言表述上获取表面信息,还能通过语义获取更深层次的信息,这种优化所带来的进步,也恰好给了智能语音问答系统生长的土壤与营养,使其生存下来。在智能语音问答系统的改革与发展下,越来越广泛地应用在如智能家居、智能客服機器人等方面,逐步取代了人工客服,越发引起了学术界和工业界的广泛关注。成熟的智能语音问答系统最终将帮助人类从大量重复性的劳动中解放出来,人类生产方式也会逐步改变,对社会的进步是无法预计的。同时,智能问答系统也是构建下一代智能世界不可或缺的一个重要角色[1]。

2 系统服务模式设计

互联网信息爆炸式产生,深度学习技术快速发展,大量的数据和革新的技术给新一代问答系统提供了发展的客观条件。与此同时,深层次的神经网络爆发式发展,用更深层的算法学习来获得更深层的自然语言特征,赋予了神经网络更加强大的学习能力,其强大的学习能力,使得问答系统得到了空前的关注。

2.1 智能语音问答系统处理框架

不同类型的智能语音问答系统在数据处理形式上是不一样的。智能语音问答系统需要解决3个基本问题:如何使计算机理解自然语言准确的语义,并在计算机中表现出来;如何选择最合适的回复答案;如何再将最合适的答案通过自然语言表现出来。

不同的智能语音问答系统在处理不同的任务时,各自有着不同的架构体系,依据各架构体系处理数据流的方式,可以分成3个模块:提问分析模块,检索模块、答案抽取模块[2]。

(1)提问分析模块,负责处理用户的问题,生成查询关键词,确定问题答案的类型以及问题的语义表示。

(2)检索模块,依据提问分析模块所转换的语句,采用深化理解和结果检索出备选答案。

(3)答案抽取模块,执行预先设计好的规则,对备选答案打分,返回出分数最高的答案选项。

2.2 智能语音问答系统的分类与技术

依据智能语音问答系统的任务类别来分,可分为两种:

(1)面向任务的智能语音问答系统,依据具体任务来安排实施,例如查询图书馆信息、成绩信息等。

(2)面向非任务的智能语音问答系统,主要作用是和人类进行自然语言的交流,例如和机器人对话[3]。

2.3 面向非任务问答系统的3种主要方法

(1)基于检索的方法,从事先定义好的数据库中,根据某种规则,选出最合适的答案。优点是通俗易懂、易于解释;缺点也很明显,非常依赖事先定义的数据库和检索算法,如果数据质量不高,那么很可能效果就很差。

(2)基于生成的方法,是当前研究领域的一个主流热点,通过理解提出的问题来生成适当的回复,典型的生成模型有seq2seq,transformer等。优点是不依赖定义好的数据库、可以灵活回复;缺点是容易生成一些无意义的回复和重复的回复等。

(3)基于检索和生成混合的方法,结合检索回复较为精确和生成回复较为灵活的优点,可以大大提升问答系统的回复效率和性能,是智能语音问答系统在实际中应用最多的方法[4]。

3 校园智能问答系统的设计思路

在校园环境中,成熟的智能语音问答系统离不开知识库的建设,校园知识库是领域信息的模型化表示。相应的技术难点在于如何理解用户的意图。需要对关键词进行准确的提取,考虑在校园生活中发生问题的重复、简单性,和现有的分词算法,基于字符串匹配的分词算法是比较合适的。在实际的高校环境应用中,为每个问题提供了至少两种以上的回复答案。从各个业务系统中收集到的专业性回复信息,再对问答库中的语句进去断句处理、语法处理、相似统计等,防止出现错误。最后根据微信公众平台提供的应用程序编程接口(Application Programming Interface,API)调用,更加准确地划分业务模块,减少各个模块之间的数据交叉,大大提高了模块的维护性,为知识库的扩展提供了便捷。

将智能语音问答机器人部署在微信公众平台上,用户在关注公众号之后,可以在公众号的对话界面通过语音提出问题,智能語音问答机器人就会开始自动识别问题信息,再通过对比知识库的数据,对命中的问题答案进行判断,再把命中的问题答案文字或者图片等形式发送给用户。若知识库中没有命中到合适的答案,智能语音问答机器人就会自动存档信息,再通过学习来不断丰富知识库。

4 智能语音问答知识库实现

4.1 校园信息的分类结构及其呈现方式

以南京城市职业学院作为研究对象,通过信息整合和信息分类,分析了校园信息的分类结构以及其呈现形式。

(1)信息的整合。将高校各业务平台的信息收集、整理到知识库后台,通过相应的智能搜索算法,把信息进行处理和筛选分类,再把结果信息显示到微信公众平台的聊天界面。

(2)信息的分类及分类方法。根据以上调研结果,校园信息分为在校教职工和校内学生两大类,每类又根据信息属性继续细分。

4.2 知识库构建与管理

(1)知识库构建,是校园信息知识库的重要设计流程。分类整理整个业务平台信息,确定横向线性流作为知识库的中心流,再有机结合横向流程和纵向模块,使其成为存在多种检索方式的知识库,并将其作为知识库建设的重要目标。

(2)知识库管理,是知识库的重要模块。采用模块化的设计方式,可以提高知识库的交互性,方便知识库的日常管理,让操作维护界面合理、清晰。

4.3 知识库的维护

提高知识库操作员的技术水平,可以让管理员们应对并解决各类知识库故障,提高运维能力。知识库不仅包含了知识的更新,还包含了知识库自身的系统更新。在知识库设计阶段,必须包含知识库未能检索问题的记录功能,后台运行维护人员会通过新增的记录更新知识库,保证了知识库数据的不断增长和完善。

4.4 知识库的评价

知识库的评价以知识库的安全、稳定运行为重要保障基础,以此保障、优化知识库的构建能力。加强知识库的运行维护以及日常管理同样重要,应该加强知识库日常巡检,改善知识库交互能力,构建高效、稳定的知识库,来保证本系统的安全运行。

5 结语

微信公众平台代表的是人类交流的一种方式,也代表了互联网的发展趋向。以智能移动终端为主的新媒体在未来会有巨大的发展潜力。人工智能作为一种新的载体不断传播和继承着高校文化,也在逐渐渗入师生们的工作、学习和生活中,不仅受到学生的追捧和青睐,还开辟了校园服务交流媒介的新纪元。在科技发展的新时代,智能语言问答是在获取校园信息方面的一次重要尝试,具有非常积极的意义。

基金项目:2019年江苏省高等学校大学生创新创业训练计划项目;项目名称:智能语音问答系统的应用与研究;项目编号:201914001004Y。

作者简介:陆世尧(1986— ),男,江苏南京人,工程师,学士;研究方向:软件技术。

[参考文献]

[1]胡蕊.大学生微信使用在高校教学中的应用前景分析[J].北京青年政治学院学报,2014(1):76-81.

[2]盛伟芳.校园微信公众平台运营策略研究[J].剑南文学,2013(2):326-327.

[3]王磊,邹铠同.微信公众平台在高校中的应用[J].电子技术与软件工程,2014(7):42.

[4]朱智强,朱广贺.基于微信公共平台的校园信息服务系统的研发[J].电子技术与软件工程,2015(11):87.

Application and research of intelligent question and answer system based on WeChat public

Lu Shiyao

(Nanjing City Vocational College, Nanjing 211200, China)

Abstract:The application of artificial intelligence in colleges and universities is more and more, among which, the realization of speech recognition and intelligent question and answer technology makes the computer communicate with the human being through natural language. WeChat public platform has a large number of users and information acquisition convenience, which lays the best and reliable carrier position of the WeChat public platform. This paper studies the intelligent question and answer system based on the WeChat public number.

Key words:intelligent question and answer; artificial intelligence; speech recognition; WeChat public platform; knowledge base

猜你喜欢

语音识别微信公众平台知识库
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
通话中的语音识别技术
基于微信的大学生微型学习平台的设计与实现
基于微信公众平台的碎片化学习研究
高速公路信息系统维护知识库的建立和应用
基于Drupal发布学者知识库关联数据的研究
位置与方向测试题