APP下载

智能聊天技术在构建智慧校园信息平台的应用

2018-07-28钱春阳

电脑知识与技术 2018年11期
关键词:聊天语义机器人

钱春阳

摘要:针对目前智慧校园中的各业务系统之间的数据孤岛,以及访问缺乏统一平台入口的问题,提出了在移动互联网下使用智能聊天技术借助微信构建智慧校园信息平台。该系统使用基于语义分析的关键词提取技术构建聊天过程,使智慧校园数据信息的获取更加的智能化和友好化。

关键词:智能聊天;智慧校园;微信;语义分析;关键词提取

中图分类号:TP311 文獻标志码:A 文章编号:1009-3044(2018)11-0218-02

1 概述

随着当前信息化技术的发展,高校的信息化水平也逐渐提升,智慧校园建设也在各大专院校陆续展开。各种信息化数据系统是智慧校园构建中重要的组成部分,包括OA系统、教务系统、科研系统、邮件系统、学生信息系统以及校园内的各种论坛平台等,各院系部门之间也重复建设各种业务系统。这种情况的出现会导致各业务系统之间彼此信息孤立,给使用者带来诸多不便。

同时,随着智能化终端的大规模普及,以及类似于微信等即时通讯软件的广泛使用,利用先进的智能聊天技术来构建智慧校园信息平台就显得意义非常重大,该平台可以让校园里的使用者很方便地通过聊天技术获取各种数据,让移动终端成为智慧校园数据信息的入口,也有助于解决校园中各业务系统之间的数据孤岛问题。

2 智能聊天工具的选择

目前随着互联网的发展,聊天入口有很多种实现方式,可以借助实体机器人实现人机对话的智能聊天方式,也可以借助即时通讯软件,譬如QQ聊天或者微信公众平台的方式去实现。鉴于目前校园里的微信的普及,该智能聊天系统采用微信公众号实现聊天功能。采用微信公众号作为聊天工具有以下几个优点:一、微信用户庞大,校园里的教师,学生都是其使用者,不需要推广,并且采用微信公众号操作简单方便,容易上手。二、微信拥有比较完备的API文档,支持各种系统的接入功能,对于系统的开发更加方便,而且该智能聊天系统采用的图灵机器人也支持微信接口的接入,具备丰富的文档,便于系统代码的编写[1]。

3智能聊天过程设计

3.1聊天数据信息的分类

在聊天过程中,为了增加聊天的智能性与友好性,现将聊天数据信息分为两类,一种是无效数据信息,一种是有效数据信息。基于这两种不同的聊天数据信息,采用不同的处理方法。

1)无效数据信息

无效数据信息就是指在智能聊天过程中,产生的聊天数据经过语意识别后,不会调用智慧校园中业务系统的非有效数据信息。

为什么会产生无效数据?因为在整个智能聊天过程中,聊天信息是不能进行有效控制与屏蔽的,允许聊天数据产生者输入一些与智慧校园业务无关的信息。但是这部分无关的数据又不能因为其业务无关性而置之不理,或者采用极端的屏蔽行为,这就是无效数据信息产生的原因。面对无效数据信息,系统借助智能聊天工具-图灵机器人。

图灵机器人是个性化机器人的开放平台,可以为使用者提供智能聊天的API接口。图灵机器人基于DeepQA深度问答技术,对中文的识别准确率高达90%,是目前中文语境下智能化程度最高的机器人。图灵机器人的核心功能之一就是智能对话。智能对话是指,图灵机器人可赋予软硬件产品中文自然语言交互的能力。在当前的聊天系统中我们可使用图灵机器人的接口来处理无效数据信息的对话问题,让聊天系统更加的智能化,友好化。

2)有效数据信息

在智能聊天系统的构建中,除了无效数据信息就是有效数据信息,有效数据信息主要通过语义识别去分析聊天内容,并且将有用的数据提取出来,通过接口传递到后台业务系统,查询或者处理所需的数据。

对于有效数据信息,智能聊天系统采用语义分析方法的关键词提取去获取有用的关键词,然后与已存入的关键词进行匹配,如果匹配成功,就去查询对应的接口以获取业务数据。该处理方法借助语义分析法的关键词提取算法来完成整个聊天过程。

3.2 基于语义分析的关键词提取方案

目前关键词提取方案有很多,但是主要有三类:1)基于统计特征,如词语出现频度的统计;2)基于词语网络,根据相应的规则讲文字转换为词语网络,利用词语网络计算的关键度;3)基于语义,根据文字的语义特征提取关键词或者转换关键词。在对应当前的智能聊天系统中,很明显第三种基于语义特征更适合我们的关键词提取方案。本系统设计中,在智能聊天过程中选择采用了基于语义分析的关键词提取[2]。

该方案的关键在于可以将对应的关键词根据相似语义转换成系统对应的关键词以便于业务接口的数据传递。

例如:学生小A通过智能聊天系统查询自己的期末考试成绩,智能聊天系统简称小智。对话如下:

小A:你好

小智:你好(图灵机器人)

小A:我的语文课本在哪里?(此话是无效数据信息,但是有“语文”等关键词,需要通过语义分析进行判断)

语义分析过程:获取关键词:语文、课本、在哪里。智能聊天系统对这几个关键词进行分析,迅速将当前关键词与在系统中的关键词进行匹配,如果系统中能够匹配上,或者匹配多个,则将结果罗列出来。假设系统中匹配上“语文”关键词,有“语文期末成绩”,“语文期中成绩”两个接口信息,于是将两个接口名称都返回至聊天窗口。让小A选择:(1)语文期末成绩(2)语文期中成绩(3)都不是,如果小A选择(1)或者(2)则将对应的学期信息返回到聊天窗口让小A进一步选择学期,从而获取信息。如果小A选择(3)则自动跳转至图灵机器人进行回答。

小A:我想知道我这学期的语文期末成绩

语义分析过程:获取关键词:知道、这学期、语文、期末、成绩。智能聊天系统对这几个关键词进行分析,分为两类:

a.语文、期末、成绩,这三个关键词可以从系统中匹配。

b.知道、这学期,这两个关键词无法从系统中进行匹配。

此时,智能聊天系统迅速与系统中的关键词进行匹配,于是匹配上“语文期末成绩”这个接口,但是仅仅从“语文期末成绩”并不能通过接口获取对应数据,因为还有两个关键词没有使用,此时通过语义分析对关键词进行转换,用“知道”去匹配系统中的同义关键词并转换,可转换成“查询”关键词,用“这学期”去匹配系统中的同义关键词并进行转换,可转换成當前学期的数字信息,譬如201801,即2018年第1学期,也就是教学中的2017-2018第2学期。

于是,小A的聊天信息转换成:查询201801学期的语文期末分数。

然后再根据当前微信号在系统中注册的信息,获取学生学号。传至后台就是查询学号为*****201801学期的语文期末分数。根据对应的接口,将查询的信息反馈到小A的微信聊天客户端。至此通过智能聊天系统整个查询过程结束[3,4]。

从以上的聊天对话中可知,如果想要准确迅速通过智能聊天系统获取有效的信息,需要准确的传达聊天信息,避免系统返回一些无效信息,从而降低查询效率。

4 系统的设计与实现

智能聊天系统在智慧校园中包含两部分:一是移动端的微信公众号、另一个是后台管理系统。后台管理系统采用Java语言编写的B/S模式的管理系统,整个系统基于MVC开发模式,利用当前流行的SSM(SpringMVC+Spring+Mybatis)框架进行编写,页面采用Bootstrap前端框架,数据库采用mysql。聊天工具借助微信公众号,同时利用图灵机器人与基于语义分析的智能聊天技术完成聊天过程的设计。

4.1 聊天系统主流程设计

1)用户通过微信工具进行聊天,聊天内容通过语义分析平台判断聊天信息是否有效,如果是有效信息则转入智慧校园平台接口,去访问各业务系统,并将查询信息返回给微信客户端。

2)如果判断是无效信息,则直接通过图灵机器人响应到微信客户端。

3)如果无法判断,则直接进行匹配展现类似接口信息列表,让用户进行选择,如果都不是,则转入图灵机器人,如果选择其一则转入智慧校园平台(接口)去访问各业务系统,并将查询信息返回给微信客户端[5]。

4.2 模块的设计

基于智能聊天技术的智慧校园信息平台从用户的角色与所对应服务的角度考虑功能模块的设计。主要包括四大功能模块:用户管理、语义分析算法、关键词管理、接口管理。

用户管理:该模块包含用户名管理、角色管理,权限管理等。需要考虑用户注册信息与数据库的用户信息是否对应,以及所映射的功能权限分配。

语义分析算法:该模块功能是对输入的聊天信息进行判断,判断其是有效信息或者无效信息,还是无法判断。主要算法思想是对所输入信息根据语义进行分析转换,如果系统中不能对相关的关键词进行匹配,需要根据语义转换对应的关键词以利于接口的数据传递。

关键词管理:该模块包含接口关键词信息以及近义词转换信息。接口关键词是指我们预先设置的接口信息关键词,用来匹配用户输入的聊天信息。近义词转换信息是指对无法识别的关键词通过近义词转换成系统可以识别的关键词。

接口管理:该模块的功能是将处理过的聊天信息传递给各业务系统。由于智慧校园平台接入较多子系统,所以需要对每个子系统对应的接口进行管理。整个功能模块如图2:

4.3 基于智能聊天技术的智慧校园平台效果分析

由于微信的普及以及各接口文档较为齐全,微信与图灵机器人的数据传递,以及微信与后台管理的信息传递均较为理想。对于表述较为精确的聊天信息则可以迅速获取后台数据。但是语义分析平台对复杂语义的聊天信息判断则较为困难,很多复杂语义和有效信息、无效信息的转换不够准确,还有一些复杂语义实际上是无效信息,则经过语义平台的判断呈现较多接口的可能,实际上是降低了平台的智能化效果[6][7]。

5 总结

基于智能聊天技术的智慧校园信息平台基本上可以满足用户通过微信聊天方式对校园业务数据的获取,但是在语义分析的关键词匹配与近义词转换上需要进一步的研究,后期的研究方向上考虑在语义分析上加入人工神经网络的自适应学习模型进行近义词的转换,以提高语义分析的精确度,更好的为智慧校园的建设与发展服务。

参考文献:

[1] 杨晨.利用微信平台开发教学支持服务系统的技术实现[J].电脑知识与技术,2017(8):103-104.

[2] 王立霞,淮晓永.基于语义的中文文本关键词提取算法[J].计算机工程,2012(1):1-4.

[3] 徐杰.基于微信平台的财务代理系统设计[J].会计信息化,2017(1):1-4.

[4] 赵玲玲.基于 Android 的智能聊天机器人设计[J].现代计算机,2016(25):79-82.

[5] 姚飞.清华智能聊天机器人“小图”的移动应用[J].现代图书情报技术,2014(Z1):120-126.

[6] 邓媛.高校图书馆微信资源共建系统的设计与实现[J].图书馆学研究,2014(10):41-47.

[7] 腾讯. 微信公众平台开发者文档[EB/OL].http://mp.weixin.qq.com

猜你喜欢

聊天语义机器人
语言与语义
敞开门聊天
“上”与“下”语义的不对称性及其认知阐释
认知范畴模糊与语义模糊
语义分析与汉俄副名组合