基于包装产业大数据知识图谱的智能问答系统设计
2018-03-07杨芳权
杨芳权
摘 要: 传统智能问答系统能够进行简单的问题答复,但对于问句信息比较相似的问题不能准确判别。基于此设计基于包装产业大数据知识图谱的智能问答系统。通过知识图谱问句映射进行问句信息框架设计,建立大数据知识图谱数据库,为问句信息的判别提供稳定的数据环境;将问句信息转化为eFAQ的判别语句,进行问句信息的理解;利用相似度计算判别相似问句信息的相似度,实现近似问句信息的判别问答。实验数据表明,设计的智能问答系统能够对相似问句信息进行精准的判别,并实现智能问答。
关键词: 包装产业; 大数据; 知识图谱; 智能问答系统; 相似度计算; eFAQ语句
中图分类号: TN911?34; TN919.3 文献标识码: A 文章编号: 1004?373X(2018)04?0143?04
Abstract: The traditional intelligent question?answering (Q?A) system can answer simple questions, but it cannot accurately identify the questions that have similar question information. An intelligent Q?A system based on big data knowledge map of packaging industry is designed. The question information framework is designed by using question mapping of knowledge map. The database of big data knowledge map is established to provide a stable data environment for question information identification. The question information is transformed into the eFAQ decision statements for question information understanding. The information similarity of similar questions is identified by means of similarity calculation to realize discriminating answering of similar question information. The experimental data shows that the designed intelligent Q?A system can accurately identify similar question information and realize intelligent question and answering.
Keywords: packaging industry; big data; knowledge map; intelligent Q?A system; similarity calculation; eFAQ statement
0 引 言
当前智能问答系统主要应用在一些开放领域以及特定领域,智能问答系统在开放领域可回答文学、历史、科研、新闻等多方面问题[1],在特殊领域能够回答制定好相关问题。智能问答系统能够识别处理问句语言信息,针对问句信息的提问,能够反馈出若干准确的答案,而不是传统应答系统反馈的大量相关信息。传统智能问答系统,在问句信息搜索引擎中,所反馈的信息准确性较差,面对专业问题与近似问句信息不能进行精准的判别[2]。针对上述问题,本文设计基于包装产业大数据知识图谱的智能问答系统。对系统框架进行设计,利用知识图谱问句映射进行大数据问句信息识别,建立大数据知识图谱数据库存储问句信息;把问句信息与eFAQ的判别语句进行转化,能够理解问句信息中的隱藏信息;使用相似度计算问句信息中的相似度,实现相似问句信息的判别问答。
为了保证该设计的有效性,进行实例分析结果表明,设计的智能问答系统,能够对相似问句信息进行判别,进行精准的问答反馈。
1 系统框架设计
大数据知识图谱为问句信息提供合理反馈信息,大数据知识图谱中包括对问句信息中语义、句式、应答信息等,同时也可对问句信息进行添加,大数据知识图谱的使用代替领域专家的评审,能够直接对问句信息进行数据性质的反馈[3]。本文主要利用大数据知识图谱问句映射实现智能问答系统的框架设计。
大数据知识图谱问句映射将问句信息分成多个类型,使用eFAQ(extended Frequently Asked Questions)语句进行判别,依据问句信息的内容,构建一个高频反馈的映射系统[4?5]。本文eFAQ语句判别过程与大数据知识图谱相结合,利用大数据知识图谱的特点保证问句信息能够进行精准反馈,同时eFAQ语句保证问句信息的单一性。系统将问句信息与答复信息分离,方便eFAQ语句判别阶段的判别,每一项信息都存储在大数据知识图谱库中,方便信息反馈调用[6]。
2 问句信息的转化
2.1 建设大数据知识图谱库
建设大数据知识图谱库,能将问句信息与eFAQ语句进行存储,同时为eFAQ语句判别过程提供一个稳定的数据环境。大数据知识图谱库构建过程将问句信息为主体,eFAQ语句信息表征信息作为支撑,本文在建设大数据知识图谱库中不仅保留了传统的问句信息分类方法[7],同时对问句信息按照识别内容完成主题分类。大数据知识图谱库可作为问句信息预处理,识别问句信息的特征,通过大数据知识图谱对问句信息进行句式语义分析,回避问句匹配数据计算,提升识别精准程度[8]。大数据知识图谱库总体结构如图1所示。endprint
构建的大数据知识图谱库将问句信息分为两层,方便反馈过程中的调用。这样的数据划分也将eFAQ语句判别过程分离开,这样继承了传统的问句分类方法的形式与优点,并且为eFAQ语句判别过程清理了数据环境,保证了eFAQ语句判别过程的准确性[9?10]。
針对问句信息的内容特征并依托问句句式进行判别性的隔离,结合传统的问句分类方法有辨别性地辅助判别语句,为实现eFAQ语句判别提供稳定的数据环境。
2.2 问句信息与eFAQ语句的转化
大数据知识图谱库建设后,需要把问句信息标识为eFAQ语句,结合终端问句语义与问答信息之间的匹配情况,进行问句信息与eFAQ语句的转化,其转化流程为:
1) 将提出的问句信息进行信息识别,将内置信息包含的语义进行语句代换[11]。
2) 分析对应的载入信息,扫描相应的eFAQ语句。如果未找到,跳至步骤4);找到,按照步骤继续转换。
3) 反馈扫描结果,更新问答执行指令进行应答句式匹配(记录每次匹配的结果),同时把本次问句信息记录入库,结束识别模块。
4) 扫描到的eFAQ反馈语句进行代换。将未找到对应eFAQ语句的问句信息进行入录,输出“暂无答案”[12]。
5) 把代换的问句信息推送到数据句式连接模块。
6) 当句式组建后,扫描eFAQ语句中的语义是否与问句语义相匹配,做句式判别。
7) 汇总转化信息,要求满足语义之间的转换,保证转化程度不低于83%。
8) 问句信息与eFAQ语义转化结束后,进入判别反馈阶段。
基于包装产业大数据知识图谱的智能问答系统,系统性能核心是问句信息的判别,直接扫描问句信息的反馈方法,反馈的信息具有一定的范围性。使用eFAQ语句进行判别具有单一性,在判别过程中,随着问句语义发生变化与变化,eFAQ语句能够进行一对一的信息反馈,并且在大数据知识图谱库中每项信息都是分离的状态,方便信息的反馈调用,提升智能问答系统的反馈速度。需要说明的是,为了保证eFAQ语句能够进行精准的判别,还需周期性地添加大数据知识图谱库中问句信息的对应eFAQ语句,并清除携带性数据的使用记录,具体过程在此不做阐述。
3 问句信息理解
对问句信息的理解能够更好解析、分类是问答信息,eFAQ语句判别结果直接影响问句信息的理解过程[13]。把问句信息理解过程以问句映射的方式映射到大数据知识图谱库中,在问句信息的理解解析过程中,eFAQ语句以对应映射形式进行语义理解,语义理解程度直接决定了问答系统的数据反馈程度。本文采用问句语义与eFAQ语句相结合的形式进行问句理解,总体流程如图2所示。
问句理解过程中,需要对问句句式进行解析,定义关键词以及关键语义,在类别的划分上将关键词进行提取,保证语义的特征性,方便进行问句信息的相似计算。
4 实例分析
4.1 数据准备
数据准备过程参考了常见问题分类体系数据,对CALIS虚拟系统中沉淀下来的135条问句信息,进行记录并汇总整理,剔除反馈的口语化表述内容信息、多条相同数据等。反馈数据应具备一定的标准化表达内容,结合包装产业大数据知识图谱,将包装产业问句信息以“线上”为基准,对提出的问题进行反馈。
针对包装产业反映的问题,传统问答系统进行问题回答过程中,CALIS虚拟系统会针对性地记录判别数据以及应答准确性,对于本文设计的基于包装产业大数据知识图谱的智能问答系统也同样记录。本文试验过程准备数据如表1所示。
4.2 实例演示与分析
从表2中可以看出,基于包装产业大数据知识图谱的智能问答系统对相似问句信息判定比较理想,但这只反映了系统功能的一部分。从总体上讲,本文设计的智能问答系统,在问句信息的反应上以及对相识问句信息的判别上都好于传统问答系统。
观察图3可以看出本文设计的智能问答系统的CALIS参数走势明显高于传统问答系统,CALIS参数是本文使用统计软件,能够对两种问答系统的反馈数据进行正确性的统计,CALIS参数越大说明正确性越高。
5 结 语
本文设计基于包装产业大数据知识图谱的智能问答系统。建立大数据知识图谱数据库,通过句信息转化为eFAQ的判别语句,进行问句信息的判别,利用相似度计算实现近似问句信息的判别问答。希望通过本文的研究能够提升问答系统的准确率。
参考文献
[1] 杜泽宇,杨燕,贺樑.基于中文知识图谱的电商领域问答系统[J].计算机应用与软件,2017,5(5):153?159.
DU Zeyu, YANG Yan, HE Liang. Question answering system of electric business field based on Chinese knowledge map [J]. Computer applications and software, 2017, 5(5): 153?159.
[2] 苏楠.基于知识图谱的国内外大数据比较研究[J].中国科技论坛,2016(7):142?147.
SU Nan. Knowledge mapping of the comparative study of big data at home and abroad [J]. Forum on science and technology in China, 2016(7): 142?147.
[3] 王文辉,吴敏华,骆力明.基于相似度算法的英语智能问答系统设计与实现[J].计算机应用与软件,2017,34(6):62?68.
WANG Wenhui, WU Minhua, LUO Liming. Design and implementation of English intelligent question?answering system based on similarity algorithm [J]. Computer applications and software, 2017, 34(6): 62?68.endprint
[4] 李佳,杨婷婷,刘伟.数字多媒体旅游咨询信息智能问答系统设计[J].现代电子技术,2017,40(12):66?68.
LI Jia, YANG Tingting, LIU Wei. Design of digital multimedia intelligent question?answering system dealing with travel advisory information [J]. Modern electronics technique, 2017, 40(12): 66?68.
[5] 俞思伟,范昊,王菲.基于知识图谱的智能医疗研究[J].医疗卫生装备,2017,38(3):109?111.
YU Siwei, FAN Hao, WANG Fei. Research on intelligent medicine based on knowledge graph [J]. Chinese medical equipment journal, 2017, 38(3): 109?111.
[6] 刘超,马东宇.智能问答的聊天机器人系统的设计与实现[J].信息技术,2017,45(5):176?177.
LIU Chao, MA Dongyu. Design and implementation of chat robot based on intelligent question?answer system [J]. Information technology, 2017, 45(5): 176?177.
[7] 詹川.大数据研究的知识图谱分析[J].图书馆论坛,2015,56(4):84?91.
ZHAN Chuan. Knowledge mapping analysis of research on big data [J]. Library tribune, 2015, 56(4): 84?91.
[8] 张峰,杨晓艺,刘奕湘.电力智能问答平台架构的研究与设计[J].中州煤炭,2017,39(7):193?195.
ZHANG Feng, YANG Xiaoyi, LIU Yixiang. Research and design of electric power intelligent question answering platform [J]. Zhongzhou coal, 2017, 39(7): 193?195.
[9] 王辉,郁波,洪宇.基于知识图谱的Web信息抽取系统[J].计算机工程,2017,43(6):118?124.
WANG Hui, YU Bo, HONG Yu. Web information extraction system based on knowledge graph [J]. Computer engineering, 2017, 43(6): 118?124.
[10] RAO Z Y, ZHANG Y X. Research on intelligent customer service system based on knowledge map [J]. Electric power information & communication technology, 2017, 5(67): 145?156.
[11] GANG S U, WANG J, LING W Q, et al. Design and implementation of intelligent transportation analysis system based on big data [J]. Computer knowledge & technology, 2015, 78(4): 123?200.
[12] TAO L I. Design of intelligent auxiliary teaching system based on knowledge grid [J]. Modern computer, 2017, 8(45): 77?80.
[13] DENG T, L? Y, YANG Y, et al. Intelligent design system of turbine blades forging die based on knowledge driven [J]. Forging & stamping technology, 2015, 56(4): 33?45.endprint