基于特种设备知识库的AI交流机器人研究与设计
2023-03-16许文倩陈照春
许文倩 黄 栋 陈照春 林 娟
(福建省特种设备检验研究院 福州 350008)
当前,特种设备在人们日常生活以及各行各业的生产过程中是不可或缺的要素。然而在其生产和使用等环节中的隐患越来越多,每个隐患都将可能是酿成事故的风险,这给特种设备安全监管带来了前所未有的挑战[1-4]。因此,特种设备安全宣传教育工作任务尤为艰巨。调研发现,传统开展特种设备宣传教育的实践中,需要选择经验丰富、素质全面的人员进行专门培训来回答专业性的问题[5],投入的时间成本和人力资源成本不只是用金钱来简单估算。即使如此也难以做到统一、全面的答复所有问题。
随着人工智能的兴起,AI智能交流机器人使特种设备的宣传教育快速普及成为可能。因此,本研究将收集特种设备相关知识,结合特种设备知识的特点,选择自然语言分析归纳方法,建立领域知识库,弥补特种设备知识库接口空白。通过搭建的特种设备知识库,连接问答Web服务器,构建基于特种设备知识库的AI交流机器人,从而打造特种设备专属宣传教育工作的新模式。
1 特种设备领域库构建
AI交流机器人的核心在于如何智能化地模拟人类进行回答。目前AI交流机器人需要固定的行业领域知识库,如股票、游戏、电信、房产等,通过相应的知识库接口,使得AI交流机器人能够拥有交流或回复的功能[6-7]。由于当前特种设备本体描述的信息欠完备,未见针对特种设备领域的知识库,因此在构建特种设备问答过程中会导致实例层的信息较少,使得当前AI无法对特种设备相关领域问答进行解惑。为了完备问答体系,建立特种设备领域知识库,能力化、逻辑化和细致化对特种设备知识进行模块化描述。
研究首先通过网络信息,对市场监督管理局、特种设备检验研究院等相关专业知识网页进行的宣传科普以及问答平台进行分析,获取相关知识并以Excel形式汇总问答题库来源,部分网址如图1所示。
图1 特种设备相关知识库源
通过收集当前常见特种设备知识问题,类比其他行业知识库,以领域专家的经验、权威工具书、重要文献、学位论文、期刊论文以及公共互联网资源等的答案对特种设备知识库进行整合分析,知识系统构建如图2所示。
图2 知识库系统结构图
为了简化整合知识库体系,避免重复问答,研究采用思维导图对问答层级进行汇总,部分问答如图3所示。
图3 特种设备知识问答思维导图
通过知识图谱方法将八大类特种设备拓展分析,对思维导图信息进行分类整合,通过知识图谱模型来模块化描述现实世界中各种人或物之间的关系[6,8-9]。在知识图谱模型中使用节点来描述人或物,用节点之间的边来描述人或物之间的关系;每个节点和关系都可设置不同的属性进行区分。在知识图谱中节点和节点之间的关系构成了一个主、谓、宾的三元组[8-10]。设计特种设备独有的知识库,并采用Neo4j进行图谱整理以及语义分析[11]。
Neo4J为高级程序设计语言,程序提供API接口,并可执行Cypher查询命令,工作原理如图4所示[12]。
图4 Neo4J 数据库工作原理
通过Match命令查询出相连关系p1和p2,然后通过Create命令建立实体p1和p2的连接。构建如图5所示知识图谱结构,明确相关问题与答案体系,有序整理相关知识结构。
因此,在知识图谱构建方面,图谱以特种设备为中心,由八大特种设备为第二层级出发,通过收集的相关特种设备法律法规、结构、安全等常见特种设备相关知识以及常见问题对知识图谱进行初步整合,部分图谱如图5所示。研究提炼出相关特种设备领域问答928条,用于深入构建特种设备领域问答体系。
图5 特种设备问答知识图谱
2 交流机器人软硬件系统
研究构建的AI机器人对人类日常问答的流程归纳并进行类比模仿,并输出答案结果。人机交互软硬件系统流程具体细节如图6所示,主要可分为4个部分:语音识别、AI问答服务器连接、问答数据库搭建与电信号转声信号输出。
图6 特种设备知识库的AI交流机器人问答流程
2.1 软件系统设计
研究采用科大讯飞的AIUI语音识别软硬一体的解决方案,通过创建整合处理的知识图谱至自建独立账号技能库,并对问答语言进行分析[12-13]。
在语音识别方面,AIUI模块支持语义识别和离线识别[14]。语义识别属于在线识别,领域问题以在线形式在讯飞云端服务器进行处理。离线识别采用本地离线识别引擎进行识别,其识别能力弱于在线识别功能。本研究语音主控的设计采用在线与离线相结合的混合识别方法,音频将送到本地离线引擎和云端解析,并采用结果反馈优先顺序策略对问题进行分析。
此外,主控将添加已有的音乐、天气等日常知识库,并加入整合后的特种设备知识库,同步云端配置特种设备知识技能库,在系统中对关键字以及词语语义进行分析,如图7所示。以特种设备用途问题为例,输入相同问题的不同表述,系统将会分析问题语义并返回一段包含了语义分析结果的Json数据,如图8所示。系统调用其提供的接口并解析输出的Json数据,实现问答对接。
图7 语义分析案例
图 8 问答案例
2.2 硬件系统设计
硬件部分采用双麦识别响应方式,以阵列式输入音频,该方式具备功耗低、识别率高、响应迅速的特点。主要配有信号层处理、解码层处理和对接层处理功能,如图9所示[14]。
图9 硬件系统设计
从嵌入式硬件角度划分,分为电源模块、DSP数字信号处理模块、麦克风、扬声器、AMP语音放大芯片、MCU主控制器模块和存储器模块,如图10所示。电源模块包含实现锂电池充电管理所需的电源;采用DSP模块作为语音信号的专用微处理器,对语音信号进行算法识别与处理;通过双麦阵列式麦克风与扬声器实现语音数据声电转换;语音放大芯片主要实现语音电信号的滤波和编码功能,通过自动增益控制器作用实现远距离语音采集,经过内部多级放大电路得到稳定放大信号并对语音进行压缩编码,输给主控制器;MCU主控制器模块主要实现将语音放大编码芯片传输的语音文件写入存储器模块,并完成文件读写管理和工作模式切换等任务;存储器模块主要用于实现语音数据的存储和删除。
图 10 硬件设计
综上,在知识交流过程中,由麦克风输入语音音频,把语音转换为控制命令或文本,上传AI问答服务器并实现问答数据库连接,结果信息默认由串口部分输出,并将电信号转声信号得出答案解析。
3 结束语
研究构建的特种设备领域AI交流机器人完成了特种设备相关知识整合,建立特种设备专业知识库,融合自然语言处理技术,填补在AI交流领域特种设备知识库的空白。
通过基于特种设备知识库的AI交流机器人在特种设备安全宣传教育领域的应用,有效提高特种设备安全宣传教育的趣味性、影响力、针对性以及有效性,对提高设备安全宣传教育质量以及提升我国特检队伍形象具有重要的意义。