基于本体知识库的智能辅助检疫系统研究
2021-01-20李颖智
周 艳 李颖智
(1、湖北国际旅行卫生保健中心(武汉海关口岸门诊部),湖北 武汉430070 2、文华学院,湖北 武汉430074)
1 概述
随着经济全球化步伐不断推进,国际贸易的迅猛发展,口岸的通关能力,直接影响着经济发展。2016 年7 月,国务院办公厅印发了《进一步简化流程提高效率优化营商环境工作方案》,明确要求将通关时长压缩为原来的三分之一[1]。2017 年7 月17日,习近平总书记在中央财经领导小组第16 次会议上要求各部门改善外贸自由化、便利化条件,切实解决进出口环节制度性成本高、检验检疫和通关流程繁琐的问题[2,3]。
可见,提升检验检疫通关效率已然成为企业和政府的强烈期盼,而检疫效率的提升有学者已经对通关监管的管理流程重组进行了研究,比如林光龙等[4]分析了自贸背景下实现出入境检验检疫高效与便捷;郭永泉等[5]通过矩阵博弈设计出海关与检验检疫区域通关的最佳方案;胡蓉等[6]通过建模和分析流程链,提出上海海关通关流程再造方案。
而随信息技术的发展,我们还可以利用人工智能和本体知识图谱相关技术来构造智能检疫系统来辅助人工检疫,提高检疫效率。本文正是研究针对目前人工检验中存在的问题,通过深入研究探索,进行了相关的理论研究和技术尝试,选择了通过建立通关货物本体知识库,与物流信息管理系统、智慧国检一体化监管系统和检疫通关管理系统等要相关系统的深度集成,开发出基于本体理论构建货物知识图谱的智能检疫辅助系统,实现检疫人员检前信息提醒、检中知识库提供的智能辅助决策功能。
2 智能辅助检疫系统
2.1 智能辅助检疫系统的架构
该系统是以本体理论构造的货物知识库框架为基础,通过互联网对采集的数据进行传输与计算服务的技术体系,具体的架构图如图1 所示。从图1 中可以看出智能审方系统包括接口层、存储层、服务层这三个部分。其中存储层包括数据库和智能知识推理引擎。
2.1.1 接口层
该层主要通过服务注册组件调用实时监控服务、数据提取服务,从物流信息管理系统业务系统中获待检疫货物基础数据,并调用映射规则服务和本体构建服务进行数据清理和融合半结构化的货物描述数据,同时生成本局部本体模型。该层主要用于获取智能系统所需的货物数据,并转换成本体模型。
2.1.2 存储层
图1 智能辅助检疫系统架构图
该数据库主要包括货物本体库、检验知识库、检验规则库和审核流程库。其中本体库主要存储各类货物的OWL 描述模式;检验知识库用于存储检验标准的属性描述信息和货物的关联信息;规则库主要存储各类检疫的对应规则;流程库主要存储本系统检验审核所能提供的各类流程服务。这四类库的独立存储有效的保证了货物属性和检疫服务的独立扩展。智能知识推理引擎,该层可以屏蔽系统数据存储的复杂性,使用户面对一个简单而统一的数据使用环境,将注意力集中在对本体检验使用情境服务的应用上来。该中间件通过货物本体生成器系统保证货物属性生成结构化货物本体数据;通过负载均衡器保证平台系统运行的稳定;通过消息队列保证平台运行的准确;通过轮询器来控制数据采集的运行频率。另外主要通过采集模块获取检验标准依据的基础数据;通过推理模块实现快速的货物智能检疫审核情境的构建;通过服务调度模块实现基础服务的应用。
2.1.3 服务层
该层主要将知识管理引擎所产生的结果以服务的形式提供给应用系统使用。其主要实现方式有Web Service、API、推送服务和检索引擎等服务方式。其主要内容是通过查询接口业务将货物的检疫审核结果信息传递给提出的应用。
2.2 智能辅助检疫系统的运行流程
智能辅助检疫系统是一个开放系统,该流程的核心是以现有的物流管理系统中货物基本信息为输入源,将各种信息元数据汇集到数据中心,构建货物本体图谱与检疫知识库进行关联实现智能辅助检疫审核的服务,该系统具体运行流程如图2 所示。
图2 智能辅助检疫系统的运行流程
从图中可以看到从物流信息系统中获取货物基本信息,构建货物本体图谱,通过与智慧国检一体化监管系统的深度集成,通过检疫知识库和规则库的提醒与监测,形成智能检疫审核结果,当出现风险时进行预警,提醒检疫人员重点关注。并对通过智能检疫的结果,人工检疫中心结合经验分析进行二次审核,对于确认的通过结果,可进入检疫结果数据流转到检疫通关管理系统进行后续通关流程。整个系统达到充分利用现有技术和资源,提高系统智能应用效果的目的。
3 智能辅助检疫系统关键技术
3.1 货物本体的构建
货物本体构建即是对检疫货物领域概念对非结构化的物流信息文本进行抽取,大致可分为以下几个过程:文件格式预处理、中文分词及词性标注、知识辞典构造、去掉相关停用词、领域相关度一致性计算等过程,主要的工作内容包括:
文件格式预处理:先对处方进行文本预处理,去除与货物检疫指标不相关的信息。
中文分词及词性标注:通过开源分词系统对货物描述内容进行中文分词以及词性标注。
知识辞典构造:为了提高中文分词的准确率,防止一些检疫领域的专业术语被切分为多个字符串,因此在中文分词的过程中,引入了检疫领域的知识辞典。
去掉相关停用词:对于处方中包含大量的结构性词语,比如助词、形容词、副词等,此类词语大多只是一些结构性词语,不能代表某一领域的主题,因此为了降低概念抽取处理过程中的计算量,设计停用词表,对其进行删除。
领域相关度一致性计算:采用统计算法和基于检疫领域知识辞典的概念正向最大匹配算法进行领域相关度一致度计算。
3.2 检疫知识库模型
检疫知识库包括三部分:一是政策文件库,进境动物相关法律、法规,海关进口报关单,双边检验检疫议定书,质检总局规范性文件,相关检验检疫行业标准,资质备案等相关资料;二是条件库,只有当每个规则都成立且其结论的权值大于预先设定的阈值时该规则才为真;三是动态知识库,包括用户在系统运行中输入的数据、系统推理用的规则、根据规则得出的结论,以及在解释用户提问时的运行过程记录等。
通过对上述内容的整合,我们在知识库中定义了Goods_desc 知识实体(如表1 所示)
表1 Goods desc 知识实体
通过上面的实体建模和实体关联后,就可以根据知识库向智能审核提供相应的匹配规则。就可以对种类繁多的货物建立监控目录,用于实现智能的检疫审核系统,从而快速实现货物的快速检疫指标审核。
结束语
论文针对在人工检疫过程中的效率问题,提出了利用专家思想的构建基于本体的货物知识库,并构建以此知识库驱动的智能检疫审核系统体系架构,同时给出了具体的应用流程和关键技术。该系统适用于口岸通过货物检疫等业务和管理部门,该系统可以极大的降低货物检疫的失误风险,提高通过关货物的检疫效率,因此,具有较高的研究与应用价值。
在后续的工作中,我们将进一步完善本体模型的自动构建和知识库的自我学习完善方法进行深入研究。