APP下载

一种基于知识图谱的数据检索与可视化方法

2020-04-20李磊鲁兴河康警予陈忠朱峰

计算机与网络 2020年5期
关键词:数据可视化知识图谱

李磊 鲁兴河 康警予 陈忠 朱峰

摘要:在现有的数据基础上通过本体构建工具建立起包括组织、人员及设施等本体概念,通过对本体间建立关系,利用本体概念下的参数关系构建实体知识图谱,为信息系统的数据资源利用提供技术保障。同时对需要支持检索的本体模型建立索引,并利用图谱间的关联关系,直观、高效地向用户展现检索结果,满足检索结果的个性化和智能化,从而更好地为决策提供支撑。

关键词:知识图谱;本体模型;数据可视化

中图分类号:TP391文献标志码:A文章编号:1008-1739(2020)05-61-4

0引言

知识图谱是在传统知识工程的基础上以及语义Web的发展中孕育并发展而来的知识表示技术[1],旨在描述客观世界的概念、实体[2-3]、事件及其之间的关系。知识图谱亦可被看作是一张巨大的图,图中的节点表示实体或概念,而图中的边则由属性或关系构成[4]。知识图谱已被用来泛指各种大規模的知识库,知识图谱技术逐步渗透到各个领域[5-6]。同时,随着作战保障和业务处理系统稳步发展,各类数据资源逐渐丰富,各领域军事应用需求的不断增长,作战指挥、作战保障和日常业务处理信息系统建设投入不断加大,各类作战保障和业务处理信息系统规模逐步扩展,积累形成了一批可用、实用的信息资源,成为构建知识图谱的重要支撑。

1知识图谱构建方法

基于本体模型构建知识图谱方法流程图如图1所示。

首先将存储在关系型数据库内数据构建成多个本体模型,然后利用原有数据库表内字段之间的关系构建本体模型间关系,完成现有数据架构下的数据关系图谱构建,接着获取本体模型下所有的实体数据,利用本体模型关联参数构建实体数据关系,形成实体数据关系网,最终将本体模型、实体数据和关系按照邻接表的方式存入到图数据库中,并实现基于图结构的索引技术,提高对图数据库中节点和关系的查找速度。

1.1本体模型构建方法

存在于数据库中的各基础和业务数据通常包含各种本体模型,如人员、设施及地名等,这些本体多以表为单位进行存储,本体之间的关系通过主外键进行关联。本文提供了一种配置化的本体模型构建工具,此工具首先获取数据库用户空间下的所有表结构,用户根据表的存储信息构建本体模型,再通过字段关联将关联信息加入到本体模型中,形成了多个独立的本体模型,使数据库使用人员能够迅速获取到数据库内的数据结构信息,然后根据需求进行数据访问。

1.2本体模型关系构建方法

人员本体与组织本体模型关系如图2所示。

本体模型构建完成后会形成多个独立的本体,这些本体之间存在诸多关系,这些关系在数据库中一般通过关联表实现,如建立一张人员与组织的关系表,表结构为人员内码和组织内码,一行数据就表示了某个人员的所属组织。本文提出了一种基于知识图谱的本体模型关系构建方法,步骤如下所示:

步骤1:选择需要建立关系的多个数据模型,模型的数量不定,如M1,M2,M3,……M。

步骤2:选择每个模型的关联字段,建立字段之间的关系,此关系可以是相等关系,如内码相等,也可以是其他复杂关系,如子字符串、取模计算等。

步骤3:将本体模型关系存入图数据库中,存入的信息包括本体模型的字段信息、参与关联的模型名称、关联的参数。

1.3实体关系构建方法

在本体模型关系构建之后,就可以根据关系参数构建实体关系,构建方法如下:

步骤1:对参与构建关系的每个本体模型通过统一的数据访问接口获取所有的数据。

步骤2:由数据库表中对于表的注释和对于表中字段的注释,将实体数据由英文属性名转为中文属性名,如组织实体中英文字段“zzmc”转为中文字段名称“组织名称”,使所有数据表现更为直观。

步骤3:将所有本体模型的实体数据存入图数据库中。

步骤4:利用本体模型的关联参数构建实体关系,例如对于组织、人员组织关系和人员这3个本体,如果某个组织实体的组织内码等于人员组织关系实体的组织内码且此人员组织关系实体的人员内码等于某个人员实体的人员内码,则在此组织实体和人员实体之间构建组织下属人员关系。

步骤5:重复步骤1~步骤4,直至所有的本体模型关系都完成对应实体关系的构建。

2数据检索与可视化方法

基于知识图谱的数据检索[7-8]是指通过语义检索[9],对大量数据进行过滤、分析和管理,实现搜索数据的结构化并且提供详细的主题相关信息,有利于建立数据间知识体系,理解各种实体概念以及它们的关联。本文创新之处在于构建了一套完整的从知识图谱构建到检索展现的系统,实现了对结构化数据进行本体构建、实体抽取、索引构建和检索结果展现的全流程可视化操作。

2.1方法体系架构

数据检索与可视化方法体系架构如图3所示,自底向上可分为数据源层、图谱及索引构建层和外部应用层。

猜你喜欢

数据可视化知识图谱
移动可视化架构与关键技术综述
大数据时代背景下本科教学质量动态监控系统的构建
可视化:新媒体语境下的数据、叙事与设计研究
我国数据新闻的发展困境与策略研究
基于R语言的大数据审计方法研究
国内图书馆嵌入式服务研究主题分析
国内外政府信息公开研究的脉络、流派与趋势
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的智慧教育研究热点与趋势分析