APP下载

小儿肺炎喘嗽本体知识库构建研究

2022-01-19万润之孙丽平王延博李雅馨

中国医药导报 2021年36期
关键词:类目知识库实例

万润之 孙丽平 王延博 李雅馨

1.长春中医药大学医药信息学院,吉林长春 130117;2.长春中医药大学附属医院儿童诊疗中心,吉林长春 130021;3.长春中医药大学中西医结合学院,吉林长春 130117

20 世纪90 年代本体概念被引入人工智能、图书情报和知识工程等领域,一度成为这些领域的热门研究课题。近年来,关于本体理论和技术的应用逐渐扩大到医学领域,其关注度也不断提升[1]。如朱玲等[2]构建了哮喘疾病本体和功能性胃肠病领域本体,对哮喘领域知识体系和肠胃病知识库进行重新组织和表示,王明强等[3]利用Neo4j 存储资源描述框架模型,实现中医皮肤病“疾病-证候-治疗”领域本体的具体认识及规范化表达,郭梦莹等[4]利用“领域本体七步法”探讨中医辨证论治知识库构建的应用。本体在医学领域的发展为疾病本体构建提供了方法基础[5-6],对于不同疾病的病因病机、发病机制、辨证论治、治疗方法等的理解与学习具有积极意义。

肺炎喘嗽是小儿时期常见的肺系疾病之一,以发热、咳嗽、痰壅、气急、鼻煽为主要症状。清代汪昂《汤头歌诀·泻白散》首次提出“肺炎喘嗽”之名[7],对比西医治法,中医治法同样有很好的效果[8]。本研究基于本体构建方法构建肺炎喘嗽本体知识库,并进行推理验证,实现了可视化查询。

1 本体的构建

1.1 知识范畴

资料来源包括中医儿科学教材、小儿肺炎喘嗽中医诊疗指南[9]、小儿病毒性肺炎中医诊疗指南[10]、儿童肺炎支原体肺炎中西医结合诊治专家共识[11]以及名老中医医案[12],术语的标准化参考中国中医药学主题词表[13]。

1.2 构建方法

使用Protégé 5.5.0 对网络本体语言(ontology web language,OWL)进行完整阐述,采用本体构建七步法[14]构建本体,并使用推理机Pellet 进行一致性检验。见图1。

图1 构建肺炎喘嗽本体流程

1.2.1 类和类目 类是本体的核心。图2 为知识库中抽取的可以用于本体构建的肺炎喘嗽的类和类目,该统计共分为四级类目,一共7 个一级类目,并按从上而下的方法构建类和类之间的关系。

图2 小儿肺炎喘嗽类目图

1.2.2 类的属性 构建类的属性需要区分类的对象属性和数据属性。对象属性使用英文表示,并在注释中添加中文注释,如“肺part_of(是…的部分)患者”。创建与其相关的逆属性(inverse of),如“表现出”(show)和“是...的表现”(reflect),同时限定其定义域(domain)和值域(range)。构建的对象属性如表1 所示,在Protégé 中构建对象属性。数据属性是一个类或实例的数据值,如“某儿童的年龄为4 岁,体重17 kg,体温38℃,血氧饱和度>0.96。”其中的个体儿童、体重、身高、脉搏血氧饱和度为实例的数据属性。图3 展示了在Protégé 中创建的数据属性、其定义域与数据类型,并为其添加备注与定义域、字符串类型标识。

图3 Protégé 构建的数据属性

表1 小儿肺炎喘嗽本体对象属性

1.2.3 实例 实例也称个体,是指类的成员个体。例如图4 在对象属性栏中选择“has component”(由…组成)与每一项组成方剂的中药相联系,在数据属性栏选择“method of foumula”(方剂使用方法)和“strength of recommand”(推荐度)两个属性,并为其添加“日1 剂,水煎服,早晚分服,每次25~40 ml”和“强推荐”的属性,在注释栏添加加减情况,这样就构成了“银翘散合麻杏石甘汤”的实例。

1.2.4 一致性检验 本体推理检验是判断类的从属关系是否正确,实例是否属于该类,如本体具有一致性,则会根据语义关系推理出“中药”没有设置的属性,如果不具有内在逻辑的一致性,则会报错。使用推理机插件Pellet 进行推理检验,根据推理得出,中药类中的实例“连翘”组成了“三拗汤合葱豉汤”和“银翘散合麻杏石甘汤”,该本体通过了内部的一致性检验。见图5。

1.3 知识库可视化

1.3.1 工具 Protégé 自带的可视化功能易造成图像重叠[15],并且不适合复杂网络的可视化,数据驱动文档(data-driven documents,D3.js)库是一个基于数据的JavaScript 库[16],能高效地操作基于数据的Web 文档,实现数据可视化。WebVOWL 是一款本体可视化编辑器[17],本研究使用D3.js 库,并将本体通过WebVOWL展示。

1.3.2 可视化方法 使用Java 开发工具包并为其配置环境变量,将Protégé 中构建的本体文件导出为OWL文件格式[18-20],使用Java 项目管理工具Maven[21-22]构建肺炎喘嗽本体项目的Jar 包。最后,在命令中部署好D3.js[23-24]包,将json 的本体文件导入WebVOWL 中完成可视化。

1.3.3 可视化结果 肺炎喘嗽本体类和类目可视化的结果如图6 所示,图中肺炎喘嗽为中心,线段上的注释为本体的对象属性,灰色图块的注释为数据属性和数据类型,“Thing”为实例的集合。部分肺炎喘嗽本体实例的可视化结果如图7 所示,图中可以清晰看出类、实例的关系,如中医证型-常证-风热闭肺证、方剂-银翘散合麻杏石甘汤、中成药-小儿肺热咳喘颗粒之中,可看出证型和方剂、中成药的联系。

图6 肺炎喘嗽本体类和类目可视化图谱

图7 肺炎喘嗽实例可视化图

2 讨论

在儿科领域乃至中医领域都较缺乏本体技术、计算机语言等新兴应用的研究。构建小儿肺炎喘嗽本体知识库难点在于对众多权威诊疗资料、多版本教材中信息的提取,在如何利用本体和计算机技术相结合上提供技术支持。

本研究采用本体工具Protégé,使用OWL 语言定义、整理小儿肺炎喘嗽专家诊疗指南等权威资料提取出的31 个类、17 个对象属性和6 个数据属性,并可以自主的为其添加实例,类和实例都有明确的定义,并通过本体一致性检验,使用Java 程序语言的D3.js 库实现可视化功能和交互功能,通过创建的本体规则进行本体推理或为其添加新的实例,可以通过推理得出新的规则。

本研究在实现知识数据结构的标准化和规范化的基础上展望未来,将来可以发展成为检索、推荐、问答和决策服务等各种语义服务的主要知识库,并在未来形成儿科系统疾病本体、儿科疾病专家诊疗系统等。

猜你喜欢

类目知识库实例
本期练习题类目参考答案及提示
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
高速公路信息系统维护知识库的建立和应用
基于Drupal发布学者知识库关联数据的研究
《中图法》第5版交替类目研究综述
黄三角、长三角、珠三角明、清及民国通志一级类目比较*
完形填空Ⅱ
完形填空Ⅰ
DDC22与CLC5化学类目映射分析
位置与方向测试题