2018年版SNOMED CT国际药物模型体系简介
2021-02-21陈超高博乔幸潮刘丽红朱彦王志
陈超 高博 乔幸潮 刘丽红 朱彦 王志
摘要:目的 对新版医学系统命名法-临床术语(Systematized Nomenclature of Medicine - Clinical Terms,SNOMED CT)中的国际药物模型进行介绍,为我国药物模型的构建提供参考。方法 对2018年7月更新的SNOMED CT国际药物模型的设计理念、药物分类体系进行介绍,并以含氨氯地平和阿托伐他汀的口服药片为例,将其在模型中的结构进行演示。结果 新版国际药物模型中,提供了更加完整的临床药物信息,包括药物充分和完整的描述,新增和调整了强度、强度物质基础、单位属性,使得产品层次结构可以完全由描述逻辑分类器推算出来。结论 SNOMED CT国际药物模型将药物进行汇总,便于相关行业进行查询、参考,对于我国药物模型的构建有很大启发,对公共突发事件、药物警戒、药物研发等有一定帮助。
關键词:医学系统命名法;临床术语;药物模型
中图分类号:R917 文献标识码:A 文章编号:2095-5707(2021)01-0013-05
医学系统命名法-临床术语(Systematized Nomenclature of Medicine - Clinical Terms,SNOMED CT)由国际卫生术语标准制定组织(IHTSDO)进行维护,其内容包括临床所需的大部分基本信息,如药物、疾病、解剖部位等,要求最大限度地保留各种类型临床数据中的信息(语义),特别是一些非结构化信息,使计算机可以在临床相关的不同学科间对数据进行处理。SNOMED CT每半年更新1次,更新内容包括概念、知识模型、药品模型等。本文对SNOMED CT中新的药物模型进行简要介绍,为我国药物模型的构建提供参考。
1 SNOMED CT简介
SNOMED CT是目前国际上较为全面、复杂的一种医学临床术语集[1]。SNOMED CT基于本体的理念构建,主要由概念、描述、关系构成。概念:按层级结构组织的具有临床含义的概念,每个概念包括数字型标识符、特指名称和描述。描述:用于描述概念在相关(语言)版本中的各种形式,即同义词。关系:概念与概念间的关系。目前SNOMED CT主要包括19个顶层概念:身体结构、临床发现、环境和地理定位、事件、观察对象、有机体、药物/生物制品、物理力、物理对象、操作、限定值、人为记录件、语境、社会环境、特殊概念、标本、分期与等级、物质、SNOMED CT模型组件。
SNOMED CT的药物/生物制品这一顶层概念轴设计目的主要包括4个方面:⑴促进药物概念的国际间相互操作性;⑵为成员国开发医药产品术语集提供基础;⑶支持药物研发、分析,为药物应用提供决策支持;⑷实现医药数据有效检索,监控观察临床用药,及时处理药物警戒等,也便于各个国家间数据的集成、整合与挖掘。
2 SNOMED CT国际药物模型设计
2.1 设计理念
2018年7月发布的SNOMED CT国际药物模型中,针对目前药物模型中存在的问题,做出了相应的修改。具体修订有3个方面:⑴新的定义:新版药物模型中,将药物定义为必要和充分条件,这使得模型开发人员能够基于推理机自动检测不一致性和推断层次结构;⑵新的语义类型:原版本中只有“产品(product)”一种,新版本将其拓展引入了“临床药物(clinical drug)”“医药产品类型(medicinal product form)”和“医药产品(medicinal product)”;⑶新的属性:新版药物模型引入新的药物语义类型,需要创建新的属性来支持。这些属性包括倾向性、剂型、活性成分、精确活性成分、强度物质基础、强度(分子值、分母值、分子单位和分母单位)[1]。国际药物模型见图1。
2.1.1 语义类型和关系 新版药物模型保留了物质(化学或生物实体)和产品(人造物体)的关系,即物质是产品的成分。例如,含有阿托伐他汀(物质)的药物(产品),阿托伐他汀为其活性成分。新版药物模型修正了基本成分与盐或酯类修饰的关系,引入了新的修饰关系“是……的修饰”(738774007 | is modification of (attribute) |),用来取代“is a (attribute) |”在物质与修饰之间的关系。这样能更准确地表达基本成分与其经过修饰的物质之间的关系,以阿托伐他汀为例,如图2所示。
2.1.2 药物的定义属性 新版药物模型增加了3个主要属性,从而对药物进行完整和充分的定义,即:强度、强度物质基础和剂型。
2.1.2.1 强度(presentation strength) 为药物提供完整和充分的描述,以支持自动推算。在新版药物模型中,将药物的强度基于结构化组成拆分为多个元素(分子值、分子单位、分母值、分母单位)进行表达,见图3。
2.1.2.2 强度物质基础(basis of strength substance) 是临床药物中表现出强度的物质,与有效成分物质相对应。例如,含1 mg/mL去甲肾上腺素的常规释放液产品,其精确活性成分为去甲肾上腺素酒石酸氢盐(norepinephrine bitartrate),强度物质基础为去甲肾上腺素(norepinephrine)。
2.1.2.3 剂型(dose form) 遵循2017年国际标准化组织(ISO)颁布的《卫生信息学-药品鉴定-数据元素和结构》(Health Information - Identification of Medicinal Products - Data Elements and Structures)中所包含的概念模型,将剂型与单位进行了区分。
2.2 药物的分类体系
新版药物模型对药物分类体系进行重构,确保类别内的药物具有充分且必要的条件,利于描述逻辑(Description Logic,DL)分类器进行维护。新的药物分类体系有4种模式。
2.2.1 倾向性 SNOMED CT概念倾向性(726711005 | disposition (disposition))需通过37个直接子概念理解。这些子概念中,有酶、酶激活剂、酶抑制剂和受体阻断剂等。例如,含有血管紧张素转换酶抑制剂的产品,其活性成分为对血管紧张素转换酶有抑制作用的物质,其倾向性为血管紧张素转换酶的抑制。当某种物质中的成分有此类倾向时,该成分就会被自动归类到此产品类别。
2.2.2 化学结构 如含有氨基糖苷类的产品,其活性成分为氨基糖苷类,当物质中的成分含有此化学结构时,该成分就会被自动归于此产品类别。
2.2.3 治疗部位 如制造为肠外制剂的产品,其制造剂型为肠外制剂,治疗部位为肠道外。当产品具有此类制造剂型时,就会被归于此产品类别。
2.2.4 治疗作用 对于一些特定药物,其定义属性包括治疗作用和作用机制,如含有抗疟药的产品。对于这类情况,其治疗作用等同于倾向性;另一种情况,治疗作用反映了卫生保健的文化和实践,此类治疗作用不会得到所有监管机构的普遍承认,是一种非定义特征。目前,治疗作用下的药物治疗类别仍在开发完善中。
2.3 模型示例
新版药物模型提供了更加完整的临床药物信息,包括药物充分和完整的描述,新增和调整了强度、强度物质基础、剂型,使得产品层次结构可以完全由DL分类器推算出来。以临床药物氨氯地平和阿托伐他汀口服药片的层次结构为例,其在SNOMED CT药物模型中的结构见图4。
3 中国药物术语集构建现状
陈颖等[2]选取截止到2012年11月26日的188 079条国产药品数据,分别在概念、语义关系、属性方面进行设置。概念以剂型,活性成分,生产单位,剂量,商品名,带剂型的临床药物名称,带商品名的药物成分和剂量、剂型、厂家等表示;属性继承来源表国家食品药品监督管理总局(CFDA)中厂家的属性;语义关系以概念之间的关系构成一个语义网络。Wang等[3]参考RxNorm规范命名系统,利用自然语言处理技术构建了中文临床药物标准知识库,该库以CFDA、中国医保药物数据、《中华人民共和国药典》、医院信息系统中药物数据为数据来源。首先基于自然语言处理技术将原始记录中的属性值抽取出来;其次,基于语义相似与领域知识,将挑选出来的属性值以中文RxNorm标准进行转化;最后,在临床和商品药物名称层面上组织药物并产生各种组织关系。
4 SNOMED CT国际药物模型对中国药物术语集构建的启发
SNOMED CT国际药物模型对于中国药物术语集的建立具有很好的示范和指导作用,如在结构、概念体系、语义关系方面的设计。这样既可以做到条理清晰、机构合理,也可以避免大量人工操作。但是中国药物术语集有自己的特点,包括中医特有的药物、剂量转化等,要做出相应的处理,就需要针对实际情况合理设计[4]。
中国药物术语集构建,可将药物-药物间、疾病-疾病间相似性结合,构建分类特征,以达到通过基因表达谱实现疾病的个性化表征。这种算法能够较为准确地预测药物-疾病的关联性及其与相应药物靶点的组织特异性。中医的整体思想体现在宏观层面,而组学技术则是基于综合分析的重新整合。在已有的中医临床术语系统基础上[5-7],构建中国药物术语集,形成涵盖基因、疾病、方剂、中药及不良反应等不同节点的数据网络,将有助于进行中医个体诊疗和精准医疗研究,促进中医发展。
中国药物术语集在建立过程中,尚有很多需要解决的问题。首先,中医古籍中存在着大量传统药物、方剂,要做好挖掘工作,找出效果显著的方药与现代中医学接轨;其次,我国特有的中成药、中药制剂等,需要在编码、语义类型、有效成分、剂量、强度、剂型等方面进行相关设置;最后,我国药物本着“衷中参西”的原则,存在中药与西药同时处于同一个药物中的情况,对于其成分设定需要进行处理。
由此可见,中国药物术语集的建立既要与国际药物术语集接轨,也要最大程度上保存我国特有药物的信息,在属性和语义类型的设定上,仍需要进一步的探索。
参考文献
[1] SNOMED International. July 2018 SNOMED CT international edition member release available to SNOMED international members[EB/OL].(2018-07-30)[2020-05-10].https://confluence. ihtsdotools.org/display/RMT/2018/06/30/July+2018+SNOMED+CT+International+Edition+Member+release+available+to+SNOMED+International+Members#app-switcher.
[2] 陈颖,李姣,李军莲.中国药品数据的知识表达方法研究[J].现代图书情报技术,2013(6):9-15.
[3] WANG L, ZHANG Y Y, JIANG M, et al. Toward a normalized clinical drug knowledge base in China-applying the RxNorm model to Chinese clinical drugs[J]. Journal of the American Medical Informatics Association, 2018,25(7): 809-818.
[4] 董燕,賈李蓉,朱彦,等.2013版SNOMED CT顶层概念调整及属性关系[J].中国医学创新,2014,11(3):106-108.
[5] 贾李蓉,刘静,刘丽红,等.中医临床术语系统v2.0病证分类体系构建研究[J].中国中医药图书情报杂志,2018,42(5):8-12.
[6] 朱彦,贾李蓉,高博,等.中医临床术语系统v2.0设计与构建[J].中国中医药图书情报杂志,2018,42(3):10-15.
[7] 朱彦,乔幸潮,崔一迪,等.中医药文献语义标注系统研究与开发[J].中国中医药图书情报杂志,2020,44(3):5-8.
(收稿日期:2020-06-16)
(修回日期:2020-07-13;编辑:郑宏)