APP下载

中文临床医学术语系统分类框架设计原则与构建思路

2018-02-08

中华医学图书情报杂志 2018年11期
关键词:术语框架医学

术语是专业领域中概念的语言指称[1]。术语和概念的关系理想状态下应一一对应,但在实际应用中,同义词(表示同一概念的多个术语)和多义词(表示多个不同概念的同一术语)现象比比皆是。此外,概念间还存在诸如包含、序列、联想等丰富的语义关系[1]。临床医学领域中也是如此,临床实践过程中同一概念的表达形式不规范统一,同一术语的多义现象非常普遍,严重影响了临床信息的交互、共享和利用。因此加强临床医学术语的标准化建设,构建能揭示各类语义关系的概念术语体系,对提升临床信息的描述、组织、整合、共享和利用等环节的质量和效率具有重要意义,是推动临床信息标准化建设、支持临床决策、服务临床医学科技创新的重要支撑。

国外在临床医学术语标准化建设方面已经研发了《医学术语系统命名-临床术语》(SNOMED-CT)、《国际疾病分类与代码》(ICD-10)、《观测指标标识符逻辑命名与编码系统》(LOINC)等术语标准,并成功应用推广。我国的中文临床医学术语标准化建设虽然也取得了一些成果,但起步较晚,以引进翻译国外标准为主要模式。一方面受语种、知识产权、应用目标、服务环境等差异的限制,汉化版无法满足我国医疗卫生的实践需求;另一方面,国内自主研发的《临床检验项目分类与代码》、全国科学技术名词审定委员会(以下简称“名词委”)颁布的相关专业名词等术语标准,都局限于某个专科领域,同时在揭示不同概念间语义关系方面存在缺陷,影响了应用效果。

与发达国家相比,我国的临床信息标准还很少,尤其缺乏满足临床人员需要、计算机可一致识别的术语和编码系统,阻碍了临床信息的二次利用[2]。如何建立具有中国特色和自主知识产权的中文临床医学术语系统,满足电子病历标准化需求,并且方便卫生统计和管理、医保支付等不同系统间信息交互和共享,是当前亟待攻克的重要课题。因此,2017年中国医学科学院医学信息研究所牵头,联合医科院北京协和医院、公共卫生学院和肿瘤医院多家单位,共同申请了“中文临床医学术语系统构建研究”项目,并获准作为中国医学科学院“医学与健康科技创新工程重大协同创新项目”正式立项,以期能尽快填补国内临床术语标准领域的空白。

建立术语系统的首要前提是对系统的分类框架进行总体设计。本文将从中文临床医学术语系统分类框架的设计原则和顶层概念类的构建思路两方面论述。

1 设计原则

在充分调研国内术语工作相关标准和规范的基础上,以术语学基本理论为指导,结合已有的术语工作经验,为中文临床术语系统分类框架拟定了如下7个设计原则。

1.1 目标性

构建任何一个概念术语体系,都应首先明确目标,确定相应的专业领域,面向特定的用户需求,解决实际应用场景中的问题[3]。建立中文临床医学术语系统也应做到目标明确,面向中国临床医学实践和计算机应用,方便临床数据处理,为电子病历信息化标准化提供支撑,同时能辅助临床决策,方便卫生管理、医保支付等不同系统间信息交互利用,提升医疗卫生信息化水平,从而提高医疗保健的质量和效率。

1.2 科学性

中文临床医学术语系统分类框架的设计应遵循科学性原则[4],在充分了解临床医学相关学科专业领域的知识、理论和技术的基础上,尊重临床医学的既有知识体系,兼顾全面性和准确性。分类框架一方面应尽可能全面覆盖临床医学各个相关学科专业领域,避免遗漏;另一方面应准确界定临床医学相关学科专业领域的范围,尽量避免收录不具有该领域特异性的无关术语,减少不必要的重复和干扰。

1.3 系统性

分类框架的设计应突出概念体系的合理性与层次性[4],兼顾整体层次性和类间均衡性。以概念为核心,统领同义术语,所有概念通过上下位关系形成层级体系。允许同一概念从不同维度划分,实现多维分类[1]。同一概念可能处于不同分支,但不允许同一概念处在同一支的不同位置,即不允许同一支的上下位概念重名。

1.4 兼容性[5]

分类框架的设计应遵循现行的国家相关法律法规、标准的规定,同时考虑与国内外其他相关术语标准的衔接和映射,为实现信息资源的交互共享提供便利。如传染病的分类框架要遵守《中华人民共和国传染病防治法》中对传染病的划分标准,也要和国标《疾病分类与代码》(GB/T 14396-2016)兼容和衔接。其中的结核病分类还要考虑相应的卫生行业标准《结核病分类》(WS 196-2017)。

1.5 规范性

分类框架中各个节点的名称应优先选用名词委审定公布的规范名词,并借鉴参考现行的相关法律法规及国家标准、行业标准、地方标准、团体标准等各级各类相关标准规范中采用的名词术语。此外,权威的工具书、教科书、百科全书等也可作为规范名称的来源,尽量保证分类框架各节点用词的规范性、权威性。

1.6 灵活性

为适应学科专业的发展和应用需求的多样化,分类框架应能方便灵活地扩展细化、纠错调整和更新维护,同时可根据不同用户的个性化需求,实现按需定制。一方面能不断吸纳学科发展过程中涌现的新概念新术语,力争能反映最新的学科进展,保证时效性;另一方面对用户反馈的相关意见和建议及时评估审核,以便采取进一步的改进完善措施,提升分类框架的方便易用性。

1.7 可行性

设计构建分类框架时,要兼顾质量和效率,将自动构建技术与人工审核干预相结合,从而达到技术上易操作、成本上可接受的预期目标。自动构建和人工审核基本是在已初步开发完成的“中文临床医学术语素材管理系统”中在线操作。自动构建主要是从已入库术语素材标准中选取和我们的研究项目比较契合的相关概念类进行整支复用和整合。人工审核干预包括两方面:一方面综合对比分析国内现行临床医学相关术语标准,深入调研各类概念的内涵和外延,前期人工搭建分类框架的基础部分;另一方面广泛搜集调研国内各种临床规范指南和临床实践日常用语,后期对自动构建结果进一步扩充细化、修改完善,尽可能准确全面地覆盖国内临床医学领域的概念和术语。在兼顾以上几点设计原则的前提下,以复用、整合已有术语标准相关概念类为主要构建方式,辅以类名调整、类级上调、类级下调、类间移动、类删除、类合并、类拆分等操作进行调整重构。此外还根据实际需要增设部分概念或族首词作为分类框架的新节点,使其结构逻辑性更强、更易读。

2 顶层概念类的构建思路

在对临床医学相关学科专业领域的国内外各种术语资源进行广泛调研和对比分析的基础上,根据我国现行的医疗卫生相关法律法规、诊疗规范或临床指南、电子病历等卫生信息化相关标准,结合我国临床实践特色,同时参考国内外临床医学领域应用比较广泛的第十版《国际疾病分类》(ICD-10)和《医学术语系统命名-临床术语》(SNOMED-CT)[6]等术语系统,目前分类框架初步设定了14个顶层概念类,依次为:疾病诊断,有机体,解剖部位,诊查对象,临床表现,诊疗项目、技术和方法,化学药品和生物制品,医用设备、器械和材料,物质,心理行为,环境地理,事件、事故和灾害,人口学及社会经济学特征,限定语。我国作为发展中国家,疾病谱(如高发传染病和恶性肿瘤方面)相对于欧美发达国家不尽相同,而且临床应用的药品器械,以及卫生管理、医保支付、人口统计学等临床相关方面也别具特色。下面将从含义、收录范围、主要参考源等方面分别阐述这14个顶层概念类的构建思路。

2.1 疾病诊断

“疾病诊断”是从医学角度对人的身体、心理的健康问题或健康状态做出判断[7]的相关概念集合。收录人类各种身心疾病(障碍、失调、紊乱、综合征等)、损伤、中毒及其他健康状况的诊断描述用语,涉及临床数据的记录、存储、检索环节中常用的各类疾病诊断术语。

鉴于《疾病分类与代码》(GB/T 14396-2016)是对ICD-10和《国际肿瘤分类》(第三版)(ICD-O-3)的等效采用[8],又结合我国国情进行了本地化修订,将疾病编码由4位扩展到6位,覆盖2万6千余个疾病条目,已广泛应用于国内医疗卫生服务、医疗付费、卫生统计管理、传染病报告等领域,成为我国卫生信息标准体系的重要组成部分。《疾病分类与代码》(GB/T 14396-2016)的中文疾病名称优先采用名词委公布的相关学科的医学名词,对尚没有标准译名的则参考国内近年出版的较权威的医学辞典,科学性、规范性更有保障。同时因为ICD-10的国际通用性能够和其他术语标准建立映射,更方便国际交流且无版权争议,所以将其选作疾病诊断分类框架的主要参考来源。另外还参考了疾病本体(Disease Ontology,DO)的分类体系、美国国立癌症研究所叙词表(National Cancer Institute thesaurus,NCIt)的肿瘤分类,以及国内疾病分类相关的其他法律法规或标准规范,如《中华人民共和国传染病法》(2013修订版)、《结核病分类》(WS 196-2017)、《中国疾病诊断相关分组》(CN-DRGs)等。医学领域比较成熟规范的相关知识组织体系如《医学专业分类表》《中文医学主题词表》(CMeSH)也提供了很多有益的借鉴。

2.2 有机体

“有机体”是对人类具有病原学意义的各类有机体及其不同的生命周期形态、营养获取形式的相关概念集合,主要收录病毒、细菌、真菌等病原微生物,原虫、蠕虫等寄生虫,动植物等真核生物,以及有机体不同生命周期形态和营养获取形态的相关概念和术语。该类框架的设计是在综合比较《医学术语系统命名-临床术语》(SNOMED-CT)、《中文医学主题词表》(CMeSH)、《中国图书馆分类法·医学专业分类表》、名词委审定公布的相关名词等已有术语系统的基础上,参考相关学科知识体系设定的。

2.3 解剖部位

“解剖部位”是人体正常的身体部位、解剖结构、组织、细胞、标本等概念的集合,主要收录身体部位,消化系统、呼吸系统等各个系统,感觉器官,组织,细胞,体液和分泌物,胚胎结构,获得性身体结构,标本等相关概念和术语。该类框架的构建主要参考了《中文医学主题词表》(CMeSH)中的“解剖学”、《医学术语系统命名-临床术语》(SNOMED-CT)中的“body structure”、解剖学基本模型本体(Foundational Model of Anatomy Ontology,FMA)等。

2.4 诊查对象

“诊查对象”是指临床活动中需要观察、检查、监测的各种对象的概念集合,主要收录人体各种生理功能、过程、现象和状态(如呼吸、排泄、免疫、遗传、细胞功能等)、各类检查监测和治疗的参数和特征(如血压监测、影像检查、放射疗法等)。该类框架的构建主要参考了《医学术语系统命名-临床术语》(SNOMED-CT)的“Observable entity”、《中文医学主题词表》(CMeSH)的“现象和过程”等术语资源。

2.5 临床表现

“临床表现”是临床上发现的人体各种异常状况、一般情况的概念集合,收录的异常情况包括症状、体征、病理改变、影像学异常、功能检查异常、化验异常、病原学检验异常、分子异常(含遗传变异)等;一般情况包括精神状态、食欲、食量、大小便、睡眠、体力、体重变化,以及疾病史(传染病、地方病等)、预防接种/外伤/手术史、过敏史等。该类框架设计主要参考了《疾病分类与代码》(GB/T 14396-2016)、《医学术语系统命名-临床术语》(SNOMED-CT)中的“clinical finding”、《中文医学主题词表》(CMeSH)中的相关概念类、人类表型本体(Human Phenotype Ontology,HPO)、《卫生信息数据元值域代码》(WS 364-2011)、《健康体检体征数据元规范》(DB11/T 1238-2015)等。

2.6 诊疗项目、技术和方法

“诊疗项目、技术和方法”是临床提供的各类医疗卫生保健服务项目及相关技术、方法的概念集合,主要收录诊断、治疗、护理、康复、预防保健等方面的服务项目、技术方法、操作程序的概念术语,如综合医疗服务、实验室诊断、影像学诊断、病理学诊断、各系统临床诊断、手术治疗、非手术治疗、物理治疗、康复医疗等。该类框架的构建主要参考了《社会保险医疗服务项目分类与代码》(LD/T01-2017)、《手术操作编码(ICD-9-CM-3)2017维护版》、《医学术语系统命名-临床术语》(SNOMED-CT)中的“procedure”、《全国医疗服务价格项目规范》(2012年)、《临床检验项目分类与代码》(WS/T102-1998)、《观测指标标识符逻辑命名与编码系统》(LOINC)、《临床实验室试验项目分类与编码》(DB33/T 903-2013)、《中文医学主题词表》(CMeSH)中的 “分析、诊疗技术”、医学专业分类表等。

2.7 化学药品和生物制品

“化学药品和生物制品”是各类用于人类疾病诊断、治疗、预防、康复、护理等方面的化学药品和生物制品的概念集合,不包括中药、民族药。该类既包括药品种类、药品剂型的概念术语,也包括具体药品品种及其不同剂型的概念术语,最终形成“药品种类-具体药品品种-不同剂型”等多层级分类框架[9]。该类框架的设计构建主要参考了《国家基本药物目录》(2018年版),从临床药理学维度划分;另外还参考了《药学名词》(第二版)、《中华人民共和国药典》(2015年版)、《国家基本医疗保险、工伤保险和生育保险药品目录》(2017年版)、《社会保险药品分类与代码》(LD/T90-2012)、《医学术语系统命名-临床术语》(SNOMED-CT)中的“pharmaceutical/biologic product”、《中文医学主题词表》(CMeSH)中的“药用制剂”和《中国图书馆分类法·医学专业分类表》的“药品”等术语标准。

2.8 医用设备、器械和材料

“医用设备、器械和材料”是在诊断、治疗、护理、康复、保健等临床活动中用到的消耗性和非消耗性设备、器械和材料的概念集合,收录了手术器材、口腔颌面器材、植入材料、介入材料、缝合止血护创材料、管套容器过滤器材、注射穿刺器材等相关概念术语。该类框架的构建主要参考了《社会保险医疗服务分类与代码》(LD/T01-2017)中的医用器材分类与代码、《中文医学主题词表》(CMeSH)中的“设备和供应”、《医疗器械分类目录》、通用医疗器械命名系统(Universal Medical Device Nomenclature System,UMDNS)等术语资源。

2.9 物质

“物质”在此表示除化学药品和生物制品以外,临床医学中经常涉及到的其他各种物质,主要收录血红蛋白等人体内的生物物质、化学结构和成分,具有特定功能的物质、各种危险物质、滥用的物质和毒品、膳食物质(如食品、营养素等)、变应原、癌症相关物质等。该类框架的构建主要参考了《医学术语系统命名-临床术语》(SNOMED-CT)中的“substance”、《中文医学主题词表》(CMeSH)中的相关概念类、《职业卫生名词术语》(GBZ/T 224-2010)等术语资源。

2.10 心理行为

“心理行为”是与人类疾病和健康相关的心理现象、心理过程、行为和行为机制的概念集合,主要收录恐惧、发怒、幸福、悲痛、焦虑等情绪情感,A型人格、B型人格、孤立型人格、攻击性人格等各类人格性格,多血质、抑郁质等气质类型,吸烟、酗酒、酒后驾车、危险性行为等行为或生活方式等相关概念和术语。该类框架的构建主要参考了《中文医学主题词表》(CMeSH)中的“心理学和精神病学”和《心理学名词》(第二版)。

2.11 环境地理

“环境地理”是与人类健康和疾病相关的环境类型、环境因素、地理区划等概念的集合,主要收录的环境类型包括草原、沼泽、沙漠、沿海等自然环境,城市、农村、住宅、公园等人工环境以及孤儿院、养老院、监狱等各类场所,环境因素则涉及气候气象因素(如热带气候、雨、雪、阳光等,引起损伤的各种物理力(如运动、摩擦、电流、声音、辐射、热、空气压力等)和物体(如车辆、武器等),地理区划主要包括各大洲、国家、地区、我国省市区县等相关概念术语。该类框架的构建主要参考了《医学术语系统命名-临床术语》(SNOMED-CT)中的“environment and geographical locations”“physical force”“physical object”等,以及《中文医学主题词表》(CMeSH)中相关概念类、《世界各国和地区名称代码》(GB/T 2659-2000)、《中华人民共和国行政区划代码》(GB/T 2260-2007)、《县以下行政区划代码编制规则》(GB/T 10114-2003)等。

2.12 事件、事故和灾害

“事件、事故和灾害”是可导致人类损伤、中毒、疾病、残疾、死亡的人为或自然的各类事件、事故和灾害的概念集合,主要收录虐待、自杀、死刑、战争、搏斗等事件,也包括火车脱轨、火灾、触电、意外跌倒等事故,还包括洪水、地震、火山喷发等自然灾害。该类具体架构的构建主要参考了《医学术语系统命名-临床术语》(SNOMED-CT)中的“event”、《疾病分类与代码》(GB/T 14396-2016)第二十章“疾病、损伤和死亡的外因”和《中文医学主题词表》(CMeSH)中相关概念类等术语资源。

2.13 人口学及社会经济学特征

“人口学及社会经济学特征”是各种影响人类健康和卫生保健的人口学及社会经济学因素的概念集合,涉及描述病历所需的人口学、社会学、经济学特征的相关术语,如性别、年龄、婚育状况、人种、国籍、民族、宗教、职业状况、教育背景、身份证件、建档医疗机构组织代码、患者类型、医疗保险类别、医疗付费方式[10-11]等。该类框架的构建主要参考了《电子病历基本数据集》(WS 445-2014)、《卫生信息数据元值域代码》(WS 364-2011)和《医学术语系统命名-临床术语》(SNOMED-CT)中的“social context”等国内外术语标准。

2.14 限定语

“限定语”是临床实践中描述疾病特征、检查检验结果和计量单位等常用限定语的集合。主要收录发病过程(急性、慢性、亚急性等)、疾病部位(全身性、单侧、双侧等)、疾病性质(良性、恶性、化脓性、黏液性等)、疾病分期(早期、中期、晚期、Ⅰ期、Ⅱ期、Ⅲ期等)、疾病分级(轻度、中度、重度等)等从各角度描述疾病特征的语词,还收录描述结果的限定语,如阴性、阳性、正常、未见异常、升高、降低、增多、减少等,临床常用的各种计量单位和符号也在该类下收录。该类框架的构建可参考《医学术语系统命名-临床术语》(SNOMED-CT)中的“qualifier value”和《量和单位》(GB 3102.3-1993)等术语资源。

3 任务进展

截至2018年10月31日,“中文临床医学术语系统”内容构建的研究任务按计划如期推进,目前已基本完成以概念为中心的“中文临床医学术语系统”的顶层框架和概念模型的设计,初步构建和定义了14个顶层概念及65种语义关系,完成了中文临床医学术语遴选标准的制定,指导“中文临床医学术语系统”术语收集遴选工作,已累计收集了63万余条中文临床术语。在术语仓储的基础上进行整理和加工,初步形成了20.7万个中文临床概念,并基本完成了概念间层级关系的构建。在协同工作平台和工具的开发方面,完成了中文临床术语素材管理和概念协同构建与管理功能的需求分析,基本实现了中文临床术语素材管理系统和概念编制工具的开发,并已投入使用。

4 结语

鉴于构建具有自主知识产权的中文临床医学术语系统,对我国临床信息标准化进程的重要性及其自身建设的复杂性,如何在借鉴国内外现有相关先进成果和经验的基础上,融合、创新、发展、探索一条具有中国特色的、科学可行的临床术语标准化之路意义重大、任重道远,需集思广益,凝聚多方智慧,群策群力,携手共同推动该研究顺利开展。

猜你喜欢

术语框架医学
本刊可直接使用的医学缩略语(二)
有机框架材料的后合成交换
框架
K-框架和紧K-框架的算子扰动的稳定性
医学的进步
预防新型冠状病毒, 你必须知道的事
关于原点对称的不规则Gabor框架的构造
医学、生命科学类
有感于几个术语的定名与应用
从术语学基本模型的演变看术语学的发展趋势