罕见病知识库和模型库的设计
2021-09-16雷行云戴国琳陈荃胡红濮
雷行云,戴国琳,陈荃,胡红濮
罕见病是指发病率低、病情一般较为严重且诊断治疗较为复杂的疾病,据估计,我国罕见病患者人数近4 000万[1]。虽然我国罕见病患者的总数较多,但因每种罕见病的患病人数少、临床病例不足且患病人群分散,罕见病患者及其家属、医务人员和公众等对罕见病防控和诊疗的知识储备多不足。目前,罕见病知识受众通过传统路径获取的罕见病知识非常有限。罕见病知识的缺乏在导致医生对罕见病的诊断能力不足的同时,也使罕见病易被误诊或漏诊。当疾病的种类都难以判断时,治疗也就无从谈起。另外,罕见病患者非常关注所患疾病的前沿诊疗方法和研究进展,并期望通过多种途径获取罕见病知识[2-3]。面对我国罕见病诊疗中仍存在认知不足这一问题,需借助信息分析处理技术将大量异构的罕见病知识、权威诊疗经验、技术方法和电子病历等进行结构化处理,构建罕见病知识库,并在此基础上建立罕见病疾病与症状之间的关联模型、罕见病之间及罕见病与常见病之间的鉴别模型,以期提升医务工作者、罕见病患者和公众等的罕见病认知水平,并为进一步研发罕见病相关智能系统和平台奠定基础,为解决罕见病难题提供一定的技术手段和重要信息支撑。当前,疾病知识库领域研究主要聚焦于临床知识库、传染病知识库和慢性病知识库,对于罕见病知识库的关注程度较低,并且现有的罕见病知识库研究多集中于对知识库的方法学和采取的关键信息技术进行探讨[4],关于罕见病模型库构建的报道较少。本研究在明确罕见病知识库和模型库构建流程的基础上,描述了9类知识库和2类模型库之间的关系及各知识库和模型库包含的具体内容,并完成了知识库和模型库的设计,可为智慧化罕见病知识服务体系的建设奠定良好的基础。
1 罕见病知识库和模型库构建流程设计
本研究在文献调研、专家咨询的基础上,广泛收集包括罕见病临床指南、典型案例和诊疗方案等在内的多种类型知识源。通过对罕见病国内外文献、临床诊疗方案和信息进行系统分析,并借鉴现有的疾病临床数据和样本资源库,结合国内外医疗机构在实践中形成的诊疗经验或临床路径,完成对罕见病知识库和模型库的设计。罕见病知识库和模型库的构建流程为:通过广泛收集罕见病领域的权威知识并对其进行分类和处理,形成不同类型的罕见病知识节点和记录,并根据本体关系定义和映射建立罕见病知识概念描述,在此基础上构建知识图谱、知识网络、知识地图和知识规则,并总结典型案例,最终形成9类罕见病知识库和2类模型库,见图1。
图1 罕见病知识库和模型库构建流程设计Figure 1 Process of the design of knowledge databases and model databases for rare diseases
1.1 知识采集 罕见病知识库和模型库构建过程中的知识来源包括教科书、专家经验、临床指南、典型案例、临床诊疗方案、电子健康档案、电子病历、文献资料和网络资源等。教科书、临床指南、临床诊疗方案和文献资料等作为罕见病诊疗过程中必须或普遍遵循的基本原则的主要来源,也是罕见病知识库中知识的基本来源。专家经验作为罕见病知识库中知识的另一重要来源,主要为从事罕见病相关研究的基础医学、临床医学和影像学等学科的专家,以及具有罕见病诊疗经验的高年资临床医师和内外妇儿等专科的临床医学专家的研究和诊疗经验。电子健康档案和电子病历主要提供已确诊罕见病患者的就诊记录、主要症状、主要检查项目及其结果、用药及手术情况和康复情况等内容。
对于第1类载体中的知识,由于其具有较高的权威性和规范性,一般无须严格的质量审核即可进行知识加工;而对于后2类载体中的知识,则需要通过专家咨询等方式对其行进一步筛选,以保证知识的权威性和科学性,避免出现知识谬误或自相矛盾的情况。
1.2 知识体系构建 罕见病知识来源多样、载体类型众多,这也使得罕见病知识信息量大、结构复杂且更新速度快,将多源知识转化为体系式的知识是知识库构建过程中非常重要的一个环节。鉴于知识获取的非延续性和知识利用的非系统化,形成系统、完善的知识体系可有助于上述问题的解决。通过将罕见病知识抽象为单一实体(如疾病的名称、别称、主要临床表现和药品名称等),并获取各实体间的关系(如成骨不全症又称瓷娃娃病,肌萎缩侧索硬化临床表现为肌肉萎缩等),以构建罕见病本体库。在此基础上,利用可视化技术,形成罕见病知识图谱、知识网络、知识地图和知识图解等,在建立罕见病相关知识规则的同时,构建罕见病案例知识库。在知识体系构建过程中,以关联模型为载体,将鉴别模型建立在关联模型数据库中,以解决相同症状和不同症状疾病在本体中的处理及储存问题。对于一些现有的、存储在知识库中的罕见病医疗术语库,利用关联模型和鉴别诊断模型之间的联系可使其为罕见病本体建模提供数据,以更好地建立罕见病知识体系。
1.3 知识库和模型库的形成 在从多种权威知识源中获取罕见病知识并建立罕见病知识体系的基础上,兼顾专科/综合性医疗机构对于罕见病诊疗的需求、基层医疗卫生机构对于慢性罕见病患者的管理需求及罕见病患者的自我管理需求,构建罕见病知识库和模型库。所形成的知识库包括罕见病通用知识库、预防知识库、症状知识库、特异症状知识库、异常检查指标知识库、诊断知识库、药物循证知识库、治疗知识库和随访知识库。模型库包括症状与疾病关联模型库和疾病鉴别模型库。
1.4 知识库和模型库的关联关系 通用知识库是其他知识库的基础,其以疾病为分类维度,对疾病信息进行全面、系统地描述。症状知识库以疾病症状为分类维度,描述症状的具体特征及可能与之相关的疾病。其他知识库可协助医务人员对罕见病进行预防和诊断,并助力罕见病患者的治疗和随访,同时支持知识的直接查询。症状和疾病关联模型是整个知识和模型库的核心,其在疾病通用知识库和症状知识库的基础上结合专家咨询和电子病历拟合等方式构建而成。
2 罕见病知识库内容
2.1 通用知识库 通用知识库内容不仅包括疾病概述、危险因素、发病机制、临床表现、临床分型、主要症状、诊断要点、鉴别诊断、预防、治疗和康复等在内的罕见病基础信息,还包括国内外公开发布的罕见病别称、共病、基因、基因型、疾病表型、疾病-基因型关联、疾病-表型关联、流行病学特征及与其他关系数据库间的映射信息等内容[5-6]。同时,通用知识库根据不同人群的知识需求设计为不同版本,主要版本包括患者及家属版、基层医生版、专科/综合性医院医生版和研究人员版,见图2。
图2 罕见病通用知识库设计Figure 2 Design of the universal knowledge database for rare diseases
2.2 预防知识库 针对80%以上的罕见病是由遗传缺陷引起、95%以上的疾病尚无有效治疗手段这一特点,设计罕见病预防知识库,内容包括孕前综合干预、孕期保健、产前筛查、产前诊断及出生缺陷干预等知识,并通过知识服务平台进行宣传。
2.3 症状知识库 以罕见病临床症状为分类维度,对罕见病的主要症状、症状特征、症状相关疾病和多个症状组合对应的疾病等进行提炼与总结,并设计相应的流程和关联规则,以建立症状知识库。
2.4 特异症状知识库 对罕见病的特异症状进行详细描述,采用多样化的呈现方式,如文字、图解、图片和视频等,协助用户对罕见病进行识别和诊断,并设计相应的流程和关联规则,以提升疾病诊断的及时性和准确性。
2.5 异常检查指标知识库 明确诊断和治疗各种罕见病时需要开展的检查项目和参考的指标及其参考范围。在对异常检查结果的临床意义进行解释的同时,对异常检查结果可能关联的疾病进行分析,并对各检查指标设立异常预警值,以形成异常检查指标知识库[7]。
2.6 罕见病诊断知识库 根据罕见病的特异症状、常见症状和各项检查指标的参考范围,结合临床诊疗标准和专家经验,形成相应的罕见病诊断规则和诊疗流程,最终构建罕见病诊断知识库[8]。
2.7 罕见病治疗知识库 通过将罕见病典型案例、诊疗指南和综合干预措施等与专家诊疗经验相整合,构建以病种为索引的罕见病治疗知识库,以系统呈现罕见病的治疗方案、常见用药、手术方案、放化疗方案和预后等内容。
2.8 药物循证知识库 挖掘罕见病特效药物使用和疾病转归之间的关系,并以疾病和药物作为本体,结合罕见病患者的用药需求和罕见病新药研发、疾病谱变化与药物政策调整等情况,建立药物循证知识库[9-10]。
2.9 随访知识库 对于已确诊的罕见病患者,根据其所患罕见病的种类,明确其随访周期和随访具体内容等。
3 罕见病模型库内容
3.1 症状与疾病关联模型库 通过分析与临床症状相关联的疾病,构建症状与疾病间的关联关系网络,以建立定性模型。在建立定性模型的基础上,对罕见病的特异症状、常见症状、伴随症状、偶发症状、异常信息和检验结果进行权重设计,建立相应的定量模型[6,11]。
3.2 疾病鉴别模型库 将疾病临床诊断标准、特异性症状、主要发病过程与专家经验相结合,对需要鉴别的疾病和与之相对应的症状进行赋值,尤其对特异性症状进行重点标记,以形成罕见病的鉴别诊断模型[12]。
4 知识库和模型库的应用
4.1 规范化知识检索 对国内外罕见病领域文献、诊疗信息、诊疗方案、诊疗指南和教材等知识进行编辑和加工,采用规则、框架、批注和流程等形式表示,将罕见病相关预防、诊疗知识存储入知识库,并以规范化格式为相关用户提供知识检索和利用服务[13-14]。
4.2 专题知识检索与查询 在建立疾病通用知识库的基础上结合罕见病患者及其家属、医务人员、教学科研人员及公众等的不同知识需求,构建多样化的罕见病专题库,包括罕见病预防专题库、诊断专题库、治疗专题库、药品专题库、医保专题库和政策专题库等[15-16]。各专题库支持用户采用多种检索方式(如关键词、主题词检索等)对该专题内的信息进行检索和查询。
4.3 辅助诊断和治疗 以症状和疾病关联模型为基础,采用多种形式关联患者的症状等信息,并结合疾病鉴别模型、特异症状知识库、诊断知识库和异常检查知识库中的诊断规则,以发挥辅助医务人员诊断罕见病的作用。在明确疾病诊断的基础上,治疗知识库和药物循症知识库可为患者提供个体化的治疗方案。
4.4 分析预测 分析预测功能主要面向医务人员和科研工作者开发,以医学统计学方法为基础,实现对相关信息(如罕见病个案)的整理、分析和知识可视化展示,并可结合SPSS、Stata、R语言等统计分析软件,助力科研人员进行罕见病相关数据的统计分析[17]。同时,分析预测功能也可为预测罕见病的发生、发展提供支持,并助力罕见病风险预测模型的构建。该功能也可为患者提供服务,以预测其疾病近、远期预后[18]。
4.5 更新与管理 随着医疗科学技术的不断进步,知识库和模型库需具备完善的更新与管理功能,以允许管理者根据最新知识前沿修正或更新知识库内容。为保障信息安全,更新与管理功能一般仅对系统管理者开放[19]。此外,由于知识库和模型库对于临床诊疗具有一定的指导作用,因此,针对医务工作者和科研人员开发的版本中增加了“内容纠错”功能,允许医务工作者和科研人员通过在线申报,向知识库建设单位进行错误反馈,以确保知识库和模型库内容完善、可靠。
5 小结
本研究明确了罕见病知识库和模型库的建设思路和内容,并梳理了知识库、模型库在罕见病预防控制、诊断和治疗等环节可能发挥的作用及其实现形式。罕见病知识库和模型库可以独立使用,以实现知识的表示、检索、查询、挖掘和利用;也可以与基层卫生信息系统、医院信息系统、区域全民健康信息平台、疾病预防控制平台和慢性病管理系统等进行对接,辅助医务人员进行罕见病的诊断和治疗。下一步,可在构建罕见病知识库和模型库的基础上建立罕见病智能知识服务平台,以为罕见病患者及其家属、医务人员和研究人员检索、查询罕见病知识提供便利,同时促进知识受众间的沟通交流。罕见病知识库和模型库的应用可为解决罕见病防控中存在的问题提供方案,并为破解罕见病诊断难、易漏诊和误诊,以及罕见病知识更新快速且难以获取、医务人员难以及时跟进罕见病研究与诊疗进展等难题提供帮助[20]。
作者贡献:雷行云负责文章的构思与设计、质量控制及审校;雷行云、胡红濮负责文章的可行性分析;戴国琳负责文献/资料收集;陈荃负责文献/资料整理;雷行云、戴国琳、陈荃和胡红濮撰写论文;雷行云、陈荃和胡红濮负责论文的修订;陈荃、胡红濮负责英文的修订;胡红濮对文章整体负责,监督管理。
本文无利益冲突。