APP下载

中医辅助诊疗推荐系统设计与实现

2021-07-11任晋宇白琳钟华

中国中医药图书情报 2021年3期
关键词:推荐系统数据挖掘

任晋宇 白琳 钟华

摘要:目的  研究和开发辅助中医医生诊疗的中医辅助诊疗推荐系统。方法  以中医历史病案数据为基础,利用数据挖掘技术和度量学习技术挖掘、整理中医诊疗经验知识,建立病案相似度计算方法,设计中医辅助诊疗推荐系统功能框架并开发应用系统。结果  设计并构建了中医辅助诊疗推荐系统,在四诊识别阶段为医生推荐候选症状,在辨证论治阶段为医生推荐诊疗方案,从而辅助经验不足的医生诊疗。结论  该系统可以在临床实践中辅助医生诊疗,从而降低中医传承难度、改善中医传承模式,更好地发展和利用中医药。

关键词:中医辅助诊疗;推荐系统;数据挖掘;度量学习

中图分类号:TP311.5;R241    文献标识码:A    文章编号:2095-5707(2021)03-0001-05

DOI: 10.3969/j.issn.2095-5707.2021.03.001        开放科学(资源服务)标识码(OSID):

Design and Implementation of TCM Auxiliary Diagnosis and Treatment Recommendation System

REN Jin-yu, BAI Lin*, ZHONG Hua

(Institute of Software Chinese Academy of Sciences, Beijing 100190, China)

Abstract: Objective To research and develop a TCM auxiliary diagnosis and treatment recommendation system. Methods Based on TCM historical medical record data, this article established a method for calculating the similarity of medical records, designed the functional framework of TCM auxiliary diagnosis and treatment recommendation system, and developed the application system by using data mining technology and metric learning technology to mine and sort out the experience and knowledge of TCM diagnosis and treatment. Results A TCM auxiliary diagnosis and treatment recommendation system was built, which could recommend symptoms for doctors in the process of TCM four diagnostic methods, and recommend diagnosis and treatment plans for doctors in the stage of syndrome differentiation and treatment, so as to assist inexperienced doctors in diagnosis and treatment. Conclusion The system can assist TCM diagnosis and treatment in clinical practice, so as to reduce the difficulty of TCM inheritance, improve TCM inheritance model, and better develop and use TCM.

Key words: TCM auxiliary diagnosis and treatment; recommendation system; data mining; metric learning

中医学是现代医疗体系不可或缺的一部分。中医诊疗过程可概括为2个阶段:四诊识别阶段和辨证论治阶段。在四诊识别阶段,医生通过望、闻、问、切获得患者的四诊信息,从而了解患者身体状况。在辨证论治阶段,医生根据得到的四诊信息结合诊疗经验辨别患者证候,从而做出诊断和提出治法。整个诊疗过程以辨证论治理念为诊断依据,诊疗结果依赖医生个人经验,不确定的经验知识较多,传承难度大。同时,中医临床实践中也存在一些现象,如无证可辨、矛盾症状等,给经验不足的医生造成困难和挑战,缺乏诊疗经验可能导致其在四诊阶段不能全面获取患者身体状况信息;不同的辨证体系及多种不确定的经验诊断模式可能让其感到无所适从,导致诊疗方案疗效欠佳。因此,结合大数据和人工智能相关技术研发诊疗辅助性的系統工具,帮助诊疗经验较少的医生显得尤为重要。本文提出一种中医辅助诊疗推荐系统,以蕴含了医生诊疗经验的中医历史病案数据为基础,利用数据挖掘技术和度量学习技术对中医历史病案数据进行多维度挖掘和度量,得到症状、证候、治则、方剂等多维中医药特征的关联关系及患者、病案间的相似关系,并基于此为医生提供辅助诊疗支持。在四诊阶段,推荐与当前患者刻下症相关联的、可能存在的其他症状,提示医生进一步完善患者的四诊结果;在辨证论治阶段,推荐与当前患者相似的其他患者的历史病案信息,为医生对当前患者的辨证论治提供可参考的诊疗方案。

1  研究背景

近年来互联网、人工智能和大数据相关技术飞速发展,这些技术应用到中医领域能够推动中医现代化发展[1]、改善中医传承模式、提升中医临床服务能力[2],成为重要的研究方向。刘伟等[3]研发了中药种质资源信息系统,实现中药种质资源的信息化管理,挖掘中药数据中潜在的规律和模式,具有重要的实用价值。刘健等[4]基于反向传播算法构建了面向大数据的高血压中医专家诊疗系统,该系统针对高血压病辨证治疗的准确率达95%以上。王倩等[5]基于云平臺Hadoop构建中医数据挖掘系统,通过数据挖掘获取中医药中的潜在信息,从而实现中医辅助诊断。卢朋等[6]综合人工智能、数据挖掘、网络科学等开发了中医传承辅助系统软件,并广泛用于中医领域的用药规律分析[7-10]。

数据挖掘是在数据集中发现并提取隐藏在其中的模式信息的一种技术。目前数据挖掘已经广泛应用于中医药领域[11],主要应用在中医证候研究、中药研究、方剂研究、名医名家用药规律研究等方面。雷蕾等[12]采用数据挖掘的方法分析名老中医在治疗慢性肾衰竭时的组方规律;张玉娇等[13]通过循证方法评价数据挖掘在中药药性研究中的应用;彭琳[14]以100种常用药方为基础,采用K近邻算法研究中药用药规律与治疗效果的关联性;Ye等[15]应用Apriori算法研究失眠症状和中药用药的关系。

患者相似性分析也是医案数据再利用中的重要研究内容,即根据2个患者的历史病案信息判断其相似程度,获得患者相似性度量[16]。基于患者相似性,可为检索相似患者构建候选集,从而辅助诊断。患者相似性分析和机器学习方法的结合逐渐成为相关研究的热点之一。Ni等[17]利用病案诊断标签之间的公共前缀长度计算相似度,再通过神经网络得到患者的向量表示,最后通过四元组损失训练得到距离度量。Zhang等[18]基于中文电子病历构建医学术语词典,精确分割电子病历并建立特征向量,最后用半监督的聚类方法判断患者之间的相似度。

2  系统核心功能

基于中医历史病案数据及数据挖掘等多种信息技术设计了中医诊疗方案推荐系统,主要包含候选症状推荐及辨证论治方案推荐两大功能。针对经验浅的医生在四诊阶段获取患者信息不全面的问题,本系统基于挖掘得到的经验诊断模式,可根据医生录入的四诊结果(即患者的刻下症),推荐与之高度关联的、可能存在的其他症状给医生,提示医生进一步询问患者,从而帮助其更全面地获取患者身体状况信息。此外,本系统基于中医病案相似性度量方法,从历史病案数据中找出与当前患者状况最为相似的一个或多个病案(包括患者的诊断、治则治法、方剂等),从而为医生在辨证论治阶段对患者做出诊断和给出诊疗方案提供参考。

3  系统架构设计

基于医案挖掘的中医诊疗方案推荐系统采用浏览器和服务器(Browser/Server,B/S)结构,分为线下挖掘训练模块和线上推荐模块两部分。系统通过RESTful API的方式向前端用户交互提供服务,主要包括候选症状推荐、诊疗方案推荐两大推荐服务模块,系统组织架构见图1。

3.1  基于图数据挖掘的候选症状推荐模块

在向医生推荐候选症状时,首先要获取中医历史病案数据中蕴含的经验诊断模式,构建模式库,再结合系统的输入(即当前患者的刻下症)与模式库中的经验诊断模式推荐候选症状。

3.1.1  数据挖掘模块  中医历史病案数据中包含症状、证候、治则、方剂等多个维度的特征,且各种特征间关系复杂,所以采用图数据结构对病案数据建模[19],并采用频繁子图挖掘算法挖掘各种特征间的关联关系。由于不同的特征类型代表不同的含义,并且其值域分布大不相同,所以本模块扩展了传统的频繁子图挖掘算法,设计了多支持度的频繁子图挖掘算法。见图2。

在中医历史病案数据中,利用上述算法进行数据挖掘,可得到代表中医诊疗经验的经验诊断模式,如图3所示。经验诊断模式以证候为核心,包含了该证候相关的典型症状、惯用治则与经典方剂等信息。其中,support为相关症状/治则/方剂在当前模式的支持度,patternSupport为当前模式在整个病案集上的支持度。support和patternSupport在一定程度上反映了模式中的特征及模式本身的重要程度。

3.1.2  候选症状推荐模块  本模块分为召回子模块和排序子模块。召回子模块结合系统输入(即患者的刻下症)与模式库中的经验诊断模式计算各模式的匹配度大小并对匹配度进行排序,最后选出匹配度最高的m个模式,如公式⑴与⑵所示。

N代表输入的刻下症集合,Ni代表第i个模式的症状信息集合,Wi代表输入的刻下症与第i个模式的匹配度。对模式库中的模式按照匹配度Wi大小降序排序,得到列表L,其中匹配度最高的模式为L1,其次为L2,以此类推。

排序子模块进一步计算m个模式中所含的每一个症状与刻下症N的关联度,最后按照症状关联度大小排序并推荐关联度最高的部分症状,计算症状关联度的方法如公式⑶所示。

Ed代表症状d的关联度,sdj代表症状d在模式Lj中的支持度,Wj代表模式Lj的匹配度,sj代表模式Lj的总体支持度。

3.2  基于相似病案的诊疗方案推荐模块

本模块通过有监督的度量学习算法学习病案间的相似性度量函数,然后以此函数判定当前患者信息(包括年龄、性别等基本信息及刻下症等)与历史病案的相似性,选择最相似的一部分病案推荐给医生供其参考。

3.2.1  相似历史病案标注模塊  本系统采用有监督的度量学习算法,以两病案间是否相似为监督信息,学习病案的相似性度量函数,采用模拟计算的方式获取病案是否相似的监督信息。对于历史病案数据中证候、治法、方剂、中药组成四大类特征,分别计算Jaccard系数,最后将所有Jaccard系数求平均值作为两病案的相似度。考虑到中医历史病案中同一患者证候特征及治法特征下的多个值之间有主次之分,所以在计算Jaccard系数时,次级证候与次级治法权重递减。

对于病案证候与治法特征采用公式⑷~⑹计算,其中,Dit与Djt分别代表病案Di与病案Dj在特征t下的特征值集合,wp代表集合中的第p个值,Dit∩Djt代表两集合的交集,Dit∪Djt代表两集合的并集,Jt代表病案Di与病案Dj在特征t下计算所得Jaccard系数,对于方剂与中药组成特征采用传统Jaccard系数计算法计算,similarity (Di,Dj)代表病案Di与病案Dj最终的相似度。

经过本模块的计算,能够得到具有监督信息的数据集,即多个病案组{Di,Dj,lij},每个病案组内的病案之间满足公式⑺。其中,lij=1,代表病案Di与Dj相似;lij=0,代表病案Di与Dj不相似。

3.2.2  度量学习模块  本模块利用度量学习技术学习2个病案之间的距离度量函数,距离越近则认为这2个病案越相似。

首先将病案Di中文本形式的症状特征经过one-hot编码转化为原始向量Did,再将原始向量Did通过线性变换L映射到一个新的空间,在该空间中计算2个病案之间的距离d (Di,Dj),如公式⑻所示。

令M=LT·L,则公式⑻等价于公式⑼,其中M即为下一步通过优化损失函数所求度量矩阵。

最后采用公式⑽中的损失函数作为模块整体的优化目标,其中dij=d (Di,Dj)。在训练过程中,使相似病案在向量空间中的距离变小,不相似病案在向量空间中的距离变大,最终得到度量矩阵M。

3.2.3  诊疗方案推荐模块  通过度量学习模块学习病案数据的度量矩阵M后,对于新的患者便能够利用矩阵M计算该患者与现有的中医历史病案之间的相似度,最后选取Top k个与该患者最相似的历史病案(包括证候、治则、方剂等诊疗信息)供医生参考。

4  小结

本中医辅助诊疗推荐系统先利用数据挖掘技术挖掘隐含在中医历史病案中的经验诊断模式,然后借助挖掘得到的模式将其中的症状信息与患者的刻下症进行匹配,并将模式中匹配关联度最高的若干症状作为当前患者可能存在的其他症状推荐给医生,提示医生进一步完善和补充患者四诊信息。此外,系统还利用度量学习技术学习病案间相似性度量函数,利用该函数计算当前患者与历史病案之间的相似度,最后基于相似病案为医生推荐个性化的诊疗方案,从而帮助经验不足的中医医生克服其在实践中遇到的困难。

本文设计实现的中医辅助诊疗推荐系统面向中医诊疗过程中四诊识别和辨证论治2个阶段,分别提供了候选症状推荐和诊疗方案推荐两大辅助诊疗功能,可有效补全四诊结果,为进一步辨证论治提供丰富的辨证依据;同时,利用患者、病案间的相似性,推荐相似病案的诊疗信息,为医生开展个性化辨证论治提供有价值的个体病案参考。今后,该系统将结合经验诊断模式中的治则、方剂等信息,进一步优化相似病案推荐算法,提高算法性能和效率,进而提高系统辅助诊疗能力。

参考文献

[1] 崔骥,许家佗.人工智能背景下中医诊疗技术的应用与展望[J].第二军医大学学报,2018,39(8):846-851.

[2] 陈辛畋,阮春阳,于观贞,等.融“古”贯“今”,构建智慧中医新体系[J].第二军医大学学报,2018,39(8):826-829.

[3] 刘伟,丁长松,梁杨.中药种质资源信息系统的设计与实现[J].中国中医药信息杂志,2017,24(5):5-7.

[4] 刘健,蒋卫民,沈宫建.面向大数据的高血压中医专家诊疗系统构建及应用[J].中国中医药图书情报杂志,2019,43(5):5-9.

[5] 王倩,石艳敏,史春晖,等.基于云平台Hadoop的中医数据挖掘系统设计与实现[J].计算机应用与软件,2018,35(10):45-48,79.

[6] 卢朋,李健,唐仕欢,等.中医传承辅助系统软件开发与应用[J].中国实验方剂学杂志,2012,18(9):1-4.

[7] 范元赫,杨永菊,关雪峰.基于中医传承辅助系统分析骨质疏松组方用药规律[J].辽宁中医药大学学报,2020,22(9):201-205.

[8] 李鹤,谢亚娟,厉启芳,等.基于中医传承辅助系统分析中医药治疗肝脾不调证溃疡性结肠炎的用药规律[J].中国医药,2020,15(10):1580-1584.

[9] 黄盛,祁烁,李会龙,等.基于中医传承辅助系统治疗甲状腺结节用药规律分析[J].世界中医药,2020,15(7):1025-1029.

[10] 宋洋,杨仁义,周德生,等.基于GEO数据与中医传承辅助系统分析气虚血瘀型脑梗死的中医药防治策略[J/OL].世界中医药[2021-01-23]. http://kns.cnki.net/kcms/detail/11.5529.R.20201102.1145.010.html.

[11] 封继宏,张鹏宇.数据挖掘在现代中医药研究中的应用进展[J].中国医药导报,2020,17(13):54-57.

[12] 雷蕾,骆言,任静,等.基于数据挖掘对中医治疗慢性肾衰竭组方规律的分析[J].中成药,2019,41(12):3079-3082.

[13] 张玉娇,章新友,谈荣珍,等.基于循证的中药药性判别数据挖掘方法评价[J].中华中医药杂志,2019,34(3):1223-1226.

[14] 彭琳.基于数据挖掘的中医药治疗效果与用药规律关联性分析[J].科技通报,2019,35(1):77-81.

[15] YE Y, XE B, MA L, et al. Research on treatment and medication rule of insomnia treated by TCM based on data mining[C]// 2019 IEEE International Conference on Bioinformatics and Biomedicine (BIBM). San Diego, 2019:2503-2508.

[16] 王妮,黄艳群,刘红蕾,等.基于半监督学习的患者相似性度量研究[J].北京生物医学工程,2020,39(2):152-157.

[17] NI J Z, LIU J, ZHANG C X, et al. Fine-grained patient similarity measuring using deep metric learning[C]// Association for Computing Machinery. 2017 ACM on Conference on Information and Knowledge Management (CIKM). New York, 2017:1189-1198.

[18] ZHANG J, CHANG D. Semi-supervised patient similarity clustering algorithm based on electronic medical records[J]. IEEE Access, 2019(7):90705-90714.

[19] YAN X F, YU P, HAN J W. Graph indexing: a frequent structure-based approach[C]// Association for Computing Machinery. Proceedings of the 2004 ACM SIGMOD International Conference on Management of Data (SIGMOD04). New York, 2004:335-346.

(收稿日期:2021-03-05)

(修回日期:2021-03-27;編辑:郑宏)

猜你喜欢

推荐系统数据挖掘
数据挖掘技术在内河航道维护管理中的应用研究
数据挖掘综述
软件工程领域中的异常数据挖掘算法
数据挖掘在选课推荐中的研究
基于用户偏好的信任网络随机游走推荐模型
基于个性化的协同过滤图书推荐算法研究
个性化推荐系统关键算法探讨
浅谈Mahout在个性化推荐系统中的应用
关于协同过滤推荐算法的研究文献综述
基于R的医学大数据挖掘系统研究