APP下载

数据挖掘在名老中医经验传承的应用现状与智能化趋势

2023-03-08徐梓铭

世界中医药 2023年13期
关键词:老中医医案数据挖掘

陶 竹 徐梓铭 郭 艳 李 倩

(1 中国中医科学院西苑医院综合科,北京,100091; 2 榆林市中医医院心血管科,榆林,719099)

中医学是中华传统文化传承千年的瑰宝,将中医学理论与实践相结合的名老中医经验是传承中医学的重要环节,也是推动中医学发展和加快中医学创新的必然途径[1]。但是,以院校传承、师徒传承、传承工作站及书著形式等为主流传承方式在效率及创新方面有一定的不足[2]。此外,诸多客观条件及临床效果评价标准的缺乏也是主流传承方式亟须解决的重要问题。数据挖掘是指从海量的非有序数据中,通过算法搜索隐含在其中的信息和知识的过程[3],数据挖掘依靠软件技术的进步,探索名老中医诊治医案中具有临床价值和指导意义的信息。

本文通过研究近10多年数据挖掘在名老中医经验传承领域应用的成果,总结分析了名老中医经验的常用数据挖掘工具与分析方法的应用现状及趋势,并尝试从人工智能(Artificial Intelligence,AI)与中医药结合的角度出发,为传承与发展名老中医经验提供更高效的途径,助力中医药现代化研究。

1 名老中医经验学习的数据挖掘工具

1.1 常用数据挖掘软件 SPSS是集数据自动处理、数据对接、数据统计等功能于一体的统计分析软件,能进行描述统计、线性模型、相关分析、回归分析、神经网络和假设检验,并广泛地应用于学习算法、统计分析、文本分析以及大数据集成等场景中。在名医经验中用其挖掘处方中药物的使用频次、配伍关系、关联强弱及聚类特点等[4-6]。

同样,集成了机器学习和统计算法的Weka软件,其功能和SPSS重合性较高,并且能将已有的成熟处理方法应用于新的数据集,可以通过回归、分类、聚类、关联规则和属性选择等方法来统计疾病各方面情况,获得药物与症状、药物与药物之间的相关性以及药对配伍规则结果[7-9]。

与SPSS、Weka比起来,R和Python这2种编程语言,在时间序列分析、聚类,以及线性与非线性建模等统计分析场景中,被用作数据分析的图形化工具,在提高中医医案数据挖掘的工作效率方面具有可视化的独特优势,但学习成本较高,研究者需要在编译环境下,通过引用Pandas、Numpy、Matplotlib等基础库,构建可视化数据挖掘平台,再进行统计分析,并将结果可视化展示出来[10-11]。

1.2 常用数据挖掘平台 中医传承辅助系统(Traditional Chinese Medicine Inheritance Support System,TCMISS)是集“数据录入-数据管理-数据查询-数据分析-分析结果输出-网络可视化展示”等功能于一体的中医传承辅助平台,不仅可以采取频次统计、聚类分析等方法对处方进行深入挖掘,获取高频用药、组方规律和核心处方,还具备方剂信息分析和药对分析的关键功能,并在此基础上实现基于复杂系统熵聚类的药物组合分析和基于无监督的熵层次聚类的新方分析[12-14]。

与之类似的还有古今医案云平台和中医传承计算平台(Traditional Chinese Medicine Inheritance Computing System,TCMICS),古今医案云平台突出医案数据管理,在十多年中医医案研究及数据积累的基础上集成医案研究分析方法及大数据、云计算等应用模式,可检索海量医案及方剂,再进行数据挖掘与分析[15-16]。TCMICS的统计分析功能涉及疾病的证候、治则治法、性别以及方剂中的中药四气五味、归经功效等,常用的方剂分析功能主要用于医案处方中的药物频次、关联规则、聚类分析、用量统计,分析出高频中药与药物基本属性,并探索常用药物组合、提炼核心处方等[17-19]。

上述平台通过客观指标和网络化展示,纵向挖掘方剂配伍规律与名老中医用药经验,加上操作的简便性,被用作名老中医学术思想和经验传承的重要工具。中医类数据平台发展到现在,已具备基本的统计和挖掘功能,数据挖掘系统的算法也在不断发展和完善,大多算法互不排斥并能根据研究目的灵活组合[20],这意味着数据平台功能的开发还有着许多可能。

2 名老中医经验学习的数据分析方法

2.1 相关性分析 相关性分析可以针对数据进行数量统计、规律挖掘、分类比较、变量分析等。例如频数分析是对总数据按某种标准进行分组,统计出各个组内含有个体的个数,通常用于分析中药的频数、高频中药的性味归经、常用选方等[21-22]。关联规则是从大量数据中发现满足一定条件的项集之间隐藏的关联[23],可以分析药症关系与药物间配伍,或者挖掘疾病与症状、证候、中药的潜在规律[24-25]。聚类分析则直接比较样本中各事物的性质,用以挖掘医案中蕴含的症状组合、病机组合、药物配伍以及核心药物等[26-27]。因子分析可以解释原始指标之间的相关性或方差关系,对确定的变量例如症状、脉象等通过主成分分析法进行处理得出各公因子的方差,来解释变量是否可靠[28-29];人工神经网络是模拟人脑工作机制的一种计算模型,类似于人脑神经网络的并行处理结构,可用于疾病证候的对比预测分析[30]。

2.2 预测性分析 预测性分析可以通过相关模型对数据进行分类、展示与预测,贝叶斯网络可以定性地展示因素间的复杂关系,定量地展示关系间强度,例如对症状-证素信息做分类识别[31];决策树主要解决实际应用中的分类问题,它是根和每个内部结点都被标记为一个问题的树,从每个结点引出的弧代表与该结点相关联的问题的可能答案,每个叶结点代表对问题解决方案的一个预测[32-33];支持向量机则基于训练数据学习得到一个分类模型,可对未知数据作预测[34]。

3 数据挖掘的不足与改进建议

3.1 医案数据不规范 中医医案在进行数据录入时往往只录入典型症状,缺乏四诊资料,加上信息缺失、歧义多义、表述含糊等诸多问题,不仅影响中医数据的采集和管理,更影响信息平台的数据交互,所以医案信息规范化是数据挖掘的第一步,为了体现辨证论治和因人制宜,在撰写医案和临床病例时可以根据2013年制定的病例报告指南报告清单及杨红等制定的中医病例报告建议条目来进行完善[35],病例报告的用词也要有统一的规范标准,例如使用淡红舌、薄白苔、脉细等中医诊断术语,在今后的诊疗中形成相应的参考标准[36]。此外,电子病历的结构化管理可以大幅提高数据挖掘的效率,建设符合中国特点的临床数据中心(Clinical Data Repository,CDR)和符合中国国情的临床集成平台[37],将医院现有各临床信息系统产生的相关信息,即时采集并转换为国际和国家标准的信息存于CDR,同时完善智能分析模型和检索引擎,实现病历数据的实时、智能、全过程管理[38]。

3.2 挖掘信息不全面 多数研究仅针对常见证型中的药物处方进行统计分析,得出的药对与处方规律太过浅显,或只能体现处方的精要部分,难以全面概括用药规律尤其是君臣佐使的配伍关系,不利于遣方用药的化裁与处理;或者只对病例中的主要证型与主症进行分析,忽略次要症状和罕见证型,无法体现中医辨证论治特色,不能全面真实地反映和传承名老中医学术经验,对临床实践和学习的指导意义十分有限。数据挖掘应该是在海量数据中提取核心规律和深层次信息,例如在收集并录入完整详备的医案信息后,不仅要对药物进行分析,还应该补充分析各个综合征与药物的关系。

3.3 临床实用仍欠缺 很多研究仅选取初诊信息进行研究,缺乏后续疗效和随访内容,加上“人机结合,以人为主”数据挖掘的结果不能完全反映名老中医的思想,对于研究结果的解读仍需要中医思维、中医理论支持,这恰恰是机器解读缺乏的,所以挖掘结果的临床可靠性和有效性还需大量统计验证。可以开发出规范的专家诊疗系统,将疾病信息录入后,分别生成多位名医的经验处方,临床工作者和学术研究者既能对处方的安全性和实用性进行判定,又能参考和借鉴。

4 数据挖掘的智能化学习与展望

AI即模拟人类智能完成任务,实现AI最常用的机器学习方法大致分为传统机器学习和深度学习2类[39],目前大部分中医药数据挖掘仍停留在传统机器学习阶段,而中医辨证论治体系对智能化有较高的要求,因为中医诊疗步骤是观察症状、决定病因、商讨治法和处方用药,任何疾病没有辨明症状之前都无法确定治法,更谈不上处方用药[40],因此,进一步促成“AI+中医药”的融合互补成为趋势,结合目前AI在西医学领域的广泛应用,可以为名老中医经验的学习与传承提供有价值的参考并进行展望。

4.1 疾病早期诊断与评估 大多数慢性疾病的发病过程非常隐匿,当出现明显的临床症状时往往已经错过最佳治疗阶段,由此不难见得疾病早期诊断的重要性。医学影像检查作为疾病诊断最重要的辅助工具之一,其与AI的结合应用较为广泛,如利用堆栈去噪自编码器(Stacked Denoising Autoencoder,SDAE)架构的自动特征探索机制和噪声容忍度优势,通过大量图像训练识别病灶以区分良性结节与恶性结节,以及乳腺超声病变和肺CT结节[41]。类似的还有人工智能内镜超声(Endoscopic Ultrasound-AI,EUS-AI),它能通过大量图像训练以识别病灶,无侵入性且安全,还能自动进行相应的诊断,有望降低出血、感染等风险[42]。对于复杂的神经退行性疾病,捕捉身体的微弱异常信号是早期诊断与评估的新思路,AI可以通过无线电信号反射从环境中捕捉特定的呼吸信号来进行识别和预测帕金森病[43]。

在名老中医经验学习领域也可以通过四诊信息AI模型来进行疾病的鉴别和诊疗,红外感应系统、图像收集系统和可穿戴设备技术愈发成熟使得四诊信息的自动化采集更加可行,将主观化的问诊数据变成可量化的机器采集,通过分析得到标准化高质量的四诊数据[44-48],结合名医医案数据库,提取适配度最高的临床处方,再设定临床疗效指标,对拟出的新方做疗效验证。从更全面、更深层次探究名医的临床经验并智能化传承,挖掘出超越个体的优秀群体经验。

4.2 疾病的治疗策略 在制定和改善疾病的治疗策略上主要有两代AI系统,第一代系统旨在促进医学的4P模型:预测性、预防性、个性化性和参与性,提供患者的自主权[49],主要关注大数据分析的临床决策,以及开发诊断和治疗的算法,提高疗效,减少医疗错误。有研究者在2个大型的重症监护室(ICU)数据库的基础上,开发了一个名为AI clincian的计算模型来模拟患者的治疗环境和运动轨迹,该模型可以动态分析所有处方和计算每个治疗方案的平均回报,最终确定最大回报的治疗方法[50]。

但是大型数据库有时缺乏长期稳定的结构良好的训练集,容易得到错误的相关性,因此采用率也较低。第二代系统预计将增加“进展”这一概念[51],因为无论是生物还是疾病发展都是动态变化的过程,专注于改善生物过程,而不是通过分析数据来帮助诊断、预测或治疗。该系统分为3个层次,第一层次提供的程序可以录入药物和非药物干预处方,例如护理人员被要求在程序中输入每种药物的剂量和给药时间,该程序中的随机数发生器会在批准的范围内引入剂量和时间的可变性[52];第二层次则是一个闭环系统,根据第一层患者对治疗的反应来调整剂量和给药时间的可变范围,该系统将学习每个患者的动态信息,并全部导入算法,最终形成基于医生确定的且对临床有意义的疗效参数及个人参数;第三层次将疾病相关的变异性特征被纳入治疗算法,例如心率变异性可用于慢性心脏病患者[53],该算法可以不断进行比较和输入,为患者选择合适的动态定制模式。

两代AI系统的进步为中医学提供了更多实践可能,尤其是第二代AI系统将单个患者作为算法的中心,并及时调整其动态数据输入与输出的机制[54]。相当于把西医提出的精准医学和中医整体观念指导下的辨证论治有效结合,通过长期收集某例患者的各方面数据,包括个人信息、疾病进展、诊疗经过以及环境、饮食等外部因素,形成个性化AI模型,不仅可以评估身体状况和治疗方案的动态变化,还能预测疾病的发生,但考虑到这种基于自身的数据模型存在局限性,可能无法预测未患过的疾病,所以慢性病人群将是首要的适用人群。以心血管疾病患者的治疗为例,通过大量自身数据集训练出的个性化AI模型可以评估名老中医处方运用于心血管疾病患者的临床疗效,根据疾病和个体内外环境的变化,不断优化适用于该患者的中医处方,实现诊疗系统的动态追踪,还能预测疾病的进展与风险,医患双方配合共同做好疾病的预防和预后工作。在这种动态调整中,由于AI不具备人脑的惯性思维,如果长期录入大量规范数据并进行追踪,AI有可能分析出比医生本人更深层、更全面的诊疗方法,由此类推,不仅能训练出针对患有某种疾病的个体AI模型,还能形成针对医家特色思想、疾病证型发展、同病不同医家、同人多病等多种模型。

4.3 医疗资源的管理 除了利用AI解决特定的医疗问题之外,医疗资源的协调与管理也不容忽视,线上平台的建立是AI的又一突破口,有研究者创建了线上的罕见病AI平台[55],并提出了一个多医院协作的操作机制。当患者来到合作的医院进行评估时,会在本人许可的情况下收集他们的人口统计信息、临床数据和联系信息,并立即发送到该平台。AI通过网络提供全面评估,并将所获得的信息保存在数据库中,当网络评估的结果为“手术”时,就会通过系统触发紧急通知医生进行确认,同时患者也会被告知全面检查的流程。此外,医生还可以根据平台评估的结果,按轻重缓急查看病例,提高诊疗效率的同时又能协调医疗资源。

资源配置不合理、地理位置的局限、数据格式不兼容等同样是名老中医经验学习与传承面临的重大考验[56],所以建立起一个针对医疗工作者和患者的广泛协作的“线上医院”是推广名医经验、发扬中医文化的新途径,重点是多医院协作,包括综合类医院和专科医院,各地区的合作医院共用一个数据库,将各医院名老中医的完整病案上传,通过AI进行归类和分析,达到医疗资源的汇总和再分配。中医学子和中医临床医生可以通过查询某类疾病或者证型得到相应名老中医的处方并进行自动智能化分析,不仅有利于名老中医经验的推广还可以为临床医生提供指导。对于患者来说,输入自己的详细信息即可以获得名老中医的智能化处方,并通过“线上医院”发送给专科医生进行审核,既能解决医疗资源的分散性,为医疗资源匮乏地区的患者提供医疗帮助,又能收集来自全国各地的医疗数据以不断丰富AI模型的深度学习,创建出真正适用于中医真实世界的平台。

5 讨论

综上所述,在信息化时代下,无论是数据挖掘工具还是分析方法都已取得了长足进步,为中医药数据分析提供了更丰富的途径与手段。但不可否认,数据挖掘技术在中医药研究中的应用尚有一定的局限,无论哪种分析方法都是对现有数据进行统计和深度挖掘,并且需要人为进行归纳总结,但智能化的挖掘工具应当具备输入和输出2种能力。西医学的AI分析方法在疾病早期诊断与评估、疾病的治疗策略与医疗资源管理这几个方面使用效果突出,不仅可以提供更快更准确的诊断、指导个性化治疗、进行风险预测,还能根据疾病的严重程度进行分级,减少医疗错误,协助医生进行临床诊治与评估,优化医疗轨迹,提高医疗效率和质量,并节省医疗成本,可以为中医药领域尤其是名老中医经验的学习与传承提供有价值的参考。

中医数据无疑是一个巨大宝库,名医经验更是中医系统中的典范,集理论和经验于一身,代表着中医治疗的最高水平,数据挖掘技术应用于中医领域已有多年,在名医经验的总结和传承中发挥着重要的作用,随着计算机技术的快速发展,AI蓬勃兴起,不断在中医药领域的科技创新中崭露头角,其运用于名医经验传承是必然趋势,我们需要不断促进高质量的中医库大数据与AI模型高水平的融合,打造出名老中医经验学习与传承的智能平台。

猜你喜欢

老中医医案数据挖掘
探讨人工智能与数据挖掘发展趋势
老中医教你睡眠养生
老中医坐诊
医案聊斋续篇 吐泻案
医案聊斋续篇 晨泄案
基于并行计算的大数据挖掘在电网中的应用
老中医
一种基于Hadoop的大数据挖掘云服务及应用
新加香薷饮医案6则
周来兴老中医治疗疑难杂症的思路与经验