贝叶斯网络在中医药领域的研究现状及展望*
2022-04-28卢恩仕韩明光刘祖发
卢恩仕,韩明光,刘祖发
1.中国中医科学院望京医院,北京 100102;2.北京大学数学科学学院,北京 100871
中医药以其独特的理论和实践体系在疾病诊疗中发挥着重要作用,但中医辨证多依靠主观经验,缺乏客观标准,这在一定程度上阻碍了中医药现代化的发展。相较于传统研究方法,数据挖掘技术能够较好地处理模糊、非线性、不完整的数据[1],有利于促进中医药标准化、数字化及信息化发展[2-3]。利用数据挖掘技术进行中医药现代化研究,已成为推动中医药发展不可或缺的环节。
目前,基于贝叶斯网络的概率图模型已广泛应用于人工智能、生物信息学和医疗大数据等众多领域[4-5]。贝叶斯网络能够根据先验知识及概率统计,对未知事件进行预测[6],其推理是在推导数理、计算概率、设定阈值等基础上建立起来的,具有明确的推理过程及精确度较高的结论表达。
1 贝叶斯网络
贝叶斯网络作为一种信念网络[7],具有有向无环性,能够利用有向边的连接表示各节点之间的因果关系。这种有向边能够直观地表达变量之间的依存关系,即直接连接两个节点的边表示两节点有直接依赖关系。贝叶斯网络的理论基础是条件独立性假设和贝叶斯定理,是一种利用不确定性问题中各变量之间逻辑依赖关系建模的概率图模型,在处理不确定问题时具有较强的稳定性能。
(1)
(2)
式(2)中:x1,x2,L,xn是节点集合,pa(xi)是节点xi的父节点集合,p(x1,x2,L,xn)是网络所有节点的联合分布。
如图1所示,有向无环图即典型的贝叶斯网络[8]。它包含一个结构模型和与该结构相关的条件概率密度函数,节点为随机变量,表示对事件、状态等特征抽象表示;直接连接两个节点的边表示两节点有直接依赖关系,该关系常常是一种因果关系。考虑随机变量集合U={x1,x2,L,xn},每个变量xi的状态有限,P是网络节点处的条件概率分布,表征各随机变量之间关系的强弱。根据条件独立性应用于链式规则,图1贝叶斯网络的联合概率分布为
图1 典型的贝叶斯网络
p(x9|x6)p(x8|x5,x6)p(x7|x5)p(x6|x3,x4)g
p(x5|x2,x3)p(x4|x1)p(x2|x1)p(x1)
(3)
2 贝叶斯网络在中医药数据挖掘中的应用
2.1 基于贝叶斯网络探究中医证候规律中医“辨证”是指通过分析症状、体征等证候规律,提取病位、病性等证候要素,并在此基础上诊断中医证型的思维过程。“辨证”的关键在于辨证候要素,但中医辨证多取决于临床医师的个人经验,受主观因素影响,难以形成客观统一的辨证标准。而贝叶斯网络能够模拟人脑思维过程,学习医师在临床中积累经验的方式,在此基础上挖掘数据中的隐藏变量[9-10],通过概率分析其可能性,提取证候要素,展现症状、证候要素及证型间的相互关系[11],从而使复杂且高度非线性的中医辨证系统可量化。
孙文军等[12]通过建立阈下焦虑抑郁患者的贝叶斯网络模型,从中提取肝郁脾虚、心肾不交、心脾两虚3种常见证型及其主次症状。Zhang等[13]运用贝叶斯网络探究男性不育症的中医证候特征,通过建立隐树模型,发现男性不育患者的基本中医证候特征为肾阳虚、肾气虚、脾阳虚、肝气郁结、气滞血瘀等,证型多为脾肾阳虚、肝气郁滞证型,而非单一证型。薛亚静[14]利用贝叶斯网络探究523例焦虑抑郁共病患者的中医证候规律,从中获得17个证候要素及7个证候类型。杨洋等[15]建立了胃癌证型间的贝叶斯网络,从中提取6种证型,并与专家的辨证结果进行比较,发现二者有着较高的吻合率,证实了贝叶斯网络在中医辨证中的有效性。
在中医证候研究中,相较于其他数据挖掘方法,贝叶斯网络技术准确率更高。吴宏进等[16]利用贝叶斯网络算法、支持向量机算法、K最近邻(k-nearest neighbor,KNN)分类算法3种数据挖掘方法探究围绝经期综合征中医证型,经比较,发现贝叶斯网络有着最高的正确率及最小的标准误差,在证型分类方面效果优于另外2种算法。李仕进等[17]分别运用贝叶斯算法及KNN算法进行古方“症-证”间的关联性研究,实验表明贝叶斯算法的正确率高于KNN算法,在中医“症-证”分析研究中更加具有优势。
2.2 贝叶斯网络在名老中医经验传承的应用贝叶斯网络技术可将名老中医的辨证经验转化为客观定量的数据表达[18],从中提取证候要素并运用条件概率分析相关症状的贡献度,展现名老中医的辨证思路,为名老中医经验传承提供新方式。
吴荣等[18]利用贝叶斯网络探究名老中医治疗冠状动脉粥样硬化性心脏病的中医证候规律,从中提取8个证候要素,发现其中最主要的证型为血瘀证,最常见的证候为气虚痰浊血瘀证。甘小金等[19]运用贝叶斯网络探讨王子瑜教授治疗子宫内膜异位症的辨证规律,其中最常见的单一证候要素为血瘀证,最常见的证素组合为气滞血瘀及肾虚血瘀,这与王子瑜教授的学术思想相吻合。
2.3 贝叶斯网络在中药药性研究中的应用中药药性理论是中医药理论的重要组成部分,但中药具有成分复杂、功效多样及靶点多的特点[20],传统研究方法多为局部研究,缺乏整体性及系统性,贝叶斯网络能够直观地展现中药药性与功效间、功效与药理间的复杂网络关系[21],探究其背后的因果规律,为中药组分药性及分子水平的研究奠定了基础[22]。
邢雁辉等[23]建立中风中药组方的贝叶斯模型,以探究中药、证候与疗效间的相互关系,对单味中药药效进行预测,并提取在疾病治疗中具有良好功效的中药,为新药研发提供了相关的技术支持。沈忱等[24]运用贝叶斯网络建立活血化瘀类中药及其药理作用间的数据模型,通过计算二者间的概率值,并利用所构建的数据模型对疑似有活血化瘀作用的中药进行预测,验证其功效。齐方等[25]运用贝叶斯网络探究中药的整体药性与物质成分间的关系,发现由偏最小二乘判别模型选择出的37个药性特征标记作为节点所构建的中药整体药性贝叶斯模型具有较高的灵敏度、特异性以及较强的中药药性判别能力。张培等[26]建立中药有效组分五味与药理间关系的贝叶斯网络模型,在此基础上进行中药五味的预测,有利于促进中药组分药性及组分配伍的进一步研究。
2.4 贝叶斯网络在疾病干预措施疗效评价中的应用近年来,贝叶斯网络多与Meta分析相结合,用于对疾病多种干预措施的系统评价。相较于传统Meta分析,网状Meta分析准确性、稳定性及灵活性更高,且能对不同的疗法进行疗效及安全性排序[27-28],使评价更加客观、全面。
贝叶斯网状Meta分析常用于分析不同中药注射剂在疾病中的疗效,并从中进行最优选择。黄培颖等[29]运用贝叶斯网络Meta分析探究6种中药注射剂与抗病毒类西药联合应用于流行性感冒的治疗效果,发现在退热、镇咳、住院时间及不良反应方面,喜炎平、清开灵及热毒清注射液分别发挥了最佳的疗效。Tan等[30]利用贝叶斯网状Meta分析探究银杏注射液联合常规治疗冠状动脉粥样硬化性心脏病心绞痛的临床疗效及安全性,研究显示银杏注射液联合常规治疗冠状动脉粥样硬化性心脏病心绞痛优于单纯常规治疗。Liu等[31]运用贝叶斯网状Meta分析探究雷公藤甲素治疗特应性湿疹的疗效及安全性,研究表明雷公藤甲素在与其他药物联合治疗特应性湿疹时协同作用较强,具有一定的临床疗效,但不良反应较为明显。
此外,贝叶斯网状Meta分析也常用于针灸、推拿及传统运动等中医疗法的综合评价中。Pang等[32]利用贝叶斯网状Meta分析探究8种针灸方法治疗神经性耳鸣的临床疗效,发现这些干预措施对神经性耳鸣的治疗均有效果,其中艾灸的疗效呈上升趋势。Li等[33]利用贝叶斯网状Meta分析探究八段锦、六字诀、太极拳及气功4种中国传统运动对认知功能障碍患者的治疗效果,发现4种中国传统运动对患者整体认知功能均有改善作用,其中八段锦效果最为明显。
3 贝叶斯网络在现代中医诊断技术发展中的应用
传统中医四诊的辨别多取决于主观经验,缺乏客观标准,而以贝叶斯网络等为主体的现代计算机技术为四诊信息的采集提供了客观依据,促进了舌诊、脉诊等中医特色诊断的标准化发展以及中医诊断方法的客观化、规范化。
Wang等[34]提出了一种定量的人体脉搏信号自动识别方法。通过提取特征参数,构建基于贝叶斯网络的识别模型,结果证实该方法可有效识别脉搏信号的深度、频率、节律、强度和形状,有利于推动脉搏诊断的现代化。Pang等[35]建立了一种新的计算机化舌诊系统,利用贝叶斯网络对色度量和纹理度量这两种定量特征与疾病之间的关系进行建模,在455名患有13种常见疾病的患者和70名健康志愿者身上测试了该方法,并证实了其有效性。Yan等[36]基于贝叶斯网络等计算机方法提出了基于像素及低对比度的彩色舌下图像的舌下静脉分割算法,实验结果表明该算法对彩色舌下图像的舌下静脉分割具有较好的效果,且该框架量化的宽度和颜色特征与舌诊总结的诊断标准基本一致。
4 基于贝叶斯网络的中医辅助诊疗系统的建立
中医诊疗强调辨证论治,个体化诊疗一直是中医学的优势所在,贝叶斯网络技术能够模拟人脑的学习和思维的过程,探究症状、证候要素、证型及方药间的关联性,使复杂且高度非线性的中医临床数据可量化,因此已广泛应用于中医药数据挖掘中[37]。除此之外,以四诊技术为核心的现代诊断技术逐渐向数据化及标准化发展[38],舌诊仪、脉诊仪、色诊仪[39]等诊疗仪器的研发促进了中医诊疗客观化发展,这些都为中医辅助诊疗系统的建立奠定了良好的基础。在此基础上,利用贝叶斯网络建立中医辅助诊疗系统,有利于促进中医智能化诊疗的发展。
基于贝叶斯网络的中医疾病辅助诊断系统的构建大致可分为四步:①确定网络变量。根据专家经验和收集到的数据,将与该疾病相关的病位和症状进行统计,作为疾病发生的依据,然后把这些依据作为网络变量,对其数据进行量化处理。②建立模型。依据所选取的数据选择相应的贝叶斯网络结构学习算法,获得贝叶斯网络疾病诊断网络。利用数据选择相应的参数学习方法对网络进行参数学习,获得具有最佳参数设置的贝叶斯网络。③网络推理,后验查询。采集多组患者信息,运用贝叶斯网络进行推理,对可能存在的各类疾病进行概率计算。④疾病诊断分析。比较各类疾病发生的后验概率,概率最大的疾病即为诊断得出的疾病类型。
目前,已有部分学者对此进行了相关探索。贾小飞[40]利用贝叶斯网络建立中西医结合疼痛康复管理系统,对疾病进行中医辨证、病理因素的诊断及最佳治疗方案的推荐,以对康复过程进行智能化、精准化管理。孙亚男等[41]利用贝叶斯算法建立了冠状动脉粥样硬化性心脏病的中医证型诊断模型,发现贝叶斯模型在中医诊断中有着较好的分类性能,可提高临床辨证的准确性。陈曦等[42]建立了基于贝叶斯网络的中医辅助诊疗模型,为患者进行自我早期疾病诊断提供了有效的技术支持。
5 不足与展望
贝叶斯网络技术在中医药研究的诸多领域均已发挥了重要作用,但仍具有不足之处,首先,实现数据分析的客观性需要大样本数据的支持,扩大样本量、提高样本质量是进一步实现数据分析客观性的必要选择。其次,贝叶斯网络算法利用频率进行,一旦出现频率较低的症状、证候要素及证型,算法会在变量筛选的过程中将其舍弃,导致信息获取不够全面,使结果的准确性受到影响[6],因此如何更多地获取高质量样本和精进算法仍然是今后需要不断研究及探索的方向。
贝叶斯网络技术的信息处理过程与中医辨证思维相吻合,目前已广泛应用于中医药数据挖掘及现代化中医诊断技术中,将复杂多样的中医数据转变成客观、可量化的标准。在此基础上,中医辅助诊疗系统建立并不断完善,促进了临床辅助诊疗及远程医疗的发展[43-44]。随着贝叶斯网络技术在中医药研究中的不断深入,建立智能化的中医药诊疗系统将是下一步的发展目标。通过智能化的诊疗系统,进行疾病诊断并提供个体化的治疗处方及调理建议,有助于充分发挥中医药“未病先防,既病防变”的诊疗优势,实现精准化的个体诊疗,同时缓解医疗资源紧缺的状况。今后需进一步加强贝叶斯网络在中医药现代化健康管理中的应用,真正发挥中医药在新时代健康管理中的作用。