数据挖掘技术在藏药方剂配伍理论研究中的应用进展*
2022-03-28才让南加文成当智
才让南加 ,藏 吉 ,文成当智 ,张 冰
(1.青海民族大学药学院 西宁 810007;2.北京中医药大学中药学院 北京 102488;3.北京中医药大学中药药物警戒与合理用药研究中心 北京 102488)
藏医药历史悠久、源远流长,是藏族文化中最为璀璨的瑰宝,是我国传统医学的重要组成部分。藏族先民在与疾病的斗争中,积累了诸多诊治经验,并在此基础上发展成为理论体系完整、临床经验丰富的独立医学体系。藏医药在长期的发展过程中,藏医学家们留下了大量的藏药方剂资源宝库。2000年以来,国内启动了多项藏医药古籍文献整理出版工程。青海省藏医药研究院整理出版了《藏医药经典文献集成丛书》,至今已出版发行121部古籍,以及《藏医药大典》,共60卷;西藏自治区藏医院整理出版了《中国藏医药影印古籍珍本》丛书,共30卷;西藏藏医药大学整理出版了《雪域藏医历算大典》丛书,共130卷。这些古籍文献的整理出版具有里程碑意义,对藏医药诊疗技术的抢救、传承、保护与创新起到了重要作用,为藏医药诊疗规律、配伍理论研究奠定了文献基础。
众所周知,方剂是连接“医”和“药”的桥梁和枢纽,藏药方剂的整理、挖掘、开发是促进藏医药发展的关键。在藏医药理论指导下研究藏医优势病种方剂配伍规律,能够揭示历代藏医药名家的组方思路和深层理论,可以挖掘我们未曾发现的“基本方”和辨证配伍法则等潜在的、有用的规律和知识[1],从而进一步完善藏药方剂配伍理论,指导临床用药和新药开发,提升藏医药学科内涵和临床实践水平。
近年来,藏药方剂配伍理论研究成为藏医药领域的研究热点,学者们基于藏医药古籍文献和临床用药数据,分别针对治疗某种疾病的方剂、或以某一种或几种药物为主配伍的方剂开展数据挖掘工作,探讨了藏药方剂配伍规律及其深层的理论,发现藏药方剂配伍具有科学性、严谨性和实践性强的特点,且“味性化味”理论是最主要的配伍理论[2-5],为藏药方剂的研究开发奠定了理论基础。然而,依然存在研究方法单一,缺乏研究深度与广度,研究成果尚未形成系统性等不足之处。本文通过系统梳理数据挖掘在藏药方剂配伍理论研究中的应用,总结现阶段研究的优势与不足,并展望未来的研究和发展方向,以期与同行共勉之。
1 藏药方剂配伍理论结构框架
藏药方剂是衔接藏医药理论与临床的枢纽,是藏医重要的防病治病手段,蕴含着历代藏医大师的智慧结晶,贯穿整个藏医药理论与实践。《四部医典》[6]提出“六过六反”警戒理论,“十要素”组方理念,君臣庶民配伍理论,同效多药联用配伍法,引经药与“调和”药配伍法为主的合理配伍理念,以及“味性化味” 核心配伍理论。藏医学认为[2],药物有“六味”“消化后味”“八性”“十七效”等不同层面的属性,疾病有“三因”“热寒”“二十个特性”等不同维度的属性,通过药物的“味”特有的“热”“锐”等“性效”对治“三因”的“寒”“钝”等“特性”,是藏药方剂配伍的核心理论。《四部医典》详细记载了“药味”配伍法、“药性”配伍法和“消化后味”配伍法,然而,因内容比较抽象,加上在古籍文献中没有详细描述具体方剂的六味、八性、十七效配伍,藏医药学家们对该理论的掌握度和应用能力弱化,致使在当今临床上辨证配伍比较少见,成为制约临床疗效和藏医药发展的一个重要因素[1]。以藏医药经典文献和临床用药数据为基础,挖掘藏药方剂配伍规律以及内在的“味性化味”配伍理论,有助于推动临床用药精准化。
2 藏药方剂配伍理论研究常用的数据挖掘平台和方法
2012年,笔者借鉴中药方剂配伍规律和相关领域的研究方法,结合藏医药学自身的特点,首次提出利用关联规则、分类与回归树分析技术等数据挖掘方法研究藏药方剂配伍规律的研究思路与方法[1]。此后,基于数据挖掘的藏药方剂配伍规律研究报道逐年增多,现已成为该领域的一个研究热点。目前通用的数据挖掘平台包括中医传承辅助平台[2-5],Cran R[7-8],Python[9-10],SPSS modler[11-12]等软件。Cran R 和 Python入门要求相对较高,但功能强大且具有较高的灵活性。中医传承辅助平台和SPSS Modler具有友好的人机交互功能和简单易用的特点,但不支持藏文;中医传承辅助平台未集成藏药方剂信息,录入方式不够简便,其“五味”“四气”“归经”等功能不适用于藏药方剂配伍理论的挖掘。
在藏药方剂配伍研究领域,目前使用的数据挖掘方法主要包括频数统计、关联规则、聚类分析、BP神经网络、偏序结构等方法[4,8,13-15]。频数统计、关联规则、BP神经网络等均属于以频率为核心的挖掘方法,从而研究结果更倾向于高频性、普遍性药物,能挖掘方中核心药物组或基本方,在藏药方剂配伍研究中成为主流的挖掘方法,但难以揭示敏感、特异、关键组方药物,且无法体现“药-量”相关规律,研究结果无法体现剂量对方剂的影响。偏序结构刚好与关联规则分析互补,能够挖掘敏感特异性关键药物。聚类分析可挖掘方剂间用药相似性和剂量相似性,但是非关键药物对研究结果的影响较大。
祁晋东等[16]结合BP算法率先采用Deep Belief Network对藏药配伍规律进行研究,揭示了方剂中隐藏的内在规律,提高了研发效率,认为DBN在藏药方剂配伍规律方面将会有更好的应用前景。王雪茜[17]引入药物原子组合思想,通过改进ECLAT算法、改进CBA算法、改进K-means算法,建立了“症状==>用药”辅助决策模型、“症型==>用药”辅助决策模型,模型预测准确率分别达到76%和76.5%。因改进的方法是依据藏药方剂的特点而改进,故针对性更强、挖掘的结果准确率更高。文成当智[10,18]为探索方剂配伍中藏药药性理论,首次提出并构建了“味性化味”矢量结构模型,整合了组方矢量、剂量矢量、配伍矢量,分析了方剂六味、三化味、十七效等配伍关系,实现复杂药性到数学模型的量化方法,为藏药药性配伍理论的研究提供了新的方法,但该方法的合理性和准确性仍需在临床实践和方剂配伍中验证。
3 数据挖掘技术在藏药方剂配伍研究中的应用
3.1 在心血管疾病方剂配伍研究中的应用
心血管疾病作为危害高原人群的主要病种,藏医药在长时间与其斗争中积累了宝贵经验,且具有良好疗效。高原红细胞增多症(HAPC)是一种常见的高原病,更藏加等[19-21]认为HAPC俗称“多血症”,属于血隆症的范畴,并在《四部医典》等藏医药古籍文献中整理治疗HAPC的210首方剂,应用中医传承辅助平台软件(V2.5)集成的频次统计、组方规律、关联规则分析、新方分析和证型分布等数据挖掘方法,挖掘出了诃子、木香、红花、余甘子、肉豆蔻、豆蔻、丁香、木香、天竺黄、毛诃子等高频药物,演化得出新处方11首。HAPC是一种现代医学的专业术语,藏医病证与西医疾病存在“一对多”或“多对一”的对应关系,因此,笔者认为在筛选治疗HAPC的方剂时,必需辨证筛选藏医病种和方剂,以治疗多血症或血隆症的方剂挖掘结果来决策HAPC用药规律,能否如实揭示藏医治疗HAPC的用药思路,有待进一步探讨。
贡保东知等[12]基于479例萨滞布病(中风后遗症)临床病案,分析发现二十味沉香丸、如意珍宝丸、七十味珍珠丸的用药频率最高,且存在清晨用七十味珍珠丸,早上用如意珍宝丸,中午用十八味杜鹃丸,晚上用二十味沉香丸的时辰用药规律。才让吉等[2]从《四部医典》《实用藏药宝库》等藏医药文献中收集80首治疗萨滞布病的方剂,采用规则分析、改进互信息、熵聚类、无监督的熵层次聚类等方法,发现麝香、肉豆蔻、诃子等高频入方药物,诃子-肉豆蔻、丁香-诃子、麝香-诃子等常用药对,并总结了祛隆驱寒、开窍辟秽、协调三因的配伍思想。以上两项研究一个以藏医文献研究对象,而另一项以临床用药数据为研究对象。从两项研究结果看,都注重抑制隆病的治疗原则,也有共性药物,但未开展文献与临床方剂比较研究,未能挖掘出古今用药的共性与差异性。
有学者基于137例临床医案,采用数据挖掘、Gephi等方法和软件,分析发现以二十五味余甘子丸、七十味珍珠丸、八味沉香丸、三味甘露散等核心方剂,且关联度很强[22]。该研究根据入药剂量,提出了组方药物的相对用量分析法,并发现诃子、余甘子、木香、沉香的相对用量最多。治疗高血压的方剂总体上以凉、钝、稀、糙等效能为主,其机理是清血热、稀化血液、通脉络堵塞。该研究凝练出了“清血热-通脉络-调胃火”三位一体的治疗原则,构建了“疾病-证型-方剂-药性”的研究模式,对藏医临床用药规律研究具有一定的借鉴价值。
3.2 在胃肠疾病方剂配伍研究中的应用
胃肠疾病作为藏医药的优势病种,其方剂配伍规律研究相对较多,有学者基于《藏药标准》《常用藏成药诠释》以及知网数据,利用中医传承辅助平台及其集成的数据挖掘方法,发现治疗慢性萎缩性胃炎等胃病和消化不良的方剂主要以补胃火、祛培根寒症为主,诃子、荜茇、红花、白豆蔻、石榴等为高频入方药[23-25]。仁青东主[4,26]等人通过挖掘萎缩性胃炎临床用药规律发现,常用药方有六味木香散、六味寒水石散、八味野牛血散、五味石榴散等具有健胃生“三火”助消化之效的方剂,诃子、木香、红花等为高频入方药。发现其组方以畅通胃之血气、调理三胃火、抗炎消炎为主,与四川南派藏医[27]在治疗胃病方面的方剂配伍大致相同,有异曲同工之妙,但是未进一步从六味、八性、十七效多维层面阐释其深层配伍理论。以上研究结果可以看出,始载于《四部医典》的四味石榴散(石榴子、肉桂、白豆蔻、荜茇)是治疗多数胃病和消化不良的基本方,延用至今并衍生了多个经典方剂。
格日多杰[11]等在多家医院收集了2613例藏医治疗慢性胃炎的医案,发现五鹏丸、仁青芒觉、六味能消散等为主要方剂,诃子、石榴子、木香等为核心组方。入方药以甘味、苦味、辛味药为主,具有凉、钝、重、糙等性效,从而对治因热、锐特性偏升引起的胃热、胃肠糜烂等疾病。然而,以西医诊断为依据开展用药规律研究时,必需考虑病情变化、并发症、藏医症候分型情况,以及藏医时辰用药的特点,否则会降低研究结果的实际价值。同时,临床用药规律研究还会受到诊疗水平、用药习惯、传承派系、医保政策和药品价格等多因素的影响,干扰挖掘结果,因此临床用药规律研究项目需采用多中心、大数据、真实世界的分析模式,以得到较为客观的研究结果。
3.3 数据挖掘在肝胆疾病方剂配伍研究中的应用
笔者前期挖掘了《四部医典》记载的212首治疗热性肝病的方剂,利用关联规则分析法挖掘出了诃子-毛诃子-余甘子;天竺黄-牛黄-藏红花-兔耳草-印度獐牙菜-甘青乌头;鸭嘴花-天竺黄-藏红花-印度獐牙菜-牛黄等用药组合,并发现治疗热性肝病的方剂以甘味药和苦味药为主,具有凉、钝的性效,认为“味、性、效”理论是藏药方剂配伍的核心理论[8]。有学者对国医大师尼玛治疗乙肝的104首方剂分析发现,高频药物以苦味和甘味为主,辛涩味为次[28];在十七效层面以钝、凉、重、稀、糙等为主,说明兼顾赤巴和隆的调节,与《四部医典》治疗热性肝病的方剂配伍理论[8]有高度的相似性,说明藏医配伍理论与临床实际用药原则相吻合,揭示藏药方剂配伍理论在当今临床上依然发挥着高度的指导作用。
表1 针对不同病症的藏药方剂配伍理论研究情况举例
续表
3.4 数据挖掘在黄水病方剂配伍研究中的应用
黄水是一系列骨关节疾病和皮肤病的病理基础,真布病(关节炎)和咋乃(痛风)均属于藏医黄水病的范畴。彭毛东主等[29]基于国医大师尼玛治疗“真布”病的222例医案,应用关联规则、聚类分析、决策树等分析发现,以清热止痛、干黄水、舒筋活络、消肿散结类方剂为主。此类方剂以苦味、甘味、辛味药为主,分别对治赤巴的热、锐和隆的轻等特性。该研究结合藏医时辰给药和多方剂联合给药的特点,发现在国医大师尼玛依据外在五源与内在三因的变化规律,清晨以止痛和通经活络药为主用药,早上以干黄水和升胃火为主,中午以干黄水和消肿散结为主,晚上以调“隆”和干黄水为主用药,这4个时段用药频率最高的药分别是十三味鹏鸟丸、二十五味儿茶丸、十八味党参丸和三十五味沉香丸。该研究体现了藏医时辰用药特点,时辰用药规律是基于“医算结合”学说的一个用药特色,在数据挖掘中应当重视。另有研究基于文献整理,得到治疗真布病的118首方剂,并对配伍规律进行分析[30],但以上研究均未从“味、性、效”理论角度深入探究其用药和配伍理论。一项基于1902例藏医治疗“真布”(类风湿性关节炎)病有效临床医案的研究[31],应用藏医方-药-性-效信息化平台,分析发现以二十五味驴血丸、如意珍宝丸、五味麝香丸等为核心方剂,凝练了以“凉-甘苦味-苦化味-凉钝-热锐-赤巴-热”为主体的药性组合模式,具有“调节黄水-对治血热-协助胃火”的内在用药规律。
泽翁拥忠等[32]基于藏医文献和中医传承辅助平台,对113条藏药治疗咋乃的方剂做了关联规则分析,发现以清血瘀血热、干黄水、疏理气机、调节血液的三果(诃子、毛诃子、余甘子)和三黄水药(决明子、黄葵子、乳香)为核心,同时辅以针对不同证型的药物进行辩证配伍,标本兼治,重在治本。综上,藏医治疗黄水病呈现出“解病因为先,除黄水为主,安置精华为后”的递进式治则治法,为藏医治疗黄水病提供理论参考。
3.5 以特定入方药材为主的方剂配伍规律研究
如上所述,除了针对不同病症开展藏药方剂配伍理论研究外(见表1.),有学者以冰片、诃子、翼首草、石榴等常用藏药材为切入点,分析了用药特征,发现了与目标药物联用频率高的药材、药对以及针对某种疾病的核心药物组[6,15,33-37],如:含冰片的藏药方剂主治肺热、瘟疫、肝热病等热性疾病,冰片常与天竺黄、红花等凉性药材联用,方剂在整体上以苦、甘、辛味药为主,具有凉、钝、稀等效能[36]。含翼首草的方剂主要用于治疗外感湿热、秽毒类病证、发热类、关节炎等疾病,所配药物多具清热解毒、消炎、祛风除湿等功效,亦常与清热类药物配伍应用[6]。可见,这种研究方法对进一步明确特定藏药的作用和功效具有一定的价值,有利于从“老药新用”角度为开发新药提供新的思路。这些研究挖掘出了藏药方剂的配伍规律,对临床用药提供了参考,但是其深层的配伍理论和组方思路未作进一步探讨。
3.6 藏药方剂配伍中的“味性化味”理论研究
藏医《四部医典》记载,“味性化味”是藏药方剂配伍的核心理论,是藏医原创的药性理论。任小巧等[38]学者提出,开展藏药方剂研究及临床应用应遵循“味、性、效”与疾病“对治”配伍原则。文成当智等[18,39-40]基于藏药“味性化味”,构建矢量结构模型,并对92种常用藏药方剂分析发现,该模型分析结果与其临床功效具有很高的拟合度和解释度。这进一步证实了六味、三化味、十七效对治三因和疾病的二十种特性的配伍理论在藏药方剂配伍理论中的普遍性。虽然其构建的藏药“味性化味”矢量结构模型算法有待进一步探讨和验证,但直观地量化了藏药方剂的药性,能反映出“味”、“性”、“效”配伍理论和其临床意义,对藏药方剂配伍理论的研究具有一定的推动作用。
综上,在藏医药基本理论框架下,合理引用数据挖掘技术,能够有效而快速地发现隐藏在复杂的藏药方剂背后的内在规律,是揭示历代藏医大师用药经验的有力方法。近年来,以Apriori算法为核心的关联规则方法在藏医药研究中发挥着重要作用[15],为藏药方剂配伍规律研究提供了方法学基础。在今后研究中需根据藏医理论和临床的实际需求,不断改进算法,守正创新,使研究结果更能切合藏医药思维模式。
4 存在的问题
4.1 藏药方剂信息数据库建设相对滞后,数据挖掘效率偏低
随着信息化时代的到来和人们对传统藏医药的需求增加,信息化建设工作成为发展藏医药的关键。然而,因经济条件和科技水平的制约,藏医药信息化工作起步较晚,且现有藏药数据库规模和数量有限。2000年后,先后虽有部分藏医药相关数据库问世,但未能得到较好的推广,数据信息共享度不高,在信息体量和完整度等方面与中医药数据库、国外医药数据库等有着较大差距。权威方剂数据库的缺乏给藏药方剂数据挖掘工作带来了很大的难度,研究者往往需要在大量的古籍文献中搜集整理相关方剂,不仅费时费力,耗时且容易遗漏信息,成为制约藏药方剂配伍研究的重要因素。
4.2 符合藏医药理论特点的分析软件缺乏,增加数据挖掘工作难度
目前藏医药文献绝大多数以藏文文种记载,如要得到高水准的藏医药研究成果,不得不借助现代计算机和网络方法,但多数软件均不支持藏文文种,且由于藏文语法结构和藏医药自身理论框架的独特性,诸多数据挖掘算法直接应用于藏药方剂配伍研究,会使结果与藏医药理论相背,无法挖掘藏医药核心学术思想。因此,根据藏医药自身理论,急需开发“守正创新”的藏医药研究工具,促进藏医药复杂而多维理论的可视化、直观化研究。
4.3 名词术语缺乏统一性,影响结果的准确性
现有汉译版《四部医典》《蓝琉璃》等相关文献普及性更高,因此部分研究基于此类中文文献进行数据挖掘。然而,藏医药文献的中文翻译版存在名词术语不统一、翻译过程中有部分信息丢失等现象,而名词术语的统一性是影响数据挖掘结果的关键。为保证研究结果的可信度,以藏文原始文献为数据来源,利用数据清洗方法工具,在保留原文的基础上依次进行数据清洗,开展相关研究工作为佳。
4.4 藏医与西医病名的差异性,影响方剂筛选的严谨性
以现代医学疾病为切入点开展数据挖掘工作时,不能简单地将藏医病症和西医疾病“等同化”。有学者从《四部医典》《甘露本草明镜》《蓝琉璃》等相关书目中收集用于治疗“高原病”的方剂531首,并通过中医传承辅助平台进行了数据挖掘分析,但是依据哪些藏医病症筛选未作说明[41]。该文已发现藏医经典中没有出现“高原病”的名词,认为民间广为流传的“腊毒”既是“高原病”,但“腊毒”是部分地区对高原反应的俗称,不同地区对其称号也有差异,并非藏医学专业名词术语,藏医药古籍文献中,以“腊毒”记载的病症和方剂极其少见。目前藏西医结合研究基础相对薄弱,在尚无足够证据证明藏医病名与西医病名高度相似性的前提下,将藏医病名与西医病名机械地、单一地“等同化”处理,并筛选方剂的做法缺乏学术严谨性,其挖掘结果的科学性有待进一步探讨。
4.5 藏药方剂配伍理论研究缺乏深度与广度,创新度不高
“味性化味”理论是藏药方剂配伍的核心理论,但部分学者未从六味、八性、十七效等层面深入探讨配伍理论,有时按四气五味等中医药理论角度探讨藏药方剂配伍理论[34],这种结合可能是一种值得期待的研究方向,但无法挖掘出藏药方剂的核心理论。
“味性化味”理论外,《四部医典》还记载了“君臣庶民”理论,与中医的“君臣佐使”理论有异同之处,“君臣庶民”理论有两层含义,一是与中医相似,在一个方剂里按每个药的作用发挥不同,分为君、丞、妃、王、子等不同角色,另一层含义是按药效强弱和其针对性,将方剂归为君方、臣方、庶民方等。“君臣庶民”理论也是重要的方剂配伍理论,但是鲜有研究涉及该领域。
除了藏医药自身理论角度探讨方剂配伍理论外,因药效物质基础层面探讨藏药方剂配伍理论的研究非常少见,难以体现客观实在的物质基础和药理机制,藏药方剂配伍的合理性与有效性缺乏科学理论依据,成为制约藏医药现代化和走向世界的重要因素之一。因此,需要通过“药性理论+效用物质”的研究方式推进藏医药现代化进程。
剂量作为影响方剂功效的主要指标,在目前的数据挖掘研究中的涉及很少,未能挖掘针对不同病症的药物剂量变化规律。
5 展望
藏药核心关键技术是炮制和方剂,其中方剂作为连接“医”和“药”的桥梁和枢纽,对其研究是藏医药研究的关键。数据挖掘是从海量数据中揭示隐含的、先前未知的、有潜在价值的信息挖掘过程。近年来,基于数据挖掘的藏药方剂配伍规律研究日益增多,对藏药方剂的传承和名老藏医经验的继承发挥着重要作用。数据挖掘的基础是构建数据库,然而藏医药领域信息化程度不高,可用的方剂数据库较少,致使研究效率低下。藏医药文献名词术语不规范,“一物多名”和“一名多物”现象普遍,需要用专业知识结合上下文或功能用途考证后统一,为数据挖掘和方剂配伍理论研究工作带来了诸多困难。因此,构建权威、专业的藏药方剂数据库和名词术语标准化工作是亟待解决的科学问题。
藏药方剂配伍理论研究起步较晚,因此该领域的研究尚未形成系统性,有待进行系统、完整、深入的研究。首先,方剂信息收集应全面、系统:从藏医药古籍文献、现代文献,以及以医联体为单位的多中心搜集临床用药数据和名老藏医经验方。其次,在使用粗糙集理论、神经网络、关联规则和聚类分析等经典数据挖掘方法的基础上,通过信息技术、人工智能、藏医药等多学科的合作,攻克关键技术难题,开发更加适用于藏药方剂挖掘特征的算法和软件,以便深入挖掘配伍理论。再次,系统地挖掘“方-证”、“方-药”、“药-证”、“药-症”多维、多层关联,揭示藏药组方的“君臣庶民”“组方十要素”等配伍理论。在此基础上“味”“性”“效”“消化后味”等药物因素与疾病的二十种特性相结合探讨针对不同证型的方剂配伍异同性。最后,从药学物质基础层面开展数据挖掘工作,发现针对不同藏医病症的核心物质基础,结合网络药理学、分子对接技术等方法预测其作用机制[42-47],并通过实验研究进一步探讨传统藏药配伍理论与生物学基础间的相关性,从而以广度和深度兼具的方式挖掘方剂配伍理论。同时,针对不同时代文献,不同传承派系文献中记载的方剂进行归类和比较,现代临床用药和古籍文献进行比较,从而研究藏药方剂的演变史。
方剂配伍理论研究的水平和掌握程度可影响临床疗效和学科发展水平。研究方剂配伍理论可挖掘我们未曾发现的“基本方”、辨证论治用药法则等潜在的、有用的规律和知识,研究成果有助于藏医药文化传承和临床用药指导,对藏医药学术体系研究、藏药方剂发展史研究都具有重要的参考意义。同时,在藏药方剂配伍研究基础上,创制新药,研发针对新发疾病和现代疾病谱的藏药复方,以期提高藏医药的守正创新能力和综合服务能力。