基于知识图谱和专家访谈分析杨霓芝教授治疗糖尿病肾病用药规律*
2020-08-01罗粤铭侯海晶卢家言李晓朋刘旭生杨霓芝
罗粤铭,侯海晶,2,卢家言,李晓朋,翁 衡,2,刘旭生,2,周 薇,2**,杨霓芝,2**
(1. 广州中医药大学第二临床医学院 广州 510405;2. 广东省中医院 广州 510120)
糖尿病肾病(diabetic nephropathy,DN)即糖尿病性肾小球硬化症,是糖尿病最主要的微血管并发症之一,也是导致慢性肾功能衰竭的主要原因之一[1]。糖尿病肾病是重要的原发病,且可继发而导致相关心血管疾病。根据美国国家终末期肾脏病(end stage renal disease,ESRD)登记处资料分析显示,从1997 年至2014年的658168名透析人群中,因糖尿病肾病导致的终末期肾脏病患者中,心血管复合事件发生率为14.6/(100 人·年),远远高于IgA 肾病的3.5/(100 人·年)[2],这对世界带来了重大的疾病及经济负担。目前,临床上对于糖尿病肾病主要采用降糖、降脂、控制血压、饮食治疗等综合治疗。除此之外,中医药方面有着独特的优势,中成药如黄葵胶囊[3]、海昆肾喜胶囊[4]等,对延缓糖尿病肾病起到了一定的作用。但在现代医学历来的研究中,虽然针对DN 发病机制各主要环节都曾有过针对性的干预治疗试验,可是在临床实践中,往往由于副作用过大,不能取得满意结果[5]。糖尿病肾病在中医文献中早有记载,属于中医学“消肾”“下消”“肾消”等范畴[6],相关治疗的方药汗牛充栋,显示出中医在防治糖尿病肾病进展中的巨大潜力。名老中医经验系由名老中医通过几十年大样本临床诊疗经验锤炼所得,是中医的重要组成部分。如何系统地继承名中医防治糖尿病肾病的临床经验、挖掘潜在的中医药诊疗规律,显得格外重要。
杨霓芝是广州中医药大学教授、主任医师、博士生导师、博士后合作教授,广东省名中医,第五批全国名老中医药专家学术经验继承指导老师,《国家中医药管理局-杨霓芝全国名老中医药专家传承工作室》导师,国家中医肾病临床研究基地、广东省中医院肾病科学术带头人,从事临床、教学与科研工作40余年,在肾脏病的治疗方面经验独到,在学术上一直提倡以“益气活血法”为基本方法治疗慢性肾脏疾病,并在实际工作中加以具体运用,收效良好。本研究通过知识图谱数据挖掘和专家访谈法,以初步学习和展现杨霓芝教授治疗糖尿病肾病的经验。本文受国家重点研发计划资助(2018YFC1704100,2018YFC1704102)与国家自然科学基金委员会面上项目(61871141)资助。
1 资料与方法
1.1 大数据知识图谱经验挖掘
1.1.1 病例选取标准
病例选取标准:①广东省中医院2007 年5 月至2017年7月十年间,于杨霓芝教授门诊就诊病人,第一诊断为“糖尿病肾病”;②均符合WHO1990 年制定的2型糖尿病相关诊断标准;③尿微量白蛋白UAE 大于30 mg/24 h 或UMA30 mg/L;④排除伴有严重心、肺、肝脏等脏器功能障碍者;⑤排除合并有急慢性传染性疾病、严重脑血管疾病、精神疾病以及肿瘤患者。最后,本研究筛选出78 个门诊患者共256 诊次病例资料,通过广东省中医院大数据团队中医药大数据智能处理与知识服务系统[7](软件著作权号2017SR561055),运用本体模型和深度学习技术的中医(TCM)知识图构建框架进行相关数据挖掘。
1.1.2 数据分析技术
为了方便语义距离计算和语义推理,根据不同的维度将构建的知识图聚合成结构化的矢量表示。矢量表示用于根据临床情景差异重新生成结构化数据集。生成的数据集可以存储到元知识仓库中以供进一步使用。数据集的每个样本都存在于稀疏矩阵中,并被赋予标签列表,其中标签对应于元知识。生成的数据集进一步用于训练递归神经网络(RNN)模型,用于计算给定元知识的知识元素向量集,以发现潜在的隐藏知识,从而构建特定领域的知识图。利用关于中草药频率和知识推理的效应模式,可以将网络中的节点聚合成结构化向量,以反映网络中元知识之间的推论。所有推论向量都有方向和权重。方向用于表示顺序关系。权重值表示关系的强弱。
1.2 专家访谈法研究设计
本研究采用了面对面的专家访谈法,通过相对客观的专家观念和指导,以避免一些相关的潜在偏倚。并确保采访者具有高等教育背景、相应知识背景,以确保访谈的质量和可信度。采访者预先确定好半结构式访谈以获得全面的回答。本采访由杨霓芝名老中医药工作室弟子卢家言对杨霓芝教授在2019 年2月21日进行面对面访谈,持续十分钟。问卷包括以下两个层次进行。分别是开放式问题及深度问题,并依具体情况灵活安排问题顺序和深入访谈的内容,以现场获得的信息为依据进行调整。开放式问题主要向受访者介绍采访:①益气活血的概念;②益气活血法治疗糖尿病肾病常用特色治法及化裁。深入访谈问题主要包括:大数据挖掘名医经验的看法。
整个访谈过程有录音记录,后期逐字逐句转录为书面文字,并根据上下文对语音表达的情感进行记录。访谈者对录音过程进行反思并记录现场回忆录,形成稿件后交回杨教授核对。在后面分析过程中,遇到需要进一步了解的地方,再次联系杨教授进行访谈。
2 结果分析
2.1 知识图谱挖掘结果
2.1.1 中药频次结果分析
基于知识图谱的画像分析与智能推荐可得,杨霓芝教授临床治疗糖尿病肾病常用中药频次较高的(n>100)的药物有甘草(218)、丹参(194)、黄芪(170)、菟丝子(150)、制首乌(146)、桃仁(136)、女贞子(134)、制山萸肉(127)、白芍(120)、泽兰(114)、白术(105)。常用药物中,除了益气活血常用药物外,亦有固护脾胃药(甘草、白术)。反映了杨教授在益气活血主要思想下,亦注重中焦脾胃健运功能的思想。具体详情见图1。
2.1.2 中药配伍结果分析
将常用中药进行知识图谱关联,进一步分析可得中药之间关联关系,箭头代表方向向量,即药物之间的使用聚类,双向箭头可以提炼出双向趋势,即药对。如“覆盆子-金樱子”“太子参-旱莲草”“丹参-黄芪”“当归-淫羊藿”“金樱子-覆盆子-芡实”“白茅根-茜草”“桂枝-泽泻”“红花-赤芍”“麻黄-桑白皮”“苍术-黄柏”“酸枣仁-合欢皮”“牛膝-桑寄生”“茯苓-黄精”等。具体详情见图2。
图1 基于知识图谱的画像分析名医验案中药频次
2.1.3 药物-症状关联结果分析
通过迭代,可得到药物与症状关系,如“尿蛋白/泡沫尿”与“丹参”的关联,“尿血”与“川芎”的关联,提示当病人出现尿血、蛋白尿时,可酌证给予丹参或川芎等活血药物。这也是从深度挖掘角度反映了杨教授益气活血的特色思想。另外,中医四诊亦与处方思路存在的密切关系,如“砂仁”和“苔黄厚腻”“麦芽”和“苔黄厚”“女贞子”和“脉沉弱”都存在单向向量关系,提示在病人出现苔黄厚腻的情况时,可酌症加予砂仁燥湿行气。黄苔主里证、热证,厚苔是胃气夹湿浊邪气熏蒸所致,主邪盛入里,或内有痰饮湿食积滞[8]。当出现苔黄厚时,患者可见食积脘痞,是尚未转为“苔黄厚腻”的节点,可用“麦芽”以佐以健脾消食。具体详情见图2。
2.1.4 药物-疾病-证型分析结果
通过知识图谱,可得到药物-疾病-证型的关系。证,是疾病过程中某一阶段或某一类型的病理概括,一般由一组相对固定的、有内在联系的、能揭示疾病某一阶段或某一类型病变本质的症状和体征构成[9]。本研究主要挖掘在相关疾病及证型中,杨霓芝教授的用药特色规律。如“慢性肾衰”病与“大黄”有着双向关联,提示大黄在慢性肾衰病中为常用搭配药物,值得进一步深入挖掘。据美国、日本及许多西欧国家统计资料表明,DN 已经升为ESRD 首位病因[5]。现代药理研究表明,大黄能减少肠道对氨类物质的重吸收,促进尿素和肌酐的排泄;抑制残余肾单位的病理性增生;提高血清补体水平,增强补体活性,提高细胞免疫功能,减少免疫变态反应的发生;抑制IL-6 等细胞因子的分泌,减轻免疫炎症反应[10],为杨霓芝教授善用大黄治疗DN 和慢性肾衰提供了依据。“藿香”与“脾肾气虚”有着双向关联,提示在“脾肾气虚,湿热内阻”证型的患者中,藿香可作为临床酌证加减药物。另外,“脾肾气虚,湿浊内阻”证与“藿香”仅存在单向关联,提示藿香并非该证型的充分条件,藿香具有芳香化浊,和中止呕,发表解暑等作用,但在同为脾肾气虚的证型下,“湿浊内阻”和“湿热内阻”条件下的不同使用,体现了该药的微调使用规律。具体见图3。
2.2 专家访谈结果
基于以上描述分析,形成糖尿病肾病的治疗主药和加减变化,然后采用专家面对面调查方法,由杨霓芝教授逐一评阅,形成专家访谈意见(表1)。
2.2.1 益气活血的概念
“益气活血”是根据中医气血关系的基本理论,将补气和活血化瘀两大治疗法则相结合,依据糖尿病肾病所处阶段及兼夹证不同辨证给药,纠正糖尿病肾病患者气虚血瘀状态的治法。糖尿病肾病患者存在气虚血瘀证,气虚血瘀证贯穿于糖尿病肾病的始终,故益气活血法适用于糖尿病肾病。
中医理论认为,气为血帅,血为气母。通过益气可以生血、行血、摄血,通过活血祛瘀通络可以消散瘀血,畅通脉络。最终达到气血运行周身,相互调和,发挥正常生理功能的目的。而针对于糖尿病肾病,气虚之脏主要责之于肺脾肾,故益气主要是补益肺脾肾三脏之气。血瘀贯穿始终,是导致糖尿病肾病缠绵的病因及病理产物。此时,患者症见面色晦暗,脉沉涩,故运用活血祛瘀的方法,消散瘀血,畅通脉络。
图2 药物-症状关联分析
临证过程中,杨霓芝教授总结糖尿病肾病疾病在演变过程中可伴肺胃燥热、气阴两虚、水湿、湿浊、浊毒等兼证,但始终以气虚血瘀为主线。根据杨霓芝教授多年临床经验,肺气虚兼见肺燥、肺阴不足,脾虚兼见胃热,肾气虚兼见肾阴不足。早期以肺肾气虚为主,后期以脾肾气虚为主,但始终以肾气虚为主。故在治疗中既要重视气虚,亦不忘血瘀,立足气虚血瘀这一根本,同时要兼顾水湿、浊毒等病理因素,予以泄浊蠲毒等治法。总之,益气活血,即补气活血,此乃补肺脾肾之气,活血祛瘀通络。
2.2.2 益气活血法治疗糖尿病肾病常用特色治法及化裁
益气活血法治疗糖尿病肾病,常用的特色药物如下。益气药包括补肾药及补脾药。补肾药常用盐山萸肉、菟丝子、女贞子、黄精、熟地。补脾气常用黄芪、党参、白术、淮山。活血药包括当归、桃仁、泽兰、川芎、赤芍、丹参、三七。结合药物频次分析、关联分析及杨霓芝教授临床经验筛选可得,杨霓芝教授临床治疗糖尿病肾病常用核心药物组为黄芪、丹参、制首乌、泽兰。详情见图4。
图3 药物-疾病-证型关联分析
表1 益气活血法大纲下常用药物——按功效分类
此外,以益气活血法为主线,可以根据糖尿病肾病演变过程中不同阶段进行化裁。糖尿病肾病早期临床以气阴两虚者多见,常以参芪地黄汤加减治疗。随着病情的进展,患者易出现肝肾阴虚证,常用六味地黄汤合二至丸加减治疗。若阴损及阳,常出现脾肾阳虚证,临床常用实脾饮合肾气丸加减治疗。病变后期可出现阴阳两虚证,临床常选用金匮肾气丸合二至丸加减治疗。具体化裁可分为养阴清燥、养阴利水、养阴化浊和养阴清热。临床中各证型加药可因人、因地、因时不同而适当灵活选用。
2.2.3 大数据挖掘名医经验的看法
名老中医是中医药界的瑰宝。名老中医经验的总结和传承是培养中医新生代人才的重要途径。因此,总结名老中医的学术思想、临床经验和用药规律,对中医药的薪火相传具有重要意义和应用价值。
中医药的传承经过了口传心授、文献记载的过程,但在医学日益昌明的今天,仅仅依靠这些方法略显不足。数据挖掘能从大量数据中揭示隐含而未知,但有价值的信息。采用数据挖掘这一前沿方法,对名老中医临证经验进行研究,可以多维度解析个中规律,分析名老中医临证经验中蕴藏的理法方药,实现名医经验的有效总结与传承。
为了避免一些相关的潜在偏倚,数据挖掘还需要结合实际,进行专家访谈,通过与专家有效的沟通,让专家结合临床进行指导,才能总结更加贴合实际的名医经验。更值得注意的是,数据挖掘前,病例纳入标准和排除标准值得研究者仔细斟酌考量。纳入标准如疾病诊断需明确;患者依从性要高,按时随诊一年以上,规律坚持用药;临床疗效好,包括症状改善,实验室指标表明病情进展速度低于平均水平,病情稳定甚至好转。排除标准如自服未知药物等。
图4 结合药物频次分析、关联分析及杨霓芝教授临床经验筛选常用核心药物组
3 讨论
名老中医经验是中医传承发展的重要组成部分。总结名老中医的学术思想、临床经验、和用药规律,对中医药的薪火相传具有重要的理论意义和应用价值,也是中医药创新发展的源泉[11]。
杨霓芝教授学术思想渊源于《内经》《金匮要略》《难经》等中医经典理论,并受李杲、张景岳、王清任等中医名家学术思想的影响,博文广见,师古创新。在长期的临床实践中,杨霓芝教授认识到气虚血瘀贯穿糖尿病肾病始终,其因气虚而发病,因血瘀而致疾病迁延难愈,其中气虚为本,血瘀为标,二者互为因果,构成本虚标实、虚实夹杂的病机特点,“气虚血瘀”是贯穿慢性肾脏病发展始末的主要病机[12],并依此提出“气血之要,古今脉承;气虚血瘀,肾病之由”的学术思想,主张以益气活血法治疗肾脏病[13]。
既往对于名老中医经验数据挖掘,多着眼点在于对名老中医用药情况的自然语言处理,采用频数分析获得高频中药或方剂[14],将常用中药进行归经分析及四气五味归纳[15],聚类分析获得方药群组[16],关联规则分析获得关联药对或核心药物组[17],或采用神经网络法,决策树法,复杂系统熵聚类、无监督的熵层次聚类等复杂计算形成核心药物网络[18]。这对于显性描述的知识是有效的。但名医经验中的隐性知识,如蕴藏在病案内的症状、中医四诊、辨证处方、随症加减、中药配对等复杂知识关系,并不能准确客观的表示出来。另一方面,这些研究方法并不能呈现出知识元的空间关系,很难评判知识效果。机器挖掘、深度学习技术,往往容易因数据量不足,而产生偏倚结果,此时,需要中医学专业人士加以进行筛查。
本研究通过跟诊学习,收集十年的相关病历资料,并结合人工智能领域的语义网络和本体技术,分别定义整理患者就诊情况、中药处方、多次就诊症状及处方变化等信息,构建名医验案本体库。计算机根据领域知识的定义,运用真实案例+知识本体构建,从定义显性知识关系,到层次化的知识集,进而应用深度神经网络(DNN)对知识集中知识元进行无监督的空间向量学习,利用学习到的知识元向量,通过多轮的迭代后达到知识元预测误差和空间向量的平衡,得出向量变化趋势。通过知识元向量训练的方法,过滤提取出客观的知识关系并进一步融合了知识向量的学习,使结果客观、分析可视化(知识地图)、样本空间稳定,为进行知识聚类和隐性知识的挖掘打下良好的基础。
结合知识图谱,并通过两位工作室跟诊学习的弟子进行初步筛查结果总结临床经验,再由高年资医生指导后,提呈杨霓芝教授本人过目指点,最终提炼出最后结果。形成了“跟诊学习-机器挖掘-资料再学习”的过程,有效避免了单纯跟诊学习的不全面性,及单纯机器学习造成的偏倚。总结出杨霓芝教授治疗糖尿病肾病临证经验中,常用药物、药物关联、药物-症状关联、药物-疾病-证型关联三个层次的结果。这些是既往研究方法所不具备的。
但本研究尚存在需要提高的部分:一是样本量未能形成大数据规模,导致部分知识未能由机器识别学习。亦是知识图谱中一些碎片化知识未能形成临床意义的原因。二是目前研究只局限于经验挖掘,并未深入到机制研究部分。下一步拟通过网络药理学等辅助进一步深度挖掘名老中医经验,以更好的继承学习,为临床服务。