APP下载

基于数据挖掘的肾系水肿茯苓运用研究*

2019-03-06罗粤铭黄馨怡卢家言刘旭生

世界科学技术-中医药现代化 2019年10期
关键词:条文方药古籍

罗粤铭,翁 衡,2,黄馨怡,卢家言,刘旭生,2,张 蕾,2**

(1.广州中医药大学第二临床医学院 广州 510405;2.广东省中医院 广州 510120)

慢性肾脏病(Chronic Kidney Disease)已成为全球重大的公共卫生健康问题之一。在几千年传承发展过程中,中医古籍记载了大量有关慢性肾脏病相关的临证经验,为后世学习古医家经验提供了知识之源。我们前期研究证实古籍条文中记载了大量慢性肾脏病相关的治疗方药[1]。本研究通过选取肾系水肿进行古籍研究,并用对其中最关键药物茯苓进行深度关联,为茯苓进一步研究及临床推广奠定基础。

在知识图谱(Knowledge Graph)技术方面,我们采用广东省中医院大数据研究团队研发的基于本体知识库和深度学习推理建模技术而建立的中医知识图谱构建框架[2]。该框架结合中医药学源远流长的特点,对中医药理法方药知识一级分类13 个,二级分类116 个,核心知识元:59000+,扩展知识元50 万,实例(知识单(病证、本草(中药)、方剂、医案),数量为:215000+,三元组(Triples)关系数量:1000 万+。可以用于挖掘潜在的隐藏知识,还可以用于协助临床医生进行学术研究、临床决策支持、知识检索等。从而能够帮助临床医生进行高效的隐性知识发现。本文通过专科医生人工筛选配合计算机信息抽取分类,建立了肾系水肿中医知识图谱。并通过知识图谱分析,对肾系水肿中最重要的中药——茯苓进行了深度挖掘,以期从“核心药物归纳总结——药物知识地图与网络构建——药症关联聚类分析——隐性知识发现与实例推荐”几个方面对茯苓逐层深入分析,并通过全国名老中医药专家验案库对结论进行验证,从显性认识和隐性知识可视化两个角度,整理古今医家运用茯苓治疗肾系水肿的经验,为茯苓的临床认识及运用提供新的思路和方法。

1 研究方法

1.1 确定研究文献来源

来源于广东省中医院大数据团队开发维护的《中医药古籍文献知识服务平台》,该平台收录了从春秋战国至1949年,超过1 100多部医学古籍,汇集了大量抄本和孤本,古籍来源完善,并提供文献检索和条文提取和分类标注等功能。结合该系统的中医药古籍文献挖掘规范操作流程,写入中华中医药学会《中医药整体证据研究的标准化操作规程》。

1.2 确定检索词

以初定的古代病名为检索词,以探究肾系水肿的方剂认知。由于水肿为肾系疾病最常见症状,在古籍中记载数量广泛,故以“水肿or 浮肿”为关键词,利用文献检索工具进行检索。

1.3 条文梳理及相关度判断

构建古籍数据库对初步检索到的古籍条文,按照分类,由2 名从事中医肾病临床工作3 年以上的中医师对肾系水肿的相关度进行判断,提取最终确定相关的古代条文,对条文中有关肾系水肿描述的条文进行归纳梳理。

1.4 纳入流程

由于肾系水肿为近现代医学发展后的概念,古籍方药条文均仅以病症描述,继施以用药。而多种可导致水肿的原因往往不容易鉴别,为从病症描述中判断筛选肾系水肿的条文进行筛选归纳带来了一定的难度。故本研究采用双人两轮筛选模式,第1轮筛选由2名从事中医肾病专业的中医师对古代条文进行判断,将明显不属于肾系水肿的条文进行剔除,并形成文献筛选标准。第2轮筛选利用文献筛选标准进一步筛除非肾系水肿条文,并对肾系水肿相关条文进行标注,整理纳入本体数据库中。未能确定,或判断不一致的古代条文交由中医肾病副主任以上医师讨论进行最终确定,提取最终确定相关的条文,对有关水肿的条文进行归纳梳理。同时排除成书年代不详古籍和重复条文。

1.5 排除标准

参考现代医学对水肿的定义,根据古籍内容进行了进一步细分筛选,完善筛除标准,排除心源性水肿、局部水肿、营养性水肿、肝源性水肿、内分泌性水肿等,其他明显非肾性水肿又不能归纳为某一类型水肿的条文,则统一归纳为“非肾病性水肿”一并排除。

1.6 对肾系疾病知识体系定义形成知识编码

大数据知识显性化与智能处理系统在融合斯坦福大学本体知识构建7步法基础上实现了条文检索与分类——信息分类抽取——用户定义/扩展知识体系——深度学习知识语义空间构建的人机协同知识图谱构建工作流。

(1)肾科医生利用系统进行文献/验案全文检索和条文分类,按研究计划以“水肿or 浮肿”为关键词检索条文11893条,经筛选后逐一整理,筛除明显非肾系水肿相关条文,将描述模糊、不能排除的纳入下一步讨论筛选。初步整理筛除明显非肾系水肿5257条,整理纳入有效条文6636 条。将纳入6636 条有效条文进行筛选,进一步排除“局部性水肿”“肝源性水肿”“营养性水肿”“心源性水肿”等非肾性水肿相关条文。

(2)信息分类抽取部分是本体知识构建中的对现有共享概念体系的重用;知识图谱模型将对条文进行信息抽取和病、症、理、法、方药、针灸等7个大类、20余个子类标准化分类的实体识别,并统一规范标准化(病症证理法方药等)药物名称,制法与用法等;

(3)肾科医生根据肾系疾病特点,定义/扩展知识体系按照本体分析一方面通过系统改进的protege 知识树模块对术语概念体系进行进一步增补和扩展新的语义类型和语义关系,例如形成以疾病为纲的方证关系、药症关系;另一方面利用系统的进行肾系水肿的领域知识概念内涵完善,力求实现精准的本体及其属性对名医验案和文献条文的语义标注和关联;

(4)基于定义的肾病知识体系和文献验案库,中医药知识图谱自动化构建框架将在原知识图谱模型基础上,利用Fine-tune 方法学习新的知识元组,量化用户领域知识语义空间,实现进一步的肾性水肿古籍库的知识关联分析挖掘。

2 结果

2.1 肾系水肿古籍核心药物归纳总结

2.1.1 药物频数分布分析

药物特征分布地图中发现茯苓为使用频率最高的药物(图1),古籍中共提及频率达3 600 余次(包括方剂组成、药物加减化裁描述等),词云图显示茯苓按权重比为最关键的药物,其他药物如白术、甘遂、防己、甘草等也处于权重较高的关键位置(图2)。

图1 药物特征分布地图

图2 药物-肾系水肿相关性词云图

2.1.2 方药频次分析

对方剂及中药的初步挖掘结果可得病症证理法方药核心及扩展知识元数为61 360 个,方剂共4 013首方,1 052味药,三元组关系数为872 292个。在中药频次统计上(图3),使用频次前十位的药物分别为“茯苓(1 063)、陈皮(809)、泽泻(728)、白术(698)、甘草(603)、葶苈子(588)、木香(564)、桑白皮(525)、槟榔(454)、防己(433)”。其中茯苓为唯一一味使用频次超过一千的中药。

2.2 药物知识地图与网络构建

通过人机结合的知识图谱深度学习得到知识向量,并融合病证症理法方药的信息,进一步推理得出药物之间的关系。药物功效主治、临证应用越相近,其关系越紧密。我们利用复杂网络筛选出古籍文献中重要药物组合,并利用网络社群聚类的方法将药物关系进一步区分出若干群组,以便于分析疾病用药的核心思想。

从肾系水肿总结的病症证理法方药入手,通过机器学习药物关系并进行网络构建,以使药物之间的关系更直接清晰化。如图4 所示,由机器学习按照不同属性将药物共分为10 类。与茯苓相同类并关联的药物包括:白术、白芍、当归、川芎、黄芪、人参、独活等,形成一个药物聚类图。

图3 方药频次分析

图4 药物知识地图与网络构建

同时茯苓又与陈皮类(蓝色)、泽泻类(黄色)中药具有相关,可为进一步药物关联组合提供思路。

2.3 茯苓相关药-症方面热图层次化聚类分析

进一步的我们通过茯苓古籍文献中出现相关的中药和相关症状的语义关系进行重点分析,这里我们用了热图层次化聚类分析。关系强度的区间由蓝色到黄色过渡,颜色越亮表示关系强度越强。上方和右方则是根据关系强度进行的层次化聚类(图5)。

图5 茯苓单味药与症状关联热图分析

我们经过文献发现,与茯苓相关症状共有50 类,古籍中对茯苓的记载由于时间和空间跨度巨大,有许多相关的名称,为了对茯苓进行全面分析,我们首先对茯苓及其古籍中可能混淆的提法,包括所有相关别名和类药,如“茯苓”、“白茯苓”、“茯芩”等进行症状关联,进行热图分析,得到大量热图数据进行全面认识(图5)。其次进一步为更好的指导临床运用,通过聚类,我们根据药-症和症-药关系进行归纳,进一步的对茯苓名称按临床使用部位进行统一化分为茯苓(包括茯苓、赤茯苓、白茯苓)、茯神(包括茯神、抱茯神、赤茯神)、茯苓皮(包括茯苓皮、茯芩皮),将茯苓的古籍相关药物分为3 大类(皮、神、苓)分别对应(1,2,3)3 个症状热区,进行热图分析(图6)。经研究发现与茯苓关系较密切的五个症状包括“腰以下肿”、“喘”、“语謇”、“蹇”、“怔忪”。结合中药学知识发现,“腰以下肿”、“喘”可以归纳与茯苓利水渗湿的功能相关,“怔忪”与茯苓宁心安神的功效相关。但“语謇”、“蹇”两个症状,为历来认知较有出入。故进行进一步挖掘。

图6 茯苓单味药细化挖掘与症状关联热图分析

2.4 隐性知识发现——古籍库及全国名老中医验案库验证

对“茯苓”苓库验证国名语謇”謇库验蹇”謇为关键词进行搜索得到215 条相关条文,共有三种情形中与茯苓的搭配使用相关。一为“语言謇涩”,如《备急千金要方·续命煮散》:“……中风,言语謇涩,四肢痑曳”,《冯氏锦囊秘录·河间地黄饮子》:“肾之脉出然谷肉内踝……其直者,挟舌本,故虚则舌謇不能言”;二为“动作蹇涩”,如《备急千金要方·肾沥汤》:“肾虚为厉风所伤……胻脚偏跛蹇、缓弱不能动”;三为“水道蹇涩”,如《太平惠民和剂局方·导赤丸》:“或服补药过多,水道蹇涩”等。其中前两者病因描述中皆与风邪相关,风邪中人,风痰上扰,肝阳上亢,气虚血瘀,导致多种语言謇涩、动作蹇涩等症状。茯苓往往会在方剂中进行搭配使用。提示茯苓在古籍使用中,可作为风邪中人的一种辅助治疗措施。

对平台收录的47 973 例全国名老中医验案库以以“苓”为关键词进行搜索,发现其相关病症前五位为“痹证、咳嗽、眩晕、胸痹、水肿”。以语言蹇涩相关症状“语言謇涩、舌强、舌本强、言语不利、失语”进行知识元搜索得到146 条记录,发现高频(次)使用中药分别为“川芎(44)、当归(41)、天麻(35)、地龙(33)、茯苓(30)”。茯苓为第五位推荐中药。提示了现代名老中医在治疗外感风、寒、湿等邪气侵袭时,茯苓亦为处方要药,这与茯苓健脾利水功效相关,亦侧面印证了茯苓具有搭配它药以祛风的功效。

3 讨论

慢性肾病是一个世界性的健康问题,在发达国家或发展中国家的患病率和发病率都在增加。2017 年Levin A 等对慢性肾脏病进行了全球性的大型研究后发现,全球慢性肾脏病患病率已超过10%,由于其患病率和病死率高,为社会卫生资源带来了沉重的负担[3]。中医药是中华民族几千年的智慧和经验结晶,经过代代相传,汇集成近千部中医古籍。作为中医学知识主要载体的中医古籍梳理工作,从古至今一直是中医学者传承经验的重要途径。知识传承与知识积累,为临床进一步运用提供了重要参考。作为中医学知识主要载体的中医古籍梳理工作,从古至今一直是中医学者传承经验的重要途径。

最早明确提出水肿概念始于《黄帝内经》,如《素问·水热穴论》说“水病下为附肿大腹,上为喘呼不得卧者,标本俱病,故肺为喘呼,肾为水肿”。指出腹部肿大严重者,不能平卧,水气上逆引起呼吸急促而且喘咳。这是肺肾同病,水液储留的原因。“水肿”就此引用开来。自《黄帝内经》始,即有对水肿的病机认识,如“诸湿肿满,皆属于脾”、“其本在肾,其末在肺,皆聚水也”。《灵枢·水胀》:“水始起也,目窠上微肿,如新卧起之状”;《素问·评热病论篇》:“诸有水气者,微肿先见于目下也”。并提出了水肿病的治疗原则为“平治于权衡,去宛陈莝”的调阴阳,补脾肾,发汗利小便等。

茯苓,又名茯菟,云苓等,性味甘、淡、平,《唐韻》《集韻》《说文解字卷一·艸部》对其注解为:苓,卷耳也。从艸令聲。郎丁切。是寄生于松树根下的一种菌类植物。《淮南子·說山訓》:千年之松,下有茯苓。具有利水渗湿、健脾宁心等功效,其最早记载于《五十二病方》中用于皮肤类疾病的治疗“乾骚(瘙)”[4]。常用于治疗水肿尿少,脾虚纳差,心悸不安,痰饮惊悸等症状[5],《神农本草经》[6]中记载茯苓具有利小便,顺胸胁逆气,宁心安神解忧,解心下结痛,烦满咳逆等功效,将其载为上品。

小剂量茯苓(茯苓<10 g)具有健脾渗湿[7]、化痰止泻的功效。中剂量茯苓(10-20 g)随着用量的增加,具有利尿理气[8]、宁心定悸之功,大剂量茯苓(>20g)擅于利水消肿和平胃止呕的功能,主治多种原因导致的水肿及胃反呕吐等症[9]。现代药理学证实其具有抗氧化[10]、调节免疫[11]、抗肿瘤[12]、抗衰老[13]等功能。

但是中医几千年发展过程中,古籍记载会随着特定的气候、政治、文化等方面的影响,有着不同特定的时代烙印。这导致了古今语言表达的差异,古籍中词汇概念表达的不确定性为古籍发掘带来了一定的困难[14]。故中医药术语概念的规范化和语义关联、古医籍中术语概念与现代词汇的对应均需要根据疾病特点进行构建。

本文从古籍中建立了自动化中医知识图构建的框架。该框架基于本体模型和深度学习技术,旨在自动化元知识提取和转换过程,进行语义距离计算和语义推理。基于推理算法构建、知识检索优化和知识导航、初步构建知识体系—知识地图,利用数据建模对中医理法方药进行科学阐释[15]。

在大数据时代,以整体性、混杂性、相关关系为特征的数据整理方法,为中医古籍挖掘提供了更多的选择。基于本体的逻辑表达方法及基于大数据处理而提出的复杂数据处理,而产生的新技术,为更好的处理中医药知识密集型数据提供了新的思路与技术支持[16]。在本研究中,我们首先采用了人工筛选结合知识图谱分析,按混杂性原则先将与茯苓相关的所有表述先总体纳入,再进一步细化筛选,有效的避免了古籍研究中的选择偏倚,纳入更多有效知识元进行总体分析。并进一步通过挖掘出的结论与平台收录的47973 例全国名老中医验案库进行比对验证,完善了单味茯苓的药物“古籍挖掘-临床验证”两方面的研究,使结论具有充分的可靠性。

由结果可知,在肾系水肿疾病中,茯苓为使用频率最高的药物,其权重比也为最关键的药物。其使用与“腰以下肿”、“喘”、“语謇”、“蹇”、“怔忪”等症状关联密切。结合病因病机和相关症状我们发现,在慢性肾脏病中,古医家们通常是运用茯苓健益脾脏,以达到祛水肿的功能。总则与茯苓的通调水液功能相关。另外我们发现,除了常见的相关症状,“语言謇涩”、“动作蹇涩”亦与茯苓的临床运用具有一定关联性。这可能是隐藏在古籍中的尚未被广泛认知的知识,为了进一步验证该结论的可靠性,我们结合相关古籍论述与名老中医经验对照,我们发现该结论具有一定的临床运用价值,可能与茯苓健脾扶正,利水消痰,佐其他药疏风以最终祛除风邪的功能有关。但该结论仍需进一步实验验证。

除了深度挖掘茯苓临床应用特色以外,在研究方法上,本研究将深度学习与数据挖掘方法有机融合,实现了几个创新,利用知识图谱深度学习得到的知识向量转化为:①知识地图聚类(将方药知识点转换为二维坐标和地图区块呈现药物关系);②方药及中医病症证知识关联热图层次化聚类分析;③复杂网络社群聚类等三种不同角度的规律诠释;④挖掘知识元和关系可以直接进行知识库检索和迭代分析,从而更完整和深层次的挖掘隐性知识。

数据挖掘技术在现代中医药研究有其积极意义,可为探讨中医药隐性知识提供基础。基于语义网络的肾系疾病中医古籍本体知识库及辅助挖掘系统,对于挖掘发现隐性知识,拓宽茯苓的临床再认识,有其独特的优势。本文通过知识图谱对古籍中茯苓的使用情况及其与症状之间的关系进行了逐层深入分析,并通过全国名老中医验案库进行结论验证,将古代医家辨证使用茯苓的思维与用药经验进一步显性知识可视化,拓宽了茯苓的功效认识,有助于古籍资源的充分发掘和利用。

猜你喜欢

条文方药古籍
《中华人民共和国安全生产法》有关条文修正前后对照表(七)
《中华人民共和国安全生产法》有关条文修正前后对照表(五)
中医古籍“疒”部俗字考辨举隅
关于版本学的问答——《古籍善本》修订重版说明
对《机车信号信息定义及分配》条文修改的分析
关于古籍保护人才培养的若干思考
我是古籍修复师
关于《建筑设计防火规范》相关条文的解析
“体-量-效”方药关系应用探讨
益气活血凉血生肌方药对气虚血瘀证冠心病冠状动脉介入术后生活质量的干预作用