APP下载

文本挖掘探索人参相关病证方药相应规律*

2013-10-10田景平郭洪涛展俊平吕爱平喻长远

中国中医基础医学杂志 2013年5期
关键词:网络图病证白虎

梁 非,田景平,蔡 峰,郑 光,4,郭洪涛,展俊平,6,张 弛,吕 诚,姜 淼,吕爱平※,喻长远△

(1.北京化工大学,北京 100029;2.中国中医科学院中医临床基础医学研究所,北京 100700;3.广州中医药大学研究生院,广州 510006;4.兰州大学信息学院,兰州 730000;5.河南中医学院第一附属医院,郑州 450000;6.上海中医药大学,上海 201203)

人参是我国传统的名贵药材,为多年生草本,是五加科人参属植物人参的根,其性温、味甘、微苦,有大补元气、固脱、生津、安神之功效。人参富含人参皂苷、挥发油、脂肪酸、酚酸、黄酮类等化学成分。现代药理学研究表明[1],人参具有调节中枢神经系统的生理功能、增强机体免疫功能、抗心律失常、延缓衰老等作用。人参对于治疗心血管疾病、糖尿病、肿瘤、神经衰弱、肾病综合征等疾病均有较好的疗效,在临床广为应用。

近年来,我国就人参的化学成分、药理机制及临床应用等方面进行了广泛的研究,所报道的相关文献大量存在于现有数据库中。本文借助课题组不断成熟的文本挖掘技术[2,3],结合原文献回溯、人工阅读分析等方法,对现有人参中文文献进行挖掘,以分析人参相关病证方药相应规律。

1 材料与方法

1.1 文本数据收集

方法概述如下:在中国生物医学文献数据库(Chinese BioMedicalLiterature Database,CBM,http://sinomed.cintcm.ac.cn/index.jsp)中,“缺省(智能)”状态下以“人参”为检索词进行检索,共得到文献22854篇(检索日期:2012年7月3日),下载后作为文本数据挖掘的原始数据。

1.2 文本数据处理

将收集来的数据按照下载的先后顺序整合到一个平面文件(后缀txt)里面,以ANSI编码格式保存。然后利用专有文本提取工具(软件著作权,软著登字第0261882号,登记号2010SR073409),对下载的非结构化txt文本数据进行信息提取,保存成格式化的、便于大型关系型数据库(Microsoft SQL Server,以下简称SQL)处理的格式,然后导入SQL中进行下一步的挖掘分析。假设每一篇文献的贡献度是相同的,1篇文献中重复出现的关键词只需要计算1次,据此构建算法进行数据清洗工作[2]。清洗完毕后的数据,既可以提取挖掘对象的一维频次,也可以得到挖掘对象的二维关系进行可视化呈现。抽出不同频次的关键词对,用Cytoscape 2.8软件进行可视化处理,形成可视化的网络图,然后结合专业知识进行解析,一旦发现不合理的结果,即回溯原文献数据集,如果是噪音仍按算法进行噪音清洗,直至噪音降到满意为止。最后的结果可视化成图,结合专业知识进行解析。

2 人参文本挖掘结果评价与分析

2.1 病证关系文本挖掘结果

文本挖掘提取到人参在心脑血管疾病,胃肠道、肝脏疾病、呼吸系统疾病、糖尿病、神经系统疾病、皮肤疾病、妇科疾病、肿瘤等方面均有应用,其中在心力衰竭、糖尿病、心律失常、心肌梗死、心肌炎等疾病中最为常用。

提取到人参的适应证候有气阴两虚、气血两虚、肾阳虚、气虚血瘀、寒热错杂等,其中气阴两虚文献频次最高。

以人参为核心,将人参与疾病相关性最高的前5种疾病,即心力衰竭、糖尿病、心律失常、心肌梗死、心肌炎,分别与证候关联起来进行挖掘,提取到的疾病和证候关系文本结果构建网络图(图1)。人参相关病证关系网络中证候(图中正方形)、疾病(图中六边形)的显示度和 node的大小正相关,连线表示相关性。

图中可见气阴两虚证与人参关联程度最高,疾病中心力衰竭、糖尿病与人参关联程度高,病证关系中心力衰竭相关的证候有肾阳虚,糖尿病涉及的证候有肾阳虚与气阴两虚,其中气阴两虚、肾阳虚证与相关疾病关联程度最高。该网络形象地反映了人参相关病证关系中同病异证、异病同证的2种表现形式。

图1 人参相关病证关系网络图

2.2 方证关系文本挖掘结果

文本挖掘提取到的人参常见方剂有人参汤(人参、甘草、干姜、白术)、人参养荣汤(人参、茯苓、甘草、五味子、黄芪等)、生脉散(人参、麦冬、五味子)、白虎加人参汤(知母、石膏、人参、甘草)、参附汤(人参、附子)等。人参汤有温中祛寒、补气健脾之功,适用于脾胃虚寒证;人参养荣汤可补益气血,适用于气血亏虚之证;生脉散能益气养阴,主治气阴两伤;白虎加人参汤有清热泻火、益气生津之功,主治气分热盛而津气不足之证;参附汤可回阳、益气、固脱,常用于元气大亏、阳气暴脱的危急重症。可见人参常见方主治证中皆有气伤因素存在,这些方剂还分别具有养血、温阳、清热等不同功效,与人参相关证候文本挖掘结果相符。

把人参常见方剂与其常见证候相关联起来挖掘,提取到的结果构建方剂与证候关系网络图(图2)。网络中方剂(图中六边形)、证候(图中正方形)的显示度和node的大小正相关,连线表示相关性。

网络中可见以人参汤为核心形成一小网络,与寒热错杂证相关联。回溯原文献数据集发现,“人参汤”有单独出现,也常见于白虎加人参汤、桂枝人参汤、四逆加人参汤等含人参汤的方名中,可见人参汤作为人参的常见方剂出现的文献频次应持保守态度;小网络中的白虎汤等方中均无人参组成。回溯文献发现,这几味方剂名常常单独或者包含在其他方剂名中,与人参汤或者包含有人参汤名的方剂同进出现于文献中;如白虎汤主要为白虎汤与白虎加人参汤同时出现;桂枝汤常为桂枝汤、枳实薤白桂枝汤等含桂枝汤名的方剂与桂枝人参汤、人参汤等相伴出现;四逆汤为四逆汤、通脉四逆汤等与人参汤、四逆加人参汤等同时出现;这些方剂组成中虽无人参,但常常与人参配伍应用于寒热错杂等相关证的治疗,如白虎加人参汤、干姜黄连黄芩人参汤、桂枝人参汤、四逆人参汤等。网络中可见,人参养荣汤与气血两虚和气阴两虚证相关联;生脉散与气阴两虚、肾阳虚及气虚血瘀证相关联;参附汤与肾阳虚证相关联;应用于气阴两虚的方剂有生脉散、人参养荣汤、白虎加人参汤;应用于肾阳虚的方剂有生脉散、参附汤。人参相关方证关系网络图形象地表现了中医同证异方、同方异证的另一特点。

图2 人参相关方证关系网络图

2.3 方病关系文本挖掘结果

把人参常见方与人参相关性最高的前5种疾病关联起来挖掘,其结果构建人参相关方剂与疾病关系网络图(图3)。网络中方剂(图中六边形)、疾病(图中菱形)的显示度和 node的大小正相关,连线表示相关性。

方病关系中可见,生脉散、参附汤与相关疾病的关联最密切;两方在心力衰竭等疾病中均有应用;治疗心力衰竭的方剂有生脉散、参附汤;治疗糖尿病的有生脉散;该网络形象地反映了方病关系中同方异病、异方同病的2种表现形式,体现了中医同病异治、异病同治的辨证论治特点,也体现了中医辨病论治的思维方式。

图3 人参相关方病关系网络图

2.4 方药关系文本挖掘结果

文本挖掘提取到的与人参常用配伍药有麦冬、黄芩、甘草、三七、当归、白术、大枣、生姜、茯苓、丹参、干姜、半夏、五味子、桂枝、柴胡、黄芪、陈皮等。这些中药分别具有补气、养阴、补血、活血、回阳、泻火等功效,其中以补气药为多,与人参相关证候文本挖掘结果相应。

提取到的人参常见配合组合有:人参、麦冬;人参、黄芩;人参、三七;人参、甘草;人参、当归;人参、茯苓;人参、丹参;人参、五味子;人参、桂枝;人参、柴胡、人参、黄芪;人参、陈皮;人参、白术、甘草、干姜;人参、甘草、生姜、半夏、大枣等。人参与不同的药物配伍适用于不同病证,可见人参的功效与其配伍有着密切的联系。

把与人参常用配伍药与人参常见方剂关联起来挖掘,提取到的结果构建人参相关方药关系网络图(图4)。网络中方剂(图中六边形)、中药(图中圆形)的显示度和node的大小正相关;连线表示相关性。

图中可见泻心汤中无当归、甘草、白术却与之直接相关联,回溯原文献,发现泻心汤与这三味分别同时出现于文献中,但彼此间并无配伍关系,因此相对于这三味药,泻心汤应视为噪音;图中可见人参常与麦冬配伍应用;人参常见配伍药是人参常见方剂的主要组成部分,如生脉散(人参、麦冬、五味子)、人参养荣汤(人参、当归、白术、甘草、大枣、生姜、茯苓、陈皮、五味子)。

3 讨论

文本挖掘(Text Mining)技术是以计算语言学、统计数理分析为理论基础,服务于生物、医药、文献研究等学科的新兴的交叉学科[4]。应用于中医药领域,文本挖掘能从海量的中医药文献中发现知识以促进中医临床研究和中药复方研发等多个方面。根据中医理论和专业知识,利用数据挖掘技术对中医药文献库与生物医学信息进行处理,为中西医药研究提供新的思路和途径,并且结果更加客观,可重复性强[5]。

图4 人参相关方药关系网络图

本研究对人参相关文献进行文本挖掘,得到人参相关疾病、证候、方剂、中药等挖掘结果,是对人参相关病证方药规律比较全面的总结。挖掘结果显示人参核心疾病是心力衰竭和糖尿病;核心证候是气阴两虚证;常见方有人参养荣汤、生脉散、参附汤等;人参常与麦冬、黄芩、三七等具有不同功效的药物配伍使用于相应病证中,人参的功效与其配伍有着密切的联系,实际应用中应对人参有着全面的认识,以便灵活应用于临床。

文本挖掘的结果,利用Cytoscape 2.8软件形成可视化的网络图,形象地展示了人参相关病证方药规律。如图1形象地反映了病证关系中同病异证、异病同证的2种表现形式。通过回溯原文献、人工阅读评价,使结果更为客观,如方证关系图中以人参汤为核心的小网络中的方剂组成中均无人参,回溯文献发现这些方剂常常与人参配伍应用于寒热错杂等相关证的治疗。可见,通过这种文本挖掘技术能够比较客观地总结中西医病证方药规律,为临床应用提供参考。不足之处是现有文本挖掘技术不能把具有包含关系的词很好得区分开来,比如人参汤的结果,是人参汤、白虎加人参汤、桂枝人参汤、四逆人参汤等诸多含有人参汤词条的综合,需要回溯原文献数据集加以综合分析,从而增加人工工作量。因此,如何提高数据挖掘技术计算分析能力,以降低噪音、节省工作量是当前应该着眼解决的问题。

[1]南京中医药大学.中药大辞典[M].上海:上海科学技术出版社,2006:38-45.

[2]ZHENG G,JIANG M,HE X J,et al.Discrete derivative:a data slicing algorithm for exploration of sharing biological networks between rheumatoid arthritis and coronary heart disease[J].BioData Min,2011,4:18.

[3]郭洪涛,郑光,赵静,等.基于文本挖掘分析甲型 H1N1流感的中医药治疗特色[J].世界科学技术-中医药现代化,2011,13(5):772-776.

[4]薛为民,陆玉昌.文本挖掘技术研究[J].北京联合大学学报(自然科学版),2005,19(4):59-63.

[5]LI S,ZHANG Z Q,WU L J,et al.Understanding ZHENG in traditional Chinese medicine in the contex of neuro-endocrineimmune network[J].IET Syst Biol,2007,1(1):51-60.

猜你喜欢

网络图病证白虎
基于病证结合的脾胃病湿热理论的创新与应用研究
基于太阳阳明经病证探讨颈椎病的防治规律
子宫内膜异位症病证结合大鼠模型研究进展
网络图计算机算法显示与控制算法理论研究
从病证结合角度探析亚急性甲状腺炎的治疗
网络图在汽修业中应用
白虎
叙事文的写作方法
白虎
浅析双代号网络图绘制方法