APP下载

文本挖掘探索抑郁症“证-症-方-药”相应规律*

2012-12-01展俊平何晓鹃吕爱平

中国中医基础医学杂志 2012年12期
关键词:网络图肝郁肝气

展俊平,张 彤,郑 光,吕 诚,蔡 峰,杨 静,何晓鹃,梁 非,5,吕爱平,姜 淼△

(1.上海中医药大学,上海 201203;2.中国中医科学院中医临床基础医学研究所,北京 100700;3.南阳医学高等专科学校,河南 南阳 473061;4.兰州大学数学院,兰州 730000;5.北京化工大学生命科学与技术学院,北京 100029)

抑郁症(Depression)是一种常见的心境障碍,可由各种原因引起,以显著而持久的心境低落为主要临床特征。迄今为止,抑郁症病因与发病机制还不明确,也无明显的体征和实验室指标异常,概括地说是生物、心理、社会(文化)因素相互作用的结果,属中医学“郁证”、“百合病”范畴。中医药配合西药治疗抑郁症为临床常用方案。中西医治疗抑郁症的文献在医学文献数据库中已大量存在。本文利用课题组逐渐成熟的文本挖掘技术[1],探索抑郁症证药相应规律。

1 材料与方法

1.1 文本数据收集

在中国生物医学文献数据库(CBM,http://sinomed.cintcm.ac.cn/index.jsp)中,以“缺省”状态下检索“抑郁症”共得到文献27509篇(检索日期:2011年12月19日),依次下载所有文献并保存。

1.2 文本数据处理

将收集来的数据按照下载的先后顺序整合到一个平面文件(后缀txt)里面,以ANSI编码格式保存。然后利用专有的文本提取工具(软件著作权,软著登字第0261882号,登记号2010SR073409),对下载的非结构化的txt文本数据进行信息提取,保存成格式化的、便于大型关系型数据库(Microsoft SQL Server,以下简称 SQL)处理的格式,导入 SQL中进行下一步的挖掘分析,据此构建算法进行数据清洗工作[1]。清洗完毕后的数据即可以提取。

假设每一篇文献的贡献度是相同的,一篇文献中重复出现的关键词,只需要计挖掘对象的一维频次,也可以得到挖掘对象的二维关系,进行可视化呈现。抽出不同频次的关键词对,用Cytoscape 2.8软件进行可视化处理,形成可视化的网络图,然后结合专业知识进行解析。一旦发现不合理的结果,即回溯原文献数据集,如果是噪音,仍按算法进行噪音清洗,直至噪音降到满意为止。最后的结果可视化成图,结合专业知识进行解析。

2 抑郁症文本挖掘结果的评析

2.1 证候文本挖掘结果

文本挖掘共提取到110个证型,选择前15个列出(括号内为文献篇数,以下同):肝气郁结(195)、肝郁脾虚(76)、心脾两虚(74)、肝郁气滞(52)、肾阴虚(34)、肝肾阴虚(29)、痰湿阻肺(26)、肾阳虚(19)、气滞血瘀(16)、心肾不交(15)、心神不宁(12)、气郁化火(11)、气滞证(11)、脾肾阳虚(11)、胆气虚(11)。由于构建词表及挖掘词的包含关系,出现以上结果重复的现象,挖掘词越短,挖掘到的频次越高。结果基本反映了抑郁症证候的特征,肝气郁结、肝郁脾虚最多,其次为心脾两虚和肝郁气滞。

进而构建抑郁症证候两两之间网络关系图(图1):图中圆圈内为证型名称,连线代表证候两两之间的联系。证候的连线越多,代表该证型与疾病的关联程度越高,越处于核心的位置;圆圈越大,代表该证型在文献中出现的频次越高,其权重越大。

图1 抑郁症证候网络图

文本挖掘共提取到540项证候组合,图1为频次大于6的证候组合参与构建的网络图。图1显示,心脾两虚、肝郁气滞、肝气郁结、肝郁脾虚的圆圈最大,其相应的文献频次最高,其中肝气郁结-肝郁脾虚的频次为44。左上侧椭圆内为阴虚证候,包括肝肾阴虚、肾阴虚、阴虚证、阴虚火旺及重复的证候;左下侧椭圆为阳虚证候,包括肾阳虚、脾肾阳虚及重复的证候;右侧椭圆为肝郁证候,包括肝郁气滞、肝郁脾虚、肝气郁结及重复的证候,两个椭圆交汇于阴阳两虚证等,其他证候频次较低。归纳这些证候,抑郁症虚实夹杂,主要以肝郁和阴虚为主;相关脏腑以肝为主,涉及心、脾、肾。

2.2 症状文本挖掘结果

文本挖掘的症状,既包含西医临床也包含中医临床报告的症状。文本挖掘共提取到症状185项,选择前15项列出:失眠(575)、功能障碍(489)、情绪低落(436)、消极(293)、头痛(272)、恶心(238)、悲观(236)、口干(212)、自责(189)、绞痛(173)、便秘(170)、头晕(157)、抽搐(147)、烦躁(141)、精神抑郁(124)。回溯原文献发现,其中“功能障碍”为认知或者执行功能障碍/内分泌功能障碍、某种激素受体的功能障碍,是对抑郁症症状或者病因的总体解释;“绞痛”为冠心病或者不稳定型心绞痛合并抑郁症出现的症状,属合并疾病的症状;“抽搐”大多为无抽搐电休克/痉挛(MECT/ECT)治疗,为抑郁症治疗方式中的一个关键词。由上可知,抑郁症是一种以精神障碍为主,伴发其他系统症状的疾病。

进一步文本挖掘共提取到1891项症状组合,选取频次大于等于30的组合构建症状网络图如下(图2)。

图2 抑郁症症状网络图

图2显示,失眠、情绪低落、悲观、恶心、头晕(头昏、头痛)等为频次较高的症状,其他主要涉及呕吐、口干、食欲不振、便秘等消化系统症状(左椭圆内)。消化系统症状多为抑郁症最常见的伴随症状,而头晕、头痛、乏力、烦躁等神经系统症状表现亦较为显著,为抑郁症常见躯体周边症状。由此可见,抑郁症是以精神障碍为主,同时伴随神经和消化系统两大躯体症状表现的疾病,这些症状和前面挖掘的主要证候肝郁和阴虚相一致。

2.3 汤药文本挖掘结果

文本挖掘共提取到相关汤药名称84个,选择前15个排序为:逍遥散(154)、柴胡疏肝散(59)、温胆汤(40)、甘麦大枣汤(35)、银杏叶(27)、归脾汤(26)、越鞠丸(24)、小柴胡汤(24)、血府逐瘀汤(19)、半夏厚朴汤(18)、加味逍遥散(15)、疏肝解郁汤(14)、百合地黄汤(13)、滋水清肝饮(10)、黄连温胆汤(9),其中银杏叶多为银杏叶片、银杏叶提取物等,联合西药治疗抑郁症。

文本挖掘共提取到中药组合1001项,选取频次大于等于8的中药组合构汤药网络图(图3)。

图3 抑郁症汤药治疗网络图

图3显示,汤药联合运用中,高频数的以逍遥散为核心,此方剂疏肝解郁、养血健脾,主治肝郁血虚脾弱证,与前面挖掘出来的证候结果相一致(其中肝气郁结-肝郁脾虚的频次为44);归脾汤、甘麦大枣汤联合主治心脾两虚,用以养心安神(肝气郁结-心脾两虚频数为42);百合地黄汤、六味地黄汤、天王补心丹主治阴虚证候。

2.4 中药文本挖掘结果

文本挖掘共提取到相关中药名称157个,选择前 15个排序为:海马(319)、柴胡(174)、艾叶(133)、百合(49)、郁金(42)、天冬(41)、大枣(41)、半夏(40)、龙骨(38)、连翘(36)、生牡蛎(36)、生地黄(33)、杏仁(32)、白芍(30),其中海马、杏仁、天冬为异常中药。回溯原文献发现,“海马”大多为海马神经元或者海马组织;“杏仁”多为脑组织的杏仁核体,用以对抑郁症病变机理的研究;“天冬”多为 N-甲基-D-天冬氨酸受体(NMDAR1)含量,用以检测药物作用及其作用机制。通过降噪,抑郁症中药饮片以柴胡、百合、郁金、大枣等为核心药物,这些药物以疏肝解郁安神为主。

文本挖掘共提取到中药组合1001项,选取频次大于等于8的中药组合构建中药网络图(图4)。

图4 抑郁症中药网络图

图4显示,柴胡、茯苓、半夏、郁金频次最高,为治疗抑郁症的核心药物,其他如菖蒲、当归、白芍等次之。挖掘到的药物按配伍组方来区分,中间运用最广的是柴胡、茯苓、白芍、当归、甘草为方剂逍遥散的主药,而柴胡、白芍、香附、川芎、甘草为柴胡疏肝散的主药,左边椭圆内石菖蒲、半夏、竹茹、陈皮、枳实、厚朴均为温胆汤的主要组方,这3个方剂和上述汤药文本挖掘中的一维频数结果相一致,说明是抑郁症的常用药。从药性上来解读,以疏肝解郁理气药柴胡、香附、川芎、陈皮、厚朴、郁金为主,养阴药以当归、白芍、为核心,安神药以龙骨、生牡蛎、百合为主。

3 讨论

文本挖掘(Text Mining)技术是以统计数理分析、计算语言学为理论基础,服务于医药、生物、文献研究等学科的新兴交叉学科[2]。在中医药领域,此方法从某种层次上促进了中医临床研究和中药复方研发等多个方面[3],为中西医结合研究提供了新的思路和途径,且结果更加客观,可重复性强[4]。

抑郁症属中医学郁证范畴,中医认为郁证的发生多因郁怒、思虑、悲哀、忧愁等七情之所伤,导致肝失疏泄、脾失运化、心神失常,脏腑阴阳气血失调而成,主要表现为心情抑郁、情绪不宁、胁肋胀痛或易怒善哭以及咽中如有异物梗阻、失眠等各种复杂症状[5]。中医根据辨证施治的原则,或将抑郁症分为虚证、实证或者虚实夹杂,或将其分为肝气郁结、郁久化火、气滞血瘀、心脾两虚、阴虚火旺等若干证型,治疗则以疏肝理气解郁为主[6]。

本研究针对从CBM收集到相关抑郁症的27509篇文献,采用课题组逐渐成熟的文本挖掘技术[1],结合回溯原文献、人工阅读降噪,对抑郁症从证候、症状、汤药、中药规律等方面进行挖掘,挖掘的结果既看到它们在文献中的频次,又可以发现它们各自在关联网络中的分布规律。从挖掘的结果来看,抑郁症虚实夹杂,日久以虚证多见,涉及气、血、湿、痰等,相关脏腑以肝为主,涉及心、脾、肾;证候方面以心脾两虚、肝气郁结、肝郁脾虚为主,从二维图形来看,主要分为肝郁和阴虚两大类;核心症状为失眠、情绪低落、悲观厌世等精神障碍,伴随恶心、乏力、头晕、头痛等躯体周边症状,其中精神抑郁、烦躁易怒为肝气郁结的体现,而头晕、头痛、乏力、口干、便秘等主要为阴虚和脾虚症状;汤药和中药的使用均以疏肝解郁、健脾养心安神为主,临床遣方用药以逍遥散、柴胡疏肝散为主,与挖掘出的证候结果肝气郁结、肝郁脾虚相互对应,证候-症状-汤药-中药3个方面互相呼应和印证,基本反映了抑郁症这种疾病的证药相应规律。

文本挖掘的结果,选取高频数的参与网络关系图的构建,展示临床上的常见证候、常用药物的使用,直接客观地反映临床研究的现状。回溯原文献,人工阅读评价,使得结果更加客观,一维频次和二维网络构图,从不同角度显示挖掘对象在文献数据集中的分布,均有不同的意义。如中药结果中,一维频次海马最高,其大多为大脑海马神经区;而在二维网络中就很低,这是因为海马很少参与二维网络的构建。因此,通过这种优化的文本挖掘组合,能够比较客观地总结中医病、证、药的规律,可以为中医客观化以及中医临床提供有益的参考。

[1]Zheng G ,et al,Discrete derivative:a data slicing algorithm for exploration of sharingbiological networks between rheumatoid arthritis and coronary heart disease[J].BioData Min,2011,4(18):1-21.

[2]薛为民,等.文本挖掘技术研究[J].北京联合大学学报(自然科学版),2005,19(4):59-63.

[3]Zheng G,et al,Two Dimensions Data Slicing Algorithm,a New Approach in Mining Rules of Literature in Traditional Chinese Medicine,in Communicationsin Computerand Information Science,2011,Springer-Verlag Berlin Heidelberg:161-174.

[4]Li S, etal, UnderstandingZHENG in traditionalChinese medicine in the context of neuro-endocrine-immune network[J].IET Syst Biol,2007.1(1):51-60.

[5]韩翠欣,等,抑郁症的中医治疗现状[J].河北中医,2007,29(8):767-768.

[6]冯广玲,中西医结合治疗抑郁症[J].中医药管理杂志,2006,14(4):55.

猜你喜欢

网络图肝郁肝气
逍遥散加减治疗肝气郁滞型月经不调的临床效果
自拟疏肝和胃汤加味治疗肝气犯胃型功能性消化不良疗效观察
春季养肝食何“味”
简易穴位埋线法治疗肝郁痰凝型乳癖疼痛的临床观察和研究
网络图计算机算法显示与控制算法理论研究
疏肝健脾方治疗肝郁脾虚型功能性消化不良临床观察
A Meta-analysis of Dachaihu Decoction combined with western medicine in the treatment of acute pancreatitis with the TCM syndrome of liver qi depression and liver-gallbladder dampness-heat
网络图在汽修业中应用
“肝气郁结证”术语源流考❋
叙事文的写作方法