APP下载

基于关联规则挖掘技术对《千金方》中养生方剂配伍规律研究

2014-12-01陈桂芬福建中医药大学管理学院福建福州350122

长江大学学报(自科版) 2014年36期
关键词:项集频数置信度

陈桂芬(福建中医药大学管理学院,福建 福州 350122)

周常恩(福建中医药大学中医学院,福建 福州 350122)

李德森(福建中医药大学药学院,福建 福州 350122)

《千金方》是中国唐朝孙思邈的临床医学著作,记载了大量的中医养生方剂。作为中国最早临床医学百科全书,拥有丰富的中药信息资源,一直为中医界所推崇。虽然有学者对《千金方》养生规律进行研究,但目前还没有利用现代信息技术筛选整理养生方剂的成果报道。数据挖掘是近些年随着数据库和人工智能发展起来的一门新兴技术,是从大量数据中发现有效的、新颖的、潜在有用并且最终可理解的知识的过程。通过筛选整理养生方剂、构建数据库、运用数据挖掘方法,可以发现《千金方》中养生方剂配伍规律。

本研究筛选整理《千金方》[1]中629首养生方剂,用药总频数达2157次,涉及中药共300味。在此基础上构建包含药物、方名、主治组成等字段的方剂数据库,分别作药物频数分析、用药关联规则和分类关联规则挖掘等研究。本文利用数据挖掘方法从多角度探讨养生方用药规律,最后经关联规则挖掘后给出了所发现的养生方常用药对和药组。

1 数据挖掘原理

1.1 关联规则

关联规则挖掘发现大量数据中项集之间有趣的关联或相关联系,从大量事务记录中发现有趣的关联关系,帮助我们更好地分析事务。

在关联规则中,设I=(I1,I2,…,In)是项的集合。任务相关的数据D是数据库事务的集合,其中每个事务T是项的集合,T⊆I。每个事务有一个标识符,称为TID。设A是一个项集,事务T包含A且仅当A⊆T。关联规则是形如A⇒B的蕴含式,其中A⊆I,B⊆I,A∩B=Φ。规则A⇒B在事务中成立,具有支持度S为:support(A⇒B)=P(A∪B)。其中P(A∪B)表示A,B同时出现的概率,既为(A,B同时出现的次数)/事务的总数。包含k个项的项集称为k—项集。支持计数supportNumber是包含项集的事务数;满足最小支持度的项集称为频繁项集[2]。

1.2 Apriori算法

Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法[3]。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里,所有支持度大于最小支持度的项集称为频繁项集,简称频集。该算法的基本思想是:首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第1步找到的频集产生期望的规则,产生只包含集合的项的所有规则,其中每一条规则的右部只有一项,这里采用的是中规则的定义。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成所有频集,使用了递归的方法[4]。

2 养生方剂配伍规律研究

2.1 建立方剂数据库

基于方证分析的准确性,首先对《千金方》中的养生方剂进行脏腑分类,分为补肺、补脾、补心、补肝肾四类养生方剂,通过对中药性、味进行聚类分析共筛选出具有完整组成养生方剂共629首,其中补肺方剂127首、补脾方剂177首、补心方剂119首和补肝肾方剂206首。然后对挑出的方剂进行规范化处理:依据《中国药典》、《中药大辞典》和《中华本草》对所选方剂药名及功效进行处理[5-7]。629首方剂共涉及300味中药,考察各药物的出现频数,删除药物支持度小于2%的药物,仅对较高支持度药物做关联规则挖掘。其次建立补肺、补脾、补心、补肝肾四类养生方剂数据仓库。研究中构建了方剂库、药物库、主治库等,各数据库依其自身关联建立相应数据链接,同时应用SPSS软件进行中药的频数分析。

2.2 关联规则挖掘

在中医观点中,很多症状的诊断之间是存在着关联性。而在药方的搭配上,也同样存在着很多关联性。以关联规则为主要算法的数据挖掘,是分析中药关联性的有效方法。关联规则(R)是形如R:A⇒B的规则,满足A∩B=Φ&sup(R)≥min_sup &conf(R)≥min_conf。其中,A、B为项目(或属性)集合;sup(R)为规则R的支持度;min_sup为最小支持度阈值;conf(R)为规则R的置信度;min_conf为最小置信度阈值[8]。规则R的支持度(support)和置信度(confidence)定义如下:

支持度和置信度是描述关联规则关联性的两项重要指标,支持度反映规则的普遍性,置信度反映规则的可靠性,通常选择支持度和置信度均较高的规则作为发现有意义的模式。

其中,“菟丝子 五味子 巴戟天”为规则前件;“肉苁蓉”为规则后件。规则前件频数为菟丝子、五味子、巴戟天三味中药同时出现在206首肝肾养生方中的频数;规则频数指菟丝子、五味子、巴戟天、肉苁蓉四味中药同时出现在206首肝肾养生方中的频数。因206首肝肾养生方中有32首方剂同时出现菟丝子、五味子、巴戟天、肉苁蓉四味中药,故规则(3)的支持度为0.1553;因32首同时出现菟丝子、五味子、巴戟天三味中药的肝肾养生方中有32首方剂同时出现肉苁蓉这味药,故规则(3)的置信度为1。

本研究运用挖掘布尔关联规则频繁项集的Apriori算法建立关联关系研究中药配伍规律,经C++编程实现,最小支持度阈值取10%,最小置信度阈值取60%。

2.3 实验结果

2.3.1 频数分析结果 见表1~4。

表1 高频补肺中药

表3 高频补心中药

表2 高频补脾中药

表4 高频补肝肾中药

2.3.2 数据挖掘结果 见表5~8。

表5 补肺中药配伍规则集

表6 补脾中药配伍规则集

3 分析

补肺药中如表1所示出现频次最高的是:温里、益气、收敛、养阴、止咳平喘药,如表5所示补肺药的规则集中出现最多的是五味子、桂心、干姜、人参配伍。如《素问·咳论篇》中提到“其寒饮食入胃,从肺脉上至于肺,则肺寒,肺寒则内外合邪,因而客之,则为肺咳”,“五脏六腑皆令人咳,非独肺也”。从挖掘结果说明,《千金方》在补肺方剂中重视如下方面:①温中散寒,温肺化饮,如五味子、桂心配伍;五味子、干姜配伍;细辛、桂心、干姜、附子配伍。②益气健脾而间接达到补肺效果,即培土生金法,体现在配伍中加入人参、茯苓、大枣、甘草、桂心;③养阴益肺,如人参、麦冬、五味子配伍。

补脾药中如表2所示出现频次最高的是:温里、益气药,部分有清热燥湿药物。如表6所示补脾药的规则集中出现最多的是附子、干姜、桂心、人参配伍,说明《千金方》注重温阳健脾,上能温心阳,下能补命火,中暖脾土而散寒。人参、茯苓配伍,桂心、人参配伍,人参、附子配伍,白术、干姜配伍,体现《千金方》重视益气健脾温中。黄连、干姜配伍,出自《伤寒论》,辛开苦降,主治因寒热互结而致心下痞满疼痛症。

表7 补心中药配伍规则集

表8 补肝肾中药配伍规则集

补心药中如表3所示出现频次最高的是:温中、益气、养血、化痰安神药,如表7所示补心药的规则集中出现最多的是人参、茯苓、甘草、干姜、桂心之间配伍。心脏的主要功能是:主血脉、主神志。如《素问·灵兰秘典论》中提到“心者,君主之官,神明出焉。”体现心脏的重要性。《千金方》中人参、茯苓、甘草、干姜、桂心、麦冬这些药物的配伍,旨在达到温中益气、养血,使气血生化有源,心的气血充足,运行顺畅,则神有所养,五脏六腑精气皆能充盈的功效。远志、人参配伍,益气化痰安神,神养痰化则神志清明,心神充足则能统御精与气。

在补肝肾药中如表4所示出现频次最高的是:温阳、养阴、温中、益气药。在《素问·阴阳应象大论》提到“肾生骨髓,髓生肝”。在传统中医理论中肝藏血,肾藏精,精血同生,肝肾同源。临床上肝与肾虚实密切相关,相互制约,治疗上多兼顾二脏。如《千金要方》指出下焦病的治疗应“热则泻于肝,寒则补于肾”。如表8所示补肝肾的规则集中巴戟天、肉苁蓉、菟丝子为基本配伍,体现《千金方》重视温补肝肾。在药物配伍中加上山茱萸既能益精,又可助阳,能增加其补益肝肾作用;加上石斛则平胃气而补肾虚,养阴清热;加上当归、干地黄则补血养肝,益精填髓;加上五味子、人参、甘草则大补元气,又有补肾宁心之功。桂心、附子、白术、人参、茯苓等配伍,重在使气血生化有源,后天补先天。

综合以上补肺、脾、心、肝、肾药物,出现频次最高的为桂心、人参、甘草和茯苓。在《神农本草经》中这四味药均列为上品,且均能久服轻身延年,各自药性介绍如下。牡桂(一名桂心):味辛温,主上气咳逆,结气喉痹,利关节,补中益气;人参:主补五脏,安精神,定魂魄,止惊悸,除邪气,明目,开心益智;甘草:主五脏六腑寒热邪气,坚筋骨,长肌肉,倍力,金创,解毒;茯苓:主胸胁逆气,忧恚,惊邪,恐悸,心下结痛,寒热烦满,咳逆,口焦舌干,利小便。这四味药配伍重在健脾养心,补中益气。如《素问·玉机真脏论》提到“脾脉者土也,孤脏以溉四傍者也。”体现《千金方》重视补脾土。如《素问·太阴阳明论》提到“四肢皆禀气于胃而不得至经,必因于脾乃得禀也”。意思为五脏六腑不能得到脾的运化水液之精微充养,则人体脏腑气血就亏虚,心、肝、肺、肾后天乏源必欠滋养而致虚损。因此,从《千金方》补五脏药中这四味药配伍出现的概率最高可以看出,孙氏重视补脾,脾不足,百病乃因之变化而生,补五脏应重视健脾。

4 小结

基于关联规则挖掘技术分析《千金方》中养生方剂配伍规律,揭示方剂与中药(包括食物)交叉错综关联与对应的模式性和规律性,发现中医养生规律知识、学术思想,不仅对丰富和发展养生方剂学理论具有重要的意义,同时也为有效指导临床遣药组方和中药养生新药的研发提供重要依据。

[1]高文柱.药王千金方[M].北京:华夏出版社,2004.

[2]Oladipupo OO,Oyelade OJ.Knowledge Discovery from Students’Result Repository:Association Rule Mining Approach[J].International Journal of Computer Science and Security,2010,4(2):199-207.

[3]Wilhelmiina Hämäläinen.StatApriori:an efficient algorithm for searching statistically significant association rules[J].Knowledge and Information Systems,2010,23(3):373-399.

[4]Sandeep Singh Rawat,Lakshmi Rajamani.Discovering Rare Association Rules Using Probability Apriori in Grid Environments[J].Advances in Intelligent and Soft Computing,2012 ,131:527-539.

[5]中国药典委员会.中华人民共和国药典[M].北京:电子工业出版社,2009.

[6]江苏新医学院.中药大辞典[M].上海:上海科学技术出版社,2002.

[7]国家中医药管理局《中华本草》编委会.中华本草[M].上海:上海科学技术出版社,1999.

[8]Somboon Anekritmongkol,ML.Kulthon KasamsanBoolean Algebra and Compression Technique for Association Rule Mining[J].Advanced Data Mining and Applications,2010,6441:150-157.

猜你喜欢

项集频数置信度
一种基于定位置信度预测的二阶段目标检测方法
硼铝复合材料硼含量置信度临界安全分析研究
不确定数据的约束频繁闭项集挖掘算法
正负关联规则两级置信度阈值设置方法
中考频数分布直方图题型展示
学习制作频数分布直方图三部曲
频数和频率
置信度条件下轴承寿命的可靠度分析
盗汗病治疗药物性味归经频数分析
一种新的改进Apriori算法*