血瘀证临床用药规律的数据挖掘实验
2010-02-11张万水陈利国
张万水,陈利国
(1.中央民族大学 内科,北京 100081;2.广州暨南大学医学院,广州 516032)
1 资料与方法
1.1 资料来源
1.1.1 收集资料 收集1994~2005年CNKI-中国学术期刊全文数据库及万方数据库中数字化期刊的文献,运用计算机检索《中医杂志》以及瘀血、血瘀、血瘀证等词。
1.1.2 数据库的选择 CNKI-中国学术期刊全文数据库。万方数据库,能够补充前者未收录的期刊,如中医杂志。二者互为补充,使收录的文献在数量、质量上满足要求。
1.1.3 计算机检索 在 CNKI-中国学术期刊全文数据库检索栏中输入关键词血瘀,通过模糊检索得到相关文献10529条。根据文献纳入和排除标准筛选符合要求的文献,并将其保存到文件夹中。然后再输入血瘀、血瘀证、活血化瘀及中医杂志等分别进行二次检索,尽量保证目标文献的录入。
1.2 血瘀证的诊断标准
采用1988年10月北京血瘀证研究国际会议修订的血瘀证诊断标准[1]。
1.3 文献纳入标准
(1)有病名、证型名、方剂名、药物名;(2)1994~2005年公开发表的省级以上期刊文献;(3)符合血瘀证诊断标准;(4)可以是自拟方、成方(《中医方剂大辞典·精选本》[2]所收录的);(5)方药可以是汤剂、丸剂、胶囊、片剂、滴丸、口服液、颗粒剂;(6)临床研究的文献包括病案。
1.4 文献排除标准
(1)综述文献;(2)用针灸或外用药,静脉注射治疗的文献应排除;(3)属于重复发表的论文仅收录其中1条;(4)动物实验文献;(5)除病案以外,未设立对照的文献;(6)理论探讨文献。
按照文献纳入及排除标准进行筛选,检索出文献862篇,其中病案214个,临床研究文献648篇。病案、临床研究文献的病例来自于全国乡村、县城、省市自治区、国家级医院或研究院,分布于22个省市自治区。862篇文献来源于CNKI-中国学术期刊全文数据库和万方数据库收录的国家核心、统计源期刊及中国学术期刊综合评价数据库来源期刊。
1.5 研究方法
1.5.1 保存原始资料 通过计算机检索把符合要求的原始资料保存到计算机资料库中。
1.5.2 整理原始资料 逐项记录文献的题目、作者、文献来源、西医诊断或中医诊断、中医证型、方剂名和中药名。
1.5.3 数据的预处理 原始文献对疾病、证型、方剂、药物名称的表述有差异,同样的药物可能有不同名称,因此要对数据进行预处理。数据的预处理主要是对病名、证型名、方剂名和药物名的规范化,对确保数据质量起着重要作用。
病名的预处理:有些临床文献的病名是疾病阶段的描述,如“卵巢肿瘤术后”并非疾病名称,尽量遵照原始资料。一般情况下,中医病名参照中医内、外、妇、儿等各科全国统编六版教材,西医病名参照西医内、外、妇、儿等各科全国统编六版教材。
证型的预处理:证型部分是参照《中华人民共和国国家标准·中医临床诊疗术语》[3]予以规范,证型一般是根据病机来命名。如心血管疾病的血瘀证,有人认为是心血瘀阻,有的认为是瘀血阻络,有的认为是气滞、气虚等。有的表述意思相同,如痰瘀互阻和痰瘀互结,统一为痰瘀互阻。处理原则以原始记录为依据,八纲、脏腑、卫气营血辨证为标准,进行统一处理,并归纳为13个证型。
方剂名的预处理:参照《中医方剂大辞典·精选本》及《方剂学》全国统编六版教材。方剂名包括成方和加减方,成方是《中医方剂大辞典·精选本》所收录的方剂,主要是成方和加减方的统一。加减方是在成方的基础上进行加减,如果加减方出现的频数超过成方,我们这次把成方和加减方统一为加减方。如血府逐瘀汤出现的次数比血府逐瘀汤加减出现次数少,统一为血府逐瘀汤加减。如果成方出现频次很少,也无加减方出现,遵从原始资料统一为成方。成方基础上加味的也统一为加减方,如血府逐瘀汤加味统一为血府逐瘀汤加减。成方剂型以原始记录为依据,如血府逐瘀胶囊不改为血府逐瘀汤加减。如果同一成方名但药物组成不同,如温经汤有张仲景和陈自明的,把陈自明的温经汤统一为陈氏温经汤。
中药名的预处理:参照《中华人民共和国药典》[4]和全国统编六版教材《中药学》内容予以规范,具体包括下面几个方面:(1)中药别名和俗称:金银花有二花、金花、银花、双花、二宝花之别名;(2)中药合写或出现方剂名:赤白芍包括赤芍、白芍;(3)中药加工或炮制以后的名称:除甘草和炙甘草外,这次把经过加工或炮制的中药名和原中药名统一为原中药名。如三七和三七粉统一为三七,法夏和半夏统一为半夏;(4)药名书写不规范:如栀子写成枝子统一为栀子。
经过数据预处理得到疾病177种,包括内、外、妇、儿各种不同病名。证型13种,方剂121首(自拟方看成1个变量),药物353种。
1.5.4 创建数据库 以SPSS12.0为操作平台,由于原始文献有些是不同医院临床医师对不同数量的病人进行治疗的经验,可以把这些文献看成一个病案,使所有病案包括的变量都成为二值变量。所出现的病名、证型、方剂、药物赋值为1,未出现的则赋值为0,比如只要病例出现了冠心病心绞痛就标记为1,这样来建立数据库基本结构。
1.5.5 录入信息的质量控制 在统计软件中必须为变量建立相应的数据表,即每个病名、证型、方剂和药物作为独立的变量,每个病案对应这些病名、证型、方剂和药物的数据以数字“1”来表示该病案具备相应的病名、证型、方剂和使用相应中药。在本次统计中,共收集了862个文献,得到177种病名13个证型121首方剂(其中自拟方看成1个变量)和353种中药。根据上述统计要求,我们通过编写计算机程序把文本文档转化为统计软件可以识别的数据形式,这样保证了录入的质量。在录入中要把握好质量,这直接关系到数据挖掘的知识发现。我们采用专人录入并反复检查、核对。
2 结果
2.1 一般情况
862个血瘀证临床病案中,由于多数文献是治疗多例患者的报道,统计患者例数为25996例,其中男性9501例占36.55%,女性16495例占63.45%,男女之比为0.58∶1;年龄最小的7岁,年龄最大的82岁,其年龄主要集中在42岁 ~64岁占76.52%。
2.2 疾病
将862个血瘀证病案按预处理方法得出177个病名,血瘀证涉及的疾病中,各疾病出现频率在前10位的顺序依次为:冠心病心绞痛、痛经、脑梗塞、崩漏、中风病、慢性盆腔炎、头痛、糖尿病、血栓闭塞性脉管炎、高血压病。中医病名有39种,有236个病案是根据中医辨病辨证用药;西医病名有138种,有626个病案是根据西医辨病中医辨证来遣方用药的,说明临床医生大多数是根据西医辨病中医辨证来进行遣方用药的。
2.3 证型
通过频数分析得到血瘀证各证型的分布情况,各证型出现频率的顺序依次为气虚血瘀、气滞血瘀、瘀血阻络、痰瘀互阻、肾虚血瘀、寒凝血瘀、湿热血瘀、肝郁血瘀、阳虚血瘀、热毒血瘀、阴虚血瘀、气阴两虚血瘀、血热互结。其中气虚血瘀和气滞血瘀在这13个证型中占49.42%,说明临床血瘀证文献大部分是从气血关系上进行遣方用药的。从上表可以看出,血瘀证辨证主要是气血辨证。
2.4 方剂
经统计加减方使用总频数为341次。血瘀证治疗中经常使用的方剂顺序依次为:血府逐瘀汤加减、补阳还五汤加减、桃红四物汤加减、少腹逐瘀汤加减、通窍活血汤加减、桂枝茯苓丸加减、温经汤加减、复元活血汤加减、当归四逆汤加减,自拟方在临床方剂的运用中占60.44%,故血瘀证临床治疗文献中还是以自拟方为主。其中理血剂占78.49%,其次是温里剂、补益剂、痈疡剂、祛痰剂、和解剂。血瘀证遣方中以理血剂为主,温里剂也是重要的活血化瘀方剂之一。
2.5 药物
对862个病案所用药物进行分析,使用的药物共353味,使用总频次为9070次。通过对所用药物进行频次处理,前10味药物分别为:当归、川芎、丹参、桃仁、红花、黄芪、甘草、白芍、牛膝、柴胡。所用药物由18类药物组成,主要有活血化瘀药、补虚药、解表药、泻下药、理气药、清热药、利水渗湿药、平肝息风药等,使用较多的集中在活血化瘀药、补虚药、理气药、解表药。可以看出,临床血瘀证的治疗大部分是根据气血关系、虚实关系来用药,又以活血化瘀药应用最多。风药和虫类药的使用在活血化瘀中也具有重要作用。
2.6 中药药理分析
随着活血化瘀药药理研究的深入,药物药理用药成为临床遣方用药的思维模式之一。对使用频次在40次以上的前48味中药的现代药理情况进行统计,扩张血管药物使用频次最高,占总频次9070次的34.95%,因此扩张血管药在血瘀证中最为常用。
2.7 用药的性味、归经
通过分析862首方剂结果发现,治疗血瘀证的中药药味以辛为主,共出现3270次;药性以温为主,共出现3652次;归经以肝经为主,共出现3710次,其次是脾经2315次,心经2103次,肾经1978次。
2.8 药物组合
为探寻血瘀证遣方用药规律,运用数据挖掘关联规则分析方法,采取C语言编写的频繁集和关联规则程序,选用 Apriori算法,经频繁集处理并按频数高低筛选出常用的组合形式。
5味前10位药物组合共用药物有10种,有当归、川芎、丹参、桃仁、红花、黄芪、甘草、白芍、牛膝、柴胡。4味前10位药物组合有当归、川芎、丹参、桃仁、红花、黄芪、甘草、白芍,3味前10位药物组合所共用药物有8种:当归、川芎、丹参、桃仁、红花、黄芪、甘草、白芍。2味前10位药物组合所共用药物有8种:当归、川芎、丹参、桃仁、红花、黄芪、甘草、白芍,均为单味药使用频率在前8位的药物。药物组合主要为活血化瘀药与补益药组合,辛温药与甘寒药组合,辛散与酸收药组合,使活血不伤血,体现了方剂的君臣佐使、性味归经等制方要点。
对前5位证型常用2味药物组合进行统计。气虚血瘀:黄芪与当归,气滞血瘀:当归与川芎,瘀血阻络:当归与川芎,痰瘀互阻:当归与茯苓,肾虚血瘀:淫羊藿与当归。对前5位疾病常用2味药物组合进行统计发现,冠心病心绞痛:黄芪与当归配伍最多;痛经:柴胡与香附配伍最多;脑梗塞:全蝎与蜈蚣配伍最多;崩漏:蒲黄与五灵脂配伍最多;中风病:川芎与当归配伍最多。
经关联规则技术处理并对结果进行筛选,在五味药物组合的关联规则中,黄芪 &当归 &桃仁 &红花→川芎的置信度为94.00%和支持度为6.61%最高,说明在含有黄芪、当归、桃仁、红花的处方中94.00%可能有川芎。在4味药物组合的关联规则中,川芎&桃仁&红花→当归规则的置信度和支持度最高。在3味药物组合的关联规则中,当归 &川芎→桃仁规则的置信度和支持度最高。在2味药物的关联规则中当归→川芎规则的置信度和支持度最高。
从药物组合的频繁集和关联规则的分析结果可以看出,药物的配伍一般为活血化瘀药与补益、疏肝理气、理气化痰、虫类、泻下等药之间配伍,一般的关联药组注重气血调和,扶正驱邪兼顾,攻补兼施,寓消于补,辛开酸收并用,消而不伤正,补而不留滞,故气血来复,血脉调和。
3 讨论
3.1 关于研究方法
文献研究的方法是用药规律研究方法中运用较多的一种,通过这种方法可以了解某一时期内医师遣方用药的一般规律,以及某些专家诊疗特色。这对于继承传统中医药有着重要而深远的意义。进行文献研究与评价,还可以指导临床和实验研究。近10余年来,随着我国科技发展的日新月异,中医药公开发表的文献数据库已经作为了解中医前沿信息的重要窗口,对这些文献的再次分析和评价可以缩短研究周期,节省研究金费。
3.2 关于分析方法
关联规则的优点是它可以产生清晰有用的结果,支持间接数据挖掘,可以处理变长的数据,它的计算的消耗量是可以预见的。其缺点是当问题变大时,计算量增长得厉害,难以决定正确的数据,容易忽略稀有的数据。本次研究所建立的数据是0、1格式的离散型的数据,适合关联分析的方法。但此次试验稀有数据比较多,因此可能忽略有意义的稀有数据,影响统计结果。
3.3 关于分析工具
本课题这一次进行了数据挖掘的初步试验[5]。由于SPSS11.5只能输入8个字符的变量,而本课题所涉及的变量名字符最多有36个,因此要把文本文件转换为数据文件,SPSS11.5是不能满足要求的。目前SPSS12.0以上版本能够满足本课题的要求,可以在其中的一个变量名中输入64个字符。因此我们选用SPSS12.0作为开发平台。
4 结论
(1)血瘀证临床治疗基本是以西医辨病结合中医辨证为主。以老年病和妇科疾病多见;(2)血瘀证以气血辨证为主,气虚血瘀和气滞血瘀是血瘀证两大基本证型;(3)血瘀证治疗以桃红四物汤为基本方剂,血府逐瘀汤、补阳还五汤分别是气滞血瘀和气虚血瘀的代表方[6~7];(4)根据药理作用用药成为临床安全用药形式之一,血瘀证治疗药物以扩血管药运用最多。大部分药物具有抗炎作用;(5)药物性味归经以温为主,以凉为次,以平为辅助;以辛为主,以甘为次,以苦为辅助;归肝经为主,脾、心经为次,肾经为辅助;(6)药物配伍主要是活血化瘀配伍补益气血、疏肝理气、虫类及化痰药为主。注意气血阴阳兼顾,攻补兼施;(7)关联规则用于药物配伍分析是可行的。
5 问题与展望
5.1 文献资料的评价
本研究是通过检索公开发表的期刊文献进行的回顾性研究。文献资料是临床医师经验的总结,大多数文献采用随机、对照的方法得出可信、科学的结论。本课题这次进行了数据挖掘实验的初步尝试,只是用人工的方法根据纳入和排除标准删选文献。在今后的研究中可以采用统计学的方法,对文献进行科学评价,对标准文献的研究所得出的结论将会更加真实、客观、可信。
5.2 数据录入误差
为减少数据的录入误差,实行及时复查,专业人员录入,反复核对,通过计算机编程后转换数据,这样保证数据录入的质量。在数据录入中,尽量尊重原文,客观求实地输入原始数据。
5.3 选择合适的研究对象和样本含量
本次实验没有对药物剂量进行研究。在临床文献中有相当一部分文献没有给出药物剂量。药物剂量是方剂配伍的一个重要方面,直接影响治疗效果。在以后的研究中应该把剂量作为研究对象之一。数据挖掘适合海量的资料,所以样本量一定要大。经过计算机反复检索,本课题从1994~2005年的期刊文献中收集了862篇文献,样本量不算小。但是文献收集仅限于期刊,没有收集公开出版的书籍,其中在分析各种病种、证型、方剂及药物配伍时可能出现偏倚。
5.4 数据预处理
对原始文献相关信息的规范化是数据预处理的重要步骤,是保证所提供数据质量的关键,因此相关信息的规范化处理应更科学,不但要得到中医学者的认可,同时也要符合数据挖掘的要求。
5.5 数据挖掘的工具
本课题通过计算机编程,采用 apriori分析方法,得到各种药物之间的关联规则。本次研究主要对药物之间的配伍关系进行分析,以后的研究中不仅可以用关联规则方法分析方药配伍规律,还可以分析遣方用药与证型、症状等的关联,此外可用Logistic回归分析建立血瘀证证型的分布模型。通过对多种模型进行比较和评价,将可以得出更加科学、客观的新的知识发现。
5.6 为血瘀证实验研究提供支持和帮助
血瘀证辨证以气血辨证为主,气血理论广泛运用于临床。“气为血之帅,血为气之母”,气的推动作用在血瘀证的形成过程中起着重要作用。“卫行脉外,营行脉中”,营卫之气均为水谷所化生的精微物质,因此在血瘀证的形成机理研究中,对气的推动作用的研究可能为血瘀证及活血化瘀研究注入“新鲜血液”,同时也为理论的中西结合到临床的中西结合缩短距离。
(感谢暨南大学信息科技学院计算机专业黄承慧同学在计算机编程方面的帮助)
[1]陈可冀.血瘀证与活血化瘀治疗的研究[J].中国中医药现代远程教育,2005,3(11):11.
[2]彭怀仁,项平.中医方剂大辞典精选本[M].北京:人民卫生出版社,1999.
[3]国家质量技术监督局.中华人民共和国国家标准·中医临床诊疗术语[M].北京:中国标准出版社,1997.
[4]中华人民共和国药典委员会编.中华人民共和国药典[M].广州:广东科技出版社,2000.
[5]张万水,陈利国,等.数据挖掘技术及其在中医遣方用药规律中的运用[J].辽宁中医学院学报,2006,8(4),62-63.
[6]张万水,陈利国,等.血瘀证辨证治疗规律及用药规律研究概况[J].辽宁中医学院学报,2006,8(2):131-133.
[7]张万水,陈利国,等.血瘀证临床遣方用药思维模式的现状[J].辽宁中医杂志,2006,33(7):385-386.