APP下载

664例崩漏医案信息挖掘结果与传统知识比较研究

2014-03-12杨阳崔蒙田野王静亢力李萌连超杰张晶奚怀平李园白

中国中医药图书情报杂志 2014年5期
关键词:项集中药学医案

杨阳,崔蒙,田野,王静,亢力,李萌,连超杰,张晶,奚怀平,李园白



664例崩漏医案信息挖掘结果与传统知识比较研究

杨阳,崔蒙,田野,王静,亢力,李萌,连超杰,张晶,奚怀平,李园白*

中国中医科学院中医药信息研究所,北京 100700

对664例崩漏医案信息挖掘结果与传统知识进行比较研究。对664例崩漏医案,利用关联分析技术,挖掘高频中药组、高频症状+中药组、高频证型+中药组的规律,并与传统知识进行比对。中药高频组的符合率是88.9%,中药+症状高频组的符合率是45.0%,中药+证型高频组的符合率是100%,同时获得未在传统经典理论中直接表述的知识。利用信息挖掘技术发现中医药信息规律是切实可行的,可作为传统知识总结的补充与参考,所发现的结果可以为临床医师提供处方参考。

中医药;妇科;崩漏;医案;数据挖掘

在妇科医案处方数据中,隐藏着一些在临床上应用良久却尚未著书立说、未被医师主观意识所发现的用药规律。本文通过关联分析技术,对664例崩漏医案的中药、中医证型、症状进行信息处理,挖掘新知,将挖掘结果与传统知识进行比对,探索数据挖掘结果在中医药信息领域的临床适用性。

1 资料

1.1 数据来源

中国期刊全文数据库(CNKI)、万方数据库、中国生物医学文献数据库(CBM)。

1.2 检索方法

检索项选择“题名”或“关键词”,检索词为“崩漏”AND(“医案”OR“病案”OR“验案”OR“治验”)。

1.3 文献纳入标准

医案内容必须包括中医诊断、处方、中医证型、症状4项内容。为了提升数据挖掘结果的可靠性,对各部分内容进行严格控制。

1.3.1 中医诊断 必须符合国家中医药管理局1994年颁布的《中华人民共和国中医药行业标准——中医病证诊断疗效标准》[1]。

1.3.2 中药处方 必须为中草药汤剂。单纯或辅助使用针灸、中成药、手术治疗、西药疗法的医案不予收录。

1.3.3 中医证型 必须含有病性及病位两个方面的内容。医案内容中只含有病位(如“脾肾为病”),或只含有病性(如“实”、“虚”),不予以收录。

1.3.4 症状 除主症以外,必须有2个以上次要症状。

按照上述标准,本文共采集崩漏医案664例,发表时间为1972-2005年,患者就诊时间为1951—2003年。

2 方法

2.1 数据预处理

对后期数据分析需要的中药、中医证型、症状3个方面的数据进行预处理。对中药名称的选词主要参考《中华人民共和国药典》(2005版)[2]、《中药大辞典》[3]和《中华本草》[4];对中医证型的选词参考《中国中医药学主题词表》[5]《中医诊断学》[6]《中华人民共和国中医药行业标准——中医病证诊断疗效标准》等书籍;对症状的选词参考《中国中医药学主题词表》《中医诊断学》《简明中医辞典》[7]等书籍。

2.2 数据挖掘工具

应用WEKA软件进行数据挖掘。该软件由中国中医科学院周雪忠教授等人开发,使用Apriori算法进行药物、症状、药症和药证等关联规则的知识发现。

2.3 数据挖掘方法

从不同角度对中药、中医证型、症状三部分内容进行处理,通过对“中药+中药”、“中药+症状”、“中药+证型”3种高频集的分析,获得更多的关联关系。

参考以往研究和多次运行预实验的结果,设定最小支持度为5%,最小置信度为40%。对所得挖掘结果筛选出置信度最高的10个项目集和支持度最高的10个项目集进行分析。

3 结果

对高频中药组、高频症状+中药组、高频证型+中药组3种高频集的挖掘结果进行分析,并与传统知识进行比对。

3.1 高频中药组与传统理论比对

表1显示,在治疗崩漏医案中,支持度为前10名的药对在传统文献中大部分找到了相应理论依据。例如排名第1位的项集白芍⇒当归,在《常用中药配对与禁忌》[8]中记载“白芍补血敛阴,柔肝和营。当归补血活血,止痛。白芍酸收性和,守而不走;当归辛香性开,走而不守。二药配伍,一守一行,一开一合,动静结合,补血而不滞血,活血而不耗血。合用共奏养血补血、养肝止痛之功”。但是排名第9位的项集地黄⇒当归未找到相关的文献描述。

在置信度前10名的药对中,有9对在传统文献中得到认可。例如地骨皮⇒地黄,在《现代中药炮制手册》[9]中记载“地骨皮甘寒清热,凉血止血,生津止渴,生地黄味甘苦性寒,功善清热凉血,又能养阴生津,二药配对,共奏清热凉血、养阴生津之功”。但是排名第9位的药对五灵脂⇒当归未在传统文献中找到依据。

表1 崩漏高频中药组挖掘结果(前10名)

3.2 高频症状+中药组挖掘结果与传统理论比对

表2显示,支持度为前10名的项集在传统文献中大部分都可以找到相应的理论依据。例如排在第1位的项集当归⇒经血量多,在《中药学》中记载“月经量多有实有虚,实为血热迫血妄行,虚者多为气虚不摄,冲任不调所致,当归多用于此证属虚者”[10]232。排名第3位的项集白芍⇒经血量多,在《中华临床中药学》[11]中记载“白芍养血敛阴,调和气血,可用于妇人冲任损伤不能制约经血,经血非时妄行,或量多如注,或淋漓不断”。数据挖掘结果与传统理论基本相符。

表2 崩漏高频症状+中药组数据挖掘结果(前10名)

置信度为前10名项集的大部分也找到了相关论述。例如排名第3位的项集五灵脂⇒腹痛,在《中药学》中记载“五灵脂苦咸温通疏泄,专入肝经血分,长于通利血脉散瘀止痛,为治血瘀诸痛之要药,如胸胁脘腹刺痛,痛经,经闭,产后瘀滞腹痛,骨折肿痛均可施用”[10]159。而排名第1位的项集五灵脂⇒经血有块,虽然分别找到了各自相关内容的描述,但两者之间明显的相关描述未有明显的理念依据。在《中药学》中记载“五灵脂:苦咸甘温,归肝经,功效是通利血脉,活血止痛,散瘀止血”[10]159,出现了活血、散瘀的表述;而在《中医诊法学》中对经血有块的描述为“经血有块:主症是气滞血瘀,或寒凝血瘀或气虚血瘀,或热结血瘀”[12],出现了4次“血瘀”。

3.3 高频证型+中药组挖掘结果与传统理论比对

表3显示,支持度、置信度前10名的项集全部在传统文献中找到了相应的理论依据。例如支持度排在第1位的项集热⇒地黄,在《中药学》中记载“地黄性甘苦寒,清热凉血,养阴生津”[10]45;置信度排名第1位的桃仁⇒瘀,在《中药学》中记载“桃仁苦甘平,活血祛瘀,润肠通便,消痈排脓,止咳平喘”[10]157。

4 结论

4.1 有效结果

对664例崩漏医案信息支持度和置信度排名前10位的数据进行分析,中药高频组与传统理论的符合率是88.9%,中药+症状高频组的符合率是45.0%,中药+证型高频组的符合率是100%。说明数据挖掘结果与传统理论大体一致,可以看出关联分析技术在妇科医案的规律发现中的合理有效性,数据挖掘信息处理技术可作为传统知识总结的补充,值得进一步研究。

表3 崩漏高频证型+中药组数据挖掘结果(前10名)

4.2 产生新知

本次崩漏数据挖掘结果发现一些在传统理论中未直接表述,但在临床处方中经常被应用的规律。例如在高频中药组中的地黄⇒当归、五灵脂⇒当归,这两组对药在临床上为医师广为应用,但在现有文献中未找到这两组药物成对使用的理论依据。因此,可以认为这些规律是医师从主观意识上难以察觉到的新知。

4.3 临床参考

本文探讨了中药配伍、高频症状+中药组、高频证型+中药组三种关系,这些关系都是医师在临床上比较关注的方面。例如,在治疗崩漏的瘀证时,教科书中记载的活血化瘀常用药有28个,活血化瘀方剂有8首,如果没有丰富的临证经验,在用药选择上会存在一定困难。而本项研究发现,专家在治疗瘀证时93%都用了桃仁,这些规律可为医师在临证处方时提供用药参考。

本项研究用定量的数理关系把“药-证-症”相连接,可以更科学地指导临床和科研工作,发现的结果可以为临床医师提供处方参考。

[1]国家中医药管理局.中医病证诊断疗效标准[M].南京:南京大学出版社,1994.

[2]国家药典委员会.中华人民共和国药典:一部[S].北京:化学工业出版社,2005.

[3]江苏新医学院.中药大辞典[M].上海:上海科学技术出版社,1977.

[4]国家中医药管理局《中华本草》编委会.中华本草[M].上海:上海科学技术出版社,1999.

[5]吴兰成.中国中医药学主题词表[M].北京:中医古籍出版社,1996.

[6]邓铁涛.中医诊断学[M].上海:上海科学技术出版社, 2002.

[7]李经纬.简明中医辞典(修订本)[M].北京:中国中医药出版社,2001.

[8]谭月来,刘庆林.常用中药配对与禁忌[M].太原:山西科学技术出版社,2003.

[9]冉懋雄.现代中药炮制手册[M].北京:中国中医药出版社, 2002:1.

[10]高学敏.中药学[M].北京:人民卫生出版社,2000.

[11]雷载权,张廷禧.中华临床中药学[M].北京:人民卫生出版社,1998.

[12]欧阳兵.中医诊法学[M].北京:中国医药科技出版社, 2002.

A Comparative Study on Data Mining Results of 664 Metrorrhagia Medical Records and Traditional Knowledge

Yang Yang, Cui Meng, Tian Ye, Wang Jing, Kang Li, Li Meng, Lian Chaojie, Zhang Jing, Xi Huaiping, Li Yuanbai*

(Institute of Information on Traditional Chinese Medicine, China Academy of Chinese Medical Sciences, Beijing 100700, China)

To carry out a comparative study on data mining results of 664 metrorrhagia medical records and traditional knowledge.Laws among Chinese herbs of high-frequency group, symptoms of high-frequency & Chinese herbs group, and syndromes of high-frequency & Chinese herbs group were researched based on 664 metrorrhagia medical records by using association analysis technology, and they were compared with traditional knowledge.The coincidence rate was 88.9% in the Chinese herbs of high-frequency group, 45% in the symptoms of high-frequency & Chinese herbs group, and 100% in the syndromes of high-frequency & Chinese herbs group. Meanwhile, knowledge which was not stated directly in the traditional classical theories was acquired.It is practical to detect the laws of information on traditional Chinese medicine by using data-mining technology, which can be the supplement and reference for summary of traditional knowledge, and the data-mining results can serve as the reference for the clinicians’ prescription.

traditional Chinese medicine; gynaecology; metrorrhagia; medical record; data mining

10.3969/j.issn.2095-5707.2014.05.002

国家自然科学基金青年科学基金(81303068)

杨阳,助理研究员,研究方向:中医药信息。E-mail: sanyangkt@126.com

通讯作者:李园白,副研究员,研究方向:中医药信息。E-mail: liyuanbai126@126.com

2014-04-08

编辑:魏民

猜你喜欢

项集中药学医案
基于Python语言构建名中医医案数据挖掘平台
中医医案方剂多维相似度算法设计与探索
临床中药学学科简介
临床中药学学科简介
基于医案探讨王孟英辨治温热病处方用药规律
桂枝汤煎服法对临床中药学实践的启示
基于矩阵相乘的Apriori改进算法
不确定数据的约束频繁闭项集挖掘算法
中医医案类数据库的构建与数据处理研究
云南省高等学校本科中药学实验教学中心介绍