基于数据挖掘技术分析《神应经》病症经穴应用规律
2016-09-08陈楚云李丽霞洪佳明林国华谢丽琴
陈楚云, 李丽霞, 洪佳明, 林国华, 谢丽琴
(1.广州市中医医院针灸科,广东广州 510130;2.广州中医药大学信息技术学院,广东广州 510006;3.广州中医药大学第一附属医院,广东广州 510405)
·中医文献研究·
基于数据挖掘技术分析《神应经》病症经穴应用规律
陈楚云1,李丽霞1,洪佳明3,林国华3,谢丽琴2
(1.广州市中医医院针灸科,广东广州510130;2.广州中医药大学信息技术学院,广东广州510006;3.广州中医药大学第一附属医院,广东广州510405)
【目的】运用数据挖掘技术分析《神应经》中病症与经脉、穴位应用和穴位配伍的关系。【方法】建立病症、经络、刺灸法、穴位标准库和《神应经》资料库,统计《神应经》中病症各部所取的经络频次与频次最高的穴位;采用Apriori算法实现配伍关系的分析,经测试界定经络配伍和腧穴配伍关系的支持度和置信度,计算经络、腧穴项集的支持度和置信度。【结果】全书病症有547条,共用穴246个、2 029频次,其中用穴频次最高的是三里(手三里和足三里),合谷次之,经脉频次最高的是足太阳膀胱经。足少阳胆经与足太阳膀胱经同时出现的概率最高,为10.17%;处方中出现足阳明胃经、足少阴肾经时,足太阳膀胱经出现的概率最高,为72.73%;曲池与合谷同时出现的概率最高,支持度为3.67%,其次是三里、合谷与曲池;处方中存在肩髃时,曲池出现的概率最高,达88.89%。【结论】运用数据挖掘技术对《神应经》病症经穴应用规律的分析结果可为现代中医针灸与临床提供参考。
《神应经》;数据挖掘;病症经穴应用
《神应经》一卷[1]由明·陈会撰,刘瑾校补。本书系对陈会所撰的《广爱书》(已佚)之十二卷精简节抄而成,内容主要是论述针灸诸病治法,有歌诀,有图谱,有议论[2]。针灸古籍中蕴含着针灸防治疾病的理、法、方、穴、术等理论和经验。本研究拟通过运用数据挖掘技术对《神应经》病症经穴应用规律进行分析,建立针灸古籍推荐平台,为现代中医针灸与临床提供参考。
1 文献资料和方法
1.1标准库根据《新编针灸大辞典》[2]、《中国针灸穴位通鉴》[3]、《中医证病名大辞典》[4],以人工录入的方式建立病症、经络、刺灸法、穴位标准词库。标准词库共有病症8 422条、穴位1 473条、经络216条、针刺655条记录。其中穴位分经穴、经外奇穴及穴位相关名词,录入穴位的名称、别名、定位、特性与出处等信息;经络分经脉、络脉、筋经、皮部及与经络相关名词,录入经络的名称、走向、表里关系、经脉病、出处等信息。
1.2资料库将《神应经》的书名、作者、书刊名、著作年代、全文等分章节录入数据库。其中原文“宽骨”、“神厥”,宽、厥字分别为髋、阙的通假字,分析时程序自动将其转化为标准库中的髋骨、神阙。
1.3数据校对与规范资料录入后,由针灸专业的医师采用交叉校对法进行校对,纠正错误的数据,删除重复的数据。
一些穴位名称或有关描述于标准库中未找到匹配项时,则进行人工阅读与归类。如“尾窍骨尽处”以长强穴代之;“狂犬伤人:灸咬处疮上”等共4处归为阿是穴;“鸡痫:足诸阳”、“蝎蜇、蛇、犬、蜈蚣伤,痛不可忍者:各详其经络部分逆顺戚气刺之;……”等共5处归为“不可定义穴位”。
书中通谷、三里、金门、吕细为同名穴,系统自动搜索标准库的通谷、金门、吕细,归入经外奇穴。但标准库中通谷是足通谷、腹通谷的别名,也属于经外奇穴;三里是手三里、足三里的别名,金门既是经外奇穴也是足太阳膀胱经的郄穴,吕细是太溪穴与经外奇穴太阴跷的别名。书中病症部分三里出现67次,手三里7次,足三里6次,而通谷(13次)、金门(6次)、吕细(3次)书中不分部位。处理的原则:手三里、足三里系统自动按所属的经脉归经;鼻口部中吕细后文有“在内踝骨尖上”,将此处归入经外奇穴;金门在“百穴法歌”、“申足太阳膀胱经篇”均有定位记载,将金门归入足太阳膀胱经;而三里(67次)、通谷(13次)、吕细(2次),系统将自动根据标准库相应于大肠经、胃经,经外奇穴、肾经、膀胱经,肾经、经外奇穴条目下各加1。
1.4数据采集系统采用中国科学院计算机技术研究所开发的汉语词法分析系统ICTCLAS2015作为词性标注工具[5]。将标准库作为ICTCLAS2015的扩展字典,约束Dic={x=>y},其中x表示术语名称,y表示词性,如x=穴位名称时,y=nacupoint表示为词性,对资料库进行切分并标注词性。如书中“咳血∶列缺三里肺俞百劳乳根风门肝俞”用ICTCLAS2015进行切分标注的结果是“咳/ v血/n∶/wp列缺/n三里/n肺俞/n百劳/n乳根/n风门/n肝俞/n”,将标准库作为ICTCLAS2015的扩展字典后切分标注的结果是“咳血/ndisease∶/wp列缺/nacupoint三里/nacupoint肺俞/nacupoint百劳/nacupoint乳根/nacupoint风门/nacupoint肝俞/ nacupoint”。然后,通过构造正则表达式实现文本信息的抽取,最后再进行人工核对,将核对后的信息保存入数据库Oracle10g,转化为结构化数据。
2 结果
2.1病症各部与经脉、腧穴的关系《神应经》疾病治疗部分有24部,共有病症547条,平均每个病症约取3.7个穴位。经统计数据采集的结果,获得《神应经》中病症各部所取的经络频次与频次最高的穴位,以总结各部与所取经络、穴位的关系与规律。各部中所取经脉、穴位最高频次见表1。
由表1可知,病症中经脉频次最高的是足太阳膀胱经,后依次为手阳明大肠经、足阳明胃经、足少阳胆经,频次最低的是手少阴心经。诸风部中频次最高的经脉,涉及大肠经19个穴位,其中穴位合谷频次最高,共7次,其次是百会。
2.2经脉配伍关联分析分析书中由某两条或两条以上经脉组成的配伍组合形式的频繁程度,需先确定经脉配伍的支持度和置信度阈值,通过测试书中不同支持度和置信度阈值,得到经脉配伍的结果集如表2。
由表2可见,支持度5%、置信度50%、经脉配伍关系结果集的数量为27个是比较合理的。因此,本结论以支持度取5%、置信度取50%对经脉配伍关系进行关联分析,计算经脉项集的支持度和置信度,结果见表3。
由表3可知,书中所有病症处方对应的经脉中,足少阳胆经与足太阳膀胱经同时出现的概率最高,为10.17%;处方中出现足阳明胃经、足少阴肾经时,足太阳膀胱经出现的概率最高,为72.73%。
2.3腧穴应用规律分析
2.3.1腧穴使用频次分析分析书中腧穴使用的频繁程度,病症部份共用穴246个,其中不可定义穴位5个、经外奇穴30个;共用穴位2 029次,频次最高的是三里80次(其中手三里7个,足三里6个,余均为三里),依次是合谷67次、三阴交40次,曲池、百会均36次,委中34次,昆仑、复溜、鱼际均33次,间使30次。
表1 病症各部的经脉经穴频次分布 n/次
表2 经脉不同支持度和置信度结果集的数量
表3 各经脉配伍组合的支持度和置信度
2.3.2腧穴配伍关联分析分析书中由两个或两个以上腧穴组成的配伍组合形式的频繁程度,需先确定腧穴配伍的支持度和置信度阈值。通过测试书中不同支持度和置信度阀值,得到腧穴配伍的结果集,见表4。
表4 不同支持度和置信度腧穴配伍结果集的数量
由表4可见,支持度0.9%、置信度50%,腧穴配伍关系结果集的数量25个是比较合理的。因此,支持度取0.9%、置信度取50%对腧穴配伍关系进行关联分析,计算得腧穴项集的支持度和置信度,见表5。
表5 各腧穴配伍组合的支持度和置信度
由表5可知,书中所有病症腧穴处方中,曲池与合谷同时出现的概率最高,支持度为3.67%,其次是三里、合谷与曲池;处方中存在肩髃时,曲池出现的概率最高,为88.89%。
3 讨论
针灸是一门传统的经验医学,其疗效取决于中医独特的理论体系和思维方式,其诊疗过程离不开传统的针灸学理论。针灸古籍凝聚着中医针灸的精华,如何有效地利用这些宝贵资源是发展针灸必须面对的一个问题。数据挖掘技术能从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含的、无先验的、对决策有用的知识,将是连接现代针灸与针灸古籍的桥梁之一[9]。本课题组在已有的快速搜索的基础上,用分词技能术、隐性语义分析等数据技术[10]结合标准库实现了针灸古籍的抽取,分析了《神应经》的病症取经、用穴特点。
3.1对《神应经》病症经穴运用特点进行数据挖掘的意义针灸古籍治疗部分的模式多数为病—症—穴—刺灸法。《神应经》24部共涉及病症547种,用穴2 029次。如诸风部共涉及24种病症,其中涉及大肠经19次,频次为最高,其次为膀胱经(16次)、胆经(13次)、督脉(12次),用穴以合谷穴频次最高,达7次,其次为百会(5次),提示大肠经、膀胱经、胆经、督脉与风病关系密切,故风病治疗取穴以合谷、百会为多。经脉配伍、腧穴配伍分析结果显示大肠经、膀胱经、胆经、督脉等经脉及其腧穴常配伍应用,如胆经与膀胱经同时出现为10.17%;处方中存在肩髃时,曲池出现的概率最高,为88.89%。提示治疗时可以胆经与膀胱经配合应用,取穴时肩髃可配曲池。
3.2数据挖掘过程中存在的问题(1)标准库中存在同名穴,包括腧穴名称相同、不同腧穴别名相同、腧穴名称与其他腧穴的别名相同等等情况,还存在腧穴名称和中医一般术语相同,如风门穴与风门药。(2)病症对应所取的部位系统于标准库中未能找到匹配项的,如该书中的“鸡痫:足诸阳”等。(3)古籍中有将三阴三阳脉作为穴位的,如《千金翼方》:“伤寒喉痹,刺手少阴。少阴在腕,当小指后动脉是也。”标准库中有将足太阴、手少阴、足厥阴、足少阳、手太阳、足太阳经穴为经外奇穴的,是否将手太阴、足少阴、手厥阴、手少阳、足阳明、手阳明也作为经外奇穴还是另立一类经脉穴,有待斟酌。(4)文中尚未对病症所取腧穴的特异性进行分析。这些都是课题组基于数据挖掘技术构建智能针灸古籍推荐平台建设需要进一步解决的问题。
[1]明·陈会,元·王国瑞.神应经扁鹊神应针灸玉龙经[M].北京:中医古籍出版社,1990.
[2]程宝书.新编针灸大辞典[M].北京:华夏出版社,1995.
[3]王德深.中国针灸穴位通鉴(上、下卷)[M].2版.青岛:青岛出版社,2004.
[4]韩成仁,黄启金,王德全.中医证病名大辞典[M].北京:中医古籍出版社,2000.
[5]乔磊,李存华,仲兆满,等.基于规则的人物信息抽取算法的研究[J].南京师范大学学报(自然科学版),2012,35(4):134.
[6]Han J W,Kamber M.数据挖掘概念与技术[M].北京:机械工业出版社,2007:148
[7]何冬凤,任玉兰,唐勇,等.古代不同时期针灸治疗胸痹用穴特点的数据挖掘研究[J].辽宁中医杂志,2013,40(6):1209.
[8]任玉兰,赵凌,陈勤,等.数据挖掘技术在经穴选用及其特异性研究中的应用[J].中医杂志,2010,51(1):47.
[9]毛国君,段立娟,王实,等.数据挖掘原理与算法[M].2版.北京:清华大学出版社,2007:9.
[10]陈楚云,李丽霞,周蔚林.用搜索引擎技术开发和利用针灸古文献[J].世界科学技术:中医药现代化,2011,13(5):821.
【责任编辑:贺小英】
R245.9
A
1007-3213(2016)04-0594-05
10.13359/j.cnki.gzxbtcm.2016.04.035
2016-02-02
陈楚云(1977-),女,副主任医师;E-mail:chencyzwl@126.com
李丽霞(1965-),主任中医师;E-mail:llxia701@126.com
广东省自然科学基金资助项目(编号:2014A030309013);广东省科技计划项目(编号:2012B060500015);广州市科技计划项目(编号:201508020002)