APP下载

基于文献计量学的中医遣方用药经验数据挖掘研究现状分析

2020-05-16田少磊李敬华童元元朱玲于琦田野王映辉

中国中医药信息杂志 2020年5期
关键词:发文中医药大学数据挖掘

田少磊,李敬华,童元元,朱玲,于琦,田野,王映辉

基于文献计量学的中医遣方用药经验数据挖掘研究现状分析

田少磊,李敬华,童元元,朱玲,于琦,田野,王映辉

中国中医科学院中医药信息研究所,北京 100700

探讨中医遣方用药经验数据挖掘研究现状、热点及存在问题,为今后相关研究提供借鉴。以中国生物医学文献数据库(CBM)、中国知识资源总库(CNKI)、中国学术期刊数据库(万方数据)、中文科技期刊数据库(维普网)收录的中医遣方用药经验数据挖掘论文为统计来源,采用描述性统计和共现分析方法对文献发表年代、作者、机构、期刊、关键词分布与共现情况进行总结分析。共纳入文献1830篇,分布于194种期刊,文献数量呈逐年上升趋势;形成7个研究团队,三大研究机构合作群;研究疾病广泛;挖掘对象为具有名望的中医临床大家;研究方法多为关联规则、聚类分析、复杂网络、频数分析、因子分析;挖掘内容主要集中在药对、组方规律、配伍规律、用药规律。数据挖掘技术在中医遣方用药经验研究领域的应用愈发广泛,逐渐被中医界接受和认可。

遣方用药;数据挖掘;研究现状;文献计量学

遣方用药是中医辨证论治的重要环节,对其进行研究和总结可发现有效的中药配伍规律,是中医传承的关键部分。近20年来,国内外学者将现代计算机技术与现代数学相结合,利用数据挖掘技术在中医遣方用药经验传承领域进行了一系列有益探索[1]。本文采用文献计量学方法,对中医遣方用药经验数据挖掘研究文献的发表年代、作者、机构、期刊及关键词进行分析,归纳其研究现状、热点及不足,以期为今后相关研究提供借鉴。

1 资料与方法

1.1 数据来源

检索中国生物医学文献数据库(CBM)、中国知识资源总库(CNKI)、中国学术期刊数据库(万方数据)、中文科技期刊数据库(维普网)。以“(数据挖掘or文本挖掘or信息挖掘or关联or聚类or复杂网络)and(中医or名医or国医or处方or用药or药对)”为检索策略,检索途径为题名或关键词。检索时间范围不限,检索日期2019年5月24日。

1.2 纳入与排除标准

纳入以挖掘中医遣方用药经验为主题的研究论文。经前期文献调研发现,学位、会议论文对中医遣方用药经验数据挖掘研究分析结果有较大意义,故纳入。排除综述、理论探索、方法研究、内容信息不全、报刊、专利论文。合并重复发表的论文,保留优先级为期刊论文>学位论文>会议论文。

1.3 研究方法

1.3.1 描述性统计

突突突,突突突……底柱身后三挺马克沁突然怒吼起来,不到最后时刻,底柱是不动用高处这座碉堡内机枪的,这是五连的底牌,轻易不肯暴露目标。

分属主题6“北欧国家数学史”的大会报告是西挪威大学Andreas Christiansen的“第一批挪威数学教科书——一个独立和争议的故事”.他介绍了第一批挪威数学教科书的作者伯恩特·迈克尔·霍姆伯(Bernt Michael Holmboe,1795—1850)及成书背景,这些教科书在当时受到了很大争议.Christiansen试着从成书的历史时期及政治和社会背景去理解这些教科书,同时阐述了诸如教科书的灵感从何而来、今天又能从这些教科书中学到什么等问题.

按文献发表年度统计文献的发表时间分布状况(见图1、表1)。结果显示,中医遣方用药经验数据挖掘研究相关论文首见于2000年[3]。2000-2008年,中医遣方用药经验数据挖掘研究类文献发表量较少,2001、2002、2004年无文献发表;2009-2013年,研究发文量逐年稳步增长;2014-2017年进入快速增长时期,年文献发表量均≥136篇。2017、2018年文献发表量分别为371、373篇。因2019年文献未能反映全年文献发表量,故未予展示。

控制单位面积上玉米穗的合理数量就是合理密植。土壤肥力、水肥条件等因素都决定着玉米的适宜种植密度,调整好玉米的种植密度可以增强整个地块的玉米长势,植株健康生长,玉米的优质高产才能得到保障。不同玉米品种的合理种植密度各不相同,自然条件以及土壤条件也影响着玉米种植密度。针对一些早熟的玉米品种,因为其发育期相对较短,植株相对矮小,所以可以适当密植,每亩以4000株左右为宜。在降雨条件或者灌溉条件良好的地块也可以适当密植,但是干旱地块的种植密度相对稀疏。

运用描述性统计方法对纳入文献的收录期刊进行统计(见表4)。1830篇文献分别来自于194种期刊,发文量≥13篇的期刊共32种,发文量>40篇的期刊共6种,分别为《中国实验方剂学杂志》《中国中医药信息杂志》《中华中医药杂志》《辽宁中医杂志》《中国中药杂志》《世界科学技术-中医药现代化》。

采用Excel2010进行描述性统计,展示中医遣方用药经验数据挖掘研究的文献发表时间、作者、机构、期刊的一般分布情况。

整理文献关键词,将表达内容相同但表述不一致者合并,如将中医传承辅助平台、中医辅助传承系统合并为中医传承辅助系统;聚类、聚类算法合并为聚类分析。运用Gephi软件绘制文献关键词共现网络图(见图4)。图中包括当前中医遣方用药数据挖掘研究领域涉及的挖掘方法及软件、西医疾病、中医疾病等。由图4可知,当前中医遣方用药数据挖掘研究领域的挖掘方法主要包括关联规则、聚类分析、复杂网络、频数分析、因子分析,西医疾病主要包括高血压病、类风湿关节炎、慢性胃炎、冠心病、糖尿病、肺癌等,中医疾病主要包括失眠、痤疮、头痛、哮喘、咳嗽、崩漏等,中医名家包括颜正华、周仲瑛、汪受传、叶天士等,所采用的主要挖掘软件为中医传承辅助系统,挖掘的主要内容包括药对、组方规律、配伍规律、用药规律、证治规律等。见表5。

“共现”指文献的特征项描述信息共同出现的现象,特征项包括文献外部和内部特征,如题名、作者、关键词、机构等。采用共现分析法对共现现象进行定量研究,可揭示信息的内容关联和特征项所隐含的知识。

2 结果与分析

2.1 文献数据

共检出11 769篇文献,CBM、CNKI、万方数据、维普网分别为1768、2872、4636、2493篇,筛选后得到有效文献1830篇。

2.2 文献发表时间分布

1.3.2 共现分析

图1 2000-2018年中医遣方用药经验数据挖掘研究文献发表情况

表1 2000-2018年中医遣方用药经验数据挖掘研究文献类型分布(篇)

年份总量期刊论文学位论文会议论文 2018年373294 77 2 2017年371266100 5 2016年310202 9612 2015年222159 5310 2014年136 93 36 7 2013年114 89 21 4 2012年 83 56 24 3 2011年 57 34 21 2 2010年 36 21 12 3 2009年 21 15 6 0 2008年 6 4 2 0 2007年 7 5 2 0 2006年 7 6 1 0 2005年 3 3 0 0 2003年 1 1 0 0 2000年 1 1 0 0

2.3 文献作者及机构分析

采用描述性统计方法,统计纳入文献的作者及机构的分布情况(见表2、表3)。运用Gephi软件绘制文献发表作者、机构的共现网络图(见图2、图3)。由表2得知,中医遣方用药数据挖掘研究类发文量≥10篇共31人,发文量≥30篇共6人,分别为吴嘉瑞、张冰、张晓朦、吕爱平、郑光、郭位先。由图2可知,中医遣方用药数据挖掘研究形成的研究团队有7个,分别为吴嘉瑞、张冰团队,吕爱平、郑光、杨静团队,李艳、郭锦晨、黄旦团队,潘建科、谢辉、刘军团队,李娟、唐东昕、杨柱、王镜辉团队,孟祥梅、王玮鑫、潘静琳团队,张寅、陈亮团队。

由表3得知,中医遣方用药数据挖掘研究类发文量≥20篇共26家机构,发文量>100篇共3家机构,分别为北京中医药大学、山东中医药大学、广州中医药大学。由图3可知,该领域形成了以北京中医药大学、中国中医科学院临床基础医学研究所、广州中医药大学为核心的三大机构合作群。北京中医药大学与中国中医科学院临床基础医学研究所的合作群联系较为密切。围绕在此两大核心节点周围的机构主要有北京中医药大学基础医学院、北京中医药大学东直门医院、中国中医科学院广安门医院、中国中医科学院中医药信息研究所、中国中医科学院中医基础理论研究所等。围绕在广州中医药大学核心节点周围的机构主要包括广州中医药大学第二临床医院、广州中医药大学第一附属医院等。

表2 中医遣方用药经验数据挖掘研究文献作者分布(发文量≥10)

序号 作者发文量/篇 序号 作者发文量/篇 1吴嘉瑞61 17黄旦14 2张冰59 18杨柱14 3张晓朦41 19唐东昕14 4吕爱平36 20洪坤豪14 5郑光36 21王镜辉13 6郭位先30 22谭勇13 7杨冰27 23周巧12 8李廷保26 24谢辉12 9忻凌25 25杨静12 10郭锦晨24 26陈丽平10 11姜淼24 27庄逸洋10 12刘军23 28李艳10 13郭洪涛23 29张天嵩10 14潘建科22 30罗莉10 15刘健17 31龙奉玺10 16宋倩14

表3 中医遣方用药经验数据挖掘研究文献机构分布(前30位)

序号机构名称发文量/篇 1北京中医药大学181 2山东中医药大学120 3广州中医药大学118 4南京中医药大学 55 5中国中医科学院中医临床基础医学研究所 52 6湖南中医药大学 45 7辽宁中医药大学 41 8广州中医药大学第二临床医学院 37 9中国中医科学院 36 10安徽中医药大学 36 11天津中医药大学 35 12浙江中医药大学 34 13成都中医药大学 34 14中国中医科学院广安门医院 33 15甘肃中医药大学 33 16长春中医药大学 30 17上海中医药大学 30 18广州中医药大学第一附属医院 29 19广东省中医院 29 20湖北中医药大学 26 21贵阳中医药大学 26 22山东中医药大学附属医院 25 23广州中医药大学第一临床医学院 24 24安徽中医药大学第一附属医院 24 25中国中医科学院中医药信息研究所 20 26北京中医药大学东直门医院 20 27辽宁中医药大学附属医院 19 28湖南中医药大学第一附属医院 18 29天津中医药大学第一附属医院 17 30河南中医药大学 17

注:节点度≥12,节点数45,边条数65

注:节点度≥8,节点数38,边条数93

2.4 期刊分析

1.3.3 复杂网络可视化分析

当丝木棉花王在新址长出嫩芽,在花王原址也移植来丝木棉长出嫩叶。我坚信,六七年后,丝木棉花王的英姿又将重现,它遇土而生、顽强生长的精神将深入人心。它们长了又灭,灭了又长,无不昭示着能屈能伸、生生不息的力量。最重要的是,它每一次绽放、凋零、重生,都在我的记忆里。或许,丝木棉的生长,本身就是一种力量,一种精神的延续。

2.5 关键词分析

Gephi为复杂网络可视化分析软件,可用于探索性数据分析、链接分析、社交网络分析和生物网络分析等[2]。本研究选用Gephi中文版0.8.2version,对纳入文献的作者、机构、关键词进行共现分析。根据本研究目的,选择Force Atlas布局,节点颜色为软件默认设置,调节参数后绘制中医遣方用药经验数据挖掘研究的作者、机构、关键词共现知识图谱。节点代表作者、机构、关键词,节点大小与节点度成正比,节点越大表明该作者、机构、关键词在其研究领域所发挥的作用越大。节点之间的连线代表作者、机构、关键词的联系,线条越粗表明关联越紧密。

表4 中医遣方用药经验数据挖掘研究文献发表期刊分布(前32位,篇)

序号期刊发文量 序号期刊发文量 序号期刊发文量 序号期刊发文量 1中国实验方剂学杂志70 9中华中医药学刊37 17世界中西医结合杂志19 25中医药学报13 2中国中医药信息杂志65 10中国中医基础医学杂志37 18北京中医药17 26中国中西医结合杂志13 3中华中医药杂志64 11世界中医药31 19中西医结合心脑血管病杂志16 27中国医药导报13 4辽宁中医杂志56 12辽宁中医药大学学报30 20西部中医药16 28中国民族民间医药13 5中国中药杂志46 13中医杂志27 21湖南中医药大学学报16 29浙江中医药大学学报13 6世界科学技术-中医药现代化45 14中国中医急症20 22中医研究15 30山东中医杂志13 7中医药导报39 15新中医20 23山东中医药大学学报15 31吉林中医药13 8时珍国医国药38 16国际中医中药杂志20 24河南中医14 32湖南中医杂志13

注:节点度≥20,节点数53,边条数380

表5 中医遣方用药经验数据挖掘研究文献关键词共现词表

共现词类别共现词 数据挖掘方法关联规则、聚类分析、复杂网络、频数分析、因子分析 西医疾病高血压病、类风湿关节炎、慢性胃炎、冠心病、糖尿病、肺癌 中医疾病失眠、痤疮、头痛、哮喘、咳嗽、崩漏 中医名家颜正华、周仲瑛、汪受传、叶天士 数据挖掘软件中医传承辅助系统 经验总结内容药对、组方规律、配伍规律、用药规律、证治规律

3 讨论

2009-2013年,中医遣方用药经验数据挖掘研究发文量逐年稳步增长。2014-2017年进入快速增长期。2017、2018年文献发表量已超过370篇。采用数据挖掘手段能发现隐藏在中医药数据中的规律[4],利用数据挖掘方法发现中医遣方用药经验的研究逐年增多,在一定程度上说明数据挖掘技术在中医遣方用药经验研究的领域应用愈发广泛,对发现中医遣方用药经验所发挥的作用逐渐增加。

文献发表作者、机构分析显示,目前中医遣方用药数据挖掘研究领域形成了7个研究团队、三大研究机构合作群。该领域主要发文机构为北京中医药大学、山东中医药大学、广州中医药大学,这三家机构的发文量均高出排名第四的1倍以上。上述研究团队及机构的研究内容及其动态变化可作为该领域研究者的重点关注内容。从发文作者的共现状况可知,各研究团队内部成员联系紧密,形成了稳定的合作关系,而各研究团队间的合作有待进一步加强。从发文机构所属地域及院所可知,北京、广东为该研究领域的核心地带,同一院所系统内部的机构共现现象明显(如广州中医药大学与其所属二级单位),而不同院所系统间的机构联系相对较少,提示各研究团队及机构应打破自身壁垒,增强交流学习,协力促进中医遣方用药数据挖掘研究领域的发展进步。从发文机构所属类别可知,中医药行业的研究机构为该领域研究的中坚力量,计算机、数学、工程等行业的研究机构参与相对较少。在今后的研究中,应注重不同类别机构间的合作,尤其要加强与计算机、数学专业研究机构合作,以推动该领域的进一步发展。

期刊分析显示,6种期刊发文量>40篇,应受到同行关注。中医遣方用药数据挖掘研究类论文目前已刊登在方剂、信息、中药等多种研究主题的中医药类核心期刊上,说明中医遣方用药数据挖掘研究逐渐被中医界接受和认可。

对经营者的考核机制必须讲究科学性、灵活性。一些国有企业的经营者为了完成经营目标采用减员增效的办法,结果出现员工下岗、社会不稳。一位领导对经济形式的判断必须基于科学,在金融危机的背景下提出经济指标实现开门红显然不切实际,结果只会导致下面造假蒙骗上面。

文献关键词分析显示,该领域研究的疾病广泛,涉及西医的循环、呼吸、消化系统疾病及中医的心、肝、肺系等疾病;中医名家为其挖掘的主要对象;研究方法多为关联规则、聚类分析、复杂网络、频数分析、因子分析等,总结的经验集中在药对、组方规律、配伍规律、用药规律等方面。作者通过查阅历年此类文献后发现,近10年中医遣方用药经验数据挖掘领域所采用的方法和经验总结的内容未发生明显变化,提示该领域研究者应不断开拓思路,创新研究模式,协同计算机及数学领域研究者将新兴数据挖掘技术引入中医遣方用药经验挖掘中,探索发现疾病诊治规律,助力中医的传承与发展。

[1] 王映辉,姜在旸,闫英杰,等.基于信息和数据挖掘技术的名老中医临床诊疗经验研究思路[J].世界科学技术-中医药现代化,2005,7(1):98-105.

[2] 邓君,马晓君,毕强.社会网络分析工具Ucinet和Gephi的比较研究[J].情报理论与实践,2014,37(8):133-138.

[3] 唐文彦,赵晓红.古今治疗糖尿病用药规律的聚类分析研究[J].承德医学院学报,2000,17(4):135-138.

[4] 周雯静,金周慧,刘灵力.数据挖掘在中医药研究中的应用述评[J].中国中医药信息杂志,2014,21(10):131-133.

Analysis on Research Status of Data Mining of TCM Prescription and Medication Experience Based on Literature Metrology

TIAN Shaolei, LI Jinghua, TONG Yuanyuan, ZHU Ling, YU Qi, TIAN Ye, WANG Yinghui

To discuss the present situation, hot spots and existing problems of data mining of TCM prescription and medication experience; To provide references for future research.Literature about data mining of TCM prescription and medication experience collected by China Biomedical Literature Database (CBM), China Knowledge Resources Database (CNKI), China Academic Journals Database (Wanfang Data), and Chinese Science and Technology Periodicals Database (VIP) was set as statistical resources. Descriptive statistics and co-occurrence analysis were used to summarize the publication date, author, institution, journal, keyword distribution, and co-occurrence.Totally 1830 articles were included, distributed in 194 journals, the number of published articles was increasing year by year, and 7 research teams and 3 cooperation groups of research institutions were formed; Diseases under study were extensive; Mining objects were prestigious TCM masters; Research methods were mostly association rules, cluster analysis, complex networks, frequency analysis, and factor analysis; The mining content mainly focused on the medicinal pairs, prescription rules, compatibility rules, and medication rules.Data mining technology is increasingly widely used in the field of TCM prescription medication experience, and is gradually known and recognized by the TCM community.

prescription and medication; data mining; research status; bibliometrics

R2-05

A

1005-5304(2020)05-0097-05

10.3969/j.issn.1005-5304.201905431

中国中医科学院中医药“一带一路”合作专项(GH2017-08);中国中医科学院基本科研业务费自主选题项目(ZZ120305)

王映辉,E-mail:wyh0wyh@139.com

(2019-05-30)

(2019-06-20;编辑:季巍巍)

猜你喜欢

发文中医药大学数据挖掘
陕西中医药大学附属医院肾病二科简介
《江中中医药大学学报》简介
探讨人工智能与数据挖掘发展趋势
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
校园拾趣
爷孙趣事
以牙还牙
基于并行计算的大数据挖掘在电网中的应用
中医药大学本科生流行病学教学改革初探
一种基于Hadoop的大数据挖掘云服务及应用