国内心血管疾病研究热点探析
—基于共词聚类分析方法
2016-05-25吕小萍邰杨芳石晓敬
吕小萍, 邰杨芳, 石晓敬
(山西医科大学管理学院,太原 030001)
国内心血管疾病研究热点探析
—基于共词聚类分析方法
吕小萍, 邰杨芳, 石晓敬
(山西医科大学管理学院,太原030001)
摘要:目的研究近10年来国内心血管疾病的研究热点,以期为临床和基础科研工作提供有价值的参考。方法利用BICOMB对2005-2014年CAJD及万方期刊论文数据库中收录的相关期刊论文进行统计,并通过统计软件SPSS19.0进行聚类分析。结果国内有关心血管疾病论文数量稳步增长,发文最多的是《中国老年学杂志》,胡大一发表论文数量排名第一,高频关键词有高血压、危险因素、糖尿病等。结论心血管疾病研究受到持续关注,已经形成多支具有影响力的研究团队。近年来研究的热点有心血管疾病的危险因素及预防、发病机制、死亡原因等。
关键词:心血管疾病;共词聚类分析;研究热点 是表述论文的主题且具有实质意义的词汇,当两个关键词同时出现在同一篇文献中时,这两个关键词之间肯定存在着一定的内在关系,并且两个关键词同时出现的次数越多,这种关系也就越密切,两者之间的距离也就越近[3],通过关键词的共词聚类分析可以反映某一领域的研究的热点。本研究运用文献计量分析对CAJD及万方期刊数据库中收录的2005-2014年心血管疾病论文进行了深入研究,发现近10年来相关论文数量稳步增长,说明心血管疾病方面的研究受到了持续的关注;论文主要发表在《中国老年学杂志》、《中华高血压杂志》,和《中华老年心血管病杂志》,排名前十的期刊除《中华老年心血管病杂志》外均为北京大学《中文核心期刊要目总览》来源期刊(2014年版)或中国科学引文数据库来源期刊(2015-2016年度),说明国内有关心血管疾病期刊论文质量都较高;北京大学人民医院的胡大一发表论文数量排名第一,中南大学湘雅医学院第二附属医院赵水平、北京医科大学附属第一医院的杜军保发文量均排名靠前;解放军总医院、北京大学、中国医学科学院阜外心血管病医院等研究机构总发文量位居榜首,是心血管疾病研究的重要基地;胡大一、赵水平和杜军保三位教授均是国内知名专家,对心血管疾病研究有突出贡献,在其带领之下的团队也是心血管疾病研究的主力军;热点关键词有高血压、危险因素、糖尿病、冠心病、动脉粥样硬化、代谢综合征、超重、心力衰竭、脂类、胰岛素抵抗等;近年心血管疾病研究的热点主要在以下几个方面:降压治疗降低心血管疾病的风险;心血管疾病发病机制的分子生物学水平研究;心血管疾病发病机制及治疗;心血管疾病与糖尿病、肿瘤死亡原因分析;心血管疾病危险因素及预防。
随着经济的发展,居民生活方式的变化特别是人口老龄化的加速,心血管疾病的发病数持续增加。在我国心血管疾病死亡占城乡居民总死亡原因的首位,心血管疾病的负担日渐加重,已成为重大的公共卫生问题[1]。对这一高发病率、高致残率及高死亡率特点的心血管疾病的病因、诊断、治疗及预防等方面的研究得到了持续关注。本文利用书目共现分析系统及共词聚类方法深入分析国内2005-2014年以来的心血管疾病研究热点、研究现状,以期为临床工作和基础科研工作提供有价值的参考。
1数据来源与研究方法
1.1数据来源
在中国学术期刊网络出版总库(简称CAJD,是世界上最大的连续动态更新的中国学术期刊全文数据库,是《国家“十一五”时期文化发展规划纲要》中国家“知识资源数据库”出版工程的重要组成部分;出版内容覆盖自然科学、工程技术、农业、哲学、医学、人文社会科学等各个领域)中用关键词“心血管疾病OR心脑血管疾病”进行精确检索,为选择国内质量较高水平论文期刊来源类别选择为SCI来源期刊、EI来源期刊、核心期刊及CSSCI来源期刊;作为CAJD的数据补充,选取万方数据知识服务平台期刊论文数据库用题名或关键词为入口,对“心血管疾病OR心脑血管疾病”进行精确检索,时间均限定为2005-2014年,共检出结果5 325条,数据检索时间为2015年11月12日。检索到的文献以NoteExprees格式导出。
1.2数据清洗
将检索结果导入NoteExpress软件进行查重处理,并去除综述类文章及无效数据如:约稿启示、书评。通知、杂志编排计划、新闻点击等,最终得到4 493条数据。
1.3研究方法
词频统计法是利用关键词的出现频次高低来确定某一领域研究热点和发展动向的文献计量方法[2],共词分析是文献计量分析常用的方法[3]。
本研究利用书目共现分析系统2.0(bibliographic items co-occurrence matrix builder,BICOMB2.0)对数据进行统计,把4 493篇有关心血管疾病论文数据导入书目共现分析系统BICOMB,进行关键统计分析,对部分同义词、近义词及写格式不同的同一词进行合并处理如心血管疾病、心血管病和心脑血管疾病合并为心血管疾病,Ⅱ型糖尿病与2型糖尿病合并为2型糖尿病;并依据中国生物医学文献数据库中的主题词树形结构对部分下位词如肥胖症、肥胖归为上位词超重,胆固醇、高密度脂蛋白归为脂类进行词频统计,获得9 317个有效关键词,最后生成高频关键词共现矩阵。将矩阵导入统计软件SPSS19.0进行共词聚类分析。
2结果分析
2.1年代及期刊分布
对论文发表时间进行统计分析,结果显示,近10年来我国有关心血管疾病论文数量稳步增长(见图1)。
图1 2005-2014年我国心血管疾病期刊论文年度分布Figure 1 Year distribution of cardiovascular disease paper in China in 2005-2014
对发表论文期刊排名进行统计,前10位的期刊见表1,这10种期刊累计发文量达到30.67%,其中发文最多的是《中国老年学杂志》、《中华高血压杂志》和《中华老年心血管病杂志》。
2.2作者及科研机构统计
对高产作者分析得出北京大学人民医院的胡大一发表论文数量排名第一,中南大学湘雅医学院第二附属医院赵水平、北京医科大学附属第一医院的杜军保发文量均排名靠前(见表2);解放军总医院、北京大学、中国医学科学院阜外心血管病医院等研究机构总发文量位居榜首,是心血管疾病研究的重要基地(见表3)。
2.3高频关键词分析
高频关键词按出现频次进行排序,关键词心血 管疾病出现的频次最高,达到2186次,其次是高血压342次、危险因素238次、糖尿病214次、冠心病172次、动脉粥样硬化165次,说明它们是心血管病研究中的重点;再次是代谢综合征、超重、心力衰竭、脂类、胰岛素抵抗等(见表4)。
表12005-2014年我国心血管疾病论文发表期刊分布
Table 1Journal distribution of cardiovascular disease paper in China in 2005-2014
序号期刊出现频次百分比(%)累计百分比(%)1中国老年学杂志※#3297.327.322中华高血压杂志※#1954.3411.663中华老年心脑血管病杂志1383.0714.734现代预防医学※1292.8717.615中国实用内科杂志※#1272.8320.436中国全科医学※#972.1622.597山东医药※952.1124.718中国公共卫生※#922.0526.759实用医学杂志※912.0328.7810临床心血管病杂志※#851.8930.67
※北京大学《中文核心期刊要目总览》来源期刊2014年版;#中国科学引文数据库来源期刊(2015-2016年度)
表22005-2014年我国心血管疾病期刊论文高产作者分布
Table 2Prolific author distribution of cardiovascular disease paper in China in 2005-2014
作者 单位 发文量胡大一北京大学人民医院40赵水平中南大学湘雅医学院第二附属医院15杜军保北京医科大学附属第一医院14吴寿岭开滦医院12蔡乐昆明医学院12李小鹰解放军总医院11叶亚怀罗平县人民医院10李觉同济大学10赵冬首都医科大学附属北京安贞医院9叶平解放军总医院9
表32005-2014年我国心血管疾病期刊论文发表机构分布
Table 3Author affiliation distribution of cardiovascular disease paper in China in 2005-201
排序机构 发文量1解放军总医院862北京大学853中国医学科学院阜外心血管病医院724北京大学人民医院695首都医科大学附属北京安贞医院586北京大学第一医院537中南大学湘雅医学院第二附属医院428北京大学第三医院419中国医学科学院北京协和医院4010重庆医科大学附属第一医院36
表42005-2014年我国心血管疾病期刊论文高频关键词
Table 4High-frequency keywords distribution of cardiovascular disease paper in China in 2005-2014
序号关键字段 出现频次百分比(%)累计百分比(%)序号关键字段 出现频次百分比(%)累计百分比(%)1心血管疾病21869.669.6629氧化应激390.2216.822高血压3421.5111.1830血压460.2022.113危险因素2381.0512.2331炎症440.1922.314糖尿病2140.9513.1732药物治疗440.1922.505冠心病1720.7613.9433降压药物430.1922.696动脉粥样硬化1650.7314.6634氧化应激420.1922.887代谢综合征1550.6915.3535他汀类药物410.1823.068超重1240.5515.9036急性心肌梗死400.1823.249心力衰竭1230.5416.4437死亡率400.1823.4110脂类1110.4916.9338老年380.1723.5811胰岛素抵抗1010.4517.3839基因多态性380.1723.7512血脂异常1000.4417.8240靶器官损害380.1723.9213血脂900.4018.2241治疗380.1724.0914老年人820.3618.5842死亡原因380.1724.2515C反应蛋白质760.3418.9243原发性高血压370.1624.4216患病率580.2619.1744脑血管障碍350.1524.57172型糖尿病570.2519.4345细胞凋亡350.1524.7318同型半胱氨酸570.2519.6846肾病340.1524.8819阿司匹林560.2519.9347动脉硬化330.1525.0220心肌缺血560.2520.1748肿瘤330.1525.1721内皮细胞520.2320.4049心律失常320.1425.3122心血管事件520.2320.6350一氧化氮310.1425.4523儿童510.2320.8651心肌细胞310.1425.5824预防510.2321.0852脑梗死290.1325.7125高脂血症470.2121.2953血管平滑肌细胞290.1325.8426流行病学470.2121.5054血糖280.1225.9627心肌梗死470.2121.7155心血管系统280.1226.0928高尿酸血症460.2021.9156高血糖270.1226.21
2.4共词聚类分析
本研究利用书目分析共现系统软件BICOMB对去除频次最高的关键词“心血管疾病”后频次≥27的高频关键词进行两两匹配,统计其共现次数,输出共现矩阵。将共现矩阵导入SPSS19.0,进行共词聚类分析,得到高频关键词聚类结果,共分5类,见图2。
在树状图上端0-25的标度代表各高频关键词之间的距离,越早聚类的关键词之间的距离越近,关系越紧密。共词聚类分析结果与高频关键词分布结合分析,2005-2014年我国心血管疾病期刊论文研究热点可以总结为以下五类。
2.4.1降压治疗降低心血管疾病的风险包括的主要关键词有降压药、靶器官损害、药物治疗、心血管事件、心血管系统、原发性高血压。大多数高血压患者是并存多种危险因素、靶器官损害甚至心血管疾病的综合体,降压治疗的首要目标是最大程度减少远期心血管疾病的危险,这需要在降压治疗的同时,全面干预心血管危险因素[4]。
2.4.2心血管疾病发病机制的分子生物学水平研究包括关键词有心肌细胞、血管平滑肌细胞、内皮细胞、氧化应激、细胞凋亡、急性心肌梗死。这类文章深入研究心血管疾病的病理生理过程,研究血管内皮细胞的功能变化、氧化应激、细胞凋亡与心血管疾病的发生和发展的密切关系[5,6]。
2.4.3心血管疾病发病机制及治疗包括关键词有动脉粥样硬化、炎症、脂类、C反应蛋白质、冠心病、脑梗死、高血压、同型半胱氨酸、一氧化氮、心力衰竭、心肌梗死、心律失常、心肌缺血、肾病、血脂异常、他汀类药物、老年。这类文章主要研究同型半胱氨酸、C反应蛋白、低密度脂蛋白等与动脉粥样硬化的发生发展的相关性[7,8],以及心力衰竭、心肌梗死等心血管疾病的发病机制[9]。
图2 高频关键词聚类结果图Figure 2 Cluster results of high frequency keywords
2.4.4心血管疾病与糖尿病、肿瘤死亡原因分析包括关键词预防、治疗、阿司匹林、脑血管障碍、死亡率、死亡原因、糖尿病、肿瘤。这类论文研究心血管疾病与肿瘤的共同发病机制以及如何预防[10];探讨糖尿病患者死亡原因与肿瘤之间的关系[11];研究治疗心血管疾病药物的肿瘤风险[12]。
2.4.5心血管疾病危险因素及预防包括关键词有血脂、血糖、超重、儿童、血压、基因多态性、高脂血症、动脉硬化、患病率、流行病学、危险因素、老年人、代谢综合征、胰岛素抵抗、高血糖、高尿酸血症、脂联素、2型糖尿病。这类论文主要研究心血管疾病的危险因素如高血压、血脂异常、糖尿病、超重以及代谢综合征,研究如何有效预防心血管疾病的发生[13],如合理摄入脂肪酸[14];一些论文从基因多态性方面研究心血管疾病的检测治疗[15,16]以及脂联素的抗动脉粥样硬化及保护心肌的作用[17]。
3结论
由于本研究没有进行高频关键词的分段时间动态分析以及突发词检索,本研究中的低频关键词有可能成为将来的研究热点,这是本研究的局限性,在后续研究中将对此进行深入研究。
参考文献:
[1]陈伟伟,高润霖,刘力生,等.中国心血管病报2013概要[J].中国循环杂志,2014,29(7):487-491.
[2]马费成,张勤.国内外知识管理研究热点——基于词频的统计分析[J].情报学报,2006,25(2):163-171.
[3]闫莉莉,程刚.基于共词聚类分析的国外知识密集服务研究热点分析[J].现代情报,2015,35(8):22-27.
[4]严晓伟.全新的高血压治疗策略:早期、综合干预心血管危险因素[J].中华高血压杂志,2010,18(6):513-515.
[5]林小龙,马晓峰,李爽,等.影响血管内皮细胞自噬的因素及其相关机制探讨[J].生物化学与生物物理进展,2012,39(3):234-240.
[6]王全伟,凡文博,王智昊,等.氧化应激与心血管疾病关系的研究进展[J].中国老年学杂志,2014,34(1):270-273.
[7]戴晶,王宪.同型半胱氨酸在心血管疾病中的免疫调节作用(英文)[J].生理学报,2007,59(5):585-592.
[8]陈志华,张皓.低密度脂蛋白及其抗体与动脉粥样硬化的关系[J].上海交通大学学报(医学版),2005,25(6):638-642.
[9]宫丽丽,方莲花,杜冠华.心血管疾病治疗的新靶点——Rho激酶[J].中国药学杂志,2008,43(1):1-4.
[10]李建军.阿司匹林对心血管疾病及肿瘤的预防机制[J].中国实用内科杂志,2011,31(12):977-979.
[11]张化冰,向红丁,杨玉芝,等.15省市1991-2005年住院糖尿病患者与肿瘤相关死亡原因的调查分析[J].中国糖尿病杂志,2010,18(6):402-404.
[12]蔡运昌,吴强.心血管药物与肿瘤风险[J].临床心血管病杂志,2013,29(5):331-334.
[13]金红芳,米杰,杨晓征,等.北京地区肥胖儿童青少年血脂状况调查[J].实用儿科临床杂志,2008,23(13):997-999.
[14]时皎皎,糜漫天,韦娜,等.不同脂肪酸构成比对大鼠血脂影响的研究[J].第三军医大学学报,2007,29(9):824-827.
[15]徐旭,陈忠云,李婧,等.335例心脑血管病患者阿司匹林抵抗与环氧化酶2基因多态性位点的相关性[J].中华老年心脑血管病杂志,2013,15(6):602-606.
[16]胡豫,徐丹梅,孙春艳,等.冠心病患者凝血因子Ⅶ-3230/10bp基因多态性的检测[J].临床心血管病杂志,2005,21(12):705-707.
[17]厉平,姜冉华,李玲,等.血清脂联素水平与我国青少年代谢综合征及心血管疾病危险因素的相关关系[J].中国动脉硬化杂志,2013,21(4):349-353.
Research hotspot of cardiovascular diseases in China based on co-word cluster analysis
LÜ Xiaoping,TAI Yangfang, SHI Xiaojing
(SchoolofManagement,ShanxiMedicalUniversity,Taiyuan030001,China)
Abstract:ObjectiveTo explore the domestic research hotspot of cardiovascular disease in the past ten years and provide valuable reference for the clinical and basic research work. MethodsData of the journal articles about cardiovascular disease published from 2005 to 2014 in CAJD and Wanfang database were analyzed. Research directions and hot points were analyzed and summarized through the cluster analysis by software of BICOMB and SPSS. ResultsThe number of the papers about cardiovascular disease published in journals had been rising steadily in recent years, with Chinese Journal of Gerontology winning the first place in numbers, and the first prolific authors was HU Dayi. The high-frequency key words were high blood pressure, risk factors, diabetes, etc. ConclusionResearch on cardiovascular disease has received a sustained attention and a number of influential research teams have been set up. The research hotspots in recent years include risk factors and prevention of cardiovascular disease, pathogenesis and cause of death, etc.
Key words:cardiovascular disease;co-word cluster analysis;research hotspot
[收稿日期:2015-08-24]
作者简介:吕小萍,女,1979-05生,硕士,实验师,E-mail:lvxiaoping@sxmu.edu.cn.
中图分类号:R54
文献标志码:A
文章编号:1007-6611(2016)02-0119-05
DOI:10.13753/j.issn.1007-6611.2016.02.004
基金项目:山西医科大学青年科研基金资助项目(02201413)