药物流行病学研究热点的可视化分析
——基于文献计量和内容分析
2021-04-06吴明智史国兵徐莉莉宫建
吴明智,史国兵,徐莉莉,宫建
(1.沈阳药科大学药物流行病与临床药物评价课题组,沈阳 110016;2.辽宁省药学会,沈阳 110000;3.中国人民解放军联勤保障部队第967医院,大连 116021)
药物流行病学是以流行病学为基础的一门新兴交叉学科,是运用流行病学的原理和方法,调查、研究、评估人群中药物利用、分布及其效应的应用学科[1-4]。药物流行病学研究能够为医疗产品的安全性和有效性提供有益的信息,并被越来越多地应用于卫生保健系统、干预措施及健康相关行为的评价中[5]。
药物流行病学作为一门学科,产生于20世纪80年代,国内的药物流行病学研究也兴起于20世纪80年代中期,1989年成立了原卫生部ADR监察中心,1992年编辑出版亚洲第一份专业期刊《药物流行病学杂志》,1995年4月在武汉召开首届中国药物流行病学学术会议,均表明药物流行病学在我国有着广阔的发展前景和良好的发展态势。尽管相关的研究文献逐渐增多,但药物流行病学在我国尚处于起步阶段。本研究旨在通过基于文献计量和内容分析的研究方法,对国内外药物流行病学研究的现状进行分析,并揭示在研究热点上的特点和趋势。
1 研究方法与数据处理
1.1研究方法
1.1.1文献计量分析 文献计量分析是综合运用统计学的方法,情报学相关原理,统计文献、揭示学科研究现状并预测其发展方向的分析方法,在各学科领域中均得到了较为广泛的应用。年度发文量的分析可以反映出研究领域的发展历史和发展现状;发文作者分析能够反映出研究领域内的领军人物;对来源期刊的分析可以在一定程度上揭示该领域的重要出版物,有利于科研人员有针对性地关注和阅读专业文献。
1.1.2共词分析 共词分析方法又称为内容分析法,它可归纳出该学科领域不同的研究类团以及各类团之间的关系,进而利用统计软件的可视化功能,使分析结果更加清晰地展现出来。共词分析法的基础是对文献中的概念出现频次的分析,进而计算这些词在同一文章里同时出现的频次,由此构建出共现矩阵,然后通过统计分析软件SPSS对共现矩阵进行系统聚类分析,对每一聚类中的概念词加以组合分析,总结该聚类所研究的主题内容,从而得到研究的热点。
1.1.3战略坐标 战略坐标是LAW等[6]于1988年提出的,用来描述研究领域内部联系情况和领域间相互影响的情况。在二维的战略坐标中,X轴为向心度(centrality),用来度量各个类别关键词与其他类别关键词之间的紧密程度,反映领域间相互影响的强度,一个学科领域与其他学科领域联系的数目和强度越大,这个学科领域在整个研究工作中就越趋于中心地位[7];Y轴为密度(density),用来度量各个类别之内的关键词的紧密程度,反映该类维持自己和发展自己的能力[8]。战略坐标可以概括地表现一个领域或亚领域的结构,它把每一个研究热点放置到坐标的4个象限中,从而描述各主题的研究发展状况。
1.2数据处理 本研究以“药物流行病学”为检索词,在中国知网(CNKI)中检索标题及关键词中包含“药物流行病学”的期刊文献记录;在PubMed数据库中以医学主题词“Pharmacoepidemiology”为检索词,检索外文文献记录。对获取的文献进行人工分析,剔除征订、约稿、简讯和通知等文献的干扰。利用BICOMB软件[9]统计发文年代、作者分布、来源期刊分布,并利用SPSS软件进行共词聚类分析和战略坐标图的建立。
2 结果
2.1论文发文年代分析 从CNKI和PubMed数据库中,经过检索和人工筛选,分别得到中文文献324篇,外文文献1 690篇。
中外文文献的年代分布情况见图1。从年代的分布可以看出,国内外对于药物流行病学的研究文献均出现于20世纪90年代,这与药物流行病学这一学科的产生时间是相符合的。从文献的总数量上来看,外文文献明显多于中文文献,逐年分布的文献趋势也表明,国内药物流行病学研究还处于刚起步的阶段,还有待进一步积累。
图1 药物流行病学文献的年代分布
2.2作者分布分析 一个作者的活跃程度可以通过其发文数量表示,通过对中外文献作者的统计分析,可以发现药物流行病学研究中高产出作者和核心作者。统计发现,早期的文献作者通常仅发表1篇相关文献,随着研究的逐渐增多,引起越来越多研究人员的关注,同一作者开始发表2篇甚至更多的文章,同时合著的现象也越来越多。表1列出了中外文献中发表5篇以上文献的作者。
2.3来源期刊分析 通过对刊载药物流行病学研究文献的期刊进行分析,可以确定该领域的核心期刊,从而反映出国内外科研人员在投稿上的倾向。对载文期刊的分析也可以指导科研人员通过关注较少数量的核心期刊来跟踪本领域的最新研究成果。刊载药物流行病学文献排名前10位的中文期刊和外文期刊分别见表2和表3。
表3 药物流行病学文献的外文期刊分布
2.4共词聚类分析和战略坐标分析
2.4.1共词聚类分析 中文文献中作者给出的关键词以及PubMed数据库中每篇文献所标引的医学主题词都能反映出每篇文献所要讨论的主要内容,能够代表药物流行病学研究中的热点问题,也在一定程度上反映出研究者的研究方向,因此,笔者分别对中外文文献的高频概念进行共词聚类分析,从而显示中外研究者在药物流行病学研究中研究方向上的异同。
PCR产物经核酸电泳检测后,送至成都擎科梓熙生物技术有限公司测序,将所测定菌株的序列同GenBank中已提交的序列进行B1astN分析和同源比对,确定菌株种属,再利用MEGA 5.05构建系统发育树。
对中文文献的关键词进行统计分析,为避免意义相同和相近关键词过于分散,在统计时将这些词统一,例如将“不良反应”“药品不良反应”“ADR”“ADRS”等关键词都统一为“药物不良反应”,最终得到出现频次不少于5次的高频中文关键词共37个。
来自于PubMed数据库的外文文献,由于每篇文献均标引有规范的医学主题词,使得用多种同义词概念表述的内容,规范到同一个主题词概念之下,同时这些主题词又组配有相关的副主题词概念,能够更明确地表述文章所反映的主旨内容,因此外文文献,我们统计主要主题词的出现频次,最终得到出现频次不少于5次的高频主题词共38个。
用BICOMB软件对这些关键词或者主题词分别生成词篇矩阵和共现矩阵,利用SPSS统计分析软件对词篇矩阵进行系统聚类分析,生成聚类分析树图(图2、图3)。37个中文关键词共分成8个聚类,38个外文主题词共分成8个聚类,通过阅读对应概念的文献,从而确定这些聚类所讨论的主要内容。
图2 中文文献共词聚类树图
图3 外文文献共词聚类树图
中文文献:①聚类1,数据库在药物流行病学研究中的应用;②聚类2,药物警戒与药物不良反应;③聚类3,新药上市后的安全性监测;④聚类4,药品不良反应监测的意义和实施;⑤聚类5,药物流行病学的研究方法;⑥聚类6,流行病学的观察性研究;⑦聚类7,中国药物流行病学研究方法学指南;⑧聚类8,药物流行病学的疗效比较和药物经济学的成本效果分析。
外文文献:①聚类1,精神治疗药物用于治疗精神疾病的医学实践;②聚类2,抗惊厥类药物利用的趋势及统计分析;③聚类3,抗生素处方的使用;④聚类4,药物给药剂量的计算;⑤聚类5,药物上市后的不良反应监测;⑥聚类6,药物警戒与药物不良反应报告系统的使用和管理;⑦聚类7,药物流行病学的研究方法;⑧聚类8,事实型数据库在药物流行病学研究中的应用。
2.4.2战略坐标分析 结合共现矩阵分别将中文文献的8个聚类和外文文献的8个聚类在战略坐标图中标示出来(图4、图5)。
图4 中文文献战略坐标图
图5 外文文献战略坐标图
从中文文献的战略坐标图可以发现:第一象限仅包括聚类2一个主题,其向心度和密度均比较高,说明该主题内部联系紧密并处于研究网络的中心,与其他的研究主题有着广泛的联系,根据聚类2的内容“药物警戒与药物不良反应”也可以看出,该主题正是药物流行病学的主要研究内容。
聚类4“药品不良反应监测的意义和实施”处于第二象限,说明该主题与其他的研究主题也有一定的联系,但内部结构略显松散,仍有进一步发展的空间,应当给予更多的关注和研究。
聚类1“数据库在药物流行病学研究中的应用”虽然处于第四象限,但是其密度值更接近于零,因此和其他5个处于第三象限的聚类相似,这些研究主题的密度和相信度都比较低,处于整个研究的边缘位置,每个聚类内部的结构也比较松散,研究尚不成熟,相关的研究仍处于浅显阶段。
从外文文献的战略坐标图可以得出:第一象限包括聚类5“药物上市后的不良反应监测”、聚类7“药物流行病学的研究方法”和聚类8“事实型数据库在药物流行病学研究中的应用”三个研究主题。这三个主题的向心度和密度值均比较高,与其他的研究主题具有非常紧密的联系,其研究能够在一定程度上影响其他主题的发展,在药物流行病学的研究中趋于中心地位。
聚类4“药物给药剂量的计算”处于第二象限,说明该主题与其他的研究主题也有一定的联系,也是药物流行病学研究的主要内容,与第一象限中的三个研究主题比较,仍有进一步发展的空间,应当给予更多的关注和研究。
聚类6“药物警戒与药物不良反应报告系统的使用和管理”位于第四象限,其研究内容与其他聚类的研究主题联系不是很紧密,但是该聚类的密度相对较高,说明该主题的研究自成体系,能够保持一种很好的研究发展趋势。
其他3个聚类均处于第三象限,这些研究主题的密度和向心度都比较低,处于整个研究的边缘位置,每个聚类内部的结构也比较松散,研究尚不成熟。
3 讨论
3.1国内研究方兴未艾,国外研究渐趋成熟 药物流行病学这门学科自从建立以来,因其与人们的生命安全密切相关,所以国内外研究发展非常迅速,文献数量明显增加,政府部门、高校及科研单位、医疗机构都在积极参与药物流行病学的相关研究。从国内相关文献的统计可知,我国药物流行病学研究文献数量还比较少,而且很多文献还是属于理论介绍性的综述性文献,在研究水平上与发达国家比较还存在差距。
3.2高产作者较少,核心作者群尚未形成 核心作者是指发文量较多,影响较大的作者。在中文作者中,发表5 篇以上论文者仅有18人,其中发文最多共发表文献25 篇。在外文作者中,发表5篇以上论文者仅有20人,其中发文最多共发表文献11篇。根据普赖斯定律,核心作者的最低发文数为N=0.749(Nmax)1/2,其中Nmax为最高产作者的论文数[10]。本研究中,中文Nmax为25,外文Nmax为11,N取最大整数,分别为4和3,那么中文核心作者为23人,外文核心作者为74人,分别占作者总数的4.04%和5.77%,这与普赖斯定律(科学家总人数开平方,所得到的人数撰写了全部科学论文的50%)的数据模式相距甚远,说明高产作者不多,核心作者群体尚未形成。
3.3来源期刊分布比较分散 国内刊载药物流行性学研究文献最多的是《药物流行病学杂志》,占全部中文文献的31.9%,排名第2到第10位的期刊,分别刊载文献6~17篇,分布较分散,其中仅有《中国药房》和《中国医院药学杂志》是2017版《中文核心期刊要目总览》收录的核心期刊。刊载药物流行病学外文文献的期刊也呈现出相似的特点,31.18%外文文献发表在期刊Pharmacoepidemiology and Drug Safety上,其他排名前10位的期刊分别刊载文献14~94篇,文献分布也是比较分散的,而且这些期刊在2019年的影响因子也均在5以下。从以上数据也可以看出,刊载药物流行病学研究文献的期刊也没有形成核心期刊群。
3.4国内外的研究侧重点存在差异 通过中文文献和外文文献的共现聚类分析以及战略坐标分析结果,可以发现,国内外在药物流行病学研究的侧重点上,虽然存在一定差异,但也有共同点。例如中外文文献中均有很大一部分是研究药物警戒[11]与药物不良反应[12-13],药物上市后的安全性监测,药物流行病学的研究方法[14-15],事实型数据库在药物流行病学研究中的使用等方面。这也是和药物流行病学“更安全、更有效和更经济的用药”的研究目的相契合的。
在研究主题的成熟程度上,国内外的研究也存在着差异,国内研究得比较深入且成熟的仅有“药物警戒与药物不良反应”主题,而国外的研究比较成熟的研究主题则有3个,这也反映出国内的研究还处于兴起的阶段,在药物流行病学其他分支研究中还缺乏系统性、深入性的研究。
在分析过程中笔者还发现,国外的研究中,有3个研究主题都是关于某类具体药物的临床使用相关的研究,例如,抗精神疾病类药、抗惊厥类药物、抗菌药物类、非甾体抗炎药等。在外文文献中出现这类高频主题词的原因可能与PubMed数据库的主题词标引功能有关。PubMed通过主题词和副主题词组配的功能,充分地表达出概念之间的语义关系,能够真实地反映出每篇文献讨论的主要内容。因此,涉及到一些具体的药物的情况下,也不会用过于笼统的概念来统一标引。
4 结束语
药物流行病学是适应临床医学、临床药学、药物评价的实际需要而发展起来的一门新兴学科,对于加强药品上市后监察、加强药品管理,更好地保护人民用药的安全有效、身体健康,对于指导药品的科研、生产、经营都具有重要意义。本研究通过文献计量分析法和基于概念的共词聚类分析以及战略坐标分析,揭示了当前国内外药物流行病学研究的现状和热点的研究主题,也从一定程度上反映出科研人员在选题方向上的特点,对今后药物流行病学的研究和探索有一定的参考意义。