基于GoPubMed有关高原病研究文献的信息分析
2016-03-21,,,
, , ,
PubMed是世界公认的最权威的生物医学文献数据库,收录高质量期刊5 000余种[1],生物医学文献2 300多万篇,世界范围内免费使用[2],是从事生物医学相关领域科学研究的必备工具之一。PubMed免费提供数据接口服务,以便其数据能够与其他个性化系统进行交换[3-5]。
GoPubMed是德国Transinsight公司和德累斯顿工业大学合作研发的以PubMed为数据源、以GO(Gene Ontology)&MeSH(Medical Subject Headings)语义搜索为技术基础的新一代生命科学文献搜索引擎[6]。其对检索结果进行分类和可视化的数据挖掘功能能够帮助用户从不同维度清晰了解某一主题内容的相关文献。系统提供4W(what/who/where/when)栏[7],帮助用户从4个方面进行分析。
我国山地、高原面积占陆地领土面积的59%,山地城镇约占全国城镇的一半,常住人口约占一半[8]。我国是地震、泥石流、洪涝、干旱等自然灾害频发的国家,进行高原地区灾难救援、伤病医治是非战争军事行动的重要内容之一,高原病是与其紧密相关的重要学科领域。本文应用GoPubMed对PubMed中国内外高原病研究的权威文献资源进行多维度的分析和展示,以了解国内外有关高原病研究的发展情况,探寻其发展趋势,准确了解该研究领域的宏观发展方向和微观合作网络。
1 材料与方法
1.1 研究对象
以PubMed收录的国内外高原病相关文献作为研究对象,时间范围为PubMed所有收录年,检索时间截至2015年12月,采用GoPubMed进行检索,检索关键词为high altitude medicine,系统自动匹配主题词为“Altitude Sickness”[mesh],共检索3 180篇文献。
1.2 研究方法
通过statistics进行分析,了解PubMed中高原病研究的主题、年代、地区分布、核心作者和可视化情况,并利用结构方程模型对各因素之间的影响程度进行分析。
结构方程模型(Structural Equation Modeling,SEM)分析也称为结构方程建模,是基于变量的协方差矩阵来分析变量之间关系的一种统计方法。基于结构方程模型的数据分析方法属于新一代统计分析方法,该方法在20世纪80年代就已经成熟。结构方程模型分析的迅速发展,弥补了传统统计方法的不足,成为多元数据分析的重要工具。结构方程模型作为基于变量的协方差矩阵来分析变量之间关系的统计方法,实际上是一般线性模型的拓展,包括因素模型与结构模型,体现了传统路径分析与因素分析的完美结合。
SEM一般使用最大似然法估计模型(Maxi-Likeliheod,ML)分析结构方程的路径系数等估计值,因为ML 法能够使研究者基于数据分析的结果对模型进行修正。目前用于结构方程模型分析的有AMOS、LISREL和EQS等。
AMOS(Analyse of Moment Structures)是一款功能强大的结构方程建模工具,通过对回归分析,因子分析,相关性分析和方差分析等传统多元数据分析方法的扩展,为理论研究提供更多的实证支持。通过AMOS可以在直观的路径图中指定、评估、检验以及展现模型,进而验证路径图中各个变量之间的假设关系。
2 结果分析
2.1 研究内容分析(what)
排名前20位的研究主题见表1。
表1 文献量排名前20的研究主题
由发文量的主题判断研究内容主要集中在特定人群在高海拔缺氧状态下出现的急性脑水肿或肺水肿。从GoPubMed提供的Knowledge Base的发文量统计结果看,来自于MeSH的热门主题显示当前主要研究集中在高原病的生物科学、化学和药品、技术和设备领域,此外针对高原病的地理学特性、命名组和护理保健也占据重要比例;来自于GO的热门主题显示当前主要研究集中在生物过程、细胞成分、分子功能领域。
2.2 发文作者分析(who)
发表论文统计结果见表2。通过GoPubMed工具分析发现,作者Bartsch P发文量最多为资深作者,处于核心作者群,其他核心作者还包括Richalet J、Maggiorini M、Hackett P、León-Velarde F、Cymerman A等。
GoPubMed的统计分析功能可对PubMed中某一领域文献作者的合作网络进行可视化展示。作者之间通过短虚线、长虚线、实线、粗体实线进行连接,连线越多、线型越多说明该作者的研究地位越重要。
高原病的文献作者合作网络见图1。通过可视化图形可以清楚发现高原病研究中有两个作者群的联系非常紧密。
其一是以Bartsch P、Maggiorini M、Swenson E为核心的合作研究团队,其二是以Cymerman A、Rock P为核心的合作研究团队。
虽然Richalet J发文量居第二位,但从其合作网络看,该作者与其他主要研究人员的联系并不紧密。我国学者虽然在高原病研究相关领域的发文量处于前列,但在合作关系图中并没有我国的核心研究人员的关系网络,说明我国从事高原病研究的科研人员处于相对独立的研究状态,缺乏相互间的协作与成果共享。
表2 发文排名前20位的作者
图1 高原病文献作者合作网络
2.3 发文国家/地区及期刊分析(where)
发文国家/地区排名见表3。由表3可以看出,美国高居高原病研究的领导地位,其次是英国,我国处于第三位,印度、日本和尼泊尔排名也都靠前。特别是印度,其首都德里高居高原病研究所在城市的第二位。位于重庆、北京和西宁的研究机构主要承担着我国高原病研究的任务,由此判断印度的高原病研究机构相对集中,而我国则相对分散。
从图2的世界地理范围看,从事高原病研究的热点区域集中在欧洲和北美洲,亚洲和南美洲次之。发文量前20的期刊见表4。
从表4可以看出,发表期刊排名能够为从事高原病研究的科研人员选择合适的期刊发表研究成果提供参考。
表3 发文前20位国家/地区
2.4 发文时间分析(when)
由图3可以看出,PubMed中有关高原病研究的文献基本处于逐年增加的趋势,说明国内外的研究机构正在逐年加大高原病的研究支持力度。
表4 发文量前20位的期刊
图3 高原病研究的发展趋势
2.5 结构方程模型分析
利用结构方程模型分析工具AMOS构建反映高原病研究论文发文情况与主题、作者、期刊等因素之间相互关系的概念模型,对模型各变量之间的关系及其相关程度进行分析。结构方程模型利用最大似然估计(Maximum Likelihood)和标准化路径系数(或载荷系数)进行模型运算。最大似然估计也称为最大概率估计,是一种具有理论性的点估计法,其基本思想是当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得从模型中抽取该n组样本观测值的概率最大。结构方程模型结果图中变量间线上的数字表示路径系数,也就是影响程度。系数越大,表示因素对变量的影响越大。高原病研究结构方程模型见图4。
图4 高原病研究结构方程模型
由图4可以看出,论文主题对论文发文量的影响程度最大,其次是论文作者,期刊影响力及地域分布对论文发文情况的影响程度相对较小。结构方程模型显示,论文主题与高原病论文发文及相关研究关系最密切,说明进行高原病相关主题和内容的研究在高原病研究中的重要作用。论文作者特别是发文较多的资深作者对高原病研究也存在一定程度的影响。此外,作者之间的紧密联系与协助能够更好地推动相关领域研究的不断发展。期刊和地域的因素对高原病研究也存在一定程度的影响,期刊论文作为研究成果的载体,能够为高原病研究提供参考,反映当前所涉及研究领域的研究程度。地域分布能够从一定程度上反映从事高原病研究热点区域的研究活动及影响力。
3 讨论与建议
高原病研究具有很强地域性特点。美国部分城市和西欧的很多国家都是高海拔、多山的高原地貌,因此相关研究文献较多。青藏高原南麓的印度和尼泊尔也都具有极强的高原病研究和处置能力。
基于GoPubMed对高原病研究文献的分析结果,对我国承担高原病研究任务的机构和个人提出如下建议。一是加强高原病相关领域的研究工作,特别是热门主题研究集中的领域,充分发挥高原病研究机构的作用,加强对高原病当前发展前沿信息的研究和掌握,为我国高原病研究发展提供有效支撑。二是从发文作者排名及作者合作关系网络可以看出,我国从事高原病研究的科研人员仍处于相对独立的研究状态,缺少相互间的合作与成果共享,更缺少与国际研究团队合作攻关的研究经历和经验,虽然我国是处于总发文量的第三位,但在核心作者关系网络中并未出现国内的研究人员。
三是结合我国高原、高山地貌比例高、高原人口较多、地质灾害多发等特点,建议科研决策部门持续加大对高原病研究的支持力度,继续保持我国高原病研究的领先地位,将我国相对分散的高原病研究人员和资源进行适当集中,以便发挥大团队的优势;四是针对高原病急性发作特点,在进行大规模非战争军事行动(如救灾)时应将我国的高原病救治机构适当向高原腹地前移,方便伤病员的及时后送和救治。