APP下载

2021年全球安全科学技术研究态势

2023-01-16冯长根李生才

华北科技学院学报 2022年6期
关键词:科学研究聚类论文

冯长根,李 杰,李生才

(1. 北京理工大学 爆炸科学与技术国家重点实验室,北京 100081;2. 中国科学院 文献情报中心,北京 100090)

0 引言

科学态势的感知和追踪,对于广大科技工作者及时了解国际研究动态及其前沿,调整研究内容或方向以及建立国际合作有重要的参考价值。长期以来,无论是在国家层面还是机构层面上,都已经开展了相应的研究工作。例如,在以往的研究中,我们就提及了中科院的《研究前沿》报告和中国工程院的《工程前沿》报告。这两种报告已经成为国内科技工作者和科技政策制定的重要参考文献。近年来,研究态势的工作越来越受到领域专家的关注,例如,中国农业科学院在参考《研究前沿》报告的基础上,研发了《农业科学前沿》报告。在全面调研国内外整体科学态势研究和领域态势研究成果的基础上,从2012年开始,课题组的相关人员便开始安全领域的科技文献知识挖掘工作,并为安全领域科学态势研究积累了大量的研究基础。自2015年开始,课题组先后出版了《安全科学知识图谱导论》[1]、《安全科学学术地图》(综合卷)[2]、《安全科学学术地图》(火灾卷)[3]、《安全科学学术地图》(热爆炸卷)[4]、《安全科学学术地图》(问题-方法卷)[5]以及2009—2015年安全科学与技术研究通报——团队协作与影响力系列报告[6-11]。这些研究从不同的维度呈现了全球安全科学研究的现状与特征,为安全科学领域的学者提供了具体场景的研究支撑。在以往研究的基础上,本研究以2021年全球安全科学产出的论文为基础数据,进一步跟踪和分析安全科学的研究态势,为当前我国安全科学学者提供安全科技情报支撑。

1 数据与方法

1.1 数据获取

为了延续之前的研究,并形成对比分析,本研究继续采用了以往的方案来进行数据采集[12]。从科睿唯安的Web of Science数据库中采集了2021年发表在23种安全科学综合性期刊研究论文(Articles)和综述论文(Review)4 861篇。本研究的论文数据检索策略如下:

SO = ("Safety Science" OR "Journal Of Safety Research" OR "Accident Analysis And Prevention" OR "Health Risk Society" OR "International Journal Of Disaster Risk Reduction" OR "International Journal Of Disaster Risk Science" OR "International Journal Of Injury Control And Safety Promotion" OR "International Journal Of Occupational Safety And Ergonomics" OR "IEEE Transactions On Reliability" OR "Journal Of Loss Prevention In The Process Industries" OR "Journal Of Operational Risk" OR "Journal Of Risk" OR "Journal Of Risk And Uncertainty" OR "Journal Of Risk Model Validation" OR "Journal Of Risk Research" OR "Proceedings Of The Institution Of Mechanical Engineers Part O Journal Of Risk And Reliability" OR "Process Safety And Environmental Protection" OR "Process Safety Progress" OR "Risk Analysis" OR "Reliability Engineering System Safety" OR "Risk Management An International Journal" OR "Stochastic Environmental Research And Risk Assessment" OR "Workplace Health Safety")。

对2021年安全科学论文数据完成采集后,首先对数据从宏观领域和微观领域的视角进行分析。宏观的领域分布显示,2021年的安全科学研究论文主要来自工业工程(1 291篇,26.558%)、运筹学与管理科学(1 291篇,26.558%)、化学工业(1 212篇,24.933%)、环境工程(1 035篇,21.292%)以及公共环境与职业健康(1 015篇,20.88%)。在微观的领域维度上,这些数据分布在安全与维修性(868篇,17.856%)、交通(629篇,12.94%)、气候变化(497篇,10.224%)和燃烧(369篇,7.591%)等方面。

1.2 数据分析方法

在本研究中,采用科学计量学的分析方法,对所采集的安全科学论文数据从期刊维度和空间产出分布维度进行分析,以认识安全科学知识产出的特征,揭示安全科学领域的重点知识载体和主要知识贡献主体。采用词频和共词的分析方法,对采集数据的标题、摘要和关键词进行内容的分析,全面呈现2021年的主题结构与热点。在计量和主题分析的基础上,提取和分析了2021年安全领域的高影响论文、高影响参考文献以及知识基础的结构,系统性呈现了研究的前沿与文献支撑。在本研究中采用自主开发的Bibliographic Analysis Tool文献分析工具和VOSviewer[13]科技文本挖掘与可视化工具对所采集的数据进行分析。

2 结果

2.1 安全科学期刊分析

期刊上刊载安全领域论文的数量可以反映其在该领域的重要性和学术影响力。在所选取的样本期刊中,发文量排名前5的期刊分别为《过程安全与环境保护》《可靠性工程与系统安全》《国际减灾与风险》《事故分析与预防》和《安全科学》。虽然,5本期刊占总期刊数的21.74%,但其合计发文量达到了3 197篇,论文数总占比达到了66%。进一步,通过所采集的数据构建了安全期刊的耦合网络,如图1所示。这些期刊的聚类结果与以往类似,通过耦合关系形成了4个大类,分别为#1风险与减灾期刊群(该聚类中包含1 317篇论文)、#2 安全科学与事故预防期刊群(包含论文1 346篇)、#3 可靠性与系统安全期刊群(包含论文986篇)和#4过程安全期刊群(包含论文1 212篇)。与2018—2020年的期刊群相比,2021年期刊群的划分更加清晰。其中,聚类 #1风险与减灾期刊群中的期刊为《健康风险社会》《国际减灾与风险》《国际灾害风险科学》《操作风险杂志》《风险杂志》《风险与不确定性》《风险模型验证杂志》《风险研究》《风险分析》《风险管理》以及《随机环境研究与风险评估》;聚类#2 安全科学与事故预防期刊群中包含了《事故分析与预防》《国际伤害控制和安全促进》《国际职业安全与人机工程学》《安全研究》《安全科学》以及《工作场所健康安全》;#3 可靠性与系统安全期刊群中有《IEEE可靠性汇刊》《风险与可靠性杂志》以及《可靠性工程与系统安全》;#4 过程安全期刊群中包含了《工业过程损失预防杂志》《过程安全与环境保护》以及《过程安全进展》。

图1 2021年全球安全科学样本期刊聚类(期刊前的数字为论文数)

在整体分类的基础上,进一步对2021年安全科学样本期刊的产出与影响力进行了统计,见表1。在期刊层面上,我国学者发表论文主要分布在《过程安全与环境保护》(419篇,50.42%)、《可靠性工程与系统安全》(352篇,47.89%)、《工业过程损失预防杂志》(126篇,42.28%)、《事故分析与预防》(120篇,25.16%)以及《安全科学》(98篇,20.99%)。按照我国学者发表论文占期刊发文总数的比例来看,我国学者还在《IEEE可靠性汇刊》(94篇,58.02%)、《风险与可靠性杂志》(50篇,56.18%)、《风险杂志》(7篇,35.00%)、《随机环境研究与风险评估》(68篇,33.33%)、《风险模型验证杂志》(4篇,26.67%)以及《国际灾害风险科学》(14篇,25.45%)上表现突出,2021年发文占比都超过了25%。在期刊分类维度上来看,我国学者在聚类#3可靠性与系统安全和聚类#4过程安全期刊上发表论文活跃,在期刊群#1和#2上则表现一般。

表1 2021年安全科学样本期刊的产出与影响力

2021年安全科学研究中引用的期刊反映了当年安全研究的知识来源,为安全科学的研究提供了重要的支撑。在所引用的期刊中,被引排名前10依次为ReliabEngSystSafe(8 724次)、AccidentAnalPrev(8 017次)、SafetySci(5 300次)、ProcessSafEnviron(3 465次)、JLossPreventProc(3 359次)、RiskAnal(2 272次)、IntJDisastRiskRe(2 219次)、JHazardMater(1 984次)、IEEETReliab(1 689次)以及TransportResRec(1 600次)。通过VOSviewer构建了期刊的共被引网络,如图2所示。图2中,期刊节点反映了期刊的被引频次,期刊根据共被引关系的强度,形成了不同的聚类。在安全科学研究中,引证的期刊来源在大的维度上与样本期刊的4个聚类一致。为了能进一步深入了解期刊的分类,在高聚类分辨率下,在期刊的4大类别上,进一步划分为8个聚类,分别为#1 可靠性与系统工程、#2灾害风险研究、#3 环境风险研究、#4 风险分析与研究、#5 过程安全研究、#6 安全科学与职业健康、#7 交通安全研究以及#8 环境灾害分析。安全科学引证期刊的共被引可视化结果如图2所示,各类中的高被引期刊见表2。同时分析结果发现,当年安全科学研究引用的期刊主要在其领域内部,且样本期刊以自引为主。

续表

2.2 论文产出的空间态势

2.2.1 国家/地区产出与合作

2021年所有国家或地区组成的合作网络如图3所示。分析结果显示,全球共有123个国家或地区在23种样本期刊上发表了论文,反映了全球安全科学研究的广泛性。2021年全球主要安全科学论文产出国家或地区的统计分析结果见表3。2021年我国论文产出1 501篇,占比30.88%,远远超过其他国家或地区,位居世界第一。结合2018—2020年的论文产出量来看,我国已经连续3年保持论文产量的世界第一,目前已经在全球安全科学研究中形成了广泛的知名度和影响力。此外,美国、英国、澳大利亚、加拿大、意大利、伊朗和印度等国家也在国际安全科学产出上表现突出。我国在全球的安全科学研究中的子网络如图4所示。在国际合作中,我国2021年与全球67个国家或地区建立了合作关系,合作伙伴数量位居全球第一。在整个合作网络中,我国与美国、澳大利亚、英国、加拿大以及荷兰等国家在安全科学研究中建立了密切的合作关系,同时在人才培养和国际学术交流中合作频繁。此外,英国、美国、澳大利亚以及荷兰在全球合作中表现活跃。从论文的引文影响力维度上来看,伊朗以篇均被引6.556次位居全球第一,我国以篇均被引6.520次位居世界第二,随后依次是加拿大、印度和荷兰。总体来看,在全球的高产、高影响的国家中,发展中国家或地区(如我国、伊朗以及印度)已经开始崛起,无论是在论文的数量上,还是在引证影响力上都已经取得了较好的成绩。

表3 2021年全球主要安全科学论文产出国家与地区

图3 2021年全球安全科学123个国家或地区合作网络

图4 2021年我国安全科学研究与67个国家或地区的合作网络

2.2.2 机构产出与合作分布

2021年全球共有4 172个机构在样本期刊上发文,其中发文量不小于5篇的机构有472个,不小于10篇的有185个。在分析中,提取了发文量大于35篇的机构,见表4。在入围的17个机构中,我国机构数达到了11个(TOP 20的高产机构中达到了13个)。与2019—2020年相比,我国的高产机构数相对稳定。在全球的高产机构中,代尔夫特理工大学以发文献67篇,排名第一。代尔夫特理工大学的安全科学研究具有较长的历史,安全科学研究小组的研究成果具有很高的国际影响力和知名度。随后依次是美国德州农工大学、北京航空航天大学、清华大学和印度理工学院。从合作的广泛度上来看,清华大学、北京理工大学、东南大学位列前三位。虽然新冠疫情对国际合作产生了较大的影响,但是我国安全科学领域的学者在全球科研合作上仍然活跃。在论文的引文影响力维度上,纽芬兰纪念大学的篇均被引达到了11.778次,反映该机构在2021年所发表论文整体具有的高影响力。我国机构在引文影响力上也表现突出,北京理工大学、东南大学、中国矿业大学以及中国石油大学位居前5位。通过机构的整体分析不难发现,我国已经产生了一批高产出、高引文影响力的安全科学研究机构,在国际合作中的地位也越来越重要。

表4 2021年安全科学研究高产机构分布

2.3 论文产出的主题结构与热点分析

对2021年安全科学论文的标题和摘要进行文本挖掘分析,得到词频不小于10次的1 292个主题词组成的聚类,如图5所示。图中节点和主题标签大小与主题的词频成正比,词频越高则节点和标签越大;主题在空间的位置表征了主题与主题之间的关联强度,主题越接近,则表明主题的关系越密切。通过复杂网络聚类的方法,将主题的共现网络进行聚类。初次的主题聚类,将安全科学的研究划分为四大方面,这与2018—2020年的分析一致,分别为#1 安全风险与灾害管理、#2工业过程安全研究、#3系统安全与可靠性研究以及#4 交通安全研究,且主题聚类在空间分布上的结构分布也高度相似。在时间维度上,安全科学研究的主题在较短时间窗口下,变化并不显著。为了获得更加细分的主题聚类,在分析中进一步提高了聚类的分辨率参数,如图5(b)所示。分析结果显示,聚类结果由原来的4大聚类增长到了7类。通过各个新类中的主题词,将新的聚类分别命名为a.系统安全与可靠性工程、b. 交通安全、c. 职业安全与健康、d. 环境风险研究、e. 灾害研究、f. 工业过程安全研究、g. 公共卫生研究(主要与新冠疫情相关)。不同的聚类分辨率下,交通安全和可靠性工程的聚类仍然稳定,其他的聚类被划分为数量不同的小的聚类。其中,原聚类的“安全风险与灾害管理”被划分为c、e和g;“工业过程安全研究”分离出了d和f。研究中涉及环境风险或保护方面的研究主题,这是因为在所选定的样本期刊中包含了ProcessSafetyandEnvironmentalProtection和StochasticEnvironmentalResearchandRiskAssessment。在以往的研究中,为了突出安全方向,故而将大的聚类命名为了过程工业安全大类,实际上从工业安全来讲,工业环境风险可以归为工业安全的一部分。

图5 2021年全球安全科学研究主题结构

以上对主题结构的分析经过了自然语言处理以及主题识别等过程,所提取的名词性术语在独立表征研究内容上有较大的欠缺。这是因为,该方面将词语分割的粒度调小,若在较小的时间窗口来进行研究热点的分析,存在明显的不足。因此,在热点的分析中,直接使用作者提供的关键词来进行分析。首先,对关键词进行系统的消歧处理(例如:同义异形)。然后,选取了词频大于30的关键词作为主题热点进行分析。分析结果显示,新冠、道路交通、气候变化、过程安全、地震、自然灾害是2021年安全科学的热点领域主题。在全球大流行的背景下,新冠属于安全科学领域的新兴主题(Emerge topic),并在2021年成为安全科学领域词频最高的热点。交通安全作为安全科学的经典领域,一直是安全科学学者关注的重要方向。大量的安全科学期刊已经将交通安全作为核心方向或重要方向之一(例如:AccidentAnalysisandPrevention、JournalofSafetyResearch以及SafetyScience等)。目前气候变化是造成自然灾害的重要诱发因素之一,已经成为联合国2030年可持续发展目标之一,关于灾害的研究大都围绕气候变化展开。在研究的方法上,2021年的热点方法除了经典的贝叶斯网络、计算流体力学、优化分析以及人工神经网络外,在人工智能背景下机器学习和深度学习的方法已经成为安全领域的新兴问题解决方法。除此之外,表征安全具体方向的热点有风险评价、韧性、风险感知、不确定性、风险管理、脆弱性以及风险分析等。我国学者2021年在安全科学研究中的热点主题见表2。整体上,我国学者所关注的研究主题是世界安全热点主题的一部分,例如:可靠性、贝叶斯、新冠、风险评估以及深度学习等是共性热点。与世界热点比较不同的核心在于,我国学者所分析的安全问题主要聚焦国内,因此‘China’成为共性热点之外排名第一的热点词。除此之外,我国在故障诊断、数值模拟、剩余使用寿命分析、任务成功率以及卷积神经网络等方面也有所偏好。

表5 2021年全球安全科学研究热点关键词

表6 2021年中国安全科学研究热点关键词

续表

2.4 高影响力论文与知识基础的结构

2.4.1 2021年安全科学产出的高影响论文

2021年安全科学样本期刊的论文被引频次分布如图6所示。从分析结果来看,论文的被引频次呈现了极大的不平衡,仅仅只有很少一部分论文获得了较高被引频次,大量论文的被引频次很低。在当前的数据集中,‘0次被引论文’达到了806篇,占比16.58%;‘被引不大于5次的论文’达到了3376篇,占比达到了69.45%。在所有论文中,重点选取了被引频次大于51次的高被引论文进行分析。这些文献主要来自5个期刊,分别为ProcessSafetyandEnvironmentalProtection(5篇)、IEEETransactionsonReliability(2篇)、RiskAnalysis(2篇)、ReliabilityEngineering&SystemSafety(2篇)、SafetyScience(1篇)以及JournalofRiskResearch(1篇)。在这些论文中,有4篇内容与新冠有关,内容涉及了空气污染与新冠、新冠风险感知与传播等。在高被引论文中,除了新冠作为新兴高被引主题受到关注外,对于新兴方法应用也成为高被引论文。例如,LSTM神经网络、双LSTM框架、迁移学习、机器学习、智能框架等。其他的3篇论文都为对某一方面的系统调查或者综述研究。从这些特征不难得出,短期成为高被引的论文主题要么切中了当前的研究热点,要么就是采用了先进的分析技术与方法,要么就是对经典话题的研究综述。通过这些高被引论文的分析,在一定层面上为我们呈现了2021年安全科学的研究前沿。

图6 2021年安全科学研究论文被引频次的统计分布

表7 2021年安全科学研究所发表的高被引论文(被引频次大于50次)

续表

2.4.2 2021年安全科学引用的高影响文献与知识基础的结构

2021年安全科学论文所引用的高被引参考文献表征了过去一年安全科学研究的知识基础,参考文献的共被引网络则呈现了知识基础的结构。对2021年所发表论文进行参考文献的共被引分析,提取了被引频次不小于20次的98篇参考文献进行网络可视化。这些文献时间跨度为1965—2021年,其论文集中出现在2000年以后。这些论文的总被引频次达到了2 910次,篇均为29.69次。通过对文献共被引网络进行社团划分,共得到8个细分的方向,分别为#1灾害与韧性研究(21篇文献)、#2 交通安全(16篇)、#3 过程安全风险评估(14篇)、#4 可靠性+机器学习(14篇)、#5 安全文化与氛围(13篇)、#6风险感知(8篇)、#7 安全系统科学(6篇)以及#8敏感性分析(6篇)。相比研究主题呈现的结构,参考文献层面所呈现的知识颗粒度更小和更加具体。

在整体知识结构的分析基础上,进一步对整体网络中包含的高被引论文进行分析,见表8。当前自然灾害发生频繁,给人类发展带来了巨大的挑战,涉及灾害问题框架研究的成果得到了高的关注度。例如,《仙台2015—2030年减少灾害风险框架》和《定量评估和增强社区抗震能力的框架》在2021年得到了很高的被引量。在这些文献中,交通安全的高被引论文数最多,共出现了4篇,并以统计类或方法综述为主。此外,其他聚类中主题涉及随机森林风险感知、动态社会风险管理以及心理学中的主题分析也得到了高度关注。综合高被引研究论文和网络整体,对2021年安全科学的知识基础贡献最大的文献可以总结为4个特征。

表8 2021年安全科学领域TOP 10高被引参考文献

续表

(1) 领域内提供事实支撑的科研或统计结果。其中,交通安全对事实统计类的数据依赖性最强(例如:WHO的交通安全统计报告或学者的统计分析类研究),使得该方面的论文或报告成为高被引成果。

(2) 领域内的经典研究成果。领域经典成果往往是对领域某一方面的研究提出了开创性的思路或者见解。例如,Zadeh LA(1965)提出的模糊逻辑理论[14]、Holling CS(1973)的韧性理论[15]、Zohar D(1980)提出的安全氛围研究[16]、 Slovic P(1987)在风险感知研究中的开创性工作[17]、Reason J(1990)《人的差错》提出的经典事故模型[18]。这些研究和理念成为安全科学发展的基石,在安全科学研究中长期发挥着重要的作用。

(3) 方法类成果成为安全研究中的重要基础(例如,随机森林、结构方程等)。例如, Cohen J(1988)的《行为科学中的统计功效分析》[19]、Simon W(2020)的《交通数据分析的统计与经济计量方法》[20]、Hollnagel E(2012)的《功能共振分析方法:复杂社会—技术系统建模》[21]等。

(4) 安全科学领域内的综述性研究成果。综述性成果往往是对领域内研究进展的汇集,在内容上具有一定的广度,容易被领域内同行引证,因此往往会形成高被引论文。

图7 2021年安全科学研究引用的98篇高被引参考文献共被引聚与时间分布

3 结论

(1) 2021年,23本安全领域的样本期刊共产出了4 861篇论文,与2018—2020年相比呈现了显著的增长趋势。虽然,全球性的科学研究活动在不同程度上受到了新冠疫情的影响,但在安全科学的产出上却保持了较高的增长态势。研究保持了与以往一致的安全科学期刊样本群,因此当前的安全期刊群仍然被划分为4个方面,分别为风险与灾害期刊群、安全科学与事故预防期刊群、可靠性与系统安全期刊群以及过程安全期刊群。这些期刊的知识产出也主要受到对应期刊群的影响,并在更加细致的维度上可以划分为8个方向,依次为#1可靠性工程、#2 灾害风险研究、#3 环境风险研究、#4 风险分析与研究、#5 过程安全研究、#6 安全科学与职业健康、#7 交通安全研究以及#8 环境灾害分析。

(2) 安全科学的论文产出在空间分布上呈现了显著的集聚特征,即呈现了少量区域产出了较多的论文的现象。在全球范围内,安全科学的产出不平衡的特征仍然存在。虽然,高产国家仍以欧美国家或地区为主,但一些发展中国家已经在国际安全科学产出上崭露头角。我国的论文产出更是连续三年位居全球第一,伊朗的论文篇均被引频次在2021年位居全球第一。2021年,我国与全球67个国家或地区建立了广泛的合作关系,发表论文的平均引文影响力已经位于全球第二。这反映了我国安全科学在国际的影响力的不断提升。这些成绩的取得与我国的一批安全科学高产机构密不可分,2021年的高产安全研究机构以北京航空航天大学、清华大学、东南大学、中国科学院以及同济大学等为代表。

(3) 安全科学研究的主题仍然保持结构上的稳定性,研究领域仍然集中在安全风险与灾害管理、工业过程安全、系统安全与可靠性以及交通安全领域。为了在微观的维度上认识安全科学研究的主题结构,将安全风险与灾害管理拆解为了职业安全与健康研究、灾害研究和公共卫生研究(以新冠为主);从工业过程安全中进一步分离出了环境风险的研究。在更加细粒度的主题的研究中,采用引证分布与共被引的分析方法,分析了2021年的高被引的论文与高被引的参考文献。高被引论文主要涉及对当前新兴热点新冠疫情的研究和当前新方法和新技术的应用。本文从高被引参考文献共被引网络的视角上分析了安全科学研究在论文层面上形成的研究结构,涉及了灾害与韧性研究、交通安全研究、过程安全风险评估、可靠性+机器学习、安全文化与氛围、风险感知、安全系统科学与敏感性分析。高被引参考文献的特征揭示,为安全科学研究提供事实统计数据、方法支撑、或做出开创性的研究以及综述性的研究具有高的引文影响力。

猜你喜欢

科学研究聚类论文
欢迎订阅《林业科学研究》
《老龄科学研究》(月刊)欢迎订阅
欢迎订阅《纺织科学研究》
纺织科学研究
基于K-means聚类的车-地无线通信场强研究
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法
下期论文摘要预登
下期论文摘要预登