基于共词聚类与可视化的我国机动车尾气污染研究热点分析
2022-08-22邓续君黄明睿
邓续君 黄明睿 张 帆
(1.广东技术师范大学汽车与交通工程学院,广东 广州 510665;2.广东技术师范大学创新创业学院,广东 广州 510665;3.河源市广师大研究院,广东 河源 517500)
0 引言
随着经济社会快速发展及城镇化进程不断加速,我国机动车保有量呈高速增长态势。据公安部统计[1],截至2021年底,全国机动车保有量达3.95亿辆;2021年全国新注册登记机动车3 674万辆,同比增长10.38%。机动车保有量的迅速增加使我国环境空气质量面临着严峻挑战。生态环境部发布《中国移动源环境管理年报(2021年)》显示[2],移动源污染已成为我国大中城市空气污染的重要来源,是造成细颗粒物、光化学烟雾污染的重要原因,机动车污染防治的紧迫性日益凸显。近年来,“机动车尾气污染”这一重要民生领域已成为学界关注的热点,涌现出了众多学术成果,涉及了工学、理学、管理学、经济学、医学等诸多学科门类[3-5],但鲜有该领域文献计量研究的相关报道,文献作为反映科技发展趋势的重要载体,文献计量研究可为了解该领域研究热点的分布特征及发展趋势提供参考依据。
研究生是我国科学研究的生力军,其学位论文内容新颖、专业性强、信息量大、学术价值高,在一定程度上反映了学科发展的动态与特点,其中论文关键词常被用于表达文献的主题内容[6]。中国知识资源总库(CNKI)囊括了中国90%以上的知识信息资源,是目前资源类型完整、内容全面的国家知识资源保障体系,完整收录博硕士论文等各种知识资源。作为文献计量学的重要方法,共词聚类法常被用于研究肿瘤护理[7]、社区教育[8]、企业技术创新[9]、城市治理[10]等诸多学科领域的研究热点。共词聚类法是以一组词为研究对象,两两组合统计它们在同一篇文献中出现的次数,然后以此为基础对这些词进行聚类分析,厘清这些词之间的亲疏关系,进而分析这些词所代表领域的结构变化,频次较高的关键词可较好反映某领域的研究热点和知识结构[11]。随着科学计算可视化的发展,社会网络分析、聚类树状结构图、战略坐标分析图等可视化工具逐渐融入了传统共词聚类分析中,将研究领域的热点和知识结构关系直观形象地呈现出来[12]。本研究采用共词聚类与可视化分析方法,对我国开展机动车尾气污染研究的研究生学位论文的关键词进行分析,以期为国内研究者了解该领域的研究热点与发展态势提供参考。
1 研究方法
1.1 数据来源与检索方法
数据来源为中国知识资源总库(CNKI)中的研究生学位论文(含博士、硕士学位论文)数据库,围绕我国机动车尾气污染研究领域,以机动车尾气、机动车尾气污染、机动车污染、汽车尾气、交通尾气、汽车废气、车辆废气、车辆尾气、机动车排气、车辆排气为篇名进行检索,检索时间范围自建库至2021年10月30日,检索时间为2021年10月30日,下载这些论文的标题、摘要和关键词,保存为TXT格式以便统计分析。
1.2 高频关键词的提取
采用书目共现分析系统(BICOMB)软件提取以上TXT文件中的关键词。由于有些关键词尚不够标准化或规范化,故需对论文之间存在内涵相同或相似的关键词进行替换处理或同值修改处理[13],如将汽车尾气、尾气、废气替换为机动车尾气等。统计以上所有关键词的出现频次。采用基于正态分布的高频词阈值计算方法选取本研究中的高频关键词[14],研究热点需要的高频词数量至少要达到σ+1(σ指词频分布的标准偏差),至少要能够反映文献库的中心(累积频次的34%)。
1.3 共词矩阵的生成与可视化
以提取的高频关键词为对象,通过BICOMB软件的矩阵计算生成词篇矩阵和共词矩阵。采用UCINET软件开展社会网络分析,生成可视化的共词矩阵社会网络图谱,图谱中的顶点为高频关键词,词与词间的关系强弱通过连接的粗细呈现,关系越强,连接它们间的线条越粗[12]。
1.4 聚类分析
将上述生成的词篇矩阵导入SPSS 23软件中进行系统聚类分析,输出聚类树状结构图,根据关键词之间的亲疏关系,识别出聚类树状结构图中各个类别的含义。
1.5 战略坐标分析
将以上聚类分析结论中的若干类关键词组作为战略坐标分析的类团,按照向心度与密度的计算方法[15],分别以向心度、密度为X轴、Y轴,以各个类向心度和密度的均值为原点,绘制热点研究领域的战略坐标图。向心度表示各类团间的相互影响程度,密度表示某类团内部关键词之间的联系程度。
2 结果与讨论
2.1 高频关键词统计
自中国知识资源总库(CNKI)中学位论文(含博士、硕士学位论文)数据库建库至2021年10月30日,围绕我国机动车尾气污染研究领域,检索出学位论文共434篇,经替换处理或同值修改处理后共得到关键词1 146个。本研究选取频次阈值大于或等于5的关键词作为高频关键词,共得到38个高频关键词(如表1所示),其总的出现频次为714次,占关键词的总频次的34.69%,基本能够代表我国机动车尾气污染领域研究热点。
表1 高频关键词清单
2.2 高频关键词的词篇矩阵、共词矩阵及社会网络分析
采用BICOMB得到以上高频关键词的词篇矩阵(如表2所示)和38×38的共词矩阵(如表3所示),采用UCINET软件开展社会网络分析得到以上高频关键词的社会网络图谱(如图1所示)。
表2 高频关键词词篇矩阵(局部)
表3、图1表明,关键词“机动车尾气”出现频次最高并在图1中处于较为中心的位置,该词与“尾气催化剂”“颗粒物”“氮氧化物”“余热发电”“控制措施”“尾气扩散模型”“大气污染”等词之间的关系较强,且这些词均位于38个高频关键词表中的词频前50%位置;此外,关系较强的词对还有“建模与仿真-余热发电”“一氧化碳-氮氧化物”“尾气催化剂-尾气治理”“尾气催化剂-储氧材料”等。这表明与机动车尾气相关的研究热点主要包括以颗粒物、氮氧化物为代表的大气污染物,以尾气催化剂、余热发电等为代表的污染控制与综合利用技术,以及以尾气排放模型为代表的机动车尾气排放特征;建模与仿真是余热发电研究的重要手段;一氧化碳和氮氧化物的协同性减排是机动车尾气治理对象的重要特征;催化剂是尾气治理的重要材料,储氧材料是催化剂的核心组成部分之一。
表3 高频关键词共词矩阵(局部)
图1 高频关键词社会网络图
2.3 聚类分析
将表2所示的高频关键词词篇矩阵导入SPSS 23软件中进行系统聚类分析,输出聚类树状结构图,将我国机动车尾气污染的研究热点分为6个类团(如图2所示)。
图2 聚类树状结构图
①Ⅰ类:尾气污染特征与交通环境管控。此类研究又包括两个小类:一类是机动车尾气污染特征,重点围绕机动车尾气排放的规律模式及其对大气环境的影响、机动车尾气中各类主要污染物的排放情况、颗粒物和多环芳烃等污染物排放的测算和应对等方面开展研究;另一类是交通环境管控,研究热点是尾气排放模型与交通仿真应用、道路交叉口和机动车比功率等交通环境管控的相关要素。
②Ⅱ类:尾气余热发电技术与强化换热建模仿真。重点围绕机动车余热综合利用和换热效率提升策略开展研究。
③Ⅲ类:基于催化氧化的尾气治理材料与技术。此类研究又包括两个小类:一类是溶胶凝胶法制备的尾气催化剂研究,另一类是在排放标准趋严的背景下研究储氧材料迭代升级对提升尾气催化剂活性的重要作用。
④Ⅳ类:尾气形成机制及等离子体治理和遥感监测技术。此类研究可细分为三个小类:一类是机动车尾气中氮氧化物和一氧化碳的形成机制,一类是针对机动车尾气中氮氧化物和一氧化碳的遥测技术,一类是等离子体技术应用于机动车尾气减排。
⑤Ⅴ类:基于非分光红外的尾气检测技术。此类重点面向机动车尾气的非分光红外检测技术开展研究。
⑥Ⅵ类:掺加纳米二氧化钛的沥青路面用于光催化降解尾气。重点研究纳米二氧化钛涂层沥青路面对机动车尾气的降解作用。
2.4 战略坐标分析
以高频关键词共词矩阵和聚类分析结论为基础,计算每个类别的向心度和密度,绘制热点研究领域的战略坐标图(如图3所示)。
图3 词团战略坐标分析图
图3表明,Ⅰ类和Ⅱ类这两类词团均位于核心且成熟的第一象限,因此这两类主题往往不易消失,维持和发展自身的能力均较强,能在相当长的时间段内保持较高的词频,其中Ⅰ类词团的研究更为成熟和深入,Ⅱ类词团的研究则处于更为中心的地位;Ⅲ类、Ⅳ类、Ⅴ类词团均位于非核心且不成熟的第三象限,表明这三类主题的研究目前较为边缘化且还不够深入,存在较大发展空间,但已经逐渐成为非常重要的研究领域;Ⅵ类词团位于核心非成熟的第四象限,这说明该类主题表现较为活跃,但词团内部之间的联系较为松散,不能很好地自成一体,存在发展还不够稳定的问题。
3 结论
①从我国机动车尾气污染研究领域的研究生学位论文中提取的38个高频关键词基本能够代表我国机动车尾气污染领域研究热点。其中“机动车尾气”出现频次最高,与其密切相关的研究热点包括以颗粒物、氮氧化物为代表的大气污染物,以尾气催化剂、余热发电等为代表的污染控制与综合利用技术,以及以尾气排放模型为代表的机动车尾气排放特征等。
②我国机动车尾气污染的研究热点可分为六个类团:Ⅰ类(尾气污染特征与交通环境管控)、Ⅱ类(尾气余热发电技术与强化换热建模仿真)、Ⅲ类(基于催化氧化的尾气治理材料与技术)、Ⅳ类(尾气形成机制及等离子体治理和遥感监测技术)、Ⅴ类(基于非分光红外的尾气检测技术)、Ⅵ类(掺加纳米二氧化钛的沥青路面用于光催化降解尾气)。其中,Ⅰ类、Ⅱ类的研究地位较为核心且成熟度较高,维持和发展自身的能力均较强;Ⅲ类、Ⅳ类、Ⅴ类的研究地位较为边缘化且还不够深入,存在较多发展空间;Ⅵ类主题在我国机动车尾气污染研究中的表现较为活跃,但存在发展还不够稳定的问题。