生活垃圾回收利用研究的趋势和热点问题
——基于论文关键词共词聚类的分析
2016-09-28胡利勇
胡利勇
(中共广东省委党校图书馆,广东广州510053)
生活垃圾回收利用研究的趋势和热点问题
——基于论文关键词共词聚类的分析
胡利勇
(中共广东省委党校图书馆,广东广州510053)
以中国知网期刊全文数据库为数据源,对主题为“生活垃圾回收利用”的论文进行检索和分析,利用书目共现分析系统Bicomb2对论文的关键词进行提取、统计,并生成共现矩阵,采用文献计量学方法,确定这一主题论文的高频关键词,然后通过统计软件SPSS和可视化工具Ucinet、NetDraw,对高频关键词进行社会关系网络、共词聚类和多维尺度分析,揭示当前生活垃圾回收利用研究发展趋势和关注热点。
文献计量学;生活垃圾;回收利用;共词分析;聚类分析
随着社会经济的不断发展,人们生活质量逐渐提高,人口增长与城市化也带来了生活垃圾的大量增加与种类的多样化。生活垃圾的回收利用,是关乎每个人切实利益的大事,也越来越受到社会和学界的关注。在中国知网中检索主题为“垃圾处理”的文献,返回结果为4.7万多篇,而且近10年来,几乎每年都有3 000~4 000篇与垃圾处理相关的文献,可见,垃圾处理这个主题受到了持续的关注。垃圾这个主题太过宏大,因此仅从“生活垃圾”这一角度,从已有文献的脉络中,寻找生活垃圾回收利用的研究趋势和关注热点。
1 文献来源与研究方法步骤
1.1文献来源
应用文献计量学方法,对以“生活垃圾回收利用”为主题的文献进行统计分析。利用中国知网期刊全文数据库,采用高级检索方式,跨库选择“期刊”、“博士”、“硕士”、“国际会议”、“国内会议”、“特色期刊”6个论文数据库作为文献来源库,检索条件设为主题同时包含“生活垃圾”和“回收利用”,采用精确检索方式,总共检索出889篇文献。删除供求、动态、科技速递、信息集成、议程、简讯、通知等消息型文章,共计876篇论文,这些论文总被引次数为4 924次,篇均被引次数为5.62次,被引次数最大为195次,零被引文献352篇,占总数的40.18%;总共被下载239 979次,平均每篇被下载273.95次,其中,期刊论文723篇,博士学位论文13篇,硕士学位论文99篇,国际会议论文5篇,中国会议论文36篇;基金论文113篇,占19.62%。这些论文的h指数为32。
1.2研究方法和步骤
本研究主要利用Excel,Bicomb2,Ucinet,NetDraw 和SPSS等工具和软件,对选取的生活垃圾回收利用876篇被引论文进行统计分析,具体方法和步骤如下。
(1)利用中国知网的参考文献导出功能,选择Notefirst方式,将样本论文的题名、作者、关键词等元数据导出为XML格式,并以文本(.txt)文件格式保存;
(2)采用书目共现分析系统Bicomb2软件[1],提取样本论文的关键要素并进行统计,导出为Excel格式文件,多方面分析和讨论;
(3)利用文献计量学方法,确定高频关键词,在Bicomb2中生成共现矩阵,并利用Ucinet软件和Net-Draw工具,绘制核心关键词知识图谱;
(4)运用SPSS19软件进行数据聚类分析,获得聚类树状图和相异系数矩阵的多维尺度图[2];
(5)根据分析结果,总结生活垃圾回收利用领域学术研究的趋势和热点。
2 高频关键词统计分析
利用Bicomb2软件,提取876篇论文的发表年份、关键词信息,根据它们出现的频次,借鉴普赖斯定律确定核心要素信息。年份出现频次即当年发表的论文数量;关键词出现频次,即每个关键词在论文关键词中出现的总次数。
2.1年份分布统计
生活垃圾回收处理主题论文数量,呈现出逐年增多的态势(图1),表明这一主题的研究越来越受到关注和重视。2012和2013年论文数最多,分别为70篇和69篇,之后两年略有减少。
图1 生活垃圾回收利用主题文章年份分布图
2.2关键词统计分析
2.2.1关键词抽取
抽取876篇高被引论文关键词,共计得到2 297个不重复的关键词,累计出现5 244次。频次最多关键词是“回收利用”,出现频次314次,也就是说有314篇论文使用了“回收利用”这个关键词;其次,是“生活垃圾”和“城市生活垃圾”,出现频次分别为165次和136次。3个最高频次关键词累计占总频次的11.73%,表明,这批文章的检索结果切合主题。词频为1次的关键词1 724个,由此可见,生活垃圾回收利用论文研究范围相当宽泛。
2.2.2数据清洗
由于2 297个关键词,去掉与主题完全相同的关键词“生活垃圾”、“回收利用”、“固废处理”、“垃圾”、“废弃物”等,有些无具体意义,如现状、问题、对策等,予以删除,有许多意义趋同,需要经过合并同义词、近义词等处理。如把“分类回收”、“垃圾分类”、“垃圾分类收集”、“分类处理”、“细分类”等统一替换为“分类”。经过反复仔细的确认和筛查,最终得到关键词1 837个,总词频为4 086次,频次最高的关键词是“分类”,出现212次,也就是说有212篇文章使用了与分类相关的词作为论文的关键词,词频为1的关键词1 482个。
2.2.3确定高频关键词
文献计量学中,普赖斯定律被用来确定高产和高影响力作者[3]。也可以利用普莱斯公式,确定核心关键词最低频次10.91,取整数11,即关键词累计出现11次或以上的关键词,作为核心关键词,共得36个高频关键词(表1),占关键总数的1.96%,累计出现1 677次,占总频次的41.04%。
表1 生活垃圾回收利用论文高频关键词
这36个高频关键词反映了生活垃圾回收利用的研究热点,分析这些关键词之间的关系,有助于确定生活垃圾回收利用近年来的发展脉络、热点前沿和发展方向[5]。共词聚类正是通过选择高频词来反映某个研究领域的知识结构,高频词代表了该词在所有关键词中出现频次的贡献值。
3 社会网络、共词聚类和多维度分析
3.1社会网络分析
分析生活垃圾回收利用领域的研究热点,主要利用Bicomb2软件得到论文的高频关键词共现矩阵,然后利用社会网络分析软件Ucinet6.0[6]和可视化绘图工具NetDraw[7],绘制出基于中介中心度(Betweenness)分析和K-cores分析[10]的高频关键词社会网络关系图谱(图2)。
图2中圆形点代表高频关键词节点,节点越大,代表该节点在整个关键词网络中的作用越大,控制其他节点共现的能力也越强;节点之间的关系用实线连接,实线越粗,代表相互之间的关系越强[8]。K-cores分析则是通过颜色来区分关键词在整个网络中的核心程度,圆形节点表示节点关键词在网络中处于核心地位[9]。
图2 高频关键词社会网络关系图谱
通过图2,可以直观地得到以下结论:(1)从节点大小来看,“填埋”、“焚烧”、“分类”圆形最大,且处于核心位置,是这个网络中的核心;生活垃圾的处理方式依然是“填埋”和“焚烧”为主,“分类”是前提。(2)“塑料”、“资源化”、“循环经济”、“环保”圆形次之,属于这个网络中的重点成员;与“减量化”、“产业化”、“无害化”、“市场化”相比,“资源化”处于更核心的位置,显然是被更多提及和重视,是当前生活垃圾回收利用的主要研究方向。(3)通过K-cores分析,将从整个网络分类,其中圆形节点占据图中大部分位置,且处于中心区域,说明它们是生活垃圾回收利用领域的研究热点,其他节点都围绕这些热点延伸拓展。
3.2聚类分析和多维尺度分析
为了更加直观地描述生活垃圾回收利用高频关键词之间的距离和相似度,通过SPSS19的双变量Pearson相关分析功能,把由Bicomb2提取出的高频关键词共现矩阵转化为相关矩阵[10],然后在Excel中用“1”与相关矩阵全部数值相减,得到表示两个关键词间相异程度的相异矩阵(见表2),再用SPSS19对高频关键词进行系统聚类和多维尺度分析[11]。
3.2.1聚类分析
将关键词相异矩阵导入SPSS19进行系统聚类分析[12],方法中选择组间联接,度量标准为区间“平均Euclidean距离”,绘制树状图(图3)。系统树状图更直观地显示出了聚类的整个过程,上边的横轴方向,给出了各类别之间相对距离的大小[13]。
依据聚类结果,可将生活垃圾回收利用的研究分为4个主题。
(1)生活垃圾的最终处理研究。包括:以填埋、焚烧、堆肥为主要手段,厌氧发酵、厌氧消化等生物处理为辅助手段的垃圾处理研究;填埋场的选择、填埋气体的回收利用、填埋气发电、填埋渗滤液的处理工艺等相关内容研究。
表2 高频关键词相异矩阵(部分)
(2)生活垃圾分类收集与资源化研究。包括:以垃圾分类方法、分类目录、分类国际国内经验、社区垃圾分类、源头分类、分类垃圾桶、分类站、国内外分类经验介绍等为主要研究内容的垃圾分类回收体系研究,以废塑料、废电池、废玻璃、餐厨(厨余)垃圾、废包装等不同种类划分的垃圾收运体系研究,以及可回收物和再生资源资源化的研究。
(3)垃圾污染防治及法律法规税费措施研究。包括:一次性垃圾、重金属、日光灯管等特殊垃圾回收研究;以污染防治、保护生态环境、保持生态平衡、生态补偿、生态工业园区等为对象的可持续发展研究;垃圾处理的法律法规研究:立法研究、立法体系、立法规范、法律控制、地方性法规政策研究;垃圾收费:收费制度、政策、模式、标准、平台的研究;环境税、垃圾税、排污税、填埋税、税收办法等税收政策的研究。
(4)生活垃圾回收利用的目标和发展趋势研究。减量化、资源化、无害化是生活垃圾目标,市场化和产业化是手段,最终要达到资源循环利用、发展循环型经济的目的。
3.2.2多维尺度分析
多维尺度分析是研究对象之间的相似性或距离,将研究对象在一个低维(二维或三维)的空间形象地表示出来,进行聚类或维度分析的一种图示法。将关键词相异矩阵导入SPSS19进行“度量-多维尺度”分析,在距离中选择形状为“正对称”,模型中度量水平选择“区间”,度量模型为“Euclidean距离”,输出得到图4。
图4 高频关键词多维尺度分析图
依据分析的结果,可以直观地看出,多维尺度分析图对高频关键词主题的划分,与树状聚类图的分类基本一致,其特征都是局部相对集中,整体比较集中,与中心点间的距离都较近,热点突出,局部热点特征明显。观察图4,把生活垃圾回收利用的热点问题大致划分为3个类团。
(1)位于坐标图上方的是“垃圾分类研究类团”,其中,垃圾分类是该类团的研究热点,塑料、餐厨、包装、电池、玻璃等生活垃圾的回收利用是该类团的重点研究问题,可回收物和再生资源资源化是这个类团的新热点。
(2)位于坐标图右方中央的是“垃圾处理研究类团”,其中,焚烧、填埋、堆肥三大处理模式及其延伸内容是该类团的研究重点,有机垃圾、生物处理和生态环境保护是这个类团当前研究新热点问题。
(3)位于坐标图左下方的是“垃圾政策研究类团”。相比之下,该类团内部节点联系松散,说明目前对该主题的研究还比较分散,由于该类团所处的位置可以预测,电子垃圾、重金属污染、建筑垃圾、日光灯管、一次性等垃圾的细分处理,垃圾回收利用精细化的必然趋势,为了保护生态而不得不做好污染防治,通过税收、收费及市场化、产业化手段,达到生活垃圾减量化、无害化的目标,最终实现资源循环利用的可持续发展模式。生态保护和污染防治,是该类团的研究重点和热点。
4 总结与讨论
以上对生活垃圾回收利用论文的分析,在一定程度上揭示了这一领域的研究特征和热点问题,但采用的方法可能还存在不少缺点,分析问题的角度还有很多不足之处。
(1)关于核心关键词的确定。核心关键词是研究重点,在选取核心关键词的时候发现,生活垃圾回收利用这一主题还是太过宽泛,很多论文关键词并不规范,尤其是早期发表的论文,有好多文章虽然被引用次数很多,但是却没有标注关键词,因此无法提取其关键词内容来做分析;在数据清洗过程中删除了诸如对策、问题、现状、研究等不能表达主题意义的关键词,还有很多近义词、同义词,可谓精彩纷呈、眼花缭乱,因此在合并和删除关键词时,以主观意识为主,错漏难免,可能也会影响分析结果。建议学者在论文写作确定关键词时,能够给出反映文章精髓的词语,直扣主题,力求精准,尽量避免概念宽泛、万象包罗。仅从核心关键词来确定生活垃圾回收利用研究现状和热点,还是不够全面。在搜集数据和撰写论文过程中,笔者对论文作者、发文单位以及核心期刊等也做统计分析,从这些指标综合来衡量学科主题发展,似乎更为科学。
(2)文献统计分析过程中还发现,生活垃圾回收利用这一主题的论文,绝大多数是在研究城市,研究农村的也有,但是数量和比例都很小,更多文章在为“垃圾围城”出谋划策,却少有人关注“垃圾围村”的现象。从实际生活垃圾回收利用情况来看,城市在垃圾分类、垃圾回收、垃圾转运、垃圾最后的填埋、焚烧等各个环节,都远远超过了农村,因此应该加强对农村生活垃圾回收利用的关注和研究。
(3)分析的论文样本中,并没有出现当前网络新闻上频频提及的“互联网+废品回收”、二维码垃圾袋等垃圾回收新热点,网媒和报纸等对当前的热点问题反映比较及时,但以消息报道为主,深入研究比较少,而期刊论文理论性更强,研究分析更加透彻严谨,因此,希望学者能对垃圾回收利用方面好的经验做法和热点问题做更深入研究,这有利于推动整个行业的发展。
(4)生活垃圾细分处理是必然趋势,低值可回收物正是从生活垃圾中细分出来的,价值低,但有一定循环利用价值,容易被混入其他生活垃圾,对低值可回收物的资源化处理,是当前生活垃圾处理的难题之一,需要进一步研究和探讨。
总之,生活垃圾回收利用未来研究的重点方向是针对这些热点主题的研究:做好垃圾分类是垃圾回收利用的前提条件,针对不同种类的生活垃圾,应该采取不同的收运和处理办法;目前生活垃圾回收后的主要处理手段是填埋、焚烧、堆肥,要通过生物处理、卫生填埋、填埋气发电等手段,尽量减少对生态环境带来的不利影响。生活垃圾要实现减量化、无害化、资源化的目标,需要有强有力的法律和法规作为保障,以税费改革为措施,以市场化、产业化为纽带,发展循环经济,最终达到可持续发展。
[1]崔雷,刘伟,闫雷,等.文献数据库中书目信息共现挖掘系统的开发[J].现代图书情报技术,2008(08):70-75.
[2]王佑镁,陈慧斌.近十年我国电子书包研究热点与发展趋势——基于共词矩阵的知识图谱分析[J].中国电化教育,2014(05):4-10.
[3]邱均平.信息计量学[M].武汉:武汉大学出版社,2007:192-195.
[4]刘雪立,王兆军.2004—2008年我国情报专题研究高被引论文的统计与分析[J].情报杂志,2010(01):64-67.
[5]侯海燕,刘则渊,栾春娟.基于知识图谱的国际科学计量学研究前沿计量分析[J].科研管理,2009(01):164-170.
[6]卜彩丽.翻转课堂的研究热点、主题与发展趋势解析——基于共词分析的可视化研究[J].现代教育技术,2016(01):73-79.
[7]王运锋,夏德宏,颜尧妹.社会网络分析与可视化工具NetDraw的应用案例分析[J].现代教育技术,2008(04):85-89.
[8]肖明.知识图谱工具使用指南[M].北京:中国铁道出版社,2014:37-38.
[9]姜鑫.我国微博研究主题的共词可视化分析[J].现代情报,2013 (11):108-113.
[10]罗应婷.SPSS统计分析从基础到实践[M].北京:电子工业出版社,2010:191-193.
[11]邱均平,杨思洛,王明芝.改革开放30年来我国情报学研究的回顾与展望(二)——情报学研究论文的作者分析[J].图书情报研究,2009(02):8-13.
[12]安源.2000—2009年图书馆信息服务领域研究现状分析——基于词频分析法和共词分析法[J].情报科学,2012(06):873-878,892.
[13]贾丽艳,杜强.SPSS统计分析标准教程[M].北京:人民邮电出版社,2010(05):268.
Trends and hot topics in the research on domestic waste recycling and utilization —base on co-word and cluster analysis of paper's keywords
HU Liyong
(Library,Party School of Guangdong Committee of CCP,Guangzhou 510053,China)
According to the result of searching papers on the recycling and utilization of domestic waste in the China Academic Journal Network Publishing Database of CNKI,the keywords are extracted and a co-occurrence matrix is generated by Bicomb2.Using the bibliometrics methods,high frequency keywords of the papers are confirmed.Then social network analysis,co-word clustering and multidimensional scaling analysis are made by SPSS,Ucinet and NetDraw to reveal the developing conditions and hot topics in the field of domestic waste recycling and utilization.
Bibliometrics;domestic waste;recycling and utilization;co-word analysis;cluster analysis
X799.3
A
1674-0912(2016)07-0021-05
2016-05-24)
广州城市管理研究联盟2015年度课题“低价值可回收物的回收利用政策研究”(0018)
胡利勇(1980-),男,硕士,馆员,中共广东省委党校(广东行政学院)图书馆咨询部主任。