APP下载

基于共词分析法的我国产业结构研究热点解析

2017-12-18李慧慧

湖北经济学院学报 2017年6期
关键词:共词就业结构第三产业

李慧慧

(1.北方民族大学 管理学院,银川 750021;2.合肥工业大学 管理学院,合肥 230009)

基于共词分析法的我国产业结构研究热点解析

李慧慧1,2

(1.北方民族大学 管理学院,银川 750021;2.合肥工业大学 管理学院,合肥 230009)

基于共词分析法,分析了27495篇产业结构相关论文中出现的26467个关键词,统计出63个高频关键词。从词频分析可以看出,“就业结构”“就业”“第三产业”“产业结构升级”“工业化”等关键词出现频率很高,是产业结构领域研究中的热点内容。同时,通过构建高频关键词的共词矩阵、相似矩阵、相异矩阵并运用多元统计分析发现,我国产业结构研究主要集中在第三产业、就业结构、城镇化进程这三个领域。

产业结构;共词分析;产业发展

目前,我国产业结构处于重要的调整转型期,一方面,国际金融危机导致外需急剧波动,对外依存度过高的风险日益凸显;另一方面,内需也在不断萎缩,同时产能过剩、人口红利消失、生产要素成本上升等问题不断凸显。要保持经济可持续发展,就必须调整产业结构,推进产业转型升级。为此,我国学者在产业结构调整方面进行了大量研究,涌现了大批研究成果。本文拟利用共词分析法探究2012—2016年间我国产业结构研究热点,以期更加直观和科学地反映我国产业结构研究的热点领域。

一、方法简介与数据来源

共词分析来源于文献计量学的引文耦合与共被引概念[1]。1986年,法国国家科学研究中心CNRS(Centre National de la Recherche Scientifique)的M.Callon、J.Law和A.Rip出版了第一部关于共词分析的专著——《Mapping the Dynamics of Science and Technology》[2]。经过几十年的发展,该方法逐步在医学、人工智能等不同领域得到了广泛应用,相关领域的学者利用该方法概述了各领域的研究热点、发展趋势等。

共词分析法主要是利用文献集中词汇对或名词短语共同出现的情况来确定该文献集所代表学科中各主题之间的关系。一般认为词汇对在同一篇文献中出现的次数越多,则代表这两个主题的关系越紧密[3]。通过这种方法可以提取所需研究领域的文献主题词,统计高频词汇,然后利用数学统计将词汇关系转化为数值或者图形。

本文从中国知网(CNKI)中的《中国期刊全文数据库》《中国硕博士学位论文全文数据库》《会议论文》三个数据库中,以“产业结构”为关键词,以2012年1月—2016年12月为检索时间段,共检索到论文27495篇。通过CNKI以ENDNOTE格式提取检索到文献的题录信息。

二、关键词的确定与分析

将从CNKI中导出的题录信息导入SATI3.2文献题录信息统计分析软件,经过去重处理,共有373218条记录。然后抽取关键词进行统计,共得到关键词26467个。为了最大限度消除我们对关键词人为合并的主观影响,体现和反映作者群体对特定关键词的共识度,对关键词并未做同义词合并处理,仅仅去掉“对策”“影响”“措施”等非实质性词语,同时,因为本文以“产业结构”为检索词,所以“产业结构”在共词分析中无法发挥作用,故删除。最终得到关键词26064个。

利用SATI软件对26064个关键词进行了词频统计,选定词频高于100次的63个关键词作为本文研究的主要关键词。部分高频关键词见表1。

表1 部分高频关键词

然后,对这63个关键词进行两两共词检索,统计它们在27495篇论文中出现的次数,形成了63*63的共词矩阵,部分矩阵如表2。

共词矩阵是一个相关矩阵,对角线上的数字是该词出现的频次,如“经济增长”共出现1205次,它与“新兴产业”同时在29篇论文中出现过。从关键词共词矩阵可以看出,产业结构的研究内容相对分散,说明学者们对产业结构的研究角度存在一定的差异性。

由于本文将运用多元统计分析方法进行相关分析,所以需将共词矩阵转化为相似矩阵和相异矩阵以满足不同的统计方法对数据的要求,于是利用SATI软件中的相似矩阵和相异矩阵功能对共词矩阵进行了转换。SATI3.2为消除多值共现矩阵中频次悬殊对统计结果造成的影响,采用Equivaience系数,将多值矩阵转化为元素值在[0,1]区间取值的相似矩阵[4],部分相似矩阵如表3,具体公式为:

其中,Eij为相似矩阵元素的值,对于词条Ti和Tj,Fij为 Ti和 Tj的共现次数,Fi为 Ti出现的总频次,Fj为Tj出现的总频次。

相似矩阵中的数字代表矩阵元素之间的相似性,两词之间的数字越大,越接近1,表示两词之间的距离越近,相似度越大;两词之间的数字越小,越接近0,表示两词之间的距离越远,相似度越小。对角线上的数据为1,表示该词自身的相关度。

由于相似矩阵中的0值过多,容易造成较大误差,因此用1与相似矩阵的数据相减的值作为相异矩阵元素的值,生成相异矩阵,部分相异矩阵如表4。相异矩阵中的数字为不相似数据,数值越大表示两词之间的距离越远,越不相似;数值越小表示两词之间的距离越近,相似度越大。

表2 部分高频关键词共词矩阵

表3 部分高频关键词相似矩阵

表4 部分高频关键词相异矩阵

三、多元统计分析

多元统计分析是统计学中内容十分丰富、应用范围极为广泛的一个分支。而在共词分析中,最常用的多元统计分析方法主要有因子分析、聚类分析和多维尺度分析。本文将利用因子分析和多维尺度分析对高频关键词进行分析,进而揭示产业结构研究的现状和热点。

1.因子分析。因子分析是利用降维的思想,通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个抽象的变量来表示其基本的数据结构。其目的就是用少数几个因子去描述许多指标或者因素之间的联系,即将相互关系比较密切的几个变量归在同一类别之中,每一类变量就成为一个因子[5]。将共词矩阵导入SPSS21,得到表5。

从表5可以看出,共提取了5个公共因子,其累计方差贡献率为88.89%,其中第二、三、四个因子的方差贡献率较高,分别为64.08%、6.21%和10.84%,这是国内产业结构研究的三个重要领域。总体来看,我国产业结构研究呈现总体分散、相对集中的特点,这与前文统计的关键词词频结果基本一致。

从因子个数碎石图(见图1)也可以看出,从第6个公因子开始,曲线开始变平,而第四个与第五个的贡献率不高并且差别不大。根据因子具有命名解释性的特点,本文对5个公共因子分别命名(见表6)。

图1 碎石图

关键词的荷载量反映了关键词在其公共因子中的相关度。根据本文的实际情况,将特征值定为1。表6显示,63个关键词中共有39个参与了分类,这可能由于有些关键词尽管频次很高,但涵盖的主

题范围比较宽泛,在因子分析中无法体现特色,如“就业质量”,它在5个主成份中的方差贡献率分别为0.03、-0.028、-0.093、-0.057、-0.054,贡献率非常小,没有实际意义,故剔除。同时,还有一些关键词对几个主成份的贡献率几乎相同,如“城市化进程”,在第1、2、3个公共因子中的贡献率分别为0.161、0.152、0.146。一个关键词同时出现在3个公共因子当中,并且作用大小几近相同,这说明不同研究类别之间具有联系性。

表5 解释的总方差(部分)

表6 因子分析确定的研究热点

另外,从公共因子命名和所涵盖的关键词可以看出,第4个、第5个公共因子虽然和产业结构相关度很高,但并没有反映出产业结构的研究领域和热点,故主要取前三个公共因子进行研究。

2.多维尺度分析。多维尺度分析试图通过测定或观测研究个体之间的距离来发现数据结构,其目的是将研究个体之间的距离尽可能地用二维或者三维的空间距离加以反映,这样可以客观地反映研究个体之间的相似性关系[6]。该方法比较直观,可以作为因子分析的辅助工具。在多维尺度分析结果中,被分析的对象以点状分布,每个点的位置表示分析对象之间的相似性;这样高度相似的对象就会聚集到一起。趋近于中心点的位置且分布较为集中的关键词代表受到较高关注的方向,越在边缘的说明其研究主题越狭小,或正过渡到其他主题[7]。

本文将相异矩阵导入SPSS21,利用多维尺度分析绘制产业结构的热点知识图谱(见图2)。通过观察可以发现,知识图谱中点的聚集情况基本呈现出总体相对分散、局部比较集中的特征,这与因子分析的结果基本一致。第四、第五个公共因子所涵盖的关键词穿插在前三个公共因子所涵盖的关键词当中,说明我国产业结构相关研究相对独立,内部聚合程度不高,同时也说明我们将前三个公共因子所代表的领域作为我国产业结构研究的热点领域是符合实际情况的。

图2 我国就业结构研究知识图谱

四、我国产业结构研究热点及趋势解析

从产业结构相关研究的词频和多元统计分析可以看出,我国产业结构相关研究呈现总体分散、局部聚集的特征,也就是说产业结构在我国得到了很多学者的关注,形成了丰富多样的研究,但主要都还是围绕就业结构、第三产业、城市化等关键词进行。如果这些因素能够不断优化组合,将会促进产业结构调整,进而推动经济快速增长。

1.产业结构与就业结构的协调发展研究。我国经济要想升级,就需要产业结构与就业结构协调发展,合理的产业结构能够推动就业结构的良性发展;优质的就业结构也为产业结构的转型升级奠定坚实基础。然而目前关于产业结构与就业结构协调性问题的研究中,更多的是利用结构偏离度、协整理论等作为定量分析手段,这些分析方法虽然能一定程度地衡量产业结构和就业结构之间的协调性,但缺乏整体性,定量分析的方法也不具优势。所以,如何通过更科学、可靠的手段和方法,分析和研究就业结构和产业结构之间的互动关系,是今后产业结构研究中的一个重要内容。

2.产业结构调整下的第三产业发展研究。第三产业涵盖的范围比较广,行业比较多,如何根据实际情况,研究分析各地第三产业内部结构情况,查找第三产业发展较慢的原因,借鉴发达国家第三产业发展的经验,加快和促进新兴第三产业的快速发展,是今后相关研究的一个重点方向。同时,如何分析第三产业的就业情况,也将为国家制定相应的教育政策和人力资源开发计划、宏观经济政策,健全和完善劳动力市场的运行,奠定科学基础。

3.城镇化进程对产业结构的影响。城镇化进程是人力资源、基础设施、商业信息等各种要素的整合过程,对产业结构升级具有重要的拉动作用,也是促进产业结构升级的重要抓手,《国家新型城镇化规划(2014—2020年)》的出台,进一步明确了新型城镇化的发展方向,将新型城镇化和工业化作为我国实现现代化的两大引擎[8]。那么,如何更加合理科学推动城镇化进程,在现有产业结构基础上,实现两者之间的有机结合及良性互动,是我国经济社会发展面临的今后面临的重大课题,也是学者们今后的一个重点研究方向。

[1]储节旺,郭春侠.共词分析法的基本原理及EXCEL实现[J].情报科学,2011,(6):931-934.

[2]Callon M,Law J,Rip A.Mapping the Dynamics of Science and Technology:Sociology of Science in the Real World[M].Macmillan,1986:89.

[3]贺颖,邱均平.同行评议专家遴选的科学计量方法与实证研究[J].图书情报工作,2012,(3):33-37.

[4]刘启元,叶鹰.文献题录信息挖掘技术方法及其软件SATI的实现——以中外图书情报学为例[J].信息资源管理学报,2012,(1):50-58.

[5]赵飞娟.西安市创新型科技人才素质模型构建与实证研究[D].西安:西安邮电学院,2011.

[6]张凌,周春雷,寇广增.基于共词分析的国内知识服务研究[J].图书情报工作,2009,(12):64-68.

[7]贾利军,管静娟,杨娅蓓.我国就业能力的研究热点及其解析[J].华东师范大学学报(哲学社会科学版),2013,(5):24-31.

[8]郭晓川.内蒙古新型城镇化、产业结构合理化协调发展研究[J].内蒙古大学学报(自然科学版),2017,(7):1-10.

Research Focus on the Industrial Structure Based on Co-word Analysis

LI Hui-hui1,2
(1.School of Management,BeiFang University of Nationalities,Yinchuan 750021,China;2.School of Management,HeFei University of Technology,HeFei 230009,China)

Based on the co-word analysis method,this paper analyzes 4067 keywords in 2732 articles related to industrial structure,and counts 58 high frequency keywords.From the frequency analysis,we can see that the key words such as"Employment Structure","Employment","upgrading of an industrial structure","Urbanization"and"Industrialization"are very frequent and are hot topics in industrial structure research.At the same time,through the construction of co-word matrix,similarity matrix and dissimilarity matrix of high-frequency keywords,we find that China's industrial structure is mainly concentrated in the tertiary industry,employment structure and urbanization process by multivariate statistical analysis.

industrial structure;co-word analysis;industrial development

F269.24;F224

A

1672-626X(2017)06-0042-06

10.3969/j.issn.1672-626x.2017.06.006

2017-07-06

北方民族大学校级科研一般项目(GLXY201602)

李慧慧(1982-),女,黑龙江牡丹江人,北方民族大学管理学院讲师,合肥工业大学管理学院博士研究生,研究方向为产业经济、人力资源管理。

彭晶晶)

猜你喜欢

共词就业结构第三产业
产业结构调整与就业结构变化关系的研究
——以重庆市为例
基于突变检测与共词分析的深阅读新兴趋势分析
第三产业完成投资增长2.9%
基于Matlab的共词矩阵构造
基于产业转型升级视角的中国就业结构转变研究
第三产业完成投资增长6%
陕西省产业结构与就业结构协调性实证研究
一季度第三产业增速明显下滑
我国产业结构与就业结构演进对就业问题的启示
中国文化在国际社交媒体传播的类型分析——基于共词聚类的研究