基于VOS方法的农业经济学研究主题的可视化分析
2012-12-20李晨英韩明杰
赵 勇 李晨英 韩明杰
基于VOS方法的农业经济学研究主题的可视化分析
赵 勇 李晨英 韩明杰
为了使研究主题的分类和可视化效果更为准确和科学,共词分析经常与因子分析、聚类分析、社会网络分析、多维尺度分析等技术综合使用。相似度可视化方法(VOS)是对多维尺度方法的改进,通过VOS方法的可视化分析能够直观、清晰地展示某一学科的研究主题热点和研究类别。基于VOS方法的农业经济学研究主题可视化分析结果表明:2007—2011年我国农业经济研究主题可以分为农民、农村金融、农民收入与粮食生产、农民工、城市化、农村发展6个类别,其中与“农民”相关的研究主题是农业经济学关注的热点。
农业经济;文献计量;共词分析;VOS方法
一、引言
文献计量方法和可视化技术为探索某一学科领域的知识结构与演变提供了有效的分析手段。共词分析是较为常用的文献计量和内容分析方法,其原理主要是对一组词两两统计它们在同一篇文献中出现的次数,对这些词进行聚类分析,进而分析这些词代表的学科和主题的结构变化[1]。早在20世纪80年代,荷兰莱顿大学的Rip Arie等学者就基于《生物技术与生物工程》杂志(Biotechnology and Bioengineering)10年的论文数据,以关键词为研究对象,利用共词分析(Co-words analysis)对生物技术领域的研究进展进行了可视化分析[2]。此后,该方法被应用到其他一些研究领域的知识演进分析中,如软件工程[3]、化学[4]、科学计量学[5]、神经网络[6]、环境科学[7]、SARS[8],等等。近年来,我国学者在研究中也开始使用共词分析的方法和技术,尤其是在图书情报学领域应用较为广泛,最近较为典型的研究如邱均平以SCI和SSCI收录的13种高影响力外文源刊在2006—2010年5年间所刊载的论文为研究对象,对国际范围内图书情报学领域的研究热点和前沿进行了辩识和追踪[9]。目前,国内学者在管理学[10]、材料科学[11]、心理学[12]、物流[13]等领域应用了共词分析方法和技术,但在农业经济领域国内外鲜见此类研究的文献。
为了使研究主题的分类和可视化效果更为准确和科学,共词分析经常与因子分析、聚类分析、社会网络分析、多维尺度分析等技术综合使用。2010年,荷兰莱顿大学Van Eck等学者在多维尺度分析(Multidimensional Scaling,MDS)的基础上提出了一种新的文献计量地图方法VOS(Visualization of Similarity),VOS方法是对多维尺度“应力函数”的加权,较多维尺度基于邻近指数和余弦方程所产生的MDS-AS和MDS-COS,VOS方法在“聚合度”和“区分度”两种关键评价指标上均要优于多维尺度法[14]。目前我国学者对VOS方法的应用还处于探索阶段[15]。
为了考察近年来我国农业经济领域关注的研究主题,本文利用VOS方法,以4种农业经济领域高影响力CSSCI收录期刊在2007—2011年刊载的论文为研究对象,通过对论文关键词的可视化分析,系统梳理了近5年我国农业经济学的研究主题,同时借助VOSviewer软件对研究热点、研究主题进行可视化展示,这有助于学者快速有效地把握当前农业经济研究的切入点,促进农业经济研究紧密结合我国农业农村发展的现实问题。
二、分析方法与数据来源
(一)VOS方法介绍
VOS方法的目的与MDS方法一致,即将多维空间的研究对象简化到低维空间进行定位、分析和归类。但VOS方法与MDS方法在实现这一目标的途径上存在差异。MDS方法通过距离来反映两个分析单元①分析单元可以是作者、期刊、关键词、国家、机构等。之间相似度(similarity),两个分析单元之间的关系越强,它们之间的距离就越小。假设Sij代表单元i和单元j之间的相似度。对于每一对单元i和j,MDS方法都需要一个邻近值(proximity)Pij和权重Wij(Wij≥0)。在已有文献中,邻近值Pij经常等于相似度Sij,但并不给出权重Wij,有些文献则将MDS方法中所有单元i和j的权重Wij设置为1。为了将各个分析单元准确地标注在几何空间图上,MDS方法将“应力函数”②将研究对象之间的空间距离与研究对象之间的实际距离进行比较,计算其差异,作为衡量空间结构与输入数据之间的拟合优度指标,即应力函数。(Stress Function)最小化。最常用的应力函数公式③公式中的应力函数是标准化应力函数(normalized raw stress function),SPSS软件的多维尺度分析中的PROXSCAL程序就是使用的该应力函数。如下:
在式(1)中,f是邻近数Pij的转换函数,xi代表分析单元i在几何空间图中的位置。几何空间图通常是一个二维结构图,几何空间图中点际之间的距离xi=(xi1,xi2)应用欧式距离算法(Euclidean Distance)进行计算。
MDS方法就是通过迭代运算将公式1中的压力函数最小化进行节点定位,常用的迭代优化方法是SMACOF算法,SPSS软件的多维尺度分析中的PROXSCAL程序使用了该方法进行运算。此外,MDS方法一般可以分为计量型(metric MDS)和非计量型(non-metric MDS)两种类型。计量型MDS要求数据为研究对象进行比较而得出量化的测量数据,如等距量表(interval scale)或比率量表(ratio scale)数据④Van Eck等指出基于比率量表数据的MDS方法中,转换函数f可以是一个非线性函数;基于等距量表数据的MDS方法中,转换函数f可以使一个线性函数;基于顺序量表数据的MDS方法可以使一个单调函数。但当邻近值Pij等于相似度Sij时,基于比率量表数据的MDS将没有意义,原因是邻近值等于相似度后,转换函数将是一个线性递减函数,即所有转换后的邻近数将为负数或零。,而非计量型MDS要求的数据为顺序量表(ordinal scale)数据。在已有文献中,研究者通常不会指出其使用了那种类型的MDS方法。目前,图书情报学界使用较为普遍的是非计量型MDS方法,即基于顺序量表数据的多维尺度分析。
而VOS方法,对于每一对单元i和j都需要一个相似度Sji(Sij≥0),相似度的计算公式如下:
在式(3)中,Cij是单元i和j的共现频次,Ci是单元i的出现频次,Cj是单元j的出现频次。VOS方法通过将公式4结果的最小化来准确地标注各个分析单元在几何空间图中的位置。
同时满足:
VOS方法利用SMACOF迭代优化对公式4进行最小化处理,将分析单元间的相似度作为它们之间欧式平方距离的权重。同时为了避免零值出现,即对于两个分析单元处于同一位置的情况,VOS方法规定这两个分析单元的平均距离值为1,见公式5。
为了配合VOS方法的实践应用,Van Eck等学者于2010年开发了VOSviewer软件供学者们使用[16]。VOSviewer在输入数据格式方面与已有文献计量分析软件存在差异[17],虽然2012年5月Van Eck等学者推出了Vosviewer1.5.0版本,支持Web of Science数据库的数据格式,但对于中文数据库(中国知网、万方、维普)的数据格式仍不支持,因此本研究依据VOS方法的原理,自主开发了BibStats程序对学术论文元数据进行处理、分析,并可以输出符合VOSviewer软件使用的格式文件,这有助于VOS方法在具体研究问题中的应用。
(二)数据来源
本研究采用的数据源于中国知网(CNKI),选取农业经济领域4种高影响力的学术期刊,即《中国农村经济》、《农业经济问题》、《中国农村观察》和《农业经济技术》期刊,在2007—2011年5年间所刊载的论文(不含增刊论文)数据为样本,剔除会议通知等非研究论文数据,最终获取有效数据2 590条,数据来源情况如表1所示。
表1 4种农业经济类期刊发文量及复合影响因子
三、数据统计与分析
(一)论文发表的基本情况
统计论文题录信息发现,4种农业经济类期刊在2007—2011年间发表的2 590篇论文来源于3 368名作者。其中,作为第一作者单位发文量前20位的机构中(如表2),来自高等院校的机构有15家,尤其是农林高校在农业经济领域的研究成果较多,说明目前农林高等院校是我国农业经济领域的重要科研力量。以第一作者身份发文量居前列的有:黄祖辉、叶敬忠、孔凡斌、万宝瑞、钟甫宁等5位学者(如表3),他们的研究方向都涉及了当前我国农业经济中的热点问题,包含了宏观和微观两个层面。
表2 发文量前20位的机构分布(篇)
表3 发文量前5位的作者情况(篇)
(二)研究主题分析
本研究利用自编BibStats工具对2 590篇文献的所有关键词出现频次进行统计。目前,已有文献中对于高频关键词的确定并没有一个统一的方法。本研究根据统计学中的箱线图法确定高频关键词。箱线图法是描述单个变量数据分布的一种统计学方法,包括5个特征值,即最大值(Max)、上四分位数(Q3,即75%百分位数)、中位数(Med)、下四分位数(Q1,即25%百分位数)和最小值(Min)。上四分位数(Q3)和下四分位数(Q1)之间的距离称为四分位距(Interquartile Range,IQR)。为了更精确地描述分布尾部的极值的信息,箱线图法规定凡是与上下四分位数值的距离超过1.5倍四分位距(1.5IQR)的为异常值,超过3倍四分位距(3IQR)的为极值。本研究采用箱线图法中的极值作为高频关键词,经计算关键词出现频次≥8的为高频关键词,共104个。这些高频关键词是2007年以来农业经济领域关注的热点词汇(限于篇幅表4列出了频次大于13,排名前51位的关键词)。
1.研究热点分析
本研究基于104个高频关键词,利用VOSviewer软件绘制了研究主题的密度视图①受纸质期刊印刷效果的局限,本文中的可视图谱(包括密度视图和标签视图)在电子版中给予了展示,全文可在中国农业大学教师文库(http:∥202.112.175.14.4237/home/jswk.xml)中获取。,密度视图中每一个节点的颜色由该点的密度所决定。默认情况下,颜色介于红色和蓝色之间。某节点周围的条目数量越多、权重越大,该节点的颜色就越接近于红色,也表明该关键词与其他关键词共现频次较高,即为该领域的重要研究主题。根据密度视图显示,与“农民”相关的研究主题是我国农业经济领域研究的热点,包括“农民收入”、“土地流转”、“合作社”、“非农就业”、“城市化”,也表明虽然我国的农业经济领域呈现宏观问题研究与微观问题研究并举的研究格局,但对于微观主体的关注度相对较高,涉及“农民”、“农民工”等微观主体切身利益的研究较多。
表4 前51位高频关键词
2.研究主题聚类结果分析
在专业人员对主题聚类结果(图2)判读的基础上,通过VOSviewer中阈值的合理调整,把关键词所代表的主题收敛为6大子类团,并给出各子类团的标签,具体聚类结果如下。
(1)农民。本类团包括的关键词主要有:农民、合作社、新农村建设、土地流转、现代农业、农业保险、新型农村合作医疗、农村基础设施、公共产品、土地承包经营权,等。
“农民”节点是标签视图中最大的节点,位于图谱的核心位置,表明“农民”一词的出现频次最高,是我国农业经济研究的重点。农民在我国历史发展中占有极其重要的位置,早在宋朝的《陈旉农书》中就有“农者,天下之大本也”的论断。农民问题也被认为是“三农”问题的核心,有学者提出目前“三农”问题依然严重的主要原因是国家对农民的赋权还不够充分[18]。而与“农民”节点紧密联系的关键词节点主要是“合作社”和“土地流转”。
“发展农民专业合作社,提高农业组织化程度”是我国政府推进农业现代化、加强农村基层民主建设的重要策略。据统计,截至2011年3月末,全国已有合作社接近41万家[19]。万宝瑞系统归纳了当前农民专业合作社需要关注的问题有:农民专业合作社内部制度不健全、运行不规范、缺乏人才、缺乏资金、缺乏用地、培训工作滞后以及存在的税务问题[20]4。与合作社相关的研究主题主要有“农业产业化”、“龙头企业”、“政府职能”等。
随着我国城市化进程的加快,农村土地流转问题日益突出,农业经济领域研究对“土地流转”的关注度也在增加。黄延信等对我国农村土地流转的状况进行了调查,认为“农村土地流转总体上表现为种植大户、龙头企业、专业合作社、集体统一经营、股份合作经营等形式,并表现出流转组织化水平提高;在推进土地规范流转方面应切实落实土地承包关系长久不变政策,加强政府部门对土地流转的服务与管理”[21]4。因此,从标签视图中也可以看出,“土地流转”节点与“合作社”、“土地承包经营权”、“交易成本”、“龙头企业”、“非农就业”等节点都存在联接。
(2)农村金融。本类团包括的关键词主要有:农村金融、农村信用社、小额信贷、金融危机、民间金融、扶贫、区域经济、农村中小企业,等。
农村金融作为农民融资的重要支撑系统,是农村各种金融及其活动所构成的有机整体,也是国家整个金融体系不可分割的组成部分[22]。与“农村金融”相关联的关键词主要有“农村信用社”、“小额信贷”、“民间金融”、“农村中小企业”等。在“农村金融”主题下的研究中,学者们除了关注农村金融体系发展过程中存在的问题,还关注了农村金融与农民收入、贫困之间的关系,丁志国认为我国农村金融发展对减少农民贫困的作用,既存在直接效应,也存在间接效益,而间接效益的作用明显高于直接效益。间接效益具体表现在,农村金融通过促进经济增长和收入再分配进而作用于贫困[22]72。因此,“扶贫”也被聚类在“农村金融”研究主题下。
(3)农民收入与粮食生产。本类团包括的关键词主要有:农民收入、粮食安全、粮食生产、农产品、生物质能源、WTO、财政支农、粮食补贴、期货市场、粮食价格、SPS措施,等。
农民收入与粮食生产是我国农村经济社会发展的两件大事,近年来国家出台的一系列农业政策也都是紧密围绕农民增收和粮食增产这两个目标。从标签视图中可以看出,除了“粮食生产”节点外,与“农民收入”节点距离较近的节点是“技术效率”,说明通过提升技术效率来增加农民收入是农业经济领域关注的一个重要研究主题。
与“粮食生产”节点联接距离较近的节点主要有“粮食安全”、“粮食补贴”。粮食补贴政策是当前我国保障粮食安全的主要政策,但目前存在粮食补贴方法不完善、对粮食主产区补偿不足、粮食安全目标与农民增收目标没有有效耦合等问题[23]11。此外,“WTO”、“SPS措施”节点与“粮食生产”、“粮食安全”节点也存在联接。SPS措施是指卫生与食品检疫措施(Sanitary and Phytosanitary,SPS),主要表现为法规、标准、程序及检验方法等,其以名义的合理性、方式的灵活性、手段隐蔽性及作用的有效性迅速成为农产品贸易的主要障碍[24]29。可见,随着我国加入世贸组织,近年来农产品国际贸易方面的研究也在日益增多,如何在WTO框架下合理运用各种贸易手段保护国家的粮食安全成为农业经济领域的关注重点。
(4)农民工。本类团包括的关键词主要有:农民工、人力资本、农村劳动力、社会资本、非农就业、社会保障、收入水平、外出务工、性别差异、社会网络,等。
农民工是我国特有的城乡二元体制的产物,据统计,“十一五”时期前4年,到本乡镇以外务工经商3个月以上的农村劳动力由1.12亿人增加到1.47亿人,年均增加875万人[25]。如此庞大的流动人口群体成为全社会关注的热点话题。与“农民工”节点密切关联的节点主要有“人力资本”、“社会资本”。谢勇研究发现人力资本存量较高的农民工倾向于采取市场化的途径获取工作;而人力资本较低的农民工一般通过社会资本来实现就业[26]49。另外“非农就业”、“失地农民”、“社会保障”、“性别差异”等关键词都是近5年我国农民工问题研究中关注的主题。
(5)城市化。本类团包括的关键词主要有:城市化、劳动力转移、城乡居民收入、城镇化、制度创新、收入差距、贫困、经济增长,等。
现代发展经济学理论认为,从传统农业社会向现代社会转变的过程就是经历城市化与工业化的过程,经济社会从城乡二元结构逐渐过渡至城乡融合的过程[27]。与“城市化”节点联接距离较近的节点有“城乡居民收入”、“收入差距”、“劳动力转移”、“制度创新”等。在农业经济学研究中,“城市化”、“收入差距”和“劳动力转移”是3个密切相关的问题,崔传斌等认为现阶段我国第二三产业迅速发展,城市化进程加快,农业比较效益下降,城乡居民收入差距加大,这些因素必然引致农村劳动力大规模流动并导致农村部分地区劳动力供给不足[28]46。而制度创新被认为是推进城市化健康发展的关键因素,因此,在标签视图中“制度创新”与“城市化”节点之间的距离较近。
(6)农村发展。本类团包括的关键词主要有:农村、农业、农村经济、农村发展、农村政策、农业发展、农村改革、统筹城乡发展,等。
农村发展是一个综合性的研究主题,其研究内容涉及到“三农”问题的诸多方面。根据标签视图显示,与“农村发展”节点联接较为紧密的节点主要有“统筹城乡发展”、“二元经济结构”、“农村经济”、“农村政策”、“农村改革”等。这些关键词都属于农业经济宏观层面的研究话语。叶敬忠等曾指出“宏观政策、制度、市场背景下,微观主体农民常常被排除在分析范畴之外”[29]10。从标签视图中我们可以证实这一观点,即这些宏观层面的研究主题节点与微观主体“农民”、“农户”节点之间的联接距离较远,表明它们在同一研究中作为关键词共现的频次较低。
四、总结
通过VOS方法的可视化分析能够直观、清晰地展示某一学科的研究主题热点和研究类别。本研究利用VOS方法对2007—2011年间农业经济学研究主题进行了探析,结果发现:近5年我国农业经济学研究主题可以分为“农民”、“农村金融”、“农民收入与粮食生产”、“农民工”、“城市化”、“农村发展”6个主要类别。①在农民问题研究中,“合作社”和“土地流转”两个主题是近5年农业经济学研究的热点主题;②在农村金融问题研究中,除了对“农村信用社”、“小额信贷”、“民间金融”、“农村中小企业”等主题关注外,农村金融对农民贫困的作用也成为学者们的关注点;③在农民收入与粮食生产研究主题中,农民收入是农业经济学研究的热点主题,而粮食生产、粮食安全和粮食补贴主题在农业经济领域关注度较高;④在农民工问题研究中,“人力资本”和“社会资本”是近年来关注的热点;⑤在城市化问题研究中,学者们主要关注了“城乡居民收入”、“收入差距”、“劳动力转移”、“制度创新”主题;⑥在农村发展问题研究中,主要包括了“农村经济”、“农村政策”、“农村改革”等宏观层面研究的关键词,且这些关键词与“农民”一词共现的频次较低。
本研究存在的不足在于:数据来源局限于4种中文学术期刊5年的论文数据,而在农业经济领域我国学者在SSCI收录期刊上也发表了很多高水平的研究论文,这些数据有待进一步分析。
[1] 冯璐,冷伏海.共词分析方法理论进展.中国图书馆学报,2006(2):88-92
[2] Rip,A.,Courtial,J.P.Co-word maps of biotechnology:an example of cognitive scientometrics.Scientometrics,1984(6):381-400
[3] Coulter N.,Monarch,I.,Konda,S.Software engineering as seen through its research literature:A study in coword analysis.Journal of the American Society for Information Science,1998(49):1206 -1223
[4] Callon,M.,Courtial,J.P.,Laville,F.Co-word analysis as a tool for describing the network of interactions between basic and technological research:The case of polymer chemistry.Scientometrics,1991(22):155-205
[5] Courtial,J.P.A coword analysis of scientometrics.Scientometrics,1994(31):251 -260
[6] Noyons,E.C.M.,Van Raan,A.F.J.Monitoring scientific developments from a dynamic perspective:Self-organized structuring to map neural network research.Journal of the American Society for Information Science,1998(49):68-81
[7] Ho,Y.S.Bibliometric Analysis of Adsorption Technology in Environmental Science.Journal of Environmental Protection Science,2007(1):1-11
[8] Chiu,W.T.,Huang,J.S.,Ho,Y.S.Bibliometric analysis of severe acute respiratory syndrome-related research in the beginning stage.Scientometrics,2004(61):69 -77
[9] 邱均平,温芳芳.近五年来图书情报学研究热点与前沿的可视化分析.中国图书馆学报,2011(2):51-60
[10] 姜春林,李江波,杜维滨.基于CSSCI的我国管理学研究热点可视化分析.图书情报工作,2008(12):55-58
[11] 王慧颖.基于高影响力论文的材料科学领域研究主题演变分析.情报杂志,2012(3):36-40
[12] 王涓.2000-2009年国内心理学论文研究热点的计量分析.心理科学,2011(5):1209-1215
[13] 殷辉,陈劲.我国物流学科研究热点的共词可视化分析.图书情报工作,2011(20):129-133
[14] Van Eck,N.J.,Waltman,L.,Dekker R.,et al.A comparison of two techniques for bibliometric mapping:Multidimensional scaling and VOS.Journal of the American Society for Information Science and Technology,2001,61(12):2450-2416
[15] 宗乾进,袁勤俭,沈洪洲,等.知识图谱视角下的2010年我国情报学研究热点——基于知识图谱的当代学科发展动向研究之一.情报杂志,2011(12):48-53
[16] Van Eck,N.J.,Waltman,L.Software survey:VOSviewer,a computer program for bibliometric mapping.Scientometrics,2010,84(2):523 -538
[17] 张力,赵星,叶鹰.信息可视化软件CiteSpace与VOSviewer的应用比较.信息资源管理学报,2011(1):95-98
[18] 李成贵,孙大光.国家与农民的关系:历史视野下的综合考察.中国农村观察,2009(6):54-61
[19] 门炜,任大鹏.外部资源对农民专业合作社发展的介入影响分析.农业经济问题,2011(12):29-34
[20] 万宝瑞.当前农业发展需要关注的五个问题.农业经济问题,2011(3):4-6
[21] 黄延信,张海阳,李伟毅,等.农村土地流转状况调查与思考.农业经济问题,2011(5):4-9
[22] 丁志国,谭伶俐,赵晶.农村金融对减少贫困的作用研究.农业经济问题,2011(11):72-77
[23] 田建民,孟俊杰.我国现行粮食安全政策绩效分析.农业经济问题,2010(3):11-15
[24] 董银果,张洁.中国农产品SPS措施遵从成本的影响因素分析.农业经济问题,2011(10):28-36
[25] 宋洪远,张红奎,方华,等.“十二五”时期农业和农村发展面临的挑战与选择.中国农村经济,2010(8):4-13
[26] 谢勇.基于人力资本和社会资本视角的农民工就业境况研究——以南京市为例.中国农村观察,2009(5):49-55
[27] 许秀川,王钊.城市化、工业化与城乡收入差距互动关系的实证研究.农业经济问题,2008(12):65-71
[28] 崔传斌,王开盛.农村劳动力转移与农业规模化经营——以陕西省铜川市烟叶生产农场化为例.农业经济问题,2008(4):46-50
[29] 叶敬忠,安苗.农业生产与粮食安全的社会学思考.农业经济问题,2009(6):9-14
Mapping the Research Topics on Agricultural Economics by VOS Method
Zhao Yong Li Chenying Han Mingjie
In order to cluster and map the research topics more exactly and scientifically,co-word analysis combined with factor analysis,social network analysis or multidimensional scaling analysis are usually applied.The method of visualization of similarity(VOS)is an improvement of multidimensional scaling,which can directly and clearly display the categories of research focuses and research topics.The results of mapping the research topics of agricultural economics by VOS method show:from 2007 to 2011,the research topics of agricultural economics in China can be clustered into six categories,including farmer,rural finance,farmers'income and food production,rural migrant workers,urbanization,rural development.The topics related to farmer are major concerns in the field of agricultural economics.
Agricultural economics;Bibliometrics;Co-word analysis;VOS method
2012-08-21
中央高校基本科研业务费专项经费资助(2012XJ007)。
赵 勇,中国农业大学图书馆馆员、管理学博士,荷兰瓦赫宁根大学访问学者,邮编:100193;李晨英,中国农业大学图书馆研究馆员,情报研究中心主任;韩明杰,中国农业大学图书馆研究馆员,副馆长。
(责任编辑:连丽霞)