国内农业信息资源建设研究的文献计量分析(2000-2014年)
2015-04-11王恒玉黄慧淼陈淑珍
王恒玉 黄慧淼 陈淑珍
(1.西北师范大学商学院,甘肃?兰州 730070;2.西北师范大学图书馆,甘肃?兰州 730070)
国内农业信息资源建设研究的文献计量分析(2000-2014年)
王恒玉黄慧淼陈淑珍
(1.西北师范大学商学院,甘肃?兰州 730070;2.西北师范大学图书馆,甘肃?兰州 730070)
〔摘要〕本文对2000-2014年农业信息资源建设研究领域496篇文献的年载量、作者队伍和作者地域分布情况进行了统计分析。并通过词频分析和共词分析,对本领域研究主题进行了分析,揭示了我国农业信息资源建设研究的前25个高频关键词及热点问题。基于对现有研究成果的梳理,概述了农业信息资源建设研究的趋势。
〔关键词〕农业信息资源;词频分析;共词分析;文献计量
农业信息资源建设是对与农业相关的信息资源进行选择、收集、组织和开发等活动,使之形成可促进农业农村经济可持续发展的信息资源体系的全过程。
当前,已有学者从不同层次、不同视角对信息资源建设进行了分析,取得了大量研究成果。虽然已有部分研究利用文献计量方法对信息资源建设现状、热点、发展趋势进行了探讨,例如邱均平基于文献调查法和内容分析法,发现知识管理已经成为国内外信息资源管理领域的一个新的研究方向[1];查先进、曹晨采用文献计量方法得出用户眼里的信息资源配置问题将是未来信息资源配置领域研究的主要内容[2];王晓光利用文献计量法发现信息资源共享领域的研究成果只是停留在经验层次,还需要实践的考证[3],但由于信息资源建设研究近几年蓬勃发展,在国内农业中,开始运用信息资源来改造传统农业,且此方面的现有研究都是从定性的角度出发,尚缺乏对农业信息资源建设领域的文献计量分析。因此,本研究将利用文献计量方法对农业信息资源建设领域的文献数据进行定量分析,对本领域的研究现状、热点问题进行考察,以期对今后的研究提供借鉴。
1 研究设计
1.1数据来源
本文选取中国知网(CNKI)学术文献网络出版总库为统计源。检索条件:(发表时间 between 2000-01-01 and 2014-12-31)and(题名=农业 and 题名=信息资源 or 关键词=农业 and 关键词=信息资源)(精确匹配)。剔除会议、报纸等非学术性文章和重复文章,最终选取文献样本496篇。
1.2数据分析工具
本研究以AntConc3.3.5w和Excel2010作为词频分析工具,用其实现高频词表的形成;应用EndnoteX6作为摘要管理工具,应用其析出共词串;以UCINET6作为网络分析工具,用以对本研究所建成的共词串矩阵进行网络特性的分析。
2 结果分析与讨论
2.1农业信息资源建设研究论文发表数量分析
对论文数量的统计可以作为某一领域研究发展状况的一种反映。图1显示了从2000-2014年国内农业信息资源建设领域内研究论文数量的变化。从图中可以看出,2000-2011年的国内农业信息资源建设研究的论文数量呈周期性变化,大约4年1个周期。在1个周期内,论文的数量呈倒U型变化,先上升后下降。但从2012年以后,整体呈下降趋势,预计2015年的研究量会低于2014年。这些现象说明,关于农业信息资源建设的研究目前暂时到了瓶颈时期,还未找到新的、具有现实意义的研究方向。
2.2农业信息资源建设研究者分析
2.2.1作者队伍的分布
运用文献计量学的方法,可以确定某一研究领域的核心作者,即用研究人员论文的绝对量和被引频次为基础选出。根据普赖斯定律,核心作者最低发文数为M,其值为:
图12000-2014年国内农业信息资源建设研究论文的数量分布
M=0.749*nmax
(1)
其中nmax指发文量最高的作者发表的论文数[4]。本次研究中nmax为9,故M取整数为2。因此,发表文章数量在2篇及以上的作者界定为核心作者,统计得到的核心作者有40名,限于篇幅,表1只列出了前10名作者。发文2篇以上的作者为40人,占总作者数的10.08%,共发表论文120篇,占总发文量26.37%,远低于农业信息资源建设论文总和的50%,这说明农业信息资源建设及相关学科尚未形成稳定的研究群体。
表1 2000-2014年农业信息资源建设研究核心作者(h指数在2以上)
在农业信息资源建设研究的496篇文献中,共有397位作者(包含第2、第3等所有合作者),发文2篇以上的核心作者却只有40位,说明关于农业信息资源建设的研究中,发表1篇论文的作者相对较多,核心作者群还未形成,研究队伍中业余作者多而核心作者少。
2005年,美国物理学家Hirsch提出了一个测度科学家个人科研成绩的新指标——h指数(h-index)。h指数的计算基于其研究者的论文数量及其论文被引用的次数。Hirsch将h指数定义为[5]:“在一个科学家发表的NP篇文章中,如果有h篇的被引次数都大于等于h,而其他(NP-h)篇被引频次都小于等于h,那么他(她)的指数值为h。”
通过h指数分析研究者的论文数量及其论文被引用次数,在40位核心作者中,h指数最大的作者分别是北京市农林科学院农业科技信息研究所的孙素芬、郑怀国、谭翠萍、张峻峰和中国农业科学院科技文献信息中心的潘淑春,h指数均为4。h指数为3的作者有6位,h指数为2的作者有14位。h指数数值较低,说明在这一时期,农业信息资源建设的研究尚处在发展阶段,尚未进入成熟、稳定时期。
孙素芬、郑怀国、谭翠萍和张峻峰研究的主题主要是农业信息资源的共建共享、整合的研究和农业信息资源服务平台的建设。孙素芬偏向农业信息技术的研究,例如应用中间件、元搜索及网络爬虫等技术与思想构建农业信息资源整合系统,以期对已有的农业信息资源进行整合,从而为用户提供方便服务[6];郑怀国、谭翠萍和张峻峰偏向于农业信息资源平台的建设和系统的开发[7-9]。以上4位主要是农业信息资源建设实践方面的研究,而潘淑春主要偏向理论方面的研究,并且偏向农业图书馆信息资源建设和农业文献信息资源建设[10-11]。
2.2.2作者地域的分布
从发文作者的地域来看,发文最多的地域是北京、山东和湖南,分别是58篇、33篇和29篇,发文最少的是青海、西藏和新疆,西藏和新疆都是0篇,而青海只是在2010年才有1篇文章涉及到农业信息资源建设研究。
北京学者对于农业信息资源建设的研究主要集中在农业信息资源的共享、利用和数字平台的建设,其中,研究农业信息资源数字平台的建设的学者主要来自北京市农林科学院,而研究农业信息资源的共享和利用的学者主要来自中国农业大学和中国农业科学院;山东学者的研究方向主要是农业信息资源的开发利用,尤其是网络上的农业信息资源,学者主要来自临沂师范学院和山东农业大学;湖南学者的研究主要集中在农业信息资源建设的现状及对策,其中对其作出贡献最大的是湖南农业大学。其余省份发文量不多,研究的方向很分散,尚未形成研究的侧重点。
2.3农业信息资源建设研究主题分析
2.3.1研究主题的词频分析
为了进一步分析2000-2014年我国农业信息资源建设研究主题方面的内在特征,对检索出的496篇文献经过同义词处理后,获得词频为10以上的主题词25个,如表2所示。
表2 农业信息资源建设主题词高频词分布(2000-2014年)
注释:在表2中,显而易见,与“农业信息资源建设”有关的“农业”、“信息”、“农业信息”、“农业信息资源”、“信息资源”、“资源建设”和“信息资源建设”均属于高频主题词,故表2中未列出上述主题词。
将上述高频词根据研究内容不同,分为研究对象、技术方法与应用领域。其中,研究对象属性的主题词有开发利用、共享、整合、模式、配置、管理、环境;技术方法属性的主题词有科技和技术、数据库、检索、发展、对策、数字化、网络、网站、系统;应用领域属性的主题词有图书馆、档案、文献、经济、市场、三农、西部、信息化、信息服务。
从主题词的词频可以看出,2000-2014年农业信息资源建设的研究热点是对农业信息资源进行开发利用。开发利用是对原始的农业信息资源进行一定层次的加工处理,这样信息所具有的价值才能被最大程度的利用。农业信息资源的开发利用是对农业信息资源进行整合、共享、配置的基础。
农业信息资源的建设也离不开技术的支持。技术一直是信息服务研究的重点。以技术为中心是近十几年来农业信息资源建设发展的最大特征。数据库是除了科技、技术外,在技术方法中词频处在第二位的主题词。对“数据库”进行聚类分析,会发现“网络数据库”、“农业信息数据库”等热点词组配,通过数据库的建设,农业信息资源建设可以渗透到农业的各个方面,进入网络化、综合化、产业化发展阶段。据统计,至2014年底,已建成的农业信息网站数量已达36 000多家,其中政府建立的有7 000多家。农业部相继建设了农业政策法规、农村经济统计、农业科技与人才、农产品价格等60多个行业数据库。所以“数据库”、“网络”、“网站”等成为这十几年来农业信息资源建设中的高频主题词也不足为奇。对管理的研究也是国内农业信息资源建设的一个特点。关于管理通过聚类,主要是信息资源管理和农业科技管理。
分析具有应用属性的主题词,发现和图书馆档案学、情报学相关的高频词较多。例如“图书馆”这个高频词。近十几年来,农业类高校图书馆、国家或者地方农业图书馆都是农业信息资源建设研究的主要单位。农业信息资源建设是农村信息化的主要内容之一,信息服务也是以信息资源为基础,所以“信息化”和“信息服务”为高频词也是理所当然的。近些年来,农村信息化建设取得了较为瞩目的成绩。根据《2013年中国农村互联网发展状况调查报告》显示,我国农村2013全年新增通宽带行政村1.8万个,全年新增2005个乡镇实施信息下活动,新建乡信息服务站2 050个、村信息服务点29 622个、乡级网上信息库9 940个、村级网上信息栏目66 780。农村信息服务受到广泛重视,满足不同层次的信息需求。自从我国在1999年提出“西部大开发”设想后,各行各业开始致力于对西部的研究。从2000-2014年,关于西部农业信息资源研究的论文篇幅不多,对于西部的研究可以作为今后农业信息资源建设研究的一个视角。
2.3.2研究主题的共词分析
在共词分析中,程度中心度(Degree Centrality)和中介度(Betweenness Centrality)是计算节点在网络中心的中心程度最重要的两个指标[12]。程度中心度用以衡量网络中哪个节点处于最中心的位置,所处的位置越位于中心位置,则影响力越大。中介度用以衡量节点作为“媒介者”的能力,中介度越高,则地位越关键。通过对农业信息资源建设研究中前18个高频词的程度中心度和中介度的计算,得到前18个计算结果,如表3所示。
表3 农业信息资源建设领域高频词的的程度中心度和中介度
表3显示,当前农业信息资源建设领域中,网络、发展、科技、图书馆和经济是研究者关注的5个焦点问题。网络、科技和图书馆这3个焦点问题在词频分析中已经描述,在此重点分析经济和发展这两个焦点问题。农业信息资源建设是农业信息化的主要内容之一,我国大力推进农业信息化建设的主要目的就是促进我国经济、社会的快速发展,。因此,发展和经济也成为影响农业信息资源建设研究的关键问题。总之,研究者预期中心度最高的这些问题在今后仍将对农业信息资源建设领域的研究发挥持续的影响。
观察表3可以看出,有些问题的程度中心度很低,但中介度却很高。说明这些问题可能是联接其他问题的重要桥梁,或者居于相对边缘的位置。例如,社会的程度中心度居于第18位,而其中介度位于第2位。据此可以认为,在农业信息资源建设领域,社会不是影响力很大的因素,但却是最重要的一个“桥梁”。正是基于社会这个中介,农业信息资源建设的领域的很多问题才得以联接起来。这对于农业信息资源建设研究领域的启示是,社会虽然不是农业信息资源建设过程中需要关注的最核心问题,但它确是一个最重要的基础平台,只有有了这个桥梁,农业信息资源建设对于经济发展的贡献、对于三农问题的解决和农业信息化过程中提供的支持才得以体现。有些问题的程度中心度较高,但该问题的中介度却相对较低。例如,科技和图书馆这两个问题。这说明科技和图书馆在农业信息资源建设领域的影响力比较大,已经得到了该领域的普遍关注,但科技和图书馆这个问题却是一个相对来说比较独立的问题,即科技和图书馆这两个问题较少具备承担农业信息资源建设领域其他问题的“媒介者”或承担沟通其他问题的桥梁。
为进一步解析这些主题词之间的关系,研究者对这些主题词之间的联结强度进行了探查。在网络分析中,联结(ties)强度较高,则表示主题之间的关系越紧密。图2展示了不同联结强度下农业信息资源建设领域研究主题网络结构的变化情况。
注释:a)ties=170,b)ties=100,c)ties=80,d)ties=50,e)ties=15,f)ties=5图2 不同联结强度下的网络结构
如图2所示,在ties=170时,农业这一主题只与“科技”和“网络”存在联结。可见,在农业信息资源建设领域最重要关联问题是科学技术和网络。可以这么认为,网络为农业信息资源建设的发展提供了机遇,而科技则是农业信息资源建设最重要的基础设施平台;进一步分析图2可见,当ties=100时,网络结构图发生明显的变化,即“农业”一方面联结了科技、技术和网络这些基础设施,还联结了图书馆、经济、发展和信息化这些主题。据此可以认为,在农业信息资源建设领域,图书馆和信息化建设、以及经济的发展都需要依靠科学技术和网络这些基础设施的建设与完善。并且,图书馆、经济、发展和信息化这些问题也受到了农业信息资源建设领域的普遍关注;当ties=80时,网络结构进一步复杂,网络等信息基础设施相关问题,也成为桥梁,与更多主题联系在一起,如管理、文献等,而且农业信息资源的开发利用也开始成为人们关注的问题之一。由图2可见,随着ties的强度由50降低到15、再降低到5时,网络的结构越来越复杂,农业信息资源建设的领域的相关主题都开始互相联结,为农业信息资源建设的研究提供了更多的研究方向。
3 结 语
本研究基于中文文献样本并且样本量较少,所以在高频词的处理中只是对高频词进行了同义词合并,并没有做进一步的数据清洗,这也是本研究的不足之处。
通过文献计量研究,探讨了我国农业信息资源建设领域文献数量的增长趋势、核心著者、作者地域,并结合词频分析和共词分析,得出我国农业信息资源建设研究的热点问题。
通过以上分析,大致可以看出近十几年我国农业信息资源建设的研究现状。国内农业信息资源建设强调从信息技术和农业经济相结合的角度进行分析。从文献年代分布来看,该领域的研究不平稳,尚未进入成熟、稳定时期;从著者队伍来看,该领域尚未形成核心作者群,且研究作者地域分布不平衡,由东、中、西部逐级减少;从研究内容来看,目前大多数对农业信息资源建设的研究停留于表面,集中于农业信息资源建设的基本理论等,实证研究有所欠缺,理论和实践的发展不一致,且研究的重点都是信息技术,很少有研究关注农村居民对于农业信息资源的需求,如何从农村居民对农业信息资源的需求来进行农业信息资源建设将是以后研究的主要方向。
参考文献
[1]邱均平,苏金燕,熊尊妍.基于文献计量的国内外信息资源管理研究比较分析[J].中国图书馆学报,2008,(5):37-45.
[2]查先进,曹晨.近20年我国信息资源配置研究文献计量分析[J].图书情报工作,2010,(20):6-10.
[3]王晓光.基于文献计量的信息资源共享研究综述[J].情报理论与实践,2006,29(3):376-379.
[4]叶鹰,潘有能,潘卫.情报学基础教程[M].北京:科学出版社,2006.
[5]HIRSCH,J.E..An index to quantify an individual’s scientific research output[C]∥Proceedings of the National Academy of Sciences,2005,102(46):165692165721.
[6]孙素芬,罗长寿,张峻峰,等.农业信息资源整合系统研究与应用[J].安徽农业科学,2007,35(22):6993-6994.
[7]张峻峰,蔡世英,孙素芬.北京农业信息网信息资源开发研究——数据库及多媒体资源的建设探讨[J].农业图书情报学刊,2001,(3):21-22.
[8]谭翠萍,张峻峰,郑怀国,等.基于.NET技术的农业信息资源共享平台开发[J].农业网络信息,2006,(11):69-71.
[9]郑怀国,张峻峰,孙素芬,等.北京农业数字信息资源中心服务平台建设[J].农业图书情报学刊,2006,18(12):5-7.
[10]潘淑春,马亚敏.NSTL农业图书馆信息资源建设与特色信息服务[J].农业图书情报学刊,2003,(4):29-32.
[11]潘淑春,马亚敏,金晨,等.全国农业文献信息资源发展与协调共享[J].农业图书情报学刊,2002,(5):52-55.
[12]罗家德.社会网络分析讲义[M].北京:社会科学文献出版社,2005:150-162.
[13]周文杰.文献计量研究中定量语言学分析程序的构建与应用——以国外文献计量研究领域为例[J].情报资料工作,2012,(2):12-17.
[14]邱均平.信息计量学[M].武汉:武汉大学出版社,2007.
[15]肖希明,仇晓惠.新中国文献资源建设六十年[J].图书馆杂志,2009,(7):3-12.
[16]肖希明,郑燃.新世纪十年信息资源建设回顾与展望[J].高校图书馆工作,2011,31(1):3-10.
[17]吴建寨.基于信息资源开发理论的农业信息化建设研究[D].泰安:山东农业大学,2005,(6):6-15.
[18]查先进.信息资源配置与共享[M].武汉:武汉大学出版社,2008:11-15.
[19]张向先.农业信息资源配置的理论与方法研究[D].长春:吉林大学,2007.
[20]李应博,乔忠.我国农业信息资源配置问题探讨[J].中国农村经济,2004,(7):73-78.
[21]梅瑞峰,王盾.宁夏农业信息资源整合及共享平台建设[J].图书馆理论与实践,2007,(6):112-113.
[22]孙艳玲,何源,梁静,等.从西部农业产业特征谈网上农业信息资源开发[J].图书情报工作,2009,53(11):67-71.
(本文责任编辑:孙国雷)
The Bibliometrics Analysis of Domestic Agricultural Information Resources Construction Research:From 2000 to 2014
Wang HengyuHuang HuimiaoChen Shuzhen
(1.Business School,North West Normal University,Lanzhou 730070,China;2.Library,North West Normal University,Lanzhou 730070,China)
〔Abstract〕This paper conducted a statistical analysis on the capacity of each year,the author team and the regional distribution of author of domestic agricultural information resources construction research field during 2000-2014.And based on the word frequency and co-word analysis,25 high-frequency words and hot issues were revealed.Besides,this study described the trend of research in domestic agricultural information resources construction.
〔Key words〕agricultural information resources construction;word frequency analysis;co-word analysis;bibliometrics
〔中图分类号〕G250.252;G253
〔文献标识码〕A
〔文章编号〕1008-0821(2015)06-0075-06
DOI:10.3969/j.issn.1008-0821.2015.06.014
作者简介:王恒玉(1972-),男,副教授,硕士生导师,研究方向:区域经济与信息管理。
基金项目:国家社会科学基金项目“西北少数民族地区农村信息消费特点与信息服务模式研究——以甘肃为例”(项目编号:10CTQ007)和西北师范大学三期二批“知识与科技创新工程”项目“甘肃省民族地区农业信息资源建设与正式制度创新研究”(项目编号:NWNU-KJCXGC-SK0302-21)的阶段性研究成果。
收稿日期:2014-05-28
·信息计量学研究与应用·