《图书馆杂志》“十二五”回眸
——基于关键词可视化分析
2016-09-03吕玉龙王细荣
吕玉龙 王细荣
《图书馆杂志》“十二五”回眸
——基于关键词可视化分析
吕玉龙王细荣
本文以《图书馆杂志》刊载的“十二五”期间学术文献为统计分析对象,应用二模网络、中心性分析、聚类分析、“K-核”分析、战略坐标图等可视化分析技术,从关键词角度分析了该刊在“十二五”期间的内容特色及主题变化态势。
“十二五”;《图书馆杂志》;可视化分析
《图书馆杂志》创刊于1982年,是上海市图书馆学会与上海图书馆联合主办的全国性图书馆学情报学专业核心学术期刊。一直以来,《图书馆杂志》秉承理论联系实际的办刊宗旨,力求前瞻探索与现实研究并重、理论学术与实践操作并举的内容特色。“十二五”期间,适逢《图书馆杂志》创刊30周年,《图书馆杂志》进行了转型发展的探索性改革,对期刊启用新封面和尝试性改版,上线新的数字化编辑系统和网站等,为读者、作者、编者提供全新的期刊服务平台和专业资讯平台。本文以《图书馆杂志》“十二五”期间刊载的学术文献为统计分析对象,使用二模网络、中心性分析、聚类分析、“K-核”分析、战略坐标图等可视化分析技术,采取图书馆与信息科学研究的迷你型方法论教科书《图书馆焦虑——理论、研究和应用》中的数据采集、数据分析和数据解释的研究框架,从关键词角度分析了《图书馆杂志》在“十二五”期间的知识网络结构、潜在的主题生态进化态势以及内容特色,以期给读者和编者提供参考。
一、数据采集
1.数据获取
《图书馆杂志》是中国知网(CNKI)全文全收录的期刊,在CNKI中可检索“十二五”期间《图书馆杂志》上刊载的全部文献。经检索,共获取文献1470篇,其中包含选题指南、总目录、馆舍介绍、简讯、通知等非学术文章,这些文章作者或单位未著录,故可通过去除作者或单位为空白的记录,以筛选出学术文章的记录数,共计1363篇,并将此作为研究分析对象。
2.数据总览
“十二五”期间,《图书馆杂志》刊载文献量按照年代分布如图1所示。2013年,该期刊的学术文献量较前两年出现了较大幅度的下降,而后两年较2013年又出现了较大幅度的下降。究其原因,《图书馆杂志》在纪念创刊30周年之际做出了在2013年开始改版尝试的决定,进行了期刊定位和栏目设置的探索性改革。在栏目设置上,2013年和前两年相比,“上图讲座经典”栏目减少了10期,延续了“理论探索”“工作研究”“公共图书馆”“高校图书馆”“新技术应用”“海外瞭望”“文史天地”和“悦读时空”八大主设栏目。经过2013年一年的探索,《图书馆杂志》在2014年开始再次对期刊栏目进行了调整,主设“专题·专稿”“理论探索”“工作研究”“新技术应用”“国际交流”和“文献考论”六大主题,并且不定期刊登“书刊推荐”和“书刊评介”。2015年,《图书馆杂志》不定期新增设“博士论坛”和“全民阅读学坛”,期刊主题逐渐增加“阅读推广”的分量。
图1 “十二五”期间《图书馆杂志》刊载文献量变化趋势图
二、数据分析
国内大部分学术期刊上所刊载的学术性文章通常都由作者标注关键词,用来反映某篇学术论文的研究主题、研究方法、研究工具等内容。每种学术期刊的刊文都有一定特色,关键词频率的变化及关键词之间的关系在较大程度上可以揭示其发文主题的变化情况。因此,可以通过关键词分析,了解期刊的内容特色和办刊主题。在上述1363篇文献中,共计出现关键词4294个,关键词频次6261次,篇均关键词4.59个。文章选取高频关键词阈值为5,共得高频关键词114个,下面应用可视化技术分析这些高频关键词。
1.关键词-年代分析
通过分析关键词随年代的迁移情况,可以了解期刊办刊主题的稳定性和连续性等变化情况。统计114个高频关键词在五年间出现的情况,得到“关键词-年代”二模关系矩阵,应用NetDraw可视化该矩阵,并使用多维量表(MDS)方法重新排列,结果如图2所示。由于多维量表技术是根据“距离”进行画图的,因此在二维空间中,距离越近的点关系越紧密。[1]图2中,2011年、2012年和2013年在距离上比较接近,说明《图书馆杂志》在这3年刊载的内容主题具有较大的相似性。2014年和2015年的距离比较远,与前3年的距离也比较远,说明这两年的内容主题变化较大,期刊定位一直处于探索中。同时,5年间的高频关键词没有出现明显的分块情况,说明主题和内容具有一定的稳定性和连续性。
图2 高频关键词—年代的多维量表图
2.关键词中心性分析
关键词出现的频率越高,说明该主题是期刊关注的研究热点,关键词共现的次数越多,说明该主题与其他主题联系能力越强。通过分析期刊刊载的关键词的“中心性”,可以评价一个主题在期刊中的重要程度,或其在期刊主题中的影响力,从而可以找出期刊的主题关键词。分别统计114个关键词在1363篇文献中共同出现的次数,得到一个高频关键词共现矩阵(主对角线上的元素表示每个关键词的词频),将该共现矩阵导入社会网络分析软件UCINET 6中,沿着“Network→Centrality→MultipleMeasures”做标准化中心度分析,分别计算高频关键词的点度中心度、中介中心度和接近中心度,并使用Net-Draw可视化关键词共现网络,结果如图3所示。
图3 高频关键词共现网络图谱
图3中,节点越大,表示点度中心度越大,该节点通常与其他节点存在较多关系;文本越大,表示中介中心度越大,即使它的度数较低,也能起到重要的中介作用,因而处于网络的中心地位。由图3可以看出,图书馆、高校图书馆和公共图书馆的点度中心度最大,其次是全民阅读、阅读文化、少儿阅读等,中介中心性较大的除了图书馆、高校图书馆和公共图书馆外,还有图书馆学、图书馆员、读者服务、阅读推广等,说明“十二五”期间,《图书馆杂志》重点关注这些领域和主题。点度中心度和中介中心度最少的是版本、图书采访、上图、《四库全书总目》、补正和Primo,说明《图书馆杂志》对这些方面刊载的文献量很低。
3.关键词K-核键词
对高频关键词进行“K-核”分析,可以确定“核心-边缘”关键词,进而可以知道期刊的核心主题和边缘主题。“K-核”中所有关键词的度数都至少为k。原始共现矩阵中非零元素的均值为2.63,选取共现频次的阈值为3,通过UCINET 6将原始矩阵转换为二值矩阵并运行“K-cores”分析,结果如图4所示。图4中,▲表示3-核簇,是核心关键词;●代表2-核簇,是次级核心关键词; 代表1-核簇,是次级边缘关键词;其余关键词为边缘关键词,关键词字体大小表示点度中心度。从图4可以看出,核心关键词有全民阅读、少儿阅读、中国图书馆学会、推广委员会和阅读学,其中全民阅读和少儿阅读的中心度最高;次级核心关键词有13个,其中图书馆学、阅读文化和阅读服务的中心度较高;次级边缘关键词中,公共图书馆、图书馆和阅读推广的中心度较高。
图4 高频关键词二值矩阵的读K-核频关键词二
图5 高频关键词聚类分析树状图(部分)
4.关键词聚类分析
聚类分析可以根据关键词之间的紧密程度聚合为一个表达某个主题的相对独立的簇,从而把所有关键词划分为若干个研究主题。为了消除共现频次差异所带来的影响,将原始共现矩阵采用Salton指数转换为相关矩阵,导入SPSS 22.0进行系统聚类分析,聚类方法选择“ward法”,度量标准选择“平方Euclidean距离”,聚类树状图(部分)如图5所示。
114个关键词可以分成10类,其中聚类9含有60个关键词,可以进一步分成10类。“K-核”分析中的5个核心关键词全部分布在类10中,13个次级核心关键词主要分布在类1、2、6、7、10中,两者中的绝大部分关键词集中于类1、2、6、10中。
5.关键词战略坐标图分析
战略坐标图(Strategical Diagram)分析方法由Law等人提出,是基于研究主题或类团的密度(Density)和向心度(Centrality)的一种可视化分析方法,用来揭示各主题聚类内的内部联系情况和类间的相互影响情况。其中横轴代表向心度,揭示研究主题与其他主题的关联程度,纵轴代表密度,表示某研究主题维持和发展自身的能力。因此,应用战略坐标图法分析期刊某一时期的高频关键词,可以了解期刊主题的生态进化趋势。根据上述的114个关键词的共现矩阵分别计算聚类分析得到的19个类的密度和向心度,密度和向心度的均值为4.92和5.21,通过Excel散点图的形式绘制战略坐标图(见图6所示)。
图6 高频关键词主题簇的战略坐标图
将战略坐标图应用于期刊刊载文献的主题分析,位于第Ⅰ象限的主题的密度和向心度都较高,说明主题内部联系紧密,并且与其他主题密切相关,期刊对该象限的主题兴趣浓厚,形成系统化的关注;第Ⅱ象限的主题结构不紧密,但其研究状况比较成熟,由于缺乏后续进展而受到的关注较少,期刊对该象限的主题有一定的关注度,但是关注内容成片状化,处于关注边缘地带;第Ⅲ象限的主题密度和向心度都比较低,内部关系松散,与其他主题的联系不够紧密,期刊对该象限的主题需要进一步提炼;第Ⅳ象限的主题密度低但向心度高,虽然处于期刊关注的核心地位,但易被其他主题同化或吸纳。如图6所示,第Ⅰ象限的主题簇有类1、类7、类9-7、类10;第Ⅱ象限的主题簇有类2、类3、类6、类9-1;第Ⅳ象限的主题簇有类9-2;其余的主题簇均在第Ⅲ象限。
三、数据解释
通过上述关于《图书馆杂志》在“十二五”期间刊载的学术文献关键词的知识图谱分析,结合高频关键词的“K-核”分析和战略坐标图分析,可得出:
1.全民阅读是其内容核心,阅读推广成潜力主题
全民阅读是“K—核”分析中的核心关键词,且在聚类分析和战略坐标图分析中归于类10和第Ⅰ象限,其点度中心度和中介中心度紧随公共图书馆之后,位列第四,足以凸显出其核心主题地位。阅读推广是次级边缘关键词,但在战略坐标图中位于第Ⅰ象限,其点度中心度和中介中心度也位居前列,说明其在广度和深度上具有较大的发展潜力,是期刊下一步关注的重点领域。
2.图书馆基础理论和学科服务主题涵盖范围广,但内容不集中,处于关注边缘
类2(图书馆本质、基础理论、图书馆学)和类6(学科馆员、学科服务、大学图书馆、学科化服务、文献采访)处于战略坐标图的第Ⅱ象限。同时,绝大部分主题是次级核心关键词,说明该领域的研究比较成熟,虽然关注度高但后续发展慢,存在被期刊边缘化的风险。
3.图书情报学主题需要进一步加强关注
大数据、云计算、可视化和数据挖掘等图书情报方面的主题均位于第Ⅲ象限。说明期刊一直对这些领域存在兴趣,但这些主题内部联系松散,与其他主题联系也不够紧密,需要引起重视,对这些主题进行细分和优化,在提高关注度同时,也要注意提高主题的内部联系。
4.数字阅读易被分解或演化为其他相关主题
类9-2(电子书、数字阅读)位于第Ⅳ象限且是次级边缘关键词,尽管具有较高的向心度,但密度较低,说明该主题在期刊中内部结构不稳定,在后期发展中易被期刊的其他主题消化或吸纳。一方面,数字阅读是现代信息技术给图书馆服务带来的新手段,另一方面,数字阅读和电子书是阅读推广的形式之一。
四、结语
“十二五”期间,《图书馆杂志》抓住时代脉搏,在转型发展中探索前行,重点关注公共文化服务体系的新理论、新模式和新途径,倡导全民阅读,关注少儿阅读,弘扬经典文化。同时,《图书馆杂志》还注重图书情报的前沿研究,特别是现代信息技术带来的新手段和新业态方面的关注。通过分析发现,《图书馆杂志》在一些主题或栏目设置方面还有优化的空间,通过栏目设置的优化和主题的提炼,可以进一步强化突出其办刊特色;读者若对全民阅读和阅读推广等领域感兴趣,可以将《图书馆杂志》作为重要的阅读刊物之一。
[1]纪念《图书馆杂志》创刊30周年座谈会在上海图书馆隆重举行[J].图书馆杂志,2013,32(1):113.
[2][英]奥韦格布兹,焦群,博斯蒂克.王细荣,主译.图书馆焦虑:理论、研究和应用[M].北京:海洋出版社,2015:62-174.
[3]魏瑞斌.学术期刊发文主题演变的实证研究以《情报学报》为例[J].情报杂志,2013,32(6): 64-69,39.
[4]刘军.整体网分析UCINET软件实用指南(第2版)[M].上海:上海人民出版社,2014:136,283-284.
[5]姜鑫.我国微博研究主题的共词可视化分析[J].现代情报,2013,33(11):108-113.
[6]赵娟.共词分析法探讨国内图书馆阅读研究热点[J].河北科技师范学院学报(社会科学版),2013,12(4):119-123.
[7]韩红旗,安小米.科技论文关键词的战略图分析[J].情报理论与实践,2012,35(9):86-90.
(作者单位:上海理工大学图书馆)
10.16653/j.cnki.32-1034/f.2016.11.033