APP下载

2017-2019年国外图书情报学研究热点与前沿可视化分析

2021-07-14苏瑞竹闫静雅广西民族大学管理学院

图书馆理论与实践 2021年4期
关键词:计量学聚类文献

苏瑞竹,张 悦,闫静雅(广西民族大学管理学院)

1 研究设计

1.1 研究方法和工具

本研究采用引文分析法、共现分析法、科学知识图谱与信息可视化的研究方法。选取可视化分析软件CiteSpace作为研究工具,以Web of Science(WoS)导出的纯文本数据为主要的数据源,探讨图书情报学领域的研究热点和发展趋势。与其他文献分析软件相比,Citespace有其自身的优势和独特之处:①可以将WoS等数据库的原始数据格式直接导入进行运算及作图,原始数据不需要转化为矩阵的格式;②对于同一数据样本,可进行多种图谱绘制,从不同角度展现数据演化特征;③该软件通过对节点和连线标记不同颜色,清晰地展现出文献数据随时间变化的脉络;④解释图形很主观,可以使用系统的算法生成聚类,也可以用视觉判断聚类,咨询领域专家[1]。

1.2 研究对象

首先,对比JCR报告“Information Science&Library Science”类别中所收录的89种期刊与北京大学编著的《国外人文社会科学核心期刊总览》“图书馆学、情报学、档案学类核心期刊表”中收录的61种期刊进行对照,得到交集。其次,选取JCR报告中影响因子排名靠前且在WoS核心数据集中能够获得“全记录与引用的参考文献”格式的共14种期刊作为研究对象(见表1)。最后,运用CiteSpace软件对这些期刊2017—2019年(时间截至2019年10月中旬)刊载的3,015篇文献(Article)进行科学计量分析。

表1 14种期刊一览表(根据影响因子的值作降序排列)

2 研究热点

本文利用CiteSpace软件对3,015篇文献的关键词进行共词(Co-words)聚类挖掘分析,科学直观描述了LIS领域的研究热点(见图1)。

图1 关键词聚类知识图谱

该图反映了国际LIS领域近两年的热点问题,利用LLR算法对关键词进行聚类,聚类号表示某关键词聚类后所在的主题。Modularity(M)即网络模块化评价指标,值越大,表示聚类越好,M的取值区间为[0,1],当M>0.3时,得到的网络社团结构是显著的。Silhouette(S)是用来衡量网络同质性的指标,当其值>0.5时,表示聚类结果是合理的,其值越接近1,同质性越高。通过LLR算法,M=0.4085,S=0.6108,说明得出的关键词聚类知识图谱合理、客观。图1中加粗字体表示不同文献共同的关键词,“#数字”表示运用LLR算法对共同关键词提取后命名的聚类词,每个色块表示由各类不同的文献组成的具有相近研究主题的聚类。通过对关键词的聚类,得到LIS领域的4个研究主题。聚类间有线条相连的现象,表示这些聚类之间存在研究主题上的交叉,其关系较为紧密,而与其他聚类间不存在连线的色块,表示该类主题具备较为独立的研究性质。以“#0,#1……”等形式对聚类进行编号(Cluster ID),聚类号越小,表示该聚类的经典文献数量(Size)越多,Silhouette值表示经典文献之间的紧密程度,Mean(Year)项表示平均年份,可反映聚类中文献的时效性,Top Terms即以LLR算法命名的聚类名称(见表2)。

表2 关键词聚类表

2.1 社会化媒体

对该主题的研究主要可以分为以下几个方面。①对社会化媒体影响力的研究。如,Muscanell等通过由美国和欧洲学者组成的样本对社交网站Research Gate(RG)的使用和功能进行研究,分析了学者们使用网站的方式以及他们对网站的看法,探讨使用社交网站对学者们职业成果的影响[2]。②对社会化媒体用户的研究。Cheng等通过对115名频繁使用微信的参与者的访谈,运用信任交通灯模型,结合定性分析方法找出显著的信任因素并对其进行进一步的阐述,最终建立了信任认知洋葱模型(Onion Model)[3]。③对社会化媒体内容的分析研究。Aswani等采用了标签分析、情感分析、词分析、主题建模等方法对Twitter的社交媒体用户生成的内容进行挖掘,并强调当用户生成的内容被不成熟的搜索引擎拿去进行商业化用途时,这样的数字营销公司提供的服务通常对用户是无益的[4]。④对社会化媒体的研究现状进行研究。Stieglitz等指出社交媒体数据正在许多不同学科中进行分析,目前已有大量关于具体数据分析方法的挑战和困难的文献,但是关于数据发现、收集和准备阶段的研究还较少。为了填补当前研究的不足,Stieglitz进行了扩展和结构化的文献分析,提出了用来扩展现有的社交媒体分析框架的方案,为收集和分析社交媒体数据的研究人员和实践者提供了借鉴[5]。

2.2 引文分析

引文分析是图书情报领域学者常用的研究方法之一,主要用来对某一领域或主题的核心内容进行归纳,绘制该领域演化路径,发现未来发展的趋势。Shiau等运用引文分析法归纳出6类移动信息系统(MobIS)的核心知识,帮助现有框架的维护和新商机的开发[6];Shiau等对4,429篇关于Facebook的学术论文进行分析,运用聚类分析和多层次测量分析确定Facebook的核心知识[7];Kogut通过引文分析研究了图书情报学科与高等教育学科之间的信息传递,评估了这两个学科之间观念的影响,认为在研究图书馆对学生成功的贡献时,需要考虑LIS领域之外的研究和合作者[8]。也有一些学者对引文分析法本身进行了研究,对该研究方法的完善做出了巨大贡献。等认为在科学期刊评价中最常用的两个引文影响指标是影响因子和h指数。然而,影响因子对存在大量引文的文章并不稳健,而h指数则取决于期刊的规模,因此提了一个根据期刊中高被引文章百分比的引文影响指标,以补充科学期刊评价体系标准[9]。

2.3 高校图书馆

高校图书馆服务价值的评估是近三年来学者们研究的热点。Malapela等探讨学术图书馆价值评估的若干理论方法,以及在进行学术图书馆服务价值研究时应考虑的实践方法[10]。Borrego等认为高校图书馆员与教职工合作的学术成果能够展示图书馆对其所属机构的价值,并探讨图书馆员在图书情报学科以外的领域对学术期刊的贡献,以及他们与这些领域研究人员的合作实践[11]。

此外,部分学者对高校图书馆的未来发展提出了建议。Cook等在认可高校图书馆在对待残疾雇员方面的多样性与包容性的同时,分析了高校图书馆在安置隐形残疾雇员时可能面临的独特挑战,并提出建议以帮助图书馆更好地理解和容纳隐形残疾的雇员[12]。Koloniari等利用结构方程模型探讨各种组织(愿景和目标、文化和结构)、技术和个人(人力资源技能和对知识管理的感知)因素对高校图书馆新知识创造和创新的影响程度。实验表明,高校图书馆领导应该培养协作、信任和学习的组织文化,提供采取主动行动的机会,创造适当的技术环境,建立一个共同的愿景,指导必要的实践和变革,以实现知识创新[13]。

2.4 科学合作

为提高科学研究水平和技术力量,国家、地区、机构、学者间往往会建立良好的科学合作关系。Chen等通过对学术出版物进行文献计量分析,探讨社交媒体事件监测领域的研究现状和发展趋势,发现附属机构和作者倾向于与同一国家的人进行更多的合作[14]。Ortega对科学合作的另一种形式——学术社交网站进行了研究,根据学科、学术地位和性别,分析学术社交网站上的个人资料分布情况,提出了这些学术场所倾向于成为专门的网站或有一个同质化的过程的猜测[15]。Zhang等提出科学合作的外延不断扩大,学科融合的程度也在不断加深,在经济学领域,企业社交网络成为企业社会化营销的重要手段,以顾客参与、价值创造和关系营销等理论为基础,建立了顾客参与对粘性的影响模型[16]。

3 研究前沿与科学领域结构

陈超美认为研究前沿是一组及时、动态且有潜在研究价值的问题,研究前沿的知识基础是引证和共引痕迹[17]。本文中,Citespace的具体操作设置是:“Term Source”同上文,“Node Type”选取“Cited Reference”选项。运行数据后,得到图书情报学研究前沿聚类图(见图2)。从图2可见,将共被引文献聚类后得到8个研究主题。

图2 图书情报学研究前沿知识图谱

结合图书情报学专业知识,排除相关度较小的聚类后,以“#0,#1……”等形式对聚类进行编号,聚类号越小,表示其聚类的文献数量越多,共被引文献的聚类情况如表3所示。

表3 共被引文献聚类表

3.1 替代计量学

替代计量学(Altmetrics)是传统文献计量学的重要补充,自2010年Jason Priem首次提出后,国外学者围绕替代计量学的理论与实践展开了一系列研究。①替代计量学的介绍、概述和评论。Williams对替代计量学进行了概述和评论,并认为Altmetrics是一个日益重要的研究领域[17]。Stuart介绍了开放式文献计量学,呼吁人们提高对开放式文献计量学潜力的认识,特别是关于发现以前未被发现的公共知识的能力[18]。Htoo等通过调查社会科学学科中替代计量学的丰富性和未来潜力,分析评价替代计量学作为各学科研究影响指标的有效性,帮助社会科学研究人员理解不同学科中的替代计量学[19]。②替代计量学的应用研究。Na等了解社会网络上关于心理学学术出版物的学术讨论,并进一步探讨了替代计量学作为学术文章研究影响评估工具的有效性[20]。

3.2 隐私问题

Huang等以社交网络服务(SNS)为研究对象,从个人媒体系统依赖(MSD)和隐私关注的角度,构建了一个研究个人SNS使用促进者和抑制者的模型[21]。Yeh等探究了互联网用户提供个人信息意愿的驱动因素,深入探讨了外部报酬如何调节用户信息隐私关注与提供个人信息意愿之间的关系[22]。在探讨隐私问题与情感和应对行为之间特殊联系的基础上,Jung等提出认知—情感评价可以作为解释用户的隐私行为的一个可靠框架,为信息隐私研究中的认知—情感视角提供了一个新的研究方向,为解释应对行为提供了一种既能反映认知又能反映情感的方法。Wang等综合隐私信任行为意向(PTB)和消费者决策模型并考察社会互动对购买意向和实际购买行为的影响,提出了一个综合模型,发现制度性隐私保障对制度性信任有积极的影响,而制度性信任反过来又会影响在线社交互动,从而增加在s-commerce网站上购买产品的可能性[24]。

3.3 跨学科

Hu等利用斯特林的多样性指数和专业化指数,以学科类别共现为基础,测量了大数据研究中跨学科协作的程度[25]。Kogut通过探讨图书情报学(LIS)与高等教育学科之间的信息传递,以评估这两个学科之间观念的影响,强调在研究图书馆对学生成功的贡献时,需要考虑LIS领域之外的研究和合作者[8]。Kiszl等从匈牙利图书馆学教育的角度分析了信息技术、市场经济和图书馆员职业之间的关系,并强调基于跨学科的主动创新信息提供的重要性,认为图书馆员未来可能成为创建数字信息拼贴的大师[26]。

3.4 大数据

新兴技术的发展与应用一直以来都是图书馆学、情报学研究的前沿,自2008年8月首次提出大数据以来,图书馆学、情报学领域的专家学者对其进行了大量的研究。①利用大数据进行分析研究。Ragini等提出可以从社交媒体和移动网络创造的大数据中挖掘宝贵的信息,通过从社会网络中收集灾害数据,根据受灾人群的需要对其进行分类,提出大数据驱动灾害的响应方法[27]。Acharya等通过实证研究了来自四个时尚零售组织的数据,发现大数据确实有助于知识的共同创造,同时反过来又能适当地引导基于证据的、有效的决策,以更好地实现业务回报[28]。②对大数据和大数据技术进行研究和评价。Duan等认为大数据与人工智能的发展相辅相成,有助于推进大数据时代人工智能在决策中的应用研究[29]。

3.5 迟滞承认

迟滞承认,又名延迟承认、超前发现、抵制发现等。2004年,荷兰计量学家Raan巧妙地借用睡美人童话把这一特殊的引文现象命名为“睡美人”现象。“睡美人”文献这一概念是从文献计量学角度对科学社会学领域延迟承认现象所作的定量描述,是指文献在发表后相当长一段时期内被引次数为零或被引极少,仿佛是在“沉睡”,而在一个时间点后突然高被引,就象被唤醒一样,起唤醒作用的文献常被称为“王子文献”[30]。一些学者对“睡美人”论文产生了浓厚的兴趣,积极探寻其“休眠”及“被唤醒”的原因。Adil等提出了一种基于睡美人论文引文网络的识别睡美人论文的方法,称为再发现论文,该方法揭示了科学界潜在的再发现作者的共同特征以及他们在引文网络传播中发挥的重要作用[31]。Lutz等研究了“热门论文”与具有“迟滞承认”特征的含义,探讨了两者之间的差异,并认为“迟滞承认”的出现是一个不可预测的过程[32]。You等结合科学计量法与定性分析法,分析了福克曼的科学成果和其著作的引文寿命,探讨了迟滞承认现象对其作品的影响程度,揭示了这一迟滞承认的背后原因[33]。

3.6 情绪分析

情绪分析主要聚焦在分析方式方法、搭建分析框架、性别对学者分析偏差的影响等方面。Chang等提出了包括数据爬虫、数据预处理、情感敏感树构建、卷积树核心分类、方面提取和类别检测以及视觉分析在内的一个集成的框架,用以获得对酒店评级和评论的深入了解[34]。Jeong等提出了一种基于话题建模和社交媒体数据情感分析的产品机会挖掘方法,用以确定每个产品主题的机会价值和改进方向[35]。Bigorra等认为相比于售后调查,对客户在互联网上发表的产品看法进行情感分析更能够有效地评估客户对产品特征的意见[36]。Moro等通过对游客的在线评论进行情感分析,提供了游戏化特征与旅行者写评论时行为之间关系的证据[37]。Ragini等通过情感分析,提出了一种大数据驱动的灾害响应方法,该模型从社会网络中收集灾害数据,并根据受灾人群的需要对其进行分类,有助于应急人员和救援人员为快速变化的灾害环境制定更有效的信息管理策略[38]。

3.7 公民互动

近年来,网络问政已成为政府与公民互动的重要方式。Aladwani等认为政府迫切想了解政府—公民互动的过程和结果,于是提出社会公民理论,两个现场调查收集的数据结果显示,政府社交媒体质量与政府的公信力成正相关[39]。Dai等指出美国警察部门开始通过社交媒体与周围社区进行接触,实施公民互动的战略,并介绍地方警察部门对Facebook和Twitter的使用情况[40]。

3.8 专利引文网

专利引文网的构建工作与检验,以及对专利引文网构建现状的分析与预测是当前国外图书馆学、情报学领域学者们关注的前沿问题。Sun等以出版物和专利为数据源构建了出版物和专利文献的引文网络,并在此基础上采用知识模因发现算法,对科技知识进化中起关键作用的模因进行识别,并利用嵌入模型跟踪模因的语义变化展现了知识模因的扩散和共现[41]。Sanghoon等基于对移动产业的专利引用分析,通过测量企业间的技术知识流,实证检验了移动生态系统的网络结构,发现平台提供者正逐渐成为生态系统中知识流动活动的中心,且每个平台提供商都在形成自己的子网络,对关联企业的影响越来越大[42]。Wonchang从不同技术部门之间引文的相互作用以及引文与被引文的集中两个方面探讨了专利引文中知识流动的结构模式,证明了知识流动在技术部门之间具有高度的互易性[43]。

3.9 科学领域结构

科学领域结构可反应LIS领域所涉及的各个学科之间的合作、交叉关系。可从合作者的聚类、文献的聚类等方面进行探索,但最直观的方式,是直接分析由WoS导出的数据中的分类号,研究领域分布图如图3所示。

由图3和表4可知,从发文量来看(图中年轮的大小表示发文量的多少),LIS领域近两年覆盖的主要科学领域依次为:信息科学与图书馆学、计算机科学、跨学科应用、信息系统、管理、商业与经济6个领域。其中,信息科学与图书馆学、计算机科学的中心度最高。这表明在图书情报领域的高水平成果中,受网络关注最高的是信息科学与图书馆学、计算机科学领域。本研究样本文献构成的研究分布网络显示,上述研究领域互相交叉,这表明当前的学科研究趋势正朝着以图书情报学为主,以其他相关领域为辅的多学科交叉研究的方向演化。

图3 研究领域分布图

表4 学科领域分布表

4 结语

本文通过对图书情报专业14种核心期刊2017-2019年发文进行文献计量与可视化分析,展示了国际LIS领域近3年的研究热点及研究前沿。①通过关键词聚类分析发现社会化媒体、引文分析、高校图书馆、科学合作这四个主题是近三年国际LIS领域的研究热点。②利用文献共被引数据预测出LIS领域今后的研究趋势将集中在替代计量学、隐私问题、跨学科、大数据、迟滞承认、情绪分析、公民互动、专利引文网等8个方面。这8个趋势与社会发展的趋势是紧密相连的,替代计量学、隐私问题、大数据、情绪分析等与近年来计算机网络等技术的发展与应用趋势相切合。跨学科、迟滞承认、公民互动、专利引文网等与社会发展趋势与相关技术的发展程度相吻合。因此结合当前研究情况看,本文利用文献共被引分析预测出的LIS领域的研究趋势具有一定的科学性和合理性。但本文只选择了14种期刊的载文,样本数据不够全面,其他未收录的期刊数据也存在深入挖掘的价值。未来可以通过进一步的文献搜索、整理,扩大样本范围,对国际LIS研究的整体热点与趋势进行更加深入的分析,以提升研究的说服力[44]。

猜你喜欢

计量学聚类文献
Hostile takeovers in China and Japan
基于Web of Science数据库的老年综合评估文献计量学分析
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
面向WSN的聚类头选举与维护协议的研究综述
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
基于高斯混合聚类的阵列干涉SAR三维成像
The Role and Significant of Professional Ethics in Accounting and Auditing
我国有氧踏板操研究的文献计量学分析
基于Spark平台的K-means聚类算法改进及并行化实现
基于加权模糊聚类的不平衡数据分类方法