图书情报学研究热点及立项项目特征分析
2023-08-24夏能能
夏能能
(广东省第二中医院(广东省中医药工程技术研究院),广东 广州 510095)
0 引言
国家社会科学基金(以下简称“社科基金”)是人文社会科学领域最高级别的科研基金项目,设立于1991年,目前涵盖26个学科、8大项目类别[1],具有较强的权威性和代表性,通过研究国家社科基金项目可以了解学科近年的发展情况、研究热点和研究方向。
此前已有学者以图书馆、情报与文献学(以下简称本学科)社科基金项目为数据来源对本学科的发展情况和研究热点、研究趋势等进行了探讨。近10年相关研究如表1所示[2-10],涉及的社科基金项目立项时间涵盖2001—2020年,其中有5位研究者采用的为社科基金项目数据,有3位研究者共同采用了社科基金及自然科学基金项目信息,有1位研究者采用了社科基金项目信息及项目论文的数据。分析角度包括项目的外部特征(立项数量、项目类型、项目负责人、立项单位、地域分布等)和内容特征(高频关键词、研究热点、研究趋势等)。此外,对基金项目进行内容分析需进行分词操作,研究者采用的分词工具包括中科院汉语词法分析系统(ICTCLAS)分词工具、ROST、Co-Occurrence6.7(COOC6.7)等几种。
表1 相关研究情况汇总
但文献调研结果显示,目前鲜见研究者对国家社科基金有本学科立项(1991年始)以来30年间项目进行整体分析,且鲜见项目负责人职称分布变化的分析报道,鲜见本研究主题采用Python jieba分词对项目名称分词操作的相关应用,因此本文拟对30年间的社科基金项目外部特征、内容特征进行汇总分析,以管窥“八五”至“十三五”期间图书馆、情报与文献学学科的总体发展情况、研究热点及趋势等,为学科研究及立项申请提供参考。
1 数据与方法
本研究数据来源于国家社科基金项目数据库[11]。数据采集时间2023年1月12日,查询条件:学科分类=图书馆、情报与文献学,其他不限。完成条件输入及检索后使用八爪鱼采集器8进行数据批量采集,最终去重纳入研究数据共2 201条,立项时间范围1991—2020年(数据采集时该数据库更新的最新立项时间为2020年)。获取的分析数据首先利用Excel对立项数量、项目类型、项目负责人职称等外部特征进行整理,将项目负责人职称及对应年度等信息导入IBM SPSS 28.0进行统计分析,探索职称在不同立项年度间有无差异。项目名称另存为txt文件,并通过Python jieba包进行分词,基于分词结果利用VOSviewer 1.6.13与CiteSpace 6.1.R1分别绘制聚类图谱和关键词突现图,以探索研究热点及前沿。
2 年度立项数量及项目类别分析
本研究获取数据的年份分布为完整的30年,覆盖了“八五”至“十三五”共6个五年计划周期,因此将国家社科基金图书馆、情报与文献学立项按5年一个时段进行划分,汇总各五年计划时段内各类项目的数量如表2、图1所示。
图1 各类项目年代分布堆积条形图
表2 项目数量增长情况
2.1 项目总数增长情况
1991—2020年国家社科基金图书馆、情报与文献学立项总量为2 201项,各五年计划周期内立项项目总量呈逐步上升趋势,其中周期间相比项目总量平均增长率为142.5%。根据表2可见,绝对增长量及增长率随立项时间推移逐步下降,因而可推测经过30多年发展,国家社科基金对图书馆、情报与文献学学科的资助力度达到一个相对平稳的水平。
2.2 项目种类及变化情况
总体数量上,一般项目占据绝对优势,共1 205项,占比54.7%;其次为青年项目566项,占比25.7%;重点项目最早出现在1996年,30年间立项总量为129项(5.9%),位于第4位。青年项目1991年开始立项,“八五”期间共4项,“九五”12项、“十五”24项、“十一五”97项,“十二五”猛增至229项,“十三五”200项,这表明新生研究力量在学科发展中的引领作用在强化,也表明国家对青年研究者的支持力度增大,在一定程度上预示着良好的学科发展前景。本学科国家社科基金中西部项目起步较晚,是在国家颁布西部大开发政策之后,从“十五”期间(2004年)才开始有立项,“十五”至“十三五”西部项目立项总量分别为3项、51项、61项、56项,总计171项(7.8%)。这类项目开始获得资助后便迅速增加到比较稳定的数量水平,表明国家对西部地区的持续支持,这对于通过文化建设促进西部地区经济发展、缩小东西部差距具有重要作用。后期资助项目、成果文库、重大项目分别在2009、2010、2012年首次出现,表明“十一五”后本学科社科基金项目体系逐步发展完善,研究广度也逐步扩大。
3 项目负责人职称分布
经过30年的发展,申报人的职称分布是否有变化?初级、中级职称的青年研究者申报数量在总体中占比情况如何?为了明确这一问题,本文对各五年计划期间项目负责人职称进行统计分析。经Excel初步统计,由于初级职称数量过少,“八五”期间项目职称一栏信息均为空,其他年份也存在部分职称信息缺失的情况,因此将初级、中级合并为一列作为“中级及以下”展示,并对除“八五”外的其他5个五年计划周期有职称信息标注的所有数据进行统计,如表3所示。
表3 项目负责人职称分布
将以上数据导入IBM SPSS 28.0,选用Kruskal-Wallis H检验进行K个独立样本检验,将“九五”至“十三五”分别赋值为1~5,将“中级及以下”赋值为1,“副高”赋值为2,“正高”赋值为3。5个时段总体比较统计量H=31.14,P<0.001,差异有统计学意义,说明“九五”至“十三五”各时段职称高低的分布有差异。
进一步进行组间两两比较(Mann-Whitney U检验),结果如表4所示,由于5个时间分段两两比较共进行10次,因此P<0.005(0.05/10)方可认为结果具有统计学意义。从表4可见,“十五”与“十二五”、“十三五”,“十一五”与“十三五”之间职称的高低分布不同,结合检验结果的平均秩次可认为项目负责人的职称中较高等级职称的总体数量,“十二五”“十三五”少于“十五”,“十三五”少于“十一五”,说明相对于过去而言,近年国社科基金图书馆、情报与文献学项目负责人有向初级、中级等科研新生力量倾斜的趋势,这也表明了学科的发展活力。
表4 职称高低分布组间两两比较
4 项目研究热点和趋势
科研项目的外部特征可以在宏观层面揭示学科发展的总体趋势,而学科的内在研究方向、研究热点则需通过内容特征的分析来展示[4]。本文对项目名称进行分词,根据分词结果的词频统计、聚类、突发词检测等对项目研究热点和趋势加以探讨。
4.1 研究热点
将分词结果格式转换后导入VOSviewer,经过调试,将Minimum total link strength of an item(最小总链接强度,代表某个关键词与其他关键词总的共现次数,包括重复共现次数)阈值设置为5,所作关键词网络密度视图如图2所示。图2中一个关键词节点附近的项目数量越多,相邻项目的权重越高,该节点的颜色越深。由图2可知,30年间研究主题集中在图书馆、大数据、文献、整理、机制、环境、模式等大的节点上,这也体现了图情档学科起源于图书馆学,以向决策部门和社会各界提供信息服务为工作中心,具有围绕大数据、文献整理等为研究对象开展研究的学科特点[7]。
图2 关键词密度视图
结合VOSviewer网络共现聚类结果,参考词频统计及项目名称,笔者将研究主题总结为6个一级类目和若干二级类目,如表5所示。
表5 研究主题聚类
4.1.1 聚类1:图书馆服务模式
图书馆作为城市的基础性建设之一,具有公共教育、传播知识和储存文献等重要作用[12]。图书馆服务即图书的读者工作,是图书馆利用馆藏、设施等向读者提供文献资源、情报知识的一切活动。图书馆服务模式为近30年来本领域研究的热点之一,研究角度包括服务内容(如知识服务、电子书服务、科研数据服务等)、服务对象(残疾人、低幼儿童等)、服务方式(情景感知、智慧服务、个性化服务、跨界服务等)。服务模式研究其本质是以用户为导向的,这说明用户服务是本领域学者关注的重点,反映了图书馆的核心业务仍是向用户提供完备的信息资源和服务[2]。这对将图书馆打造成全民信息服务场所,为国家的文化建设奠定强有力的基础具有重要意义[4]。
4.1.2 聚类2:图书馆建设
图书馆建设相关研究出现在2000年以后,2010年及之前的主要项目主题包括图书馆信息资源数字化建设及数字图书馆、复合图书馆建设,社会主义新农村建设、和谐社会建设中图书馆的作用,农村、欠发达地区图书馆的建设等,主要为图书馆相关实体对象的建设研究;2010—2020年包括图书馆制度建设、图书馆联盟建设、图书馆组织文化建设等非实体对象建设研究。
4.1.3 聚类3:文献保护与整理研究
2007年,国务院办公厅发布《关于进一步加强古籍保护工作的意见》[13],提出大力实施“中华古籍保护计划”,全国图书馆界重点开展古籍征集、收藏、整理、保护及开发利用等方面的研究工作,并取得重大成果[14]。社科基金项目中本学科有关内容主要围绕地方文献、古籍文献及特殊类型文献(如宗教文献、医药文献、口述文献等)开展。其中,地方文献整理与保护相关项目类型较多属于西部项目,如针对广西儒学文献、清代陇右乡贤文献、甘青川藏族民间苯教文献、湘黔边区傩书文献等的整理研究;医药文献涉及藏医药、西夏文医药文献、清代整理中医药文献、宋代笔记医药文献、侗医药等;少数民族文献整理研究涉及纳西族藏语音读东巴古籍文献、古藏文历史档案文献、彝文文献等;口述文献涉及彝族口述历史资料、中缅跨境民族口承文化资料、广西京族口述历史资料等;其他还包括明清杂剧文献、抗战文献、数术文献、契约文献、西北戏曲文献。研究角度包括文献编目、文献考证、翻译及数据库建设(包括有声数据库)等。
4.1.4 聚类4:档案信息服务
档案信息服务研究主题包括档案信息资源的组织、利用、保存与共享研究,档案信息利用效益研究,档案信息保护机制及发展对策等。在国家治理体系和治理能力现代化的建设背景下,档案信息服务正面临着服务理念与模式的转型与升级[15]。2000年以前,档案信息服务主要集中在档案利用对策、档案事业发展中的问题及发展战略;2000—2010年主要围绕档案信息化、档案信息资源的利用与共享等;2011—2020年相关研究数量更多、涉及的细分主题面也更广,包括档案馆的发展战略及中外对比,档案资源体系构建,濒危档案的保护,民间档案、民族档案的整理和保护等。
4.1.5 聚类5:大数据环境下信息管理与服务
基于本研究数据,大数据环境下信息管理与服务最早出现在2013年,包括大数据时代图书馆用户信息的资源化研究、基于大数据的产业竞争态势动态预警机制研究、政府部门基于大数据的决策模式研究、电子政务信息资源共享建设等;而后逐渐转向大数据环境下的企业竞争情报分析、社会舆情应急管理、图书馆服务体系的创新、基于社交媒体的信息分析与利用、画像构建与应用等。近年来,从国家战略发展需求角度,在总体国家安全观指导下,对于大数据环境下突发事件的应急决策、反恐情报预警、信息安全等较为关注,同时还涉及数字图书馆的个性化服务研究、版权保护等。
4.1.6 聚类6:学科研究
1990年,图书馆学、情报学和档案学结为一级学科,包含图书馆学、情报学和档案学3个二级学科[16]。近30年来,本学科社科基金研究项目中有关学科研究的课题包括学科发展历史、人才培养模式、本领域学者研究、学科创新体系以及国外本学科发展情况研究等。
4.2 研究前沿
研究前沿代表学科当下及未来一段时间内的关注点,对了解学科发展、把握学科动态具有实际参考意义。CiteSpace中提供突发词探测技术和网络算法,依靠词频的变动趋势确定研究前沿领域[17],因此本节利用CiteSpace进行关键词突发词检测,并保留前25个高强度探测词,得到的突发词探测结果,如图3所示。根据图3可以分析得出我国图书馆学研究前沿为学术、社交媒体、创新、整理、画像等,均包含在前文分析的研究热点主题内。基于突发词探测结果,参考前文研究热点分析,本文将图情档研究前沿预测分析如下。
图3 突发词探测结果(按突发起始时间排序)
4.2.1 大数据环境下的创新服务
本文数据分析结果显示,2014年大数据开始获得了广泛关注,图情档学科的主要研究内容之一便是处理信息和数据,因此如何从海量数据中提取、总结出有用的知识,实现知识创新,将是本学科的一个重要研究方向。通过对2018—2020年有关“创新”的项目主题进行考察发现,近年来图情档社科基金有关项目主要围绕情报/信息服务创新、学术评价创新、制度创新等,既包含应用层面,也涉及理论层面。
4.2.2 古籍文献整理研究
如前文所述,古籍文献的整理研究是本领域研究热点之一。根据突发词探测结果,“整理”一词从2017年开始突现,并持续至原始数据终止年(即2020年),因此古籍文献的整理研究亦为本领域研究前沿主题之一,值得学者持续关注。考察项目名称发现,“整理”多与“研究”“收集/搜集”等并行出现,其对象大部分为我国不同朝代、地域的古籍文献,如碑刻铭文、私家藏书、家谱等,其中著作类有《周易注》、《四库全书总目》、水书《正七卷》等。
4.2.3 学术信息的组织、管理与利用
“学术”一词突现时间为2015—2020年,根据项目名称,相关项目主要涉及学术信息、学术资源、学术论文、学术专著、学术期刊等,因此本文将其概括为“学术信息的组织、管理与利用”。具体研究包括论文/著作的学术影响研究、期刊评价、学术出版研究、学术资源的开放共享、相关数据库建设等。
4.2.4 社交媒体
社交媒体也称为社会化媒体,主要包括社交网站、微博、微信、论坛、博客、播客等[18]。随着互联网的高速发展,社交媒体已成为公共信息传播的重要媒介,用户不仅可以通过社交媒体获取最新信息资源,还可以进行个人创作、分享和发表评价。图书馆、情报与文献学领域有望深入研究运用前沿科技对网络舆情进行采集获取、研究判断,从而对“突发事件”进行应急信息公开,为有关部门的决策提供支持[19]。尤其新冠疫情暴发以来,有关“重大突发公共卫生事件”中社交媒体用户的信息行为研究、舆情监控等都引起了学者的关注。
4.2.5 用户画像研究
用户画像是以大量真实用户数据为基础,对用户行为、兴趣等进行特征抽取而形成的虚拟用户模型,具有全面性、真实性、代表性、动态性以及移情性等特征[20]。它是一种标签化了的用户模型,展示了某一类目标用户的特征,因此对精准信息服务具有重要参考价值。张海涛等[21]指出用户画像是图书情报领域刚刚兴起的主要研究内容之一,近年来受到了学者们的普遍关注。本文关键词突现显示“画像”的突现时间为2018—2020年,与该论述相符。考察原始数据项目名称发现,“画像”涉及的主体包括图书馆用户、科研人员、杰出人才、企业等。
5 结语
本文基于国家社科基金图书馆、情报与文献学项目信息,利用Excel、SPSS分析了年度立项数量、项目类别及项目负责人职称变化情况,而后通过python 对项目名称进行分词,利用VOSviewer绘制关键词共现图、CiteSpace进行突发词探测,分析了项目研究热点及趋势,所得研究结论如下:
(1)以每个五年计划为一个时段进行划分,发现“八五”至“十三五”期间本学科社科基金立项数量逐年增长,但增长率有所下降,可能是社科基金对本学科资助力度逐步达到一个相对平稳的水平;项目类别中一般项目最多,其次是青年项目、西部项目,其中青年项目的显著增长表明了国家对青年研究者支持力度的增大,这与项目负责人职称的变化情况(高级职称总体数量有减少趋势)也相互印证。
(2)30年间,本学科社科基金项目研究重点包括图书馆服务模式、图书馆建设、文献保护与整理、档案信息服务、大数据环境下的信息管理与服务以及学科研究等;在未来,本学科可能会进一步基于大数据环境开展创新服务研究,进一步深化古籍文献整理研究和学术信息管理,持续关注社交媒体中的用户行为及舆论风险控制,重视用户画像研究,提高精准信息服务水平等。
值得注意的是,2021年12月,国务院学位委员会办公室发布《关于对<博士、硕士学位授予和人才培养学科专业目录>及其管理办法征求意见的函》,其中管理学大类下新设“信息资源管理(‘图书情报与档案管理’更名)”,这对本学科的发展意义重大,预示着学科将会有更多的细分发展方向和学科生长点,值得学者更加广泛和深入研究探索。