人大复印报刊资料《图书馆学情报学》选文特征分析*

2021-08-30周春雷孟丽慧李正南

情报杂志 2021年8期

周春雷孟丽慧李正南

(1.郑州大学信息管理学院郑州 450001；2. 郑州市数据科学研究中心郑州 450001)

据官网资料介绍，中国人民大学出版的复印报刊资料(以下简称《资料》)以专家和学者的眼光，依循严谨的学术标准，去芜存菁、优中选优，提供高质量的学术信息产品，便于用户把握本领域的研究动态[1]。《资料》选稿时，以学术创新性、论文完备性、社会价值、难易程度等可以直接反映论文价值的定性指标为主，以课题立项、发表载体等间接指标为辅[2]。《资料》发展至今，已在我国人文社会科学领域具有很高的影响力。对《资料》所收录论文的特征进行研究，不仅对了解领域发展状况有帮助，也能丰富我们关于单篇论文评价标准和方法的认识。

目前，学术界关于《资料》选文特征的研究大体涉及选文期刊、选文内容、论文发表机构和选文影响力四个方面。刘晶、李永[3]分析了2010-2014年《资料》档案类的转载情况，发现核心期刊是其主要选稿来源。张恺姣[4]认为来源期刊与《资料》的相互优化作用加剧了学术期刊的“马太效应”，被《资料》重点转载的期刊更容易吸引到高质量的文章。姜春林等[5]对《资料》的科技哲学卷进行文献计量分析后发现，来源期刊的数量呈下降趋势，且向少数期刊集中，转载周期有拉长的趋势；转载的机构以领域内的代表机构为主；转载论文的主题符合学科的演进特征，但缺乏前沿性研究方法。张家榕等[6]认为《资料》可以很好地捕捉研究热点，转载的论文主要来源于少数权威机构，被转载论文的质量总体较高。蒋鸿标[7]发现《资料》转载的论文与学术期刊的质量无必然联系，选文的学术影响力不高，被引频次较低。以上研究表明，《资料》的质量较为稳定，能较为准确地报道不同领域的研究进展，但在选文过程中偏向于收录来自代表性机构的核心期刊论文，对一些方法创新型论文的识别效果欠佳。

为进一步研究《资料》的选文特征并探讨改进单篇论文评价的策略，本文以《资料》2000-2019年转载的图书馆学情报学选文为样本，剔除无法从CNKI、万方、维普等主流数据库中获取发文信息者的全文转载论文，以及论点摘编类论文，得到5 993篇论文样本。拟从入选论文的基本信息、作者、内容和影响力等角度探析《资料》的选文特征，其中影响力主要考察论文在CSSCI数据库中的被引情况。

1 《人大复印报刊资料》选文基本特征分析

1.1来源期刊分析经统计，《图书馆学情报学》选文的来源期刊共195种，绝大多数为图情期刊，也有少量高校学报和基础科学领域的期刊。年转载量与来源期刊种类的共变关系见图1，主要来源期刊及相关指标的数据如表1所示。表1中的刊名统一采用现名，期刊被转载量占比是指期刊自身被《资料》转载的相对值[8]，载文总量占比是指期刊被转载量占期刊发文总数的比例。考虑到发文时间与收录时间差等因素，采用各期刊1999-2019年的发文量。

图1 年转载量和年转载期刊种类

表1 被转载量大于100篇的来源期刊

从表1可以看出，前18名均为核心期刊。结合图1和表1可知，随着年转载量的减少，来源期刊的种类也在减少，且有向本领域核心期刊集中的趋势。第19名的《数字图书馆论坛》虽非核心期刊，但载文总量占比高达4.05%。从学术授信评价角度[9]看，这意味着《资料》很信赖该刊的学术品味和所发表论文的质量，将该刊视为优质的图情类稿源。显然，《资料》通过控制转载率对各刊的发文质量表达了自己的观点，这些信息对于探讨期刊评价问题颇具参考价值。由此可见，《资料》要求选文来源具有较高的学术公信力，这意味着那些在学术声望卓著的期刊上发表的论文被转载的概率较大。这种可相互印证的双向学术授信行为对于巩固、提高《资料》和相关期刊的影响力很有意义，但若过度关注核心期刊而忽略普通期刊，不仅会遗漏一些优秀成果，也会助长以“刊”论文现象，这未免会让很多未能将论文发表在核心期刊上的作者感慨“输在起跑线上”，进而质疑《资料》选文视野的局限性。

1.2收录时效性分析入选论文的收录年与发文年之间的时间差可以反映《资料》收录论文的时效性，以及对领域内研究热点的反应速度。因《资料》转载的论文只显示了转载的年份和期号，且来源期刊的出版频次不同，本文仅计算发文年与收录年之差。对于早期选文来说，数据库显示的时间为论文的收录时间，而非发表时间，存在发文年晚于《资料》收录年的情况，本研究剔除了存在此类现象的5篇论文。

如表2所示，绝大多数论文被《资料》转载的时间差为0或1年，这说明新发表论文是选文的主体。具体分析数据可知，最长时间间隔为11个月，说明《资料》收录论文时较为看重时效性。但是，这一点既是《资料》的优点又是其缺点。原因在于：一味坚持时效性标准会忽视借助外力纠偏补录的必要性。于是，即使某文献日后被证明属于“睡美人”[10]型高价值文献，《资料》也不会收录该文。因此，若《资料》能适当关注“旧”文献，借助单篇论文评价指标或同行专家的推荐补录高价值论文，将会在识别论文方面更具灵活性，提高自身收录优秀论文的全面性与权威性。

表2 收录年与发文年差值情况

2 《人大复印报刊资料》选文作者分析

表3 被转载量排名前20的作者

2.2作者机构分析本节通过《资料》记录的第一作者机构探讨发文机构特征，将二级机构归并为一级机构，将14篇无发文机构者归类为其它，共得到790家机构，其中来自国外的科研机构有37家，占比1.13%。表4列出了总被转载量较大的机构。

表4 被转载量排名前10的机构

分析可知，表4中的机构在国内图情领域具有很强的学术影响力，且其中的高校均在全国第4次学科评估中名列前茅。机构总被转载量与被转载作者数量呈线性相关，即机构内被转载作者人数越多，则机构的总被转载量越大；而人均被转载量与机构总被转载量无关。这似乎意味着《资料》选文时可能在某种程度上考虑了作者及其所属机构的学术影响力。毕竟，从常理来说，高影响力作者和代表性机构对研究热点的把握能力更强，其成果质量更有保障，而《资料》对选文的时效性要求又比较高，优先关注带有“优质原产地”标签的论文当属理性行为，“走眼”概率较小。但是，这种经验主义策略的弊端不容忽视：学术发展的活力在于创新，而非对现有范式的一再重复，若一味倚重“名角”求稳很可能错失“非共识”性创新之作。

3 《人大复印报刊资料》转载内容分析

期刊的栏目设置通常是其总体设计的重要组成部分，也是体现办刊宗旨、展示期刊风格和特色、方便读者阅读和检索的方式之一[14]。《资料》选文内容偏好集中体现在其栏目设置上，我们可以从各栏目转载论文量的多寡观察《资料》对图情领域不同研究主题的偏好。本小节的数据来源为《资料》2000-2019年转载的全部论文，但不包括2019年没有按栏目划分的160篇论文，见表5。分析得《资料》2000-2009年以总论和图书馆学、图书馆事业栏目为主进行选文；在2010-2019年，《资料》各个栏目的年转载量上下波动，除图书馆学外，信息科学方面的论文收录较多，而情报学、情报工作栏目的转载量最少。对期刊发文量和各主题转载量分析发现，发文量与《资料》转载论文量无关。

表5 各栏目年转载量 (篇)

将《资料》的转载内容与国内的图情领域的专业期刊的发文热点进行对比分析，发现《资料》转载的论文大体与领域研究热点同步，但更偏重于学科建设、理论研究及研究方法创新方面。其收录的论文虽然来源广泛，但在代表性方面则难免因选稿专家个人偏好的影响而有一定的偏差。总之，《资料》有其自身的选文特色，在保障选文质量的同时大体准确地报道了领域研究热点与发展脉络。

4 《人大复印报刊资料》选文影响力分析

由于部分选文无法查到被引数据，不能开展引文分析研究，本节主要分析能够在自建数据库及CSSCI中查询到被引数据的5 173篇论文。

4.1被引频次分析被引频次能在一定程度上反映论文的质量和影响力，也能反映论文在学术交流中的价值与地位。《资料》收录论文的被引次数分布情况如图2所示。从图中不难看出，《资料》转载论文的整体被引次数较低，高被引论文较少。其中被引次数在1～10次的论文占比78.50%，其中被引次数为1的论文占17.26%。而被引次数≥10的高被引论文占比21.5%，且被引次数集中在10～20之间。

图2 《资料》转载论文被引次数

普赖斯[11]认为，已发表文献的引用高峰期为其出版后的两年。图3为《资料》2000-2019年转载文献的施引年与发文年之差的分布情况，可以看到《资料》转载的论文在发表后的1～3年达到被引用高峰期，符合普赖斯定律。深入调查4 061篇被引频次为1者的初次被引时间，发现响应时间在论文发表后三年及以上者多达47.86%。这意味着相当数量的选文发表后很少得到C刊论文作者们的关注，即使其得到了《资料》的赏识与推荐。这一现象固然可以说明专家群体的定性评价与量化指标的判断结果有很强的互补性，但大量的低被引论文终究是我们反思单篇论文评价方法及效果的契机。

图3 施引时滞情况

筛选2000-2019的高被引选文(被引频次≥10的)，并将其与图情领域1999-2019年的高被引论文进行对比，发现二者的重合度并不高，《资料》识别出了22.33%的论文，各被引频段的占比情况如图4所示。从图4可以看出，《资料》选稿专家群体对于高被引论文的识别效果较好，但关于低被引论文的判断与学界的分歧较大。因此，建议《资料》在选文时不妨借鉴ESI筛选高被引论文及热点论文的思路，借助引文指标发现后备选文。

图4 《资料》转载论文中高被引论文占比情况

4.2被引广度分析被引广度考察一种期刊对多少种期刊产生影响，也就是说该期刊的论文被多少种期刊刊载的论文引用过[15]。本文中的被引广度是指《资料》转载的论文被多少种期刊引用过。《资料》2000-2019年的选文，被360种期刊引证，一共被引39 841次，期刊自引仅占11.11%。表6列出了施引次数大于100次的期刊，它们提供的引用占总量的94.18%。按施引期刊所属学科进行归类，发现引用图情类选文的期刊主要为情报学、图书馆学领域的核心期刊，而来自综合类、经济学、社会学期刊的引用总量较少，但期刊种类较为丰富。结合上文分析，核心期刊是《资料》的主要来源期刊和施引期刊，它们和《资料》一样都是重要的学术成果传播平台，以自身的学术辐射力和影响力提升了被关注论文的可见度和影响力，增加了其吸引更多引用的可能性。

表6 主要施引期刊

5 分析及总结

从本质上说，《资料》是一个信息过滤器或推荐系统，其价值在于浓缩、摘编、汇集某一领域的高质量研究成果。本研究发现《资料》实际发挥的作用与学界的期望大体相符，但存在一些值得改进之处。本文的分析结果可概括为：a.《资料》收录的论文具有新颖性和及时性，能够及时报道领域研究热点，但《资料》缺乏补录功能，若能放宽对收录时效性的限制，扩大筛选范围，将有助于提高选文质量。b.《资料》评选出的高被转载作者群体通常来自领域内的代表性研究机构，在领域内具有较高的影响力，但推选论文时需警惕过于考虑作者及机构因素。c.虽然《资料》转载的内容大致反映了我国图情领域不同阶段的研究热点，但其栏目设置情况和专家群体的偏好可能在一定程度上影响了其对图情领域实际研究状况的客观报道。d.《资料》转载的论文整体被引频次不高，且施引期刊主要为专业核心期刊，但来自相关领域的期刊较少。这说明《资料》的选文虽能得到某些专业人士的关注，但对大同行的影响力较弱，需要改进宣传和传播手段，将相关论文推介给更多的专业人士。

总之，作为我国人文社会科学领域的优秀二次文献工具，《资料》集中报道了大量成果，受到学术界的广泛关注，也为我们深入研究单篇论文评价问题提供了难得的资料，但其选稿专家群体的规模与作者群体相比毕竟要小得多，在当下“破四唯”、倡导“代表作”评价的背景下，其学术影响力和公信力与ESI等国际知名学术评价工具相比还有较大的提升空间。定量评价与定性评价各有千秋，优秀引文指标的作用不容小觑，ESI高被引论文、热点论文在专业领域中有很强的学术引领力和影响力即为例证。引文分析之所以有效，在很大程度上得益于学术共同体成员对学术传统的尊重和维护，习惯于以引文形式展示各自的学术授信投票。因此，建议以《资料》为代表的二次文献机构广泛吸纳单篇论文评价成果，研发功能强大的基础数据库，借助引文指标和Altmetrics指标多角度揭示来自学术共同体的意见，为选稿专家提供更加丰富的支持信息，进一步提高选文质量。