APP下载

直翅目昆虫分类学研究的文献计量学分析

2021-08-26黄海清黄扬帆

北方农业学报 2021年3期
关键词:发文昆虫期刊

黄海清,黄扬帆,边 迅

(广西师范大学生命科学学院,广西桂林 541006)

直翅目(Orthoptera)昆虫隶属节肢动物门六足总纲昆虫纲不完全变态昆虫,包括3 亚目[Caelifera(蝗亚目,又称短角亚目),Ensifera(螽亚目,又称长角亚目),Titanoptera(巨翅亚目)]27 总科80 科,共计28 699 个有效种[1],除南极洲外其他各大洲均有分布,热带地区的物种丰富度最高,常见的种类有蝗虫、蚱、蟋蟀、螽斯、蟋螽、蝗螽等。20世纪末,INGRISCH 等[2]编著的Bibliographia Systematica Orthopterorum Saltatoriorum包含了1750—2000年与分类有关的系统学、分类学、同物异名、命名等文献,共计14 000 条记录。目前,世界直翅目昆虫分类研究常用的在线数据库Orthoptera Species File,共收录14 878 条文献记录[1]。

文献计量学是基于文献本身信息,采用数学、统计学等计量方法客观地分析研究文献信息的分布、结构、数量关系等,进而探讨科学技术的某些结构、特征和规律的一门集数学、统计学、文献学于一体的学科[3]。洛特卡定律和布拉德福定律是文献计量学常用的两个定律。

洛特卡定律揭示了在一个成熟的研究领域,研究者的数量与论文数量存在一定的关系,即写过1 篇论文的作者人数刚超过该领域全部作者人数的60%,写2 篇论文的作者人数大约是1 篇的1/4,写3 篇论文的作者人数大约是1 篇的1/9,写4 篇论文的作者人数大约是1 篇的1/16,……写过x篇论文的作者人数大约是写了1 篇论文科学家人数的1/x2[4]。后来学者又提出了广义的洛特卡定律,公式

式中,x为论文数;y为相应的作者百分比;n为频率(表示高产作者对本领域的贡献大小);c为学科特征常数[5],反映某学科科学工作者构成的主要指标,该c值越大,表明作者的分布越平均,高产作者的贡献越小,低产作者的贡献越大[5-7]。通常人们先用最小二乘洛特卡参数法拟合计算n,然后用帕欧公式估计c值[8]。周爱民[8]研究认为,帕欧提出的近似估计法较为复杂,且参数估计不科学,在帕欧估计结果的基础上提出了非线性回归模型,该方法利用非线性回归模型对论文数(x)及作者百分比(y)进行一元非线性回归在约束条件下估计参数n值,然后利用帕欧公式估计参数c。对于c值,莫晓霞[9]在用最小二乘法计算出n之后,根据所有作者的和得到参数c值,公式

鉴于广义的洛特卡模型计算烦琐及高产作者的确定模糊,张海燕[10]又提出了乘幂拟合法,该方法在删除高产作者后根据论文数(x)和作者百分比(y)拟合乘幂方程确定n值和c值。对于化学和物理来说,洛特卡经典公式中n=2 可能是合理的,此时c≈0.607 9。当n与2 接近时,表明该领域的高产作者对本领域的贡献大,同时该学科发展成熟度越高;n大于2,说明高产作者少,多数学者研究处于起步状态,没有进行深层次或者更持续性的研究,也反映出该领域的核心作者群尚未稳定[11]。而对于其他学科未必如此,n的取值在1.2~3.5,最大可达4.8[12]。

在洛特卡定律的基础上,普赖斯定律用于确定高产核心作者,即在同一研究领域,半数的研究学术文献为一群高生产能力作者撰写,这些作者的发文总量约等于该研究领域发文作者总数量的平方根。据此,又进一步推导出核心作者群[13]。把核心作者群中发表论文数量排名较靠前的一些作者作为高产核心作者[14],高产核心作者人数较少,但学术影响力很高,是某学科领域的顶尖人才。

经典布拉德福定律用于定量描述科学论文数量分布在相关期刊中集中与离散的状况[15],即对某一研究领域而言,将来源期刊按其刊载学术文献数量以递减的顺序排列划分为3 个区,即核心区、相关区、外围区,使每个区的论文数量相等,在这些来源期刊中找出对该研究领域最有贡献的核心期刊,以及含有与核心部分文献数量相同的随后几个区域,每个区域里的期刊数量之间的关系为:n1∶n2∶n3=1∶a∶a2…(n为不同区域的期刊总数,a为布拉德福常数,约等于5)[16-19]。李江等[20]研究认为,如果统计中各分类号下第二区的期刊数在严格数值上下浮动25%以内,则可以认为该领域的期刊分布符合布拉德福的经验定律。

为了更好地探究直翅目昆虫分类研究领域的发展历程,了解该领域的发展规律和研究热点,本研究运用洛特卡定律、普赖斯定律、布拉德福定律等文献计量学方法,对1750—2019年直翅目昆虫分类研究文献从年度文献量分布、作者发文量和来源期刊载文量3 个方面进行了定量分析。

1 数据来源及方法

本研究将Bibliographia Systematica Orthopterorum Saltatoriorum收录的1750—2000年文献条目和Orthoptera Species File 收录的2001—2019年的文献条目逐条录入EndNote 建立直翅目昆虫分类文献数据库。通过EndNote 的“References”菜单下的“Find Duplicates”查找重复的文献条目,并删除题目、作者、发表年份、期刊名等不完善的文献,共得到17 884 条文献条目。利用EndNote 统计功能和R 语言进行文献计量学分析。

1.1 年度文献量统计

为直观地反映该研究领域发展的动态变化及研究的规模,本研究计算了年度发文量和累积率。在EndNote 中根据年份(Year)进行统计,将结果导入Excel,计算年度发文量。文献累积率是当年发表文献量与上一年度文献累积数的比例,计算公式

式中,B为文献累积率;ai为当年发表文献量。文献累积率在一定时间内的波动情况可判断出该研究领域发展是否稳定[21]。

1.2 作者发文量

论文产量是科学工作者创造劳动的指标,高产作者和核心作者是某一研究领域的主力军,对研究的发展起到了很大的推动作用,从作者发文情况可以看出某领域中研究者的成熟程度[22]。本研究在不考虑作者署名中的先后顺序前提下,以作者出现的总频次作为发文量,进而计算直翅目昆虫分类学研究的核心作者群和高产核心作者。为了得到准确的n值和c值,首先根据维拉奇标准,删除高产作者,然后,分别计算最小二乘法模型(简称最小二乘)和非线性回归模型(简称非线性)的n 值,再将两种n值分别代入帕欧公式(简称帕欧)和作者求和法(简称全和)计算出的c值,同时又进行了乘幂拟合法估算参数(简称乘幂拟合)。上述5 种方法计算的n值和c值代入广义洛特卡公式,根据参考文献[23]的K-S 检验(柯尔莫可洛夫-斯米洛夫检验,Kolmogorov-Smirnov test)步骤,计算实际作者的累积概率与理论作者的累积概率差值绝对值的最大值Dmax及K-S 临界值,计算公式为

式中,z为作者数,然后进行K-S 一致性检验;当显著性水平a=0.01 时,如果Dmax小于D0,则实际分布符合洛特卡定律,否则不符合。

核心作者群数学公式为

式中,m为核心作者发表的论文篇数;nmax为统计时间内发文最多的作者发表的论文篇数。核心作者为那些发文量≥m篇的作者[13]。

把核心作者群中发表论文数量排名较靠前的一些作者作为高产核心作者,根据普赖斯定律的公式为

式中,N为核心作者人数;nmax为统计时间内发文最多的作者发表的论文篇数;R取整数。

1.3 来源期刊分布

利用EndNote 对直翅目昆虫文献库按期刊名(Publisher 和Secondary Title)进行筛选,共获得16 544 篇文献的3 162 种期刊。为准确获得期刊分布的核心期刊区和布拉德福系数,除经典布拉德福定律外,本研究又采用如下两种方法:

(1)期刊数量计算法[24]:埃格的公式

式中,P为核心期刊数量;E为欧拉系数=0.577 2;Y为最大载文量期刊的载文量。

式中,n为布拉德福系数;R为分区数目3;Y为最大载文量期刊的载文量;E为欧拉系数E=0.577 2。

(2)知识密度梯度graduR(n)法:根据论文变化量dR(n)和期刊变化量dn计算知识密度梯度场,并作图。在知识密度梯度场中一般集中区文献分布呈间断性变化,而离散区文献分布呈连续性变化[25]。

2 结果与分析

2.1 年度文献量分布情况

由图1 和图2 可知,总体来看,近270年直翅目昆虫分类学研究呈现逐步加强、研究成果数量逐步增多的趋势。其发展历程可分为4 个时期:

图1 1750—2019年直翅目昆虫分类学研究论文数量动态

萌芽期(1750—1778年):研究处于开始发展时期,研究文献量的基数小,平均每年仅1 篇,甚至出现连续几年没有文章发表的情况,如1750—1753年和1768—1770年。由图2 可知,累积率的波动较大,文献累积率可达到100%,平均累积率约为14.67%,特别是在1750—1766年,波动幅度达最大,直翅目昆虫分类学研究文献数量处于不稳定的增长,但文献量仍随年份积累,表明直翅目昆虫分类学研究已经开始得到关注。

图2 1750—2019年直翅目昆虫分类学研究文献累积率变化

发展起步期(1779—1829年):这个时期的年度文献增量较萌芽期增幅不大,平均每年仅有2 篇。文献累积率波动较萌芽期明显减少,最大值为10.00%,最小值为0,平均值约为3.03%,表明直翅目昆虫分类学研究经历了萌芽期的文献积累,其发展已逐渐步入正轨。

缓慢发展期(1830—1947年):这个时期年度发文量增长缓慢,平均为40.67 篇,在1910—1920年和1940—1947年出现了两个低谷期,1929年的发文量最高,为133.00 篇,与1 830年的5.00 篇相比增长了26.60 倍。文献累积率的波动范围较起步期减少,最大值为7.94%,最小值为0.97%,平均值为3.17%。

快速发展期(1948—2019年):增长速度随着年份增长越来越大(图1),呈“情报爆炸”态势。发文量最大的是2000年的317.00 篇、1990年的315.00 篇。文献累积率变化逐步趋于稳定,在1.07%~2.87%,平均值约为1.80%。这说明随着直翅目昆虫分类学研究文献年产量越来越稳定,研究技术和方法越来越成熟,其发展态势越来越平稳。

2.2 发文作者分布情况

2.2.1 作者发文量分析 共有7 473 位作者参与发表直翅目昆虫分类学研究文章,根据维拉奇标准计算出有90 位高产作者在删减范围内,这些作者最低发文量为43 篇,因此,在拟合洛特卡公式时仅保留43 篇以下的作者,最后共有7 383 位作者进行后续分析。

由表1 可知,由5 种方法计算的n值和c值与经典的洛特卡公式n值、c值接近,但均小于生物学的n值(2.456 61)和c值(0.735 91)[26]。K-S 检验中,Dmax超过了D0=0.019 005 97,未能通过K-S 检验,说明直翅目昆虫分类学的研究中作者分布不均匀,高产作者对本领域的研究贡献较大。未通过K-S 检验的主要原因有:(1)本研究的直翅目昆虫分类学研究时间跨度大(近270年),选取的样本容量较大,拟合出来的分布模型虽具有描述性和代表性,但也增加了通过K-S 检验的难度[27-28];(2)作者数量越大,临界值越小,检验精度可能较高,不容易通过K-S 检验[28]。

表1 基于5 种拟合方法计算出的作者的理论概率

2.2.2 核心作者群分析 由表2 可知,将nmax=581 代入普赖斯定律的核心作者公式,计算得出m≈18.05,表明在直翅目昆虫分类学研究领域中,发文量在18 篇及以上的作者为该领域的核心作者。发文量≥18 篇的作者有281 人,约占作者总数的3.76%,发文总量为13 311 篇,约占全部文献总数的74.43%,远大于普赖斯定律关于核心作者的发文量应占全部作者发文量50%的规定,说明直翅目昆虫分类学研究已经形成核心作者群。

2.2.3 高产核心作者分析 将N=281、nmax=581 代入普赖斯定律的高产核心作者公式,得到R≈9.47,说明排名前10 的作者为该领域的高产核心作者。高产核心作者有10 人,约占全部核心作者的3.56%。由图3 可知,发文量最多的高产核心作者是我国昆虫学家郑哲民(ZHENG Zhemin),其发文量远超于其他高产核心作者,为581 篇,发文主要集中在1964—2017年。其他高产核心作者按照从多到少的顺序依次为:GOROCHOV Andrey V(1978—2019年328 篇)>UVAROV Boris Petrovitch(1910—1977年299 篇)>KEVAN D Keith McE(1942—1999年281 篇)>REHN James A G(1900—1964年277 篇)>CHOPARD Lucien(1911—1970年237 篇)>SHI Fuming(1994—2019年192 篇)>HEBARD Morgan(1905—1945年145 篇)>INGRISCH Sigfrid(1973—2019年138 篇)>BOLIVAR Ignacio(1873—1942年136 篇)。10 位高产核心作者中,2 位作者(HEBARD Morgan 和BOLIVAR Ignacio)处于直翅目昆虫分类学研究缓慢发展期,4 位作者(UVAROV Boris Petrovitch、KEVAN D Keith McE、REHN James A G和CHOPARD Lucien)处于昆虫分类学研究缓慢发展期与快速发展期过渡阶段,4 位作者(ZHENG Zhemin、GOROCHOV Andrey V、SHI Fuming 和INGRISCH Sigfrid)处于昆虫分类学研究快速发展期。

图3 高产核心作者发文量情况

2.3 来源期刊分布情况

按照经典的布拉德福定律将所有期刊按照其载文量降序,均分为3 份,核心区的期刊有41 种,共5 830 篇文献;相关区有264 种期刊,共5 776 篇文献;外围区2 858 种期刊,共5 707 篇文献。3 个区的期刊数之比为41∶264∶2858≈1.00∶6.44∶69.70,第二区在严格数值(8.342)的基础上下浮了29.5%,表明直翅目昆虫分类学研究不符合布拉德福定律。同时,尽管根据经典布拉德福定律得出的结果,直翅目昆虫分类学研究的文献数量从核心区到外围区依次递减,形成了一定的“集中—分散”的分布趋势,但一些核心区期刊与相关区期刊发文量并无明显区别(表2),例如Metaleptea和Proceedings of the Entomological Society of Washington发文量分别为57 篇和56 篇。

表2 基于经典布拉德福定律获得的核心区期刊

由数量计算法得到核心区期刊数14.17492≈14 种,布拉德福系数为10.617 31≈10.6。由表3 可知,知识密度梯度的最大值为422,最小值为1,知识密度梯度dR(n)/dn随着期刊累积数n的增大而减少。在n=14,dR(n)/dn=139 处呈现明显的间断(图4),说明n从1~14 形成了明显的“场强”中心。综上可见,两种方法得到的核心期刊数均为14 种(表3),其中,Zootaxa载文量最多,为672,约占文献总量的3.76%;依次是Journal of Orthoptera Research,其载文量为422,约占文献总量的2.36%;载文量排第三的是Bulletin de la SociétéEntomologique de France,其载文量为365,约占文献总量的2.04%。

图4 直翅目昆虫分类学研究知识场知识密度梯度分布

表3 直翅目昆虫分类学研究知识场知识密度梯度分布

3 结论与讨论

3.1 结论

本研究以Bibliographia Systematica Orthopterorum Saltatoriorum和Orthoptera Species File 网站收录的直翅目昆虫分类学研究文献条目作为数据来源,时间跨度为1750—2019年,整理出17 884 篇直翅目昆虫分类学研究文献,从作者发文量、年度文献量分布、期刊载文量3 个方面进行统计分析,得出以下结论:

一是,直翅目昆虫分类学研究经历了4 个发展时期:1750—1778年为萌芽期,文献量处于不稳定增长;1779—1829年为起步发展期,研究开始步入正轨;1830—1947年为缓慢发展期;1948—2019年为快速发展期,研究成果呈“情报爆炸”式涌出。

二是,从作者发文量来看,直翅目昆虫分类学研究者分布不均匀,但已形成稳定的核心研究群体,核心作者人数为281 人,高产核心作者数量比较少,仅有10 人,发文量最多的是我国昆虫学家郑哲民(ZHENG Zheming)。

三是,从来源期刊来看,直翅目昆虫分类学研究已形成了由Zootaxa,Journal of Orthoptera Research,Bulletin de la SociétéEntomologique de France,Articulata,Entomological News等14 种期刊组成的核心期刊群,发文量最多的是Zootaxa,为672 篇。

3.2 讨论

分类学历来属于相对冷门的研究领域,其工作包括存疑种的研究、新种的发现与描述、隐存种的甄别、重要类群的修订、系统发育关系的探讨等,其产出成果往往需要学者投入更长的时间和精力[29],这也决定分类学文章的老化速度较慢,即使百年的文献仍有其参考意义。分类学中物种的描述往往会出现重复交叉,即同一个物种以不同书写方式、不同的描述习惯、不同的文字造成内容的重复,尤其是广泛分布物种。同时,分类学作为一门古老的学科,早期文献主要用法、德、拉丁、西班牙、意大利等国文字发表,且多种语言的发表不利于研究者之间信息的交流。如KARNY 等[30]发表的蟋螽类昆虫重要专著是以德文书写,给非德语为母语的分类学工作者快速、准确获得物种描述的信息鉴定物种带来了困难。随着全球化进程的加快,快速发展期英文文章的比例越来越高,促进了科学信息的交流。如俄国学者GOROCHOV Andrey V 部分重要文献以俄文发表[31-41],但Entomological Review 刊载了相关论文的英文极大地促进了其他分类学者对该领域的研究。

我国直翅目昆虫分类学研究处于快速发展阶段,发文量逐年增加,特别是物种的描述及发表由原来的绘图逐渐被高清晰的数码图片及3D 模型代替,加大了年发文量。但我国直翅目昆虫分类学研究基本处于a 分类水平,以新种的发表为主,缺乏系统性的修订工作。同时,直翅目昆虫部分类群的采集难度大,馆藏标本数量少,研究不透彻,且目前研究主要集中在生物多样性的热点地区,如云南、贵州、四川、广西、海南等。

(续)表3

在实际考证中,根据经典布拉德福定律计算出相邻区域之间的期刊数量比例不是一个常数[42]。本研究比较了3 种不同计算核心区期刊的方法,也说明像生物的其他领域(如生物技术学科和生物工程类领域的研究)一样相邻区域之间的期刊数量比例不是一个固定值。直翅目昆虫分类学研究文章的期刊分布也呈现了自然科学文献本身共有的特点:离散性与集中性[43],主要集中在昆虫分类或动物分类相关的期刊上。Zootaxa是发表分类学文章的专业期刊,由于其免费、审稿周期短、发表快,受到直翅目昆虫分类学者的青睐。近年来,随着学科之间交叉日益加深,研究内容越来越趋向于多种证据、多学科知识的交叉,研究成果的发表也逐渐在系统学、生物多样性、生物进化等多种学科的专业期刊上发表。

本研究仅利用题录从发文量、作者及期刊分布进行文献计量学分析,且部分文献的作者、年份、期刊等信息未列入统计范围,并由于文献计量本身存在的不足,不能完全反映该学科领域的发展全貌。未来可加入研究内容分析(如关键词分析),以期通过相关内容的分析了解直翅目昆虫分类学研究历程,为我国直翅目昆虫分类学的研究提供参考依据。

猜你喜欢

发文昆虫期刊
期刊简介
七部门联合发文 进一步完善和落实积极生育支持措施
《防爆电机》期刊
期刊审稿进度表
校园拾趣
爷孙趣事
以牙还牙
有趣的无脊椎动物
昆虫产卵跟鸡生蛋一样吗?
Smallest Flying Robot 会飞的机器昆虫