APP下载

中国知网居前1‰高被引论文的学科阈值

2015-12-14丁福虎

现代情报 2015年10期
关键词:权重阈值论文

〔摘要〕寻找各学科居前1‰高被引论文的阈值,是评估科研绩效的标尺。利用中国知网检索了94个学科领域的居前1‰高被引论文,对被引用阈值和权重进行排序,发现各学科领域的阈值严重不均衡,最高值和最低值之间相差55倍,平均阈值为101。各学科阈值的高低取决于以下因素:文献总量多的学科领域高于文献总量少的学科领域;哲学与人文社会科学同一学科内基础理论领域高于其他领域等。

〔关键词〕1‰高被引论文;热点论文;学科阈值;中国知网;中图分类;绩效评估

DOI:10.3969/j.issn.1008-0821.2015.10.023

〔中图分类号〕G2502〔文献标识码〕A〔文章编号〕1008-0821(2015)10-0124-04

Subject Threshold Value of Top 1‰ Highly Cited Papers in CnkiDing Fuhu

(Henan Institute of Science and Technology,Huixian 453600,China)

〔Abstract〕Look for the threshold values of top 1‰ highly cited papers of various subjects,which is a ruler to assess the scientific research performance.Use Cnki to search the top 1‰ highly cited papers of 94 subjects,sort the cited threshold value and weights,find that the treshold values of various subject are seriously unbalanced,the difference between the highest value and the lowest value is 55 times,the average threshold value is 101.Whether the threshold value is high or low depends on the following factors:the subject area which has a large amount of documents is higher than the subject field which has a small amount of documents;the basic theory field in the same subject of philosophy and humanities and social sciences is higher than other fields and so on.

〔Key words〕1‰ highly cited papers;hot paper;subject treshold value;Cnki;CLC;performance evaluation

科研绩效评估时如何考虑不同学科之间的差异,一直是科技评价中的一个难点。早期的绩效评价主要是采用定性和定量相结合的方法,比如专家加权法、兑换计量法和文献计量法等[1]。然而由于受专家因素的影响,引文评价的客观性价值尺度在基础研究领域逐渐被重视起来,从而带动了文献计量评价的发展和应用[2]。但是由于学科之间引文数量的不均衡性,单一的评价指标就很容易出现偏差。比如薛天祥等就认为同质性(相同学科间)是可比性的前提[3],因而寻找不同学科之间的权重系数就成了一个关键点。学术界认为,高被引论文是学术创新的风向标,也是各个学科进行评价的一个重要参照指标。而一个学科的居前1‰高被引论文则代表了一个学科的学术贡献和影响力。汤森路透基于Web of Science?(SCIE/SSCI)所收录的全球11 000多种学术期刊的1 000多万条文献记录而建立的计量分析数据库,于2001年推出的基本科学指标数据库(ESI),分别排出居世界前1%的研究机构、科学家、研究论文和居前1‰的热点论文,目前已成为世界科学界用以评价高校、学术机构、国家与地区国际学术水平及影响力的重要评价指标工具之一。近年来,以美国ESI等数据库为研究载体,基于计量学的理论,开始了在科研成果、科技人才、科技期刊、科研机构、学科评价和大学科研竞争力等方面产生了一批研究文献[4-5]。在国内,以中国知网(CNKI)和中文社会科学引文数据库(CSSCI)等数据库为工具,产生了一批高被引论文的研究文献。但是,利用国内数据库进行宏观的,具有学科比较意义的高被引论文指标体系研究还缺少进展。而进行高被引论文学科阈值的比较研究,对于不同学科之间的绩效比较就具有了广泛的意义。

1研究方法

由于各学科发展程度和引文方式的差异,导致了论文被引用次数在各个学科之间缺少可比性。但是,在综合性大学、综合性科研机构内部,以及政府部门组织的各类项目评估当中,有时候不同学科之间、不同领域之间也需要进行择优比较。否则,评优工作就缺少客观性和可比性的一个参数。为了寻找一个相对公平的尺度,先假设在一个学科内部,被引用次数相同的文献,其学术影响力和学术贡献是大致相等的。中国知网收录了国内正式出版的7 000多种自然科学和社会科学学术期刊发表的文献,各个学科分支收录的文献从数千条到上百万条不等,对这些数据进行云计算既繁琐又未必科学[6]。但进入各个学科领域的前1‰高被引论文的被引用次数的阈值,在各个学科内部的文献当中具有一定的稳定性和高影响力意义,属于一种散布在群峰中的学术水平“雪线”。因此在不同的学科之间具有一定的参考性和可比性。基于这个考虑,本文选取中国知网(CNKI)的“中国学术期刊网络出版总库”作为检索数据库,为了拥有较大范围的文献量,检索的开始时间不受限制,检索截止时间到2015年3月,以中图分类号检索方式,除军事学科之外,对各大学科门类的代表性学科或领域进行抽样检索,共检索了94个学科的居前1‰高被引论文的收录情况。endprint

2015年10月第35卷第10期现?代?情?报Journal of Modern InformationOct,2015Vol35No102015年10月第35卷第10期中国知网居前1‰高被引论文的学科阈值Oct,2015Vol35No102居前1‰高被引论文的学科阈值与权重系数

根据94个学科居前1‰高被引论文的阈值,计算出94个学科的平均阈值为101。之后按照各学科文献阈值从高到低进行排序,并计算出各个学科的阈值权重(见表1)。居前1‰高被引论文最高阈值的学科为语言学,文献被引用330次;最低阈值的学科为诗歌、韵文,为第69位,文献被引用仅有6次,两者之间相差55倍。与上一年度相比较,学科平均阈值上升了83个百分点。在94个学科中,排序未发生变化的学科有52个,占553%;排序发生变化的学科有42个,占447%。其中位序变化在3个位序之内的有36个,占全部学科的383%;位序变化在4~7个位序之内的有6个,占全部学科的64%。表194个学科领域居前1‰高被引论文被引用阈值与权重排序情况

序号代码学科领域文献总数前1‰

阈值阈值权重1H0语言学106 577330030612X2社会与环境27 863274036863P9自然地理学14 423252040084P5地质学90 558227044495F0经济学123 753224045096D0政治理论59 695217046547B84心理学138 120199050758O22运筹学25 540187054019F30农业经济理论117 5801760573910S3农学44 3261710590611P4气象学120 0221660608412Q93微生物学29 8831650612113H19汉语教学64 4101600631314TU3建筑科学131 4671560647415P7海洋学72 2991480682415C91社会学241 8471480682416S7林业260 2451420711317Q7分子生物学49 7651410716318R28中药学432 3681350748119F82货币91 8451330759420F23会计313 2121290782921O63高分子化学46 5631230821121O34固体力学23 4771230821122Q81生物工程学17 1431190848723I0文学理论56 6951170863224R18流行病与防疫122 6461130893824O24计算数学34 1151130893825Q96昆虫学18 9331120901826F40工业经济理论72 3381110909927B82伦理学50 8081100918228O61无机化学49 0771090926629D92中国法律892 7201060952829V2航空164 2401060952830H12文字学35 0321040971231F31世界农业经济21 3661020990232Q98人类学7 2821011000033O65分析化学116 612991020233S6园艺495 307991020234G35情报学42 651981030634Q4生理学150 476981030635O62有机化学80 168971041236R25中医内科227 336961052137B0哲学理论45 624941074538TE石油、天然气229 484931086038H13训诂学125 536931086039S2农业工程426 282921097839R9药学317 755921097839TD矿业工程291 3949210978表1(续)

序号代码学科领域文献总数前1‰

阈值阈值权重40R71妇产科学279 510901122240N94系统科学112 856901122241O7晶体学18 707871160942G25图书馆学316 876861174442TV水利工程297 824861174442O48固体物理学31 908861174443O31理论力学11 576841202444D5世界政治58 380801262545TU1建筑基础科学35 158781294945K1世界史42 397781294945Q2细胞生物学77 313781294945K0史学理论24 115781294945O41理论物理学29 847781294945G31科学研究工作28 551781294945D63国家行政管理460 331781294946TN92无线通信204 990761328947O43光学42 899751346747X9安全科学112 008751346748TS轻工业、手工业801 814741364949C95民族学15 659691463850U2铁路运输287 583661530351B83美学18 132651553852K9地理103 968641578152C96人才学42 841641578152I1世界文学43 599641578153TF冶金工业128 740631603254D62政治制度与国家机构161 964621629055R77眼科学140 425611655756R78口腔科学146 483581741456U6水路运输157 226581741456S9水产、渔业447 472581741457O18几何、拓扑18 453531905758O17数学分析111 150511980459B2中国哲学81 719472148960J0艺术理论27 857452244461B26现代哲学8 423422404861TL原子能技术51 097422404862B9宗教99 412382657962K23封建社会史26 590382657963J9电影、电视艺术187 681362805664O51低温物理学3 840342970665J5工艺美术148 430303366766J4摄影艺术104 974244208367A马克思主义、列宁endprint

主义、毛泽东思想、

邓小平理论441 379224590968I25报告文学17 473812625069I22诗歌、韵文252 0896168333394个学科阈值分析

31居前1‰高被引论文阈值在各学科内部的分化呈现严重不均衡现象许多学者认为,不同的学科由于引文特征差异过大,基于文献被引次数的各种评价指标体系也就仅适用于同一学科之内[7-8]。H指数的发明者赫希也认为,生物学家的h指数都偏高,表明h指数就像其他指标一样,不同学科之间的差异很大[9]。数据显示,居前1‰高被引论文的阈值不仅在各个学科门类之间存在着较大差异,就连同一学科领域之间也存在着较大差异。如文学领域,文学理论、文字学分别为117次和104次,而报告文学和诗歌、韵文领域分别仅有8次和6次。在数学领域,运筹学和计算数学的阈值分别为187次和113次,而几何拓扑、数学分析领域仅有53次和51次。在农学领域,农学和林学的阈值分别为171次和142次,而园艺、水产渔业学科领域分别仅有99次和58次。

32在学科相近的领域中,文献总量多的学科分支阈值高于文献总量少的学科分支在物理学内,固体物理学、低温物理学的文献总量分别为31 908条和3 840条,两者的文献比率为1∶012;而两者的阈值分别为86次和34次,比率为1∶04。微生物学、昆虫学的文献总量分别为29 883条和18 933条,两者的文献比率为1∶063;而两者的阈值分别为165次和112次,比率为1∶062。心理学、伦理学和美学的文献总量分别为138 120条、50 808条和18 132条,三者的文献比率为1∶036∶013;而三者的阈值分别为199次、110次和65次,比率为1∶059∶033。文献总量多的学科意味着该学科的科学家总人数多,其阈值也就可能相应被提高。

33在哲学与人文社会科学门类中,同一学科的基础理论领域的阈值高于其他领域在哲学学科内,哲学理论的阈值为94次,而美学、中国哲学和现代哲学的阈值分别为65次、47次和42次。在政治学学科内,政治理论领域的阈值为217次,而世界政治、政治制度与国家机构领域的阈值分别为80次和62次。在艺术学学科内,艺术理论的阈值为45次,而电影和电视艺术、工艺美术、摄影艺术的阈值分别为36次、30次和24次。基础理论科学是一个学科的框架和支撑点,在高被引文献中也得到了充分的体现。

34理学和农学阈值最高,文学和史学阈值最低

将94个学科阈值划分为高位区(>151)、较高区(101~150)、中位区(71~100)、较低区(51~70)和低位区(<50)5个区域,结果发现在高位区和较高区中,理学和农学均排在前两位,分别占高位区、较高区总量的693%和444%。而在低位区中,文学和史学排在前两位,分别占低位区总量的462%和231%。这与刘则渊等人的研究相接近[10]。这种分布态势可能与学科性质、研究方法和著作权观念等方面的差异有关联,有待后续深入研究。

4总结与展望

文献的被引用次数反映了该文献的影响力和学术贡献。学科之间文献的被引用次数,不仅在各个学科门类之间存在着较大差异,在同一学科门类之间这种差异同样存在。而各学科居前1‰高被引论文的阈值权重系数,对于解决学科内外的差异性评价具有重要参考作用。

基于文献被引用次数的评价指标体系,比如各学科文献在被引用次数、影响因子、H指数等指标的评价上,均可用各学科居前1‰高被引论文的阈值权重系数加以修正。可适用于学科评估、课题评价、人才选拔和学术奖励等方面的绩效评估。比如,一位经济学学者的H指数为10,乘以经济学的权重系数04509,则修正后的H指数为45;而一位情报学学者的H指数为6,乘以情报学的权重系数10306,则修正后的H指数为62。如果单纯比较H指数,则经济学学者绩效在前;如果乘以各自学科的权重系数,那么毫无疑问情报学学者的绩效是靠前的。

随着国内学术界与国际科学文献评价标准的不断接近,各学科居前1‰高被引论文的阈值权重也会随着时间的变化而变化,这就需要学科评价工作人员做出相应的调整。比如,2014年的学科平均阈值,就比2013年上升了83个百分点,其中近一半的学科阈值系数在位序上发生一些细微变化。

参考文献

[1]丁福虎.科研绩效评估的理论与方法[J].科技管理研究,2000,20(3):45-48.

[2]丁福虎.引文评价及其应用[J].情报科学,2003,21(8):835-837.

[3]薛天祥,杨运鑫,李健宁.以学科评价为基础的研究型大学综合实力评价的思考[J].中国高等教育评估,2002,(1):19-23.

[4]周海花,华薇娜.从世界顶级计量学期刊看信息计量学和科学计量学的现状及发展——Journal of Informetrics和Scientometrics发文分析[J].现代情报,2014,34(2):115-120.

[5]刘月雷,聂风英.基于ESI数据库的地球科学领域文献计量分析研究[J].现代情报,2015,35(6):81-85.

[6] 姜茸,马自飞,李彤,等.云计算安全风险因素挖掘及应当策略[J].现代情报,2015,35(1):85-90.

[7]丁福虎,张水潮.利用CNKI和H指数评价大学科研绩效[J].科技管理研究,2010,(13):97-100.

[8]金贞燕,金文姬,赵丹群.世界著名大学及学科h指数与传统文献计量指标的比较[J].图书情报工作,2012,(7):21-29.

[9]Hirsch J E.An index to quantify an individuals scientific research output[J].Proceedings of the National Academy of Sciences of the United States of America,2005,102(46):16569-16572.

[10]钟镇,刘则渊.博士学位论文的学科差异研究——以大连理工大学为例[J].中国高教研究,2011,(5):35-38.

(本文责任编辑:马卓)endprint

猜你喜欢

权重阈值论文
权重常思“浮名轻”
小波阈值去噪在深小孔钻削声发射信号处理中的应用
基于自适应阈值和连通域的隧道裂缝提取
为党督政勤履职 代民行权重担当
比值遥感蚀变信息提取及阈值确定(插图)
基于公约式权重的截短线性分组码盲识别方法
室内表面平均氡析出率阈值探讨
下期论文摘要预登
下期论文摘要预登
下期论文摘要预登