APP下载

大数据对人文社科成果评价的价值研究*

2016-11-22蒋玲施立红苗林

新世纪图书馆 2016年3期
关键词:社科科研成果社会科学

蒋玲 施立红 苗林

大数据对人文社科成果评价的价值研究*

蒋玲 施立红 苗林

论文提出了大数据评价方法所带来的转变以及可能产生的贡献,认为这种评价方法将作为目前经验性评价方法的补充,可以得出更准确的评价结果。然而大数据虽然为人文社科学术评价的转变提供了新的机遇,也不能盲目地完全信任新的评价方法,应理性并扎实地推进评价改革。

大数据人文社会科学科研成果

DOI 10.16810/j.cnki.1672-514X.2016.03.022

互联网、现代通讯、社交网络和电子商务将我们带入了大数据时代。大数据被定义为以PB(1024TB)为单位的非结构和无序性的数据信息,虽然极为庞大,但云计算可迅速地分析目标并得到相对准确的结果。大数据及云计算这两样工具使得更多的真相得以在庞大的信息中被加以揭示,而且与以往的因果关系分析与研究不同,大数据中是从相关关系的角度进行分析挖掘,从而帮助人们做出决策。

相比自然科学研究成果,人文社会科学表现出一定的广泛性、复杂性、历史性、社会性和相对性。当今,人文社会科学科研成果的评价方法主要建立在因果关系的评价方法上,如专家评价方法、期刊级别评价方法、代表性成果评价方法和绩效评价方法等,这些方法在很大程度上反映了科研成果的价值[1]。但是,科研成果所预期的社会效益、专业研究影响力、与研究热点的紧密程度、研究人员及社会的关注程度等信息则很难使用该方法进行评价。笔者从大数据分析方法中得到启发,尝试提出利用相关关系的角度评价科研成果,挖掘出大数据对于人文社科科研成果评价的价值。

1 大数据理念对人文社科成果评价的启发

1.1 大数据内涵

大数据就是囊括了包括各方面信息的一个庞大的数据总和,其最核心的价值在于对海量数据进行存储和分析,并实现预测某一事物发展的趋向。相比起现有的其他技术而言,大数据的廉价、迅速、优化这三方面的综合成本是最低的。大数据最重要的是如何使用,最大的挑战在于哪些领域能更好地使用数据及大数据的应用情况如何。

1.2 引用大数据评价的契机

有研究人员对人文社会科学研究成果进行了分析,“可以确认人文社会科学学者的研究产出具有一些不同于自然科学者的特性,足以支持人文社会科学学者研究产出的学术评鉴不宜与自然科学采用同一标准。”人文社会科学学者成果种类呈多元化,包括非学术性的图书、杂志、报纸等多元化的出版品型态。如要完整地将社会科学学者所有有影响力的研究成果涵盖在评价范围内,包括转载、引用或延伸出的观点等有影响的方面,点对点评价难以支撑所有的信息,但大数据评价却可以做到这一点[2]。

2 大数据理念对人文社科成果评价的转变

2.1 从随机样本到全体数据

在信息处理能力受限的时代,世界需要数据分析,却缺少用来分析所收集到数据的工具,因此随机采样应运而生。统计学的一个目的就是尽可能使用少的样本数据反映或证实大群体的事实。随机样本是非常成功的统计方法,当我们沉溺于随机抽样方法的使用和避免主观偏见的时候,大数据时代的到来已经使得获取全体样本数据的可能不再是妄想了[3]。如今,计算和制表不再像过去一样困难。感应器、手机导航、网站点击被动地收集了大量数据,而计算机可以轻易地对这些数据进行处理。

人文社会科学科研成果的评价属于社会科学的范畴,社会科学大部分工作在于通过样本分析、研究和调查问卷分析实证数据。大数据记录下了人们的平常状态,对全体数据的分析避免了调查问卷时可能出现以偏概全的影响;大数据收集到了过去无法收集到的信息,跳出了对抽样调查的完全依赖。在很多领域,从收集部分数据到收集尽可能多的数据的转变已经发生了[4]。如果可能的话,我们会收集所有的数据,即“样本=总体”。

2.2 从精确性到混杂性

当我们掌握有限的数据时,我们务必要确定每条数据的精确性,以保证分析结果的准确,因为收集信息的有限意味着细微的错误会被放大,甚至有可能影响整个结果,同时在保证数据的精确性上要下足功夫。然而,在不断涌现的新情况里,允许不精确的出现已经成为一个新的亮点,而非缺点。因为放松了容错的标准,人们掌握的数据也多了起来,还可以利用这些数据做更多的事情。这样就不是大量数据优于少量数据那么简单了,而是大量数据创造了更好的结果。如果掌握了相关的大量或全部数据,就可以从繁杂的大信息量中获益,并允许错误的信息存在,而不是以高昂的代价来避免不确定性[5]。

从大数据的完整和混杂的信息中得出的客观结果,可以预期人文社会科学科研成果效益和价值,突破点对点式的结论,从更广阔的维度层面进行评价。大数据要求我们接受混杂性和不确定性,从中获得真相的全貌。要想获得大规模数据带来的好处,混杂应该是一种标准途径,而不应是竭力避免的。

2.3 从因果关系到相关关系

相关关系一般指某一事物不论是好的还是坏的,只要发生就一定与某些人或者物有关系。包括任何不确定因素成分的存在都和相关关系有直接或者间接的联系。从科研上来说,相关关系是可以让我们更快地发现指向因果关系的风向标,同时更快速地排除不必要的行为,以加快研究进度,特别在研究复杂系统时,使用大数据进行研究的方法效率很高。

鉴于时代的发展速度和社会需求,深入研究相关关系有时候意义甚于研究因果关系。大数据的核心便是在相关关系分析法基础上的预测。如果A和B一起发生,那么B的发生也预示着A的发生,在巨大的信息量中,无数个A和B相关性被发现,那么A的发生也就相应有了大概率的预测办法[6]。虽然利用相关关系的评价有时收到奇效,但大数据的评价方法却无法代替同行评议等主观和因果关系的评价方法,主观和客观的合一,因果关系和相关关系的合一,双重评价方法的搭配才可以揭示科研成果价值的真相。

3 大数据对人文社会科学科研成果评价的贡献

国家人文社科评价在理论和实践上还存在着诸多问题,尚未形成公认的人文社会科学评价手段,同时在国际上也没有一套现成的学术评价体系可以直接应用。大数据分析最重要的应用领域之一就是预测性分析,从大数据中挖掘出特点,建立科学的模型,通过模型代入新的数据,从而预测未来的结果,由此大数据评价将可以在科研成果的独创性、社会效益和科学价值方面起到一定的挖掘分析作用[7]。这些方面,是以往人文社会科学科研成果评价所无法触及的,大数据评价将对如今现有的评价体系做出有益的补充,更加真实地反映出科研成果的真正价值。

不同的人文社会科学成果评价内容需要不同的大数据进行分析。对人文社会科学科研成果独创性的评价使用反抄袭系统,它所包含的信息量在10TB以上,这是科研领域使用大数据进行成果评价的成功案例,并随着时间和信息量的累积,大数据也在不断地扩展。对社会效益的评价,可能会使用到更多网络的大数据,如百度网民搜索大数据;对科学价值的评价则会使用到学术论文大数据,包括CNKI或万方数据库[8]。

3.1 人文社会科学科研成果独创性的评价

独创性科研成果是由作者独立完成的,而并非重复已有的科研成果,它与其他研究成果之间具有一定的差异性,科学研究的进展尤其作为人文社会科学中有价值的科研成果多数都具有鲜明的独创性。现今,清华大学已制作出科研论文反抄袭系统软件,供全国各科研单位在期刊论文发表和高校毕业生论文审校时使用,软件大数据库收纳了20世纪80年代以来所有公开发表的论文,在大数据对成果独创性评价的使用过程中,有效降低了科研成果的重复现象。人文社会科学科研成果具有一定的主观性和广泛性,百家争鸣和标新立异才能推动人文社会学向前发展,科研成果的独创性是价值基础,大数据评价成果的独创性可以对同行评议提供参考和补充[9]。

3.2 人文社会科学科研成果社会效益评价

百度海量网民行为数据为基础的数据分享平台——百度指数正在向公众开放,利用检索词可以通过这个大数据分享和搜索平台获得一定时间内的网民整体搜索指数和移动搜索指数,从而进一步判别其科研成果是否与大众所关心的问题有关,并能够预期为大众带来多少社会效益。虽然现在对社会效益的量化还没有很好的办法,但我们已经可以从大数据中得出科研成果与社会效益的相关性结果。

我们以“大数据”检索词为例,输入百度指数中,时间区间选择为一年,可以发现“大数据”的需求分布图谱(见图1),以及相关检索词(见图2)。

在趋势研究的选项中(见图3)可以看出“大数据”检索词被人们关注的程度,从2012年到2014年,大数据被检索的次数呈阶梯式的上涨。

随着大数据研究的发展,越来越多的检索库将公开自己网站的海量数据共享,为人文社会科学科研成果的社会效益预测和评估开辟了新的途径。

3.3 人文社会科学科研成果科学价值评价

科研成果在制造社会效益和价值外,更多的是被同行业或相关行业学者专家借鉴和使用,即产生的科学价值,也称为学术价值。我们可以从众多不同种类的学术文献数据库中下载选择范围内的涵盖论文名称、作者、关键词 、摘要 、发表时间及刊物等信息的大数据,从大数据中分析检索词学术关注程度,相关检索词热点等信息。

学术文献大数据分析可以采用一些软件,如CiteSpace,这是一款可视化文献分析软件,是大数据时代下的产物。它能够显示一个学科或检索词的知识域在一定时期发展的趋势与动向,辅助对科研人员、成果或机构进行评价,形成若干研究前沿领域的演进历程。简单说来,就是找出学术文献中文字(包括作者、杂志、关键词 、被引用词汇等等)的关系,并可视化表示出来(见图4)。

CiteSpace只是大数据分析工具之一,更多的分析软件会将大数据庞大和繁杂的信息通过相关性的方法分析出来,使人文社会科学科研成果的学术价值在大数据分析下得以客观呈现。

4 大数据对人文社科成果评价的不足

评价和了解研究人员的学术研究成果,可以为后续学术质量的提升及规划发展提供参考依据,并以此来激励研究人员进一步提高其学术研究的质量。长期以来,人们在此方面一直是以定性的方法为主,强调同行互评,并辅之以书目等成果计量方式的定量方法,目前定性与同行互评仍位居学术评价的主流地位。同行互评的缺陷在于无法排除评价者的主观影响,评价者本身的学术积累、知识领域和学术观点等都会对被评价者造成一定的影响。计量方式只是对其所发表的出版物进行计量,无法真正计算学术成果所带来的社会影响力。大数据的出现使得这些原本难以解决的难题迎刃而解。大数据主要的功能之一就是预测。人文社会科学科研成果的影响力可能是长时间的,在短时间内无法通过有限的数据真正反映其价值,大数据的预测使其成为可能,并大幅缩减评价时间和评价成本,将控制评价的主观随意性减到最低。

当然,在人文社会科学科研成果中采用大数据评价方法也存在很多障碍。如牵头机构、数据整合、学者意识、推广宣传等,以及改变现有人文社科学术评价的固有理念,使之向大数据转移,也是一大难点。辩证地认识大数据时代评价结论的相对性,是确保评价变革成果的关键。大数据时代评价结论具有相对的正确性,但不能将大数据的评价结论等同于精确结论。因为数据可能是全面的,但人对大数据的掌控力度有限,不可能完全把握。大数据的评价结论也可能出错,因此不能将大数据时代的评价“神化”“万能化”[10]。首先,我们并不能通过大数据预测出创新的成果一定会成为热点。如果过度依赖大数据的结果,科研成果反而会受到分析结果的压制;同时,分析和评价也需要同行专家的经验进行补充。其次,大数据因为信息的过于庞大而允许信息的不准确性,但却无法估算多少信息是不真实的,因而存在着大量的“脏数据”带来的隐患;最后,大数据存在着个人隐私安全的问题,庞大的信息记录着个人兴趣、经历、联系方式等信息,对个人隐私的安全带来威胁。

5 结语

统计学的抽样调查是经典的社会学统计分析方法,但随着大数据时代的到来,人们获得全体数据已经不是不可能的了,因为先进的多核计算机可以在短时间内分析完成庞大而繁杂的数据[11]。所以,我们可以利用大数据分析以前所难以评价的结果。在人文社会学科研成果的评价方法当中,经验性和结果性评价仍为主流,本文尝试提出较为客观性的大数据分析方法评价成果的效益和价值,作为经验性评价的补充,让主观和客观统一,相信会得出更准确的评价结果。大数据虽然为人文社科学术评价的变革提供了新的机遇,我们应好好把握,但也不能盲目地拥抱“大数据时代”,走向“用量化手段代替一切评价”的极端,应警惕这种评价变革可能带来的风险,扎实推进评价改革。

[1]黄慕萱.人文社会科学研究评鉴特性及指标探讨[J].清华大学学报(哲学社会科学版),2010(5):44-49.

[2]高自龙,杨红艳.学术评价:理想与现实之间的优化选择[J].江汉论坛.2011(11):120-129.

[3]阿尔文·托夫勒.第三次浪潮[M].黄明坚,译.北京:中信出版社,2006:36-42.

[4]MANYIKA J,et al.Big data:The next frontier for innovation,competition,and productivity[EB/OL].[2015 -07-18]http: www.mckinsey.com/insights/mgi/research /technology and innovation/big data the next frontier for innovation.

[5]倪宁.大数据时代的传播观念变革[J].西北大学学报(哲学社会科学版),2014(1):139-145.

[6]蒋玲,杨红艳.大数据时代人文社科成果评价变革探析[J].情报资料工作,2015(3):92-97.

[7]王通讯.大数据与人才的发现评价[N].光明日报,2014-04-19(11).

[8]维克托·迈尔·舍恩伯格,肯尼斯·库克耶.大数据时代:生活、工作与思维的大变革[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2012:55-70.

[9]叶继元.人文社会科学评价体系探讨[J].南京大学学报,2010(1):97-110.

[10]罗旭.大数据时代,如何评价人才:访中国人事科学研究院原院长吴江.光明日报,2014-05-17.

[11]全国统计专业技术资格考试用书编写委员会.统计相关知识[M].中国统计出版社,2008.

蒋玲中国人民大学图书馆馆员。北京,100872。

施立红中国人民大学图书馆馆员。北京,100872。

苗林中国人民大学图书馆馆员。北京,100872。

Study on the Big Data Value of Evaluation for the Humanities and Social Science Achievement

Jiang Ling,Shi Lihong,Miao Lin

This paper proposes the transformation and the possible contribution brought by the evaluation method of big data. It believes that this evaluation method will complement the current empirical evaluation method to obtain more accurate evaluation results.However,the big data provides a new opportunity to change the data for the humanities and social sciences academic evaluation.We cannot blindly trust the new evaluation method.It is rational for us to advance the reform of evaluation solidly.

Big data.Humanities and social sciences.Achievements in scientific research.

C34

2015-07-15 编校:方玮)

*本文系中国人民大学科学研究基金中央高校基本科研业务费专项资金资助“基于读者借阅耦合分析的大学生阅读倾向研究”(项目编号:14XNE013)研究成果。

猜你喜欢

社科科研成果社会科学
社科成功展示
社科成果展示
科研成果转化
《云南社会科学》征稿征订启事
《河北农业大学(社会科学版)》2021年喜报
社科成果展示
中国科研成果震撼全球
加强医疗科技自主创新和科研成果转化
审批复杂 科研成果落地难
人文社科