欧洲高校哲学社会科学研究成果评价及启示

2021-09-14高慧

湖北第二师范学院学报 2021年9期

高慧

(湖北省社会科学院，武汉 430077)

哲学社会科学研究成果评价是广受关注的难题。哲学社会科学研究成果自身多样性的特点，决定了其评价的特殊性。与自然科学相比，哲学社会科学研究成果具有自身的特点：哲学社会科学研究成果是解释性的，即主要是由文本、理论和概念驱动的，而自然科学则是通过研究回答具体的问题并且是由进步驱动的；哲学社会科学研究成果是反思性的，通过培养话语争议和竞争性视角在学术界引入新的观点；哲学社会科学研究成果主要是个体性的，合作撰写的较少；生产力对于哲学社会科学研究成果来说并不重要；哲学社会科学研究成果的社会导向很重要，即哲学社会科学研究成果旨在影响社会，与社会的直接互动是哲学社会科学研究的一部分[1]5。建立健全中国特色哲学社会科学评价体系，需要正确认识知识生产模式转型下哲学社会科学研究成果评价面临的改革压力以及当前的评价困境。欧洲高校在哲学社会科学研究成果评价方面的探索在国际层面上提供了有价值的贡献。鉴于此，本文选取了德国、法国、瑞典三个国家的哲学社会科学评价案例，分析并总结了欧洲高校哲学社会科学研究成果评价的典型特征，并对我国哲学社会科学成果评价的改进提出建议，以期使哲学社会科学研究成果评价工作与时俱进，并真正起到促进哲学社会科学蓬勃发展的作用。

一、欧洲高校哲学社会科学研究成果评价实践及特征

(一)欧洲高校哲学社会科学研究成果评价实践

1.德国：对同行评议进行审视

2011—2012年，由德国科学委员会、德国科学与人文委员会组织的全国性科研同行评议活动在德国高校的英语系展开。杜塞尔多夫大学的Ingo Plag教授对于同行评议的过程提出了以下质疑：评审员的个人判断有多可靠？不同评审员对于无法量化的标准有多大程度的共识？不同评价指标之间的关系是什么？外部资金的数量是否能反映研究者的研究成果质量？根据19位评审员提供的4110个评分，Ingo Plag教授对此次评价活动的方法进行了批判性的实证研究，重点在于考察评价指标的分类形式以及各类评价指标的可靠性。

在这次的大规模同行评议活动中，19位评审人员被分成了四个小组，分别对应英语系的四个分支：英国文学与文化、美国研究、语言学、英语教学。评议小组建立了一个对高校英语系科研总体情况的评价体系，其中关于研究成果的评价维度和指标如表1所示。

表1 高校英语系研究成果评价指标体系[2]237

每个指标的评分被分为九个等级，5分为杰出，4.5分为介于优秀与杰出之间，4分为优秀，3.5分为介于优秀与良好之间，3分为良好，2.5分为介于良好与合格之间，2分为合格，1.5分为介于合格与不合格之间，1分为不合格[2]238。首先，每个评审员对表中的所有指标进行独立评分；然后四个小组分别召集其评审员开会，讨论得出每组在四个维度上的得分；最后，所有评审员在全体会议上给出某个高校的英语系在四个维度上的最终得分。

Ingo Plag教授为了研究该评价活动的评价指标和评价信度，收集了两套数据集，第一套数据集包含所有评审员的独立评分，用于调查评审员的内部一致性以及不同指标之间的关系。第二套数据集包含全体会议中对每个高校四个维度的评分，该数据集用于调查四个评价维度的相关性。结果表明，所有评审员的同质性较强，评价结果的总体可靠性较大。大多数评价指标高度相互关联，只有“转移”的两项指标与其他指标之间没有太大的联系，此外，“外部资金支持”并不是衡量研究成果质量的有效指标。

2.自下而上：法国SSH1研究评价的新视角

尼古拉·萨科齐总统任期内(2007—2012)，法国的顶尖大学在上海交大软科公布的世界最好大学排行上一直置于前50名和前100名的末端，与此同时，法国的大学和科研机构在对其科研人员和研究成果的同行评议过程中常常因为评价标准模糊而出现混乱。种种因素促使法国政府明确提出“要创造10个高绩效的高等教育研究机构”；此外，政府希望通过提高学术标准、建立合理的科研评价体系，来提升法国高等教育的国际竞争力。无论是分配资金、设计研究策略、支持团队发展还是展示物有所值，在过去的十年中，更客观的评估方法已经成为法国的一项重要需求。

为了在高校的哲学社会科学领域落实上述政策，2007年《大学责任与义务法》颁布后，法国成立了新的科研评价机构——“最高评价理事会”(High Council of the Evaluation，HCERES)，用于评价人文和社会科学(Social Sciences and Humanities，SSH)的科研情况[3]181。不仅如此，一些创造性的科研评价项目为法国人文社科成果的评价开辟了全新的视角。本文主要介绍由布列塔尼人文科学研究所支持的DisValHum和 IMPRESHS 项目。

DisValHum和 IMPRESHS 项目的出发点是基于法国研究评价中由于对所评价领域观察不充分或对所评价领域没有进行观察，以及缺乏与利益相关者的接触等而产生的许多问题，这两个项目都致力于改善这种情况。项目采取的是一套自下而上的研究评价体系，该评价体系专注于SSH的研究实践，并反思如何采用自己的方法而不是应用和调整用于评价自然科学和生命科学的方法来评价SSH研究[3]189。它们不同于自上而下的评价活动，有先入为主的固定评价体系。此项目旨在通过对研究人员的资料收集和访问调查，制定最佳的人文社科成果评价指标体系，同时听取基层研究人员的意见，以公开透明的方式展开成果评价。这两个项目探究了不同学科的研究人员选择研究成果传播途径的动机及其差异，试图在研究成果的影响力与其传播途径之间建立一种关系。

项目将调查范围锁定在法国布列塔尼地区的四所大学，这四所大学属于被称为欧洲大学布列塔尼分校的一个集群，每一所大学在所研究的各个领域都保持一定程度的专业化。这四所学校中有两所综合类大学(Brest和 Bretagne-Sud)、一所理工类大学(含法律、经济学院，Rennes 1)、一所人文和社会科学类大学(Rennes 2)。这两项项目旨在：一是分析研究成果的传播形式；二是观察研究人员的生产率曲线和平均值；三是分析协作研究实践，即SSH学科的合著频率和形式；四是观察传播渠道；五是了解研究人员选择这些渠道的原因。为了实现这些目标，需要建立一个研究成果数据库。项目实施小组尽可能多地收集了四所大学人文社科学者的简历，帮助改进数据库的类别和结构。在数据库建设的同时，项目实施小组对布列塔尼各研究单位的SSH学者进行了一系列的小组访谈，旨在帮助改进数据库中包含的产品类型。项目小组统计了不同学科学者的各类研究成果数量，以四个学科为例，数据收集结果如表2所示。

表2 不同学科学者研究成果传播形式分布情况 (百分比)[3]195

基于上表数据，在历史和文学研究中，书籍和书籍章节的主导地位是显而易见的。民法和文学的期刊文章、书籍章节、专著、百科全书的数量较多，其研究成果偏重于在学术界制造影响力；而法律史、历史学的会议报告、报刊报道、其他出版物数量较多，其研究成果在社会大众中的影响力较大。每个学科都有自己的出版模式和自己的渠道，法律史和历史甚至都没有相似之处，民法和法律史即使作为相同研究领域下的分支，其研究成果的发表途径也大不相同。

综合简历和访谈的调查结果，项目小组发现，人文社会学科中，不同学科的研究人员选择研究成果出版物的动机存在巨大差异：社会经济学、心理学学者偏向于将作品发表在高影响力的期刊上，他们希望在国家和国际层面制造较大的学术影响力，吸引国际合作伙伴；研究历史的学者具有强烈的大众吸引力，因此其研究成果大量地在无线电广播上传播；而法律研究人员则将他们的研究报告直接与当地法院联系起来，在法律、制度变革上产生影响；视觉艺术研究者，尤其是那些研究电影作品的人，与非学术受众的互动密切，他们的作品传播方式更集中于媒体渠道。

3.替代计量方法：瑞典SSH研究评价的创新

近年来，高速发展的互联网平台吸引了大量的学术研究人员利用网络媒介传播和分享科研成果，这种科研成果传播方式的变化不仅对传统的出版形式提出挑战，还对传统的衡量科研成果影响力的方式提出质疑。为了解决这一问题，替代计量学方法应运而生，它超越了文献计量学(Bibliometrics)、科学计量学(Scientometrics)、信息计量学(Informetrics)的计量方法，将科研成果在社交网站上的传播形式纳入评价范围内，强调评价学术成果时要考虑多个发布平台和多种浏览指标。

瑞典使用替代计量学对哲学社会科学成果进行评价，主要基于两个方面的原因。一方面，替代计量学考虑到了研究成果的影响并非局限于学术人员范围内，它把研究成果的读者分为四种——研究人员、专业人士、大学生和有兴趣的公众，并用“网络影响力”体现研究成果的综合影响力[4]1423。衡量研究成果的综合影响力对哲学社会科学来说是极其有意义的，比如历史或文学研究，其针对的群体大部分来自学术界以外的广泛受众。使用替代计量学方法除了可以衡量学术影响以外的社会影响，还能比较不同社交软件的传播能力。另一方面，传统的文献计量学收集引文数据需要相当长的时间，一般在两到五年之内才能反映一篇文章的引用情况，而在哲学社会科学领域，有学者建议应设置比自然科学更长的引文考量时间。然而，替代计量学方法收集到的阅读量、转发量(比如tweets或Mendeley计数)是即时可用的，比引文分析更快速，该方法提高了哲学社会科学成果评价的效率[4]1428。

2012年，瑞典建立了SwePub数据库，该数据库收录了来自30所瑞典大学的出版物。该数据库中的所有学术成果都至少包含一名来自瑞典的作者，还有一些出版物是与外国研究人员合著的[4]1423。为了评估数据库中“人文科学”的所有出版物，评估人员首先确定了数据库中的“人文科学”的范围，所有在数据库中作为2012年“人文学科”登记的出版物都被选作进一步的分析材料，据统计一共包含25个研究领域。通过替代计量资源管理器(Altmetric Explorer)收集来自Twitter、Mendeley、Cite U Like、blogs和Facebook等不同来源的相关数据。在2012年，“人文学科”索引的出版物总数为5091份，通过进一步的分类与计数，结果如表3所示。

表3 SwePub数据库中人文科学出版物的统计结果[4]1424

初步统计之后，评估人员利用替代计量资源管理器(Altmetric Explorer)从上述社交软件中收集上表所有“人文科学”作品的单个浏览量、下载量、转载量，用来测量每项作品的“网络影响力”，最后得出每个种类中所有作品的影响力排名。以期刊文章的测量结果为例，评估人员评选出了6篇具有最高“网络影响力”的“人文科学”期刊文章，并发现这6篇文章中有4篇是跨学科合作的作品，结果如表4所示。

表4 期刊文章最佳作品[4]1427

替代计量学在Mendeley、Twitter、Cite U Like、blogs、Facebook、Google Scholar等社交平台利用altmetric.com、Impact Story和 Plum analytics等工具计算学术论文的网络影响力，统计的数据可能包括点击、查看、下载、保存、注释、喜欢、推文、分享、评论、推荐、讨论、文章、标签、引用、书签等等[5]122-124。相比于传统的评价方法，替代计量学的数据源覆盖面广、统计指标多样化、统计结果实时更新。概括来说，替代计量获得的支持主要来源于替代计量学在分析交流传播渠道的多样性、检索数据的速度、方法的开放性、衡量超越“学术领域”的影响的能力等方面的优势[6]852。

(二)欧洲高校哲学社会科学研究成果评价的特征

在德国开展的对于评价高校英语系研究成果的评价指标与评价人员的研究，对于构建科学的评价体系以及考察评价人员的专业度有非常积极的作用。通过分析评价指标、评价维度之间的关联程度，可以帮助评价人员在指标体系中剔除无效指标，也方便其在后期工作中为高校科研情况改进提出相关建议。法国采用的自下而上的评价方法因为考虑到了人文社会科学研究者的科学研究和交流实践，而被认为是改进评价过程的一种很好的解决方案。这种评价程序不仅意味着评价更适应现实，而且也意味着学术界从一开始就更容易接受结果[3]196。基于自下而上程序的客观研究将有利于人们更好地了解成果类型和研究人员选择这些产出渠道背后的动机。只有这样，才有可能将研究成果与可能的社会影响联系起来。瑞典所使用的替代计量方法在分析和测量哲学社会科学研究的影响方面优于传统的文献计量方法这一点是值得肯定的，但要实现其潜力必须解决以下几个问题：学者在哲学社会科学学科中使用的不同的出版渠道，在许多学科中对印刷的持续依赖、以及非英语出版物的覆盖性。因此，哲学社会科学的许多领域的学术实践可能限制了替代计量数据的可用性。从上述评价实践可以看出，欧洲高校哲学社会科学研究成果评价呈现出以下特征:

第一，重视非学术受众的评价。西方学者将哲学社会科学研究成果的受众分为三种：国际学者、国内研究人员和非学术受众[7]115-131。前二者为专业的评价主体，后者为非专业的评价主体。欧洲国家的专业评价主体由政府行政机构以及第三方评价机构构成，包括德国科学与人文委员会(German Council of Science and Humanities)、荷兰皇家艺术和科学院(Royal Netherlands Academy of Arts and Sciences)、瑞士人文社会科学院等。此外，许多欧洲高校内部也组建了同行评议会用于评价教师的科研绩效。与此同时，欧洲国家也相当重视让非专业的社会大众参与到研究成果的社会效益的评估中。学者们提出了各种各样的术语来描述哲学社会科学研究成果的社会效益概念，如“社会相关性”、“公共价值”以及“社会质量”。英国的大学利用社区服务把他们的文学艺术研究成果传达给社区居民，在社区范围的互动内收集群众的反馈[8]219-233。

第二，注重学术成果的外部影响。长期以来，欧洲学者的注意力主要集中在学术成果的产出及其学术影响上。近年来，他们的兴趣开始转向研究成果在科学界以外的影响上，即研究所产生的经济、环境、社会和文化影响。哲学社会科学一直保持建立与社会的互动，当焦点集中在经济影响上时，这些互动往往是隐性的；当以人为本、解决问题、和以社会为导向的活动成为焦点时，哲学社会科学与社会的互动才更加凸显。欧盟委员会充分认识到哲学社会科学在社会发展中，特别是其在应对重大的社会挑战方面的关键作用，哲学社会科学研究成果的社会影响逐渐被纳入科研评估方案。英国已将影响的案例研究纳入其研究卓越框架(REF)，与2008年的科研评估(RAE)相比，2014年的REF新增了权重为20%的科研影响力。荷兰则在其标准评估协议(SEP2015-2021)中评估社会相关性，如荷兰皇家艺术和科学院于2011年5月发布的《人文学科研究质量指标》报告显示，人文学科研究成果可从“学术产出”与“社会效益”两方面分别计算得分，“学术产出”维度包括“学术出版物”、“学术用途”、“学术认可”三项指标；“社会效益”维度包括“社会出版物”、“社会用途”、“社会认可”三项指标[9]47-48。意大利在其研究质量评价(VQR2011-2014)中也考虑了社会影响。

第三，提倡自下而上的评价程序。欧洲高校的哲学社会科学评价活动有自上而下(top-down)和自下而上(bottom-up)之分，自上而下的评价活动即正式的评价，由政府或第三方评价机构组织；自下而上的评价活动又称非正式的评价，由一个地区或一个国家的人文社科学者自行组织[1]2。随着欧洲学者对哲学社会科学研究评价中的方法论问题及评价程序问题等的批判，欧洲高校哲学社会科学学者开始采取一些自下而上的举措。这些举措涉及从简单地改善哲学社会科学数据可用性和准确性，到广泛质量标准和指标的复杂的评价程序等不同的范围。它致力于打破传统的、僵化的评价体系，构造基于各学科研究实践的、灵活的、有针对性的新型科研评价模式。如挪威于2004年创立了“挪威模式”用于评价该国高等教育机构的学术出版物，并以“出版物加权得分”决定政府对各高校的科研拨款的再分配情况，挪威的评价活动后来被丹麦、比利时等国家效仿[10]79-90。又如2011年瑞士苏黎世大学进行的“开发与测试人文学科研究质量指标”项目，该项目聚集了一群专家学者组成评价团队，从大规模调研中寻找研究“质量”的明确定义与学科之间的通用衡量标准[11]369-383。

二、我国高校哲学社会科学研究成果评价的变革需求与现实困境

(一)知识生产模式转型对高校哲学社会科学研究成果评价提出新要求

在过去半个多世纪中，科学知识经历爆炸性增长的同时，人类社会的知识及其生产过程出现了重大变化，知识生产的组织、知识生产的资助者、知识生产者的范围、知识创新的方式等都发生了重大变化，引发了知识生产方式的系统性转变。“大科学”[12]、“巴斯德象限”[13]、“三螺旋”[14]、“创业科学”[15]、“后学院科学”[16]、“学术资本主义”[17]、“知识生产模式2”[18]等概念的提出都对知识生产方式变革的现象作出解释，这其中最为广泛引用的就是“模式2”概念。基于模式2导致的知识生产的经济化、功利化倾向，对科学研究自身和外部社会发展、生态环境等产生了一定的负面效应，卡拉雅尼斯探讨了一种新的知识生产模式，提出了注重公民参与及社会力量、关注经济发展生态平衡、倡导持续性竞争与社会繁荣为特征的知识生产模式3。[19]新的知识生产模式的出现，揭示了知识生产日益显示出在生产主体、组织方式、评价方式等方面所发生的重大变化，高校哲学社会科学研究成果评价必然随着知识生产模式的转型而与时俱进。

第一，知识生产的集体性和跨学科性要求研究成果评价要考虑不同学科之间的研究实践和研究类型之间的差异，重视跨界、跨地区合作以及跨学科视角的考量。知识生产的集体性和跨学科性，不仅预示着不同学科之间的合作，还预示着科研是一种集体的、团队的活动，它们在共同的目标指引下获得学科和知识生产的共同发展[20]58。对哲学社会科学研究活动的评价一直是一项有争议和复杂的任务，目前对该领域特别是作为研究成果的出版物的评价提出的大多数批评，主要集中在：评价程序与哲学社会科学的研究实践及交流实践不相一致[21]1-12。传统的知识生产是高度个人主义的，这种个人主义，由学术专业强大却高度分散的结构得以维持，它和围绕“首席研究者”或者其他公认的科学领袖的专业化研究小组的发展并不矛盾，但真实存在的多学科团队合作从各个方面挑战了这种传统结构，影响着个人自治、业绩标准、知识产权等。因此，这种知识生产方式要求哲学社会科学研究成果评价要考虑这种跨学科团队合作的研究实践。

第二，知识生产的社会责任性要求研究成果评价纳入社会化程度、社会影响力等指标。知识对社会和经济的影响不仅限于商业化。强调哲学社会科学研究成果对社会影响的证明，被解释为一种接受类似市场的或工具价值的压力，同时牺牲哲学社会科学研究和文化的非工具本质。社会问责的矛盾性压力已经以特殊的形式施加给哲学社会科学学科，需要向公众证明公共资助的研究活动的结果并向公众证明其合理性，促使了评价的产生。和其他知识生产领域一样，日益增长的社会问责的要求引发了质量标准的转变，质量标准不再由学术团体来单独定义，其他外部的、通常是弥散性的力量也参与进来。哲学社会科学作为研究人类、研究社会的科学，其研究成果的传播不应局限于课本、课堂，而要扩大到某个地区、某个国家的日常媒体中，从而引起大众的共鸣，甚至改变全人类的精神生活。在评价体系中纳入与社会影响力相关的指标，有利于引导哲学社会科学成果发挥为大众服务的功能。

第三，知识生产的杂合式质量控制标准，推动着评价主体多元化发展以及评价维度的扩充。质量控制有两个主要的组成部分：一个部分是体制上的，关乎于一项特定研究活动中认知图景上的空间位置；另一部分是认知上的，属于研究活动所在的社会组织[18]28。当今的哲学社会科学研究往往是围绕市场驱动与学术驱动开展的有目的的活动，对于研究成果的价值评判不能全由学术专家决定，相关利益团体、社会大众也应享有发言权。由于不同的评价群体拥有不同的评价视角，多元评价主体势必会导致评价维度的变化与更新。这里涉及从定位于学科的控制到更加分散的体现问题所定义的跨学科本质的控制。由于知识生产模式的转变，由学科同行所定义的质量控制被附加了诸如效率和实用性等从应用的情境中产生的一些额外的标准，这些标准的界定所依据的是研究工作对跨学科问题的整体解决所作的贡献。

(二)我国高校哲学社会科学研究成果评价的现实困境

1.评价标准：忽视研究实践与学科类型的差异

我国哲学社会科学包括哲学、文学、历史学、经济学、法学、教育学、管理学、艺术学八大学科门类，大多数高校评价哲学社会科学研究成果时都按照学校制定的《人文社会科学研究成果分类标准》等文件，将所有学科门类的研究成果划分为若干等级打分[22]11-12。在上述评分文件中，一般对学术论文和著作的等级规定得较为详细，而并未对其他服务社会的科学研究成果作具体等级划分。图书和科学期刊的排名、分类或质量标签是几乎所有评价过程中使用的工具。在某种程度上，这些来源的使用证实了在科学产出方面提供客观指标的需要。但评价过程过于简化和自动化，将期刊或出版物在排名中的位置自动转化成科学贡献的价值。而且，部分学科的应用与发展类学术成果占据较大比重，若单纯“以论文论英雄”，则不能突出此类学科的特殊功能与使命。

此外，哲学社会科学学科的多样性可能导致某些评价指标在一门学科中比在另一门学科中更具有适用性。例如，在某一学科领域中，大量的研究人员可能同时致力于发展和完善同一理论，而在另一学科领域，研究人员的研究主题各不相同，这对引文分析文献计量指标的适用性产生了重大影响，并且对各学科的文献计量可比性设置了限制。

2.评价维度：客观界定和区分研究质量的领域偏窄

哲学社会科学的研究目的除了有系统地增加和澄清对现实的认识等以外，也包括社会相关性，即学术知识通常与政策制定者、文化机构、教育者和其他相关方组成的更广泛的目标群体共享。自20世纪90年代以来，科学和学术的社会相关性日益受到重视。认为质量在一定程度上取决于使用情境的观点，使得社会质量日益受到关注。如今，哲学社会科学研究的质量和相关性不仅受到同行的检验，也受到社会的直接检验。

当前我国高校哲学社会科学研究成果的评价指标是围绕学术价值而建构的，通常评价指标中会考虑研究成果的内在质量，即难度、学术规范性、创新性等，也会顾及研究成果的外在质量，即下载量、引用量、转载量。而有关社会公众认可度、企业利用价值、政策利用价值等指标却很少被纳入评价指标体系内。“学术至上”的评价视角往往会误导科研工作者集中追求研究成果的学术价值，弃社会价值于不顾。

3.评价方法：怠忽对现代信息技术的恰当运用

长期以来，我国高校哲学社会科学研究成果的评价方法以同行评议与文献计量学为主，但研究过程的数字化以及同行之间和整个社会共享研究知识的网络化方式可能会导致研究生产系统发生重大变化，并对研究成果的质量评价指标产生影响。数字化使科学和学术研究过程更加透明，与过去相比，质量作为标签也可以附加到这些过程本身，而不仅仅是通过结果呈现。学术出版物是研究的物化、有形和可衡量的结果。从这个角度来看，出版物是判断研究活动的一个基本要素。然而，当今社会不仅需要科学知识的产生和出版，而且还需要它对社会的影响和效用。数字化可以通过在研究过程中分享知识的方式，例如通过学术博客的方式获得承认，将其作为研究成果的组成部分，并显示其质量。所有这一切意味着，只关注这种物化的学术出版物是不够的。

另一方面，传统的同行评议和文献计量评价方式对应用与发展研究成果并不管用。应用与发展研究成果面向社会实践问题而产生，对其的考核与评价应该在实际验证的过程中完成，而不能只通过专家主观评判或引文数据库考察。而且，同行评议的评价主体限于专家学者，文献计量学的统计量基本反映的是学术圈内的下载、引用情况，两者均未将学术圈以外的人员加入评价主体内，在一定程度上窄化了评价主体的范围。

三、我国高校哲学社会科学研究成果评价的改进路径

(一)以学科群为导向自下而上开发具有差别化的评价指标体系

根据英国学者托尼·比彻根据社会性和文化性进行区分的学科分类，哲学社会科学可分为软-纯科学(文学、艺术学、历史学、哲学)和软-应用科学(经济学、管理学、教育学、法学)[23]289。利用学科之间的相通性，高校可以从文学-艺术、经济-管理等学科群入手开展研究成果评价。评价的首选方法是知情同行评议，通过采用公平的评价流程，赋予评价的学者对流程及其结果进行评论的可能性。其次，必须考虑广泛的质量标准。质量标准必须从下至上地制定，并反映被评价学科领域学者的质量概念，因为只有他们自己才能判断自己学科的实际质量。质量标准的制定，要对需要评价的学科领域的学者进行调查，组建相关学科的专家形成调研团队，调查目标学科群的研究成果类型，对于学者达成共识的质量标准，可以确定为指标，以此搭建研究成果评价指标体系。另外，学者们要对这些指标如何充分衡量标准进行评估。根据学者一致同意的质量标准和指标，进行评价实验，最后对评价结果进行统计分析，筛选出目标学科群的研究成果评价指标。评价指标体系既包括可以用指标衡量的标准，也包括无法用指标衡量的标准，其他利益相关者的标准也可以纳入评价指标体系中，以考虑学术研究质量以外的其他研究目标。

(二)开辟研究成果全方位评价视角，注重研究成果的社会质量

由于哲学社会科学研究的选题越来越倾向于解决社会问题，研究基金来源的多样化决定了评价主体形成的多元化，同时学术视角与社会视角也会产生不同的价值判断标准[24]65。欧洲研究咨询委员会曾建议在评估过程中突出人文社会科学对问题导向研究的贡献[25]43-57。产品或服务的质量在很多方面是相对的，这是某些人所赋予的，它与某些目标即使用情境密切相关。在哲学社会科学方面，质量存在于研究成果对学术界及其他人的意义上。鉴于质量与使用情境有关，产品是否满足了用户的期待？所有这一切也适用于学术研究的质量，这也被其他人，特别是同事或同行所认可。他们决定研究是否提供了用户可以期待的内容。学术界期望新的知识和新的见解、对未来研究的展望和新的讨论。其他用户，如政府、企业、文化和公民社会机构等，也有自己合理的期望。人们希冀研究成果能够达到这些期望，并对具体研究成果是否符合这些预期进行评估。因此，需要一系列相当广泛的评价指标，这些指标能正确地反映该领域内产品、目标群体和出版文化的多样性。组建多元的评价主体，可囊括学界同行、校科研管理部门、政府机构、社会受众等。评价主体的扩充使评价维度不再受到制约，评价维度随之可发展为文化更新、科研投入与产出、政策变革、社会效益等层面，而多重评价维度又反作用于研究成果本身，保障研究成果的利用价值与物质形态多方面发展。

(三)搭建开放式新媒体评价平台，形成评价方式多样化格局

哲学社会科学研究以不同的方式展示其成果，而不仅仅通过一种出版物。考虑到不同的交流渠道、与出版物不同的其他成果以及数字化及跨领域开放存取，这是评价过程中需要解决的挑战之一。与封闭式数据库相比，通过开放来源对研究活动进行评价的评价实践等，都要求开发更完整的数据平台，提供关于广泛的期刊、出版商和其他传播渠道的信息。这些平台应将研究主题、方法等与选择出版文本的质量严格结合起来。开放资源的存在能够收集关于学术影响的更完整的数据。民意调查、社会反馈等方法需要在应用与发展研究成果的评价上引起重视。在新媒体环境下，基础理论成果的评价要充分运用互联网、移动客户端等平台。基于新媒体平台的评价方法不仅能够作为同行评议、文献计量学的补充，还对形成开放、自由的学术交流环境有促进作用。社会大众以及专家学者对于研究成果的推荐、分享、评论等行为能够及时被研究人员捕捉到，评价主体与被评价者可以实现快捷高效的互动。