大数据与人工智能时代的学术著作评价体系建设

2020-11-17徐升国

现代出版 2020年5期

◎ 徐升国

文化强国和科技强国建设，要求我国必须加快提升学术研究能力和水平，推动我国学术研究和科技创新面向世界前沿、面向经济社会发展主战场，加强原始创新，加强长期积累和持续攻关，实现我国学术和科技发展的重大突破。而建立一个良性发展的学术生态体系，除了加强学术研究队伍建设和推动研究成果创新外，建立一个与之配套的健全科学的学术评价体系，也是其中非常关键的环节。评价体系是一个导向系统，不仅是对学术研究最终成果的评价，同时也是对学术研究路径、研究目标的引领。与我国学术期刊评价体系的快速发展相比，科学系统和公认的学术著作评价体系一直是我国学术评价体系建设中的薄弱环节，学术著作的重要性被忽视这一问题亟待解决。

一、学术期刊评价体系对学术著作评价体系建设的启示

1.学术期刊评价体系建设的经验和教训

20世纪90年代以来，通过引进国外科技期刊评价体系评价方法，我国建立起几大学术期刊评价体系，包括南京大学中国社会科学研究评价中心发布的“中文社会科学引文索引”（CSSCI），北京大学图书馆发布的《中文核心期刊要目总览》（总览），武汉大学发布的《中国社科学术期刊评价研究报告——RCCSE权威、核心期刊排行榜及指南》（RCCSE），中国社会科学院文献计量与科学评价研究中心发布的“中国人文社会科学核心期刊”（AMI），中国科学院文献情报中心发布的“中国科学引文数据库来源期刊”（CSCD），中国科学技术信息研究所发布的“中国科技论文统计源期刊”（又称“中国科技核心期刊”）。此外，还有中国人民大学书报资料中心发布的“复印报刊资料转载指数排名”和“复印报刊资料重要转载来源作者”，中国知网发布的“中国学术期刊国际国内影响力统计分析数据库”和“全国高校国内期刊高被引论文数量排行榜”，中国人文社会科学学报学会发布的“中国人文社科学报核心期刊”等。①同时，我国学术和科技界还引进了美国“科学引文索引”（SCI）和“社会科学引文索引”（SSCI）等科技期刊与社科期刊评价体系。这些学术期刊评价体系不仅用于期刊质量评价，还被广泛应用于科技计划项目、人才项目、基地建设、学科评估、“双一流”建设、成果奖励等活动，在国内教育质量评价、科研成果评价、科研资金发放，以及学术科技评奖、院士增选、人才评聘、职称评审、研究生毕业等环节都产生了重大影响，成为我国学术科技发展和人才培养使用的导向性指南，反映出学术成果评价体系的巨大应用价值和社会效益。

这些学术期刊评价体系的发展，对促进我国学术评价方法的科学化，引领我国学术和科技发展，起到了十分积极的作用，同时也为促进我国学术评价体系建设和研究积累了大量经验。对国外经过理论证明和实践检验的以文献计量学定量研究学术期刊评价的方法的引入，使我国学术期刊评价走上了量化评价的道路。

学术期刊评价体系经过二十多年的发展，也暴露出一系列问题与不足，并因为在实际应用过程中产生了较大的负面影响，而引起了学术界巨大的争议。其主要结果之一，是近两年来国家科技部和教育部接连出台“反四唯”（唯论文、唯职称、唯学历、唯奖项）、“反五唯”（唯分数、唯升学、唯文凭、唯论文、唯帽子）政策文件，反对学术评价工作中的唯“SCI”和“核心期刊”导向，提出重建我国学术成果评价体系。这体现了期刊学术评价体系中存在的几个根本性问题。

一是盲目照搬，削足适履，简单粗暴地直接以美国学术期刊评价体系（SCI）为准绳来衡量我国的学术成果和学者水平；二是简单地以美国SCI文献计量学量化标准为主要准绳来建立我国学术期刊评价体系，评价体系科学性、专业性、适用性缺乏公认度，未能充分考察我国期刊实际情况和多元特征；三是学术期刊评价机构自我授权，评价体系不公开不透明，评价过程缺乏公正性和外部监督，甚至有些学术评价机构将评价工作作为自身套取名利的机会，有的学术评价机构本身就是商业组织而直接将评价工作与自身商业利益捆绑；四是对学术期刊评价成果泛化和极端化应用，出现“以刊评文”“以文评人”“唯论文”“唯成果”等一系列问题；五是期刊界和学术界病态化追求评价结果，期刊为了评上“核心期刊”、为了提高期刊影响因子，学者为了在“核心期刊”上发表论文，不择手段采取种种破坏学术生态的极端化做法。

2.学术期刊评价体系给学术著作评价体系建设的启示

学术期刊评价体系建设积累的丰富经验和教训，给学术著作评价体系建设带来了许多启示。

第一，学术著作评价体系建设具有巨大的社会应用价值，其作为评价工具具有巨大的社会影响力。特别是在文化强国、科技强国建设中，学术评价体系具有独特而重要的导向作用。往高里说，它是一种文化软实力。作为我国学术科研绩效评价和学术科研工作的指导性标准，其作用远远超出学术期刊质量评价或学术期刊馆藏指南这么一种功能。所以不能掩耳盗铃似地将学术著作评价简单理解为仅仅只是一种学术成果评价方法和评价工具，或指导馆藏的实用工具。这启示我们，学术著作评价不能简单地作为一种学术评价研究方法或科研成果转化应用工具，不是任何人、任何机构只要掌握了评价方法就可以自我赋权、自行开展的一项活动，更不可将其当作一种话语权、一种获得评价者自身利益的工具，而应当将其作为一项社会公器，由能代表广大学界公共利益、获得相关主管部门授权的第三方非营利性独立专业公共机构来运营，评价方法、评价过程均应当公开、公正、透明、科学，并接受社会和管理部门的监督。也正因此，我们不能简单地直接采用国外的SCI等评价体系来评价我国的科研工作，丧失学术评价的主导权和主动权。

第二，学术著作评价体系建设应当以科学性原则为最高原则。科学性是学术著作评价体系的灵魂和生命力。一个不科学的评价体系，其评价结果必然不准确，其效果也必然带来严重的误导作用。科学性的一个重要标准是客观性、可重复性、可验证性。所谓客观性，就是评价指标不能过于强调主观性，不能以个人偏好、个人判断作为主要评价手段。传统的行政性评价、专家精英定性评价，甚至传统的同行评议，均因为过于强调评价者个体的主观性而缺乏足够公信力和说服力。应该说，西方和我国普遍采用的文献计量学评价方法，作为一种学术成果评价方法，无论是其研究方法的标准化、客观化，还是其研究结果在实践中得到的验证，都证明了其具有较强的科学性。我们可以进一步完善或改进文献计量学研究方法或用更科学的方法替代它，但不可因为其还存在不足或不完美就全盘否定它。科学性的另一个特征是可重复性、可验证性，即无论是谁、无论什么时候，均可以对评价过程、评价结果重复出同样的结果。科学性还要求评价标准具有可证伪性，任何人都可以通过推理来证明其方法是否科学、准确、客观，一旦证伪即说明这种方法是不科学的，或不够科学，并可以提出更新更科学的方法。可证伪性可以使学术评价体系不断前进，这也正是科学发展的历程。科学性还要求学术著作评价工作应当遵循科学标准，由学术共同体来实施，而不能过于依赖行政机构或权力机构，当然更不能交由商业机构来实施，这些机构的运行规则本身往往不是以科学性为最高标准的。

第三，学术著作评价成果的作用具有有限性。学术著作评价成果虽然应用广泛、导向作用巨大，但是在实际应用过程中，仍然不能过度使用，特别是不能片面化、极端化、单一化使用，也即不能“唯著作”“唯成果”“唯论文”。这个问题不在学术著作评价工作本身，而是社会各界对其应用应当有度有节有限，这其实不是评价工作本身的过错，也不是评价工作本身能解决的问题。现在社会上存在的“四唯”“五唯”现象，如果简单地把账算到学术期刊评价体系本身，是打错了板子。而有人借此否定学术期刊评价体系，则不是别有用心，就是无理取闹。有些人为了获得更高学术成果评价而采取种种不正当手法，则更不能归罪于学术成果评价工作本身。任何一种评价工作，都不可避免地存在不正当现象，承担责任的应当是实施这些不正当行为的人，受惩罚的也应当是不正当行为者，而不是评价工作者。对此，未来开展学术著作评价工作时需要有清醒的认识，不可杯弓蛇影。

二、学术期刊评价体系与学术著作评价体系的差异辨析

这些年国内外发展出这么多套学术期刊评价体系，却至今未能发展出一套公认的学术著作评价体系，究其原因，主要是因为两种评价体系在评价模型上存在巨大的差异。

1.学术期刊评价体系实行以文评刊与以刊评文的循环运行机制

从学术期刊评价与学术图书评价两者的整体评价运作体系出发，我们可以来辨析两者的异同。学术期刊和学术图书评价体系，都是希望通过大规模的评价，尽可能地对全部学术成果进行全面评价，进而形成对单篇论文或者著作质量的比较性评价，而非基于某一个特定的项目评选、评奖或评估进行的小型专题评价。大规模、连续性、全覆盖的全行业学术成果质量评价是两者共同的目标。

从这个目的出发，两者都要求能够大规模持续开展，既要保证评价方法的科学性，还要保证评价工作实施的经济性和可操作性。没有科学性，评价没有意义，没有经济性和可行性，则评价也不具有操作性。一个理论上非常完美但实践上缺乏可操作性的方案只能是空中楼阁。

基于这一定位，在评价模式上，学术期刊评价体系采用了以文评刊与以刊评文相结合的方式。第一步以文评刊，搜集所有反映学术期刊发表论文质量的相关因素，采用文献计量学方法进行全面量化统计分析，测算出某一期刊的整体质量水平，以及在同类期刊中的排位。第二步以刊评文，该模型认定一个期刊所发表文章的整体水平大体具有一致性。因为西方很多优秀学术期刊，都对拟发论文采取“专家匿名评审”方法，确保论文质量相对平稳。如果文章在该刊上发表，就可以推断出该论文质量等级与该刊定位基本相当。这样，通过该刊总体质量评价，就可以推断出该刊其他文章的质量优劣。这样在应用评价成果时，就不用把每一篇文章当作孤立的个体来确认其评价结果，而是以期刊整体质量评价结果来确认个体论文的评价结果。评价成果使用单位只需要知道作者的论文发表在核心期刊上，即可认定其质量达到相应水平。

这个评价模型的最大优势是，通过以文评刊实现对期刊的整体评价，通过以刊评文实现对单篇文章的评价。期刊评价可以通过从以文评刊到以刊评文，实现从个体到整体和从整体到个体的评价循环。在评价成果的应用上，使用者不需要深入考查每一篇论文的水准，而只需知道论文发表在什么期刊上即可简单判断，这样一来就极大地降低了评价成果实际应用的门槛。此外，还能以过去的评价结果指导作者投稿，从而实现以过去间接地来反映和评价未来，实现评价工作的指导价值。这样一来，评价工作在科学性、经济性和可行性上取得了大体的平衡，大大降低了评价工作的复杂度和评价成果应用的难度，使评价结果得以在社会上广泛应用。学术期刊评价之所以成为一个广泛应用的评价方式，并能深刻地影响到整个学术生态，其背后的逻辑也正在于此。

然而，学术期刊文献计量学评价模型的潜在问题也随之而生。我们能够以文献计量学方法证明以文评刊的科学性，但是并不必然能证明以刊评文的科学性，因为：第一，学术期刊整体质量的好坏，并不天然地证明刊物里每一篇文章质量的优劣。常见的现象是，刊物是核心期刊，但是里边发表的文章的质量也存在较大的差异；同样，即使刊物不是权威、核心，也并不必然说明里面的文章就一定都质量不高。刊物质量与文章质量只是大概平衡的。第二，我国学术期刊的论文选择方法与西方不同，我国并没有全面实行“专家匿名评审”制度，而是主要实行编辑选稿制度。这种选稿制度使期刊大多数文章质量与刊物质量能够匹配，但是毫无疑问，例外也比比皆是、极为普遍。尤其是在中国这种人情社会，许多学术期刊都有关系稿、人情稿、收费稿，这也是人们心照不宣的客观事实。这就更加为以刊评文埋下了隐患，也是国内对核心期刊评价工作质疑的一个重要原因。这一质疑，可以说是对学术期刊评价工作模式的质疑，也是对评价成果应用中以刊评文逻辑的质疑。这使我们在建立学术著作评价体系的时候需要寻求更为科学有效的方法。

2.学术著作评价体系的著作单独评价机制

学术期刊评价与学术著作评价的不同，在于学术著作评价天然无法实现以文评刊与以刊评文的循环。学术期刊评价体系采用的文献计量学方法有三大支撑，第一是期刊全文数据库，第二是文献计量学方法，第三是期刊连续出版（可以持续稳定地跟踪评价）。这三大支柱在学术著作中除文献计量学方法可以通用外，其余两者均完全不同。不像学术期刊有知网、万方、维普和超星等连续动态更新的大型全文数据库，我国至今没有一个即时动态更新的吸收全部或主要学术著作的全文数据库，应用文献计量学工具覆盖全部学术专著也就无从谈起了。学术著作也不是连续出版物，无法稳定持续地进行系统化的循环评价。

每一部独立的学术著作，都是一个孤立的个体，需要进行单独评价。不能因为一本著作的质量推断出其他著作的质量，也不能通过评价过去的著作推断未来的著作的质量。一部高水平的专著，并不能保证作者的下一部著作仍然是高水平的。每一部作品都是一个孤立的原子，相互之间缺乏通约性。我们很难做到以书评出版社，然后再倒过来以社评书。同一个出版社不同著作的质量差异远远超过了同一本期刊不同文章的差异。

这使得学术期刊的评价模型与学术著作的评价模型差异巨大，前者可以一年评一次甚至三年五年评一次，其结果可以长期使用。后者则需要对每一部著作进行单独评价，而且评价结果也只一次有效。评价机构需要长期持续地对不同著作分别进行评价，而这又受制于学术著作无固定出版周期，无及时完整的学术著作数据库支撑来开展文献计量学评价工作。如果为了评价而单独建立一个全面、及时、完整的学术著作数据库，则在成本和操作性方面无疑都有很多困难。这样一来，学术著作评价工作的经济性、可行性就完全无法与学术期刊评价工作相比。

而从评价结果应用看，学术著作评价结果也无法像核心期刊名单一样，以一个简单通约的方式供学校等学术著作评价成果使用者来应用评价结果。这也给学术著作评价成果的应用推广带来较高的障碍，评价结果应用的机会较低，评价成果应用难度也大。这样一来，学术著作评价工作的价值和社会影响力就会大打折扣。因而，学术著作评价的经济性、可行性、影响力和成果应用价值都远不如学术期刊评价。

在评价过程上，粗看学术论文与学术著作的评价原理差不多，科学性也相似，但实际上，两者在评价工作和评价体系的经济性、可行性，以及评价成果的应用机会上都完全不同。这使学术期刊评价体系与学术著作评价体系的差异，看似是评价一本期刊与一本著作的差异，实际上显示出两者在评价模型和评价成果应用等评价整体体系上有天壤之别。这一“细微”却关键的差异，可能正可以解释为什么国内外有那么多学术期刊评价体系，而公认的学术著作评价体系却至今暂付阙如。未来构建学术著作评价体系，需要对两者的这一本质差异有深刻认识。

三、学术著作评价模型的逻辑演进

从历史发展进程看，国内和国际上学术期刊评价的逻辑演进可以大概分为三种方法，这也是学术著作评价模型设计的参考。第一种方法是基于专家评价和同行评议的定性评价；第二种方法是基于文献计量学的定量评价，这是目前我国学术期刊评价的主要方式；第三种方法是基于大数据的算法评价，目前国外已经开始朝这个方向发展。而在可见的未来，将出现第四种方法，即朝基于人工智能的智能化算法评价方向演进，使评价体系和方法更加具有科技含量，并能有效解决学术期刊评价工作中存在的“以刊评文”难题，也将有望解决学术著作评价中存在的著作单独评价经济性、可行性和应用性难题。

1.基于专家评价与同行评议的定性评价

无论是我国长期以来开展的各类政府奖励性评审（如中国出版政府奖中的图书奖、期刊奖），还是科技成果奖（如中华优秀出版物奖、“五个一工程”奖、出版基金），基本上都为行政管理部门主导，并组织专家进行定性评价。而出版社和杂志社的审稿制度，也采用编辑定性评价或同行评议制度。在国外，至今许多社科学术成果评价、学者评价，也仍然主要采用同行评议方式进行。②

由学术共同体开展同行评议，是长久以来被实践证明相对有效的一种学术著作评价方法。同行评议能够依托专家对学术发展方向的专业把握、对评审对象的专业审视能力，加上制度上的独立评审、多人评审、匿名评审，基于质量、原创性、创新性、社会价值等核心要素对著作展开直接评审。这比文献计量学借助影响因子间接评价更为直接有效。

但是，这一方式也存在一些缺点。一是主观性。严重依赖专家个体的主观判断，而不同专家的判断常常不同，显示这一评价方法缺乏统一的客观标准，存在一定的判断误差。二是经济性差。因为依赖专家个体，需要专家投入较大精力对一个成果进行全面审阅才能形成判断，对专家的时间、精力耗费较大，评价工作成本高，如果每年对源源不断生产的成千上万甚至上十万种学术著作进行大规模专家评价，则所耗费的专家资源就完全不可承受，这在经济性和可行性上都缺乏操作空间。因此，同行评议法不适于构建大规模、全覆盖、连续性的学术著作评价体系，而更适用于小范围特定成果评价，如科研成果评奖、专家评聘等。无论中西，概莫能外。

2.基于文献计量学的定量评价

学术期刊评价的第二种方法是在西方率先发展起来的文献计量学定量评价，其使评价体系走向定量化、客观化、标准化道路。文献计量学是采用数学、统计学等计量研究方法，以期刊载文量、文献被引量、影响因子等文献计量特征为研究对象，对科学技术的现状、发展规律进行预测和评价的一门学科。由英国著名文献学家布拉德福提出的“布拉德福定律”、美国文献学家尤金·加菲尔德提出的“加菲尔德引文集中定律”、美国科学学家普赖斯提出的“普赖斯指数”这三大定律是文献计量学的重要原理，也是学术期刊定量评价的理论基础。③可以说，文献计量学的出现及其在学术期刊评价中的应用，推动了学术期刊的发展。文献计量学应用于学术期刊评价最重要和最显著的标志事件，是1961年由美国科学情报研究所期刊文献检索工具“科学引文索引”（Science Citation Index，简称SCI）的创立。文献计量学方法采用的“以文评刊”逻辑，在理论上和实证上都有可靠的证据证明其科学性。西方学术期刊的“专家匿名评审”及学术期刊后续循环评价原则，使“以刊评文”逻辑下的论文质量有相对可靠的保证。文献计量学学术期刊评价体系发展到今天，已经受了数十年的实践检验，证明是一条相对有效的道路。同时这一评价方法也在不断完善升级，进一步提高科学性。

在逻辑上，采用文献计量学方法进行学术著作评价与学术期刊评价基本相似，测算相关学术论文和学术著作中对拟评价学术著作的文献被引量、影响因子等，同样可以测量出该学术著作的整体质量。而两者最大的差异，正如上文所述，主要不是单篇论文与单本著作评价方法的差异，而是评价工作整体实施的经济性和可操作性上的差异，以及评价成果应用机会的差异，而这也使得计量文献学评价方法在学术著作评价上一直未能长期有效开展。

在国外，随着学术数据库的发展，包括汤森路透和爱思维尔在内的科技出版巨头也开始构建学术著作评价体系。2011年，汤森路透基于Web of Science推出了图书引文索引（Book Citation Index，简称BKCI）。2013年，爱思维尔的Scopus文摘引文库也增加了对专著、参考书及大学教材的收录。这些图书引文索引库的推出，为学术著作评价奠定了数据基础。目前国内的知网和超星等数据库也开始大规模收录学术著作，只是收录的完整性和信息更新速度与开展学术著作评价的需要还有一定差距。

3.定量评价与定性评价相结合的学术著作评价

学术著作评价将定量评价与定性评价相结合的方法，总体逻辑是海量著作初步筛选采用文献计量学定量评价为主，后期优秀著作精选评价采用学术共同体专家评价与同行评议定性评价结合的方式开展。这一思路既可以发挥文献计量学定量评价便于开展大规模评价的优势，又可以发挥专家定性评价专业性更强的优势，同时又可以避免定性评价无法针对海量学术著作进行大规模评价的不足，以及文献计量学定量评价单纯依赖数据模型的弊端。这也是许多专家呼吁的方法路径。南京大学叶继元教授于2010年提出的“全评价”体系，总体上也属于这一思路。“全评价”体系包括评价主体、评价客体、评价目的、评价方法、评价标准及指标、评价制度等六大要素和形式评价、内容评价、效用评价等三个维度，其中形式评价对应文献计量评价，内容评价基于同行专家学者评价，效用评价则依赖于实践和历史评价或检验。④

南京大学中国社会科学研究评价中心的学术著作评价体系采用的正是这一基本思路。2015年7月，南京大学中国社会科学研究评价中心与中国图书评论学会合作研发的“中文学术图书引文索引”(Chinese Book Citation Index，简称CBKCI）正式对外发布，该数据库计划收录1992年以来中国大陆出版的优秀中文人文社会科学原创学术专著的全部章节信息和参考文献，并与南京大学先期研发的CSSCI引文数据库进行整合，共同构建成为涵盖学术期刊、学术集刊、学术专著等多重出版形态的符合学术规范和科学评价需求的大数据平台。南京大学沈固朝教授介绍该项目时说，这一数据库将建立客观的来源期刊和图书的遴选指标，采用定性评价和定量评价相结合的遴选方式。他认为，该项目通过建立文献之间的引证关系，可以较全面地反映学术研究的文献引用行为，对学者个人的研究工作、对管理部门的规划和决策等都具有积极的意义。但他特别指出，主要基于影响力的书刊评价不能与基于创新力的学术评价和成果的内容价值判定直接画等号，CSSCI-CBKCI的使用要注意避免因评价体制中的问题而被放大缺陷。⑤南京大学这一学术著作评价体系自2015年首次发布阶段性成果后，未见每年进行公开的持续性信息更新。

这一方法确实可以有效结合两种评价方法的优势，并避免两者各自的劣势，但这一方法的前提是两种评价方法可以有效应用于学术著作评价工作。如前所述，专家定性评价已经在实践中证明了其在小范围内进行评价的有效性。但是，文献计量学定量评价虽然用于学术期刊评价已经获得成功，但用于学术著作评价则无论在理论上还是实践上其可行性都仍有待证明。所以，这一评价逻辑是否成立，要先解决文献计量学方法应用于学术著作评价中存在的建立及时动态更新的学术著作引文数据库和成果应用难带来的经济性与可操作性难题。

四、基于大数据与人工智能的学术著作评价体系思考

大数据时代，网络信息技术和社交媒体的发展，使在线科研日益成为重要的科研方式，进而快速催生了补充计量学（Alt metrics）的发展。补充计量学是在以数字图书馆、开放存取、Web2．0、移动及社交网络、自媒体、在线科研及MOOCs、大数据等为代表的新学术信息环境下的新的一系列计量指标及方法。⑥相比文献计量学，补充计量学提供了更多元更丰富的评价视角和指标。谷歌学术（Google Scholar）、微软学术（Microsoft Academic）、COUNTER和F1000等都在这些方面进行了积极探索，体现了国外在应用大数据、网络技术等开展学术评价的实践和理论上都有很大发展。

2020年7月7日，谷歌学术发表了2020年谷歌学术指标（Google Scholar Metrics，GSM）。此版本涵盖2015—2019年发布的文章。谷歌学术于2004年年底推出，广受好评，影响力也日益增大。与流传较广的Web of Science相比，谷歌学术的最大优点是其涵盖范围远大于Web of Science。据估计，截至2014年5月，谷歌学术共收集1．6亿篇学术文献，几乎是Web of Science的三倍。其学术指标在推出后，也开始冲击影响因子的地位。Google学术计量的排序和分类指标为过去5年被引论文“h5指数”。h指数由美国加州大学圣地亚哥分校的物理学家乔治·赫希（J．E．Hirsch）于2005年提出，是指至少有h篇论文被引用过h次。而谷歌h5指数，则是指过去5年出版物发表的h篇文章，每篇至少都被引用过h次的最大值。谷歌学术指数基于谷歌全网搜索优势，通过运用大数据技术，实现了基于海量内容的学术成果引文指标测量。⑦谷歌学术指数的推出，使学术期刊评价进入大数据时代。此外，谷歌也在探索推出学术著作影响力排名，但目前尚未对外发布。

补充计量指标不仅可以包括学术论文在各类在线平台的引用情况，还可以包括著作的阅读量、下载量、点评量等信息，以及读者的评价，具体可表现为读书笔记、在线书评、博客微博微信评论、豆瓣书评打分等，这些均可以纳入评价体系，作为参考性依据。此外，对学术著作的学术影响力、社会影响力，甚至成果价值转化如决策采纳、政策制定、专利文献引用等，也可以纳入评价体系。这样就能够更加全面地反映学术成果的社会影响和价值。基于这一思路，不少学者也尝试探索建立新的学术成果评价体系。

大连理工大学科学学与科技管理研究所暨WISE实验室姜春林所长和他的硕士魏庆肖在《融合补充计量指标的人文社科专著影响力评价指标体系研究》一文中，提出一个除传统科学计量指标外，还包括阅读量、下载量、荐购次数、收藏量、评论量、豆瓣网络书评、学术社区讨论量、网络书店读者点评量、社交网络提及量等在内的补充计量指标，构建起一个新型学术著作评价指标体系。⑧这一体系虽然还有待实测验证，但确实也为我们在大数据时代探索新型学术著作评价指标体系提供了一个参考。

随着人工智能时代的到来，学术成果评价体系还可以进一步应用人工智能算法来进行。有了大数据作为基础，目前人工智能技术在深度学习、积卷神经网络、海量计算、无穷次迭代、自适应学习、自我优化等方面都获得了飞速发展。这些人工智能技术不仅可以用于下围棋、看X光片辅助医学诊断，同样可以用于学术成果评价。知识图谱、语义分析、图像识别、语音识别、跨语种自动翻译、机器写作、机器阅读、物联网机器数据交换这些人工智能应用，都为学术成果评价利用人工智能提供了技术基础。从谷歌大脑到百度大脑到阿里智慧城市、腾讯人工智能，这些人工智能领域的技术支撑系统为学术著作评价运用人工智能提供了技术平台。这些人工智能新技术应用到学术著作评价中，将使学术成果评价从定性评价、同行评议进化到文献计量学定量评价，再进化到大数据全评价后，进一步进化到人工智能机器算法评价新阶段。这是一种评价思维方式的变革和评价范式的转换。

现在的千人千面的个性化推荐算法替代了传统门户网站编辑推荐，在内容编辑方面无疑是一次革命性的发展。工业机器人、自动驾驶、无人飞机、机器新闻、机器写作、机器科研、量子计算，都显示了智能技术对传统人工的超越。随着弱人工智能进化到强人工智能再进化到超人工智能，技术革命正在使人类进入一个全新时代，即信息时代、数据时代、人工智能时代和人机融合时代。这一时代目前仅仅开始，远未到终点。

虽然目前基于人工智能的学术成果评价体系尚未出现，但这是大数据应用于学术成果评价之后的必然发展结果。应用大数据和人工智能技术进行学术成果查重，现在已经被广泛接受了。而应用人工智能技术进行学术成果的文字质量甚至内容质量评估，目前也已经有人在开发相关程序。2020年7月，由开放获取出版商Frontiers开发的Artificial Intelligence Review Assistant（AIRA），首次被用于研究论文的审查和同行评审。通过机器学习模型，AIRA可以在阅读完论文后的几秒钟内，在语言质量、数据完整性、查重检测及识别潜在利益冲突等方面，提出专业的评估意见，协助编辑、审稿人来评估论文的质量。⑨

吉林大学杜杏叶在其博士论文《学术论文关键指标智能化评价研究》中，就运用人工智能技术对学术论文关键指标进行评价做了深入研究。该文探讨了如何构建学术论文评价关键指标体系，如何建立学术论文智能化评价框架，以及学术论文选题新颖性、内容创新性、引文科学性的智能化评价方法。⑩虽然这一评价体系主要是针对单篇论文的，但对如何应用人工智能技术进行学术成果的大规模评价也具有较强的参考价值。实际上，大数据技术、人工智能技术最大的优势就在于低成本地对数据进行全网搜索和深入分析，无论是之前的文献计量学评价系统，还是谷歌学术指数大数据系统，都是基于信息技术的这一优势的。如果能够开发专门的学术成果评价人工智能系统，充分利用目前已经越来越成熟的语义分析技术、知识图谱技术、深度学习技术及神经网络技术，以几十年积累下来的学术成果评价结果为训练依据，以数以亿计的学术成果为训练对象，对这套人工智能系统进行全面深入的反复训练与持续优化，相信不久的将来，就有可能见到一个基于人工智能的学术论文与学术著作评价系统问世。而这一系统不仅能对海量学术成果进行全面评价，而且由于不依赖人工，所以成本非常低。在评价结果应用上，也将有可能完全免费开放给所有人，就像谷歌学术指数目前做到的一样，从而使成果应用变得方便和快捷。这样，困扰文献计量学对海量学术著作评价的两大难题也就有望解决了。

五、小结：学术著作评价与人的回归

随着基于人工智能的学术著作评价体系的发展，不少人会担心机器算法会不会异化和取代人的智慧。如果我们看到机器背后是人类在操纵、设计、使用人工智能，而不是人工智能自身在对人类进行评价，我们就可以释怀了。马克思曾经尖锐地指出，工业革命中机器吃人的本质是人对人的统治，资本的背后是资本家。人工智能同样如此。

进一步思考，人工智能不管如何先进，仍然只能是工具。当从人手、人脑进化到机器手、机器脑后，我们仍然要人归到人。人是出发点也是目的。人驾驭机器而不是机器驾驭人，人不能异化为机器的附庸。基于人工智能、超越人工智能，我们才能更好地站在时代之巅，俯览历史和人类文明众山之小。此时，我们一再宣称的中国特色、中国气派、人类命运共同体、时代使命担当，就是有本之木、有源之水了。

注释：

① 中国新闻出版研究院课题组.我国哲学社会科学学术期刊评价体系对比研究[J].传媒,2020(4):32-35.

② 吴凡洁.国外学术评价体系浅析及启示[J].科技传播,2018(10):189-190.

③ 刁敬东,农晓琳.文献计量学在学术期刊评价中的应用研究[J].医学信息（上旬刊）,2018(23):24-26.

④ 叶继元.近年来国内外学术评价的难点、对策与走向[J].甘肃社会科学,2019(3):61-67.

⑤ “中文学术图书引文索引”数据库首次发布[N/OL].(2015-7-22)[2020-8-28]. http://book.people.com.cn/n/2015/0722/c69360-27345337.html.

⑥ 姜春林,魏庆肖.融合补充计量指标的人文社科专著影响力评价指标体系研究[J].情报杂志,2018(12):67-72.

⑦ 2018谷歌学术指数出炉，影响因子何去何从？[EB/OL].(2018-8-7)[2020-8-28]. http://m.medsci.cn/article/show_article.do?id=a5041461 063f.

⑧ 姜春林,魏庆肖.融合补充计量指标的人文社科专著影响力评价指标体系研究[J].情报杂志,2018(12):67-72.

⑨ 人工智能如何推动同行评审的发展[Z/OL].(2020-8-5)[2020-8-28].https://mp.weixin.qq.com/s?src=11×tamp=1598585515&ver=25 49&signature=Vw*lsWBYAz5WIvWJcawrtxO*Dfmw20yRbdfG8VK pO90O5riK-60NGZtSUbevjx0x0qRa-s4kp7AfS04jBLRc8iyeBVRUH nisIfkGgknqWOQcWcOhUVN2TkCdPTJqGQLu&new=1.

⑩ 杜杏叶.学术论文关键指标智能化评价研究[D].长春:吉林大学,2019.