大学排名技术关键步骤及未来发展思考
2021-06-15李振华
◎李振华
提 要: 大学排名作为针对高等教育的活动、 专业、 院校或高等教育系统等发展情况, 采用一定的技术方法所进行的评估量化工作, 长期以来受到了大学主办者、举办者、 学习受众等群体的热切关注。 随着大学间的竞争越发激烈, 大学排名技术应用市场也进一步扩大。 基于大学排名技术的理论基础, 分析大学排名关键步骤及其技术, 以当今世界四大大学排名为研究对象, 梳理大学排名技术的实践与应用情况, 并对大学排名技术应用研究的未来发展做出展望, 为大学排名技术应用的实践与发展提供参考。
大学排名作为针对高等教育的活动、 专业、 院校或高等教育系统等发展情况,采用一定的技术方法所进行的评估量化工作, 也被称作大学排行榜、 机构排名等。长期以来, 大学排名受到了大学主办者、 举办者、 学习受众等群体的热切关注, 并且这种关注热度不断攀升, 加大了对大学发展规划、 政策制定、 资源配置、 内部决策等方面的影响, 大学间的竞争越发激烈, 大学排名的技术应用市场也因此进一步扩大。 据统计, 当今世界上已有形成体系、 较为成熟的大学排名50 余个, 在这些大学排名中以美国新闻与世界报道大学排名(U. S. News, 美国)、 泰晤士报高等教育副刊世界大学排名(THE, 英国)、 夸夸雷利·西蒙兹公司世界大学排名(QS, 英国)、 世界大学学术排名(ARWU, 中国) 等四个大学排名的影响力较大, 有力地推进了大学排名相关领域的研究。 本文以当今世界四大大学排名为研究对象, 总结归纳这些大学排名中涉及的相关技术、 原理、 方法, 大学排名技术的实践与应用情况, 并对大学排名技术研究做出展望, 为大学排名技术的实践与发展提供参考。
一 大学排名技术的理论研究与应用现状
(一) 大学排名技术的理论基础
大学排名始于对大学等高等教育机构的有效性评估, 主要面向大学的教学、 科研和社会服务等三大职能进行。 当前的大学排名主要采用产出理论评估框架对大学的三大职能的有效性投入、 过程、 产出等方面予以整体描述与测度。 如美国新闻与世界报道大学排名就以财政资源、 校友捐赠等作为投入评估指标, 毕业率、 同行项目评定等作为产出评估指标。 当然, 世界范围内的大学排名风格各异, 基于不同模型或理论会形成不同的大学排名系统, 然而, 大学排名仅仅用如上视角考量评估并不完全科学。 夸夸雷利·西蒙兹公司世界大学排名等世界大学排名建立评估教学、科研、 社会服务等市场机制并结合开展大量的问卷调查、 教学质量评价等, 强化多视角、 多数据、 多技术的量化评估, 用以回应如何保障大学排名所需的关于教学、科研、 社会服务等方面的量化数据科学有效等问题。 然而, 大学担负着复杂多样的使命, 如何保障大学排名与大学教学质量之间的综合治理, 如何在大学排名中科学有效地衡量大学在人才培养、 科学研究、 服务社会、 传承文化、 国际交流等方面的成败, 也即如何衡量高等教育的五大职能等, 还须从大学排名关键步骤与技术层面进一步挖掘, 从中改良相关技术方法以利于全面呈现大学复杂的内在本质以及多样化的使命。
(二) 大学排名技术的应用现状
1925 年雷蒙德对美国研究项目的声望开展排名, 开启了美国大学的排名研究。直至今日学者们还在继续完善各类大学排名技术应用, 继续丰富大学排名技术市场。综观当前的50 多个大学排名, 既有新闻媒体主导的排名也有学术排名主导的排名。其中当今世界上较为权威的四大大学排名分别为美国新闻与世界报道大学排名、 泰晤士报高等教育副刊世界大学排名、 夸夸雷利·西蒙兹公司世界大学排名和世界大学学术排名。 表1 为四大世界大学排名相关情况对比情况。 相比而言, 学术研究主导的大学排名更让人信服, 能提供更可靠、 有效的排名结果并积极指导大学教学、科研等方面的质量提升工程。
表1 四大世界大学排名情况对比情况
美国新闻与世界报道大学排名创始于1983 年, 最初仅针对美国1800 余所院校进行排名。 之后逐步演变为包括本科排名、 研究生院排名、 世界大学排名等若干排名在内的大学排名系统。 该大学排名于2014 年涉足世界大学排名, 其排名指标体系较为稳定。 由于其世界大学排名在不断增加外部获取的数据, 开展如委托科睿唯安数据公司建立备选高校数据库等工作, 其排名表现也越发呈现全面性。 该大学排名在数据采集中注重科研文献的计量, 强调客观数据与学术研究等方面声誉的展现。在数据合成中结合权重和测量的13 个指标得到排名整体分数, 如全球研究声誉指标主要反映近五年全国最佳大学学术声誉调查结果的总体情况, 区域研究声誉则侧重学术界对所在区域的其他大学的意见。
泰晤士报高等教育副刊世界大学排名通过在数据采集阶段与汤森路透的合作来实现收集大学数据、 完成面向业内权威专家访谈等工作, 着重推行同行评议法, 进而针对大学教学科研与声誉等进行数据分析与合成。 夸夸雷利·西蒙兹公司世界大学排名同样重视数据采集, 联合著名的爱思维尔出版集团开展大学排名的评估工作。 世界大学学术排名由中国上海交通大学高等教育研究所设计并于2003 年发布, 是全球首个世界大学排名。 该排名在数据采集中采用文献计量等方法, 获取国家相关职能部门、大学官网等数据。
数据采集、 分析与合成情况在此由四大世界大学排名的指标来观测。 美国新闻与世界报道大学排名的一级指标包括声誉影响、 科研产量、 科研影响等; 泰晤士报高等教育副刊世界大学排名的一级指标主要有教学质量、 科研能力、 论文引用、 国际化、 工业收入等; 夸夸雷利·西蒙兹公司世界大学的一级指标主要聚焦于声誉影响、 教学质量、 科研能力、 国际化等; 教学质量、 教师质量、 科研产出、 人均绩效是世界大学学术排名的一级指标。 可见, 科研总量、 高质量科研成果数量、 篇均等科研产出类指标是世界四大大学排名的主要观测指标, 同时声誉影响也得到了广泛的关注, 权重位于25% ~50%。 由指标情况反映出对于大学教育过程的关注不够,而强调教育产出, 世界四大大学排名仅有泰晤士报高等教育副刊世界大学排名在教育过程环节设置了指标, 占据总指标的8.25%, 因而指标对于大学教学中心地位的保障工作还不够。
二 大学排名技术与关键步骤
从本质上来讲, 大学排名就是基于某种模型的评估量化工作。 大学排名依照维度数量情况, 可以划分成单维度大学排名和多维度大学排名。 前类大学排名主要通过对单一维度的多个指标进行赋权加和来实现对大学实际表现的评估, 而后类大学排名主要提供系列化的维度分数表, 可以通过指标权重分配实现多维度的评估量化。相比而言, 单维度大学排名无疑实际应用更为广泛。 当前学界的关注点主要集中在如何把大学的主要工作或全部工作转换为可供统计、 描述、 分析、 排行的数字化的指标体系之上, 而这仅仅是主要工作的一部分, 就大学排名的主要工作而言, 主要包括通过大学排名涉及的指标数据的收集、 分析与合成等工作阶段来形成大学排名的排行情况。
(一) 数据采集
大学排名机构根据其目的和发展愿景, 结合本科生教学、 研究生研究等不同类型的大学功能定位, 绩效考核、 声誉测量等不同类别的大学评估量化要求, 设定具有科学化、 规范化与合理化的大学排名方法与指标体系, 并根据其指标体系开展数据采集工作。 其中数据采集的范围包括了大学本身具有的一手数据、 排名机构调查所得的数据、 政府及其他机构提供的公开数据、 第三方独立机构收集到的数据、 文献数据资料, 以及调研问卷等。 可见, 从上述近乎海量的数据中抽取简化出所需的数据并非易事。 现有数据采集技术多为专属模板采集、 直接采集、 软件采集与接口采集相结合的方式, 即在数据采集时大学排名机构根据相应情况分别予以对待。 鉴于数据本身存在的真实性、 权威性等现实问题, 英国等国家针对大学本身具有的一手数据等开展数据审查。 数据审查主要就各类数据指标及数据收集、 报送的日期等加以严格界定与审计。 同时为避免篡改数据带来大学排名改变等情况的发生, 在数据采集中还增加了数据保护、 加密等技术。
(二) 数据分析
数据分析阶段是将数据采集阶段所获得的与设定指标有关的数据进行标准化处理, 使其转换为分数或其他相应的数字形式。 理查森研究发现在数据合成之前, 对各指标数据的调整并不标准和规范。 然而为了便于理解和进一步计算合成, 需要采取融合多类型数据进行数据标准化操作, 改进现有数据的标准化程度、 扩大数据分析范围等技术。 如Z 分数技术就是将采集到的数据转换为一个以0 分到10 分为度量的量表, 即数据在标准化处理之后被映射到一个单一的测量量度上, 该量度平均值为0, 标准差为1。 虽然测量量度的标准建立并没有科学的理论分析依据, 但这种变动数据实现标准化的处理方式也是泰晤士报高等教育副刊世界大学排名等大学排名机构常用的方式。 在具体实践中, 也存在给量表赋值时采用0 ~100 或者是组合赋值的情况。 基于数据分析大平台的技术操作也有利于后期数据分析、 数据审计追踪的开展实施。
(三) 数据合成
数据合成阶段是以对不同指标分数赋权加和的形式予以聚合测量指标, 形成单一的测度结果, 从而得出最终的大学排名结果, 用以表示大学的教学质量、 研究成果等方面的发展情况。 对于指标分数赋权的方法主要包括基于经验出发定性的主观赋权法, 包括均方差法、 变异系数法、 主成分分析法等在内的依照指标原始数据间的不同开展的客观赋值法, 以及结合主观赋权法与客观赋权法双方优点的组合赋权法等。 对照世界上大学排名机构的排名结果可以发现, 同一大学会有不同排名结果的现象, 其主要原因在于各大学排名机构所采用的方法具有差异性, 大学排名所呈现的仅仅是排名目标群体在某些方面的综合整体表现, 即在采用的数据指标、 数据源、 数据处理方式、 指标权重分配、 排名目标群体、 排名领域等方面存在差异性情况。 结合大学排名机构的发展目标与愿景的差异性, 显然大学排名的差异结果也是可以接受的。
三 大学排名技术未来发展的思考
(一) 大学排名技术要在应用基础上发力
从大学排名技术发展层面来看, 伴随着以5G 为代表的物联网时代的到来, 大数据计算力与人工智能理论算法的大幅提升, 数字网络设施设备的演变与革新, 大学排名技术在数据收集、 分析与合成的主动性、 融合性、 智能性层面都将有明显的增强。 在数据收集方面, 依托大数据实现数据量大、 突发性强的泛在计算; 在数据分析方面, 基于数据类型多样性、 不确定性与计算实时性等要求实现泛在自主计算;在数据合成方面, 依托人工智能实现面向云端融合, 具有移动性、 迭代性的泛在协作运算。
(二) 大学排名技术要在应用发展上深入
从大学排名技术应用发展层面来看, 高等教育机构排名的柏林原则已经对大学排名未来发展给出了建议, 即大学排名中相关要素的透明度、 相关性、 数据比较的有效性是提升排名科学性与有效性的关键, 而大学排名技术应用与改进则应延续该思路, 汲取大学排名技术发展的优势力量, 从当前一元化的大学排名调整为多元化的大学排名, 将原有以大学排名机构为中心视角的排名改变为以准大学生等客户为中心的排名, 由大学排名转变为以体现地区特征、 学科间差异为导向的地区排名、学科排名等。 以客户为中心的大学排名、 地区大学排名、 学科排名等大学排名将带动大学排名技术应用的推进, 带动人工智能、 增强现实等技术融合的软硬件技术设备的开发。 如定制大学排名, 开发可触摸操作的、 具有增强现实功能的全国商科院校排名系统, 由客户在硬件触摸屏上移动加载相关数据, 促成即时计算实现增强现实展示的排名情况, 使硬件与技术应用有机融合。 未来大学排名技术应用场景将更为广阔, 如政府制定政策, 特别是合作高校认定、 高校资格认定、 大学合并、 技术移民等涉及教育教学方向的政策制定都将是大学排名技术应用的新阵地; 高校人事与组织机构调整、 资源分配与优化等事关高校发展规划与决策管理领域也会让大学排名技术应用有所施展。 另外, 基于其核心技术还可移植应用到智能城市交通出行、网上购物、 体育竞技训练等领域的排名与推荐。 同时整合后期可能源源不断产生的个性化大学排名需求, 智能汇聚人机交互设备、 动态传感器资源等, 还将继续推进大学排名技术的深入发展与技术应用的泛在化。
(三) 大学排名技术要加强应用生态的管理
从大学排名技术应用生态管理层面来看, 大学排名技术应用将整合资源、 应用、作用层面的要素形成包括数据采集、 数据分析与数据合成在内的三个子生态圈, 并由这三个子生态圈合成大学排名技术应用大生态圈, 与政府、 院校、 企业等形成信息、 资源等互通互联的技术应用、 生成、 评测等生态环境, 及时载入类脑计算等新技术, 促进大学排名技术应用的生态发展。 第一, 要继续加强技术基础研究, 夯实大学排名技术的理论、 方法和技术研究基础, 支撑起大学排名技术应用的实现。 第二, 要加强软硬件协同式创新设计, 为定制化、 个性化大学排名建立一体化的生态环境。 第三, 强化对技术应用标准化的研究, 对标准化视角的研究有利于进一步强化大学排名的国际化发展, 进一步精准研发本土化工科、 商科等纵深化的学科大学排名。 同时在敏捷项目管理等管理介入的作用下, 实现技术应用生态内外部生生不息、 动态平衡与演化发展的生态图景。