APP下载

大学教师学术水平排名模型

2018-05-11毛园园

关键词:科利实力次数

毛园园

随着人们收集数据能力的不断增强,排名问题已受到人们广泛关注。在统计学、经济学、博弈论中有大量的排名方法[1],每种排名方法都有其创新性和独特性。由阿罗不可能性定理知[1],不存在绝对完美的排名体系。针对学术评价,从由权威学者对一项科研成果或人才进行评价的传统科研评价机制,到目前有关学术评价极少的系统方法或平台,学术评价仍存在量化评价不合理、行政权力过度干预、课题崇拜等问题。而科学合理地教师评估体系能够激励教师学术研究,提高教师资源的利用率,提升教师个人、高等院校和国家的教育水平与学术影响力。目前关于教师水平评价排名系统很少且不完善,因此,本文应用科利法和基纳法建立教师学术水平排名模型。

1 排名方法的理论基础

1.1 科利法

科利法是胜率法的一种改进[2]。胜率法是一种评分方法,根据获胜率为队伍i打出的评分值ri为

式中,wi和ti分别为队伍i累积获胜的场数和所进行比赛的总场数。胜率法存在明显的缺陷,首先,参赛队伍常会出现评分持平的情况;其次,在分析中并未以任何方式对对手的强弱加以考虑;最后,有时胜率评分的结果不太正常。例如,在赛季开始时,所有队伍的赛季前评分都是0,随着比赛的进行,一场未胜的队伍所得的评分仍为0。

为弥补胜率法的缺陷,科利根据确定股桌下注的拉普拉斯“承续法则”[3],对(1)式进行了调整

(2)式的优点:首先,所有队伍都以相同的赛季前评分1/2开始,此外,如果队伍i在第一场比赛中输给对手,则科利评分为1/3,这个数值比ri=0更为合理;其次,考虑了赛程强度,即对手的强弱,队伍i的评分与其对手的评分相关联,二者之间评分是相互依赖的。

将一支队伍累积获胜场数分解

其中,li=0是队伍i累积失利的场数。由于所有队伍的评分都从rj=1/2(每个队伍的初始评分值)开始,所以,此时(oi为队伍 i的对手集合)。随着比赛的展开,rj将发生改变,但由于评分都在1/2附近波动,故

假设(4)式为等式,带入(2)式中,则可得

可见,ri是依赖于其他未知数rj的,这就是科利法如何将对手的强弱结合到评分中的。

将(5)式整理为一个线性系统

其中,实对称正定阵Cn×n是科利系数矩阵,n为联盟中队伍的总数,nij为队伍i和j的对阵场数,rn×1是未知的科利评分向量,bn×1=1+1/2(wi-li)是右向量。求解科利系统Cr=b以获取科利评分向量r。由于Cn×n是可逆的,故此线性系统总具有唯一解。

1.2 基纳法

基纳法是利用竞争者之间的非负统计量,为每支队伍产生一个数值评分[4]。它将给定队伍的评分与该队的绝对实力联系在一起,而绝对实力又依赖于队伍的相对实力(相对于其对手实力而言该队伍的强弱)。

基纳法分为以下几个步骤:

(1)在所考虑竞争项目的众多统计数据中,选择能够体现队伍实力的属性,有益于合理地进行队伍实力之间的相对比较。并令aij为队伍i与队伍 j竞争时给出的统计数据值(aij≥0)。

例如,比赛得分,队伍i从队伍 j上所赢取的分数,sij是体现i相对于 j的实力的一个相关属性,此时aij=sij;还有获胜次数、失利次数等等,通过各个更为细致的方面所得到的不同评分,将它们聚合起来形成总体评分。要注意不断更新属性数据以及是否需要按时间对aij进行加权。

(2)利用拉普拉斯承续法则调整原始数据aij以处理异常情况。

例如,考虑得分sij,如果队伍i与队伍 j都是进攻出色而防守薄弱,那它们在交手时就都能获得很高的分数。相反,如果队伍p与q都是进攻乏力而防守牢固,则它们对阵时很可能得到很低的分数。在后续的评分系统中,相比于小数值spq和sqp,大数值sij和sji将对排名产生不适当的影响。故当比较队伍i与 j时,考虑两队的总得分,设

(3)若调整后的某些aij远大于(或小于)它们应取得值(可能是强队在弱队身上人为获得很高的分数所造成的),对每个aij采用一个非线性的偏好函数

以帮助减小强弱之间的差距,恢复数据的平衡,进行替换aij←h(aij)。

(4)规范化。若队伍进行不同场数的比赛,则需规范化处理,通过替换aij←,其中,ni为队伍i进行的比赛场数,并将数据组织成一个非负矩阵的形式A=[aij]m×m,其中,m为联赛中队伍的数量。

(5)根据基纳的第一条规则,一支队伍的实力应根据它与对手之间的相互作用以及对手的实力来加以调整。统计数据aij衡量队伍i对阵队伍 j的表现,评分值rj衡量队伍 j的实力,则队伍i相比于队伍 j的相对实力为

队伍i与联盟中所有其他队伍相比的相对实力之和称为队伍i的总实力或绝对实力,即

注意,实力向量可表示为

根据基纳第二条规则,每支队伍的评分应与其实力成正比例关系,即对于每个队伍i,存在一个比例常数λ,使得si=λri,用向量来表达就是s=λr。由于 s=Ar,故

这就是基纳法的根本。

用线性代数的语言来讲,找到矩阵A的特征值和特征向量即可。但矩阵A的特征值有多个,可能是复数或负数等,需要挑选对研究问题有实际意义的一个特征值。为解决此问题,根据佩隆-弗罗贝尼乌斯定理[5],只要矩阵A满足非负性、不可约性和素性,就可求得唯一评分向量r。通过替换A←A+εeeT,使矩阵A强制满足不可约性和素性,其中,e为m×1且元素全为1的矩阵,ε>0是很小的数,采用幂法求解评分向量r。

2 学者学术水平排名模型

2.1 教师学术水平指标数据的选取与处理

大学教师在国内外各级刊物上发文、承担国家各项研究项目、每年获得科研经费情况等都体现了教师的学术水平。在现实情况中,不管是重点院校还是普通学校的老师都会发表文章,而论文的发表能力和被引用次数在一定程度上反映了一个人的学术能力和科研水平。目前各类评价体系都过分或单纯注重成果数量,难免有些学者一味地追求数量提高自己的学术排名,我们认为论文数量作为指标不具有客观性。为弥补以上缺陷,并能够合理地进行教师学术实力的相对比较以及最大程度代表教师的学术水平,依据真实情况,经过慎重人为筛选,把文章的平均引用次数作为体现教师学术实力的属性。此外,一篇论文的引用次数若是高则反映了文章对相应科研领域的价值高,故此属性也隐形地考虑了文章的质量。本文模型暂且不考虑权重问题,后续研究中再加入权重[6-7]。

考虑到教师年龄和职称的问题,采用平均数。设置统一数据指标:将每名教师每篇文章的被引用次数首先按7大洲划分统计,相比于其他洲,亚洲的相对引用次数比较高,故再将其进行详细划分为东亚、南亚、西亚、北亚、东南亚、中亚6个地区。每名教师每篇文章被他引一次(教师引用自己文章的次数忽略不计),则在他引文章第一作者所在地区下加1分(多名作者时以第一作者所在地为数据统计依据)。例如,一名教师在东亚地区的总引用次数是n,截止到某一时间该教师共发表m篇论文,则该名教师的论文在东亚地区的平均引用次数为n/m。

讨论某大学数学与科学学院8名教师学术实力的排名问题,在谷歌学术网站上统计了8名教师截止到2015年12月所有论文的平均引用次数如下所示(结果保留4位有效数字)。

U是一个行为各个地区平均引用次数且列为每名教师的矩阵,0表示该地区没有引用该教师的文章。在北亚地区8名教师的平均引用次数均为0,故都忽略不计。教师1在东亚地区他引总次数n=631,截止到2015年12月其发表文章总数目 m=65,故 u11=n/m=631/65≈ 9.707 7,u11=9.707 7表示教师1在东亚地区论文的平均引用次数是9.707 7,其他同理。

通过矩阵U可以看出,在东亚、南亚、欧洲地区对8名教师论文的平均引用次数相对高于其他地区;教师1,5与6在各个地区的他引平均数明显高于其他教师,可见这3名教师的论文质量相对高于其他教师,学术水平应该比较靠前。通过最后一行总平均引用次数指标,对8名教师进行一个简单粗略的排名,教师6排名最高,教师8排名最低。为充分挖掘数据背后隐藏的信息和提高排名的精确度,分别采用科利法与基纳法建立排名评价模型。

2.2 模型一—科利法

科利法仅使用教师在对比过程的胜负信息建立科利评价模型Cr=b,根据(5)式可得到

根据矩阵U,可知教师1一共与其他教师进行了30次交手(18场获胜,12场失利),其中2次与教师2,3次与教师3,5次与教师4,与教师5和6是7次,与教师7和8是2次。其他6名教师的科利方程同理,写成矩阵形式如下

采用Matlab软件求解科利系统Cr=b以获取科利评分向量r,具体见表1。

表1 8名教师的科利评分和基纳评分及排名

由表1可知,每名教师的初始评分都是1/2,随着“比赛”的进行,每名老师的评分将根据“比赛”结果(平均引用次数)在这个中心点上下波动。所有评分ri的平均值rˉ恒为1/2,故科利法具有守恒性。此外,科利法最引人注目的一点是它通过忽略比分实现了无偏性,即能够避免因强队在弱队身上获取高分数而带来的潜在问题。

2.3 模型二—基纳法

由于统计了每名教师文章多个地区的平均引用次数,相当于他们之间交手不止一次,故选择sij是在所有地区的平均引用次数对比中教师i从教师 j所赢取的累积得分,根据矩阵U可以得到矩阵S为

例如,s15=(9.707 7-6.631 6)+(0.815 4-0.228 1)+(0.230 8-0.140 4)+(0.076 9-0.070 7)=3.760 5,表明教师1从教师5在所有地区的平均引用次数对比中赢得3.760 5分,而s21=0表明在对比过程中,教师2全战败,记为0分。

8名教师之间都进行了相同数量两两对比,即每名教师都与其他7名教师进行7场较量,故规范化不必进行。因为A2>0,所以矩阵A是素矩阵且不可约,无需进行扰动。通过上面对数据的各种修补,可知基纳法的灵活性,可对排名进行很多的变动和微调。建立基纳法的基本方程Ar=λr,用Matlab软件求得该方程的唯一解λ=2.619 1,以及与λ相对应的唯一评分向量r,具体见表1。

从表1中可知8名教师的评分0<ri<1且,评分之和为1意味着一名教师的评分提升时,必然会有另一名或多名教师评分的随之下降,评分值之间始终维持一种平衡。

通过比较两种方法的结果(表1)可以看出,教师6排名最高(其学术水平在一定程度上应为最高),与之前根据总平均引用次数指标得出的结果一致。虽然两种模型最终的评分值都不同,所得排名结果稍有出入,但最终排名效果比较稳定,以上排名结果符合现实生活中人为主观对8名教师的大致排名。高校依据以上的排名结果对教师资源进行合理且充分配置,对提高等教育质量具有重要意义和参考价值。

3 总 结

学术论文是反映科研成果的最直接载体,为了保证教师学术实力的充分展现和公平评价,本文选取教师发表文章的平均引用次数作为衡量指标,并对其进行统一科学量化,建立科利与基纳模型分别得出排名结果。与国内外已有的研究相比,本文方法具有以下特点:(1)将通常用在体育类竞赛中的排名方法转化应用到教师排名领域;(2)在统计数据及数据预处理中,为形成成对比较矩阵,将文章的引用次数按地区进行详细划分,如同每个用户为影片的打分;(3)两种方法都不受教师数量、教师文章引用次数的限制,具有很好的开放性和普适性;(4)相比于目前评价系统选择论文数量作为指标,文章的平均引用次数更加合情合理。

当然本文的评价指标和研究方法在使用中还需进行修正和完善。除论文的发表能力和被引用次数,承担国家各项研究项目情况、撰写书的情况等都在一定程度上反映了一个人的学术能力和科研水平。此外,就论文的平均引用次数这个指标数据有待进一步合理量化,考虑到引用者的重要性,即一名教师越是被资深著名学者引用,那他的排名就应该越靠前,就好比一篇论文被诺贝尔奖得主所引用,显然比被普通研究者所引用更说明有价值;考虑研究领域的难易程度,一作,二作以及独作之间的差异等,可为这些差异赋予合理的权重,因此,将来会进步优化评价模型。

参考文献:

[1]LANGVILLE A,MEYER D.Who’s#1?,the Science of rating and ranking[M].Princeton :Princeton University Press,2012:21-50.

[2]COLLEY N.Colley’s bias free college football ranking method:the colley matrix explained[D].Princeton:Princeton University,2002.

[3]FELLER W.An introduction to probability theory and its applications.Vol.II[M].New York:Wiley,1968:99-124.

[4]KEENER P.The perron-frobenius theorem and the ranking of football teams[J].Siam Review,1993,35(1):80-93.

[5]MEYER D.Matrix analysis and applied linear algebra[M].SIAM:Philadelphia,2000:34-49.

[6]彭张林,张强,杨善林.综合评价理论与方法研究综述[J].中国管理科学,2015,23(S1):245-256.

[7]李红,朱建平.综合评价方法研究进展评述[J].统计与决策,2012(9):7-11.

猜你喜欢

科利实力次数
2020年,我国汽车召回次数同比减少10.8%,召回数量同比增长3.9%
劳动不丢人
最后才吃梨
实力抢镜
俄罗斯是全球阅兵次数最多的国家吗?
王晓晨:逆袭靠实力
提升文化软实力是当务之急
场上拼实力,场下拼表情,就这么拼了
从尼科利奇访华看中塞关系特点