APP下载

移除最高分最低分的均值统计理论研究

2018-01-02汪甜芳

赤峰学院学报·自然科学版 2017年24期
关键词:次序均匀分布新式

闫 铸,汪甜芳

(1.南京大学 工程管理学院,江苏 南京 210046;2.内蒙古工业大学 理学院,内蒙古 呼和浩特 010051)

移除最高分最低分的均值统计理论研究

闫 铸1,汪甜芳2

(1.南京大学 工程管理学院,江苏 南京 210046;2.内蒙古工业大学 理学院,内蒙古 呼和浩特 010051)

在竞技比赛中个人表现可以用裁判分数的平均值来评估.两种方法可以得到平均值.一种方法是直接取平均数,而另一种则是通过剔除最高分和最低分取剩下样本的平均值.后者在实际中得到了广泛的应用.本文建立了这种评价方法的统计理论,并与经典理论进行了比较.结果表明两种方法的准确性无显著性差异.只有当最高最低分代表少数评委的评价,并且被怀疑有一定的倾向性时,移除最高分和最低分才是合理的.该结果可指导实践中选择竞赛评委和评价方法.

次序统计量;均值;最高分;最低分

0 引言

近年来,随着各种选秀、比赛节目的增多,经常看到评委对选手进行评分来反映选手的水平,评委的评分方法主要分为两种:第一种是传统的评分方法,即对所有得分求均值定为选手的得分;第二种为新式的方法,即除掉得分中的最高分和最低分求均值定为选手的得分.目前,这种新式的去掉最高分和最低分再求均值的评分方法广受大众推崇,但是却很少发现有针对这种方法评价的理论研究,这种新式的评分方法理论上是否具有一定优势,相比较传统的方法能不能更精确地体现选手的水平,为此本文中从理论和数值上进行研究.

因为评委的打分是集中在一定区域的,均匀散布或呈现两头小中间大的趋势,所以可以将评委的打分近似看成是服从均匀分布或正态分布的,也就是说,可以将评委所打的分数看成是均匀分布或正态分布总体的子样.

在基于这两种分布,除掉最高分和最低分即为这一样本中除掉最大次序统计量和最小次序统计量,讨论传统方法选手的得分即为样本均值,而新式的方法即为除掉最大次序统计量和最小次序统计量后的样本的均值,针对这两种方法精度的比较,也就转换成了:对这两种均值的期望与方差大小的比较.

1 均匀分布情形

本节讨论上述两种评价方法的精度.

设评委的打分为 ξ1,ξ2,…,ξn,将其按从小到大排列为 ξ(1),ξ(2),…,ξ(n).假设评委的打分总体服从均匀分布,即 ξ1,ξ2,…,ξn是U(a,b)的容量为 n 的子样,ξ(1),ξ(2),…,ξ(n)为对应的次序统计量.令

1.1 计算 E()

因为η(k)的密度函数为:

所以

1.2 计算 Var()

根据(1.6),有

通过一些数学计算,容易得到以下结果:

根据协方差公式有:

因为(η(k),η(j))的联合密度函数为:

根据(1.7)和(1.13)可以得到

所以

1.3 比较 Var()和 Var()

当n≥3时,很显然以下不等式成立:

表1 和的方差

表1 和的方差

n Va Varξ)4 5 6 7 8 9 1 0 11 12 13 14 15 0.2500000 0.3200000 0.2000000 0.2804233 0.1666667 0.2334184 0.1428571 0.1966667 0.1250000 0.1687243 0.1111111 0.1471614 0.1000000 0.1301653 0.0909091 0.1164927 0.0833333 0.1052916 0.0769231 0.0959690 0.0714286 0.0881019 0.0666667 0.0813827

2 正态分布情形

假设评委的打分服从正态分布,即 ξ1,ξ2,…,ξn是 N(μ,σ2)的子样,ξ(1),ξ(2),…,ξ(n)是次序统计量.同样地,令为传统方法选手的得分为新方法选手的得分.

η(1)的密度函数为

η(n)的密度函数为

根据方差和协方差的定义公式:

η(k)的密度函数为:

此时E(η(k)),E(η2(k))可以写成如下表达式:

η(k),η(j)的联合密度函数为:

则 E(η(k)η(j))可以写成如下表达式:

D':(0<u<+∞,0<v<+∞),且 Jacobi行列式 J=1.则

表2 和的方差

表2 和的方差

n Var(ξ¯) Var(ξ~)4 5 6 7 8 9 1 0 11 12 13 14 15 0.2500000 0.301409 0.2000000 0.229054 0.1666667 0.185498 0.1428571 0.156094 0.1250000 0.134828 0.1111111 0.118704 0.1000000 0.106045 0.0909091 0.095839 0.0833333 0.087431 0.0769231 0.080385 0.0714286 0.074393 0.0666667 0.069234

当 n=4,5,…,15 时,分别运行程序并得到 Var()和 Var()的值,并将其值在表 2 中.(考虑到 Var()和 Var()都有系数σ2,在这里计算的值是分别提取系数σ2后的值.)

3 结论

通过以上分析知道,在评委的打分服从均匀分布或正态分布的情况下,令为传统的评分方法(即以所有评委打分的平均值估计选手的得分)中的选手得分,为新式的评分方法(即除掉分数中的最高值和最低值后的平均分计为选手的得分)中选手的得分,则有 E()=E(),Var()>Var().从以上结果可以知道,两种方法都能估计选手的真实水平,且在评委数不是特别大的情况下,传统的方法较新方法更能精确的反映选手的真实水平,也就是说传统的评分方法要优于新评分方法.

但现实生活中新式评分方式仍然大受欢迎,究其原因,更多的是防止评委偏袒,从而达到对选手的公平公正.

附录R程序

〔1〕John Verzani.Using R for introductory statistics,Chapman&Hall CRC Press,New York,2004.

〔2〕茆诗松,王静龙,濮晓龙.高等数理统计[M].北京:高等教育出版社,1998.

〔3〕Philippe Caperaa,Louis-Paul Rivest.On the variance of the trimmed mean.Statistics&Probability Letters 22(1),79-85(1995).

O213

A

1673-260X(2017)12-0004-03

2017-09-19

猜你喜欢

次序均匀分布新式
《汉纪》对汉帝功业次序的重构及其意义
新式汽车
接触压力非均匀分布下弯曲孔道摩阻损失分析
甘露/新式婚爱珠宝《爱will》放大你身上的幸福光芒
Cartoons
生日谜题
电磁感应综合应用检测题
新式可伸缩性布朗式架的改良及应用
放假一年
浅谈交换积分次序