正规得分规则及其在预测问题中的应用
2014-05-30钱昆
[摘要]得分规则(scoring rules)可以很好地对预测结果的“质量”进行评价,它是一种可以用来衡量和测评预测结果好坏程度的方法。它可以通过给定一种“规则”,对各种预测方案进行赋值打分,选择其中得分最少的来确定最佳预测方案,这一方法在诸如天气、比赛结果等方面的预测有着很好的应用。
[关键词]预测;得分规则;正规得分规则;应用
一、正规得分规则的定义
“得分规则”一词的首次出现是Good在1952年发表的一篇关于“合理决策”问题的文章中,而后Winkler于1969年讨论了得分规则在被用来评估概率预测和被用来推导方面的区别,而正式的关于得分规则被用来做推导的研究可以在Savage和Lindley的文章中看到, Bernardo和Smith于1994年做了相关的补充[2]。此外,正规得分规则还可以用来引导出个人的主观概率,Savage运用数学的方法推导出了可以用来推导出个人主观概率的正规得分规则的一般表达式,也就是所谓的球形得分规则。
Giovanni Parmigiani等[1]在《决策理论与方法》中提到针对一件未知事件θ设定一个赌局,在保证赌局设定方一定获利的前提下给出一個赔付比q:(1-q),双方按照按设定的赔付比各自支付赌金,赌金之和作为一次赌局的奖金总额S,最终由赌赢的一方获得奖金。显然,从赌局制定者的角度考虑,如果θ最终发生了,即θ=1,那么卖方将有收益-(1-q)S,如果θ最终没有发生,收益为qS。而作为赌局的赔付比制定者,他自己也有着对于事件θ是否发生的一个主观概率π,那么在这种情况下赌局制定者的期望收益为,显然,当取q=π时,赌局制定者的期望收益为0,此时的q=π是期望收益的一个临界值,而根据预期效用最优化原则,此时赌局制定者的预期效用最大。在这种得分规则下的赌局制定者的期望得分也达到最小。因此,正规得分规则的定义为当且仅当存在一个正数π,使得成立时,我们称之为正规得分规则,且当π为唯一值时,此时的得分规则被称为严格正规得分规则。
二、几种常见的正规得分规则
自Good于1952年首次提出了正规得分规则这一概念并给出了第一个正规得分规则的数学形式以来,诸多学者根据不同的统计分析需要不断提出了一系列的其他的正规得分规则,如二次得分规则、球形得分规则等。
①对数得分规则(logarithmic rule),最早由古德于1952年提出来的,也是最早的一种正规得分规则,其数学形式为:该得分规则最初是被用来计算负熵值对得应的一种得分规则。这种得分规则的计分方法只与众多状态中最终发生的状态有关,而与其他未发生的状态无关。实际上,这种得分规则也是一种较为严格的得分规则—局部得分规则的典型代表。
②二次得分规则(Quadratic scoring rule ),是正规得分规则中最著名的一种得分规则。它最初是由Brier在研究天气预测问题中的证明时所提出来的,而它的数学形式则是由Savage(1971)推导出来的,具体形式为:,其中,,。这种得分规则的最大优点是可以通过修改系数A,B的值来实现其灵活应用。Selten于1998年对它进行了公理化的论证[4]。
③球形得分规则(Spherical rule),它是由Savage于1971年首次提出的,它是球面得分规则下的一种特殊情况,其具体数学公式为: 。
三、正规得分规则在预测问题上的应用
正规得分规则在预测问题上的应用非常广泛。本文选取了NBA2013-2014季后赛总冠军的归属作为预测事件θ,某博彩公司将为两支球队的夺冠可能性设定赌局,使得博彩公司的盈利最大。总决赛的对阵双方为迈阿密热队和圣安东尼奥马刺队,这一事件只存在两种状态θ1和θ2(θ1表示热队夺冠,θ2表示马刺队夺冠)。博彩公司要根据两队的球员实力和状态、教练的经验、主场优势、以及个人的偏好等因素给出两队的胜率。此处,将每个预测人员给出的两队的胜率预测表示为q1和q2,而每个预测者的个人主观胜率表示为π1和π2,那么博彩公司到底应该根据哪个预测者的预测结果去设定一个赔付比,才能使期望受益最大呢?而预测者应该怎样给出自己的预测概率才能使自己的预测结果最为精确呢?我们可以为每个预测者设定一个得分(q-θ)2以表示预测结果与实际情况的偏差,那么按照这种得分规则下的每个预测者的期望得分为:
显然,取q1=π1时,预测者的期望得分最少,那么博彩公司到底应怎样从中选取最合理的预测结果呢?为此,本文选择了具有代表性的ESPN部分专家的预测结果代替并选择最具代表性的二次得分规则作为计算每个预测者的期望得分的方法。因为事件θ有两种状态,因此,并取。那么此处的得分规则为。
我们不难算出在此得分规则下的每个预测专家的期望得分,得分结果如表1所示:
表1在二次得分规则下每个专家预测的两队胜率及期望得分
显然,前后分别有四位专家是预测热队和马刺队将会夺得总冠军,前四位专家中Thorpe得分最低,后四位专家中Torres的得分最低,按照得分最少预测效果最好的原则,应分别取这两位专家的预测概率作为设定两支球队是否夺冠的赔付比,而根据正规得分规则的定义,我们认为每个专家所给出的预测概率均为个人的主观概率,那么博彩公司最终为热队和马刺队设定的赔付比应为2.45:1和3.17:1。按照这样的赔付比来设定赌局能保证博彩公司能够始终盈利。
四、总结
得分规则作为决策理论中的一个重要方法在对未知事件的预测方面有着广泛的应用。本文将正规得分规则的原理运用到NBA等体育赛事结果的预测上。在研究过程中,部分假设合理化了一些因素,且未能考虑到不同预测者之间的综合影响,所以可能与实际情况有所偏差,这些也正是今后还需改进的地方。
参考文献
[1]G. Parmigiani., Y. T. Inoue. Decision Theory: Principles and Approaches, pp.191-198
[2]T Gneiting and A. Raftery. Strictly Proper Scoring Rules, Prediction, and Estimation
[3]ESPN中文网. http://www.espnstar.com.cn
[4]Stein. Estimation of the mean of a multivariate normal distribution, Annals of Statistic 9: 1135~1151.
作者简介
钱昆 单位:南京财经大学 省市 :江苏南京。