大数据时代奥运会金牌预测模型初探
——以田径世界锦标赛成绩为例
2021-06-09袁俊杰
袁俊杰
1 研究目的
近年来,奥运会正日益成为许多国家增强国家软实力、提升国家形象的重要手段。准确预测各国奥运金牌总数和排名,对制订我国奥运参赛目标有着十分重要的意义,也是人们在奥运会前关注的热门话题。
随着大数据时代的来临,由已知推测未知的可靠性和精准性也随之提高。2012年,荷兰著名体育数据公司Infostrada(后被Gracenote公司收购)利用大数据技术汇总奥运会、世界锦标赛、世界杯(或同级别的比赛)等赛事成绩,将比赛名次、比赛时间距奥运会的远近、比赛级别(奥运会、世界锦标赛、世界杯)设定不同权值,利用某种运算统计预测出各国奥运金牌数。
比赛名次是由运动员自身发挥、对手在比赛中的表现、裁判的评定行为三方面因素决定的,每个方面的异常都会导致名次的变化。世界锦标赛是除奥运会以外的最高水平比赛之一,同场竞技,比赛环境相同,世界锦标赛的名次无疑是奥运会金牌预测的最好依据。以世界锦标赛为主的世界高水平体育赛事的名次与奥运金牌到底有什么关系?本文以田径为例,分析世界锦标赛名次与奥运金牌的关联程度,期望能利用相关权值来建立奥运金牌预测模型。
2 研究对象
田径世界锦标赛每两年举办一次,分别在每个奥运周期的第一年和第三年。本研究选取了1997-2019年间的田径世界锦标赛前8名(剔除非奥运项目)、2000-2016年奥运会的田径金牌获得者等数据进行研究分析。
3 研究方法
主要采用文献资料法、数理统计法、对比分析法、倒推法进行研究。
通过检索国际田径联合会网站(www.iaaf.org)的相关成绩数据,整理导入到Access数据库中,编写SQL语句结合Excel软件对数据进行统计,对比分析统计结果推算出一个公式,最后代入历史数据进行验证。
4 研究结果
4.1 世界锦标赛名次与奥运会金牌关系
统计结果表明,田径世界锦标赛的每个名次的运动员都有可能获得奥运金牌,每个名次获得奥运金牌的概率是不同的,基本上第一名获奥运金牌的概率最大。
奥运周期第一年的田径世界锦标赛的前3名运动员获得奥运会金牌的平均概率分别为19.3%、9.4%和5.1%;奥运周期第三年的田径世界锦标赛的前3名运动员获得奥运会金牌的平均概率分别为28.3%、16.3%和6.0%,明显高于奥运周期第一年的田径世界锦标赛。但4-8名的夺金概率在第一年和第三年并没有太大差距。
奥运周期第一年的田径世界锦标赛的前8名运动员平均能获得当届奥运田径金牌的47.2%左右,奥运周期第三年的田径世界锦标赛的前8名运动员平均能获得63%的奥运会田径金牌,明显高于奥运周期第一年的田径世界锦标赛。从近几届世界锦标赛看,前八名夺金概率隐有上升趋势。即使2015年田径世界锦标赛前8名运动员获奥运金牌最多,也仅为奥运田径金牌的72.3%。其余30%左右的金牌,被世界锦标赛前8名以外的运动员和未参加当届世界锦标赛的运动员获得。“黑马”频现,意外爆冷,这种不可预测性正是体育竞赛独特的魅力。
表2 各奥运周期第三年田径世界锦标赛前8名获奥运金牌概率
4.2 不同国家的世界锦标赛名次与奥运会金牌关系
近5届奥运会的田径比赛中,共有51个国家获得过金牌,其中仅有10个国家获得过5枚及以上金牌,即只有10个国家平均每届奥运会获1枚以上金牌。曾获得各周期第一年世界锦标赛第一名的国家中,有17个国家获得当届奥运会金牌;有12个国家虽未进入世界锦标赛前八,但各获1-2枚奥运金牌,希腊更是共获4金;曾获得各周期第三年世界锦标赛第一名的国家中,有27个国家获得当届奥运会金牌,有7个国家虽未进入世界锦标赛前八名,但各获得1-2枚奥运金牌。巧的是,各有9个国家虽然在第一年或第三年世界锦标赛上获得过第一名,但没有在奥运会上夺金。
表3 各国在奥运周期第一年的田径世界锦标赛上前8名获奥运金牌的概率
表4 各国在奥运周期第三年的田径世界锦标赛上前8名获奥运金牌的概率
从表中可以看出,在同一世界锦标赛的相同名次下,不同国家获奥运金牌的概率不同,并且与该项目的平均概率也不同。前10名国家中,奥运周期第一年和第三年世界锦标赛成绩中,美国、牙买加、英国和波兰第一名的奥运夺金概率都远高于平均值。古巴和埃塞俄比亚分别在第一年和第三年略高于平均值,其他5国则低于平均概率。前八名的夺金概率也各有一半国家分散在平均值两侧。
不同国家世界锦标赛前8名运动员夺得奥运金牌数占该国奥运田径金牌总数的比例也不同,这与该国奥运田径金牌总数和排名并没关系,有些国家的奥运田径金牌全部由世界锦标赛前8名的运动员夺得,有些国家世界锦标赛前8名运动员没有获得奥运金牌,反而由其他运动员爆冷夺金。
从世界锦标赛第一名的夺金概率来看,各国的奥运周期第三年的概率都明显大于奥运周期第一年的概率;同样,大多数国家在奥运周期第三年世界锦标赛的前8名运动员比奥运周期第一年世界锦标赛的前8名运动员能获得更多的奥运金牌,这与项目整体统计结果是一致的。
4.3 以世界锦标赛成绩预测各国奥运金牌的简单数学模型
根据上面分析,可以简单推出一个公式:G=(∑Rn·Vn)/P8(其中n=第1……8名;G=预测金牌数;Rn=世界锦标赛第n名的总数;Vn=世界锦标赛第n名获奥运金牌的概率;P8=世界锦标赛前8名获奥运金牌的数量占该项目奥运金牌总数的百分比)。
4.4 预测模型的验证
选取近5届奥运会各获5枚以上田径金牌的10个国家,根据上面公式来倒推各届奥运会田径金牌的预测值,以田径世界锦标赛第一名的总数作为参考值,进行对比分析,每个国家按照周期第一年世界锦标赛和第三年世界锦标赛计算,各得到5组数据,经比较得到表5。
表5 田径世界锦标赛第一名总数(参考值)、本模型预测值与实际值误差次数比较
从表5可以看出,美国、肯尼亚、英国、德国这4个国家,误差缩小的次数远大于误差增大的次数,按照公式计算出的数值明显比参考值更接近实际金牌数。俄罗斯、牙买加埃塞俄比亚等国家并不明显,误差缩小和持平的总次数略比误差增大的次数多,而波兰、中国、古巴则持平,误差缩小和持平的总次数基本与误差增大的次数相等。
从这几个国家的倒推结果可以发现,现在的统计误差比参考值都有不同程度的减小。因此,采用各国家每个名次的奥运夺金概率来计算金牌预测值是可行的,当然还需要进一步考虑主场因素、历史成绩等其他因素来调整权值。
4.5 预测模型的运用
根据2017年田径世界锦标赛的前八名成绩,用预测模型计算出这10个国家在2020年东京奥运会田径项目上可能获得的金牌数分别为:美国10枚,肯尼亚和英国各4枚,牙买加3枚,俄罗斯、埃塞俄比亚和波兰各2枚,德国和中国各1枚,古巴0枚。而根据2019年田径世界锦标赛的前八名成绩,计算出这些国家在2020年东京奥运会田径项目上可能获得的金牌数分别为:美国13枚,牙买加5枚,肯尼亚、英国和中国各3枚,埃塞俄比亚和波兰各2枚,俄罗斯、德国和古巴各1枚。这些结果留待日后验证。
表6 根据2017年、2019年世界锦标赛成绩预测的2020年东京奥运会田径金牌
5 结论与建议
1.对田径项目来说,世界锦标赛前3名的奥运夺金概率依名次递减,第1名的奥运夺金概率最高;世界锦标赛距离奥运会越近,第1名的奥运夺金概率越高;奥运金牌获得者并不一定是世界锦标赛的前8名运动员。
2.在同一世界锦标赛的同一名次下,不同国家夺得奥运金牌的概率不同。世界锦标赛距离奥运会越近,同一国家的世界锦标赛第1名的奥运夺金概率越高,世界锦标赛前8名运动员夺得奥运金牌也越多。
3.利用每个世界锦标赛名次的总数、该名次对应的奥运夺金概率、世界锦标赛前8名所获奥运金牌数占该项目奥运金牌总数的百分比来预测某个国家某个项目的奥运金牌预测值数是可行的。
4.建议对所有奥运项目的世界锦标赛、世界杯(世界杯总决赛)等世界最高水平的比赛名次与奥运会成绩进行对比分析,同时考虑奥运会各项目参赛名额限制和主场等其他因素,在大数据环境下完善预测模型,提高奥运金牌预测的准确率,为我国制定奥运目标提供数据支撑。