新智元报道
编辑:Cris
小组赛刚刚过半,本届世界杯便已迎来「大结局」?千万不要小瞧这个 AI 黑科技!
说起 2010 年南非世界杯的最大网红,一定非「章鱼保罗」莫属!
这只位于德国海洋生物中心的神奇章鱼,不仅成功预测了德国队全部七场比赛的结果,还顺利地选出了最终的总冠军西班牙队。
不幸的是,保罗已经永远地离开了我们,但它的「遗产」却在人们预测足球比赛结果的尝试中持续存在。
在艾伦图灵研究所(The Alan Turing Institute),随着 2022 年卡塔尔世界杯的持续进行,三位研究员 Nick Barlow、Jack Roberts 和 Ryan Chan 决定用一种 AI 算法预测今年的冠军归属。
预测模型
图灵研究所的统计算法基于一款衍生于足球游戏《英超范特西》的模型「AIrsenal」(没错,从名字就能看出,该算法的发明者一定是阿森纳球迷)。
该模型借鉴了 Dixon 和 Coles 于 1997 年推出的足球预测经典模型。该模型将球队攻击强度、防守强度和主场优势考虑在内,并使用了贝叶斯统计计算比赛中最有可能得分的球队。
三位研究员调整了 AIrsenal 模型,使其更适合预测国际比赛的结果。
例如,每支国家队都最常与来自同一大洲的球队比赛,例如巴西自 2019 年之后就没有与任何欧洲球队比赛过。这可能会在预测来自不同大洲的球队之间的结果时产生偏差。
为了解决这个问题,研究员引入了不同大洲联合会间的「相对优势参数」,对模型进行了修正。
训练数据
为了精准预测 2022 年世界杯的冠军,首先需要用过去的数据对模型训练。
三位图灵院的研究员采用 GitHub 用户 martj42 编制的国际足球比赛综合数据库——该数据库记录了自 1872 年以来,每场足球比赛的详细结果。
在训练数据中,世界杯正赛(2002 年之后)和近期比赛的权重,要依次大于洲际锦标赛、预选赛和友谊赛。研究员还将 FIFA 官方排名输入到模型中,以提供对球队表现的最新估计。
值得一提的是,研究员也在新闻稿中说明,他们的模型并没有将「球员」、「点球」和「地点/天气/其他」等因素考虑在内,却仍然成功预测了 2014 年和 2018 年世界杯的冠军德国和法国。
预测结果
最终,通过这个 AI 模型以及 100,000 次实验结果,艾伦图灵研究所分别对「最终冠军」以及「英格兰和威尔士队的成绩」进行了预测,最终给出了两份报告。
最终冠军预测
通过上表我们可以发现,在 100,000 次测试结果中,巴西有接近 25,000 次都赢得了最终的冠军,夺冠概率大约为25%。
比利时和阿根廷分别是夺冠的第 2 和第 3 大热门,概率分别为18%和13. 5%。
此外,夺冠概率4-10 位的球队分别是法国(11%)、英格兰(7.5%)、西班牙(4.5%)、荷兰(4.4%)、丹麦(3.1%)、葡萄牙(3.0%)和克罗地亚(2.2%)——清一色是欧洲球队。
大英两兄弟成绩预测
根据 AI 模型对英格兰和威尔士队的成绩模拟,威尔士有超过一半的概率(52%)止步小组赛。
英格兰则情况稍好,只有 20% 的概率无缘小组出线,不过模型仍认为他们有 70% 的概率止步 8 强,并不看好「三狮军团」的夺冠前景。
不知这样的预测,远在英伦半岛的英格兰球迷,是否会同意呢。
其他模型同样看好巴西
无独有偶。
最近,来自卢森堡大学、慕尼黑工业大学和多特蒙德工业大学的联合研究团队,也利用 2002、2006、2010、2014 和 2018 五届世界杯的数据,结合各支球队的结构和各国 GDP 等参数对「随机森林模型」进行了训练,以此预测 2022 年世界杯的冠军归属。
最终结果显示,巴西队进入决赛的概率为23. 5%,并有15%的概率最终夺冠,在 32 强中高居榜首。夺冠概率2-5 位的球队分别是:阿根廷、荷兰、德国和法国。
联合研究团队 AI 模型对最终冠军的预测,与艾伦图灵研究所的研究结果如出一辙。由此看来,「桑巴军团」加冕第六颗星——还真是指日可待呢!
最后我们也必须承认,虽然利用 AI 去预测比赛结果具有一定科学性,巴西、比利时和阿根廷等球队也确实是本届大赛的最大热门,但模型绝对不可能将全部因素都涉及到。
无论 AI 模型有多精准,足球永远是一种随机游戏。
绿茵场上那波诡云谲的不可预测因素,或许才是我们喜欢、并深深热爱它的原因。
参考资料:
https://www.zeileis.org/news/fifa2022/
https://www.eurekalert.org/news-releases/971175
https://www.turing.ac.uk/blog/can-our-algorithm-predict-winner-2022-football-world-cup