AI 在体育界有多不可靠?11 月苏格兰足球冠军联赛的赛场,AI 摄影机将边线裁判的光头辨识成足球,疯狂追了一整场。无论哪支球队进攻,哪个球员带球,AI 都视而不见,反而紧盯裁判光头不放,还时不时给个特写,全场 90 分钟的足球盛宴,在家看直播的球迷大部分时间都在围观一颗头。
「真想冲上去帮裁判戴帽子!」不少球迷吐槽。
由于直播画面一度非常糟糕,事后负责人还亲自发文向球迷致歉。
这是苏格兰因弗内斯足球足球俱乐部首次在直播赛事引入 AI 摄影机。採用 AI 技术原本是为了给球迷更好的观赛体验,因由于Cv新冠疫情大流行,广大球迷不能到现场看比赛。
没想到 AI 竟然翻车了,还翻得如此彻底。这件事情发生后,主办方採用 AI 技术时不得不更慎重,因为多次翻车事件让球迷都极度不满。
最近慕尼黑工业大学的研究人员更证实这点。他们利用机器学习分析球迷对 AI 技术的态度,结果发现:124 场英超联赛中,球迷差评率高达 41.1%,好评率仅 25.5%。
不过,这里的 AI 技术指的并不是 AI 摄影师,而是另一项应用──VAR。
影像辅助裁判 VAR
最近获得 2 次英超联赛冠军的足球运动员詹姆斯‧米尔纳(James Milner)在 Twitter 吐槽。
很明显,我们需要严肃讨论 VAR 的价值。不只我觉得目前的 AI 不适合大型足球赛事。
Milner 提到的 VAR,全称 Video Assistant Referees,是 AI 影像辅助裁判技术。採用 VAR 技术目的是:透过影像分析辅助主裁判,减少比赛可能出现的争议和误判。
不同于主裁判必须亲临现场,VAR 透过摄影机捕捉到的比赛画面分析判断,因此更可能关注到小细节,因比赛瞬息万变,仅凭主裁判肉眼观察难免出现争议。当然,只有主裁的判决有争议时,VAR 才会派上用场。比如出现球员犯规或越位、红牌判罚、犯规地点是否在禁区内、禁区内手球和犯规等情况时。
VAR 技术走向足坛是 2016 年,当时首次在美国职业大联盟预备队赛担任裁判助手,之后经过两年技术升级,2018 年国际足球协会理事会(IFAB)正式推出 VAR,随后开始大量用于各国比赛。
从近几年回馈看来,VAR 的表现让球员非常不满。
2018 年,国际足总俱乐部世界盃一场半决赛后,席内丁·席丹、加雷斯·贝尔、卢卡·莫德里奇、卡塞米罗等大牌球星纷纷吐槽:「VAR 把比赛搞得支离破碎。」
之前詹路易吉·布冯也公开表示:
我知道这项技术是实验性阶段。但当这个简单的工具,让比赛频繁中断,我感觉很糟糕,感觉像是打水球。
近日 2020 年英超联赛正如火如荼进行,Milner 也藉此表达对 VAR 的看法。
VAR 在比赛的综合表现如何,是否能继续使用,仅有球员回馈还是不够,观众和球迷的态度也非常重要。另外从科学角度来讲,评估技术辅助工具需要以科学研究分析。
鉴于此,慕尼黑工业大学研究人员利用机器学习技术进行科学分析。
被嫌弃的 VAR
体育赛事期间,有 79% 观众会透过社群媒体互动。最普遍的是在 Twitter 发文,对 AI 来讲是庞大且有效的检测资料库,且球迷推文是情绪检测的重要指标。
因此研究人员从 2019~2020 英超联赛 129 场比赛期间,使用官方 Twitter API 收集 643,251 条推文为研究资料库,其中 4,583 条推文为训练资料库。
另外,他们将观众情感划分为积极(肯定)、中立(无感)以及消极(吐槽)三类,并训练一个情感分类模型。
多种监督的机器学习演算法均适用训练短文本语料库的情感分类模型,研究人员使用梯度增强法训练基于树的模型,因为这种方法在此类问题的研究展现出最佳性能。
此外还採用三个进一步的分类模型:一是朴素贝叶斯分类器(Bayes Classifier),一个支援向量机(Support Vector Machine),另一个基于 Bagging 的随机森林(Random Forest)。
如图,研究人员对所有模型进行标準的 10 倍交叉验证。测试结果显示情感分类和主题检测(是否与 AVR 相关)这两个分类问题的 10 次交叉验证的性能度量。
主题检测方面,基于决策树的三种方法準确度都达 94%,且 F 值也没有太大差异;支援向量机的表现稍差,朴素贝叶斯分类器的精度值仅 71.0%
情感分析,模型达最高準确性值(70.8%),可以说此方法比传统增强方法和情感分类/主题检测(VAR)模型的性能都要稍好。
来看一下模型最终的分析结果:
4,583 条推文中,有 31.1% 标记为与影像助理裁判(VAR)相关。情感方面,有 25.5% 表示为积极情绪,而 41.1% 表示为负面情绪,其余为中立情绪。
研究人员比较 94 次 VAR 事件前后不同时间间隔的平均情绪,结果发现一旦发生 VAR 事件,平均情绪就会显着下降。
这代表採用 VAR 技术的赛事或与 VAR 相关的事件都会造成观众明显的不满情绪。
如何减少观众的消极评估,除了进一步提升技术减少乌龙事件,研究人员也提出两条建议:
- 足球协会 VAR 使用过程应尽可能确保透明度,即在球场同步公布 AI 评审过程资讯。
- 足球管理机构需要改进现行体制,实行质询制度,让比赛各方可透过现场投诉启动审查程序。
AI 赋能体育的可能性
可见基于视觉技术的 AI,在赛事直播和辅助裁判方面还不够成熟。
不过从现实考量来看,AI 想做好这件事确实不容易。因包括足球赛等任何大型体育赛事,不仅情势瞬息万变,涉及运动员众多,且场地也大,这些外在因素对 AI、硬体、演算法都有非常高的要求。
另外,这还要求系统必须有强大的后台大脑,能即时分析数据,在最短时间内提供最科学的现场报告,这点在辅助裁判方面尤为明显。虽然目前 AI 技术有明显的局限性,但并不妨碍赋能体育市场的可能性。
最近几年,AI 加速渗透到体育领域,多次翻车事件后,其实可看到 AI 技术不断升级优化,看到它在更多潜在应用场景的价值,如用 AI 分析球队打法、预防球员受伤、评价球员积极性等。
总之,热血澎湃的体育赛场需要 AI,只是一切得慢慢来。
- Twitter sentiment analysis suggests football fans would give video referees the red card
- Video kills the sentiment—Exploring fans’ reception of the video assistant referee in the English premier league using Twitter data