2016-2017赛季欧洲足坛那些亮眼数据(一)——一个
五大联赛重燃战火,每一家具乐部都会为我们带来更多激情碰撞和经典对决。从 2016-2017 赛季开始,我会在欧锦赛期间继续这个系列,每周(大概)为你带来欧洲足球产生的令人眼花缭乱的数据。
在新栏目开始之前,首先给懂球的大家介绍一下当今足球中的各种数据是如何产生的,它们的作用是什么,它们的局限性是什么。正好作为介绍,也希望以后能做一个问答索引,供大家收藏。
(图)2012欧洲杯2012德国vs希腊投篮统计
[压倒性的数据从何而来]
在当今在线咨询的时代,每场比赛结束后,从微博、微信到了解球,球迷们都能迅速接受各种数据的洗礼。很多人也有一个疑问:数据是怎么计算出来的?有人猜测是收藏家拿着一个小笔记本在上面刮,也有人猜测是电脑程序控制了一切。恭喜你,你没事。
根据数据类型和用户需求的不同,足球场上的数据基本来自以下三种形式。
首先是人工统计。数据采集员观看比赛直播或观看高清转播,手动记录射门、传球、抢断等重要事件,并标记球员、起止点、时间等相关内容。经过系统的整合和分类,最终形成了下面这个粉丝非常熟悉的数据图。
(图)2016年欧洲杯2016威尔士vs比利时交叉统计
在足球统计的早期,这样的统计是由一个人单独完成,或者由两个人负责比赛的每一方。随着数据公司的发展和用户对准确性的更高要求,如今的数据采集基本采用“一人配多人”的方式。至于“是射门还是传球”之类的争论,由投票决定结果。
除了变得更加准确之外,这类数据也变得更加直观。例如,系统会根据采集者输入的数据,自动绘制如下图所示的玩家活动热图。
(图)2016年欧洲杯揭幕战坎特活动热图
这就是著名的数据提供商OPTA完成收集和统计工作的方式。他们平均每个会话收集大约 1,500 个数据。我们比较熟悉从 OPTA 导入数据进行分析的网站,例如 WhoScored 等。
但是,手动统计有一个明显的缺点:只能计算球活动。无论是无球状态下的相关动作,还是跑动距离等数据,肉眼观察是无法统计的。因此,这类数据的主要服务对象是媒体和球迷,真正为球队提供数据服务的公司,以及其他更高的统计方法。
第二种是高速摄像机。多台专门设计的高速摄像机安装在体育场的各个位置,通过光学跟踪算法自动提取球员和足球的运动轨迹,使程序可以完整计算包括跑步距离在内的实时数据,并连跑步都可以细分。对于慢跑、快跑和短跑等每个子项。
在实践中,这样的自动化过程有时仍需要人工干预,例如两名玩家之间的近距离战斗。但即便如此,高速摄像头采集的数据绝对不是纯人工统计一个数量级,也受到很多俱乐部的欢迎。
这项技术的领导者是 Prozone,它成立于 1995 年,现已被 STATSports 收购,以下段落也将对此进行介绍。
(图)2016年欧洲杯单场跑动最多、每90分钟跑动最多的球员是意大利老将帕罗洛
这种方法也有其自身的局限性:整个系统必须安装在体育场内。也就是说,要收集这些数据,必须征得俱乐部的同意,而要在整个比赛过程中进行横向比较,则需要与主办方乃至足协协商。另外,不同提供商光学算法的差异也可能导致最终数据存在一定程度的误差。
第三种,传感设备。近年来,一个新现象逐渐引起了舆论的关注,那就是很多球员在训练甚至比赛中都穿着黑色短背心,球迷们也形象地称其为“Bra”。
穿这件黑色背心的意义在于收集球员在运动过程中的各种数据。背心正面有一条心率带,可以随时监测球员的心率、运动负荷等身体数据。背面是整个系统最关键的GPS模块,可以测量跑步距离、实时速度、反应速度、配速平衡等一系列精细复杂的内容。
2015年7月,FIFA正式允许球员在比赛中佩戴感应装置,“黑背心”迅速成为各大豪门和国家队的标配。近 30 支英超和英冠球队成为 STATSports 在北爱尔兰的客户,包括曼联、曼城、阿森纳、利物浦、托特纳姆热刺等。巴塞罗那和他们做出了同样的选择,而切尔西、皇家马德里、巴黎、尤文图斯、米兰二人组则从澳大利亚购买了 GPSports 智能运动内衣。
提到这类数据的缺点,首先是价格昂贵。为整个团队配备“黑背心”的成本已达数十万欧元。在不太富裕的地区发展。对于豪门来说,最大的问题是他们只能收集自己球员的数据,无法与其他球队的球员进行比较。
这三种类型的数据有不同的用途。他们如何改变足球比赛?
【怎么用也是一门学问】
前面必须要写的是,数据只是帮助人类做出主观判断和得出结论的辅助手段,目前的技术水平还远未达到还原游戏全貌的水平。换句话说:数据永远不会骗人,但现阶段,列出的所有脱离现实的数据都是流氓。
在以上前提下,我们来看看数据究竟给球队、球迷和媒体带来了什么。
对于球队来说,数据可以提供的帮助主要包括两个方面:转会决策和战术安排。让我们先谈谈转会决定。目前,包括曼联、巴塞罗那、拜仁和尤文图斯在内的欧洲豪门都是在线球探平台Scout7或WyScout的客户。这些网站可以提供数百个联赛(包括低级别)的球员视频和统计数据,可以为俱乐部的引援提供参考。
有一些著名的例子:温格第一次签下弗拉米尼是因为他在马赛的第一个正式赛季中单场跑了 1.40,000 米。而南安普顿愿意将克莱因卖给利物浦,因为他们的分析团队找到了一个数据非常相似的替代者——当时效力于里斯本竞技的塞德里克·苏亚雷斯。
还有一些关于引援和替补的研究可能有助于未来的转会。多位学者统计了2012-2013赛季西甲所有球员的跑动数据,试图找出跑动风格与梅西、哈维和C罗最相似的球员。
结果非常有趣。与梅西跑位最相似的球员是那个赛季效力于马拉加的萨维奥拉。没错,就是巴萨俱乐部和球迷一直不愿承担的“兔子”。最接近哈维跑动风格的是队友蒂亚戈,他在那个赛季结束后被瓜迪奥拉带到了拜仁,现实和数据联系在一起。
克里斯蒂亚诺·罗纳尔多跑动风格最多的球员可能会让很多人感到惊讶:贝蒂斯的鲁本·卡斯特罗。不过,卡斯特罗在过去的6年里为球队打进了4个西甲和2个西甲赛季的122球,而他在西甲的单赛季进球数从未低于两位数。被称为“穷人版的罗纳尔多”。
一个更惊人的故事即将到来。在与 C 罗的跑动最相似的球员中排名第二的是格列兹曼,他当时也在皇家社会效力,现在在整个欧洲都很有名。
当然,在现实世界的签约中过于相信数据并不一定能达到点球成金的效果。利物浦曾经很看重“对方半场关键传球”和“对方禁区内抢断成功率”的统计数据。他们签下了唐宁和查理亚当,但他们未能在安菲尔德证明自己。
作为红军德比对手的前任主帅,著名的“数据控”马丁内斯对此可能有更专业的态度:“如果在德比中被要求主罚点球,他会如何反应?如果是语言不通 一个外国玩家,老婆天天喊回国,他会怎么做?玩家一般都是老公和爸爸,但是数据控制不了这个。”
所以,马丁内斯在收到球探部门编制的签约名单后,会先用数据过滤掉不合适的球员,然后通过谷歌、推特和脸书收集所有关于他的新闻和信息。意见,并最终决定是否要约。虽然上赛季因为战绩不佳而将工作丢给了埃弗顿,但马丁内斯的理论已经被很多年轻教练抄袭了。
数据对团队的帮助也可以体现在战术安排上。 1983年在美国踢球的新英格兰队主教练萨姆·阿勒代斯发现,共享训练基地的NFL球队坦帕湾海盗队经常使用数据分析来制定战术,他对此产生了兴趣。 Prozone一出世,他立刻成为了第一个客户,并开始探索数据与战术的结合。
在执教博尔顿期间,大山姆从 Prozone 订购了一个特殊版本,并聘请了一支年轻、受过高等教育的团队进行研究和分析,最终转化为一种需要无球跑动和极度专注于定位的战术件。风格。从2003年到2007年的四个赛季,他的富勒姆始终保持在英超前八,可谓是真正足坛最早的“点球”。
在大山姆组建的数据分析团队中,三位年轻人依然活跃在英超世界,他们先后成为曼城的数据分析总监、技术球探、利物浦的转会总监。前人种树,其他人乘凉。年过六十的阿勒代斯不再是足球数据的引领者opta足球数据官网,但他对欧洲足球产生了深远的影响。
今天,阿森纳收购了数据分析公司StatDNA,为温格的赛前准备、赛后分析和技战术变革提供全面帮助。曼城组建了11人的数据部门,并与大学等研究机构签署了多项合作协议,旨在成为“大数据时代”的引领者。
这股从英超兴起的浪潮也开始席卷欧洲大陆。从拜仁到皇马,从巴萨到尤文图斯,基本上所有豪门近年来都建立了数据分析部门,并与各个专业厂商达成合作。协议。
几乎在国际足联允许球员佩戴传感设备的同时,巴萨让梅西在正式比赛中穿智能运动内衣,目的是为了收集心率等数据来判断他是否在美洲杯比赛中完全康复筋疲力尽之后。
Prozone 已在 150 多个俱乐部的主场安装了摄像头分析系统,覆盖了五大联赛的大多数球队,为他们的分析部门提供了实时的逐场比赛数据。在安联球场,Prozone与软件巨头SAP合作,为拜仁提供数据定制服务。去年,该设备扩展到整个德甲。
利用这样的数据,不仅可以监测队员的身体健康状况,避免不必要的伤害,还可以在判断状态好坏、有针对性的安排、寻找球队等多方面为排队提供信息。缺点。帮助。
当然,必须再次强调,数据只是辅助,主教练的决策依然是战术世界的关键。
【从兴趣到事业,普通人也有机会】
由于无法获得Prozone、STATSports等公司提供的专业数据(除非你愿意花几十万欧元),公众基本上只能从OPTA相关渠道或一些官方新闻中获取部分数据。这些数据大部分来源于人工统计,对于整个比赛产生的专业数据量来说,只是沧海一粟。
这样的沧海一粟,显然不能代表足球的全貌,但足以满足大众对足球数据的好奇,作为深入了解足球的切入点。
对于球迷来说,数据是从假球迷到了解比赛的球员的途径之一。随着观看次数的增加,很多人都会对比赛的走势、无球跑位、战术调整产生浓厚的兴趣。如果你回过头来发现“某位防守型中场上场后右路进攻比例从31%上升到57%”、“30分钟后主队控球率从56%下降到42%”这样的数据”,然后想想中场完成抢断后,第一次传到右侧,主队开始一波猛攻,然后迅速回防。我也会对教练的阵型有所了解。
或者,在一些“意见不一”的巨魔面前,你可以拿出十几条数据,扇他们耳光。有过这样经历的人,一定会明白其中的乐趣。
如果你深入研究,甚至有可能将爱好变成职业。
Prozone 在多个国家/地区设有教育基地,为普通球迷和俱乐部工作人员提供有关如何使用数据的专业培训,并向成绩优异的人颁发证书。在这个科学分析越来越流行的时代,很多数据专业人士通过这个渠道找到了进入职业足球领域的机会。
想象一下,如果你能成为俱乐部分析部的工作人员,当主教练对球队的进攻无能为力时,你交出的报告是这样的:球队防守到进攻的平均速度是4.1m/s,而全联盟的平均是6.6m/s,也许尽量给青年队一个带球最快的机会。
成为穆里尼奥的知己并非不可能。
你可能会觉得这样的事情离我们很远很远。但实际上,广州恒大、上海上港、杭州绿城等俱乐部已经有专人负责数据整理分析,还有“武磊下半场跑得比上半场快”,可以帮助战术安排实际应用。起步虽晚,但未来可期。
对于媒体来说,数据是解释、分析和总结比赛的好帮手。如今,球迷们已经不再满足于直截了当的报道方式,对围绕比赛进行全方位报道有了自己的顾虑和需求。在评估游戏或玩家时,数据可以为媒体人的观点提供强有力的支持。
已经成为著名评论员的枪手球星亨利对吉鲁有这样的评价:“够好,但还不够好。”而他拿来作为证据的就是这些数据:吉鲁的头球是成功的。场均关键传球命中率和场均关键传球均在英超中锋中名列前茅。投篮命中率和场均投篮命中率都在逐年上升,但错失的绝对得分机会的数量也是整个英超联赛中最高的。有理有据。
正如我在本文开头所说,我将为您带来新赛季欧洲足球的一些有趣的每周统计数据。在这里opta足球数据官网,我们先来介绍一些未来可能会出现,粉丝还不太了解的术语。
【答题要点及时间】
除非另有说明,以下解释仅针对 OPTA 统计数据,可能与其他公司或组织的定义有所不同。
创造的机会:指成功传给队友并导致射门的传球。最终导致进球的称为助攻(Assist),为队友创造射门机会但未能得分的称为助攻。关键通行证。需要注意的是,只要将球成功传给队友,即使队友带球后射门,仍会被视为创造机会甚至助攻。比如下面欧洲杯英格兰对斯洛伐克的比赛统计中,出现在本方半场的关键传球,是队友一路带球到禁区前沿再带球的结果。远射。
此外,在 OPTA 目前的统计数据中,只有传球才能导致助攻。因此,在葡萄牙欧洲杯半决赛战胜威尔士的比赛中,罗纳尔多禁区外的远射被纳尼捅入球门,不算助攻,但被算为射门偏出。但是,根据欧足联的规定,这个球被罗纳尔多算作助攻。
进攻三传:字面意思也可以翻译为进攻三传。所谓进攻三区,是指将球场垂直一分为三后,距离对方球门最近的1/3区域。事实上,这种划分方式在中国一直比较容易解释,即后场、中场和前场。因此,包括BBC在内的媒体在其中文版中,直接将进攻三区接球点的传球翻译为“前锋传球”。
还有一点很多人不知道的是,传中球、任意球、角球、界外球、守门员罚球、球门球这六大类不计入传球次数。因此,像“克罗斯全场传球次数超过 100 次”这样的统计数据实际上并没有包括他的边路传中和定位球。
平均决斗获胜率:指赢得一对一比赛的玩家的百分比。目前,这个数据可以细分为以下四项——抢断成功率、犯规占犯规的比例(犯规+犯规次数)、运球成功率和头球成功率。整体对抗成功率是以上四项的成功次数与总项数之和的比值。
因此,梅西上赛季联赛对抗成功率的计算方法如下:抢断成功(7次)+犯规(60次)+带球成功(117次)+头球成功(5次) = 189,总抢断次数(24)+总犯规次数(73)+出手次数(190)+头球次数(14)=301,结果是189/301=62.79%。单个游戏中的数据也是如此。
铲球:指球员在一对一铲球中赢得对抗并拿到球或将球踢出界的行为。也就是说,如果防守队员伸腿从运球者手中抢断球,但刺伤了对方球员,在统计数据中不算抢断,而是抢断失败。
但是,这只是 OPTA 和 FIFA 统计数据中的一个概念。在欧足联的统计中,Tackle指的是铲球,即“通过铲球完成的抢断”,因此他们在欧洲杯期间的官方数据通常只给出一场比赛中两到三个球队铲球。
拦截:指防守队员在对方传球时阻止球传给目标的行为。因此,将对手的传球打出界外的防守也算作拦截。目前此数据不计入故障。
Clearance:当球员受到压力时将球踢出防守区域或将球推出防守区域的行为。在没有压力的情况下破坏球只会被视为抢断或拦截,而不是解围。此外,如果将球直接传给防守区内的对手,则一次解围将被视为一次解围失败。
您可能已经注意到,抢断、拦截和解围之间的差异是微妙的,而且很容易引起争议。当出现“这是抢断还是清场”的问题时,如上所述,最终结果将根据收集者的投票决定。
回球:也常翻译为“反抢”。事实上,这是一个相当笼统的概念,各方定义不同。 OPTA对此的官方解释是“球员重新找回丢失的球或球直接回到他的控制之下”。
很难理解吗?其实根据目前的统计,大致可以理解为:当一名球员接到传球或运球时,对方做出防守动作但没有形成抢断或拦截,之后回到自己身边短时间内丢球。
这不是更难理解吗……好吧,用 GIF 来说明可能更简单。让我们仔细看看博格巴在欧锦赛揭幕战中的两场全场最高的 12 回合。
案例A:萨尼亚将球给博格巴,罗马尼亚球员上前盯防,虽然皮球碰到了罗马尼亚球员,但他没有完成任何抢断动作,博格巴随后控球,算1控球权球。
案例 B:当博格巴运球时,罗马尼亚球员进行了身体接触,但没有做出任何抢断动作。然后足球击中了球员的身体并弹出了界外。博格巴又拿到了 1 球,把球拿回来。
所以,“防盗”的翻译可能并不准确。夺回球权并不是我们字面上理解的“被抢断后取回”(其实这样的情况都会分别算作抢断),而是指“丢球后立即夺回球权”。此统计也不属于防御类别,在主要统计网站上被归类为进攻类别。
折磨,不是吗?是的,由于缺乏统一严谨的通用标准,足球界的数据体系还存在很多争议和误解。但是,任何新事物的发展,都必然要经历一个不断更新完善的过程。足球是否会迎来“大数据时代”,让我们共同见证。