Tuesday, July 6, 2010

如果让科学家来选“国脚”

这人竟然是西北大学的,强大。
虽然远不能说做的有多大意义,但这个很有趣很MIT-style。

Sent to you by tony via Google Reader:


via 科学松鼠会 by 新京报·新知周刊 on 7/5/10


阿马罗在论文中列出了2008年欧洲杯三场比赛的球员评分示意图。
文/金煜
和篮球、棒球等相比,进球少的足球向来以难以量化出名,主观因素即让球场上变得风云莫测,但又同时给预测和评选等相应措施带来很大的不便。不过,且慢,谁说足球不能量化的?
美国学者阿马罗(Luis Amaral)不仅看球、踢球,还将自己的数学能力运用到足球中去,利用数学模型设计出一种"量化最佳球员"的计算方式。其结果基本符合欧洲杯的评价结果,现在世界杯正热火举行中时,他的"最佳球员"模式也正一路测试过来。
统计难度
集体运动更难量化

足球是世界上最流行的运动,但也是最难量化的运动。足球球场变化复杂,球的运动轨迹无从预测。相比之下,为得分较多的篮球和棒球比赛做数据统计就容易多了,你甚至可以计算出每个球员对整场球赛的贡献是多少。但是,足球更多是一门集体活动,每一粒进球都是集体合作的结果。12个人的合作到底是如何导致更好的进球表现的,这在数学上的解释依然相当之少。而对于全体队员来说,个人的表现到底该如何评判也很模糊。
"要量化足球是很困难的,很多表现只能凭借主观来评判。"前国安队总经理、北体大成教学院院长马冰说,"队员状态如何,传球、进攻、防守表现如何,都得靠人为判断。一般评选最佳球员都只能人为判断。"
不过,美国西北大学的化学生物工程教授,同时也是该校复杂系统中心成员的阿马罗和他一帮热爱足球的科学家朋友却不相信这点。"要测量一名球员的球场表现,必须'隐藏'在球队中才能进行:不管是从对方球队得球,还是传球给队员,个体球员都可能对全队造成极大的影响。"他们在6月16日发表于开放在线期刊《PLoS》上的研究中写道。
阿马罗在接受本报记者电话采访时说,从小就看球的他一直以来都对足球有一个困惑:"看球的时候,总有喜欢的球队和球员,因此在做评价的时候不免会有偏好。我们就想怎么可以客观地评价足球队和队员。"
量化球员表现并非第一次。"这些排行榜的问题是,并未与公认的其他评价标准进行验证。"
这份研究名为《量化球赛中个体球员表现》,阿马罗与合作者们以2008年欧洲杯为对象,分别对所有球员的表现进行了量化,评选"最佳球员"。其结果与体育媒体、球队专家、教练、俱乐部经理等普遍认可的主观评价一致。
主要指标
传球是核心数据

和对篮球的研究不同,他们的量化指标并非立足于进球数。事实上,现在的足球比赛中也会统计一些基本数据,比如射门次数、任意球数、助攻数等,而阿马罗小组的研究则侧重于传球的次数。
阿马罗介绍说,研究者将一支球队视为一个计算机"网络",球员之间的传球就是这个网络各节点之间的连接。当然,因为比赛的目标就是进球,因此,是否进球也成为被列入评价指数之一。"我们看球从最初开始运动到最后完成射门这一路的过程。"阿马罗说,"以射门结束的球的运动路线越多,球队表现就最佳;同时,以射门结束的球在某个队员中经过的越多,这名队员的表现也最佳。"
研究者们用数学模型绘制出了"网络"中各球员之间的球的流动,再加上射门的数据,形成最后的结果。模型只计算射门成功的传球,丢球、射失等都不计分,球每过一名球员(节点),这名球员就会得到1分。然后,数学模型会模拟运行几百万次,看网络中队员最后的平均得分是多少,高于平均值越多的球员,表现就越佳。
比如,在2008年欧洲杯德国对西班牙一战中,德国队后卫之间的"节点连接"非常多,但在中场和前锋之前却并不活跃;相反,西班牙队全场的连接都非常活跃。计算结果显示,西班牙队表现更佳,其最终以1比0胜德国。
数模的结果与欧洲杯的评价一致,西班牙得分最高,评分体系中得分最高的20名球员同样也是公认的欧洲杯前20名最佳球员。西班牙8号中场哈维在一场比赛中的得分最高,他的后卫队员拉莫斯则在所有比赛中的得分最高。"如果我们的测量方式不好的话,不可能结果和这么多专家的评估有如此惊人的一致。"他说。
阿马罗说,这个评分系统可以用在历史上的一些最佳球员的评价中,比如,足球历史上最著名的争论:真正的球王是谁,贝利,还是马拉多纳?
最新数据
梅西暂列最佳

这种计算方法是否会突出中场和前锋,而忽视以破坏对方进攻为主的后卫?阿马罗解释说,后卫可以降低对方球员的得分,此外,往往射门得分的连续传球都是从后卫开始的,后卫可以从对方脚下抢走球,发动新一轮的进攻,也可以通过很好的传球给中场和前锋创造机会。"你看我们对本届世界杯已进行的比赛的分析,得分高的常是后卫。"阿马罗说。
本届世界杯成为这个小组测试这个系统的最佳对象,它们对每场球赛都进行分析,并在实验室的主页上更新公布每场球赛,每个球队,每个球员的表现评估。到截稿前,阿根廷球员梅西得分最高。
那么,守门员怎么办?阿马罗表示,守门员是现在这个计算中唯一没法准确评估的球员,"守门员的角色跟别的球员都不一样。"
这个系统在欧洲杯的评估表现得很好,但以个人突破见长的南美球队是否会不适应这个系统?对此,阿马罗说,"巴西队也有很多传球,球队风格并不影响算法。并不是说这个系统更适合某支队伍。事实上,到目前为止,等级最高的是南美球队,韩国队也有很好的得分。"
即使如此,在现阶段,通过这个系统来预测谁最终会夺得大力神杯还有很多的不确定性。"世界杯到现在这个阶段,一个问题是,运气的成分还是很大。"他解释道,"比如西班牙和瑞士的比赛,西班牙踢得很好,有很多机会可以攻门,但都运气不好没攻入。美国队和英国的比赛也是这样。运气起到了很大的作用。"
"足球比赛就是这样,即使很努力,但还是不一定会赢,不确定性就是足球的最大魅力。"他说。不过,随着更多的比赛出现,好队好的表现会越来越出现好的结果,到淘汰赛的时候,可能就可以对表现优秀的球队做出预测了。
另类统计
如何让你的球队获胜?

希腊亚里士多德大学的研究者们也对世界杯的比赛进行了一系列统计研究。这些数据或许值得各队的主教练们好好研究。他们发现,下半场比上半场更容易进球。在 1998年和2002年世界杯中,大部分进球都是在下半场完成。2006年世界杯中,其差距减少,但下半场的进球依然以52.5%的比例居多。研究者分析说,比赛进行越长,进球也越多,他们猜测,原因可能与队员疲劳、缺水、注意力分散导致防守失误,以及战术策略有关。研究者还对欧洲杯的进球模式进行了分析,发现44%的进球都来自有组织进攻,35.6%来自定位球,20.3%来自防守反击,在进球前的运球方式中,长传占了最多,达34.1%。在定位球中,进球最多的是角球和任意球。
阿马罗等科学家的实验室主页
提供了相关比赛的数据统计结果。这是世界杯赛事发文前的球员TOP20。

本文地址(转载请注明出处): 复制
收藏、分享这篇文章: 豆瓣 新浪微博 人人网 开心网 QQ空间 qq书签 GOOGLE书签 MySpace 百度搜藏 鲜果 做啥       更多...

Things you can do from here:

No comments:

Post a Comment