feedback

意见

反馈

back-to-up

回到

顶部

中美体育的差距可能就是一个数字化的NBA

数据侠

· Harry Wu

· 林雨旸

Harry Wu, Young Lin   2019-01-08

虽然足球是全球第一大体育运动,但篮球,尤其是NBA,在中国和北美的成功让人感到惊讶。所以,数据侠Young和Harry就一起研究了NBA的数字化技术,走访了球队的数据分析师及相关技术领域专家,为大家探究这个成功篮球赛事里的数字基因。  

美国四大职业体育联盟之一的NBA(美职篮)是世界篮球最高殿堂。NBA总冠军球队的每一位球员和教练都会收到一枚总冠军戒指,上面除了雕刻着冠军球队和个人的名字,还在显眼的地方印上“World Champion”(世界冠军),可见NBA在篮球世界的地位。

2002年随着姚明以NBA选秀状元的身份加入火箭队,并打出全明星级别表现之后,NBA的热潮顺势席卷中国乃至全亚洲,截至当下,NBA已经成为中国体育迷们最喜爱的赛事,没有之一。

NBA的数字基因

美国有着全球最好的数字化技术与应用场景,这使得NBA自2009年之后通过注入数据DNA,成为了全球最智能、科技感最强的运动体育赛事,并在商业领域获得巨大的成功。

在开启探究NBA数字化成功之道前,我们先来了解一下NBA的数字基因。

马克·库班和达里尔·莫雷可谓是NBA“数字基因编辑”的代表人物。

被誉为“NBA最疯狂的球队老板”的库班,年轻时候曾在达拉斯最早的软件零售商担任销售员。推销软件前,他自然要了解软件,并执念于新技术能创造更大价值。

日后,通过创立与出售MicroSolutions计算机咨询公司、BROADCAST体育视频网站等,库班赚取了自己的人生财富。2000年,他买下达拉斯小牛队(现改名独行侠),虽从一名科技企业家变身体育产业大老板,但库班的信条始终是“相信科技”。

小牛队可能是联盟最早让球员穿戴智能设备与使用AI、数据分析协助球队经营与提高球场成绩的队伍,库班(注:其与迈克尔·乔丹一起投资了瑞士运动数据公司Sportradar)十分相信人工智能,他说:“我们做生意的方式,我们的生活方式,所有的一切都被网络改变,但与人工智能相比,这些都相形见绌。”

NBA的数字化除了有相信科技的人,还要有懂大数据的。休斯顿火箭队总经理达里尔·莫雷就是这样一位“数据门徒”。

莫雷(注:目前还担任体育数据公司Stats的顾问)曾经是一位计算机科学家,在获得MIT的MBA学位之后,他在芝加哥创办了一家专门为各种职业球队提供运营数据分析的体育信息咨询公司。加盟火箭之初,他基于数据分析的魔球理论(Money Ball)重建球队,通过数据收集与分析进行合同风险管理与薪资控制,在选贤方面,一些二轮新秀被他点石成金。莫雷曾如此定义赢得一场比赛:第一要量化每一回合得多少分,第二要了解如何去争取到更多的回合数,这就要靠数据分析。

早在NBA三分狂潮掀起之前,莫雷团队就通过分析球场上个点位投篮的得分效率数据,得到一个答案——三分球的有效性比长两分更好。

(图片说明:计算机视觉技术识别球场上球员移动位置、轨迹和篮球运动轨迹,并推算进球的可能性  图片来源:The Economist)

 

相比于90年代NBA盛行的长两分球,三分球的得分效率与威慑力都更强。2012年平均每场比赛投出18.4次三分,相较2017年的27次提高了50%,一个三分球射手有65%的概率改变比赛走势。所以,NBA教练们在近年来开始大量使用三分射手。

(图片说明:十年间NBA的三分球投射比率从22.3%上升至33.7%)

以休斯顿火箭(最早使用智能摄像头、可穿戴硬件和使用数据分析的球队之一)为首的一批顶尖强队掀起了三分狂潮(有兴趣可以阅读数据侠相关文章《NBA的三分球革命》),直至今天,利用三分球作为主要进攻武器的球队,都在这几年的NBA赛场上胜多负少。

数据分析的核心在于海量数据。在美国五大联赛中,NBA的数据点排名第三(注:NHL场上选手和比赛时间都长于NBA,MLB赛程和比赛方式更有利于产生更大数据量)。2009年起,NBA在每个球场(包括训练场)部署6个每秒25帧拍摄速度的摄像头以收集数据,单赛季就能产生超过1.77亿张图像,超过23亿个数据点。

(图片说明:NBA的数据点;总计最小数据点=一个赛季总计比赛场次×一场比赛参与球员数量)

 

NBA大数据的背后是什么技术加持?数据下游是什么样的应用在解决具体问题?

2012年,时任NBA总裁的大卫-斯特恩在介绍NBA的数字化运营时说:“统计学与数字化革命将改变NBA商业模式,“SportVU”智能摄像头系统跟踪每一个球员和球的运动,收集海量球场数据,教练可以在自己的平板电脑上获得各类数据统计及分析结果。这些数据势必影响比赛与执教。”

(图片说明:SportVU系统对于场上球员移动轨迹的监测)

 

早在2009年,SportVU系统就被部署到部分NBA球队。这是一套球员追踪与分析的监控系统,也是NBA数字化革命的起点。这套价格不贵、效果奇佳(据传一套大约10万多美金)的设备在球场上部署六个运动捕捉摄像头,它们会以每秒25帧的速度捕捉球员的空间坐标,与此同时,为每个坐标点加上时间戳和球员ID,将这些数据捕捉到服务器端之后,数据收集的工作就已经基本完成了。

当“数字化革命”发生

2005年,以色列导弹追踪以及光学领域的顶尖科学家米基·塔米尔发明了SportVU系统,最初用于军事领域,但在金融危机期间,运动数据公司STATS收购了SportVU,于是这套系统很快被应用到了篮球场上。

如今每只NBA球队都配备几名数据分析师,他们将诸如SportVU这类的智能设备收集来的数据结合传统统计数据,进行交叉分析,一方面监测球员疲劳度及积极性等状态,以帮助分配最合适的球员上场竞技,另一方面,根据场上的进攻与防守数据协助教练员制定战术,以及选择签约合适的球员。

2013年,来自哈佛大学两位博士瑟沃尼和艾利克斯建立了一个测量NBA球员表现价值的指标——预球权分(Expected Possession Value,预期球权得分机制)。该模型源自于竞争风险模型(注:处理多种终点事件和竞争风险事件存在的生存数据的分析方法),简单地说就是研究“一名球员是否被低估了其在球场上价值”的一套指标(不同于得分、篮板、助攻及命中率等传统衡量球员的数据)。

(图片说明:伦纳德在三分线外持球,如果投篮EPV为0.68分,如果传给邓肯,EPV为0.8分,传给帕克为0.94分,传给博纳为0.94分,传给格林为1.08分)

有了模型,只差数据。SportVU向瑟沃尼和艾利克斯提供了“大数据”,这些用于跑模型的数据就包括了2012-2013赛季中14个球馆的8亿个球员位置坐标,光这个项目的数据集就达到93GB。为了处理“大数据”,瑟沃尼和艾利克斯启用了哈佛大学的超级计算机(计算机集群)——奥德赛,通过500台电脑并行处理器和2TB内存的算力完成了分析。而这套指标正在辅助教练员更好地评估每一位球员的真实价值。

做好了数据收集与融合,拥有一套智能分析系统就显得更加重要了。NBA一度又引入了德国软件巨头SAP的SAP HANA系统。智能设备收集来的战术、空间位置、球员健康等数据实时传送到SAP HANA系统上,并将数据保持在最细的颗粒度,不进行任何预先的聚合,通过自动分析,每秒并发处理250个复杂查询,在不同数据颗粒度层次都能满足数据分析的诉求,最大限度的方便了球队分析师、第三方机构,乃至于球迷的数据分析以及可视化需求。

数字化驱动的新商业

NBA的数字化战略不止于此。互联网科技公司常常利用骇客松(Hackathon)的方式(注:针对黑客设计的马拉松,主办单位会将一批计算机极客聚集起来,在极短的时间内让极客们针对特定的议题进行头脑风暴并提供解决方案),来刺激用户间的合作与公司外部的创新,体育界的领头羊NBA从2016年开始,也决定要利用群众的力量与智慧,来找寻运营和商业中的隐藏机会。

(图片说明:NBA官网通知,2018年9月22日NBA新泽西办公室举行骇客松)

NBA从2016年开始对外举办NBA骇客松,目前仅限于北美地区。经过海选的50只队伍,被分配到两种题目的分析组——篮球分析组与商业分析组。篮球分析组队的问题主要是和球队教练和球队经理相关的,例如“如何利用NBA采集到的多样空间数据,来改变比赛规则,增加比赛的精彩程度”;又或是“预测未来十年的投篮趋势,分析现在这种从后卫到中锋都学习勇士库里飘射三分的狂潮,到底能持续多久。”而商业分析则更靠近球队的商业考量,例如如何量化球队的“娱乐价值”,或是如何利用现有的CRM(客户关系管理)数据来挖掘更多的商业价值。

2017年篮球分析组的冠军根据数据分析的结果,针对未来投篮趋势提出的建议:一旦比赛中中距离投篮的进球数量超过16个,就可以将中距离的得分从两分提高到三分,以增加比赛的精采程度。而商业分析组的冠军,则创建了一个时间序列为主的互动工具,能够预测未来NBA任意一场比赛的娱乐价值。

如此经营骇客松,无论对于球迷或是NBA而言,都是个双赢的局面。对参赛者而言,因为赛题围绕数据与分析应用展开,参赛者的数据分析能力必不可少,而这些数据是NBA最真实的运营数据,作为球迷的分析师,除了在比赛中可以和球员面对面讨论题目,晚上熬夜时吃着球星送来的外卖以外,在探索数据的价值中,还能更了解所关心的主队和球员,甚至是左右未来联盟的规则发展。这简直是球迷的天堂(注:第一名的奖励是和NBA总裁共进午餐、球赛门票和一大堆的周边产品)。而对于联盟或球队而言,这些活动既可以创造更强的粉丝粘性,又可以收集好的分析与应用思维和解决方案,进而改进联盟与球队的经营效果,何乐而不为?

(图片说明:NBA骇客松上,NBA球星肖恩·巴蒂尔与极客们的交流互动  图片来源:网络)

除了NBA联盟希望利用大数据挖掘更多价值外,30只球队也积累了很大的数据能量。以华盛顿奇才队为例,先从公开数据来看看他们的表现:这只位于美国首府华盛顿特区的球队,价值1.3亿美金,主要来自于体育事业的贡献(占比约40%),前年(2017)的球队收入成长了43%,一口气来到了两亿多美金。

有趣的是,球队门票销售在过去五年持续成长的原因,主要是成功的营销,一部分上升来自于2013-2014年开始增加的AdWords广告花费(注:该季AdWords花费上升将近300%,并从Adwords获取的新客上升了72%),另一部分则来自于过去五年不断上升的票价(注:2019年票价的增长率大约是10%,依照44种不同的座位分区有不同的调整)。

(图片说明:奇才队的历史战绩与攻防评分数据  来源:Tableau public )

 

而从球队表现来看,ORtg (Offensitve Rating, 进攻评分)与DRtg (Defensive Rating,防守评分)显示,奇才队从2003由Eddie Jordan执教后,利用出色的进攻打出一波1970年代后期之后未曾看见的佳绩。虽然之后陷入低谷,但新教练的到来促使球队风格逐渐由进攻转为防守,并在最近的赛季表现都不错,过去五个赛季中有三次进入分区半决赛。

以上成绩都与奇才队的精益数据分析不无关系。

AI驱动的NBA

无论是大数据还是其他黑科技,整个NBA拥抱技术的态度都非常积极。各只球队为了提高球队表现与商业化,大量引进与使用人工智能。

目前NBA的官方数据技术合作方除了STATS公司外,还包括运动科技公司Second Spectrum。Second Spectrum公司创立于加州的洛杉矶,创始人是来自南加州大学(USC)的两位教授,他们希望利用机器学习算法真正地让机器看懂篮球,然后产出有建设性意见的洞察结果。

Second Spectrum通过一种叫作“时空模式识别”的算法,识别球员在球场上执行教练的战术特征,该系统能认知出挡拆、双档掩护等篮球场上的技战术。起初,Second Spectrum的系统学习了20种左右篮球战术,现在已经能学会并记住500种战术,这让预测球场上“因为实施某种技战术而产生固定的结果”变成了可能。

(图片说明:Second Spectrum对场上球员与球的轨迹监测   来源:TED)

另外,通过计算机视觉技术,结合持球球员及其他数据(进攻动作、防守者位置、球员历史定点命中率等数据),建模预判一个球员在特定区域的投篮命中率,一旦球不能被投进,还可预判篮板球的落点,以及谁将抢到篮板球。

(图片说明:Second Spectrum监测持球球员与无球球员移动,以计算不同点位的命中率)

 

除了硅谷,来自澳大利亚的Catapult科技公司正在通过自己的智能硬件设备改变球场上的战术实施,Catapult的可穿戴设备记录球员的移动、速度、身体状况等数据,帮助教练员更好地分配场上球员,部署战术。

类似Cataplut的公司还有不少,并且都在为NBA球队带来科技红利。目前冠军之师金州勇士队(有兴趣可以阅读数据侠相关文章《大数据告诉你勇士凭什么“4年3冠”》)除了利用SportVu的智能摄像头监测球员场上状况,球队还让球员穿戴一款高科技“智能服装”,监测球员实时运动状态、呼吸和肌肉活动等信息,避免过度训练造成疲劳并帮助减少运动损伤。

NBA医务总监John DiFiori博士说,从智能可穿戴设备上获取的数据不但可以协助维持球员健康,还能通过更多细节数据,结合球队拥有的医疗设备,帮助球员更好的预防伤病,并从伤病中更好、更快地恢复。

NBA的教练们也在受到大数据等新兴信息技术的影响。人工智能能够在接触、识别、反馈数据模型的过程中完成自我学习。香港理工大学OpenCog AI实验室首席研究员Ben Goertzel认为,如果AI系统学习大量的NBA比赛视频,它就会聪明到能够理解比赛中发生的各种事件,如此,人工智能就能够做出更好的篮球战术安排,比如选择最合适的首发阵容。Goertzel预言,NBA球队主教练的大部分工作,未来都可以由AI来完成。

自2016年,来自瑞士的Sportradar公司就开始为美国市场之外的国家提供NBA的实时数据和高标准的视听服务。NBA还将Sportradar纳入其数据综合业务中,从2018年开始, Sportradar就开始为NBA、WNBA和NBA发展联盟提供统计信息,并将数据完整地输送美国的球迷、球队、媒体和其他80个国际和地区的球迷及用户,而这些数据中包含了Second Spectrum检测的球场上球员的运营轨迹数据(包括速度、运动距离、禁区停留市场和防守反击等数据)。

基于这些大数据,萨克拉门托国王队开发了一款类似iPhone Siri的APP——国王的人工智能(KAI),它能与球队粉丝互动,根据不同的提问,将数据与信息通过文字与语音回复给粉丝。

(图片说明:国王队基于大数据开发的机器人KAI)

 

在一次体育产业峰会上,美国体育媒体EPSN分析总监Benjamin Alamar总结了十年间NBA的数字化变迁,他表示,十年前,一个赛季每场比赛详细报道(Play by Play)的数据可以打包成6兆的数据包,现在,一场比赛详细报道数据就达到16兆,现在一场比赛的数据是十年前连续三个赛季的数据之和。

大数据与AI技术在NBA的使用案例远远不止机器学习、亦或是基于卷积神经网络的计算机视觉技术,包括贝叶斯网络、知识图谱等广义AI技术也在被采用。

关于未来,新科技在NBA的想象空间非常大。STATS公司CEO Gary Walrath说:“未来全新的NBA术语将包括速度档案、进攻战术类型、防守对位和球场覆盖地图等信息。”

在NBA的身后,包括中国CBA在内的多个篮球联赛都在探索一条属于自己的数字化战略。紧随成功部署数字化战略的NBA,中国篮球正在篮协主席姚明的带领下走出低谷,作为NBA数字化先驱球队休斯顿火箭队的前明星球员,姚明也许明白NBA的数字化革命将为中国篮球带来什么样的启示。

作者 | Harry Wu,Young Lin

题图 | 视觉中国

数据侠门派

本文数据侠Harry Wu,篮球球迷,自诩“非典型宇宙免检知识混子”,喜欢在数字化峰会、券商投资策略会和高校公开课上YY人工智能和大数据。之前写了不少财经类文章,在各大财经网站头条短暂飘过,怒砍百万流量,个人观点和内容还登上过南华早报、路透社等海外媒体。目前是“DT数据侠”项目的负责人。 

本文数据侠Young Lin,篮球球迷,在某大型数据分析与咨询公司担任资深数据分析师,协助娱乐、高科技等客户透过数据挖掘的方式发现并创造价值。热爱数据和统计、营销、科技,曾自主创业,担任过跨国销售、上市专案经理等职位。旅居欧洲、美国等地,喜欢旅行、阅读、运动、音乐、Podcast。现与朋友经营“RS实验室”公众号(ID: rs_lab),希望利用数据分析的方式发现生活中有趣的事物。

● 作者话痨小故事:我和老友Ben

2018年,我(Young)回到华盛顿,抽空和读研时的老友Ben(奇才队数据分析师)见面。

(图片说明:马里兰大学的同学们,左一是Ben,右一是Young)

Ben是犹太人,律师家庭出生的他是一位典型美国人,非常热衷参与职业体育,除了会在比赛期间观看球赛,他还在大学期间成为了马里兰大学的篮球校队经理,半工半读,和球队南征北战。

马大篮球队从2014年开始加入Big 10 Conference,联盟的14所大学集中在美国东北部,并以篮球这个运动项目著称。

Ben在研究生(营销分析专业)毕业后加入了华盛顿奇才队,从事球队数据分析、球员薪资战略规划等工作。

目前奇才内部的组织架构,负责分析的团队有两大部门,分别是球探(负责在美国各州学校发现有价值的球星)和科技/数据分析团队。Ben刚加入球队时,主要负责比赛影片的剪辑,提供给教练和球员,作为动作和战术上的改进参考。有趣的是,奇才是NBA第一个开始采用VR训练球员技术的球队(2015年开始采用STRIVR Lab的技术),Ben的工作也就包含了剪辑与使用VR影片。

(图片说明:Ben在接受华盛顿邮报专访时,让记者使用VR来练习投篮)

Ben向我进一步解释Oculus的VR眼镜时说到:“奇才2017年末成立的G-League(NBA发展联盟)队伍Capital City Go Go(很有趣的名字),将可以使用这样的技术来训练年轻球员。奇才队的当家球员们比较没有时间和机会使用这样的技术。”(我自己感觉这VR挺鸡肋的....)

Ben位于Capital One Arena的办公室,坐落在体育馆场的二楼。整个体育馆从Locker Room到健身房、SPA房、练习场,都是他的游乐场。穿梭在球场与球员间的他,日常的工作,除了球员薪资战略规划外,还包含了球队赛前的对手分析,和球队每赛季的合同战略。他指着桌上一本厚厚的报告说:“这是2017年针对奇才在季后赛对战凯尔特人所做的专题研究,完整分析了每个球员的表现和对战状况。”想想有多少从事数据分析的人,可以这样玩数据?

球队的经营目标之一,就是要创造更多的价值。通过各种技术:无论是Google Adwords、VR、还是大数据分析球员表现或是球员合同,都可以协助球队在球场表现或是门票销售上,得到显著的提升。但运动有趣的地方就是运动充满不确定性:预算最高的球队也可能会输球,没有球星的球队也可能逆转比赛。

加入数据侠

“数据侠计划”是由第一财经旗下DT财经发起的数据社群,包含数据侠专栏、数据侠实验室系列活动和数据侠联盟,旨在聚集大数据领域精英,共同挖掘数据价值。了解数据侠计划详情请回复“数据侠计划”,投稿、合作请联系datahero@dtcj.com。

 

分享这篇文章到