Posted on

大数据+体育 数据挖掘在体育商业领域的应用及原理

不知何时起,“大数据”这个词瞬间进入了人们的视野,依稀记得念大学时书店畅销榜上数月高居不下的《大数据时代》,“大数据”也成为人们日常的必备谈资。那么大数据商业价值到底有多大?体育商业又应该如何运用大数据分析技术?今天笔者和大家一起以数据挖掘技术为切入,看看北美体育市场有哪些数据挖掘与分析的应用,以及其背后的原理。

说起体育领域的数据分析,不知道大家是不是很笔者一样首先想到的是《Money Ball》里奥克兰运动家球队经理 Billy Beane。无论是原著还是电影,一个活灵活现的体育职业经理人形象展现在我们面前,面对传统的体育管理与运营思路的压力,Billy Beane 敢于大胆启用新技术,新商业模式而创造了“小球队神话”。随着数据分析技术的发展与创新,这样的“神话”早已走入北美体育市场日常的商业决策制定过程中。

体育分析可以说是近年兴起的商业分析(BA Business Analytics)的一个分支,正如笔者之前的文章提到,体育分析是由两部分组成的:起步较早的球员和教练员维度的运动分析(Performance Analysis)和迎头赶上的经理人和业主维度的商业分析(Business Analysis)。那么这些看似繁杂枯燥的数据是否真的能为球队带来价值呢?

在回答这个问题之前,我们先来看看什么是数据挖掘技术,数据挖掘技术泛指从数据集中发掘出特定模式或信息的过程,在大数据+体育背景下,便是利用庞大、实时、精准的数据库得出能够为球队战略制定提供参考与反馈信息的数据分析过程,有效地帮助球队管理者发现从市场至每一个个体的异常(Anomalies),模式(Patterns)和相关度(Correlations)。

球队搜集到的数据,既有包括球迷基本资料这样的结构化数据,涉及到每个球迷个体的半结构化数据,也包括社交媒体上的留言,点赞乃至图片这样的非结构化数据。这些数据同样具备着大数据的4V 特性:价值(Value),多样性(Variety),高速(Velocity)和大量(Volume)。球队在挖掘出数据之后需要使用不同种类的数据处理方法来得到可参考的结论,在讨论这套应用方法之前,我们不妨先来看几个成功应用的案例:

2000年初,NBA 成立了一个全新的联盟内独立咨询部门TMBO(Team Marketing & Business Operation),旨在帮助联盟和球队开发市场,优化运营,虽然这个部门并不能直接作出商业决策,但却在联盟和球队的商业决策制定过程中发挥着类似于“智库”的关键作用。

近年来,TMBO 启用数据分析技术,在联盟和球队关于票务定价、赞助商洽谈,乃至赛场食品饮品定价决策过程中发挥了非常关键的作用。纵观 TMBO 团队,无不是商业分析与咨询的经营,很多球队的高级管理者也都出身于此,而这个作为联盟的“超级大脑”的部门确低调的不能再低调。

与此同时,联盟也建议每支球队成立自己的战略分析部门(Strategy & Analytics Department),根据 NBA Career 官方给出的数据,2012年仅有13人在联盟/球队从事数据分析相关方面的工作,而截至去年,至少有71人从事相关工作。

在笔者之前参访的芝加哥公牛队便在两年前成立了自己的商业战略与分析部门(Business Strategy and Analytics),部门主管 Matt Kobe 先生在与我们交流的过程中详细的介绍了部门的职责与日常的运营。部门的主要职责面向消费者和零售端,以收入管理为导向,协助其他部门通过数据分析为其提供建议。

具体事务诸如完善 CRM(面向男性消费者追踪其消费行为,挖掘个人背景;面向女性消费者追踪其社交媒体动向),帮助不同职能部门制定战略,处理商业数据,完成特殊项目(诸如完成对新球队商店的设计)。该部门直接向球队老板 Micheal Reinsdorf 汇报。

今年部门初次尝试收集分析实时数据,利用嵌入在球队 APP 内的iBeacon技术,分析人员可以实施抓取每一个使用 App 的球迷的地理位置,帮助球队优化赛时体验与服务,举个最简单的例子:当工作人员通过 iBeacon 定位发现大量球迷聚集在某一特定区域内(如卫生间、餐饮区、通道),可通过定点定向发送通知舒缓压力(“距离您130米处有售卖相同热狗与啤酒的店面,请右转步行至 XXX 区以便节约您的时间”)

不仅如此,正如笔者之前文章中所提到,这项新技术可以在诸多方面为球队带来战略制定的借鉴价值,通过分析球迷的赛前活动位置可以有效进行市场策略与合作机遇选择,目前公牛便正基于数据分析建立新的球场内酒吧。

不单单是 NBA,几家联盟如今都愈发重视数据分析的价值了,MLB 球队 2012年商业数据分析岗从业人员33人,去年增加至54人,虽然与棒球运动分析相比发展规模明显不足,但并不影响领域的飞速发展,联盟层面也设有 Department of League Economics & Strategy,专注商业分析。NHL、NFL也纷纷成立对应的商业数据分析部门,Ticketmaster、Aramark、Levy Restaurants(后两者为场馆食品供应商)也建立了颇具规模的分析团队。

在体育分析领域,充满智慧大脑的大学体育运动队同样把大数据+体育分析玩的“飞起”:

德州大学运动部战略与分析副主管 Juan Garcia(Associate athletic director for strategy and analytics,University of Texas)便通过数据分析发现了一个神奇的相关度:持有狩猎许可的校友更倾向于向学校捐款。学校的筹款活动在这一发现的见一下果然取得了显著地效果。“这边是数据最令人兴奋的地方,你能通过数据分析去发现那些隐藏起来的相关性,我喜欢这种通过数据寻找问题的解决方案并教会大家的感觉”。目前相同的数据分析策略应用到了 Longhorns 的球票销售与资金募集。

同样尝到数据分析“甜头”的还有佛罗里达大学,学校的特许商品外包公司Collegiate Licensing Company(简称 CLC,IMG College 旗下)于2013推出了自主研发的特许商品数据分析管理系统。在此之前,学校只能通过 CLC 提供的月度报告来了解商品的销售情况,学校很难掌握并控制自己特许商品的分销情况。

随着技术的逐步成熟与推广,如今学校可以通过这套名为MyiCLC的系统实时跟踪商品销售数据,具体类别销售情况,分销商业绩与市场的反馈。七万五千个不同的分销商代码对应着各自的销售记录,学校需要做的便是查询自己的授权经销商,监测他们的业绩,制定下一步发展战略。

Debbie Gay,佛罗里达大学 Gators 运动队特许商品经理可以通过 MyiCLS 提供的数据像业绩良好的分销商提供更多产品,而取消与业绩不理想乃至全年没有销售额的分销商解约。通过数据分析,佛大工作人员吃惊的发现自己的学校竟然与超过 30 家特许商销售同一件商品,特许商一度超过 800 家。MyiCLC 的引入有效的帮助球队精简规模,提高收入,增强品牌影响。

数据挖掘技术可以说“擦亮了”Gators 的眼睛,让其能够看清市场需要的是什么,正如 Mr. Gay 本人所言:“数据分析帮我们发现了成年女球迷群体和女学生球迷群体在选择特许商品时偏好的差异,我们因此有机会联合维多利亚的秘密推出特别款装备来满足市场的需求。”

在笔者之前的文章中曾经详细向大家介绍过美国体育票务市场的版图()其中的一家票务代理商 Gametime 主打的便是“Last Minute Offer”提供临赛票务交易服务,往往在赛前两小时票务商的线上交易系统就会关闭了,球迷的购票路径多为现场购票,也催生了我们司空见惯的“黄牛贩”。而如今依托于实时数据,票务商有能力也有空间将票务销售延长到比赛的“最后一分钟”,进而实现门票销售的利润最大化。

除了专注于移动端的 Gametime,其他代理商诸如 ScoreBig、Ticketmaster、StubHub也瞄准机会进入这一市场。NBA 更是通过推出College Pass(Student Pass)在比赛前将未售出余票匹配给当地的高中生和大学生。加入 College Pass 计划的学生会在比赛当天临赛前收到自动促销短信,告知当日特价座位讯息。

这个新的市场战略不仅仅帮助球队“填满了场馆”,更长远的价值便是 —— 帮助球队锁定了更多的未来球迷群体,扩充了球迷数据库,如今球队经营者面对的一个很严重问题便是目前的季票持有者都“太老了”,球队继续年轻群体的扩充,通过低廉的票价来吸引更多的球迷,获取他们的数据。正如前国民队(Washington Nationals) VP 所言:“我们卖周一1美元特价票(Monday 1 dollar ticket special)一点也不亏,相反我们认为是球迷向我们支付一美元的同时还把他们的信息扩充进了我们的数据库。”

除上述我们所提及的案例,赞助商对于数据挖掘与分析也是“情有独钟”,“自古以来”如何评估赞助商权益价值都是一个非常令人头疼的问题,应用了大数据挖掘与分析技术后,赞助商的影响力与收益可以通过“板上钉钉”的数据直观的展现出来。多家公司诸如 WME-IMG 现在已经启用数据分析来研究品牌 ROI 以及赞助商品牌收益与体育的内在关系,联合利华聘请尼尔森帮助自己调研在大学体育市场赞助的收益情况。

南佛罗里大学(USF)体育商业分析 MBA 项目负责人 Mike Mondello 教授结合多年行业实践给出了体育分析从业者所应具备的五项素质,我们也借此来引出数据挖掘与分析在体育领域应用的基本原理:

在了解了众多体育分析在实际中的应用案例之后,让我们追本溯源,来理清数据挖掘是如何应用在体育商业领域的。与统计学意义上的数据挖掘和广义的商业分析相类似,体育分析中的数据挖掘也是由三块不同的建模方式组成的:描述型建模(Deive Modeling),预测型建模(Predictive Modeling)以及决策型建模(Preive Modeling)。

通过对历史数据的挖掘与分析探寻模式与相关度,帮助球队识别划分不同的消费者群体,理解其群体特点与消费习惯。具体使用的分析技术包括:

聚类分析(Clustering Analysis)将相似的对象聚合在一起,总结其差异性与相似性。在此需要与判别分析(Discrimination Analysis)相区分,聚类是将每类相似的消费者(事物)组合成一个聚类的过程(不知道有多少类),判别是在已知一系列反映消费者(事物)群体特性的数量变量值的情况下对组群进行分析获取分类规则。

异常检测(Anomoly Detection)在数据集中搜索与预期模式或行为不匹配的数据项,比如球迷针对性的投诉或抱怨,异常的消费行为等。

关联规则学习(Association Rule Learning)在数据库中发现不同记录之间相关度的方法,比如狩猎许可和捐赠,啤酒和尿布等等。

主成分分析(Principal Component Analysis)通过减少数据集的维度来分析、简化数据集的技术,有效的发现变量之间的联系,同时还能保护数据集中对方差贡献最大的变量特征。

关联分组(Affinity Grouping)将消费者依据消费习惯与其他特征进行分组,归结出可以使用同种市场战略的群体。(例如年收入超过 $100,000 的季票持有者可能更关注球队汽车赞助商的宣传)

聚类分析(Clustering Analysis)将相似的对象聚合在一起,总结其差异性与相似性。在此需要与判别分析(Discrimination Analysis)相区分,聚类是将每类相似的消费者(事物)组合成一个聚类的过程(不知道有多少类),判别是在已知一系列反映消费者(事物)群体特性的数量变量值的情况下对组群进行分析获取分类规则。

异常检测(Anomoly Detection)在数据集中搜索与预期模式或行为不匹配的数据项,比如球迷针对性的投诉或抱怨,异常的消费行为等。

关联规则学习(Association Rule Learning)在数据库中发现不同记录之间相关度的方法,比如狩猎许可和捐赠,啤酒和尿布等等。

主成分分析(Principal Component Analysis)通过减少数据集的维度来分析、简化数据集的技术,有效的发现变量之间的联系,同时还能保护数据集中对方差贡献最大的变量特征。

关联分组(Affinity Grouping)将消费者依据消费习惯与其他特征进行分组,归结出可以使用同种市场战略的群体。(例如年收入超过 $100,000 的季票持有者可能更关注球队汽车赞助商的宣传)

在既有的描述型模型下,可以通过数据去预测未来比赛的上座率与收益,赞助商的潜在收益回报,乃至球队市场策略的效果。具体的分析技术包括:

回归分析(Regression Analysis)研究因变量和自变量(一个或多个)的依赖关系,是进行预测分析的基准盘。

人工神经网络(Neural Networks)通过模仿生物神经网络结构和功能构建的计算模型,是一种非线性统计性数据建模自适应系统。在规定的学习规则下,可以完成识别模式,做出预测与自主学习,具体应用便是帮助球队完成对球迷的视觉识别与语音识别。(PS. 勇士队就是在违规使用这项技术“窃听”球迷通话记录而被告的)

决策树(Decision Trees)由一个决策图和可能的结果(包括资源,成本和风险)组成, 用来创建到达目标的规划。具体应用诸如比赛的风险管理与赞助商赞助收益评估。

支持向量机(SVM)是一种监督式学习的方法,可广泛地应用于统计分类以及回归分析。

回归分析(Regression Analysis)研究因变量和自变量(一个或多个)的依赖关系,是进行预测分析的基准盘。

人工神经网络(Neural Networks)通过模仿生物神经网络结构和功能构建的计算模型,是一种非线性统计性数据建模自适应系统。在规定的学习规则下,可以完成识别模式,做出预测与自主学习,具体应用便是帮助球队完成对球迷的视觉识别与语音识别。(PS. 勇士队就是在违规使用这项技术“窃听”球迷通话记录而被告的)

决策树(Decision Trees)由一个决策图和可能的结果(包括资源,成本和风险)组成, 用来创建到达目标的规划。具体应用诸如比赛的风险管理与赞助商赞助收益评估。

支持向量机(SVM)是一种监督式学习的方法,可广泛地应用于统计分类以及回归分析。

决策型模型的使用是基于(包含)前两种模型的,基于历史数据的描述型模型球队管理者可以发现异常,模式与相关度,预测型模型帮助战略制定者预测可能的状况,而决策型模型,在二者基础上超越了对未来的预测和判别,给出基于预测所应采取的行动与战略建议,以及可能涉及的每种决策下所关联产生的结果。

用一个例子简化来表述,通过历史数据分析【描述型模型】球队发现多个不同的消费群体对于球场内的热狗定价产生抵触情绪(价格过高/产品质量不理想),影响了销量;通过与热狗相关的种种变量的引入回归分析,决策树【预测型模型】预测消费者对于热狗的预期与产品的利润空间。有了这些结论是不够的,球队还需要【决策型模型】来针对不同热狗定价与产品改良策略下所带来的不同影响进行有效的识别,找到最佳的解决办法。这个解决办法,才是管理者最关心的。

描述型模型与预测型模型对于战略制定当然具有一定的参考借鉴价值,但远没有决策型模型来的“解渴”。同时决策型模型在一定程度上还拓宽了数据库的空间,将非结构化数据(球迷的评论、语音、图片、视频等等)纳入了分析之中,将其过滤转化成为可供预测借鉴的有效数据。

决策型模型具体分析技术包括:预测分析(Predictive Analysis + Rules)大数据分析方法中最有价值的一种分析方法,可以预测消费者未来的行为,进而识别风险和机遇。优化分析(Optimization Analysis)依靠算法来实现的产品/市场策略优化过程,继而满足预期值(ROI,上座率,观赛体验等)

实话来讲,体育分析不是传统体育业主能够直接玩开的一个领域,需要的是更多既懂体育又会数据分析的专业玩家,本文的最后一个板块就让咱们来清点一下林立在北美体育市场的数据分析专业级别“玩家”:

总部位于堪萨斯城,起家于体育商业创新与球迷定向分析,主要客户包括美网和 Speedway Motorsports,也曾向 SeatGeek 的一级票务市场板块提供数据支持

位于芝加哥,专注于赞助商估值与品牌价值分析,设计诸多球队投资分析与冠名合同,在亚洲地区有合作商。

Kraft Sports Group (新英格拉爱国者所属体育集团)旗下公司,创始人 Jessica Gelman 也是 MIT 斯隆商学院体育分析年会联合创始人,与 Learfield 合作开发大学体育项目。

业内元老级公司,经过收购,拆分后现在形成以运动分析与商业分析(主要做 Fan Engagement 监测)芝加哥 base 公司。

全球软件巨头也开始触及体育板块,与 NBA、NHL 均有合作。与此同时 SAS,Oracle(甲骨文),MS SQL Server 也纷纷入场。

非常感谢您的阅读!希望这篇文章能够为您带来启发与参考,即使是走在前列的美国职业体育市场,大数据与体育商业分析也是出于刚刚起步的阶段,笔者也相信在不远的未来中国的体育市场同样可以应用数据分析技术发展的又快又好。

最近的爆炸新闻实在太多了…十月惊奇刚刚过去,不知道十一月会不会更炸裂呢?!“易帝”拖鞋,“光绪熊”夺冠,不知道18年韩国平昌冬奥会不会因为韩国证据的动荡而受到影响…

最后的最后,贴一张昨晚看 World Series 的截图,看到后半夜感慨的睡不着…

发表回复

您的电子邮箱地址不会被公开。