- 1、本文档共27页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
nba中的数学模型
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 邢正 1.背景知识 在美国四大职业体育联盟中,nba(美国男子篮球职业联赛)虽然在美国国内影响力位居四大联盟垫底,但它是大数据的鼻祖,也是大数据的最佳践行者。20世纪80年代以来,nba所有球员的得分、篮板、助攻、盖帽、抢断、失误、犯规,以及投篮、三分和罚球命中率等一系列场上数据均被统计在列。此外,合理冲撞区的触球次数、每回合传球次数、潜在助攻、造犯规次数等“高级数据”同样成为分析球员个人能力与团队意识的关键数据 Daryl Morey 达雷尔·莫雷,先后毕业于麻省理工大学计算机与工商管理专业,在nba就职前没有接触过正规篮球。 现任休斯顿火箭队总经理 长于信息收集分析和风险控制,其“魔球理论”被奉为经典 数学与篮球 Jonas Kazlauskas 尤纳斯·卡兹劳斯卡斯,毕业于维尔纽斯大学数学系 前任中国男篮主教练,帮助中国队在北京奥运会中进入八强 数学与篮球 建模思想及相关数据分析① ①.数据及进攻端模型来自虎扑网,参考网友“古巢2飞曹”《数学建模为你解答--NBA比赛中决定胜负的因素》一文 数学模型(Mathematical Model)是数学理论与实际问题相结合的一门科学。它将现实问题归结为相应的数学问题,并在此基础上利用数学的概念、方法和理论进行深入的分析和研究,从而从定性或定量的角度来刻画实际问题,并为解决现实问题提供精确的数据或可靠的指导。 接下来我们将按照建立数学模型的方法和步骤,将nba球员的能力进行量化,并简单研究数据与能力值的关系。 为研究nba中一场比赛的胜负与哪些因素有关,我们选取2010年20场nba季后赛的数据作为样本(见下表),其中包括主队和客队的净胜分、命中率差、三分球命中个数差、罚球命中个数差、篮板差、助攻差、失误差(均为主队数据-客队数据),建立一个数学模型,衡量出净胜分与其他因素的关系,从而得出比赛的胜负与哪些因素相关。 假设:y~净胜分x1~命中率差x2~三分球命中个数差x3~罚球命中个数差x4~篮板差x5~助攻差x6~失误差 将上表的数据排成x,y,用MATLAB中的stepwise(x,y)命令,得到stepwise Table和stepwise Plot窗口,并移去回归系数置信区间(由样本统计量所构造的总体参数的估计区间)包含零点的x2,x3,x5(包含零点则估计的系数不显著)得到下图: 利用MATLAB统计工具箱求解,得到的回归系数估计值及其置信区间 观察上表可以看出,常数项的回归系数置信区间含零点,说明常数项对因变量的影响不显著,可以从原模型去掉。 模型可改进为y=b1x1+b2x2+b3x3+b4x4+b6x6 再次利用MATLAB统计工具箱求解,得到的回归系数估计值及其置信区间 可以看出所有的回归系数置信区间都不包含零点,即y=1.0863x1+0.7206x2+0.3335x3+0.6022x4-1.0735x6 接下来我们将2010年NBA总决赛第一场的数据y=13,x1=5.4,x2=3,x3=-6,x4=11,x6=-1代入上面的模型求解得: y=13.7245,与y的实际值13相差无几。 同理,我们可以运用这种方法分析其他数据(特别是抢断、盖帽等防守端数据,以及犯规等恶性数据)与比赛胜负的定量关系。将一个球员赛季场均得分,篮板,助攻,抢断,盖帽,失误,犯规等数据按权重(如上面的b4,b6)进行加和,并将得到的数据与投篮,三分和罚球命中率按权重(如上面的b1,b2,b3)得到的和进行乘积运算,从而得到该球员的能力值。我们可以得出结论:球员的能力值越高,该球员对球队胜利的贡献值就越大,球队应以更高的价格签约能力值更高的球员。 3.此类模拟的缺陷及相关科学性的质疑 这些规则和设置存在着致命缺陷——数据不能完全模拟球员的真实表现! Isaiah Canaan由于效力于摆烂期间的弱旅费城76人队,获得了大量的球权和出手权,数据也迎来了“井喷式”增长,然而其实力显然与数据不符。 抢断数据同样不能完全衡量球员的防守能力,很多球员有冒险抢断的“掏球”习惯,这样的球员虽然抢断数据不错,但一旦抢断失败则有防守失位的风险。 Klay Thompson,该球员射术精湛,防守习惯良好,经常负责盯防对方主攻点,但由于抢断数据偏低,其数据始终不能达到实际水平。 数据好的球员综合能力不一定强,这是此类模拟最大的软肋! 为解决这一问题,我们不妨引入更高级的数据。除前文提到的触球次数、每回合传球次数、潜在助攻、造犯规次数等以个人表现为衡量标准
文档评论(0)