经济学家的高尔夫预测EAGLE开始飞行2017年8月9日推出全新改进版高尔夫预测系统

日期:2019-01-05 08:05:01 作者:申屠财 阅读:

<p>欢迎来到EAGLE的主页,高尔夫可能性估算器中的经济学家优势EAGLE是高尔夫锦标赛的数学模型,可以衡量每位玩家在赛事中每一点获胜的机会当EAGLE预测的任何比赛正在进行时,其预计的排行榜和估计的获胜概率将显示在这篇文章的顶部</p><p>自2001年以来几乎所有男子专业的历史预测将显示在下面你可以看到冠军的所有选手在赛事过程中的演变程度,所有亚军,我们本来打算在比赛开始之前赢得的高尔夫球手,以及在完成第三或更低的比赛之前获得最高胜利机会的高尔夫球手,以及我们的数据集之间最糟糕的崩溃排名</p><p>这些过去的预测将转移到返回页首升级您的收件箱并获取我们的每日调度和编辑精选2017年8月10日:去年夏天我们推出了EA的首届版本GLE(高尔夫可能性估算器中的经济学家优势),我们针对男性主要高尔夫锦标赛的统计投影系统在我们对其方法的总结中,我们警告说该模型基本上是一个最小的可行产品,具有容易识别的弱点和充足的改进空间</p><p>它的发布,我们一直在努力弥补这些缺陷我们很高兴推出EAGLE 20版本,这是一个更全面,更强大和更准确的模型我们首先在麻省理工学院斯隆体育分析会议上与公众分享这个青少年版的EAGLE 3月对于不熟悉的读者,我们会推荐这个演示视频,最好与相应的幻灯片一起查看原始模型的方法的详细摘要可以在下面找到但是如果你已经熟悉EAGLE最初出现时的机制并且是主要感兴趣的是什么是新的,请从这里阅读整个辣酱玉米饼馅从孵化的那一刻起,EAGLE遭受了营养不良一个模型与它训练的数据一样好,并且自2001年以来,EAGLE的第一个化身仅仅是从主要锦标赛中获得历史分数的饥饿饮食</p><p>尽管有450,000个玩家漏洞可能听起来很多,大约五分之六典型玩家参与的事件不是专业的结果因此,婴儿EAGLE基于高尔夫球手的全部作品仅仅预测了该模型该模型试图通过使用官方世界高尔夫排名(OWGRs)来弥补这一弱点</p><p>代表失踪事件的分数然而,他们被证明是真实的东西的不良替代品因为OWGRs是基于玩家在锦标赛的最终排名中完成的而不是他的绝对分数,他们不公平地惩罚编制出色表现的高尔夫球手但遭遇不幸的是参加同一场锦标赛,而不是那些表现得更好的人,同样不公平地奖励那些尽管取得好成绩而赢得冠军的人 - 很好的表现,因为没有人碰巧把他们的“A”游戏带到一个特定的事件这使得他们基本上是一个具有有限预测能力的向后看的措施此外,EAGLE对他们的依赖变成了一种不健康的依赖:OWGR总是在至少三分之二的EAGLE对球员技能的总体估计,并且通常远远超过EAGLE现在已经毕业到相当于固体食物的模型:它结合了自8月以来每个OWGR认可的每个高尔夫球手所进行的每一轮比赛</p><p> 2006年结果,世界排名已经成为事后的想法:他们现在仅占典型球员技能预测的3%左右</p><p>狮子队的份额取决于高尔夫球手的个人表现,无论其他人是如何在同一场比赛中出场的该模型仍然使用OWGR作为对某一特定事件显示的场强的度量,因此它可以比较锦标赛的得分这个过程只引入了原始方法的一小部分误差风暴风暴风暴风暴每个高尔夫球手都知道同一个洞可以完全不同于世界上最好的球员,来自三级和四级赛事</p><p>根据航线条件,下一天到下一天雨,风和湿度(或他们的缺席)可以将一个蛋糕步道变成一个雷区,反之亦然EAGLE 10评估了每个球场和洞的整体难度,但没有说明一天到 - 变化 它的继任者没有明确地将天气影响纳入其预测中,并提供有关温度,云层等的实际数据</p><p>但是,它确实考察了锦标赛中作为一个群体的玩家每天相对于其预期的表现,并调整其对相应的表现如果小鸟和鹰在早晨像季节性迁徙一样飘飘,那可能表明天空晴朗,绿色柔软;相反,如果早期发球组中的柏忌和更糟糕的比赛(在考虑到那些球员的预期技术水平之后),那些在当天晚些时候上场的高尔夫球手可能也会期待一个障碍赛程</p><p>每个人都是一个特殊的雪花</p><p>另外一个错误的假设是EAGLE 10取决于所有具有相同技能的高尔夫球手应该对给定球洞有相同的预测实际上,每个球员都有所不同:即使在控制了他们的整体表现之后,有些人在驾驶方面更好,有些人在推杆方面有所提高,有些人更有攻击性,有些则更保守</p><p>因此,EAGLE 20并没有直接通过驾驶距离等数据来衡量比赛风格但是它确实使用了高尔夫球手在大满贯赛事中的历史记录来确定他们过去是否倾向于在短洞或长洞上超过或低于其投影,三分球或五杆洞以及异常困难或轻松的洞因此,在长洞上倾向于表现不成比例的球员w在短期课程中获得较高的获胜概率,在短期课程中获得较低的获胜概率,反之亦然每一个时刻都是神奇的正如EAGLE 10错误地为相同技能的高尔夫球手打出相同的预测一样,每个得分结果也产生相同的概率(对于在给定标准杆和码数的洞上具有相同投射平均得分的高尔夫球手而言,例如小鸟或柏忌)事实上,具有相同平均值的概率分布看起来可能大不相同:它们可以展开或聚集在一起,不平衡于向左或向右并且有宽阔或狭窄的肩膀这些区别适用于球员 - 反映他们是否倾向于保守地进行比赛,或者积极地进行绿色和洞洞,其中有很多危险的球员将有更广泛的标准偏差(结果范围)比不那么危险的那些将EAGLE 20预测球员,球场和球洞的得分分布的所有四个时刻,并据此计算其概率完整的蒙特(Carlo)最后,我们改进了EAGLE的模拟方法尽管去年的模型确实根据他们之前的表现更新了每个模拟中每个玩家的预计洞穴结果概率(例如小鸟和柏忌),否则它会对待每个玩家 - 作为一个完全独立的事件相比,EAGLE 20首先模拟每个模拟中每个高尔夫球手的预期性能质量,以及每天的整个球场和每个球洞的预期难度然后计算结果基于这些预期日平均值的每个玩家洞的概率这两者都确保模拟过程将探索全范围的排列 - 例如,当一个球员恰好在非常容易地进行比赛时有一个休息日的球员 - 并且将适当地考虑对于任何一种趋势,玩家可能不得不在某一天从一个洞到另一个洞带来积极或消极的动力我不得不承认它已经到了在这个蓬勃发展的增长突破之后,EAGLE不再仅仅是一个刚刚起步但它还远没有完全成熟目前,它只取得了主要赛事的得分和来自非主要赛事的圆形数据;在未来,我们希望能够为它提供一个一个接一个的宴会,甚至是逐个拍摄的统计数据</p><p>同样,EAGLE目前依赖于推断大型击球手放置节拍器,直接投射的危险洞和虽然它的直觉是强大的,但它仍然是明确结合驾驶距离,天气预报和航线图的弱替代品如果它现在是一个敏锐的掠夺者,我们希望它最终会成熟为一个光头的圣人我们是渴望听到建设性的批评和任何改进的建议,所以如果您有任何想法,请在下面的评论帖子中分享 我们最初的方法论摘要,2016年7月15日:EAGLE最初是使用过去15年来从主要锦标赛中抽取的大约440,000个高尔夫球洞的数据集开发的</p><p>概念上,它非常简单首先,系统估计每个球员在每个球洞的技术水平接下来,根据球洞的配置和难度计算,计算高尔夫球手在每个洞上产生每种得分类型的概率,范围从老鹰(低于标准杆两杆)到四重柏忌(高于标准杆四杆)</p><p> ,它使用这些概率来模拟每个高尔夫球手在事件中剩下的每个洞数10,000次,计算每个参赛者赢得的模拟次数,以获得他们的胜利机会EAGLE的数字运算以最简单的前提开始:官方世界高尔夫排名(OWGR)是球员技能的合理代理证据支持这一假设排名较差的球员倾向于对于那些排名较高的人来说,他们的得分更低(参见图1)然而,OWGR对精英球员的能力来说是一个更可靠的指南对于排名下半部分的高尔夫球手来说,其平均成绩有时会更接近于柏忌范围而有时则不会因为这种现象,我们将这个图形称为“留声机情节”分析中的下一步同样有道理:不同面值的孔可能会显示出不同的特征,而针脚远离发球台的那些洞将比那些靠近球洞的那些洞更困难这些数字也证实了这一假设尽管绝对击球总分当然在五杆洞中最高,而在三杆洞中最低,帕尔在五杆洞比四分卫和三分球更容易击败(见图2)同时,五杆洞的得分也很多更多的影响据说距离洞口的距离远远超过四四分之三,这可能是因为只有这项运动中的顶级车手能够快速到达远距离的绿色区域,足以击中标准杆</p><p>另外,三分球得分也是如此倾向于聚集与一小部分柏忌相当接近,而小鸟甚至老鹰在五杆洞中更为常见所以一个寻求保护狭窄领先优势的球员将受益于有很多三分球的球员,这会阻止一个希望不太可能卷土重来的对手应该希望能够稳定地减少五杆洞的比赛</p><p>这三个因素 - OWGR,杆位和距离 - 占据了高尔夫球手得分变化的相当大的一部分在多元线性回归中,EAGLE可以计算任何球洞上任何高尔夫球手的基线预测分数</p><p>例如,我们预计一名球员在相对较短的500码(457米)五杆洞中排名世界第五</p><p>得分在0407左右低于标准杆比方说,593%的球和407%的小鸟相比之下,一个相同长度的挑战四杆洞的未经过排练的球员将被投射为高于标准杆的0479杆,可能是521%的杆和479%的柏忌</p><p>两个洞是相似的不幸的是,这种方法依赖于两个错误的,简化的假设:相同标准杆和距离的所有洞都相似,并且同一世界排名的所有高尔夫球手都是相似的让我们用这些小说消除虽然我们没有关于导致洞难度的非距离因素的特定历史数据,例如沙坑和水障碍,我们可以从高尔夫球手如何作为一组进行推断来了解他们的信息我们第一次看到球场时,我们假设每个洞都显示正常它的标准和距离的难度通过第二轮,我们可以比较之前玩过它的每个人的平均得分与我们根据他们的OWGRs预期得到的结果,以及洞的分数和码数在某些洞,看来这个领域的每个人都会小鸟;在其他人身上,即使是直接的标准看起来也是一项了不起的成就这些模式在锦标赛中变得高度一致,尽管它们每年都不是特别耐用在加利福尼亚州的圆石滩(图中),一个580码的臭名昭着的第14洞五杆洞,最后一场比赛是在2010年美国公开赛的一个主要赛事中根据高尔夫球手的OWGRs以及球洞的杆面值和距离,EAGLE预计该组平均为0在14号球杆上低于标准杆145杆但是在比赛的第一天,它们实际上合并了0435杆高于标准杆</p><p>这被证明是其难度的可靠先驱:该领域并未接近该车型的排名预测接下来的三天在第二轮比赛中,他们平均每场0474次投篮命中率差于标准杆即使在较弱的高尔夫球手在比赛中途被击败之后,他们在第三轮和第四轮中的表现也不会超过0401</p><p>当然,Pebble海滩的14号是有名的原因(现在正在进行修改,以减少它的残酷)但从某种意义上说,这是非常典型的:大多数洞在EAGLE的基础预测中显示出如此大的差异,在比赛初期倾向于维持它们在后几轮我们决定通过使用非线性回归测量它来利用这一趋势,以确定我们可以预期每天持续多少效果计算这个因素我们将其添加到EAGLE的预测中接下来,EAGLE寻求区分同等OWGRs的高尔夫球手最重要的是,并非所有世界级别的球员都是平等的在他的力量最高的时候,老虎伍兹在三年内赢得了七个大满贯相比之下,Jason Day,今天排名第一的球员,他的名字只有一个主要冠军此外,OWGRs遭受其他缺陷他们忽略了两年以上的所有数据他们完全基于球员在锦标赛中的完成而不是他的个人得分这意味着一个高尔夫球手的排名会变得更糟,如果他在一些竞争对手碰巧做得更好的那一天有他最好的一生所以我们的下一步是进行另一个非线性回归,以确定一个球员的最佳混合基于OWGR的预测以及他自己在主要锦标赛中的历史难度调整分数排名前200的球员没有特定的OWGR预测因此,我们不得不使用平均绩效毫无疑问,这个数字显然是一个相当弱的预测者所以没有球员,除非他们有近期的大型赛事经验,否则往往会有非常不稳定的预测:连续几只小鸟在比赛的第一天就足以增加EAGLE对其技术水平的估计相比之下,OWGR的可靠性令人印象深刻即使对于我们数据集中最常观察到的高尔夫球手 - 斯科特先生,他在主要PGA锦标赛之间拍摄了近4000个球洞</p><p> 2001年和2015年 - 我们对OWGR的加权大约是他个人记录Max Planck最喜欢的运动的两倍由于这些修正,EAGLE可以用基于OWGR,标准杆和距离的简单投影替换每个洞的定制预测特定难度和每个球员过去的表现然而,所有这些计算仍然依赖于第三个错误的假设:高尔夫球得分来自inf不可分割的棋子上面列出的方程式的输出是一个球员在给定球洞上的预期得分的预测 - 如果你是Rory McIlroy在2015年不可能短暂的284码四杆洞,则低于标准杆0689杆</p><p>如果你不幸在2003年英国公开赛第二轮第八洞(他吞下柏忌)中成为一名颓势的查尔斯·查伦,那么美国网球公开赛(他盯着它),或者比它高1045杆还要糟糕</p><p>实际上,没有人得到a -0689或者+1045,因为没有分数中风只有鹰,小鸟,pars和不断恶化的柏忌类型的游行 - 除了令人惊讶的罕见的三低于标准的信天翁,它只发生了8次我们的整个数据集为了将这些连续投影转化为离散分数,我们使用累积有序logit回归这种技术为每个洞的每个高尔夫球手产生七种不同结果的概率,范围从老鹰到四重柏忌(分数低于-2 o)高于+4的r是非常罕见的,我们无法可靠地对它们进行建模</p><p>所得到的预测根据洞的面值和距离,球场先前在球洞上的表现以及高尔夫球手的技术图3来说明潜在结果的范围</p><p>我们在每个票面价值数据集中的最短和最长的洞,它列出了每个得分最高和最差的高尔夫球手得分的几率 是的,20亿个模拟洞最后,有了这些概率,我们部署了蒙特卡罗模拟方法,最初是由核武器科学家在20世纪40年代开发的</p><p>对于每个锦标赛中每个洞的每个高尔夫球手,我们提取从0到0的随机数</p><p>一次10,000次,使用先前计算的概率将每个数字分配给小鸟或柏忌等结果我们随后在比赛进行时重复练习,模拟每个高尔夫球手完成第一洞后的剩余比赛,并在他们有完成后再次完成了第一个和第二个,依此类推,直到只留下一个洞来模拟All告诉我们,我们模拟了超过20亿个高尔夫球手洞</p><p>在每次比赛中,我们允许每个球员的投射洞成果受到早期球洞的影响,因此高尔夫球手随机抽出几个双柏忌参加比赛,他会看到他对该模拟其余部分的预测会相应地恶化一旦CPU完成g我们所要做的只是计算结果,看看每个球员赢得的频率所得到的概率看起来相当好校准(见图4)有319,000个高尔夫球手洞,其中EAGLE认为球员在低于05时获胜的可能性预计该组中有01%的人无法胜任并赢得胜利当然,确实有01%的胜利(最不可能的回归是韩国队的杨扬在2009年美国PGA锦标赛中的惊人反弹之后,落后伍兹先生八杆,这是一场比赛不太可能在我们的10,000次模拟中没有发生过一次最不可能的事情是基冈·布拉德利在2011年美国职业高尔夫球协会的胜利,当时他在前8洞落后领先7杆并取得了胜利,一万分之一同样,预计在20分钟中赢得一次的球员在5%的时间内获胜,那些预测为十分之一的球员在11%的时间中占优势,而预测为五分之一的球员在20%的时间内获胜,因为大多数高尔夫球手去如果失败,那么一个人很有可能获胜的情况就会少得多</p><p>因此,高端数据的可靠性会有所提高</p><p>例如,估计联合45%概率的156名球员实际赢得了63%的胜率</p><p>时间和另外274,由于集体79%的预测继续赢得86%的时间但是这些都是异常值:大多数最喜欢的群体的预测机会仍然是现货 - 并且没有明显的错误模式,暗示它们可能只是较小样本量的后果而不是系统性缺陷您可能想知道是否可以使用EAGLE赚钱我们不建议尝试使用来自GolfOddscom的历史投注线,我们比较了EAGLE过去的赛前预测对于那些领先的博彩公司而言,尽管两者的关系非常接近 - 它们的相关系数是084,其中1意味着完全一致地移动 - 我们发现这两个系列的线条比我们并没有在市场预测中添加一剂EAGLE并没有改善他们的预测我们并不对此感到沮丧:鉴于EAGLE完全依赖于公开的课程,记分卡和排名数据,如果竞争激烈,那将是非常惊人的博彩市场尚未充分纳入此类信息拉格维加斯无法做到的事情不仅告诉您将会发生什么,而且为什么EAGLE能够更新其预测作为事件进展的能力可能超过市场我们计划在未来的比赛中收集有关这方面的数据最好的还未到来EAGLE是一项正在进行中的工作,并将随着时间的推移而改进最重要的是,我们仍未设法摆脱其未经证实的假设的模型其蒙特卡罗方法依赖于前提是每个参赛者的表现不受任何其他参赛者的影响</p><p>实际上,高尔夫球手面临着改变比赛的战略激励措施</p><p>为了避免像Spieth一样的崩溃,而一个大幅度落后的人将会很好地承担风险玩家也可能因其在积分榜上的位置而受到心理上的影响同样,EAGLE目前假设所有具有同等技能的高尔夫球手同样表现出色在相同难度的洞上这几乎肯定是假的高尔夫球手的个人优势和劣势之间必须存在某种程度的“适合”,无论好坏,以及他正在玩的球场 EAGLE的未来迭代将尝试将这些动态结合起来此外,EAGLE现在根据玩家多久以前的表现来衡量玩家过去的表现</p><p>这可能会过于简单化我们想要探索“条纹”的概念或者“热手”,并找出一个碰巧连续组成一些显着或可怕的回合的玩家是否可能在短期内继续这些趋势最后,有无数额外的数据来源可以丰富EAGLE我们计划测试开球时间和天气的影响,分离推杆和驾驶性能,使用非记分卡信息,如驾驶距离和准确性,并扩展我们的数据集,