为什么原始赔率不等于100%
这是我刚开始处理赔率数据时的一个"顿悟"时刻。我把所有结果转换为隐含概率,加起来却得到...104%。然后是106%。有时甚至110%。
那个额外的百分比叫做利润率(或超额利润、vig、juice)。理解它对任何认真做体育数据分析的人都至关重要。
利润率背后的数学
在理论上的"公平"市场中,隐含概率的总和应该正好是100%:
| 结果 | 公平赔率 | 隐含概率 |
| 主胜 | 2.50 | 40% |
| 平局 | 3.33 | 30% |
| 客胜 | 3.33 | 30% |
| 总计 | 100% |
| 结果 | 实际赔率 | 隐含概率 |
| 主胜 | 2.38 | 42.0% |
| 平局 | 3.17 | 31.5% |
| 客胜 | 3.17 | 31.5% |
| 总计 | 105% |
为什么这对机器学习模型很重要
构建预测模型时,使用赔率作为特征有两种选择:
1. 使用原始隐含概率
简单,但包含因市场和来源而异的利润率噪声。
2. 标准化以移除利润率
````
真实概率 = 原始隐含概率 / 所有概率之和
在OddsFlow,当我们使用赔率作为校准目标时通常进行标准化,但在追踪市场变动时保留原始值(因为利润率变化本身也具有信息价值)。
将利润率作为特征使用
我们发现:利润率随时间的变化可以具有预测性。当利润率收紧(趋向100%)时,通常表明市场确定性增加。当利润率扩大时,可能存在信息不对称。
*OddsFlow提供AI驱动的体育分析,仅供教育和信息参考。*

