我第一次注意到有趣的事情
当我开始为我们的模型跟踪赔率数据时,我犯了大多数人都会犯的错误:我只看开盘和收盘价格。每场比赛两个数据点,仅此而已。
然后有一天,我真正绘制了一场比赛的完整时间线。这条线不是直的——它有曲线、突然下降、稳定期和最后一刻的飙升。我意识到我一直在丢弃90%的信号。
那时我开始把赔率变动不当作噪音,而是当作结构化数据来思考。
蒸汽和漂移:基本词汇
让我给你我们内部使用的术语:
蒸汽是赔率缩短——隐含概率上升。如果一支球队开盘3.00(33%隐含概率),然后降到2.50(40%隐含概率),这就是蒸汽。某些东西正在将市场拉向那个结果。
漂移是相反的。赔率延长,隐含概率下降。也许市场正在远离某个结果,或者资金正在流向其他地方。
但关键是:标签不是重点。重点是变动*如何*以及*何时*发生。
稳定性是没人谈论的特征
两场比赛可以以完全相同的收盘赔率结束,但到达那里的路径完全不同。
比赛A开盘2.00,全天保持在1.95-2.05之间,收盘2.00。稳定。
比赛B开盘2.00,波动到2.40,降到1.80,反弹到2.20,收盘2.00。波动。
从收盘赔率的角度来看,它们是相同的。但从信号的角度来看?完全不同的故事。
我们使用赔率路径的标准差来测量稳定性,结果发现它是我们更具预测性的特征之一。高波动性通常表明市场不确定性或信息冲突。
临门变动得到特殊处理
这是我们从分析数百万场比赛中学到的:开球前最后几个小时的变动与早期变动表现不同。
为什么?临门变动包含:
- 最终阵容确认
- 最后一刻的伤病消息
- 天气更新
- 之前不可用的信息
我们将变动特征分为"早期"(T-4小时之前)和"临门"(最后4小时)窗口。临门窗口往往更有信息量,但如果不小心处理也会更嘈杂。
我们如何将变动转化为特征
原始赔率变动是混乱的。以下是我们如何清理它:
Delta (Δ): 从开盘到当前隐含概率的简单变化。如果开盘35%,现在是42%,delta是+7个百分点。
速度: 移动有多快?24小时内7个点的变化与30分钟内7个点完全不同。
波动性: 路径的标准差。我们是平稳到达还是经历混乱?
临门强度: 总变动中有多少百分比发生在最后窗口?
这些成为我们特征矩阵中的列。模型学习哪些模式具有预测性。
关键要点
- 1蒸汽=概率上升,漂移=概率下降
- 2稳定性是一个特征,不仅仅是噪音
- 3临门变动值得单独分析
- 4将原始变动转化为结构化特征(delta、速度、波动性)
*OddsFlow提供AI驱动的体育分析,仅供教育和信息目的。*

