為什麼原始賠率不等於100%
這是我剛開始處理賠率數據時的一個「頓悟」時刻。我把所有結果轉換為隱含機率,加起來卻得到...104%。然後是106%。有時甚至110%。
那個額外的百分比叫做利潤率(或超額利潤、vig、juice)。理解它對任何認真做體育數據分析的人都至關重要。
利潤率背後的數學
在理論上的「公平」市場中,隱含機率的總和應該正好是100%:
| 結果 | 公平賠率 | 隱含機率 |
| 主勝 | 2.50 | 40% |
| 平局 | 3.33 | 30% |
| 客勝 | 3.33 | 30% |
| 總計 | 100% |
| 結果 | 實際賠率 | 隱含機率 |
| 主勝 | 2.38 | 42.0% |
| 平局 | 3.17 | 31.5% |
| 客勝 | 3.17 | 31.5% |
| 總計 | 105% |
為什麼這對機器學習模型很重要
構建預測模型時,使用賠率作為特徵有兩種選擇:
1. 使用原始隱含機率
簡單,但包含因市場和來源而異的利潤率雜訊。
2. 標準化以移除利潤率
````
真實機率 = 原始隱含機率 / 所有機率之和
在OddsFlow,當我們使用賠率作為校準目標時通常進行標準化,但在追蹤市場變動時保留原始值(因為利潤率變化本身也具有資訊價值)。
將利潤率作為特徵使用
我們發現:利潤率隨時間的變化可以具有預測性。當利潤率收緊(趨向100%)時,通常表明市場確定性增加。當利潤率擴大時,可能存在資訊不對稱。
*OddsFlow提供AI驅動的體育分析,僅供教育和資訊參考。*

