私たちを騙したバックテストの間違い（そしてどう修正したか）

データリーケージ、チェリーピッキング、そしてバックテスト結果が嘘をつく微妙な方法。実際の予測システム構築からの教訓。

OddsFlow Team

完璧に見えたモデル（そうでなくなるまで）

最初のバックテストの災害を今でも覚えています。モデルは2年間の履歴データで12%のROIを示しました。お祝いしていました。

そしてデプロイしました。最初の月：-8%。2ヶ月目：-6%。何が起こったのか？

リーケージ。オープニングで予測するはずのモデルを訓練するために、誤ってクロージングオッズを使用していました。もちろんバックテストでは素晴らしく見えました——未来を見ていたのですから。

リーケージ：サイレントモデルキラー

データリーケージは、モデルが予測時に持つべきでない情報を誤って見たときに発生します。

私たちが発見した一般的なリーケージソース：

1オープニングで予測するときのトレーニングデータのクロージングオッズ

2ラインナップ発表前のタイムスタンプでの最終ラインナップデータ

3特徴計算に忍び込む試合後の統計

4シーズン中の予測に漏れるシーズン終了情報

修正は簡単ですが規律が必要：すべてをタイムスタンプロック。

チェリーピッキング：自分に嘘をつく方法

これは微妙で、しばしば無意識に起こります。

私たちの現在のルール：実験を実行する*前に*包含基準を定義し、何があってもそれを守る。

重要なポイント

1リーケージはどんなモデルも素晴らしく見せることができる（デプロイまで）
2チェリーピッキングは微妙に起こる——事前に基準を定義
3時間ベースの分割はスポーツデータに必須
4サッカーは変化する；複数の時間ウィンドウで評価

📖 関連記事： モデル評価 • 特徴エンジニアリング

*OddsFlowは教育および情報目的でAI駆動のスポーツ分析を提供しています。*

#backtesting#model validation#data leakage#ML best practices#sports analytics#time series

Ready to get AI-powered predictions?

Start using OddsFlow to make smarter betting decisions with data-driven insights.

View Predictions

完璧に見えたモデル（そうでなくなるまで）

最初のバックテストの災害を今でも覚えています。モデルは2年間の履歴データで12%のROIを示しました。お祝いしていました。

そしてデプロイしました。最初の月：-8%。2ヶ月目：-6%。何が起こったのか？

リーケージ：サイレントモデルキラー

データリーケージは、モデルが予測時に持つべきでない情報を誤って見たときに発生します。

私たちが発見した一般的なリーケージソース：

1オープニングで予測するときのトレーニングデータのクロージングオッズ

2ラインナップ発表前のタイムスタンプでの最終ラインナップデータ

3特徴計算に忍び込む試合後の統計

4シーズン中の予測に漏れるシーズン終了情報

修正は簡単ですが規律が必要：すべてをタイムスタンプロック。

チェリーピッキング：自分に嘘をつく方法

これは微妙で、しばしば無意識に起こります。

私たちの現在のルール：実験を実行する*前に*包含基準を定義し、何があってもそれを守る。

重要なポイント

1リーケージはどんなモデルも素晴らしく見せることができる（デプロイまで）
2チェリーピッキングは微妙に起こる——事前に基準を定義
3時間ベースの分割はスポーツデータに必須
4サッカーは変化する；複数の時間ウィンドウで評価

📖 関連記事： モデル評価 • 特徴エンジニアリング

*OddsFlowは教育および情報目的でAI駆動のスポーツ分析を提供しています。*

私たちを騙したバックテストの間違い（そしてどう修正したか）

完璧に見えたモデル（そうでなくなるまで）

リーケージ：サイレントモデルキラー

チェリーピッキング：自分に嘘をつく方法

重要なポイント

Ready to get AI-powered predictions?

関連記事

サッカーオッズの読み方：価格を確率に変換する方法

勝率が誤解を招く指標である理由：キャリブレーションと適切な評価

オープニング vs クロージングデータ：タイミングが市場情報品質にどう影響するか

Ready to Try AI-Powered Predictions?

私たちを騙したバックテストの間違い（そしてどう修正したか）

完璧に見えたモデル（そうでなくなるまで）

リーケージ：サイレントモデルキラー

チェリーピッキング：自分に嘘をつく方法

重要なポイント

Ready to get AI-powered predictions?

関連記事

サッカーオッズの読み方：価格を確率に変換する方法

勝率が誤解を招く指標である理由：キャリブレーションと適切な評価

オープニング vs クロージングデータ：タイミングが市場情報品質にどう影響するか

Ready to Try AI-Powered Predictions?