Le Moment Où Nous Avons Réalisé Que Les Cotes Ne Suffisaient Pas
Environ six mois après avoir construit nos modèles de prédiction, nous avons touché un mur. Notre précision était correcte, mais nous continuions à voir des matchs où nos modèles manquaient des facteurs évidents que n'importe quel fan de football considérerait. Une équipe jouant son quatrième match en douze jours. Un effectif sans trois titulaires clés. Des choses basiques.
Les cotes capturaient bien le sentiment du marché, mais elles compressaient beaucoup de contexte en un seul nombre. Nous devions décompresser ce contexte et donner à nos modèles accès aux facteurs sous-jacents.
Pourquoi xG Est Devenu Notre Première Caractéristique Non-Cotes
Les Buts Attendus (xG) mesurent la qualité des tirs plutôt que les buts réels. Une équipe qui génère 2.5 xG mais ne marque qu'une fois crée de bonnes occasions—elle a juste eu malchance. Avec le temps, xG tend à mieux prédire la production future de buts que les comptages de buts bruts.
Nous avons commencé à suivre les moyennes mobiles de xG—combien de buts attendus une équipe crée et concède au cours des cinq derniers matchs.
La partie délicate était de bien gérer le timing. Vous ne pouvez utiliser que des données xG de matchs déjà terminés au moment où vous faites une prédiction.
Blessures: Plus Nuancées Que Prévu
Notre première tentative avec les caractéristiques de blessures était grossière: simplement compter combien de joueurs sont blessés. Ça n'a pas beaucoup aidé.
Ce qui a mieux fonctionné:
- Pondération par position: L'absence d'un gardien titulaire ou d'un avant-centre a plus d'impact qu'un remplaçant
- Minutes jouées: Encoder combien de minutes les joueurs absents contribuent typiquement
- Immédiateté: Quand l'information de blessure a-t-elle été publiée? C'est important pour l'intégrité du modèle
Encombrement du Calendrier: La Caractéristique la Plus Simple Qui Fonctionne
C'était presque honteusement simple, mais ça a notablement amélioré nos modèles:
- Jours depuis le dernier match
- Nombre de matchs dans les 14 derniers jours
- Si l'équipe avait un match européen en milieu de semaine
Une équipe jouant son troisième match en 7 jours montre une baisse de performance mesurable, surtout en seconde période.
Comment Nous Combinons Tout
L'approche en couches qui a émergé de l'expérimentation:
Couche 1 - Baseline: Les probabilités dérivées des cotes donnent l'évaluation du marché.
Couche 2 - Ajustements: Les données xG, blessures et calendrier peuvent décaler les probabilités quand elles suggèrent que le marché rate quelque chose.
Couche 3 - Confiance: Les modèles de mouvement des cotes et le consensus des bookmakers aident à calibrer le niveau de confiance.
Ce Que Nous Avons Appris
- 1Les caractéristiques simples surpassent souvent les complexes si bien implémentées
- 2Le timing et l'hygiène des données sont aussi importants que les caractéristiques elles-mêmes
- 3Chaque source de données ajoute de la valeur incrémentale—il n'y a pas de "signal secret" unique
- 4Les meilleures caractéristiques sont celles que vous pouvez expliquer logiquement
Nous expérimentons encore de nouvelles sources de données, mais ces trois—xG, blessures et calendrier—ont constamment prouvé leur valeur sur plusieurs saisons.
*OddsFlow fournit des analyses sportives alimentées par l'IA à des fins éducatives et informatives.*

