El Momento en Que Nos Dimos Cuenta de Que las Cuotas No Eran Suficientes
Aproximadamente seis meses después de construir nuestros modelos de predicción, chocamos con un muro. Nuestra precisión era decente, pero seguíamos viendo partidos donde nuestros modelos pasaban por alto factores obvios que cualquier fan del fútbol consideraría. Un equipo jugando su cuarto partido en doce días. Un plantel con tres titulares clave ausentes. Cosas básicas.
Las cuotas capturaban bien el sentimiento del mercado, pero comprimían mucho contexto en un solo número. Necesitábamos descomprimir ese contexto y dar a nuestros modelos acceso a los factores subyacentes.
Por Qué xG Se Convirtió en Nuestra Primera Característica No-Cuotas
Los Goles Esperados (xG) miden la calidad de los disparos en lugar de los goles reales. Un equipo que genera 2.5 xG pero solo marca uno está creando buenas oportunidades—simplemente ha tenido mala suerte. Con el tiempo, xG tiende a predecir la producción de goles futura mejor que los conteos de goles brutos.
Comenzamos a rastrear promedios de xG móviles—cuántos goles esperados crea y concede un equipo en los últimos cinco partidos.
La parte difícil fue acertar el timing. Solo puedes usar datos de xG de partidos que ya han terminado en el punto en que haces una predicción.
Lesiones: Más Matizadas de Lo Esperado
Nuestro primer intento con características de lesiones fue tosco: simplemente contar cuántos jugadores están lesionados. No ayudó mucho.
Lo que funcionó mejor:
- Ponderación por posición: La ausencia de un portero titular o delantero centro tiene más impacto que un extremo suplente
- Minutos jugados: Codificar cuántos minutos contribuyen típicamente los jugadores ausentes
- Inmediatez: ¿Cuándo se publicó la información de lesiones? Esto es importante para la integridad del modelo
Congestión de Calendario: La Característica Más Simple Que Funciona
Esto fue casi vergonzosamente simple, pero mejoró notablemente nuestros modelos:
- Días desde el último partido
- Número de partidos en los últimos 14 días
- Si el equipo tuvo un partido europeo a mitad de semana
Un equipo jugando su tercer partido en 7 días muestra una caída de rendimiento medible, especialmente en la segunda mitad.
Cómo Lo Combinamos Todo
El enfoque en capas que surgió de la experimentación:
Capa 1 - Línea Base: Las probabilidades derivadas de cuotas dan la valoración del mercado.
Capa 2 - Ajustes: Los datos de xG, lesiones y calendario pueden desplazar probabilidades cuando sugieren que el mercado puede estar pasando algo por alto.
Capa 3 - Confianza: Los patrones de movimiento de cuotas y el consenso de casas ayudan a calibrar cuánta confianza depositar.
Lo Que Aprendimos
- 1Características simples a menudo superan a las complejas si se implementan correctamente
- 2El timing y la higiene de datos son tan importantes como las características mismas
- 3Cada fuente de datos agrega valor incremental—no hay una "señal secreta" única
- 4Las mejores características son las que puedes explicar lógicamente
Todavía experimentamos con nuevas fuentes de datos, pero estas tres—xG, lesiones y calendario—han demostrado consistentemente su valor a través de múltiples temporadas.
*OddsFlow proporciona análisis deportivo impulsado por IA con fines educativos e informativos.*

