Saat Kami Menyadari Odds Tidak Cukup
Sekitar enam bulan setelah membangun model prediksi kami, kami menabrak dinding. Akurasi kami lumayan, tapi kami terus melihat pertandingan di mana model kami melewatkan faktor-faktor yang jelas yang akan dipertimbangkan oleh penggemar sepak bola mana pun. Tim yang memainkan pertandingan keempat mereka dalam dua belas hari. Skuad yang kehilangan tiga pemain kunci. Hal-hal dasar.
Odds menangkap sentimen pasar dengan baik, tapi mereka memampatkan banyak konteks menjadi satu angka. Kami perlu mendekompresi konteks itu dan memberikan model kami akses ke faktor-faktor yang mendasarinya.
Mengapa xG Menjadi Fitur Non-Odds Pertama Kami
Expected Goals (xG) mengukur kualitas tembakan daripada gol aktual. Tim yang menghasilkan 2.5 xG tapi hanya mencetak satu gol sedang menciptakan peluang bagus—mereka hanya tidak beruntung. Seiring waktu, xG cenderung memprediksi produksi gol masa depan lebih baik daripada hitungan gol mentah.
Kami mulai melacak rata-rata xG bergulir—berapa banyak gol yang diharapkan tim ciptakan dan kebobolan selama lima pertandingan terakhir.
Bagian yang rumit adalah mendapatkan timing yang tepat. Anda hanya bisa menggunakan data xG dari pertandingan yang sudah selesai pada saat Anda membuat prediksi.
Cedera: Lebih Bernuansa Dari yang Kami Harapkan
Percobaan pertama kami dengan fitur cedera kasar: hanya menghitung berapa banyak pemain yang cedera. Tidak banyak membantu.
Yang lebih berhasil:
- Pembobotan posisi: Kehilangan kiper utama atau striker utama memiliki dampak lebih besar daripada cadangan
- Menit bermain: Mengkodekan berapa menit yang biasanya disumbangkan pemain yang absen
- Kekinian: Kapan informasi cedera dipublikasikan? Ini penting untuk integritas model
Kepadatan Jadwal: Fitur Paling Sederhana yang Berhasil
Ini hampir memalukan sederhananya, tapi secara nyata meningkatkan model kami:
- Hari sejak pertandingan terakhir
- Jumlah pertandingan dalam 14 hari terakhir
- Apakah tim memiliki pertandingan Eropa di tengah minggu
Tim yang memainkan pertandingan ketiga mereka dalam 7 hari menunjukkan penurunan kinerja yang terukur, terutama di babak kedua.
Bagaimana Kami Menggabungkan Semuanya
Pendekatan berlapis yang muncul dari eksperimen:
Lapisan 1 - Baseline: Probabilitas yang berasal dari odds memberikan penilaian pasar.
Lapisan 2 - Penyesuaian: Data xG, cedera, dan jadwal dapat menggeser probabilitas ketika menyarankan pasar mungkin melewatkan sesuatu.
Lapisan 3 - Kepercayaan: Pola pergerakan odds dan konsensus bandar membantu mengkalibrasi seberapa besar kepercayaan yang harus ditempatkan.
Apa yang Kami Pelajari
- 1Fitur sederhana sering mengalahkan yang kompleks jika diimplementasikan dengan benar
- 2Timing dan kebersihan data sama pentingnya dengan fitur itu sendiri
- 3Setiap sumber data menambah nilai tambahan—tidak ada "sinyal rahasia" tunggal
- 4Fitur terbaik adalah yang bisa Anda jelaskan secara logis
Kami masih bereksperimen dengan sumber data baru, tapi ketiga ini—xG, cedera, dan jadwal—telah secara konsisten membuktikan nilainya selama beberapa musim.
*OddsFlow menyediakan analisis olahraga bertenaga AI untuk tujuan edukasi dan informasi.*

