Mengapa Satu Sumber Data Tidak Cukup
Di awal membangun sistem prediksi kami, kami membuat kesalahan pemula. Kami memilih satu penyedia odds dan membangun segalanya di sekitarnya. Bersih, sederhana, dan sepenuhnya salah.
Masalahnya menjadi jelas pada suatu akhir pekan ketika penyedia itu mengalami gangguan. Harga mereka menjadi aneh selama beberapa jam, dan seluruh model kami mulai menghasilkan sampah. Saat itulah kami menyadari: bergantung pada satu sumber seperti membangun rumah di atas satu tiang.
Sekarang kami mengagregasi data dari berbagai sumber, dan semuanya menjadi lebih kuat.
Kekuatan Konsensus
Pikirkan seperti ini. Jika Anda bertanya kepada satu orang tentang suhu di luar, Anda mendapat satu perkiraan. Tanya sepuluh orang, dan Anda mendapat sesuatu yang lebih dekat dengan kebenaran—terutama jika sebagian besar setuju.
Prinsip yang sama berlaku untuk data pasar. Penyedia yang berbeda memiliki kekhasan yang berbeda:
- Beberapa bereaksi lebih cepat terhadap berita
- Beberapa memiliki margin lebih tinggi
- Beberapa mengkhususkan diri pada liga tertentu
Ketika kami menggabungkannya, kekhasan tersebut rata-rata. Yang tersisa adalah sinyal yang lebih bersih.
Bagaimana Kami Membangun Fitur Konsensus
Ini adalah proses aktual kami:
Langkah 1: Kumpulkan odds dari berbagai sumber untuk pertandingan yang sama.
Langkah 2: Konversi semuanya ke probabilitas tersirat (agar kami membandingkan apel dengan apel).
Langkah 3: Hitung probabilitas median di seluruh sumber. Mengapa median bukan rata-rata? Karena tahan terhadap outlier.
Langkah 4: Ukur dispersi—seberapa tersebar sumber-sumbernya.
Metrik dispersi itu ternyata sangat berguna. Ketika sumber-sumber setuju erat (dispersi rendah), pasar yakin. Ketika tersebar (dispersi tinggi), ada ketidakpastian yang nyata.
Dispersi Sebagai Fitur
Biarkan saya memberi contoh nyata. Dua pertandingan sama-sama memiliki probabilitas median kemenangan kandang 55%.
Pertandingan A: Sumber berkisar dari 53% hingga 57%. Dispersi rendah.
Pertandingan B: Sumber berkisar dari 48% hingga 62%. Dispersi tinggi.
Pertandingan A adalah konsensus. Pertandingan B memiliki ketidaksepakatan—mungkin ada berita cedera yang tidak jelas.
Kami memasukkan dispersi ke model kami sebagai fitur terpisah. Ini membantu model memahami bukan hanya apa yang dipikirkan pasar, tetapi seberapa yakin pasar tersebut.
Poin Kunci
- 1Data sumber tunggal rapuh; konsensus kuat
- 2Median menangani outlier lebih baik dari rata-rata
- 3Dispersi adalah fitur, bukan hanya noise
- 4Lacak bagaimana kesepakatan berubah seiring waktu
📖 Bacaan terkait: Bagaimana Margin Dihitung • Pergerakan Odds
*OddsFlow menyediakan analisis olahraga bertenaga AI untuk tujuan edukasi dan informasi.*

