Cara Saya Menggunakan Pembelajaran Mesin Untuk Taruhan Judi Bola

Cara Saya Menggunakan Pembelajaran Mesin Untuk Taruhan Judi Bola

Bisakah pembelajaran mesin membuat Anda kaya dari taruhan olahraga?

Dua tahun lalu, saya bertanya pada diri sendiri apakah mungkin menggunakan pembelajaran mesin untuk memprediksi hasil pertandingan sepak bola dengan lebih baik. Saya juga mencoba taruhan slot spadegaming dengan mesin dan menghasilkan banyak uang.

Saya memutuskan untuk mencobanya dengan serius dan hari ini, dua tahun dan data kontekstual dari 30.000 pertandingan sepak bola kemudian, saya mendapatkan banyak wawasan menarik.

Tantangan data besar: Mari mulai penambangan data

Langkah 1: Untuk memulai, saya mengumpulkan poin data sebanyak mungkin. Saya menambang data game lama dari setiap sumber dan API berbeda yang dapat saya temukan. Beberapa yang lebih penting adalah Football-data, Everysport, dan Betfair.

Langkah 2: Saya kemudian menggabungkan poin data ini dengan hasil yang sesuai, menghitungnya, dan memasukkan semuanya ke dalam satu database.

Langkah 3. Terakhir, saya menggunakan data tersebut untuk melatih model pembelajaran mesin, untuk digunakan sebagai perangkat lunak saya untuk memprediksi pertandingan sepak bola yang akan datang.

Bagaimana mengukur prediksi yang tidak dapat diprediksi
Sifat dari sebuah pertandingan sepak bola tentu saja tidak dapat diprediksi. Saya rasa itu sebabnya kami menyukai game ini, bukan?

Namun, saya agak terobsesi dengan gagasan naif bahwa saya, yang dipersenjatai dengan model pembelajaran mesin berbasis data, akan dapat memprediksi game dengan lebih baik daripada biasanya. Pada saat itu, saya mendasarkan sebagian besar taruhan olahraga saya pada emosi (“firasat”) daripada data aktual.

Tantangan pertama adalah menemukan cara mengukur apakah model saya berhasil atau tidak. Saya segera menyadari bahwa mengukur persentase sebenarnya dari game yang ditebak dengan benar tidak menambah banyak nilai – bukan tanpa beberapa bentuk konteks.

Saya memutuskan untuk membandingkan keluaran model dengan tebakan terbaik dari pasar sebenarnya. Cara termudah untuk menilai data tersebut adalah memanen peluang yang diatur pasar. Oleh karena itu, saya mulai membandingkan bagaimana kinerja model saya jika bertaruh pada Betfair, hanya karena peluang mereka disesuaikan berdasarkan orang sungguhan bertaruh dengan uang sungguhan satu sama lain.

Hasilnya: Apakah model saya membuat saya kaya?

Maju cepat ke hari ini: Sekarang – dua tahun telah berlalu. Apakah model itu membuat saya menjadi orang kaya?

Tidak.

Saya segera menyadari bahwa sebagian besar prediksi saya selaras dengan kinerja terbaik pasar.

Karena saya menggunakan model berbasis regresi, saya dapat memprediksi kekuatan probabilitas hasil tertentu dari suatu game. Dan pada tingkat probabilitas terkuat, model saya memprediksi sekitar 70% game dengan benar. Karena pasar bekerja dengan baik, itu membuat saya sulit untuk benar-benar menghasilkan uang yang serius dari taruhan saya.

Tapi, sejujurnya, saya juga tidak pernah berpikir bahwa saya akan menciptakan “mesin uang”. Sebagai gantinya, saya mendapatkan beberapa wawasan yang cukup menarik tentang kemungkinan (dan batasan!) Dari data besar dan pembelajaran mesin:

Pembelajaran 1: Pembelajaran mesin dan mengurangi keuntungan

Secara teori, pembelajaran mesin harus dapat meningkat dari waktu ke waktu. Jumlah data yang harus dipelajari model dari pertumbuhan, meningkatkan hasil prediksi.

Yah, ini sama sekali bukan pengalaman saya.

Dua tahun lalu saya mulai dengan sekitar 2.000 game di database saya – dan dengan set data yang cukup terbatas yang menyertainya. Hari ini, saya memiliki hampir 30.000 game di database, lengkap dengan banyak metadata yang mencakup segala hal mulai dari cuaca dan jarak antara kandang tim hingga tembakan dan tendangan sudut.

Semua data tambahan ini – dan fakta bahwa model tersebut telah dapat “belajar” dari waktu ke waktu! – masih belum meningkatkan prediksinya. Tampaknya data besar dan pembelajaran mesin hanya membawa Anda sejauh ini dalam mencoba memprediksi hal-hal yang tidak dapat diprediksi.

Pembelajaran 2: Kekuatan generalisasi yang tidak bias

Misalnya: Selama dua tahun terakhir, saya penasaran untuk melihat apakah model saya dapat memprediksi kapan kemenangan atau kekalahan beruntun harus dipatahkan. Misalnya, jika bisa memprediksi kapan Barcelona akhirnya akan kalah setelah memenangkan sepuluh pertandingan berturut-turut. Bisakah model saya membuktikan anomali tertentu menjadi signifikan?

Yah, itu terbukti tidak begitu bagus dalam hal itu.

Yang saya temukan adalah bahwa model itu secara mengejutkan bagus dalam bertaruh melawan tim yang dinilai terlalu tinggi dari waktu ke waktu.

Musim lalu, saya melihat bagaimana mesin prediksi sepak bola saya cukup sering melakukan prediksi melawan Borussia Dortmund sementara pasar membuat prediksi lain. Dortmund akhirnya mengalami musim yang buruk membuat model saya lebih menguntungkan dibandingkan dengan prediksi pasar. Musim ini saya telah melihat hal yang sama ketika datang ke tim-tim seperti Liverpool dan Chelsea.

Jadi pelajaran yang didapat adalah bahwa beberapa orang cenderung membuat keputusan taruhan olahraga berdasarkan emosi. Liverpool dan Dortmund adalah tim yang disukai oleh banyak orang dan terkadang, Anda membuat prediksi dengan hati, bukan otak Anda. Model pembelajaran mesin saya, ternyata tidak.

Pembelajaran 3: Pembelajaran mesin dan keuntungan mudah

Jika tidak ada yang lain, saya belajar bahwa membuat prediksi yang mengungguli pasar itu sulit. Namun, ketika saya mulai melihat apa yang telah saya capai (alih-alih hanya terobsesi pada apa yang tidak saya capai), saya menemukan satu fakta yang cukup mengejutkan:

Dari program Python sederhana dan kurang dari 10.000 baris kode, saya masih membuat sesuatu yang berkinerja sebaik pasar. Berapa banyak jam kerja yang tidak ada di belakang model dan prediksi peluang bandar judi? Model ini dapat memilih taruhan yang menarik setiap minggu, sama seperti surat kabar atau pakar mana pun. Dengan membuat generalisasi, Anda mungkin tidak dapat menemukan satu taruhan yang akan membuat Anda kaya – tetapi ini dapat menghemat banyak waktu dalam konteks yang tepat.

Menerapkan pembelajaran mesin ke Ide Luas

Dengan pemahaman ini, saya mulai melihat proyek lain yang telah saya ikuti selama lima tahun terakhir; platform ide Wide Ideas, platform bagi perusahaan untuk mengumpulkan ide dan kreativitas.

Yang ingin saya lakukan adalah melihat ide-ide yang dikumpulkan perusahaan dari karyawan mereka dan mencoba memprediksi apakah ide tersebut akan diimplementasikan atau tidak.

Tim dan saya menghitung data, tetapi alih-alih tembakan ke gawang dan prakiraan cuaca, kami melihat berapa banyak yang telah berinteraksi dengan sebuah ide – dan dengan cara apa. Dan lihatlah; hasilnya setara dengan prediksi sepak bola:

Kami sekarang dapat membuat prediksi yang layak tentang apakah ide kreatif akan diterapkan atau tidak. Kami dapat memvisualisasikan ini dengan cara mendorong lebih banyak ide hebat melalui gamifikasi.

Bisakah kita menemukan ide bagus yang tidak mengikuti pola umum dari ide bagus? Tidak, tidak juga – setidaknya belum.

Namun, untuk produk, dan mengingat Anda melihat organisasi yang dapat memanen 10.000 ide per tahun, menemukan cara untuk menyoroti dan mendorong ide-ide tertentu dapat menghemat waktu dan sumber daya. Jadi, hanya dengan beralih dari 10.000 ide menjadi 100 mungkin ide bagus dan memvisualisasikan hasilnya akan menghemat banyak waktu.

Kesenjangan besar antara membuat mesin sebaik manusia dan benar-benar membuatnya lebih baik dari kita.

Data besar dan pembelajaran mesin mungkin dapat memprediksi apa pun mulai dari kanker stadium awal hingga membuat mobil tanpa pengemudi untuk mengantisipasi potensi bahaya. Model seperti ini mungkin akan terbukti paling berguna jika generalisasi menghemat waktu.

Ambil implementasi medis, misalnya. Memilah-milah ribuan gambar tanda lahir, sebuah model dapat membantu memilih yang paling mungkin menjadi kanker, sehingga menghemat waktu dan sumber daya dokter yang berharga.

Namun, perilaku manusia mungkin terbukti rumit. Bagaimana perilaku manusia dapat diprediksi? Kami tidak rasional secara rasional. Kami akan dapat menggeneralisasi, menempatkan orang ke dalam kategori berbeda berdasarkan apa yang Anda suka makan, tonton, atau lakukan, tetapi mungkin ada terlalu banyak faktor yang membedakan kami sebagai individu.

Akankah data besar dan pembelajaran mesin dapat mendeteksi anomali – atau apakah itu hanya akan menjadi hebat dalam membuat generalisasi?

Saya berharap kita akan mengalami masa depan di mana perusahaan berfokus pada analisis data aktual, alih-alih berpikir bahwa “data besar” secara default sama dengan “data yang lebih baik”.

Jadi, sampai seseorang membuktikan saya salah (atau Arnold Schwarzenegger kembali dari masa depan, mana saja yang lebih dulu!), Saya percaya bahwa pembelajaran mesin harus digunakan di mana generalisasi dapat menghemat waktu dari manusia nyata.

Sebaliknya, risikonya adalah kita akan mendapatkan begitu banyak metrik sehingga jumlah yang begitu banyak akan mencekik kemungkinan untuk memahaminya.