Memahami Bayesian Probability

Istilah bayesian probability ini cukup sering muncul ketika saya sedang mencari dan membaca literatur tentang machine learning dan semacamnya. Sebenarnya ini itu barang apa? Saya selalu berpegang bahwa probabilitas itu bisa dihitung dengan pure logic yaitu:


Contoh konkritnya misal kita ingin mengetahui probabilitas dadu yang dikocok hasilnya adalah angka genap, kita tahu angka yang ada pada dadu adalah 1, 2, 3, 4, 5, dan 6 sementara angka genap pada dadu adalah 2, 4, 6. Sehinnga kemungkinan angka dadu yang muncul genap adalah


atau 50%.

Sementara itu, rumus dari bayesian probability sepintas agaknya counterintuitive, yaitu


Masalah pertama mengapa rumus ini membingungkan adalah kita tidak tahu arti simbonya. Arti dari simbol-simbol pada rumus tersebut adalah sebagai berikut

- P(A|B) dan P(B|A) = probabilitas terjadinya A jika B juga terjadi (sebagai trigger dari A) dan sebaliknya secara berurutan

- P(A) dan P(B) = probabilitas terjadinya A dan B secara independen (dengan tidak memperhitungkan adanya trigger)

Sebenarnya, formulasi dari bayesian probability ini analog dengan rumus sederhana yang kita deklarasikan paling awal tadi, hanya saja di bayesian probability memperhitungkan bagaimana jika suatu kejadian (P(A|B)) dengan triggernya (P(B|A)) tidak 100% pasti memicu kejadian tersebut. Probabilitas ini disebut juga sebagai probabilitas kondisional. Suku penyebut pada rumus bayesian probability bisa di anggap sama seperti "TotalKejadian". Jelasnya bisa dengan contoh soal berikut:

Suatu tes narkoba mempunyai keakuratan 99% untuk mendeteksi orang yang positif memakai narkoba. Anggap ada 0.5% pemakai narkoba pada populasi yang dilakukan tes tersebut, berapa persen seseorang mendapatkan hasil tes narkoba positif dan benar-benar memakai narkoba?

Pada kasus ini kita mencari P(User | +), dimana 'User' berarti pengguna narkoba yang sebenarnya dan '+' pada tes terdeteksi menggunakan narkoba. Sementara itu 'NonUser' dianggap sebagai bukan pengguna narkoba. Sehingga kasus ini bisa dirumuskan menjadi


Pada kasus ini, ada 2 kemungkinan seseorang itu mendapatkan hasil tes narkoba positif, yaitu: orang itu benar-benar menggunakan narkoba atau orang itu sebenarnya tidak menggunakan narkoba. Dengan menganalogikannya sama seperti rumus probabilitas yang paling awal kita deklarasi sebelumnya di sini, maka P(+) bisa di uraikan lagi sehingga rumusan permasalahan ini menjadi


Sekarang mari kita kuantifikasi rumusan di atas. Tes tersebut akurasinya 99% (P(+|User) = 0.99, P(+|NonUser) = 0.01). Pengguna narkoba dalam populasi yang di tes ada 0.5% (P(User) = 0.005, P(NonUser) = 0.995). Sehingga ini menjadi


atau 33.2% probabilitas seseorang yang di tes hasilnya positif dan benar-benar menggunakan narkoba.

Cara saya pribadi agar bisa memahami teori ini yaitu dengan mengubah contoh kasus tersebut menjadi lebih sederhana. Seandainya akurasi dari tes narkoba tersebut adalah 100%. maka


100%. Do u see the big picture here? Inilah alasan kenapa ini disebut sebagai probabilitas kondisional. Kita mencoba menghitung probabilitas suatu kejadian dengan informasi ada kejadian yang sekiranya bisa memicu kejadian yang akan kita hitung probabilitasnya tersebut. Seketika saya langsung memahami apa yang sebenarnya inti dari perhitungan probabilitas ini.

Pada kasus pertama tadi (akurasi tes 99%), kehandalan tes tersebut yang begitu rendah (33.2%) hanya karena keakurasian tesnya sedikit tidak akurat. Sebenarnya itu bisa dinalar kalau kita memahami probabilitas kondisional ini. Misal ada 1000 orang yang akan di tes narkoba, maka yang akan mendapatkan hasil tes positif narkoba akan terbagi 2, yaitu: yang mendapatkan tes false positif (0.01 x 995 ≈ 10) dan yang benar-benar memakai narkoba (0.99 x 5 ≈ 5). Dengan memakai rumus sederhana kita tadi, di dapatkan


yang mana ini mendekati dengan hasil yang kita hitung menggunakan formula bayesian probability tadi.

Sekian pemaparan tentang bayesian probability ini. Postingan ini agak lambat dan redundant tujuannya agar bayesian probability ini menjadi lebih intuitif untuk dipahami.

referensi:
https://en.wikipedia.org/wiki/Bayes%27_theorem, di Akses pada 31 Desember 2017

Komentar