Teore eorema ma Bayes/ Bayesian/ Naïve Bayes Dwi Harin Harinii sulis s ulistyawati tyawati S.ST S.ST., ., MT. MT.
SEJARAH TEOREMA BAYES •
•
•
Ditemukan oleh Reverend Thomas Bayes abad ke 18 Dikembangkan secara luas dalam statistik inferensia (statistik yang digunakan untuk menganalisis data sampel dan hasilnya diberlakukan untuk populasi) Aplikasi banyak untuk : DSS (Decision Support System)
SEJARAH TEOREMA BAYES
Thomas Bayes, seorang pendeta Inggris pada tahun 1763
TEOREMA BAYES Menurut Grainner (1998), teorema bayes mempunyai beberapa kelebihan, yaitu: 1. Mudah untuk dipahami. 2. Hanya memerlukan pengkodean yang sederhana. 3. Lebih cepat dalam penghitungan.
DEFINISI TEOREMA BAYES •
•
Teorema Bayes menerangkan hubungan antara probabilitas terjadinya peristiwa A dengan syarat peristiwa B telah terjadi dan probabilitas terjadinya peristiwa B dengan syarat peristiwa A telah terjadi. Teorema ini didasarkan pada prinsip bahwa tambahan informasi dapat memperbaiki probabilitas (Iqbal Hasan, 1999). Probabilitas adalah suatu nilai untuk mengukur tingkat kemungkinan terjadinya suatu kejadian yang tidak pasti (Johannes Supranto, 1991).
CONTOH 1 Diketahui hasil survey yang dilakukan sebuah lembaga kesehatan menyatakan bahwa 30% penduduk di dunia menderita sakit paruparu. Dari 30% penduduk yang sakit paru-paru ini 60% adalah perokok, dan dari penduduk yang tidak menderita sakit paru-paru 20% perokok. Hitung peluang kemungkinannya bila diketahui seseorang merokok, apakah dia menderita sakit paru-paru?
S olus i: Fakta didefinis ik an deng an: X=s aki t paru-paru dan Y=perokok Tahap 1 P(X) = 0.3 Peluang Seseorang merokok dan P(~X) = 0.7 dia menderita sakit paru-paru = YA Tahap 2 P(Y |X) = 0.6 P(Y |~X) = 0.2 Tahap 3
P({Y }|X) = P(Y |X).P(X) = (0.6) . (0.3) = 0.18 P({Y }|~X) = P(Y |~X). P (~X) = (0.2).(0.7) = 0.14 Tahap 4 P({Y }|X) > P({Y }|~X)
CONTOH 2 No
Cuaca (X1)
Temperatur (X2)
Kecepatan Angin (X3)
Berolah-raga (Y)
1
Cerah
Normal
Pelan
Ya
2
Cerah
Tinggi
Pelan
Ya
3
Hujan
Normal
Kencang
Tidak
4
Hujan
Normal
Pelan
Tidak
5
Cerah
Tinggi
Kencang
Tidak
6
Hujan
Normal
pelan
Tidak
Apakah bila cuaca cerah, temperatur normal dan kecepatan angin kencang, orang akan berolahraga?
S olus i : Tahap 1
P(Y =ya) = 2/6
P(Y =tidak) = 4/6
Tahap 2 P(X1=cerah|Y=ya) = 2/2=1, P(X1=cerah|Y=tidak) = 1/4 P(X2=normal|Y=ya) = 1/2, P(X2=normal|Y=tidak) = 3/4 P(X3=kencang|Y=ya) = 0/2=0 , P(X3=kencang|Y=tidak) = 2/4
Tahap 3
P( X1=cerah,X2=normal,X3=kencang | Y=ya )
= P(X1=cerah|Y=ya).P(X2=normal|Y=ya).P(X3=kencang|Y=ya).P(Y=ya) = (1) . (1/2) . (0) . 2/6 =0
P( X1=cerah,X2=normal,X3=kencang | Y=tidak )
=P(X1=cerah|Y=tidak).P(X2=normal|Y=tidak).P(X3=kencang|Y=tidak) .P(Y=tidak) = (1/4) . (2/4) . (3/4) . (4/6) = 0,25 . 0,5 . 0,75 . 0.6 = 0,05625 Tahap 4 P( X1=cerah,X2=normal,X3=kencang|Y=ya ) < P(X1=cerah,X2=normal, X3=kencang|Y=tidak ) KEPUTUSAN BEROLAHRAGA = TIDAK
CONTOH 3 •
Perhitungan Sederhana Teorema Bayes untuk Prediksi Kelulusan
•
Tabel Training : NO
JENIS KELAMIN
STATUS
STATUS PERNIKAHAN
IPK
STATUS KELULUSAN
1
LAKI - LAKI
MAHASISWA
BELUM
3.17
TEPAT
2 3
LAKI - LAKI PEREMPUAN
BEKERJA MAHASISWA
BELUM BELUM
2.70 3.00
TEPAT TEPAT
4
PEREMPUAN
MAHASISWA
MENIKAH
3.25
TEPAT
5 6
LAKI - LAKI LAKI - LAKI
BEKERJA BEKERJA
MENIKAH MENIKAH
3.20 2.50
TEPAT TERLAMBAT
7
PEREMPUAN
BEKERJA
MENIKAH
3.30
TERLAMBAT
8
PEREMPUAN
BEKERJA
BELUM
2.70
TERLAMBAT
9
LAKI - LAKI
BEKERJA
BELUM
2.40
TERLAMBAT
10
PEREMPUAN
MAHASISWA
MENIKAH
2.50
TERLAMBAT
11
PEREMPUAN
MAHASISWA
BELUM
2.50
TERLAMBAT
12
PEREMPUAN
MAHASISWA
BELUM
3.30
TEPAT
13
LAKI - LAKI
BEKERJA
MENIKAH
3.30
TEPAT
14
LAKI - LAKI
MAHASISWA
MENIKAH
3.25
TEPAT
15
LAKI - LAKI
MAHASISWA
BELUM
2.30
TERLAMBAT
CONTOH 3 •
Hitung jika seorang mahasiswa dengan data sebagai berikut:
•
Tabel Testing JENIS KELAMIN
STATUS
STATUS PERNIKAHAN
IPK
STATUS KELULUSAN
LAKI - LAKI
MAHASISWA
BELUM
2.70
???
SOLUSI Tahap 1 menghitung jumlah class/label
Jumlah data “TEPAT” pada kolom ‘STATUS KELULUSAN’ dibagi jumlah data P(Y= TEPAT) = 8/15 Jumlah data “TERLAMBAT” pada kolom ‘STATUS KELULUSAN’ dibagi jumlah data P(Y= TERLAMBAT) = 7/15
Tahap 2 menghitung jumlah kasus yang sama dengan class yang sama
P(JENIS KELAMIN = LAKI - LAKI | Y= TEPAT) = 5/8 P(JENIS KELAMIN = LAKI - LAKI | Y= TERLAMBAT) = 3/7
P(STATUS = MAHASISWA | Y= TEPAT) = 5/8 P(STATUS = MAHASISWA | Y= TERLAMBAT) = 3/7
P(STATUS PERNIKAHAN = BELUM| Y= TEPAT) = 4/8 P(STATUS PERNIKAHAN = BELUM| Y= TERLAMBAT) = 4/7
P(IPK = 2.70| Y= TEPAT) = 1/8 P(IPK = 2.70| Y= TERLAMBAT) = 1/7
SOLUSI Tahap 3 kalikan semua hasil variabel TEPAT & TERLAMBAT
TEPAT
P (JENIS KELAMIN=LAKI – LAKI), (STATUS=MAHASISWA), (PERNIKAHAN=BELUM), (IPK=2.70 ) |TEPAT) = {P(P(KELAMIN=LAKI-LAKI|Y=TEPAT) x P(STATUS=MAHASISWA | Y=TEPAT) x P(PERNIKAHAN=BELUM|Y=TEPAT) x P(IPK=2.70|Y=TEPAT)} =
5/8 x 5/8 x 4/8 x 1/8 x 8/15
= 0,625 x 0,625 x 0,5 x 0,125 x 0,533 = 0,013
TERLAMBAT
P (JENIS KELAMIN=LAKI – LAKI), (STATUS=MAHASISWA), (PERNIKAHAN=BELUM), (IPK=2.70 ) |TERLAMBAT) = {P(P(KELAMIN=LAKI-LAKI|Y=TERLAMBAT) x P(STATUS=MAHASISWA | Y=TERLAMBAT) x P(PERNIKAHAN=BELUM|Y=TERLAMBAT) x P(IPK=2.70|Y=TERLAMBAT)} = 3/7 x 3/7 x 4/7 x 1/7 x 7/15 = 0,428 x 0,428 x 0,571 x 0,142 x 0,466
SOLUSI Tahap 4 Bandingkan hasil class TEPAT & TERLAMBAT (P|TEPAT) = 0,013 (P|TERLAMBAT) = 0,006 (P|TEPAT)
>
(P|TERLAMBAT)
JENIS KELAMIN
STATUS
STATUS PERNIKAHAN
IPK
STATUS KELULUSAN
LAKI - LAKI
MAHASISWA
BELUM
2.70
TEPAT
LATIHAN •
Jika seorang mahasiswa dengan data sebagai berikut
•
Tabel Testing
JENIS KELAMIN
STATUS
STATUS PERNIKAHAN
IPK
STATUS KELULUSAN
PEREMPUAN
BEKERJA
BELUM
3.30
???
KELEBIHAN NAIVE BAYES CLASSIFIER 1. Mudah diimplementasikan 2. Hasil baik dalam banyak kasus 3. Hanya memerlukan sejumlah kecil data pelatihan untuk mengestimasi parameter (rata – rata dan variansi dari variabel) yang dibutuhkan untuk klasifikasi. 4. Cepat dan efisiensi ruang 5. Kokoh terhadap atribut yang tidak relevan
KELEMAHAN NAIVE BAYES CLASSIFIER 1. Kondisi kelas saling bebas , sehingga kurang akurat. 2. Memerlukan pengetahuan awal untuk dapat mengambil suatu keputusan. Tingkat keberhasilan metode ini sangat tergantung pada pengetahuan awal yang diberikan. 3. Tidak berlaku jika probabilitas kondisionalnya adalah nol, apabila nol maka probabilitas prediksi akan bernilai nol juga.
BEBERAPA APLIKASI METODE BAYES •
•
•
•
•
•
Menentukan diagnosa suatu penyakit berdasarkan datadata gejala (sebagai contoh hipertensi atau sakit jantung). Mengenali buah berdasarkan fitur-fitur buah seperti warna, bentuk, rasa dan lain-lain Mengenali warna berdasarkan fitur indeks warna RGB Mendeteksi warna kulit (skin detection) berdarkan fitur warna chrominant Menentukan keputusan aksi (olahraga, art, psikologi) berdasarkan keadaan Menentukan jenis pakaian yang cocok untuk keadaankeadaan tertentu (seperti cuaca, musim, temperatur, acara, waktu, tempat dan lain-lain)
TERIMA KASIH