MAKALAH TENTANG ALGORITMA NAÏVE BAYES
Disusun oleh : RIAN FERNANDA 14312407
PROGRAM STUDI S1 INFORMATIKA FAKULTAS TEKNIK DAN ILMU KOMPUTER UNIVERSITAS TEKNOKRAT INDONESIA BANDAR LAMPUNG 2018
A. Teorema Naïve Bayes Naïve Bayes Classifier merupakan sebuah metoda klasifikasi yang berakar pada teorema Bayes. Ciri utama dari Naïve Bayes Classifier ini adalah asumsi yang sangat kuat (naif) akan independensi dari masing-masing kondisi/kejadian. Sebelum menjelaskan Naïve Bayes Classifier ini, akan dijelaskan terlebih dahulu Teorema Bayes yang menjadi dasar dari metoda tersebut. Pada teorema Bayes, bila terdapat dua kejadian yang terpisah (misalkan A dan B), maka teorema Bayes dirumuskan sebagai berikut:. P(Hi | E) =
P( E | Hi ) 𝑥 P(Hi ) | H𝑘 ) 𝑥 P(H𝑘 )
∑𝑛𝑘=1 P(E
Penjelasan dari rumus tersebut adalah sebagai berikut (kusumadewi, 2003) :
P (Hi | E)
= Probabilitas hipotesis Hi benar jika diberikan evidence E.
P (E | Hi)
= Probabilitas munculnya evidence E, jika diketahui hipotesis Hi benar.
P(Hi)
= Probabilitas hipotesis Hi (menurut hasil sebelumnya tanpa memandang evidence apapun.
n
= Jumlah hipotesis yang mungkin.
Naïve bayesian klasifikasi adalah suatu klasifikasi berpeluang sederhana berdasarkan aplikasi teorema bayes dengan asumsi antar variable penjelas saling bebas (Pratiwi, 2016). Dalam hal ini, diasumsikan bahwa kehadiran atau ketiadaan dari suatu kejadian dari suatu kelompok terentu tidak berhubungan dengan kehadiran atau ketiadaan dari kejadian lainnya. Naïve bayes memiliki kelebihan antara lain, sederhana, cepat, dan berakurasi tinggi.
B. Klasifikasi dengan Naïve Bayes classifier Klasifikasi adalah proses untuk menemukan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk dapat memperkirakan kelas dari suatu obyek (Agus Mulyanto 2009). Oleh karena itu, kelas yang ada tentulah lebih dari satu. Penentuan kelas dari suatu dokumen dilakukan dengan cara membandingkan nilai probabilitas suatu sampel berada di kelas yang satu dengan nilai probabilitas suatu sampel berada di kelas yang lain.
C. KELEBIHAN DAN KEKURANGAN Kelebihan dari penggunaan Naïve Bayes classifier dalam klasifikasi dokumen dapat ditinjau dari prosesnya yang mengambil aksi berdasarkan datadata yang telah ada sebelumnya. Oleh karena itu, klasifikasi dokumen dengan metode ini dapat dipersonalisasi, maksudnya adalah proses klasifikasi dokumen dapat disesuaikan sesuai dengan sifat dan kebutuhan masing-masing orang.
Kelebihan Naive Bayesian :
1. Menangani kuantitatif dan data diskrit 2. Kokoh untuk titik noise yang diisolasi, misalkan titik yang dirata – ratakan ketika mengestimasi peluang bersyarat data. 3. Hanya memerlukan sejumlah kecil data pelatihan untuk mengestimasi parameter (rata – rata dan variansi dari variabel) yang dibutuhkan untuk klasifikasi. 4. Menangani nilai yang hilang dengan mengabaikan instansi selama perhitungan estimasi peluang 5. Cepat dan efisiensi ruang 6. Kokoh terhadap atribut yang tidak relevan.
Kekurangan dari metode Naïve Bayes classifier ini adalah banyaknya celah untuk mengurangi keefektifan metoda ini dan akibatnya meloloskan dokumen ke dalam kelas tertentu padahal jelas-jelas dokumen tersebut tidak layak berada di kelas tersebut. Dalam kasus spam filtering, kelemahan ini banyak digunakan oleh spammers berpengalaman untuk meloloskan spam ke dalam kelas bukan spam.
Kekurangan Naive Bayesian : 1. Tidak berlaku jika probabilitas kondisionalnya adalah nol, apabila nol maka probabilitas prediksi akan bernilai nol juga 2. Mengasumsikan variabel bebas. D.contoh soal Naïve bayes Tabel 3.3. Bobot Penyakit
Bobot Penyakit Kode penyakit P001 P002 P003 P004
Nama Penyakit
Pasien Penyakit Endrometriosis Pasien Penyakit kista ovarium Pasien Penyakit Myoma Pasien Penyakit P I D
Bobot Penyakit
0.12 0.13 0.06 0.70
Tabel 3.4. Bobot Gejala Penyakit
NO
Nama Penyakit
Kode Gejala
Gejala
G001 Terdapat bercak darah pada selaput rahim G002 P01
P02
Endrometriosis
Kista Ovarium
G003 G004 G005 G006 G007 G008 G009 G010 G011
P03
Myoma Uteri
P04
PID (Infeksi Daerah Panggul)
G012 G013 G014 G006 G015 G013 G016 G017 G018 G019
Rasa nyeri bagian bawah perut seperti Kramp seminggu sebelum massa mens Rasa Nyeri daerah bagian bawah pinggang selama waktu mens Rasa nyeri sewaktu berhubungan seksual Rasa nyeri sewaktu buang air besar sulit hamil dan mudah keguguran rasa nyeri sewaktu bersetubuh atau saat bergerak rasa gatal di rongga panggul siklus menstruasi tidak teratur perut membesar Hasil USG dan CT Scanmenunjukan adanya kista atau pembesaran kista Nyeri masa menstruasi Pendarahan lebih banyak saat menstruasi rongga perut terasa penuh seperti tertekan sulit hamil dan mudah keguguran Nyeri pada rongga panggul Pendarahan lebih banyak saat menstruasi Demam mual muntah ketika buang air terasa terbakar keputihan berlebih
Probabilitas 0.8 0.3 0.5 0.6 0.6 0.3 0.7 0.6 0.7 0.2 0.5 0.7 0.6 0.3 0.3 0.7 0.6 0.6 0.7 0.4 0.5
Uji coba dilakukan dengan mendapat gejala penyakit Kandungan. Data penyakit kandungan dibandingkan dengan gejala yang menyebabkan penyakit kandungan. Contoh perhitungan dengan menggunakan metode Teorema Bayes diterapkan pada pasienke-2 yang terdapat pada lampiran dengan gejala sebagai berikut: Rasa nyeri paska menstruasi (G002) Rasa nyeri pada saat berhubungan (G004)
Sulit Hamil dan mudah keguguran (G006) Selanjutnya menghitung semua probabilitas P(Hi|E) dengan gejala tersebut, dengan rumus berikut P(Hi | E) =
P(E | Hi ) 𝑥 P(Hi ) ∑𝑛 𝑘=1 P(E | H𝑘 ) 𝑥
P(H𝑘 )
1. Menghitung Probabilitas Endrometriosis P(Endo |G002,G004,G006) = 0,7463 x 0,6020 x 0,4478 x 0,7028 (0 x 0 x 0 x 0,1154)+(0,7463 x 0,6020 x 0,4478 x 0,7028)+(0 x 0 x 0 x 0,0559)+(0 x 0 x 0 x 0,1259) 0,141
= (0 )+(0.141)+(0)+(0 ) 0,141
= 0,141 =1
2. Menghitung Probabilitas Endrometriosis P(Endrometriosis |g002,g004,g006) =
0 x 0 x 0 x 0,12 (0 x 0 x 0 x 0,1)+(0,75 x 0,6 x 0,45 x 0,7)+(0 x 0 x 0 x 0,05)+(0 x 0 x 0 x 0,12) 0
= (0 )+(0.141)+(0)+(0 ) 0
= 0,141 =0 3. Menghitung Probabilitas MYOMA
P(MYOMA |g002,g004,g006) =
0 x 0 x 0 x 0,05 (0 x 0 x 0 x 0,1)+(0,75 x 0,6 x 0,45 x 0,7)+(0 x 0 x 0 x 0,05)+(0 x 0 x 0 x 0,12) 0
= (0 )+(0.141)+(0)+(0 ) 0
= 0,141 =0 4. Menghitung Probabilitas Kista Ovarium P(Kista Ovarium |g002,g004,g006) =
0 x 0 x 0 x 0,12 (0 x 0 x 0 x 0,1)+(0,75 x 0,6 x 0,45 x 0,7)+(0 x 0 x 0 x 0,05)+(0 x 0 x 0 x 0,12) 0
= (0 )+(0.141)+(0)+(0 ) 0
= 0,141 = 0 Dari hasil uji coba yang telah dilakukan nilai P(Hi|E) terbesar dapat dilihat pada tabel 3.5. Tabel 3.5. Hasil Uji Coba
Penyakit
Nilai P(Hi|E)
P I D (Infeksi daerah panggul)
1
Endrometriosis
0
Myoma Uteri
0
Kista Ovarium
0
Berdasarkan tabel 3.5. nilai terbesar P(Hi|E) adalah 1, maka pasien tersebut menderita penyakit Candidiasis of vulva and vagina (Infeksi Daerah Panggul PID).