DIAGNOSA PENYAKIT DIABETES MELLITUS DENGAN METODE NAÏVE BAYES BERBASIS DESKTOP APPLICATION 1
2
3
4
5
Al mir a Sya Syawli wli , Gopi Yudoyo , M. Ali F ahmi , Sil Sil via Ar i Santhy , Zulkar naein naein 1. Teknik Informatika, Program Teknologi Informasi dan Ilmu Komputer, Universitas Brawijaya, Malang, 65145, Indonesia Indonesia 2. Program Teknologi Teknologi Informasi dan Ilmu Komputer, Universitas Universitas Brawijaya, Brawijaya, Malang, 65145, 65145, Indonesia 1 2 3 Email:
[email protected] ,
[email protected] [email protected] om ,
[email protected] , 4 5
[email protected] silvia.aska@gma il.com , zulkhafourze@ ,
[email protected] gmail.com
Abstrak
Bidang kesehatan merupakan salah satu bidang yang sudah menerapkan berbagai teknologi teknolo gi komputer. Untuk melakukan diagnosa penyakit yang diderita pasien pun sudah dilakukan dengan bantuan komputer. Salah satunya adalah untuk mendiagnosa penyakit diabetes mellitus yang dapat terjadi pada siapa pun. Penyakit diabetes mellitus merupakan salah satu jenis penyakit yang sering ditemukan pada masyarakat. Penyakit ini juga merupakan penyebab kematian terbesar keempat di dunia, dan di Indonesia terutama di kota-kota besar seperti Jakarta dan Surabaya sudah hampir 10 persen penduduknya mengidap diabetes. Oleh karena itu, penelitian ini bertujuan untuk mencegah mencegah masalah masalah tersebut dengan bantuan sistem pakar. Dalam hal ini, pasien dapat memasukkan berbagai gejala yang mengindikasi penyakit Diabetes Mellitus. Dari gejala yang dimasukkan, dapat diketahui prediksi bahwa pasien terkena atau tidak terkena Diabetes Mellitus dengan metode Naive Bayes. Metode Naïve Bayes ini membantu membantu kita dalam menentukan probabilitas seorang pasien dengan gejala tertentu dapat dikatakan terkena Diabetes mellitus atau tidak terkena Diabetes mellitus berdasarkan dari 22 gejala sebagai indikator kunci dari Diabetes Mellitus. Dari masukan tersebut akan dibandingkan dengan data training yang telah tervalidasi. Kata Kunci : Kunci : Diabetes mellitus, Teorema Bayes, Metode Naïve Bayes, Sistem Pakar
Abstract
The health sector is one area that has been implementing a variety of computer technologies. To make a diagnosis of the patient's illness was already done with the help of computers. One is to diagnose diabetes mellitus that can be happened to anyone. Diabetes mellitus is a disease that is oftenly found in the community. This disease is also the fourth largest cause of death in the world, and i n Indonesia, especially in big cities such as Jakarta and Surabaya which are nearly 10 percent of the population have diabetes. Therefore, this study aims to avoid t hese problems with the help of an expert system. In this case, the patient may enter a variety of symptoms that indicate Diabetes Mellitus disease. From that symptoms, it can be seen the predictions of patients that exposed or not exposed to Diabetes Mellitus with the Naive Bayes method. Naive Bayes method helps us in determining the probability of a patient with certain symptoms that can be said exposed or not exposed based on 22 symptoms as a key indicator of Diabetes Mellitus. Furthermore, the input will be compared with training data that has been validated. Keywords: Diabetes Diabetes Mellitus, Bayes Theorem, Theorem, Naive Bayes Methods, Methods, Expert System System
1
PENDAHULUAN
Teorema
Bayes
adalah
sebuah
pendekatan untuk sebuah ketidaktentuan yang Diabetes
Mellitus
(DM)
adalah
diukur dengan probabilitas. Pendekatan bayes
penyakit yang akhir-akhir ini semakin banyak
pada
saat
klasifikasi
adalah
mencari
dijumpai. Penyakit Diabetes Melitus juga
probabilitas tertinggi (VMAP) dengan masukan
sering kita sebut dengan istilah kencing manis
atribut (a1, a2, a3, ..., an) seperti tampak pada
atau penyakit gula darah. Penyakit yang satu
persamaan 1 berikut [2] :
ini termasuk jenis penyakit kronis yang tanda VMAP = arg max P(v j |a1,a2,a3,...,an)
awalnya yaitu meningkatnya kadar gula dalam
(1)
v j V
darah sebagai akibat adanya gangguan sistem metabolisme dalam tubuh. Organ tubuh yang terganggu adalah pankreas yang mana sudah
Teorema Bayes sendiri berawal dari rumus
tidak
persamaan 2 berikut :
berfungsi
sebagaimana
mestinya.
Pankreas sudah tidak mampu memproduksi hormon insulin dalam memenuhi kebutuhan
P(A|B) =
tubuh. Beberapa faktor yang menyebabkan
(2)
seseorang menderita penyakit diabetes, yaitu [3] :
Dimana
1) Banyak mengkonsumsi makanan yang
diketahui
P(A|B)
artinya
keadaan
B.
peluang
A jika
Kemudian
dari
persamaan rumus 2 diatas didapat persamaan 3
mengandung gula
seperti berikut :
2) Kurang tidur 3) Makan terlalu banyak karbohidrat dari nasi
P(B
atau roti
A) = P( B | A) P(A)
(3)
4) Merokok 5) Kurangnya Aktivitas Fisik
Sehingga didapatkan teorema bayes seperti
6) Faktor Keturunan
persamaan 4 berikut :
Penentuan mengenai terkena penyakit Diabetes
P(A | B) =
Mellitus, dapat dikenali melalui beberapa
|
(4)
gejala yang dirasakan seperti banyak kencing, dehidrasi, berat badan turun, penglihatan
Yang mana :
kabur, dan sebagainya. Prediksi seseorang
A adalah hipotesis data A (class spesifik)
mengidap penyakit ini dapat diketahui dari
B adalah data dengan class yang belum
perhitungan probabilitas menggunakan metode Naïve
Bayes.
Metode
ini
diketahui
memanfaatkan
teorema Bayes.
2
P(A|B) adalah probabilitas hipotesis A
seperti banyak kencing, dehidrasi, berat badan
berdasar
turun, penglihatan kabur, dan sebagainya.
kondisi
B
(posterior
|
Dalam prosesnya, diperlukan beberapa
probability)
P(B|A) adalah probabilitas B berdasar
tahapan untuk menjadikan data mentah sebagai
kondisi pada hipotesis A
knowledge based bagi sistem pakar. Aktivitas
P(A) adalah probabilitas hipotesis A
yang dilakukan untuk memindahkan kepakaran
(prior probability)
adalah [3] :
P(B) adalah probabilitas dari B
1. Knowledge Acquistion (dari pakar atau sumber lainnya)
Menggunakan teorema bayes ini, persamaan diatas dapat ditulis menjadi persamaan 5
2. Knowledeg
Representation
(ke
dalam
komputer) 3. Knowledge Inferencing
berikut ini :
4. Knowledge Transfering Vmap=arg max
| (5)
Akuisisi
pengetahun
dilakukan
sepanjang
proses pembangunan sistem. Proses akuisisi pengetahuan dibagi kedalam enam tahap, yaitu
Karena nilai P(a1, a2, a3, ..., an) konstan untuk semua v j, maka persamaan ini dapat ditulis
[5] : 1. Tahap Identifikasi Tahap identifikasi meliputi penentuan
menjadi persamaan 6 berikut ini :
komponen-komponen kunci dalam sistem yang sedang dibangun. Komponen kunci
VMAP = arg max P(a 1,a2,a3,...,an | v j)P(v j)
ini adalah knowledge
v j V
(6)
engineer , pakar, karakteristik masalah, sumber daya dan tujuan.
Untuk menghitung P(a1, a2, a3, ..., an | v j) bisa jadi semakin sulit karena jumlah term P(a1, a2, a3, ..., an | v j) bisa jadi sangat besar [2]. Hal ini
Permasalahannya adalah bagaimana cara
Diabetes
bahwa
Mellitus
seseorang
dengan
Tahap ini, memperjelas konsep – konsep kunci
dan
hubungannya
yang
telah
didtemtukan pada tahap sebelumnya.
disebabkan jumlah term tersebut
memprediksikan
2. Tahap Konseptualisas
terkena
menggunakan
metode Naïve Bayes. Prediksi ini dapat menggunakan masukan berupa gejala – gejala Diabetes Mellitus yang dirasakan oleh pasien
3. Tahap Formalisasi Tahap ini, memetakan seluruh konsep – kosenp pengatahuan sebelumnya ke dalam representasi formal yang sesuai dengan permasalahan. 4. Tahap Implementasi Pada tahap ini, hasil dari formalisasi diterapkan ke dalam skema representasi
3
pengetahuan
yang
dipilih
kemudian
Perancangan Sistem
dibuatlah prototype dari sisem. 5. Tahap Pengujian
Prosedur perancangan sistem secara
Tahap ini, melakukan pengujian terhadap
umum terdiri atas beberapa tahap antara lain
sistem
perancangan data, perancangan proses dan
dengan
memasukkan
berbagai
sampel masalah.
perancangan interface.
6. Revisi Protoype
Tahap pertama adalah perancangan data meliputi data input, data output dan data
METODE PENELITIAN
training. Data training yang akan digunakan sebagai acuan untuk menentukan data output
Pada penelitian ini, metode yang
yang dihasilkan oleh sistem, diperoleh dari
digunakan adalah metode klasifikasi dengan
Departemen
kesehatan
Naïve Bayes. Naïve Bayes menyederhanakan
sosial RI 2001 sebanyak 18 data [4]. Tahap
teorema bayes dengan asumsi bahwa fitur-fitur
kedua
dan
adalah
kesejahteraan
perancangan
tidak
proses implementasi Naïve Bayes ke dalam
kata
sistem. Pada tahap ini akan dijelaskan cara
independen satu sama lain. Seperti tampak
kerja sistem (perhitungan) dan proses-proses
pada persamaan 7 berikut ini :
yang akan digunakan,
yang
terdapat
tergantung
didalamnya
atau
saling
independen,
setiap
mulai dari masuknya
data input yang kemudian akan diproses oleh P(a1,a2,a3,...,an | v j) =
∏ |
(7)
sistem hingga menjadi data output. Pada tahap ini diambil beberapa data
ini
training untuk di tes. Kemudian diambil
dengan persamaan diatas maka akan dihasilkan
probabilitas kemunculan setiap nilai masing-
rumus seperti persamaan 8 berikut ini :
masing fitur per kelasnya.
Dengan
mensubstitusikan
persamaan
Langkah VMAP = arg max P(v j)
∏ |
(8)
v j V
Naïve Bayes adalah model penyederhanaan dari metode bayes. Dimana:
VMAP = Nilai output hasil klasifikasi Naïve Bayes
P(a1, a2, a3, …, an) = Peluang A
Vj = Keadaan atau kategori j
meng-generate
pertama data
adalah
training
yang
dengan telah
diperoleh sebanyak 18 dataset. Dari data training yang diperoleh, kemudian dilakukan analisa mengenai gejala (fitur) dari penyakit Diabetes
Mellitus.
Setelah
menganalisa,
didapatkan 22 indikasi (bersifat diskrit) dari Diabetes Mellitus, yaitu : a.
Polituria
b. Polidipsia c.
Polipagia
d. Kesemutan e.
Rasa tebal
4
f.
Berat badan turun
Dari
kedua
fungsi
diatas,
dapat
g. Kulit
dilakukan perhitungan dengan metode Naïve
h. Gatal
Bayes seperti pada persamaan 9 berikut :
i.
Bisul
j.
Infeksi
( )∏ |
(9)
k. Keputihan l.
Luka
Dimana j adalah jumlah kelas dan i adalah
m. Lapar
jumlah fitur yang ada.
n. Gemetar
Aturan
bayes
itu
sendiri
bisa
o. Lemah
ditetapkan sebagai berikut:
p. Konsentrasi
Misalkan terdapat kategori dua kelas P(h 1) dan
q. Keringat
P(h2).
r.
Berdebar
| < | , maka x diklasifikasikan
s.
Pusing
sebagai h2.
t.
Gelisah
Pada pengamatan nilai x tertentu,
u. Koma
ketika
mengambil
suatu
keputusan
maka
Serta dua kelas utama yaitu kelas Ya (terkena
probabilitas errornya seperti pada persamaan
Diabetes Mellitus) dan kelas Tidak (tidak
10 berikut :
terkena Diabetes Mellitus). Langkah
kedua
yaitu
| | { |
melakukan
testing dengan diberikan data sample. Dengan
(10)
begitu dapat dihitung peluang terkena atau tidak terkena Diabetes Mellitus menggunakan Naïve Bayes. Dalam proses perhitungannnya
Jadi jelasnya peluang error bisa diminimalkan
dibutuhkan Prior yang merupakan probabilitas
jika diberikan nilai x dengan memutuskan h1
kemunculan kejadian tiap kelas yang tidak
jika
diketahui dengan pasti tetapi dapat diestimasi
| > | dan memutuskan h jika | > | [1]. Maka untuk
dari data yang tersedia. Prior dinyatakan
memutuskan
dengan (P(h j)).
memilih nilai posterior yang paling besar.
Variabel
random
diskrit
2
Tahap
yang
sesuatu
ketiga
Tahap
ini
atau
decide
adalah
dengan
perancangan
didistribusikan bergantung pada kemunculan
interface.
merupakan
tahap
objek dan dinyatakan dengan P(x|h) yang
pembuatan user interface sebagai fasilitator
menyatakan peluang muncul x jika diketahui h.
dalam berkomunikasi antar sistem dengan
Fungsi peluang P(x|h j) ini disebut juga dengan
user .
istilah fungsi likelihood dari h j terhadap x.
5
HASIL DAN PEMBAHASAN Eksperimen dilakukan untuk menguji kinerja sistem penentuan terkena Diabetes Mellitus. Pada proses pengujian ini, digunakan metode klasifikasi Naïve Bayes.
15
Gemetar
16
Lemah
17 Konsentrasi 18 Keringat
Langkah pertama yaitu menghitung probabilitas kemunculan (gejala)
terhadap
dari
kelasnya.
setiap fitur Berdasarkan
19 Berdebar 20
Pusing
perhitungan tersebut, diperoleh hasil seperti 21 Gelisah
pada tabel 1 berikut :
Tabel 1. Likelihood tiap fitur dari semua kelas
Fitur 1
Poliuria
2
Polidipsia
3
Polipagia
4
Kram
5
Kesemutan
6
Rasa Tebal
7
Berat Badan Turun
8
Kulit
9
Gatal
10
Bisul
11
Infeksi
12 Keputihan 13
Luka
14
Lapar
Kondisi Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak
Diabetes Mellitus Ya Tidak 7/10 3/10 8/10 1/10 9/10 1/10 5/10 5/10 6/10 4/10 2/10 8/10 4/10 6/10 2/10 8/10 3/10 7/10 1/10 9/10 2/10 8/10 4/10 6/10 7/10 3/10 2/10 8/10
3/8 5/8 3/8 5/8 1/8 7/8 4/8 4/8 2/8 6/8 7/8 1/8 6/8 2/8 7/8 1/8 6/8 2/8 6/8 2/8 7/8 1/8 5/8 3/8 1/8 7/8 4/8 4/8
22
Koma
Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak
Kemudian
4/10 6/10 9/10 1/10 2/10 8/10 9/10 1/10 2/10 8/10 5/10 5/10 5/10 5/10 2/10 8/10
dilakukan
3/8 5/8 2/8 6/8 5/8 3/8 2/8 6/8 7/8 1/8 4/8 4/8 5/8 3/8 5/8 3/8 analisis
keakuratan data dengan memasukkan data sample melalui sistem seperti pada gambar 1 dan 2 berikut.
Gambar 1. Form input data user
Gambar 2. Form input gejala
6
Pengujian
keakuratan
dilakukan
dengan memasukkan masalah yang sama
Dari
pengujian
dapat
diketahui tingkat keakurasiannya adalah :
dengan data training sebelumnya. Dari hasil
= 94,4%
Akurasi =
pengujian tersebut, dapat dihitung tingkat keakuratan dengan cara pada persamaan 11
tersebut,
KESIMPULAN
berikut :
Pada penelitian ini dapat disimpulkan bahwa semakin banyak jumlah data yang
Akurasi =
digunakan untuk training maka semakin tinggi (11)
Adapun hasil pengujian dari setiap data training ditunjukkan pada tabel 2 berikut :
keakuratannya. Selain itu, semakin sering juga dilakukan
learning
knowledge
maka
akan
penambahan semakin
cepat
mendapatkan klasifikasi dengan benar. Untuk
Tabel 2. Hasil pengujian
atau
langkah
selanjutnya,
akan
berkonsentrasi pada pengembangan aplikasi
Data
Data
Data Output
ke -
Training
(Hasil Pengujian)
1
ya
ya
mendapatkan akurasi yang tinggi dengan
2
ya
ya
berapapun jumlah data trainingnya. Aplikasi
3
tidak
tidak
juga
4
tidak
tidak
meminimalisir waktu pemrosesan pada saat
5
tidak
tidak
learning.
6
ya
ya
7
ya
ya
8
ya
ya
9
tidak
tidak
10
tidak
tidak
11
ya
ya
12
tidak
tidak
13
ya
ya
14
tidak
ya
15
ya
ya
16
ya
ya
17
ya
ya
18
tidak
tidak
seperti
dapat
konstanta
menentukan
bayes
dapat
secara
nilai
otomatis
disempurnakan
variasi untuk
untuk
DAFTAR PUSTAKA [1] Basuki, Achmad. 2006. Metode Bayes. Pens,
Institut
Teknologi
Sepuluh
November.
[2] Ferry Febrian, ” Analisis Komparasi Algoritma Klasifikasi Data Mining Pada Akseptasi
Data
Fakultatif
Reasuransi
Jiwa”, Tesis, Program Studi Teknik Informatika, Program Pasca Sarjana (S2) Magister
Komputer,
2011.
URL
:
http://edp.stmikpasim.ac.id/agoenthea/pub lic_html/thesis/Research%20Method/romi
7
-mp/01%20%20research%20fields/data%20mining/th esis/Ferry%20%20Komparasi%20Klasifikasi%20DM% 20untuk%20Akseptasi%20Reas.pdf diakses tanggal 4 januari 2012.
[3] Suardin Yakub, “Sistem Pakar Deteksi Penyakit
Diabetes
Menggunakan
Mellitus
Dengan
Pendekatan
Naïve
Bayesian Berbasis Web”, Skripsi, Jurusan Teknik Informatika, Fakultas Sains Dan Teknologi, 2008. URL : http://lib.uinmalang.ac.id/thesis/fullchapter/04550034suardin-yakub.ps
diakses
tanggal
4
Oktober 2012.
[4] DEPKES RI. 2001. Pedoman
Pengobatan Dasar Di Puskesmas Berdasarkan Gejala. Jakarta : DEPKES.
[5]
Firebaugh Intelligence: Approach,
M.W., A
1989,
Artificial
knowledge-Based
PWS-Kent
Publishing
Company, Boston.
8