Jurnal Diabetes Mellitus

DIAGNOSA PENYAKIT DIABETES MELLITUS DENGAN METODE NAÏVE BAYES BERBASIS DESKTOP APPLICATION 1

2

3

4

5

Al mir a Sya Syawli wli , Gopi Yudoyo , M. Ali F ahmi , Sil Sil via Ar i Santhy , Zulkar naein naein 1. Teknik Informatika, Program Teknologi Informasi dan Ilmu Komputer, Universitas Brawijaya, Malang, 65145, Indonesia Indonesia 2. Program Teknologi Teknologi Informasi dan Ilmu Komputer, Universitas Universitas Brawijaya, Brawijaya, Malang, 65145, 65145, Indonesia 1 2 3 Email: [email protected] , [email protected] [email protected] om , [email protected] , 4 5 [email protected] silvia.aska@gma il.com , zulkhafourze@ , [email protected] gmail.com

Abstrak

Bidang kesehatan merupakan salah satu bidang yang sudah menerapkan berbagai teknologi teknolo gi komputer. Untuk melakukan diagnosa penyakit yang diderita pasien pun sudah dilakukan dengan bantuan komputer. Salah satunya adalah untuk mendiagnosa penyakit diabetes mellitus yang dapat terjadi pada siapa pun. Penyakit diabetes mellitus merupakan salah satu jenis penyakit yang sering ditemukan pada masyarakat. Penyakit ini juga merupakan penyebab kematian terbesar keempat di dunia, dan di Indonesia terutama di kota-kota besar seperti Jakarta dan Surabaya sudah hampir 10 persen penduduknya mengidap diabetes. Oleh karena itu, penelitian ini bertujuan untuk mencegah mencegah masalah masalah tersebut dengan bantuan sistem pakar. Dalam hal ini, pasien dapat memasukkan berbagai gejala yang mengindikasi penyakit Diabetes Mellitus. Dari gejala yang dimasukkan, dapat diketahui prediksi bahwa pasien terkena atau tidak terkena Diabetes Mellitus dengan metode Naive Bayes. Metode Naïve Bayes ini membantu membantu kita dalam menentukan probabilitas seorang pasien dengan gejala tertentu dapat dikatakan terkena Diabetes mellitus atau tidak terkena Diabetes mellitus berdasarkan dari 22 gejala sebagai indikator kunci dari Diabetes Mellitus. Dari masukan tersebut akan dibandingkan dengan data training yang telah tervalidasi. Kata Kunci : Kunci : Diabetes mellitus, Teorema Bayes, Metode Naïve Bayes, Sistem Pakar

Abstract

The health sector is one area that has been implementing a variety of computer technologies. To make a diagnosis of the patient's illness was already done with the help of computers. One is to diagnose diabetes mellitus that can be happened to anyone. Diabetes mellitus is a disease that is oftenly found in the community. This disease is also the fourth largest cause of death in the world, and i n Indonesia, especially in big cities such as Jakarta and Surabaya which are nearly 10 percent of the population have diabetes. Therefore, this study aims to avoid t hese problems with the help of an expert system. In this case, the patient may enter a variety of symptoms that indicate Diabetes Mellitus disease. From that symptoms, it can be seen the predictions of patients that exposed or not exposed to Diabetes Mellitus with the Naive Bayes method. Naive Bayes method helps us in determining the probability of a patient with certain symptoms that can be said exposed or not exposed based on 22 symptoms as a key indicator of Diabetes Mellitus. Furthermore, the input will be compared with training data that has been validated. Keywords: Diabetes Diabetes Mellitus, Bayes Theorem, Theorem, Naive Bayes Methods, Methods, Expert System System

1

PENDAHULUAN

Teorema

Bayes

adalah

sebuah

pendekatan untuk sebuah ketidaktentuan yang Diabetes

Mellitus

(DM)

adalah

diukur dengan probabilitas. Pendekatan bayes

penyakit yang akhir-akhir ini semakin banyak

pada

saat

klasifikasi

adalah

mencari

dijumpai. Penyakit Diabetes Melitus juga

probabilitas tertinggi (VMAP) dengan masukan

sering kita sebut dengan istilah kencing manis

atribut (a1, a2, a3, ..., an) seperti tampak pada

atau penyakit gula darah. Penyakit yang satu

persamaan 1 berikut [2] :

ini termasuk jenis penyakit kronis yang tanda VMAP = arg max P(v j |a1,a2,a3,...,an)

awalnya yaitu meningkatnya kadar gula dalam

(1)



v j V

darah sebagai akibat adanya gangguan sistem metabolisme dalam tubuh. Organ tubuh yang terganggu adalah pankreas yang mana sudah

Teorema Bayes sendiri berawal dari rumus

tidak

persamaan 2 berikut :

berfungsi

sebagaimana

mestinya.

Pankreas sudah tidak mampu memproduksi hormon insulin dalam memenuhi kebutuhan

P(A|B) =

tubuh. Beberapa faktor yang menyebabkan

 

(2)

seseorang menderita penyakit diabetes, yaitu [3] :

Dimana

1) Banyak mengkonsumsi makanan yang

diketahui

P(A|B)

artinya

keadaan

B.

peluang

A jika

Kemudian

dari

persamaan rumus 2 diatas didapat persamaan 3

mengandung gula

seperti berikut :

2) Kurang tidur 3) Makan terlalu banyak karbohidrat dari nasi

P(B

atau roti

 A) = P( B | A) P(A)

(3)

4) Merokok 5) Kurangnya Aktivitas Fisik

Sehingga didapatkan teorema bayes seperti

6) Faktor Keturunan

persamaan 4 berikut :

Penentuan mengenai terkena penyakit Diabetes

P(A | B) =

Mellitus, dapat dikenali melalui beberapa

 |  

(4)

gejala yang dirasakan seperti banyak kencing, dehidrasi, berat badan turun, penglihatan

Yang mana :

kabur, dan sebagainya. Prediksi seseorang



A adalah hipotesis data A (class spesifik)

mengidap penyakit ini dapat diketahui dari



B adalah data dengan class yang belum

perhitungan probabilitas menggunakan metode Naïve

Bayes.

Metode

ini

diketahui

memanfaatkan

teorema Bayes.

2



P(A|B) adalah probabilitas hipotesis A

seperti banyak kencing, dehidrasi, berat badan

berdasar

turun, penglihatan kabur, dan sebagainya.

kondisi

B

(posterior

|

Dalam prosesnya, diperlukan beberapa

probability) 





P(B|A) adalah probabilitas B berdasar

tahapan untuk menjadikan data mentah sebagai

kondisi pada hipotesis A

knowledge based bagi sistem pakar. Aktivitas

P(A) adalah probabilitas hipotesis A

yang dilakukan untuk memindahkan kepakaran

(prior probability)

adalah [3] :

P(B) adalah probabilitas dari B

1. Knowledge Acquistion (dari pakar atau sumber lainnya)

Menggunakan teorema bayes ini, persamaan diatas dapat ditulis menjadi persamaan 5

2. Knowledeg

Representation

(ke

dalam

komputer) 3. Knowledge Inferencing

berikut ini :

4. Knowledge Transfering Vmap=arg max

 |  (5)

Akuisisi

pengetahun

dilakukan

sepanjang

proses pembangunan sistem. Proses akuisisi pengetahuan dibagi kedalam enam tahap, yaitu

Karena nilai P(a1, a2, a3, ..., an) konstan untuk semua v j, maka persamaan ini dapat ditulis

[5] : 1. Tahap Identifikasi Tahap identifikasi meliputi penentuan

menjadi persamaan 6 berikut ini :

komponen-komponen kunci dalam sistem yang sedang dibangun. Komponen kunci

VMAP = arg max P(a 1,a2,a3,...,an | v j)P(v j)

ini adalah knowledge



v j V

(6)

engineer , pakar, karakteristik masalah, sumber daya dan tujuan.

Untuk menghitung P(a1, a2, a3, ..., an | v j) bisa jadi semakin sulit karena jumlah term P(a1, a2, a3, ..., an | v j) bisa jadi sangat besar [2]. Hal ini

Permasalahannya adalah bagaimana cara

Diabetes

bahwa

Mellitus

seseorang

dengan

Tahap ini, memperjelas konsep – konsep kunci

dan

hubungannya

yang

telah

didtemtukan pada tahap sebelumnya.

disebabkan jumlah term tersebut

memprediksikan

2. Tahap Konseptualisas

terkena

menggunakan

metode Naïve Bayes. Prediksi ini dapat menggunakan masukan berupa gejala – gejala Diabetes Mellitus yang dirasakan oleh pasien

3. Tahap Formalisasi Tahap ini, memetakan seluruh konsep – kosenp pengatahuan sebelumnya ke dalam representasi formal yang sesuai dengan permasalahan. 4. Tahap Implementasi Pada tahap ini, hasil dari formalisasi diterapkan ke dalam skema representasi

3

pengetahuan

yang

dipilih

kemudian

Perancangan Sistem

dibuatlah prototype dari sisem. 5. Tahap Pengujian

Prosedur perancangan sistem secara

Tahap ini, melakukan pengujian terhadap

umum terdiri atas beberapa tahap antara lain

sistem

perancangan data, perancangan proses dan

dengan

memasukkan

berbagai

sampel masalah.

perancangan interface.

6. Revisi Protoype

Tahap pertama adalah perancangan data meliputi data input, data output dan data

METODE PENELITIAN

training. Data training yang akan digunakan sebagai acuan untuk menentukan data output

Pada penelitian ini, metode yang

yang dihasilkan oleh sistem, diperoleh dari

digunakan adalah metode klasifikasi dengan

Departemen

kesehatan

Naïve Bayes. Naïve Bayes menyederhanakan

sosial RI 2001 sebanyak 18 data [4]. Tahap

teorema bayes dengan asumsi bahwa fitur-fitur

kedua

dan

adalah

kesejahteraan

perancangan

tidak

proses implementasi Naïve Bayes ke dalam

kata

sistem. Pada tahap ini akan dijelaskan cara

independen satu sama lain. Seperti tampak

kerja sistem (perhitungan) dan proses-proses

pada persamaan 7 berikut ini :

yang akan digunakan,

yang

terdapat

tergantung

didalamnya

atau

saling

independen,

setiap

mulai dari masuknya

data input yang kemudian akan diproses oleh P(a1,a2,a3,...,an | v j) =

∏  |  

(7)

sistem hingga menjadi data output. Pada tahap ini diambil beberapa data

ini

training untuk di tes. Kemudian diambil

dengan persamaan diatas maka akan dihasilkan

probabilitas kemunculan setiap nilai masing-

rumus seperti persamaan 8 berikut ini :

masing fitur per kelasnya.

Dengan

mensubstitusikan

persamaan

Langkah VMAP = arg max P(v j)



∏  |  

(8)

v j V

Naïve Bayes adalah model penyederhanaan dari metode bayes. Dimana: 

VMAP = Nilai output hasil klasifikasi Naïve Bayes



P(a1, a2, a3, …, an) = Peluang A



Vj = Keadaan atau kategori j

meng-generate

pertama data

adalah

training

yang

dengan telah

diperoleh sebanyak 18 dataset. Dari data training yang diperoleh, kemudian dilakukan analisa mengenai gejala (fitur) dari penyakit Diabetes

Mellitus.

Setelah

menganalisa,

didapatkan 22 indikasi (bersifat diskrit) dari Diabetes Mellitus, yaitu : a.

Polituria

b. Polidipsia c.

Polipagia

d. Kesemutan e.

Rasa tebal

4

f.

Berat badan turun

Dari

kedua

fungsi

diatas,

dapat

g. Kulit

dilakukan perhitungan dengan metode Naïve

h. Gatal

Bayes seperti pada persamaan 9 berikut :

i.

Bisul

j.

Infeksi

  ( )∏  | 

(9)

k. Keputihan l.

Luka

Dimana j adalah jumlah kelas dan i adalah

m. Lapar

jumlah fitur yang ada.

n. Gemetar

Aturan

bayes

itu

sendiri

bisa

o. Lemah

ditetapkan sebagai berikut:

p. Konsentrasi

Misalkan terdapat kategori dua kelas P(h 1) dan

q. Keringat

P(h2).

r.

Berdebar

| < | , maka x diklasifikasikan

s.

Pusing

sebagai h2.

t.

Gelisah

Pada pengamatan nilai x tertentu,

u. Koma

ketika

mengambil

suatu

keputusan

maka

Serta dua kelas utama yaitu kelas Ya (terkena

probabilitas errornya seperti pada persamaan

Diabetes Mellitus) dan kelas Tidak (tidak

10 berikut :

terkena Diabetes Mellitus). Langkah

kedua

yaitu

|  |  { | 

melakukan

testing dengan diberikan data sample. Dengan

(10)

begitu dapat dihitung peluang terkena atau tidak terkena Diabetes Mellitus menggunakan Naïve Bayes. Dalam proses perhitungannnya

Jadi jelasnya peluang error bisa diminimalkan

dibutuhkan Prior yang merupakan probabilitas

jika diberikan nilai x dengan memutuskan h1

kemunculan kejadian tiap kelas yang tidak

jika

diketahui dengan pasti tetapi dapat diestimasi

| > | dan memutuskan h jika  | >  | [1]. Maka untuk

dari data yang tersedia. Prior dinyatakan

memutuskan

dengan (P(h j)).

memilih nilai posterior yang paling besar.

Variabel

random

diskrit

2

Tahap

yang

sesuatu

ketiga

Tahap

ini

atau

decide

adalah

dengan

perancangan

didistribusikan bergantung pada kemunculan

interface.

merupakan

tahap

objek dan dinyatakan dengan P(x|h) yang

pembuatan user interface sebagai fasilitator

menyatakan peluang muncul x jika diketahui h.

dalam berkomunikasi antar sistem dengan

Fungsi peluang P(x|h j) ini disebut juga dengan

user .

istilah fungsi likelihood dari h j terhadap x.

5

HASIL DAN PEMBAHASAN Eksperimen dilakukan untuk menguji kinerja sistem penentuan terkena Diabetes Mellitus. Pada proses pengujian ini, digunakan metode klasifikasi Naïve Bayes.

15

Gemetar

16

Lemah

17 Konsentrasi 18 Keringat

Langkah pertama yaitu menghitung probabilitas kemunculan (gejala)

terhadap

dari

kelasnya.

setiap fitur Berdasarkan

19 Berdebar 20

Pusing

perhitungan tersebut, diperoleh hasil seperti 21 Gelisah

pada tabel 1 berikut :

Tabel 1. Likelihood tiap fitur dari semua kelas

Fitur 1

Poliuria

2

Polidipsia

3

Polipagia

4

Kram

5

Kesemutan

6

Rasa Tebal

7

Berat Badan Turun

8

Kulit

9

Gatal

10

Bisul

11

Infeksi

12 Keputihan 13

Luka

14

Lapar

Kondisi Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak

Diabetes Mellitus Ya Tidak 7/10 3/10 8/10 1/10 9/10 1/10 5/10 5/10 6/10 4/10 2/10 8/10 4/10 6/10 2/10 8/10 3/10 7/10 1/10 9/10 2/10 8/10 4/10 6/10 7/10 3/10 2/10 8/10

3/8 5/8 3/8 5/8 1/8 7/8 4/8 4/8 2/8 6/8 7/8 1/8 6/8 2/8 7/8 1/8 6/8 2/8 6/8 2/8 7/8 1/8 5/8 3/8 1/8 7/8 4/8 4/8

22

Koma

Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak Ya Tidak

Kemudian

4/10 6/10 9/10 1/10 2/10 8/10 9/10 1/10 2/10 8/10 5/10 5/10 5/10 5/10 2/10 8/10

dilakukan

3/8 5/8 2/8 6/8 5/8 3/8 2/8 6/8 7/8 1/8 4/8 4/8 5/8 3/8 5/8 3/8 analisis

keakuratan data dengan memasukkan data sample melalui sistem seperti pada gambar 1 dan 2 berikut.

Gambar 1. Form input data user

Gambar 2. Form input gejala

6

Pengujian

keakuratan

dilakukan

dengan memasukkan masalah yang sama

Dari

pengujian

dapat

diketahui tingkat keakurasiannya adalah :

dengan data training sebelumnya. Dari hasil

   = 94,4% 

Akurasi =

pengujian tersebut, dapat dihitung tingkat keakuratan dengan cara pada persamaan 11

tersebut,

KESIMPULAN

berikut :

Pada penelitian ini dapat disimpulkan bahwa semakin banyak jumlah data yang

     Akurasi =   

digunakan untuk training maka semakin tinggi (11)

Adapun hasil pengujian dari setiap data training ditunjukkan pada tabel 2 berikut :

keakuratannya. Selain itu, semakin sering juga dilakukan

learning

knowledge

maka

akan

penambahan semakin

cepat

mendapatkan klasifikasi dengan benar. Untuk

Tabel 2. Hasil pengujian

atau

langkah

selanjutnya,

akan

berkonsentrasi pada pengembangan aplikasi

Data

Data

Data Output

ke -

Training

(Hasil Pengujian)

1

ya

ya

mendapatkan akurasi yang tinggi dengan

2

ya

ya

berapapun jumlah data trainingnya. Aplikasi

3

tidak

tidak

juga

4

tidak

tidak

meminimalisir waktu pemrosesan pada saat

5

tidak

tidak

learning.

6

ya

ya

7

ya

ya

8

ya

ya

9

tidak

tidak

10

tidak

tidak

11

ya

ya

12

tidak

tidak

13

ya

ya

14

tidak

ya

15

ya

ya

16

ya

ya

17

ya

ya

18

tidak

tidak

seperti

dapat

konstanta

menentukan

bayes

dapat

secara

nilai

otomatis

disempurnakan

variasi untuk

untuk

DAFTAR PUSTAKA [1] Basuki, Achmad. 2006. Metode Bayes. Pens,

Institut

Teknologi

Sepuluh

November.

[2] Ferry Febrian, ” Analisis Komparasi Algoritma Klasifikasi Data Mining Pada Akseptasi

Data

Fakultatif

Reasuransi

Jiwa”, Tesis, Program Studi Teknik Informatika, Program Pasca Sarjana (S2) Magister

Komputer,

2011.

URL

:

http://edp.stmikpasim.ac.id/agoenthea/pub lic_html/thesis/Research%20Method/romi

7

-mp/01%20%20research%20fields/data%20mining/th esis/Ferry%20%20Komparasi%20Klasifikasi%20DM% 20untuk%20Akseptasi%20Reas.pdf diakses tanggal 4 januari 2012.

[3] Suardin Yakub, “Sistem Pakar Deteksi Penyakit

Diabetes

Menggunakan

Mellitus

Dengan

Pendekatan

Naïve

Bayesian Berbasis Web”, Skripsi, Jurusan Teknik Informatika, Fakultas Sains Dan Teknologi, 2008. URL : http://lib.uinmalang.ac.id/thesis/fullchapter/04550034suardin-yakub.ps

diakses

tanggal

4

Oktober 2012.

[4] DEPKES RI. 2001. Pedoman

Pengobatan Dasar Di Puskesmas Berdasarkan Gejala. Jakarta : DEPKES.

[5]

Firebaugh Intelligence: Approach,

M.W., A

1989,

Artificial

knowledge-Based

PWS-Kent

Publishing

Company, Boston.

8

Jurnal Diabetes Mellitus

Recommend Documents