Deteksi Penyakit Demam Berdarah, Tifus, Dan Demam Biasa Berdasarkan Gejala-Gejalanya 1
2
3
4
Ramdhani Bima Arista , Osi Adha Dwi Kenanti , Sri Wahyuni , M.Fahmi Yusuf , Nur Rokhim 5
Satria N. *)
Program Teknologi Informasi dan Ilmu Komputer Universitas Brawijaya Program Studi Informatika 1
2
3
*)E-mail:
[email protected] ,
[email protected] ,
[email protected] [email protected] m , 4 5
[email protected] ,
[email protected]
ABSTRAK Naïve Bayes merupakan pengklasifikasian dengan metode probabilitas dan statistik yang dikemukakan oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi peluang di masa depan [1] berdasarkan pengalaman di masa sebelumnya sehingga dikenal sebagai teorema Bayes . Pada paper ini akan memaparkan penggunaan naive bayes dalam pengklasifikasian data yang berupa data test dan data latih. Disini akan membuktikan keoptimalan naive bayes dalam kondisi mendeteksi penyakit Demam Berdarah, Tifus, dan Demam biasa berdasarkan gejala-gejalanya. Data test akan memberikan keakuratan dalam program ini. Naive bayes is classification of method proposed by british scientists Thomas Bayes that predict [1] future opportunities based on experiences in the past, so it known as Teorema Bayes . This paper will describe the use of naive bayes in the data classification in the form of data training and data test. Here it will proved optimal naive bayes detect disease in conditions of Dengue Fever, Typhoid, and Fever based on its symptoms. Data Test will detecting provide the accuracy in this program.
PENDAHULUAN Latar Belakang Pada musim hujan banyak penyakit bermunculan. Salah satunya yang patut kita waspadai dan paling banyak mewabah adalah Demam berdarah(DBD). Demam adalah suatu bagian penting dari mekanisme pertahanan tubuh melawan infeksi. Kebanyakan bakteri dan virus yang
menyebabkan infeksi pada manusia hidup [3] subur pada suhu 37 derajat C . Meningkatnya suhu tubuh beberapa derajat dapat membantu tubuh melawan infeksi. Demam biasanya muncul pertama kali, lalu disusul oleh sakit kepala hebat, hilang selera makan dan lemas lesu. Simtom lain adalah rasa sakit di dada, batuk-batuk, sakit perut, diare, konjungtivitas, pembengkakan wajah [4] . Demam bukanlah suatu penyakit, tetapi 1
gejala yang dialami seseorang sebelum terserang penyakit. Kondisi ringan maupun menengah suatu demam, tidak terlalu berpengaruh bagi tubuh, hanya menimbulkan efek tidak nyaman terutama bagi anak-anak. Gejalanya sakit kepala, nafas pendek-pendek dan batuk serta sakit pada daerah tertentu dan terjadi peradangan. Tujuan Berdasarkan masalah yang ada maka tujuan dari dilaksanakannya program ini adalah memudahkan masyarakat awam untuk mengetahui lebih awal penyakit apa yang diderita dari gejala-gejala yang dialami. DASAR TEORI Thypus Penyakit tifus disebabkan oleh bakteri yang dinamakan Salmonella Typhi [2] . Bakteri ini berkembang cepat pada tempat-tempat yang kotor. Penyebaran bakteri ini dibantu oleh serangga-serangga pembawa bakteri seperti lalat dan serangga lainnya. Bakteri ini biasa ada pada makanan atau minuman dan akan masuk ketubuh orang yang mengkonsumsinya dan menyebabkan penyakit tifus. Gejala dari penyakit ini hampir mirip dengan gejala demam berdarah, yang membedakan adalah diare, dan khususnya pada malam hari suhu akan meningkat dan akan turun pada pagi hari. Inilah yang membedakan demam tifus dengan demam berdarah. Demam Berdarah Penyakit Demam Bedarah Dengue/DBD (secara medis disebut Dengue Hemorrbagic Fever /DHF) adalah penyakit yang disebabkan oleh virus dengue yag
ditularkan melalui gigitan nyamuk Aedes aegypti dan Aedes albopictus. Virus ini akan mengganggu kinerja darah kapiler dan sistem pembekuan darah, sehingga [2] mengakibatkan perdarahan-perdarahan . Dari infeksi virus tersebut dapat menimbulkan berbagai gejala seperti panas tinggi, nyeri otot, bintik merah dan lain sebagainya. Penyakit ini banyak ditemukan di daerah tropis, termasuk seluruh plosok Indonesia, kecuali di tempat-tempat dengan ketinggian lebih dari 1.000 meter di atas permukaan air laut. Dokter dan tenaga kesehatan lainnya, seperti bidan, sering kali salah dalam penegakan diagnosis, karena kecendrungan gejala awal penyakit ini menyerupai penyakit lain, seperti flu dan tifus (typhoid ). METODOLOGI Pada pembuatan software ini, kami menggunakan data set sebagai bahan data latih dan data test. Dataset merupakan sebuah himpunan data yang akan ditampilkan dalam report. Dataset yang kami gunakan berupa gejala-gelaja dari penyakit Demam Berdarah (DBD), Tifus dan Demam Biasa, dan dibuat dalam 3 kelas Seperti pada tabel 5. Kelas 1 yaitu demam berdarah, kelas 2 yaitu tifus dan kelas 3 adalah demam biasa. Dari setiap gejala disimbolkan dengan 1 (Ya) dan 0 (Tidak).
Radang 1
ya
o
tidak Tabel 1
2
Diare 1
ya
0
tidak Tabel 2 Nyeri Otot
Disini kami menggunakan metode naive bayes untuk pengambilan keputusan. naive bayes merupakan salah satu metode machine learning yang menggunakan perhitungan probabilitas. konsep dasar yang digunakan oleh Naive Bayes adalah teorema Bayes, yaitu melakukan klarifikasi c i, jika diketakui dokumen d j. klasifikasi dilakukan untuk menentukan kategori c
1
ya
0
tidak Tabel 3
Demam Pagi-Malam 1
naik turun
0
tetat
C dari suatu dokumen d Ɛ D dimana C = {c1, c 2, c 3…..ci} dan D = {d1, d2, d3,.....,d j}. penentuan dari kategori sebuah dokumen dilakukan dengan mencari nilai maksimum dari p(C = ci | D = d j) pada P={ p(C = ci | D = d j) | c Ɛ C dan d Ɛ Ɛ
D}. Nilai probabilitas p(C = ci | D = d j) dapat dihitung dengan persamaan (Mitchell, 2005):
Tabel 4 Pola Demam Dalam Satu Minggu
1
panas-turunpanas
0
panas terus menerus
Tabel 5 Class
1
demam berdarah
2
tifus
3
demam biasa Tabel 6
...(1)
dengan p(C = ci | D = d j) merupakan nilai probabilitas dari kemunculan dokumen d j jika diketahui dokumen tersebut berkategori ci p(C = ci ) adalah nilai probabilitas kemunculan dari kategori ci, dan p( D = d j) adalah nilai probabilitas kemunculan [7] dokumen d j . Naive Bayes menganggap sebuah dokumen sebagai kumpulan dari kata-kata yang menyusun dokumen tersebut, dan tidak memperhatikan urutan kemunculan kata pada dokumen. sehingga perhitungan probabilitas p( D = d j| C = ci) dapat
3
dianggap sebagai hasil perkalian dari probabilitas kemunculan kata-kata pada dokumen d j. perhitungan probabilitas p( D = d j| C = ci) dapat dituliskan sebagai berikut:
hasil klarifikasi secara keseluruhan. Sehingga persamaan Db(wk = wkj , c) dituliskan sebagai (Mitchelle, 2005):
... (5)
dengan |V| merupakan jumlah kemungkinan nilai dari w kj. ... (2)
dengan adalah hasil perkalian dari probabilitas kemunculan semua kata pada dokumen d j. Proses klasifikasi dilakukan dengan membuat model probabilistik dari dokumen training, yaitu dengan menghitung nilai p(wk |c). untuk wkj diskrit dengan w kj Ɛ V = (v1, v2, v3, …, vm} maka p(wk |c) dicari untuk seluruh kemungkinan nilai w kj dan didapatkan dengan melakukan perhitungan (Mitchelle, 2005):
Pemberian kategori dari sebuah dokumen dilakukan dengan memilih nilai c yang memiliki nilai p(C = ci | D = d j) maksimum dan dinyatakan dengan: ... (6)
Kategori c* merupakan kategori yang memiliki nilai p(C = c i | D = d j) maksimum. Nilai p( D = d j) tidak mempengaruhi perbandingan karena untuk setiap kategori nilainya akan sama. Berikut pada gambar 1 adalah gambaran proses klasifikasi dengan algoritma Naive Bayes:
... (3)
dan
... (4)
dengan Db(wk = wkj , c) adalah fungsi yang mengembalikan jumlah dokumen b pada kategori c yang memiliki nilai kata w k = w kj Db(c) adalah fungsi mengembalikan jumlah dokumen b yang memiliki kategori c dan |D| adalah jumlah seluruh training dokumen. Persamaan Db(wk = wkj , c) sering kali dikombinasikan dengan Laplacian Smoothing untuk mencegah persamaan mendapat nilai 0, yang dapat mengganggu
Gambar 1. Tahapan Proses Klasifikasi Dokumen Dengan Algoritma Naive Bayes 4
HASIL DAN PEMBAHASAN
Program ini dijalankan dengan mengisi form yang berisi gejala yang dialami oleh penderita, kemudian program akan
Dibawah ini merupakan hasil dari program:
Gambar 1 Terdapat sebuah form yang dapat diisi berdasarkan gejala-gelaja yang dialami oleh penderita penyakit. Jika sudah selesai memasukan gejala yang dialami maka dapat meng-klik tombol check. Setelah itu akan muncul message penderita penyakit
menghasilkan keluaran berupa diagnosa penyakit yang dialami. Diagnosa yang dikeluarkan oleh program ini merupakan hasil dari dataset yang telah di input.
terserang penyakit Demam Berdarah, Tifus atau Demam Biasa.
Gambar 2 Presentasi ketepatan diagnosa berdasarkan data uji yang ada: Benar : 13/30 * 100% = 43 % Salah : 27/30 * 100% = 57%
5
DAFTAR PUSTAKA
[1]Dita Martha Pratiwi, 2011, Algoritma Naive Bayes Classification, URL: http://http://ditut113070242.wordpress.com/ 2011/03/22/algoritma-naive-bayesclassification/, 15/12(2012) [2]Prasetyono DS, Daftar Tanda dan Gejala Ragam Penyakit, Jogjakarta: FlashBooks, 2012 [3] Kelly H, Bennett N, Murray S and O’Grady KA, Pengenalan, Pencegahan dan Penyembuhan Penyakit-penyakit yang Disebebkan oleh Bakteri dan Virus, Jogjakarta: PALMALL, 2009 [4]Bau III, David, Lloyd N. Trefethen, 1997. Numerical Linear Algebra. Philadelphia: Society for Industrial and Applied Mathematics. [5] Burton, K., Burton, A. Java, and I. Soboroff. The ICWSM 2009 Spinn3r Dataset. In Proceedings of the Third Annual International Conference on Weblogs and Social Media (ICWSM 2009), San Jose, CA. May 2009. [6] Hazimah, Wan. 2005. Text Categorization Using Naïve Bayes Algorithm. Tesis Tidak Terpublikasi. Malaysia: Universiti Utara Malaysia. [7] Nir Friedman,Dan Geiger,and Moises Goldszmidt.Bayesian network classifiers. Machine Learning, 29:131-163,1997.
6