IMPLEMENTASI ALGORITMA C4.5 UNTUK MENGANALISIS KEMUNGKINAN DIBATALKANYA SEPEDA SANTAI CAR FREE DAY OLEH FAKTOR ALAM
TUGAS MATA KULIAH
Diajukan Untuk Memenuhi Tugas Mata Kuliah kecerdasan buatan
Program Studi Teknik Informatika Fakultas Teknik Dan Ilmu Komputer
TATANG R GANDA WIJAYA
10111137
Bagus Chandra Wanto
10111152
PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNIK DAN ILMU KOMPUTER UNIVERSITAS KOMPUTER INDONESIA 2015
KATA PENGANTAR
Puji dan Syukur kami panjatkan ke Hadirat Allah Swt, karena berkat limpahan Rahmat dan Karunia-nya sehingga kami dapat menyusun penelitian ini dengan baik dan tepat pada waktunya. Dalam penelitian ini kami membahas laporan pembangunan "IMPLEMENTASI ALGORITMA C4.5".
Penelitian ini dibuat dengan berbagai observasi dan beberapa bantuan dari berbagai pihak untuk membantu menyelesaikan tantangan dan hambatan selama mengerjakan penelitian ini. Oleh karena itu, kami mengucapkan terima kasih yang sebesar-besarnya kepada semua pihak yang telah membantu dalam penyusunan penelitian ini.
Penulis menyadari bahwa masih banyak kekurangan yang mendasar pada penelitian ini. Oleh karena itu kami mengundang pembaca untuk memberikan saran serta kritik yang dapat membangun kami. Kritik konstruktif dari pembaca sangat kami harapkan untuk penyempurnaan penelitian selanjutnya.
Akhir kata semoga laporan ini dapat memberikan manfaat bagi kita sekalian. Wassallam.
Bandung, Januari 2015
Penulis
DAFTAR ISI
KATA PENGANTAR 2
DAFTAR ISI 3
DAFTAR TABLE 5
DAFTAR GAMBAR 6
BAB I PENDAHULUAN 7
Latar Belakang Masalah 7
Perumusan Masalah 9
Maksud Dan Tujuan 9
Batasan Masalah 9
Metode Penelitian 10
Sistematika Penulisan 12
BAB II TINJAUAN PUSTAKA 13
Tinjauan Tempat Penelitian
Profil Car Free day 13
Sejarah Car Free day 13
Landasan Teori
Data 14
Informasi 15
Pengertian Data Maining 15
Proses data Maining 16
Pemodelan Data Maining 17
Pohon Keputusan 17
Algoritma C45 18
Pengelompokan Data 19
BAB III IMPLEMENTASI DAN PENGUJIAN 21
Implementasi` 21
Implementasi Perangkat Keras 21
Implementasi Perangkat Lunak 21
Implementasi Antar Muka 21
Pengujian 25
Rencana Pengujian 25
Kesimpulan Pengujian 25
BAB IV KESIMPULAN DAN SARAN 26
4.1 Kesimpulan Pengujian 26
4.2 Saran 26
DAFTAR PUSTAKA 27
DAFTAR TABLE
Table III.3, Rencana Pengujian aplikasi
DAFTAR GAMBAR
Gambar I.1, Metode Waterfall
Gambar III.3, Halaman Awal aplikasi
Gambar III.3, Halaman Menu Utama aplikasi
Gambar III.3, Pengaturan Atribut aplikasi
Gambar III.3, Output data text aplikasi
Gambar III.3, Pohon keputusan Aplikasi
BAB I
PENDAHULUAN
Latar belakang masalah
Kehadiran data minning di latarbelakangi beberapa macam masalah terutama data explision yang dialami beberapa perusahaan seperti contoh beberapa perusahaan mengumpukan data dari tahun ketahun lamanya (data pembelian, data stock barang, data mahasiswa dan data lainya) (Rangga Gelar Guntara, 2011). Kehadiran data mining merupakan juga bidang ilmu yang sangat luas penerapanya diantaranya penerapan dalam kehidupan sehari-hari, dengan data mining dapat menganalisis beberapa masalah yang belum dikhetahui. data mining menurut David Hand, Heikki Mannila, padharic Smyth dari MIT adalah analisis terhadap data ( biasanya data yang berukuran besar ) untuk menemukan hubungan yang jelas serta menyimpulkanya yang belum dikhetahui sebelumnya dengan cara terkini dipahami dan berguna bagi pemilik data tersebut (Larose, 2006).
Masalah ini pula yang terjadi pada para pesepeda yang ingin berolah raga dengan menggunakan sepeda, terkadang pesepeda tidak mengetahui jika olah raga sepeda yang mereka rencakan jauh-jauh hari bisa batal tanpa sepengetahuan oleh faktor alam yang tidak di prediksi sebelumnya, seperti contohnya hujan atau bencana alam.
Perkembangaan ilmu teknologi dan ilmu industri mengharuskan beberapa macam masalah muncul di kehidupan sehari-hari, seperti contoh dengan berkembangnya ilmu teknologi dan industri yang mempengaruhi tatanan alam berubah seperti tidak terprediksinya musim kemarau dan musim hujan yang mengakibatkan sulitnya memprediksi keadaan alam.
Begitu pula permasalahan bagi para pesepeda yang ingin berolah raga dalam memanfaatkan waktu luang-nya untuk berolah raga yang terkadang selalu batal diakibatkan faktor alam, sebagai contoh pada tahun 2014 yang lalu beberapa pesepeda yang sudah direncanakan untuk bersepeda di carr free day dago terpaksa batal diakibatkan hujan angin yang terjadi, padahal sehari sebelum acara sepeda cuaca dan faktor alamnya sangat mendukung untuk olah raga.
Berdasarkan permasalahan tersebut, kemungkinan batalnya bersepeda bisa dikhetahui sebelum waktu acara dimulai dan pesepeda dapat melakukan tindakan agar bersepeda bisa dilaksanakan sesuai dengan harapan.
Untuk mengatasi permasalahan tersebut dibutuhkan alat analis untuk mengetahui batalnya acara olah raga sepeda. Analisis ini dapat memanfaatkan ilmu tentang penalaran berbasis kasus, yaitu menganalisis kasus-kasus yang pernah terjadi untuk di bandingkan dengan waktu acara yang akan dilaksanakan, aplikasi ini dapat digunakan untuk menentukan keputusan yang akan terjadi oleh faktor alam.
Di dalam pembuatan aplikasi ini memanfaatkan algoritma data mining dengan membuat pohon keputusan. Pohon keputusan merupakan teknik yang paling efisien, teknik registrasi sangat banyak, tetapi paling terkenal adalah algoritma yang diperkenalkan oleh prof. Brieman dengan istilah the classification and regression tree (CHART). Algoritma pohon keputusan terkenal adalah c4.5 pada akhir tahun 1970 sampai awal tahun 1980 J.Ros Quinlan, seorang peneliti dibidang machine learning, membuat sebuah algoritma desicion three yang dikenal dengan ID3, kemudian J.Ros Quinlan membuat algoritma c4.5 (pohon keputusan) yang merupakan pengembangan dari algoritma ID3 (Han, 2006). Algoritma ini memiliki kelebihan yaitu flexible, dimengerti, dan dapat divisualisasikan dengan bentuk gambar(pohon keputusan) (Garunescu, 2011). Ada beberapa beberapa tahapan dalam membuat pohon keputusan dengan algoritma c4.5 (kusrini, 2009) yaitu. Menyiapkan data training, menentukan akar dari pohon. Adapun judul tugas sistem kecerdasan buatan ini adalah IMPLEMENTASI ALGORITMA C4.5 UNTUK MENGANALISIS KEMUNGKINAN DIBATALKANYA SEPEDA SANTAI CAR FREE DAY OLEH FAKTOR ALAM.
Rumusan Masalah
Adapun rumusan masalah yang ingin diselesaikan dalam tugas kecerdasan buatan ini yaitu bagaimana cara membuat aplikasi untuk membantu bagi para pesepeda yang ingin berolah raga dalam menganalisis kasus dibatalkanya sepeda santai. Dalam penelitian ini model pohon keputusan yang akan digunakan menggunakan algoritma c4.5.
Maksud dan Tujuan
Maksud dan tujuan dari penelitian ini adalah mengimplementasikan algoritma pohon keputusan c4.5 terhadap masalah yang terjadi pada pesepeda carr free day.
Sedangkan tujuan dari tugas kecerdasan buatan adalah :
Kemungkinan terjadinya gangguan oleh faktor alam dapat dikhetahui oleh pesepeda yang ingin berolah raga.
Untuk mengetahui keputusan yang akan diketahui oleh pesepeda yang ingin berolah raga.
Batasan Masalah
Pada pembuatan tugas kecerdasan buatan ini, permasalahan dibatasi pada :
Membentuk pohon keputusan dengan algoritma C4.5
Proses yang dilibatkan dalam aplikasi ini adalah data mining.
Aplikasi yang akan dibangun menggunakan weka openshorce.
Keluaran dari aplikasi ini berupa informasi pengklarifiasian data berupa pohon keputusan.
Data yang digunakan dalam aplikasi ini diambil secara acak. Dengan tujuan agar dapat membandingkan data lama dan data baru.
Pencocokan data dengan kasus baru dan lama dilakukan secara manual.
Analisis yang digunakan berdasarkan aliran data terstruktur. Alat yang digunakan dengan menggunakan diagram konteks dan data flow diagram (dfd).
Metodologi Penelitian
Metodologi penelitian yang digunakan dalam pembuatan tugas matakuliah kecerdasan buatan ini sebagai berikut:
Tahap Pengumpulan data
Metode dalam pengumpulan data yang digunakan dalam pembuatan tugas matakuliah ini adalah
Studi pustaka
Pengumpulan data di dalam pembuatan tugas matakuliah sistem terestrebusi dengan cara mengumpulkan data berupa ( jurnal, paiper, buku dan bacaan-bacaan yang berkaitan dengan judul tugas matakuliah ini)
Observasi
Teknik yang digunakan dalam pembuatan tugas matakuliah sistem terestrebusi dengan cara penelitian dan peninjauan langsung ke tempat penelitian.
Wawancara
Wawancara adalah teknik pengumpulan data secara langsung tanya jawab dengan pengendara sepeda, membahas keterkaitanya dengan tugas matakulah sistem terestrebusi.
Tahap Pembuatan Perangkat Lunak
Teknik analisis data dalam pembuatan perangkat lunak menggunakan paradikma secara waterfall. Waterfall memiliki beberapa proses untuk membuat perangkat lunak.
System egeneing
System Egenering merupakan bagian terpenting dalam pembuatan perangkat lunak, dimulai dengan mencari data yang dibutuhkan, mengumpulkan data yang dibutuhkan dan menetapkan kebutuhan yang dibutuhkan oleh sistem.
Analisis
Analisis Merupakan tahap menganalisis yang dibutuhkan dalam pembuatan perangkat lunak.
Desegn
Desegn adalah tahapan mengplementasikan terjemahan kedalam bentuk yang mudah dimengerti oleh user.
Coding
Coding merupakan tahapan implementasi terjemahan data dan pemecahan masalah yang dirancang ke dalam bahasa pemograman yang berkaitan dengan pembuatan perangkat lunak.
Testing
Testing adalah tahap pengujian aplikasi kepada user apakah sudah sesuai dengan kebutuhan.
Maintance.
Maintance adalah tahapan terakhir di dalam tahapan pembuatan perangkat lunak, dalam tahapan ini perangkat lunak sudah selesai di buat dan kemungkinan besar ada penambahan fitur dalam aplikasi tersebut sesuai keinginan user.
Gambar I.1 Metode Waterfal
Sistematika Penulisan
Adapun sistem penulisan yang digunakan dalam pembuatan tugas sistem terestrebusi sebagai berikut :
BAB 1 PENDAHULUAN
Pada BAB 1 PENDAHULUAN menguraikan tentang latar belakang masalah, rumusan masalah, maksud dan tujuan, batasan masalah, metodologi penelitian, sistematika penulisan.
BAB II TINJAUAN PUSTAKA
Pada BAB II TINJAUAN PUSTAKA menguraikan analisis masalah yang dihadapi dalam pembuatan sistem dan aplikasi yang akan dibuat.
BAB III IMPLEMENTASI DAN PEMBAHASAN
Berisi tahapan-tahapan yang dilakukan untuk menerapkan sistem yang telah dirancang dan implementasi aplikasi yang sudah di buat serta pada bab ini sifatnya terpadu dan tidak terpecah secara terpisah.
Hasil penelitian sedapat-dapatnya disajikan dalam bentuk daftar (tabel), grafik, foto, atau bentuk lain, agar pembaca lebih mudah mengikuti uraian.
Pembahasan tentang hasil yang diperoleh, berupa penjelasan teoritik, baik secara kualitatif, kuantitatif, atau secara statistik.
BAB IV KESIMPULAN DAN SARAN
Berisi rangkuman dan kesimpulan dari penelitian tugas sistem terestrebusi serta saran untuk mengembangkan dan membangun aplikasi itu kembali.
BAB II
TINJAUAN PUSTAKA
Tinjauan tempat penelitian
Pada subab ini akan membahas mengenai implementasi algoritma C4.5 serta tempat penelitian tugas sistem terestrebusi.
Profil car free day
Hari Bebas Kendaraan Bermotor (HBKB) atau dalam bahasa Inggris disebut sebagai Car Free Day bertujuan untuk mensosialisasikan kepada masyarakat untuk menurunkan ketergantungan masyarakat terhadap kendaraan bermotor. Kegiatan ini biasanya didorong oleh aktivis yang bergerak dalam bidang lingkungan dan transportasi.
Tema penting dalam hari bebas kendaraan bermotor, adalah tinggalkan kendaraan bermotor di rumah dan berjalan kakilah atau gunakan kendaraan tidak bermotor atau pun menggunakan kendaraan umum untuk perjalanan panjang
Sejarah Car Free Day
Car free day merupakan suatu kegiatan yang bertujuan mengurangi ketergantungan terhadap kendaraan umum atau pribadi car free day juga lebih menproritaskan pengembangan ruang public.
Car free day pertama kali di adakan oleh pemerintah swise untuk mengurangi energi tahun 1973, disusul kembali oleh negara-negara lainya seperti negara prancis pada tahun 1998 ( world car free day ). Diindonesia car fre day sudah ada sejak tahun 2002 kegiatan tersebut di gagas dan dikalanakan oleh para LSM lingkungan hidup. Hari bebas kendaraan di jakarta pada awalnya dilaksanakan setiap hari minggu, keiatan ini berlangsung selama 8 jam sampai12. Karena banyaknya keluhan dari masyarakat, tentunya penyelenggaraan dilaksanakan selama 2 jam.
Dalam mengurangi modal transportasi dimulai sejak krisis energi tahun 1977baru ketika tanggal 22 september sebagai hari ditetapkanya CFD internasional, dan baru pada 1995 terbentuknya world carr free day yang mendukung CFD internasional.
Gagaysan utama dari CFD adalah mengembangkan trasnportasi masal, bersepeda, dan berjalan kaki. Dengan begitu banyak yang berbelanja dan melakukan aktifitas dengan jarak yang dekat dari tempat tinggal dan tempat kerja lainya.
Landasan Teori
Data
Menurut Abdul Kadir (2003: 29), data adalah deskripsi tentang benda, kejadian, aktivitas, dan transaksi, yang tidak mempunyai makna atau tidak berpengaruh secara langsung kepada pemakai. Data juga sesuatu yang belum mempunyai arti bagi penerimanya dan masih memerlukan adanya suatu pengolahan. Data bisa berujud suatu keadaan, gambar, suara, huruf, angka, matematika, bahasa ataupun simbol-simbol lainnya yang bisa kita gunakan sebagai bahan untuk melihat lingkungan, obyek, kejadian ataupun suatu konsep Data bisa merupakan jam kerja bagi karyawan perusahaan.
Data ini kemudian perlu diproses dan diubah menjadi informasi, Data sebagai catatan atas kumpulan fakta.[1] Data merupakan bentuk jamak dari datum, berasal dari bahasa Latin yang berarti "sesuatu yang diberikan". Dalam penggunaan sehari-hari data berarti suatu pernyataan yang diterima secara apa adanya. Pernyataan ini adalah hasil pengukuran atau pengamatan suatu variabel yang bentuknya dapat berupa angka, kata-kata, atau citra.
Menurut sifatnya data dibagi atas dua bagian yaitu :
Data kualitatif.
Data kualitatif adalah data yang dikategorikan menurut lukisan kualitas objek yang dipelajari.
Data kuantitatif.
Data kuantitatif adalah data yang memiliki harga yang berubah – ubah atau bersifat variabel
Informasi
Informasi merupakan hasil pengolahan dari sebuah model, formasi, organisasi, ataupun suatu perubahan bentuk dari data yang memiliki nilai tertentu, dan bisa digunakan untuk menambah pengetahuan bagi yang menerimanya. Dalam hal ini, data bisa dianggap sebagai obyek dan informasi adalah suatu subyek yang bermanfaat bagi penerimanya. Informasi juga bisa disebut sebagai hasil pengolahan ataupun pemrosesan data[2].
Pengertian data Mining
Data mining merupakan bidang ilmu yang sangat luas penerapanya, data mining merupakan cabang ilmu yang termasuk masih baru tetapi telah menghasilkan keuntungan yang cukup besar saat ini. Data mining sering dimanfaatkan untuk mendeteksi kejadian-kejadian yang ganjil seperti penyakit tertentu , transaksi yang mencurigakan, hingga mendeteksi telephone orang yang ingin menipu seperti penyalahgunaan kartu kredit.
Data mining menurut david hand, heika manila dan padraic Smyth dari MT adalah analisis terhadap data (biasanya data yang cukup besar) untuk menemukan hubungan yang jelas serta menyimpulkan yang belum dikhetahuisebelumnya dan data dapat dipahami dan berguna bagi pemiliknya (Larose, 2006).
"Data mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual." (Pramudiono, 2006).
Data mining mempunyai teori-teori yang banyak dan data mining teorinya pun sudah ada sejak lama Naive-Bayes, Nearst Neigbox, Pohon keputusan . Aturan Assoisasi,K-Mens Cluster dan Text Mining (Bramer, 2007), sedangkan perkembanganya sampai saat ini sudah muncul algoritma-algoritma yang baru dikembangkan saat ini yaitu jaringan syaraf tiruan, Algoritma ginetik , Fuzzy C-Mens, Support Vector Machine (SVM) dan lain-lain (Larose, 2006).
Kemajuan luar biasa yang terus berlanjut dalam bidang data mining didorong oleh beberapa faktor, antara lain (Larose, 2005):
Pertumbuhan yang cepat dalam kumpulan data.
Penyimpanan data dalam data warehouse, sehingga seluruh perusahaan
memiliki akses ke dalam database yang andal.
Adanya peningkatan akses data melalui navigasi web dan intranet.
Tekanan kompetisi bisnis untuk meningkatkan penguasaan pasar dalam globalisasi ekonomi.
Perkembangan teknologi perangkat lunak untuk data mining (ketersediaan teknologi).
Perkembangan yang hebat dalam kemampuan komputasi dan pengembangan.
kapasitas pengembangan media penyimpanan.
Hubungan yang dicari dalam data mining dapat berupa hubungan antara dua atau lebih dalam satu dimensi. Misalnya dalam dimensi produk kita dapat melihat keterkaitan pembelian suatu produk dengan produk yang lain. Selain itu, hubungan juga dapat melihat antara dua atau lebih atribut dan dua atau lebih objek (Ponniah, 2001).
Proses data mining
Secara skematis, Gorunscu (2011) membagi langkah-langkah proses pelaksanan data mining dalam tiga aktifitas yaitu
Ekplorasi data, terdiri dari aktifitas pembersihan data, transformasi data, pengurangan dimensi, pemilihan ciri, dan lain-lain.
Membuat model dan pengujian validitas model, merupakan pemilihan terhadap model-model yang sudah di kembangkan yang cocok dengan kasus yang dihadapi, dengan kata lain, dilakukan pemilihan model secara kompetitif.
Penerapan model dengan data baru untuk menghasilkan perkiraan data kasus ada. Tahap ini merupakan tahap yang menentukan apakah model yang telah dibangun dapat menjawab permasalahan yang dihadapi.
Untuk menentukan model baik atau buruk, kita memerlukan elemen-elemen kunci antara lain :
Akurasi prediksi, untuk menentukan seberapa akurat suatu model dalam memprediksi keluaran.
Kecepatan, yang menunjukan seberapa cepat suatu model dalam memproses data masukan.
Robustness, menggambarkan kemampuan suatu model melakukan prediksi yang akurat, walau dalam kondisi extreme dan banyak gangguan.
Skalabilitas, kemampuan suatu proses data ukuran yang besar ataupun kecil.
Kesederhanaan, merupakan sifat yang cenderung dipilih untuk menyelesaikan suatu permasalahan.
Pemodelan data mining
Pemodelan adalah penggunaan prinsip-prinsip atau teknik-teknik tertentu dalam suatu rancangan sistem. Kian kompleksnya masalah-masalah yang dijumpai saat ini membuat proses pemodelan menjadi semakin kompleks.
Sebagai bahan pertimbangan, gounescu (2011), menyarankan tahapan-tahapan sebagai berikut :
Identifikasi
Ekstimasi dan pencocokan
Pengujian
Penerapan praktis
Iterasi
Pohon keputusan
Pohon keputusan merupakan salah satu teknik terkenal dalam data mining karena merupakan salah satu metode yang popular dalam menentukan keputusan suatu kasus, akurasinya dalam pohon keputusan sangat baikasalkan data yang dijadikan patokan merupakan data yang akurat, metode ini banyak diterapkan dalam pendidikan, finansial, produksi, astronomi, hingga biologi.
Pohon keputusan merupakan teknik paling efisien, teknik registrasi sangat banyak tetapi paling terkenal adalah algoritma yang diperkenalkan prof. Breimann dengan istilah the clarifikation and registration tree (CART).
Algoritma C.45
Ada beberapa tahap untuk membat pohon keputusan dengan algoritma C.45 (kurnia, 2009) yaitu
Menyiapkan data trainer.
Data trainer di ambil dari data atau dokument yang tersimpan dan tersusun dalam kelas-kelas tertentu.
Menentukan akar pohon.
Akar dipilih dari atribut yang dipilih, dengan cara menghitung nilai gain dari masing-masing atribut, nilai tertinggi akan menjadi akar. Sebelum menghitung gain dari atribut, hitung dahulu nilai entropy. Untuk menghitung nilai entropy dengan rumus:
Keterangan :
S = himpunan kasus
N = Jumlah partisi
Pi = Proposi Si terhadap S
Menghitung nilai gain menggunakan rumus.
Keterangan :
S = Himpunan kasus
A = Fitur
N = Jumlah partisi atribut A
"Si" = proposi Si terhadap S
"S" = Jumlah kasus dalam S
Ulangi langkah ke dua hingga semua record terpartisi
Proses partisi berhenti jika :
Semua record dalam simpul N mendapat nilai kelas yang sama.
Tidak ada atribut dalam record yang dipartisi lagi.
Tidak ada record di dalam cabang yang kosong.
Pengelompokkan Data mining
Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat dilakukan, yaitu (Larose, 2005):
Deskripsi
Terkadang peneliti dan analis secara sederhana ingin mencoba mencari cara untuk menggambarkan pola dan kecenderungan yang terdapat dalam data.
Estimasi
Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih ke arah numerik daripada ke arah kategori. Model dibangun menggunakan record lengkap yang menyediakan nilai dari variabel target sebagai nilai prediksi. Selanjutnya, pada peninjauan berikutnya estimasi nilai dari variabel target dibuat berdasarkan nilai variabel prediksi.
Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada di masa mendatang. Beberapa metode dan teknik yang digunakan dalam klasifikasi dan estimasi dapat pula digunakan (untuk keadaan yang tepat) untuk prediksi.
Klasifikasi
Dalam klasifikasi, terdapat target variabel kategori. Sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan tinggi, pendapatan sedang, dan pendapatan rendah. Metode-metode yang telah dikembangkan oleh periset untuk menyelesaikan kasus klarifikasi. Metode-metode tersebut antara lain (sumathi, 2006) :
Pohon keputusan
Pengklarifikasian bayes
Jaringan syaraf tiruan.
Analisis statis
Algoritma ginetik
Rought sets
Pengklarifikasian k-nearst
Metode berbasis aturan
Memory based
Support vector machine.
Pengklusteran
Pengklusteran merupakan pengelompokkan record, pengamatan, atau memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan. Kluster adalah kumpulan record yang memiliki kemiripan satu dengan yang lainnya dan memiliki ketidakmiripan dengan record-record dalam cluster lain.
Asosiasi
Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul dalam satu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang belanja.
BAB III
IMPLEMENTASI DAN PENGUJIAN
3.2 Implementasi
implementasi sistem bertujuan untuk menerapkan modul-modul yang telah dikerjakan pada tahap perancangan, sehingga pengguna dapat memberikan masukan berupa kritik dan saran.
3.3 Implementasi Perangkat keras
Implemetasi aplikasi ini menggunakan perangkat keras berupa komputer ataupun berupa notebook dalam pembangunan aplikasi ini untuk menganalisis terjadinya pembatalan sepeda santai car fre day oleh faktor alam, implementasi ini menggunakan algoritma c4.5. berikut spesipikasi perangkat keras yang umumnya digunakan.
Procesor intel pentium coreI3
RAM 1GB.
Kapasitas HDD 250GB
Monitor LCD dengan resolusi 1024 x 768 pixels
3.4 Implementasi perangkat Lunak
Perangkat lunak yang digunakan dalam pembuatan aplikasi ini adalah
Operating system windows 7 32byt.
Weka Aplication
3.5 Imlementasi Antara Muka
Pada tahap ini dilakukan penerapan hasil perancangan perangkat lunak ke dalam sistem yang dibangun dan digunakan menggunakan perangkat lunak yang telah dijelaskan di subbab implementasi perangkat lunak.
Tampilan antar muka halaman awal aplikasi
Gambar III.3, Halaman Awal
Tampilan antar muka halaman menu utama aplikasi.
Gambar III.3, halaman menu utama
Tampilan antar muka halaman pengatur atribut
Gambar III.3, halaman pengatur atribut
Tampilan antar muka halaman output data text hasil.
Gambar III.3, halaman output data text
Tampilan antar muka halam utama pohon keputusan.
Gambar III.3, halaman pohon keputusan.
3.6 Pengujian
Pengujian dengan metode ini dengan metode blackbox, pengujian blackbox berfokus pada persyratan fungsional perangkat lunak.
3.7 Rencana pengujian
Rencana pengujian adalah pengujian terhadap fungsi-fungsi yang ada dalam sistem, apakah fungsi tersebut berfungsi sesuai yang diharapkan atau tidak. Rencana pengujian yang akan dilakukan dengan menguji sistem secara alpha dan beta.
Item Uji
Detail Pengujian
Jenis Uji
Pengaturan atribut
Pilih atribut yang akan digunakan
Pilih atribut Tujuan
Pengujian blackbox
Data kasus
Atribut yang muncul
Pengujian blackbox
Pembentukan pohon keputusan
Proses pembentukan Pohon Keputusan menggunakan Algoritma C4.
Pengujian blackbox
Uji data
Pengujian data hasil pohon keputusan
Pengujian blackbox
Pembentukan Aturan
Pembentukan daftar aturan hasil pohon keputusan.
Penyimpanan daftar aturan ke dalam format Excel
Pengujian blackbox
Table III.3, Rencana pengujian
3.8 Kesimpulan pengujian alpha
Berdasarkan hasil pengujian blackbox dapat diambil kesimpulan sebagai berikut :
Masih terjadinya kesalahan syntack yang terjadi karena beberapa proses belum maximal.
Secara fungsional sistem sudah menghasilkan output yang dihasilkan.
BAB IV
KESIMPULAN DAN SARAN
4.1 Kesimpulan
Dari hasil penelitian ini dapat ditarik kesimpulan sebagai berikut :
Algoritma C4.5 dapat digunakan untuk memudahkan dalam pengambilan keputusan dengan memproyeksikan datadata yang ada ke dalam bentuk pohon keputusan, berdasarkan nilai entropy dan gain yang dimiliki masing-masing atribut data.
Untuk hasil prediksi yang lebih akurat dibutuhkan data dalam jumlah besar, artinya semakin besar jumlah data yang digunakan maka semakin akurat hasil prediksi yang dihasilkan.
4.2 Saran
Dari hasil penelitian dan Kesimpulan diatas, penulis memberikan saran kepada pengembang algoritma C4. Yaitu
Hitunglah nilai masing-masing dengan teliti.
Data yang disediakan haruslah banyak dan menycukupi.
Gunakan algoritma C.45 sesuai kebutuhan.
DAFTAR PUSTAKA
[1] Ariadni, Ratih dan Arieshanti Isye, Implementasi Metode Pohon Keputusan untuk Klasifikasi Data Dengan Nilai Fitur yang tidak pasti. Surabaya.
[2] Bahri, Kusnassriyanto Saiful & Wawan Sjachriyanto. 2008. Teknik
[3] Berry, Michael J.A. dan Gordon S. Linoff. 2004. Data Mining Techniques for Data Mining. John Willey & Sons, Inc.
[4] Fayyad, Usama. 1996. Advances in Knowledge Discovery and Data Mining.
[5] Hanik, Umi. 2011. Fuzzy Decision Tree dengan Algoritma C4.5 pada Data Diabetes Indian Pima
[6] IT Professional. John Willey & Sons, Inc.
[7] Kristanto, Andri. 2008. Perancangan Sistem Informasi dan Aplikasinya.
[8] Kusrini dan Emha Taufiq Luthfi. 2009. Algoritma Data Mining. Penerbit Andi Offset, Yogyakarta.
[9] Larose, Daniel T. 2005. Discovering Knowledge in Data: An Introduction to Marketing, Sales, Customer Relationship Management. Second Edition. Wiley MIT Press.
[10] Pemrograman Delphi Edisi Revisi. Bandung: Informatika.
[11] Ponniah, P. 2001. Datawarehouse Fundamentals: A Comprehensive Guide for
[12] Pramudiono, I. 2006. Apa itu Data Mining? Dalam http://datamining.japati.net/cgi-bin/indodm.cgi. Diakses tanggal 26 oktober 2014. Publishing, Inc.
[13] Turban, E., dkk. 2005. Decision Support Systems and Intelligent Systems.
[14] Wahana Komputer. 2003. Tip dan Trik Pemrograman Delphi 7.0. Yogyakarta: Sunjana. Klasifikasi Data Nasabah sebuah Asuransi Menggunakan Algoritma C4.5 Seminar Nasional Aplikasi Teknologi Informasi 2010 (SNATI 2010).
21