IMPLEMENTASI DATA IMPLEMENTASI DATA MINING MINING DENGAN DENGAN METODE CLUSTERING UNTUK CLUSTERING UNTUK MELAKUKAN COMPETITIVE INTELLIGENCE PERUSAHAAN
Noor Rindho, Rindho, Suzuki Syofian Syofian Teknik Informatika , Universitas Universitas mercubuana
[email protected]
Abstract - Global economic crisis that began in last year make interfere in business world, it requires that a business manager to design smart strategies for business improvement efforts. One of the important points of that is the consumer. consumer. Consumers Consumers is one of the supporting supporting element element in the business can be more advanced or failed, failed, so the existence of the consumer in a business can’t be unimportant considered. A method can be needed to manage customer data, that can be used to dig up hidden information. This method is known as data mining. With the help of software, data mining will make the process of data analysis to find hidden patterns or rules in the scope of consumer data. On this essay, analysis of data mining is done by clustering methods that use the divisive hierarchical algorithm, which then translated in a software. The software, which will be used for grouping data based on consumer transactions, so that groups can be found - according to the level of consumer groups active transactions. Things have been done and what has not been done through this software development will be reviewed at the end of this essay.
Keywords: data mining, clustering clustering methods, divisive hierarchical algorithm
I.
D
PENDAHULUAN
unia unia bisni bisniss yang yang tergan terganggu ggu denga dengan n adanya adanya krisi krisiss ekonom ekonomii globa globall yang yang dimu dimulai lai sejak sejak akhir akhir tahun tahun kemarin, kemarin, menjadik menjadikan an seorang seorang manager manager bisnis bisnis harus harus pintar - pintar dalam merancang strategi bisnis untuk kemajuan usahanya. Salah satu poin penting yang tidak tidak boleh boleh dilup dilupaka akan n dalam dalam meran merancan cang g strate strategi gi bisnis adalah konsumen. Konsumen merupakan salah satu unsur penunjang suatu usaha atau bisnis bisa mengalami kemajuan ataupun kemunduran, kemunduran, sehingga dalam hal ini keberadaan konsumen tidak boleh dipandang dipandang dengan sebelah mata saja. saja. Untuk mengelola data konsumen ini, dibutuhkan sebuah metode yang bisa digunakan untuk menggali informasi – informasi tersembunyi dari data tersebut. Meto Metode de ters terseb ebut ut dike dikena nall deng dengan an data data mini mining ng . Dengan bantuan perangkat lunak, data mining akan melakukan melakukan proses proses analisa analisa data untuk untuk menemuka menemukan n pola atau aturan aturan tersembunyi dalam lingkup lingkup hinpunan data data kon konsum sumen en ters tersebu ebut. t. Pada Pada stud studii kasus kasus ini, ini, analisa data data mini mining ng dilak dilakuka ukan n dengan dengan meto metode de clustering yang yang mengu menguna nakan kan algor algoritm itmaa hirarki divisive yang kemudian diterjemahkan dalam sebuah perangkat lunak. Perangkat lunak ini, yang akan digu diguna naka kan n untu untuk k peng pengel elom ompo poka kan n kons konsum umen en berdasarkan data transaksi yang dilakukan, sehingga bisa didapatkan kelompok – kelompok konsumen menurut tingkat tingkat keaktifan transaksinya. transaksinya. Berdasarkan latar belakang masalah diatas, maka penulis tertarik
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
untuk untuk meneliti meneliti bidang ini dengan dengan mengamb mengambil il judul judul “Implementasi Data mining deng dengan an Meto Metode de Clustering Untuk Untuk Melak Melakuk ukan an Competitive Intelligence Intelligence Perusahaan”.
meli meliba batk tkan an basis asis data data lain lainny nyaa, yan yang kemudian kemudian akan diolah diolah berdasar berdasarkan kan prosesproses proses yang ada dalam dalam data mining. •
Kemiripan antar data dalam studi kasus ini diterjemahkan sebagai jarak kedekatan antar data dengan gan titik pusat, sehingga gga menghasilkan klaster-klaster customer yang sesuai dengan tujuan dari studi kasus ini.
•
Penggunaan meto metode de clus cluste teri ring ng untuk mengelompokan customer dengan menggunakan algoritma algoritma hirarki divisive divisive kmeans. means.
•
Sebagai prototype prototype sist sistem em,, stud studii kasu kasuss dila dilaku kuka kan n dito ditoko ko perh perhia iasa san n Bente enteng ng Jeweller Jewellery y yang yang beralam beralamat at di Mall Mall Pondok Pondok Inda Indah h 1 lt. lt. 1 blok blok K no. no. 29-A 29-A Jl. Jl. Metr Metro o Pondo Pondok k Indah Indah Blok Blok 3B Pondo Pondok k Pinan Pinang, g, Jakarta Selatan 12310.
•
Bahasa pemprograman yang digunakan pada studi studi kasus kasus ini ini adalah adalah PHP dan XAMPP XAMPP sebagai aplikasi basis data.
•
Aplikasi data data mining mining engine engine yang yang akan akan dibang dibangun un hanya hanya menam menampil pilkan kan data data hasil hasil penggelompokan customer saja customer saja yang berupa tabel tabel dan grafik grafik pengelom pengelompokan pokan customer tanpa memberikan keputusan apapun.
•
Aplikasi data data mining mining engine engine yang yang akan akan dibangun hanya bisa membentuk kelompokkelompok customer dari tingkat tingkat frekuensi frekuensi mere mereka ka mela melaku kuka kan n tran transa saks ksi, i, sehi sehing ngga ga seorang customer pada kelompok kelompok klaster klaster akt aktif belum elum bisa dip dipasti astika kan n bahw ahwa merek merekala alah h yang yang melaku melakukan kan pembay pembayara aran n terbesar.
A. Maksu Maksud d dan dan Tujua Tujuan n Penel Peneliti itian an Maksud Maksud dan tujuan dari peneliti penelitian an tugas tugas akhir akhir ini, ini, adalah: •
•
•
•
Menerapk Menerapkan an proses proses data data mini mining ng untuk pengolahan basis data customer dengan metode metode clustering clustering menggunakan algoritma hira hirark rkis is divi divisi sive ve k-means untuk mengelompokan customer . Penggunaan meto metode de clus cluster terin ing g dan algori algoritma tma hirark hirarkii divisive divisive k-means k-means untuk mengetahui kemiripan karakteristik karakteristik antar data dalam basis data customer berdasarkan customer berdasarkan transaksi yang dilakukan, guna membentuk kelompok – kelompok customer kelompok customer . Membangun Membangun sebuah sebuah aplikasi aplikasi data data mining mining yang dapat dapat membantu membantu mentran mentranform formasika asikan n basis data customer berdasarkan transaksi yang yang dilak dilakuka ukan n menja menjadi di infor informas masii yang yang berguna. Memanfaatkan Memanfaatkan aplikasi data mining untuk melakukan compe competi titi tive ve inte intell llig igen ence ce perusahaan guna pengelompokan pengelompokan customer .
B. Bata Batasa san n Masa Masala lah h Untuk Untuk menghind menghindari ari salah salah pengerti pengertian an dalam dalam penulisan tugas akhir ini dan untuk lebih menfokus menfokuskan kan terhadap terhadap permasal permasalahan ahan , maka maka fokus fokus permasalahan permasalahan dititik beratkan pada memanfaatkan memanfaatkan data mining dengan metode clustering menggunakan algo algori ritm tma a hira hirark rkii divi divisi sive ve untu untuk k mela melaku kuka kan n comp compet etit itiv ivee inte intell llig igen ence ce peru perusa saha haan an,, guna guna pengelompokan customer . Batasan perumusan masalah dalam penulisan studi kasus pada tugas akhir ini, meliputi: •
Competitive intelligence dalam dalam studi studi kasus kasus ini ini hanya anya sebatas atas untu untuk k melak lakukan ukan pengelompokan customer berdasarkan data tran transa saks ksii yang yang dil dilakuk akukan an saja saja tanp tanpaa melakukan melakukan proses proses competitive competitive intelligence intelligence
II. II. LAND LANDAS ASAN AN TEOR TEORII A. Data Mining Data mining merupakan merupakan sebuah analisa analisa dari dari obse observ rvas asii data data dalam dalam jumla jumlah h besa besarr unt untuk mene menemu muka kan n hub hubunga ungan n yan yang tida tidak k dike dikettahui ahui
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Clustering adalah salah satu teknik unsupervised teknik unsupervised learning dimana dimana kita tida tidak k perlu melat melatih ih metode metode ters terseb ebut ut atau atau deng dengan an kata kata lain lain,, tida tidak k ada ada fase learning. Tujuan dari metode clustering adalah untuk mengelompokkan sejumlah data atau objek kedalam klaster sehingga setiap klaster akan terisi data yang semirip mungkin (Budi Santosa, 2007). C. Algor Algoritm itmaa Hirar Hirarki ki Divi Divins nsive ive Langkah awal yang dilakukan dalam algoritma hirarki divisive adalah membentuk satu cluster besar yang yang dapat ditempati ditempati oleh oleh semua obyek data. data. Pada Pada langk langkah ah beri berikut kutnya nya,, satu satu cluster besar besar tersebu tersebutt dipisah dipisah – pisahkan pisahkan menjadi menjadi beberapa beberapa cluster yang lebih ebih keci ecil denga engan n karak rakter terist istik dat data yang yang mempunya mempunyaii lebih lebih besar besar kesamaan kesamaan satu dengan dengan yang lainnya, sehingga data yang tidak memiliki kemiripan yang cukup besar berada pada cluster yang cluster yang terpisah.
•
promosi maupun pemberian bonus atau diskon kepada setiap customer yang customer yang dimiliki dengan tepat. Terla Terlalu lu banya banyakny knyaa competitor usaha, sehingga diperlukan sebuah sistem yang bisa mendetek mendeteksi si berapa berapa jumlah jumlah customer yang aktif dan yang kurang aktif dalam bertransaksi bertransaksi sebagai sistem pendukung keputusan keputusan,, sehingga sehingga bisa digunaka digunakan n untuk untuk mera meranc ncan ang g sebu sebuah ah stra strate tegi gi bisn bisnis is yang yang efektif guna mempertahankan pangsa pasar dala dalam m pers persai aing ngan an deng dengan an competitor dite diteng ngan an kris krisis is ekon ekonom omii glob global al sepe sepert rtii sekarang ini.
Untuk Untuk gambaran gambaran sistem sistem pencari pencarian an data yang dilakukan selama ini dilakukan pada toko ini (gambar 3.1) adalah sebagai berikut:
III. III. ANALIS ANALISA A DAN PERANC PERANCANG ANGAN AN SISTEM SISTEM A. Peru Perumu musa san n Mas Masal alah ah Perumus Perumusan an masalah masalah merupaka merupakan n langkah langkah untuk mema memaham hamii perma permasal salaha ahan n terhad terhadap ap sistem sistem secara secara lebih ebih dala dalam m. Langka ngkah h ini diambi ambill unt untuk mendefin mendefinisika isikan n semua semua kebutuhan kebutuhan sistem sistem yang yang akan dibangun secara terperinci. terperinci.
1)
Analisa Permasalahan Permasalahan
Dalam kegiatan bisnis untuk mempertahankan mempertahankan area pemasaranya, toko Benteng jewellry mengalami beberapa permasalahan-permasalahan permasalahan-permasalahan yang menyangk menyangkut ut kebutuhan kebutuhan data dan informa informasi si tentang tentang customer , sehi sehing ngga ga untu untuk k mela melaku kuka kan n kegi kegiat atan an-kegia kegiatan tan promo promosi si demi demi memp mempert ertaha ahanka nkan n pangsa pangsa pasar agar tetap bisa bertahan ditengah krisis ekon konomi omi mengala galam mi beber eberap apaa masalah alahan an.. Permasalahan-permasalahan Permasalahan-permasalahan itu antara lain, yaitu: •
Sulitnya melakukan analisa pemasaran yang efekti efektiff karen karenaa tidak tidak adan adanya ya siste sistem m yang yang dapat dapat menya menyajik jikan an data data histor historis is sehin sehingga gga dapat dapat memberi memberikan kan output tentang tentang berapa berapa banyak jumlah customer yang dimiliki dan kelompok-kelompok customer yang yang aktif aktif maupun tidak menurut frekuensi transaksi transaksinya, nya, karena karena data yang ada masih masih berbentuk data manual dan belum
Gambar.1 Gambaran proses pencarian data customer selama ini pada benteng jewellry. 2) Peme Pemeca caha haan an Masa Masala lah h Berdasarkan latar belakang masalah diatas, maka dibutuhka dibutuhkan n sebuah sebuah sistem sistem yang mampu mampu mengelola mengelola data customer yang customer yang dapat memberikan output berupa output berupa jumlah customer secara keseluruhan dan kelompokkelompok customer yang yang menya menyatak takan an keakt keaktifa ifan n melakukan transaksi sehingga bisa digunakan untuk melakukan customer customer relationship relationship guna kelancar kelancaran an kegia kegiatan tan prom promosi osi untuk untuk memp mempert ertaha ahanka nkan n pangs pangsaa pasar sehingga toko ini bisa bertahan ditengah krisis ekonom ekonomii global global.. Atas Atas dasar dasar anali analiss diata diatas, s, maka penulis tertarik untuk meneliti bidang ini dengan meng mengam ambi bill judu judull “Implementasi Data mining dengan den gan Metode Metode Clustering Untuk Melakukan Melakukan guna Comp Competi etitiv tivee Intel Intellig ligenc encee Perusahaan” pengelompokan customer .
B. Anali Analisa sa Kebut Kebutuha uhan n Sis Sistem tem Analisa Analisa kebutuhan kebutuhan sistem sistem berfungs berfungsii untuk untuk mendefin mendefinisika isikan n kebutuhan kebutuhan-kebut -kebutuhan uhan sistem sistem yang
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Analisa data akan mengidentifikasikan mengidentifikasikan kebutuhan data yang sesuai dengan ketentuan yang diperlukan sistem dari data yang tidak lengkap dan inkonsisten yang yang biasa biasanya nya terjad terjadii pada pada basi basiss data data yang yang ada. ada. Analisa ini meliputi: Analisa target data. Proses data cleaning (pembersihan cleaning (pembersihan data). • Proses data integration (integrasi data). • Proses data selecti data selection on (pemilihan data). • Proses data transformasi (pembentukan data prosesing). Analisa Analisa kebutuhan kebutuhan data input, input, proses proses dan output.
Validasi User <
>
Longin
<>
Koneksi Data Keserver
<>
Form Selamat Datang
•
•
<>
View Data Normal
<>
Tabel Detail Transaksi
Tabel Barang
View Data Frekuensi
2) Anal Analis isaa Keb Kebutuh utuhan an Peran erangk gkat at Kera Kerass dan dan Perangkat Lunak
Dalam Dalam perancan perancangan gan sistem sistem ini, metode yang yang digu diguna naka kan n adal adalah ah meto metode de pera peranc ncan angan gan sist sistem em berorientasi berorientasi objek dengan (Object Oriented Analysis) Analysis) dengan menggunakan Unified Unified Modelling Modelling Language Language (UML (UML). ). Sebag ebagai ai gamb gambar aran an sist sistem em yang yang akan akan dibangun, adalah sebagia berikut :
Tabel Transaksi
Manager
Klaster
C. Pera Peranc ncan anga gan n Sis Siste tem m
<>
<>
•
Analisa Analisa ini mendeskr mendeskripsi ipsikan kan perangkat perangkat yang dibutuhkan dalam pembangunan sistem yang terdiri dari komponen perangkat keras dan perangkat lunak. Komponen Komponen perangka perangkatt keras keras yang yang dibutuhka dibutuhkan n oleh sistem sistem adalah adalah sebuah sebuah pc atau workstation dengan spesifikasi minimal, sebagai berikut: Hardware Hardware : • Processor Processor intel Pentium Pentium IV atau lebih, RAM 512 atau lebih, HDD 80GB, VGA 12 MB shared, CD-RW/ DVD-RW. Software : • Operat atin ing g syst system em : windows Oper 98/2000/XP XAMPP-win32-1.6.7 XAMPP-win32-1.6.7 web browser : Ms. Internet Explrer Explrer , Mozilla Mozilla Firefox Firefox 3.0
Tabel Customer
<>
Menampilkan <> Jumlah Klaster & Titik Pusat awal
Hasil Klaster
Exit
Gambar.2 Usecase diagram sistem yang akan dibangun IV. IMPLEMENTASI DAN ANALISA HASIL Dalam bab implementasi dan analisa hasil, akan dijelask dijelaskan an tentang tentang pembangun pembangunan an perangkat perangkat lunak lunak yang yang tela telah h dira diranc ncan ang g seb sebelum elumny nyaa pada pada bab sebel ebelum umn nya yaitu itu bab tenta entan ng analis alisaa dan dan peancangan. Implementasi Implementasi dari perancangan pembangunan perangkat lunak dalam studi kasus ini, meliputi: A.
Imple Impleme menta ntasi si Bas Basis is Data Data
Dalam studi kasus ini, sistem basis data yang digunaka digunakan n adalah adalah ApacheFriend ApacheFriendss XAMPP XAMPP versi versi 1.6.7. Karena basis basis data awal dalam dalam studi kasus ini yang yang dimi dimili liki ki beru berupa pa basi basiss data data dala dalam m bent bentuk uk manual, maka pembentukan basis data dalam studi kasus ini dibuat melalui pembangunan basis data baru dengan dengan melak melakuka ukan n pemben pembentuk tukan an tiap tiap tabel tabel yang yang diperlukan dan pengisian data dengan cara input data satu satu persa persatu tu kedala kedalam m sistem sistem basis basis data data yang yang ada ada diaplikasi ApacheFrien ApacheFriends ds XAMPP bukan melalui proses export dan export dan import data import data.. Adapun proses pembangunan basis data yang sesuai dengan perangkat lunak yang akan dibangun adalah sebagai berikut: Melakuka Melakukan n pembent pembentukan ukan basis basis data baru, baru, • yaitu basis data clustering .
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
•
ini kecuali tabel frekuensi yang merupakan tabel proses dalam studi ini. Melakukan Melakukan pengisia pengisian n tabel tabel frekuens frekuensii yang yang merupakan merupakan data proses proses dalam dalam studi studi kasus kasus ini, ini, dengan gan melak elakuk ukan an pemb embaca acaan id_customer yang ada dalam tabel transaksi berdasarkan id_customer yang yang ada ditabel customer yang customer yang dilakukan oleh sistem secara langsung.
B. Impl Implem emen enta tasi si Fun Fungs gsii Pembang Pembangunan unan perangkat perangkat lunak lunak data mining mining dengan dengan metode metode clustering menggunakan algoritma hirark hirarkii divisi divisive ve untuk untuk pengelom pengelompokan pokan customer dalam studi kasus ini, fungsi – fungsi yang dipakai adalah fungsi untuk menentukan titik-titik pusat yang berguna sebagai pusat-pusat kelompok customer. Fungsi Fungsi - fungsi fungsi terse tersebut but adala adalah h sebaga sebagaii beriku berikutt (santosa, 2007): 1)
Lanngkah I
Fungsi untuk menentukan titik pusat awal dari semua data customer yang customer yang ada berdasarkan transaksi yang dilakukan menggunakan perhitungan nilai ratarata (mean (mean)) dari semua data yang ada dalam tabel frekuens frekuensii transaksi transaksi.. Pada Pada langkah langkah ini digunaka digunakan n perhitungan nilai rata-rata (mean) mean) kare karena na untu untuk k menganti mengantisipas sipasii adanya adanya nilai nilai outline (nila (nilaii yang yang letaknya sangat jauh dari data yang ada) dari data yang ada dalam dalam tabel frekuensi. frekuensi. Contoh perhitungan perhitungan lang langka kah h I dari dari sample data data frekue frekuens nsii trans transaks aksii customer (tabel customer (tabel 1), adalah sebagai berikut: Tabel.1 Tabel data frekuensi
Dari contoh data frekuensi diatas, maka kemudian diurut diurutkan kan dari dari freku frekuens ensii palin paling g kecil kecil sampa sampaii ke frekuensi terbesarnya, yaitu sebagai berikut: Data frekuensinya frekuensinya :0,0,0,0,0,0,0,0,0,1,1,1,1, :0,0,0,0,0,0,0,0,0,1,1,1,1, 1,1,1,2, 1,1,1,2,2,2,4 2,2,4,5,5 ,5,5,6,7, ,6,7,11,1 11,11,15. 1,15. Maka Maka perhitun perhitungan gan pada langkan I ini ini adalah sebagai sebagai berikut: Perh Perhit itun unga gan n nila nilaii rata rata-ra -rata ta (mean) mean) dari • semua nilai yang ada pada tabel frekuensi. 0+0+0+0+0+0+0+0+0+1+1+1+1+1+ 1+1+2+2+2+4+5+5+6+7+11+11+15/30 2.56666666667. Perhitungan titik pusat 1 nilai frekuensi terkecil + nilai mean dari semua data data tabel frekuensi/ frekuensi/ 2 0+2.56666666667/2 1.283333333333. Perhitungan titik pusat 2 menggunakan hasil perhitungan nilai ratarata (mean (mean)) dari semua nilai yang ada pada tabel frekuensi. 2.56666666667. •
•
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Maka Maka hasil hasil titik titik pusat pusat dari dari langka langkah h I ini ini adalah : pusat 1 = 1.283333333335 1.283333333335 Titik pusat Titik pusat 2 = 2.56666666667 Titik pusat 3 = 8.78333333333 Setelah pencarian titik pusat klaster pada langkah 1 diket diketahu ahuii hasil hasilnya nya,, kemudi kemudian an titik titik – titik titik pusat pusat terseb tersebut ut digun digunaka akan n untuk untuk menar menarik ik anggo anggota ta dari dari semu semuaa nila nilaii data data yang yang ada ada pada pada tabe tabell frek frekue uens nsii dengan dengan mengg mengguna unakan kan sistem sistem perhit perhitung ungan an jarak jarak kedekata kedekatan n setiap setiap data dengan dengan masing-ma masing-masing sing titik titik pusat tersebut. Perhitungan Perhitungan jarak kedekatan dalam langkah 1 ini ditentukan dengan perhitungan selisih antar titik pusat dibagi 2, kemudian hasil selisih titik pusat tersebut ditambahkan pada titik pusat yang lebih lebih kecil kecil dan dikurangkan dikurangkan dengan titik titik pusat pusat yg lebih lebih besarnya, besarnya, sehingga sehingga bisa diambil diambil kesimpul kesimpulan an bahwa data-data yang berada dalam rentang titik pusat tersebut tersebut merupakan anggotanya. anggotanya. Contoh: Untuk menentukan anggota cluster dari titik pusat 2, meliputi meliputi : Perhitungan rentang terendah : 2.576666666667 - 1.283333333335 / 2 = 0.646666666666. Maka titik terendah dari titik pusat 2 adalah 2.566666 2.56666666667 66667 - 0.6466666 0.646666666666 66666 = 1.920 Perhitungan rentang tertinggi: 8.783333333 8.78333333333 33 - 2.56666666 2.56666666667 667 / 2 = 3.10833333333 Maka titik tertinggi dari titik pusat 2 adalah 2.56666666667 + 3.10833333333 = 5.675 Sehingga anggota cluster dari titik pusat 2 • bisa diambil dari rentang titik frekuensi data : 1.920 ≤ anggota cluster titik pusat 2 < 5.675
Dari data diatas, untuk menghitung nilai titik pusat 1 pada langkah langkah 2 diguna digunakan kan perhit perhitung ungan an dengan dengan langk langkah ah sebagai berikut: a. Juml Jumlah ahka kan n semu semuaa item item data data yang yang ada pada klaster 1 pada langkah I Num=[0,0,0,0,0,0,0,0,0,1,1 Num=[0,0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,2,2 ,1,1,1,1,1,2,2 ,2] = 19 item b. Kemudian melakukan perhitungan titik titik pusat pusat mengguna menggunakan kan perhitung perhitungan an median (nilai (nilai tengah) tengah) untuk untuk mengecek mengecek titik pusat pada langkah 1 Jika Nilai sisa bagi = 19mod2 = 1 Karena sisa bagi dari total item 1, maka perhitungan titik titik pusat = ((19/2) +((19/2)-1)/2 +((19/2)-1)/2 = 9 nilai tengahnya berada diantara item ke – 9 yang dibaca dari awal data dan akhir data dari dari anggo anggota ta klast klaster er 1 pada langka I =[0,0,0,0,0,0,0,0,0|1 =[0,0,0,0,0,0,0,0,0|1|1,1,1,1,1,1,2,2,2] Jadi nilai titik pusat satu pada langkah II adalah 1. Kemudian titik pusat satu pada langkah II ini dibandingkan dibandingkan dengan titik pusat pusat satu pada langkah I, dimana nilai 1 ≠ 1.2833333 1.283333333335 33335 sehingga sehingga bisa ditarik ditarik kesim kesimpul pulan an bahwa bahwa titik titik pusat pusat masih masih berubah.
•
•
•
2) Langkah II II Setelah klaster-klaster pada langkah 1 terbentuk, maka pada langkah 2 ini dilakukan pengecekan ulang perhitungan titik pusat setiap klaster dengan menggunakan perhitungan nilai median (perhitungan nilai tengah). Pemakaian Pemakaian perhitungan perhitungan nilai median karena karena semua semua data yang ada sudah diketahui diketahui pada lang langka kah h 1, sehi sehing ngga ga tida tidak k ada ada kekh kekhaw awat atir iran an munculnya data outline. outline. Contoh Contoh perh perhitung itungan an pada pada langkah langkah 2 berdasar berdasarkan kan semua data yang yang ada pada halis langkah langkah I adalah sebagai berikut: berikut:
•
Titik pusat 2 Anggota klaster ini pada langkah I adalah : 4,5,5 Dari data diatas, titik pusat 2 pada langkah II ini dihitung dengan cara sebagai berikut: a. Juml Jumlah ahka kan n semu semuaa item item data data yang yang ada pada klaster 1 pada langkah I Num = [4,5,5] [4,5,5] = 3 item b. Kemudian melakukan perhitungan titik titik pusat pusat mengguna menggunakan kan perhitung perhitungan an median (nilai (nilai tengah) tengah) untuk untuk mengecek mengecek titik pusat pada langkah 1 Jika Nilai sisa bagi = 3 mod 2 = 1 Karen Karenaa sisa sisa bagi bagi dari dari total total item 1, maka maka perhitungan titik titik pusat = ((3/2) +((3/2)-1)/2 = 1 nilai tengahnya berada diantara item ke – 1 yang dibaca dari awal data dan akhir data dari anggota klaster 2 pada langka I = [5|5 [5| 5|5]
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
sehingga bisa ditarik kesimpulan bahwa titik pusat masih berubah. berubah.
Titik pusat 3 Anggo Anggota ta clust cluster er pada pada langka langkah h I adala adalah h : 6,7,11,11,15 Dari data diatas, titik pusat 3 pada langkah II ini dihitung dengan cara sebagai berikut: a. Juml Jumlah ahka kan n sem semua item item data data yang yang ada pada klaster 1 pada langkah I Num = [6,7,11,11,15] [6,7,11,11,15] = 5 item item b. Kemudian melakukan perhitungan titik titik pusat pusat mengguna menggunakan kan perhitung perhitungan an median (nilai (nilai tengah) tengah) untuk untuk mengecek mengecek titik pusat pada langkah 1 Jika Nilai sisa bagi = 5 mod 2 = 1 Karena sisa bagi dari total item 1, maka perhitungan titik titik pusat = ((5/2) +((5/2)-1)/2 = 2 nilai tengahnya berada diantara item ke – 2 yang dibaca dari awal data dan akhir data dari dari anggo anggota ta klast klaster er 3 pada langka I = [6,7|11| [6,7|11|11,15] 11,15] Jadi nilai titik pusat satu pada langkah II adalah 11. Kemudian Kemudian titik titik pusat pusat tiga pada langkah langkah II ini dibandingkan dengan titik pusat tiga pada langkah I, dimana nilai 11 ≠ 8.78333333333 sehingga bisa ditarik kesimpulan bahwa titik pusat masih berubah. berubah. Karena Karena hasil hasil titik titik pusat pusat pada langkah langkah dua ini masih masih berub berubaa maka maka dilak dilakukan ukan perhitung perhitungan an jara jarak k rentang rentang anggota anggota masing masing – masing masing cluster, cluster, sebagai sebagai penentu suatu nilai data masuk pada tiap-tiap klaster yang jarak titik pusatnya paling dekat dengan data. Contoh perhitungan jarak rentang antar data adalah, •
•
Titik pusat 3 Rentang titik pusat 3 = titik pusat 3 – titik pusat 2 / 2 = 11 11 – 5 / 2 = 3 Maka rentang anggota titik pusat 3 = 11 – 3 = 8 data frekuensi bernilai 8 ≤ anggota klaster 3 pada langkah II
3) Langkah 3 Fungsi yang digunakan pada langkah ini, sama seperti fungsi yang digunakan pada langkah II, yaitu penggunaan perhitungan nilai tengan (median). median). Fungsi dalam langkah ini digunakan untuk mengecek apakah titik pusat klaster yang telah terbentuk pada langkah langkah sebelumn sebelumnya ya sudah sudah tidak tidak berubah berubah lagi atau tidak, dengan cara membandingkan membandingkan hasil perhitungan titik pusat langkah ini dengan langkah sebelumnya. Apabila titik pusat tersebut sudah tidak berubah maka pembentukan klaster customer sudah selesai. Tetapi apabila apabila titik titik pusat pusat masih masih berubah berubah maka maka dilakukan dilakukan perhitungan ulang seperti pada langkah II, perhitungan ini akan terus berulang berulang sampai titik pusat cluster tidak berubah lagi. C. Impl Implem emen enta tasi si Sis Siste tem m Dalam Dalam studi studi kasus kasus ini, ini, sistem sistem yang dibangun merup merupaka akan n sebuah sebuah perang perangkat kat lunak lunak data data mining mining dengan dengan metode metode clustering menggunakan algoritma hirarki devisive. devisive. Perangka Perangkatt lunak lunak ini berisi berisi form form tampila tampilan n basis basis data yang telah telah dinormal dinormalisas isasi, i, form tampila tampilan n untuk untuk data frekuens frekuensii transaksi transaksi dan form tamp tampil ilan an dari dari hasi hasill peng pengel elom ompo poka kan n data data customer menjadi customer menjadi beberapa beberapa klaster. klaster. Perangkat lunak lunak ini berfungsi untuk mencari pola-pola yang menarik dari basis data yang berupa nilai frekuensi transaksi untuk mengelompokan customer . Softwar Softwaree yang yang digunaka digunakan n untuk untuk membangun membangun perangkat lunak ini adalah kode program PHP deng dengan an ser server ver basi basiss data data XAMMP XAMMP . Untuk njal njal ka ku de ak
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Adapun form–fo Adapun form–form rm atau halaman–halaman utama yang menjadi isi dari perangkat lunak atau aplikasi ini, adalah sebagai berikut: Halaman longin. longin. • Halaman menu utama dan view data normal. • Halaman view data frekuensi. • Halaman klaster •
D. Peng Penguj ujia ian n Sist Sistem em Pengujia Pengujian n sistem sistem digunakan digunakan untuk untuk mengecek mengecek performan sistem ketika seorang user dalam hal ini manag manager er menjal menjalank ankan an sistem sistem Pengu Pengujia jian n ini, ini, meliputi: •
Pengujian hak akses atau longin. longin.
•
Pengujian pembentukan klaster berdasarkan data. V.KESIMPULAN DAN SARAN
A. Kesimpulan Berdasarkan studi kasus yang telah dilakukan, mulai mulai dari dari tahap tahap studi studi pustak pustaka, a, studi studi obser observas vasi, i, perancancangan perancancangan dan implementasi implementasi sistem, maka dari hasil yang didapatkan bisa ditarik kesimpulan sebagai berikut: 1) Metode clustering dengan algoritma hirarki divisive bisa digunakan digunakan untuk untuk melakukan melakukan pengelompokan customer guna competitive intelegent bisnis intelegent bisnis perusahaan. frekuensi transaksi seorang 2) Informasi dari frekuensi customer bisa customer bisa digunakan untuk membangun sebuah sistem yang dapat mentranformasikan mentranformasikan data customer menjadi informas informasii yang yang berguna berguna untuk melakukan melakukan etiti etiti inte inteleg legent ent bisnis
Untuk melaku melakukan kan pemben pembentuk tukan an sebuah sebuah 5) Untuk cluster dibutuhka dibutuhkan n sebuah sebuah titik titik pusat pusat yang bisa dicari dari seluruh data yang ada dalam tabel frekuensi transaksi dengan melakukan metode metode perhitung perhitungan an nilai nilai rata rata rata (mean ( mean)) ataupun perhitungan nilai tengah (median (median). ). Aplikasi asi teta tetap p bisa bisa berjal berjalan an baik baik ketika ketika 6) Aplik dijalan dijalankan kan pada tiga web browser browser yang internet et explore explorer, r, mozill mozilla a berbeda, yaitu intern firefox firefox dan flock flock web web browser. browser. 7) Hasil dari aplikasi ini bisa dijadikan sebagai pendukung keputusan oleh manager terhadap cust custom omer er – cust custom omer er yang dimi dimili liki kiny nya. a. Misa Misaln lnya ya pend penduk ukun ung g keputu keputusa san n untuk untuk meni meningk ngkatk atkan an promo promosi si kebeberapa customer yang berada diklaster kurang aktif dan sedang ataupun keputusan untu untuk k memb member erik ikan an fasi fasili lita tass yang yang lebi lebih h exclusive maupu maupun n pember pemberian ian bonus bonus atau atau diskon diskon kepada kepada customer yang yang bera berada da di klaster yang aktif.
C. Saran Beri Berikut kut adala adalah h saran saran yang yang mungk mungkin in perlu perlu dilakukan dalam pengembangan selanjutnya dimasa data mining mining yang yang akan akan datan datang g terhad terhadap ap aplik aplikasi asi data dengan dengan metode metode clustering menggunakan algoritma hirarki divisive k-means ini nantinya. yang akan datang dalam 1) Dimasa pengembangan selanjutnya, guna lebih memaksimalkan pendukung keputusan yang akan diambil, diambil, misalkan misalkan untuk kepentinga kepentingan n memu memuda dahk hkan an kegi kegiat atan an prom promos osii bisa isa ditambahkan sebuah fasilitas berupa fasilitah pengiriman email email kepada customer . 2) Dalam studi kasus ini, item yang digunakan
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
yang dibentuk tidak hanya tiga klaster tapi mungkin lebih dari pada itu dan informasi yang didapatkanpun menjadi lebih banyak. 3) Dala Dalam m stud studii kasu kasuss ini, ini, algo algori ritm tmaa yang yang digunakan adalah algoritma hirarki divisive yang yang berf berfun ungs gsii untu untuk k memb membagi agi sebu sebuah ah cluster besar cluster besar menjadi beberapa cluster kecil, cluster kecil, dalam pengem gembangan gan selanjut jutnya dimungkin dimungkinkan kan menggunak menggunakan an metode metode yang yang lain, separti : Metode mark market et bask baskel el anal analis isis is • sehingga sehingga bisa bisa diketahu diketahuii pola-pol pola-polaa lain seperti seperti barang apa saja yang yang menjadi menjadi favorit customer dalam customer dalam sebuah cluster. Peng Penggun gunaa aan n algo algori ritm tmaa apri aprior orii • untu untuk k meng mengan anal alis isaa kece kecend ndru rung ngan an seorang customer dalam dalam melakuka melakukan n tran transa saks ksi, i, misa misaln lnya ya untu untuk k mene meneli liti ti tangg tanggal al berap berapaka akah h biasa biasanya nya seoran seorang g customer mela melaku kuka kan n tran transa saks ksii pembelian dan barang apa saja yang biasa mereka beli sehingga manager bisa menyusun strategi lain dalam pemasaranya. pemasaranya. DAFTAR PUSTAKA
[1] Budi udi
Santo antossa, “ Data Mining: Mining: Teknik Teknik Pemanfaatan Pemanfaatan Data Data Untuk Untuk Keperluan Keperluan Bisnis” Bisnis”,, Graha Ilmu, Yogyakarta, 2007. [2] David Hand, Heikki Mannila dan Padhraic Smyt Smyth, h, “ Principles Principles of data mining” mining”,, A Bradford book The MIT Press, Cambridge, Massachusetts London England, 2001. “UML for the IT Business [3] Howard podeswa, “UML Analyst: Analyst: A Practical Practical Guide to ObjectObjectOrien riente ted d Requ Requiirem rements ents Gathe atheri ring ng ”, Thomson Course Technology PTR, 2005.
[9] Iko
pramudiono, “ proses data mining ”,http://datamining.japati.net/ , posted on 17/08/2006 07.57pm. [10] Jerry Jerry Peter Peter “ XAMPP: XAMPP: Paket Paket Apache, Apache, PHP dan MySQL MySQL Instant Instant ”, ”, ilmu komputer.com, komputer.com, 2007. [11] Laboratoriun Data Mining, “ Modul 11 – Clustering, Fakultas Teknik Industri”, Industri” , UII, komunikasi pribadi. [12] Triswansyah Yuliano “ pengena “ pengenalan lan PHP ”, ”, ilmu computer.com, 2007. -oo0oo-