Self-organizing map (SOM) untuk analisis cluster dalam diagnosa di agnosa multi-penyakit ABSTRAK Dengan tujuan diagnosa multi-penyakit, self-organizing map (SOM) dikembangkan. Dalam tulisan ini, ciri-ciri penyakit tomat diekstrak dan pemetaan hubungan antara penyakit dan ciri-cirinya dibuat. Pengelompokan tidak akurat dari algoritma SOM tradisional dianalisis. Menurut analisis, Jarak Euclid diambil sebagai pemisah utama dan algoritma pencarian yang berdekatan dioptimalkan. Penggunaan algoritma yang dioptimalkan, hasil cluster dari sampel input diperoleh, ciri-ciri penyakit dipetakan, dan model diagnosa multi penyakit Dikembangkan. Model yang diusulkan berbasis SOM memiliki dua layer. Susunan ciri-ciri penyakit dapat diurutkan secara akurat dan cepat dan dikelompokkan menggunakan model ini. Model ini dapat mencapai diagnosa multi-penyakit yang akurat. Hasil simulasi menunjukkan bahwan model yang diajukan berkinerja dengan baik dan diagnosa multi penyakit yang diajukan pun efektif.
PENGANTAR Diagnosa adalah suatu aplikasi penting dari kecerdasan buatan (artificial ( artificial intelligence). intelligence). Hal ini umum bahwa multi-penyakit terjadi secara bersamaan dalam penyakit pertanian, penyakit manusia, dan bidang kerusakan mesin. Suatu penyakit bisa disebabkan karena berbagai alasan, alasan, dan
satu alasan juga dapat menyebabkan menyebabkan banyak penyakit. Dengan
demikian, ada kebutuhan untuk membentuk suatu multiple-to-multiple map. map. Karena penyakit yang berbeda dan ciri-ciri bentuk agregasi atau daerah yang berbeda pula maka diagnosa multi penyakit menjadi semakin rumit. Pengambilan diagnosa penyakit pertanian sebagai contoh, saat ini diagnosa biasanya didasarkan pada jaringan saraf (neural ( neural network ) dan sistem ahli cerdas (intelligent (intelligent experts systems), systems), yang terutama mengatasi dengan deskripsi diagnosa single penyakit dan metode diagnosa cerdas (Chai & Qin, 2003). Karena karakter pohon biner ( binary tree) tree) dari information-searching tree tree dalam intelligent experts systems sample-training sample-training dalam
dan cognizant-standardcognizant-standard-
Neural Network , yang terutama sesuai untuk diagnosa single
penyakit. Tapi hal tersebut tidak dapat mengatasi karakter gejala penyakit kompleks. Selalu ada perbedaan antara hasil diagnostik dengan keadaan nyata (Gustafsson & Paplinski, 2004, Wang, Qu, Liu, & Cheng, 2004; Wu & Chow, 2004). Hasil penelitian (Aras, Altınel, & Oommen, 2003; Chou, Cheng, & Chang, 2007; Gil, Johnsson, Chamizo, Soriano, & Ruiz, 2009, Kohonen, 1982, 1990, 2001; Varsta, Heikkonen, Lampinen, & Millan, 2001) menunjukkan bahwa jaringan self-organizing map ( SOM) SOM) adalah jaringan saraf kompetitif dan kooperatif yang dapat menampung vektor input dari struktur topologi dan peta data jaringan berdimensi tinggi ke yang lebih rendah, kemudian membentuk peta topologi (Samsonova, Kok, & IJzerman, 2006; Tu, Yan, & Qian, 2006; Yang, 2006). Karena tertata dengan baik, hubungan di dalam ciri-ciri input data dan pemetaan diketahui, yang menawarkan metode terkenal untuk hubungan inheren
antara input dan output (Han & Kamber, 2001; Zhong, Shi, & Dia, 2005). Dengan model input ini, suatu ekspresi inheren terbentuk dan akhirnya dipetakan ke layer output. Algoritma ini terutama digunakan dalam analisis pengelompokan yang berarti untuk memperkuat objek sesuai dan membatasi yang tidak cocok (Li, Fu, & Duan, 2003; Turkoglu, Arslan, & Ilkay, 2002; Yan, Jiang, Zheng, Peng, & Li, 2006), kemudian susun beberapa grup pengelompokkan (clustering). Hal ini terbukti telah menimbulkan hasil yang lebih baik dalam diagnosa single penyakit sejak kemunculannya (Gorzalczany & Rudzinski, 2006; Torre & Kanade, 2006). Jaringan saraf pengelompokkan, termasuk SOM harus diterapkan untuk diagnosa penyakit. Iatrical scholar , misalnya, menggunakan teknik SOM dan teori himpunan untuk menemukan kecenderungan kondisi pasien penderita penyakit kardiovaskular secara individual (Chou et al, 2007). Pada instansi lainnya, jaringan saraf pengelompokkan yang lain misalnya, jaringan Learning Vector Quantization (LVQ) berhasil digunakan dalam klasifikasi dari dataset penyakit tiroid untuk memperoleh diagnosa (Temurtas, 2007). Dan satu organisasi iatrical menggunakan Complementary Learning Fuzzy Neural Network (CLFNN) untuk mengklasifikasikan proses penyakit kanker payudara (Tan, Quek, Ng, & Ng, 2007). Menurut kasus ini, jaringan dianggap memiliki klasifikasi atau kinerja pengelompokkan yang baik dalam diagnosa single penyakit. Di sisi lain, Angeli (2008) menunjukkan bahwa: ''Hal ini umumnya diterima bahwa telah terjadi peningkatan minat dalam deteksi kesalahan online dan teknik diagnosa untuk proses teknis selama beberapa tahun terakhir. Teknik-teknik ini berasal dari bidang kecerdasan buatan atau gabungan metode numerik klasik dengan metode kecerdasan buatan". Sehingga perkembangan dan peningkatan sistem diagnosa penyakit diharapkan. Dalam tulisan ini, model diagnosa jaringan SOM dua-level diusulkan, dan system pemetaan sifat penyakit dikembangkan, yang menempatkan self-organized, kompetitif, dan clustering dan kuantitatif kesalahan untuk penilaian dan penyimpulan antara penyakit dan ciri-cirinya. Perbandingan dan klasifikasi yang diambil adalah penyakit, kumpulan kelompok ciri-ciri gejala sampel penyakit, dan kumpulan kelompok ciri-ciri gejala penyakit yang nyata. Dengan pengecualian dari kelas tidak cocok, pencarian kombinasi ciri-ciri penyakit nyata akan mendapatkan kelas yang lebih baik dan mencapai diagnosa beberapa penyakit. Penyakit Tomat diambil sebagai contoh untuk studi simulasi.
2. Model yang diusulkan untuk diagnosa multi-penyakit Diagnosa penyakit pertanian didasarkan pada kondisi pertumbuhan tanaman abnormal yang berarti suatu penyakit dikenali oleh gejala penyakit. Karena tomat rentan terhadap beberapa penyakit (Lv, 2000), terutama dalam lingkungan tumbuh abnormal maka digunakan sebagai contoh dalam penelitian ini.
2.1. Deskripsi ciri-ciri penyakit dan penyakit
Gunakan gejala dari analisis sebagai bukti diagnosa. (Suatu penyakit tomat dapat menunjukkan gejala yang berbeda dalam posisi yang berbeda. Supaya dapat diklasifikasikan dengan baik, penyakit dalam posisi yang berbeda dianggap sebagai yang berbeda. Tulisan ini hanya membahas penyakit dengan gejala yang jelas dan dapat dengan mudah dibedakan, dengan total sebanyak 88). Ciri-ciri dari masing-masing penyakit diklasifikasikan. Mengingat ciri-ciri dinamis dalam pertumbuhan, kelas gejala didefinisikan. Ambil posisi (akar, berbonggol, daun, buah, bibit dan tanaman) sebagai karakter klasifikasi utama. Posisi (bagian) penyakit: akar p1, berbonggol p2, daun p3, bunga p4, buah p5, dan tanaman p6:
bagian (p1, p2,…, p6).
(1)
Gejala: menyaring ciri-ciri dari penyakit tomat. Notasikan berbagai gejala penyakit dalam posisi yang berbeda dengan sn. Sebagai contoh, stand s 5 untuk bercak coklat, stand s19 untuk berbedak putih, s 72 untuk layu, dll. Nama Penyakit (penyakit): tomato damping-off (bibit) d1, drooping (bibit) d2 , early blight (daun) d18, gray mold (batang) d50, low-temperature unjury (tanaman individual) dn-1, cracking fruit dan sunscald dn, dll. Deskripsi penyakit (des): deskripsi posisi dan gejala suatu penyakit , dimana isinya adalah agregasi dari upper two (m adalah jumlah ciri-ciri dalam penyakit): des =
}
(2)
Menurut definisi, suatu klasifikasi penyakit dapat diekspresikan. Sebagai contoh, penyakit dapat digambarkan sebagai berikut: Awalnya terdapat bercak kecil dan hitam di daun. Kemudian, rentang menjadi bercak coklat melingkar, memiliki cincin hijau atau kuning dengan konsentris roda di pusat (Lv, 2000). Deskripsi ciri-ciri diberikan sebagai: des =
}
(3)
Ciri-ciri dari penyakit melalui (3) dijelaskan. Ketika deskripsi dalam (3) sesuai dengan gejala beberapa penyakit, penyakit d y dipetakan ke dalam deskripsi des. Ciri-ciri penyakit mendefinisikan bagian diagnostik utama dalam model ini. 2.2. Algoritma diagnosa Neural Network SOM dianggap sebagai salah satu jaringan syaraf yang disukai untuk analisis pengelompokkan. Titik kunci dari algoritma SOM adalah dengan perhitungan geometri sederhana, dimana karakter kompleks dan efek samping dari aturan Hebb. Pada jaringan SOM, karakter pemetaan adalah terurut secara topolgi dan pemilihan karakter. Pengurutan secara topologi berarti posisi ruang neuron dalam jaringan dipetakan dari karakter atau beberapa wilayah
sampel input. Pemilihan karakter berarti bahwa ketika suatu data
diberikan di ruang input terdistribusi non-linear, SOM dapat memilih karakter terbaik sebagai pendekatan (Chi & Yang, 2006). Kedua karakter membuat jaringan SOM cocok untuk map ciri-ciri penyakit dengan konstruksi yang dibutuhkan (Canetta, Cheikhrouhou, & Glardon, 2005; Lee, Gu, & Suh, 2006; Lee & Singh, 2004). Kelas dalam jaringan menunjukkan kombinasi dari unsur-unsur dalam
daerah topologi yang co-centered , yang berarti agregasi dari 0 sampai S (S adalah jumlah neuron). Dalam model ini seperti ditunjukkan pada Gambar. 1, penyakit memiliki beberapa kondisi terbatas (ciri penyakit dari tipe sederhana) termasuk untuk kelas yang sama. Pertama, dalam jaringan SOM, penyakit dibagi ke dalam kelas. Dan sampel penyakit yang dikelompokkan dikembangkan. Dalam proses ini, setiap penyakit mencakup L ciri, ciri ini masukan ke jaringan sehingga jumlah node input adalah L. Kedua, masukan kombinasi ciriciri penyakit real untuk diagnosa ke jaringan dan klasifikasikan berulang kali dengan sampel penyakit yang dikelompokkan (dasar pemikiran adalah sampel penyakit yang digolongkan memenuhi criteria kestabilan), memperoleh hasil setiap klasifikasi. Kemudian, proses dapat meninggalkan daerah (kelas) penyakit yang tidak mungkin. Ketiga, dengan mencari daerah kemungkinan, pemetaan
(kombinasi dari ciri-ciri penyakit) yang memiliki penyesuaian
tertinggi dengan penyakit, itu merupakan hasilnya. Secara umum, fungsi ini didasarkan pada jarak Euclid dan algoritma pengelompokkan. Jarak Euclid
adalah dari grid dua dimensi (dalam model ini, jarak merupakan jarak
absolut dalam ruang multi dimensi). Di sini, dari neuron aktif ,
‖ ‖
, dengan
adalah posisi
adalah posisi terdispersi dari neuron pemenang . Keduanya diukur
dalam ruang terdispersi.
Ada beberapa langkah dalam penerapan algoritma. Ini adalah kompetisi dan pembelajaran untuk mendapatkan pemenang dalam proses. Langkah-langkah diatas diulang sampai pemetaan ciri terbentuk. Langkah-langkah tersebut adalah: (1)
(2)
Inisialisasi Definisikan input data sebagai vector bobot awal neuron output, biasanya bobot neuron j pada saat t; awal harus dalam interval [0, 1].
, memilih secara acak nilai untuk , dengan adalah jumlah ; s adalah jumlah penyakit. Define sebagai dari neuron output N harus berbeda, dan bobot
Kompetisi Karena sampel X dari sampel input pada probabilitas, maka vector X menunjukkan input ke jaringan. Gunakan aturan jarak Euclid untuk menemukan pemenang C pada
langkah ke-t (t adalah waktu iterasi). Jarak Euclid didefinisikan sebagai :
√ ∑
dari neuron j ke input X
,
(4)
dan pemenangnya dapat diperoleh dengan dengan adalah komponen vector bobot ke-i dari node output, input ke- i dari X pada saat t .
{ } (3)
(5) adalah
Pembelajaran Gunakan rumus update:
[ ]
(6)
dengan adalah fungsi persekitaran dari neuron pemenang C. Ketika neuron j tidak berada di dalam persekitaran neuron C pada saat t maka . Variabel adalah parameter rasio pembelajaran yang didefinisikan sebagai
(7)
dengan T adalah waktu maksimum dari iterasi, adalah nilai awal dari , biasanya 1. Secara umum, jaringan SOM menetapkan tepi kelas oleh yang didefinisikan oleh pemenang dan berubah dengan cepat. Dalam algoritma ini, fungsi Gaussian topological adjacent digunakan, yang mengukur persekitaran topologi lingkungan didefinisikan sebagai:
(8)
dengan adalah jarak Euclid dari neuron j ke C, dan adalah konstanta yang menentukan lebar dari fungsi Gaussian. Dari proses di atas, jaringan SOM berbentuk tunggal atau berganda dan digolongkan oleh fungsi . Unsur-unsur dalam persekitaran ini termasuk ke dalam kelas yang sama. Salah satu karakter khusus dari algoritma SOM adalah ukuran persekitaran topologi. Daerah ini menyusut secara bertahap. Ini membutuhkan lebar turun tepat waktu untuk memenuhi. Variabel dapat didefinisikan sebagai:
(9)
dengan adalah nilai awal, dan adalah waktu yang konstan. Sesuaikan vektor bobot semua neuron. Dalam rangka untuk memperoleh hasil terbaik, dan secara bertahap berkurang selama proses pembelajaran. (4)
Ulangi langkah (2) dan (3) sampai perubahan dalam pemetaan ciri-ciri menjadi sangat kecil atau saat iterasi maksimum tercapai.
penyakit
Berdasarkan persyaratan diagnosa multi-penyakit, peta ciri-ciri penyakit dalam jaringan SOM melalui langkah-langkah di atas dapat dibangun. Pertama, cluster sampel dalam kelas, catat pusat masing-masing kelas, dan sekaligus menghitung radius
setiap kelas (dari pusat ke jarak terjauh dari setiap titik). Setelah peta ciri-ciri penyakit diperoleh, layer kedua pada model diagnosa untuk kelas yang sesuai bisa dicari. 2.3. Optimasi algoritma adjacent -searching Algoritma SOM tradisional mengambil pusat kelas (output neuron dengan penyesuaian terbaik) sebagai kondisi pencarian, tetapi beberapa rasio error pada algoritma telah ditemukan dalam penelitian ini. Dalam beberapa kondisi, tidak dapat memastikan kebenaran dari closest adjacent jika pencarian hanya dengan menghitung jarak Euclid dari vektor input ke pusat kelas. Suatu pengelompokkan khusus yang pertama menghitung jarak dari vektor input ke setiap vektor pusat kelas dan penyajian dalam kelas dengan jarak terkecil diperlihatkan pada gambar 2. Artinya, titik a, b dan c simetris dengan O 1 dan termasuk dalam anggota kelas 1 (pusatnya adalah O1), d dan e simetris dengan O 2 dan termasuk dalam anggota kelas 2 (pusatnya adalah O 2), keduanya memenuhi kondisi konvergensi pengelompokkan SOM. Jarak dari sampel input ke O2 lebih dekat daripada ke O 1, sedangkan jarak dari ke d dan e keduanya lebih jauh daripada ke c. Jadi, hasil pencarian kedekatan yang benar adalah c. Namun, hasil pencarian oleh algoritma tradisional adalah d atau e. Itu karena hubungan “closest ” dari multi-dimensi kurang dekat daripada yang dari sampel input tergantikan untuk pusat pengelompokkan, dan kedua kondisi tidak yakin mana yang terdekat dari sampel input ke salah satu titik dalam kelas (Yang & Li, 2003). Analisis menunjukkan bahwa selain jarak Euclid , yang merupakan jarak dari sampel ke pusat kelas O s dari kelas s, dan yang adalah jarak dari ke salah satu titik di kelas s dengan O s sebagai pusat, jarak juga memainkan peran penting. Artinya, terkecil adalah yang lebih memenuhi ke s. Gambar. 2 menunjukkan bahwa daerah adalah ( adalah radius kelas 1), dimana c, O 1, dan kelas 1 masing-masing mewakili , O s, dan s. Jika diambil sebagai pusat kelas maka superposisi yang derajat satu (kelas t) didasarkan pada dan satu kelas adalah hubungan terbalik. Jadi, pengoptimalan algoritma adjacent-searching harus memenuhi titik, dimana jarak Euclid antara neuron lebih besar dari . Kelas dimana jarak Euclid ke pusat kelas lebih besar dari dan yang tidak memenuhi kondisi terdahulu tetapi memenuhi radius kelas, yang lebih besar dari harus dikecualikan. Dalam model diagnostik, penentuan nilai agregasi sampel dan nilai agregasi dari pusat pengklasifikasian dan jari-jari dari ciri penyakit algoritma map konstitusi sebagai distribusi map, diharapkan bahwa sampel bisa fall menjadi hanya satu distribusi setelah optimasi algoritma adjacent-searching dan tidak termasuk kelas tidak sesuai. Seperti ditunjukkan dalam Gambar 3, dengan asumsi didefinisikan sebagai agregasi map ciri penyakit, agregasi sampel . ini termasuk kelas 1 dan 2 kelas (masing-masing, menentukan dua kelas sebagai C 1 dan C2, pusat kelas masing-masing o 1 dan o2, dan radius r 1 dan r2). diketahui jika sampel input adalah . Kemudian, beberapa elemen akan fall ke C1 dan C2, sampel yang terdekat dengan adalah smin, jarak terkecil di C 2 adalah s2. Dalam rangka untuk membuat hasil pencarian fall ke C1, smin yang tidak termasuk dalam C 2 harus dibuktikan.
Sangat mudah untuk membuktikan bahwa kuadrat dari jarak Euclid terkecil , dan kuadrat terbesar l max adalah . l min dari ke kelas adalah Kemudian
(10)
Sehingga
(11)
dan l 1_max < l 2_min diketahui, maka:
(12)
Karena
,
(13)
l 1_max
. Dengan demikian, smin termasuk dalam C1 dan ditemukan
sehingga diperoleh sehingga
Dengan cara lain, asumsikan
(14)
maka
.
(15)
Berdasarkan definisi dari pencarian kelas yang berdekatan maka dapat dibuktikan:
atau
(16)
Diketahui
(17)
tetapi
(18)
sehingga
(19)
salah. Karena dengan benar, maka
maka
. Dari (19), proposisi tidak dapat dibuktikan
(20)
Jadi kesimpulan yang didapat: untuk suatu sampel input , jika yang memenuhi , (21) diperoleh:
dan untuk
(21)
maka untuk arbitrary map distribution, syarat perlu dan syarat cukup dari (14) (sama seperti (20)) adalah:
| | | () || |
Asumsikan Untuk setiap
dan
merupakan pusat kelas
memenuhi:
,
(22) dan
.
(23)
Dari (23), untuk arbitrary map distribution, syarat perlu dan syarat cukup untuk adalah
(24)
Dari definisi di atas, misal dengan hasil agregasi adalah: asumsikan agregasi sampel dalam , dimensi , dilihat dari (21) dan (23),
Asumsikan agregasi
, kelas-kelas yang ditemukan adalah
(25)
dan
(26)
kelas dengan adalah . Jika adalah terpenuhi, adalah beberapa nilai antara dan , radius adalah , untuk setiap , selalu benar. Melalui (22) dan (24), akan ditarik kesimpulan sebagai berikut: untuk arbitrary map distribution dari ciri penyakit, syarat perlu dan cukup untuk adalah
(27)
Sesuai deduksi di atas, jauh lebih masuk akal algoritma adjacent-searching diperbandingkan dengan tradisional, salah satunya “hanya menduga jarak Euclid dari pusat kelas dengan sampel input”, dan memastikan suatu klasifikasi yang tepat dari sampel input (dalam Gambar 3, hasil sampel input dari adjacent-searching fall ke dalam secara tepat) termasuk contoh yang ditunjukkan pada Gambar 3.
Menurut hasil aplikasi, karakteristik sistem tersebut adalah sebagai berikut: lebih sedikit operasi daripada SOM normal, akurasi diagnostik lebih tinggi, dan toleransi kuat. Ketika informasi yang salah termasuk dalam input, bisa mendapatkan output yang relatif tepat dan ruang sampel mudah diperluas. Itu berarti sistem sesuai dengan kebutuhan
diagnostik multi-penyakit. Kebanyakan dari semua, ciri-ciri dari analisis clustering membuatnya lebih mudah untuk memprediksi penyakit tertentu dengan mengubah jaringan. Dengan menghitung kesesuaian antara kombinasi ciri-ciri penyakit dan kelas, sistem dapat menemukan kombinasi yang mungkin dari ciri penyakit. Pada point ini, meniru mode self -associative memory dari manusia, yang membuat model jauh lebih intelektual. Kemudian atribut-atribut yang akan dipakai dalam pengelompokkan adalah sebagai berikut: (cirri penyakit) Dari hasil pengkodean didapat tabel berikut ini: Feature array No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
Disease name Leaf Mold
1
2
3
4
5
6
7
8
9
1 0
1 1
1 2
1 3
1 4
1 5
1 6
1 7
1 8
1 9
2 0
2 1
2 2
2 3
2 4
1
0
1
0
0
0
1
1
0
0
0
0
0
0
1
1
1
0
0
0
1
1
0
1
Cercospora Leaf Mold
1
0
1
1
0
0
1
1
0
0
0
0
0
0
0
1
0
0
0
0
1
1
0
0
Early Blight
1
0
1
1
1
0
0
1
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
Corynespora Leaf Spot
0
0
1
1
0
1
0
0
0
1
0
0
1
0
0
0
0
1
1
0
0
1
0
0
Fruit Rot
0
0
0
1
1
0
0
1
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
Septoria Leaf Spot
1
0
0
0
1
1
0
1
0
1
1
0
0
0
0
0
0
0
0
0
0
1
0
0
Verticillium Wilt
0
0
1
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
1
Fusarium Wilt
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
0
0
1
0
0
1
0
1
Bacterial Leaf Spot
0
0
1
1
1
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
Powdery Mildew
1
1
0
0
0
0
1
0
0
0
0
0
0
0
1
0
0
0
0
1
0
1
0
1
Helminthospor Fruit Rot
0
0
0
1
0
1
0
1
1
1
1
0
0
0
0
1
0
0
1
0
0
0
0
0
Late Blight
1
0
0
1
1
0
1
0
0
0
0
1
0
0
1
0
0
0
1
0
0
0
1
0
Gray Mold
0
0
0
0
1
0
0
0
0
1
0
1
0
0
0
0
0
1
1
0
0
1
0
0
Bacterial Scab
1
0
0
1
0
0
1
1
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
Stem Rot
0
0
0
1
0
1
1
0
0
0
0
0
0
0
1
0
0
0
1
0
0
1
0
0
Stem Blight
0
0
0
1
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
Brown Rot
1
0
0
0
0
0
1
0
0
1
0
1
0
0
0
0
0
0
0
0
0
0
1
0
Gray Leaf Spot
1
1
0
0
0
1
0
1
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
Mosaic Virus I
1
0
1
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
Mosaic Virus II
0
0
0
1
0
0
1
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
Gray Spot
0
0
0
1
1
0
0
1
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
Unknown disease
0
1
0
0
1
1
0
1
0
1
0
0
0
1
0
0
0
0
1
1
0
1
1
0
Tabel 1.1. Data atribut yang telah di coding
Hasil Simulasi A. Pengelompokkan sampel
penyakit tomat
Dari output hasil pengelompokkan menggunakan jaringan self-organizing map (SOM) terlihat bahwa 22 penyakit tanaman tersebut telah terbagi menjadi 12 kelas, yaitu:
Kelas 1 2 3 4 5 6
Nama Penyakit Leaf Mold, Cercospora Leaf Mold Powdery Mildew Verticillium Wilt, Mosaic Virus I Stem Blight, Brown Rot Bacterial Scab, Mosaic Virus II Late Blight
7 8 9 10 11 12
Fusarium Wilt, Stem Rot Corynespora Leaf Spot, Gray Mold Unknown disease Helminthospor Fruit Rot, Gray Leaf Spot Septoria Leaf Spot Early Blight, Fruit Rot, Bacterial Leaf Spot, Gray Spot
Dengan pengaturan epoch menjadi 5000 maka hasil cluster seperti yang ditunjukkan pada Tabel di atas diidentifikasi baik dan dapat diterima karena ternyata setiap penyakit pada kelas yang sama memiliki kedekatan sesuai dengan ciri penyakit .
3.3. Uji Diagnosa Data ciri-ciri dan penyakit dalam tulisan ini diperoleh dari Fujian Academy of Agricultural Sciences dan telah diuji dalam menciptakan dua-layer jaringan. Beberapa hasil pengujian ditunjukkan pada Tabel .. Kombinasi ciri penyakit (code)
Epoch 250
Hasil Diagnosa Menggunakan toolbox LVQ Neural Network Epoch 500
Epoch 1000
Epoch 2000
Epoch 3000
Epoch 4000
Epoch 5000
101111010101000001000100
Early Blight
Early Blight
Early Blight
Early Blight
Early Blight
Early Blight
Early Blight
100100100001001000100100
Late Blight
Late Blight
Late Blight
Late Blight
-
-
Late Blight
110001110010001000010100
Gray Leaf Spot
Gray Leaf Spot
Powdery Mildew
Powdery Mildew
Gray Leaf Spot
Gray Leaf Spot
Gray Leaf Spot
110000100000001000010100
Powdery Mildew
Powdery Milde
Powdery Milde
Powdery Milde
Powdery Milde
Powdery Milde
Powdery Milde
100000100101000000000011
Brown Rot
Brown Rot
Brown Rot
Brown Rot
Brown Rot
Brown Rot
Brown Rot
001110000000000000000000
Bacterial Leaf Spot
Bacterial Leaf Spot
Bacterial Leaf Spot
Bacterial Leaf Spot
Bacterial Leaf Spot
Bacterial Leaf Spot
Bacterial Leaf Spot
Kombinasi ciri penyakit (code)
Hasil Diagnosa Menggunakan Jaringan LVQ
1011110101010 00001000100
Early Blight
1001001000010 01000100100
Late Blight, Stem Rot
1100011100100 01000010100
Gray Leaf Spot, Powdery Mildew
1100001000000 01000010100
Powdery Mildew
1000001001010 00000000011
Brown Rot
0011100000000 00000000000
Bacterial Leaf Spot
START
INISIALISASI BOBOT
INPUT
INPUT R
BACA DATA ATRIBUT CIRI-CIRI PENYAKIT
LAKUKAN PENGKODEAN
MASUKKAN KOMPONEN VEKTOR X YAITU X i
MENCARI WINNER OUTPUT )2 D(j) = (
CARI INDEKS D(j) MINIMUM SEBAGAI WINNER
DISPLAY BOBOT WINNER
UPDATE BOBOT wij(new)=w ij(old) + α[ xi - wij(old)]
ADA PERUBAHAN BOBOT?
UPDATE LEARNING RATE DAN UPDATE RADIUS TETANGGA
END