Uji Akurasi Data Kategori Pramaditya Wicaksono, M.Sc. Kartografi dan Penginderaan Jauh Fakultas Geografi UGM Data kategori terdiri dari data nominal dan ordinal dimana data ini sifatnya kualitatif maupun semi kuantitatif. Data nominal merupakan data yang nilainya sejajar. Artinya, antara data satu dengan data yang lain tidak memiliki tingkatan. Sebagai contoh adalah informasi penggunaan lahan hasil klasifikasi digital. Pada hasil klasifikasi digital, ladang/tegalan mempunyai kepentingan kepentingan yang sama dengan sawah s awah ataupun tambak dan permukiman. Data ordinal merupakan data hasil kategorisasi yang nilainya memiliki tingkatan dan tidak sejajar. Contohnya adalah informasi tematik kesesuaian lahan yang memiliki kelas S1 (sangat sesuai), S2 (cukup sesuai), dan N (tidak sesuai). Pada jenis data ini, S1 lebih baik daripada S2 dan S2 lebih baik daripada N yang berarti ada tingkatan pada suatu data kategori. Uji akurasi yang dilakukan pada data kategori ini pada umumnya adalah pengujian hasil interpretasi visual, klasifikasi digital, dan pengelompokan nilai-nilai hasil transformasi spektral. Teknik yang digunakan adalah tabel kontingensi kont ingensi yang pada ilmu penginderaan jauh lebih dikenal dengan nama confusion matrix table. table . Table confusion matrix merupakan tabel matriks yang menghubungkan antara piksel hasil klasifikasi dan ground truth data data yang informasinya dapat diambil dari data lapangan maupun peta yang sudah diverifikasi. Informasi yang bisa diambil dari confusion matrix ini sangat banyak antara lain overall accuracy, producer accuracy, user accuracy, kappa coefficient , coefficient , dan tau coefficient . Penjelasan untuk tiap-tiap unsur uji akurasi diatas diterangkan pada bab-bab dibawah ini. Table Confusion matrix Contoh aplikasi penggunaan confusion matrix yang paling umum adalah untuk uji akurasi hasil pemetaan penutup lahan. Aplikasi lain adalah untuk menguji akurasi hasil pemetaan spesies vegetasi pada hutan, pemetaan habitat laut dangkal, pemetaan kerapatan hutan, dan pemetaan lainnya. Pada bab ini, contoh yang digunakan adalah penggunaan confusion matrix untuk menguji akurasi pemetaan habitat laut dangkal yang berisi terumbu karang, pasir, makro alga, dan lamun (Wicaksono, 2010). Pada bab sebelumnya telah diungkapkan bahwa ketika kita mengambil sampel dilapangan, sebaiknya kita mengambil dua jenis sampel yaitu sampel untuk melakukan proses re-interpretasi dan atau re-klasifikasi dan sampel untuk uji akurasi. Sampel ini sebaiknya benar-benar terpisah dan independen untuk menghindari bias dari hasil akurasi yang diperoleh. Terkadang kita sengaja memilih sampel untuk melakukan uji akurasi demi mendapatkan akurasi pemetaan yang tinggi. Hanya saja, akurasi yang tinggi ini nantinya hanya mencerminkan akurasi pada tiap titik yang tersampel saja,
tidak mampu merepresentasikan akurasi populasi piksel secara keseluruhan. Oleh karena itu, sebaiknya sampel untuk uji akurasi diambil secara independen dan lokasinya terdistibusi spasial secara merata. Tabel 1. Uji akurasi pemetaan habitat bentik menggunakan model inte grasi penghilangan kolom air yang dikembangkan oleh Wicaksono (2010) Kelas
Pasir
Terumbu Karang 2
Pasir 14 Terumbu 1 36 Karang Makro 5 5 Alga Lamun 0 2 Laut 0 3 Total 20 48 Producer 70% 75% Accuracy Error 30% 25% Omission Sumber: Wicaksono (2010)
Makro Alga 0
16
User Accuracy 87,5%
Error Comission 12,5%
0
44
81,82%
18,18%
1
0
14
21,42%
78,58%
0 0 6
14 0 19
0 5 5
16 8 98
87,5% 62,5%
12,5% 37,5%
50%
73,68%
100%
50%
26,32%
0%
Lamun
Laut
Total
0
0
3
4
3
Overall accuracy
73,46%
Kappa
0,6222
Berikut ini adalah rumus untuk mendapatkan tiap nilai akurasi yang muncul pada tabel diatas. Overall accuracy (%) =
jumlah piksel yang terklasifikasi secara benar jumlah sampel uji akurasi
× 100
Nilai overall accuracy (akurasi (akurasi keseluruhan) menunjukan banyaknya jumlah piksel yang terklasifikasi secara benar pada tiap kelas dibanding jumlah sampel yang digunakan untuk uji akurasi pada semua kelas. Pada contoh Tabel 3.2, akurasi keseluruhan menunjukkan nilai 73,46% yang berarti 73,46% piksel yang ada pada hasil klasifikasi terklasifikasi dengan benar. Nilai dari uji akurasi ini yang paling banyak digunakan untuk menguji akurasi suatu hasil interpretasi dan atau klasifikasi. Kelemahan metode ini adalah tidak mempertimbangkan aspek aspek kesalahan dari tiap kelas yang ada, untuk itu biasanya overall accuracy selalu selalu disertai user dan producer dan producer accuracy accuracy untuk untuk tiap kelas. Producer accuracy (%) =
jumlah sampel uji akurasi suatu kelas y ang terklasifikasi benar jumlah sampel uji akurasi pada suatu kelas
× 100
Error omission (%) = 100% - Producer accuracy User accuracy (%) =
jumlah sampel uji akurasi suatu kelas yang terklasifikasi benar jumlah sampel uji akurasi yang terklasifikasi sebagai kelas tersebut
× 100
Error comission (%) = 100% - User accuracy Nilai dari user dan producer accuracy dihitung untuk tiap kelas yang ada dalam klasifikasi. Begitu halnya juga dengan nilai error omisi dan komisi yang merupakan residual dari producer dan user accuracy . Berikut ini adalah penjelasan untuk
menginterpretasi nilai-nilai tersebut beserta contohnya menggunakan kelas habitat lamun pada Tabel 3.2. Nilai user accuracy pada pada kelas lamun adalah sebesar 87,5% yang berarti 87,5% peluang bahwa piksel yang terklasifikasi pada citra sebagai lamun adalah benar-benar lamun pada kenyataan di lapangan. Dengan kata lain hanya ada 12,5% ( error comission) comission) kemungkinan bahwa piksel yang dicitra terklasifikasi sebagai lamun adalah bukan lamun di lapangan. Nilai user accuracy ini ini lebih banyak digemari oleh para pengambil keputusan karena hasil klasifikasi mampu memberikan estimasi dan gambaran dari kondisi sebenarnya dilapangan. Nilai producer accuracy pada kelas lamun adalah 73,68% yang berarti ada 73,68% lamun di lapangan pada area riset diklasifikasikan secara benar. Artinya 26,32% ( error omission) omission) lamun di lapangan tidak terklasifikasi sebagai lamun. Nilai producer accuracy ini umumnya lebih digemari oleh para thematician thematician karena akurasi ini mampu menunjukkan banyaknya objek dipermukaan bumi yang direpresentasikan dengan benar pada peta atau hasil klasifikasi. Kappa coefficient =
( x ) – ) 2 –
Keterangan:
: total sampel untuk uji akurasi : jumlah piksel yang terklasifikasi secara benar X kk kk akurasi untuk tiap tiap kelas kelas dikalikan jumlah piksel piksel X kΣ X Σk : jumlah sampel untuk uji akurasi kΣ yang terklasifikasikan pada kelas tersebut dan ditambahkan untuk semua kelas.
N
Nilai kappa menunjukan perbandingan antara hasil klasifikasi yang diuji dengan hasil klasifikasi acak. Dengan kata lain nilai kappa menunjukkan konsistensi akurasi hasil klasifikasi. Nilai kappa ini akan selalu lebih rendah dibanding nilai overall accuracy kecuali klasifikasinya mempunyai akurasi yang amat sangat tinggi. Nilai kappa pada Tabel 3.2 adalah 0,6222 yang berarti hasil klasifikasi tersebut mampu menghindari 62,22% kesalahan yang akan muncul pada klasifikasi acak.
Gambar 1. Hasil klasifikasi pemetaan habitat bentik yang diuji pada Tabel 1.