RMK Chapter 9
PENGUKURAN; Penskalaan, keandalan, validitas Kini setelah kita mengetahui empat tipe skala yang dapat dipakai untuk mengukur dimensi dan elemen variable (variable (variable)) yang didefinisikan secara operasional adalah perlu untuk menelaah metode penskalaan (yaitu, menentukan nomor dan simbol) untuk memperoleh respons sikap subjek terhadap objek, peristiwa atau orang. Terdapat dua kategori utama skala sikap (jangan dikacaukan dengan empat tipe skala) skala) – skala peringkat dan skala ranking. Skala peringkat (rating scale) memiliki beberapa kategori respons dan digunakan untuk mendapatkan respons yang terkait dengan objek, peristiwa, atau orang yang dipelajari. Skala ranking (rating scale), di sisi lain, membuat perbandingan antara objek, peristiwa, atau orang, dan mengungkap pilihan yang lebih disukai dan merangkingnya. merangkingnya. Kedua skala tersebt dibahas di bawah ini. SKALA PERINGKAT Skala peringkat berikut ini sering dipakai dalam penelitian organisasional : 1.
Skala dikotomi
2.
Skala kategori
3.
Skala likert
4.
Skala numerikal
5.
Skala diferensial semantik
6.
Skala peringkat terperinci
7.
Skala peringkat jumlah konstan atau tetap
8.
Skala stapel
9.
Skala peringkat grafik
10.
Skala konsensus
11.
Skala Dikotomi
Skala dikotomi (dichotomous (dichotomous scale) scale) digunakan untuk memperoleh jawaban Ya atau Tidak, seperti dalam contoh di bawah ini. Perhatikan bahwa skala nominal ( nominal scale) scale) dipakai untuk mengungkap respons.
Skala Kategori
Skala kategori (categori scale) menggunakan banyak item untuk mendapatkan respons tunggal seperti dalam contoh berikut. Contoh ini juga menggunakan skala nominal. Skala Likert
Skala Likert ( Likert scale) didesain untuk menelaah seberapa kuat subjek setuju atau tidak setuju dengan pernyataan pada skala 5 titik. Skala Diferensial Semantik
Beberapa atribut berkutub dua (bipolar ) diidentifikasi pada skala ekstrem, dan responden diminta untuk menunjukkan sikap mereka pada hal yang bisa disebut sebagai jarak semantik ( semantic space) terhadap individu, objek atau kejadian tertentu pada masing-masing atribut. Kata sifat berkutub dua yang digunakan misalnya akan berupa istilah tertentu, seperti BaikBuruk; Kua-Lemah; Panas-Dingin. Skala diferensial semantik ( semantic differential scale) dipakai untuk menilai sikap responden terhadap merek, iklan, objek atau orang tertentu. Skala Numerikal
Skala numerikal (numerical scale) mirip dengan skala diferensial semantik, dengan perbedaan dalam hal nomor pada skala 5 titik atau 7 titik disediakan dengan kata sifat berkutub dua pada ujung keduanya. Ini juga merupakan skala interval. ·Skala Peringkat Terperinci
Pada skala peringkat terperinci (itemized rating scale), skala 5 titik atau 7 titik dengan titik panduan atau jangkar (anchor ), sesuai keperluan, disediakan untuk tiap item dan responden menyatakan nomor yang tepat di sebelah masing-masing item, atau melingkari nomor yang relevan untuk tiap item, seperti dalam contoh berikut ini. Respons terhadap item kemudian disajikan. Hal ini menggunakan skala interval. Skala Jumlah Konstan atau Tetap
Disin responden diminta untuk mendistribusikan sejumlah poin yang diberikan ke berbagai item seperti dalam contoh di bawah. Skala jumlah konstan atau tetap ( fixed or constan sum scale) lebih bersifat skala ordinal (ordinal scale). Skala Stapel
Skala staple ( staple scale) secara simultan mengukur arah dan intensitas sikap terhadap item yang dipelajari. Karakteristik minat terhadap studi ditempatkan di bagian tengah dengan jarak skala numerik, katakanlah, dari +3 ke -3, pada tiap sisi item seperti diilustraikan di bawah. Skala ini memberikan ide mengenai seberap dekat atau jauh respons individu terhadap stimulus, sebagaimana ditunjukkan dalam contoh berikut. Karena skala ini tidak memiliki titik nol absolut, skala ini adalah skala interval. Skala Peringkat Grafik
Gambaran grafis membantu responden untuk menunjukkan pada skala peringkat grafik ( graphic rating scale) jawaban mereka untuk pertanyaan tertentu dengan menempatkan tanda pada titik yang tepat pada garis, seperti dalam contoh berikut. Ini merupakan skala ordinal, meskipun contohb erikut mungkin membuatnya terlihat seperti skala interval. Skala Konsensus
Skala juga dibuat berdasarkan konsensus, di mana panel juri memilih item tertentu, mengukur konsep yang menurut mereka releva. Item dipilih terutama berdasarkan ketepatan atau relevansinya
dengan
konsep.
Skala
konsensus
( consensus
scale)
tersebut
dibuat
setelah item terpilih diperiksa dan diuji validitas dan keandalannya. Skala Lainnya
Ada juga beberapa metode penskalaan yang sudah sangat maju atau rumit ( advance) seperti penskalaan multidimensional (multidimensional scaling ), di mana objek, orang, atau kedua-duanya, diskalakan secara visual, dan dilakukan analisis gabungan (conjoint ). Hal tersebut memberikan gambar visual mengenai hubungan yang ada dianara dimensi sebuah konsep (construct ). Perbandingan Berpasangan
Skala Perbandingan Berpsangan ( paired comparison) digunakan ketika diantara sejumlah kecil objek, responden diminta untuk memilih antara dua objek pada sat u waktu. Hal ini membantu untuk menilai preferensi. Skala Komparatif
Skala komparatif (comparative scalei) memberikan standar (benchmark ) atau poin referensi untuk menilai sikap terhadap objek, kejadian, atau situasi saat ini yang diteliti. Validitas Konsep
Validitas konsep (construct validity) menunjukkan seberapa baikhasil yang diperoleh dari penggunaan ukuran cocok dengan teori yang mendasari desain tes. Hal tersebut dinilai melalui validitas konvergen (convergent validity) dan diskriminan (discriminant validity). KEANDALAN
Keandalan (reliabilitg) suatu pengukuran menunjukkan sejauh mana pengnkuran tersebut tanpa bias (bebas kesalahan-enor free) dan karena itu menjamin pengukuran yang konsisten lintas waktu dan lintas beragam ilem dalam instrumen. Dengan kata lain, keanda-lan suatu pengukuran merupakan indikasi mengenai stabilitas dan konsistensi di mana instrumen mengukur konsep dan membantu menilai "ketepatan" sebuah pengukuran. Stabilitas Pengukuran
Kemampual suatu pengukuran untuk tetap sama sepanjang waktu-meskipun terdapat kondisi pengujian yang tidak dapat dikontrol atau keadaan responden itu sendiri-merupakan indikasi dari stabilitas dan kerentanannya yang rendah untuk berubah dalam situasi. Ha1 tersebut membuktikan "ketepatan"nya karena konsep benar-benar diukur, tidak peduli kapan pun dilakukan. Dua uji stabilitas adalah keandalal tes ulang dari keandalan bentuk para1el. Keandalan Tes Ulang
Koefisien keandalan yang diperoleh dengan pengulangan ukuran yang sama pada kesempatal kedua disebut keanda,lan tes ulang (test-retest reliabilitgl. Yaitu, jika sebuah kuesioner yang mengandung sejumlah item yang diandaikan mengukur suatu konsep diberikan kepada sekumpulan responden saat ini. kepada responden yang sama, katakanlah beberapa minggu hingga 6 bulan mendatang, maka korelasi antara skor yang diperoleh pada dua waktu yang berbeda dari sekumpulan responden yang sama disebut koefisien tes ulang. Semakin tinggi koefisien tersebut, semakin baik keand1an tes u1ang, dan konsekuensinya, stabilitas ukuran melintasi waktu. Konsistensi Internal Ukuran Konsistensi internal uk,ran (internat consistency of measures) merupakan indikasi homogenitas item d,aTarn ukuran yang mengungkap ide. Denga, kata latn, item harus "bersama-sama sebagai kesatuan,,, dan mampu secara beban mengukur konsep yang sama sehingga responden menyematkan makna keseluruhan yang sama untuk tiap item. HaJ ini dapat dilihat dengan menguji apakah item dan subset i/em dalam instmmen pengukuran berkorelasi tinggi. Konsistensi dapat diuji melalui keandalan antat-itemdan uji keandala,n belah dua. Keandalan Konsistensi Antar-item
Keandalan konsistensi artar-item merupakan pengujian konsistensi jawaban responden atas semua item yang diukur. Sampai tingkat di mana item-item merupakan ukuran bebas dari konsep yang sama, mereka akan berkorelasi satu sama lain. Tes keandalan antar-itemyang paling populer adalah koefisien alfa Cronbach (alfa Cronbach; Cronbach, 1946), yang diguna,lian untuk ilem skala-multipoin, dan formula Kuder-Richardson ( Kuder & Richardson, 1937), yang digunakan untuk ilem dikotomi. Semakin tinggi koefisien, semakin baik instrumen pengukuran. Keandalan Belah-Dua Keandalan belah-dua (split-half reliabilitgl mencerminkan korelasi antara dua bagian instrumen. Estimasi akan berbeda-beda tergantung pada bagaimana item delam pengurkuran dibelah ke dalam dua bagian. Keandalan belah dua bisa lebih tinggi daripada alfa Cronbach hanya dalam keadaan di mana terdapat lebih dari satu dimensi respons mendasar yang diungkap oleh pengukuran dan jika beberapa kondisi lainnya terpenuhi (untuk rincian lengkap, lihat Campbeil, 1976). Karena itu, dalam hampir setiap kasus, alfa Cronbach bisa dianggap merupakan indeks yang memadai untuk keandalan konsistensi antar item VALIDITAS
Sebeiumnya, dalam Bab 7, kita telah mempelajari istilah validitas internal \internal validity) dan validitas eksternal (extemal validity.itg) dalam konteks desain Metodotogi Penelitian untuk Bisnis eksperimen. Yaitu, kita mendalami persoalan hubungan sebab dan akibat (validitas internal), dan generalisasinya untuk lingkungan eksternal (validitas eksternal). Sekarang kita akan menelaah validitas dari instrumen pengukuran itu sendiri. Jika kita mengajukan sekumpulan pertanyaan (yaitu membuat instrumen pengukuran) dengan harapan bahwa kita mengungkap konsep, bagaimana dapat yakin secara logis bahwa kita benar-benar mengukur konsep yang telah direncanakan dan bukan sesuatu yang lain? Ha1 tersebut dapat ditentukan dengan menerapkan uji validitas tertentu' Ada beberapa jenis uji validitas yang digunakan untuk menguji ketepatan ukuran dan penulis menggunalan istiiah yang berbeda untuk menunjukkannya. Demi kejelasan, kita bisa mengelompokkan uji validitas ke daiam tiga bagian besar: validitas isi (confent uatidity\,validitas berdasar kriteria dan validitas konsep Validitas Isi validitas isi (content vatidity) memastikan bahwa pengukural memasukkan sekumpulan item yang memadai dan mervakili yang mengungkap konsep' Semakin item skaTa mencerminkan kawasan atau keseluruhan konsep yang diukur, semakin besar va-iiditas isi. Dengan kata lain, validitas isi mempakan fungsi seberapa baik dimensi dan elemen sebuah konsep telah digambarkan. panel juri dapat menegaskan validitas isi instrumen. Kidder dan Judd (1986) menyebutkan contoh di mana sebuah tes yang didesain untuk mengukur tingkat kerusakan kemampuan
berbicara bisa dianggap memiliki validitas jika tes tersebut dievaluasi oleh sekelompok juri ahli (yaitu terapis bicara orofesional). Validitas muka (face validity) dianggap oleh sejumlah pihak sebagai indeks validitas isi yang paling dasar dan sangat minimum. validitas isi menunjukkan bahwa item-item yang dimaksudkan untuk mengukur sebuah konsep, memberikan kesan malnpu mengungkap konsep yang hendak diukur. Beberapa peneliti tidak merasa tidak tepat untuk memberlakukan validitas muka sebagai komponen yang valid dari validitas isi Validitas Berdasar Kriteria vatiditas berd.asar kiteia lcriteion-related ualidity) terpenuhi jika pengukuran membedakan individu menurut suatu kriteria yang diharapkan diprediksi. Ha1 tersebut bisa dilakukan clengan menghasilkan ualiditas konkuren (concurrent