CHAPTER 12: MEASUREMENT: SCALLING, RELIABILITY, VALIDITY
CHAPTER 12: MEASUREMENT: SCALLING, RELIABILITY, VALIDITY
Sekarang kita telah mengetahui bagaimana cara mengoperasionalisasikan konsep atau variable. Disini kita perlu menetapkan angka (atau simbol lain) sebagai cara. Hal penting yang harus diingat adalah aturan dalam menetapkan angka sebagai karakteristik atau atribut dari sebuah objek harus distandarisasikan dan diterapkan secara konstan. Angka memberikan kita tampilan analisis statistik dari data dan hasil uji hipotesis yang telah kita kembangkan.
Four Types of Scales Sebuah skala adalah alat atau mekanisme dimana individu-individu dibedakan, bagaimana mereka berbeda satu sama lain pada variabel yang menarik bagi penelitian. Skala melibatkan penciptaan sebuah rangkaian kesatuan dimana objek berada. Nominal Scale Skala nominal adalah salah satu alat yang memungkinkan peneliti untuk menetapkan subjek ke dalam kategori atau kelompok tertentu. Contohnya untuk variabel gender, responden bisa dibagi ke dalam dua grup. Laki-laki dan perempuan. Dua grup ini bisa diberikan kode angka 1 dan 2. Angka ini hanya sekedar angka tanpa nilai yang lebih antara satu dan yang lainnya, atau lebih ekslusif antara satu dan yang lainnya. Ordinal Scale Sebuah skala ordinal tidak hanya mengkategorikan variabel sedemikian rupa untuk menunjukkan perbedaan diantara berbagai kategori, tetapi skala ini juga memberikan peringkat kategori dalam beberapa cara yang berarti. Dimana setiap variabel dikategorikan menurut beberapa preferensi, skala ordinal akan digunakan. Contoh ranking, urutan kesukaan, dan lain-lain. Interval Scale Sebuah skala interval memungkinkan kita untuk melakukan operasi aritmatika tertentu pada data yang dikumpulkan dari responden. Sedangkan skala nominal memungkinkan kita hanya untuk secara kualitatif membedakan kelompok dengan mengelompokkan mereka ke dalam hal yang eksklusif dan kolektif lengkap, dan skala ordinal ke peringkat preferensi, skala interval memungkinkan kita mengukur jarak antara dua titik pada skala. Hal ini membantu kita untuk menghitung sarana dan standar deviasi dari tanggapan pada variabel. Dengan kata lain, skala
OMAR SHAZAKI DILAGA (A311 11 259)
CHAPTER 12: MEASUREMENT: SCALLING, RELIABILITY, VALIDITY
interval tidak hanya kelompok individu menurut kategori, tetapi juga mengukur besarnya perbedaan preferensi antara individu. Ratio Scale Skala Rasio mengatasi kelemahan dari titik asal yang acak dari skala interval, dalam hal ini memiliki titik nol yang mutlak (berbeda dengan acak), yang merupakan titik pengukuran yang lebih berarti. Dengan demikian skala rasio tidak hanya mengukur besarnya perbedaan antara poin pada skala, tetapi juga proporsi dalam perbedaan. Skala ini merupakan skala yang paling kuat dari empat skala yang lain, karena memiliki titik asal nol yang unik (tidak acak) dan menggolongkan semua dari tiga skala lainnya. Berat adalah contoh yang baik dari skala rasio. Ini memiliki asal mutlak nol yang dikalibrasi, yang memungkinkan kita untuk menghitung rasio bobot dua individu.
Rating Scales Skala penilaian berikut sering digunakan dalam penelitian bisnis: Dichotomous Scale Skala dikotomi digunakan untuk mendapatkan jawaban Ya atau Tidak. Category Scales Skala kategori menggunakan beberapa item untuk mendapatkan respon tunggal sebagai jawaban. Skala Ini juga menggunakan skala nominal. Semantic Differential Scale Skala diferensial semantik ini digunakan untuk menilai sikap responden terhadap merek tertentu, iklan, objek, atau individu. Tanggapan dapat diplot untuk mendapatkan ide bagus dari persepsi mereka. Skala ini diperlakukan sebagai skala interval. Numerical Scale Skala numerik mirip dengan skala diferensial semantik, dimana perbedaannya terletak pada adanya angka skala lima atau tujuh poin, dengan kata sifat bipolar pada kedua ujungnya. Skala ini juga merupakan skala interval. Itemized Rating Scale
OMAR SHAZAKI DILAGA (A311 11 259)
CHAPTER 12: MEASUREMENT: SCALLING, RELIABILITY, VALIDITY
Skala lima atau tujuh poin dengan jangkar dibutuhkan, skala ini disediakan untuk setiap item dan responden menyatakan jumlah yang tepat di sisi setiap item, atau melingkari nomor yang relevan terhadap setiap item. Skala ini menggunakan skala interval. Likert Scale Skala Likert dirancang untuk melihat seberapa kuat subjek setuju atau tidak setuju dengan pernyataan dalam skala 5 poin yang dirancang. Skala ini juga merujuk kepadasummated scale. Fixed or Constant Sum Scale Disini responden diminta untuk mendistribusikan jumlah poin dalam berbagai item. Bersifat lebih ke arah skala ordinal. Stapel Scale Skala ini secara langsung mengukur kedua arah dan intensitas sikap terhadap item yang diteliti sekaligus. Karakteristik yang menarik bagi penelitian ditempatkan di pusat dengan bentangan jarak skala numerik, katakan saja jarak bentangan dari +3 sampai -3. Graphic Rating Scale Sebuah gambaran grafis yang membantu responden untuk mengindikasikan pada skala ini jawaban mereka atas pertanyaan tertentu dengan menempatkan tanda pada titik yang tepat pada baris. Skala ini juga merupakan skala ordinal. Consensus Scale Skala juga dapat dikembangkan oleh konsensus, dimana panel penilai memilih item tertentu, yang menurutnya dapat mengukur konsep yang relevan. Item yang dipilih terutama didasarkan pada ketepatan atau relevansi dengan konsep mereka. Skala konsensus tersebut dikembangkan setelah item yang dipilih diperiksa dan diuji validitas dan reliabilitasnya. Salah satu skala konsensus adalah Thurstone Equal Appearing Interval Scale, dimana konsep diukur melalui proses yang kompleks yang diikuti oleh panel penilai. Other Scales Ada juga beberapa metode skala tingkat atas seperti skala multidimensi, dimana benda, orang, atau keduanya, secara visual diskalakan, dan analisis conjoint dilakukan. Hal ini memberikan gambaran visual dari hubungan dalam suatu ruang antara dimensi suatu konstruksi.
OMAR SHAZAKI DILAGA (A311 11 259)
CHAPTER 12: MEASUREMENT: SCALLING, RELIABILITY, VALIDITY
Ranking Scales Skala peringkat digunakan untuk menngetahui preferensi antara dua atau lebih benda atau barang (bersifat ordinal). Namun, peringkat tersebut tidak memberikan petunjuk definitif untuk beberapa jawaban yang dicari. Paired Comparison Skala perbandingan berpasangan digunakan ketika, diantara sejumlah kecil benda responden diminta untuk memilih antara dua objek tersebut pada suatu waktu. Hal ini membantu untuk menilai preferensi. Forced Choice Skala ini memungkinkan responden untuk merangking objek relatif terhadap satu sama lain, diantara alternatif yang disediakan. Hal ini akan lebih mudah digunakan bagi responden apabila jumlah pilihan tidak terlalu banyak. Comparative Scale Skala perbandingan menyediakan patokan atau titik acuan untuk menilai sikap terhadap objek saat ini, peristiwa, atau situasi yang diteliti.
International Dimensions of Scalling Bagian dari sensitifitas definisi operasional dari suatu konsep dalam budaya yang berbeda, dalam hal memberikan skala juga membutuhkan penanganan dalam penelitian lintas budaya. Perbedaan budaya memberikan reaksi yang berbeda terhadap pemberian skala. Misalnya dalam beberapa penelitian di beberapa daerah, skala tujuh poin lebih sensitif dibandingkan dengan skala empat poin dalam hal menemukan tanggapan yang baik (tidak terjadi gangguan).
Goodness of Measures Sekarang kita telah melihat bagaimana mendefinisikan secara operasional variabel dan menerapkan teknik skala yang berbeda. Penting untuk memastikan bahwa instrumen yang kita kembangkan untuk mengukur konsep tertentu memang akurat mengukur variabel, dan bahwa dalam kenyataannya, kita benar-benar mengukur konsep dengan alasan untuk mengukur. Hal ini
OMAR SHAZAKI DILAGA (A311 11 259)
CHAPTER 12: MEASUREMENT: SCALLING, RELIABILITY, VALIDITY
juga membuktikan bahwa ketika mengoperasionalisasikan persepsi dan sikap variabel, kita tdak melihatnya secara berlebihan. Berikut hal-hal yang dapat memastikan bahwa langkah-langkah yang kita kembangkan memiliki alasan yang baik. 1. Item Analysis 2. Validity
Content Validity Criterion-Related Validity (Concurrent Validity and Predictive Validity) Construct Validity (Convergent Validity and Discriminant Validity)
3. Reliability
Stability of Measures
Test-Retest Reliability
Parallel-Form Reliability
Internal Consistency of Measures
Interitem Consistency Reliability
Split-Half Reliability
Reflective versus Formative Measurement Scales Pada saat ini, penting untuk kembali ke anggapan bahwa item-item dari ukuran multi-item harus bersatu sebagai satu perangkat dan mampu secara mandiri mengukur konsep yang sama. Tetapi faktanya adalah bahwa item yang mengukur konsep tidak harus selalu bersatu. Ini hanya berlaku untuk skala reflektif, tetapi tidak untuk skala formatif. What Is Reflective Scale? Dalam skala reflektif semua item dianggap saling berkorelasi. What Is a Formative Scale and Why Do The Items of a Formative Scale Not Necessarily Hang Together? Skala formatif digunakan ketika konstruk dilihat sebagai kombinasi yang menjelaskan indikatorindikatornya (Fornell & Bookstein, 1982; Fornell, 1987).
OMAR SHAZAKI DILAGA (A311 11 259)