MAKALAH ANALISIS HASIL TES MENGGUNAKAN MODEL PENSKORAN DAN MODEL PENSKALAAN
Disusun Oleh : Arda Pramudita Swardana (15302241025) (15302241025) Sinta Wulanningrum (15302241031) (15302241031) Ilham Miftahul Hoer (15302241033) (15302241033) Pendidikan Fisika A
JURUSAN PENDIDIKAN FISIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS NEGERI YOGYAKARTA 2017
KATA PENGANTAR
Segala puji kami panjatkan kehadirat Tuhan Yang Maha Esa, atas rahmat dan hidayah-Nya sehingga kami dapat menyelesaikan makalah Teori Teknik
Pengukuran mengenai “ Analisis Hasil Tes Menggunakan Model Penskoran dan Penskalaan”. Makalah ini disusun untuk memenuhi tugas dari dosen pembimbing yang bertujuan agar mahasiswa lebih le bih memahami konsep Teori Teknik Pengukuran dan dapat digunakan pembaca agar lebih memahami mengenai Teori Teknik Pengukuran. Dengan kerendahan hati dan kesadaran penuh, kami sampaikan bahwa makalah ini tidak akan mungkin terselesaikan te rselesaikan tanpa adanya dukungan dan bantuan dari berbagai pihak, baik secara langsung ataupun tidak langsung. Oleh karena itu, kami ucapkan terimakasih kepada : 1.
Drs. Edi Istiyono M.Si. selaku dosen mata kuliah Teori Teknik Pengukuran
2.
Orang tua penulis yang telah memberikan dukungan positif baik dukungan spiritual maupun material.
Kami menyadari sepenuhnya bahwa, makalah ini masih banyak kekurangan meskipun telah disusun sebaik-baiknya. Untuk itu kami sangat mengharapkan adanya masukan, saran, dan kritik dari semua pihak yang bersifat membangun demi kesempurnaan makalah ini. Semoga makalah ini dapat bermanfaat bagi diri kami para penulis dan pembacanya.
Yogyakarta, 25 November 2017
Penulis
DAFTAR ISI
.................................................................... ............................................ ..................................ii ............ii Kata Pengantar.............................................. Daftar Isi ........................................... ................................................................. ............................................ ............................................ .........................iii ...iii BAB
1
Pendahuluan........................................ .............................................................. ............................................ ................................1 ..........1
A. Latar Belakang Masalah............................ Masalah.................................................. ............................................ .............................1 .......1 B. Rumusan Masalah....................... Masalah............................................. ............................................ ...........................................1 .....................1 C. Tujuan Penulisan.......................................... Penulisan.................................................................. .............................................. ........................1 ..1 BAB 2 Pembahasan .......................................... ................................................................ ............................................ ................................2 ..........2
A. Dikotomus...................................... Dikotomus............................................................ ............................................ ........................................2 ..................2 B. Politomus..................... Politomus........................................ ......................................... ............................................ ........................................9 ..................9 1. PCM
( Partial Partial
Credit
Model )............................................. )...............................................................14 ..................14 2. GPCM (Generalized (Generalized Partial Credit Model )........................................16 )........................................16 3. GRM (Graded (Graded Response Model ).........................................................24 ).........................................................24 4. MGRM ( Modified Modified Graded Response Mode) Mode)........................................27 ........................................27 5. RSM ( Rating Scale Model )............................................. )..................................................................3 .....................30 0 .................................................................. ............................................ ...................................34 .............34 BAB 3 Penutup............................................
A. Simpulan....................................................................................................34 B. Saran...........................................................................................................35 Daftar Pustaka ......................................................................................................36 Lampiran ..............................................................................................................37
BAB I PENDAHULUAN
A. Latar Belakang
Dewasa ini di zaman modern , sebagian besar orang banyak yang menggunakan sesuatu secara instan. Dalam dunia pendidikan, guru masih menggunakan metode-metode untuk penskoran dan penskalaan hasil tes dengan cara yang instan. Sebagian besar pendidik juga masih kebingungan dalam menentukan skor dan skala yang sebaiknya dipakai dalam menganalisis hasil tes peserta didik. Dalam menganalisis sebuah data untuk penulisan skripsi, tesis, disertasi, dan karya ilmiah khususnya dalam penelitian dibidang pendidikan banyak menggunakan metode penskoran dan penskalaan. Penskoran dan penskalaan ini merupakan tindak lanjut dari tes yang telah dilakukan terhadap peserta didik dimana guru memberi skor dan skala sesuai dengan model yang ada. Sebelum, melakukan penskoran dan penskalaan dari sebuah instrumen berupa tes guru perlu mengetahui metode atau model dari penskoran dan penskalaan agar tidak kebingungan dalam menentukan cara yang sebaiknya digunakan. Pada makalah ini, penulis ingin memaparkan mengenai model-model penskalan dan penskoran yang bertumpu pada dua jawaban atau banyak jawaban, yaitu dikotomus dan politomus. Pemaknaan dari angka penskoran ini dapat dimaknai secara penskalaan. Berdasarkan uraian di atas, maka penulis menyusun makalah dengan
judul “Analisis Hasil Tes Menggunakan Model Penskoran dan Penskalaan ” . Diharapkan makalah ini dapat menambah wawasan guru, mahasiswa, dan pembaca dalam melakukan penskoran dan penskalaan hasil tes.
B. Rumusan Masalah
1. Bagaimana analisis hasil tes menggunakan model penskoran? 2. Bagaimana analisis hasil tes menggunakan model penskalaan? C. Tujuan
1. Untuk mengetahui analisis hasil tes menggunakan model penskoran 2. Untuk mengetahui
analisis hasil tes menggunakan model penskalaan
D. Manfaat
1.
Bagi Guru
a)
Memberi wawasan dan pengetahuan dalam melakukan penskoran dan penskalaan hasil tes peserta didik
b)
Sebagai acuan atau pedoman
pendidik dalam menentukan ,metode
penskoran dan penskalaan agar tidak kebingungan dalam menentukan cara
penskoran dan penskalaan yang sebaiknya digunakan.
2.
Bagi Pembaca
a)
Menjadikan referensi dalam melakukan penskoran dan penskalaan hasil tes
BAB II PEMBAHASAN
A.
Analisis Hasil Tes Model Penskoran Penskoran merupakan langkah pertama dalam proses pengolahan hasil tes
pekerjaan siswa. Penskoran adalah suatu proses pengubahan jawaban-jawaban tes menjadi angka-angka (mengadakan kuantifikasi). Angka-angka hasil penskoran tersebut kemudian diubah menjadi nilai-nilai melalui suatu proses pengolahan tertentu. Penggunaan simbol untuk menyatakan nilai-nilai itu ada yang dengan angka, seperti angka dengan rentangan 0-10, 0-100, atau 0-4, dan ada pula yang dengan huruf A, B, C, D, dan E. Yang terjadi selama ini, banyak diantara para guru yang masih mencampuradukkan antara 2 pengertian yaitu skor dan nilai. Skor: hasil pekerjaan menskor (=memberikan angka) yang diperoleh dengan jalan menjumlahkan angka-angka pada setiap butir item yang oleh testee dijawab dengan betul. Contohnya adalah tes Hasil belajar fisika menyajikan 5 butir soal tes uraian dimana disetiap butir soal yang dijawab dengan betul diberi bobot 10.siswa yang bernama Sita, untuk kelima butir soal tes uraian tersebut memberikan jawaban sebagai berikut: -
Untuk butir soal nomer 1 dapat dijawab dengan sempurna, sehingga kepadanya diberikan skor 10
-
Untuk butir soal nomer 2 hanya jawab betul separohnya, sehingga skor yang diberikan kepada siswa tersebut adalah 5
-
Untuk butir soal nomer 3,hanya sekitar seperempat bagian saja yang dapat dengan betul, sehingga diberikan skor 2,5
-
Untuk butir soal nomer 4 dijawab dengnabetul sekitar separuhnya sehingga diberi nilai 5
-
Untuk butir soal nomer 5 dijawab dengan betul tiga perempatnya, sehingga diberikan skor 7,5
Dengan demikian untuk kelima butir soal tes uraian tersebut,siswa Fatimah tersebut mendapatkan skor sebesar = 10 + 5+ 2,5 + 5 + 7,5= 30. Angka 30 disini belum dapat disebut nilai , sebab 30 itu masih merupakan skor mentah (raw score), yang untuk dapat disebut nilai masih memerlukan pengolahan atau perubahan (=konversi). Nilai: angka atau huruf yang melambangkan seberapa jauh atau seberapa kemampuan yang telah ditunjukan oleh testee terhadap materi atau bahan yang diteskan. Pengubahan skor menjadi nilai dapat dilakukan untuk skor tunggal, misalnya sesudah memperoleh skor ulangan harian atau untuk skor gabungan dari beberapa ulangan dalam rangka memperoleh nilai akhir untuk rapor. Secara rinci skor dapat dibedakan atas tiga macam,yaitu skor yang diperoleh, skor sebenarnya, dan skor kesalahan. Kelemahan butir tes, situasi yang tidak mendukung, kecemasan, dan lain-lain faktor dapat berakibat terhadap skor yang diperoleh. Skor sebenarnya sering juga disebut dengan skor univers – skor alam, adalah nilai hipotesis yang sangat tergantung dari perbedaan individu berkenaan dengan pengetahuan yang dimiliki secara tetap. Perbedaan skor yang diperoleh dan skor yang sebenarnya, disebut dengan istilah kesalahan dalam pengukuran atau kesalahan skor. Hubungan antara ketiga macam skor tersebut adalah sebagai berikut : Skor yang diperoleh = skor sebenarnya + skor kesalahan Cara menskor hasil tes biasanya disesuaikan dengan bentuk soal-soal tes yang yang dipergunakan, apakah tes objektif atau tes essay. Untuk soal-soal objektif biasanya setiap jawaban benar di beri skor 1 (satu) dan setiap jawaban yang salah diberi skor 0 (nol); total skor diperoleh dengan menjumlahkan skor yang diperoleh dari semua soal. Untuk soal-soal essay dalam penskorannya biasanya digunakan cara member
bobot
kepada
setiap
soal
menurut
tingkat
kesukarannya
atau
banyak-sedikitnya unsure yang harus terdapat dalam jawaban yang dianggap paling
baik. Misalnya: untuk soal nomor 1 diberi skor maksimum 4, untuk soal nomor 3 diberi skor maksimum 6, untuk soal nomor 5 skor maksimum 10, dan seterusnya.
Dilembaga-lembaga pendidikan kita, masih banyak pengajaran yang melakukan penskoran soal-soal essay, tanpa pembobotan; setiap soal diberi skor yang sama meskipun sebenarnya tingkat kesukaran soal-soal dalam tes yang disusunnya itu tidak sama. 1. Bahkan yang lebih memprihatinkan lagi, terutama dalam penilaian soal-soal essay, proses penskoran dan penilaian biasanya tidak dibedakan satu sama lain; pekerjaan siswa langsung diberi nilai, jadi bukan di skor terlebih dahulu. Oleh karena itu, hal ini sering kali menimbulkan terjadinya halo effect, yang berarti dalam penilaiannya itu diikutsertakan pula unsure-unsur yang irelevan seperti kerapian dan ketidakrapian tulisan, gaya bahasa, atau panjang-pendeknya jawaban sehingga cenderung menghasilkan penilaian yang kurang andal. Hasil penilaian jadi kurang objektif. Jika tes yang berbentuk soal-soal essay tersebut dinilai oleh lebih dari satu orang, sering kali terjadi perbedaan-perbedaan di antara penilai, bukan juga hasil penilaian seorang penilai sering kali berbeda terhadap jawaban-jawaban yang sama dari soal tertentu. Kesalahan seperti ini tidak akan selalu terjadi jika dalam pelaksanaannya diadakan pemisahan antara proses penskoran dan penilaian. B.
Jenis-Jenis Kunci Pemberian Skor Disamping penyusunan dan pelaksanaan tes, menskor dan menilai merupakan
pekerjaan yang menuntut ketekunan yang luar biasa dari penilai, ditambah dengan kebijaksanaan-kebijaksanaan tertentu. Nama lain dari menskor adalah memberi angka. Dalam hal menskor atau menentukan angka, dapat digunakan tiga macam alat bantu, yaitu : 1)
Pembantu menentukan jawaban yang benar, disebut kunci jawaban
2)
Pembantu menyeleksi jawaban yang benar dan yang salah, disebut kunci skoring
3)
Pembantu menentukan angka, disebut pedoman penilaian
Keterangan dan penggunaannya dalam berbagai bentuk tes. a.
Kunci jawaban dan kunci pemberian skor untuk tes bentuk pilihan ganda
(Multiple Choice)
Dengan bentuk tes seperti ini, testee diminta untuk melingkari atau tanda silang salah satu pilihan jawaban. Dalam hal menentukan kunci jawaban untuk bentuk ini langkahnya sama seperti soal bentuk betul salah. Hanya untuk soal yang jumlahnya melebihi 30 buah, sebaiknya menggunakan lembar jawaban dan nomor-nomor urutannya dibuat sedemikian rupa sehingga tidak memakan t empat. Dalam menentukan angka untuk tes bentuk pilihan ganda, dikenal 2 macam cara pula yaitu dengan denda atau rumus tanpa denda. Untuk penskoran soal-soal objektif jika yang dipergunakan rumus correction for guessing, atau dapat juga disebut system denda. Rumus perhitungan skor dengan denda adalah : S= (R – W)
Untuk multiple choice (obyektif)
Contoh : -
Banyanknya soal
= 10 buah
-
Yang betul
= 8 buah
-
Yang salah
= 2 buah
-
Banyaknya pilihan = 3 buah
Maka skornya adalah = (10 – 8) - ( 3 – 1 ) = 8 – 1 = 7 Adapun rumus perhitungan skor tanpa denda adalah : S=R Keterangan : S = Skor yang sedang di cari
R = Right (Jumlah Jawaban betul ) Contoh : Dalam tes hasil belajar bidang study usul fiqh yang diikuti oleh 40 orang siswa madrasah aliyah diajukan 20 butir item tes obyektif, 20 butir diantaranya adalah obyektif bentuk true - false dengan ketentuan bahwa untuk setiap butir item yang dijawab betul diberikan bobot 1 dan untuk setiap butir item yang dijawab salah diberikan bobot 0. Dalam tes tesebut seorang siswa bernama Basirudin dapat menjawab dengan betul sebanyak 15 butir item (R=15):berarti jawaban yang salah = 20 -15 = 5 (w=5).sedangkan option = 2 (0=2). Apabila terhadap jawaban salah itu dikenai sanksi berupa denda, maka skor akhir yang diberikan kepada basirun adalah : S =
(R – W )
= (15 – 5) = 10 Sedangkan apabila terhadap jawaban salah itu tidak dikenai sanksi berupa denda, maka skor yang diberikan kepada basyirun adalah :
S= R=
15
Untuk tes obyektif bentuk matching, fill in dancompletion , perhitungan skor akhir pada umumnya tidak memperhitungkan sanksi berupa denda, sehingga rumus yang digunakan adalah : S = R Dengan kata lain , skor yang diberikan kepada tesstee adalah sama dengan jumlah jawaban betulnya. Contoh : Tes hasil belajar bidang studi al- Qur’an
al-Hadist menyajikan 20 butir item
bentuk matching, 20 item butir bentuk fill in dan 20 butir item bentuk completion. Untuk butir butir soal bentuk matching siswa bernama ridwan mejawab betul 8 butir, bentuk fill in di jawab betul 10 butir, sedangkan bentuk completion dijawab betul sebanyak 4 butir. Dengan demikian skor yang diberikan kepada siswa bernama Ridwanadalah sebagai berikut :
·
Untuk item bentuk matching : S = R = 8
·
Untuk item bentuk fiil In
·
Untuk item bentuk completion : S = R = 4
: S = R = 10
Adapun untuk tes obyektif bentuk multiple choice items dapat digunakan salah satu dari dua buah rumus, yaitu rumus dengan denda atau rumus tanpa denda. Rumus perhitungan skor dengan denda : S = R-(W : ( 0-1 ))
Adapun rumus perhitungan skor tanpa denda : S = R Dimana: S = Skor yang sedang di cari R = Right (jumlah jawaban betul) W = Wrong (jumlah jawaban salah) 0 = Banyaknya option yang dipasang pada item 1 = Bilangan konstan Contoh : Tes hasil belajar bidang studi Aqidah Akhlaq menyajikan 40 butir item bentuk multiple choice item, yang masing-masing itemnya dilengkapi dengan 5 buah option. Siswa bernama Dardiri dapat menjawab dengan betul 32 butir item (R = 32), sehingga jawaban salahnya adalah = 40 – 32 = 8 ( W = 8 ). Dengan demikian apabila dalam pemberian skor akhir diperhitungkan sanksi berupa denda, maka skor yang diberikan kepada siswa bernama Dardiri itu adalah : S = R – (W : ( 0-1)) = 32 - (8 : ( 5-1 )) = 32 – 2 = 30
Jika tidak dikenai sanksi berupa denda, maka skor yang diberikan pada siswa bernama Dardiri itu adalah : S = R = 32 Suatu hal yang perlu dicatat ialah, bahwa karena tes obyektif bentuk multiple choice item terdiri dari berbagai model yang masing-masing memiliki derajat kesukaran yang berbeda, maka bobot jawaban betul yang diberikan belum tentu 1, melainkan bisa saja diberikan bobot 1 ½ , 2, 2 ½ , 3,4, atau 5 misalnya. Dalam hubungan ini, orang yang paling tahu berapa bobot yang seharusnya diberikan terhadap jawaban betul itu adalah si pembuat soal itu sendiri, yaitutester , karena dialah orang yang paling tahu mengenai derajat kesukaran yang dimiliki oleh masing-masing butir item yang dikeluarkan dalam tes hasil belajar. Sehubungan dengan itu, maka apabila dalam pemberian skor itu ditentukan bobot (weight) yang berbeda-beda, maka kedua rumus yang telah disebutkan di atas perlu dimodifikasi menjadi sebagai berikut : S=R-( W : ( 0-1) Wt Rumus tanpa denda : S = R X Wt Contoh : Tes hasil belajar bidang studi bahasa arab menyajikan 50 butir item tes obyektif bentuk multiple choice dengan rincian sebagai berikut : Nomor urut item
Model multiple
Jumlah butir item
choice item 01-10
MCI Model
Bobot jawaban betul
10
1
10
1½
10
1½
10
2
10
4
melengkapi 5 pilihan 11-20
MCI Model asosiasi dengan 5 pilihan
21-30
MCI Model melengkapi berganda
31-40
MCI Model analisis hubungan antar hal
41-50
MCI model analisis
kasus Total
50
-
Misalkan dalam tes hasil belajar tersebut siswa bernama Erlina dari 50 butir utem tes tersebut dapat menjawab betul sebagai berikut :
Model multiple choice item
Jumlah jawaban betul
Melengkapi 5 pilihan
8
Asosiasi dengan 5 pilihan
6
Melengkapi berganda
4
Analisis hubungan antar hal
7
Analisis kasus
3
Apabila dalam pemberian skor itu digunakan sanksi berupa denda, maka skor yang diberikan kepada siswa bernama Erlina adalah sebagai berikut :
Skor yang Butir item
Model MCI
Option
Jawaban
(0)
Betul (R)
Nomor
Jawaban salah (W)
Bobot
diberikan
(Wt)
S=R(W : (0-1))Wt
01-10
Melengkapi 5
5
8
2
1
pilihan 11-20
Asosiasi dengan
=7,50 5
6
4
1½
5 pilihan 21-30
Melengkapi
Analisis
6(4 : (5-1))1,5=4,50
5
4
6
1½
berganda 31-40
8(2:(5-1))1
4(6: (5-1))1,5 =1,75
5
7
3
2
hubungan antar
7(3(5-1))2 =5,50
hal 41-50
Analisis kasus
5
3
7
4
3(7: (5-1))4
=-4,00 Total
15,25
Adapun apabila dalam pemberian skor dilakukan tanpa memperhitungkan denda, maka dengan menggunakan rumus : S = R x Wt, skor yang diberikan kepada Erlina adalah sebagai berikut : Butir item Nomor
Skor
01-10
8x1=8
11-20
6x1½=9
21-30
4x1½=6
31-40
7 x 2 = 14
41-50
3 x 4 = 12
Total
49
Kalau saja dalam tes hasil belajar tersebut seoraeng siswa dapat menjawab dengan betul keseluruhan item (50 butir item), maka skor yang diberikan kepada siswa tersebut ialah :
Butir item Nomor
Skor
01-10
10 x 1 =10
11-20
10 x 1 ½ = 15
21-30
10 x 1 ½ = 15
31-40
10 x 2 = 20
41-50
10 x 4 = 40
Total
100
Di samping pendapat yang menganggap perlu digunakannya correction for guessing dalam penskoran, ada pula pendapat yang menganggap bahwa penggunaan rumus correction for guessing itu tidak ada gunanya dan bahkan tidak mengenai sasarannya. Adapun alasan dari pendapat yang terakhir ini dikemukakan sebagai berikut: 1) Dalam praktik sulit sekali diketahui mana jawaban yang benar dan atau salah yang diperoleh sebagai hasil terkaan saja, dan mana yang bukan hasil terkaan. 2)Dalam kehidupan sehari-hari kita sering dihadapkan kepada keadaan kita harus menarik kesimpulan tanpa memiliki data informasi yang lengkap sehingga kemampuan menggunakan pengetahuan yang tidak lengkap menjadi suatu tujuan mata ajaran tertentu. Misalnya, sulit bagi kita untuk membedakan secara halus antara nilai 5 ½, 5 ¾, 5 7/8 dan sebagainya. Persoalan ini akan lebih dipersulit lagi dengan adanya kebiasan yang salah dari para penilai atau pengajar yang hanya memakai rentangan angka 5-8, ada yang memakai 5-7, dan semacamnya sehingga kualitas yang sama tidak dilukiskan dengan nilai yang sama. Atau dengan kata lain, untuk kualitas kemampuan atau penguasaan yang sama terlukiskan dalam angka berbeda-beda bagi setiap penilai. b.
Kunci jawaban dan kunci pemberian skor untuk tes bentuk betul-salah
Untuk tes bentuk betul-salah (true-false) yang dimaksud dengan kunci jawaban adalah deretan jawaban yang kita persiapkan untuk pertanyaan atau soal -soal yang kita susun, sedangkan kunci skoring adalah alat yang kita gunakan untuk mempercepat pekerjaan skoring. Oleh karena itu dalam hal ini testee (tercoba) hanya diminta untuk melingkari huruf B atau S, maka kunci jawaban yang disediakan hanya berbentuk urutan nomor serta huruf dimana kita menghendaki untuk melingkari atau dapat juga diberi tanda X pada jawabannya. Misalnya : 1. B
6. S
2. S
7. B
3. S
8. S
4. B
9. S
5. B
10. B
Ada baiknya kunci jawaban ini ditentukan terlebih dahulu sebelum menyusun soalnya, agar : -
Dapat diketahui imbangan antara jawab B dan S
-
Dapat diketahui letak atau pola jawaban B dan S Bentuk tes betul-salah sebaiknya disusun sedemikian rupa sehingga jumlah
jawaban B hampir sama banyaknya dengan jawaban S, dan tidak dapat ditebak karena tidak diketahui pola jawabannya. Kunci jawaban untuk tes bentuk ini dapat diganti kunci skoring yang pembuatannya melalui langkah-langkah sebagai berikut : Langkah 1 : Menentukan letak jawaban yang betul. Misalnya : 1. B - S
3. B - S
2. B - S
4. B - S
5. B - S
Langkah 2 : Melubangi tempat-tempat lingkaran sedemikian rupa sehingga lingkaran yang dibuat oleh testee dapat dilihat. 1. B - S
3. B - S
2. B - S
4. B - S
5. B - S
Catatan : Dengan pengalaman ini dapat kita ketahui bahwa lubang yang terlalu kecil berakibat tertutupnya jawaban testee, sedangkan lubang yang terlalu besar akan saling memotong. Oleh karena itu, cara menjawab dengan member tanda silang akan lebih baik daripada melingkari. Dengan demikian maka tanda yang dibuat akan tampak jelas.
Dalam menentukan angka (skor) untuk tes bentuk B-S ini kitadapat menggunakan 2 cara seperti telah disinggung didepan, yaitu : -
Tanpa hukuman atau tanpa denda
-
Dengan hukuman atau dengan denda
Tanpa hukuman adalah apabila banyaknya angka yang diperoleh siswa sebanyak jawaban yang cocok dengan kunci. Sedangkan dengan hukuman (karena diragukan adanya unsur tebakan), digunakan 2 macam rumus, tetapi hasilnya sama. Pertama, dengan rumus : S=R-W
Singkatan dari : S = Score R = Right W = Wrong Skor yang diperoleh siswa sebanyak jumlah soal yang benar dikurangi dengan jumlah soal yang salah. Contoh : -
Banyaknya soal
= 10 buah
-
Yang betul
= 8 buah
-
Yang salah
= 2 buah
Angkanya adalah : 8 - 2 = 6 Kedua, dengan rumus : S = T – 2W
T singkatan dari Total, artinya jumlah soal dalam tes. Contoh diatas dihitung : -
Banyaknya soal
= 10 buah
-
Yang salah
-
Angkanya adalah = 10 – (2 x 2) = 10 – 4 = 6
c.
= 2 buah
Kunci jawaban dan kunci pemberian skor untuk tes bentuk jawaban
singkat (Short answer test)
Tes berbentuk jawaban singkat adalah bentuk tes yang menghendaki jawaban berbentuk kata atau kalimat pendek.Bentuk tes ini dapat digolongkan kedalam bentuk tes obyektif.Tes bentuk isian ini, dianggap setaraf dengan tes jawaban singkat ini. Dengan mengingat jawaban yang hanya satu pengertian saja, maka angka bagi tiap nomor soal mudah ditebak.Usaha yang dikeluarkan oleh siswa sedikit, tetapi lebih sulit daripada tes bentuk betul-salah atau bentuk pilihan ganda.Sebaiknya tiap soal diberi angka 2.Dapat juga angka itu kita samakan dengan angka pada bentuk betul-salah atau pilihan ganda jika memang jawaban yang diharapkannya ringan atau mudah. Tetapi sebaliknya apabila jawabannya bervariasi misalnya lengkap sekali, lengkap dan kurang lengkap, maka angkanya dapat dibuat bervariasi pula misalnya 2; 1,5; dan 1. d.
Kunci jawaban dan kunci pemberian skor untuk tes bentuk menjodohkan
(Matching)
Pada dasarnya tes ini adalah bentuk tes pilihan ganda, dimana jawabannya dijadikan satu, demikian pula pertanyaan-pertanyaannya. Satu kesulitan lagi adalah bahwa jawaban yang dipilih dibuat sedemikian rupa sehingga jawaban yang satu tidak diperlukan bagi pertanyaan lain. Kunci jawaban tes bentuk ini dapat berbentuk deretan jawaban yang dikehendaki atau deretan nomor yang diikuti oleh huruf-huruf yang terdapat didepan alternative jawaban. Telah dijelaskan bahwa tes bentuk menjodohkan ini adalah tes bentuk pilihan ganda yang lebih kompleks.Maka angka yang diberikan sebagai imbalan juga harus lebih banyak .Sebagai ancar-ancar dapat ditentukan bahwa angka untuk tiap nomor adalah 2. e. test)
Kunci jawaban dan kunci pemberian skor untuk tes bentuk uraian (Essay
Sebelum menyusun sebuah tes uraian sebaiknya kita tentukan terlebih dahulu pokok-pokok jawaban yang kita kehendaki. Dengan demikian, akan mempermudah kita dalam mengoreksinya. Ada sebuah saran, langkah-langkah apa yang harus kita lakukan pada waktu kita mengoreksi dan memberi angka tes bentuk uraian. Saran tersebut adalah sebagai berikut : 1.
Membaca soal pertama dari seluruh siswa untuk mengetahui situasi jawaban. Dengan membaca seluruh jawaban, kita dapat memperoleh gambaran lengkap tidaknya jawaban yang diberikan siswa secara keseluruhan.
2.
Menentukan angka untuk soal pertama tersebut. misalnya jika jawaban itu
lengkap diberi angka 5, kurang sedikit diberi angka 4, demikian seterusnya. 3.
Memberi angka bagi soal pertama
4.
Membaca soal kedua dari seluruh jawaban siswa untuk mengetahui situasi
jawaban, dilanjutkan dengan pemberian angka untuk soal kedua 5.
Mengulangi langkah-langkah tersebut bagi soal tes ketiga dan seterusnya hingga seluruh soal diberi angka
6.
Menjumlahkan angka-angka yang diperoleh oleh masing-masing siswa untuk tes
bentuk uraian Dengan membaca terlebih dahulu seluruh jawaban yang diberikan oleh ssiswa, kita menjadi tahu bahwa mungkin tidak ada seorang pun dari siswa yang menjawab dengan betul untuk sesuatu nomor soal. Menghadapi situasi seperti ini, kita gunakan cara pemberian angka yang relatif. Misalnya untuk sesuatu nomor soal jawaban yang paling lengkap mengandung 3 unsur, padahal kita menghendaki 5 unsur, maka pada jawaban yang paling lengkap itulah kita berikan angka 5, sedangkan jika menjawab hanya 2 atau 1 unsur, kita berikan angka lebih sedikit. Ini adalah cara memberikan angka dengan menggunakan atau mendasarkan pada norma kelompok. Apabila memberikan angka berdasarkan pada standar mutlak, maka langkah-langkahnya akan lain, yaitu : 1.
Membaca setiap jawaban yang diberikan siswa dan dibandingkan dengan kunci jawaban yang telah kita susun
2.
Membubuhkan skor disebelah kiri setiap jawaba. Ini dilakukan per nomor
3. Menjumlahkan skor-skor yang telah dituliskan pada setiap soal, dan terdapatlah skor untuk bagian soal yang berbentuk uraian Dengan cara kedua ini maka skor siswa tidak dibandingkan dengan jawaban yang paling lengkap yang diberikan oleh siswa lain, tetapi dibandingkan dengan jawaban yang sudah ditentukan oleh guru. Adakalanya kita dituntut untuk memberikan nilai terhadap prestasi belajar siswa tanpa memberikan skor terlebih dahulu.Misalnya pada ujian lisan.Apabila nilai ujian diberikan terhadap setiap butir pertanyaan, cukuplah memadai.Bahaya yang mengancam kita dalah masuknya unsur subjektivitas dalam diri kita sehingga kita seringkali melakukan hal-hal diluar keadilan.Untuk menguragi masuknya unsure subjektivitas dalam penilaian, kita dapat menentukan sendiri aspek-aspek yang menjadi bagian dari penilaian. Misalnya untuk penilaian ujian skripsi : a.
Mutu skripsi yang tersusun, meliputi unsur metodologi dan pembahasan teoritik
b.
Cara dan kemampuan mempertahankan kebenaran pendapatnya
c.
Luasnya materi pendukung yang digunakan untuk menjawab
d.
(untuk pembimbing) kemandirian dan kelancaran dalam konsultasi Untuk masing-masing aspek dapat ditentukan berapa nilainya, kemudian
dijumlah dan ditentukan nilai akhir. Dalam menentukan nilai terhadap tiap-tiap aspek ini pun kita dituntut untuk memberikan pertimbangan yang didasari oleh kebijaksanaan. Sebenarnya kita dapat mengambil salah satu dari 2 cara dibawah ini, yaitu : a.
Bertitik tolak dari batas bawah, yaitu berfikir dari pekerjaan yang paling jelek diberi nilai berapa, kemudian membandingkan hasil pekerjaan yang kita hadapi dengan nilai batas bawah tersebut. dari batas bawah ini kita memberikan tambahan nilai sebanyak jarak antara nilai batas bawah dengan pekerjaan mahasiswa. Jadi kita berangkat dari bawah, lalu nik. Menurut pengalaman, pemberian nilai dengan cara ini cenderung menghasilkan nilai yang rendah.
b.
Bertitik tolak dari plafon/batas atas. Dengan cari ini kita berfikir mengenai kesempurnaan pekerjaan tetapi diukur menurut ukuran mahasiswa, bukan diukur
dengan kemampuan dosen atau ahli-ahli yang kita kagumi. Selanjutnya berangkat dari nilai batas atas tersebut kita kurangkan sedikit-sedikit sejauh kesenjangan antara nilai batas dengan pekerjaan mahasiswa yang kita hadapi. Jadi berangkat dari atas kemudian turun. Menurut pengalaman, pemberian nilai dengan cara ini cenderung menghasilkan nilai yang tinggi. Cara ini juga bisa diterapkan untuk menilai tugas atau yang bersifat relatif, yang berupa unjuk kerja atau penampilan. Hal lain yang harus diperhatikan adalah tepatnya waktu penyerahan nilai. f.
Kunci jawaban dan kunci pemberian skor untuk tugas
Kunci jawaban untuk memeriksa tugas merupakan pokok-pokok yang harus termuat didalam pekerjaan siswa.Hal ini menyangkut criteria teentaang isi tugass.Namun sebagaai kelengkapan dalam pemberian skor, digunakan suatu tolok ukur tertentu. Tolok ukur yang disarankan dalam buku ini sebagai ukuran keberhasilan tugas adalah : ·
Ketepatan waktu menyerahkan tugas
·
Bentuk fisik pengerjaan tugas yang menandakan keseriusan siswa/mahasiswa dalam mengerjakan tugas
·
Sistematika yang menunjukkan alur keruntutan pikiran
·
Kelengkapan isi menyangkut ketuntasan penyelesaian dan kepadatan isi
·
Mutu hasil tugas, yaitu kesesuaian hasil dengan garis-garis yang sudah ditentukan oleh guru/dosen Dalam mempertimbangkan nilai akhir perlu difikirkan peranan masing-masing aspek kriteria tersebut, misalnya : A1 - ketepatan waktu, diberi bobot 2 A2 - bentuk fisik, diberi bobot 1 A3 - sistematika, diberi bobot 3 A4 - kelengkapan isis, diberi bobot 3
A5 - mutu hasil, diberi bobot 3 Maka nilai hasil akhir tugas tersebut diberikan dengan rumus : NAT = 2 x A1 + A2 + 3 x A3 + 3 x A4 + 3 x A5 12 NAT adalah Nilai Akhir Tugas. Dari uraian di atas dapat disimpulkan bahwa di satu pihak kita lihat adanya peranan penting yang diberikan kepada nilai-nilai sebagai simbol prestasi akademis siswa, tetapi di lain pihak kita melihat pula adanya kekurangan cara pemberiannya.
B. Analisis Hasil Tes Model Penskalaan Secara umum ada empat jenis ukuran atau yang biasa disebut skala dalam statistik antara lain: 1.
Skala Nominal : Skala pengukuran nominal digunakan untuk mengklasifikasikan
obyek, individual atau kelompok. Sebagai contoh pengklasifikasi jenis kelamin, agama, pekerjaan, dan area geografis. Dalam mengidentifikasi hal-hal diatas digunakan angka-angka sebagai symbol. Contohnya : jenis kelamin rsponden, laki-laki = 1, dan wanita = 2. 2.
Skala Ordinal : Skala pengukuran ordinal memberikan informasi tentang jumlah
relatif karakteristik yang berbeda yang dimiliki oleh obyek atau indvidu tertentu. Tingkat pengukuran ini mempunyai informasi skala nominal ditambah dengan sarana peringkat relative tertentu yang memberikan informasi apakah suatu obyek memiliki karakteristik yang lebih atau kurang tetapi bukan berapa banyak kekurangannya atau kelebihannya. Skala pengukuran yang meyatakan kategori sekaligus melakukan rangking terhadap kategori. Contoh : kita ingin mengukur preferensi responden terhadap empat merek produk air mineral. Merek Air Mineral
Aquana Aquaria
Ranking
1 2
3.
Aquasan
3
Aquasi
4
Skala Interval : Skala interval mempunyai karakteristik seperti yang dimiliki oleh
skala nominal dan skala ordinal dengan ditambah karakteristik lain, yaitu berupa adanya interval yang tetap. Dengan demikian peneliti dapat melihat besarnya perbedaan karakteristik antara satu individu atau obyek dengan lainnya. 4.
Skala Rasio : Skala pengukuran ratio mempunyai semua karakteristik yang dipunyai
oleh skala nominal, ordinal, dan interval dengan kelebihan skala ini mempunyai nilai 0 (nol) empiris absolut. Nilai absolut nol tersebut terjadi pada saat ketidak hadirannya suatu karakteristik yang sedang diukur. Pengukuran ratio biasanya dalam bentuk perbandingan antara satu individu atau obyek tertentu dengan lainnya.
Selain skala yang diatas ada juga berbagai skala yang dapat digunakan untuk mengukur gejala/fenomena sosial atau sering disebut skala sikap. Ada empat jenis skala pengukuran sikap menurut Daniel J Mueller (1992), yaitu: 1.
Skala Likert
Skala Likert digunakan untuk mengukur sikap, pendapat dan persepsi seseorang atau sekelompok orang tentang fenomena sosial. Dengan skala Likert, maka variabel yang akan diukur dijabarkan menjadi indikator variabel. Kemudian indikator tersebut dijadikan sebagai titik tolak untuk menyusun item-item instrument yang dapat berupa pernyataan atau pertanyaan. Jawaban setiap item instrumen yang menggunakan skala Likert mempunyai gradasi dari sangat positif sampai sangat negatif, yang dapat berupa kata-kata antara lain: Sangat setuju
Sering
Sangat positif
Setuju
Kadang-kadang
Positif
Ragu-ragu
Tidak pernah
Negatif
Tidak setuju
Sangat negatif
Sangat tidak setuju
Sangat baik Baik Tidak baik
Sangat tidak baik Untuk keperluan analisis kuantitatif, maka jawaban itu dapat diberi skor, misalnya: 1.
Setuju/ selalu/ sangat positif diberi skor
5
2.
Setuju/ sering/ positif diberi skor
4
3.
Ragu-ragu/ kadang-kadang/ netral diberi skor
3
4.
Tidak setuju/ hampir tidak pernah/ negatif diberi skor
2
5.
Sangat tidak stuju/ tidak pernah/ diberi skor
1
Instrumen penelitian yang menggunakan skala Likert dapat dibuat dalam bentuk checklist ataupun pilihan ganda. Contoh Bentuk Checklist
Berilah jawaban pernyataan berikut sesuai dengan pendapat anda, dengan
cara memeberi tanda (√) pada kolom yang tersedia.
No.
Jawaban
Pertanyaan SS
1
ST
RG
TS
Sekolah ini akan menggunakn teknologi informasi dalam pelayanaan administrasi dan akademik
√
………………………………… 2
SS
= Sangat Setuju
diberi skor
5
ST
= Setuju
diberi skor
4
STS
RG
= Ragu-Ragu
diberi skor
3
TS
= Tidak setuju
diberi skor
2
STS
= Sangat Tidak Setuju
diberi skor
1
2.
Contoh bentuk plihan ganda
Berilah salah satu jawaban terhadap pertanyaan berikut sesua dengan pendapat anda, dengan cara member tanda lingkaran nomor jawaban yang tersedia. Kurikulum baru tu akan segera diterapkan di lembagaan pendidikan anda? a.
Sangat tidak setuju
b.
Tidak setuju
c.
Ragu-ragu/ netral
d.
Setuju
e.
Sangat setuju Dengan bentuk pilihan ganda itu, maka jawaban dapat diletakkan pada
tempat yang berbeda-beda. Dalam penyusunan instrument untuk variabel tertentu sebaiknya butir-butir pertanyaan dibuat dalam bentuk kalimat positif netral atau negatif, sehungga responden dapat mejawa dengan serius dan konsisten. Dengan cara demikian maka kecenderungan responden untuk menjawab pada kolom tertent da ri bentuk checklist dapat dikurangi. Dengan model ini juga responden akan selalu membaca pertanyaan setiap instrument dan juga jawabannya. Pada bentuk checklist sering jawaban tidak dibaca, karena letak jawabanna sudah menentu. Tetapi dengan bentuk checklis, maka akan didapat keuntungan dalam hal ini sangat singkat dalam pembuatannya, hemat kertas, mudah mentabulasikan data, dan secara visual lebih menarik. Data yang diperoleh dari skala tersebut adalah berupa data internal.
Skala Likert digunakan untuk mengukur sikap, pendapat, dan persepsi seseorang atau sekelompok orang tentang fenomena sosial. Sedangkan pada evaluasi, skala likert digunakan untuk:
Menilai keberhasilan suatu kebijakan atau program
Menilai manfaat pelaksanaan suatu kebijakan atau program
Mengetahui kepuasan stakeholder terhadap pelaksanaan suatu kebijakan atau program
dll
Kelebihan:
Mudah dibuat dan di terapkan.
Terdapat kebebasan dalam memasukan pertanyaan- pertanyaan, asalkan sesuai dengan konteks permasalahan.
Jawaban suatu item dapt berupa alternative, sehingga informasi mengenai item tersebut diperjelas.
Reliabilitas pengukuran bisa diperoleh dengan jumlah item tersebut diperjelas Kekurangan:
Karena ukuran yang digunakan adalah ukuran ordinal, skala Likert hanya dapat mengurutkan individu dalam skala, tetapi tidak dapat membandingkan berapa kali satu individu lebih baik dari individu yang lain.
Kadangkala total skor dari individu tidak memberikan arti yang jelas, karena banyak pola respons terhadap beberapa item akan memberikan skor yang sama. Adanya kelemahan di atas sebenar nya dapat dipikirkan sebagai error dari respons yang terjadi
Prosedur dalam membuat skala Likert adalah sebagai berikut:
1.
Peneliti mengumpulkan bahan-bahan yang relevant dengan masalah yang sedang diteliti
2.
Menyusun Blue Print untuk memandu penyusunan alat ukur
3.
Membuat item-item yang akan diuji sesuai dengan panduanUji coba item kepada sekelompok responden yang cukup representatif dari populasi yang ingin diteliti. Responden di atas diminta untuk mengecek tiap item, apakah ia menyenangi (+) atau tidak menyukainya (-). Respons tersebut dikumpulkan dan jawaban yang memberikan indikasi menyenangi diberi skor tertinggi. Tidak ada masalah untuk memberikan angka 5 untuk yang tertinggi dan skor 1 untuk yang terendah atau sebaliknya. Yang penting adalah konsistensi dari arah sikap yang
diperlihatkan. Demikian juga apakah jawaban “setuju” atau “tidak setuju” disebut yang disenangi, tergantung dari isi pertanyaan dan isi dari item-item yang disusun. 4.
Setelah item di uji coba kepada responden, lalu diuji ti ngkat validitas dan reabilitas dari item-item tersebut. Validitas adalah suatu ukuran yang menunjukkan tingkatan kevalidan atau kesa hihan suatu instrumen sedangkan reliabilitas merupakan penilaian tingkat konsistensi terhadap hasil pengukuran bila dilakukan multiple measurement pada sebuah variabel suatu alat ukur dikatakan reliabel jika alat ukur tidak berubah.
Uji Validitas
Uji validitas dilakukan dengan metode Pearson yaitu dengan mengkorelasikan skor item kuesioner dengan skor totalnya. Langkah-langkah pelaksanaannya adalah sebagai berikut:
Menghitung dan menjumlahkan skor tiap subyek
Mengkorelasikan skor tiap-tiap item dengan skor total yang diperoleh setiap subyek
Nilai r hitung dibandingkan dengan r tabel. Pilihlah item yang r hitungnya positif dan lebih besar dari r tabel
Biasanya dapat juga menggunakan patokan r minimal 0,3
Buang item yang r hitungnya kurang dari r tabel atau kurang dari 0,3 dan hitung kembali korelasinya hingga r hitung se mua item lebih dari r tabel atau lebih dari 0,3
Item yang memiliki nilai r hitung >0,3 maka item tersebut dinyatakan valid
Uji Reabilitas
Metode yang dapat digunakan pada uji reabilitas adalah metode Croncbach’s Alpha. Penghitungan Cronbach’s Alpha dilakukan dengan menghitung rata-rata interkorelasi diantara butir-butir pernyataan dalam kuesioner. Variabel dinyatakan reliabel jika alphanya lebih dari 0,3. 5.
Setelah item terpilih didapatkan, maka langkah selanjutnya adalah penskalaan respon. Penskalaan respon merupakan prosedur penempatan sejumlah alternatif respon tiap item pada suatu kontinum kuantitatif sehingga didapatkan angka sebagai skor masing-masing alternatif respon
6.
Teknik Skoring Setelah nilai tiap faktor diketahui maka dilakukan teknik skoring. Teknik skoring dilakukan untuk memperoleh data kuantitatif. Tahapan dalam terbagi menjadi 4 tahap yaitu : 1.
Pentabulasian hasil kuesioner yang telah diuji validitas dan reliabilitasnya.
2.
Penyesuaian nilai dari tiap-tiap faktor dengan skala pengukuran likert yang digunakan.
3.
Menghitung nilai indeks dari tiap-tiap faktor, dengan cara masing-masing jawaban dikalikan dengan bobot/skoring jawabannya.
4.
Hasil skoring dikembalikan lagi pada nilai skala respon untuk menghasilkan interpretasi
Skala likert hanya salah satu teknik dalam evaluasi perencanaan dan masih banyak lagi teknik analisa yang dapat dipergunakan.
3.
Skala Guttman
Skala pengkuran dengan tipe ini, akan didapat jawaban yang tegas, yaitu
“ya-tidak”, “benar -salah”, “penah-tidak pernah”, positif -negatif” dan lain-lain. Data yang diperboleh dapat berupa data interval atau rasio dikhotomi (dua alteratif). Jadi kalau pada skala Likert terdapat 3, 4, 5, 6, 7 interval dri kata “sangat
setuju” sampai “sangat tidak setuju”maka pada dalam skala Guttman hanya ada dua interval yaitu “setuju”atau “tidak setuju”. Contoh: 1)
2)
Bagaimana pendapat anda, bila orang itu menjabat Kepala sekolah disini? 1.
Setuju
2.
Tidak setuju
Pernakah Penilik Sekolah melakukan pemeriksaan di ruang kelas anda? 1.
Tidak pernah
2.
Pernah
Skala Guttman selai dapat dibuat dalam bentuk pilihan ganda, juga dapat dibuat dalam bentuk checklist. Jawaban yang dapat diskor tertinggi satu dan ter endah nol.
3. Semantic Defferensial
Skala pegukuran yang berbenuk semantic defferensial di kembangkan oleh Osgood. Skala ini juga digunakan untuk mengukur sikap, hanya bentuknya tidak pilihan ganda maupun checklist, tetapi tersusun dalam satu garis kontinum yang
jawaban “sangat positifnya”, terletak dibagian kanan garis, dan jawaban yang “sangat negatif” terletak di bagian kiri garis atau sebaliknya. Data yang diperoleh
adalah data interval, dan biasanya skala ini digunakan untuk mengukur sikap/ karakteristik tertentu yang dipunyai oleh seseorang. Contoh:
Mohon diberi nilai gaya kepemimpinan Kepala Sekolah Bersahabat
5
4
3
2
1
Tidak bersahabat
Tepat janji
5
4
3
2
1
Lupa janji
Bersaudara
5
4
3
2
1
Memusuhi
Memberi pujian
5
4
3
2
1
Mencela
Mempercayai
5
4
3
2
1
Mendominasi
Responden dapat memberi jawaban, pada rentang jawaban yang positif sampai negatif. Responden yang member penilaian pada angka 5 berarti menilai Kepala Sekolah sangat negatif dan sebaliknya.
4.
Rating Scale
Dari ketiga skala pengukuran seperti yang telah dikemukaan data yang diperoleh semuanya adalah data kualitatif yang kemudian dikuantitatifkan. Tetapi dengan rating-scale data mentah yang diperoleh berupa angka kemudan ditafsirkan dalam pengertian kualitatif. Responden menjawab, senang atau tidak senang, setuju atau tidak setuju, penah-tidak pernah adalah merupakan data kualitatif. Dalam skala model rating scale, responden tidak akan menjawab salah satu jawaban kuantitatif yang telah disedikan.Oleh karena itu rating scale ini lebih fleksibel, tidak terbatas untuk pengukuran sikap saja tetapi untuk mengukur status sosial ekonomi, kelembagaan, pengetahuan, kemampuan, proses kegiatan, dan lain-lain. Yang penting bagi penyusunan instrument dengan rating scale adalah harus dapat mengartikan setiap angka yang diberikan pada alternative jawaban seti ap item instrument.
Data dari pengukuran skilap dengan skala sikap adalah bentuk dari tada interval, demikian juga dalam pengukuran tata ruang. Tetapi data hasil dari pengukuran penambahan pengetahuan seperti tersebut diatas akan menghasilkan ratio.
*
Jenis Rating Scale
Ada beberapa jenis skala rating yang dapat digunakan, yaitu : a.
Skala grafis
Menggunakan garis lurus horizontal ataupun kadang vertikal dalam penyajiannya. Misalnya :
b.
Skala Numeris
Angka dalam kebanyakan skala rating digunakan sebagai anchor, tetapi penggunaan angka ini harus didefinisikan secara jelas. Di depan ataupun di belakang setiap deskripsi disediakan ruang untuk membubuhkan tanda (biasanya tanda √) yang menunjukkan kesesuaiannya dengan subjek yang diamati. Bentuk numeris ini kadang disertai bentuk grafis, sehingga observer atau rater hanya menandai angka yang menjadi pilihannya. Misalnya skala enam jenjang utk mengukur orientasi pelayanan pelanggan :
Atau : 1. Bagaimanakah partisipasi peserta didik dalam diskusi kelas? 1 2 3 4 5 2. Bagaimanakah hubungan peserta didik dengan kelompoknya? 1 2 3 4 5
Catatan: 1 = tidak memuaskan 2 = di bawah rata-rata. 3 = rata-rata
4 = di atas rata-rata 5 = sempurna c.
Standard Rating
Bentuk rating ini sering juga disebut sebagai skala presentase. Anchor presentase meminta observer merating subjek ke dalam suatu kontinum yang bergerak dari 0 s/d 100, dalam perbandingan dengan subjek amatan lain
atau
kelompok
khusus.
Misalnya
mengukur
interpersonal
persuasiveness ability :
d.
Cumulated Points Rating
Aitem yang disusun merupakan indikator suatu trait yang akan diukur. Skor akhir skala merupakan penjumlahan kelseluruhan aitem. Misalnya, bagaimana seorang pemilik toko mengobservasi kemampuan pegawainya dalam memberikan pelayanan pada konsumen :
e.
Force Choice Rating
Bentuk ini biasanya digunakan dalam bidang militer atau bisnis. Observer diminta memilih kalimat yang menggambarkan kondisi subjek amatan. Misalnya:
f.
Semantic Differential
Skala ini menggunakan pasangan kata sifat yang berlawanan dalam memberikan rating. Secara ringkas penyusunan skala sbb : º
Pilih suatu konsep yang akan diamati
º
Tentukan pasangan kata sifat yang akan digunakan
º
Susun kutub pasangan kata tersebut secara random Misalnya :
Kelebihan Rating Scale
-
Mudah penggunaannya.
-
Dapat mengetahui intensitas dan gambaran keadaan suatu perilaku/kejadian.
-
Dapat digunakan untuk mengkonfirmasikan antara realitas dengan persepsi subjektif rater.
Kekurangan Rating Scale
Observer dapat melakukan kesalahan dalam membuat kesimpulan, antara lain :
5.
º
Error of leniency : terlalu longgar
º
Error of central tendency : cenderung ke pusat skala
º
Hallo effect : terkesan hal umum
º
Error of logic : cenderung sama karena dianggap berhubungan
º
Error of contast : memiliki dua arah
º
Ketidakjelasan dalam penggunaan istilah
º
Social desirability effect : secara sosial lebih diterima
º
Skala rating tidak memberi informasi sebab terjadinya perilaku
º
The generosity effect : terjadi ketika ragu-ragu
º
Carry over effect : tidak memisahkan gejala
Skala Thurstone
Skala Thurstone adalah skala yang disusun dengan memilih butir yangberbentuk skala interval. Setiap butir memiliki kunci skor dan jika diurut,
kunciskor menghasilkan nilai yang berjarak sama. Skala Thurstone dibuat dalambentuk sejumlah (40-50) pernyataan yang relevan dengan variabel yang hendak diukur kemudian sejumlah ahli (20-40) orang menilai r elevansi pernyataan itudengan konten atau konstruk yang hendak diukur. Adapun contoh skalapenilaian model Thurstone adalah seperti gambar di bawah ini.Nilai 1 pada skala di atas menyatakan sangat tidak relevan, sedangkan nilai 11menyatakan sangat relevan.
BAB III KESIMPULAN A. Kesimpulan
1.
Analisis hasil tes menggunakan model penskoran dalam memberi skor tidak sama untuk setiap jenis tes. Tes pilihan ganda dan benar-salah memiliki penskoran untuk setiap jawaban benar dengan denda atau tanpa denda. Tes jawaban singkat memiliki penskoran untuk setiap jawaban benar 2 dengan jawaban tunggal diberi skor 2 dan jawaban bervariasi diberi skor sesuai kelengkapannya, misal lengkap sekali diberi skor 2, lengkap diberi skor 1,5, dan kurang lengkap diberi skor 1. Tes menjodohkan memiliki penskoran untuk setiap jawaban benar 2. Tes uraian memiliki penskoran sesuai dengan jawaban peserta didik, semakin lengkap jawaban maka semakin tinggi skor yang diperoleh. Sedangkan untuk penskoran tes tugas dibedakan menjadi beberapa aspek diantaranya aspek ketepatan waktu diberi skor 2, bentuk fisik diberikan skor 1, sistematika diberikan skor 3, kelengkapan diberikan skor 3, dan mutu hasil diberikan skor 3.
2.
Analisis hasil tes menggunakan model penskalaan dibedakan menjadi skala nominal, ordinal, interval, dan rasio dalam statistik. Sedangkan dalam menganalisis hasil tes menggunakan skala likert, skala gutman, skala diferensial, dan rating scale. Untuk rating scale terdapat skala grafik, numerik, standart rating, cumulated point rating, force choice rating, semantic differential.
B. Saran
DAFTAR PUSTAKA
Phillips, Allen D. (1979). Measurement and Evaluation in physical education. Canada: John Whiley & Sons, Inc.
Renawati, Heri. 2006. Penerapan Regresi Logistik pada Jawaban Siswa terhadap Butir Tes dengan Penskoran Dikotomus.http://eprints.uny.ac.id/11984/1/M-70%20Heri%20Renawati.pdf .