I. PENDAHULUAN A. Pengertian
Kegiatan menganalisis butir soal merupakan suatu kegiatan yang harus dilakukan guru untuk meningkatkan mutu soal yang telah ditulis. Kegiatan ini ini me meru rupa paka kan n pros proses es peng pengum umpu pula lan, n, peri pering ngka kasa san, n, dan dan peng penggu guna naan an informas informasii dari jawaban siswa untuk untuk membuat membuat keputusa keputusan n tentang tentang setiap penilaian (Nitko, 1996: 308). Tujuan Tujuan penelaahan adalah untuk mengkaji dan dan me mene nela laah ah seti setiap ap buti butirr soal soal agar agar dipe dipero role leh h soal soal yang yang berm bermut utu u sebelum sebelum soal digunakan digunakan.. Di samp samping ing itu, tuju tujuan an anal analisi isiss butir butir soal juga juga untuk membantu meningkatkan tes melalui revisi atau membuang soal yang tidak tidak efe efektif ktif,, serta serta untuk untuk men mengeta getahui hui informa informasi si diagnos diagnostik tik pada pada siswa siswa apak apakah ah me mere reka ka sudah/bel sudah/belum um memahami memahami materi materi yang telah diajarkan diajarkan (Ai (Aike ken, n, 199 1994: 63). 3). Soa Soal yang yang berm bermut utu u adal adalah ah soal soal yang ang dap dapat memberika memberikan n informasi informasi setepat-te setepat-tepatny patnya a sesuai dengan dengan tujuannya tujuannya di antaranya dapat menentukan peserta didik mana yang sudah atau belum menguasai materi yang diajarkan guru. Dala Dalam m me mela laks ksan anak akan an anal analis isis is buti butirr soal soal,, para para penu penuli liss soal soal dapa dapatt menganalisis mengan alisis secara kualitatif, kualitatif, dalam kaitan kaitan dengan isi dan bentuknya, bentuknya, dan kuantitatif dalam kaitan dengan ciri-ciri statistiknya (Anastasi dan Urbina, 1997: 172) atau prosedur peningkatan secara judgment dan prosedur pening peningkata katan n secara secara empiri empirikk (Popha (Popham, m, 1995: 1995: 195). 195). Analisi Analisiss kualitat kualitatif if mencakup mencakup perti pertimb mban anga gan n vali validi ditas tas isi dan dan ko kons nstru truk, k, seda sedang ngkan kan analisis kuantitatif kuantitatif mencakup mencakup pengukuran pengukuran kesulitan kesulitan butir butir soal dan disk rimina rim inasi si soal soa l yang termasuk validitas soal dan reliabilitasnya. Jadi, ada dua cara yang dapat digunakan dalam penelaahan butir soal yaitu penelaaha penelaahan n soal secara kualitatif kualitatif dan kuantitatif kuantitatif.. Ke Kedua dua teknik teknik ini masing-masing memiliki ke keung unggu gula lan n dan kel kelem emaha ahan. n. Ol Oleh eh karena karena itu tekn teknik ik terb terbai aikk adal adalah ah men menggu ggunak nakan an keduanya keduanya (penggabunga (penggabungan). n). Kedua Kedua cara ini diuraikan secara rinci dalam buku ini. B. Manfaat Manfaat Soal Soal yang yang Telah Telah Ditela Ditelaah ah
Tujuan utama analisis butir soal dalam sebuah tes yang dibuat guru adalah untuk mengiden mengidentifi tifikasi kasi keku kekurang rangan-k an-kekur ekuranga angan n dalam dalam tes atau dalam dalam pembe pembelaj lajara aran n (Anas (Anastas tasii dan Urbi Urbina na,, 1997 1997:1 :184 84). ). Berd Berdas asar arka kan n tujuan ini, maka kegiatan analisis butir soal memiliki banyak manfaat, di anta antara rany nya a adal adalah ah:: (1) (1) dapa dapatt me memb mban antu tu para para peng penggu guna na tes tes dala dalam m evaluasi evaluasi atas tes yang digunakan digunakan,, (2) sangat relevan relevan bagi penyusunan penyusunan tes informal dan lokal seperti tes yang disiapkan guru untuk siswa di kelas, kel as, (3) me mendu ndukun kungg penul penulisa isan n butir butir soal soal yang yang efe efekti ktif, f, (4) (4) sec secara ara materi dapat memperbaiki tes di kelas, (5) meningkatkan validitas soal dan dan reliab liabil ilit ita as (Ana (Anast stas asii and and Urbin rbina, a, 1997 1997:1 :172 72). ). Di samp sampin ingg itu, itu,
1
Panduan Analisis Butir Soal
manfaat lainnya adalah: (1) menentukan apakah suatu fungsi butir soal sesu sesuai ai deng dengan an yang yang diha dihara rapk pkan, an, (2) (2) me memb mber erii masu masukan kan ke kepa pada da siswa siswa tentang kemampuan dan sebagai dasar untuk bahan diskusi di kelas, (3) memberi memberi masu masuka kan n ke kepa pada da gu guru ru tent tentan angg ke kesu suli lita tan n sisw siswa, a, (4) (4) me memb mber erii masukan pada aspek tertentu untuk pengembangan pengembangan kurikulum, kurikulum, (5) merevisi materi yang dinilai atau diukur, diukur, (6) meningkatkan meningkatkan keterampilan penulisan soal (Nitko, 1996: 308-309). Linn dan Gronlund (1995: 315) juga menambahkan tentang pelaksanaan kegi ke giat atan an anal analis isis is buti utir soal yang hiasanya hiasanya didesain didesain untuk untuk menjawab menjawab pert anyaan-pertanyaan berikut ini. (1) Apakah fungsi soal sudah tepat? (2) Apakah soal ini memiliki tingkat kesu ke suka kara ran n yang yang tepa tepat? t? (3) Apakah Apakah soal soal bebas bebas dari dari halhal-hal hal yang yang tidak tidak relevan relevan?? (4) Apakah Apakah pilihan pilihan jawaban jawabannya nya efe efektif ktif?? Le Lebi bih h lanj lanjut ut Linn Linn dan dan Gronlund Gronlund (1995: 3 16-318) 16-318) menyatakan menyatakan bahwa kegunaan kegunaan analisis analisis butir soal bukan hanya terbatas untuk peningkatkan butir soal, tetapi ada beberapa hal, hal, yait yaitu u bahw bahwa a data data analis analisis is butir butir soal soal berman bermanfaa faatt sebaga sebagaii dasar: dasar: (1) (1) diskusi kelas efisien tentang hasil tes, (2) untuk kerja remedial, (3) untuk peningkatan secara umum pembelajaran di kelas, dan (3) untuk peningkatan keterampilan pada konstruksi tes. Berbagai Berbagai uraian di atas menunjukkan menunjukkan bahwa analisis analisis butir soal adalah: (1) untuk menentukan soal-soal yang cacat atau tidak berfungsi penggunaannya; (2) untuk untuk men mening ingkat katkan kan butir butir soal soal mel melalu aluii tiga tiga kompon komponen en analis analisis is yaitu yaitu tingkat kesukaran, daya pembeda, dan pengecoh soal, serta meningkatkan pembel pembelaja ajaran ran mel melalu aluii ambigu ambiguita itass soal soal dan ketera keterampi mpilan lan terten tertentu tu yang yang menyeb men yebabk abkan an peser peserta ta didik didik sul sulit. it. Di sampin sampingg itu, itu, butir butir soal soal yang yang telah telah dianalisis dapat memberikan informasi kepada peserta didik dan guru seperti contoh berikut ini. DATA KEMAMPUAN PESERTA DIDIK NOMOR SOAL*
NAMA SISWA
5
10 10
2
6
9
2
7
3
8
4
SKOR TOTAL#
A
1
1
1
1
1
1
0
1
0
0
7
Normal
B
I
1
1
1
1
0
1
0
0
0
6
Normal
C
0
0
0
1
0
1
1
0
1
1
5
Mengantuk dll.
D
1
0
1
0
0
0
0
0
1
1
4
Menebak
E
1
1
1
0
0
0
0
0
0
0
3
Lamban, berat
JUMLAH
4
3
4
3
2
2
2
1
2
2
KETERANGAN
Keterangan: Keterangan: 1 = soal yang dijawab benar 0 = soal yang dijawab salah * Soal disusun dari soal yang paling mudah sampai dengan soal yang paling sukar # Disusun dari skor yang paling tinggi sampai dengan skor paling rendah
Dari data di atas seperti soal nomor 3, 8, dan 4 (hanya dapat dijawab benar
2
Panduan Analisis Butir Soal
oleh 1, 2, dan 2 pesert oleh peserta a didik) didik) dapat dapat member memberika ikan n inform informasi asi kepada kepada guru guru atau pengawas tentang materi soal itu yang telah diajarkan kepada peserta didik. Mereka dapat memperbaiki diri berdasarkan informasi/data di atas. Informasi itu misalnya berupa 10 pertanyaan introspeksi diri atau penilaian diri seperti berikut ini. PENILAIAN DIRI NO
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 10.
A SPE K YA NG DITANYAK A N
YA
TI DAK
Apaka Apakah h guru guru memb membuat uat per persia siapan pan men mengaj gajar ar khu khusu susn snya ya materi yang bersangkutan? Apaka Apakah h guru guru men mengu guasa asaii mate materi ri yang yang bersa bersangk ngkuta utan? n? Apakah Apakah guru guru tela telah h meng mengaja ajarka rkan n seca secara ra maksim maksimal al materi materi yang sesuai dengan tuntutan kompetensi yang harus dikuasai peserta didik? Apak Apakah ah per peril ilaku aku yang yang diu diuku kurr pad pada a mate materi ri yan yangg ditanyakan dalam soal itu sudah tepat (harus dikuasai siswa)? Apak Apakah ah mate materi ri yang yang ditan ditanyak yakan an meru merupa paka kan n mater materii urgensi, kontinyuitas, relevansi, dan keterpakaian dalam kehidupan sehari-hari tinggi? Apakah Apakah guru guru mem memili iliki ki kreati kreativit vitas as dalam dalam memela memelajar jarkan kan materi yang bersangkutan? Apaka Apakah h gur guru u mam mampu pu me memb mban angki gkitka tkan n mina minatt dan dan kegiatan belajar peserta didik khususnya dalam membelajarkan materi yang bersangkutan? Apak Apakah ah guru guru tela telah h menyu menyusu sun n kisikisi-ki kisi si deng dengan an tepa tepatt sebelum menulis soal? Apaka Apakah h guru guru men menuli uliss soal soal ber berdas dasar arkan kan indik indikato atorr dalam kisi-kisi dan kaidah penulisan soal serta menyusun pedoman penskoran atau pedoman pengamatannya? Apakah Apakah soal soal nomo nomorr 3, 8, 8, dan 4 valid valid yaitu yaitu me memil miliki iki daya daya beda tinggi, tidak salah kunci jawaban, pengecohnya berfungsi, atau memang materinya belum diajarkan?
Keterangan: Secara jujur berilah tanda (V) (V ) pada kolom Ya dan Tidak.
3
Panduan Analisis Butir Soal
II. ANALISIS BUTIR SOAL SECARA KUALITATIF A. Pengertian
Pada prinsipnya analisis butir soal secara kualitatif dilaksanakan berdasarkan kaidah penulisan soal (tes tertulis, perbuatan, dan sikap). Penelaahan ini biasanya dilakukan sebelum soal digunakan/diujikan. Aspek yang diperhatikan di dalam penelaahan secara kualitatif ini adalah setiap soal ditelaah dari segi materi, konstruksi, bahasa/budaya, dan kunci jawaban/pedoman penskorannya. Dalam melakukan penelaahan setiap butir soal, penelaah penelaah perlu mempersiapkan mempersiapkan bahan-baha bahan-bahan n penunjan penunjangg seperti: seperti: (1) kisi-kisi tes, (2) kurikulum yang digunakan, (3) buku sumber, dan (4) kamus bahasa Indonesia. B. Teknik eknik Analis Analisis is Secar Secara a Kuali Kualitat tatif if
Ada beberapa teknik yang dapat digunakan untuk menganalisis butir soal secara kualitatif, diantaranya adalah teknik moderator dan teknik panel. Teknik moderator merupakan teknik berdiskusi yang di dalamnya terdapat satu satu orang orang sebaga sebagaii peneng penengah. ah. Berdas Berdasark arkan an teknik teknik ini, ini, setiap setiap butir butir soal soal didiskusikan secara bersama-sama dengan beberapa ahli seperti guru yang mengajar mengajarkan kan materi, materi, ahli materi, materi, penyusun/ penyusun/penge pengembang mbang kurikulum kurikulum,, ahli penilaian, ahli bahasa, berlatar belakang psikologi. Teknik ini sangat baik karena setiap butir soal dilihat secara bersama-sama berdasarkan kaidah penulisannya. Di samping itu, para penelaah dipersilakan mengomentari/ memperbaiki berdasarkan ilmu yang dimilikinya. Setiap komentar/masukan dari peserta diskusi dicatat oleh notulis. Setiap butir soal dapat dituntaskan secara bersama-sama, perbaikannya seperti apa. Namun, kelemahan teknik ini adalah memerlukan waktu lama untuk rnendiskusikan setiap satu butir soal. Teknik panel merupakan suatu teknik menelaah butir soal yang setiap butir soalnya ditelaah berdasarkan kaidah penulisan butir soal, yaitu ditelaah dari segi materi, konstruksi, bahasa/budaya, kebenaran kunci jawaban/pedoman pensko penskoran rannya nya yang yang dilaku dilakukan kan ole oleh h beber beberapa apa penela penelaah. ah. Carany Caranya a adalah adalah beberapa penelaah diberikan: butir-butir soal yang akan ditelaah, format penelaahan, dan pedoman penilaian/ penelaahannya. Pada tahap awal para penelaah diberikan pengarahan, kemudian tahap berikutnya para penelaah ber berke kerj rja a send sendir irii-se send ndir irii di temp tempat at yang yang tida tidakk sama sama.. Para ara pene penela laah ah dipe dipers rsil ilak akan an me memp mper erba baik ikii lang langsu sung ng pada pada teks teks soal soal dan dan me memb mber erik ikan an kome ko ment ntar arny nya a sert serta a me memb mber erik ikan an nila nilaii pada pada seti setiap ap buti butirr soal soalny nya a yang yang kriterianya adalah: baik, diperbaiki, atau diganti. Secara ideal penelaah butir soal di samping memiliki latar belakang materi yang diujikan, beberapa penelaah yang diminta untuk menelaah butir soal memilik memilikii keter keteramp ampila ilan, n, sepert sepertii guru guru yang yang men mengaj gajark arkan an materi materi itu, ahli ahli
4
Panduan Analisis Butir Soal
materi, ahli pengembang kurikulum, ahli penilaian, psikolog, ahli bahasa, ahli kebijakan pendidikan, atau lainnya. C. Prose Prosedur dur Analis Analisis is Secar Secara a Kualita Kualitatif tif
Dalam Dalam me menga nganal nalisi isiss buti butirr soal soal seca secara ra kuali kualitat tatif if,, pengg pengguna unaan an form format at penelaa penelaahan han soal akan sangat sangat memban membantu tu dan memper mempermuda mudah h prosedu prosedurr pelaksanaannya. Format penelaahan soal digunakan sebagai dasar untuk menganali menganalisis sis setiap setiap butir butir soal. soal. Format Format penelaahan penelaahan soal yang dimak dimaksud sud adalah format penelaahan butir soal: uraian, pilihan ganda, tes perbuatan dan instrumen non-tes. Agar penelaah dapat dengan dengan mudah mudah mengguna menggunakan kan format format penelaaha penelaahan n soal soal,, maka maka para para pene penela laah ah perl perlu u me memp mper erha hatik tikan an petu petunj njuk uk peng pengis isia ian n formatnya. Petunjuknya adalah seperti berikut ini. 1. Analisislah setiap butir soal berdasarkan semua kriteria yang tertera di dalam format! 2. Berilah tanda cek (V) pada kolom "Ya" bila soal yang ditelaah sudah sesuai dengan kriteria! 3. Berilah tanda cek (V) pada kolom "Tidak" bila soal yang ditelaah tidak sesu sesuai ai den denga gan n kriteria, kemudian tuliskan alasan pada ruang catatan atau pada teks soal dan perbaikannya. a.
Format Penelaahan Butir Soal Bentuk Uraian
FORMAT PENELAAHAN BUTIR SOAL BENTUK URAIAN Mata Pelajaran Pelajaran : ........................ ................................. ......... Kelas/semester : ................................. Penelaah : .... ........ ...... ......... ...... .... .... .... .... .... .... .... .. No.
Aspek yang ditelaah
A. 1
Materi Soal sesuai dengan indikator (menuntut tes tertulis untuk bentuk Uraian) Batasan pertanyaan dan jawaban yang diharapkan sudah sesuai Materi yang ditanyakan sesuai dengan kompetensi (urgensi, relevasi, kontinyuitas, keterpakaian seharihari tinggi) Isi materi yang ditanyakan sesuai dengan jenjang jenis sekolah atau tingkat kelas
2 3
4
B 5
6 7 8
1
2
3
Nomor Soal 4 5 6 7
8
9
…
Konstruksi Menggunakan kata tanya atau perintah yang menuntut jawaban uraian Ada petunjuk yang jelas tentang cara mengerjakan soal Ada pedoman penskorannya Tabel, gambar, grafik, peta, atau
5
Panduan Analisis Butir Soal
No.
Aspek yang ditelaah
A. 1
Materi Soal sesuai dengan indikator (menuntut tes tertulis untuk bentuk Uraian) Batasan pertanyaan dan jawaban yang diharapkan sudah sesuai Materi yang ditanyakan sesuai dengan kompetensi (urgensi, relevasi, kontinyuitas, keterpakaian seharihari tinggi) Isi materi yang ditanyakan sesuai dengan jenjang jenis sekolah atau tingkat kelas
2 3
4
1
2
3
Nomor Soal 4 5 6 7
8
9
…
Nomor Soal 2 3 4 5
…
yang sejenisnya disajikan dengan jelas dan terbaca C. 9 10 11 12 13
Bahasa/Budaya Rumusan kalimat coal komunikatif Butir soal menggunakan bahasa Indonesia yang baku Tidak menggunakan kata/ungkapan yang menimbulkan penafsiran ganda atau salah pengertian Tidak menggunakan bahasa yang berlaku setempat/tabu Rumusan soal tidak mengandung
Keterangan: Keterangan: Berilah tanda (V) bila tidak sesuai dengan aspek yang ditelaah!
b. Format ormat Pen Penela elaaha ahan n Soal Soal Bentuk Bentuk Pilih Pilihan an Ganda Ganda FORMAT PENELAAHAN SOAL BENTUK PILIHAN GANDA Mata Pelajaran Pelajaran : ........................ ................................. ......... Kelas/semester : ................................. Penelaah : .... ........ ...... ......... ...... .... .... .... .... .... .... .... .. No. A. 1
2. 3. 4. B. 5. 6.
7. 8
Aspek yang ditelaah
1
Materi Soal sesuai dengan indikator (menuntut tes tertulis untuk bentuk pilihan ganda Materi Materi yang yang ditan ditanyak yakan an sesuai sesuai deng dengan an kompet kompeten ensi si (urgensi, relevasi, kontinyuitas, keterpakaian seharihari tinggi) Pilihan ilihan jawaba jawaban n homo homogen gen dan logis logis Hany Hanya a ada ada sat satu u kun kunci ci jawa jawaba ban n Konstruksi Pokok soal dirumuskan dengan singkat, jelas, dan tegas Rumus Rumusan an pokok pokok soal soal dan piliha pilihan n jawaba jawaban n merupa merupakan kan pernyataan yang diperlukan saja Pokok Pokok soal soal tidak tidak membe memberi ri petun petunjuk juk kunc kuncii jawaba jawaban n Pokok Pokok soal soal bebas bebas dan pernya pernyataa taan n yang yang bers bersifa ifatt negatif ganda
6
Panduan Analisis Butir Soal
No.
Aspek yang ditelaah
A. 1
Materi Soal sesuai dengan indikator (menuntut tes tertulis untuk bentuk pilihan ganda Pilihan Pilihan jawaban jawaban homoge homogen n dan dan logis logis ditin ditinjau jau dari segi materi Gambar, grafik, grafik, tabel, diagram diagram,, atau sejenis sejenisnya nya jelas jelas dan berfungsi Panjang Panjang pilihan pilihan jawaba jawaban n relati relatiff sama sama Pilihan Pilihan jawaban jawaban tidak tidak menggunak menggunakan an pernyata pernyataan an "semua jawaban di atas salah/benar" dan sejenisnya Pilihan Pilihan jawaban jawaban yang yang berbentuk berbentuk angka/w angka/waktu aktu disusu disusun n berdasarkan urutan besar kecilnya angka atau kronologisnya Butir soal tidak tidak berga bergantun ntung g pada jawaban jawaban soal soal sebelumnya
9. 10. 11. 12. 13. 14.
1
Nomor Soal 2 3 4 5
…
C. Bahasa/Budaya 15. Menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia 16. Meng Menggunak gunakan an bahasa bahasa yang komunikati komunikatiff 17. Tidak Tidak menggun menggunakan akan bahasa bahasa yang yang berlaku berlaku setempat/ setempat/tabu tabu 18. Piliha Pilihan n jawaban jawaban tidak mengu mengulang lang kata/ke kata/kelomp lompok ok kata yang sama, kecuali merupakan satu kesatuan pengertian Keteran Keterangan: gan: Berilah Berilah ta nd a ( V) bila tidak sesuai sesuai dengan dengan aspek aspek yang ditelaah! ditelaah!
c. Forma t Penel enelaa aaha han n untu untuk k Instr Instrum umen en Per Perbu buat atan an FORMAT PENELAAHAN SOAL TES PERBUATAN Mata Pelajaran Pelajaran : ........................ ................................. ......... Kelas/semester : ................................. Penelaah : .... ........ ...... ......... ...... .... .... .... .... .... .... .... .. No.
Aspek yang ditelaah
1
Nomor Soal 2 3 ...
A. Materi 1. Soal sudah sesuai dengan indikator (menuntut tes perbuatan: kinerja, hasil karya, atau penugasan) 2. Pertanyaan Pertanyaan dan jawaban yang diharapkan sudah sesuai 3. Materi sesuai dengan tuntutan kompetensi (urgensi, relevansi, kontinyuitas, keterpakaian sehari-hari tinggi) 4. Isi materi yang ditanyakan sesuai dengan jenjang jenis sekolah taua tingkat kelas B. 5.
6. 7. 8. C. 9.
Konstruksi Menggunakan kata tanya atau perintah yang menuntut jawaban perbuatan/praktik Ada petunjuk yang jelas tentang cara mengejakan soal Ada pedoman penskorannya Tabel, peta, gambar, grafik, atau sejenisnya disajkian dengan jelas dan terbaca Bahasa/Budaya Rumussan soal komunikatif
7
Panduan Analisis Butir Soal
No.
Aspek yang ditelaah
Nomor Soal 1 2 3 ...
A. Materi 1. Soal sudah sesuai dengan indikator (menuntut tes perbuatan: kinerja, hasil karya, atau penugasan) 2. Pertanyaan Pertanyaan dan jawaban yang diharapkan sudah sesuai 3. Materi sesuai dengan tuntutan kompetensi (urgensi, relevansi, kontinyuitas, keterpakaian sehari-hari tinggi) 4. Isi materi yang ditanyakan sesuai dengan jenjang jenis sekolah taua tingkat kelas 10. Butir soal menggunakan bahasa Indonesia yang baku 11. Tidak menggunakan kata /ungkapan yang menimbulkan penafsiran ganda atau salah pengertian 12. Tidak menggunakan bahasa yang berlaku setempat/tabu 13. Rumusan soal tidak mengandung kata/ungkatpan yang dapat menyinggung perasaan siswa Keterangan: Berilah tanda (V) bila tidak sesuai dengan aspek yang ditelaah!
8
Panduan Analisis Butir Soal
d. Forma For matt Penela enelaaha ahan n untuk untuk Instru Instrume men n Non-T Non-Tes es FORMAT FORMAT PENELAA PENELAAHAN HAN SOAL NONNO N-TE TES S Nama ama Tes Tes : ... ......... ...... ......... ...... .... .... .... .... .... .... .... .... Kelas/semester : ................................. Penelaah : .... ........ ...... ......... ...... .... .... .... .... .... .... .... .. No.
A. 1. 2.
B. 3.
4. 5. 6. 7. 8.
9. 10. 11. 12. C. 13.
14. 15.
Aspek yang ditelaah
1
Nomor Soal 2 3 ...
Materi Pernyataan/soal Pernyataan/soal sudah sesuai dengan rumusan indikator dalam kisi-kisi. Aspek yang diukur pada setiap pernyataan sudah sesuai dengan tuntutan dalam kisi-kisi (misal untuk tes sikap: aspek koginisi, afeksi, atau konasinya dan pernyataan positif atau negatifnya). Konstruksi Pernyataan Pernyataan dirumuskan dengan singkat (tidak melebihi 20 kata) dan jelas. Kalimatnya bebas dari pernyaatn yang tidak relevan objek yang dipersoalkan atau kalimatnya merupakan pernyataan yang diperlukan saja. Kalimatnya bebas dari pernyataan yang bersifat negatif ganda. Kalimatnya bebas dari pernyataan yang mengacu pada masa lalu. Kalimatnya bebas dari pernyataan faktual atau dapat diinterpretasikan sebagai fakta. Kalimatnya bebas dari pernyataan dapat diinterpretasikan lebih d Kalimatnya bebas dari pernyataan yang mungkin disetujui atau dikosongkan oleh hampir semua responden. Setiap pernyataan hanya berisi satu gagasan secara lengkap. Kalimatnya bebas dari pernyaan yang tidak pasti pasti seperti semua, selalu, kadang-kadang, tidak satupun, tidak pernah. Jangan banyak menggunakan kata hanya, sekedar, sekedar, semata-mata. Gunakan seperlunya. Bahasa/Budaya Bahsa soa harus harus komunikatif dan sesuai dengan dengan jenjang pendidikan siswa atau responden. Soal harus menggunakan bahasa Indonesia baku. Soal tidak menggunakan bahasa yang berlaku setempat/tabu.
Keterangan: Berilah tanda (V) bila tidak sesuai dengan aspek yang ditelaah!
9
Panduan Analisis Butir Soal
III. ANALISIS BUTIR SOAL S OAL SECARA KUANTITA KUANTITATIF A. Pengertian
Penelaahan soal secara kuantitatif maksudnya adalah penelaahan butir soal didasarkan pada data empirik dari butir soal yang bersangkutan. Data empirik ini diperoleh dari soal yang telah diujikan. B. Anal Analis isis is Butir utir Soal Soal Ada dua pendek pendekata atan n dalam dalam anali analisis sis secara secara kuanti kuantitat tatif, if, yaitu yaitu pendek pendekata atan n secara klasik dan modern. 1. Klasik sik Analisis butir soal secara klasik adalah proses penelaahan butir soal melalui informasi dari jawaban peserta didik guna meningkatkan mutu butir soal yang bersangkutan dengan dengan menggunakan teori tes klasik.
Keleb elebih ihan an anal analis isis is buti butirr soal soal seca secara ra kl klas asik ik adal adalah ah mu mura rah, h, dapa dapatt dilaksanakan sehari-hari dengan cepat menggunakan komputer, murah, sederhana, familier dan dapat menggunakan data data dari dari bebe bebera rapa pa pese peserta rta didik atau sampel kecil (Millman dan Greene, 1993: 358). Adap Adapun un pros proses es anal analis isis isny nya a suda sudah h bany banyak ak dila dilaks ksan anak akan an para para gu guru ru di sekolah seperti beberapa contoh di bawah ini. a. Lang Langka kah h pert pertam ama a yang yang dila dilaku kuka kan n adal adalah ah me mena nabu bula lasi si jawa jawaba ban n yang yang telah dibuat pada setiap butir soal yang meliputi berapa peserta didik yang: yang: (1) men menjaw jawab ab benar benar pada pada setiap setiap soal, soal, (2) men menjaw jawab ab salah salah (option pengecoh), (3) tidak menjawab soal. Berdasarkan tabulasi ini, dapat diketahui tingkat kesukaran setiap butir soal, daya pembeda soal, alternatif jawaban yang dipilih peserta didik. b. Misalnya Misalnya analisis analisis untuk untuk 32 siswa, siswa, maka maka langkah langkah (1) urutkan urutkan skor skor siswa siswa dari yang tertinggi sampai yang terendah. (2) Pilih 10 lembar jawaban pada kelompok atas dan 10 lembar jawaban pada kelompok bawah. (3) Ambil kelompok tengah (12 lembar jawaban) dan tidak disertakan dalam dalam analis analisis. is. (4) Untuk Untuk masing masing-ma -masin singg soal, soal, susun susun jumla jumlah h siswa siswa kelompok atas dan bawah pada setiap pilihan jawaban. (5) Hitung tingkat kesukaran pada setiap butir soal. (6) Hitung daya pembeda soal. soal. (7) Analisi Analisiss efe efekti ktivit vitas as pengec pengecoh oh pada pada setiap setiap soal soal (Linn (Linn dan Gronlund, 1995: 318-319). Aspek yang perlu diperhatikan dalam analisis butir soal secara klasik adalah setiap butir soal ditelaah dari segi: tingkat kesukaran butir, daya pembeda butir, dan penyebaran pilihan jawaban (untuk soal bentuk obyektif) atau frekuensi jawaban pada setiap pilihan jawaban.
10
Panduan Analisis Butir Soal
a. Tingkat Kesukaran (TK)
Tingkat kesukaran soal adalah peluang untuk menjawab benar suatu soal pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam bentuk indeks. Indeks tingkat kesukaran ini pada umumnya dinyatakan dalam bentuk bentuk proporsi proporsi yang besarnya besarnya berkisar berkisar 0,00 - 1,00 (Aiken (Aik en (1994: (1994 : 66). Semakin besar indeks tingkat kesukaran yang diperoleh dari hasil hasi l hitungan, hitungan, berarti semakin mudah soal itu. Suatu soal memiliki TK= 0,00 0,00 artiny artinya a bahwa bahwa tidak ada siswa yang menjawab menjawab benar dan bila memiliki TK= 1,00 artinya bahwa siswa menjawab menjawab benar benar. Perhitun Perhitungan gan indeks indeks tingkat tingkat kesukara kesukaran n ini dilakuka dilakukan n untuk untuk setiap setiap nomor nomor soal. soal. Pada prinsipnya, skor rata-rata yang diperoleh peserta didik pada butir soal yang bersangkutan dinamakan tingkat kesukaran butir soal itu. Rumus ini ini dipergun dipergunaka akan n un untuk tuk soal soal obye obyekti ktif. f. Ru Rumu musny snya a adala adalah h seper seperti ti berikut ini (Nitko, 1996: 310). Tingkat Kesukaran (TK )
Jumah siswa yang menjawab benar butir soal =
Jumlah siswa yang mengikuti tes
Fungsi tingkat kesukaran butir soal biasanya dikaitkan dengan tujuan tes. tes. Misal Misalnya nya untuk untuk keperl keperluan uan ujian ujian semeste semesterr diguna digunakan kan butir butir soal yang memilik memilikii tingkat tingkat kes kesuka ukaran ran seda sedang ng,, un untu tukk ke kepe perl rlua uan n sele seleks ksii digunakan butir soal yang memiliki tingkat kesukaran tinggi/sukar, tinggi/sukar, dan untuk keperluan diagnostik biasanya digunakan butir soal yang memiliki tingkat kesukaran rendah/mudah. Untuk mengetahui tingkat kesukaran soal bentuk uraian digunakan rumus berikut ini. Mean
=
Jumah skor . siswa peserta tes pada suatu soal Jumlah peserta didik yang mengikuti tes
Tingkat Kesuli tan
=
Mean Skor maksimum yang ditetapkan
Hasil perhitungan dengan menggunakan rumus di atas menggambarkan tingka tingkatt kes kesuka ukaran ran soal soal itu. itu. Klasif Klasifika ikasi si tingka tingkatt kes kesuka ukaran ran soal soal dapat dapat dicontohkan seperti berikut ini. 0,00 - 0,30 soal tergolong sukar 0,31 - 0,70 soal tergolong sedang 0,71 - 1,00 soal tergolong mudah Tingkat kesukaran butir soal dapat mempengaruhi bentuk distribusi total skor skor tes. tes. Untu Untukk tes tes yang yang sang sangat at suka sukarr (TK= (TK= < 0,25 0,25)) dist distri ribu busi siny nya a berbentuk positif skewed, sedangkan tes yang mudah dengan TK= >0,80) distribusinya berbentuk negatif skewed.
11
Panduan Analisis Butir Soal
Tingkat kesukaran butir soal memiliki 2 kegunaan, yaitu kegunaan bagi guru dan kegunaan bagi pengujian dan pengajaran (Nitko, 1996: 310313). Kegunaannya bagi guru adalah: (1) sebagai pengenalan konsep terhad terhadap ap pembel pembelaja ajaran ran ulang ulang dan member memberii masuka masukan n kepada kepada siswa siswa tent tentan angg hasi hasill bela belaja jarr me mere reka ka,, (2) (2) me memp mper erole oleh h info inform rmas asii tent tentan angg penekanan kurikulum atau mencurigai terhadap butir soal yang bias. Adap Adapun un ke kegu guna naan anny nya a bagi bagi peng penguj ujia ian n dan dan peng pengaj ajar aran an adal adalah ah:: (a) (a) pengenalan konsep yang diperlukan untuk diajarkan ulang, (b) tandatanda terhadap kelebihan dan kelemahan pada kurikulum sekolah, (c) memberi masukan kepada siswa, (d) tanda-tanda kemungkinan adanya butir soal yang bias, (e) merakit tes yang memiliki ketepatan data soal. Di samp sampin ingg ke kedu dua a ke kegu guna naan an di atas atas,, dala dalam m ko kons nstr truk uksi si tes, tes, ting tingka katt kesuka kes ukaran ran butir butir soal soal sangat sangat pentin pentingg karena karena tingka tingkatt kes kesuka ukaran ran butir butir dapat: dapat: (1) mempenga mempengaruhi ruhi karakteri karakteristik stik distribusi distribusi skor (mempenga (mempengaruhi ruhi bent bentuk uk dan dan peny penyeb ebar aran an skor skor tes tes atau atau jum umla lah h soal soal dan dan ko kore rela lasi si antarsoal), (2) berhubungan dengan reliabilitas. Menurut koefisien alfa clan KR-20, semakin tinggi korelasi antarsoal, semakin tinggi reliabilitas (Nunnally, 1981: 270-271). Tingkat kesukaran butir soal juga dapat digunakan untuk mempredikst alat alat uk ukur ur itu itu send sendir irii (soa (soal) l) dan dan ke kema mamp mpua uan n pese pesert rta a didi didikk dala dalam m mema me maha hami mi mate materi ri yang yang diaj diajar arka kan n gu guru ru.. Misa Misaln lnya ya satu satu buti butirr soal soal termasuk kategori mudah, maka prediksi terhadap informasi ini adalah seperti berikut. 1) Peng engeco ecoh h butir butir soal soal itu itu tidak tidak berfun berfungsi gsi.. 2) Sebagi Sebagian an besar besar siswa siswa menjaw menjawab ab benar benar butir butir soal soal itu; artin artinya ya bahwa bahwa sebagian besar siswa telah memahami materi yang ditanyakan. Bila suatu butir soal termasuk kategori kategori sukar sukar, maka prediksi prediksi terhadap terhadap informasi ini adalah seperti berikut. 1) Butir Butir soal soal itu itu "mun "mungki gkin" n" sala salah h kunc kuncii jawab jawaban. an. 2) Butir soal itu mempunyai mempunyai 2 atau atau lebih lebih jawaban jawaban yang benar. benar. 3) Materi yang ditanyakan belum diajarkan atau belum tuntas pemb pembel elaj ajar aran anny nya, a, sehi sehing ngga ga ko komp mpet eten ensi si mini minimu mum m yang yang haru haruss dikuasai siswa belum tercapai. 4) Mate Materi ri yang yang diuk diukur ur tida tidakk coco cocokk dita ditany nyak akan an deng dengan an me meng nggu guna naka kan n bent bentuk uk soal soal yang yang dibe diberi rika kan n (mis (misal alny nya a me meri ring ngka kass ce ceri rita ta atau atau mengarang ditanyakan dalam bentuk pilihan ganda). 5) Pernyat Pernyataan aan atau kalimat kalimat soal soal terlalu terlalu komple kompleks ks dan dan panjan panjang. g.
12
Panduan Analisis Butir Soal
Namun, Namun, analisis analisis secara secara klasik klasik ini memang memang memiliki memiliki keterbatas keterbatasan, an, yaitu bahwa tingkat kesukaran sangat sulit untuk mengestimasi secara tepat karena karena estima estimasi si tingka tingkatt kes kesuka ukaran ran dibias dibiaskan kan ole oleh h sampel sampel (Halad (Haladyna yna,, 1994: 145). Jika sampel berkemampuan tinggi, maka soal akan sangat mudah (TK= >0,90). Jika sampel berkemampuan rendah, maka soal akan sangat sulit (TK = < 0,40). Oleh karena itu memang merupakan kelebihan analisis secara IRT, karena 1RT dapat mengestimasi tingkat kesukaran soal tanpa menentukan siapa peserta tesnya (invariance). Dalam IRT, komposisi sampel dapat mengestimasi parameter dan tingkat kesukaran soal tanpa bias. b. Daya Pembeda (DP)
Day Daya pem embe bed da soal soal adal dalah ke kem mamp ampuan uan suat suatu u butir utir soa soal dapat pat membedakan antara warga belajar/siswa yang telah menguasai materi yang yang ditany ditanyaka akan n dan dan warga warga belaja belajar/s r/sisw iswa a yang yang tidak/ tidak/kur kurang ang/be /belum lum menguasai materi yang ditanyakan. Manfaat daya pembeda butir soal adalah seperti berikut ini. 1) Untuk meningkatkan mutu setiap butir soal melalui data empiri empirikny knya. a. Berdas Berdasark arkan an indeks indeks daya daya pembe pembeda, da, setiap setiap butir butir soal soal dapat diketahui apakah butir soal itu baik, direvisi, atau ditolak. 2) Untuk mengetahui seberapa jauh setiap butir soal dapat mendeteksi/membedakan kemampuan siswa, yaitu siswa yang telah memaha memahami mi atau atau belum belum memaha memahami mi materi materi yang yang diajar diajarkan kan gu guru. ru. Apab Apabil ila a suat suatu u butir utir soal oal tid tidak dapa dapatt me mem mbeda bedaka kan n ke ked dua kema ke mamp mpu uan sisw siswa a itu itu, maka aka buti butirr soal soal itu itu dapa apat dicur icurig iga ai "kemungkinannya" seperti berikut ini. • Kunci Kunci jawaban butir soal itu tidak tepat. • Butir soal itu memiliki 2 atau lebih kunci jawaban yang benar • Kompetensi Kompetensi yang diukur tidak jelas • Pengecoh tidak berfungsi • Materi yang ditanyakan terlalu sulit, schingga banyak siswa yang menebak • Sebagian besar siswa yang memahami materi yang ditanyakan berpikir ada yang salah informasi dalam butir soalnya Indeks daya pembeda setiap butir soal biasanya juga dinyatakan dalam bentuk bentuk propor proporsi. si. Semaki Semakin n tinggi tinggi indeks indeks daya daya pembed pembeda a soal soal berar berarti ti sema semaki kin n mampu ampu soal soal yang ang ber bersang sangku kuta tan n membed bedakan akan warga arga belajar/siswa yang telah memahami materi dengan warga bela belaja jar/ r/pe pese sert rta a didi didikk yang yang belu belum m me mema maha hami mi mate materi ri.. Inde Indeks ks daya daya pembeda berkisar antara -1,00 sampai dengan +1,00. Semakin tinggi daya pembeda suatu soal, maka semakin kuat/baik soal itu. Jika daya pembed pembeda a neg negati atiff (<0) (<0) berar berarti ti lebih lebih banyak banyak kel kelomp ompok ok bawah bawah (warga (warga belajar/peserta didik yang tidak memahami materi) menjawab benar soal dibanding dengan kelompok atas (warga belajar/peserta didik yang memahami materi yang diajarkan guru).
13
Panduan Analisis Butir Soal
Untuk Untuk men menget getahu ahuii daya daya pembed pembeda a soal soal bentuk bentuk piliha pilihan n ganda ganda adalah adalah dengan menggunakan rumus berikut ini. DP =
BA − BB 1 N 2
atau
DP =
2(BA − BB ) N
DP = daya pembeda soal, BA = jumlah jawaban benar pada kelompok atas, ata s, BB = jumlah jawaban benar pada kelompok bawah, N=jumlah siswa yang mengerjakan tes. Di samping rumus di atas, untuk mengetahui daya pembeda soal bentuk pilihan pilihan ganda dapat dipergun dipergunukan ukan rumus korelasi korelasi point point biserial biserial (r pbis) pbis) dan korelasi biserial (r bis) (Miliman and (ireene, 1993: 359-360) dan (Glass and Stanley, 1970: 169-170) seperti berikut. rpbis =
X b − X s pq SD
dan
rbis =
Y b − Y s nb.ns . SD un n 2 − n
Xb, Yb adalah rata-rata skor warga belajar/siswa b elajar/siswa yang menjawab benar Xs, Ys adalah rata-rata skor warga belajar siswa yang menjawab salah SDt adalah simpangan baku skor total nb dan n, adalah jumlah siswa yang menjawab benar dan jumlah siswa yang menjawab salah, serta nb + n, = n. p adalah proporsi jawaban benar terhadap semua jawaban siswa q adalah I –p U adalah ordinat kurva normal.
Untuk Untuk men menget getahu ahuii daya daya pembed pembeda a soal soal bentuk bentuk uraian uraian adalah adalah dengan dengan menggunakan rumus berikut ini. DP =
Mean kelompok atas − Mean kelompok bawah Skor maksimum soal
Hasi Hasill perh erhitun itunggan den dengan gan men engg ggu unaka nakan n rumu muss di ata atas dapa dapatt mengga men ggamba mbarka rkan n tingka tingkatt kem kemamp ampuan uan soal soal dalam dalam membed membedaka akan n antar antar pese pesert rta a didi didikk yang yang suda sudah h me mema maha hami mi mate materi ri yang yang diuj diujik ikan an deng dengan an peserta didik yang belum/tidak memahami materi yang diujikan. Adapun klasifikasinya adalah seperti berikut ini (Crocker dan Algina, 1986: 315). 0,40 0,40 - 1,00 1,00 0,30 0,30 - 0,39 0,20 - 0,29 0,29 0,19 - 0,00
soal soal dit diter erim ima a baik baik soal soal diterim diterima a tetapi tetapi perlu perlu diper diperbai baiki ki soal diperbaiki diperbaiki soal tidak dipakai/dibuang
14
Panduan Analisis Butir Soal
r pbis me merup rupaka akan n korela korelasi si produ product ct moment moment antara antara skor skor dikoto dikotomus mus dan penguk pengukura uran n kriter kriterion ion,, sedang sedangkan kan rbis rbis merupa merupakan kan korela korelasi si produ product ct moment antara variabel latent distribusi normal berdasarkan dikotomi bena benarr-sa sala lah h dan dan peng penguk ukur uran an krit kriter erio ion. n. Oleh Oleh kare karena na itu, itu, un untu tukk perhitungan pada data yang sama rpbis = 0, sedangkan r bis paling sedikit 25% lebih besar daripada rpbis. Kedua korelasi ini masing-masing memilik memilikii kel kelehi ehihan han (Millm (Millman an and Green Greene, e, 1993: 1993: 360) 360) walaup walaupun un para para guru/pengambil kebijakan banyak yang suka menggunakan rpbis.
Kelebihan Kelebih an korelasi korelasi point biserial: biserial: (1) memberik memberikan an refleksi refleksi konstribus konstribusii soal secara sesungguhnya terhadap fungsi tes. Maksudnya ini mengukur bagaimana baiknya soal berkorelasi dengan criterion (tidak bagaimana baik baikny nya a bebe bebera rapa pa/s /sec ecar ara a abst abstra rak) k);; (2) (2) sede sederrhana hana dan dan lang langsu sung ng berhubungan dengan statistik tes, (3) tidak pernah mempunyai value 1,00 karena hanya variabel-variabel dengan distribusi bentuk yang sama yang dapat berkorelasi secara tepat, dan variabel kontinyu (kriterion) dan skor dikotonius tidak mempunyai bentuk yang sama. Adapun kelebihan korelasi biserial adalah: (1) cenderung lebih stabil dari sampel ke sampel, (2) penilaian lebih akurat tentang bagaimana soal dapat diharapkan untuk membedakan pada beberapa perbedaan point di skala abilitas, (3) value rbis yang sederhana lebih langsung berhubungan dengan indikator diskriminasi ICC. Contoh menghitung korelasi point biserial (rpbis). DAFTAR SKOR SISWA SOAL NOMOR 5 Nomor siswa yang menjawab benar 1 2 3 4 5 6 7 8 9 10
Jumlah
Jumlah skor keseluruhan
19 18 18 16 16 16 15 13 13 13 12 12 11
192
Nomor siswa yang menjawab salah 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Jumlah skor keseluruhan
17 16 15 14 14 12 12 12 12 12 11 11 10 9 8 8 7 200
15
Panduan Analisis Butir Soal
Juml Jumlah ah sisw siswa a yan yangg men menja jawa wab b ben benar ar = 13 13 Juml Jumlah ah sisw siswa a yan yangg men menja jawa wab b sal salah ah = 17 17 Jumlah siswa keseluruhan = 30 Rata-rata siswa siswa yang menjawab menjawab benar = 192:13 = 14,7692 Rata-rata siswa yang yang menjawab menjawab salah = 200:17 200:17 = 11,7647 Rata Rata-r -rat ata a sko skorr sis siswa wa kese keselu luru ruha han n = (19 (192+ 2+20 200) 0) :30 :30 = 13, 13,0667 0667 Simpangan baku skor total = 3,0954 Jumlah skor keseluruhan = 392 r pbis =
r pbis =
r pbis =
xb − x s SD
pq
14,7692 − 11,7647 3,0954 3,0045 3,0954
13 17 30 30
.
(0,433333)(0,566666)
=(0,9706338) (0,4955355) = 0,4809835 = 0,48 (Artinya butir soal nomor 5 diterima/baik)
Di samping samping menggunak menggunakan an kriteria kriteria di atas, untuk. menentukan menentukan diterima tid tidakny aknya a (sign signif ifik ika ansi) si) suatu uatu buti butirr dapa apat ditent tentu ukan kan den enggan menggunakan tabel Z bila n >_ 30 dengan menggunakan rumus Z= r 4 N-1 atau tabel t bila n < 30 dengan rumus t = r (N2)I(1-r2) (Bruning dan Kintz, 1987: 179-180). Contoh untuk data di atas digunakan tabel Z. Z = r N − 1 Z = 0,48√ 30-1 Z = 2,58 Dalam tabel Z dapat diketahui untuk α = 0,05 dengan 2 sisi (2 tailed), Z kritiknya adalah ±1,96 dan Z=2,58 probabilitasnya ("area di atas Z" atau "bid "bidan angg ters tersem empi pit" t")) = 0,00 0,0049 49.. Cara Carany nya a adal adalah ah liha lihatt Tabel abel Z pada pada lampiran buku ini. c. Penye enyeba barran (dis (distr trib ibus usi) i) jawa jawaba ban n
Penyebaran pilihan jawaban dijadikan dasar dalam penelaahan soal. Hal ini dimaks dimaksudk udkan an untuk untuk me menge ngetah tahui ui berfun berfungsi gsi tidakn tidaknya ya jawaba jawaban n yang yang tersedia. Suatu pilihan jawaban (pengecoh) dapat dikatakan berfungsi apabila pengecoh: 1) paling tidak dipilih oleh 5 % peserta tes/siswa, 2) lebih banyak dipilih oleh kelompok kelompok siswa siswa yang belum paham materi.
16
Panduan Analisis Butir Soal
d. Reliabilitas Reliabil itas Skor Tes
Tujuan utama menghitung reliabilitas skor tes adalah untuk mengetahui ting tingka katt ke kete tepa pata tan n (pre (preci cisi sion on)) dan dan ke keaj ajeg egan an (con (consi sist sten ency cy)) skor skor tes. tes. Inde Indeks ks reli reliab abil ilit itas as berk berkis isar ar anta antara ra 0 - 1. Sema Semaki kin n ting tinggi gi ko koef efis isie ien n reliabilitas suatu tes (mendekati 1), makin tinggi pula keajegan/ketepatannya. Tes yang Tes yang me memi mili liki ki ko kons nsis iste tens nsii reli reliab abil ilit itas as ting tinggi gi adal adalah ah akur akurat at,, repr reprod oduc ucib ibel el,, dan dan ge gene nera rali lize zed d terh terhad adap ap ke kese semp mpat atan an test testin ingg dan dan inst instru rume men n tes tes lain lainny nya. a. Seca Secara ra rinc rincii fakt faktor or yang yang me memp mpen enga garu ruhi hi reliabilitas skor tes di antaranya: 1) Semaki Semakin n banyak banyak juml jumlah ah butir butir soal soal,, semaki semakin n ajek ajek suatu suatu tes. tes. 2) Sema Semaki kin n lama lama wakt waktu u tes, tes, sem semak akin in aje ajek. k. 3) Sema Semaki kin n semp sempit it range ange ke kesu suka kara ran n buti butirr soal soal,, sema semaki kin n besa besarr keajegan. 4) Soal-soal yang saling berhubungan akan mengurangi keajegan. 5) Semakin objektif pemberian skor, semakin besar keajegan. 6) Ketid etidak akte tepa pata tan n pemb pember eria ian n skor skor. 7) Men Menjaw jawab ab besar besar soal soal deng dengan an cara cara men meneba ebak. k. 8) Semakin homogen materi semakin besar keajegan. 9) Pengalaman peserta ujlan. 10) Salah penafsiran terhadap butir soal. 11) Menjawab Menjawab soal dengan dengan buru-b buru-buru/ uru/cepat cepat.. 12) Ke Kesiapa siapan n menta mentall pesert peserta a ujian. ujian. 13) Adanya Adanya ganggu gangguan an dalam dalam pelaksa pelaksanaan naan tes. 14) Jarak Jarak antara antara tes tes pertama pertama dengan dengan tes kedua. kedua. 15) Mencontek Mencontek dalam mengerja mengerjakan kan tes. 16) Posisi Posisi individ individu u dalam dalam belajar belajar.. 17) Kondi Kondisi si fisik fisik pesert peserta a ujian. ujian. Ada 3 cara yang dapat dilakukan untuk menentukan reliabilitas skor tes, yaitu : 1) Keajeg Ke ajegan an pengukuran pengukuran ulang: ulang: kesesuaian kesesuaian antara antara hasil pengukuran pengukuran pertama dan kedua dari sesuatu alat ukur terhadap kelompok yang sama. 2) Keajeg Ke ajegan an pengukur pengukuran an setara: setara: kesesuaia kesesuaian n hasil pengukuran pengukuran dan 2 atau lebih alat ukur berdasarkan kompetensi kisi-kisi yang lama. 3) Keajegan belah dua: kesesuaian antara hasil pengukuran belahan pertama dan belahan kedua dari alat ukur yang sama. Penggunaan rumus untuk mengetahui koefisien ketiga jenis reliabilitas di atas dijelaskan secara rinci berikut ini. e. Reliabilitas Instrumen I nstrumen Tes Tes (soal bentuk pilihan ganda)
Untuk mengetahui koefisien reliabilitas tes soal bentuk pilihan ganda digunakan rumus Kuder Richadson 20 (KR-20) seperti berikut ini.
17
Panduan Analisis Butir Soal
KR − 20 =
k 1 − k − 1
∑ p(1− p) (SD )2
Keterangan: k : Jumlah butir soal 2 (SD) : Varian Contoh menghitung KR-20: Siswa A B C D E F p
Soal 1 1 1 0 0 1 1 0 ,6 7
2 0 1 0 0 1 1 0 ,5 0
3 0 0 1 0 0 1 0 ,3 3
( 1 - p) p(1-p) Σ p (1 - p) Jumlah siswa swa J u n la h s k o r
: 0, 0, 3 3 : 0, 0,22 : 0, 0, 2 2 = 6 orang ang = 12
Varia nce
= Σ ( X − x )2 /N
4 0 0 1 0 1 1 0,50
0,50 0,25 + 0,25 +
Σ Skor 1 2 2 0 3 4 12
X
2 2 2 2 2 2
X
−
X
-1 0 0 -2 -1 -2
( X − x )
2
1 0 0 4 1 4 10
0 ,6 7 0,50 0 ,2 2 0,25 0 ,2 2 + 0 , 2 5 = 0 ,9 4 4
=10:6 =1,67 Standar Deviasi Deviasi =√1,67 =1,29
∑ p(1− p)
KR − 20 =
k 1 − k − 1
KR − 20 =
4 0,944 1− 4 − 1 1,67
(SD)2
= 0,58 0,58 (Arti (Artiny nya a bahw bahwa a ting tingka katt ke keaj ajeg egan an tes tes ini ini renda rendah. h. Hal Hal ini ini disebabkan butir soal yang dianalisis hanya 4 butir soal) Di samp samping ing KR-2 KR-20 0 di atas, atas, ada ada tekn teknik ik lain lain un untu tukk me meng nghi hitun tungg reliabilitas reliabilitas tes, yaitu yang dikembangkan oleh Spearman-Brown. Caranya adalah dengan mengelompokkan nomor butir yang ganjil dan genap. Perhatikan contoh berikut ini.
18
Panduan Analisis Butir Soal
Soal
Nama Peserta Didik Nur Chasanah Salim Alkhasan Abdul Latif Choeroddin Moh Chanif Rofi’ah
1 1 1 0 0 1 1
2 0 1 0 0 1 1
3 0 0 1 0 0 1
4 0 0 1 0 1 1
p
0,67
0,50
0,33
0 ,5 0
Butir Butir Skor Z Ganjil Genap Ga n ji l (1+3) (2+4) 1 0 0 1 1 0 1 1 0 0 0 -1,72 1 2 0 2 2 +1,72
Nama Peserta Didik Nur Chasanah Salim Alkhasan Abdul Latif Choeroddin Moh Chanif Rofi’ah p
0,67
n= 6 Mean SD
= =
1,0 0,58
0 ,5 0 1,0 0,82
0,33
Σ Skor 1 2 2 0 3 4 12
untuk Ge n a p
Zgan xZ gen
-1,22 0 0 -1,22 +1,22 +1,22
0 0 0 2,10 0 2,10
0,50
12 Jumlah= 4,2
∑ Z
xZ gan gen
r 12 =
r 12 =
n
4,2
6 = 0,70
reliabilit as Spearman Brown =
2r 1.2 1 + r 1.2
=
2. (0,70) 1 + 0,70
= 0,82
(Artinya bahwa tingkat keajegan/konsistensi tes ini adalah tinggi, sehingga skor tes ini dapat dipercaya penggunaannya.)
19
Panduan Analisis Butir Soal
2. Modern
Analis Anal isis is buti butirr soal soal seca secara ra mode modern rn yait yaitu u pene penela laah ahan an buti butirr soal soal deng dengan an menggunakan Item Response Theory (IRT) atau teori jawaban butir soal. Teori ini merupakan suatu teori yang menggunakan fungsi matematika untuk meng me nghu hubu bung ngka kan n anta antara ra pelu peluan angg me menj njaw awab ab bena benarr suat suatu u scal scal deng dengan an kemamp kem ampuan uan siswa. siswa. Nama Nama lain lain IRT IRT adalah adalah latent latent trait trait theory theory (LTT) (LTT),, atau atau characteristics characteristics curve theory (ICC). Asal mula IRT adalah kombinasi suatu versi hukum phi-gamma dengan suatu analisis faktor butir soal (item factor analisis) kemudian bernama Teori Teori Trait Trait Latent Latent (Late (Latent nt Trait rait The Theory ory), ), kem kemudi udian an sek sekara arang ng secara secara umu umum m dikena dikenall menjadi teori jawaban butir soal (Item Response Theory) (McDonald, 1999: 8). Dalam subbab ini akan disajikan kelebihan analisis secara IRT dan kalibrasi butir soal dan pengukuran kemampuan orang. 1. Keleb Kelebiha ihan n Anal Analisi isiss IRT
Untu Untukk me meng nget etah ahui ui ke kele lebi biha han n anal analis isis is IRT IRT, maka maka para para gu guru ru perl perlu u mengetahu mengetahuii keterbata keterbatasan san analisis analisis secara secara klasik. klasik. Keterba Keterbatasan tasan model pengukuran secara klasik bila dibandingkan dengan teori jawaban butir soal adalah seperti berikut (Hambleton, Swaminathan, dan Rogers, 1991: 2-5). (1) Tingkat Tingkat kemampuan dalam teori klasik adalah "true score". Jika tes sul sulit it artiny artinya a tingka tingkatt ke kemam mampua puan n peser peserta ta didik didik mudah. mudah. Jika Jika tes mudah mudah artinya tingkat tingkat kemampuan kemampuan peserta peserta didik tinggi. tinggi. (2) Tingk Tingkat at kesukaran soal didefinisikan sebagai sebagai proporsi proporsi peserta didik dalam grup yang menjawab benar soal. Mudah/sulitnya butir soal tergantung pada kema ke mamp mpua uan n pese pesert rta a didi didikk yang yang dite ditess dan dan ke kema mamp mpua uan n tes tes yang yang dibe diberi rika kan. n. (3) (3) Daya Daya pemb pembed eda, a, reli reliab abil ilit itas as,, dan dan vali validi dita tass soal soal/t /tes es didefi didefinis nisika ikan n berdas berdasark arkan an grup grup pesert peserta a didik. didik. Adapun Adapun kel kelebi ebihan han IRT IRT adalah bahwa: (1) IRT tidak berdasarkan grup dependent, (2) skor siswa dideskripsikan bukan test dependent, (3) model ini menekankan pada tingkat butir soal bukan tes, (4) IRT tidak memerlukan paralel tes untuk menent men entuka ukan n relil relilabi abilit litas as tes, tes, (5) IRT IRT suatu suatu model model yang yang memerl memerluka ukan n suatu pengukuran ketepatan untuk setiap skor tingkat kemampuan.
20
Panduan Analisis Butir Soal
Kelem lemaha ahan teor teorii tes tes kl klas asik ik di atas tas dipe diperrku kuat at Hamb Hamble leto ton n dan Swaminathan (1985: 1-3) yaitu: (1) tingkat kesukaran dan daya pembeda tergan tergantun tungg pada pada sampel sampel;; (2) penggu penggunaa naan n metode metode dan teknik teknik untuk untuk desain dan analisis tes dengan memperbandingkan kemampuan siswa pada pernbagian kelompok atas, tengah, bawah. Meningkatnya validitas skor skor tes tes dipe dipero role leh h dari dari ting tingka katt ke kesu suka kara ran n tes tes dihu dihubu bung ngka kan n deng dengan an tingkat kemampuan setiap siswa; (3) konsep reliabilitas tes didefinisikan dari istilah tes paralel; (4) tidak ada dasar teori untuk menentukan bagaimana siswa memperoleh tes yang sesuai dengan kemampuan siswa; (5) Standar error of measurement (SEM) hanya berlaku untuk seluruh peserta didik. Selanjutnya Hambleton dan Swaminathan (1985: 13) menyatakan bahwa tujuan utama IRT adalah memberikan kesamaan antara statistik soal dan esti estima masi si ke kema mamp mpua uan. n. Ada Ada tiga tiga ke keun untu tung ngan an IRT IRT adal adalah ah:: (1) (1) asum asumsi si bany banyak ak soal soal yang yang diuk diukur ur pada pada trai traitt yang yang sama sama,, perk perkir iraa aan n ting tingka katt kemampuan peserta didik adalah independen; (2) asumsi pada populasi tingkat kesukaran, daya pembeda merupakan independen sampel yang menggambarkan untuk tujuan kalibrasi soal; (3) statistik yang digunakan untu un tukk me meng nghi hitu tung ng ting tingka katt ke kema mamp mpua uan n sisw siswa a dipe diperk rkir irak akan an dapa dapatt terlaksana, (Hableton dan Swaminathan, 1985: 11). Jadi IRT merupakan hubungan antara probabilitas jawaban suatu butir soal yang benar dan kema ke mamp mpua uan n sisw siswa a atau atau ting tingka kata tan/ n/le leve vell pres presta tasi si sisw siswa. a. Namu Namun n kelema kel emahan han beker bekerja ja dengan dengan model model IRT IRT adalah adalah beker bekerja ja mel melalu aluii suatu suatu proses yang sulit karena kelebihan IRT adalah: (1) tanpa varian pada parame parameter ter butir butir soal, soal, (2) tanpa tanpa varian varian pada pada parame parameter ter abilit abilitas, as, (3) adanya ketepatan pada pengukuran lokal, (Bejar, 1983: 3-4). Ada empat macam model 1RT (Hambleton, 1993: 154-157; Hambleton dan dan Swam Swamin inat atha han, n, 1985 1985:: 34-5 34-50) 0).. (1) (1) Mo Mode dell satu satu para parame mete terr (M (Mod odel el Rasch), yaitu untuk menganalisis data yang hanya menitikberatkan pada parameter tingkat kesukaran coal. (2) Model dua paremeter, paremeter, yaitu untuk menganalisis data yang hanya menitikberatkan pada parameter tingkat kesukaran dan daya pembeda soal. (3) Model tiga parameter, yaitu untuk meng me ngan anali alisi siss data data yang yang me meni niti tikb kber erat atka kan n pada pada para parame mete terr ting tingka katt kesukaran soal, daya pembeda soal, dan menebak (guessing). (4) Model empat parameter, yaitu untuk menganalisis data yang menitikberatkan pada parameter parameter tingkat kesukaran kesukaran soal, daya beda soal, menebak, dan penyebab lain. Hambleton dan Swaminathan (1985: 48) menjelaskan bahwa siswa yang memiliki kemampuan tinggi tidak selalu menjawab soal dengan betel. Kadang-kadang mereka sembrono (mengerjakan dengan serampangan), memiliki informasi yang berlebihan, sehingga mereka menjawab salah pada pada suat suatu u soal soal.. Untu Untukk me meng ngat atas asii masa masala lah h ini ini dipe diperl rluk ukan an mode modell 4 parameter.
21
Panduan Analisis Butir Soal
Dari keempat model itu tidak sama penekanannya dan sudah barang tentu tiap-tiap model itu memiliki kelebihan dan kekurangan. Kelebihan dan dan ke keku kura rang ngan an itu itu dapa dapatt dikl diklas asif ifka kasi sika kan n sesu sesuai ai deng dengan an juml jumlah ah parame parameter ter yang yang ditent ditentuka ukan n pada pada masin masing-m g-masi asing ng model model dan tujuan tujuan menggunakan model yang bersangkutan. Adapun contoh kurva ciri soal model satu parameter atau Rasch terlihat seperti pada grafik di bawah ini. Peluang menjawab benar
1,00 0,90 1
2
3
0,50
0,30 -3
-2
-1
-0,52
0
0,87 1
1,28
Kemampuan Siswa
2. Kalibrasi Butir Soal dan Pengukuran Kemampuan Orang.
Kalibr Kalibrasi asi butir butir soal soal dan penguku pengukuran ran kemampu kemampuan an orang me merup rupaka akan n proses estimasi parameter pada model respon butir. Model persamaan dasar Rasch adalah model probabilistik yang mencakup hasil dari suatu intera interaksi ksi butir butir soal-o soal-oran rang. g. Proses roses men menges gestim timasi asi kem kemamp ampuan uan orang orang dinama dinamakan kan pengu pengukur kuran, an, sedang sedangkan kan proses proses me menge ngesti stimas masii parame parameter ter tingka tingkatt kes kesuka ukaran ran butir butir soal soal dinama dinamakan kan kalibr kalibrasi asi.. Jadi Jadi kalibr kalibrasi asi soal soal merupakan proses penyamaan skala soal yang didasarkan pada tingkat kesukaran butir soal dan tingkat kemampuan siswa. Adapun ciri suatu skala adalah mempunyai titik awal, biasanya 0, dan mempunyai satuan ukuran atau unit pengukuran. Prosedur estimasi dapat dilakukan dengan tangan atau komputer. Ada beberapa langkah yang dapat dilakukan dalam mengkalibrasi butir dan menguki.r kemampuan orang dengan tangan (Wright and Linacre, 1992: 32-45) seperti berikut ini. a. Meny Menyus usun un jawab jawaban an peser peserta ta didik didik un untu tukk seti setiap ap butir butir soal ke dalam dalam tabel. Dalam Dalam me menyu nyusun sun jawaba jawaban n pesert peserta a didik didik untuk untuk setiap setiap butir butir ke
22
Panduan Analisis Butir Soal
dalam tabel perlu disediakan disediakan kolom: (1) siswa, siswa, (2) butir soal, (3) skor siswa, dan (4) skor butir soal. Data berbentuk angka 1 untuk jawaban benar dan 0 untuk jawaban salah. b. Mengedit da data Berdas Berdasark arkan an model model Rasch, Rasch, butir butir soal soal yang yang dijawa dijawab b siswa siswa betul betul semua atau salah semua dan siswa yang dapat menjawab dengan betul semua atau salah semua, soal atau siswa yang bersangkutan tidak dianalisis atau dikeluarkan dari tabel. Pada langkah kedua ini perlu disediakan tambahan kolom: (1) proporsi skor siswa dan (2) proporsi proporsi skor butir butir soal. Propo Proporsi rsi skor peserta peserta didik adalah adalah skor siswa : jumlah jumlah butir butir soal; sedangkan sedangkan proporsi skor soal adalah skor soal : jumlah siswa. c. Meng Menghi hitu tung ng dist distri ribu busi si sko skorr soa soall Berdasarkan skor soal yang sudah diedit, maka skor soal diklasifikasikan menjadi beberapa kelompok berdasarkan skor yang sama. Untuk memudahkan penghitungan Distribusi skor butir soal, maka perlu disusun beberapa kolom di dalam tabel, seperti kolom: (1) kelompok skor soal (i) yaitu kelompok skor yang didasarkan pada skor soal yang sama, kolom ini berhubungan berhubungan langsung dengan kolom 2 dan kolom 3; (2) nomor butir soal, (3) skor soal (Si), (4) frekuensi soal (Fi) yaitu jumlah soal yang memiliki skorsoal sama; (5) proporsi benar (Pi) yaitu Si : jumlah peserta tes; (6) proporsi salah (1-Pi), (7) logit (log odds unit)-proporsi salah (Xi) yaitu Ln [(1 -Pi)/Pi], -Pi)/Pi], (8) hasil kali frekuensi soal dengan logit proporsi salah (FiXi), (9) kuadrat logit proporsi salah (FiXi)2 , (10) hasil kali frekuensi soal dengan kuadrat logit proporsi salah(FiXi2), (11) inisial kalibrasi butir soal yaitu di° = Xi - nilal rata-rata skor soal, dan (12) hasil kali antara frekuensi soal dengan kuadrat nilai rata-rata skor coal (FIX ?). d. Menghi Menghitun tungg distri distribus busii skor skor pesert peserta a didik. didik. Untuk Untuk memudahkan memudahkan di dalam menghit menghitung ung distribusi distribusi skor skor peserta peserta didik perlu disusun beberapa kolom yaitu kolom: (1) kemungkinan skor peserta didik (r) yang disusun secara berurutan dimulai dan skor terendah sampai sampai tertinggi; (2) skor peserta didik, didik, yaitu berupa berupa toli skor peserta didik; (3) frekuensi peserta didik (nr) yang memperoleh skor; (4) proporsi benar (Pi -) yaitu skor peserta didik dibagi dibagi jumlah jumlah soal, (5) logit proporsi benar (Yr) yaitu Ln [Pr/(1-Pr)]; (6) perkalian antara frekuensi siswa dengan logit proporsi benar (nrYr); (7) logic proporsi benar yang dikuadraktan (Yr kuadrat); (8) hasil perkalian antara antara frekuens frekuensii peserta peserta didik didik dengan dengan logic logic propor proporsi si benar benar yang yang dikuad dikuadrat ratkan kan (nrYr (nrYr kuadra kuadrat); t); (9) inisia inisiall pengu pengukur kuran an ke kemam mampua puan n peserta didik (br Yr); (10) perkalian antara frekuensi peserta didik dengan nilai rata-rata skor peserta didik (nrYr kuadrat). e. Me Meng nghi hitu tung ng fakt faktor or eksp ekspan ansi si kema kemamp mpua uan n pese pesert rta a didi didikk (x) (x) dan dan kesu ke suka kara ran n buti butirr soal soal (Y). (Y). Dala Dalam m me meng nghi hitu tung ng fakt faktor or ek eksp span ansi si diperlukan variasi distribusi kelompok skor soal (U) dan variance
23
Panduan Analisis Butir Soal
distri distribus busii kel kelomp ompok ok skor skor siswa siswa (V). (V). Faktor Faktor eks ekspan pansi si kem kemamp ampuan uan peserta didik terhadap keluasan tes adalah X = [ (I 4-U/2,89)/ (1UV/8,35)]" 2 Faktor Faktor ekspansi ekspansi kemampuan kemampuan peserta peserta didik terhadap penyebaran sampel adalah X =_ [ (1+U/2,89)/ (1-UV/8,35)] (1-UV/8,35)]12 f.
Menghitun Menghi tungg tingkat tingkat kesuk kesukara aran n dan kesal kesalaha ahan n standar standar buti butirr soal soal Dalam menghitung menghitung tingkat tingkat kesukaran kesukaran dan kesalahan kesalahan standar soal perlu perlu disusu disusun n bebera beberapa pa kol kolom om di dalam dalam tabel, tabel, yaitu yaitu kol kolom: om: (1) kelompok skor soal (1); (2) nomor soal; (3) inisial kalibrasi soal (d); (4) faktor ekspansi kesukaran soal terhadap penyebaran sampel (Y); (5) tingkat kesukaran soal atau Yd; = d;; (6) skor soal (S); (7) kesalahan standar kalibrasi soal yang dikoreksi [SE(di)] atau SE = [ N/Si (N-Si)] ll2
g. Menghi Menghitun tungg tingkat tingkat kemam kemampua puan n dan kesala kesalahan han stand standar ar siswa siswa Dalam menghitung tingkat kemampuan dan kesalahan standar siswa disusun beberapa kolom, yaitu kolom: (1) kemungkinan skor siswa (r); (2) initial pengukuran kemampuan siswa (br); (3) faktor ekspansi kema ke mamp mpu uan sisw siswa a ter terhada adap ke kelluasa uasan n tes tes (X); (X); (4) tingk ingkat at kemampuan siswa (br) atau (Xbr); (5) kesalahan standar pengukuran kemampuan siswa yang dikoreksi [SE (br)] yaitu X [ L/r (L-r)] 112 ; (6) peserta tes. h. Menghi Menghitun tungg probabil probabilita itass atau peluang peluang menjaw menjawab ab benar benar setiap setiap butir butir soal [P(0)}. Untuk menghitung peluang menjawab benar setiap butir pada model Rasch atau model satu parameter digunakan rumus berikut ini. e IX° - bi) 1 Pi (0) = atau Pi (0) = 1 + e D(O - bi) 1 + e D(E) - bi) Estimasi data yang lebih teliti dan akurat hasilnya adalah menggunakan komp ko mput uter er sepe sepert rtii me meng nggu guna nakan kan prog progra ram m Bigs Bigste teps ps.. Dala Dalam m prog progra ram m Bigste Bigsteps, ps, estima estimasi si data data diguna digunakan kan me metod tode e Appoxi Appoxima mation tion Maximu Maximum m Likeli Lik elihoo hood d (PROX) (PROX) dan Uncond Unconditi itiona onall Maxim Maximum um Lik Likeli elihoo hood d (UCON (UCON). ). Untuk menghasilkan hasil yang akurat, estimasi data dengan komputer dapat dapat mel melaku akukan kan iteras iterasii maksim maksimum um untuk untuk metode metode PROX, PROX, misal misal bisa bisa sampai 20 kali kemudian dilanjutkan dengan metode UCON sampai dengan 50 kali tergantung banyaknya data. Perbedaan hasil kalibrasi pada setiap iterasi semakin lama semakin kecil dan akan berhenti bila prosesnya sudah terpenuhi (converge) atau lebih kecil dari 0,01. Kriteria data sesuai dengan model Rasch adalah apabila hasil korelasi point bhiserial tidak negatif dan outfitnya < 2 baik outfit butir soal maupun outfit orang. Hal ini menunjukkan bahwa data adalah fit dengan
24
Panduan Analisis Butir Soal
model. Maksudnya bahwa data soal sesuai dengan model Rasch atau valid yang memiliki mean= 0 dan SD=1. Metode pengujian fit tergantung pada pada juml jumlah ah buti butirr soal soal dala dalam m tes: tes: (a) (a) tes tes sang sangat at pend pendek ek (10 (10 atau atau beberapa butir), (b) tes pendek (11-20 butir), atau (c) tes panjang ( >20 butir). Outfit orang maksudnya statistik orang menunjukkan bagaimana perilaku yang yang tida tidakk diha dihara rapk pkan an pada pada buti butirr soal soal yang yang me memp mpun unya yaii ting tingka katt kesukaran jauh dengan kemampuan orang yang bersangkutan. Adapun Outfit Outfit butir butir maksud maksudnya nya statis statistik tik butir butir soal soal men menunj unjukk ukkan an bagaim bagaimana ana perilaku yang tidak diharapkan dari orang yang mempunyai kemampuan lebih dengan tingkat kesukaran butir yang bersangkutan. Dala Dalam m pela pelaks ksan anaa aann nnya ya,, anal analis isis is seca secara ra IRT IRT tida tidakk seru serumi mitt sepe sepert rtii penjelasan di atas. Pelaksanaannya sangat mudah dipahami oleh para guru gu ru kare karena na dala dalam m anal analis isis is digu diguna naka kan n prog progra ram m ko komp mput uter er,, sepe sepert rtii program RASCAL, PASCAL, BIGSTEPS, atau QUEST. QUEST. Untuk mengenal lebih jauh program-program ini, bacalah pada bab berikut.
25
Panduan Analisis Butir Soal
IV. IV. ANALISIS BUTIR SOAL DENGAN KALKULATOR
A. Pengertian
Analisis butir soal dengan kalkulator maksudnya adalah penelaahan butir soal soal seca secara ra ku kuan anti tita tati tiff yang yang peng penghi hitu tung ngan anny nya a me meng nggu guna naka kan n bant bantua uan n kalkulator. Kalkulator yang digunakan di dalam menganalisis data adalah kalkulator scientifics atau kalkulator statistik, misalnya seperti CASIO fx 3600P. Setiap kalkulator, khususnya kalkulator statistik, cara pengopera pengoperasiann siannya ya tergantun tergantungg pada versinya versinya masing-ma masing-masing. sing. Setiap Setiap versi versi memiliki ciri khusus dalam pengoperasiannya. Oleh karena itu, apabila para guru gu ru me memb mbel elii kalk kalkul ulat ator or stat statis isti tikk pada pada ve vers rsii terb terbar aru, u, baca bacala lah h buku buku manualnya. Karena semua petunjuk pengoperasionalnya ada di dalamnya. Sebagai Sebagai pengenalan pengenalan awal dalam buku ini, kalkulator kalkulator yang digunakan digunakan untuk memberi penjelasan adalah menggunakan kalkulator "lama" yaitu CASIO fx3600P. Adapun penggunaannya ada 4 aspek yang perlu diperhatikan, yaitu: (1) pembersihan data, (2) fungsi SD, (3) fungsi LR, (4) teknik merandom data. B. Pembers bersih ihan an Da Data
Sebelum kalkulator digunakan untuk menganalisis data sebaiknya data yang berada di dalam kalkulator perlu dibersihkan terlebih dahulu. Maksudnya agar hasil analisisnya tidak tercemari dengan data-data atau angka yang sudah digunakan di dalam kalkulator. Cara pembersihannya adalah tekan tombol ON, INV, INV, AC. Apabila masih belum bersih bersih,, tekanl tekanlah ah tombol tombol MR, M+. Apabila Apabila masih masih belum belum bersih bersih,, tekanl tekanlah ah tombol MODE, . , INV, INV, AC. C. Fungsi SD
Fungsi Fungsi SD me merup rupaka akan n perhit perhitung ungan an yang yang berhub berhubung ungan an dengan dengan standa standard rd deviasi. Sebelum memulai memasukkan data, munculkanlah kata SD pada layar kalkulator. Caranya adalah dengan menekan tombol MODE, 3. Setelah di layar kalkulator muncul SD, maka langkah selanjutnya adalah memulai memasukkan data. Carany Caranya a adalah adalah me memas masukk ukkan an hanya hanya skor skor siswa siswa (55, (55, 54, 51, 55, 53; tidak tidak perlu memasukkan "nomor/nama siswa") seperti berikut.
26
Panduan Analisis Butir Soal
No. 1. 2. 3. 4.
Siswa A B C D E
Skor X 55 5 51 55 53
Tekan tombol RUN RUN RUN RUN RUN (Tampak di layar kalk ulator 53)
Hasilnya adalah seperti berikut ini. M e n gh i t u n g -
Tek an tombo l
SD sampel SD populasi Mean Jumlah data Jum lah sk or Ju ml ah ku adr at sk o r
I N V, 3 INV, 2 INV, 1 K O U T, 3 K O U T, 2 K O U T, I
Tampak di layar kalkulator 1.67 332 0 1 .4 9 66 62 5 3.6 5. 268 1 4 37 6
D. Fungsi LR
Fung Fungsi si LR me meru rupa paka kan n perh perhit itun unga gan n yang yang berh berhub ubun unga gan n deng dengan an Lini Linier er kata LR Regres Re gression. sion. Sebelum Sebelum memulai memulai memasukka memasukkan n data, munculkan munculkanlah lah kata pada layar kalkulator. Caranya adalah dengan menekan tombol MODE, 2. Setelah di layar kalkulator muncul LR, maka langkah selanjutnya adalah memulai memasukkan data. Caranya adalah memasukkan hanya skor siswa (tidak perlu memasukkan "nomor/nama siswa") seperti berikut. No. Siswa 1. 2. 3. 4. 5. 6.
Skor X
A B C D E F
55 52 54 53 53 54
Tekan tombol [ (... [( ... [( ... [ ( .. . [(… [( ...
Skor Y
Tekan tombol tombol
75 RUN 60 RUN 66 RUN 80 RUN 85 RUN 70 RUN (Tampak di layar kalkulator 70.)
Hasilnya adalah seperti berikut ini.
-
Men ghit un g Mean X SD sampel X SD SD populasi X Mean Y S D sam pel Y
Tek an t ombol INV, 1 INV, 3 INV, 2 IN V, 4 IN V, 6
Tampak di layar kalkulator 5 3 .5 1 .0 48808 8 0 . 95 7 4 2 71 7 2 .6 6 6 6 6 9 . 20 1 4 4 9
27
Panduan Analisis Butir Soal
-
Men ghit un g SD popu popula lasi si Y Korelasi XY A Constant in regression B Regression coefficients Y XY SX1 ZX Tn V Y'
Tek an t ombol INV, 5 IN V, 9 INV, 7 IN V, 8 K OUT, 6 K OUT, I K O UT, 2 K OUT, 3 K OUT, 4 K O U T, 5
Tampak di layar kalkulator 8.399735 0 .1 6 57 9 3 - 5.15 15 1 .4 5 45 2333 4 1717 9 321 6 3 21 0 6 4 36
E. Cont Contoh oh Mer Merando andom m data data
Untuk merandom data, tekan tomhol INV dan tanda titik. Tampak di layar misalnya angka 0,425. BiIa yang dirandom menggunakan satu digit, maka angka yang digunakan adalah satu angka setelah koma, yaitu angka 4. Bila dua digit yang digunakan adalah dua angka setelah koma, yaitu 42. Bila tiga digit angka yang digunakan adalah tiga angka setelah koma, yaitu 425. Contoh misalnya merandom kunci jawaban butir soal untuk pilihan ganda. Kunci A= 1, B=2, C=3, D=4. Angka yang digunakan adalah hanya satu digit. Jadi berdasarkan hasil random dari kalkulator di atas, maka soal nomor I kuncii jawabanny kunc jawabannya a adalah adalah D (karena (karena angka 4= D). Kemudian Kemudian ditekan tombol INV dan tanda titik lagi. Tampak di layar misalnya angka 0,184; maka kunci jawaban soal nomor 2 adalah A (karena angka 1= A). Ditekan tombol INV dan tanda titik lagi. Tampak di layar misalnya angka 0, 865. Angka ini tidak kita perg pergun unak akan an kare karena na bata batass angk angka a yang yang dica dicari ri hany hanya a samp sampai ai no nomo morr 4, sedangkan yang muncul adalah nomor 8. Ditekan tombol INV dan tanda titik lagi dan seterusnya sampai selesai jumlah butir soalnya. Selamat mencoba! F.
Contoh Contoh Uji Uji Validi Validitas tas Butir Soal Bentuk Bentuk Pilihan Pilihan Ganda Ganda
Kare Karena na di dala dalam m prog progra ram m kalk kalkul ulat ator or tida tidakk ters tersed edia ia uji uji vali validi dita tass buti butirr (kor (korel elas asii poin pointt bise biseri rial al)) yait yaitu u ko kore rela lasi si anta antara ra data data no nomi mina nall dan dan data data kontin kon tinyu, yu, maka maka kita kita perlu perlu me mengh nghitu itungn ngnya ya dengan dengan men menggu ggunak nakan an rumus rumus seperti berikut ini. r pbis =
X b − X s SD
pq
Keterangan: Xb: adalah rata-rata skor kemampuan kemampuan peserta didik didik yang menjawab menjawab benar Xs: adalah adalah rata-rata rata-rata skor kemam kemampuan puan peserta peserta didik didik yang yang menjawab menjawab salah salah SD: adalah adalah simpanga simpangan n baku skor skor total total
28
Panduan Analisis Butir Soal
p : adalah proporsi jawaban benar terhadap semua jawaban siswa q adalah 1-p Cara Carany nya a adal adalah ah ke keti tikl klah ah jawa jawaba ban n pese pesert rta a didi didik/ k/re resp spon onde den n menggunakan angka 1 (jawaban benar) dan 0 (jawaban salah).
deng dengan an
29
Panduan Analisis Butir Soal
V. ANALISIS BUTIR SOAL DENGAN KOMPU TER
A. Pengertian
Analisis butir soal dengan komputer maksudnya adalah penelaahan butir soal secara secara kuanti kuantitat tatif if yang yang penghi penghitun tungan gannya nya men menggu ggunak nakan an bantua bantuan n progra program m komputer komputer.. Analisis Analisis data dengan dengan menggunak menggunakan an program program komputer komputer adalah adalah sangat sangat tepat. tepat. Karena Karena tingka tingkatt keakur keakurata atan n hitung hitungan an dengan dengan me mengg ngguna unakan kan progra program m komput komputer er lebih lebih tinggi tinggi bila bila diband dibanding ingkan kan dengan dengan diolah diolah secara secara manual manual atau atau men menggu ggunak nakan an kalkul kalkulato ator/ r/ tangan tangan.. Program rogram komput komputer er yang yang digunakan untuk menganalisis data modelnya bermacam-macam tergantung tujuan dan maksud analisis yang diperlukan. Program yang sudah dikenal secara umum adalah EXCEL, SPSS (Statitistical Program for Social Science), atau program khusus seperti ITEMAN (analisis secara kiasik), RASCAL, ASCAL, BILOG (analisis secara item respon teori atau IRT), FACETS (analisis model Rasch untuk data kualitati f). Untuk memahami progra program-p m-prog rogram ram komput komputer er di atas, atas, bacala bacalah h manual manual progr programn amnya ya secara secara saksam saksama, a, kem kemudi udian an prakt praktikk ikkan an dengan dengan men menggu ggunak nakan an progr program am komput komputer er sebagai sebagai latihannya latihannya.. Berikut Berikut ini akan disajikan contoh program analisis analisis data dengan menggunakan komputer, seperti program ITEMAN, RASCAL, ASCAL, BIGSTEP, QUEST. Selamat berlatih! B. ITEMAN
ITEMAN ITEMAN merupaka merupakan n program program komputer komputer yang digunakan digunakan untuk menganalisis menganalisis butir soal secara klasik. Program ini termasuk satu paket program dalam MicroCAT°n yang dikemban dikembangkan gkan oleh Assessment Assessment Systems Corporat Corporation ion mulai tahun 1982 dan mengalami revisi pada tahun 1984, 1986, 1988, dan 1993; mulai ulai dari vers ersi 2.00 .00 sampa ampaii den dengan gan versi ersi 3.50 3.50.. Al Ala amatn matnya ya ada adalah lah Assessment Systems Corporation, 2233 University Avenue, Avenue, Suite 400, St Paul, Minesota 55114, United States of America. Program ini dapat digunakan untuk: (1) menganalisis data file (format ASCII) jawaban butir soal yang dihasilkan melalui manual entry data atau dari mesin scanner; (2) menskor dan menganalisis data soal pilihan ganda dan skala Likert untuk 30.000 siswa dan 250 butir butir soal; (3) menganali menganalisis sis sebuah tes yang terdiri dari 10 skala (subtes) dan memberikan informasi tentang validitas setiap butir (daya pembeda, tingkat kesukaran, proporsi jawaban pad pada seti setia ap opti option on)), reli reliab abil ilit ita as (KRKR-20/A 20/Allpha pha), sta standar ndar erro errorr of measurement, mean, variance, standar deviasi, skew, kurtosis untuk jumlah skor pada jawaban benar, skor minimum dan maksimum, skor median, dan frekuensi distribusi skor,
30
Panduan Analisis Butir Soal
Saat ini telah tersedia ITEMAN tinder Windows 95, 98, NT, 2000, ME, dan XP deng dengan an harg harga a $299 $299.. Sebe Sebelu lum m me meng nggu guna naka kan n prog progra ram m Item Iteman an,, baca bacala lah h manual manualnya nya/bu /buku ku petun petunjuk juk pengop pengoper erasi asiona onalny lnya a secara secara sek seksam sama. a. Sebaga Sebagaii contoh, tahap awal adalah membuat "file data" (control tile) yang berisi 5 komponen utama. 1. Baris Baris pertama pertama adalah adalah baris baris pengont pengontrol rol yang yang mendeskrip mendeskripsikan sikan data. 2. Baris Baris kedua kedua adalah adalah dafta daftarr kunci kunci jawaban jawaban seti setiap ap butir butir soal. soal. 3. Baris Baris ketiga ketiga adalah adalah daftar daftar jumlah jumlah option option untuk untuk setiap setiap butir coal. 4. Baris Baris keempat keempat adalah adalah daftar daftar butir soal yang yang hendak hendak dianal dianalisis isis (jika (jika butir butir yang akan dianalisis diberi tanda Y (yes), jika tidak diikutkan dalam analisis diberi tanda N (no). 5. Bari Bariss ke keli lima ma dan sete seteru rusn snya ya adalah adalah data siswa siswa dan dan pili piliha han n jawa jawaba ban n siswa. Setiap Setiap piliha pilihan n jawaba jawaban n siswa siswa (untu (untukk soal soal bentuk bentuk piliha pilihan n ganda) ganda) diketi diketikk dengan menggunakan huruf, misal ABCD atau angka 1234 untuk 4 pilihan jawaban atau ABCDE atau 12345 untuk 5 pilihan jawaban. Cara menggunakan program ini, pertama data diketik di DOS atau Windows. Cara Cara term termud udah ah adal adalah ah me meng nggu guna naka kan n prog progra ram m Wind Window owss yait yaitu u deng dengan an mengeti men getikk data data di tempat tempat Notep Notepad. ad. Carany Caranya a adalah adalah kli klikk StartStart-P Program rogramssAccessories-Notepad. Contoh pengetikan data untuk soal bentuk pilihan ganda 30 o n 6
[Jumlah soal, kode omit, kode tidak dijawab, jmlh
karakterl
43142442113424141324213411334 444444444444444444444444444444 YYYYYYYYYYYYYYYYYYYYYYYYYYYYYY
[Kunci jawaban jawaban dapat ditul ditulis is dengan angk angka atau huru hu rufl fl [Jumlah pilihan] [Soal yang dianalisis, bila tidak dianalisis
ditulis NJ
Dita Fauria Fauria Fara Nafis Raufan Raufan Dina
123123244113424143324213211334 423142 423142243 2434134 4134241 241411 4112421 2421311 311123 1233 3 423142242113424141324213411334 143142242433434141324413431334 243142 243142242 2424134 4134341 341414 4141121 1121321 321113 1134 4 423342224113423141421213044331
(Jawaban siswa, dapat ditulis ditulis dengan angka atau huruf)
Contoh pengetikan data untuk skala Likert. 30 x Y 10 [Jumlah soal, kodc omit, kode tida tidak k dijawab, jmlh karak kar akte ter] r] +++++++------+++++------+++++-[Positif/negative [Positif/negative pernyataan] 777777777777777777777777777777 [Jumlah pilihan]
111111111111111111111111111111 Nurul Imam Ali
Kiki Chanan
[Kode skala]
211214123242343423111231243767 312214214242443423224562332565 2242123313324431243254624371YY 22421112X432443323226556664122 32421424234244344322653546X343
[Jawaban siswa, dapat ditulis dengan angka atau huruf)
31
Panduan Analisis Butir Soal
Contoh lain pengetikan data untuk soal bentuk pilihan ganda 25 0 N 24 ABDCEBCEDAABEDCCBDBAEDCAB ABDCEBCEDAAB EDCCBDBAEDCAB Kuncine 5555555555555555555555555 555555555555 5555555555555 Pilihane YYYYYYYYYYYYYYYYYYYYYYYYY IWAN SUYAWAN
ABDCEBCEDAABEDCEADBAEEECB ABDCEBCEDAAB EDCEADBAEEECB
TIKA HATIKAH
ACCEEBCDBAABEECBBDBAEEAAB
YENNY SUKHRAINI
ABDDDBCEDAABCACCBDDBCDCAB
WIJI PURWANTA
ACBCEBCEDDCEEDCCAADAEDBBB ACBCEBCEDDCE EDCCAADAEDBBB
HENNY LISTIANA
ABDCECBDDAABDEACBDBBBECAB ABDCECBDDAAB DEACBDBBBECAB
UJANG
CDDCEBCEDCDCEDCCBBCADDCAE
HE HERMAWAN
NIKEN IRIANTI
CDDCEBACDAABEBBCBDBAADAAB CDDCEBACDAAB EBBCBDBAADAAB
MIMIK RIATIN
ABDDDBCEDAABCACCBDDBCDCAB
NUR WAHY AHYU RISD RISDIA IANT NTO O
ABDB ABDBCD CDC CEDAA EDAABB BBCD CDCB CBD DBAAA BAAACA CAB B
RURI
SU SUSIYANTI
AEDEEBCEDBBDEDCCBDCDBDCAB
RYSA YSA DWI DWI INDAH NDAH YATI ATI
ABCD ABCDEB EBC CEDAA EDAABC BCAC ACCB CBD DBDEB BDEBCA CAB B
ANDRIKO
ACDCEBCECBCBEDCADABAEBBCB
JOKO SLAMET
AAAABBBCCCDDEEAABBCCDDEEA
LUKMAN
ACDBEBCECDBBEDCCBBAAEDCBB
NU NURHUDA
OTAH PIANTO
DBBCEBAECAABDCBCBDBAEAEAB
AKHMAD SYAMSURIZAL
ADDCEBCEDCBCDDCCBDBEEDCAB
DENY TRI SETIAWAN SETIAWAN
ABCDABCE ABCDABCEDABC DABCBDCC BDCCBDEA BDEAEDCAB EDCAB
DEWI
ACCBEBCDCBABEDBCEDBDCBCAC
SE SETYOWATI
ISMAIL SHOLEH
ABDBCDCEDAABBCDCBDBAAACAB ABDBCDCEDAAB BCDCBDBAAACAB
JEMI INTARYO
ACCEEBCDBAABEECBBDBAEEAAB ACCEEBCDBAAB EECBBDBAEEAAB
Langkah kedua data yang telah diketik disimpan, misal disimpan pada file: Selanjutn utnya ya untuk untuk men menggu ggunak nakan an progra program m Iteman Iteman yaitu yaitu dengan dengan Tes1.txt. Selanj mengklik icon Iteman. Kemudian isilah pertanyaan-pertanyaan yang muncul di layar computer seperti berikut. Enter the name of the input file: Tesl.txt Enter the name of the output file: haltesl.txt Do you want the scores written to a file? (Y/N) Y Enter the name of the score file: scrtesl.txt **ITEMAN **ITEMAN ANALYSIS IS COMPLET E**
Langkah Langkah ketiga ketiga adalah adalah membaca membaca hasil, hasil, yaitu dengan mengklik icon hsltes1. hsltes1. Hasilnya adalah seperti pada contoh berikut.
32
Panduan Analisis Butir Soal
MicroCAT (tm) Testing System Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation Item and Test Analysis Program -- ITEMAN (tm) Version 3.00 Item analysis for data from file tes1.txt
Seq. No. ---1
Scale -Item ----0-1
Item Statistics ----------------------Prop. Point Correct Biser. Biser. ------- ------ -----0.850
-0.018
-0.012
CHECK THE KEY A was specified, C works better
2
3
4
0-2
0-3
0-4
0.450
0.600
0.400
0.534
0.515
0.172
0.425
0.406
0.135
CHECK THE KEY C was specified, D works better
5
0-5
0.700
0.215
0.163
CHECK THE KEY E was specified, D works better
6
0-6
0.850
-0.089
-0.058
CHECK THE KEY B was specified, D works better
Page
1
Alternative Statistics ----------------------------------Prop. Point Alt. Endorsing Biser. Biser. Key ----- --------- ------ ------ --A B C D E Other
0.850 0.000 0.100 0.050 0.000 0.000
-0.018 -0.012 -9.000 -9.000 0.047 0.028 -0.040 -0.019 -9.000 -9.000 -9.000 -9.000
*
A B C D E Other
0.050 0.450 0.300 0.150 0.050 0.000
-1.000 0.534 -0.262 0.231 0.121 -9.000
-0.856 0.425 -0.199 0.151 0.057 -9.000
A B C D E Other
0.050 0.100 0.250 0.600 0.000 0.000
-1.000 -0.142 0.039 0.515 -9.000 -9.000
-0.856 -0.083 0.029 0.406 -9.000 -9.000
A B C D E Other
0.050 0.200 0.400 0.200 0.150 0.000
-1.000 -0.856 -0.059 -0.041 0.172 0.135 0.474 0.332 0.018 0.012 -9.000 -9.000
A B C D E Other
0.050 0.050 0.100 0.100 0.700 0.000
0.281 0.133 -1.000 -0.856 0.142 0.083 0.331 0.194 ? 0.215 0.163 * -9.000 -9.000
A B C D E Other
0.000 0.850 0.050 0.100 0.000 0.000
-9.000 -9.000 -0.089 -0.058 * -0.040 -0.019 0.142 0.083 ? -9.000 -9.000 -9.000 -9.000
?
*
*
* ?
33
Panduan Analisis Butir Soal
MicroCAT (tm) Testing System Copyright (c) 1982, 1984, 1986, 1988 b y Assessment Systems Corporation Item and Test Analysis Program -- IT EMAN (tm) Version 3.00 Item analysis for data from file tes1.txt
Seq. No. ----
Scale -Item -----
25
0-25
Item Statistics ----------------------Prop. Point Correct Biser. Biser. ------- ------ -----0.850
1.000
0.685
Page
5
Alternative Statistics ----------------------------------Prop. Point Alt. Endorsing Biser. Biser. Key ----- --------- --- --- ------ --A B C D E Other
0.050 0.850 0.050 0.000 0.050 0.000
-1.000 1.000 -0.523 -9.000 -0.040 -9.000
-0.856 0.685 -0.247 -9.000 -0.019 -9.000
*
Keterangan: Prop. Correct= tingkat kesukaran butir:, Biser dan Point Biser.= korelasi Biserial dan Korelasi Point Biserial, Alt.= alternative/pilihan jawaban, Prop. Endorsing= proporsi Jawaban pada setiap option MicroCAT (tm) Testing System Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation Item and Test Analysis Program -- ITEMAN (tm) Version 3.00 Item analysis for data from file tes1.txt
Page
6
There were 20 examinees in the data file.
Scale Statistics ---------------Scale:
0 ------N of Items 25 N of Examinees 20 Mean 16.250 Variance 9.087 Std. Dev. 3.015 Skew -2.463 Kurtosis 6.976 Minimum 5.000 Maximum 20.000 Median 17.000 Alpha 0.437 SEM 2.261 Mean P 0.650 Mean Item-Tot. 0.266 Mean Biserial 0.352
34
Panduan Analisis Butir Soal
Hasil scor butir soal pilihan ganda dari ITEMAN versi 3.00 24 1 Scores for examinees from file tes1.txt IWAN SUYAWAN 20.00 TIKA HATIKAH 16.00 YENNY SUKHRAINI 18.00 WIJI PURWANTA 15.00 HENNY LISTIANA 16.00 UJANG HERMAWAN 16.00 NIKEN IRIANTI 17.00 MIMIK RIATIN 18.00 NUR WAHYU RISDIANTO 17.00 RURI SUSIYANTI 17.00 RYSA DWI INDAH YATI 19.00 ANDRIKO 15.00 JOKO SLAMET 5.00 LUKMAN NURHUDA 17.00 OTAH PIANTO 16.00 AKHMAD SYAMSURIZAL 19.00 DENY TRI SETIAWAN 18.00 DEWI SETYOWATI 13.00 ISMAIL SHOLEH 17.00 JEMI INTARYO 16.00
Hasil korelasi point-biserial (rpbi) dan korelasi biserial (rpbis) berasal dari perhitungan rumus berikut. r pbi = Yp Yt dan dan St p U
Y p − Y t p Y p − Y t p(1 − p ) atau r bis = St (1 − p ) St U
= = = =
mean skor pada kriterion si siswa ya yang me menjawab be benar so soal. mean mean dan dan standa standard rd devia deviasi si krite kriterio rion n seluru seluruh h siswa. siswa. propor proporsi si siswa siswa yang yang me menja njawab wab benar benar soal. soal. ordinat kurva normal.
Korelasi point-biserial (r pbi) tidak sama dengan 0, korelasi biserial (r bis) paling sedikit 25% lebih besar daripada r pbi untuk perhitungan pada data yang yang sama. sama. Korelas orelasii pointpoint-bis biser erial ial (r pbi) pbi) merupa merupakan kan korela korelasi si produc productt mome moment nt anta antara ra skor skor diko dikoto tomu muss dan dan peng penguk ukur uran an krit kriter erio ion; n; seda sedang ngka kan n korelasi biserial (r bis) merupakan korelasi product moment antara variabel latent distribusi normal berdasarkan dikotomi benar-salah dan pengukuran kriterion. Menurut Millman dan Greene (1989) dalam Educational Measurement, kedua korela korelasi si ini me memil miliki iki kel kelebi ebihan han masing masing-ma -masin sing. g. Kele elebih bihan an korela korelasi si point point biserial adalah: (1) memberikan refleksi kontribusi soal secara sesungguhnya terh terhad adap ap fung fungsi si tes. tes. Maks Maksud udny nya a ini ini me meng nguk ukur ur baga bagaim iman ana a baik baikny nya a soal soal berkor berkorela elasi si dengan dengan kriter kriterion ion (tidak (tidak bagaim bagaimana ana baikny baiknya a bebera beberapal palsec secara ara abstrak); (2) sederhana dan langsung berhubungan dengan statistik tes; (3) tidak pernah mempunyai value 1,00 karena hanya variabel-variabel dengan distribusi bentuk yang sama yang dapat berkorelasi secara sempurna, dan variabel kontinyu (kriterion) dan skor dikotomus tidak mempunyai bentuk
35
Panduan Analisis Butir Soal
yang sama. Kelebihan korelasi biserial adalah: (1) cenderung lebih stabil dari sampel ke sampel, (2) penilaian lebih akurat tentang bagaimana soal dapat diharapkan untuk membedakan pada beberapa perbedaan point di skala abilitas, (3) value r bis yang sederhana lebih langsung berhubungan dengan indikator diskriminasi kurva karakteristik butir (Item Characteristic Curve atau ICC). Kebanyakan para ahli pendidikan, khususnya di Indonesia, banyak yang menggunakan korelasi point biserial daripada korelasi biserial. Kriteria baik tidaknya butir soal menurut Ebel dan Frisbie (1991) dalam Essentials Essentials of Educational Educational Measurement Measurement halaman 232 adalah bila korelasi point biserial: >0.40=butir soal sangat baik; 0.30 - 0.39=soal baik, tetapi perlu perbaikan; 0.20 - 0.29=soal dengan beberapa catatan, biasanya diperlukan perbai perbaikan kan;; < 0. 19=soa 19=soall jel jelek, ek, dibuan dibuang, g, atau atau diperb diperbaik aikii mel melalu aluii revis revisi. i. Adapun tingkat kesukaran butir soal memiliki skala 0 - 1. Semakin mendekati 1 soal tergolong mudah dan mendekati 0 soal tergolong sukar. C. EXCEL
Excel merupakan sebuah program pengolalah data yang biasa dinamakan "spreadsheet". Karena program ini dapat digunakan untuk mengolah data yang berupa angka ataupun lainnya. Ada dua cara mengolah data dengan Excel, yaitu (1) melalui program bantu khusus perhitungan statistik dan (2) melalui fungsi statistik yang terdapat di dalam Excel. Oleh karena itu tidak semua program Statistik ada di program Excel, seperti halnya Uji Validitas Validitas butir soal baik soal pilihan ganda maupun bentuk uraian, uji reliabilitas baik bentuk pilihan ganda, uraian maupun reliabilitas non-tes, dalam hal ini harus disain secara manual. Karena di dalam program ini tidak tersedia program tersebut.
36
Panduan Analisis Butir Soal
D. SPSS SPSS (Stati (Statisti stical cal Progr Program am for for Social Social Scienc Science) e)
SPSS merupakan sebuah program pengolah data yang sudah sangat dikenal di dalarn dunia pendidikan. Penggunaannya sangat mudah untuk dipahami para guru gu ru di seko sekola lah. h. Semu Semua a data data dike diketi tikk di dala dalam m form format at SPSS SPSS yang yang suda sudah h disediakan disediakan.. Setelah Setelah selesai, selesai, kemu kemudian dian tinggal tinggal memilih memilih statistik statistik yang akan digunakan pada menu STATISTIC/ANAL STATISTIC/ANALYZE. YZE. Misalnya uji validitas butir atau reliabilitas tes, diklik pada menu ANLYZE kemudian pilih CORELATE, pilih BIVARIAT, untuk uji reliabilitas pilih RELIABILITY. Di samping itu, program ini dapat dapat digun digunaka akan n untuk untuk analis analisis is data data kuanti kuantitat tatif if secara secara um umum, um, misaln misalnya ya untuk uji normalitas, homogenitas, dan linearitas data. Agar mudah pengoperasiannya dalam menggunakan program ini, sebaiknya para guru membaca terlebih dahulu manual/buku pedoman pengoperasiannya secara saksama. Berikut ini disajikan salah satu contoh penggunaan program SPSS yang digunakan untuk menguji uji normalitas, homogenitas, dan linearitas data, serta uji kesesuaian antara butir soal dan kisi-k kisi-kisi isinya nya (anali (analisis sis faktor faktor). ). Program rogram SPSS SPSS sel selama ama ini sudah sudah diprod diproduks uksii bebera beberapa pa versi, versi, dianta diantaran ranya ya versi versi 11, 12, maupun maupun versi versi 13. Untuk Untuk lebih lebih jelasnya perhatikan contoh pengetikan data dan analisisnya berikut ini. Motivasi Belajar (X) 60 61 75 70 60 80 70 60 79 69
Prestasibelajar (Y) 65 68 85 76 65 89 74 62 81 75
Jenis Kelamin 1 2 1 2 1 2 1 2 1 2
Setelah program SPSS dibuka, data di atas di masukkan ke dalam format SPSS. Caranya sangat mudah yaitu seperti berikut. 1. 2. 3. 4. 5. 6. 7. 8. 9.
Klik "V "Variable View" (letaknya di sebelah sebelah kiri bawah). Ketik X pada kolom "Name". Klik pada kolom "Label" kemudian ketik Motivasi Belajar. Belajar. Ketik Y pada kolom "Name" (di bawah X). Klik pada kolom "Label" "Label" kemudian ketik Prestasi Prestasi Belajar. Belajar. Ketik JK pada kolom "Name" (di bawah Y) Klik pada kolom "Label" kemudian ketik Jenis Kelamin. Klik pada kolom "Scale" kemudian klik pada "Nominal". Klik "Data "Data View" View" (letaknya (letaknya di sebelah kin bawah), bawah), kemudian kemudian masukkanlah masukkanlah data di atas (diketik) sesuai dengan kolomnya.
1. Mene Menent ntuk ukan an Ana Anali lisis sis Desk Deskri ript ptif if
37
Panduan Analisis Butir Soal
a.
Cara pertama Analyze Descriptive statistics Frequencies Semua variable dimasukkan kedalam kotak ”Variables” ”Variables” Clik : ”statistics” Klik Klik : me mean an,, med media ia,, mod mod,, sum sum Std deviation, variance, range, minimu, maximum, S.E mean. Skewnes, curtosis Klik: ”Continue” Klik: ”Ok”
Hasil: Ststistic Motivasi Belajar N
Valid Missing Mean Std. Error of Mean Median Mode Std. Deviation Variance Skewness Std. error of skewness Kurtosis Std. error of kurtosis Range Minimum Maximum Sum Percentiles 25 50 75
Prestasi Belajar
10 0 68.4000 2.499978 69.5000 60.00 7.9499 62.48889 .243 .687 -1.512 1.334 20.00 60.00 80.00 684.00 60.0000 69.5000 76.0000
10 0 74.000 2.87131 74.5000 65.00 9.07989 82.44444 .307 ,687 -1.037 1.334 27.00 62.00 89.00 740.00 65.0000 74.5000 82.0000
Jenis Kelamin 10 0 1.5000 .16667 1.5000 1.00 .52705 .27778 .000 .687 -2.571 1.334 1.00 1.00 2.00 15.00 1.0000 1.5000 2.0000
Motivasi Belajar Frequency Valid
Total
60.00 61.00 69.00 70.00 75.00 79.00 80.00
Percent
Valid Pe Percent
3 1 1 2 1 1 1
30.0 10.0 10.0 20.0 10.0 10.0 10.0
30.0 10.0 10.0 20.0 10.0 10.0 10.0
10
100.0
100.0
Cumulative Percent 30.0 40.0 50.0 70.0 80.0 90.0 100.0
Prestasi Belajar
38
Panduan Analisis Butir Soal
Frequency Valid
62.00 65.00 68.00 74.00 75.00 76.00 81.00 85.00 89.00
Total
Percent
Valid Pe Percent
1 2 1 1 1 1 1 1 1
10.0 20.0 10.0 20.0 10.0 10.0 10.0 10.0 10.0
10.0 20.0 10.0 20.0 10.0 10.0 10.0 10.0 10.0
10
100.0
100.0
Cumulative Percent 10.0 30.0 40.0 50.0 60.0 70.0 80.0 90.0 100.0
Jenis Kelamin Frequency Valid
1.00 2.00
Total
Percent
Valid Percent
5 5
50.0 50.0
50.0 50.0
10
100.0
100.0
Cumulative Percent 50.0 100.0
b. Cara ke kedua
Analyze Descriptive statistics Descriptives - Semu Semua a vari variab able le dim dimas asuk ukka kan n ke dal dalam am kot kotak ak "V "Varia ariabl bles es"" - Klik: "Options" - Klik: - mean, sum - std deviation, deviation, variance variance,, range, minimum, minimum, maximum, maximum, S.E. S.E. mean - kurtos kurtosis, is, ske skewne wness ss - Asce Ascendi nding ng me means ans - K l i k : " C o n t in u e " - Kl i k : " O K " Descriptive Statistic
Motivasi belajar Prestasi Prestasi belajar Jenis Kelamain Valid N (listwise)
N Statistic 10 10 10 10
Range Statistic 20.00 27.00 1.00
Minimum Statistic 60.0 62.0 1.00
Maximum Statistic 80.00 89.00 2.00
Sum Statistic 684.00 740.00 15.00
39
Panduan Analisis Butir Soal
Descriptive Statistic Mean Statistic Motivasi belajar Prestasi belajar Jenis Kelamain Valid N (listwise)
Std. error
68.4000 74.0000 1.5000 10
2.4998 2.8713 .1667
Std. Statistic
Variance Statistic
7.90499 9.07989 .52705
62.489 82.444 .278
Descriptive Statistic Skewness Statistic Motivasi belajar Prestasi belajar Jenis Kelamain Valid N (listwise)
.243 .307 .000 10
Kurtosis
Std. error
Statistic
Std. error
.687 .687 .687 .587
-1.512 -1.037 -2.571
1.334 1.334 1.334
2. Uji Uji Per Persya syarratan atan Anal Analisi isiss a. Cont Contoh oh Uji Uji Nor Norma mali lita tass
Analyze Descriptive statistics Explore -
Variabe ariabell X dan Y dim dimasu asukka kkan n ke dalarn dalarn kotak kotak "Dep "Depend endent ent List:" List:" Klik lik ko kota takk "Plot Plot"" ke kemu mud dian ian kl klik ik pada ada "Normal rmalit ityy plot plotss wit with tests". Klik "C "Continue" Klik "OK"
Rumusan hipotesis. H0 :sample : sample berasal dari populasi berdistribusi normal. H1 :sample tidak berasal dad populasi berdistribusi normal. Kaidah penetapan: - Jika Jika signi signifik fikan an > 0,05, 0,05, sam sampel pel berasa berasall dari dari popu populas lasii berdi berdistr stribu ibusi si normal. - Jika signifikan < 0,05, sampel tidak berasal dari populasi berdistribusi normal.
40
Panduan Analisis Butir Soal
b. Uji Uji Homogen ogenit itas as Analyze Descriptive statistics Explore
-
Variabe ariabell X dan Y dim dimasu asukka kkan n ke dalam dalam kota kotak k "Dep "Depend endent ent List." List." Varia ariab bel jen enis is ke kela lam min dim dimasuk asukka kan n ke dalam alam ko kota takk ":Fac :Facto torr List:" Klik Klik kota kotak k "Plot "Plot"" kemu kemudia dian n klik klik pada pada "Nor "Normal mality ity plots plots with with tests tests"" dan "Untransformed" Klik "C "Continue" Klik "OK"
Rumusan hipotesis: HO: variansi pada setiap kelompok sama sama (homogen). HI : variansi pada setiap kelompok tidak sama (tidak homogen).. Kaidah penetapan: - Jika Jika sign signi$k i$kan an > 0,05 0,05,, vari varians ansii setia setiap p samp sampel el sama sama (hom (homoge ogen). n). c.
Cont Contoh oh Uji Uji Line Linear arit itas as Analyze Compare Means Means
-
Varia ariabe bell X dima dimasu sukk kkan an ke ke dala dalam m kota kotak k "Dep "Depen ende dent nt Lis List: t:"" Variabe ariabell Y dimasu dimasukka kkan n ke ke dala dalam m kota kotak k "Ind "Indepe epende ndent nt List:" List:" Klik Klik kota kotak k "Opti "Option on"" ke kemu mudi dian an klik klik pada pada "Ano "Anova va tabl table e and eta" eta" dan "Test for linearity" Klik "C "Continue" Klik "OK"
Rumusan hipotesis: H0: Linearitas tidak dipenuhi. H1: Lin Linieerit ieeritas as dipenu dipenuhi. hi. Kaidah penetapan: - Jika Jika sig signi nifi fika kan n > 0,0 0,05, 5, lin linea eari rita tass tida tidak k dipe dipenu nuhi hi.. - Jika Jika sign signif ifik ikan an < 0,0 0,05, 5, line linear arit itas as dipe dipenuh nuhi. i. - Jika Jika sign signif ifik ikan an < 0,05 0,05,, vari varian ansi si seti setiap ap samp sampel el tida tidak k sama sama (tida (tidakk homogen).
41
Panduan Analisis Butir Soal
3. Contoh Contoh Uji Perbeda erbedaan an dengan dengan t-tes t-tes
Analyze Compare Means Independent-Sample T Test -
Variabe ariabell Y dimasu dimasukka kkan n ke ke kota kotak k "T "Test Variabl ariables" es" Variabe ariabell jenis jenis kel kelami amin n dimas dimasukk ukkan an ke ke kotak kotak "Group "Grouping ing variab variable" le" Kli Klik "De "Defin fine Grou Group ps" kem kemudi udian keti ketikk 1 pad pada Grou Group p 1 dan dan ke keti tikk 2 pada Group 2. -Klik "Continue" Klik "OK"
Rumusan hipotesis: H0 :tidak : tidak terdapat perbedaan antara variable X dan variable Y... Y... H1 :terdapat :t erdapat perbedaan antara variable X dan variable Y ... Kaidah penetapan: - Jika Jika sign signif ifik ikan an > 0,0 0,05, 5, HO dite diteri rima ma.. - Jika Jika sign signif ifik ikan an < 0,05 0,05,, HO dito ditola lak. k. 4. Contoh Contoh Uji Uji Perbed Perbedaan/ aan/P Pengaruh engaruh denga dengan n ANOVA ANOVA
Analyze Compare means One-way ANOVA ANOVA -
Varia riabel bel Y (pad (pada a ek ekssperi perim men dan con control trol)) dim dimasukk sukka an ke dalarn "Dependent List:" Varia ariabe bell jeni jeniss kela kelami min n dima dimasu sukk kkan an ke dal dalam am "Fa "Fact ctor or:" :" Klik Klik "Opt "Option ions" s" kem kemudi udian an kli klik k "Hom "Homoge ogeneit neityy of of vari varianc ance e test test". ". Klik "C "Continue" Klik "OK"
Rumusan hipotesis: H0: tidak terdapat perbedaan/pengaruh perbedaan/pengaruh antara variable variable X dan variable Y H1: terdapat perbedaanlpengaruh perbedaanlpengaruh antara antara variable X dan variable variable Y Kaidah penetapan: - Jika Jika sign signif ifik ikan an > 0,0 0,05, 5, HO dite diteri rima ma.. - Jika Jika signi igniff kan kan < 0, 0,05, 05, HO HO di ditola tolak. k. 5. Contoh Contoh Uji Hubun Hubungan gan dengan dengan Korela Korelasi si
Analyze Correlate Bivariate
42
Panduan Analisis Butir Soal
-
Variabe ariabell X dan Y dim dimasu asukka kkan n ke ke dala dalam m kotak kotak "Vari "Variabl ables" es" Klik Klik "Pea "Pears rson on"" "Two "Two-T -Tai aile led" d" Klik Klik "Opt "Option ions" s" kem kemudi udian an kli klik k "mea "means ns and standa standard rd deviat deviation ions" s" Klik "C "Continue" Klik "OK"
Rumusan hipotesis: H0 :tidak terdapat hubungan antara variable X dan variable Y. H1 :terdapat hubungan antara variable X dan variable Y. Kaidah penetapan: - Jika Jika sign signif ifik ikan an > 0,0 0,05, 5, HO dite diteri rima ma.. - Jika Jika sign signif ifik ikan an < 0,05 0,05,, HO dito ditola lak. k. 6. Contoh Uji Hubungan dengan Regresi Linear
Analyze Regression Linear -
Varia ariabe bell Y dima dimasu sukk kkan an ke ko kota tak k "De "Depe pend nden ent" t" Varia ariabe bell X dima dimasu sukk kkan an ke ke kot kotak ak "Ind "Indep epen ende dent nts" s" Klik Klik "Sta "Statis tistic tics" s" kem kemudi udian an kli klik k "est "estima imates tes", ", "model "model fit", fit", dan klik "Continue". Klik "OK"
Rumusan hipotesis: HO : tidak terdapat terdapat hubungan antara variable variable X dan variable variable Y. Y. H1 : terdapat hubungan antara variable variabl e X dan variable Y. Kaidah penetapan: - Jika Jika sign signif ifik ikan an > 0,0 0,05, 5, HO dite diteri rima ma.. - Jika Jika sign signif ifik ikan an < 0,05 0,05,, HO dito ditola lak. k. 7. Uji Kesesuaian Kesesuaian antara antara Butir Soal dan Kisi-kisinya (Uji Konstruk dengan dengan Analisis Faktor) Faktor) a. Anal Analis isis is Fak Fakto torr Eksp Eksplo lora rato tori ri
Kegiat giata an memval validas idasii ko kon nstr struk dila dilaks ksa anak nakan setel telah tes tes digunakan/diuji coba. Analisis faktor terdiri dari dua yaitu analisis faktor faktor eksplorat eksploratori ori dan konfirmato konfirmatori. ri. Analisis faktor faktor konfirmat konfirmatori ori menekankan pada estimasi parameter dan tes hipotesis, sedangkan analisis faktor eksploratori menekankan pada beberapa faktor yang menjelaskan hubungan antar-indikator dan estimasi muatan faktor. faktor.
43
Panduan Analisis Butir Soal
Untuk menguji validitas kesesuaian antara butir soal dan kisi-kisi konstruknya digunakan analisis faktor. faktor. Konsep validitas berhubungan dengan: (1) ketepatan, (2) kebermaknaan, dan (.3) kegunaan suatu skor tes (Gable, 1986: 71). Macam-macam validitas adalah validitas: (1) konten yang meliputi: definisi konsep dan definisi operasional; (2) (2) ko kons nstr truk uk,, dan dan (3) (3) krit kriter erio ionn-re rela late ted d (Gab (Gable le,, 1986 1986:: 72-7 72-77) 7).. Terdapat empat teknik untuk menganalisis konstruk, yaitu dengan: (I) korelasi antarvariabel, (2) analisis multitrait multimethod, (3) analisis faktor, dan (4) prosedur known-groups (Gable, 1986. 77). Analisis faktor dikembangkan oleh Charles Spearman tahun 1904 di USA (Harman, 1976: 3). Analisis faktor adalah suatu nama generik yang diberikan pada suatu kelas metode statistik multivariat yang tuju tujuan an utam utaman anya ya adal adalah ah Untu Untukk me mend ndef efin inis isik ikan an stru strukt ktur ur dala dalam m matriks data (Hair et. al, 1998: 90). Tujuan utama analisis faktorr adaalah untuk menguji secara empirik huburngan antar butir soal dan untuk untuk men menent entuka ukan n kel kelomp ompok ok soal soal yang yang saling saling me menen nentuk tukan an seba sebaga gaii suat suatu u fakt faktor or/k /kon onst stru rukk yang yang diuk diukur ur me mela lalu luii inst instru rume men n (Gable, 1986: 85). Jadi tujuan utamanya dapat disimpulkan menjadi 3, yait yaitu u un untu tukk me mene nent ntuk ukan an:: (1) (1) fakt faktor or um umum um yang yang dipe diperl rluk ukan an terhadap jumlah patern korelasi antar semua pasangan tes dalam satu set tes; (2) faktor umum sesungguhnya (asli) yang menghitung untuk untuk tes inter interkor korela elasi; si; (3) propo proporsi rsi varian varian untuk untuk suatu suatu variab variabel el observasi yang dihubungkan dengan varian faktor umum (Crocker and Algina, 1986: 305-306) atau sebagai pengenalan struktur melalui peringkasan data atau reduksi/pengurangan data (Hair et al., 1998: 95). Adapun manfaat analisis faktor adalah: (1) memberitahu kita tes-tes dan ukuran-ukuran yang saling dapat serasi atau sama tujuannya dan sejauh sejauhman mana a kes kesama amaann annya, ya, (2) memban membantu tu me menem nemuka ukan n dan mengidentifikasi kebutuhan- kebutuhan atau sifat-sifat fundamental yang melandasi tes dan pengukuran (Kerlinger, 1993: 1000). Langka Langkah h atau atau prosed prosedur ur penggu penggunaa naan n analis analisis is factor factor ek ekspl splora orator torii selalu memproses melalui 4 tahap, yaitu: (1) perhitungan korelasi matr matriiks un untu tukk sem emua ua varia ariabe bel, l, (2) (2) ek eksstra traksi ksi fak faktor tor un untu tukk menentukan jumlah faktor, (3) rotasi, untuk membuat faktor lebih bermakna, dan (4) perhitungan skor setiap faktor untuk setiap case. Cara pengoperasional dalarn program SPSS adalah seperti berikut. Pilih menu STATISTIC atau ANALYZE DATA DATA REDUCTIO RED UCTION N FACTOR
44
Panduan Analisis Butir Soal
Pada boks dialog variabel yang akan dianalisis dimasukkan ke kotak VARIABLES. Klik pada kotak DESCRIPTIVE (misal: klik "initial solution" pada kolom statistics dan "KMO and Bartlett's test of sphericity" pada kolom correlation Matrix), EXTRACTION, ROTATION, SCORES, atau OPTION. Hasil print outnya terdiri dari beberapa tabel dan sebuah grafik "scree plot". Beri Beriku kutt ini ini dije dijela lask skan an bebe bebera rapa pa hasi hasill prin printt ou outt anali analisi siss fakt faktor or eksploratori dan penafsirannya. (1)
Statistik Deskriptif Dalam tabel statistik deskriptif berisi informasi yang bersifat deskriptif seperti mean dan standard deviasi setiap variabel. Jika besarnya mean variabel sangat dekat/ekstrim pada skala jawa jawaba ban n dan dan stan standa darr devi devias asin inya ya rend rendah ah,, maka maka ko kore rela lasi si antar antarvar variab iabel el akan akan rendah rendah dan beraki berakibat bat renda rendah h pula pula pada pada hasil analisis faktor Gabel,1986:91).
(2) Bartlett Bartlett test of spheric sphericity ity Tes ini digun digunaka akan n untuk untuk me menge ngetes tes hipote hipotesis sis yang yang korela korelasi si matri matrikny knya a merupa merupakan kan suatu suatu matri matriks ks identi identitas tas,, yaitu yaitu semua semua diagonal adalah 1 dan semua yang tidak diagonal (off-diagonal) adalah 0. Hasil tes menunjukkan bahwa sample data berasal dari suatu populasi normal multivariat atau tidak. Jadi bila nila nilaii tes tes stat statis isti tikk dari dari sphe spheri rici city ty luas luas/t /tin ingg ggii dan dan leve levell sign signif ifik ikan anny nya a ke keci cil, l, maka maka dapa dapatt dika dikata taka kan n bahw bahwa a matr matrik ikss korelasi populasi adalah signifikan (Norusis, 1993:50). (3)
Pengukuran Pengukuran Sampling Kaiser Meyer Olkin (KMO) KMO merupakan suatu indeks perbandingan besarnya koefisien korelasi observed dan besarnya koefisien korelasi parsial. Jika jumlah kuadrat korelasi parsial pada semua pasangan variabel adalah kecil bila dibandingkan dengan jumlah kuadrat koefisien korelasinya, maka besar KMO mendekati 1. Jika besar KMO kecil atau rendah maka hasil analisis faktornya adalah tidak baik. Kaiser (1974) dalam Norusis (1993: 52) mengklasifikasi tentang besa esarny nya a KMO ada adalah lah bil bila besa besarrny nya a 0,90 ,90 bag bagus sek sekali ali (marvelous), 0,80 bermanfaat (meritorious), 0,70 sedang/cukup (middling), 0,60 sedikit cukup (mediocre), 0,50 gawat/menyedihkan (miserable), (miserable), dan di bawah 0,50 tidak dapat diterima (unacceptable). (unacceptable).
(4) Matriks Matriks Korelasi Korelasi antarbutir antarbutir Korelasi antarbutir menunjukkan adanya beberapa butir yang saling saling berhubun berhubungan gan secara secara wajar wajar. Jika korelasi korelasi antarvaria antarvariabel bel adalah adalah kecil, kecil, maka variabel-v variabel-varia ariabel bel itu berhubun berhubungan gan dengan dengan faktor-f faktor-faktor aktor secara secara umum (share (share common common factors) factors) (Norusis, (Norusis, 1993:50).
45
Panduan Analisis Butir Soal
(5) Matriks Matriks Korelasi Korelasi Anti-image Anti-image Matr Matrik ik ini ini beri berisi si ko kore rela lasi si anti anti-i -ima mage ge,, maks maksud udny nya a adal adalah ah koefis koe fisien ien korela korelasi si parsia parsiall yang yang neg negati atif. f. Jika Jika propor proporsi si untuk untuk koefis koe fisien ien yang yang banyak banyak adalah adalah tinggi tinggi,, maka maka kita kita diper dipersil silaka akan n untuk mempertimbangkan kembali tepat atau tidak menggunakan analilsis faktor. (6) Ekstraksi Ekstraksi Faktor Faktor Ekstraksi merupakan hubungan antara faktor-faktor dan variabel indiv ndivid idu. u. Tu Tujjuan uan utama tama ek ekst strraksi aksi fak faktor tor ada adalah lah un untu tukk mene me nent ntuk ukan an juml jumlah ah fakt faktor or.. Bebe Bebera rapa pa juml jumlah ah fakt faktor or yang yang diperlukan untuk merepresen data. Hal ini sangat membantu dalam dalam men mengu guji ji persen persentas tase e total total varian varian (eige (eigenva nvalue lues) s) untuk untuk masing-m masing-masing asing faktor faktor. Total varian varian merupakan merupakan jumlah jumlah varian varian masin masing-m g-masi asing ng variab variabel. el. Di sampin sampingg itu, itu, untuk untuk men menent entuka ukan n jumlah faktor dapat dilihat pada "scree test" atau "scree plot" Dari Dari tes tes atau atau plot plot itu itu dapa dapatt dike diketa tahu huii juml jumlah ah fakt faktor or yang yang ditun ditunjuk jukkan kan denga dengan n bebera beberapa pa garis garis yang yang panja panjang ng dan curam curam serta diikuti dengan jumlah garis yang pendek-pendek. (7) Residua esiduals ls Keterangan residu terdapat di bawah matrik koefisien korelasi estimate. Jika residu lebih besar dari 0,05 adalah residunya luas luas.. Arti Artiny nya a mode modell tida tidakk fit fit deng dengan an data data dan dan data data perl perlu u diperbaiki (Norusis, 1993:59). (8) (8) Rotas otasii Rotasi otasi analis analisis is faktor faktor adalah adalah me memba mbantu ntu lebih lebih mudah mudah untuk untuk meng me ngin inte terp rpre reta tasi sika kan n data data.. Tujua ujuan n rota rotasi si adal adalah ah un untu tukk menentukan suatu struktur sederhana. Artinya di setiap faktor tidak tidak dikeh dikehend endaki aki adanya adanya nil nilai ai nol pada pada faktor faktor loding loding untuk untuk setiap setiap variabel. variabel. Ro Rotasi tasi tidak berpenga berpengaruh ruh pada fitnya fitnya faktor faktor.. Rotasi mendistribusikan kembali penjelasan varian untuk faktor individu. Adapun Adapun metode metode rotasi rotasi dapat digunakan digunakan sesuai sesuai dengan dengan tujuan, tujuan, yaitu orthogonal seperti: varimax, equamax, quartimax, atau oblique seperti direct oblimin. Thurstone Thurst one dalam dalam Kerling erlinger er (1993: (1993: 1019-1 1019-1020 020)) me membe mberik rikan an panduan dalam melakukan rotasi, yaltu menetapkan 5 prinsip atau struktur sederhana yang berlaku untuk rotasi yang tegak Iurus (orto ortogo gona nall ata atau sudut udut 90 dera deraja jat) t) maup maupun un yang yang tida tidak/ k/mi miri ring ng (jik (jika a sudu sudutt yang yang dibe dibent ntuk uk oleh oleh dua dua sumb sumbu u merup me rupaka akan n sudut sudut lancip lancip/ / tumpul tumpul). ). Prinsip rinsip-pr -prins insip ip strukt struktur ur sederhana yang dimaksud adalah: (1) setiap larik dari matriks fakt faktor or haru haruss seti setida dakk-ti tida dakn knya ya me memil milik ikii satu satu mu muat atan an yang yang mende me ndekat katii nol nol:: (2) untuk untuk setiap setiap kol kolom om pada pada matrik matrikss faktor faktor
46
Panduan Analisis Butir Soal
harus harus terdapat terdapat setidak-ti setidak-tidakny daknya a variabel variabel bermuatan bermuatan nol atau mendekati nol yang sama banyaknya dengan banyaknya faktor; (3) (3) un untu tukk seti setiap ap pasa pasang ngan an fakt faktor or (kol (kolom om)) haru haruss terd terdap apat at sejumlah variabel yang mempunyai muatan pada satu faktor (kolom) tetapi tidak bermuatan pada faktor lainnya; (4) kalau ada empat empat faktor faktor atau atau lebih, lebih, sebagi sebagian an besar besar dari dari variab variabelelvari variab abel el itu itu haru haruss me memi mili liki ki mu muat atan an yang yang dapa dapatt diab diabai aika kan n (mend (mendeka ekati ti nol nol)) pada pada sebara sebarang ng pasang pasangan an faktor faktor;; (5) untuk untuk setiap pasangan faktor (kolom) pada matriks faktor itu harus ada hanya kolom sekaligus. Kriteria ini menghendaki sebanyak mungkin variabel "murni" yakni setiap variabel memuat sedikit mungkin faktor dan nor yang sebanyak mungkin dalam matriks faktor yang dirotasi (Kerlinger, 1933: 1021).
47
Panduan Analisis Butir Soal
DAFTAR PUSTAKA
Aiken,, Lewis Aiken Lewis R. (1994). (1994). Psychologi Psychological cal Testing esting and Assessment,( Assessment,(Eight Eight Edition), Edition), Boston: Allyn and Bacon. Anastasi. Anastasi. Anne and Urbina, Urbina, Susana. Susana. (1997). (1997). Psicoholol Psicoholologica ogicall Testing. esting. (Seventh (Seventh Edition). New Jersey: Prentice-Hall, Prentice-Hall, Inc. Assessment Systems Corporation. (1984). User's Manual for the MiicroCat Testing System, USA. Atkinson, Atkinson, John W. (1978) (1978).. Person Personality ality Motivation Motivation Hemisphere Publishing Corporation.
and Achie Achievemc vemcnt. nt. Sashington. Sashington.
Beja Bejarr, Isaa Isaacc I. (198 (1983) 3).. Intr Introd oduc ucti tion on to Item Item Respo espons nse e Th Theo eory ry and and Th Thei eirrAssump Assumptio tions. ns. Hamble Hambleton ton,, Ronald onald K. (Edito (Editor) r).. Applic Applicati ations ons of Item Item Respo Re sponse nse The Theory ory.. Canada Canada:: Educa Education tional al Researc esearch h Instit Institute ute of Briti British sh Columbia. Bruning, James L. and Kintz, B. L. (1987). Computational Handbook of Statistics. Third Edition. Illinois: Scott, Foresman and Company. Crock Crocker er,, L. & Alg Algina ina,, J. (1986) (1986).. Introd Introduc uction tion to Classi Classica call and Modern Modern Test, est, Theory_. New York: Holt, Rinehart and Winston, Inc. Ebel, Robert L, and Frisbie, David A. Essentials of Educatiornul Measurement. New Jersey: Prentice Hall, 1991. Gable. Gable. Robert obert K. (I986) (I986).. Instr Instrume ument nt Develo Developme pment nt in the Aff Affect ective ive Domain Domain Boston: Kluwer-Nijhoff Publishing. Glass, Gene V. and Stanley, Julian C. (1970). Statistical Methods in Education and Psychology. New Jersey: Prentice Hall, Inc. Hair, J. F.; Anderson, R. E., Tatham, R. L., and Black, W. C. (1998). Multivariate Data, Analysis. New Jersey. Prentice-I-lall International, Inc. Haladyna, Haladyna, Thomas Thomas M. (1994). (1994). Developin Developingg and Validating alidating Multiple-C Multiple-Choic hoice e Test Items. New Jersey: Lawrence Lawrence Erlbaum Associates, Publishers. Publishers. Hamble Hambleton ton,, Ro Ronal nald d K (1993) (1993).. Princip rinciples les and Selec Selected ted Applic Applicati ations ons of Item Item Response Theory. In Linn, Robert L. (Editor). Educational Measurement. Third Edition. Phoenix: American Council on Education, Series on Higher Education Oryx Press.
48
Panduan Analisis Butir Soal
Hambleton Hambleton,, R.K. & Swaminatha Swaminathan, n, H. (1985). (1985). Item Re Respon sponse se Theory: Theory: Princip Principles les and Applications. Boston: Kluwer. Nijhof'f Publishing. Hamb Hamble leto ton, n, Ron onal ald d K.; K.; Swam Swamin inat atha han. n. H.; H.; and and Rog oger ers, s, H. Jane Jane.. (199 (1991) 1).. Fundament Fundamentals als of Item Re Respons sponse e Theory Theory. California California:: Sage Publicatio Publications, ns, The International Professional Professional Publishers. Harm Harman an,, Harr Harryy H. (197 (1970) 0).. Mo Mode dern rn Fact Factor or An Anal alys ysis is (Thi (Third rd Edit Editio ion n Rev evis ised ed). ). Chicago: The University of Chicago Press. Holland. PW & Thaycr. DT (1988). Test Validity. New Jersey: Lawrence Erlbaum Associates, Publishers. Izard, Izard, John. John. (1995) (1995).T .Tria riall Testing esting and Item Item Analys Analysis is (Modul (Module e (A). (A). Aus Austra tralia lia:: Australian Council Ibr Pdtrcallonal Research, Research, UNESCO. 1996). PRELIS2: PRELIS2:User User’’s Reference Reference Guide. Guide. Jore Joresk skog og,, Karl Karl and and Sorb Sorbon oni, i, Dag. Dag. (1996). Chicago: Scientific Software Internasional, Inc.
Joreskog, Karl G and Sorbom, Dag, (1989). LISREL, 7 User's Reference Guide, First Edition. IJSA: Scientific Software, Inc. Kerli Ke rlinge ngerr, Fred Fred N (199.0 (199.0.. Asas-a Asas-asas sas Pene enelit litian ian Behavi Behaviora orall (Edisi (Edisi Ketiga) etiga),, diterjemahkan Simatupang L. R. Yogyakarta: Gad jah Mada University Press. Kerling Ke rlinger er,, Fred N. Asas-asas Asas-asas Peneli enelitian tian Behavioral Behavioral, Edisi ketiga, ketiga, Penerj Penerjemah emah Simatupang Simatupang,, ed. HJ. Koesoem Koesoemanto anto.. Yogyakarta ogyakarta:: Gdjah Gdjah Mada Universi University ty Press, 1993. Linn, Robert L. and Gronlund, Norman E. (1995). Measurement and Assessment in teaching (Seventh Edition). Ohio: Merrill, an immprint of Prentice Hall. Lord, F. M. (1952). A Theory f Test Scores. USA: Educational Testing Service. McDonald, Roderich Roderich P. (1999). Test Theory: A Unified Treatment. New Jersey: Larvrence Erbaum Associates, Publishers. Millman, Jason and Greene, Jennifer. (1993).The Spesification and Development of Tests ests of Ac Achi hiie ieve veme ment nt and and Abil Abilit ityy in Rober obertt L. Lin Lin (Edi (Edito tor) r).. Educational Measurement, Third Edition. Phoenix: American Council on Education, Series on Higher Education Oryx Press. Nitko, Nitko, Anthony J. (1996). (1996). Educationa Educationall Assessment Assessment of Students, Students, Second Second Edition. Edition. Ohio: Merrill an imprint of Prentice Hall Englewood Cliffs. Norusis, Norusis, Marija J. (1993). (1993). SPSS for Windows Windows Base System System user's user's Guide, Guide, Re Release lease
49
Panduan Analisis Butir Soal
6.0. Chicago: Marketing Departernent SPSS Inc. Nunally, Nunally, Jum C. (1978). Psychometric Theory, Theory, Second Edition. New Delhi: Tata McGrawHill Publishing Company Limited. Pedhazur, Elazar J. and Schmekin, Liora Pedhazur. (1991). Measurement, Design, and Analysis: An Integrated Approach. New Jersey: Lowrence Erlbaum Associates, Publishers. Petri, Petri, Herbert L. (1981). Motivation Theory and Research. Belmont, California: Wadsworth, Inc. Popham, Popham, James W. (1995). Classroom Assessment: What Teachers Teachers Need to Know. Know. Boston: Allyn and Bacon. Pusat Pusat Pene enelit litian ian dan Peng engemb embang angan an Sistem Sistem Peng enguji ujian, an, Balitb Balitbang ang Dikbud Dikbud.. (1993/1994). Bahan Penataran Pengujian Pendidikan. Jakarta. Safari Safari.. (2000) (2000).. Kaidah Kaidah Bahasa Bahasa Indone Indonesia sia dalam dalam Pen enuli ulisan san Soal. Soal. Jakar Jakarta: ta: PT Kartanegara. Shavelson, Richard J. (1988). Statistical Reasoning for The Behavioral Sciences. (Second Edition). Boston: Allyn and Bacon, Inc.This'en, David and Steinberg, Lynne. (1997). A Response Model for Multiple-Choice Items dala dalam m Wim Wim J. van van der der Lind Linden en and and Ron onal ald d K. Hamb Hamblet leton on (Edi (Edito tor) r).. Handbook of Modern Item Response Theory. New York: Springer-Verlag. Thornd Thorndike ike,, Robert obert M. (1997) (1997).. Measur Measureme ement nt and Evalua Evaluation tion in Pschol Pschology ogy and and Education, Sixth Edition. Ohio: Merrill, an imprint of Prentice Prentice Hall. Wright, Benjamin D. and Linacre, John M. (1992). A User's Guide to BIGSTEPS: Rasch Model Computer Program, Version Version 2.2. Chicago: MESA Press. Wright, B.D. and Stone,
50