Analisis perbaikan butir soal A. Mengapa Analisis Butir Soal Penting? Dengan melakukan analisis butir soal dapat diperoleh banyak informasi yang bermanfaat, baik untuk guru, siswa maupun proses pembelajaran itu sendiri. Menganalisis butir soal dilakuk an dengan harapan dapat meningkatkan kualitas butir soal tersebut. Menurut Nitko (1983), analisis butir soal menggambarkan suatu proses pengambilan data dan penggunaan informasi tentang butir-butir soal, terutama informasi tentang respon siswa terhadap setiap butir soal. Lebih lanjut penggun aan analisis butir soal adalah sebagai berikut: 1. Untuk mengetahui apakah butir-butir soal yang disusun sudah berfungsi sesuai dengan apa yang dikehendaki oleh penyusun soal. Untuk itu perlu diperhatikan hal-hal sebagai berikut: a. Apakah soal-soal yang disusun sudah sesuai untuk mengukur perubahan tingkah laku seperti telah dirumuskan dalam tujuan pembelajaran khusus? b. Apakah tingkat kesukaran soal sudah diperhitungkan? c. Apakah soal tersebut sudah mampu membedakan antara siswa yang pandai dengan siswa yang kurang pandai? d. Apakah kunci soal sudah sesuai dengan maksud soal? e. Jika digunakan tes pilihan ganda, apakah pengecoh (distractor) yang dipilih sudah berfungsi dengan baik? f. Apakah soal tersebut masih dapat ditafsirkan ganda atau tidak? 2. Sebagai umpan balik bagi siswa untuk mengetahui kemampuan mereka dalam menguasai suatu materi. 3. Sebagai umpan balik bagi guru untuk mengetahui kesulitan-kesulitan yang dialami siswa dalam memahami suatu materi. 4. Sebagai acuan untuk merevisi soal. 5. Untuk memperbaiki (meningkatkan) kemampuan guru dalam menulis soal. B. Kapan Analisis Butir Soal Dilakukan? Pada saat guru mengujikan suatu set soal untuk mengambil keputusan penting tentang hasil belajar siswa, maka idealnya guru harus yakin bahwa set soal tersebut adalah valid d an reliabel. Validitas set soal dapat diketahui dari kisi-kisi soal sedangkan reliabilitas soal baru dapat diketahui setelah uji coba. Sehingga untuk mengetahui reliabilitas set soal dilakukanlah analisis butir soal. 1. Tingkat Kesukaran (P) Tingkat kesukaran suatu butir soal merupakan salah satu yang dapat menunjukkan kualitas butir soal tersebut (mudah, sedang, sukar). Suatu butir soal dikatakan mudah jika sebagian besar siswa dap at menjawab dengan benar dan dikatakan sukar jika sebagian besar siswa tidak dapat menjawab dengan benar. Besarnya tingkat kesukaran butir soal dapat dihitung dengan memperhatikan proporsi peserta tes yang menjawab benar terhadap setiap butir soal, dalam hal ini dapat dihitung dengan menggunakan rumus: P=B/N Keterangan: P adalah indeks tingkat kesukaran butir soal B adalah jumlah peserta tes yang menjawab benar N adalah jumlah seluruh peserta tes Contoh:
Jika butir soal nomor 1 yang Anda ujikan dapat dijawab dengan benar oleh 10 dari 40 siswa, maka indeks tingkat kesukaran butir soal tersebut adalah: P = 10 / 40 = 0,25 Indeks tingkat kesukaran butir soal bergerak antara 0,00 sampai dengan 1,00. Indeks tingkat kesukaran suatu butir soal (P) = 0,00 akan tercapai apabila seluruh peserta tes tidak ada yang menjawab dengan benar dan indeks tingkat kesukaran suatu butir soal (P) = 1,00 akan tercapai apabila ap abila seluruh peserta tes dapat menjawab dengan benar. Jadi butir soal yang mudah akan mempunyai P mendekati 1,00 dan butir soal yang sukar akan mempunyai P mendekati 0,00. Menurut Fernandes (1984) kategori indeks tingkat kesukaran b utir soal adalah sebagai berikut: P >= 0,76 : mudah
Butir soal yang dianggap sangat bermanfaat (useful) adalah butir soal yang mempunyai indeks tin gkat kesukaran dalam kategori sedang. 2. Daya Pembeda (D) Daya pembeda butir soal memiliki pengertian seberapa jauh butir soal tersebut dapat membedakan kemampuan individu peserta tes. Butir soal yang didukung oleh potensi daya pembeda yang baik akan mampu membedakan peserta tes (peserta didik) yang memiliki kemampuan tinggi (pandai) dengan peserta didik yang memiliki kemampuan rendah (kurang pandai). Indeks daya pembeda butir soal dapat dihitung dengan menggunakan rumus: D = PA – PB Keterangan: D adalah indeks daya pembeda butir soal PA adalah proporsi kelompok atas yang menjawab benar PB adalah proporsi kelompok bawah yang menjawab benar
Contoh:
Dalam menjawab butir soal nomor 2, diperoleh 6 dari 10 siswa yang termasuk dalam kelompok atas dapat menjawab benar dan 2 dari 10 siswa yang termasuk kelompok bawah dapat menjawab benar, maka indeks daya pembeda butir soal tersebut adalah: D = (6/10) – (2/10) = 4/10 = 0,4 Yang dimaksud siswa kelompok atas adalah kelompok siswa yang memperoleh skor tinggi sedangkan yang dimaksud dengan siswa kelompok bawah adalah kelompok siswa yang memperoleh skor rendah setelah mengerjakan satu set suatu mata pelajaran. Nilai indeks daya pembeda butir soal bergerak dari – 1 sampai 1. Semakin tinggi indeks daya pembeda menunjukkan bahwa butir soal tersebut semakin dapat membedakan antara siswa yang pandai dengan siswa yang kurang pandai. Secara teoritis indeks daya pembeda soal (D) = 1 akan tercapai apabila semua siswa kelompok atas dapat menjawab benar dan semua siswa kelompok bawah menjawab salah. Indeks daya pembeda soal (D) = – 1 akan tercapai apabila semua siswa dalam kelompok atas menjawab salah dan semua siswa kelompok bawah dapat menjawab benar. Sedangkan indeks daya pembeda soal (D) = 0 tercapai apabila proporsi siswa yang menjawab benar dalam kelompok atas dan kelompok bawah adalah sama. Butir soal yang mempunyai indeks daya pembeda negatif adalah butir soal yang kurang baik karena soal tersebut tidak bisa membedakan siswa yang pandai dengan siswa yang kurang pandai, di mana siswa yang kurang pandai justru lebih banyak menjawab benar daripada siswa yang pandai. Butir soal mempunyai daya pembeda yang baik jika kunci (jawaban soal) mempunyai daya pembeda positif dan pengecohnya mempunyai daya pembeda negatif. Menurut Fernandes (1984) kate gori indeks daya pembeda butir soal adalah sebagai berikut:
D <= 0,19 : tidak baik C. Bagaimana Cara Melakukan Analisis Secara Sederhana? Untuk melakukan analisis butir soal secara sederhana, berikut ini disajikan langkah-langkah yang diperlukan: 1. Hitunglah jumlah jawaban yang benar untuk seluruh siswa. 2. Berdasarkan jumlah jawaban yang benar dari seluruh siswa tersebut susunlah skor siswa mulai skor tertinggi ke skor terendah. 3. Berdasarkan urutan skor tersebut tentukan siswa yang termasuk dalam kelompok atas dan siswa dalam kelompok bawah. Untuk menentukan berapa persen siswa yang termasuk kelompok atas dan berapa persen yang masuk kelompok bawah gunakan rambu-rambu sebagai berikut: a. Jika jumlah siswa <= 20, maka jumlah kelompok atas dan kelompok bawah masing-masing 50%. b. Jika jumlah siswa 21 – 40 , maka jumlah kelompok atas dan kelompok bawah masing-masing 33,3%. c. lah kelompok atas dan kelompok bawah masing-masing 27%. 4. Hitunglah jumlah siswa dalam kelompok atas yang memilih tiap-tiap alternatif jawaban yang disediakan. 5. Dengan cara yang sama hitunglah jumlah siswa dalam kelompok bawah yan g memilih tiap-tiap alternatif jawaban yang disediakan. 6. Hitung jumlah seluruh peserta tes (kelompok atas, tengah, bawah) yang menjawab benar. 7. Tentukanlah tingkat kesukaran dan daya pembeda butir soal dengan menggunakan rumus yang telah disediakan. Contoh:
Perhatikan jawaban 100 siswa terhadap butir soal nomor 1 berikut: Kelompok Alternatif Jawaban Jumlah A B* C D E Atas 5 15 0 0 7 27 Tengah 3 25 12 0 5 27 Bawah 7 Catatan: * (kunci jawaban) Indeks tingkat kesukaran butir soal di atas adalah: P = B / N = (15 + 25 + 7)/100 = 47/100 = 0,47 Indeks daya pembeda butir soal di atas adalah : D = PA – PB = (15/27) – (7/27) = 0,30 D. Bagaimana Memperbaiki Butir Tes? Beberapa hal yang perlu diperhatikan dalam memperbaiki butir soal adalah sebagai berikut: 1. Perhatikan tingkat kesukaran butir soal. Butir soal diangg ap baik jika mempunyai indeks tingkat kesukaran (P) antara 0,25 sampai dengan 0,75 atau yang mendekati angka tersebut. 2. Perhatikan daya pembeda butir soal. Butir soal dianggap baik jika kunci (jawaban soal) mempunyai indeks daya pembeda positif tinggi dan pengecohnya mempunyai indeks daya pembeda negatif. 3. Perhatikan stem atau pokok soalnya sebab stem yang ambigius akan membingungkan peserta ujian untuk menentukan jawabannya.
Salah satu upaya dalam meningkatkan kualitas proses dan hasil belajar sebagai bagian dari peningkatan kualitas pendidikan dapat dilakukan melalui sistem penilaian. Dalam penilaian proses dan hasil belajar siswa di sekolah, guru memberikan suatu evaluasi untuk mengetahui sejauh mana penguasaan materi yang telah dikuasai oleh siswa selama proses belajar mengajar mengenai materi yang disampaikan. Dalam melaksanakan kegiatan evaluasi, berhasil atau tidaknya sangat ditentukan oleh tepat atau tidaknya pelaksanaan ujian. Untuk melaksanakan ujian ini memerlukan alat-alat. Bagi ujian tertulis maka alatnya adalah butir-butir soal tertulis. Bagi ujian lisan maka alatnya adalah butir soal tertulis yang disediakan bagi setiap testi, atau sekurang-kurangnya pokok pertanyaan yang sudah tertulis dan dipersiapkan sebelumnya. Bagi ujian praktek, maka alatnya adalah lembar pengamatan yang berisi segi-segi yang diamati beserta rentang skor masing-masing. Idealnya sebelum suatu tes dipergunakan maka tes tersebut harus memenuhi syarat-syarat sebagi tes yang baik, maka tes yang bersangkutan perlu diuji cobakan. Namun sebelum diuji cobakan tes tersebut harus memperlihatkan indokator-indikator sebagai tes yang baik. Dalam hal ini dilakukan suatu analisis butir soal. Analisis butir soal adalah pengkajian pertanyaan tes a gar diperoleh perangkat pertanyaan yang memiliki kualitas memadai. Analisis yang dilakukan atas dasar uji cob a dinamakan analisis empiris. Sedangkan analisis berdasarkan karakteristik yang tampak pada tes tersebut tanpa uji coba dinamakan analisis rasional, karena semata-mata dilakukan atas dasar pertimbangan rasio. Ada beberapa analisis butir soal, yakni analisis tingkat kesukaran soal dan analisis daya pembeda di samping validitas dan reabilitas. Menganalisis tingkat kesukaran soal artinya mengakaji soal dari segi kesulitann ya sehingga dapat diperoleh soal mana yang termasuk mudah, sedang dan sukar. Sedang menganalisis daya pembeda artinya mengkaji soal tes dari segi kesanggupan tes tersebut dalam membedakan siswa yang termasuk kategori kuat/tinggi prestasinya. Sedangkan validitas dan reabilitas mengkaji kesulitan da n keajegan pertanyaan tes. ANALISIS BUTIR SOAL Analisis butir soal yang dalam bahasa inggris disebut item a naliysis dilakukan terhadap empirik.Maksudnya, analisis itu baru dapat dilakukan apabila suatu tes telah dilaksanakan dan hasil jawaban terhadap butir-butir soal telah kita peroleh. Pengertian,Tujuan,dan Manfaat Analisis butir soal. Analisis butir soal adalah suatu kegiatan analisis untuk menentuka n tingkat kebaikan butir-butir soal yang terdapat dalam suatu tes sehingga informasi yang d ihasilkan dapat kita pergunakan untuk memperbaiki butir soal dan tes tersebut. Tujuan analisis butir soal yaitu untuk mengadakan identifikasi soal-soal yang baik,kurang baik dan soal yang buruk. Sehingga dapat petunjuk untuk mendapatkan perbaikan. Manfaat yang dapat diberikan apabila dilakukan analisis terhadap butir soal,sebagai berikut : Untuk mengetahui soal yang dianalisis telah berfungsi sebagaimana yang diharapkan. Untuk mengetahui tingkat kesukaran soal. Untuk mengetahui apakah tanggapan-tanggapan soal yang dianalisis sudah baik susunannya. Untuk mengetahui apakah soal yang dianalisis sudah betul/baik konstruksinya. Untuk bahan masukan menyusun program remedial teaching. Untuk meningkatakan keterampilan guru dalam merencanakan dan mengolah hasil tes. Jenis-jenis analisis Ada dua jenis analisis butir soal yang dapat pendidik laksanakan, yaitu : prosedur peningkatan secara judgement, terkait dengan isi dan bentuk soal.Analisis secara kualitatif Teknik analisis kualitatif Teknik moderator merupakan teknik berdiskusi yang di dalamnya terdapat satu orang sebagai penengah. Berdasarkan teknik ini, setiap butir soal didiskusikan secara bersama-sama d engan beberapa ahli dan dimoderatori oleh satu orang. Kelebihan : Setiap butir soal dapat dituntaskan secara bersama-sama, perbaikannya seperti apa. Kelemahan : Teknik ini adalah memerlukan waktu lama untuk rnendiskusikan setiap satu butir soal. Teknik panel merupakan suatu teknik menelaah butir soal yang setiap butir soalnya ditelaah berdasarkan kaidah penulisan butir soal. Para penelaah dipersilakan memperbaiki langsung pada teks soal dan memberikan komentarnya serta memberikan nilai pada setiap butir soalnya yang kriterianya adalah: baik, diperbaiki, atau diganti. prosedur peningkatan secara empirik,Analisis secara kuantitatif terkait dengan ciri-ciri statistiknya. Penelaahan butir soal didasarkan pada data empirik dari butir soal terkait yang telah diujikan. Pendekatan Analisis Kuantitatif - Klasik Analisis butir soal secara klasik adalah proses penelaahan butir soal melalui informasi dari jawaban peserta didik guna meningkatkan mutu butir soal yang bersangkutan dengan menggunakan teori tes klasik. Kelebihan : mudah , murah, sederhana, familier digunakan guru-guru, dapat menggunakan data sampel kecil. Kelemahan :
(1) Tingkat kemampuan dalam teori klasik adalah ―true score‖. Jika tes sulit artinya tingkat kemampuan
peserta didik mudah. Jika tes mudah artinya tingkat kemampuan peserta didik tinggi. (2) Tingkat kesukaran soal didefinisikan sebagai proporsi peserta didik dalam grup yang menjawab benar
soal. Mudah/sulitnya butir soal tergantung pada kemampuan peserta didik yang dites dan kemampuan tes yang diberikan. (3) Daya pembeda, reliabilitas, dan validitas soal/tes didefinisikan berdasarkan grup peserta didik. -Modern Penelaahan butir soal dengan menggunakan Item Response Theory (IRT) atau teori jawaban butir soal. Teori ini merupakan suatu teori yang menggunakan fungsi matematika untuk menghubungkan antara peluang menjawab benar suatu soal dengan kemampuan siswa. IRT merupakan hubungan antara probabilitas jawaban suatu butir soal yang benar dan kemampuan siswa atau tingkatan/level prestasi siswa. Kelebihan : (1) asumsi banyak soal yang diukur pada trait yang sama, perkiraan tingkat kemampuan peserta didik adalah independen; (2) asumsi pada populasi tingkat kesukaran, daya pembeda merupakan independen sampel yang menggambarkan untuk tujuan kalibrasi soal; (3) statistik yang digunakan untuk menghitung tingkat k emampuan siswa diperkirakan dapat terlaksana Kelemahan : prosesnya cukup rumit dan sulit Penghitungan dalam penelaahan butir soal secara kuantitatif dapat menggunakan bantuan kalkulator scientific atau program komputer.Program yang sudah dikenal secara umum adalah EXCEL, SPSS (Statitistical Program for Social Science), atau program khusus seperti ITEMAN (analisis secara klasik), RASCAL, ASCAL, BILOG (analisis secara item respon teori atau IRT), FACETS (analisis model Rasch untuk data kualitatif). Dalam analisis butir soal secara kuantitatif ada empat yang perlu dianalisis pada setiap soal yang telah dikerjakan siswa yaitu: Analisis Tingkat Kesukaran Soal Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkan. Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena di luar jangkauannya. Dalam menentukan kriteria soal, apakah soal tersebut termasuk mudah, sedang, atau sukar adalah berdasarkan pertimbangan – pertimbangan tertentu. Pertimbangan tersebut antara lain adalah: Aspek yang di ukur dalam pernyataan tersebut. Sifat materi yang di ujikan atau ditanyakan. Isi bahan yang di tanyakan sesuai dengan bidang keilmuannya, baik luasnya maupun kedalamannya. Cara melakukan analisis untuk menentukan tingkat kesukaran soal adalah sebagai berikut : 1). Menentukan indeks kesukaran (difficulty index), yaitu bilangan yang menunjukan sukar dan mudahnya sesuatu soal. Dalam dunia evaluasi belajar umumn ya dilambangkan dengan huruf P (proporstion). 0,0 1,0 Sukar Mudah Rumus mencari indeks kesukaran soal : P= B/Js x 100 % Dengan: P=Indeks kesukaran B= banyaknya siswa yang menjawab soal itu dengan betul Js= jumlah seluruh siswa peserta tes 2). Menentukan tingkat kesukaran, adalah ukuran yang menunjukan derajat kesulitan soal untuk diselesaikan oleh siswa dan mengetahui soal-soal yang termasuk mudah, sedang dan sukar. Rumus mencari tingkat kesukaran soal i).Tk=JB/JJ x 100 % Dengan: TK= Tingkat kesukaran JB= Jumlah jawaban yang benar JJ= Jumlah jawaban keseluruhan ii).F=(PH+PL)/2 Dengan: F =Tingkat kesukaran PH = Prosentase pada kelompok tinggi PL = Prosentase pada kelompok rendah Contoh soal : kita misalkan murid yang mengikuti tes yang kita berikan adalah sebanyak 50 orang .lembar jawababn murid-murid tersebut kita susun dari skor tertinggi paling atas sampai dengan skor terendah paling bawah. Kita ambil 27% dari mereka yang mendapatkan skor tertinggi.Dalam hal ini 27% X 50 orang sama dengan 13,5 orang kita bulatkan menjadi 14 orang.begitu pula kita ambil 27% dari mereka yang mendapatkan skor terendah.jumlahnya tentu sama dengan kelompok atas ,yaitu 14 orang juga. Misalkan data yang diperoleh adalah sebagi berikut : Untuk item no.1,dari kelompok bawah salah 9 orang dan dari kelompok atas salah 2 orang. Untuk item no.2,dari kelompok bawah salah 8 orang dan dari kelompok atas salah 85orang. Untuk item no.3,dari kelompok bawah salah 14 orang dan dari kelompok atas salah 8 orang. Untuk item no.4,dari kelompok bawah salah 6 orang dan dari kelompok atas tidak ada yang salah.
Untuk item no.5,dari kelompok bawah salah 13 orang dan dari kelompok atas salah 11 orang. Untuk item no.6,dari kelompok bawah salah 2 orang dan dari kelompok atas salah 3 orang. Berdasarkan data tersebut ,maka dapat dibuat tabe l sebagai berikut : No.item PL PH PL +PH PL-PH 1 9 2 11 7 2 8 5 13 3 3 14 8 23 6 46066 5 13 11 24 2 6 2 3 5 -1 DST Dari tabel tersebut,maka tingkat kesukaran untuk masing-masing item dap at dicari sebagi berikut : Untuk item no.1. Tk=JB/JJ x 100 % = 11 x 100% 28 = 39% Untuk item no.2 Tk=JB/JJ x 100 % =13 x 100 % = 46% 28 Untuk item no.3 Tk=JB/JJ x 100 % =23 x 100 % = 82% 28 Untuk item no.4 Tk=JB/JJ x 100 % = 6 x 100 % = 21% 28 Untuk item no.5 Tk=JB/JJ x 100 % = 24 x 100 % = 86% 28 Untuk item no.6 Tk=JB/JJ x 100 % = 5 x 100 % = 18% 28 Derajat kesukaran yang baik adalah derajat kesukaran yang bergerak 25% sampai 75%.item yang mempunyai derajat kesukaran dibawah 25% berarti bahwa itemtersebut terlalu mudah .sebaliknya item yang mempunyai derajat kesukaran 75% ,berarti bahwa item tersebut terlalu sukar. Kriteria indeks kesukaran soal adalah sebagai berikut. Kriteria yang digunakan adalah makin kecil indeks yang diperoleh, makin sulit soal tersebut. Sebaliknya, makin besar indeks yang diperoleh makin mudah soal tersebut. 0,00-0,30 Soal sukar 0,31-0,70 Soal sedang 0,71-0,90 Soal mudah Analisis Daya Pembeda Daya pembeda adalah mengkaji soal-soal tes dari segi kesanggupan tes tersebut dalam membedakan siswa yang termasuk ke dalam kategori rendah dan kategori tinggi prestasinya. Tujuan daya pembeda yaitu untuk mengetahui kesanggupan soal dalam membedakan siswa yang tergolong mampu (tinggi prestasinya) dengan siswa yang tergolong kurang atau lemah prestasinya. Cara melakukan analisis daya pembeda adalah sebagai berikut: a). Daya pembeda soal ditunjukan indeks diskriminasi (D) yang dihitung dengan menggunakan rumus: D=PH-PL Dengan: D = Daya Pembeda PH= Prosentase pada kelompok tinggi PL = Prosentase pada kelompok rendah b). Cara lain menghitung daya pembeda DP=(PL-pH)/n Dengan : DP = Indeks DP atau daya pembeda yang di cari PH = Prosentase pada kelompok tinggi PL = Prosentase pada kelompok renda n=jumlah kelompok atas atau kelompok bawah
Mengambil dari tabel dari soal tingkat kesukaran tad i bisa dilihat juga daya pembeda No.item PL PH PL +PH PL-PH 1 9 2 11 7 2 8 5 13 3 3 14 8 23 6 46066 5 13 11 24 2 6 2 3 5 -1 DST Untuk item no.1 DP=(PL-pH)/n Dp = 9-2 = 0,50 14 Untuk item no.2 DP=(PL-pH)/n Dp = 8-5 = 0,21 14 Untuk item no.3 DP=(PL-pH)/n Dp = 14-8 = 0,43 14 Untuk item no.4 DP=(PL-pH)/n Dp = 6-0 = 0,43 14 Untuk item no.5 DP=(PL-pH)/n Dp = 13-11 = 0,14 14 Untuk item no.6 DP=(PL-pH)/n Dp = 2-3 = -0,07 14 c). Klasifikasi daya pembeda adalah sebagai berikut: 0,00-0,20 Buruk 0,21-0,40 Cukup 0,41-0,70 Baik 0,71-1,00 Baik sekali Analisis validitas Suatu alat pengukur dapat dikatakan alat pengukur yang valid apabila alat pengukur tersebut dapat mengukur apa yang hendak diukur secara tepat. Penganalisaan terhadap tes hasil belajar sebagai suatu totalitas dapat dilakukan dengan dua cara. Pertama, penganalisaan yang dilakukan dengan jalan berpikir secara rasional atau penganalisaan dengan menggunakan logika (logical analysis). Kedua, penganalisaan yang dilakukan dengan mendasarkan diri kepada kenyataan empiris, di mana penganalisaan dilaksanakan dengan menggunakan empirical analysis. a. Pengujian Validitas Tes Secara Rasional Tes hasil belajar yang setelah dilakukan penganalisaan secara rasional ternyata memiliki daya ketepatan mengukur, disebut tes hasil belajar yang telah me miliki validitas logika (logical validity). Validitas rasional adalah validitas yang diperoleh atas dasar hasil pemikiran, validitas yang diperoleh dengan berpikir secara logis. 1). Validitas isi (content validity) Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan. Validitas isi ini sering juga disebut validitas kurikuler. Validitas isi adalah validitas yang ditilik dari segi isi tes itu sendiri sebagai alat pengukur hasil bel ajar peserta didik, isinya telah dapat mewakili secara representatif terhadap k eseluruhan materi atau bahan pelajaran yang seharusnya diteskan (diujikan). Upaya lain yang d apat ditempuh dalam rangka mengetahui validitas isi d ari tes hasil belajar adalah dengan jalan menyelenggarakan diskusi panel. Dalam forum diskusi tersebut, para pakar yang dipandang memiliki keahlian yang ada hubungann ya dengan mata pelajaran yang diujikan, diminta pendapat dan rekomendasinya terhadap isi atau materi yang terkandung dalam tes hasil belajar yang bersangkutan. Hasil-hasil diskusi itu selanjutnya dijadikan pedoman atau bahan acuan untuk memperbaiki dan menyempurnakan isi atau materi hasil belajar tersebut. Jadi kegiatan menganalisis validitas isi dapat dilakukan baik sesudah maupun sebelum tes hasil belajar dilaksanakan. Dalam hal tertentu tes yang telah disusun sesuai dengan kurikulum (materi dan tujuannya) agar memen uhi validitas isi, peneliti atau pemakai tes dapat meminta bantuan ahli bidang studi untuk mene¬laah apakah konsep materi yang diajukan telah memadai atau tidak, sebagai sampel tes. Dengan demikian validitas isi
tidak memerlukan uji coba dan analisis statistik atau dinyatakan dalam bentuk angka¬-angka. Contoh : Misalnya apabila kita ingin memberikan tes biology kepada anak-anak kelas II, maka item-itemnya harus diambil dari pelajaran kelas II. Kalau terdapat item -item yang diambil dari kelas III maka tes itu tidak valid lagi. 2).Validitas konstruksi (construct validity). Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir soal yang m embangun tes tersebut mengukur setiap aspek berfikir seperti yang disebutkan dalam tujuan instruksional khusus. Tes hasil belajar dapat dinyatakan sebagai tes yang telah memiliki validitas konstruksi apabila tes hasil belajar tersebut ( – ditilik dari segi susunan, kerangka atau rekaannya – ) telah dapat dengan secara tepat mencerminkan suatu konstruksi dalam teori psikologis. Tes hasil belajar baru dapat d ikatakan telah memiliki validitas susunan apabila butir-butir soal atau item yang membangun tes tersebut benar-benar telah dapat dengan secara tepat mengukur aspek-aspek berpikir (seperti: aspek kognitif, aspek efektif, aspek pdikomotorik dan sebagainya) sebagaimana telah ditentukan dalam tujuan instruksional khusus. Penganalisaan validitas konstruksi juga dapat dilakukan dengan jalan menyelenggarakan diskusi panel. Pengujian validitas konstruksi tes ini pun dapat dilakukan baik sesudah maupun sebelum tes hasil belajar tersebut dilaksanakan. Contoh : Konsep mengenai ―hubungan social‖, konsep sikap dapat dilihat dari indikatornya secara teoretis (deduksi teori) : dilihat dari pengalaman: - kesediaan menerima stimulus - (bisa bergaul dengan o rang lain) - kemauan reaksi stimulus - (disenangibanyak temannya) - menilai stimulus - (menerima pendapat orang lain) - menyusun/mengorganisasi - (tidak memaksakan pendapat) - internalisasi nilai - (bisa bekerjasama dgn siapapun) Apabila hasil tes menunjukkan indicator ang tidak berhubungan secara positif satu sama lain, berarti ukuran tersebut tidak memiliki validitas konstruksi. Maka prlu ditinjau atau diperbaiki kembali. b. Pengujian Validitas Tes Secara Empirik. Dimaksud dengan validitas empirik adalah ketepatan mengukur yang didasarkan pada hasil analisis yang bersifat empiric yang bersumber pada atau diperoleh atas dasar pengamatan di lapangan. Untuk dapat menentukan apakah tes hasil belajar sudah memiliki validitas empirik ataukah belum, dapat dilakukan penelusuran dari dua segi, yaitu dari segi daya ketepatan meramalnya (predictive validity) dan daya ketepatan bandingannya (concurrent validity). 3).Validitas ―Ada Sekarang‖ (Concurrent Validity) Validitas ini lebih umum dikenal dengan validitas empiris. Dikatakan validitas empiris jika hasilnya sesuai dengan pegalaman. Pengalaman selalu mengenal hal yang telah lampau sehingga data pengalaman tersebut sekarang sudah ada (ada sekarang, concurrent). Cara yang dipergunakan untuk menilai validitas ini dengan jalan mengkorelasikan hasil-hasil yang dicapai dalam tes dengan hasil-hasil yang dicapai dalam tes yang sejenis yang telah diketahui mempunyai validitas tinggi (misalnya tes standar). Tinggi rendahnya koefisien korelasi yang diperoleh menun jukkan tinggi rendahnya validitas tes yang akan kita nilai kualitasnya. 4).Validitas Prediksi (Predictive Validity) Sebuah tes dikatakan memiliki validitas prediksi atau validitas ramalan apa bila mempunyai kemampuan
untuk meramalkan apa yang akan terjadi pada masa yang akan datang. Istilah ―ramalan‖ jika dikaitkan
dengan validitas tes, maka yang dimaksud dengan validitas ramalan dari suatu tes adalah su atu kondisi yang menunjukan seberapa jauhkah sebuah tes telah dapat dengan secara tepat menunjukan kemampuannya untuk meramalkan apa yang bakal terjadi pada masa mendatang. Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang diperoleh setelah peserta tes mengikuti pelajaran di perguruan tinggi. Jika ternyata siapa yang memiliki nilai tes lebih tinggi gagal dalam ujian semester 1 dibandingkan dengan dahulu nilai tesnya lebih rendah maka tes masuk yang dimaksud tidak memiliki prediksi. Untuk mengetahui apakah suatu tes hasil belajar dapat dinyatakan sebagai tes yang telah memiliki validitas ramalan ataukah belum, dapat ditempuh dengan cara: mencari korelasi antara tes hasil belajar yang sedang diuji validitas ramalannya dengan kriterium yang ada. Jika diantara kedua variabel tersebut terdapat korelasi positif yang signifikan, maka tes hasil belajar yang sedang diuji validitas ramalannya itu, dapat dinyatakan sebagai tes hasil belajar yang telah memiliki daya ramal yang tepat, artinya: apa yang telah diramalkan, betul-betul telah terjadi secara nyata dalam praktek. Dalam rangka mencari korelasi antara tes hasil belajar yang sedang diuji validitas ramalannya dengan kriterium yang telah ditentukan itu, cara sederhana yang paling sering digunakan adalah dengan menerapkan Teknik Analisis Korelasional Product Moment dari Karl Pearson. Cara mengetahui Validitas Alat ukur. Sebuah tes dikatakan memiliki validitas jika hasilnya sesuai dengan kriterium, dalam arti memiliki kesejajaran antara hasil tes tersebut dengan kriterium. Teknik yang digunakan untuk mengetahui kesejajaran adalah teknik korelasi product moment yang dikemukakan oleh Pearson.
Rumus korelasi product moment ada 2 macam,yaitu : Korelasi product moment dengan simpangan Dengan : ┌xy = koefisien korelasi antara variable x dan variable y,dua variable yang dikorelasikan (x=X-x dan y=Y-y)
Σxy = jumlah perkalian x dengan y
x2 = kuadrat dari x. y2 = kuadrat dari y. Korelasi product moment dengan kata kasar
Dengan : ┌xy = koefisien korelasi anatara variable x dan varia ble y,dua variable yang dikorelasikan. N= Banyaknya siswa X= Nilai total Y= Skor total. Interprestasi mengenai besarnya koefisien korelasi adalah sebagai berikut: R INTERPRESTASI Antara 0,81-1,00 Tinggi Antara 0,61-0,80 Cukup Antara 0,41-0,60 Agak rendah Antara 0,21-0,40 Rendah Antara 0,00-0,20 Sangat rendah Contoh soal : Tabel : Persiapan U/ Mencari Validitas Tes Prestasi B.Inggris No Nama X Y x y x2 y2 xy 1 Nadia 6,5 6,3 0 -0,1 0,0 0,01 0,0 2 Susi 7 6,8 +0,5 +0,4 0,25 0,16 +0,2 3 Cecep 7,5 7,2 +1,0 +0,8 1,0 0,64 +0,8 4 Erna 7 6,8 +0,5 +0,4 0,25 0,16 +0,2 5 Dian 6 7 -0,5 +0,6 0,25 0,36 -0,3 6 Asmara 6 6,2 -0,5 -0,2 0,25 0,04 +0,1 7 Siswoyo 5,5 5,1 -0,1 -1,3 1,0 1,69 +1,3 8 Jihad 6,5 6 0 -0,4 0,0 0,16 0,0 9 Yanna 7, 6,5 +0,5 +0,1 0,25 0,01 +0,05 10 Lina 6 5,9 -0,5 -0,6 0,25 0,36 +0,3 Jumlah 65,0 63,8 3,5 3,59 2,65 Bila dilihat pada kedua hitungan diatas terdpt perbedaan 0,003 lebih besar pd simpangan ini wajar karna adanya pembulatan . Koefisien Korelasi adalah sebagai berikut: Antara 0,800 sampai dengan 1,00 = sangat tinggi Antara 0,600 sampai dengan 0,800 = tinggi Antara 0,400 sampai dengan 0,600 = cukup Antara 0,200 sampai dengan 0,400 =rendah Antara 0,00 sampai dengan 0,200 = sangat rendah Validitas Butir Soal Atau Validitas Item. Validitas di atas adalah validitas soal secara keseluruhan tes. Di samping mencari validitas soal perlu juga mencari validitas butir soal atau validitas item. Sebuah item memiliki validitas yang tinggi jika skor pada item mempunyai kesejajaran dengan skor total. Kesejajaran ini d apat diartikan dengan korelasi sehingga untuk mengetahui validitas item digunakan rumus korelasi. Untuk soal-soal bentuk objektif skor untuk item b iasa diberikan dengan 1 (bagi item yang dijawab benar) dan 0 (bagi item yang dijawab salah). Sedangkan skor total merupakan jumlah dari skor untuk semua item yang membangun soal tersebut. Rumus untuk menghitung validitas item. Dengan : Rpbis = koefisien korelasi biserial. Mp = rerata skor dari subjek yang menjawab betul bagi item yang dicari validitasnya. Mt = rerata skor total St = standar deviasi dan skor otal P = proporsi siswa yang menjawab benar (banyakknya siswa yang benar dibagi jumlah seluruh siswa) g= proporsi siswa yang menjawab salah (g=1-p) Sedangkan untuk menghitung validitas item pada soal-soal tes dan soal-soal bentuk uraian di mana skor untuk setiap item diberikan menghendaki gradualisasi penialain, men ggunakan rumus korelasi product moment baik dengan simpanagan atau dengan angka kasar antara skor setiap item dengan skor total. Penafsiran koefisien korelasinya dapat melihat ke tabel harga kritik r product moment pearson dengan kriteria jika r yang dihitung lebih besar dari r tabel maka item tersebut valid. Analisis Reliabilitas. Suatu tes dapat dikatakan mempunyai kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap. Maka pengertian realibilitas tes berhubungan dengan masalah ketetapan hasil tes atau seandainya
hasilnya berubah-rubah, perubahan yang terjadi dapat dikatakan tidak berarti. Reliabilitas alat penilaian adalah ketetapan atau keajegan alat dalam menilai apa yang dinilainya. Beberapa hal yang memepengaruhi hasil tes: Hal yang berhubungan dengan tes itu sendiri, yaitu panjang tes dan kualitas butir-butir soalnya. Hal yang berhubungan dengan tercoba (testee) Suatu tes yang dicobakan kepada kelompok yang terdiri dari banyak siswa akan mencerminkan keragaman hasil yang menggambarakan besar kecilnya reliabilitas tes. Hal yang berhubungan dengan penyelenggaraan tes. Faktor penyelenggaraan tes yang bersifat administrasi sangat menentukan hasil tes. Kualitas butir-butir soal ditentukan oleh : Jelas tidaknya rumusan soal. Baik tidaknya pengarahan soal kepada jawaban sehingga tidak menimbulkan salah jawab. Petunjuknya jelas sehingga mudah dan cepat dikerjakan. Cara – cara mencari besarnya reliabilitas yaitu : Metode Bentuk Parallel (Equivalent). Tes parallel atau tes ekuivalen adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran, dan susunan tetapi butir-butir soalya berbeda. Metode Tes Ulang (Test-Retest Method) Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes. Dalam menggunakan teknik atau metode ini pengetesannya memiliki satu segi tetapi dicobakan dua kali. 3.) Metode Belah Dua(Split-Half Method). Dalam menggunakan metode ini pengetes hanya menggunakan sebuah tes dan dicobakan satu kali pada waktu membelah dua dan mengkorelasikan dua belahan baru diketahui reliabiltas separo tes. Syarat menggunakan metode ini adalah bahwa banyaknya butir soal harus genap agar dapat dibelah, item-item yang membangun soal harus homogeny atau dibelah terdapat keseimbangan antara belahan pertama dan belahan kedua. Rumus empiris Spearman-Brown sebagai berikut :
r_(11=) (2 .r 1⁄2 1⁄2)/(( 1+r 1⁄(2 1⁄2))) dengan keterangan: r11 : koefisien realiabilitas yang sudah disesuaikan. r1/21/2 : korelasi antara skor-skor setiap belahan tes. . Contoh: Koefisien korelasi belah dua adalah 0,60 R11 = = Sedangkan untuk mengatasi kesulitan bila berhadapan dengan banyaknya butir soal ganjil atau genap, maka digunakan rumus kuder-Richhardson (KR-20) sebagai berikut : r_11=[n/(n-1)][(S^2- ∑▒pq)/S^2 ] dengan : r11 = reliabilitas instrument n= banyakknya butir soal S=standar deviasi dari tes (akar varians) P=proporsi subjek yang menjawab item dengan benar q =proporsi subjek yang menjawab item dengan salah.
Σpq= jumlah hasil perkalian p dan q
Untuk mecari reliabilitas tes bentuk uraian dan bentuk non tes digunakan rumus Alpha sebagai berikut : Misalnya disusun tes sebanyak 80 soal. Setelah di berikan kepada sejumlah siswa dalam kelas tertentu, lalu dicari nilai rata rata dan simpangan bakun ya. Misalnya diperoleh nilai rata rata 60 dan simpangan b akunya 8. Dengan rumus di atas maka: R11 = = = = 0,77 Uraian ukuran reliabilitas yang telah dijelaskan di atas dapat dipertimbangkan oleh peneliti, cara mana yang paling tepat digunakan bergantung pada peneliti. Pertimbangan tersebut, antara lain sifat variabel yang diukur, jenis alat ukur, jumlah subjek yang diuku r, serta hasil hasil pengukuran yang diharapkan sesuai dengan tujuan penelitian. Misalnya seorang guru hendak melihat reliabilitas tes yang telah dibuatnya. Setelah melakukan dua kali pengukuran didapatkan skor tes sebagai berikut: Koefisien reliabilitas test di atas dapat dihitung dengan menggunakan formula korelasi produk momen dari Pearson sebagai berikut: Dengan demikian, korelasi sebesar 0,954 menggambarkan bahwa reliabilitas tes cukup tinggi. Salah satu kelemahan mendasar dari teknik test-retest adalah carry-over effect. Masalah ini disebabkan oleh adanya kemungkinan pada test yang k edua dipengaruhi oleh test pertama. Misalnya, jika peserta tes masih ingat dengan soal-soal dan bahkan jawaban ketika dilakukan test pertama. CONTOH PERHITUNGAN RELIABILITAS (METODA BELAH DUA) Nama Skor Skor Siswa Ganjil Genap
X Y X2 Y2 X.Y A 20 25 400 625 500 B 38 40 1444 1600 1520 C 28 26 784 676 728 D 33 32 1089 1024 1056 E 33 43 1089 1849 1419 F 44 45 1936 2025 1980 G 17 16 289 256 272 H 33 32 1089 1024 1056 I 36 35 1296 1225 1260 J 35 32 1225 1024 1120 K 30 26 900 676 780 L 42 38 1764 1444 1596
————————————————————————————————— - Jumlah: 389 390 13305 13448 13287 Setelah dihitung / dijumlahkan diperoleh harga-harga: Y=390,X=389, N=12, XY=13287Y2=13448, X2=13305, Harga-harga tersebut di atas dimasukkan ke dalam rumus Pearson’s Product Moment sebagai berikut: Y)X) (XY) – ( N ( — rxy = – ____________________________ Y) 2]Y2) - ( X)2] [N(X2) - ( √ [N( Dengan rumus itu diperoleh harga rxy atau rgg = 0,88 2 x 0,88 1,72 Koef. reliabilitas (rtt) = ———— - = —— = 0,94 1 + 0,88 1,88 Berarti tes ini tergolong baik sebab reliabilitasnya tinggi. KESIMPULAN Analisis butir soal bertujuan untuk memperoleh kualitas soal yang baik sehingga dapat memperoleh gambaran tentang prestasi siswa yang sebenarnya. Ada beberapa cara melalukan analisis butir soal: untuk dapat membedakan soal kategori mudah, sedang dan sukar.Analisis tingkat kesukaran soal mengkaji apakah soalAnalisis daya pembeda mempunyai kemampuan dalam membedakan siswa termasuk kategori mempunyai kemampuan tinggi atau rendah. mengkaji kesahihan alat ukur (soal) dalam menilaiAnalisis validitas apa yang seharusnya diukur atau mengkaji ketepatan soal sebagai alat ukur. mengkaji keajegan atau ketetapan hasil tesAnalisis reliabilitas manakala tes tersebut diujikan kepada siswa yang sama lebih dari satu kali.