RELIABILITAS TES
Pendahuluan
Tes hasil belajar digunakan untuk mengukur hasil belajar tertentu pada sejumlah siswa peserta tes. Tes hasil belajar yang baik dicapai melalui proses pembakuan (standardization). Dalam proses pembakuan, tes hasil belajar dicobakan untuk mengukur hasil belajar sejumlah peserta uji coba dan memeriksa terpenuhinya persyaratan sebagai tes hasil belajar yang baik. Uji coba untuk pemeriksaaan kualitas tes hasil belajar harus dilakukan sebelum benar- benar digunakan untuk mengumpulkan data hasil belajar. Pemeriksaan dilakukan untuk menjamin bahwa pengukuran dilakukan menggunakan tes hasil belajar yang layak untuk pengumpulan data hasil belajar.
Tes hasil belajar yang memenuhi syarat alat ukur yang baik dapat menghasilkan hasil ukur belajar yang akurat. Syarat yang harus dipenuhi untuk menjadi alat ukur hasil belajar yang baik berhubungan dengan validitas dan reliabilitas. Reliabilitas memberikan konsistensi yang membuat terpenuhinya syarat utama, yaitu validnya suatu hasil skor instrumen. Di samping itu, reliabilitas juga menunjukkan gambaran praktis yang dapat diklasifikasi berkaitan erat dengan syarat ketiga, yaitu kebermanfaatan (usability). Ini berarti semakin reliabel suatu tes, semakin yakin kita dapat menyatakan bahwa dalam hasil suatu tes mempunyai hasil yang sama dan bisa dipakai di suatu tempat sekolah, ketika dilakukan tes kembali.
Dalam kenyataanya, tes yang mempunyai nilai koefisien reliabilitas sempurna adalah tidak ada. Karena skor itu kemungkinan besar bervariasi, yang disebabkan oleh terjadinya kesalahan pengukuran yang berasal dari bermacam- macam sumber. Jika sebuah tes mempunyai reliabilitas yang tinggi maka pengaruh kesalahan pengukuran telah terkurangi.. Dalam makalah ini akan dibahas tentang reliabilitas dan berbagai metode pengujian reliabilitas yang dapat dipilih.
Pengertian Reliabilitas Tes
Reliabilitas berasal dari kata rely yang artinya percaya dan reliabel yang artinya dapat dipercaya. Reliabilitas sering diartikan dengan keterandalan, artinya suatu tes memiliki keterandalan bila mana tes tersebut dipakai mengukur berulang- ulang hasilnya sama. Dengan demikian reliabilitas dapat pula diartikan dengan keajengan atau stabilitas. Reliabilitas diartikan dengan keajengan bila mana tes tersebut diujikan berkali- kali hasilnya relatif sama, artinya setelah hasil tes pertama dengan tes berikutnya dikorelasikan terdapat hasil korelasi yang signifikan.
Reliabilitas juga menunjuk pada ketetapan (konsistensi) dari nilai yang diperoleh sekelompok individu dalam kesempatan yang berbeda dengan tes yang sama ataupun yang itemnya ekuivalen. Menurut para ahli, reliabilitas berarti:
Menurut Conny Semiawan (1982): Reliabilitas menunjukkan pada ketetapan (konsistensi) dari nilai yang diperoleh sekelompok individu dalam kesempatan yang berbeda dengan tes yang sama ataupun yang itemnya ekuivalen .
Menurut Sugiono (2005): Reliabilitas adalah serangkaian pengukuran atau serangkaian alat ukur yang memiliki konsisten bila pengukuran yang dilakukan dengan alat ukur itu dilakukan secara berulang.
Menurut Sukadji (2000): Reliabilitas suatu tes adalah seberapa besar derajat tes mengukur secara konsisten sasaran yang diukur.
Menurut Nursalam (2003): Reliabilitas adalah kesamaan hasil pengukuran atau pengamatan bila fakta atau kenyataan hidup tadi diukur atau diamati berkali – kali dalam waktu yang berlainan. Alat dan cara mengukur atau mengamati sama- sama memegang peranan penting dalam waktu yang bersamaan.
Cara Menentukan Reliabilitas Suatu Tes
Reliabilitas Dengan Tes- Retes
Reliabilitas tes- retes adalah derajat yang menunjukkan konsistensi hasil sebuah tes dari waktu ke waktu. Tes- retes menunjukkan variasi skor yang diperoleh dari penyelenggaraan satu tes evaluasi yang dilakukan dua kali atau lebih, sebagai akibat kesalahan pengukuran. Dengan kata lain, kita tertarik dalam mencari kejelasan bahwa skor siswa mencapai suatu tes pada waktu tertentu adalah sama hasilnya, ketika siswa tersebut dites lagi dengan tes yang sama. Dengan melakukan tes- retes tersebut, seorang guru akan mengetahui seberapa jauh konsistensi suatu tes mengukur apa yang ingin diukur.
Reliabilitas tes- retes lebih penting, khususnya ketika digunakan untuk menentukan prediktor misalnya tes kemampuan. Tes kemampuan tidak akan bermanfaaat, jika ternyata menunjukkan hasil yang selalu berubah- ubah secara signifikan saat diberikan kepada responden. Penentuan pemakaian reliabilitas tes- retes, juga tepat ketika bentuk tes alternatif lainnya tidak ada, dan ketika tampak bahwa orang yang mengambil tes kedua kalinya tidak ingat atas jawaban tes yang pertama.
Jika banyak siswa memperoleh skor yang sangat berbeda pada setiap kali pelaksanaaan tes, maka hal ini tidak stabil maka hasil- hasilnya perlu diulang. Reliabilitas tes- retes dapat dilakukan dengan cara seperti berikut:
Selenggarakan tes pada suatu kelompok yang tepat sesuai dengan rencana.
Setelah selang waktu tertentu, misalnya satu minggu atau dua minggu, lakukan kembali tes yang sama dengan kelompok yang sama tersebut.
Korelasikan hasil kedua tes tersebut.
Jika hasil koefisien korelasi menunjukkan tinggi, berarti reliabilitas tes adalah bagus. Sebaliknya, jika korelasi rendah, berarti tes tersebut mempunyai konsistensi rendah. Tes- retes juga mempunyai beberapa permasalahan. Diantaranya ialah faktor waktu jeda atau tenggang yang diambil, ketika dilakukan tes pertama dengan tes kedua. Jika interval waktu terlalu pendek, siswa memiliki kesempatan untuk mengingat jawaban dalam tes sehingga tes yang kedua dapat dipastikan lebih baik, karena faktor retensi atau sisa- sisa hapalan yang terjadi pada subjek pelaku. Jika interval waktu terlalu panjang, kemampuan para pelaku yang mengikuti tes mungkin bertambah karena dua kemungkinan, yaitu faktor maturasi atau kedewasaan dan faktor intervensi dari faktor belajar para subjek.
Reliabilitas Bentuk Ekuivalensi
Tes ekuivalen adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran, dan susunan, tetapi butir- butir soalnya berbeda. Dalam menggunakan metode tes ini pengetes harus menyiapkan dua buah tes, dan masing- masing dicobakan pada kelompok siswa yang sama. Oleh karena itu, ada orang yang menyebutkan sebagai double- test- double- trial method. Penggunaan metode ini baik karena siswa dihadapkan kepada dua macam tes sehingga tidak ada faktor " masih ingat soalnya" yang dalam evaluasi disebut adanya practice – effect dan carry- over effect, artinya ada faktor yang dibawa oleh pengikut tes karena sudah mengerjakan soal tersebut. Kelemahan dari metode ini adalah bahwa pengetes pekerjaaannya berat karena harus menyusun dua seri tes. Lagi pula harus tersedia waktu yang lama untuk mencobakan dua kali tes.
Tes yang ekuivalen yang akan diukur reliabilitasnya dibuat identik dengan tes acuan. Setiap tampilannya, kecuali substansi item yang ada, tepat berbeda. Kedua tes tersebut sebaiknya mempunyai karakteristik sama. Karakteristik yang dimaksud misalnya mengukur variabel yang sama mempunyai jumlah item yang sama, struktur yang sama, mempunyai tingkat kesulitan yang mempunyai petunjuk, cara penskoran, dan interpretasi yang sama.
Reliabilitas ekuivalen, pada umumnya juga menggambarkan bentuk konsistensi alternatif, yang dapat menunjukkan variasi skor yang terjadi dari bentuk tes evaluasi satu dengan bentuk tes lainnya. Akan tetapi, yang juga perlu diingat ialah bahwa pengambil tes reliabilitas ekuivalen ini akan dapat mencapai hasil yang tepat, jika pengambil tes hapal terhadap jawaban tes yang dibuat dalam sesi pertama, sehingga mereka dapat menjawab kembali tes yang kedua. Kedua bentuk alternatif tes tersedia, yang perlu diketahui dari kedua tes adalah berapa reliabilitas ekuivalensi. Hal ini perlu diyakinkan kembali, agar terjadi bahwa skor seseorang tidak akan dipengaruhi oleh cara mengadministrasikan tes tersebut. Adapun langkah- langkah yang ditempuh adalah:
1. Menyusun dua buah tes yang ekuivalen.
2. Mengujikan kedua tes tersebut (dalam waktu yang bersamaan dan beriringan).
3. Memberikan skor hasil tes yang telah diujikan, disusun dengan memisahkan antara tes A dengan B.
4. Mencari koefisien stabilitas kedua tes dengan jalan mencari korelasinya melalui rumus korelasi product moment.
Reliabilitas Dengan Belah Dua (Split-Half)
Suatu tehnik yang terkenal dalam menghitung ekuivalensi item melalui administrasi satu tes tunggal adalah tehnik perhitungan reliabilitas spilt – half . Split berarti membelah dan half berarti separo. Tes dibelah menjadi dua bagian. Jadi kita akan membagi salah satu tes ke dalam dua bagian yang sama, masing- masing bagian berisi jumlah item yang sama dan setiap tes memiliki proporsi item yang sama (jumlah item, isi, dan corak yang sama) dan tingkat kesukaran dan daya beda yang sama.
Reliabilitas belah dua ini termasuk reliabilitas yang mengukur konsistensi internal. Yaitu salah satu tipe reliabilitas yang dibesarkan pada keajengan dalam setiap item tes evaluasi. Reliabilitas belah dua ini pelaksanaannya hanya memerlukan waktu satu kali. Ada beberapa kemungkinan dalam cara ini. Termasuk perbedaan kondisi tes yang terjadi, ketika menggunakan metode tes- retes dapat dihilangkan. Reliabilitas belah dua juga tepat digunakan, ketika tes evaluasi yang ada terlalu panjang. Cara melakukan pembelahan hasil tes tersebut dapat dilakukan dua jalan, yaitu:
Prosedur ganjil genap, artinya seluruh item yang bernomor ganjil dikumpulkan menjadi satu kelompok, dan seluruh item yang bernomor genap menjadi satu kelompok yang lain.
Prosedur secara random, misalnya dengan jalan lotre, atau dengan jalan mempergunakan tabel bilangan random.
Kuder- Richarson
Dalam metode ini, digunakan perhitungan statistik pada setiap item dan hasil- hasil koefisien Kuder Richarson. Item- item tes yang baik harus dibedakan diantara orang yang ada, misalnya, sangat baik, rata- rata kurang dalam mengeja. Jika setiap siswa berhasil pada setiap item atau gagal pada setiap item tes, maka tidaklah dapat dibedakan di antara siswa dan tidaklah dapat diukur reliabilitas atau ketepatannya.
Jika tes itu memiliki seratus item kita bisa memperkirakan siswa rata- rata akan memperoleh lima puluh item dengan tepat, di atas rata- rata dapat menjawab tujuh puluh dan superior dapat menjawab sembilan puluh item. Lebih lanjut kita memperkirakan sebagian besar akan berhasil menjawab item- item yang mudah, kita juga mengharapkan agar kemampuan mengeja untuk berhasil pada item- item yang sangat sukar.
Adapun perhitungan reliabilitas dilakukan dengan langkah- langkah sebagai berikut:
Menyusun tabel persiapan perhitungan.
Menghitung varians total.
Menghitung reliabilitas.
Faktor- Faktor Yang Mempengaruhi Reliabilitas
Koefisien reliabilitas dapat dipengaruhi oleh waktu penyelenggaraan tes- retes. Interval penyelenggaraan yangh terlalu dekat atau terlalu jauh, akan mempengaruhi koefisien reliabilitas. Faktor- faktor lain yang juga mempengaruhi reliabilitas instrumen evaluasi di antaranya sebagai berikut:
Panjang tes, semakin panjang suatu tes evaluasi, semakin banyak jumlah item materi pembelajaran diukur. Ini menunjukkan dua kemungkinan yaitu tes semakinmendekati kebenaran, dan dalam mengikuti tes, semakin kecil siswa menebak. Berarti akan semakin tinggi nilai koefisien reliabilitas.
Penyebaran skor, koefisien reliabilitas secara langsung dipengaruhi oleh bentuk sebaran skor dalam kelompok siswa yang diukur. Semakin tinggi sebaran, semakin tinggi estimasi koefisien reliabilitas. Hal ini terjadi karena posisi skor siswa secara individual mempunyai kedudukan sama pada tes- retes lain, sebagai acuan.
Kesulitan tes, tes formatif yang terlalu mudah atau terlalu sulit untuk siswa, cenderung menghasilkan skor reliabilitas rendah. Fenomena tersebut akan menghasilkan sebaran skor yang cenderung terbatas pada salah satu sisi.
Objektivitas, yang dimaksud dengan objektif yaitu derajat dimana siswa dengan kompetensi sama, mencapai hasil sama. Ketika prosedur tes evaluasi memiliki objektivitas tinggi, maka reliabilitas hasil tes tidak dipengaruhi oleh prosedur teknik penskoran. Item tes skor objektif yang dihasilkan tidak dipengaruhi pertimbangan atau opini dari seorang evaluator.
Hubungan Validitas Dan Reliabilitas Tes
Reliabilitas diperlukan untuk pengujian validitas dan lebih mudah untuk dicapai daripada validitas. Meskipun reliabilitas diperlukan untuk memiliki ukuran yang valid dari suatu konsep, hal itu tidak menjamin ukuran tersebut bisa berlaku. Suatu ukuran yang reliabel atau dapat menghasilkan hasil yang sama berulang-ulang, namun belum tentu valid atau mungkin hasil pengukuran tidak cocok dengan definisi konstruk.
Validitas dan reliabilitas merupakan konsep yang saling melengkapi, namun dalam beberapa situasi mereka bertentangan satu sama lain. Kadang-kadang, validitas meningkat namun reliabilitas lebih sulit dicapai, atau sebaliknya. Hal ini terjadi ketika memiliki definisi konstruk yang sangat abstrak dan tidak mudah diamati. Reliabilitas paling mudah dicapai ketika ukuran secara tepat dan dapat diamati. Dengan demikian, ada pertentangan antara esensi sebenarnya dari konstruk yang sangat abstrak dan mengukurnya secara konkret.
Umumnya orang berpendapat bahwa validitas mempunyai hubungan proporsional dengan reliabilitas. Orang menduga bahwa semakin valid suatu tes, semakin reliabel dan sebaliknya. Dugaan itu tidak sepenuhnya salah, tetapi juga tidak sepenuhnya betul.
Tujuan validitas dan reliabilitas seringkali bersilangan. Bila kita ingin mempunyai suatu tes reliabel sekaligus valid dengan koefisien tinggi, sering kita mengerjakan pekerjaan yang mempunyai tujuan bersilangan. Reliabilitas maksimal membutuhkan interkorelasi tinggi antar item, sedangkan validitas prediktif yang maksimal memerlukan interkorelasi antar item rendah. Reliabilitas maksimal membutuhkan item dengan tingkat kesukaran sama, sedangkan validitas prediktif maksimal menuntut tes memiliki taraf kesukaran berbeda, sehingga perlu kompromi.
Bila kita ingin mempertinggi reliabilitas suatu tes dan sekaligus mempertinggi validitas, cara yang dapat ditempuh adalah menambah varians faktor umum. Namun jika langkah ini kita ambil, sebaiknya diperhitungkan apakah penambahan faktor umum ini dapat terjangkau oleh peserta didik. Oleh karena itu perlu dalam penentuan perencanaan, terutama dalam penyusunan kisi-kisi tes, faktor umum yang akan diperbanyak itu diperhitungkan juga jangan terlalu keluar dari program dan proses pendidikan sebelumnya.
Kesimpulan
Reliabilitas berasal dari kata rely yang artinya percaya dan reliabel yang artinya dapat dipercaya. Reliabilitas sering diartikan dengan keterandalan, artinya suatu tes memiliki keterandalan bila mana tes tersebut dipakai mengukur berulang- ulang hasilnya sama. Dengan demikian reliabilitas dapat pula diartikan dengan keajengan atau stabilitas. Reliabilitas diartikan dengan keajengan bila mana tes tersebut diujikan berkali- kali hasilnya relatif sama, artinya setelah hasil tes pertama dengan tes berikutnya dikorelasikan terdapat hasil korelasi yang signifikan.
Adapun cara menentukan reliabilitas suatu tes adalah:
Reliabilitas Dengan Tes- Retes
Reliabilitas Bentuk Ekuivalensi
Reliabilitas Dengan Belah Dua (Split-Half)
Kuder Richarson
Faktor yang mempengaruhi reliabilitas suatu tes yaitu:
Panjang tes
Penyebaran skor
Kesulitan tes
Objektivitas
Reliabilitas diperlukan untuk pengujian validitas dan lebih mudah untuk dicapai daripada validitas. Meskipun reliabilitas diperlukan untuk memiliki ukuran yang valid dari suatu konsep, hal itu tidak menjamin ukuran tersebut bisa berlaku. Suatu ukuran yang reliabel atau dapat menghasilkan hasil yang sama berulang-ulang, namun belum tentu valid atau mungkin hasil pengukuran tidak cocok dengan definisi konstruk. Validitas dan reliabilitas merupakan konsep yang saling melengkapi.
DAFTAR PUSTAKA
Dewa Ketut Sukardi, Analisis Tes Psikologi, Jakarta: Rineka Cipta, 1990.
M. Chabib Thoha,Tenik Evaluasi Pendidikan, Jakarta: Raja Grafindo Persada, 1991
M. Sukardi, Evaluasi Pendidikan, Jakarta: Bumi Aksara, 2011.
Purwanto, Evaluasi Hasil Belajar ,Yogyakarta: Putaka Pelajar,2010.
Suharsimi Arikuntu, Dasar- Dasar Evaluasi Pendidikan, Jakarta: Bumi Aksara, 2012.
Jacobs, L. C. (1991). Test Reliability. IU Bloomington evaluation service & testing. Diakses pada tanggal 15 Oktober 2015 pukul 11.11 WIB dari www .indiana.edu
.
Purwanto, Evaluasi Hasil Belajar (Yogyakarta: Putaka Pelajar,2010), hlm. 153.
M. Chabib Thoha,Tenik Evaluasi Pendidikan (Jakarta: Raja Grafindo Persada, 1991), hlm. 118.
M. Sukardi, Evaluasi Pendidikan (Jakarta: Bumi Aksara, 2011), hlm. 45.
Ibid., hlm .46.
Suharsimi Arikunto, Dasar- Dasar Evaluasi Pendidikan (Jakarta: Bumi Aksara, 2012), hlm. 105.
M.Sukardi, Op., Cit. hlm.46
Dewa Ketut Sukardi, Analisis Tes Psikologi (Jakarta: Rineka Cipta, 1990), hlm. 192.
Dewa Ketut Sukardi, Op. Cit., hlm. 193.
M. Sukardi, Op. Cit., hlm.51-52.
Jacobs, L. C. (1991). Test Reliability. IU Bloomington evaluation service & testing. Diakses pada tanggal 15 Oktober 2015 pukul 11.11 WIB dari www .indiana.edu.
M. Chabib Thoha, Op., Cit. hlm.117-118.
11