Resume Buku Evaluasi PAI Prof. Dr. Suharsimi Arikunto
25 Tuesday Jun 2013
Posted by Syarifah, M. Pd. I in Evaluasi PAI
2 Comments
Bab 1 PENDAHULUAN
1. Pengertian Pengukuran, Penilaian dan Evaluasi
Menurut Prof. Dr. Suharsimi Arikunto dalam bukunya dasar-dasar evaluasi pendidikan, yang menyatakan : kita tidak dapat mengadakan penilain sebelum kita mengadakan pengukuran.
Mengukur adalah membandingkan sesuatu dengan satu ukuran. Pengukuran bersifat kuantitatif.
Menilai adalah mengambil suatu keputusan terhadap sesuatu dengan ukuran baik dan buruk. Penilaian bersifat kuantitatif.
Mengadakan Evaluasi meliputi kedua langkah diatas, yakni mengukur dan menilai
Jadi, dalam istilah asing pengukuran adalah Measurement, sedang penilaian adalah Evaluation. Dari kata evaluation inilah diperoleh kata evaluasi yang berarti menilai (tetapi dilakukan dengan mengukur terlebih dahulu). Jadi evaluasi adalah kegiatan untuk mengumpulkan informasi tentang bekerjanya sesuatu, yang selanjutnya informasi tersebut digunakan untuk menentukan alternatif yang tepat dalam mengambil keputusan, yang dimaksudkan untuk membantu para guru dalam pengambil keputusan dalam usaha menjawab pertanyaan atau permasalahan yang ada. Fungsi utama evaluasi dalam hal ini adalah menyediakan informasi-informasi yang berguna bagi pihak decision maker untuk menentukan kebijakan yang akan diambil berdasarkan evaluasi yang telah dilakukan.
2. Penilaian Pendidikan
Dalam pendidikan, ada awalnya pengertian evaluasi pendidikan selalu dikaitkan dengan prestasi belajar siswa. Definisi yang pertama dikembangkan oleh Ralph Tyler (1950). Ahli ini mengatakan bahwa evaluasi merupakan sebuah proses pengumpulan data untuk menentukan sejauh mana, dalam hal apa, dan bagian mana tujuan tercapai. Jika belum, bagaimana yang belum dan apa sebabnya. Definisi ini diperluaskan oleh dua ahli lain, yakni Cronbach dan Stufflebeam. Tambahan definisi tersebut adalah bahwa proses evaluasi bukan sekedar mengukur sejauh mana tujuan tercapai, digunakan untuk membuat keputusan.
3. Mengapa Menilai?
Menurut suharsimi arikunto ada beberapa makna dari proses penilaian antara lain sebagai berikut:
a. Makna Bagi siswa
Dengan diadakannya penilaian maka siswa dapt mengetahui sejauh man telah berhasil mengikuti pelajaran yang diberikan oleh guru. Hasil yang diperoleh oleh siswa ada 2 kemungkinan :
1). Memuaskan. Jika siswa memperoleh hasil yang memuaskan siswa akan memiliki motvasi yang cukup besar agar dapat belajar lebih giat.
2). Tidak Memuaskan. Jika siswa tidak puas dengan hasil yang diperolehnya, maka ia akan beruaha agar lain kali tidak seperti itu lagi.
b. Makna bagi guru
1). Dengan hasil penilaian guru dapat mengetahui siswa mana saja yang berhak melanjutkan pelajaran.
2). Guru dapat mengetahui apakah pelajaran yang ia sampaikan tepat sasaran kepada siswa.
3). Guru akan mengetahui apakah metode yang ia gunakan sudah dapat maksimal atau belum.
c. Makna Bagi Sekolah
1). Apabila guru-guru mangadakan penilaian akan diketahui hasil siswa, maka dapat diketahui pula apakah kondisi belajar disekolah sudah sesuai harapan atau belum.
2). Akan ada informasi tentang tepat tidaknya kurikulum sekolah.
3). Akan ada informasi hasil penilaian dari tahun ke tahun yang bias digunakan sebagai pedoman dari tahun ke tahun.
4. Tujuan atau Fungsi Penilaian
Dengan diketahuinya makna dari penilaian, maka dapat dikatakan bahwa fungsi penilaian adalah sebagai berikut:
a. Penilaian berfungsi selektif.
Dengan cara penilaian guru mempunyai cara untuk mengadakan seleksiatau penilaian terhadap siswanya.
b. Penilaian berfungsi diagnostik.
Apabila alat yang digunakan dalam penilaian cukup memenuhi syarat, maka dengan melihat hasilnya guru dapat mengetahui kelemahan siswa. Disamping itu akan diketahui pula sebab-sebab kelemahan itu. Jadi dengan mengadakan penilaian guru sebanarnya melakukan diagnosis kepada siswanya.
c. Penilaian berfungsi sebagai penempatan
Setiap siswa sejak lahir telah membawa bakat sendiri-sendiri sehingga belajar akan lebih efektif jika di sesuaikan dengan pembawaan yang ada. Untuk dapat menentukan dengan pasti kelompok mana yang sesuai dengan kemampuan siswa, maka digunakan suatu penilaian.
d. Penilaian berfungsi sebagai pengukur keberhasilan.
Fungsi ini dimaksudkan untuk mengetahui suatu mana suatu program berhasil diterapkan kepada siswa.Jadi dapat disimpulkan bahwa penilaian berfungsi sebagai alat ukur keberhasilan dalam proses belajar.
5. Ciri-Ciri Penilaian dalam Pendidikan
Untuk dapat menentukan kepandaian seseorang, bukan kepandaian yang diukur. Namun kita dapat melihat dari gejala-gejala yang tampak atau memancar dari kepandaianya. Salah satu contohnya adalah bahwa anak yang pandai biasanya dapat menyelesaikan soal-soal yang diberikan oleh gurunya.
Ciri-ciri penilaian antara lain sebagai berikut:
a. Ciri pertama yaitu bahwa penilaian dilakukan secara tidak langsung. Dalam contoh ini kita menilai kepandaian melalui ukuran menyelesaikan soal.
b. Ciri kedua yaitu pengunaan ukuran kuantitatif. Penilaian bersifat kuantitatif artinya mengunakan simbol bilangan sebagai hasil pertama pengukuran. Setelah itu lalu diinterpretasikan ke bentuk kualitatif. Contoh : dari hasil pengukuran tia mempunyai IQ 126 sedangkan budi 89. Maka tia dapat dikatagorikan sebagai anak pandai sedangkan budi anak dibawah rata-rata.
c. Ciri ketiga yaitu bahwa penilaian pendidikan mengunakan, unit-unit atau satuan-satuan yang tetap misalnya, IQ 126 menurut unit pengukurannya termasuk anak yang pandai sedangkan 89 termasuk anak dibawah rata-rata.
d. Ciri keempat yaitu bersifat relatif artinya tidak selalu tetap dari waktu ke waktu yang di sebabkan banyak faktor. contoh nilai ulangan MTK pertama tia adalah 90 namun ulangan keduanya hanya 40.
e. Ciri kelima bahwa dalam penilaian pendidikan sering terjadi kesalahan-kesalahan. Adapun kesalaan-kesalahan itu ditinjau dari berbagai faktor yaitu:
1). Terletak pada alat ukurnya.Alat yang digunakan untuk mengukur haruslah baik namun sering kali terjadi kesalahan di alat ukurnya.
2). Terletak pada orang yang melakukan pengukurannya.Hal ini dapat berupa:
a). kesalahan pada waktu penilaian karena factor subjektif penilai yang telah terpengarus oleh hasil pengukuran, misalnya tulisan jelek atau tidak jelas itu sering mempengaruhi subjektif penilaian.
b). kecenderungan dari penilai untuk memberikan nilai secara murah atau mahal. Ada guru yang mudah memberikan nilai ada yang sulit untuk memberikan nilai.
c). Adanya Hello-effect, yakni adanya kesan penilai terhadap siswa.
d). adanya pengaruh dari hasil sebelumnya.
e). kesalahan yang disebabkan oleh kekeliruan menjumlah angka-angka hasil penilaian.
3). Terletak pada anak yang dinilai.
a). siswa adalah manusia yang berperasaan dan bersuasana hati. Suasana hati sangat berpengaruh terhadap hasil penilaian.
b). keadaan fisik ketika siswa sedang dinilai.
c). nasib siswa kadang-kadang mempunyai peranan terhadap hasil penilaian.
4). Terletak pada situasi dimana penilaian berlangsung
a). suasana pada saat terjadinya penilaian. Keadaan yang gaduh akan mempengaruhi penilaian yang sebenarnya karena siswa tidak dapat konsenterasi.
b). Pengawasan dalam penilaian. Bentuk pengawasan yang tidak sesuai akan berpengaruh pada keobjektifan hasil dari pengukuran yang ada.
Bab 2 Subjek dan sasaran Evaluasi
1. Subjek Evaluasi
Dalam keterangan ini yang di maksud dengan subjek evaluasi adalah orang yang melakukan pekerjaan evaluasi. Siapa yang dapat di sebut sebagai subjek evaluasi untuk setiap tes, di tentukan oleh suatu aturan pembagian tugas atau ketentuan yang berlaku.
Ada pandangan lain yang mengatakan subjek evaluasi adalah siswa, yakni orang yang di evaluasi, dalam hal ini yang di pandang sebagai objek evaluasi adalah mata pelajarannya. Pandangan lain mengatakan siswa sebagai objek evaluasi dan guru sebagai subjek evaluasi.
2. Sasaran Evaluasi
Adapun sasaran evaluasi di sini mencakup beberapa sasaran penilaian untuk unsure-unsurnya, meliputi : Input, Transformasi dan Out put.
a. In Put
Berkenaan dengan hal ini ada beberapa aspek yang harus di perhatikan untuk mencapai hasil yang di inginkan, yaitu :
· Kemampuan
Jika sebuah institusi menginginkan out put yang berguna bagi nusa dan bangsa maka haruslah memperhatikan atau memilah-milah kemampuan dari beberapa calon murid. Adapun tes yang di gunakan adalah tes kemampuan.
· Kepribadian
Kepribadian adalah sesuatau yang terdapat pada diri manusia serta tampak bentuknya dalam tingkah laku, sehingga seorang pendidik akan mengetahui satu-persatu calon peserta didiknya. Adapun alat yang di pakai adalah tes kepribadian.
· Sikap
Sikap adalah bagian dari tingkah laku manusia yang menggambarkan kepribadian seseorang, akan tetapi karena sikap ini sangat menonjol dalam pergaulan maka banyak orang yang ingin tahu lebih dalam informasi khusus terkait dengannya. Adapun alat yang di pakai adalah tes sikap.
· Intelegensi
Dalam hal ini para ahli seperti binet dan simon menciptakan tes buatan yang di kenal dengan tes binet-simon yang dapat mengetahui IQ seseorang, karena IQ bukanlah intelegensi.
b. Transformasi
Di sini ada beberapa unsur yang dapat menjadi sasaran atau objek pendidikan demi di perolehnya hasil pendidikan yang di harapkan, yaitu :
· Kurikulum/materi
· Metode dan cara penilaian
· Media
· Sistem administrasi
· Pendidik dan anggotahnya.
c. Out Put
Penilaian atas lulusan suatu sekolah di lakukan untuk mengetahui seberapa jauh tingkah pencapaian atau prestasi belajar mereka selama mengikuti program tersebut dengan menggunakan tes pencapaian.
Bab 3 PRINSIP DAN ALAT EVALUASI
1. Prinsip Evaluasi
Ada satu prinsip umum dan penting dalam kegiatan evaluasi, yaitu adanya triangulasi atau hubungan erat tiga komponen, yaitu:
a. Hubungan antara tujuan dengan KBM
Kegiatan belajar-mengajar yang dirancang dalam bentuk rencana mengajar disusun oleh guru dengan mengacu pada tujuan yang hendak dicapai. Dengan demikian, anak panah yang menunjukkan hubungan antara keduanya mengarah pada tujuan dengan makna bahwa KBM mengacu pada tujuan, tetapi juga mengarah dari tujuan ke KBM, menunjukkan langkah dari tujuan dilanjutkan pemikirannya ke KBM.
b. Hubungan antara tujuan dengan evaluasi
Evaluasi adalah kegiatan pengumpulan data untuk mengukur sejauh mana tujuan sudah tercapai. Dengan makna demikian maka anak panah berasal dari evaluasi menuju ke tujuan. Di lain sisi, jika dilihat dari langkah, dalam menyusun alat evaluasi ia mengacu pada tujuan yang sudah dirumuskan.
c. Hubungan antara KBM dengan evaluasi
Seperti yang sudah disebutkan dalam poin (a), KBM dirancang dan disusun dengan mengacu pada tujuan yang telah dirumuskan. Telah disebutkan pula dalam poin (b) bahwa alat evaluasi juga disusun dengan mengacu pada tujuan. Selain mengacu pada tujuan, evaluasi juga harus mengacu atau disesuaikan dengan KBM yang dilaksanakan. Sebagai misal, jika kegiatan belajar-mengajar dilakukan oleh guru dengan menitikberatkan pada keterampilan, evaluasinya juga harus mengukur tingkat keterampilan siswa, bukannya aspek pengetahuan.
2. Alat Evaluasi
Secara garis besar, maka alat-alat evaluasi yang digunakan dapat digolongkan menjadi dua macam, yaitu tes dan non tes. Dibawah ini akan dijelaskan secara rinci macam-macam tes dan non tes.
a. Teknik Non Tes
Ada beberapa teknik non-tes yaitu:
1) Skala Bertingkat
Skala menggambarkan suatu nilai yang berbentuk angka terhadap suatu hasil pertimbangan. Sebagai contoh adalah skor yang diberikan oleh guru di sekolah untuk menggambarkan tingkat prestasi belajar siswa.
2) Kuesioner
Kuesioner (questionaire) juga sering dikenal sebagai angket. Pada dasarnya, kuesioner adalah sebuah daftar pertanyaan yang harus diisi oleh orang yang akan diukur. Tentang macam kuesioner, dapat ditinjau dari beberapa segi :
a) Ditinjau dari siapa yang menjawab, maka ada :
Ø Kuesioner langsung. Kuesioner dikatakan langsung jika kuesioner tersebut dikirimkan dan diisi langsung oleh orang yang akan dimintai jawaban tentang dirinya.
Ø Kuesioner tidak langsung. Kuesioner tidak langsung adalah kuesioner yang dikirimkan dan diisi oleh orang yang bukan diminta keterangannya.
b) Ditinjau dari segi cara menjawab maka dibedakan atas:
Ø Kuesioner tertutup. Kuesioner tertutup adalah kuesioner yang disusun dengan menyediakan pilihan jawaban langkah sehingga pengisi hanya tinggal memberi tanda pada jawaban yang dipilih.
Ø Kuesioner terbuka. Kuesioner terbuka adalah kuesioner yang disusun sedemikian rupa sehingga para pengisi bebas mengemukakan pendapatnya.
3) Daftar cocok (check list). Yang dimaksud dengan daftar cocok adalah deretan pertanyaan, dimana responden yang dievaluasi tinggal membubuhkan tanda cocok ( ) di tempat yang sudah disediakan.
4) Wawancara. Wawancara atau interview adalah suatu cara yang digunakan untuk mendapatkan jawaban dari responden dengan jalan tanya jawab sepihak. Wawancara dapat dilakuakan dengan 2 cara, yaitu:
Ø Intervieu bebas, di mana responden mempunyai kebebasan umtuk mengutarakan pendapatnya, tanpa dibatasi oleh patokan-patokan yang telah dibuat oleh subjek evaluasi.
Ø Intervieu terpimpin, yaitu intervieu yang dilakukan oleh subjek evaluasi dengan cara mengajukan pertanyaan-pertanyaan yang sudah disusun terlebih dahulu.
5) Pengamatan. Pengamatan atau observasi adalah suatu teknik yang dilakukan dengan cara mengadakan pengamatan secara teliti serta pencatatan secara sistematis. Ada 3 macam observasi:
Ø Observasi partisipan, yaitu observasi yang dilakukan oleh pengamat, tetapi dalam pada itu pengamat memasuki dan mengikuti kegiatan kelompok yang sedang diamati.
Ø Observasi sistematik, yaitu observasi di mana faktor yang diamati sudah didaftar secara sistematis, dan sudah diatur menurut kategorinya.
Ø Observasi eksperimental
Ø Observasi eksperimental terjadi jika pengamat tidak berpartisipasi dalam kelompok
6) Riwayat hidup. Riwayat hidup adalah gambaran tentang keadaan seseorang selama dalam masa kehidupannya
b. Teknik Tes
Dibawah ini ada beberapa pendapat dari para ahli mengenai pengertian tes.
Dalam bukunya "Evaluasi Pendidikan", Drs. Amin Daien Indrakusuma mengatakan bahwa tes adalah suatu alat atau prosedur yang sistematis dan objektif untuk memperoleh data-data atau keterangan-keterangan yang diinginkan tentang seseorang, dengan cara yang boleh dikatakan tepat dan cepat.
Dalam bukunya " Teknik-teknik Evaluasi", Mucthar Bukhori mengatakan tes ialah suatu percobaan yang diadakan untuk mengetahui ada atau tidaknya hasil-hasil pelajaran tertentu pada seorang murid atau kelompok murid.
Dalam buku "Encyclopedia of Educational Evaluation", diterangkan "Test is comprehensive assessment of an individual or to an entire program evaluation effort" (tes adalah penilaian yang kompherensif terhadap seorang individu atau keseluruhan usaha evaluasi program.
Dari beberapa kutipan dan uraian di atas dapat disimpulkan bahwa tes merupakan suatu alat pengumpul informasi tetapi jika dibandingkan dengan alat-alat yang lain, tes ini bersifat lebih resmi karena penuh dengan batasan-batasan
Ditinjau dari segi kegunaan untuk mengukur siswa, maka dibedakan atas adanya tiga macam tes, yaitu:
Tes diagnostic. Tes Diagnostik adalah tes yang digunakan untuk mengetahui kelemahan-kelemahan siswa sehingga berdasarkan kelemahan-kelemahan tersebut dapat dilakukan pemberian perlakuan yang tepat.
Tes Formatif. Dari kata "form" yang merupakan dasar dari istilah "formatif" maka evaluasi formatif dimaksudkan untuk mengetahui sejauh mana siswa telah terbentuk setelah mengikuti sesuatu program tertentu. Dalam kedudukannya seperti ini tes formatif dapat juga dipandang sebagai tes diagnostik pada akhir pelajaran. Evaluasi formatif mempunyai manfaat baik bagi siswa, guru, maupun bagi program itu sendiri. Manfaat bagi siswa:
Ø Untuk mengetahui apakah siswa sudah menguasai bahan program secara menyeluruh.
Ø Merupakan penguatan (reinforcement) bagi siswa.
Ø Usaha perbaikan.
Ø Sebagai diagnose.
Ø Manfaat bagi guru
Ø Mengetahui sejauh mana bahan yang diajarkan sudah dapat diterima oleh siswa
Ø Mengetahui bagian mana dari bahan pelajaran yang belum menjadi milik siswa.
Ø Dapat meramalkan sukses dan tidaknya seluruh program yang akan diberikan.
Manfaat bagi program. Setelah diadakan test formatif maka diperoleh hasil. Dari hasil tersebut dapat diketahui :
ü Apakah program yang telah diberikan merupakan program yang tepat dalam arti sesuai dengan kecakapan anak.
ü Apakah program tersebut membutuhkan pengetahuan-pengetahuan prasyarat yang belum diperhitungkan.
ü Apakah diperlukan alat, sarana dan prasarana untuk mempertinggi hasil yang akan dicapai.
ü Apakah metode, pendekatan dan alat evaluasi yang digunakan sudah tepat.
Tes Sumatif
Evaluasi sumatif atau tes sumatif merupakan tes yang dilaksanakan setelah berakhirnya sekelompok program atau sebuah program yang lebih besar.
Manfaat tes sumatif, ialah:
v Untuk menentukan nilai.
v Untuk menentukan seorang anak dapat atau tidaknya mengikuti kelompok dalam menerima program berikutnya.
v Untuk mengisi catatan kemajuan belajar siswa yang akan berguna bagi orang tua siswa, pihak bimbingan dan penyuluhan disekolah, serta pihak-pihak lain apabila siswa tersebut akan pindah ke sekolah lain, akan melanjutkan belajar atau akan memasuki lapangan kerja
3. Perbandingan antara Tes Diagnostik, Formatif, dan Sumatif
Dalam membandingkan, akan ditinjau dari 9 aspek, yaitu :
a. Ditinjau dari fungsinya
1) Tes diagnostik
· Menentukan apakah bahan prasyarat telah dikuasai atau belum.
· Menentukan tingkat penguasaan siswa terhadap bahan yang dipelajari.
· Memisah-misahkan (mengelompokkan) siswa berdasarkan kemampuan dalam menerima pelajaran yang akan dipelajari.
· Menetukan kesulitan-kesulitan belajar yang dialami untuk menentukan cara yang khusus untuk mengatasi atau memberikan bimbingan.
2) Tes formatif
Sebagai umpan balik bagi siswa, guru, maupun program untuk menilai pelaksanaan satu unit program.
3) Tes sumatif
Untuk memberikan tanda kepada siswa bahwa telah mengikuti suatu program, serta menentukan posisi kemampuan siswa dibandingkan dengan kawannya dalam kelompok.
b. Ditinjau dari waktu
1) Tes diagnostik
o Pada waktu penyaringan calon siswa
o Pada waktu membagi kelas atau permulaan memberikan pelajaran.
o Selama pelajaran berlangsung bila guru akan memberikan bantuan siswa.
2) Tes formatif
Selama pelajaran berlangsung untuk mengetahui kekurangan agar pelajaran dapat berlangsung sebaik-baiknya.
3) Tes sumatif. Pada akhir unit caturwulan, semester akhir tahun, atau akhir pendidikan.
c. Ditinjau dari titik berat penilaian
1) Tes diagnostik
Ø Tingkah laku kognitif, afektif, dan psikomotor.
Ø Faktor-faktor fisik, psikologis, dan lingkungan.
2) Tes formatif. Menekankan pada tingkah laku kognitif.
3) Tes sumatif. Pada umumnya menekankan pada tingkah laku kognitif, tetapi ada kalanya pada tingkah laku psikomotor dan kadang-kadang pada afektif.
d. Ditinjau dari alat evaluasi
1) Tes diagnostik
Ø Tes prestasi belajar yang sudah distandarisasikan.
Ø Tes diagnostik yang sudah distandarisasikan.
Ø Tes buatan guru.
Ø Pengamatan dan daftar cocok.
2) Tes formatif
Tes prestasi belajar yang tersusun secara baik.
3) Tes sumatif
Tes ujian akhir.
e. Ditinjau dari cara memilih tujuan yang dievaluasi
1) Tes diagnostik
Ø Memilih tiap-tiap keterampilan prasyarat.
Ø Memilih tujuan setiap program pelajaran secara berimbang.
Ø Memilih yang berhubungan dengan tingkah laku fisik, mental, dan perasaan.
2) Tes formatif
Mengukur semua tujuan instruksional khusus.
3) Tes sumatif
Mengukur tujuan instruksional umum.
f. Ditinjau dari tingkat kesulitan tes
1) Tes diagnostik
Untuk tes diagnostik mengukur keterampilan dasar, diambil soal tes yang mudah.
2) Tes formatif
Belum dapat ditentukan
3) Tes sumatif
Rata-rata mempunyai tingkat kesulitan (indek kesukaran) antara 0,35-0,70.
g. Ditinjau dari scoring (cara menyekor)
1) Tes diagnostik
Menggunakan standar mutlak dan standar relatif
2) Tes formatif
Menggunakan standar mutlak
3) Tes sumatif
Kebanyakan menggunakan standar relatif, tetapi dapat pula dipakai standar mutlak
h. Ditinjau dari tingkat pencapaian
Yang dimaksud dengan tingkat pencapaian adalah skor yang harus dicapai siswa dalam setiap tes.
1) Tes diagnostik
Untuk tes diagnostik yang sifatnya memonitor kemajuan, tingkat pencapaian yang diperoleh siswa merupakan informasi tentang keberhasilannya.
2) Tes formatif
Ditinjau dari tujuan, tes formatif digunakan untuk mengetahui apakah siswa sudah mencapai tujuan insruksional umum yang diuraikan menjadi tujuan instruksional khusus.
3) Tes sumatif
Sesuai dengan fungsi tes sumatif yaitu memberikan tanda kepada siswa bahwa mereka telah mengikuti suatu program dan untuk menentukan posisi kemampuan siswa dibandingkan dengan kawan dalam kelompoknya, maka tidak diperlukan suatu tuntutan harus berapa tingkat penguasaan yang dicapai.
i. Ditinjau dari cara pencatatan hasil
1) Tes diagnostik
Dicatat dan dilaporkan dalam bentuk profil
2) Tes formatif
Prestasi tiap siswa dilaporkan dalam bentuk catatan berhasil atau gagal menguasai suatu tugas.
3) Tes sumatif
Keseluruhan skor atau sebagian skor dari tujuan-tujuan yang dicapai.
Bab 4 MASALAH TES
1. Pengertian
Istilah tes berasal dari bahasa Prancis Kuno yaitu "testum" yang berarti piring untuk menyisihkan logam mulia. Dalam bahasa Indonesia tes diterjemahkan sebagai ujian atau percobaan.
Menurut Arikunto (2010: 53), tes merupakan alat atau prosedur yang digunakan untuk mengetahui atau mengukur sesuatu dalam suasana, dengan cara dan aturan-aturan yang sudah ditentukan.
2. Ciri-Ciri Tes yang Baik
Suharsismi Arikunto (2008: 57-62) menyatakan bahwa suatu tes dapat dikatakan baik apabila memenuhi lima syarat yaitu:
a) Validitas merupakan ketepatan, tes yang sebagai alat ukur dikatakan valid jika tes itu tepat pada hasil belajar dan akan menghasilkan yang valid pula.
b) Reliabilitas, jika memberikan hasil yang tetap dari suatu tes, tidak terpengaruh oleh apapun.
c) Objektifitas berarti tidak ada unsur pribadi yang mempengaruhinya, tidak ada unsur subjektifitas yang mempengaruhi tes tersebut.
d) Praktikabilitas, tes ini merupakan tes yang praktis, mudah dan tidak mengecoh. Mudah pelaksanaannya, mudah diperiksa, dan dilengkapi dengan petunjuk sehingga dapat diberikan kepada orang lain.
e) Ekonomis, bahwa pelaksanaan tes tidak membutuh biaya yang mahal dan tidak membuang waktu.
Bab 5 VALIDITAS
Validitas adalah suatu ukuran yang menunjukkan tingkat-tingkat kevalidan atau kesahihan suatu instrument. Suatu instrument yang valid atau sahih mempunyai validitas tinggi, sebaliknya, instrument yang kurang valid berarti memiliki validitas rendah (Suharsimi Arikunto 2006).
1. Macam -Macam Validitas
Menurut Suharsimi ada dua jenis validitas yaitu validitas logis dan validitas empiris. Sementara validitas itu terbagi menjadi beberapa4 yaitu validitas isi, validitas konstrak, validitas "ada sekarang" dan validitas predictive.
a. Validitas isi (content validity)
Yaitu pengujian terhadap isi yang terkandung dalam tes hasil belajar tersebut. Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan. Validitas isi merupakan validitas yang diperhitungkan melalui pengujian terhadap isi alat ukur dengan analisis rasional. Pertanyaan yang dicari jawabannya dalam validasi ini adalah "sejauh mana item-item dalam suatu alat ukur mencakup keseluruhan kawasan isi objek yang hendak diukur oleh alat ukur yang bersangkutan?" atau berhubungan dengan representasi dari keseluruhan kawasan.
Pengertian "mencakup keseluruhan kawasan isi" tidak saja menunjukkan bahwa alat ukur tersebut harus komprehensif isinya akan tetapi harus pula memuat hanya isi yang relevan dan tidak keluar dari batasan tujuan ukur.
Walaupun isi atau kandungannya komprehensif tetapi bila suatu alat ukur mengikutsertakan pula item-item yang tidak relevan dan berkaitan dengan hal-hal di luar tujuan ukurnya, maka validitas alat ukur tersebut tidak dapat dikatakan memenuhi ciri validitas yang sesungguhnya.Apakah validitas isi sebagaimana dimaksudkan itu telah dicapai oleh alat ukur, sebanyak tergantung pada penilaian subjektif individu. Dikarenakan estimasi validitas ini tidak melibatkan komputerisasi statistik, melainkan hanya dengan analisis rasional maka tidak diharapkan bahwa setiap orang akan sependapat dan sepaham dengan sejauhmana validitas isi suatu alat ukur telah tercapai.
Validitas isi dapat diusahakan tercapainya sejak saat penyusunan dengan cara merinci materi kurikulum atau meteri buku pelajaran. Yaitu sejauh mana tes hasil belajar sebagai alat pengukur hasil belajar peserta didik, isinya telah dapat mewakili secara representatif terhadap keseluruhan materi atau bahan pelajaran yang harus diuji.
b. Validitas Konstruksi (Contruct validity)
Secara etimologis, kata kontruksi mengandung arti susunan, kerangka atau rekaan. Sebuah tes dikatakan memiliki validitas kontruksi apabila butir- butir soal yang membangun tes tersebut mengukur setiap aspek berfikir seperti yang disebutkan dalam Tujuan Instruksional Khusus.
Pengujian validitas konstrak merupakan proses yang terus berlanjut sejalan dengan perkembangan konsep mengenai trait yang diukur. Hasil estimasi validitas konstrak tidak dinyatakan dalam bentuk suatu koefisien validitas.
Dengan kata lain jika butir- butir soal mengukur aspek berfikir tersebut sudah sesuai dengan aspek berfikir yang menjadi tujuan instruksional.
Sebagai contoh jika rumusan Tujuan Instruksional Khusus (TIK), "Siswa dapat mengenal tata cara memandikan mayat", maka butir soal pada tes merupakan perintah bagaimana cara memandikan mayat dengan baik.
c. Pengujian Validitas Tes secara Empiris
Istilah "Validitas empiris" memuat kata "empiris" yang artinya "pengalaman" sebuah instrumen dapat dikatakan memiliki validitas empiris apabila sudah diuji dari pengalaman. Yang dimaksud dengan validitas empiris adalah ketepatan mengukur yang didasarkan pada hasil analisis yang bersifat empirik. Sedangkan menurut Ebel bahwa Empirical Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan suatu kriteria. Kriteria tersebut adalah ukuran yang bebas dan langsung dengan apa yang ingin diramalkan oleh pengukuran.
Jadi empirical validity adalah validitas yang berkenaan dengan hubungan antara skor dengan suatu kriteria. Kriteria tersebut adalah ukuran yang bebas dan langsung dengan apa yang ingin diramalkan oleh pengukuran. Bertitik tolak dari itu maka tes hasil belajar dapat dikatakan telah memiliki validitas empirik apabila berdasarkan hasil analisis yang dilakukan terhadap data hasil pengamatan dilapangan, terbukti bahwa tes hasil belajar itu dengan secara tepat telah dapat mengukur hasil belajar yang seharusnya diungkap atau diukur lewat tes hasil belajar tersebut.
Untuk menentukan apakah tes hasil belajar sudah memiliki validitas empirik ataukah belum dapat dilakukan penelusuran dari dua segi, yaitu segi daya ketepatan meramal (prediktif validity), dan daya ketepatan bandingannya (concurren validity).
d. Validitas Ramalan (Predictive Validity)
Setiap kali kita menyebutkan istilah "ramalan" maka didalamnya akan terkandung pengertian mengenai "sesuatu yang bakal terjadi masa yang akan datang " atau sesuatu yang pada saat sekarang belum terjadi dan baru akan terjadi pada waktu-waktu yang akan datang. Apabila istilah ramalan dikaitkan dengan validitas tes maka yang dimaksut dengan validitas ramalan dari suatu tes adalah suatu kondisi yang menunjukkan seberapa jauhkah sebuah tes telah dapat dengan secara tepat menunjukkan kemampuannya untuk meramalkan apa yang bakal terjadi pada masa yang akan datang.
Menurut Suharsimi meprediksi artinya meramal, dengan meramal selalu mengenai hal yang akan datang jadi sekarang belum terjadi. Sebuah tes dikatakan memiliki validitas prediksi atau validitas ramalan apabila mempunyai kemampuan untuk meramalkan apa yang akan terjadi masa yang akan datang.
Jadi pada dasarnya tes yang dilakukan adalah dengan memberikan bentuk soal, item dan sarat yang diberikan harus memiliki tujuan akhir yang akan ditempuh sehingga proses atau hasil yang dicapai dapat diprediksi sebelumnya.
e. Validitas Bandingan (concurrent validity)
Tes sebagai alat pengukur dapat dikatakan telah memiliki validitas bandingan apabila tes tersebut dalam kurun waktu yang sama dengan secara tepat telah mampu menunjukkan adanya hubungan yang searah antara tes pertama dengan tes berikutnya. Menurut Suharsimi dalam hal ini tes dipasangkan dengan hasil pengalaman. Pengalaman selalu mengenai hal yang telah lampau sehingga data pengalaman tersebut sekarang sudah ada.
Validitas bandingan juga sering dikenal dengan istilah : validitas sama saat, validitas pengalaman atau validitas ada sekarang. Dikatakan sama saat sebab validitas tes itu ditentukan atas dasar data hasil tes yang pelaksanaannya dilakukan pada kurun waktu yang sama. Dikatakan validitas pengalaman sebab validitas tes tersebut ditentukan atas dasar pengalaman yang telah diperoleh. Adapun dikatakan sebagai validitas ada sekarang sebab setiap kali kita menyebut istilah pengalaman maka istilah itu akan selalu kita kaitkan dengan hal-hal yang telah ada atau hal-hal yang telah terjadi pada waktu yang lalu, sehingga data mengenai pengalaman masa yang lalu itu pada saat ini sudah ada di tanggan.
Jadi dalam rangka menguji validitas bandingan, data yang mencerminkan pengalaman yang diperoleh masa yang lalu itu, kita bandingkan dengan data hasil tes yang diperoleh sekarang ini. Jika hasil tes yang ada sekarang ini mempunyai hubungan searah dengan hasil tes berdasarkan pengalaman yang lalu, maka tes yang memiliki karakteristik seperti itu dapat dikatakan telah memiliki validitas bandingan.
Misalnya seorang guru ingin mengetahui apakah tes sumatif yang disusun sudah valid atau belum. Untuk itu diperlukan sebuah kriterium masa lalu yang sekarang datanya dimiliki. Misalnya nilai ulangan harian atau nilai ulkangan sumatif yang lalu.
Cara mengetahui Validitas Alat Ukur
3. Validitas Butir Soalatau Validitas Item
4. Tes Terstandar Sebagai Kriterium dalam Menentukan Validitas
5. Validitas Faktor
Bab 6 REALIBILITAS
1. Arti Reabilitas Bagi Sebuah Tes
2. Cara-Cara Mencari Besarnya Realibilitas.
Sekali lagi reliabilitas adalah ketetapan suatu tes apabila diteskan kepada subyek yang sama. Untuk mengetahui ketetapan ini pada dasarnya dilihat kesejajaran hasil.
Kriterium yang digunakan untuk mengetahui ketetapan ada yang berada diluar tes (consistency external) dan pada tes itu sendiri (consistency internal).
a. Metode bentuk Paralel (equivalen)
Tes parallel atau tes ekuivalen adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran, dan susunan, tetapi butir-butir soalnya berbeda. Dalam istilah bahasa inggris disebut alternate-forms method (parallel forms).
Dengan metode bentuk parallel ini, dua uah tes yang paralel, misalnya Matematika Seri A yang akan dicari reliailitasnya dan Seri B di teskan pada sekelompok siswa yang sama, kemudian hasilnya dikorelasikan. Koefisien korelasi dari kedua hasil tes inilah yang menunjukan koefisien reliabilitas tes Seri A. jika oefisiennya tinggi maka tes tersebut sudah reliable dan dapat digunakan sebagai alat pengetes yang terandalkan.
Dalam menggunakan metode paralel ini pengetes harus menyiapkan dua buah tes, dan masing-masing dicobakan pada kelompok siswa yang sama. Oleh karena itu, ada orang yang menyebutkan sebagai double tes-daubel-trial method.
b. Metode tes ulang (test-retest method)
Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes. Dalam menggunakan teknik atau metode ini pengetes hanya memiliki satu seri tes tetapi dicobakan dua kali. Oleh karena tesnya hanya satu dan dicobakan dua kali, maka metode ini dapat disebut dengan single-test-double-trial method. Kemudian hasil dari kedua tes tersebut dihitung korelasinya.
Untuk tes yang banyak mengungkap pengetahuan (ingatan) dan pemahaman, cara ini kurang mengena karena tercoba akan masih ingat akan butir-butir soalnya. Oleh karena tenggang waktu akan pemberian tes pertama dengan kedua menjadi permasalahan tersendiri. jika tenggang waktu terlalu sempit, siswa masih banyak ingat materi. Sebaliknya kalau tenggang waktu terlalu lama, maka faktor-faktor atau kondisi tes sudah akan berbeda, dan siswa senddiri barangkali sudah mempelajari sesuatu. Tentu saja faktor-faktor ini akan berpengaruh pula terhadap reliabilitas.
c. Metode belah dua atau split-half method
Kelemahan penggunaan metode dua tes dua kali percobaan dan satu tes dua kali percobaandiatasi dengan metode ketiga ini yaitu metode belah dua. Dalam menggunakan metode ini pengetes hanya menggunakan sebuah tes yang dicobakan satu kali. Oleh karena itu, disebut juga single-test-single-trial method.
Berbeda dengan metode pertama dan kedua yang setelah diketemukan koefisien korelasi langsung ditafsirkan itulah koefisien reliabilitas, maka dengan metode ketiga ini tidak dapat demikian. Pada waktu membelah dua dan mengkorelasikan dua belahan, baru diketahui reliabilitas separo tes. Untuk mengetahui reliabilitas seluruh tes harus digunakan rumus Spearman-rown .
Bab 7 TAKSONOMI
1. Arti dan Letak Taksonomi dalam Pendidikan
2. Taksonomi Bloom
Menurut taksonomi Bloom ini tujuan pendidikan dibagi menjadi beberapa domain (ranah, kawasan), dan setiap domain tersebut dibagi kembali ke dalam pembagian yang lebih rinci berdasarkan hirarkhinya. Domain-domain tersebut antara lain:
a) Cognitive Domain (Ranah Kognitif), yang berisi perilaku-perilaku yang menekankan aspek intelektual, seperti pengetahuan, pengertian, dan keterampilan berpikir. Dalam ranah ini hirarkinya adalah pengetahuan (knowledge), pemahaman (comprehension), aplikasi (application), analisis (analysis), sintesis (synthesis), dan evaluasi (evaluation).
b) Affective Domain (Ranah Afektif) berisi perilaku-perilaku yang menekankan aspek perasaan dan emosi, seperti minat, sikap, apresiasi, dan cara penyesuaian diri. Dalam ranah ini hirarkinya adalah pandangan atau pendapat (opinion) dan sikap atau nilai (attitude, value)
c) Psychomotor Domain (Ranah Psikomotor) berisi perilaku-perilaku yang menekankan aspek keterampilan motorik seperti tulisan tangan, mengetik, berenang, dan mengoperasikan mesin. Ranah ini tersusun atas keterampilan (skill) dan kemampuan ( abilities)
Taksonomi lain-lainnya:
a. Mc Guire dan Klickmann (1963) telah menyusun taksonomi untuk bidang biologi, Wood (1968) untuk matematika, Leuis (1965) untuk IPA.
b. Guilford telah menciptakan pola yang menggambarkan struktur intelek dalam bentuk kubus
c. Gagne dan Merrill menyebutkan ada 8 hierarki tingkah laku, antara lain:
ü Signal learning
ü Stimulus-response learning
ü Chaining
ü Verbal associating
ü Discrimination learning
ü Concept learning
ü Rule learning
ü Problem solving.
d. Garlach dan Sullivan mencoba mengganti gambaran tentang proses dalam rumusan yang umum menjadi tingkah laku siswa yang dapat diamati. Kategori yang diajukan adalah:
ü Identify
ü Name
ü Describe
ü Construct
ü Order
ü Demonstrate.
e. De Block mengemukakan model yang didasarkan pada tujuan-tujuan mengajar. Dia mejukan 3 arah dalam kegiatan mengajar:
ü From partial to more integral learning
ü From limited to fundamental learning
ü From special to eneral learning.
Bab 8 TUJUAN INTRUKSIONAL
1. Bermacam-Macam Tujuan Pendidikan.
Tujuan Pendidikan Nasional adalah mencerdaskan kehidupan bangsa dan mengembangkan manusia Indoensia seutuhnya, yaitu manusia yang beriman dan bertaqwa terhadap Tuhan Yang Maha Esa dan berbudi pekerti luhur, memiliki pengetahuan dan keterampilan, kesehatan jasmani dan rohani, kepribadian yang mantap dan mandiri serta rasa tanggung jawab kemasyarakatan dan kebangsaan.
Pengembangan di bidang pendidikan didasarkan atas falsafah negara Pancasila dan diarahkan untuk membentuk manusia-manusia pembangunan yang ber-Pancasila dan untuk membentuk manusia Indonesia yang sehat jasmani dan rohaninya memiliki pengetahuan dan keterampilan, dapat mengembangkan kreativitas dan tanggung jawab, dapat menyuburkan sikap demokrasi dan penuh tenggang rasa, dapat mengembangkan kecerdasan yang tinggi dan disertai budi pekerti yang luhur, mencitai bangsanya dan mencintai sesama manusia sesuai dengan ketentuan termaktub dalam UUD 1945.
Dengan adanya pendidikan, maka akan timbul dalam diri seseorang untuk berlomba-lomba dan memotivasi diri kita untuk lebih baik dalam segala aspek kehidupan. Pendidikan merupakan salah satu syarat untuk lebih memajukan pemrintah ini, maka usahakan pendidikan mulai dari tingkat SD sampai pendidikan di tingkat Universitas.
2. Tujuan Instruksional(Intructional Objectives)
Suharsimi Arikunto menyatakan dalam tujuan instruksional umum menggunakan kata kerja yang masih umum dan tidak dapat diukur, maka dibutuhkan tujuan instruksional khusus. Jadi ada 2 macam tujuan instruksional:
ü tujuan instruksional umum ( TIU)
ü tujuan instruksional khusus (TIK)
Adapun manfaat tujuan instruksional adalah:
a. Pendidik mempunyai arah untuk memilih bahan pelajaran dan memilih prosedur (metode) mangajar,
b. Peserta didik mengetahui arah belajarnya,
c. Setiap pendidik mengetahui batas-batas tugas dan wewenang mengajarkan suatu bahan sehingga diperkecil kemungkinan timbulnya celah (gap) atau saling menutup (overlap) antar pendidik,
d. Pendidik mempunyai patokan dalam mengadakan penilaian kemajuan belajar peserta didik,
e. Pendidik sebagai pelaksana dan petugas-petugas pemegang kebijaksanaan (decision maker) mempunyai kriteria untuk mengevaluasi kualitas maupun efiensi pengajaran.
3. Merumuskan Tujuan Intruksional.
Bagaimana cara merumuskan tujuan pembelajaran atau indikator hasil belajar itu?ada empat komponen pokok yang harus nampak dalam rumusan indikator hasil belajar seperti yang digambarkan dalam pertanyaan berikut:
a) Siapa yang belajar atau yang diharapkan dapat mencapai tujuan atau mencapai hasil belajar itu?
b) Tingkah laku atau hasil belajar yang bagaimana yang diharapkan dapat dicapai itu?.
c) Dalam kondisi yang bagaimana hasil belajar itu dapat ditampilkan?
d) Seberapa jauh hasil belajar itu bisa diperoleh.
4. Langkah-LangkahyangDilakukan dalam Merumuskan Tujuan Intruksioanal Khusus.
a. Membuat sejumlah TIU (Tujuan Instruksional Umum) untuk setiap mata pelajaran/bidang studi yang akan diajarkan dalam kurikulum 1975 maupun 1984, TIU sudah ada tercantum dalam buku garis-garis besar program pengajaran. Dalam merumuskan TIU digunakan kata kerja yang sifatnya masih umum dan tidak dapat di ukur karena perubahan tingkah laku masih terjadi di dalam diri manusia.
b. Dari masing-masing TIU dijabarkan menjadi sejumlah TIK yang rumusannya jelas, khusus, dapat dimengerti, terukur, dan menunjukkan perubahan tingkah laku.
Contoh-contoh rumusan untuk TIU:
Ø Memahami teori evaluasi.
Ø Mengetahui perbedaan antara skor dan nilai.
Ø Mengerti cara mencari validita.
Ø Menghayati perlunya penilaian yang tepat.
Ø Menyadari pentingnya mengikuti kuliah dengan teratur.
Ø Menghargai kejujuran mahasiswa dalam mengerjakan tes.
5. Tingkah Laku Akhir
Tingkah laku akhir adalah tingkah laku yang diharapkan setelah peserta didik mengalami proses belajar. Di sini tingkah laku ini harus menampakkan diri dalam suatu perbuatan yang dapat diamati dan diukur (observable and measurable).
Contoh:
ü Menuliskan kalimat perintah,
ü Mengalikan pecahan persepuluh,
ü Menggambarkan kurva normal,
ü Menyebutkan batas-batas Daerah Istimewa Yogyakarta,
ü Menceritakan kembali uraian guru,
Dan lain-lain yang berwujud kata kerja perbuatan/operasional (Action Verb) yang dapat diamati dan diukur.
6. Kata-Kata operasioanal
a. Kognitif
ü Pengetahuan (knowledge). Kata-kata instruksional yang sering digunakan: Mendefinisikan, mendeskripsikan, mengidentifikasi, mendaftarkan, menjodohkan, menyebutkan, menyatakan (state), mereproduksi.
ü Pemahaman (comprehension). Kata-kata instruksional yang sering digunakan: mempertahankan, membedakan, menduga (estimate), menerangkan, memperluas, menyimpulkan, menggeneralisasikan, memberikan, contoh, menuliskan kembali, menggunakan.
ü Aplikasi. Kata-kata instruksional yang sering digunakan: mengubah, menghitung, mendemonstrasikan, menemukan, memanipulasi, memodifikasi, mengoperasikan, meramalkan, menyiapkan, menghasilkan, menghubungkan, menunjukkan, memecahkan, menggunakan.
ü Analisis. Kata-kata instruksional yang sering digunakan: memerinci, menyusun diagram, membedakan, mengidentifikasi, mengilustrasikan, menyimpulkan, menunjukkan, menghubungkan, memilih, memisahkan, membagi (subdivides).
ü Sintesis. Kata-kata instruksional yang sering digunakan: mengategorikan, mengombinasikan, mengarang, menciptakan, membuat desain, menjelaskan, memodifikasikan, mengorganisasikan, menyusun, membuat rencana, mengatur kembali, merekronstuksikan, menghubungkan, mereorganisasikan, merevisi, menuliskan kembali, menuliskan, menceritakan.
ü Evaluasi. Kata-kata instruksional yang sering digunakan: menilai, membandingkan, menyimpulkan, mempertentangkan, mengkritik, mendeskripsikan, membedakan, menerangkan, memutuskan, menafsirkan, menghubungkan, membantu (supports).
b. Afektif
ü Reesiving. Kata-kata instruksional yang sering digunakan: menanyakan, memilih, mendeskripsikan, mengikuti, memberikan, mengidentifikasikan, menyebutkan, menunjukkan, memilih, menjawab.
ü Responding. Kata-kata instruksional yang sering digunakan: menjawab, membantu, mendiskusikan, menghormat, berbuat, melakukan, membaca, memberikan, menghafal, melaporkan, memilih, menceritakan, menulis.
ü Valuing. Kata-kata instruksional yang sering digunakan: melengkapi, menggambarkan, membedakan, menerangkan, mengikuti, membentuk, mengundang, menggabung, mengusulkan, membaca, melaporkan, memilih, bekerja, mengambil bagian (share), mempelajari.
ü Organization. Kata-kata instruksional yang sering digunakan: mengubah, mengatur, menggabungkan, membandingkan, melengkapi, mempertahankan, menerangkan, menggeneralisasikan, mengidentifikasikan, mengintregasikan, memodifikasikan, mengorganisir, menyiapkan, menghubungkan, mensistesiskan.
ü Characterization by value or value complex. Kata-kata instruksional yang sering digunakan: membedakan, menerapkan, mengusulkan, memperagakan, mempengaruhi, mendengarkan, memodifikasikan, mempertunjukkan, menanyakan, merevisi, melayani, memecahkan, menggunakan.
c. Psikomotorik
ü Musclar or motor skills. Kata-kata instruksional yang sering digunakan: mempertontonkan gerak, menunjukkan hasil (pekerjaan tangan), melompat, menggerakkan, menampilkan.
ü Manipulation of materials or objects. Kata-kata instruksional yang sering digunakan: mereparasi, menyusun, membersihkan, menggeser, memindahkan, membentuk.
ü Neuromusclar coordination. Kata-kata instruksional yang sering digunakan: mengamati, menerapkan, menghubungkan, menggandeng, memotong, menarik, memasang, menarik, menggunakan.
Kata-kata yang telah disajikan di atas merupakan kata-kata kerja yang dipakai dalam merumuskan tujuan instruksional khusus bagi peserta didik yang belajar, sehingga rumusan seutuhnya menjadi pernyataan-pernyataan, sebagai berikut:
1) Peserta didik dapat menghafal ibu kota negara bagian Jerman.
2) Peserta didik dapat menunjukkan letak ibu kota negara bagian Jerman.
3) Peserta didik dapat membuat kalimat dalam Bahasa Jerman.
7. Kondisi Demonstrasi
Kondisi demonstrasi adalah komponen TIK yang menyatakan suatu kondisi atau situasi yang dikenakan kepadapeserta didik pada saat pendidik mendemonstrasikan tingkah laku akhir.
Standar keberhasilan adalah kelompok TIK yang menunjukkan seberapa jauh tingkat keberhasilan yang di tuntut oleh penilai bagi tingkah laku pelajar pada situasi akhir.
Tingkat keberhasilan dapat dinyatakan dalam jumlah maupun prsentase, misalnya:
a) Dengan 75% betul.
b) Sekurang-kurangnya 5 dari 10.
c) Tanpa kesalahan.
Dalam pedoman pelaksanaan kurikulum di jelaskan bahwa dalam kegiatan belajar-mengajar pendidik di haruskan memperhatikan pula keterampilan tentang prosesnya. Pendekatan ini di sebut dengan istilah pendekatan keterampilan proses. Keterampilan-keterampilan di maksud meliputi keterampilan dalam hal:
a) Mengamati.
b) Menginterprestasikan (menafsirkan) hasil pengamatan.
c) Merabalkan.
d) Menerapkan konsep.
e) Merencanakan penelitian.
f) Melaksanakan penelitian.
g) Mengkomunikasikan hasil penemuan.
Sesuai dengan tuntutan tersebut maka pendidik dalam merumuskan tujuan instruksional khusus harus mengandung apa yang dilakukan peserta didik dalam kegiatan belajar-mengajar.
Tujuan instruksional umum yang termuat sudah dirumuskan dalam satu rumusan yang menjelaskan:
a) Materi yang dipelajari.
b) Perilaku mengutarakan hasil.
c) Proses pencapaiannya.
Bab 9 TES STANDAR DAN TES BUATAN GURU
1. Pengertian Tes Standar
Tes adalah salah satu bentuk instrumen evaluasi untuk mengukur seberapa besar kemampuan siswa dalam memahami dan menguasai pokok-pokok materi yang sudah diajarkan. Tes ada yang dibuat oleh seorang guru yang kemudian disebut tes buatan guru dan ada tes yang sudah memenuhi standar suatu satuan pendidikan maupun lembaga pendidikan yang kemudian disebut tes terstandar.
Dalam menilai, baik tes terstandar maupun tes buatan guru ada beberapa hal yang perlu diperhatikan yang berkaitan dengan validitas dan reliabilitas.
Tes kemampuan pada dasarnya terbagi menjadi dua macam, yaitu :
a. Aptitude test
b. Achievement tes
Perbedaan antara dua tes ini sebenearnya tidak tegas, soal – soal mengenai kedua tes tersebut sering kali saling melingkupi ( overlap ). Untuk kedua macam tes ini biasanya menggunakan hitung – hitungan dan perbendaharaan kata – kata dan sekelompok tes dari kedua macam tes ini biasanya juga menguji tentang keterampilan membaca. Kesamaan yang lain adalah bahwa keduanya telah digunakan untuk meramalkan hasil untuk yang masa akan dating, walaupun pada umumnya jika kita menggunakan tes prestasi penilai melihat apa yang telah diperoleh setelah siswa ( tercoba ) itu diberi suatu pelajaran.
2. Tes Prestasi Standar
Di antara tes prestasi yang digunakan di sekolah ada yang dinamakan tes prestasi standar. Dalam salah satu kamus, arti kata "standar" adalah:
"A degree of level of requirement, excellence, or attainment"
Standar untuk siswa dapat dimaksudkan sebagai suatu tingkat kemampuan yang harus dimiliki bagi suatu program tertentu. Mungkin standar bagi suatu kursus A berbeda dengan B. Jadi standar ini dapat dibuat "keras" maupun "lunak" tergantung dari yang mempunyai kebijaksanaan.
Suatu tes standar dengan demikian berbeda dengan tes prestasi biasa.
Prosedur yang digunakan untuk menyusun tes standar untuk tes prestasi melalui cara langsung yang ditumbuhkan dari tes yang digunakan di kelas. Sedangkan spesifikasi yang digunakan untuk menentukan isi dalam tes bakat biasanya didasarkan atas analisis job (jabatan) atau analisis tugas yang merupakan tuntutan calon pekerjaannya. Disamping itu juga mempertimbangkan sifat-sifat yang ada pada manusia. Analisis jabatan analisis tugas yang dilakukan biasanya tidak tidak didasarkan atas satu kurikulum, tetapi diambil dari masyarakat.
Istilah "standar" dalam tes dimaksudkan bahwa semua siswa menjawab pertanyaan-pertanyaan yang sama dari sejumlah besar pertanyaan dikerjakan dengan menggunakan petunjuk yang sama dan dalam batasan waktu yang sama pula. Dengan demikian maka seolah-olah ada suatu standar atau ukuran sehingga diperoleh suatu standar penampilan (performance) dan penampilan kelompok lain dapat dibandingkan dengan penampilan kelompok standar tersebut.
Istilah "standar" tidak mengandung arti bahwa tes tersebut mengukur apa yang harus dan dapat diajarkan pada suatu tingkat tertentu atau bahwa tes itu menyiapkan suatu standar prestasi dimana siswa harus dan dapat mencapai suatu tingkat tertentu. Sekali lagi, tes standar dipolakan untuk penampilan prestasi sekarang (yang ada) yang dilaksanakan secara seragam, diusahakan dalam kondisi yang seragam, baik itu diberikan kepada siswa dalam pelaksanaan perseorangan maupun siswa sebagai anggota dari suatu kelompok.
3. Perbandingan Antara Tes Standar dengan Tes Buatan Guru
Tes standar disusun dalam tipe-tipe soal yang sama yang meliputi bahan atau pengetahuan yang sama banyak dengan bahan atau pengetahuan yang dicakup oleh tes buatan guru. Lalu apakah perbedaan antara tes standar dengan tes buatan guru, atau apakah keburukan dan keuntungan tes standar?
Pertama, marilah kita tinjau perbedaan antara tes standar dengan tes buatan guru. Perbedaannya adalah sebagai berikut:
Tes Standar
Tes Buatan Guru
a. Didasarkan atas bahan dan tujuan umum dari sekolah-sekolah di seluruh Negara.
Mencakup aspek yang luas dan pengetahuan atau keterampilan dengan hanya sedikit butir tes untuk setiap keterampilan atau topik.
c. Disusun dengan kelengkapan staf profesor, pembahas, dan editor butir tes.
d. Menggunakan butir tes yang sudah diujicobakan (try out), dianalisis dan direvisi sebelum menjadi sebuah tes.
e. Mempunyai reliabilitas yang tinggi.
f. Dimungkinkan menggunakan norma untuk seluruh Negara.
a. Didasarkan atas bahan dan tujuan khusus yang dirumuskan oleh guru untuk kelasnya sendiri.
b. Dapat terjadi hanya mencakup pengetahuan atau keterampilan yang sempit.
c. Biasanya disusun sendiri oleh guru dengan sedikit atau tanpa bantuan orang lain/tenaga ahli.
d. Jarang menggunakan butir tes yang sudah diujicobakan, dianalisis dan direvisi.
e. Mempunyai reliabilitas sedang atau rendah.
f. Norma kelompok terbatas kelas tertentu.
Kedua, untuk menyusun tes standar, diutuhkan waktu yang lama. Seperti disebutkan ahwa untuk memperoleh sebuah tes standar melalui prosedur:
§ Penyusunan;
§ Uji coba;
§ Analisa;
§ Revisi;
§ Edit.
Kelima kegiatan ini membutuhkan waktu lama.
4. Kegunaan Tes Standar
Secara singkat dapat dikemukakan bahwa kegunaan tes standar adalah:
§ Jika ingin membuat perbandingan,
§ Jika banyak orang yang akan memasuki suatu sekolah tetapi tidak tersedia data tentang calon ini.
Secara garis besar kegunaan tes standar adalah:
Ø Membandingkan prestasi belajar dengan pembawaan individu atau kelompok.
Ø Membandingkan tingkat prestasi siswa dalam keterampilan di berbagai bidang studi untuk individu atau kelompok.
Ø Membandingkan prestasi siswa antara berbagai sekolah atau kelas.
Ø Mempelajari perkembangan siswa dalam suatu periode waktu tertentu.
5. Kegunaaan Tes Buatan
Secara singkat dapat dikemukakan bahwa kegunaan tes buatan guru adalah:
vUntuk menentukan seberapa baik siswa telah menguasai bahan pelajaran yang diberikan dalam waktu tertentu.
vUntuk menentukan apakah sesuatu tujuan telah tercapai.
vUntuk memperoleh suatu nilai.
Selanjutnya baik tes standar dan tes buatan guru dianjurkan dipakai jika hasilnya akan digunakan untuk:
· Mengadakan diagnosis terhadap ketidakmampuan siswa.
· Menentukan tempat siswa dalam suatu kelas atau kelompok.
· Memberikan bimbingan kepada siswa dalam pendidikan dan pemilihan jurusan.
· Memilih siswa untuk program-program khusus.
6. Kelengkapan Tes Standar
Sebuah tes yang sudah distandardisasikan dan sudah dapat disebut sebagai tes standar, biasanya dilengkapi dengan sebuah manual. Manual ini memuat keterangan-keterangan atau petunjuk-petunjuk yang perlu terutama yang menjelaskan tentang pelaksanaan, menskor, dan mengadakan interpretasi.Secara garis besar manual tes standar ini memuat:
a. Ciri-ciri mengenai tes, misalnya menyebutkan tingkat validitas, tingkat reliabilitas dan sebagainya.
b. Tujuan serta keuntungan-keuntungan dari tes. Misalnya yang disebutkan untuk siapa tes tersebut diberikan dan untuk tujuan apa.
c. Proses standardisasi tes. Misalnya mengenai hal-hal yang berhubungan dengan sampel.
o Besarnya sampel,
o Teknik sampling,
o Kelompok mana yang diambil sebagai sampel (sifat sampel).
Juga mengenai taraf kepercayaan yang diambil dan bagaimana kaitannya dengan hasil tes.
d. Petunjuk-petunjuk tentang cara melaksanakan tes
Misalnya: dilaksanakan dengan lisan atau tertulis, waktu yang digunakan untuk mengerjakan setiap bagian, boleh tidaknya tercoba keluar jika sudah selesai mengerjakan soal itu dan sebagainya.
e. Petunjuk-petunjuk bagaimana cara menskor
Misalnya: untuk beberapa skor tiap-tiap soal/unit, menggunakan sistem hukuman atau tidak, bagaimana cara menghitung nilai akhir dan sebagainya.
f. Petunjuk-petunjuk untuk menginterpretasikan hasil
Misalnya:
o Betul nomor sekian sampai sekian cocok untuk jabatan kepala seksi,
o Betul nomor sekian saja, cocok untuk jabatan guru dan sebagainya.
g. Saran-saran lain
Misalnya: siapa harus menjadi pengawas, bagaimana seandainya tidak ada calon yang mencapai skor tertentu dan sebagainya
Bab 10 PENYUSUSNAN TES
1. Fungsi Tes
Fungsi tes dapat ditinjau dari 3 hal :
a. fungsi untuk kelas
b. fungsi untuk bimbingan.
c. fungsi untuk administrasi
a. Fungsi untuk Kelas, tes dapat berfungsi untuk :
1) mengadakan diagnosis terhadap kesulitan belajar siswa
2) mengevaluasi celah antara bakat dengan pencapaian
3) menaikkan tingkat prestasi
4) mengelompokkan siswa dalam kelas pada waktu metode kelompok
5) merencanakan kegiatan proses belajar mengajar untuk siswa secara perseorangan.
6) menentukan siswa mana yang memerlukan bimbingan khusus
7) menentukan tingkat pencapaian untuk setiap anak.
b. Fungsi untuk Bimbingan, tes dapat berfungsi untuk :
1) menentukan arah pembicaraan dengan orang tua tentang anak-anak mereka.
2) membantu siswa dalam menentukan pilihan.
3) membantu siswa mencapai tujuan pendidikan dan jurusan.
4) memberi kesempatan kepada pembimbing, guru, dan orang tua dalam memahami kesulitan anak.
c. Fungsi untuk Administrasi
1) memberi petunjuk dalam mengelompokkan siswa.
2) penempatan siswa baru
3) membantu siswa memilih kelompok
4) menilai kurikulum
5) memperluas hubungan masyarakat
6) menyediakan informasi untuk badan-badan lain di luar sekolah.
2. Langkah-Langkah dalam Penyusunan Tes
a. Menentukan tujuan mengadakan tes
b. Mengadakan pembatasan terhadap bahan yang akan diteskan.
c. Merumuskan Tujuan Instruksional Khusus (TIK) dari tiap bagian bahan.
d. Menderetkan semua TIK dalam tabel persiapan yang memuat pula aspek tingkah laku dalam terkandung TIK itu, tabel digunakan untuk identifikasi terhadap tingkah laku yang dikehendaki, agar tidak terlewati.
e. Menyusun tabel spesifikasi yang memuat pokok materi, aspek berfikir yang diukur beserta imbangan antara kedua hal tersebut. (Uraian penjelasan tentang tabel spesifikasi i akan kami jelaskan di sub bab berikutnya)
f. Menuliskan butir-butir soal, didasarkan atas TIK-TIK yang sudah dituliskan pada tabel TIK dan aspek tingkah laku yang dicakup
3. Komponen-Komponen Tes
Komponen Test terdiri dari:
a. Buku tes, yakni lembaran atau buku yang memuat butir-butir soal yang mesti dikerjakan oleh siswa
b. Lembar jawaban tes, yaitu lembaran yang disediakan oleh penilain bagi testee untuk mengerjakan tes, untuk bentuk pilihan ganda dibuat lembaran nomor dan huruf A, B, C, D, E menurut banyaknya alternative yang disediakan
c. Kunci jawaban tes, berisi jawaban-jawaban yang dikehendaki. Kunci jawaban ini dapat berupa huruf atau kalimat. Untuk test bentuk uraian yang dituliskan adalah kata-kata kunci atau kalimat seingkat untuk memberikan ancar-ancar jawaban. Ide dari kunci jawaban ini adalah:
1) Pemeriksaan tes dapat dilakukan oleh orang lain
2) Pemeriksaannya betul,
3) Dilakukan dengan mudah,
4) Sedikit mungkin masuknya unsur subjektif
d. Pedoman penilaian, pedoman penilaian atau pedoman skoring, berisi tentang pedoman perincian tentang skor atau angka yang diberikan kepada siswa bagi soal-soal yang telah dikerjakan.Contoh pedoman penilaian:
Untuk penilaian dengan contoh soal diatas, tiap soal diberi skor 5.
Jumlah skor : 5×20= 100
Bab 11 TES TERTULIS UNTUK PRESTASI BELAJAR
1. Bentuk-Bentuk Tes
a. Tes subyektif. Secara umum soal subyektif adalah pertanyaan yang menuntut peserta didik menjawab dalam bentuk menguraikan, menjelaskan, mendiskusikan, membandingkan, memberikan alasan, dan bentuk lain yang sejenis sesuai dengan tuntutan pertanyaan dengan menggunakan kata-kata dan bahasa sendiri. Jumlah soal-soal bentuk subyektif biasanya tidak banyak, hanya sekitar 5-10 buah soal dalam waktu kurang lebih 90-120 menit. Soal-soal bentuk ini menuntut kemampuan peserta didik untuk dapat mengorganisir, menginterpretasi, dan menghubungkan pengertian-pengertian yang telah dimiliki.
b. Tes objektif. Tes objektif adalah tes yang dalam pemeriksaannya dapat dilakukan secara objektif (Arikunto, 1995 : 165). Karena sifatnya yang objektif maka penskorannya dapat dilakukan dengan bantuan mesin. Soal ini tidak memberi peluang untuk memberikan penilaian yang bergradasi karena dia hanya mengenal benar dan salah. Apabila respons siswa sesuai dengan jawaban yang dikehendaki maka respons tersebut benar dan biasa diberi skor 1. Apabila kondisi yang terjadi sebaliknya, maka respons siswa salah dan biasa diberi skor 0. Jawaban siswa bersifat mengarah kepada satu jawaban yang benar (convergence).
Merujuk kepada berbagai pendapat tentang tes objektif dapat diambil kesimpulan bahwa tes objektif adalah tes yang semua informasi yang diperlukan peserta tes untuk memberikan respon telah disediakan oleh penyusun tes, sehingga peserta tes tinggal memilihnya. Jawaban yang berupa pilihan bersifat deterministik, sehingga hanya ada dua kemungkinan kebenaran jawaban – benar atau salah.
2. Macam-Macam Tes Objektif
a. Bentuk Tes Benar Salah (True-False Test). Tes benar salah adalah bentuk tes yang mengajukan beberapa pernyataan yang bernilai benar atau salah. Biasanya ada dua pilihan jawaban yaitu huruf B yang berarti pernyataan tersebut benar dan S yang berarti pernyataan tersebut salah. Tugas peserta tes adalah menentukan apakah pernyataan tersebut benar atau salah.
Contoh salah satu tes bentuk uraian adalah :
B S : Ibukota Peru berjumlah lima buah.
B S : Manado adalah Ibukota propinsi Sulawesi Utara
Kelebihan Tes Benar Salah:
Ø Dapat mencakup bahan yang luas dan tidak memakan tempat yang banyak
Ø Mudah dalam penyusunannya
Ø Petunjuk mengerjakannya mudah dimengerti
Ø Dapat digunakan berkali-kali
Ø Objektif
Ø Praktis
Kelemahan Tes Benar Salah:
o Mudah ditebak
o Banyak masalah yang tidak dapat dinyatakan hanya dengan kemungkinan benar atau salah
o Reliabilitasnya rendah.
o Hanya dapat mengungkapkan daya ingat dan pengenalan kembali
Petunjuk Penyusunan:
ü Hindari kalimat negatif, yakni kalimat yang mengandung kata "tidak" atau "bukan".
ü Pernyataan harus disusun sedemikian rupa sehingga siswa yang memiliki pengertian samar-samar dapat terkecoh dalam menjawabnya.
ü Dalam menyusun keseluruhan tes, diharapkan item yang mengandung "salah sedikit" cukup banyak.
Cara Melakukan Penskoran Tes Benar Salah
v Dengan Denda. Skor = Jumlah jawaban benar – Jumlah jawaban Salah
v Tanpa Denda. Skor = Jumlah jawaban yang benar
b. Bentuk Pilihan Ganda (Multiple Choice Test). Tes pilihan ganda merupakan tes yang menggunakan pengertian/ pernyataan yang belum lengkap dan untuk melengkapinya maka kita harus memilih satu dari beberapa kemungkinan jawaban benar yang telah disiapkan.
Apabila dilihat konstruksinya maka tes pilihan ganda terdiri dari dua hal pokok yaitu stem atau pokok soal dengan 4 atau 5 alternatif jawaban. Satu di antara alternatif jawaban tersebut adalah kunci jawaban. Alternatif jawaban selain kunci disebut dengan pengecoh (distractor). Semakin banyak alternatif jawaban yang ada (misalnya 5) maka probabilitas menebaknya akan semakin kecil
c. Menjodohkan (Matching Test). Menjodohkan terdiri atas satu sisi pertanyaan dan satu sisi jawaban, setiap pertanyaan mempunyai jawaban pada sisi sebelahnya. Siswa ditugaskan untuk memasangkan atau mencocokkan, sehingga setiap pertanyaan mempunyai jawaban yang benar.
ü Kelebihan:
o Dipergunakan untuk menilai bermacam-macam hal, misalnya: problem dan penyelesaiannya, sebab akibat, istilah dan definisinya, dsb.
o Relatif mudah disusun.
o Jika disusun dengan baik, maka faktor menerka-nerka dapat dihilangkan.
o Dapat dinilai dengan mudah, cepat dan objektif.
ü Kelemahan:
o Sukar menyusun test jenis ini yang benar-benar baik.
o Untuk menilai ingatan saja.
o Pengarahan jawaban sering terjadi
o Memakan banyak waktu dan tenaga untuk menyusunnya.
ü Saran Penulisan:
v Banyaknya jawaban di sebelah kanan lebih dari jawaban di sebelah kiri
v Lebihnya jawaban hendaknya menunjukkan jawaban yang salah
v Materinya setiap sisi baiknya mengenai satu pokok bahasan saja
v Pisahkan menjadi dua kolom, kolom pertama memuat jawaban, nomor soal dan pertanyaan. Sedangkan kolom kedua memuat kode dan pilihan jawaban.
ü Cara Memberikan Skor: Penskoran pada tes menjodohkan tidak diberikan denda terhadap jawaban yang salah. Skor = Jumlah jawaban benar
d. Tes Isian (Complementary Test). Tes isian terdiri dari kalimat yang dihilangkan (diberi titik-titik). Bagian yang dihilangkan ini yang diisi oleh peserta tes merupakan pengertian yang diminta agar pernyataan yang dibuat menjadi pernyataan yang benar. Contoh:
(1) Yang merupakan nama asli dari Sultan Hamengkubuwono X adalah …..
(2) Para filsuf zaman modern menegaskan bahwa pengetahuan tidak berasal dari kitab suci atau ajaran agama, tidak juga dari para penguasa, tetapi dari diri manusia sendiri. Namun tentang aspek mana yang berperan ada beda pendapat. Aliran ……………….. beranggapan bahwa sumber pengetahuan adalah rasio: kebenaran pasti berasal dari rasio (akal). Aliran ……………, sebaliknya, meyakini pengalamanlah sumber pengetahuan itu, baik yang batin, maupun yang inderawi.
ü Cara Memberikan Skor:
Pada tes ini sulit dilakukan tebakan, sehingga tidak diperlukan denda terhadap jawaban yang salah. Maka rumus yang digunakan adalah :
Skor = Jumlah jawaban benar
3. Pengukuran Ranah Afektif
Pengukuran ranah afktif tidak dapat diukur seperti halnya ranah kognitif, karena dalam ranah afektif kemampuan yang diukur adalah, Menerima (memperhatikan), merespon, menghargai, mengorganisasi, dan karakteristik suatu nilai.Sedangkan tujuan penilaian afektif adalah :
a) Untuk mendapatkan umpan balik (feedback) baik bagi guru maupun siswa sebagai dasar untuk memperbaiki proses belajar mengajar dan mengadakan program perbaikan (remedial program) bagi anak didiknya.
b) Untuk mengetahui tingkat perubahan tingkah laku anak didik yang dicapai antara lain diperlukan sebagai bahan bagi : perbaikan tingkah laku anak didik, pemberian laporan kepada orang tua, dan penentuan lulus tidaknya anak didik.
c) Untuk menempatkan anak didik dalam situasi belajar mengajar yang tepat, sesuai dengan tingkat pencapaian dan kemampuan serta karakteristik anak didik.
d) Untuk mengenal latar belakang kegiatan belajar dan kelainan tingkah laku anak didik.
Jenis-jenis skala sikap
a. Skala Likert
Skala Likert di gunakan untuk mengukur sikap, pendapat, dan resepsi seseorang atau sekelompok orang tentang fenomena social. Dalam penelitian, fenomena social ini telah di tetapkan secara spesifik oleh peneliti, yang selanjutnya di sebut sebagai variable penelitian
b. Skala pilihan ganda
Skala ini bentuknya seperti soal bentuk pilihan ganda yaitu suatu pernyataan yang diikuti oleh sejumlah alternative pendapat.
c. Skala Thurstone
Skala Thurstone merupakan skala sikap yang pertama dikembangkan dalam pengukuran sikap. Skala ini mempunyai tiga teknik penskalaan sikap, yaitu :
· metode perbandingan pasangan
· metode interval pemunculan sama, dan
· metode interval berurutan.
Ketiga metode ini menggunakan bahan pertimbangan jalur dugaan yang menganggap kepositifan relatif pernyataan sikap terhadap suatu obyek.
d. Skala Guttman
Skala pengukuran dengan tipe ini, akan di dapat jawaban yang tegas, yaitu ya atau tidak, benar atau salah, pernah atau tidak, positif atau negative dan lain – lain. Data yang di peroleh dapat berupa data interval atau rasio dikhotomi (dua alternatif). Jadi kalau pada skala likert terdapat 3,4,5,6,7 interval, dari kata "sangat setuju" sampai "sangat tidak setuju", maka pada dalam skala Guttman hanya ada dua interval yaitu "setuju atau tidak setuju". Penelitian menggunakan sakal Guttman di lakukan bila ingin mendapatkan jawaban yang tegas terhadap suatu permasalahan yang di tanyakan. Contoh :
1. Apakah anda setuju dengan kebijakan perusahaan menaikkan harga jual?
a. Setuju b. Tidak Setuju
e. Semantic Deferensial.
Skala pengukuran yang berbentuk Semantic defferensial di kembangkan oleh Osgood. Skala ini juga di gunakan untuk mengukur sikap, hanya bentuknya tidak pilihan ganda maupun checklist, tetapi tersusun dalam satu garis kontinum yang jawaban "sangat positifnya" terletak di bagian kanan garis, dan jawaban yang "sangat negatif" terletak di bagian kiri garis, atau sebaliknya. Data yang di peroleh adalah daya interval, dan biasanya skala ini di gunakan untuk mengukur sikap/karakteristik tertentu yang di punyai oleh seseorang.
4. Pengkuran Ranah Psikomotor
Ranah psikomotor berhubungan erat dengan kerjaan otot sehingga menyebabkan geraknya tubuh atau bagian-bagiannya. Yang termasuk dalam klasifikasi gerak disini mulai dari gerak yang paling sederhana yaitu melipat kertas sampai dengan merakit suku cadang televisi serta komputer. Secara mendasar perlu dibedakan antara 2 hal yaitu keterampilan (skills) dan kemampuan (abilities)
Kebanyakkan para guru tidak menuntut pencapaian 100 dari tujuan yang dirumuskan kecuali hanya berharap bahwa keterampilan yang dicapai oleh siswa-siswanya akan sangat mendukung mempelajari keterampilan lanjutan atau gerakan-gerakan yang lebih kompleks sifatnya. Selain yang telah dikemukakan tersebut, Harrow juga memberikan saran yang mengenai bagaimana melakukan pengukuran terhadap ranah psikomotor ini. Menurutnya penentuan kriteria untuk mengukur keterampilan siswa harus dilakukan dalam jangka waktu sekurang-kurangnya 30 menit. Kurang dari waktu tersebut diperkirakan para penilai belum dapat menangkap gambaran tentang pola keterampilan yang mencerinkan kemampuan siswa.
Bab 12 TABEL SPESIFIKASI
1. Fungsi Tabel Spesifikasi
Fungsi dari tabel spesifikasi ialah untuk menjaga agar tes yang kita susun tidak menyimpang dari bahan (materi) serta aspek kejiwaan (tingkah laku) yang akan dicakup dalam tes.
Contoh table spesifikasi:
Aspek yang diungkap
Pokok Materi
Ingatan
(I)
Pemahaman
(P)
Aplikasi
(A)
Jumlah
Bagian I
Bagian II
Bagian (terakhir)
…………
…………
…………
…………….
……………..
……………..
………….
………….
………….
………….
…………
…………
Jumlah
………..
…………….
…………..
…………
2. Langkah-Langkah Pembuatan
a. Untuk materi yang seragam
Yang dimaksud "seragam" disini adalah bahwa antara pokok materi yang satu dengan pokok materi yang lain mempunyai kesamaan dalam imbangan aspek tingkah laku. Misalnya 50% untuk ingatan, 30% untuk pemahaman, dan 20% untuk aplikasi. Selanjutnya banyaknya butir soal untuk setiap sel (kotak kecil) diperoleh dengan cara menghitung persentase dari banyaknya soal bagi tiap pokok materi yang sudah tertulis di kolom paling kanan.Contoh:
Tabel Spesifikasi Penyusunan Tes Tarikh Kelas XI
Aspek yang diungkap
Pokok Materi
Ingatan
(50 %)
Pemahaman
(30%)
Aplikasi
(20%)
Jumlah
Latar Belakang Berdirinya Umayyah (20%)
[A]
[B]
[C]
10
Kahalifah-Khalifah Besar Umayyah (30%)
[D]
[E]
[F]
15
Keberhasilan Umayyah (30%)
[G]
[H]
[I]
15
Keruntuhan Umayyah (20%)
[J]
[K]
[L]
10
Jumlah
50
Untuk mengisi/menentukan banyaknya butir soal untuk tiap sel adalah sebagai berikut:
Sel A = 50 % x 10 soal = 5 (5 soal)
Sel B = 30% x 10 soal = 3 (3 soal)
Sel C = 20% x 10 soal = 2 (3 soal)
Untuk memgisi sel-sel yang lain, dilakukan dengan cara yang sama seperti hal nya mengisi sel A, B, dan C.
Disamping menggunakan cara seperti diatas, dalam menentukan jumlah butir soal untuk tiap-tiap pokok materi, ada lagi cara lain yang dapat diambil yaitu mulai dari pengisian sel-sel kemudian baru diperoleh jumlah soal tiap pokok materi.
b. Untuk materi yang tidak seragam
Untuk membuat tabel spesifikasi pokok-pokok materi yang tidak seragam, tidak perlu mencantumkan angka persentase imbangan tingkah laku di kepala kolom. Pemberian imbangan dilakukan tiap pokok materi didasarkan atas banyaknya soal untuk pokok materi itu dan imbangan yang dikehendaki oleh penilaian menurut sifat pokok materi yang bersangkutan.Contoh:
Tabel Spesifikasi Penyusunan Tes Tarikh Kelas XI
Aspek yang diungkap
Pokok Materi
Ingatan
Pemahaman
Aplikasi
Jumlah
Bab I: Daulah Umayyah (30%)
[A]
[B]
[C]
15
Bab II: Daulah Abbasiyah (40%)
[D]
[E]
[F]
20
Bab III: Islam di Asia (30%)
[G]
[H]
[I]
15
Jumlah (100%)
50
Dalam keadaan seperti dicontohkan misalnya: BAB I mayoritas hafalan, BAB II mayoritas pemahaman, BAB III mayoritas aplikasi. Maka imbangan aspek tingkah laku, tidak dituliskan pada kepala kolom. Penentuan angka yang menunjukkan banyaknya butir soal pada tiap sel, ditentukan per BAB. Misalnya: untuk Bab I, Ingatan 60%, pemahaman 20%, aplikasi 20%, maka:
Sel A = 60% x 15 soal = 9 soal
Sel B = 20% x 15 soal = 3 soal
Sel C = 20% x 15 soal = 3 soal
Untuk Bab II, ingatan 20%, pemahaman 50%, aplikasi 30%, maka:
Sel D = 20% x 20 soal = 4 soal
Sel E = 50% x 20 soal = 10 soal
Sel F = 30% x 20 soal = 6 soal
Untuk Bab III, ingatan 20%, pemahaman 20%, aplikasi 60%, maka:
Sel G = 20% x 15 soal = 3 soal
Sel H = 20% x 15 soal = 3 soal
Sel I = 60% x 15 soal = 9 soal
4) Tidak Lanjut Sesudah Penyususnan Tabel Spesifikasi
Terdapat dua langkah lagi sebagai tindak lanjut sesudah penyususnan tabel spesifikasi untuk memperoleh seperangkat soal tes yaitu:
a. Menentukan bentuk soal. Ada dua hal yang harus dipertimbangkan dalam menentukan bentuk soal yaitu waktu yang tersedia dan sifat materi yang diteskan.
b. Menuliskan soal-soal. Langkah terakhir dalam penyusunan tes adalah penulisan soal-soal tes (item writing). Langkah ini merupakan langkah penting karena kegagalan dalam hal ini dapat berakibat fatal. Hal-hal yang harus diperhatikan dalam menuliskan soal-soal tes yaitu:
(1) Bahasanya harus sederhana dan mudah dipahami.
(2) Suatu soal tidak boleh mengandung penafsiran ganda/membingungkan.
(3) Cara mengenal kalimat atau meletakkan/menata kata-kata perlu diperhatikan agar tidak ditafsirkan salah.
(4) Petunjuk mengerjakan. Petunjuk ini harus dituliskan sedemikian rupa sehingga jelas, dan siswa tidak bekerja menyimpang dri yang dikehendaki guru.
Untuk memperoleh sebuah tes yang standar, harus dilakukan uji coba (try out) berkali-kali sehingga diperoleh soal-soal yang baik. Dengan mengadakan uji coba terhadap soal-soal tes yang sudah disusun, maka akan memperoleh manfaat yaitu: pengalaman menggunakan tes tersebut, mengetahui kesukaran bahasa, mengetahui variasi jawaban siswa, mengetahui waktu yang dibutuhkan, dan lain-lain.
Bab 13 MENGANALISISS HASIL TES
1. Menilai Tes yang Dibuat Sendiri
Guru yang sudah banyak berpengalaman, mengajar dan menyusun soal-soal tes, juga masih sukar menyadari bahwa tesnya masih belum sempurna. Oleh karena itu cara yang paling baik adalah secara jujur melihat hasil yang diperoleh oleh siswa.
Ada 4 cara untuk menilai tes, yaitu:
a. Meneliti secara jujur soal-soal yang sudah disusun, kadang-kadang dapat diperoleh jawaban tentang ketidak jelasan perintah atau bahasa, taraf kesukaran, dan lain-lain keadaan soal tersebut. Pertanyaan-pertanyaan tersebut antara lain:
(1) Apakah banyaknya soal untuk tiap topik sudah seimbang ?
(2) Apakah semua soal menanyakan bahan yang telah diajarkan ?
(3) Apakah soal yang kita susun tidak merupakan pertanyaan yang membingungkan (dapat disalah tafsirkan)?
(4) Apakah soal itu tidak sukar untuk dimengerti ?
(5) Apakah soal itu dapat dikerjakan oleh sebagian besar siswa ?
b. Mengadakan analisis soal (item analysis). Analisis soal adalah suatu prosedur Yang sistematis, yang akan memberikan informasi-informasi yang sangat khusus terhadap butir tes yang kita susun. Faedah mengadakan analisis soal:
(1) Membantu kita dalam mengidentifikasi butir-butir soal yang jelek.
(2) Memperoleh informasi yang akan dapat digunakan untuk menyempurnakan soal-soal untuk kepentingan lebih lanjut.
(3) Memperoleh gambaran secara selintas tentang keadaan yang kita susun.
c. Mengadakan checking validitas. Validitas yang paling penting dari tes buatan Guru adalah validitas kurikuler.
d. Mengadakan checking reliabilita. Salah satu indikator untuk tes yang
Mempunyai realibilitas yang tinggi adalah bahwa kebanyakan dari soal-soal tes itu mempunyai daya pembeda yang tinggi.
2. Analisis Butir Soal(Item Analysis)
Analisis butir soal yang dalam bahasa inggris disebut item analiysis dilakukan terhadap empirik.Maksudnya, analisis itu baru dapat dilakukan apabila suatu tes telah dilaksanakan dan hasil jawaban terhadap butir-butir soal telah kita peroleh.
Untuk mengetahui kapan soal dikatakan baik, kurang baik, dan soal yang jelek sangat berhubungan dengan analisis soal, yaitu taraf kesukaran, daya pembeda, dan pola jawaban soal.
a) Taraf Kesukaran
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkannya. Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena di luar jangkauannya.
Bilangan yang menunjukkan sukar dan mudahnya sesuatu soal disebut indeks kesukaran. Besarnya indeks kesukaran antara 0,00 sampai dengan 1,0. Soal yang indeks kesukaran 0,0 menunjukkan bahwa soal itu terlalu sukar, sebaliknya indeks 1,0 menunjukkan bahwa soalnya terlalu mudah.
Didalam istilah evaluasi, indeks kesukaran diberi simbol P (proporsi). Rumus mencari P adalah :
P = B
JS
Dimana :
P= indeks kesukaran
B = Banyaknya siswa yang menjawab soal itu dengan betul
JS = jumlah seluruh siswa peserta tes
Menurut ketentuan yang sering diikuti, indeks kesukaran sering diklasifikasikan sebagai berikut :
Soal dengan P 1,00 sampai 0,30 adalah soal sukar
Soal dengan P 0,30 sampai 0,70 adalah soal sedang
Soal dengan P 0,70 sampai 1,00 adalah soal mudah
Walaupun demikian ada yang berpendapat bahwa soal – soal yang di anggap baik yaitu soal – soal sedang, tetapi bukan berarti soal – soal yang terlalu mudah atau terlalu sukar tidak bisa digunakan, hal ini tergantung dari penggunaannya.
b) Daya Pembeda.
Daya pembeda soal adalah kemampuan sesuatu soal untuk membedakan antara siswa yang berkemampuan tinggi dengan siswa yang berkemampuan rendah.
Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi, indeks diskriminasi ini sama dengan indeks kesukaran yaitu berkisar antara 0,00 sampai 1,00. Hanya bedanya, indeks kesukaran tidak mengenal tanda negatif tetapi pada indeks diskriminasi ada tanda negatif.
Bagi suatu soal yang dapat dijawab benar oleh siswa pandai maupun siswa bodoh, maka soal itu tidak baik, demikian pula jika semua siswa, baik pandai maupun bodoh tidak dapat menjawab dengan benar, soal tersebut tidak baik karena keduanya tidak mempunyai daya pembeda. Soal yang baik adalah soal yang dapat dijawab oleh siswa pandai saja.
Jika seluruh kelompok atas (pandai) dapat menjawab soal dengan benar, sedang seluruh kelompok bawah (bodoh) menjawab salah, maka soal tersebut mempunyai diskriminasi paling besar, yaitu 1,00. Sebaliknya jika semua kelompok atas menjawab salah, tetapi semua kelompok bawah menjawab betul, maka nilai diskriminasinya adalah -1,00. Tetapi jika siswa kelompok atas dan siswa kelompok bawah sama-sama menjawab benar atau sama-sama menjawab salah, maka soal tersebut mempunyai nilai diskriminasi 0,00 karena tidak mempunyai daya pembeda sama sekali.
Rumus mencari nilai Diskriminasi adalah :
D = BA/JA – BB/JB = PA – PB
Dimana :
J = jumlah peserta tes
JA = banyaknya peserta kelompok atas
JB = banyaknya peserta kelompok bawah
BA = banyaknya peserta kelompok atas yang menjawab soal itu dengan benar
BB BA/JA = banyaknya peserta kelompok bawah yang menjawab soal itu dengan benar.
PA = BB/JB = proporsi peserta kelompok atas yang menjawab benar ( P sebagai indeks kesukaran).
PB = proporsi peserta kelompok bawah yang menjawab benar
c) Pola Jawaban Soal
Pola jawaban yang dimaksud adalah distribusi testee dalam hal menentukan pilihan jawaban pada soal bentuk pilihan ganda. Pola jawaban soal diperoleh dengan menghitung banyaknya testee yang memilih pilihan jawaban a, b, c, atau d atau yang tidak memilih pilihan manapun.
Dari pola jawaban soal dapat ditentukan apakah pengecoh (distractor) berfungsi sebagai pengecoh dengan baik atau tidak. Pengecoh yang tidak dipilih sama sekali oleh testee berarti bahwa pengecoh itu jelek, sebaliknya sebuah distraktor dapat dikatakan berfungsi dengan baik apabila distraktor tersebut mempunyai daya tarik yang besar bagi pengikut – pengikut tes yang kurang memahami konsep atau kurang menguasai bahan.
Dengan melihat pola jawaban soal, dapat diketahui :
a. Taraf kesukaran soal
b. Daya pembeda soal
c. Baik dan tidaknya distraktor
Kekurangan suatu soal mungkin hanya terletak pada rumusan kalimatnya sehingga hanya perlu ditulis kembali, dengan perubahan seperlunya.
Bab 14 MENSKOR DAN MENILAI
1. Menskor
Sementara orang berpendapat bahwa bagian yang paling penting dari pekerjaan pengukuran dengan tes adalah penyusunan tes. Jika alat tesnya sudah disusun sebaik-baiknya maka anggapannya sudah tercapailah sebagian besar dari maksudnya. Tentu saja anggapan itu tidak benar sama sekali. Penyusunan tes baru merupakan satu bagian dari serentetan pekerjaan mengetes.
Di samping penyusunan dan pelaksanaan tes itu sendiri, menskor dan menilai merupakan pekerjaan yang menuntut ketekunan yang luar biasa dari penilai, ditambah dengan kebijaksanan-kebijaksanaan tertentu. Nama lain menskor adalah memberi angka.
Dalam hal pekerjaan menskor atau menentukan angka, dapat digunakan 3 macam alat bantu yaitu:
a. Pembantu menentukan jawaban yang benar, disebut kunci jawaban.
b. Pembantu menyeleksi jawaban yang benar dan yang salah, disebut kunci scoring.
c. Pembantu menentukan angka, disebut pedoman penilaian.
Keterangan dan pengunaannya dalam berbagai bentuk tes.
(1) Kunci jawaban dan kunci pemberian skor untuk tes bentuk betul-salah.
Untuk tes bentuk betul-salah (true-false) yang dimaksud dengan kunci jawaban adalah deretan jawaban yang kita persiapkan untuk pertanyaan atau soal-soal yang kita susun, sedangkan kunci scoring adalah alat yang kita gunakan untuk mempercepat pekerjaan scoring.
Oleh karena dalam hal ini testee (tercoba) hanya diminta melingkari huruf B atau S maka kunci jawaban yang disediakan hanya berbentuk urutan nomor serta huruf dimana kita menghendaki untuk melingkari (atau dapat juga diberi tanda X).
Ada baiknya jika kunci jawaban ini ditentukan terlebih dahulu sebelum menyusun soalnya agar:
üdapat diketahui imbangan antara jawaban B dan S.
üdapat diketahui letak atau pola jawaban B dan S.
Bentuk betul-salah sebaiknya disusun sedemikian rupa sehingga jumlah jawaban B hampir sama banyaknya dengan jawaban S, dan tidak dapat ditebak karena tidak diketahui pola jawabannya. Dalam menentukan angka (skor) untuk tes bentuk B-S ini kita dapat menggunakan 2 cara yaitu:
ü Tanpa hukuman atau tanpa denda.
ü Dengan hukuman atau dengan denda.
(2) Kunci jawaban dan kunci pemberian skor untuk tes bentuk pilihan ganda (multiple choice)
Dengan tes bentuk pilihan ganda, testee diminta melingkari salah satu huruf di depan pilihan jawaban yang disediakan atau membubuhkan tanda lingkaran atau tanda silang (x) pada tempat yang sesuai di lembar jawaban.
(3) Kunci jawaban dan kunci pemberian skor untuk tes bentuk jawab singkat (sort answer test)
Tes bentuk jawab singkat adalah bentuk tes yang menghendaki jawaban berbentuk kata atau kalimat pendek. Melihat namanya, maka jawaban untuk tes tersebut tidak boleh berbentuk kalimat-kalimat panjang, tetapi harus sesingkat mungkin dan mengandung satu pengertian. Dengan persyaratan inilah maka bentuk tes ini dapat digolongkan ke dalam bentuk tes objektif.
Kunci jawaban tes bentuk ini merupakan deretan jawaban sesuain dengan nomornya.
Dengan mengingat jawaban yang hanya satu pengertian saja, maka angka bagi tiap nomor soal mudah ditebak. Usaha yang dikeluarkan siswa sedikit, tetapi lebih sulit daripada tes bentuk betul-salah atau bentuk pilihan ganda. Sebaiknya setiap soal diberi angka 2. Dapat juga angka itu kita samakan dengan angka pada bentuk betul-salah atau pilihan ganda jika memang jawaban yang diharapkannya ringan atau mudah. Tetapi sebaliknya apabila jawabannya bervariasi misalnya lengkap sekali, lengkap dan kurang lengkap, maka angka-angkanya dapat dibuat bervariasi pula misalnya 2; 1,5; dan 1.
(4) Kunci jawaban dan kunci pemberian skor untuk tes bentuk menjodohkan (matching)
Pada dasarnya tes bentuk menjodohkan adalah tes bentuk pilihan ganda, dimana jawaban-jawabannya dijadikan satu, demikian pertanyaan-pertanyaannya. Dengan demikian, maka pilihan jawabannya akan lebih banyak. Satu kesulitan lagi adalah bahwa jawaban yang dipililh dibuat sedemikian rupa sehingga jawaban yang satu tidak diperlukan lagi bagi pertanyaan lain.
Kunci jawaban tes bentuk menjodohkan dapat berbentuk deretan jawaban yang dikehendaki atau deretan nomor yang diikuti oleh huruf-huruf yang terdapat di depan alternative jawaban.
Telah dijelaskan bahwa tes bentuk menjodohkan adalah tes bentuk pilihan ganda yang lebih kompleks. Maka angka yang diberikan sebagai imbalan juga harus lebih banyak. Sebagai ancar-ancar dapat ditentukan bahwa angka untuk tiap nomor adalah 2 (dua).
(5) Kunci jawaban dan kunci pemberian skor untuk tes bentuk uraian (essay test)
Sebelum menyusun sebuah tes uraian sebaiknya kita tentukan terlebih dahulu pokok-pokok jawaban yang kita kehendaki. Dengan demikian, maka akan mempermudah kita dalam pekerjaan mengkoreksi tes itu.
Tidak ada jawaban yang pasti terhadap tes bentuk uraian ini. Jawaban yang kita peroleh akan sangat beraneka ragam, berada dari siswa satu ke siswa lain. Untuk menetukan standar terlebih dahulu, tentulah sukar. Berikut adalah saran langkah-langkah apa yang harus kita lakukan pada waktu kita mengoreksi dan member angka tes bentuk uraian:
a) Membaca soal pertama dari seluruh siswa untuk mengetahui situasi jawaban. Dengan membaca seluruh jawaban, kita dapat memperoleh gambaran lengkap tidaknya jawaban yang diberikan siswa secara keseluruhan.
b) Menentukan angka untuk soal pertama tersebut. Misalnya jika jawabannya lengkap diberi angka 5, kurang sedikit diberi angka 4, begitu seterusnya sampai kepada jawaban yang paling minim jika jawabannya meleset sama sekali. Dalam menentukan angka pada hal yang terakhir ini umumnya kita perlu berpikir bahwa tidak ada unsur tebakan. Dengan demikian maka ada dua pendapat, satu pendapat menentukan angka 1 atau 2 bagi jawaban yang salah, tetapi pendapat lain menentukan 0 untuk jawaban itu. Tentu saja bagi jawaban yang kosong (tidak ada jawaban sama sekali), jelas kita berikan angka 0.
c) Memberikan angka bagi soal pertama.
d) Membaca soal kedua dari seluruh siswa untuk mengetahui situasi jawaban, dilanjutkan dengan pemberian angka untuk soal kedua.
e) Mengulangi langkah-langkah tersebut bagi soal-soal tes ketiga, keempat dan seterusnya hingga seluruh soal diberi angka.
f) Menjumlahkan angka-angka yang diperoleh oleh masing-masing siswa untuk tes bentuk uraian.
Setelah mempelajari langkah-langkah tersebut kita tahu bahwa dengan membaca terlebih dahulu seluruh jawaban yang duberikan oleh siswa, kita menjadi tahu bahwa mungkin tidah ada seorang pun dari siswa yang menjawab dengan betul untuk sesuatu nomor soal.
Menghadapi situasi seperti ini, kita gunakan cara pemberian angka yang relative. Misalnya untuk satu nomor soal jawaban yang paling lengkap hanya mengandung 3 unsur, padahal kita menghendaki 5 unsur, maka kepada jawaban yang paling lengkap itulah kita berikan angka 5, sedangkan untuk menjawab hanya 2 atau 1 unsur, kita beri angka sedikit, yaitu misalnya 3,4; 2; 1,5.
(6) Kunci jawaban dan kunci pemberian skor untuk tugas
Kunci jawaban untuk memeriksa tugas merupakan poko-pokok yang harus termuat di dalam pekerjaan siswa. Hal ini menyangkut criteria tentang isi tugas. Namun sebagai kelengkapan dalam pemberian skor, digunakan suatu tolok ukur tertentu. Tolok ukur yang disarankan sebagai ukuran keberhasilan tugas adalah:
a) Ketepatan waktu penyerahan tugas.
b) Bentuk fisik pengerjaan tugas yang menandakan keseriusan mahasiswa dalam mengenakan tugas.
c) Sistematika yang menunjukkan alur keruntutan pikiran.
d) Kelengkapan isi menyangkut ketuntasan penyelesaian dan kepadatan isi.
e) Mutu hasil tugas, yaitu kesesuaian hasil dengan garis-garis yang sudah ditentukan oleh dosen.
2. Perbedaan Antara Skor dan Nilai
Apa yang terjadi selama ini, banyak di antara para guru sendiri yang masih mencampuradukkan antara dua pengertian yaitu skor dan nilai.Skor : adalah hasil pekerjaan menskor yang diperoleh dengan menjumlahkan angka-angka bagi setiap soal tes yang dijawab betul oleh siswa.Nilai : adalah angka ubahan dari skor dengan menggunakan acuan tertentu, yakni acuan normal atau acuan standar.Secara rinci skor dapat dibedakan atas tiga macam, yaitu skor yang diperoleh (obtained score), skor sebenarnya (true score), dan skor kesalahan (error score).
Score yang diperoleh adalah sejumlah biji yang dimiliki oleh testee sebagai hasil mengerjakan tes. Kelemaham-kelemahan butir tes, situasi yang tidak mendukung, kecemasan dan lain-lain factor dapat berakibat terhadap skor yang diperoleh ini. Apabila factor yang berpengaruh ini muncul, baik sebagian atauppun menyeluruh, penilai tidak dapat mengira-ngira seberapa cermat skor yang diperoleh siswa ini mampu mencerminkan pengetahuan dan keterampilan siswa yang sesungguhnya.
Skor sebenarnya (true score) sering kali juga disebut dengan istilah skor univers = skor alam (universe score), adalah nilai hipotesis yang sangat tergantung dari perbedaan individu berkenaan dengan pengetahuan yang dimiliki secara tetap.
Perbedaan antara skor yang diperoleh dengan skor yang sebenarnya, disebut dengan istilah kesalahan dalam pengukuran atau kesalahan skor, atau dibalik skor kesalahan. Hubungan antara ketiga macam skor tersebut adalah sebagai berikut:
Skor yang diperoleh = skor sebenarnya = skor kesalahan
3. Norm ReferenceddanCriterion Referenced
Dalam penggunaan Norm – Referenced, prestasi belajar seorang siswa dibandingkan dengan siswalain dalam kelompoknya. Kualitas seseorang sangat dipengaruhi oleh kualitas kelompoknya. Dasar pikiran dari penggunaan standar ini adalah adanya asumsi bahwa disetiap populasi yang heterogen tentu terdapat kelomouk baik, kelompok sedang, dan kelompok kurang.
Apabila standar mutlak dan standar relatif ini dihubungkan dengan pengubahab skor menjadi nilai, maka akan terlihat demikian.
a. Dengan standar mutlak
(1) Pemberian skor terhadap siswa, didasarkan atas pencapaian siswa terhadap tujuan yang ditentukan.
(2) Nilai diperoleh dengan mencari skor rata-rata langsung dari skor asal (skor mentah). Contoh :
ü dari ulangan ke-1, memperoleh skor 60 (mencapai 60 % tujuan)
ü dari ulangan ke-2, memperoleh skor 80 (mencapai 80 % tujuan)
ü dari ulangan ke-3, memperoleh skor 50 (mencapai 50 % tujuan)
maka nilai siswa tersebut : 60 + 80 + 50 = 63,3. Dibulatkan 63.
b. Dengan standar relatif
(1) pemberian skor terhadap siswa juga didasakan atas pencapaian siswa terhadap tujuan yang ditentukan
(2) nilai diperoleh dengan 2 cara :
Ø mengubah skor dari tiap-tiap ulangan lalu diambil rata-ratanya
Ø menjumlah skor tiap-tiap ulangan, baru diubah ke nilai
Bab 15 MENGOLAH NILAI
1. Beberapa Skala Penilaian
a. Skala Bebas
Skala bebas yaitu skala yang tidak tetap, ada kalanya skor tertinggi 20, lain kali lagi 50. Ini semua tergantung dari banyak dan bentuk soal. Jadi, angka tertinggi dari skala yang di gunakan tidak selalu sama.
b. Skala 1-10
Dalam skala 1-10, guru jarang memberikan angka pecahan, misalnya 5,5. Angka 5,5 tersebut di bulatkan menjadi 6. Dengan menggunakan skala 1-10 maka bilangan bulat yang ada masih menunjukan penilaian yang agak kasar.
c. Skala 1-100
Penilaian dengan menggunakan skala 1-100, di mungkinkan melakukan penilaian yang lebih halus karena terdapat 100 bilangan bulat. Nilai 5,5 dalam skala 1-10 yang biasanya di bulatkan menjadi 6, dalam skala 1-100 ini boleh di tuliskan dengan 55.
d. Skala huruf
Selain menggunakan angka, pemberian nilai dapat di lakukan dengan huruf A,B,C,D,dan E. Huruf tidak menunjukan kuantitas, tetapi dapat di gunakan sebagai symbol untuk menggambarkan kualitas.
2. Distribusi Nilai
a. Distribusi nilai berdasarkan standar mutlak
Pemberian skor terhadap siswa, didasarkan atas pencapaian siswa terhadap tujuan yang ditentukan. Nilai diperoleh dengan mencari skor rata-rata langsung dari skor asal (mentah). Apabila soal-soal ulangan yang dibuat oleh guru sangat mudah, sebagian besar siswa akan dapat berhasil mengerjakan soal-soal itu, dan tingkat pencapaiannya tinggi.sebagian besar siswa akan memiliki nilai sekitar 8, 9 atau 10 apabila telah diubah ke skala 10, sebaliknya apabila soal-soal tes yang disusun oleh guru termasuk soal sukar, maka pencapaian siswa akan sebaliknya pula. Sebagian besar siswa akan memiliki nilai 3, 4 bahkan mungkin 2 atau 1. Hanya beberapa orang siswa yang istimewa saja yang memiliki nilai 6, dan mungkin tidak ada yanig memiliki nilai 7 ke atas. Namun demikian dengan standar mutlak ini mungkin pula diperoleh gambar kurva normal jika soal-soal tes disusun oleh guru dengan tepat seperti gambaran kecakapan siswa-siswanya.
b. Distribusi nilai berdasarkan standar relative
Pemberian skor terhadap siswa juga didasarkan atas pencapaian siswa terhadap tujuan yang ditentukan.Nilai diperoleh dengan 2 cara:
§ Mengubah skor dari tiap-tiap ulangan lalu diambil rata-ratanya.
§ Menjumlah skor tiap-tiap ulangan, baru diubah ke nilai.
Telah diterangkan, bahwa dalam menggunakan standar relative atau norm refrenced, kedudukan seseorang sealu dibandingkan dengan kawan-kawannya dalam kelompok. Dalam hal ini tanpa menghiraukan apakah distribusi skor terletak dalam kurva juring positif atau juring negative, tetapai dalam norm refrenced selalu tergambar dalam kurva normal. Hal ini didasarkan atas asumsi bahw apabila distribusi skor tergambar dalam kurva juring positif, yang kurang sempurna adalah soal-soal tesnya, yaitu terlalu sukar. Dengan demikian, nilai siswa lalu direntangkan sedemikian rupa sehingga tersebar dari nilai tinggi ke nilai rendah, dengan sebagian terbesar terletak pada nilai sedang. Demikian pula sebaliknya apabila skor siswa tergambar dalam kurva juring negative. Dalam ubahan menjadi nilai, disebar sedemikian rupa sehingga kurva normal, dengan nilai sedang adalah nilai yang paling banyak.
3. Standar Nilai
a. Nilai standar berskala Sembilan (stannine), yaitu rentangan atau skala nilai yang bergerak mulai dari 1 sampai dengan 9,[7] seperti berikut ini:
Staines
Interpretasi
9 (4%)
Tinggi (4%)
8 (7%)
7 (12%)
Diatas rata-rata (19%)
6 (17%)
5 (20%)
4 (17%)
Rata-rata (54%)
3 (12%)
2 (7%)
Dibawah rata-rata (19%)
1 (4%)
Rendah (4%)
Misalnya kita memiliki skor-skor seperti disebutkan dalam hasil ulangan IPS kelas V, dengan mudah dapat kita tentukan 4% dari siswa yang mendapat nilai 9, selanjutnya 7% mendapat nilai 8, 12% mendapat nilai 7, 17% mendapat nilai 6, dan seterusnya.
b. Nilai standar berskala sebelas (standar eleven/ stanel= eleven points scale), yaitu skala nilai yang bergerak mulai dari nilai 0 sampai dengan nilai 10,[9] yang dikembangkan oleh Fakultas Ilmu Pendidikan UGM disesuaikan dengan system penilaian di Indonesia. Dengan stanel ini, system penilaian membagi skala menjadi 11 golongan, yaitu angka-angka 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, yang satu sama lain berjarak sama. Tiap-tiap angka menempati jarak antara
c. Standar sepuluh. Didalam Buku Pedoman Penilaian (Buku III B Seri Kurikulum SMA Tahun 1975) ditentukan bahwa untuk mengolah hasil tes, digunakan standar relative, dengan nilai berskala 1 – 10. Untuk mengubah skor menjadi nilai, diperlukan dahulu:
Ø Mean (rata-rata skor)
Ø Deviasi Standar (Simpangan Baku)
Ø Tabel Konversi angka ke dalam nilai berskala 1 – 10
Tahap-tahap yang dilalui dalam mengubah skor mentah menjadi nilai berskala 1 – 10 adalah sebagai berikut:
v Menyusun distribusi frekuensi dari angka-angka atau skor-skor mentah
v Menghitung rata-rata skor (mean)
v Menghitung deviasi standar
v Mentransformasi (mengubah) angka-angka mentah ke dalam nilai berskala 1 – 10
Bab 16 KEDUDUKAN SISWA DALAM KELOMPOK
1. Pengertian
Pengertian yang dimaksud kedudukan siswa dalam kelompoknya adalah letak seorang siswa di dalam urutan tingkatan, dalam istilah disebut rangking. Untuk dapat diketahui rangking dari siswa di suatu kelas maka harus diadakan pengurutan nilai siswa tersebut dari yang paling atas sampai ke nilai yang paling bawah.
2. Cara-cara menentukan kedudukan siswa:
a. Dengan rangking sederhana( simple rank) adalah urutan yang menunjukkan letak atau kedudukan seseorang dalam kelompoknya dan dinyatakan dengan nomor atau angka biasa.
b. Dengan rangking presentase (percentile rank) adalah kedudukan seseorang dalam kelompok, yang menunjukkan banyaknya persentase yang berada di bawahnya
c. Standar Deviasi adalah penentuan kedudukan dengan membagi kelas atas kelompok-kelompok. Tiap kelompok dibatasi oleh suatu standar deviasi tertentu.
d. Standard score atau z-score adalah angka yang menunjukkan perbandingan perbedaan score seseorang dari mean dengan standar deviasinya untuk menentukan z-score, harus diketahui:
Ø Rata-rata skor dari kelompok.
Ø Standar deviasi dari skor-skor tersebut
Pengetrapan dari z-score ini banyak digunakan di dalam menentukan kejuaraan seseorang apabila kebetuan jumlah nilainya sama
Kedudukan seseorang dalam sebuah kelas sangat penting karena dengan begitu peserta didik akan tahu berapa rangking yang telah dicapainya, jika mendapat rangking yang bagus maka dia akan merasa bangga dengan hasil yang diperoleh atas usaha yang telah dilakukan selama ini dalam proses belajar mengajar, sedang apabila rangkingnya jelek maka peserta didik akan lebih termotivasi untuk memperbaiki dirinya. Dalam bab ini telah dijelaskan bagaimana cara menentukan kedudukan siswa melalui beberapa standar yang lazim digunakan.
Bab 17 MENCARI NILAI AKHIR
1. Fungsi Nilai Akhir
a. Fungsi intruksional bertujuan untuk memberikan suatu balikan yang mencerminkan seberapa jauh seorang siswa telah mencapai tujuan yang ditetapkan dalam pengajaran atau system intruksional.
b. Fungsi informatif bertujuan untuk memberikan nilai siswa kepada orang tuanya mempunyai arti bahwa orang tua siswa tersebut menjadi tahu akan kemajuan dan prestasi putranya di sekolah.
c. Fungsi bimbingan bertujuan untuk mengetahui bagian-bagian mana dari usaha siswa di sekolah yang masih memerlukan bantuan.
d. Fungsi administratif:
Ø Menentukan kenaikan dan kelulusan siswa
Ø Memindahkan atau menempatkan siswa
Ø Memberikan beasiswa
Ø Memberikan rekomendasi untuk melanjutkan belajar
Ø Memberi gambaran tentang prestasi siswa atau lulusan kepada calon pemakai tenaga kerja.
2. Faktor-faktor yang mempengaruhi penilaian:
a. Prestasi/ pencapaian (achievement)
b. Usaha (effort)
c. Aspek pribadi dan social (personal and social characteristics)
d. Kebiasaan bekerja (working habits).
3. Cara menentukan nilai akhir:
a. Untuk memperoleh nilai akhir, perlu diperhitungkan nilai tes formatif dan tes sumatif.
b. Nilai akhir diperoleh dari nilai tugas, nilai ulangan harian, dan nilai ulangan umum dengan bobot 2,3,dan 5.
c. Nilai akhir untuk STTB diperoleh dari rata-rata nilai ulangan harian (diberi bobot satu) dan nilai EBTA (diberi bobot dua), kemudian dibagi 3.
Bab 18 MEMBUAT LAPORAN
1. Pentingnya Laporan
Laporan biasanya dibuat oleh seorang guru dibuat pada akhir semester, dibuatnya laporan ini diperlukan untuk mengetahui hasil akhir dari apa yang dilakukan oleh siswa-siswi serta diperlukan agar guru dapat mengetahui tingkat keberhasilannya dalam mengajar sudah berhasil atau belum jika belum maka guru akan meninjau kembali metodenya dalam mengajar.Secara sistematis dapat dikemukakan disini bahwa laporan tentang siswa bermanfaat bagi beberapa pihak yaitu sebagai berikut:
a) Siswa sendiri, secara alamiah setiap orang selalu ingin tahu akibat dari apa yang telah mereka lakukan, dengan mengetahui hasil yang positif dari perbuatannya, maka pengetahuan yang diperoleh akan dikuatkan dan jika siswa mendapat informasi bahwa jawwabannya salah, maka lain kali ia tidak akan menjawab seperti itu lagi.
b) Guru yang mengajar akan mengetahui catatan laporan kemajuan siswa.
c) Guru lain, maka guru yang akan mengganti mengajar akan tahu bagaimana meladeni atau memperlakukan siswa.
d) Petugas lain disekolah.
e) Orang tua akan mengetahui kemajuan anak dari hari ke hari.
f) Pemakai lulusan, laporan pendidikan menunjukkan bahwa seseorang telah memiliki pengetahuan dan ketrampilan tertentu. Digunakan untuk mencari pekerjaan dan mencari kelanjutan studi.
2. Macam dan Cara Membuat Laporan
ü Catatan lengkap.
ü Catatan tidak lengkap.
ü Lulus-belum lulus.
ü Nilai siswa.
Bab 19 EVALUASI PROGRAM PENGAJARAN
1. Apakah Evaluasi Program Itu?
Evaluasi merupakan suatu kegiatan yang bertujuan untuk menentukan apakah target progam yang disusun sudah tercapai dengan begitu maka akan diketahui bagaimana kualitas mengajar seorang guru apakah sudah efektif atau belum berdasarkan tingkat pencapaian yang sudah dicapai.
Evaluasi progam merupakan suatu rangkaian kegiatan yang dilakukan dengan sengaja untuk melihat tingkat keberhasilan progam. Untuk menentukan seberapa jauh target progam sudah tercapai, yang dijadikan tolak ukur adalah tujuan yang sudah dirumuskan dalam tahap perencanaan kegiatan.
Pentingnya evaluasi progam yaitu agar guru mengetahui betul apa yang terjadi di dalam proses belajar-mengajar, guru berkepentingan atas kualitas pengajaran. Untuk memperbaiki proses pengajaran yang akan dilaksanakan lain waktu, guru perlu mengetahui seberapa tinggi tingkat pencapaian dari tugas yang telah dikerjakan selama kurun waktu tertentu.
2. Objek atau sasaran evaluasi progam.
Ø Input(masukan)
Ø Materi atau kurikulum.
Ø Guru.
Ø Metode atau pendekatan dalam mengajar.
Ø Sarana: alat pelajaran atau media pendidikan.
Ø Lingkungan manusia.
Ø Lingkungan bukan manusia.
3. Cara melaksanakan evaluasi progam.
Apabila guru ingin melakukan evaluasi progam dengan lebih seksama, terlebih dahulu harus menyusun rencana evaluasi sekaligus menyusun instrument pengumpulan data. Mengenai bagaimana menyiapkan instrumen untuk angket, pedoman wawancar, pedoman pengamatan dapat dipelajari dari buku-buku penelitian. Sebagai cara yang paling sederhana adalah mengadakan pencatatan terhadap peristiwa yang dialami dari kegiatan sehari-hari di kelas.