10
SPECIAL INTEREST TOPIC: MENGAPA TEST IQ MENGGUNAKAN
MEAN 100 DAN STANDAR DEVIASI 15?
Digunakan untuk Memenuhi Tugas Mata Kuliah Konstruksi Instrumen
Dosen Pengampu Prof. Dr. Trie Hartiti Retnowati
Disusun oleh :
Rizki Nor Amelia 14701251022
Agustinus Pas 14701251036
PENELITIAN DAN EVALUASI PENDIDIKAN
PROGRAM PASCASARJANA
UNIVERSITAS NEGERI YOGYAKARTA
2015
A. Pendahuluan
Hasil pengukuran dari suatu objek disebut skor (raw score). Namun dalam praktiknya, skor mentah (raw score) disebut "skor "saja. Supaya gambaran tentang distribusi frekuensi skor makin bertambah lengkap dan jelas, gambaran tersebut tidak hanya dilihat dari tendensi sentral (Mean) dan variabilitas (rentangan dan deviasi standar) saja, tetapi perlu juga dilihat bagaimana skor-skor dalam suatu distribusi itu menyebar di atas atau di bawah Mean dalam satuan deviasi standar, sehingga menjadi skor-skor baru. Dengan kata lain skor baru itu (derived score=skor terjabarkan) merupakan penjabaran dari skor (mentah) dalam satuan deviasi standar. Selanjutnya dengan menggunakan penilaian berbasis norma, maka skor standar (kadang-kadang disebut scalled score-skor berskala) merupakan skor terjabarkan yang paling sering digunakan.
Perubahan skor mentah menjadi skor standar melibatkan penciptaan sekumpulan nilai dengan satu penetapan sebelumnya bahwa rata-rata dan standar deviasi yang tetap di seluruh variabel yang sudah ditentukan sebelumnya. Meskipun kita sedang menggambarkan sejumlah perbedaan format skor standar, skor standar itu memiliki sejumlah karakter yang sama. Semua skor standar mengandung standar deviasi untuk menunjukkan dimana skor peserta tes terletak relatif terhadap rata-rata dari distribusi. Seperti yang telah kita ketahui bersama bahwa skor standar dapat diatur untuk setiap mean dan standar deviasi yang diinginkan, sehingga pembuat tes ataupun peneliti sering menjadi faktor penentu untuk mengkonversikan skor tersebut. Standar skor yang akan dibahas di dalam makalah ini hanyalah sebagian dari tes yang sering digunakan dalam bidang pendidikan maupun bidang psikologi.
B. Special Interest Topic : Mengapa Tes IQ Menggunakan Rata-rata 100 dan Standar Deviasi 15?
1. Sejarah Tes IQ
Novelis Inggris pada abad ke-20 Aldous Huxley mengatakan bahwa anak-anak itu hebat dalam rasa ingin tahu dan intelegensinya. Apakah yang dimaksudkan Husley dengan intelegensi? Intelegensi adalah salah satu milik manusia yang paling berharga, tetapi bahkan orang yang paling cerdas sekalipun tidak sepakat tentang apa itu intelegensi. Walaupun demikian, beberapa pakar tetap memberikan definisi tentang intelegensi yakni sebagai keahlian dalam memecahkan masalah (problem solving). Ada juga yang mendeskripsikannya sebagai kemampuan beradaptasi dan belajar dari pengalaman hidup sehari-hari.
Pada tahun 1904, atas permintaan Menteri Pendidikan Perancis, psikolog Alfred Binet menyusun metode untuk mengidentifikasi anak-anak yang tidak mampu belajar di sekolah umum. Tes yang disusun itu disebut "Skala 1905" yang terdiri dari 30 pertanyaan mulai dari kemampuan menyentuh telinga hingga kemampuan untuk menggambar desain berdasarkan ingatan dan mendefinisikan konsep abstrak. Tes Binet direvisi berkali-kali untuk disesuaikan dengan kemajuan dalam pemahaman intelegensi dan tes intelegensi. Revisi-revisi ini dilakukan di Standford University, oleh karena itu disebut Standford-Binet. Dengan melakukan tes untuk banyak orang dari usia yang berbeda dan latar belakang yang beragam, peneliti menemukan bahwa skor pada tes Standford-Binet mendekati Distribusi Normal.
Tes-tes Binet beserta semua revisinya merupakan skala individual yang pengadministrasiannya memerlukan waktu cukup lama. Pada saat Amerika Serikat memasuki Perang Dunia I pada tahun 1917, sebuah komisi ditunjuk oleh American Psychological Association untuk merancang tes yang dapat melakukan klasifikasi kilat atas satu setengah juta orang calon tentara. Maka di bawah arahan Robert M. Yerkes, dikembangkanlah tes Army Alpha dan Army Beta untuk memenuhi kebutuhan praktis ini. Aplikasi tes inteligensi kelompok seperti ini jauh lebih cepat daripada tes-tes individual. Namun kemudian, ketika tes-tes ini ternyata gagal memenuhi harapan, skeptisme terhadap para tester dan ahli tes kerap muncul.
Tiga puluh empat tahun setelah diterbitkannya tes inteligensi oleh Binet dan Simon, David Wechsler memperkenalkan versi pertama tes inteligensi yang dirancang khusus untuk digunakan oleh orang dewasa. Tes tersebut terbit pada tahun 1939 dan dinamai Wechsler-Bellevue Intelligence Scale (WBIS). Pada tahun 1949, Wechsler juga menerbitkan skala inteligensi untuk anak-anak yang dikembangkan berdasar skala WBIS tadi. Skala ini diberi nama Wechsler Instelligence Scale for Children (WISC). Pada tahun 1974, suatu revisi terhadap tes WISC dilakukan kembali dan edisi revisi ini diterbitkan di tahun tersebut dengan nama WISC-R (huruf R merupakan singkatan dari kata Revised). Di tahun 1955, Wechsler menyusun skala lain untuk mengukur inteligensi orang dewasa dengan memperluas isi tes WISC. Skala baru ini diberinya nama Wechsler Adult Intelligence Scale (WAIS). Revisi terhadap WAIS dilakukan dan diterbitkan pada tahun 1981 dengan nama WAIS-R
Pada perkembangan selanjutnya, disusunlah suatu standar penyusunan tes internasional di Amerika Serikat yang dikenal dengan "Standards for Psychological and Educational Test" yang digunakan hingga saat ini. Kini tes psikologi semakin mudah, praktis, serta muncul dengan berbagai variasi bentuk.
2. Asesmen Tes IQ
Salah satu cara yang sering digunakan untuk menyatakan tinggi rendahnya inteligensi adalah dengan menerjemahkan hasil tes inteligensi ke dalam angka yang dapat menjadi petunjuk mengenai kedudukan tingkat kecerdasan seseorang bila dibandingkan secara relatif terhadap suatu norma.
Secara tradisional, angka normatif dari hasil tes inteligensi dinyatakan dalam bentuk rasio (quotient) dan diberi nama intelligence quotient (IQ). Walaupun demikian, tidak semua tes inteligensi akan menghasilkan angka IQ karena IQ bukan satu-satunya cara untuk menyatakan tingkat kecerdasan seseorang. Beberapa tes inteligensi bahkan tidak menghasilkan IQ, tetapi memberikan klasifikasi tingkat inteligensi, seperti Level III yang berarti klasifikasi inteligensi normal.
Istilah IQ diperkenalkan pertama kali pada tahun 1912 oleh seorang psikolog Jerman, William Stern. Kemudian ketika pada tahun 1916, L.M. Terman menerbitkan edisi revisi tes Binet, istilah IQ mulai digunakan secara resmi untuk yang pertama kali. Sewaktu pertama kali digunakan secara resmi, angka IQ dihitung dari hasil tes inteligensi Binet, yaitu dengan membandingkan skor tes yang diperoleh seorang individu dengan usia individu tersebut. Pada waktu itu, perhitungan IQ dilakukan dengan menggunakan rumus: IQ = (MA/CA) x 100
Keterangan:
MA = Mental Age (usia mental)
CA = Chronological Age (usia kronologis)
100 = Angka konstan untuk menghindari bilangan desimal
Istilah usia mental dikemukakan untuk pertama kalinya bersamaan dengan perumusan perhitungan IQ di atas. Pada masa tersebut, rumus IQ digunakan untuk menentukan tingkat inteligensi seseorang berdasarkan hasil tes inteligensi Binet. Sebenarnya usia mental merupakan suatu norma pembanding, yaitu norma performansi pada kelompok usia tertentu. Misalkan anak yang berusia 8 tahun sebagian besar di antara mereka mampu menjawab dengan benar sebanyak 24 soal dalam tes, maka skor 24 tersebut dijadikan norma untuk kelompok anak-anak usia 8 tahun, dan disebut usia mental 8 tahun. Bila seorang anak, dalam mengerjakan tes yang sama, mampu menjawab 24 soal dengan benar, maka ia dikatakan sebagai mempunyai usia mental 8 tahun, sekalipun usia kronologisnya baru 7 tahun. Adapun usia kronologis adalah usia anak sejak dilahirkan yang dinyatakan dalam satuan tahun atau dalam satuan bulan. Selanjutnya, di bawah ini akan dipaparkan hal-hal yang menyangkut asesmen tes IQ:
a) Batasan Rasio MA/CA
Gagasan pokok dalam perumusan rasio MA/CA adalah perbandingan relatif antara usia kronologis dengan usia mental yang telah ditentukan berdasar rata-rata skor pada kelompok usia tersebut. Seorang yang berinteligensi normal, diharapkan pada usia lima tahun akan mencapai usia mental lima tahun, pada usia tujuh tahun akan mencapai usia mental tujuh tahun, dan seterusnya.
Ternyata, hubungan seperti disebutkan di atas tidaklah selalu ditemui dalam kenyataannya. Setelah memasuki usia remaja akhir, usia mental seseorang rupanya tidak lagi banyak berubah, bahkan cenderung menurun. Rata-rata skor tes yang diperoleh individu berusia 40 tahun relatif sama dengan rata-rata skor sewaktu ia masih berusia 15 tahun, dan karenanya tidaklah layak untuk mengatakannya mencapai usia mental 40 tahun. Di sisi lain, usia kronologis seseorang terus saja bertambah dari waktu ke waktu. Dengan demikian, apabila tes dilakukan dengan membandingkan MA dan CA, maka angka IQ yang diperoleh akan semakin mengecil sejalan dengan bertambahnya usia kronologis. Hal itu memberikan kesan bahwa semakin tua seseorang, maka IQ-nya akan semakin menurun. Padahal hal tersebut tidaklah logis dan tidak sesuai dengan kenyataan. Karena itu, perhitungan IQ dengan menggunakan perbandingan MA dan CA tidak dapat dilanjutkan lagi.
b) Perumusan IQ-Deviasi
Dengan adanya kelemahan penggunaan rasio MA/CA untuk menghitung IQ, maka David Wechsler memperkenalkan konsep penghitungan IQ yang disebut IQ-Deviasi. IQ-Deviasi tidak ditentukan berdasarkan perbandingan MA/CA, akan tetapi dihitung berdasarkan norma kelompok (mean) dan dinyatakan dalam besarnya penyimpangan (deviasi standar) dari norma kelompok tersebut. Dalam statistika, angka yang dinyatakan dalam satuan deviasi standar disebut skor standar dan dirumuskan sebagai: Skor Standar = m + s {(X-M)/sx}
Keterangan:
m = mean skor standar yang diinginkan
s = deviasi standar yang diinginkan
X = skor mentah yang akan dikonversikan
M = mean distribusi skor mentah yang diperoleh
sx = deviasi standar skor mentah yang diperoleh
Sebagai catatan, mean IQ selama ini ditetapkan sebesar 100. Hal ini merupakan kebiasaan tradisional para ahli tes inteligensi selama berpuluh-puluh tahun dalam menafsirkan IQ sebesar 100 sebagai tanda tingkat inteligensi normal. Wechsler sendiri menggunakan mean sebesar 100 dan deviasi standar sebesar 15 untuk menghitung IQ yang diperoleh dari tes WAIS dan WISC, sedangkan tes Stanford-Binet, sejak edisi revisi tahun 1960, menggunakan mean sebesar 100 dan deviasi standar sebesar 16.
c) Distribusi IQ dan Klasifikasi Inteligensi
Sebagaimana karakteristik fisik dan karakteristik psikologis yang lain, dalam suatu populasi yang besar, distribusi angka IQ akan mengikuti suatu model sebaran normal yang berbentuk genta/lonceng simetris, di mana mean terletak di tengah sumbu, angka-angka yang lebih kecil dari mean terletak di sebelah kiri, dan angka-angka yang lebih besar dari mean terletak di sebelah kanan. Hal itu terjadi sesuai dengan deskripsi matematis Quatelet mengenai kurva lonceng yang dijadikan landasan oleh Galton, pada tahun 1869, untuk menyatakan bahwa setiap sifat yang terjadi secara alamiah akan mempunyai satu mean dan satu distribusi normal terhadap mean tersebut.
Implikasi model distribusi normal ini terhadap tingkat inteligensi adalah bahwa persentase terbesar populasi akan memiliki IQ di sekitar mean (100), yaitu di antara angka 90 dan 110. Semakin jauh ke arah kiri (IQ semakin rendah) dan semakin jauh ke arah kanan (IQ semakin tinggi), persentase populasi yang ada akan semakin kecil. Artinya, persentase orang yang mempunyai IQ yang tinggi sekali akan sama kecilnya dengan persentase orang yang memiliki IQ rendah sekali. Hal tersebut telah terbukti kebenarannya dari data yang diperoleh oleh Terman dan Merril pada tahun 1937. Data tersebut berasal dari 3184 subyek yang digunakan untuk standardisasi tes Stanford-Binet. Distribusi data tersebut tampak dalam tabel berikut:
IQ
PERSENTASE
KLASIFIKASI
160 – 169
0,03
Sangat Superior
150 – 159
0,20
140 – 149
1,10
130 – 139
3,10
Superior
120 – 129
8,20
110 – 119
18,10
Rata-rata Tinggi
100 – 109
23,50
Rata-rata Normal
90 – 99
23,00
80 – 89
14,50
Rata-rata Rendah
70 – 79
5,60
Batas Lemah
60 – 69
2,00
Lemah Mental
50 – 59
0,40
40 – 49
0,20
30 – 39
0,03
Normalitas distribusi skor tes inteligensi juga diperlihatkan oleh hasil pelancaran skala WAIS-R, pada tahun 1981, sebagaimana tampak dalam tabel di bawah ini. Dalam tabel tersebut dapat dibandingkan distribusi persentase teoretis bagi masing-masing kelompok IQ dengan distribusi persentase yang diperoleh dari sampel nyata.
IQ
PERSENTASE
KLASIFIKASI
Teoretis
Sampel Nyata
130
2,2
2,6
Sangat Superior
120 – 129
6,7
6,9
Superior
110 – 119
16,1
16,6
Di Atas Rata-rata
90 – 109
50,0
49,1
Rata-rata
80 – 89
16,1
16,1
Di Bawah Rata-rata
70 – 79
6,7
6,4
Batas Lemah
69
2,2
2,3
Lemah Mental
Gambaran distribusi IQ demikian diharapkan juga dapat berlaku pada populasi subyek yang lain di mana saja, asalkan bukan merupakan kelompok khusus atau kelompok pilihan.Bottom of Form
C. Sekilas Macam-Macam Skor Standar
No.
Jenis
Mean
Standar deviasi
1.
Z-score
0
1
2.
T-score
50
10
3.
Wechsler IQs
100
15
4.
Standford-Binet IQs
100
16
5.
CEEB Scores (SAT/GRE)
500
100
D. Mengkonversikan Skor Standar ke dalam Format Skor Standar Lain
Seperti yang telah disampaikan sedikit di bagian pendahuluan, meskipun terdapat perbedaan format pada skor standar tetapi skor standar itu memiliki sejumlah karakter yang sama. Gambar 3.3 dan Tabel 3.2 menggambarkan hubungan antara berbagai format pengolahan skor menjadi skor terstandar. Apabila kelompok yang akan dibandingkan adalah sebanding, maka Tabel 3.2 juga dapat digunakan untuk membantu Anda dalam membandingkan kinerja siswa pada suatu tes dengan atribut yang berbeda menggunakan standar yang berbeda pula. Sementara itu, Tabel 3.3 menggambarkan sebuah rumus sederhana yang memungkinkan Anda untuk mengkonversi nilai standar dari satu format yang lain (misalnya Z-score ke T-score).
Ketika pendidik, peneliti, maupun psikolog melaporkan skor standar dalam laporan, mereka seringkali tidak mencantumkan format standar skor yang mana yang mereka gunakan. Padahal spesifikasi format dalam mengkonversi sebuah skor menjadi skor standar amatlah penting. Contohnya jika suatu skor standar sebesar 70, apabila skor tersebut merupakan T-score maka skor tersebut akan mewakili skor dengan standar deviasi sebesar 2 diatas rata-rata (melebihi sekitar 98% dari skor dalam distribusi). Dengan kata lain, sangatlah penting untuk mengetahui format standar mana yang akan digunakan, sehingga mampu untuk menginterpretasikan skor secara akurat.
Gambar 3.3. Distribusi normal yang menggambarkan hubungan antar-skor standar
Tabel. 3.2. Hubungan dari Perbedaan Format Skor Standar
Z Skor
X = 0
SD = 1
T Skor
X = 50
SD = 10
IQ
X = 100
SD = 15
CEEB Skor
X = 500
SD = 100
Percentile
Rank
2.6
76
139
760
>99
2.4
74
136
740
99
2.2
72
133
720
99
2.0
70
130
700
98
1.8
68
127
680
96
1.6
66
124
660
95
1.4
64
121
640
92
1.2
62
118
620
88
1.0
60
115
600
84
0.8
58
112
580
79
0.6
56
109
560
73
0.4
54
106
540
66
0.2
52
103
520
58
0.0
50
100
500
50
-0.2
48
97
480
42
-0.4
46
94
460
34
-0.6
44
91
440
27
-0.8
42
88
420
21
-1.0
40
85
400
16
-1.2
38
82
380
12
-1.4
36
79
360
8
-1.6
34
76
340
5
-1.8
32
73
320
4
-2.0
30
70
300
2
-2.2
28
67
280
1
-2.4
26
64
260
1
-2.6
24
61
240
1
Keterangan : X = mean (rata-rata); SD = standar deviasi
Tabel. 3.3. Konversi Skor Standar dari Format Satu ke Format yang lain
Anda dapat dengan mudah mengkonversi skor standar dari satu format menjadi format yang lain dengan rumus berikut :
Skor standar baru=Xss2+SDss2 x X-Xss1SDss1
dimana :
X = Skor standar asli
Xss1 = Rata-rata dari format skor standar asli
SDss1 = Standar deviasi dari format skor standar asli
Xss2 = Rata-rata dari format skor standar baru
SDss2 = Standar deviasi dari format skor standar baru
Contoh soal :
Jika seorang siswa memiliki z-score sebesar 1, maka apabila ingin diubah menjadi T-score menjadi :
Skor standar baru=Xss2+SDss2 x X-Xss1SDss1
T-score=50+10 x 1-01
=50+10 (11)
=50+10
=60
Jika dari T-score akan dikonversikan menjadi CEEB score, maka:
CEEB-score=500+100 x 60-5010
=500+100 (1010)
=500+100
=600
D. DAFTAR PUSTAKA
Reynolds C.R., Livingston R.B., & Willson V. (2009). Measurement and Assessment in Education. New Jersey: Pearson Education.
John W. Santrock. (2010). Psikologi Pendidikan (Second Edition). Jakarta: Kencana Media Group.