TUGAS KELOMPOK 6 MATA KULIAH KAPITA SELEKTA
RESAMPLING
“
”
OLEH :
1. Apry Zakaria Ramadhan (0910950023) 2. Evellin Dewi Lusiana
(0910950037)
3. Nur Istiqomah
(0910953007)
4. Dita F. Aprianti
(0910953023)
5. Prawitra Kusumastuti
(0910953041)
6. Ridia Nurul Hijjah
(0910953043)
PROGRAM STUDI STATISTIKA JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS BRAWIJAYA MALANG 2012
BAB I PENDAHULUAN
1.1.Latar Belakang
Dalam statistika, penelitian atau pengamatan dilakukan terhadap sampel yaitu sekumpulan individu yang mewakili populasi. Semakin besar ukuran smapel yang digunakan maka semakin baik hasil penelitian karena bisa mendekati keadaan populasi yang sebenarnya. Akan tetapi, mendapatkan ukuran sampel yang besar juga memerlukan waktu, tenaga dan biaya yang besar, oleh karena itu seringkali seorang peneliti hanya mampu mengadakan penelitian dengan ukuran sampel yang kecil. Hal ini kemudian menimbulkan permasalahan di mana hasil penelitian menjadi tidak bisa benar-benar merepresentasi populasi yang sebenarnya atau dengan kata lain akan terjadi bias. Salah satu solusi untuk mengatasi hal ini adalah melalui metode resampling. Resampling adalah suatu metode yang memungkinkan kita melakukan sampling dari data sampel, sehingga seolah-olah data hasil penelitian tersebut merupakan populasi. Terdapat dua metode resampling yang saat ini banyak digunakan yaitu
dengan
menggunakan subset dari data yang tersedia ( jackknifing ) atau menggambar secara acak dengan penggantian dari satu set titik data ( bootstrapping ). Bootstrap dan jackknife umumnya bertujuan untuk menaksir salah baku dan selang kepercayaan parameter populasi, seperti
mean, median, koefisien korelasi dan regresi, dengan tidak
memperhatikan asumsi distribusi. Metode bootstrap adalah metode resampling N data baru dari sampel asal berukuran n (N
1.2. Permasalahan
Permasalahan yang akan dibahas dalam makalah ini yaitu:
-
Apa yang dimaksud dengan metode resampling bootstrap dan jackknife?
-
Bagaimana prosedur metode resampling bootstrap dan jackknife?
-
Bagaimana contoh penerapan metode bootstrap dan jackknife?
1.3. Tujuan
Tujuan pembuatan makalah ini yaitu:
-
Untuk mengetahui pengertian metode resampling bootstrap dan jackknife
-
Untuk mengetahui prosedur metode resampling bootstrap dan jackknife
-
Untuk mengetahui cara menerapkan metode bootstrap dan jackknife
BAB II TINJAUAN PUSTAKA
2.1. Metode Bootstrap
Metode Bootstrap pertama kali diperkenalkan oleh Efron dan Tibshirani pada tahun 1979. Bootstrap berasal dari kata “pull oneself up one‟s bootstrap” yang berarti berpijak di atas kaki sendiri. Hal ini mengandung pengertian bahwa data yang berukuran kecil, data yang menyimpang dari asumsi-asumsi distribusi tertentu dan data yang tidak memiliki asumsi mengenai asumsi distribusi populasi (Efron dan Tibshirani, 1993). Metode bootstrap didasarkan pada prosedur resampling yaitu penarikan contoh acak secara berulang yang dilakukan dengan pengembalian. Metode ini memungkinkan peneliti untuk melakukan inferensi tanpa membuat anggapan atau asumsi mengenai distribusi populasi yang kuat dan tidak membutuhkan rumus analisitis untuk menduga distribusi sampel (Tinungki, 2000). Langkah-langkah dalam prosedur Bootstrap yaitu (): 1. Sampel asal, dari eksperimen atau simulasi, berukuran n. 2. Resample berukuran N (N150 (Efron dan Tibshirani, 1993). 3. Perhitungan penaksir setiap hasil resample, didapatkan : b,1, b,2 ,..., b,B ; ˆ
umumnya b,i ˆ
4. Perhitungan penaksir bootstrap
-
Rata-rata (Mean) bootstrap xb ˆ
xb
-
1 B
B
xb,i i 1
Ragam bootstrap s 2 ˆ
2 (b )
s
1
B
( xb,i xb ) B 1 i 1
2
ˆ
ˆ
bentuk
-
Selang kepercayaan Dalam resampling biasanya digunakan selang kepercayaan nonparametric yang disebut selang persentil yaitu xbr ;lower xbr ;upper
di mana: xbr = penduga rata-rata bootstrap terurut
Lower = (α/2)B
Upper = (1-α/2)B
2.2. Metode Jackknife
Metode Jackknife pertama kalai diperkenalkan oleh Quenouille pada tahun 1949 dengan tujuan untuk mengurangi bias. Metode ini kemudian dikembangkan oleh Tukey pada tahuj 1958 sehingga terbentuk metode umum untuk memperkirakan ragam sebuah parameter. Tidak seperti metode Bootstrap yang mana banyaknya resample bisa mencapai ribuan, pada metode Jackknife resample dilakukan sebanyak n kali atau sama dengan ukuran contoh. Cara kerja metode Jackknife adalah sebagai berikut: 1. Sampel asal, berukuran n. 2. Resample berukuran n-1 dengan mengeluarkan pengamatan ke i, i = 1, 2, ... , n sehingga didapatkan Resample ke i (i = 1, 2, . . . , n). 5. Perhitungan penaksir setiap hasil resample, didapatkan : j ,1, j ,2 ,..., j ,n ; ˆ
umumnya j ,i ˆ
6. Perhitungan penaksir bootstrap
-
Rata-rata (Mean) jackknife x j ˆ
x j
1 n
n
x j ,i i 1
ˆ
ˆ
bentuk
-
Ragam bootstrap s 2 ˆ
2 (b )
s
n
n
( xb,i xb ) n 1
2
i 1
-
Selang kepercayaan Dalam resampling biasanya digunakan selang kepercayaan nonparametric yang disebut selang persentil yaitu x jr ;lower x jr ;upper
di mana: x jr
= penduga rata-rata bootstrap terurut
Lower
= (α/2)n
Upper
= (1-α/2)n
BAB III CONTOH SOAL DAN PEMBAHASAN
Berikut ini adalah data yang menunjukkan skor hasil efektivitas mahasiswa prodi Statistika angkatan 2009 kelas A dalam mengikuti mata kuliah Statistika Non Parametrik pada pagi hari dan siang hari : Responden 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
Pagi 16 17 14 14 16 16 16 16 17 18 16 15 16 10 15 17 16 12 16 16 15 12 16 16 12 14 14 14 18 18 17
siang 12 13 12 10 10 10 16 10 10 15 15 13 12 12 10 14 13 7 10 12 11 12 10 12 5 14 14 10 9 9 13
Dari data tersebut, dapat dicari selisih antara skor efektivitas pada siang hari dengan pagi hari sebagai berikut: Responden 1
Pagi 16
Siang 12
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
17 14 14 16 16 16 16 17 18 16 15 16 10 15 17 16 12 16 16 15 12 16 16 12 14 14 14 18 18 17
13 12 10 10 10 16 10 10 15 15 13 12 12 10 14 13 7 10 12 11 12 10 12 5 14 14 10 9 9 13
d
-4 -4 -2 -4 -6 -6 0 -6 -7 -3 -1 -2 -4 2 -5 -3 -3 -5 -6 -4 -4 0 -6 -4 -7 0 0 -4 -9 -9 -4
Dengan menggunakan metode Bootstarp dan Jackknife akan dilakukan resampling untuk menduga apakah efektivitas mengikuti kuliah Statistika NonParamterik pada pagi dan siang hari adalah berbeda.
3.1 Metode Bootstrap
Dengan menggunakan metode bootstrap akan dilakukan resampling dengan pengembalian dengan nb= 16 dan B=500 . Proses Penerapan Metode Bootstrap terhadap d dengan bantuan Ms. Excel 2007, langkahlangkahnya adalah sebagai berikut : 1. Input data d pada worksheet seperti gambar
2. Blok cells yang memuat original data sample d tersebut lalu definisikan „Name‟ sebagai „Samples‟.
3. Lakukan pengacakan data sebanyak n b= 16 . Pada cell A10 isikan rumus: =INDEX(Samples;ROWS(Samples)*RAND()+1;COLUMNS(Samples)*RAND()+1)
Lalu hold and drag sampai cell P10, sehingga diperoleh hasil seperti pada gambar berikut:
4. Blok range A10:P10, lalu hold drag hingga baris ke 509 supaya diperoleh pengulangan bootstrap sebanyak 500 5. Cari
rata-rata
dari
masing-masing
pengulangan
dengan
=AVERAGE(A10:P10) di cell R10 untuk perulangan ke 1,
mengisikan
rumus:
lalu hold and drag
sampai R509 untuk pengulangan ke 500. 6. Untuk mencari d.., isikan rumus: =AVERAGE(R10:R509) pada cell tertentu misal S10. Sedangkan untuk mencari Sd.., isikan rumus =STDEV(R10:R509) pada cell S10.
7. Apabila kita tertarik
untuk mencari interval konfidensi dari d.., maka lakukan
langkah berikut untuk sembarang cell.
8. Apabila kita ingin membuat histogram dan fungsi kepekatan dari d :
Pada kolom X : Isikan angka bin seperti pada cell X17 sampai X37
Pada kolom Y : isikan formula =FREQUENCY(R10:R509;X17:X37) Saat kursor masih berada di cell Y17, blok cell Y17:Y37, lalu tekan F2, lalu tekan Ctrl+Shift+Enter
Pada cell Y38 : isikan formula
=SUM(Y17:Y37)
Pada kolom Z : isikan formula
=SUM(Y17/Y$38)
lalu hold and drag
sampai Z37 Data yang digunakan untuk membuat Chart adalah dari „bin‟ sebagai sumbu -X dan „Probability‟ sebagai sumbu-Y.
Untuk menampilkan histogram pilih chart dengan model Column (pada trendline pilih Two Average Moving Average ). Sedangkan untuk menampilkan gambar fungsi
kepekatan, pilih Chart dengan Scatter With Smooth Lines.
HASIL: Hipotesis: H0 : µsiang - µ pagi = 0
atau H1 : µd = 0
H0 : µsiang - µ pagi ≠ 0
H1 : µd ≠ 0
Dalam menerapkan metode bootstrap ini, resampling dilakukan terhadap d . dengan bantuan software MS. Excel 2007 diperoleh hasil sebagai berikut : ̅ = -2,93538 ̅ = 0,03158
Zhit =
̅ ̅
Untuk nilai Z = memiliki p-value = 0,0000 Karena p-value < α, maka H 0 ditolak
Jadi, dapat disimpulkan bahwa efektivitas mengikuti kuliah Statistika Non Parametrik pada siang hari dan pagi hari adalah berbeda dengan keyakinan 90%.
Lebih spesifik, terlihat bahwa mengikuti kuliah Statistika Non Parametrik pada pagi hari lebih efektif/baik daripada kuliah pada siang hari.
Selain itu dengan metode bootstrap ini, dapat pula dicari interval konfidensi untuk rata-rata d , yaitu P(-4,25 ≤ µd ≤ -1,75) = 1-(2*0,05) P(-4,25 ≤ µd ≤ -1,75) = 0,90 Karena µd = 0 tidak masuk dalam selang interval tersebut, maka H0 ditolak. Sehingga efektivitas mengikuti kuliah Statistika NonParametrik pada siang hari dan pagi hari adalah berbeda.
Gambar 3.1. Histogram dan fungsi kepekatan Nilai tengah d berdasarkan 500 pengulangan bootstrap
3.2 Metode Jackknife
Dengan menggunakan metode jackknife akan dilakukan resampling dengan pengambilan dan pengembalian sebanyak n (n=31) Proses Penerapan Metode jackknife terhadap d dengan bantuan Ms. Excel 2007, langkahlangkahnya adalah sebagai berikut :
1. Input data d pada worksheet seperti gambar:
2. Resample dengan mengeluarkan elemen sampel ke i, i = 1, 2, ... , n. Didapatkan Resample ke i (i = 1, 2, . . . , n).
3. Perhitungan penaksir setiap hasil resample, didapatkan : nilai rata-rata dan nilai standar deviasi (akan didapatkan 31 nilai rata-rata dan nilai standar deviasi) 4. Kemudian hitung nilai rata-rata dari ke-31 nilai rata-rata yang telah diperoleh dan hitung nilai rata-rata dari ke-31 nilai standar deviasi yang telah diperoleh.
5. Apabila kita tertarik
untuk mencari interval konfidensi dari d.., maka lakukan
langkah berikut untuk sembarang cell.
6. Apabila kita ingin membuat histogram dan fungsi kepekatan dari d :
Pada kolom F : Isikan angka bin seperti pada cell F37 sampai F58
Pada kolom G : isikan formula =FREQUENCY(D34:AH34;F37:F58) Saat kursor masih berada di cell G37, blok cell G37:G58, lalu tekan F2, lalu tekan Ctrl+Shift+Enter
Pada cell Y38 : isikan formula
Pada kolom H : isikan formula
=SUM(G37:G58)
=SUM(G37/G$59)
lalu hold and drag
sampai H58 Data yang digunakan untuk membuat Chart adalah dari „bin‟ sebagai sumbu -X dan „Probability‟ sebagai sumbu-Y.
Untuk menampilkan histogram pilih chart dengan model Column (pada trendline pilih Two Average Moving Average ). Sedangkan untuk menampilkan gambar fungsi
kepekatan, pilih Chart dengan Scatter With Smooth Lines. HASIL: Hipotesis: H0 : µsiang - µ pagi = 0
atau
H0 : µsiang - µ pagi ≠ 0
H1 : µd = 0 H1 : µd ≠ 0
Dalam menerapkan metode jackknife ini, resampling dilakukan terhadap d . dengan bantuan software MS. Excel 2007 diperoleh hasil sebagai berikut : ̅ = -3.87097
= 0.689 ̅
Zhit =
̅ ̅
Untuk nilai Z = memiliki p-value = 0.000 Karena p-value <α, maka H 0 ditolak.
Jadi, dapat disimpulkan bahwa efektivitas mengikuti kuliah Statistika Non Parametrik pada siang hari dan pagi hari adalah berbeda dengan keyakinan 90%.
Lebih spesifik, terlihat bahwa mengikuti kuliah Statistika Non Parametrik pada pagi hari lebih efektif/baik daripada kuliah pada siang hari. Selain itu dengan metode jackknife ini, dapat pula dicari interval konfidensi untuk rata-rata d , yaitu P(-4,06667 ≤ µ d ≤ -3,76667) = 1-(2*0,05) P(-4,06667 ≤ µ d ≤ -3,76667) = 0,90 Karena µd = 0 tidak masuk dalam selang interval tersebut, maka H0 ditolak. Sehingga efektivitas mengikuti kuliah Statistika NonParametrik pada siang hari dan pagi hari adalah berbeda.
Gambar 3.2. Histogram dan fungsi kepekatan Nilai tengah d berdasarkan metode jackknife
BAB IV PENUTUP
4.1. Kesimpulan
Berdasarkan hasil analisis dan uraian yang telah dijabarkan, dapat disimpulkan beberapa hal sebagai berikut:
-
Resampling adalah metode pengambilan contoh acak dari data hasil pengamatan
-
Metode resampling yang banyak digunakan adalah Bootstrap dan Jackknife
-
Metode Bootstrap adalah metode pengambilan contoh acak N dari contoh berukuran n dengan pengembalian sebanyak B kali Metode Jackknife adalah metode pengambilan contoh acak n-1 dari contoh
-
berukuran n dengan pengembalian sebanyak n kali
-
Untuk contoh soal yang ada, kedua metode resampling menghasilkan kesimpulan yang sama yaitu efektivitas mengikuti kuliah Statistika Non Parametrik pada siang hari dan pagi hari adalah berbeda dengan keyakinan 90%.
4.2. Saran
Saran yang dapat disampaikan yaitu apabila memungkinkan, maka sebaiknya peneliti menggunakan ukuran contoh yang besar. Namun, jika tidak maka disarankan untuk menggunakan metode resampling.
DAFTAR PUSTAKA
Anonymous. 2012. Resume Bootstrap dan Jackknife. http://oc.its.ac.id/ambilfile.php?idp=1150 diakses pada tanggal 20 Oktober 2012 Sahinler, S. dan Topuz, D. 2007. Bootstrap and Jackknife Resampling Algorithms for Estimation of Regression Parameter. Journal of Quantitative Method (2): 188-199 Tinungki, G. M. 2007. Skripsi: Perbandingan Ragam Penduga Regresi Linier Sederhana untuk Penarikan Contoh Dua Tahap dengan Metode Bootstrap. Metode Jackknife dan Metode Klasik. IPB : Bogor