TUGAS INDIVIDU METODE REGRESI
Analisis Data Pengaruh Usia Mahasiswa Saat Masuk S2 dan Fakultas Asal Mahsiswa Terhadap Nilai Tes Potensi Akademik (TPA) Mahasiswa Program Magister ITS Tahun 2006 Dengan Menggunakan Analisis Regresi Dummy
Oleh: Fausania Hibatullah
1313 030 018
Asisten Dosen: Ardhian Bayu Firdauz
Program Studi Diploma III Jurusan Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Teknologi Sepuluh Nopember Surabaya 2014
BAB I ANALISIS DAN PEMBAHASAN
1.1
Interpretasi Model Regresi Linier Berganda dengan Variabel Prediktor Dummy Pada penelitian ini, model regresi linier berganda bertujuan untuk
meramalkan nilai TPA (Tes Potensi Akademik) dari mahasiswa program Magister ITS pada tahun 2006 berdasarkan faktor usia mahasiswa pada saat masuk S2 dan fakultas mahasiswa berasal. Terdapat 3 kategori fakultas yaitu FMIPA, FTK dan FTIf ITS. Berikut adalah koding yang dilakukan dalam analisis regresi linier berganda dengan variabel dummy pada data fakultas mahasiswa berasal. Tabel 1.1 Koding Pada Data Fakultas
Fakultas
Dummy1 (d1 ) 1 0 0
FMIPA FTK FTIf
1.1.1
Dummy2 (d 2 ) 0 1 0
Model Regresi Berikut hasil persamaan model regresi linier berganda dengan variabel
prediktor dummy dengan menggunakan Software Minitab. Tabel 1.2 Model Regresi
Persamaan Regresi R-Sq
y 621 3.37x- 7.9 d1 - 54.1d 2 30.5 %
Berdasarkan Tabel 1.2 dapat diketahui bahwa persamaan model regresi mampu menjelaskan sebesar 30.5% variabilitas yang dimiliki, sedangkan sisanya sebesar 69.5% dijelaskan oleh variabel lain yang tidak masuk dalam model. A. Persamaan Regresi untuk Fakultas Fakultas Matematika dan Ilmu Pengetahuan Alam (FMIPA) y 621 3.37x- 7.9 d1 - 54.1d 2
Pada Fakultas Matematika dan Ilmu Pengetahuan Alam, nilai d1 = 1 dan d2 = 0 y1 621 3.37x- 7.9 (1) - 54.1(0)
y1 613.1 - 3.37x
Dari persamaan model diatas, dijelaskan bahwa nilai Tes Potensi Akademik (TPA) dari mahasiswa program Magister FMIPA ITS tahun 2006 lebih rendah
1
sebesar 7.9 poin dibandingkan dengan nilai TOEFL dari mahasiswa program Magister FTIf ITS. B. Persamaan Regresi untuk Fakultas Teknologi Kelautan (FTK) y 621 3.37x- 7.9 d1 - 54.1d 2
Pada Fakultas Teknologi Kelautan, nilai d1 = 0 dan d2 = 1 y2 621 3.37x- 7.9 (0) - 54.1(1) y2 566.9 3.37x
Dari persamaan model diatas, dijelaskan bahwa nilai Tes Potensi Akademik (TPA) dari mahasiswa program Magister FTK ITS tahun 2006 lebih rendah sebesar 54.1 poin dibandingkan dengan nilai TOEFL dari mahasiswa program Magister FTIf ITS. C. Persamaan regresi untuk Fakultas Teknologi Informasi (FTIf) y 621 3.37x- 7.9 d1 - 54.1d 2
Pada Fakultas Matematika dan Ilmu Pengetahuan Alam, nilai d1 = 1 dan d2 = 0 y3 621 3.37x- 7.9 (0) - 54.1(0) y3 621- 3.37x
Dari persamaan model diatas, dijelaskan bahwa nilai Tes Potensi Akademik (TPA) dari mahasiswa program Magister FTIf ITS tahun 2006 lebih tinggi dibandingkan dengan nilai TOEFL dari mahasiswa program Magister FMIPA dan FTK ITS. 1.1.2 Scatterplot Scatterplot digunakan untuk mengetahui hubungan kelinieran antara variabel respon yaitu nilai Tes Potensi Akademik (TPA) mahasiswa program Magister dari FMIPA, FTK dan FTIf ITS tahun 2006 dengan variabel prediktor usia mahasiswa tersebut saat masuk S2.
2
Scatterplot of y duga fmipa, y duga ftk, y duga ftif vs Usia saat ma 550
Variable y duga fmipa y duga ftk y duga ftif
525
Y-Data
500 475 450 425 400
20
25
30
35 40 45 Usia saat masuk s2
50
55
Gambar 1.1 Scatterplot
Berdasarkan hasil persamaan model regresi dan Gambar 1.1, dapat diketahui bahwa nilai Tes Potensi Akademik (TPA) mahasiswa program Magister dari FTIf ITS tahun 2006 lebih tinggi sebesar 7.9 poin dibandingkan dengan mahasiswa program Magister dari FMIPA ITS dan lebih tinggi sebesar 54.1 poin dibandingkan dengan mahasiswa program Magister dari FTK ITS.
1.2
Analisis Regresi Linier Berganda dengan Variabel Prediktor Dummy Pada analisis Regresi Linier Berganda dengan variabel prediktor dummy
akan dilakukan uji serentak serta uji parsial pada data nilai Tes Potensi Akademik (TPA) mahasiswa program Magister ITS tahun 2006 berdasarkan faktor usia mahasiswa saat masuk S2 dan fakultas mahasiswa berasal. 1.2.1 Uji Serentak Uji serentak adalah pengujian untuk melihat signifikansi parameter secara bersama. Hipotesis yang digunakan sebagai berikut.
H 0 : i 0 dimana i = 1, 2, 3 (semua variabel tidak berpengaruh signifikan terhadap nilai TPA mahasiswa program Magister ITS)
H1 : Minimal ada satu i 0 dimana i = 1, 2, 3 (Minimal ada satu variabel yang berpengaruh signifikan terhadap nilai TPA mahasiswa program Magister ITS) Taraf signifikan
: 0.05
Daerah penolakan
: Tolak H0 jika F F ( db1 ,db2 )
3
Tabel 1.3 Hasil Uji Serentak
Sumber Regresi Galat Total
Derajat Bebas 3 26 29
Jumlah Kuadrat 34248 78039 112287
Kuadrat Tengah 11416 3001
F-hitung
F0.05(3,26)
P-value
3.80
2.98
0,022
Berdasarkan Tabel 1.3 dapat diketahui bahwa nilai F hitung sebesar 3.80. Pada taraf 0.05 , didapatkan nilai F tabel (F0.05(3,26)) sebesar 2.98 sehingga F (3.80) > F0.05(3,26) (2.98) dan P-value (0.022) < α (0.05) maka keputusan yang diambil adalah H 0 ditolak dan didapatkan kesimpulan bahwa minimal ada satu variabel yang berpengaruh signifikan terhadap nilai Tes Potensi Akademik (TPA) dari mahasiswa program Magister ITS tahun 2006. 1.2.2
Uji Parsial Uji parsial digunakan untuk mengetahui variabel/parameter mana dari
memiliki pengaruh signifikan terhadap nilai Tes Potensi Akademik (TPA) mahasiswa program Magister ITS tahun 2006. Uji ini dilakukan pada masingmasing variabel prediktor dengan variabel respon sehingga menggunakan beberapa analisis. A.
Uji Parsial Pengaruh Usia Mahasiswa Saat Masuk S2 Terhadap Nilai TPA Mahasiswa Program Magister ITS
Hipotesis yang digunakan adalah sebagai berikut.
H 0 : 1 0 (Usia saat masuk S2 tidak berpengaruh signifikan terhadap nilai TPA mahasiswa program Magister ITS)
H1 : 1 0 (Usia saat masuk S2 berpengaruh signifikan terhadap nilai TPA mahasiswa program Magister ITS) Taraf signifikan
: 0.05
Daerah penolakan
: Tolak H 0 jika | t | t / 2( n( p1))
Statistik uji
: Tabel 1.4 Uji Parsial X terhadap Y
Prediktor Usia saat masuk S2
t-hitung -2.15
t0.025(26) 2.056
P-value 0.041
Berdasarkan Tabel 1.4 dapat diketahui bahwa nilai |t-hitung| sebesar 2.15. Pada taraf 0.05 , didapatkan nilai t tabel (t0.025(26)) sebesar 2.056 sehingga |t| (2.15) > t0.025(26) (2.056) dan P-value (0.041) < α (0.05) maka keputusan yang 4
diambil adalah H 0 ditolak dan didapatkan kesimpulan bahwa usia mahasiswa saat masuk S2 berpengaruh signifikan terhadap nilai Tes Potensi Akademik (TPA) mahasiswa program Magister ITS B.
Uji Parsial Pengaruh Variabel Dummy Terhadap Nilai TPA Mahasiswa Program Magister ITS
Hipotesis yang digunakan adalah sebagai berikut.
H 0 : 2 3 0 (Asal fakultas dari FMIPA dan FTK ITS tidak berpengaruh signifikan terhadap nilai TPA mahasiswa program Magister ITS)
H1 : Minimal ada satu i 0 dimana i = 2,3 (Minimal ada satu asal fakultas yang berpengaruh signifikan terhadap nilai TPA mahasiswa program Magister ITS) Taraf signifikan
: 0.05
Daerah penolakan
: Tolak H 0 jika F F ( db1 ,db2 )
Statistik uji
: F
JK (b2 b3 b0 b1 ) /(k 1) KTG
(34248 17330) / 2 2.819 3001
Berdasarkan hasil perhitungan diatas dapat diketahui bahwa nilai F-hitung sebesar 2.819. Pada taraf 0.05 , didapatkan nilai F tabel (F0.05(3,26)) sebesar 2.98 sehingga F (2.819) < F0.05(3,26) (2.98) maka keputusan yang diambil adalah H0 gagal ditolak dan didapatkan kesimpulan bahwa asal fakultas dari FMIPA dan FTK ITS tidak berpengaruh signifikan terhadap nilai TPA mahasiswa program Magister ITS. C.
Uji Parsial Ada Tidaknya Perbedaan Antara Mahasiswa Dengan Fakultas Asal FMIPA dan FTIf ITS
Hipotesis yang digunakan adalah sebagai berikut.
H 0 : 2 0 (Mahasiswa yang berasal dari FMIPA ITS tidak memiliki perbedaan yang signifikan dengan mahasiswa yang berasal dari FTIf ITS)
H1 : 2 0 (Mahasiswa yang berasal dari FMIPA ITS memiliki perbedaan yang signifikan dengan mahasiswa yang berasal dari FTIf ITS) Taraf signifikan
: 0.05
5
Daerah penolakan
: Tolak H 0 jika | t | t / 2( n( p1))
Statistik uji
: Tabel 1.5 Uji Parsial Kategori 1 dan 3
Prediktor FMIPA ITS
t-hitung -0.32
P-value 0,752
Berdasarkan Tabel 1.5 dapat diketahui bahwa nilai |t-hitung| sebesar 0.32. Pada taraf 0.05 , didapatkan nilai t tabel (t0.025(26)) sebesar 2.056 sehingga |t| (0.32) < t0.025(26) (2.056) dan P-value (0.752) > α (0.05) maka keputusan yang diambil adalah H 0 gagal ditolak dan didapatkan kesimpulan bahwa mahasiswa yang berasal dari FMIPA ITS tidak memiliki perbedaan yang signifikan dengan mahasiswa yang berasal dari FTIf ITS. D.
Uji Parsial Ada Tidaknya Perbedaan Antara Mahasiswa Dengan Fakultas Asal FTK dan FTIf ITS
Hipotesis yang digunakan adalah sebagai berikut.
H 0 : 3 0 (Mahasiswa yang berasal dari FTK ITS tidak memiliki perbedaan yang signifikan dengan mahasiswa yang berasal dari FTIf ITS)
H1 : 3 0 (Mahasiswa yang berasal dari FTK ITS memiliki perbedaan yang signifikan dengan mahasiswa yang berasal dari FTIf ITS) Taraf signifikan
: 0.05
Daerah penolakan
: Tolak H 0 jika | t | t / 2( n( p1))
Statistik uji
: Tabel 1.6 Uji Parsial Kategori 2 dan 3
Prediktor FTK ITS
t-hitung -2.19
P-value 0,038
Berdasarkan Tabel 1.6 dapat diketahui bahwa nilai |t-hitung| sebesar 2.19. Pada taraf 0.05 , didapatkan nilai t tabel (t0.025(26)) sebesar 2.056 sehingga |t| (2.19) > t0.025(26) (2.056) dan P-value (0.038) < α (0.05) maka keputusan yang diambil adalah H 0 ditolak dan didapatkan kesimpulan bahwa mahasiswa yang berasal dari FTK ITS memiliki perbedaan yang signifikan dengan mahasiswa yang berasal dari FTIf ITS. E.
Uji Parsial Ada Tidaknya Perbedaan Antara Mahasiswa Dengan Fakultas Asal FTI dan FTSP ITS
Hipotesis yang digunakan adalah sebagai berikut.
6
H 0 : 2 3 (Mahasiswa yang berasal dari FMIPA dan FTK ITS memberikan respon yang sama terhadap nilai TPA mahasiswa program Magister di ITS)
H1 : 2 3 (Mahasiswa yang berasal dari FMIPA dan FTK ITS memberikan respon yang berbeda terhadap nilai TPA mahasiswa program Magister di ITS) Taraf signifikan
: 0.05
Daerah penolakan
: Tolak H 0 jika | t | t / 2( n( p1))
Statistik uji :
t
a1 a 2 ( Se(a1 )) ( Se(a 2 )) 2 cov( a1 a 2 ) 2
2
7.9 54.1
614.335 612.094 2( 313.075 )
1.886
Berdasarkan hasil perhitungan diatas dapat diketahui bahwa nilai |t-hitung| sebesar 1.886. Pada taraf 0.05 , didapatkan nilai t tabel (t0.025(26)) sebesar 2.056 sehingga |t| (1.886) < t0.025(26) (2.056) maka keputusan yang diambil adalah H 0 gagal ditolak dan didapatkan kesimpulan bahwa mahasiswa yang berasal dari FMIPA dan FTK ITS memberikan respon yang sama terhadap nilai TPA mahasiswa program Magister di ITS.
1.3
Pemeriksaan Asumsi Residual IIDN Setelah melakukan analisis Regresi Linier Berganda dengan variabel
prediktor dummy, selanjutnya akan dilakukan pemeriksaan asumsi residual IIDN yaitu residual independen, residual identik, dan residual berdistribusi normal. Residual Plots for nilai TPA Normal Probability Plot
Versus Fits
99
100
Residual
Percent
90 50 10 1 -200
-100
0 Residual
0
-100
100
400
440 480 Fitted Value
Histogram
Versus Order
7.5
Residual
Frequency
560
100
10.0
5.0 2.5 0.0
520
-150
-100
-50 0 Residual
50
100
0
-100
2
4
6
8 10 12 14 16 18 20 22 24 26 28 30
Observation Order
Gambar 1.2 Pemeriksaan Asumsi Residual IIDN
7
Berdasarkan Gambar 1.2 dapat diketahui bahwa grafik versus fits dari data nilai TPA mahasiswa program Magister ITS tahun 2006 tidak berpola atau tidak membentuk suatu pola tertentu sehingga secara visual nilai TPA mahasiswa program Magister ITS tahun 2006 dapat dikatakan memenuhi asumsi independen. Grafik versus order dari data nilai TPA mahasiswa program Magister ITS tahun 2006 tidak berpola atau tidak membentuk suatu pola tertentu sehingga secara visual nilai TPA mahasiswa program Magister ITS tahun 2006 dapat dikatakan memenuhi asumsi identik. Pada grafik normal probability plot menunjukkan nilai probabilitas masing-masing residual tidak menyebar mengikuti garis lurus yang artinya data nilai TPA mahasiswa program Magister ITS tahun 2006 tidak berdistribusi normal.
8
BAB II KESIMPULAN DAN SARAN 2.1
Kesimpulan Berdasarkan analisis dan pembahasan pada Bab I dapat diperoleh
kesimpulan sebagai berikut. 1.
Model regresi linier menunjukkan bahwa nilai nilai Tes Potensi Akademik (TPA) mahasiswa program Magister dari FTIf ITS tahun 2006 lebih tinggi sebesar 7.9 poin dibandingkan dengan mahasiswa program Magister dari FMIPA ITS dan lebih tinggi sebesar 54.1 poin dibandingkan dengan mahasiswa program Magister dari FTK ITS.
2.
Uji serentak pada analisis regresi linier berganda dengan variabel prediktor dummy menunjukkan bahwa minimal ada satu variabel yang berpengaruh signifikan terhadap nilai TPA mahasiswa program Magister ITS, sehingga dilanjutkan ke uji parsial. Uji parsial menunjukkan bahwa usia mahasiswa saat masuk S2 berpengaruh signifikan terhadap nilai TPA mahasiswa program Magister ITS, asal fakultas dari FMIPA dan FTK ITS tidak berpengaruh signifikan terhadap nilai TPA mahasiswa program Magister ITS, mahasiswa yang berasal dari FMIPA ITS tidak memiliki perbedaan yang signifikan dengan mahasiswa yang berasal dari FTIf ITS, mahasiswa yang berasal dari FTK ITS memiliki perbedaan yang signifikan dengan mahasiswa yang berasal dari FTIf ITS, mahasiswa yang berasal dari FMIPA dan FTK ITS memberikan respon yang sama terhadap nilai TPA mahasiswa program Magister di ITS.
3.
Pemeriksaan asumsi residual IIDN menunjukkan bahwa data nilai TPA mahasiswa program Magister ITS tahun 2006 memenuhi asumsi residual identik dan independen namun tidak berdistribusi normal.
2.2
Saran Diharapkan dengan adanya percobaan ini, mahasiswa lebih teliti dan
cermat pada mengolah data yang ada. Selain itu, saran untuk percobaan selanjutnya adalah harus lebih disiplin waktu dan tidak menunda-nunda pekerjaan.
9
LAMPIRAN Lampiran 1 Nilai TPA Mahasiswa Program Magister ITS Tahun 2006 Berdasarkan Usia Saat Masuk S2 dan Fakultas. No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Nilai TPA 540 560 500 480 480 560 575 520 440 420 440 400 480 300 500 560 460 420 520 540 500 520 540 560 575 440 520 560 520 500
Usia saat masuk s2 29 28 32 45 39 24 31 23 27 34 26 54 34 31 23 29 32 30 28 23 26 30 31 27 23 29 32 28 35 27
Fakultas FMIPA FMIPA FMIPA FMIPA FMIPA FMIPA FMIPA FMIPA FMIPA FMIPA FTK FTK FTK FTK FTK FTK FTK FTK FTK FTK FTIf FTIf FTIf FTIf FTIf FTIf FTIf FTIf FTIf FTIf
D1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Keterangan : D1 = Fakultas Matematika dan Ilmu Pengetahuan Alam ITS (FMIPA ITS) D2 = Fakultas Teknologi Kelautan ITS (FTK ITS)
D2 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0
Lampiran 2 Output Model Regresi The regression equation is nilai TPA = 621 - 3.37 Usia saat masuk s2 - 7.9 FMIPA - 54.1 FTK S = 54.7858
R-Sq = 30.5%
R-Sq(adj) = 22.5%
Lampiran 3 Output Regresi Linier Berganda Uji Serentak dan Uji Parsial Analysis of Variance Source Regression Residual Error Total
DF 3 26 29
SS 34248 78039 112287
Source Usia saat masuk s2 FMIPA FTK
DF 1 1 1
MS 11416 3001
F 3.80
P 0.022
Seq SS 17330 2578 14340
Lampiran 4 Predictor Constant Usia saat masuk s2 FMIPA FTK
Coef 620.62 -3.372 -7.91 -54.08
SE Coef 48.36 1.568 24.79 24.74
T 12.83 -2.15 -0.32 -2.19
Lampiran 4 Varians β Data Display Matrix M5 2338.38 -70.77 -130.24 -144.40
-70.7737 2.4574 -5.8978 -5.4063
-130.243 -5.898 614.355 313.075
-144.398 -5.406 313.075 612.094
P 0.000 0.041 0.752 0.038
TUGAS INDIVIDU METODE REGRESI
Pengujian Asumsi Residual IIDN, Pendeteksian Multikonlinearitas dan Pemilihan Model Terbaik pada Data Faktor-Faktor yang Diduga Mempengaruhi Jumlah Kasus Kanker Serviks di Tiap Kabupaten/Kota di Provinsi Jawa Timur Tahun 2010
Oleh: Fausania Hibatullah
1313 030 018
Asisten Dosen: Ardhian Bayu Firdauz
Program Studi Diploma III Jurusan Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Teknologi Sepuluh Nopember Surabaya 2014
BAB I ANALISIS DAN PEMBAHASAN
1.1
Statistika Deskriptif Statsistika deskriptif merupakan langkah analisis yang harus dilakukan
pertama kali untuk mengetahui dan memberikan keterangan tentang karakteristik data dari hasil pengamatan yang telah dilakukan dalam praktikum. Perhitungan statistika deskriptif tersebut diolah menggunakan software Minitab. Berikut merupakan hasil perhitungan statistika deskriptif data mengenai jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur. Tabel 1.1 Statistika Deskriptif
Variabel Jumlah Kasus Kanker Serviks (Y) Persentase Sarana Kesehatan (X1) Persentase Tenaga Medis (X2) Persentase Penduduk Perempuan yang Umur Kawin Pertama ≤16 Tahun (X3) Persentase Penduduk dan Rumah Tangga (RT) Perempuan (X4) Persentase Daerah yang Berstatus Desa (X5)
Mean 45.6 0.1135 1.438 29.64
StDev 86.6 0.124 1.132 13.19
Minimum Median Maksimum 0 25 479 0.02 0.08 0.73 0.2 1.28 7.52 12.12 25.72 62.7
50.669
1.077
48.49
50.6
53.33
60.83
32.62
0.00
71.43
93.55
Berdasarkan Tabel 1.1, dapat diketahui bahwa nilai rata-rata dari jumlah kasus kanker serviks di tiap kabupaten/kota provinsi Jawa Timur pada tahun 2010 sebesar 45.6 kasus, nilai maksimum sebesar 479 kasus dan nilai minimum sebesar 0 kasus dengan nilai keragaman sebesar 86.6. Setengah dari data jumlah kasus kanker serviks di tiap kabupaten/kota provinsi Jawa Timur mempunyai nilai diatas 25 kasus, sedangkan setengah lainnya mempunyai nilai dibawah 25 kasus. Nilai rata-rata dari persentase sarana kesehatan di tiap kabupaten/kota provinsi Jawa Timur pada tahun 2010 sebesar 0.1135 persen dengan nilai keragaman sebesar 0.124. Nilai rata-rata dari persentase tenaga medis di tiap kabupaten/kota provinsi Jawa Timur pada tahun 2010 sebesar 1.438 persen dengan nilai keragaman sebesar 1.132. Nilai rata-rata dari persentase penduduk perempuan yang umur
1
kawin pertama ≤16 tahun di tiap kabupaten/kota provinsi Jawa Timur pada tahun 2010 sebesar 29.64 persen dengan nilai keragaman sebesar 13.19. Nilai rata-rata dari persentase penduduk dan RT perempuan di tiap kabupaten/kota provinsi Jawa Timur pada tahun 2010 sebesar 50.669 persen dengan nilai keragaman sebesar 1.077. Nilai rata-rata dari persentase daerah yang berstatus desa di tiap kabupaten/kota provinsi Jawa Timur pada tahun 2010 sebesar 60.83 persen dengan nilai keragaman sebesar 32.62, sehingga variabel prediktor persentase daerah yang berstatus desa di tiap kabupaten/kota provinsi Jawa Timur pada tahun 2010 mempunyai nilai rata-rata dan nilai keragaman terbesar.
1.2
Pemeriksaan dan Pengujian Asumsi Residual IIDN Pemeriksaan asumsi residual IIDN (Identik, Independen dan Distribusi
Normal) ini dilakukan untuk mengetahui apakah data dalam percobaan ini memenuhi asumsi residual identik, independen dan berdistribusi normal dengan memeriksa residualnya. Berikut merupakan pemeriksaan secara visual beserta pengujiannya. 1.2.1
Pemeriksaan dan Pengujian Asumsi Residual Identik Berikut merupakan hasil pemeriksaan asumsi residual identik pada data
yang telah diperoleh dengan software minitab. Versus Fits
(response is y) 400
Residual
300
200
100
0
-100 0
50
100
150 Fitted Value
200
250
300
Gambar 1.1 Pemeriksaan Asumsi Residual Identik
Gambar 1.1 jika dilihat secara visual dapat terlihat plot menyebar secara acak dan tidak membentuk suatu pola tertentu sehingga dapat dikatakan bahwa residual data pada jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa
2
Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur telah memenuhi asumsi residual identik. Untuk mengetahui lebih tepat apakah data telah memenuhi asumsi identik, maka dilakukan pengujian Glejser. Hipotesis yang digunakan adalah sebagai berikut. H0 : σ12 = σ22 = σ32 = σ42 = σ52 = σ2 (residual memenuhi asumsi identik) H1 : σ12 = σ22 = σ32 = σ42 = σ52 ≠ σ2 (residual tidak memenuhi asumsi identik) Taraf Signifikan : α = 0,05 Daerah Kritis: Tolak H0 jika Fhitung > Ftabel Statistik Uji: Tabel 1.2 ANOVA Uji Glejser
Source Regression Residual Error Total
DF 5 31 36
SS 27286 109452 136737
MS 5457 3531
F 1.55
Ftabel 2.52
P 0.205
Berdasarkan Tabel 1.2 dapat diketahui bahwa nilai Fhitung (1.55) < Ftabel (2.52) maka keputusan yang didapat adalah gagal tolak H0. Selain itu dapat dilihat dari nilai Pvalue (0.205) > α (0,05) maka dapat diambil keputusan bahwa H0 gagal ditolak dan didapatkan kesimpulan bahwa residual data pada jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur telah memenuhi asumsi residual identik. 1.2.2
Pemeriksaan dan Pengujian Asumsi Residual Independen Berikut merupakan hasil pemeriksaan asumsi residual independen pada
data yang telah diperoleh dengan software minitab.
3
Versus Order (response is y)
400
300
Residual
200
100
0
-100 1
5
10
15 20 25 Observation Order
30
35
Gambar 1.2 Pemeriksaan Asumsi Residual Independen
Gambar 1.2 secara visual dapat dilihat plot-plot telah menyebar secara acak dan tidak membentuk suatu pola tertentu, sehingga dapat disimpulkan bahwa residual data pada jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur telah memenuhi asumsi residual independen, kemudian dilakukan uji independensi residual dengan pemeriksaan pada plot ACF sebagai berikut. Autocorrelation Function for RESI1
(with 5% significance limits for the autocorrelations) 1.0 0.8
Autocorrelation
0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 1
2
3
4
5 Lag
6
7
8
9
Gambar 1.3 Plot ACF
Berdasarkan Gambar 1.3 didapatkan bahwa tidak ada lag yang melewati batas garis merah, maka dapat disimpulkan bahwa residual data pada jumlah
4
kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur tidak memiliki autokorelasi atau independen. Untuk mengetahui lebih tepat apakah data telah memenuhi asumsi independen, maka dilakukan uji Durbin Watson dengan pengujian dua sisi. Hipotesis yang digunakan adalah sebagai berikut. H0: ρ = 0 (residual data memenuhi asumsi independen) H1: ρ ≠ 0 (residual data tidak memenuhi asumsi independen) Taraf signifikan: α = 0,05 Daerah Kritis: Tolak H0 jika d < dU Statistik Uji: Tabel 1.3 Nilai Durbin Watson
Durbin-Watson statistic 2.02816
dU 1,79
Berdasarkan Tabel 1.3 dapat diketahui bahwa nilai Durbin-Watson statisic sebesar 2.02816, sehingga dapat diambil keputusan bahwa H0 gagal ditolak dan didapatkan kesimpulan bahwa residual data pada jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur telah memenuhi asumsi residual independen. 1.2.3
Pemeriksaan dan Pengujian Asumsi Residual Beristribusi Normal Pemeriksaan dan pengujian asumsi residual berdistribusi normal untuk
mengetahui apakah residual data telah berdistribusi normal. Pemeriksaan asumsi residual berdistribusi normal secara visual menggunakan Probability Plot sebagai berikut.
5
Probability Plot of RESI1 Normal
99
Mean StDev N KS P-Value
95 90
5.645934E-14 72.70 37 0.220 <0.010
Percent
80 70 60 50 40 30 20 10 5
1
-200
-100
0
100 RESI1
200
300
400
Gambar 1.4 Pemeriksaan Asumsi Residual Distribusi Normal
Berdasarkan Gambar 1.4 dapat diketahui bahwa plot-plot residual tidak mengikuti dan menyebar secara acak pada garis normal, sehingga secara visual didapatkan kesimpulan bahwa residual data pada jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur tidak memenuhi asumsi residual berdistribusi normal. Untuk lebih jelasnya, pembahasan akan berlanjut pada uji Kolmogorov Smirnov untuk mengetahui apakah residual berdistribusi normal. Hipotesis yang digunakan adalah sebagai berikut. H0 : residual data berdistribusi normal H1 : residual data tidak berdistribusi normal Taraf signifikan : α = 0,05 Daerah Kritis: Tolak H0 jika D>Dtabel Statistik Uji: Tabel 1.4 Uji Kolmogorov-Smirnov
Residual urut Frekuensi Kumulatif Fn -78.2484 1 1 0.027027 -76.0918 1 2 0.054054 -65.1571 1 3 0.081081 -62.914 1 4 0.108108
6
z -1.07626 -1.0466 -0.8962 -0.86534
F0 0.140906 0.147643 0.185074 0.193425
|Fn-F0| 0.113878627 0.093588737 0.103992753 0.085316871
-58.9569 -51.2759 -43.9837 -42.5439 -33.6239 -33.0508 -28.461 -26.3403 -25.3595 -20.6137 -12.1991 -10.5687 -10.2796 -9.16279 -7.987 -5.26453 -1.5751 -0.17234 4.120685 4.982244 6.659471 10.01841 13.43022 14.37834 15.51851 16.711 21.9087 33.5559 36.09519 41.54001 46.13517 59.90816 378.8678
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37
0.135135 0.162162 0.189189 0.216216 0.243243 0.27027 0.297297 0.324324 0.351351 0.378378 0.405405 0.432432 0.459459 0.486486 0.513514 0.540541 0.567568 0.594595 0.621622 0.648649 0.675676 0.702703 0.72973 0.756757 0.783784 0.810811 0.837838 0.864865 0.891892 0.918919 0.945946 0.972973 1
-0.81092 -0.70527 -0.60497 -0.58517 -0.46248 -0.45459 -0.39146 -0.36229 -0.34881 -0.28353 -0.16779 -0.14537 -0.14139 -0.12603 -0.10986 -0.07241 -0.02166 -0.00237 0.056678 0.068528 0.091597 0.137797 0.184725 0.197765 0.213448 0.22985 0.301341 0.461541 0.496468 0.571358 0.634562 0.824001 5.2111
0.208707 0.240321 0.2726 0.279218 0.32187 0.324701 0.347727 0.358566 0.363618 0.388386 0.433374 0.442211 0.443781 0.449855 0.456262 0.471138 0.491358 0.499054 0.522599 0.527317 0.536491 0.5548 0.573277 0.578386 0.584511 0.590896 0.618423 0.677795 0.690218 0.716121 0.737143 0.79503 1
0.073571553 0.078159256 0.08341054 0.063001976 0.078626479 0.054430627 0.050430084 0.034241512 0.012266396 0.01000721 0.027968514 0.009778562 0.01567828 0.036631851 0.057251856 0.069402931 0.076209789 0.09554026 0.099022648 0.121331402 0.139184783 0.147903064 0.156452232 0.178371068 0.199272619 0.219915085 0.219415071 0.187070016 0.201674144 0.202797436 0.208803127 0.17794251 0
D = Sup |Fn(X)-F0(X)| = 0.219915085 = 0.22 Berdasarkan Tabel 1.4 dapat diketahui bahwa nilai D sebesar 0.22 dengan P-value kurang dari 0.01. Nilai D (0.22) > Dtabel (0.196) dan Pvalue (<0,010) < α (0,05) maka dapat diambil keputusan H0 ditolak, sehingga didapatkan kesimpulan bahwa residual data pada jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin 7
pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur tidak memenuhi asumsi residual berdistribusi normal.
1.3
Pendeteksian Multikolinieritas Identifikasi multikolinieritas pada variable-variabel prediktor dapat
dilakukan dengan melihat nilai VIF (Variance Inflation Factor) pada masingmasing variabel prediktor. Berikut adalah nilai VIF dari setiap variabel prediktor yang didapatkan dengan menggunakan Software Minitab. Tabel 1.5 Nilai VIF
Variabel Persentase Sarana Kesehatan (X1) Persentase Tenaga Medis (X2) Persentase Penduduk Perempuan yang Umur Kawin Pertama ≤16 Tahun (X3) Persentase Penduduk dan Rumah Tangga (RT) Perempuan (X4) Persentase Daerah yang Berstatus Desa (X5)
Nilai VIF 9.733 7.953 1.825 1.135 2.518
Berdasarkan Tabel 1.5, dapat diketahui bahwa pada variabel bebas X1, X2, X3, X4 dan X5 tidak terdeteksi adanya multikolinieritas karena semua nilai nilai VIF dari ke-5 variabel prediktor tersebut nilainya kurang dari 10, sehingga dapat disimpulkan bahwa tidak terdapat kasus multikolinieritas pada data jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur.
1.4
Pemilihan Model Terbaik dengan Metode All Possible Regression Metode All Possible Regression digunakan untuk memilih persamaan
penduga yang terbaik dengan mempertimbangkan kriteria nilai R2 yang dicapai, nilai S2 atau jumlah kuadrat sisa regresi, nilai Statistik Cp. Hasil output dari metode all possible regression pada data jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur 8
kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur adalah sebagai berikut. Tabel 1.6 Hasil Metode All Possible Regression Antara Variabel Respon Dengan Variabel Prediktor
Vars
R-Sq
1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4 5
22.7 16.8 16.2 5.7 0.2 27.7 27.6 23.3 23.1 23.1 28.6 28.4 28.4 28.1 28.0 29.2 29.0 28.9 28.7 24.1 29.5
R-Sq (adj) 20.5 14.4 13.8 3.0 0.0 23.4 23.4 18.7 18.6 18.5 22.1 21.9 21.9 21.5 21.5 20.3 20.1 20.0 19.7 14.6 18.1
Mallows Cp 1 3.6 3.8 8.5 10.9 0.8 0.8 2.7 2.8 2.8 2.4 2.4 2.4 2.6 2.6 4.1 4.2 4.3 4.3 6.3 6.0
S 77.173 80.082 80.382 85.277 87.712 75.740 75.780 78.044 78.099 78.135 76.391 76.480 76.481 76.683 76.703 77.274 77.379 77.439 77.547 77.980 78.348
X 1 X
X 2
X 3
X 4
X 5 X
X X X X X X X X
X X X
X X X X X X X X
X X
X X X X
X X X X X X X
X X X X X
X X X X X X
X X X X X X X X X X
Berdasarkan Tabel 1.6 dapat diketahui bahwa terdapat beberapa model dari prosedur All Possible Regression yang dapat digolongkan menjadi persamaan regresi terbaik. Salah satu model regresi yang terbaik antara variabel respon dan variabel prediktor yaitu antara Y dengan X1, X3, dan X5. Nilai R-Sq dan R-Sq (adj) cukup tinggi yaitu 28.4 dan 21.9. Memiliki nilai S (kuadrat tengah sisa) yang kecil yaitu sebesar 76.480. Sedangkan nilai Cp-Mallows sebesar 2.4 yang hampir mendekati jumlah banyaknya variabel prediktor yang ditambah dengan intercept. Sehingga dalam hal ini model regresi terbaik dengan metode All Possible Regression adalah antara jumlah kasus kanker serviks (Y) dengan persentase sarana kesehatan (X1), persentase
penduduk perempuan yang umur kawin
pertama ≤16 tahun (X3) dan persentase daerah yang berstatus desa (X5). Model regresi terbaik dengan metode All Possible Regression adalah
y 43.5 266X1 0.8X3 0.851X 5 . 9
1.5
Pemilihan Model Terbaik dengan Metode Best Subset Regression Pemilihan model regresi terbaik dengan metode best subset regression
tidak jauh beda dengan all possible regression. Pada metode best subset, hanya ditampilkan persamaan regresi terbaik yang terpilih dengan kriterianya masingmasing. Hasil output dari metode best subset regression pada d data jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur adalah sebagai berikut. Tabel 1.7 Hasil Metode Best Subset Regression Antara Variabel Respon Dengan Variabel Prediktor
Vars
R-Sq
1 1 2 2 3 3 4 4 5
22.7 16.8 27.7 27.6 28.6 28.4 29.2 29.0 29.5
R-Sq (adj) 20.5 14.4 23.4 23.4 22.1 21.9 20.3 20.1 18.1
Mallows Cp 1 3.6 0.8 0.8 2.4 2.4 4.1 4.2 6.0
S 77.173 80.082 75.740 75.780 76.391 76.480 77.274 77.379 78.348
X 1 X
X 2
X 3
X 4
X X X X X X X
X X
X X X X X
X X
X 5 X X X X X X X X
Berdasarkan Tabel 1.7 dapat diketahui bahwa terdapat beberapa model dari prosedur Best Subset Regression yang dapat digolongkan menjadi persamaan regresi terbaik. Salah satu model regresi yang terbaik antara variabel respon dan variabel prediktor yaitu antara Y dengan X1, X3, dan X5. Nilai R-Sq dan R-Sq (adj) cukup tinggi yaitu 28.4 dan 21.9. Memiliki nilai S (kuadrat tengah sisa) yang kecil yaitu sebesar 76.480. Sedangkan nilai Cp-Mallows sebesar 2.4 yang hampir mendekati jumlah banyaknya variabel prediktor yang ditambah dengan intercept. Sehingga dalam hal ini model regresi terbaik dengan metode Best Subset Regression adalah antara jumlah kasus kanker serviks (Y) dengan persentase sarana kesehatan (X1), persentase
penduduk perempuan yang umur kawin
pertama ≤16 tahun (X3) dan persentase daerah yang berstatus desa (X5). Model regresi
terbaik
dengan
metode
Best
y 43.5 266X1 0.8X3 0.851X 5 .
10
Subset
Regression
adalah
1.6
Pemilihan Model Terbaik dengan Metode Forward Selection Pemilihan model terbaik dengan metode forward selection yaitu dengan
menambahkan satu per satu variabel prediktor yang paling signifikan pada model. Berikut merupakan analisis untuk menentukan model regresi terbaik dengan menggunakan metode forward selection pada data jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur. Tabel 1.8 Hasil Metode Forward Selection Antara Variabel Respon Dengan Variabel Prediktor
Persentase Sarana Kesehatan (X1) Constant 7.934 X1 332 P-value 0.003 S 77.2 R-Sq 22.73 R-Sq (adj) 20.52 Mallows Cp 1
Berdasarkan Tabel 1.8 dapat diketahui bahwa pada metode forward selection tahap pertama, nilai yang paling signifikan adalah X1 dengan P-value sebesar 0.003, sehingga dalam hal ini model regresi terbaik dengan metode forward selection adalah persentase
sarana
antara jumlah kasus kanker serviks (Y) dengan
kesehatan
(X1).
Model
regresi
terbaiknya
adalah
y 7.934 332X1 .
1.7
Pemilihan Model Terbaik dengan Metode Backward Elimination Pemilihan model terbaik dengan metode backward elimination yaitu
dengan meregresikan variabel respon dengan semua variabel prediktor, dan secara bertahap mengurangi banyaknya peubah di dalam persamaan sampai suatu keputusan dicapai untuk menggunakan persamaan yang diperoleh. Berikut merupakan
analisis
untuk
menentukan
model
regresi
terbaik
dengan
menggunakan metode backward elimination pada data jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk
11
perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur. Tabel 1.9 Hasil Metode Backward Elimination Antara Variabel Respon Dengan Variabel Prediktor
Step
1
P-value
0.613
P-value
0.722
P-value
0.559
P-value
0.648
P-value S R-sq Mallows Cp
0.136 78.3 29.46 6
2 X1 0.026 X2 X3 0.572 X4 0.582 X5 0.124 77.3 29.17 4.1
3
4
5
0.028
0.031
0.003
0.139 75.8 27.62 0.8
77.2 22.73 1
0.542
0.124 76.5 28.45 2.4
Berdasarkan Tabel 1.9 dapat diketahui bahwa pada metode backward elimination tahap pertama, variabel yang paling tidak signifikan adalah X2 dengan P-value sebesar 0.722 sehingga X2 dikeluarkan dari model. Pada metode backward elimination tahap kedua, variabel yang paling tidak signifikan adalah X4 dengan P-value sebesar 0.582 sehingga X4 dikeluarkan dari model. Pada metode backward elimination tahap ketiga, variabel yang paling tidak signifikan adalah X3 dengan P-value sebesar 0.542 sehingga X3 dikeluarkan dari model. Pada metode backward elimination tahap keempat, variabel yang paling tidak signifikan adalah X5 dengan P-value sebesar 0.139 sehingga X5 dikeluarkan dari model. Pada tahap terakhir, nilai yang signifikan adalah X1 dengan P-value sebesar 0.003. Oleh karena itu, dengan menggunakan metode backward elimination variabel yang masuk ke dalam model terbaik adalah jumlah kasus kanker serviks (Y) dengan persentase sarana kesehatan (X1). Model regresi terbaiknya adalah y 7.934 332X1 .
1.8
Pemilihan Model Terbaik dengan Metode Stepwise Regression Stepwise merupakan gabungan antara metode forward dengan metode
backward, variabel yang pertama kali dimasukan adalah variabel yang korelasinya tertinggi dan signifikan dengan variabel dependent, variabel yang masuk kedua
12
adalah variabel yang korelasi parsialnya paling tinggi dan masih signifikan, setelah variabel tertentu masuk kedalam model maka variabel yang lain yang ada didalam model dievaluasi. Jika ada variabel yang tidak signifikan maka variabel tersebut dikeluarkan. Berikut merupakan analisis untuk menentukan model regresi terbaik dengan menggunakan metode stepwise regression pada data jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur. Tabel 1.10 Uji Korelasi Antara Y dan Variabel Prediktor
Y
X1 X2 X3 X4 X5 r 0.477 0.402 -0.238 -0.043 -0.410 P-value 0.003 0.014 0.157 0.801 0.012 Berdasarkan Tabel 1.10 dapat diketahui bahwa korelasi yang paling
siginifikan dengan nilai korelasi tertinggi adalah antara jumlah kasus kanker serviks (Y) dengan persentase sarana kesehatan (X1) dengan nilai Pearson Correlation sebesar 0.477 dan P-value sebesar 0.003. Oleh karena itu, di lanjutkan pada uji korelasi parsial untuk mengetahui apakah ada variabel prediktor lain yang signifikan dengan menggunakan persentase sarana kesehatan (X1) sebagai variabel kontrol. Tabel 1.11 Uji Korelasi Parsial
Variabel Kontrol X1
X2 X3 X4 X5 Y r -0.072 -0.065 0.081 -0.252 P-value 0.678 0.707 0.639 0.139 Berdasarkan Tabel 1.11 dapat diketahui bahwa tidak ada nilai yang
signifikan dari variabel prediktor X2, X3, X4 dan X5 terhadap Y dengan X1 sebagai variabel kontrol. Oleh karena itu, dengan menggunakan metode stepwise regression, variabel yang masuk ke dalam model terbaik adalah jumlah kasus kanker serviks (Y) dengan persentase sarana kesehatan (X1). Model regresi terbaiknya adalah y 7.934 332X1 .
13
BAB II KESIMPULAN DAN SARAN 2.2
Kesimpulan Berdasarkan analisis dan pembahasan pada Bab I dapat diperoleh
kesimpulan sebagai berikut. 1.
Nilai rata-rata dari jumlah kasus kanker serviks di tiap kabupaten/kota provinsi Jawa Timur pada tahun 2010 sebesar 45.6 kasus, nilai maksimum sebesar 479 kasus dan nilai minimum sebesar 0 kasus dengan nilai keragaman sebesar 86.6. Variabel prediktor persentase daerah yang berstatus desa di tiap kabupaten/kota provinsi Jawa Timur memiliki nilai rata-rata dan nilai keragaman terbesar.
2.
Pemeriksaan dan pengujian asumsi residual IIDN menunjukkan bahwa residual data pada jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur telah memenuhi asumsi residual identik dan independen namun tidak memenuhi asumsi residual berdistribusi normal.
3.
Tidak terdapat kasus multikolinieritas pada data jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur.
4.
Model regresi terbaik dengan metode All Possible Regression adalah antara jumlah kasus kanker serviks (Y) dengan persentase sarana kesehatan (X1), persentase
penduduk perempuan yang umur kawin
pertama ≤16 tahun (X3) dan persentase daerah yang berstatus desa (X5). Model regresi terbaik dengan metode All Possible Regression adalah
y 43.5 266X1 0.8X3 0.851X 5 .
14
5.
Model regresi terbaik dengan metode Best Subset Regression adalah antara jumlah kasus kanker serviks (Y) dengan persentase sarana kesehatan (X1), persentase
penduduk perempuan yang umur kawin
pertama ≤16 tahun (X3) dan persentase daerah yang berstatus desa (X5). Model regresi terbaik dengan metode Best Subset Regression adalah
y 43.5 266X1 0.8X3 0.851X 5 . 6.
Model regresi terbaik dengan metode Forward Selection adalah jumlah kasus kanker serviks (Y) dengan persentase sarana kesehatan (X1). Model regresi terbaiknya adalah y 7.934 332X1 .
7.
Model regresi terbaik dengan metode Backward Elimination adalah jumlah kasus kanker serviks (Y) dengan persentase sarana kesehatan (X1). Model regresi terbaiknya adalah y 7.934 332X1 .
8.
Model regresi terbaik dengan metode Stepwise Regression adalah jumlah kasus kanker serviks (Y) dengan persentase sarana kesehatan (X1). Model regresi terbaiknya adalah y 7.934 332X1 .
2.2
Saran Diharapkan dengan adanya percobaan ini, mahasiswa lebih teliti dan
cermat pada mengolah data yang ada. Selain itu, saran untuk percobaan selanjutnya adalah harus lebih disiplin waktu dan tidak menunda-nunda pekerjaan.
15
LAMPIRAN Lampiran 1 Data Jumlah Kasus Kanker Serviks di Tiap Kabupaten/Kota Provinsi Jawa Timur Tahun 2010 dengan Variabel Prediktornya No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35
Kabupaten/Kota Pacitan Ponorogo Trenggalek Tulungagung Blitar Kediri Malang Lumajang Jember Banyuwangi Bondowoso Situbondo Probolinggo Pasuruan Sidoarjo Mojokerto Jombang Nganjuk Madiun Magetan Ngawi Bojonegoro Tuban Lamongan Gresik Bangkalan Sampang Pamekasan Sumenep Kota Kediri Kota Blitar Kota Malang Kota Probolinggo Kota Pasuruan Kota Mojokerto
Y 0 25 19 75 15 11 51 18 0 30 54 0 86 0 26 0 0 0 74 39 46 61 0 30 63 27 15 0 4 58 53 479
X1 0.02 0.12 0.06 0.16 0.06 0.1 0.24 0.1 0.2 0.14 0.06 0.04 0.08 0.06 0.32 0.16 0.14 0.12 0.02 0.04 0.04 0.12 0.06 0.08 0.12 0.02 0.02 0.02 0.04 0.16 0.08 0.18
X2 0.92 1.15 1.08 1.28 1.14 1.88 2.14 1.71 2.07 1.73 1.62 0.2 1.06 1.55 2.19 1.55 2.03 1.34 1.4 1.04 1.37 1.45 1.01 1.47 1.78 1.01 0.74 0.98 1.09 0.83 0.49 1.36
X3 21.78 24.82 30.48 22.34 22.95 20.71 30.05 34.5 40.79 31.04 58.78 62.7 59.27 33.63 13.92 24.31 22.28 24.59 29.47 24.76 25.72 36.35 34.67 37.44 22.16 37.43 47.45 41.8 47.79 12.12 14.98 17.75
X4 49.87 51.12 50.1 50.85 49.16 50.43 49.62 50.79 50.67 49.16 50.49 50.33 50.14 50.97 49.31 50.25 50.69 49.4 51.41 51.91 51.75 50.29 50.57 51.84 50.07 53.33 51.39 51.21 53.12 50.66 48.49 50.6
X5 88.89 78.36 82.17 66.42 78.63 69.48 70 86.63 74.6 71.43 84.93 75.74 77.27 70.96 24.08 66.45 52.94 69.72 81.07 69.79 93.09 86.51 86.28 89.24 60.96 86.48 93.55 86.77 89.46 0 0 5.26
0 5 39
0.04 0.02 0.12
0.82 0.79 0.55
27.28 21.88 13.05
49.78 50.74 50.76
27.59 5.88 0
36 37
Kota Madiun Kota Surabaya
23 262
0.11 0.73
0.85 7.52
13.32 12.16
53.12 50.38
0 0
Keterangan : Y = Jumlah kasus kanker serviks di tiap kabupaten/kota provinsi Jawa Timur X1 = Persentase sarana kesehatan di tiap kabupaten/kota provinsi Jawa Timur X2 = Persentase tenaga medis di tiap kabupaten/kota provinsi Jawa Timur X3 = persentase penduduk perempuan yang umur kawin pertama ≤16 tahun di tiap kabupaten/kota provinsi Jawa Timur X4 = Persentase penduduk dan Rumah Tangga (RT) perempuan di tiap kabupaten/kota provinsi Jawa Timur X5 = Persentase daerah yang berstatus desa di tiap kabupaten/kota provinsi Jawa Timur
Lampiran 2 Output Statistika Deskriptif Descriptive Statistics: y, x1, x2, x3, x4, x5 Variable y x1 x2 x3 x4 x5
N 37 37 37 37 37 37
Mean 45.6 0.1135 1.438 29.64 50.669 60.83
StDev 86.6 0.1243 1.132 13.19 1.077 32.62
Minimum 0.0 0.0200 0.200 12.12 48.490 0.00
Median 25.0 0.0800 1.280 25.72 50.600 71.43
Maximum 479.0 0.7300 7.520 62.70 53.330 93.55
Lampiran 3 Output Uji Glejser Regression Analysis: residual abs versus x1, x2, x3, x4, x5 The regression equation is residual abs = - 194 + 105 x1 - 16.6 x2 + 0.31 x3 + 5.62 x4 0.820 x5 Analysis of Variance Source Regression Residual Error Total
DF 5 31 36
SS 27286 109452 136737
MS 5457 3531
F 1.55
P 0.205
Lampiran 4 Output Durbin Watson Statistic Regression Analysis: y versus x1, x2, x3, x4, x5 Durbin-Watson statistic = 2.02816
Lampiran 5 Output VIF Regression Analysis: y versus x1, x2, x3, x4, x5 The regression equation is y = - 257 + 168 x1 + 11.7 x2 + 0.79 x3 + 6.0 x4 - 0.973 x5 Predictor Constant x1 x2 x3 x4 x5
Coef -256.5 167.6 11.66 0.790 5.96 -0.9732
SE Coef 655.3 327.7 32.52 1.338 12.91 0.6352
T -0.39 0.51 0.36 0.59 0.46 -1.53
P 0.698 0.613 0.722 0.559 0.648 0.136
VIF 9.733 7.953 1.825 1.135 2.518
Lampiran 6 Output Metode All Possible Regression Best Subsets Regression: y versus x1, x2, x3, x4, x5 Response is y Vars 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4 5
R-Sq 22.7 16.8 16.2 5.7 0.2 27.7 27.6 23.2 23.1 23.1 28.6 28.4 28.4 28.1 28.0 29.2 29.0 28.9 28.7 24.1 29.5
R-Sq(adj) 20.5 14.4 13.8 3.0 0.0 23.4 23.4 18.7 18.6 18.5 22.1 21.9 21.9 21.5 21.5 20.3 20.1 20.0 19.7 14.6 18.1
Mallows Cp 1.0 3.6 3.8 8.5 10.9 0.8 0.8 2.7 2.8 2.8 2.4 2.4 2.4 2.6 2.6 4.1 4.2 4.3 4.3 6.3 6.0
S 77.173 80.082 80.382 85.277 87.712 75.740 75.780 78.044 78.099 78.135 76.391 76.480 76.481 76.683 76.703 77.274 77.379 77.439 77.547 79.980 78.348
x x x x x 1 2 3 4 5 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
Lampiran 7 Output Metode Best Subset Regression Best Subsets Regression: y versus x1, x2, x3, x4, x5 Response is y Vars 1 1 2 2 3 3 4 4 5
R-Sq 22.7 16.8 27.7 27.6 28.6 28.4 29.2 29.0 29.5
R-Sq(adj) 20.5 14.4 23.4 23.4 22.1 21.9 20.3 20.1 18.1
Mallows Cp 1.0 3.6 0.8 0.8 2.4 2.4 4.1 4.2 6.0
S 77.173 80.082 75.740 75.780 76.391 76.480 77.274 77.379 78.348
x x x x x 1 2 3 4 5 X X X X X X X X X X X X X X X X X X X X X X X X X
Lampiran 8 Output Metode Forward Selection Stepwise Regression: y versus x1, x2, x3, x4, x5 Forward selection.
Alpha-to-Enter: 0.05
Response is y on 5 predictors, with N = 37 Step Constant
1 7.934
x1 T-Value P-Value
332 3.21 0.003
S R-Sq R-Sq(adj) Mallows Cp
77.2 22.73 20.52 1.0
Lampiran 9 Output Metode Backward Elimination Stepwise Regression: y versus x1, x2, x3, x4, x5 Backward elimination.
Alpha-to-Remove: 0.05
Response is y on 5 predictors, with N = 37 Step Constant
1 -256.525
2 -313.445
3 43.512
4 56.445
5 7.934
x1 T-Value P-Value
168 0.51 0.613
277 2.34 0.026
266 2.30 0.028
256 2.26 0.031
332 3.21 0.003
x2 T-Value P-Value
12 0.36 0.722
x3 T-Value P-Value
0.8 0.59 0.559
0.8 0.57 0.572
0.8 0.62 0.542
x4 T-Value P-Value
6 0.46 0.648
7 0.57 0.582
x5 T-Value P-Value
-0.97 -1.53 0.136
-0.86 -1.58 0.124
-0.85 -1.58 0.124
-0.66 -1.52 0.139
S R-Sq R-Sq(adj) Mallows Cp
78.3 29.46 18.08 6.0
77.3 29.17 20.31 4.1
76.5 28.45 21.94 2.4
75.8 27.62 23.37 0.8
77.2 22.73 20.52 1.0
Lampiran 10 Output Uji Korelasi Correlations Y y
Pearson Correlation
x1 1
Sig. (2-tailed) N x1
Pearson Correlation Sig. (2-tailed) N
x2
37 .477
**
x2
x4
x5
*
-.238
-.043
-.410
.003
.014
.157
.801
.012
37
37
37
37
37
1
**
*
-.235
.000
.018
.162
.006
.477
**
x3
.003
.402
.901
-.388
-.444
*
**
37
37
37
37
37
37
*
**
1
-.240
-.110
-.190
.152
.518
.260
Pearson Correlation
.402
Sig. (2-tailed)
.014
.901
.000
N x3
Pearson Correlation Sig. (2-tailed) N
x4
Pearson Correlation Sig. (2-tailed) N
x5
Pearson Correlation
37
37
37
37
37
-.238
-.388
*
-.240
1
.184
.157
.018
.152
37
37
37
-.043
-.235
.801 37
N
.659
.000
37
37
37
-.110
.184
1
.180
.162
.518
.274
37
37
37
37
37
**
-.190
**
.180
1
.012
.006
.260
.000
.287
37
37
37
37
37
*
-.444
.659
.287
37
Lampiran 11 Output Uji Korelasi Parsial Correlations Control Variables x1
y
x2
Y Correlation
x5 .081
-.252
Significance (2-tailed)
.
.678
.707
.639
.139
df
0
34
34
34
34
-.072
1.000
.274
.241
.539
.678
.
.106
.156
.001
34
0
34
34
34
-.065
.274
1.000
.104
.590
.707
.106
.
.546
.000
34
34
0
34
34
Correlation
.081
.241
.104
1.000
.087
Significance (2-tailed)
.639
.156
.546
.
.614
34
34
34
0
34
-.252
.539
.590
.087
1.000
.139
.001
.000
.614
.
34
34
34
34
0
Correlation Significance (2-tailed) df
df x5
x4
-.065
df
x4
x3
-.072
Significance (2-tailed)
x3
x2
1.000
Correlation
Correlation Significance (2-tailed) df
**
.274
-.410
Sig. (2-tailed)
37