pemilihan model regresi terbaik

TUGAS INDIVIDU METODE REGRESI

Analisis Data Pengaruh Usia Mahasiswa Saat Masuk S2 dan Fakultas Asal Mahsiswa Terhadap Nilai Tes Potensi Akademik (TPA) Mahasiswa Program Magister ITS Tahun 2006 Dengan Menggunakan Analisis Regresi Dummy

Oleh: Fausania Hibatullah

1313 030 018

Asisten Dosen: Ardhian Bayu Firdauz

Program Studi Diploma III Jurusan Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Teknologi Sepuluh Nopember Surabaya 2014

BAB I ANALISIS DAN PEMBAHASAN

1.1

Interpretasi Model Regresi Linier Berganda dengan Variabel Prediktor Dummy Pada penelitian ini, model regresi linier berganda bertujuan untuk

meramalkan nilai TPA (Tes Potensi Akademik) dari mahasiswa program Magister ITS pada tahun 2006 berdasarkan faktor usia mahasiswa pada saat masuk S2 dan fakultas mahasiswa berasal. Terdapat 3 kategori fakultas yaitu FMIPA, FTK dan FTIf ITS. Berikut adalah koding yang dilakukan dalam analisis regresi linier berganda dengan variabel dummy pada data fakultas mahasiswa berasal. Tabel 1.1 Koding Pada Data Fakultas

Fakultas

Dummy1 (d1 ) 1 0 0

FMIPA FTK FTIf

1.1.1

Dummy2 (d 2 ) 0 1 0

Model Regresi Berikut hasil persamaan model regresi linier berganda dengan variabel

prediktor dummy dengan menggunakan Software Minitab. Tabel 1.2 Model Regresi

Persamaan Regresi R-Sq

y  621 3.37x- 7.9 d1 - 54.1d 2 30.5 %

Berdasarkan Tabel 1.2 dapat diketahui bahwa persamaan model regresi mampu menjelaskan sebesar 30.5% variabilitas yang dimiliki, sedangkan sisanya sebesar 69.5% dijelaskan oleh variabel lain yang tidak masuk dalam model. A. Persamaan Regresi untuk Fakultas Fakultas Matematika dan Ilmu Pengetahuan Alam (FMIPA) y  621 3.37x- 7.9 d1 - 54.1d 2

Pada Fakultas Matematika dan Ilmu Pengetahuan Alam, nilai d1 = 1 dan d2 = 0 y1  621 3.37x- 7.9 (1) - 54.1(0)

y1  613.1 - 3.37x

Dari persamaan model diatas, dijelaskan bahwa nilai Tes Potensi Akademik (TPA) dari mahasiswa program Magister FMIPA ITS tahun 2006 lebih rendah

1

sebesar 7.9 poin dibandingkan dengan nilai TOEFL dari mahasiswa program Magister FTIf ITS. B. Persamaan Regresi untuk Fakultas Teknologi Kelautan (FTK) y  621 3.37x- 7.9 d1 - 54.1d 2

Pada Fakultas Teknologi Kelautan, nilai d1 = 0 dan d2 = 1 y2  621 3.37x- 7.9 (0) - 54.1(1) y2  566.9  3.37x

Dari persamaan model diatas, dijelaskan bahwa nilai Tes Potensi Akademik (TPA) dari mahasiswa program Magister FTK ITS tahun 2006 lebih rendah sebesar 54.1 poin dibandingkan dengan nilai TOEFL dari mahasiswa program Magister FTIf ITS. C. Persamaan regresi untuk Fakultas Teknologi Informasi (FTIf) y  621 3.37x- 7.9 d1 - 54.1d 2

Pada Fakultas Matematika dan Ilmu Pengetahuan Alam, nilai d1 = 1 dan d2 = 0 y3  621 3.37x- 7.9 (0) - 54.1(0) y3  621- 3.37x

Dari persamaan model diatas, dijelaskan bahwa nilai Tes Potensi Akademik (TPA) dari mahasiswa program Magister FTIf ITS tahun 2006 lebih tinggi dibandingkan dengan nilai TOEFL dari mahasiswa program Magister FMIPA dan FTK ITS. 1.1.2 Scatterplot Scatterplot digunakan untuk mengetahui hubungan kelinieran antara variabel respon yaitu nilai Tes Potensi Akademik (TPA) mahasiswa program Magister dari FMIPA, FTK dan FTIf ITS tahun 2006 dengan variabel prediktor usia mahasiswa tersebut saat masuk S2.

2

Scatterplot of y duga fmipa, y duga ftk, y duga ftif vs Usia saat ma 550

Variable y duga fmipa y duga ftk y duga ftif

525

Y-Data

500 475 450 425 400

20

25

30

35 40 45 Usia saat masuk s2

50

55

Gambar 1.1 Scatterplot

Berdasarkan hasil persamaan model regresi dan Gambar 1.1, dapat diketahui bahwa nilai Tes Potensi Akademik (TPA) mahasiswa program Magister dari FTIf ITS tahun 2006 lebih tinggi sebesar 7.9 poin dibandingkan dengan mahasiswa program Magister dari FMIPA ITS dan lebih tinggi sebesar 54.1 poin dibandingkan dengan mahasiswa program Magister dari FTK ITS.

1.2

Analisis Regresi Linier Berganda dengan Variabel Prediktor Dummy Pada analisis Regresi Linier Berganda dengan variabel prediktor dummy

akan dilakukan uji serentak serta uji parsial pada data nilai Tes Potensi Akademik (TPA) mahasiswa program Magister ITS tahun 2006 berdasarkan faktor usia mahasiswa saat masuk S2 dan fakultas mahasiswa berasal. 1.2.1 Uji Serentak Uji serentak adalah pengujian untuk melihat signifikansi parameter secara bersama. Hipotesis yang digunakan sebagai berikut.

H 0 :  i  0 dimana i = 1, 2, 3 (semua variabel tidak berpengaruh signifikan terhadap nilai TPA mahasiswa program Magister ITS)

H1 : Minimal ada satu  i  0 dimana i = 1, 2, 3 (Minimal ada satu variabel yang berpengaruh signifikan terhadap nilai TPA mahasiswa program Magister ITS) Taraf signifikan

:   0.05

Daerah penolakan

: Tolak H0 jika F  F ( db1 ,db2 )

3

Tabel 1.3 Hasil Uji Serentak

Sumber Regresi Galat Total

Derajat Bebas 3 26 29

Jumlah Kuadrat 34248 78039 112287

Kuadrat Tengah 11416 3001

F-hitung

F0.05(3,26)

P-value

3.80

2.98

0,022

Berdasarkan Tabel 1.3 dapat diketahui bahwa nilai F hitung sebesar 3.80. Pada taraf   0.05 , didapatkan nilai F tabel (F0.05(3,26)) sebesar 2.98 sehingga F (3.80) > F0.05(3,26) (2.98) dan P-value (0.022) < α (0.05) maka keputusan yang diambil adalah H 0 ditolak dan didapatkan kesimpulan bahwa minimal ada satu variabel yang berpengaruh signifikan terhadap nilai Tes Potensi Akademik (TPA) dari mahasiswa program Magister ITS tahun 2006. 1.2.2

Uji Parsial Uji parsial digunakan untuk mengetahui variabel/parameter mana dari

memiliki pengaruh signifikan terhadap nilai Tes Potensi Akademik (TPA) mahasiswa program Magister ITS tahun 2006. Uji ini dilakukan pada masingmasing variabel prediktor dengan variabel respon sehingga menggunakan beberapa analisis. A.

Uji Parsial Pengaruh Usia Mahasiswa Saat Masuk S2 Terhadap Nilai TPA Mahasiswa Program Magister ITS

Hipotesis yang digunakan adalah sebagai berikut.

H 0 : 1  0 (Usia saat masuk S2 tidak berpengaruh signifikan terhadap nilai TPA mahasiswa program Magister ITS)

H1 : 1  0 (Usia saat masuk S2 berpengaruh signifikan terhadap nilai TPA mahasiswa program Magister ITS) Taraf signifikan

:   0.05

Daerah penolakan

: Tolak H 0 jika | t | t / 2( n( p1))

Statistik uji

: Tabel 1.4 Uji Parsial X terhadap Y

Prediktor Usia saat masuk S2

t-hitung -2.15

t0.025(26) 2.056

P-value 0.041

Berdasarkan Tabel 1.4 dapat diketahui bahwa nilai |t-hitung| sebesar 2.15. Pada taraf   0.05 , didapatkan nilai t tabel (t0.025(26)) sebesar 2.056 sehingga |t| (2.15) > t0.025(26) (2.056) dan P-value (0.041) < α (0.05) maka keputusan yang 4

diambil adalah H 0 ditolak dan didapatkan kesimpulan bahwa usia mahasiswa saat masuk S2 berpengaruh signifikan terhadap nilai Tes Potensi Akademik (TPA) mahasiswa program Magister ITS B.

Uji Parsial Pengaruh Variabel Dummy Terhadap Nilai TPA Mahasiswa Program Magister ITS


H 0 :  2   3  0 (Asal fakultas dari FMIPA dan FTK ITS tidak berpengaruh signifikan terhadap nilai TPA mahasiswa program Magister ITS)

H1 : Minimal ada satu  i  0 dimana i = 2,3 (Minimal ada satu asal fakultas yang berpengaruh signifikan terhadap nilai TPA mahasiswa program Magister ITS) Taraf signifikan

:   0.05

Daerah penolakan

: Tolak H 0 jika F  F ( db1 ,db2 )

Statistik uji

: F

JK (b2 b3 b0 b1 ) /(k  1) KTG



(34248 17330) / 2  2.819 3001

Berdasarkan hasil perhitungan diatas dapat diketahui bahwa nilai F-hitung sebesar 2.819. Pada taraf   0.05 , didapatkan nilai F tabel (F0.05(3,26)) sebesar 2.98 sehingga F (2.819) < F0.05(3,26) (2.98) maka keputusan yang diambil adalah H0 gagal ditolak dan didapatkan kesimpulan bahwa asal fakultas dari FMIPA dan FTK ITS tidak berpengaruh signifikan terhadap nilai TPA mahasiswa program Magister ITS. C.

Uji Parsial Ada Tidaknya Perbedaan Antara Mahasiswa Dengan Fakultas Asal FMIPA dan FTIf ITS


H 0 :  2  0 (Mahasiswa yang berasal dari FMIPA ITS tidak memiliki perbedaan yang signifikan dengan mahasiswa yang berasal dari FTIf ITS)

H1 :  2  0 (Mahasiswa yang berasal dari FMIPA ITS memiliki perbedaan yang signifikan dengan mahasiswa yang berasal dari FTIf ITS) Taraf signifikan

:   0.05

5

Daerah penolakan

: Tolak H 0 jika | t | t / 2( n( p1))

Statistik uji

: Tabel 1.5 Uji Parsial Kategori 1 dan 3

Prediktor FMIPA ITS

t-hitung -0.32

P-value 0,752

Berdasarkan Tabel 1.5 dapat diketahui bahwa nilai |t-hitung| sebesar 0.32. Pada taraf   0.05 , didapatkan nilai t tabel (t0.025(26)) sebesar 2.056 sehingga |t| (0.32) < t0.025(26) (2.056) dan P-value (0.752) > α (0.05) maka keputusan yang diambil adalah H 0 gagal ditolak dan didapatkan kesimpulan bahwa mahasiswa yang berasal dari FMIPA ITS tidak memiliki perbedaan yang signifikan dengan mahasiswa yang berasal dari FTIf ITS. D.

Uji Parsial Ada Tidaknya Perbedaan Antara Mahasiswa Dengan Fakultas Asal FTK dan FTIf ITS


H 0 :  3  0 (Mahasiswa yang berasal dari FTK ITS tidak memiliki perbedaan yang signifikan dengan mahasiswa yang berasal dari FTIf ITS)

H1 :  3  0 (Mahasiswa yang berasal dari FTK ITS memiliki perbedaan yang signifikan dengan mahasiswa yang berasal dari FTIf ITS) Taraf signifikan

:   0.05

Daerah penolakan

: Tolak H 0 jika | t | t / 2( n( p1))

Statistik uji

: Tabel 1.6 Uji Parsial Kategori 2 dan 3

Prediktor FTK ITS

t-hitung -2.19

P-value 0,038

Berdasarkan Tabel 1.6 dapat diketahui bahwa nilai |t-hitung| sebesar 2.19. Pada taraf   0.05 , didapatkan nilai t tabel (t0.025(26)) sebesar 2.056 sehingga |t| (2.19) > t0.025(26) (2.056) dan P-value (0.038) < α (0.05) maka keputusan yang diambil adalah H 0 ditolak dan didapatkan kesimpulan bahwa mahasiswa yang berasal dari FTK ITS memiliki perbedaan yang signifikan dengan mahasiswa yang berasal dari FTIf ITS. E.

Uji Parsial Ada Tidaknya Perbedaan Antara Mahasiswa Dengan Fakultas Asal FTI dan FTSP ITS


6

H 0 :  2   3 (Mahasiswa yang berasal dari FMIPA dan FTK ITS memberikan respon yang sama terhadap nilai TPA mahasiswa program Magister di ITS)

H1 :  2   3 (Mahasiswa yang berasal dari FMIPA dan FTK ITS memberikan respon yang berbeda terhadap nilai TPA mahasiswa program Magister di ITS) Taraf signifikan

:   0.05

Daerah penolakan

: Tolak H 0 jika | t | t / 2( n( p1))

Statistik uji :

t

a1  a 2 ( Se(a1 ))  ( Se(a 2 ))  2 cov( a1 a 2 ) 2

2

 7.9  54.1



614.335  612.094  2( 313.075 )

 1.886

Berdasarkan hasil perhitungan diatas dapat diketahui bahwa nilai |t-hitung| sebesar 1.886. Pada taraf   0.05 , didapatkan nilai t tabel (t0.025(26)) sebesar 2.056 sehingga |t| (1.886) < t0.025(26) (2.056) maka keputusan yang diambil adalah H 0 gagal ditolak dan didapatkan kesimpulan bahwa mahasiswa yang berasal dari FMIPA dan FTK ITS memberikan respon yang sama terhadap nilai TPA mahasiswa program Magister di ITS.

1.3

Pemeriksaan Asumsi Residual IIDN Setelah melakukan analisis Regresi Linier Berganda dengan variabel

prediktor dummy, selanjutnya akan dilakukan pemeriksaan asumsi residual IIDN yaitu residual independen, residual identik, dan residual berdistribusi normal. Residual Plots for nilai TPA Normal Probability Plot

Versus Fits

99

100

Residual

Percent

90 50 10 1 -200

-100

0 Residual

0

-100

100

400

440 480 Fitted Value

Histogram

Versus Order

7.5

Residual

Frequency

560

100

10.0

5.0 2.5 0.0

520

-150

-100

-50 0 Residual

50

100

0

-100

2

4

6

8 10 12 14 16 18 20 22 24 26 28 30

Observation Order

Gambar 1.2 Pemeriksaan Asumsi Residual IIDN

7

Berdasarkan Gambar 1.2 dapat diketahui bahwa grafik versus fits dari data nilai TPA mahasiswa program Magister ITS tahun 2006 tidak berpola atau tidak membentuk suatu pola tertentu sehingga secara visual nilai TPA mahasiswa program Magister ITS tahun 2006 dapat dikatakan memenuhi asumsi independen. Grafik versus order dari data nilai TPA mahasiswa program Magister ITS tahun 2006 tidak berpola atau tidak membentuk suatu pola tertentu sehingga secara visual nilai TPA mahasiswa program Magister ITS tahun 2006 dapat dikatakan memenuhi asumsi identik. Pada grafik normal probability plot menunjukkan nilai probabilitas masing-masing residual tidak menyebar mengikuti garis lurus yang artinya data nilai TPA mahasiswa program Magister ITS tahun 2006 tidak berdistribusi normal.

8

BAB II KESIMPULAN DAN SARAN 2.1

Kesimpulan Berdasarkan analisis dan pembahasan pada Bab I dapat diperoleh

kesimpulan sebagai berikut. 1.

Model regresi linier menunjukkan bahwa nilai nilai Tes Potensi Akademik (TPA) mahasiswa program Magister dari FTIf ITS tahun 2006 lebih tinggi sebesar 7.9 poin dibandingkan dengan mahasiswa program Magister dari FMIPA ITS dan lebih tinggi sebesar 54.1 poin dibandingkan dengan mahasiswa program Magister dari FTK ITS.

2.

Uji serentak pada analisis regresi linier berganda dengan variabel prediktor dummy menunjukkan bahwa minimal ada satu variabel yang berpengaruh signifikan terhadap nilai TPA mahasiswa program Magister ITS, sehingga dilanjutkan ke uji parsial. Uji parsial menunjukkan bahwa usia mahasiswa saat masuk S2 berpengaruh signifikan terhadap nilai TPA mahasiswa program Magister ITS, asal fakultas dari FMIPA dan FTK ITS tidak berpengaruh signifikan terhadap nilai TPA mahasiswa program Magister ITS, mahasiswa yang berasal dari FMIPA ITS tidak memiliki perbedaan yang signifikan dengan mahasiswa yang berasal dari FTIf ITS, mahasiswa yang berasal dari FTK ITS memiliki perbedaan yang signifikan dengan mahasiswa yang berasal dari FTIf ITS, mahasiswa yang berasal dari FMIPA dan FTK ITS memberikan respon yang sama terhadap nilai TPA mahasiswa program Magister di ITS.

3.

Pemeriksaan asumsi residual IIDN menunjukkan bahwa data nilai TPA mahasiswa program Magister ITS tahun 2006 memenuhi asumsi residual identik dan independen namun tidak berdistribusi normal.

2.2

Saran Diharapkan dengan adanya percobaan ini, mahasiswa lebih teliti dan

cermat pada mengolah data yang ada. Selain itu, saran untuk percobaan selanjutnya adalah harus lebih disiplin waktu dan tidak menunda-nunda pekerjaan.

9

LAMPIRAN Lampiran 1 Nilai TPA Mahasiswa Program Magister ITS Tahun 2006 Berdasarkan Usia Saat Masuk S2 dan Fakultas. No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

Nilai TPA 540 560 500 480 480 560 575 520 440 420 440 400 480 300 500 560 460 420 520 540 500 520 540 560 575 440 520 560 520 500

Usia saat masuk s2 29 28 32 45 39 24 31 23 27 34 26 54 34 31 23 29 32 30 28 23 26 30 31 27 23 29 32 28 35 27

Fakultas FMIPA FMIPA FMIPA FMIPA FMIPA FMIPA FMIPA FMIPA FMIPA FMIPA FTK FTK FTK FTK FTK FTK FTK FTK FTK FTK FTIf FTIf FTIf FTIf FTIf FTIf FTIf FTIf FTIf FTIf

D1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

Keterangan : D1 = Fakultas Matematika dan Ilmu Pengetahuan Alam ITS (FMIPA ITS) D2 = Fakultas Teknologi Kelautan ITS (FTK ITS)

D2 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0

Lampiran 2 Output Model Regresi The regression equation is nilai TPA = 621 - 3.37 Usia saat masuk s2 - 7.9 FMIPA - 54.1 FTK S = 54.7858

R-Sq = 30.5%

R-Sq(adj) = 22.5%

Lampiran 3 Output Regresi Linier Berganda Uji Serentak dan Uji Parsial Analysis of Variance Source Regression Residual Error Total

DF 3 26 29

SS 34248 78039 112287

Source Usia saat masuk s2 FMIPA FTK

DF 1 1 1

MS 11416 3001

F 3.80

P 0.022

Seq SS 17330 2578 14340

Lampiran 4 Predictor Constant Usia saat masuk s2 FMIPA FTK

Coef 620.62 -3.372 -7.91 -54.08

SE Coef 48.36 1.568 24.79 24.74

T 12.83 -2.15 -0.32 -2.19

Lampiran 4 Varians β Data Display Matrix M5 2338.38 -70.77 -130.24 -144.40

-70.7737 2.4574 -5.8978 -5.4063

-130.243 -5.898 614.355 313.075

-144.398 -5.406 313.075 612.094

P 0.000 0.041 0.752 0.038

TUGAS INDIVIDU METODE REGRESI

Pengujian Asumsi Residual IIDN, Pendeteksian Multikonlinearitas dan Pemilihan Model Terbaik pada Data Faktor-Faktor yang Diduga Mempengaruhi Jumlah Kasus Kanker Serviks di Tiap Kabupaten/Kota di Provinsi Jawa Timur Tahun 2010

Oleh: Fausania Hibatullah

1313 030 018

Asisten Dosen: Ardhian Bayu Firdauz

Program Studi Diploma III Jurusan Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Teknologi Sepuluh Nopember Surabaya 2014

BAB I ANALISIS DAN PEMBAHASAN

1.1

Statistika Deskriptif Statsistika deskriptif merupakan langkah analisis yang harus dilakukan

pertama kali untuk mengetahui dan memberikan keterangan tentang karakteristik data dari hasil pengamatan yang telah dilakukan dalam praktikum. Perhitungan statistika deskriptif tersebut diolah menggunakan software Minitab. Berikut merupakan hasil perhitungan statistika deskriptif data mengenai jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur. Tabel 1.1 Statistika Deskriptif

Variabel Jumlah Kasus Kanker Serviks (Y) Persentase Sarana Kesehatan (X1) Persentase Tenaga Medis (X2) Persentase Penduduk Perempuan yang Umur Kawin Pertama ≤16 Tahun (X3) Persentase Penduduk dan Rumah Tangga (RT) Perempuan (X4) Persentase Daerah yang Berstatus Desa (X5)

Mean 45.6 0.1135 1.438 29.64

StDev 86.6 0.124 1.132 13.19

Minimum Median Maksimum 0 25 479 0.02 0.08 0.73 0.2 1.28 7.52 12.12 25.72 62.7

50.669

1.077

48.49

50.6

53.33

60.83

32.62

0.00

71.43

93.55

Berdasarkan Tabel 1.1, dapat diketahui bahwa nilai rata-rata dari jumlah kasus kanker serviks di tiap kabupaten/kota provinsi Jawa Timur pada tahun 2010 sebesar 45.6 kasus, nilai maksimum sebesar 479 kasus dan nilai minimum sebesar 0 kasus dengan nilai keragaman sebesar 86.6. Setengah dari data jumlah kasus kanker serviks di tiap kabupaten/kota provinsi Jawa Timur mempunyai nilai diatas 25 kasus, sedangkan setengah lainnya mempunyai nilai dibawah 25 kasus. Nilai rata-rata dari persentase sarana kesehatan di tiap kabupaten/kota provinsi Jawa Timur pada tahun 2010 sebesar 0.1135 persen dengan nilai keragaman sebesar 0.124. Nilai rata-rata dari persentase tenaga medis di tiap kabupaten/kota provinsi Jawa Timur pada tahun 2010 sebesar 1.438 persen dengan nilai keragaman sebesar 1.132. Nilai rata-rata dari persentase penduduk perempuan yang umur

1

kawin pertama ≤16 tahun di tiap kabupaten/kota provinsi Jawa Timur pada tahun 2010 sebesar 29.64 persen dengan nilai keragaman sebesar 13.19. Nilai rata-rata dari persentase penduduk dan RT perempuan di tiap kabupaten/kota provinsi Jawa Timur pada tahun 2010 sebesar 50.669 persen dengan nilai keragaman sebesar 1.077. Nilai rata-rata dari persentase daerah yang berstatus desa di tiap kabupaten/kota provinsi Jawa Timur pada tahun 2010 sebesar 60.83 persen dengan nilai keragaman sebesar 32.62, sehingga variabel prediktor persentase daerah yang berstatus desa di tiap kabupaten/kota provinsi Jawa Timur pada tahun 2010 mempunyai nilai rata-rata dan nilai keragaman terbesar.

1.2

Pemeriksaan dan Pengujian Asumsi Residual IIDN Pemeriksaan asumsi residual IIDN (Identik, Independen dan Distribusi

Normal) ini dilakukan untuk mengetahui apakah data dalam percobaan ini memenuhi asumsi residual identik, independen dan berdistribusi normal dengan memeriksa residualnya. Berikut merupakan pemeriksaan secara visual beserta pengujiannya. 1.2.1

Pemeriksaan dan Pengujian Asumsi Residual Identik Berikut merupakan hasil pemeriksaan asumsi residual identik pada data

yang telah diperoleh dengan software minitab. Versus Fits

(response is y) 400

Residual

300

200

100

0

-100 0

50

100

150 Fitted Value

200

250

300

Gambar 1.1 Pemeriksaan Asumsi Residual Identik

Gambar 1.1 jika dilihat secara visual dapat terlihat plot menyebar secara acak dan tidak membentuk suatu pola tertentu sehingga dapat dikatakan bahwa residual data pada jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa

2

Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur telah memenuhi asumsi residual identik. Untuk mengetahui lebih tepat apakah data telah memenuhi asumsi identik, maka dilakukan pengujian Glejser. Hipotesis yang digunakan adalah sebagai berikut. H0 : σ12 = σ22 = σ32 = σ42 = σ52 = σ2 (residual memenuhi asumsi identik) H1 : σ12 = σ22 = σ32 = σ42 = σ52 ≠ σ2 (residual tidak memenuhi asumsi identik) Taraf Signifikan : α = 0,05 Daerah Kritis: Tolak H0 jika Fhitung > Ftabel Statistik Uji: Tabel 1.2 ANOVA Uji Glejser

Source Regression Residual Error Total

DF 5 31 36

SS 27286 109452 136737

MS 5457 3531

F 1.55

Ftabel 2.52

P 0.205

Berdasarkan Tabel 1.2 dapat diketahui bahwa nilai Fhitung (1.55) < Ftabel (2.52) maka keputusan yang didapat adalah gagal tolak H0. Selain itu dapat dilihat dari nilai Pvalue (0.205) > α (0,05) maka dapat diambil keputusan bahwa H0 gagal ditolak dan didapatkan kesimpulan bahwa residual data pada jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur telah memenuhi asumsi residual identik. 1.2.2

Pemeriksaan dan Pengujian Asumsi Residual Independen Berikut merupakan hasil pemeriksaan asumsi residual independen pada

data yang telah diperoleh dengan software minitab.

3

Versus Order (response is y)

400

300

Residual

200

100

0

-100 1

5

10

15 20 25 Observation Order

30

35

Gambar 1.2 Pemeriksaan Asumsi Residual Independen

Gambar 1.2 secara visual dapat dilihat plot-plot telah menyebar secara acak dan tidak membentuk suatu pola tertentu, sehingga dapat disimpulkan bahwa residual data pada jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur telah memenuhi asumsi residual independen, kemudian dilakukan uji independensi residual dengan pemeriksaan pada plot ACF sebagai berikut. Autocorrelation Function for RESI1

(with 5% significance limits for the autocorrelations) 1.0 0.8

Autocorrelation

0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 1

2

3

4

5 Lag

6

7

8

9

Gambar 1.3 Plot ACF

Berdasarkan Gambar 1.3 didapatkan bahwa tidak ada lag yang melewati batas garis merah, maka dapat disimpulkan bahwa residual data pada jumlah

4

kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur tidak memiliki autokorelasi atau independen. Untuk mengetahui lebih tepat apakah data telah memenuhi asumsi independen, maka dilakukan uji Durbin Watson dengan pengujian dua sisi. Hipotesis yang digunakan adalah sebagai berikut. H0: ρ = 0 (residual data memenuhi asumsi independen) H1: ρ ≠ 0 (residual data tidak memenuhi asumsi independen) Taraf signifikan: α = 0,05 Daerah Kritis: Tolak H0 jika d < dU Statistik Uji: Tabel 1.3 Nilai Durbin Watson

Durbin-Watson statistic 2.02816

dU 1,79

Berdasarkan Tabel 1.3 dapat diketahui bahwa nilai Durbin-Watson statisic sebesar 2.02816, sehingga dapat diambil keputusan bahwa H0 gagal ditolak dan didapatkan kesimpulan bahwa residual data pada jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur telah memenuhi asumsi residual independen. 1.2.3

Pemeriksaan dan Pengujian Asumsi Residual Beristribusi Normal Pemeriksaan dan pengujian asumsi residual berdistribusi normal untuk

mengetahui apakah residual data telah berdistribusi normal. Pemeriksaan asumsi residual berdistribusi normal secara visual menggunakan Probability Plot sebagai berikut.

5

Probability Plot of RESI1 Normal

99

Mean StDev N KS P-Value

95 90

5.645934E-14 72.70 37 0.220 <0.010

Percent

80 70 60 50 40 30 20 10 5

1

-200

-100

0

100 RESI1

200

300

400

Gambar 1.4 Pemeriksaan Asumsi Residual Distribusi Normal

Berdasarkan Gambar 1.4 dapat diketahui bahwa plot-plot residual tidak mengikuti dan menyebar secara acak pada garis normal, sehingga secara visual didapatkan kesimpulan bahwa residual data pada jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur tidak memenuhi asumsi residual berdistribusi normal. Untuk lebih jelasnya, pembahasan akan berlanjut pada uji Kolmogorov Smirnov untuk mengetahui apakah residual berdistribusi normal. Hipotesis yang digunakan adalah sebagai berikut. H0 : residual data berdistribusi normal H1 : residual data tidak berdistribusi normal Taraf signifikan : α = 0,05 Daerah Kritis: Tolak H0 jika D>Dtabel Statistik Uji: Tabel 1.4 Uji Kolmogorov-Smirnov

Residual urut Frekuensi Kumulatif Fn -78.2484 1 1 0.027027 -76.0918 1 2 0.054054 -65.1571 1 3 0.081081 -62.914 1 4 0.108108

6

z -1.07626 -1.0466 -0.8962 -0.86534

F0 0.140906 0.147643 0.185074 0.193425

|Fn-F0| 0.113878627 0.093588737 0.103992753 0.085316871

-58.9569 -51.2759 -43.9837 -42.5439 -33.6239 -33.0508 -28.461 -26.3403 -25.3595 -20.6137 -12.1991 -10.5687 -10.2796 -9.16279 -7.987 -5.26453 -1.5751 -0.17234 4.120685 4.982244 6.659471 10.01841 13.43022 14.37834 15.51851 16.711 21.9087 33.5559 36.09519 41.54001 46.13517 59.90816 378.8678

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37

0.135135 0.162162 0.189189 0.216216 0.243243 0.27027 0.297297 0.324324 0.351351 0.378378 0.405405 0.432432 0.459459 0.486486 0.513514 0.540541 0.567568 0.594595 0.621622 0.648649 0.675676 0.702703 0.72973 0.756757 0.783784 0.810811 0.837838 0.864865 0.891892 0.918919 0.945946 0.972973 1

-0.81092 -0.70527 -0.60497 -0.58517 -0.46248 -0.45459 -0.39146 -0.36229 -0.34881 -0.28353 -0.16779 -0.14537 -0.14139 -0.12603 -0.10986 -0.07241 -0.02166 -0.00237 0.056678 0.068528 0.091597 0.137797 0.184725 0.197765 0.213448 0.22985 0.301341 0.461541 0.496468 0.571358 0.634562 0.824001 5.2111

0.208707 0.240321 0.2726 0.279218 0.32187 0.324701 0.347727 0.358566 0.363618 0.388386 0.433374 0.442211 0.443781 0.449855 0.456262 0.471138 0.491358 0.499054 0.522599 0.527317 0.536491 0.5548 0.573277 0.578386 0.584511 0.590896 0.618423 0.677795 0.690218 0.716121 0.737143 0.79503 1

0.073571553 0.078159256 0.08341054 0.063001976 0.078626479 0.054430627 0.050430084 0.034241512 0.012266396 0.01000721 0.027968514 0.009778562 0.01567828 0.036631851 0.057251856 0.069402931 0.076209789 0.09554026 0.099022648 0.121331402 0.139184783 0.147903064 0.156452232 0.178371068 0.199272619 0.219915085 0.219415071 0.187070016 0.201674144 0.202797436 0.208803127 0.17794251 0

D = Sup |Fn(X)-F0(X)| = 0.219915085 = 0.22 Berdasarkan Tabel 1.4 dapat diketahui bahwa nilai D sebesar 0.22 dengan P-value kurang dari 0.01. Nilai D (0.22) > Dtabel (0.196) dan Pvalue (<0,010) < α (0,05) maka dapat diambil keputusan H0 ditolak, sehingga didapatkan kesimpulan bahwa residual data pada jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin 7

pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur tidak memenuhi asumsi residual berdistribusi normal.

1.3

Pendeteksian Multikolinieritas Identifikasi multikolinieritas pada variable-variabel prediktor dapat

dilakukan dengan melihat nilai VIF (Variance Inflation Factor) pada masingmasing variabel prediktor. Berikut adalah nilai VIF dari setiap variabel prediktor yang didapatkan dengan menggunakan Software Minitab. Tabel 1.5 Nilai VIF

Variabel Persentase Sarana Kesehatan (X1) Persentase Tenaga Medis (X2) Persentase Penduduk Perempuan yang Umur Kawin Pertama ≤16 Tahun (X3) Persentase Penduduk dan Rumah Tangga (RT) Perempuan (X4) Persentase Daerah yang Berstatus Desa (X5)

Nilai VIF 9.733 7.953 1.825 1.135 2.518

Berdasarkan Tabel 1.5, dapat diketahui bahwa pada variabel bebas X1, X2, X3, X4 dan X5 tidak terdeteksi adanya multikolinieritas karena semua nilai nilai VIF dari ke-5 variabel prediktor tersebut nilainya kurang dari 10, sehingga dapat disimpulkan bahwa tidak terdapat kasus multikolinieritas pada data jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur.

1.4

Pemilihan Model Terbaik dengan Metode All Possible Regression Metode All Possible Regression digunakan untuk memilih persamaan

penduga yang terbaik dengan mempertimbangkan kriteria nilai R2 yang dicapai, nilai S2 atau jumlah kuadrat sisa regresi, nilai Statistik Cp. Hasil output dari metode all possible regression pada data jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur 8

kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur adalah sebagai berikut. Tabel 1.6 Hasil Metode All Possible Regression Antara Variabel Respon Dengan Variabel Prediktor

Vars

R-Sq

1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4 5

22.7 16.8 16.2 5.7 0.2 27.7 27.6 23.3 23.1 23.1 28.6 28.4 28.4 28.1 28.0 29.2 29.0 28.9 28.7 24.1 29.5

R-Sq (adj) 20.5 14.4 13.8 3.0 0.0 23.4 23.4 18.7 18.6 18.5 22.1 21.9 21.9 21.5 21.5 20.3 20.1 20.0 19.7 14.6 18.1

Mallows Cp 1 3.6 3.8 8.5 10.9 0.8 0.8 2.7 2.8 2.8 2.4 2.4 2.4 2.6 2.6 4.1 4.2 4.3 4.3 6.3 6.0

S 77.173 80.082 80.382 85.277 87.712 75.740 75.780 78.044 78.099 78.135 76.391 76.480 76.481 76.683 76.703 77.274 77.379 77.439 77.547 77.980 78.348

X 1 X

X 2

X 3

X 4

X 5 X

X X X X X X X X

X X X

X X X X X X X X

X X

X X X X

X X X X X X X

X X X X X

X X X X X X

X X X X X X X X X X

Berdasarkan Tabel 1.6 dapat diketahui bahwa terdapat beberapa model dari prosedur All Possible Regression yang dapat digolongkan menjadi persamaan regresi terbaik. Salah satu model regresi yang terbaik antara variabel respon dan variabel prediktor yaitu antara Y dengan X1, X3, dan X5. Nilai R-Sq dan R-Sq (adj) cukup tinggi yaitu 28.4 dan 21.9. Memiliki nilai S (kuadrat tengah sisa) yang kecil yaitu sebesar 76.480. Sedangkan nilai Cp-Mallows sebesar 2.4 yang hampir mendekati jumlah banyaknya variabel prediktor yang ditambah dengan intercept. Sehingga dalam hal ini model regresi terbaik dengan metode All Possible Regression adalah antara jumlah kasus kanker serviks (Y) dengan persentase sarana kesehatan (X1), persentase

penduduk perempuan yang umur kawin

pertama ≤16 tahun (X3) dan persentase daerah yang berstatus desa (X5). Model regresi terbaik dengan metode All Possible Regression adalah

y  43.5  266X1  0.8X3  0.851X 5 . 9

1.5

Pemilihan Model Terbaik dengan Metode Best Subset Regression Pemilihan model regresi terbaik dengan metode best subset regression

tidak jauh beda dengan all possible regression. Pada metode best subset, hanya ditampilkan persamaan regresi terbaik yang terpilih dengan kriterianya masingmasing. Hasil output dari metode best subset regression pada d data jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur adalah sebagai berikut. Tabel 1.7 Hasil Metode Best Subset Regression Antara Variabel Respon Dengan Variabel Prediktor

Vars

R-Sq

1 1 2 2 3 3 4 4 5

22.7 16.8 27.7 27.6 28.6 28.4 29.2 29.0 29.5

R-Sq (adj) 20.5 14.4 23.4 23.4 22.1 21.9 20.3 20.1 18.1

Mallows Cp 1 3.6 0.8 0.8 2.4 2.4 4.1 4.2 6.0

S 77.173 80.082 75.740 75.780 76.391 76.480 77.274 77.379 78.348

X 1 X

X 2

X 3

X 4

X X X X X X X

X X

X X X X X

X X

X 5 X X X X X X X X

Berdasarkan Tabel 1.7 dapat diketahui bahwa terdapat beberapa model dari prosedur Best Subset Regression yang dapat digolongkan menjadi persamaan regresi terbaik. Salah satu model regresi yang terbaik antara variabel respon dan variabel prediktor yaitu antara Y dengan X1, X3, dan X5. Nilai R-Sq dan R-Sq (adj) cukup tinggi yaitu 28.4 dan 21.9. Memiliki nilai S (kuadrat tengah sisa) yang kecil yaitu sebesar 76.480. Sedangkan nilai Cp-Mallows sebesar 2.4 yang hampir mendekati jumlah banyaknya variabel prediktor yang ditambah dengan intercept. Sehingga dalam hal ini model regresi terbaik dengan metode Best Subset Regression adalah antara jumlah kasus kanker serviks (Y) dengan persentase sarana kesehatan (X1), persentase


pertama ≤16 tahun (X3) dan persentase daerah yang berstatus desa (X5). Model regresi

terbaik

dengan

metode

Best

y  43.5  266X1  0.8X3  0.851X 5 .

10

Subset

Regression

adalah

1.6

Pemilihan Model Terbaik dengan Metode Forward Selection Pemilihan model terbaik dengan metode forward selection yaitu dengan

menambahkan satu per satu variabel prediktor yang paling signifikan pada model. Berikut merupakan analisis untuk menentukan model regresi terbaik dengan menggunakan metode forward selection pada data jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur. Tabel 1.8 Hasil Metode Forward Selection Antara Variabel Respon Dengan Variabel Prediktor

Persentase Sarana Kesehatan (X1) Constant 7.934 X1 332 P-value 0.003 S 77.2 R-Sq 22.73 R-Sq (adj) 20.52 Mallows Cp 1

Berdasarkan Tabel 1.8 dapat diketahui bahwa pada metode forward selection tahap pertama, nilai yang paling signifikan adalah X1 dengan P-value sebesar 0.003, sehingga dalam hal ini model regresi terbaik dengan metode forward selection adalah persentase

sarana

antara jumlah kasus kanker serviks (Y) dengan

kesehatan

(X1).

Model

regresi

terbaiknya

adalah

y  7.934 332X1 .

1.7

Pemilihan Model Terbaik dengan Metode Backward Elimination Pemilihan model terbaik dengan metode backward elimination yaitu

dengan meregresikan variabel respon dengan semua variabel prediktor, dan secara bertahap mengurangi banyaknya peubah di dalam persamaan sampai suatu keputusan dicapai untuk menggunakan persamaan yang diperoleh. Berikut merupakan

analisis

untuk

menentukan

model

regresi

terbaik

dengan

menggunakan metode backward elimination pada data jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk

11

perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur. Tabel 1.9 Hasil Metode Backward Elimination Antara Variabel Respon Dengan Variabel Prediktor

Step

1

P-value

0.613

P-value

0.722

P-value

0.559

P-value

0.648

P-value S R-sq Mallows Cp

0.136 78.3 29.46 6

2 X1 0.026 X2 X3 0.572 X4 0.582 X5 0.124 77.3 29.17 4.1

3

4

5

0.028

0.031

0.003

0.139 75.8 27.62 0.8

77.2 22.73 1

0.542

0.124 76.5 28.45 2.4

Berdasarkan Tabel 1.9 dapat diketahui bahwa pada metode backward elimination tahap pertama, variabel yang paling tidak signifikan adalah X2 dengan P-value sebesar 0.722 sehingga X2 dikeluarkan dari model. Pada metode backward elimination tahap kedua, variabel yang paling tidak signifikan adalah X4 dengan P-value sebesar 0.582 sehingga X4 dikeluarkan dari model. Pada metode backward elimination tahap ketiga, variabel yang paling tidak signifikan adalah X3 dengan P-value sebesar 0.542 sehingga X3 dikeluarkan dari model. Pada metode backward elimination tahap keempat, variabel yang paling tidak signifikan adalah X5 dengan P-value sebesar 0.139 sehingga X5 dikeluarkan dari model. Pada tahap terakhir, nilai yang signifikan adalah X1 dengan P-value sebesar 0.003. Oleh karena itu, dengan menggunakan metode backward elimination variabel yang masuk ke dalam model terbaik adalah jumlah kasus kanker serviks (Y) dengan persentase sarana kesehatan (X1). Model regresi terbaiknya adalah y  7.934 332X1 .

1.8

Pemilihan Model Terbaik dengan Metode Stepwise Regression Stepwise merupakan gabungan antara metode forward dengan metode

backward, variabel yang pertama kali dimasukan adalah variabel yang korelasinya tertinggi dan signifikan dengan variabel dependent, variabel yang masuk kedua

12

adalah variabel yang korelasi parsialnya paling tinggi dan masih signifikan, setelah variabel tertentu masuk kedalam model maka variabel yang lain yang ada didalam model dievaluasi. Jika ada variabel yang tidak signifikan maka variabel tersebut dikeluarkan. Berikut merupakan analisis untuk menentukan model regresi terbaik dengan menggunakan metode stepwise regression pada data jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur. Tabel 1.10 Uji Korelasi Antara Y dan Variabel Prediktor

Y

X1 X2 X3 X4 X5 r 0.477 0.402 -0.238 -0.043 -0.410 P-value 0.003 0.014 0.157 0.801 0.012 Berdasarkan Tabel 1.10 dapat diketahui bahwa korelasi yang paling

siginifikan dengan nilai korelasi tertinggi adalah antara jumlah kasus kanker serviks (Y) dengan persentase sarana kesehatan (X1) dengan nilai Pearson Correlation sebesar 0.477 dan P-value sebesar 0.003. Oleh karena itu, di lanjutkan pada uji korelasi parsial untuk mengetahui apakah ada variabel prediktor lain yang signifikan dengan menggunakan persentase sarana kesehatan (X1) sebagai variabel kontrol. Tabel 1.11 Uji Korelasi Parsial

Variabel Kontrol X1

X2 X3 X4 X5 Y r -0.072 -0.065 0.081 -0.252 P-value 0.678 0.707 0.639 0.139 Berdasarkan Tabel 1.11 dapat diketahui bahwa tidak ada nilai yang

signifikan dari variabel prediktor X2, X3, X4 dan X5 terhadap Y dengan X1 sebagai variabel kontrol. Oleh karena itu, dengan menggunakan metode stepwise regression, variabel yang masuk ke dalam model terbaik adalah jumlah kasus kanker serviks (Y) dengan persentase sarana kesehatan (X1). Model regresi terbaiknya adalah y  7.934 332X1 .

13

BAB II KESIMPULAN DAN SARAN 2.2

Kesimpulan Berdasarkan analisis dan pembahasan pada Bab I dapat diperoleh

kesimpulan sebagai berikut. 1.

Nilai rata-rata dari jumlah kasus kanker serviks di tiap kabupaten/kota provinsi Jawa Timur pada tahun 2010 sebesar 45.6 kasus, nilai maksimum sebesar 479 kasus dan nilai minimum sebesar 0 kasus dengan nilai keragaman sebesar 86.6. Variabel prediktor persentase daerah yang berstatus desa di tiap kabupaten/kota provinsi Jawa Timur memiliki nilai rata-rata dan nilai keragaman terbesar.

2.

Pemeriksaan dan pengujian asumsi residual IIDN menunjukkan bahwa residual data pada jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur telah memenuhi asumsi residual identik dan independen namun tidak memenuhi asumsi residual berdistribusi normal.

3.

Tidak terdapat kasus multikolinieritas pada data jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur tahun 2010 berdasarkan faktor persentase sarana kesehatan, persentase tenaga medis, persentase penduduk perempuan yang umur kawin pertama ≤16 tahun, persentase penduduk dan Rumah Tangga (RT) perempuan dan persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur.

4.

Model regresi terbaik dengan metode All Possible Regression adalah antara jumlah kasus kanker serviks (Y) dengan persentase sarana kesehatan (X1), persentase


pertama ≤16 tahun (X3) dan persentase daerah yang berstatus desa (X5). Model regresi terbaik dengan metode All Possible Regression adalah

y  43.5  266X1  0.8X3  0.851X 5 .

14

5.

Model regresi terbaik dengan metode Best Subset Regression adalah antara jumlah kasus kanker serviks (Y) dengan persentase sarana kesehatan (X1), persentase


pertama ≤16 tahun (X3) dan persentase daerah yang berstatus desa (X5). Model regresi terbaik dengan metode Best Subset Regression adalah

y  43.5  266X1  0.8X3  0.851X 5 . 6.

Model regresi terbaik dengan metode Forward Selection adalah jumlah kasus kanker serviks (Y) dengan persentase sarana kesehatan (X1). Model regresi terbaiknya adalah y  7.934 332X1 .

7.

Model regresi terbaik dengan metode Backward Elimination adalah jumlah kasus kanker serviks (Y) dengan persentase sarana kesehatan (X1). Model regresi terbaiknya adalah y  7.934 332X1 .

8.

Model regresi terbaik dengan metode Stepwise Regression adalah jumlah kasus kanker serviks (Y) dengan persentase sarana kesehatan (X1). Model regresi terbaiknya adalah y  7.934 332X1 .

2.2

Saran Diharapkan dengan adanya percobaan ini, mahasiswa lebih teliti dan

cermat pada mengolah data yang ada. Selain itu, saran untuk percobaan selanjutnya adalah harus lebih disiplin waktu dan tidak menunda-nunda pekerjaan.

15

LAMPIRAN Lampiran 1 Data Jumlah Kasus Kanker Serviks di Tiap Kabupaten/Kota Provinsi Jawa Timur Tahun 2010 dengan Variabel Prediktornya No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35

Kabupaten/Kota Pacitan Ponorogo Trenggalek Tulungagung Blitar Kediri Malang Lumajang Jember Banyuwangi Bondowoso Situbondo Probolinggo Pasuruan Sidoarjo Mojokerto Jombang Nganjuk Madiun Magetan Ngawi Bojonegoro Tuban Lamongan Gresik Bangkalan Sampang Pamekasan Sumenep Kota Kediri Kota Blitar Kota Malang Kota Probolinggo Kota Pasuruan Kota Mojokerto

Y 0 25 19 75 15 11 51 18 0 30 54 0 86 0 26 0 0 0 74 39 46 61 0 30 63 27 15 0 4 58 53 479

X1 0.02 0.12 0.06 0.16 0.06 0.1 0.24 0.1 0.2 0.14 0.06 0.04 0.08 0.06 0.32 0.16 0.14 0.12 0.02 0.04 0.04 0.12 0.06 0.08 0.12 0.02 0.02 0.02 0.04 0.16 0.08 0.18

X2 0.92 1.15 1.08 1.28 1.14 1.88 2.14 1.71 2.07 1.73 1.62 0.2 1.06 1.55 2.19 1.55 2.03 1.34 1.4 1.04 1.37 1.45 1.01 1.47 1.78 1.01 0.74 0.98 1.09 0.83 0.49 1.36

X3 21.78 24.82 30.48 22.34 22.95 20.71 30.05 34.5 40.79 31.04 58.78 62.7 59.27 33.63 13.92 24.31 22.28 24.59 29.47 24.76 25.72 36.35 34.67 37.44 22.16 37.43 47.45 41.8 47.79 12.12 14.98 17.75

X4 49.87 51.12 50.1 50.85 49.16 50.43 49.62 50.79 50.67 49.16 50.49 50.33 50.14 50.97 49.31 50.25 50.69 49.4 51.41 51.91 51.75 50.29 50.57 51.84 50.07 53.33 51.39 51.21 53.12 50.66 48.49 50.6

X5 88.89 78.36 82.17 66.42 78.63 69.48 70 86.63 74.6 71.43 84.93 75.74 77.27 70.96 24.08 66.45 52.94 69.72 81.07 69.79 93.09 86.51 86.28 89.24 60.96 86.48 93.55 86.77 89.46 0 0 5.26

0 5 39

0.04 0.02 0.12

0.82 0.79 0.55

27.28 21.88 13.05

49.78 50.74 50.76

27.59 5.88 0

36 37

Kota Madiun Kota Surabaya

23 262

0.11 0.73

0.85 7.52

13.32 12.16

53.12 50.38

0 0

Keterangan : Y = Jumlah kasus kanker serviks di tiap kabupaten/kota provinsi Jawa Timur X1 = Persentase sarana kesehatan di tiap kabupaten/kota provinsi Jawa Timur X2 = Persentase tenaga medis di tiap kabupaten/kota provinsi Jawa Timur X3 = persentase penduduk perempuan yang umur kawin pertama ≤16 tahun di tiap kabupaten/kota provinsi Jawa Timur X4 = Persentase penduduk dan Rumah Tangga (RT) perempuan di tiap kabupaten/kota provinsi Jawa Timur X5 = Persentase daerah yang berstatus desa di tiap kabupaten/kota provinsi Jawa Timur

Lampiran 2 Output Statistika Deskriptif Descriptive Statistics: y, x1, x2, x3, x4, x5 Variable y x1 x2 x3 x4 x5

N 37 37 37 37 37 37

Mean 45.6 0.1135 1.438 29.64 50.669 60.83

StDev 86.6 0.1243 1.132 13.19 1.077 32.62

Minimum 0.0 0.0200 0.200 12.12 48.490 0.00

Median 25.0 0.0800 1.280 25.72 50.600 71.43

Maximum 479.0 0.7300 7.520 62.70 53.330 93.55

Lampiran 3 Output Uji Glejser Regression Analysis: residual abs versus x1, x2, x3, x4, x5 The regression equation is residual abs = - 194 + 105 x1 - 16.6 x2 + 0.31 x3 + 5.62 x4 0.820 x5 Analysis of Variance Source Regression Residual Error Total

DF 5 31 36

SS 27286 109452 136737

MS 5457 3531

F 1.55

P 0.205

Lampiran 4 Output Durbin Watson Statistic Regression Analysis: y versus x1, x2, x3, x4, x5 Durbin-Watson statistic = 2.02816

Lampiran 5 Output VIF Regression Analysis: y versus x1, x2, x3, x4, x5 The regression equation is y = - 257 + 168 x1 + 11.7 x2 + 0.79 x3 + 6.0 x4 - 0.973 x5 Predictor Constant x1 x2 x3 x4 x5

Coef -256.5 167.6 11.66 0.790 5.96 -0.9732

SE Coef 655.3 327.7 32.52 1.338 12.91 0.6352

T -0.39 0.51 0.36 0.59 0.46 -1.53

P 0.698 0.613 0.722 0.559 0.648 0.136

VIF 9.733 7.953 1.825 1.135 2.518

Lampiran 6 Output Metode All Possible Regression Best Subsets Regression: y versus x1, x2, x3, x4, x5 Response is y Vars 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4 5

R-Sq 22.7 16.8 16.2 5.7 0.2 27.7 27.6 23.2 23.1 23.1 28.6 28.4 28.4 28.1 28.0 29.2 29.0 28.9 28.7 24.1 29.5

R-Sq(adj) 20.5 14.4 13.8 3.0 0.0 23.4 23.4 18.7 18.6 18.5 22.1 21.9 21.9 21.5 21.5 20.3 20.1 20.0 19.7 14.6 18.1

Mallows Cp 1.0 3.6 3.8 8.5 10.9 0.8 0.8 2.7 2.8 2.8 2.4 2.4 2.4 2.6 2.6 4.1 4.2 4.3 4.3 6.3 6.0

S 77.173 80.082 80.382 85.277 87.712 75.740 75.780 78.044 78.099 78.135 76.391 76.480 76.481 76.683 76.703 77.274 77.379 77.439 77.547 79.980 78.348

x x x x x 1 2 3 4 5 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X

Lampiran 7 Output Metode Best Subset Regression Best Subsets Regression: y versus x1, x2, x3, x4, x5 Response is y Vars 1 1 2 2 3 3 4 4 5

R-Sq 22.7 16.8 27.7 27.6 28.6 28.4 29.2 29.0 29.5

R-Sq(adj) 20.5 14.4 23.4 23.4 22.1 21.9 20.3 20.1 18.1

Mallows Cp 1.0 3.6 0.8 0.8 2.4 2.4 4.1 4.2 6.0

S 77.173 80.082 75.740 75.780 76.391 76.480 77.274 77.379 78.348

x x x x x 1 2 3 4 5 X X X X X X X X X X X X X X X X X X X X X X X X X

Lampiran 8 Output Metode Forward Selection Stepwise Regression: y versus x1, x2, x3, x4, x5 Forward selection.

Alpha-to-Enter: 0.05

Response is y on 5 predictors, with N = 37 Step Constant

1 7.934

x1 T-Value P-Value

332 3.21 0.003

S R-Sq R-Sq(adj) Mallows Cp

77.2 22.73 20.52 1.0

Lampiran 9 Output Metode Backward Elimination Stepwise Regression: y versus x1, x2, x3, x4, x5 Backward elimination.

Alpha-to-Remove: 0.05

Response is y on 5 predictors, with N = 37 Step Constant

1 -256.525

2 -313.445

3 43.512

4 56.445

5 7.934

x1 T-Value P-Value

168 0.51 0.613

277 2.34 0.026

266 2.30 0.028

256 2.26 0.031

332 3.21 0.003

x2 T-Value P-Value

12 0.36 0.722

x3 T-Value P-Value

0.8 0.59 0.559

0.8 0.57 0.572

0.8 0.62 0.542

x4 T-Value P-Value

6 0.46 0.648

7 0.57 0.582

x5 T-Value P-Value

-0.97 -1.53 0.136

-0.86 -1.58 0.124

-0.85 -1.58 0.124

-0.66 -1.52 0.139

S R-Sq R-Sq(adj) Mallows Cp

78.3 29.46 18.08 6.0

77.3 29.17 20.31 4.1

76.5 28.45 21.94 2.4

75.8 27.62 23.37 0.8

77.2 22.73 20.52 1.0

Lampiran 10 Output Uji Korelasi Correlations Y y

Pearson Correlation

x1 1

Sig. (2-tailed) N x1

Pearson Correlation Sig. (2-tailed) N

x2

37 .477

**

x2

x4

x5

*

-.238

-.043

-.410

.003

.014

.157

.801

.012

37

37

37

37

37

1

**

*

-.235

.000

.018

.162

.006

.477

**

x3

.003

.402

.901

-.388

-.444

*

**

37

37

37

37

37

37

*

**

1

-.240

-.110

-.190

.152

.518

.260

Pearson Correlation

.402

Sig. (2-tailed)

.014

.901

.000

N x3


x4


x5

Pearson Correlation

37

37

37

37

37

-.238

-.388

*

-.240

1

.184

.157

.018

.152

37

37

37

-.043

-.235

.801 37

N

.659

.000

37

37

37

-.110

.184

1

.180

.162

.518

.274

37

37

37

37

37

**

-.190

**

.180

1

.012

.006

.260

.000

.287

37

37

37

37

37

*

-.444

.659

.287

37

Lampiran 11 Output Uji Korelasi Parsial Correlations Control Variables x1

y

x2

Y Correlation

x5 .081

-.252

Significance (2-tailed)

.

.678

.707

.639

.139

df

0

34

34

34

34

-.072

1.000

.274

.241

.539

.678

.

.106

.156

.001

34

0

34

34

34

-.065

.274

1.000

.104

.590

.707

.106

.

.546

.000

34

34

0

34

34

Correlation

.081

.241

.104

1.000

.087


.639

.156

.546

.

.614

34

34

34

0

34

-.252

.539

.590

.087

1.000

.139

.001

.000

.614

.

34

34

34

34

0

Correlation Significance (2-tailed) df

df x5

x4

-.065

df

x4

x3

-.072


x3

x2

1.000

Correlation

Correlation Significance (2-tailed) df

**

.274

-.410

Sig. (2-tailed)

37

pemilihan model regresi terbaik

Recommend Documents