SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
1
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
ANALISIS MULTIVARIAT
11
Proses analisis multivariat dengan menghubungkan beberapa variabel independen dengan satu variabel dependen pada waktu yang bersamaan. Jumlah sampel dalam analisis multivariat sangat penting diperhatikan, sebaiknya jangan terlalu sedikit, pedoman yang berlaku adalah setiap variabel minimal diperlukan 10 responden. Bila dalam penelitian terdapat 10 variabel, maka diperlukan jumlah sampel minimal = 10 x 10 responden = 100 responden. Dari analisis multivariat kita dapat mengetahui: a. Variabel independen mana m ana yang paling besar pengaruhnya terhadap variabel dependen? b. Apakah
variabel independen berhubungan dengan variabel dependen
dipengaruhi variabel lain atau tidak? c. Bentuk hubungan beberapa variabel independen dengan variabel dependen, apakah berhubungan langsung atau pengeruh tidak langsung. Prosedur pengujian tergantung dari jenis data yang diuji apakah katagori atau numerik. Berikut adalah gambaran secara garisbesar beberapa analisis statistik yang dapat digunakan untuk analisis multivariat: Variabel Independen
Variabel Dependen
Jenis Uji
Numerik
Uji Regresi Linier
Katagori
Numerik
ANOVA
Katagori
Katagori
Uji Regresi Logistik
Kontinyu
Katagori
Uji Diskriminan
Numerik/Katgori
Numerik waktu
Uji Regresi Cox
Numerik (minimal 1 variabel numerik)
(dapat dengan numerik)
2
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
ANALISIS MULTIVARIAT
11
Proses analisis multivariat dengan menghubungkan beberapa variabel independen dengan satu variabel dependen pada waktu yang bersamaan. Jumlah sampel dalam analisis multivariat sangat penting diperhatikan, sebaiknya jangan terlalu sedikit, pedoman yang berlaku adalah setiap variabel minimal diperlukan 10 responden. Bila dalam penelitian terdapat 10 variabel, maka diperlukan jumlah sampel minimal = 10 x 10 responden = 100 responden. Dari analisis multivariat kita dapat mengetahui: a. Variabel independen mana m ana yang paling besar pengaruhnya terhadap variabel dependen? b. Apakah
variabel independen berhubungan dengan variabel dependen
dipengaruhi variabel lain atau tidak? c. Bentuk hubungan beberapa variabel independen dengan variabel dependen, apakah berhubungan langsung atau pengeruh tidak langsung. Prosedur pengujian tergantung dari jenis data yang diuji apakah katagori atau numerik. Berikut adalah gambaran secara garisbesar beberapa analisis statistik yang dapat digunakan untuk analisis multivariat: Variabel Independen
Variabel Dependen
Jenis Uji
Numerik
Uji Regresi Linier
Katagori
Numerik
ANOVA
Katagori
Katagori
Uji Regresi Logistik
Kontinyu
Katagori
Uji Diskriminan
Numerik/Katgori
Numerik waktu
Uji Regresi Cox
Numerik (minimal 1 variabel numerik)
(dapat dengan numerik)
2
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Dalam melakukan analisis multivariat kita harus mengetahui terlebih dahulu mengenai konsep konfounding dan Interaksi.
a.Konfounding Konfounding
merupakan
kondisi
bias
dalam
mengestimasi
efek
pajanan/expose terhadap kejadian penyakit/masalah kesehatan, akibat dari perbandingan yang tidak seimbang antara kelompok expose dengan kelompok non expose. Masalah ini terjadi dikarenakan pada dasarnya sudah ada perbedaan risiko terjadinya penyakit pada kelompok expose dengan kelompok non expose. Artinya risiko terjadinya penyakit pada kedua kelompok itu berbeda meskipun expose dihilangkan pada kedua kelompok tersebut. Satu variabel disebut konfounding bila variabel tersebut merupakan faktor risiko terjadinya penyakit dan memiliki hubungan dengan expose. Seorang ahli statistik menyatkan bahwa suatu variabel dikatakan konfounding jika variabel tersebut merupakan faktor risiko untuk terjadinya penyakit(outcome) dan berhubungan dengan variabel independen tapi tidak merupakan hasil dari variabel independen.
b.Interaksi Interaksi atau efek modifikasi adalah heterogenitas efek dari satu expose Pada tingkat expose yang lain. Jadi efek efek satu expose pada kejadian penyakit berbeda pada kelompok expose lainnya. Tidak adanya modifikasi efek, berarti efek expose homogen. Modisikasi efek merupakan konsep yang penting dalam analisis karena pada saat analisis kita harus menentukan apakah akan melaporkan efek bersama (yang terkontrol konfounder) atau efek yang terpisah untuk masing-masing strata. Pada analisis multivariat, jika ditemukan ditemukan adanya interaksi antar variabel expose dengan variabel lainnya, maka nilai koefisien, misalnya OR, harus dilaporkan secarfa terpisah menurut strata dari variabel tersebut. Nilai OR yang tertera pada variabel menjadi tidak berlaku dan nilai OR untuk masing-masing strata harus dihitung 3
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
ANALISIS
12
REGRESI LINIER GANDA Analisis Multiple regression Linear atau sering disebut juga analisis regresi
linier ganda merupakan perluasan analiss Simple Linear Regression (regresi linier sederhana). Dalam analisis Simple Linear Regression hanya ada satu variabel independen (variabel bebas) dihubungkan dengan satu variabel dependen (terikat).. Sedangkan pada Multiple regression Linear merupakan analisis hubugan antara beberapa variabel independen dengan satu variabel dependen. Misalkan untuk mengetahui faktor-faktor yang berhubungan dengan tekanan darah, dilakukan analisis dengan melibatkan variabel independen: umur, berat badan, dan jenis kelamin. Dalam
regresi
linier
ganda
variabel
dependennya
harus
numerik
sedangkan variabel independen boleh semuanya numerik dan boleh juga campuran numerik dan katagorik. Model persamaan regresi linier ganda merupakan perluasan regresi linier sederhana, yaitu: Y = a + b1X1 + b2X2 + …. + bk Xk + e
1. Asumsi Regresi Linier Seperti pada umumnya pengujian statistik, dari analisis regresi linier ganda diharapkan dapat memberikan informasi yang lebih banyak bukan sekedar diskripsi data teramati. Kita tentu ingin menarik inferensi (menggeneralisasi) tentang hubungan variabel-variabel dalam populasi asal dari sampel diambil. Bagaimanakanh hubungan antara umur, berat badan dan jenis kelamin ‘pada semua orang (populasi)’, tidak hanya seperti yang teramati di sejumlah orang pada sampel?. Oleh karena itu agar inferensi kita valid maka dalam analisis regresi dianjurkan untuk mengikuti kaidah-kaidah yang dipersyaratkan dalam analisis regresi. Dengan kata lain, setiap melakukan analisis Multiple regression 4
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Linear harus memenuhi asumsi/persyaratan yang ditetapkan. Adapun asumsi yang digunakan dalam Multiple regression Lineari sebagai berikut a. Asumsi Eksistensi (Variabel Random) Untuk tiap nilai dari variabel X (variabel independen), variabel Y (dependen) adalah variabel random yang mempunyai mean dan varian tertentu. Asumsi ini berkaitan dengan teknik pengambilan sampel. Untuk memenuhi asumsi ini, sampel yang diambil harus dilakukan secara random. Cara mengetahui asumsi eksistensi dengan cara melakukan analisis deskriptif vareiabel residual dari model, bila residual menunjukkan adanya mean dan sebaran (varian ata satandar deviasi) maka asumsi eksistensi terpenuhi. b. Asumsi Independensi Suatu keadaan dimana masing-masing nilai Y bebas satu sama lain. Jadi nilai dari tiap-tiap individu saling berdiri sendiri. Tidak diperbolehkan nilai observasi yang berbeda yang diukur dari satu individu diukur dua kali. Untuk mengetahui asuamsi ini dilakukan dengan cara mengeluarkan uji Durbin Watson, bila nilai Durbin –2 s.d. +2 berarti asumsi independensi terpenuhi, sebaliknya bila nilai Durbin < -2 atau > +2 berarti asumsi tidak terpenuhi c. Asumsi Linieritas Nilai mean dari variabel Y untuk suatu kombinasi X1, X2, X3, …, Xk terletak pada garis/bidang linier yang dibentuk dari persamaan regresi. Untuk mengetahui asumsi linieritas dapat diketahui dari uji ANOVA (overall F test) bila hasilnya signifilan (p value
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
e. Asumsi Normalitas Variabel Y mempunyai distribusi normal untuk setiap pengamatan variabel X. dapat diketahui dari Normal P-P Plot residual, bila data menyebar di sekitar garis diagonal dan mengikuti arah garis diagonal, maka model regresi memenuhi asumsi model regresi tidak memenuhi asumsi normalitas.
2. Kegunaan Analisis Regresi Ganda Tujuan analisis regresi linier ganda adalah untuk menemukan model regresi yang paling sesuai menggambarkan faktor-faktor yang berhubungan dengan variabel dependen. Pada prinsipnya, model regresi ganda dapat berguna untuk dua hal: a. Prediksi, memperkirakan variabel dependen dengan menggunakan informasi yang ada pada sebuah atau beberapa variabel independen. Disini dapat diketahui secara probabilitas nilai variabel dependen bila seseorang/individu mempunyai
suatu set variabel dengan independen tertentu. Misalnya kita
melakukan analisis variabel independen umur, BB dan jenis kelamin dihubungkan dengan variabel dependen tekanan darah. Dari hasil regresi, seseorang iindividu dapat diperkirakantekanan darahnya pada umur, berat badan dan jenis kelamin tertentu. b. Estimasi,
menguantifikasihubungan
sebuah
atau
beberapa
variabel
independen dengan sebuah variabel dependen. Pada fungsi ini regresi dapat digunakan untuk mengetahui variabel indepeden apa saja yang berhubungan dengan variabel dependen. Selain itu kita juga dapat mengetahui seberapa besar hubungan masing-masing independen terhadap variabel independen lainnya. Dari analisis ini dapat diketahui
variabel mana yang paling
besar/dominan mempengaruhi variabel dependen, yang ditunjukkan dari koefisien regresi (b) yang sudah distandardisasi yaitu nilai beta.
6
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
3. Pemodelan Satu hal yang penting dalam regresi ganda adalah bagaimana memilih variabel independen sehingga terbentuk sebuah model yang paling sesuai menjelaskan/ mengambarkan variabel dependen yang sesungguhnya dalam alam (populasi). Dalam pembuatan model seringkali dijumpai pandangan yang kurang tepat yaitu “memasukkan semua/sebanyak mungkin variabel independen ke dalam model”. Alasannya, dengan memasukkan sebanyak mungkin variabel independen ke dalam model, maka variabel dependen diharapkan diprediksi dengan sempurna. Perlu diketahui bahwa penambahan variabel independen tidak selalu meningkatkan kemampuan prediksi variabel independen terhadap variabel dependen, sebab semakin banyak variabel independen (lebih-lebih variabel yang tidak relevan) mengakibatkan makin besarnya nilai standar error (Se). disamping itu, model dengan banyak variabel seringkali malah menyulitkan dalam interpretasi. Berdasarkanpertimbangan
tersebut
pemilihan
variabel
independen
hendaknya dengan memperhatikan aspek statistik dan substansi. Model yang dihasilkan diharapkan model yang PARSIMONI, artinya variabel yang masuk dalam model sebaiknya yang sedikit jumlahnya, namun cukup baik untuk menjelaskan faktor-faktor penting yang berhubngan dengan variabel dependen. Banyak Kriteria yang dapat digunakan untuk memilih variabel masuk dalam model, salah satu kriteria yang sering digunakan adalah melihat perubahan R 2 (R Square ). Namun penggunaan kriteria ini perlu hati-hati, karena setiap penambahan satu variabel independen akan meningkatkan R 2 walaupun variabel tersebuttidak cukup penting. Oleh karena itu model yang digunakan adalah model dengan nilai R 2 yang besar namun variabel independennya dengan jumlah sedikit. Berikut langkah-langkah dalam pemodelan regresi linier ganda: 1). Melakukan analisis bivariat untuk menentukan variabel yang menjadi kandidat model. Masing-masing variabel independen dihubungkan dengan variabel 7
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
dependen (bivariat), bila hasil uji bivariat mempunyai nilai p<0,25, maka variabel tersebut masuk dalam model multivariat. Untuk variabel yang p value-nya > 0,25 namun secara substansi penting, maka variabel tersebut dapat masuk ke multivariat. 2) Lakukan analisis secara bersamaan, lakukan pemilihan variabel yang masuk dalam model. Ada beberapa metode untuk melakukan pemilihan variabel independen dalam analisis multivariat regresi linier ganda, yaitu: a). ENTER, memasukkan semua variabel independen dengan serentak satu langkah, tanpa melewati kriteria kemanaan statistik tertentu. Metode
ini
yang tepat/sering digunakan, karena dalam pemodelan kita dapat melakukan pertimbangan aspek substansi. b). FORWARD, measukkan satu persatu variabel dari hasil pengkorelasian variabel dan memenuhi kriteria kemaknaan statistik untuk masuk ke dalam model, sampai semua variabel yang memenuhi kriteria tersebut masuk ke dalam model. Variabel yang masuk pertama kali adalah variabel yang mempunyai korelasi parsial terbesar dengan variabel dependen dan yang memenuhi kriteria tertentu untuk dapat masuk model. Korelasi parsial adalah adalah korelasi antara variabel independen dengan dependen, kriteria variabel yang dapat masuk P-in (PIN) adalah 0,005 artinya variabel yang dapat masuk model bila variabel
tersebut
mempunyai nilai P lebih kecil atau sama dengan 0,05. c). BACKWARD, meamasukkan semua variabel ke dalam model, tetapi kemudian satu persatu
variabel independen dikeluarkan dari model
berdasarkan kriteria kemaknaan tertentu, variabel yang pertama kali dikeluarkan adalah variabel yang mempunyai korelasi parsial terkecil dengan variabel dependen. Kriteria pengeluaran atau P-out (POUT) adalah 0,10, artinya variabel yang mempunyai nilai P lebih besar atau sama dengan 0,10 dikeluarkan dari model. d). STEPWISE, model ini merupakan kombinasi antara metode backward dan Forward. Seperti halnya forward, metode Stepwise dimulai dari tanpa 8
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
variabel
sama
sekali
di
dalam
model.
Lalu
satu
variabel
hasil
pengkorelasian variabel dimasukkan ke dalam model. Lalu satu persatu variabel hasil
pengkorelasian
dimasukkan
ke dalam model
dan
dikeluartkan dari model dengan kriteria tertentu. Variabel yang pertama masuk sama dengan metode forward yakni variabel yang mempunyai korelasi parsial terbesar. Selanjutnya setelah masuk, variabel pertama ini diperiksa lagi apakah harus dikeluarkan dari model menurut kriteria pengeluaran seperti metode backward. e). REMOVE, mengeluarkan semua variabel independen dengan serentak satu langkah, tanpa melewati kriteria kemaknaan statistik tertentu.
3) Melakukan diagnostik regresi linier, a). Melakukan pengujian terhadap kelima asumsi. b). Melakukan pengujian adanya kolinearitas. Kolinearitas terjadi bila antar variabel independen terjadi saling hubungan yang kuat. Untuk mengetahui adanya kolinearitas dapat dilihat dai nilai koefisien korelasi ®, bila nilai r lebih tinggi dari 0,8 maka terjadi kolinearitas. Selain itu dapat diketahui dari nilai VIF atau tolerance, bila nilai VIF > 10, atau tolerance sekitar 1 (satu) maka model terjadi kolinearitas.
4). Melakukan analisis interaksi. Setelah memperoleh model yang memuat variabel-variabel penting, maka langkah selanjutnya adalah memeriksa adanya interaksi antar variabel independen. Interaksi merupakan keadaan dimana hubungan antara satu variabel independen dengan dependen berbeda menurut tingkat variabel independen yang lain.
5). Penilaian reliabilitas model. Model regresi yang sudah terpilih perlu dicek reliabilitasnya dengan cara membagi (split) sampel ke dalam dua kelompok. Untuk masing-masing sampel dibuat model dengan variabel yang sama,
9
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
kemudian
bandingkan
antara
model
1
dan
model
2,
bila
hasilnya
sama/hampir sama maka model regresi reliabel. Bila model reliabel maka seluruh sampel dapat digunakan untuk pembuatan model.
10
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
KASUS: REGRESI LINIER GANDA Sebagai
latihan
kita
melakukan
analisis
penelitian
“faktor-faktor
yang
berhubungan dengan berat badan bayi”. Gunakan/aktifkan file data LBW.SAV. Variabel independennya meliputi berat badan ibu dlm pounds (BWT), umur ibu(AGE), riwayat hipetensi(HT), riwayat merokok(SMOKE), frekuensi mengalami prematur (PTL) dan frekuensi melakukan ANC (FTV). Variabel dependennya berat badan bayi (BWT). Kode variabel pada file data : LBW.SAV Nama
Definisi Operasional
Id
Nomor Identitas
Low
Kondisi bayi dalam klasifikasi BBLR
Hasil Ukur
0 = ≥ 2500 g 1 = < 2500 g
Age
Umur ibu
tahun
Lwt
Berat ibu pada saat menstruasi terakhir
pounds
Race
Suku bangsa/ras
1= putih 2= hitam 3 = lainnya
Smoke
Kebiasaan merokok selama hamil
0 = tidak 1 = ya
Ptl
Riwayat mengalami prematur
0 = tidak 1 = ya
Ht
Riwayat menderita hipertensi
0 = tidak 1 = ya
Ui
Terjadi/mengalami iritability Uterine
0 = tidak 1 = ya
Ftv
Frekuensi periksa hamil pada trimester pertama
0 ,1, 2 dst..
Bwt
Berat badan bayi
gram
11
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Data selengkapnya ada di lampiran:
A. Langkah pertama pemodelan: SELEKSI BIVARIAT Seleksi bivariat masing-masing variabel independen dengan variabel dependen. Variabel yang dapat masuk model multivariat adalah variabel yang pada analisis bivariatnya mempunyai nilai p (p value) < 0,25. Namun ketentuan p value<0,25 ini tidaklah harus dipenuhi manakala dijumpai ada suatu variabel yang walaupun p value-nya > 0,25 karena secara substansi sangat penting berhubungan dengan variabel dependen, maka variabel tersebut dapat diikutkan dalam model multivariat. Uji yang digunakan pada analisis bivariat tergantung dari variabel yang digunakan, bila : variabel independennya numerik -> uji korelasi, bila independennya katagorik -> uji t atau uji anova. a. Bivariat uji korelasi : melakukan analisis bivariat untuk variabel independen berjenis numerik: variabel berat badan ibu, umur ibu, frekuensi prematur, frekuensi anc : Langkahnya : 1. Klik ‘Analysis’, sorot ke ‘Correlate’, sorot dan klik ‘Bivariate’ 2. Muncul dilayar menu ‘Bivariate Correlations’ 3. Pada kotak Variables, isikan semua variabel numerik baik untuk variabel independen (age,lwt,ptl,ftv) dan dependen (bwt)
12
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
4. Klik tombol ‘OK’ Muncul dilayar hasil sbb:
Correlations Correlations
Age of mother
Pearson Correlation
Age of mother 1
Sig. (2-tailed) Weight of mother (pounds) No physician visits in first trimester
Birth weight (gram)
Birth weight (gram) .090
.013
.003
.328
.219
189
189
189
189
1
.141
-.140
.186*
.054
.055
.010
N
189
Pearson Correlation
.180*
Sig. (2-tailed) N
.013 189
189
189
189
189
Pearson Correlation
.215**
.141
1
-.044
.058
Sig. (2-tailed)
.003
.054
.544
.426
189
189
189
189
189
Pearson Correlation
.072
-.140
-.044
1
Sig. (2-tailed)
.328
.055
.544
N
189
189
189
189
Pearson Correlation
.090
.186*
.058
-.155*
Sig. (2-tailed)
.219
.010
.426
.034
N
189
189
189
189
N History of premature labor
No Weight of physician History of mother visits in first prematur (pounds) trimester e labor .180* .215** .072
-.155* .034
*. Correlation is significant at the 0.05 level (2-tailed). **. Correlation is significant at the 0.01 level (2-tailed).
13
189 1 189
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Hasil dari analisis bivariat dengan korelasi didapatkan nilai p value untuk variabel umur (p=219), berat badan (p=0,010), frekuensi anc (p=0,426), frekuensi prematur (p=0,034). Dari hasil ini dapat kita simpulkan bahwa variabel umur, berat badan dan frekuensi prematur mempunayi p value < 0,25, dengan demikian ketiga variabel tersebut dapat lanjut masuk ke pemodelan multivariat. Sedangkan untuk variabel frekuensi anc mempunyai p value > 0,25 (yaitu p=0,426) sehingga tidak bisa masuk ke multivariat, namun demikian oleh karena secara substansi frekuensi anc merupakan faktor yang sangat penting mempengaruhi berat badan bayi, maka variabel frekuensi anc tetap diikutkan dalam analisis multivariat.
b. Bivariat uji t: melakukan analisis bivariat untuk variabel independen berjenis katagorik: merokok dan riwayat hipertensi
1. Merokok Langkahnya: 1.Dari menu utama SPSS, pilih menu ‘ Analyze ”, kemudian pilih sub menu “Compare Means’ , lalu pilih “Independen-Samples T Test ” 2.Pada layar tampak kotak yang di dalamnya ada kotak ‘Test variable’
dan
‘Grouping Variable ’. Ket: kotak test varibles tempat memasukkan variabel numeriknya, sedangkan kotak grouping variable untuk memasukkan variabel katagoriknya, ingat jangan sampai terbalik. 3.Klik ‘bwt’ dan msukkan ke kotak ‘Test variable’ 4.Klik variabel ‘smoke’ dan masukkan ke kotak ‘Grouping Variable ’.
14
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
5.Klik ‘Define Group’, kemudian di layar nampak kotak isian. Anda diminta mengisi kode variabel ‘smoke’ ke dalam kedua kotak. Pada contoh ini, kita tahu bahwa ‘0’ tidak merokok dan kode ‘1’ untuk Yang merokok. Jadi ketiklah 0 pada Group 1” dan 1 pada “Group 2 ”
1. Klik “Continue” 2. Klik “OK ” untuk menjalankan prosedur perintahnya, dan hasilnya sbb:
T-Test Group Statistics
Birth weight (gram)
Smoking status No Yes
N 115 74
Mean 3054.96 2773.24
Std. Deviation 752.409 660.075
Std. Error Mean 70.163 76.732
15
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Independent Samples Test
Levene's Test for Equality of Variances
F Birth weight (gram)
Equal variances assumed
1.508
Equal variances not assumed
Sig. .221
t-test for Equality of Means
t
df
Sig. (2-tail ed)
Mean Differen ce
Std. Error Differenc e
95% Confidence Interval of the Difference Lower
Upper
2.634
187
.009
281.713
106.969
70.693
492.7
2.709
170.0
.007
281.713
103.974
76.467
487.0
Hasil analisis hubungan merokok dengan berat bayi menghasilkan p value = 0,009, dengan demikian p value yang dihasilkan < 0,25 maka variabel merokok dapat lanjut ke multivariat.
2. Riwayat Hipertensi Langkahnya: 1.Dari menu utama SPSS, pilih menu ‘ Analyze ”, kemudian pilih sub menu “Compare Means’ , lalu pilih “Independen-Samples T Test ” 2.Pada layar tampak kotak yang di dalamnya ada kotak ‘Test variable’
dan
‘Grouping Variable ’. Ket: kotak test varibles tempat memasukkan variabel numeriknya, sedangkan kotak grouping variable untuk memasukkan variabel katagoriknya, ingat jangan sampai terbalik. 3.Klik ‘bwt’ dan msukkan ke kotak ‘Test variable’ 4.Klik variabel ‘ht’ dan masukkan ke kotak ‘Grouping Variable ’. (variabel yang sebelumnya (variabel smoke) dikeluarkan dahulu baru ‘ht’ dimasukkan
16
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
5.Klik ‘Define Group’, kemudian di layar nampak kotak isian. Anda diminta mengisi kode variabel ‘smoke’ ke dalam kedua kotak. Pada contoh ini, kita tahu bahwa ‘0’ tidak ada hipertensi dan kode ‘1’ ada hipertensi’. Jadi ketiklah 0 pada Group 1” dan 1 pada “Group 2 ”
6.Klik “Continue” 7.Klik “OK ” untuk menjalankan prosedur perintahnya, dan hasilnya sbb: Group Statistics
Birth weight (gram)
History of hypertension No Yes
177
Mean 2972.31
Std. Deviation 709.226
Std. Error Mean 53.309
12
2536.75
917.341
264.813
N
17
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Independent Samples Test
Levene's Test for Equality of Variances
F Birth weight (gram)
Equal variances assumed
1.419
Equal variances not assumed
Sig. .235
t-test for Equality of Means
t
df
Sig. (2-taile d)
Mean Differe nce
Std. Error Differen ce
95% Confidence Interval of the Difference Lower Upper
2.019
187
.045
435.56
215.709
10.024
861.1
1.612
11.908
.133
435.56
270.126
-153.5
1025
Dari hasil analisis bivariat uji t antara variabel riwayat adanya hipertensi dengan berat bayi didapatkan p value = 0,045, berarti p valuenya < 0,25 sehiingga variabel riwayat adanya hipertensi dapat lanjut ke analisis multivariat Dengan demikian selesailah sudah seleksi semua variabel independen, dari 6 variabel independen semuaanya masuk ke proses berikutnya yaitu ke analisis multivariat.
B. Langkah Kedua : Pemodelan Multivariat Setelah tahap bivariat selesai, tahap berikutnya melakukan analisis multivariat secara bersama-sama. Variabel yang valid dalam model multivariat adalah variabel yang mempunyai p value < 0,05. Bila dalam model multivariat dijumpai variabel yang p value nya > 0,05, maka variabel tersebut harus dikeluarkan dalam model. Pengeluaran variabel dilakukan tidak serempak, melainkan bertahap satu per satu dikeluarkan dimulai dari p value yang terbesar. Adapun proses selengkapnya sbb: 1. Klik ‘Analyisis’, sorot ‘Regression’, sorot dan klik ‘Linier’ lalu muncul menu regresi linier, a. Pada kotak ‘dependen isikan variabel dependen (dalam hal ini berarti bwt) dan kotak ‘independen’ isikan variabel independennya (dalam hal ini age, lwt, smoke, ht, ptl, ftv) 18
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
5. Pada kotak ‘Method ’, pilih Enter’ 6. Abaikan lainnya 7. Klik ‘OK’ , dan hasilnya
Regression Model Summary
Model 1
R R Square .340a .116
Adjusted R Square .086
Std. Error of the Estimate 696.829
a. Predictors: (Constant), No physician visits in first trimester, Smoking status, History of hypertension, History of premature labor, Age of mother, Weight of mother (pounds)
19
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
ANOVAb
Model 1
Regression Residual Total
Sum of Squares 11543236
df 6
Mean Square 1923872.611
88373817
182
485570.423
99917053
188
F 3.962
Sig. .001a
a. Predictors: (Constant), No physician visits in first trimester, Smoking status, History of hypertension, History of premature labor, Age of mother, Weight of mother (pounds) b. Dependent Variable: Birth weight (gram) Coefficientsa
Unstandardized Coefficients Model 1
B 2315.862
Std. Error 299.442
7.162
10.022
4.793
Smoking status History of premature labor History of hypertension
(Constant) Age of mother Weight of mother (pounds)
No physician visits in first trimester
Standardized Coefficients Beta
t 7.734
Sig. .000
.052
.715
.476
1.777
.201
2.698
.008
-232.253
105.928
-.156
-2.193
.030
-154.002
106.574
-.104
-1.445
.150
-574.230
215.481
-.193
-2.665
.008
-2.847
49.705
-.004
-.057
.954
a. Dependent Variable: Birth weight (gram)
Dari kotak ‘Model Sumarry” didapatkan nilai R Square sebesar 0,116, artinya keenamm variabel independen dapat menjelaskan variabel berat bayi sebesar 11,6 % sedangkan sisanya dijelaskan oleh variabel lain. Dari hasil uji statistik (lihat kotak anova) didapatkan p value = 0,001 berarti persamaan garis regresi secara keseluruhan sudah signifikan. Namun demikian prinsip pemodelan harus yang sederhana variabelnya sehingga masing-masing variabel indepeden perlu di cek nilai p valuenya, variabel yang p valuenya > 0,05 dikeluarkan daari model. Ternyata dari 6 variabel indepeden (lihat kolom sig di kotak Coefficients) ada 3 variabel yang p valuenya > 0,05, yaitu umur (age) p=0,476, riwayat prematur (history prematur) p=0,150 dan frekuensi anc (no physician) p=0,954. Tahap berikutnya mengeluarkan variabel yang p valuenya > 0,05, pengeluaran variabel dimulai dari p value yang terbesar. Dengan demikian variabel yang kita coba keluarkan adalah frekuensi anc(No physician..). 20
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Langkahnya: 1. Klik ‘Analysis’, sorot ‘Regression’, sorot dan klik ‘Linier’ 2. Di layar nampak pada kotak Dependen masih terisi ‘bwt’ lewati dan biarkan saja. Pada kotak Independen juga masih lengkap ada 6 variabel, namun sekarang anda harus keluarkan variabel ‘no physician’ dan masukkan ke kotak Variable di sebelah kiri. 3. Klik OK, dan hasilnya sbb: Model Summary
Model 1
R R Square a .340 .116
Adjusted R Square .091
Std. Error of the Estimate 694.929
a. Predictors: (C onstant), History of hypertension, Smoking status, Age of mother, History of premature labor, Weight of mother (pounds) Coefficientsa
Unstandardized Coefficients Model 1
B 2317.608
Std. Error 297.074
Age of mother
7.051
9.807
Weight of mother (pounds)
4.781
Smoking status History of premature labor History of hypertension
(Constant)
Standardized Coefficients Beta
t 7.801
Sig. .000
.051
.719
.473
1.759
.201
2.718
.007
-232.224
105.638
-.156
-2.198
.029
-153.747
106.191
-.104
-1.448
.149
-573.011
213.841
-.192
-2.680
.008
a. Dependent Variable: Birth weight (gram)
Setelah variabel frekuensi anc dikeluarkan, kita cek dulu apakah setelah dikeluarkan, ada perubahan besar( berubah lebih dari 10 %) untuk R Square dan Coef. B. Bila ada perubahan yang besar maka variabel tersebut tidak jadi dikeluarkan dalam model (tetap dipertahankan di model). Untuk nilai R Square ternyata tidak ada perunbahan yaitu tetap 0,116. Sedangkan untuk coefisian B, Sekarang kita bandingkan nilai coefisien B untuk variabel umur,
21
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
berat ibu, merokok, riwayat prematur dan riwayat hiperteni antara sebelum dan sesudah variabel frekuensi anc dikeluarkan, hasil perhitungannya sbb:
Variabel
Anc msih ada
Anc dikeluarkan
perubahan Coef.
Age
7,1
7,0
1,4 %
bwt
4,7
4,7
0%
smoke
-232,2
-232,2
0%
ptl
-154,0
153,7
0,1 %
hi
-574,2
573,0
0,1 %
ftv
-2,8
-
Dari perhitungan perubahan nilai coefisien B pada masing-masing variabel, ternyata tidak ada yang berubah lebih dari 10 %, dengan demikian variabel frekuensi anc kita keluarkan dari model. Selankutnya kita lihat kembali bahwa pada model masih ada variabel yang p value > 0,05. Sekarang kita akan keluarkan variabel umur (p value =0,473). Langkah/proses : 1. Klik ‘Analysis’, sorot ‘Regression’, sorot dan klik ‘Linier’ 2. Di layar nampak pada kotak Dependen masih terisi ‘bwt’ lewati dan biarkan saja. Pada kotak Independen juga masih terisi ada 5 variabel, namun sekarang anda harus keluarkan variabel ‘umur (age)’ dan masukkan ke kotak Variable di sebelah kiri. 3. Klik OK, dan hasilnya sbb: Model Summary
Model 1
R R Square a .336 .113
Adjusted R Square .094
Std. Error of the Estimate 694.016
a. Predictors: (C onstant), History of hypertension, Smoking status, History of premature labor, Weight of mother (pounds)
22
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Coefficientsa
Unstandardized Coefficients Model 1
B 2449.121
Std. Error 233.779
5.035
1.721
Smoking status History of premature labor
-236.420
History of hypertension
(Constant) Weight of mother (pounds)
Standardized Coefficients Beta
t 10.476
Sig. .000
.211
2.925
.004
105.338
-.159
-2.244
.026
-145.412
105.417
-.098
-1.379
.169
-582.566
213.148
-.195
-2.733
.007
a. Dependent Variable: Birth weight (gram)
Setelah variabel umur
dikeluarkan, nilai R Square ternyata ada sedikit
perunbahan yaitu menjadi 0,113. sedangkan untuk coefisian B, , hasil perhitungannya sbb:
Variabel
Masih lengkap
umur dikeluarkan
perubahan Coef.
Age
7,1
-
-
bwt
4,7
5,0
6,3 %
smoke
-232,2
-236,4
1,8 %
ptl
-154,0
145,4
6,1 %
hi
-574,2
582,5
1,3 %
ftv
-2,847
-
Dari hasil perhitungan perubahan coef. Ternyata tidak ada yang lebih dari 10 %, dengan demikian variabel umur kita keluarkan dari model.
Langkah selanjutnya mengeluarkan variabel Riwayat mengalami prematur, Prosesnya/langkahnya sama dengan diatas, Klik Analysis, sorot Regression, ..dst. Pada kotak independen variabel riwayat mengalami prematur dikeluarkan dan dimasukkan ke kotak variable disebelah kiri, dan hasilnya sbb:
23
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Model Summary
Model 1
R R Square a .322 .104
Adjusted R Square .089
Std. Error of the Estimate 695.707
a. Predictors: (C onstant), History of hypertension, Smoking status, Weight of mother (pounds) Coefficientsa
Unstandardized Coefficients Model 1
Standardized Coefficients
B 2390.105
Std. Error 230.391
5.352
1.710
Smoking status
-263.009
History of hypertension
-586.722
(Constant) Weight of mother (pounds)
Beta
t 10.374
Sig. .000
.224
3.130
.002
103.812
-.177
-2.534
.012
213.646
-.197
-2.746
.007
a. Dependent Variable: Birth weight (gram)
Hasil R Square turun sedikit yaitu menjadi 0,104. Sedangkan hasil perhitungan perubahan Coef. B dapat dilihat sbb:
Variabel
Masih lengkap
Prematur keluar
perubahan Coef.
Age
7,1
-
-
bwt
4,7
5,3
12,3 %
smoke
-232,2
-236,4
1,7 %
ptl
-154,0
-
-
hi
-574,2
582,5
1,3 %
ftv
-2,847
-
Hasil perhitungan setelah dikeluarkan variabel prematur, ternyata coefisin B pada variabel beat badan ibu (bwt) beubah sebesar 12,3 % dengan demikian variabel riwayat mengalami prematur tidak jadi dikeluarkan dan tetap dipertahankan dalam model multivariat. Dari hasil analisis ternyata tidak ada lagi yang p valuenya > 0,05 dengan demikian proses pencarian variabel yang masuk dalam model telah selesai dan model yang terakhir adalah sbb: 24
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Model Summaryb
Model 1
R R Square a .336 .113
Adjusted R Square .094
Std. Error of the Estimate 694.016
DurbinWatson .222
a. Predictors: (Constant), History of premature labor, History of hypertension, Smoking status, Weight of mother (pounds) b. Dependent Variable: Birth weight (gram)
Coefficientsa
Mo de l 1
Unstandardized Coefficients
(Constant) Weight of mother (pounds) Smoking status History of hypertension History of premature labor
B 2449.121
Std. Error 233.779
5.035
1.721
-236.420
Stand ardize d Coeffi cients Beta
Collinearity Statistics Tolera nce
t 10.476
Sig. .000
VIF
.211
2.925
.004
.925
1.081
105.338
-.159
-2.244
.026
.964
1.037
-582.566
213.148
-.195
-2.733
.007
.943
1.060
-145.412
105.417
-.098
-1.379
.169
.947
1.056
a. Dependent Variable: Birth weight (gram)
Langkah selanjutnya UJI ASUMSI Agar persaman garis yang digunkan untuk memprediksi menghasilkan angka yang valid, maka persamaan yang dihasilkan harus memenuhi asumsi-asumsi yang diersyaratkan uji regresi linier ganda. Adapun uji asumsinya sbb: Langkahnya: 1.Klik ‘Analysis’, sorot ‘Regression’, sorot dan klik ‘Linier’ 2. Masukkan dalam kotak Dependen variabel ‘bwt’ 3. Masukan dalam kotak Independen variabel berat badan ibu (lwt), merokok(smoke), riwayat hipertensi (hi) dan variabel riwayat prematur(ptl)
25
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
4.Klik tombol Statistics 5. Klik kotak ‘Collinearity diagnostic’ dan klik kotak ‘Covariance matrix’ (perintah ini untuk uji asumsi multicoliniarity) 6. Klik kotak ‘Durbin-Watson’ (perintah ini untuk uji asumsi Independensi)
7. Klik Continue 26
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
8. Klik tombol ‘Plot” 9. Masukkan ‘SRESID’ ke kotak Y, dan masukan ‘ZPRED’ ke kotak X (perintah ini untuk uji asumsi Homoscedasity) 10. Klik kotak ‘histogram’ dan kotak ‘Normal probability plot” (perintah ini untuk uji asumsi Normality)
11. Klik Continue Hasilnya : a. Asumsi Eksistensi (Variabel Random) Untuk tiap nilai dari variabel X (variabel independen), variabel Y (dependen) adalah variabel random yang mempunyai mean dan varian tertentu. Asumsi ini berkaitan dengan teknik pengambilan sampel. Untuk memenuhi asumsi ini, sampel yang diambil harus dilakukan secara random. Cara mengetahui asunsi eksistensi dengan cara melakukan analisis deskriptif vareiabel residual dari model, bila residual menunjukkan adanya mean mendekati nilai nol dan ada sebaran (varian ata satandar deviasi) maka asumsi eksistensi terpenuhi. Hasil analisis:
27
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Residuals Residuals Statisticsa
Minimum 2249.77
Maximum 3602.03
Mean 2944.66
S td. Deviation 245.079
Std. Predicted Value
-2.835
2.682
.000
1.000
189
Standard Error of Predicted Value
67.193
292.804
103.399
45.407
189
1955.43
3616.97
2943.73
251.196
189
-2082.610
1921.631
.000
686.593
189
Std. Residu R esidual al
-3.001
2.769
.000
.989
189
Stud. Residua R esiduall
-3.015
2.782
.001
1.005
189
-2102.316
1940.423
.923
708.619
189
-3.084
2.835
.000
1.010
189
Mahal. Distance
.768
32.469
3.979
5.320
189
Cook's Distance Centered Leverage Value
.000
.209
.007
.019
189
.004
.173
.021
.028
189
Predicted Value
Adjusted Predicted Value Residual
Deleted Residual Stud. Deleted Residual
N 189
a. Dependent Variable: Birth weight (gram)
Hasil dari output diatas menunjukkan angka residual dengan mean 0,000 dan standar deviasi 686,59. Dengan demikian asumsi Eksistensi terpenuhi
b. Asumsi Independensi Independensi Suatu keadaan dimana masing-masing nilai Y bebas satu sama lain. Jadi nilai dari tiap-tiap individu saling berdiri sendiri. Tidak diperbolehkan nilai observasi yang berbeda yang diukur dari satu individu diukur dua kali. Untuk mengetahui asuamsi ini dilakukan dengan cara mengeluarkan uji Durbin Watson, bila nilai Durbin –2 s.d. +2 berarti asumsi independensi terpenuhi, sebaliknya bila nilai Durbin < -2 atau > +2 berarti asumsi tidak terpenuhi Model Summaryb
Model 1
R R Square a .336 .113
Adjusted R Square Square .094
Std. Error of the Estimate 694.016
DurbinWatson .222
a. Predictors: (Constant), History of premature labor, History of hypertension, Smoking status, Weight of mother (pounds) b. Dependent Variable: Birth weight (gram)
Dari hasil uji didapatkan koefisien Durbin Durbin Watson Watson
0,222, berarti berarti asumsi
independensi terpenuhi. 28
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
c. Asumsi Linieritas Nilai mean dari variabel Y untuk suatu kombinasi X1, X2, X3, …, Xk terletak pada garis/bidang linier yang dibentuk dari persamaan regresi. Untuk mengetahui asumsi linieritas dapat diketahui dari uji ANOVA (overall F test) bila hasilnya signifilan (p value
Model 1
Regression Residual Total
Sum of Squares 11291987 88625066 99917053
df 4 184 188
Mean Square 2822996.778 481657.965
F 5.861
Sig. .000a
a. Predictors: (Constant), History of premature labor, History of hypertension, Smoking status, Weight of mother (pounds) b. Dependent Variable: Birth weight (gram)
Dari output diatas menghasilkan uji anova 0,0005, berarti asumsi linearitas terpenuhi
d. Asumsi Homoscedascity Varian nilai variabel Y sama untuk semua nilai variabel X. Homoscedasticity dapat diketahui dengan melakukan pembuatan plot residual. Bila titik tebaran tidak berpola tertentu dan menyebar merata disekitar garis titik nol maka dapat disebut varian homogen pada setiap nilai X dengan demikian asumsi homoscedasticity terpenuhi. Sebaliknya bila titik tebaran membentuk pola tertentu misalnya mengelompok di bawah atau di atas garis tengah nol, maka diduga variannya terjadi heteroscedasticity. 29
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Scatterplot
Dependent Variable: Birth weight (gr am) 3
l a u 2 d i s e R 1 d e z i t 0 n e d u -1 t S n o -2 i s s e r g -3 e R -4
-3
-2
-1
0
1
2
3
Regressi on Standardized Predicted Value
Dari hasil plot diatas terlihat tebaran titik mempunyai pola yang sama antara titik-titik diatas dan dibawah garis diagonal 0. Dengan demikian asumsi homoscedasity terpenuhi
e. Asumsi Normalitas Variabel Y mempunyai distribusi normal untuk setiap pengamatan variabel X. dapat diketahui dari Normal P-P Plot residual, bila data menyebar di sekitar garis diagonal dan mengikuti arah garis diagonal, maka model regresi memenuhi asumsi model regresi tidak memenuhi asumsi normalitas.
30
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Histogram
Dependent Variable: Birth weight (gr am)
40
30 y c n e u q e 20 r F
10
Mean =-2.53E-16 Std. Dev. =0.989 N =189
0 -4
-3
-2
-1
0
1
2
3
Regressio n Standardized Residual
31
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Normal P-P Plot o f Regression Standardized Resid ual
Dependent Variable: Birth weight (gram) 1.0
0.8
b o r P
0.6
m u C d e t c 0.4 e p x E 0.2
0.0 0.0
0.2
0.4
0.6
0.8
1.0
Observed Cum Prob
Dari grafik histogram dan grafik normal P-P plot terbukti bahwa bentuk distribusinya normal, berarti asumsi normality terpenuhi.
f.Diagostik Multicollinearity Dalam regresi linier tidak boleh terjadi sesama variabel independen berkorelasi secara kuat (multicollinearity). Untuk mendeteksi collinearity dapat diketahui dari nilai VIF (variance inflation factor), bila nilai VIF lebih dari 10 maka mengindikasikan telah terjadi collinearity.
32
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Coefficientsa
Mo de l 1
Unstandardized Coefficients B 2449.121
Std. Error 233.779
5.035
1.721
Smoking status
-236.420
History of hypertension History of premature labor
(Constant) Weight of mother (pounds)
Stand ardize d Coeffi cients Beta
Collinearity Statistics Tolera nce
t 10.476
Sig. .000
VIF
.211
2.925
.004
.925
1.081
105.338
-.159
-2.244
.026
.964
1.037
-582.566
213.148
-.195
-2.733
.007
.943
1.060
-145.412
105.417
-.098
-1.379
.169
.947
1.056
a. Dependent Variable: Birth weight (gram)
Dari hasil uji asumsi didapatkan nilai VIF tidak lebih dari 10, dengan demikian tidak ada Multicollinearity antara sesama variabel indepeden
Dari hasil uji asumsi dan uji kolinearitas ternyata semua asumsi terpenuhi sehingga model dapat digunakan untuk memprediksi berat badan bayi. Langkah sekanjutnya adalah UJI INTERAKSI, Namun karena secara substansi antar variabel dipandang tidak interaksi maka uji interaksi tidak dilakukan. Sehingga model yang terakhir adalah sbb: Model Summaryb
Model 1
R R Square a .336 .113
Adjusted R Square .094
Std. Error of the Estimate 694.016
DurbinWatson .222
a. Predictors: (Constant), History of premature labor, History of hypertension, Smoking status, Weight of mother (pounds) b. Dependent Variable: Birth weight (gram)
33
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Coefficientsa
Mo de l 1
Unstandardized Coefficients
(Constant) Weight of mother (pounds) Smoking status History of hypertension History of premature labor
B 2449.121
Std. Error 233.779
5.035
1.721
-236.420 -582.566 -145.412
Stand ardize d Coeffi cients Beta
Collinearity Statistics Tolera nce
t 10.476
Sig. .000
VIF
.211
2.925
.004
.925
1.081
105.338 213.148
-.159 -.195
-2.244 -2.733
.026 .007
.964 .943
1.037 1.060
105.417
-.098
-1.379
.169
.947
1.056
a. Dependent Variable: Birth weight (gram)
Interpretasi model:
Setelah dilakuikan analisis ,ternyata variabel independen yang masuk model regresi adalah berat badan ibu, ibu merokok, riwayat hipertensi, dan riwayat prematur. Pada tabel ‘Model Summary’ terlihat koefisien determinasi (R square) menunjukkan nilai 0,113 artinya bahwa model regresi yang diperoleh dapat menjelaskan 11,3 % variasi variabel dependen berat bayi. Atau dengan kata lain keempat variabel independen tsb dapat menjelaskan variasi variabel berat bayi sebesar 11,3 %.. Kemudian pada kotak ‘ ANOVA’ , kita lihat hasil uji F yang menunjukkan nilai P (sig) = 0,000, berarti pada alpha 5% kita dapat menyatakan bahwa model regresi cocok (fit) dengan data yang ada. Atau dapat diartikan kedua variabel tersebut secara signifikan dapat utnuk memprediksi variabel berat bayi. Pada kotak ‘Coefficient’ kita dapat memperoleh persamaaan garisnya, pada kolom B (di bagian Variabel In Equation ) di atas, kita dapat mengetahui koefisien regresi masing-masing variabel. Dari hasil di atas, peresamaat regresi yang diperoleh adalah Berat Bayi = 2449,1+5,0 Lwt – 236,4 smoke - 582Hi – 145,4 Ptl
34
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Dengan model persamaan ini, kita dapat memperkirakan berat badan bayi dengan menggunakan variabel berat badan ibu, merokok dan hipertensi. Adapun arti koef. B untuk masing-masing variabel adalah sbb: -
Setiap kenaikan berat badan ibu sebesar 1 kg, maka berat badan bayi akan naik sebesar 5,0 gram setelah dikontrol variabel merokok, hipertensi dan prematur
-
Pada ibu yang merokok berat bayinya akan lebih rendah sebesar 236,4 gram setelah dikontrol variabel berat badan, hipertensi dan prematur.
-
Pada ibu yang menderita hipertensi,berat bayinya akan lebih rendah sebesar 582,5 gram setelah dikontrol variabel berat badan ibu, merokok dan prematur.
Kolom Beta dapat digunakan untuk mengetahui variabel mana yang paling besar peranannya (pengaruhnya) dalam menentukan variabel dependennya (berat badan bayi). Semakin besar nilai beta semakin besar pengaruh nya terhadap variabel dependennya. Pada hasil di atas berarti variabel yang paling besar pengaruhnya terhadap penentuan berat badan bayi adalah berat badan ibu..
35
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
REGRESI LOGISTIK
13
Berbeda dengan regresi linier yang variabel dependennya numerik, regreesi logistik merupakan jenis regresi yang mempunyai ciri khusus, yaitu variabel dependennya berbentuk variabel katagorik (terutama yang dikotomus, artinya katagorik yang terdiri dari dua kelompok, misalnya hidup/mati, puas/tidak puas dll). A. REGRESI LOGISTIK SEDERHANA 1. Pendahuluan Analisis regresi logistik adalah salah satu pendekatan model matematis yang digunakan untuk menganalisis hubungan satu atau beberapa variabel independen
dengan
sebuah
variabel
dikotom/binary. Variabel katagorik
dependen
katagorik
yang
bersifat
yang dikotom adalah variabel yang
mempunyai dua nilai variasi, misalnya sakit-tidak Sakit, bayi BBLR dan Normal, merokok dan tidak merokok, dan lain-lain Perbedaan antara regresi linear dengan regresi logistik terletak pada jenis variabel dependennya. Regresi linear digunakan apabila variabel dependennya numerik , sedangkan regresi logistik diogunakan pada data yang dependennya berbentuk katagorik yang dikotom. Untuk memahami lebih jelas tentang regresi logistik coba kita lihat contoh analisis penelitian yang mempelajari hubungan antara variabel umur dengan kejadian penyakit jantung koroner. Pengamatan dilakukan pada 100 orang sampel, didapatkan hasil : No
1
2
3
4
5
6
7
8
9
10
11
…
…
100
Umur 20
22
23
24
25
27
28
29
30
32
33
…
…
70
PJK
0
1
0
0
1
0
1
1
0
0
…
…
1
0
36
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Nomor merupakan nomor urut responden dan PJK merupakan variabel kejadian jantung koroner. Variabel PJK diberi kode 1 bila responden menderita PJK dan diberi kode 0 bila mereka tiodak menderita PJK. Bila data tersebut kita perlakukan analisisnya menggunakan regresi linier, misalnya dibuat penyajian dalam bentuk diagram tebar (Scatter Plot ), maka hubungannya tidak jelas terlihattebaran data pada Scatter Plot membentuk dua garis yang sejajar. Diagram tebat menunjukkan adanya kecenderungan kejadian penyakit jantung koroner yang lebih sedikit pada responden yang berusia muda. Walaupun grafik tersebut telah dapat menggambarkan/menjelaskan variabel dependen (kejadiab PJK) yang cukup jelas, namun grafik tersebut tidak mampu menggambarkan dengan lebih tajam/jelas hubungan antara umur dangan kejadian PJK.
Untuk
mempertajam
analisis
kita,
sekarang
dicoba
untuk
mengelompokkan variabel independen (variabel umur) dan menhitung nilai tengah (dalam hal ini menghitung proporsi) variabel dependen (variabel PJK) untuk setiap kelompok variabel umur dan kejadian jantung dapat dilihat pada tabel berikut:
37
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Umur
Jumlah
PJK
Proporsi
Tidak
Ya
Kejadian
20 – 29
10
9
1
0,10
30 – 34
15
13
2
0,13
35 – 39
12
9
3
0,25
40 – 44
15
10
5
0,33
45 – 49
13
7
6
0,46
50 – 54
8
3
5
0,63
55 – 59
17
4
13
0,76
60 – 69
10
2
8
0,80
Total
100
57
43
0,43
Pada tabel terlihat bahwa ada peningkatan proporsi kejadian jantung pada kelompok umur semakin tua/lanjut. Kemudian kita coba sajikan data tersebut dengan grafik dan hasilnya dapat dilihat pada grafik berikut: 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 20 - 29 30 – 34 35 – 39 40 – 44 45 – 49 50 – 54 55 – 59 60 – 69
Pada grafik tyer;lihat jelas adanya peningkatan yang tidak linear antara proporsi kejadian PJK dengan peningkatan umur. Diawali peningkatan yang landai, kemudian meningkat tajam dan kemudian landai kembali, garis tersebut menyerupai huruf S. Kalau kita cermati, pembuatan diagram tebar tersebut merupakan cara untuk mendeteksi/mengetahui hubungan pada analisis regresi linier, namun ada 38
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
sedikit perbedaan hal dalam hal meringkas variabel dependennya. Seperti kita ketahui bahwa pada regresi linier kita ingin mengestimasi nilai mean variabel dependen berdasarkan setiap nilai variabel independen. Nilai tersebut disebut sebagai mean kondisional yang dinyatakan dengan E(Y/x), dengan Y sebagai dependen dan x sebagi independen. E(Y/x) adalah nilai Y yang diharapkan berdasarkan nilai x. misal Y variabel tekanan darah dan x variabel umur, maka untuk mengetahui estimasi tekanan darah berdasarkan umu, dihitung rata-rata (mean) tekanan darah pada masing-masing nilai umur. Pada regresi linier nilai E(Y/x) akan berkisar antara 0 s.d ∞ (0
≤
E(Y/x)
≤
∞).
Pada regresi logistik dapat juga diperlakukan hal tersebut namun ada sedikit perbedaan dalam menghitung rata-rata variabel dependennya (Y). oleh karena pada regresi logistik dependennya adalah dikotom maka variabel dependen dihitung bukan dengan mean namun menggunakan proporsi. Seperti pada data di atas variabel Y kejadia PJK dan x variabel umur, maka untuk mengetahui estimasi kejadian PJK berdasarkan umur, dihitung proporsi kejadian PJK pada tiap kelompok umur. Pada regresi logistik, nilai E(Y/x) akan selalu berada antara nol dan satu (0
≤
E(Y/x)
≤
1).
2. Model Logistik f (z) =
1 . -z 1+e
f(Z) merupakan propbabilitas kejadian suatu penyakit berdasarkan faktor risiko tertentu. Misalnya probabilitas kejadian jantung pada umur tertentu. Nilai Z merupakan nilai indeks variabel independen. Nilai Z bervariasi antara - ∞ sampai +∞. Bila nilai Z mendekati – ∞ maka f (– ∞) =
1
. =0
1 + e - (– ∞)
39
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Bila nilai Z mendekati + ∞ maka f (+ ∞) =
1
. =1
1 + e - (+ ∞) Fungsi Logistik dapat digambarkan sbb:
1
-∞
0
+∞
Terlihat bahwa fungsi f(Z) nilai berkisar 0 dan 1 berapapun nilai Z. kisaran pada regresi logistik ini berari cocok/sesuai digunakan untuk model hubungan yang variabel dependennya dikotom. Grafik f(Z) membentuk garis yang berbentuk huruf S, ini berarti sesuai dengan contoh plot hubungan antara PJK dengan umur pada kasus yang telah kita bahas di atas. Bentuk S ini mencerminkan tentang pengaruh nilai Z pada risiko individu yang minimal pada nilai Z rendah kemudian seiring dengan meningkatnya nilai Z risiko juga semakin meningkat, dan pada ketinggian tertentu garisnya akan mendatar mendekati nilai 1. Berdasarkan uaraian tersebut maka bila ingin mengestimasi suatu probabilitas kejadian pada dependen yang dikotom maka model regresi logistik adalah pilihan yang tepat.
3. Model Logistik Model logistik dikembangkan dari funsi logistik dengan nilai Z merupakan penjumlahan linear konstanta (α) ditambah
dengan β1X1, ditambah β2X2 dan
seterusnya sampai βiXi. Variabel X adalah variabel Independen. 40
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Z = α + β1X1
(Regresi logistik sederhana)
Z = α + β1X1 + β2X2 + … + βiXi
(Regresi logistik berganda)
Bila nilai Z dimasukkan pada fungsi Z, maka rumus fungsi Z adalah
f (z) =
1
.
1 + e - (α + β1X1 + β2X2 + … + βiXi) 4. Contoh Kasus Contoh studi follow up selama 9 tahun. Dalam studi ini dipelajari mengenai hubungan antara kejadian penyakit jantung koroner (dengan nama vaiabel PJK) dengan tinggi rendahnya kadar katekolamin dalam darah (nama variabel KAT). Pemberian kode nilai variabel adalah sbb: Untuk variabel PJK Æ
1 = timbul penyakit jantung koroner 0 = tidak ada penyakit jantung koroner
Untuk variabel KAT
Æ
1 = kadar katekolamin darah tinggi 0 = kadar katekolamin darah rendah
Pertanyaan: a. Berapa peluang mereka yang kadar katekolaminnya tinggi mempunyai risiko untuk terjadi PJK? b. Berapa peluang mereka yang kadar katekolaminnya rendah mempunyai risiko untuk terjadi PJK? c. Bandingkan risiko terjadi PJK antara mereka yang kadar katekolaminnya tinggi dengan yang kadar katekolaminnya rendah?
Jawab: Dengan model regresi logistik maka pada soal tersebut modelnya adalah: f (z) =
1 . 1 + e-z 41
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Nilai f(z) dapat diganti dengan P(X), maka rumusnya: P(X) =
1 . 1 + e-z
Bila Z = α + β1KAT, maka modelnya : P(X) =
1 . α + β1KAT 1 + e-
Misdalkan didapatkan hasil analisis dengan paket program statistik sbb: α = -3,911 dan β1 = 0,652, maka: P(X) =
1 1+e
.
-(-3,911 + 0,652KAT)
Dari model tersebut coba kita jawab pertanyaan di atas: a. Besar risiko terjadinya PJK pada mereka yang kadar katekolaminnya tinggi. Oleh karena kadar katekolamin tinggi diberi angka 1, maka masukkan nilai KAT=1 pada model di atas, hasilnya: P(X) =
1
.
= 0,037 atau sekitar 4%
1 + e -(-3,911 + 0,652*1) jadi mereka/individu
yang
kadar katekolaminnya
tinggi dalam darah
mempunyai risiko untuk terjadinya PJK sebesar 4% selama periode follow up. b. Besar risiko terjadinya PJK pada mereka yang kadar katekolaminnya rendah Oleh karena kadar katekolamin rendah diberi angka 0, maka masukkan nilai KAT=0 pada model di atas, hasilnya: P(X) =
1
.
= 0,019 atau sekitar 2%
1 + e -(-3,911 + 0,652*0) jadi mereka/individu yang kadar katekolaminnya rendah dalam darah mempunyai risiko untuk terjadinya PJK sebesar 2% selama periode follow up. c. Besar risiko kedua kelompok tersebut P1(X) = 0,037 = 1,947 = 2,0 P0(X)
0,019
Angka tersebut di atas sebenarnya adalah risiko relatif (RR)yang diperoleh secara direk. Arti dari angka di atas adalah mereka yang kaadar 42
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
katekolaminnya tinggi mempunyai risiko terjadi PJK dua (2) kali lebih tinggi dibandingkan mereka yang kadar katekolaminnya rendah. Model regresi logistik dapat digunakan pada data yang dikumpulkan melalui rancangan kohort, case control maupun cross sectional. Pada rancangan kohort prospektif dapat digunakan untuk memperkirakan risiko individual. Sedangkan pada rancangan case control dan cross sectional tidak dapat digunakan untuk menghitung risiko individual karena β0 pada rancangan ini tidak sahih. Nilai β0 dapat dihitung/diestimasi bila sampling fraction populasi yang disampel diketahui-kondisis ini hanya terjadi pada rancangan kohort (ket: sampling fraction adalah proporsi terpapar yang menjadi sakit atau tidak sakit). Namun dengan memperlakukan rancangan case control dan cross sectional sebagai studi follow up, maka dapat dihitung OR (Odds Ratio), yang merupakan perhitungan RR yang indirek. Nilai OR yang merupakan yang merupakan perhitungan eksponensial β dari persamaan garis regresi logistik. Odds Ratio (OR) = exp
(β)
atau dapat ditulis OR = e
Dengan demikian dapat disimpulkan bahwa
(β)
Individual Risk (ririko
individu) hanya dapat diperoleh dari rancangan kohor prospektif. Sedangkan pada rancangan case control, cross sectional tidak dapat melakukan prediskis risiko individual. Pada rancangan case control dan cross sectional dan cohort dapat dihitung nilai Odds Ratio (OR), yang merupakan perhitungan RR indirek. Pada rancangan kohort prospektif regresi logistik dapat digunakan untuk memprediksi/menaksir probabilitas individu untuk sakit (atau meninggal) berdasarkan nilai-nilai sejumlah variabel yang diukur padanya. Prediksi dapat digunakan dengan model: P(X) =
1
.
-(α + β1X1 + β2X2 + … + βiXi
1+e
43
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
B. REGRESI LOGISTIK GANDA Pada pembahasan di atas sudah diperkenalkan mengenai regresi logistik sederhana. Seperti juga pada regresi linier, keuntunngan regresi logistik ganda adalah kemampuannya untuk memasukkan beberapa variabel dalam satu model. Pada regresi logistik, variabel independennya boleh campuran antara variabel katagorik dan numerik. Namun sebaiknya variabel independennya berupa katagorik karena dalam menginterpretasi hasil analisis akan lebih mudah.
Kegunaan analisis regresi logistik ganda mencakup dua hal, yaitu: a. Model Prediksi Pemodelan dengan tujuan untuk memperoleh model yang tediri dari beberapa variabel independen yang dianggap terbaik untuk memprediksi kejadian variabel dependen. Pada pemodelan ini semua variabel dianggap penting sehingga estimasi dapat dilakukan estimasi beberapa koefisien regresi logistik sekaligus. Bentuk kerangka konsep model regresi : X1 X2
Y
X3 X4
Prosedur pemodelan: Agar diperoleh model regresi yang hemat dan mampu menjelaskan hubungan variabel independen dan independen dalam populasi, diperlukan prosedur pemilihan variabel sbb: 1). Melakukan analisis bivariat antara masing-masing variabel independen dengan variabel dependennya. Bila hasil uji bivariat mempunyai nilai p < 0,25, maka variabel tersebut dapat masuk model multivariat. Namun bisa saja p value > 0,25 tetap diikutkan ke multivariat bila variabel tsb secara substansi penting.
44
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
2). Memilih variabel yang dianggap penting yang masuk dalam model, dengan cara mempertahankan variabel yang mempunyai p value < 0,05 dan mengeluarkan variabel yang p valuenya > 0,05. Pengeluaran variabel tidak serentak semua yang p valuenya > 0,05, namun dilakukan secara bertahap dimulai dari variabel yang mempunyai p value terbesar. 3). Identifikasi linearitas variabel numerik dengan tujuan untuk menentukan apakah variabel numerik dijadikan variabel katagorik atau tetap variabel numerik. Caranya dengan mengelompokkan variabel numerik ke dalam 4 kelompok berdasarkan nilai kuartilnya. Kemudian lakukan analisis logistik dan dihitung nilai OR-nya. Bila nilai OR masing-masing kelompok menunjukkan
bentuk
garis
lurus,
maka
variabel
numerik
dapat
dipertahankan. Namun bila hasilnya menunjukkan adanya patahan, maka dapat dipertimbangkan dirubah dalam bentuk katagorik. 4). Setelah memperoleh model yang memuat variabel-variabel penting, maka langkah terakhir adalah memeriksa kemungkinan interaksi variabel ke dalam model. Penentuan variabel interaksi sebiknya melalui pertimbangan logika substantif. Pengukian interaksi dilihat dari kemaknaan uji statistik. Bila variabel mempunyai nilai bermakna, maka variabel interaksi penting dimasukkan dalam model.
b. Model Faktor Risiko Pemodelan dengan tujuan mengestimasi secara valid hubungan satu variabel utama dengan variabel dependen dengan mengontrol beberapa variabel konfonding. Bentuk kerangka konsep model faktor risiko: X1
Y
X2 X3 X4
45
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Tahapan pemodelan: 1). Lakukan pemodelan lengkap, mencakup variabel utama , semua kandidat konfonding dan kandidat interaksi (interaksi diabuat antara variabel utama dengan semua variabel konfonding). 2). Lakukan penilaian interaksi, dengan cara mengeluarkan variabel interaksi yang nilai p Wald-nya tidak signifikan dikeluarkan dari model secara berurutan satu per satu dari nilai p Wald yang terbesar. 3). Lakukan penilaian konfonding, dengan cara mengeluarkan variabel kovariat/ konfonding satu per satu dimuali dari yang memiliki nilai p Wald terbesar, bila setelah dikeluarkan diperoleh selisih OR faktor/variabel utama antara sebelum dan sesudahvariabel kovariat (X1) dikeluarkan lebih besar dari 10%, maka variabel tersebut dinyatakan sebagai konfonding dan harus tetap berada dalam model.
46
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
KASUS I :
REGRESI LOGISTIK MODEL PREDIKSI Untuk latihan, gunakan file data “LBW.SAV ”
Suatu penelitian ingin mengetahui hubungan antara UMUR IBU (age) , RAS (race), MENDERITA HIPERTENSI (ht), ADA KELAINAN UTERUS (ui) dan PERIKSA HAMIL (ftv) dengan BBLR (low).
Adapun langkahnya:
A. SELEKSI BIVARIAT Masing-masing variabel independen dilakukan analisis bivariat dengan variabel dependen. Bila hasil bivariat menghasilkan p value < 0,25, maka variabel tersebut langsung masuk tahap multivariat. Untuk variabel independen yang hasil bivariatnya menghasilkan p value > 0,25 namun secara substansi penting, maka variabel tersebut dapat dimasukkan dalam model multivariat. Seleksi bivariat menggunakan uji regresi logistik sederhana.
1.Analisis bivariat antara “umur” dengan”bblr” 1. Pilih “ Analyze ” 2. Pilih “Regression ” 3. Klik “Binary Logistic ”, muncul menu dialog yang berisi kotak Dependent dan kotak Covariates. 4. Pada kotak Dependen isikan variabel yang kita perlakukan sebagai dependen (dalam hal ini berarti masukkan “low” ) dan pada kotak independen isikan variabel independennya (dalam hal ini berarti masukkan “age”). Sehingga tampilannya sbb: 47
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
5. Klik tombol ‘Options’ , klik ‘CI for Exp(B)’ 6. Klik ‘Continue’ 7. Klik “OK ”, dan hasilnya sbb:
Bloc k 1: Method = Enter Omnibus Tests of Model Coefficients
Step 1
Step
Chi-square 2.760
df 1
Sig. .097
Block
2.760
1
.097
Model
2.760
1
.097
Variables in the Equation
95.0% C.I.for EXP(B) Step a 1
age Const ant
B -.051
S.E. .032
Wald 2.635
df 1
Sig. .105
Exp(B) .950
.385
.732
.276
1
.599
1.469
Lower .893
Upper 1.011
a. Variable(s) entered on step 1: age.
48
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Dari hasil output, pada tampilan Block 1 didapatkan hasil omnibus test pada bagian Bloc dengan p value 0,097 berarti variabel umur p value nya <0,25 sehingga variabel umur dapat dilanjutkan ke analisis multivariat. Dari tampilan SPSS nilai OR dapat diketahui dari kolom Exp(B) yaitu sebesar 0,950 (95% CI: 0,89-1,01)
2.Analisis bivariat antara “ras” dengan “bblr” 1. Pilih “ Analyze ” 2. Pilih “Regression ” 3. Klik “Binary Logistic ”, muncul menu dialog yang berisi kotak Dependent dan kotak Covariates. 4. Pada kotak Dependent tetap berisi “low” dan pada kotak Covariates variabel ‘age’ dikeluarkan dan gantilah dengan mengisikan variabel ‘race’. Tampilannya sbb:
5. Pada variabel ras perlu dilakukan dummy oleh karena variabel ras berjenis katagorik dengan isi lebih dari 2 nilai, tepatnya 3 kelompok(yaitu :ras 49
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
putih, hitam dan lainnya). Klik tombol Categorical, pindahkan ‘race’ dari kotak covariates ke kotak categorical covariates, klik pilihan ‘first’ pada bagian Reference category, lalu klik Change, dan tampilannya:
6. Klik Continue, layar ke menu logistic 7. Klik OK Categorical Variables Codings
Race
White Black Other
Frequency 96 26 67
Parameter coding (1) (2) .000 .000 1.000 .000
.000 1.000
Omnibus Tests of Model Coefficients
Step 1
Step Block Model
Chi-square 5.010 5.010 5.010
df 2
Sig. .082
2 2
.082 .082
50
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Variables in the Equation
95.0% C.I.for EXP(B) B Stea p1
S.E.
race
Wald 4.922
df 2
Sig. .085
Exp(B)
Lower
Upper
race(1)
.845
.463
3.323
1
.068
2.328
.939
5.772
race(2)
.636
.348
3.345
1
.067
1.889
.955
3.736
-1.155
.239
23.330
1
.000
.315
Constant
a. Variable(s) entered on step 1: race.
Hasil uji didapatkan p value 0,087 berarti p value < 0,25, sehingga variabel ras dapt lanjut ke multivariat. Dari output dapat diketahui juga nilai OR dummy, terlihat ada dua nilai OR yaitu OR untuk race(1) 2,328 artinya ras kuliat hitam akan berisiko bayinya bblr sebesar 2,3 kali lebih tinggi dibandingkan ras kulit putih. OR untuk race(2) besarnya 1,89 artinya ras kelompok lainnya mempunyai risiko bayinya bblr sebesar 1,89 kali lebi tinggi dibandingkan ras kulit putih.
3. Analisis bivariat antara “hipertensi” dengan “bblr” 1. Pilih “ Analyze ” 2. Pilih “Regression ” 3. Klik “Binary Logistic ”, muncul menu dialog yang berisi kotak Dependent dan kotak Covariates. 4. Pada kotak Dependent tetap berisi “low” dan pada kotak Covariates isikan “ht”. Klik OK, Tampilannya sbb:
Omnibus Tests of Model Coefficients
Step 1
Step Block Model
Chi-square 4.022
df 1
Sig. .045
4.022
1
.045
4.022
1
.045
51
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Variables in the Equation
Step a 1
ht Constant
B 1.214 -.877
S.E. .608 .165
Wald 3.979 28.249
df 1 1
Sig. .046 .000
Exp(B) 3.365 .416
95.0% C.I.for EXP(B) Lower Upper 1.021 11.088
a. Variable(s) entered on step 1: ht.
Hasil uji didapatkan p value = 0,045 (p value < 0,25) berarti masuk dalam multivariat 4. Analisis bivariat antara “kelainan uterus” dengan “bblr” 1. Pilih “ Analyze ” 2. Pilih “Regression ” 3. Klik “Binary Logistic ”, muncul menu dialog yang berisi kotak Dependent dan kotak Covariates. 4. Pada kotak Dependent tetap berisi “low” dan pada kotak Covariates isikan “ui”. Klik OK, Tampilannya sbb: Omnibus Tests of Model Coefficients
Step 1
Step
Chi-square 5.076
df 1
Sig. .024
Block
5.076
1
.024
Model
5.076
1
.024
Variables in the Equation
Step a 1
ui Constant
B .947 -.947
S.E. .417 .176
Wald 5.162 29.072
df 1 1
Sig. .023 .000
Exp(B) 2.578 .388
95.0% C.I.for EXP(B) Lower Upper 1.139 5.834
a. Variable(s) entered on step 1: ui.
Hasil p value 0,024 (p value < 0,25), maka variabel kelainan uterus dapat lanjut ke multivariat
52
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
5.Analisis bivariat antara “periksa hamil” dengan “bblr” 1.Pilih “ Analyze ” 2.Pilih “Regression ” 3.Klik “Binary Logistic ”, muncul menu dialog yang berisi kotak Dependent dan kotak Covariates. 4.Pada kotak Dependent tetap berisi “low” dan pada kotak Covariates isikan “ftv”. Klik OK, Tampilannya sbb: Omnibus Tests of Model Coefficients
Step 1
Step
Chi-square .773
df 1
Sig. .379
Block
.773
1
.379
Model
.773
1
.379
Variables in t he Equation
95.0% C.I.for EXP(B) Step a 1
ftv
B -.135
S.E. .157
Wald .744
df 1
Sig. .389
Exp(B) .874
Constant
-.687
.195
12.427
1
.000
.503
Lower .643
Upper 1.188
a. Variable(s) entered on step 1: ftv.
Hasil uji p value = 0,379 (p value > 0,25) sehingga secara statistik tidak dapat lanjut ke multivariat, namun karena secara substansi variabel periksa hamil sangat penting, maka variabel ini dapat dianalisis multivariat.
6.Analisis bivariat antara “merokok” dengan “bblr” Omnibus Tests of Model Coefficients
Step 1
Step Block Model
Chi-square 4.867
df 1
Sig. .027
4.867
1
.027
4.867
1
.027
53
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Variables in the Equation
Step a 1
smoke Constant
B .704 -1.087
S.E. .320 .215
Wald 4.852 25.627
df 1 1
Sig. .028 .000
Exp(B) 2.022 .337
95.0% C.I.for EXP(B) Lower Upper 1.081 3.783
a. Variable(s) entered on step 1: smoke.
Hasil analisis bivariat didapatkan p value = 0,027 ( < 0,25) dengan demikian variabel merokok dapat masuk ke multivariat. 7.Analisis bivariat antara “prematur” dengan “bblr” Omnibus Tests of Model Coefficients
Step 1
Step
Chi-square 6.779
df 1
Sig. .009
Block
6.779
1
.009
Model
6.779
1
.009
Variables in t he Equation
95.0% C.I.for EXP(B) Step a 1
ptl Constant
B .802
S.E. .317
Wald 6.391
df 1
Sig. .011
Exp(B) 2.230
-.964
.175
30.370
1
.000
.381
Lower 1.197
Upper 4.151
a. Variable(s) entered on step 1: ptl.
Hasil analisis didapatkan p value sebesar 0,009 berarti < 0,25 sehingga variabel riwayat adanya prematur dapat masuk ke multivariat Hasil seleksi bivariat : Variabel
P value
Umur
0,097
Ras
0,082
Hipertensi
0,045
Kelainan uterus
0,024
Periksa hamil
0,379
Merokok
0,027
Prematur
0,009 54
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Hasil seleksi bivariat semua variabel menghasilkan p value < 0,25, hanya periksa hamil yang p valuenya > 0,25. namun variabel periksa hamil tetap dianalisis multivariat oleh karena secara substansi periksa hamil merupakan variabel yang sangat penting berhubungan dengan kejadian bblr.
B. PEMODELAN MULTIVARIAT Selanjutnya dilakukan analisis multivariat keenam variabel tersebut dengan kejadian bblr. 1.. Lakukan pemilihan variabel yang berhubungan signifikan dengan variabel dependen. 1. Pilih “ Analyze ” 2. Pilih “Regression ” 3. Klik “Binary Logistic ”, muncul menu dialog yang berisi kotak Dependent dan kotak Covariates. 4. Pada kotak Dependent tetap berisi “low” dan pada kotak Covariates isikan variabel age, race, smoke, ptl, ht, ui, ftv. Ingat untuk Race dilakukan dummy. 5. Klik Option, pilih ‘CI for exp(B)’ 6. Klik ‘Continue’
55
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
7. Kilik ‘OK’
Logistic Regression Variables in the Equation
95.0% C.I.for EXP(B) Step a 1
age
B -.041
S.E. .036
race
Wald 1.249
df 1
Sig. .264
6.783
2
.034
Exp(B) .960
Lower .894
Upper 1.031
race(1) race(2)
1.009 1.003
.502 .426
4.034 5.560
1 1
.045 .018
2.743 2.727
1.025 1.185
7.345 6.280
smoke ptl
.964 .630
.391 .340
6.090 3.429
1 1
.014 .064
2.622 1.877
1.219 .964
5.639 3.654
ht
1.361
.631
4.648
1
.031
3.902
1.132
13.451
ui ftv
.802 .009
.458 .161
3.066 .003
1 1
.080 .954
2.229 1.009
.909 .736
5.468 1.384
-1.183
.919
1.659
1
.198
.306
Constant
a. Variable(s) entered on step 1: age, race, smoke, ptl, ht, ui, ftv.
Dari hasil analisis terlihat ada 4 variabel yang p valuenya > 0,05 yaitu age, ptl, ui dan ftv, yang terbesar adalah ftv, sehingga pemodelan selanjutnya variabel ftv dikeluarkan dari model.
Dengan langkah yang sama akhirnya diperoleh hasil sbb. 56
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Logistic Regression Variables in t he Equation
95.0% C.I.for EXP(B) Step a 1
B -.040
S.E. .036
Wald 1.275 6.781
df 1 2
Sig. .259 .034
Exp(B) .960
Lower .896
Upper 1.030
race(1)
1.009
.503
4.035
1
.045
2.744
1.025
7.347
race(2)
1.002
.425
5.562
1
.018
2.723
1.184
6.262
smoke ptl
.963
.390
6.086
1
.014
2.620
1.219
5.632
.629
.340
3.423
1
.064
1.875
.963
3.651
1.358 .800
.629 .457
4.663 3.063
1 1
.031 .080
3.889 2.226
1.134 .908
13.341 5.454
-1.184
.919
1.661
1
.197
.306
age race
ht ui Constant
a. Variable(s) entered on step 1: age, race, smoke, ptl, ht, ui.
Setelah ftv dikeluarkan kita lihat perubahan nilai OR untuk variabel age, race, smoke, ptl, ht, dan ui. Variabel
OR ftv ada
OR ftv tak ada
perubahan OR
Age
0.960
0.960
0%
Race(1)
2.743
2.744
0%
Race(2)
2.727
2.723
0%
Smoke
2.622
2.620
0%
Ptl
1.877
1.875
0,1 %
Ht
3.902
3.889
0.3 %
ui
2.229
2.226
0,1 %
ftv
1.009
Dengan hasil perbandingan OR terlihat tidak ada yang > 10 % dengan demikian dikeluarkan dalam model. Selanjutnya variabel yang terbesar p valuenya adalah umur, dengan demikian dikelurkan dar model dan hasilnya Hasilnyanya :
57
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Variables in the Equation
95.0% C.I.for EXP(B) B Step a 1
race race(1) race(2) smoke ptl ht ui Constant
S.E.
Wald 7.968
df 2
Sig. .019
Exp(B)
Lower
Upper
1.088
.501
4.723
1
.030
2.968
1.113
7.916
1.059 .991
.418 .387
6.422 6.569
1 1
.011 .010
2.883 2.694
1.271 1.263
6.538 5.747
.576
.334
2.975
1
.085
1.779
.925
3.422
1.364 .855
.633 .451
4.640 3.585
1 1
.031 .058
3.912 2.350
1.131 .970
13.537 5.692
-2.146
.386
30.917
1
.000
.117
a. Variable(s) entered on step 1: race, smoke, ptl, ht, ui.
Setelah variabel umur dikeluarkan, kita cek lagi perubahan OR untuk variabel yang masih aktif di model. Variabel
OR age ada
OR age tak ada
perubahan OR
Age
0.960
-
Race(1)
2.743
2.968
8,2 %
Race(2)
2.727
2.883
5,7 %
Smoke
2.622
2.694
2,7 %
Ptl
1.877
1.779
5,2 %
Ht
3.902
3.912
0.3 %
ui
2.229
2.350
5,4 %
ftv
1.009
Dari analisis perbandingan OR, ternyata perubahannya < 10 %, dengan demikian variabel umur dikeluarkan dari model Langkah selanjutnya mengeluarkan variabel yang p valuenya > 0,05, variabel ptl dikeluarkan model, hasilnya
58
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Variables in the Equation
95.0% C.I.for EXP(B) B Step a 1
S.E.
race
Wald 8.245
df 2
Sig. .016
Exp(B)
Lower
Upper
race(1)
1.064
.499
4.545
1
.033
2.897
1.090
7.704
race(2)
1.083
.413
6.877
1
.009
2.955
1.315
6.640
smoke ht
1.094
.380
8.299
1
.004
2.986
1.419
6.286
1.359 1.006
.630 .438
4.660 5.262
1 1
.031 .022
3.894 2.734
1.133 1.158
13.379 6.458
-2.092
.380
30.307
1
.000
.123
ui Constant
a. Variable(s) entered on step 1: race, smoke, ht, ui.
Setelah ptl dikeluarkan, kita lihat perubahan OR nya: Variabel OR ptl ada OR ptl tak ada
perubahan OR
Age
0.960
-
Race(1)
2.743
2.897
5,6 %
Race(2)
2.727
2.955
8,3 %
Smoke
2.622
2.986
13,8 %
Ptl
1.877
-
-
Ht
3.902
3.894
0.2 %
ui
2.229
2.734
22,6 %
ftv
1.009
-
Ternyata setelah ptl dikeluarkan, OR variabel merokok dan kelainan uterus berubah > 10 %, dengan demikian variabel ptl dimasukkan kembali dalam model. Kemudian variabel ui dikeluarkan dalam model karena p valuenya > 0,05, dan hasilnya sbb:
59
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Variables in the Equation
95.0% C.I.for EXP(B) B Step a 1
S.E.
race
Wald 8.286
df 2
Sig. .016
Exp(B)
Lower
Upper
race(1)
1.062
.500
4.513
1
.034
2.894
1.086
7.712
race(2)
1.085
.411
6.949
1
.008
2.958
1.321
6.626
smoke ht
.996
.382
6.794
1
.009
2.707
1.280
5.726
1.221 .696
.629 .325
3.764 4.596
1 1
.052 .032
3.390 2.007
.988 1.062
11.640 3.793
-2.025
.372
29.586
1
.000
.132
ptl Constant
a. Variable(s) entered on step 1: race, smoke, ht, ptl.
Kita lihat kembali perubahan nilai OR setelah variabel ui dikeluarkan : Variabel OR ui ada OR ui tak ada perubahan OR Age
0.960
-
Race(1)
2.743
2.894
5,5 %
Race(2)
2.727
2.958
8,4 %
Smoke
2.622
2.707
3,2 %
Ptl
1.877
2.007
6,9 %
Ht
3.902
3.390
13.1 %
ui
2.229
-
-
ftv
1.009
-
-
Setelah dilakukan perbandingan OR, ternyata variabel ht berubah > 10 %, dengan demikian variabel ui masuk kembali dalam model. Akhirnya model yang dihasilkan adalah sbb:
60
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Variables in the Equation
95.0% C.I.for EXP(B) B Step a 1
S.E.
race race(1) race(2) smoke ptl ht ui Constant
Wald 7.968
df 2
Sig. .019
Exp(B)
Lower
Upper
1.088 1.059 .991
.501 .418 .387
4.723 6.422 6.569
1 1 1
.030 .011 .010
2.968 2.883 2.694
1.113 1.271 1.263
7.916 6.538 5.747
.576 1.364
.334 .633
2.975 4.640
1 1
.085 .031
1.779 3.912
.925 1.131
3.422 13.537
.855 -2.146
.451 .386
3.585 30.917
1 1
.058 .000
2.350 .117
.970
5.692
a. Variable(s) entered on step 1: race, smoke, ptl, ht, ui.
C. UJI INTERAKSI Uji interaksi dilakukan pada variabel yang diduga secara substansi ada interaksi, kalau memang tidak ada tidak perlu dilakukan uji interaksi. Dalam kasus sekarang, misalkan kita duga merokok berinteraksi dengan hipertensi. Langkahnya: 1. klik analysis, klik regression, klik binary ogistik 2. Kotak dependen isikan low 3. Kotak Kovariat isikan Race, smoke, ptl, ht dan ui 4. Klik tombol Next 5. isikan : smoke*ht ke kotak kovariat 6. klik OK
lihat hasilnya pada bagian Block 2
Bloc k 2: Method = Enter Omnibus Tests of Model Coefficients
Chisquare Step 1
df
Sig.
Step
.000
1
.994
Block
.000
1
.994
Model
26.560
7
.000
61
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Variables in the Equation
95.0% C.I.for EXP(B) B Step a 1
S.E.
race(1)
1.088
.502
Wald 7.900 4.692
race(2)
1.059
.419
6.387
1
.011
2.883
1.268
6.555
smoke
.990
.397
6.211
1
.013
2.692
1.236
5.865
ptl ht
.576
.336
2.937
1
.087
1.779
.921
3.438
1.360 .854
.831 .451
2.680 3.584
1 1
.102 .058
3.896 2.350
.765 .970
19.852 5.693
.010
1.283
.000
1
.994
1.010
.082
12.491
-2.146
.386
30.875
1
.000
.117
race
ui ht by smoke Constant
df 2 1
Sig. .019 .030
Exp(B)
Lower
Upper
2.969
1.109
7.946
a. Variable(s) entered on step 1: ht * smoke .
Pada output bagian Block 2:Methode=Enter, terlihat hasil uji omnibusnya memperlihatkan p value = 0,994 (lihat bagian step) berarti lebih besar dari 0,05, berarti : tidak ada interaksi antara merokok dengan hipertensi.
Dengan demikian pemodelan telah selesai, model yang valid adalah model tanpa ada interaksi:
MODEL TERAKHIR Variables in t he Equation
95.0% C.I.for EXP(B) B Step a 1
S.E.
race(1) race(2)
1.088
.501
Wald 7.968 4.723
1.059
.418
6.422
1
.011
2.883
1.271
6.538
smoke
.991 .576
.387 .334
6.569 2.975
1 1
.010 .085
2.694 1.779
1.263 .925
5.747 3.422
1.364
.633
4.640
1
.031
3.912
1.131
13.537
.855 -2.146
.451 .386
3.585 30.917
1 1
.058 .000
2.350 .117
.970
5.692
race
ptl ht ui Constant
df 2 1
Sig. .019 .030
Exp(B)
Lower
Upper
2.968
1.113
7.916
a. Variable(s) entered on step 1: race, smoke, ptl, ht, ui.
62
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Interpretasi: Model regresi logistik hanya dapat digunakan untuk penelitian yang bersifat Kohort. Sedangkan unutk penelitian yang bersifat cross sectional atau case control , interpretasi yang dapat dilakukan hanya menjelaskan nilai OR (Exp B) pada masing-masing variabel. Oleh karena analisisnya multivariat/ganda maka nilai OR-nya sudah terkontrol (adjusted ) oleh variabel lain yang ada pada model. Dari analisis multivariat ternyata variabel yang berhubungan bermakna dengan kejadian BBLR adalah variabel ras, merokok dan hipertensi. Sedangkan variabel riwayat prematur dan kelainan uterus sebagai variabel konfounding. Hasil analisis didapatkan Odds Ratio (OR) dari variabel hipertensi adalah 3,9, artinya Ibu yang menderita hipertensi akan melahirkan bayi BBLR sebesar 4 kali lebih tinggi dibandingkan ibu yang tidak menderita hipertensi setelah dikontrol variabel race, merokok, prematur dan uterus. Secara sama dapat diinterpretasikan untuk variabel yang lain.
Untuk melihat variabel mana yang paling besar pengaruhnya terhadap variabel dependen, dilihat dari exp (B) untuk variabel yang signifikan, semakin besar nilai exp (B) berarti semakin besar pengaruhnya terhadap variabel dependen yang dianalisis. Dalam data ini berarti hipertensi yang paling besar pengaruhnya terhadap kejadian bayi BBLR.
63
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
KASUS KEDUA : REGRESI LOGISTIK MODEL FAKTOR RISIKO Tujuan analisis : Untuk mengetahui hubungan pekerjaan dengan menyusui eksklusive Variabel independen utama : Pkerjaan Variabel dependen : Eksklusive Variabel konfounding : umur, berat badan ibu dan sikap A. Langkah pertama: menyusun model mencakup semua variabel dan variabel interaksi Cara 1. Pilih “ Analyze ” 2. Pilih “Regression ” 3. Klik “Binary Logistic ”, muncul menu dialog yang berisi kotak Dependent dan Covariat. Pada kotak Dependen isikan variabel yang kita perlakukan sebagai dependen (dalam contoh ini berarti eksklu) dan pada kotak Covariat isikan variabel independen utama beserta variabel konfounding dan interaksinya (dalam hal ini berarti: kerja, umur1, bbibu, sikap, kerja*umur1,kerja*bbibu, kerja*sikap) 4. Klik ‘OK’ , dan hasilnya sbb:
Logistic Regression Variables in t he Equation
95.0% C.I.for EXP(B) Stea p1
kerja
B S.E. -20.275 28420.722
Wald .000
df 1
Sig. .999
Exp(B) .000
Lower .000
Upper .
umur1
1.681
1.197
1.972
1
.160
5.372
.514
56.109
sikap
-.052
.114
.208
1
.648
.949
.760
1.186
20.279 28420.722
.000
1
.999
6E+008
.000
.
.849
1.583
kerja by umur1 kerja by sikap Constant
.148
.159
.869
1
.351
1.160
-1.505
1.432
1.105
1
.293
.222
a. Variable(s) entered on step 1: kerja, umur1, sikap, kerja * umur1 , kerja * sikap .
64
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Dari output model penuh/lengkap ini kita lakukan uji interaksi, variabel dikatakan berinteraksi bila p valuenya < 0,05. Seleksinya dengan mengeluarkan secara bertahapVariabel interaksi yang tidak signifikan (p>0,05), pengeluaran dilakukan secara bertahap dari variabel interaksi yang p value- nya terbesar. Dari hasil di atas variabel interaksi ”Pekerjaan by umur” mempunyai nilai p terbesar (p=0,999) sehingga variabel tersebut dikeluarkan dari model. Dan model menjadi:
Logistic Regression Variables in the Equation
95.0% C.I.for EXP(B) Stea p1
kerja umur1
B -.445
S.E. 1.718
Wald .067
df 1
Sig. .795
Exp(B) .641
Lower .022
Upper 18.557
2.217
1.146
3.741
1
.053
9.177
.971
86.749
sikap
-.060
.114
.274
1
.601
.942
.753
1.178
.175
.156
1.264
1
.261
1.191
.878
1.616
-1.881
1.483
1.610
1
.205
.152
kerja by sikap Constant
a. Variable(s) entered on step 1: kerja, umur1, sikap, kerja * sikap .
Dari
output diatas, variabel interaksi ‘kerja by sikap’ harus dikeluarkan dari model
karana p valuenya > 0,05. Setelah dikeluarkan hasilnya: Variables in the Equation
95.0% C.I.for EXP(B) Step a 1
kerja umur1 sikap Consta nt
B 1.376
S.E. .666
Wald 4.273
df 1
Sig. .039
Exp(B) 3.959
Lower 1.074
Upper 14.592
2.260 .035
1.157 .076
3.812 .212
1 1
.051 .645
9.582 1.036
.991 .893
92.609 1.202
-2.876
1.239
5.384
1
.020
.056
a. Variable(s) entered on step 1: kerja, umur1, sikap.
Dengan demikian hasil uji interaksi sudah selesai, kesimpulannya tidak ada variabel interasksi, langkah selanjutnya uji konfounding
65
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
UJI KONFOUNDING Uji konfounding dengan cara melihat perbedaan nilai OR untuk variabel utama dengan dikeluarkannya variabel kandidat konfounding, bila perubahannya > 10 %, maka varaibel tsb dianggap sebagai variabel konfounding.
Tahap pertama : akan dikeluarkan variabel Sikap, setelah dikeluarkan dari model hasiilnya sbb:’ Variables in the Equation
Stea p1
kerja umur1 Constant
B 1.413
S.E. .660
Wald 4.585
df 1
Sig. .032
Exp(B) 4.110
2.378 -2.624
1.135 1.113
4.389 5.555
1 1
.036 .018
10.783 .073
95.0% C.I.for EXP(B) Lower Upper 1.127 14.985 1.165
99.754
a. Variable(s) entered on step 1: kerja, umur1.
Setelah variabel sikap dikeluarkan terlihat perubahan OR variabel utama kerja sebesar : (4,111 – 3,959)/4,111 =3,6 % . Dengan demikian variabel sikap bukan konfounding, dan harus dikeluarkan dari model Langkah selanjutnya mengeluarkan variabel umur, setelah dikeluarkan hasilnya: Variables in t he Equation
95.0% C.I.for EXP(B) Step a 1
kerja Const ant
B 1.698
S.E. .618
Wald 7.545
df 1
Sig. .006
Exp(B) 5.464
-.754
.429
3.091
1
.079
.471
Lower 1.627
Upper 18.357
a. Variable(s) entered on step 1: kerja.
Setelah variabel umur dikeluarkan terlihat perubahan OR variabel utama: kerja sebesar : (5,464-4,111)/4,111 =32,9 % . Dengan demikian variabel umur merupakan variabel konfounding. Untuk itu variabel umur harus tetap ikut dalam model sebagai konfounding hubungan kerja dengan menyusui eksklusive.
66
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Model terakhir : Variables in the Equation
95.0% C.I.for EXP(B) Stea p1
kerja umur1 Constant
B 1.413
S.E. .660
Wald 4.585
df 1
Sig. .032
Exp(B) 4.110
Lower 1.127
Upper 14.985
2.378
1.135
4.389
1
.036
10.783
1.165
99.754
-2.624
1.113
5.555
1
.018
.073
a. Variable(s) entered on step 1: kerja, umur1.
Interpretasi: Setelah dilakukan analisis confounding , ternyata, umur merupakan confounding hubungan pekerjaan dengan menyusui eksklusif, maka modelnya adalah sbb: Dari model di atas dapat dijelaskan bahwa ibu yang tidak bekerja mempunyai peluang menyusui eksklusif 4 kali dibandingkan ibu yang tidak bekerja setelah dikontrol variabel ”umur”.
67
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
Lampiran data LBW. SAV.
Id
Low
age
lwt
race
smoke
ptl
ht
ui
ftv
bwt
1
1
28
120
3
1
1
0
1
0
709
2
1
29
130
1
0
0
0
1
2
1021
3
1
34
187
2
1
0
1
0
0
1135
4
1
25
105
3
0
1
1
0
0
1330
5
1
25
85
3
0
0
0
1
0
1474
6
1
27
150
3
0
0
0
0
0
1588
7
1
23
97
3
0
0
0
1
1
1588
8
1
24
128
2
0
1
0
0
1
1701
9
1
24
132
3
0
0
1
0
0
1729
10
1
21
165
1
1
0
1
0
1
1790
11
1
32
105
1
1
0
0
0
0
1818
12
1
19
91
1
1
2
0
1
0
1885
13
1
25
115
3
0
0
0
0
0
1893
14
1
16
130
3
0
0
0
0
1
1899
15
1
25
92
1
1
0
0
0
0
1928
16
1
20
150
1
1
0
0
0
2
1928
17
1
21
200
2
0
0
0
1
2
1928
18
1
24
155
1
1
1
0
0
0
1936
19
1
21
103
3
0
0
0
0
0
1970
20
1
20
125
3
0
0
0
1
0
2055
21
1
25
89
3
0
2
0
0
1
2055
22
1
19
102
1
0
0
0
0
2
2082
23
1
19
112
1
1
0
0
1
0
2084
24
1
26
117
1
1
1
0
0
0
2084
25
1
24
138
1
0
0
0
0
0
2100
26
1
17
130
3
1
1
0
1
0
2125
27
1
20
120
2
1
0
0
0
3
2126
28
1
22
130
1
1
1
0
1
1
2187
29
1
27
130
2
0
0
0
1
0
2187
30
1
20
80
3
1
0
0
1
0
2211
68
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
31
1
17
110
1
1
0
0
0
0
2225
32
1
25
105
3
0
1
0
0
1
2240
33
1
20
109
3
0
0
0
0
0
2240
34
1
18
148
3
0
0
0
0
0
2282
35
1
18
110
2
1
1
0
0
0
2296
36
1
20
121
1
1
1
0
1
0
2296
37
1
21
100
3
0
1
0
0
4
2301
38
1
26
96
3
0
0
0
0
0
2325
39
1
31
102
1
1
1
0
0
1
2353
40
1
15
110
1
0
0
0
0
0
2353
41
1
23
187
2
1
0
0
0
1
2367
42
1
20
122
2
1
0
0
0
0
2381
43
1
24
105
2
1
0
0
0
0
2381
44
1
15
115
3
0
0
0
1
0
2381
45
1
23
120
3
0
0
0
0
0
2395
46
1
30
142
1
1
1
0
0
0
2410
47
1
22
130
1
1
0
0
0
1
2410
48
1
17
120
1
1
0
0
0
3
2414
49
1
23
110
1
1
1
0
0
0
2424
50
1
17
120
2
0
0
0
0
2
2438
51
1
26
154
3
0
1
1
0
1
2442
52
1
20
105
3
0
0
0
0
3
2450
53
1
26
190
1
1
0
0
0
0
2466
54
1
14
101
3
1
1
0
0
0
2466
55
1
28
95
1
1
0
0
0
2
2466
56
1
14
100
3
0
0
0
0
2
2495
57
1
23
94
3
1
0
0
0
0
2495
58
1
17
142
2
0
0
1
0
0
2495
59
1
21
130
1
1
0
1
0
3
2495
60
0
19
182
2
0
0
0
1
0
2523
61
0
33
155
3
0
0
0
0
3
2551
62
0
20
105
1
1
0
0
0
1
2557
63
0
21
108
1
1
0
0
1
2
2594
64
0
18
107
1
1
0
0
1
0
2600
69
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
65
0
21
124
3
0
0
0
0
0
2622
66
0
22
118
1
0
0
0
0
1
2637
67
0
17
103
3
0
0
0
0
1
2637
68
0
29
123
1
1
0
0
0
1
2663
69
0
26
113
1
1
0
0
0
0
2665
70
0
19
95
3
0
0
0
0
0
2722
71
0
19
150
3
0
0
0
0
1
2733
72
0
22
95
3
0
0
1
0
0
2750
73
0
30
107
3
0
1
0
1
2
2750
74
0
18
100
1
1
0
0
0
0
2769
75
0
18
100
1
1
0
0
0
0
2769
76
0
15
98
2
0
0
0
0
0
2778
77
0
25
118
1
1
0
0
0
3
2782
78
0
20
120
3
0
0
0
1
0
2807
79
0
28
120
1
1
0
0
0
1
2821
80
0
32
121
3
0
0
0
0
2
2835
81
0
31
100
1
0
0
0
1
3
2835
82
0
36
202
1
0
0
0
0
1
2836
83
0
28
120
3
0
0
0
0
0
2863
84
0
25
120
3
0
0
0
1
2
2877
85
0
28
167
1
0
0
0
0
0
2877
86
0
17
122
1
1
0
0
0
0
2906
87
0
29
150
1
0
0
0
0
2
2920
88
0
26
168
2
1
0
0
0
0
2920
89
0
17
113
2
0
0
0
0
1
2920
90
0
17
113
2
0
0
0
0
1
2920
91
0
24
90
1
1
1
0
0
1
2948
92
0
35
121
2
1
1
0
0
1
2948
93
0
25
155
1
0
0
0
0
1
2977
94
0
25
125
2
0
0
0
0
0
2977
95
0
29
140
1
1
0
0
0
2
2977
96
0
19
138
1
1
0
0
0
2
2977
97
0
27
124
1
1
0
0
0
0
2992
98
0
31
215
1
1
0
0
0
2
3005
70
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
99
0
33
109
1
1
0
0
0
1
3033
100
0
21
185
2
1
0
0
0
2
3042
101
0
19
189
1
0
0
0
0
2
3062
102
0
23
130
2
0
0
0
0
1
3062
103
0
21
160
1
0
0
0
0
0
3062
104
0
18
90
1
1
0
0
1
0
3076
105
0
18
90
1
1
0
0
1
0
3076
106
0
32
132
1
0
0
0
0
4
3080
107
0
19
132
3
0
0
0
0
0
3090
108
0
24
115
1
0
0
0
0
2
3090
109
0
22
85
3
1
0
0
0
0
3090
110
0
22
120
1
0
0
1
0
1
3100
111
0
23
128
3
0
0
0
0
0
3104
112
0
22
130
1
1
0
0
0
0
3132
113
0
30
95
1
1
0
0
0
2
3147
114
0
19
115
3
0
0
0
0
0
3175
115
0
16
110
3
0
0
0
0
0
3175
116
0
21
110
3
1
0
0
1
0
3203
117
0
30
153
3
0
0
0
0
0
3203
118
0
20
103
3
0
0
0
0
0
3203
119
0
17
119
3
0
0
0
0
0
3225
120
0
17
119
3
0
0
0
0
0
3225
121
0
23
119
3
0
0
0
0
2
3232
122
0
24
110
3
0
0
0
0
0
3232
123
0
28
140
1
0
0
0
0
0
3234
124
0
26
133
3
1
2
0
0
0
3260
125
0
20
169
3
0
1
0
1
1
3274
126
0
24
115
3
0
0
0
0
2
3274
127
0
28
250
3
1
0
0
0
6
3303
128
0
20
141
1
0
2
0
1
1
3317
129
0
22
158
2
0
1
0
0
2
3317
130
0
22
112
1
1
2
0
0
0
3317
131
0
31
150
3
1
0
0
0
2
3321
132
0
23
115
3
1
0
0
0
1
3331
71
SUTANTO PRIYO HASTONO: Analisis Multivariat, FKM UI, 2006
133
0
16
112
2
0
0
0
0
0
3374
134
0
16
135
1
1
0
0
0
0
3374
135
0
18
229
2
0
0
0
0
0
3402
136
0
25
140
1
0
0
0
0
1
3416
137
0
32
134
1
1
1
0
0
4
3430
138
0
20
121
2
1
0
0
0
0
3444
139
0
23
190
1
0
0
0
0
0
3459
140
0
22
131
1
0
0
0
0
1
3460
141
0
32
170
1
0
0
0
0
0
3473
142
0
30
110
3
0
0
0
0
0
3475
143
0
20
127
3
0
0
0
0
0
3487
144
0
23
123
3
0
0
0
0
0
3544
145
0
17
120
3
1
0
0
0
0
3572
146
0
19
105
3
0
0
0
0
0
3572
147
0
23
130
1
0
0
0
0
0
3586
148
0
36
175
1
0
0
0
0
0
3600
149
0
22
125
1
0
0
0
0
1
3614
150
0
24
133
1
0
0
0
0
0
3614
151
0
21
134
3
0
0
0
0
2
3629
152
0
19
235
1
1
0
1
0
0
3629
153
0
25
95
1
1
3
0
1
0
3637
154
0
16
135
1
1
0
0
0
0
3643
155
0
29
135
1
0
0
0
0
1
3651
156
0
29
154
1
0
0
0
0
1
3651
157
0
19
147
1
1
0
0
0
0
3651
158
0
19
147
1
1
0
0
0
0
3651
159
0
30
137
1
0
0
0
0
1
3699
160
0
24
110
1
0
0
0
0
1
3728
161
0
19
184
1
1
0
1
0
0
3756
162
0
24
110
3
0
1
0
0
0
3770
163
0
23
110
1
0
0
0
0
1
3770
164
0
20
120
3
0
0
0
0
0
3770
165
0
25
241
2
0
0
1
0
0
3790
166
0
30
112
1
0
0
0
0
1
3799
72