REGRESI LOGISTIK BINER DAN PENERAPANNYA
DALAM BIDANG KESEHATAN
(Studi Kasus Faktor-Faktor Yang Mempengaruhi Hasil Diagnosa Penyakit Kanker Payudara Jinak di New Haven, New York, Amerika Serikat)
MAKALAH
Diajukan untuk memenuhi salah satu tugas mata kuliah Analisis Regresi Terapan
Disusun Oleh :
Pratiwi Sudiro (12611004)
Sofi Khoirunnisak (13611018)
Conita (13611091)
Andriani Septiyani (13611166)
JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS ISLAM INDONESIA
YOGYAKARTA
2015
BAB I
PENDAHULUAN
Latar Belakang
Kanker payudara adalah suatu penyakit dimana terjadi pertumbuhan berlebihan atau perkembangan tidak terkontrol dari sel-sel jaringan payudara. Kanker payudara merupakan jenis kanker yang sering ditemukan oleh kebanyakan wanita. Menurut WHO pada tahun 2005 dilaporkan sebanyak 506.000 wanita meninggal disebabkan oleh kanker payudara.
Di Amerika Serikat, lebih dari 450.000 wanita orang meninggal dunia setiap tahun karena penyakit kanker payudara. Sekitar 70-90% dari penyakit kanker tersebut berkaitan dengan lingkungan dan gaya hidup (life style). Kurang Iebih 30% dari kematian tersebut karena rokok. Faktor-faktor keturunan (genetik), radiasi, polusi dan eksposur lainnya memberikan kontribusi 45.000-90.000 kematian. Dari seluruh penyakit kanker yang disebabkan faktor lingkungan, sekitar 40-60% berhubungan dengan faktor gizi. Dalam tahun 1984, 22% dari seluruh kematian di Amerika Serikat, disebabkan karena kanker diantaranya juga adalah kanker payudara. Dan 965.000 kasus baru yang didiagnosis menderita kanker, 483.000 di antaranya meninggal dunia. Diperkirakan 60-70% kanker disebabkan karena faktor lingkungan, terutama makanan dan rokok.
Dari berbagai kesulitan yang ada pada kanker payudara mensimulasikan penderita kanker payudara sehingga bisa diketahui karakteristik penderita kanker payudara. Analisis regresi logistik digunakan untuk analisis data respon kategorik (nominal/ ordinal) dengan variabel-variabel bebas kontinu dan kategorik. Perbedaan nilai probabilitas pada setiap kelas akan menghasilkan nilai odds rasio. Nilai odds rasio dapat menginformasikan besarnya pengaruh salah satu variabel bebas terhadap terjadinya perubahan kelas. Dalam penelitian ini adalah penderita dan non penderita kanker payudara.
Karena banyaknya wanita yang menderita penyakit kanker payudara di New Haven, Amerika Serikat, maka dalam makalah ini kami tertarik untuk mengetahui apa saja faktor-faktor yang mempengaruhi timbulnya penyakit kanker payudara jinak. Oleh sebab itu, dalam makalah ini kami mengambil judul Regresi logistic biner dan penerapannya dalam bidang kesehatan (studi kasus : Faktor-faktor yang mempengaruhi timbulnya penyakit kanker payudara jinak di New Haven, Amerika Serikat).
Rumusan Masalah
Dari latar belakang diatas maka permasalahan yang ada dalam penelitian ini adalah :
Bagaimana hasil dari analisis Logistic Biner untuk mengetahui diagnose penyakit kanker payudara jinak setelah dilakukan penelitian terhadap 178 responden memeriksa epidemiologi fibrokistik penyakit payudara?
Berdasarkan model regresi logistic variabel-variabel apa saja yang berpengaruh terhadap faktor-faktor yang mempengaruhi timbulnya penyakit kanker payudara jinak?
Tujuan Penulisan
Adapun tujuan dari penelitian yang ingin dicapai adalah :
Mengetahui hasil diagnose penyakit kanker payudara jinak setelah dilakukan penelitian terhadap 178 responden yang memeriksa epidemiologi fibrokistik pada payudara.
Mengetahui variabel-variabel yang berpengaruh terhadap faktor-fkctor timbulnya penyakit kanker payudara jinak.
BAB II
TINJAUAN PUSTAKA
Pengertian Kanker
Kanker merupakan kumpulan sel abnormal yang terbentuk oleh sel-sel yang tumbuh secara terus-menerus, tidak terbatas, tidak terkoordinasi dengan jaringan sekitarnya dan tidak berfungsi fisiologis. Kanker terjadi karena timbul dan berkembangbiaknya jaringan sekitarnya (infiltratif) sambil merusaknya (dekstrutif), dapat menyebar kebagian lain tubuh, dan umumnya fatal jika dibiarkan. Sel-sel kanker akan berkembang dengan cepat, tidak terkendali, dan terus membelah diri, selanjutnya menyusup ke jaringan di sekitarnya (invasive) dan terus menyebar melalui jaringan ikat, darah, dan menyerang organ-organ penting serta saraf tulang belakang. Dalam keadaan normal, sel hanya akan membelah diri jika ada penggantian sel-sel yang telah mati dan rusak. Sebaliknya, sel kanker akan membelah terus meskipun tubuh tidak memerlukannya, sehingga akan terjadi penumpukan sel baru. Penumpukan sel tersebut mendesak dan merusak jaringan normal, sehingga mengganggu organ yang ditempatinya Pertumbuhan sel-sel kanker akan menyebabkan jaringan menjadi besar dan disebut sebagai tumor. Tumor merupakan istilah yang dipakai untuk semua bentuk pembengkakan atau benjolan dalam tubuh. Sel-sel kanker yang tumbuh cepat dan menyebar melalui pembuluh darah dan pembuluh getah bening. Penjalarannya kejaringan lain disebut sebagai metastasis. Kanker mempunyai karakteristik yang berbeda-beda.
Pengertian Kanker Payudara
Kanker payudara adalah tumor ganas yang meyerang jaringan payudara, jaringan payudara terdiri dari kelenjar susu (kelenjar pembuat air susu) saluran kelenjar (saluran air susu) dan jaringan penunjang payudara. Kanker payudara merupakan penyakit yang dapat menyebabkan kematian pada wanita,kanker payudara terjadi karena adanya kerusakan pada gen yang mengatur pertumbuhan dan diferensiasi sehingga sel itu tumbuh dan berkembang biak tanpa dapat dikendalikan. Sel-sel kanker payudara ini dapat menyebar melalui aliran darah ke seluruh tubuh.
Faktor-faktor resiko Kanker payudara Jinak
Ada beberapa faktor resiko yang erat kaitannya dengan terjadinya kanker payudara, yaitu :
Umur
Meningkatnya resiko kanker payudara sejalan dengan bertambahnya umur. Wanita yang paling sering terkena kanker payudara adalah mereka yang umurnya yang memasuki usia 30-40 tahunan, meskipun demikian tidak berarti wanita dibawah usia tersebut tidak mungkin terkena kanker payudara, hanya kejadiannya lebih rendah dibandingkan dengan wanita yang mempunyai umur 30 sampai 40 tahun keatas.
Usia menarche dini (pertama kali menstruasi)
Bila haid pertama datang sebelum usia 12 tahun, maka wanita akan mengalami sirkulasi hormon estrogen sepanjang hidupnya lebih lama. Hormon estrogen dapat merangsang pertumbuhan duktus dalam kelenjar payudara. Keterpajanan lebih lama dari hormon estrogen dapat menimbulkan perubahan sel-sel duktus dari kelenjar payudara. Perubahan tersebut dapat berupa hipertropi dan proliferasi yang abnormal sehingga akhirnya dapat berubah menjadi kanker.Menarche kurang dari 12 tahun mempunyai risiko 1,7-3,4 kali lebih tinggi daripada wanita dengan menarche datang pada usia normal yaitu lebih dari 12 tahun.
Usia terakhir kali Menopouse
Wanita yang mengalami masa menopausenya terlambat lebih dari 55 tahun,risikonya 2,5 hingga 5 kali lebih tinggi dari pada wanita yang masa menopausenya kurang dari 55 tahun.Penelitian Azamris di Rumah Sakit Dr.M.Djamil Padang tahun 1998-2000 Faktor menopause didapatkan memiliki risiko 1,89 kali (CI 1,71- 2,06). Hal ini menunjukkan bahwa kanker payudara lebih sering mengenai wanita usia menopause.
Berat badan Subyek pada saat wawancara apakah mengalami obesitas atau kegemukan.
Orang dewasa yang memiliki berat badan berlebihan (obesitas) berisiko terhadap kanker payudara. Risiko ini disebabkan oleh lemak yang berebihan dalam darah meningkatkan kadar estrogen dalam darah, sehingga akan meningkatkan pertumbuhan sel-sel kanker.Menurut laporan Nagi dan Lee moffit yang dikutip oleh Luwia ( 2004) menunjukan bahwa perempuan yang mengalami peningkatan berat badan pada usia 30 tahun, dan yang lemak tubuhnya lebih banyak berada ditubuh bagian atas, tidak hanya memiliki risiko lebih besar untuk terkena kanker payudara, tetapi juga memiliki risiko yang lebih besar untuk meninggal akibat kanker itu.
Pemeriksaan Umum Medis
Wanita yang pernah memeriksakan diri mereka untuk mengetahui tumor jinak payudara secara dini dan rutin risikonya 2,5 kali lebih lebih kecil daripada wanita yang tidak pernah memeriksakan diri mereka untuk mengetahui tumor jinak payudara. Hasil diagnose yang akurat sangat diperlukan guna memperkecil terjadinya area perluasan kanker.
Pengertian Logistik
Regresi logistik adalah bagian dari analisis regresi yang digunakan ketika variabel dependen (respon) merupakan variabel dikotomi. Variabel dikotomi biasanya hanya terdiri atas dua nilai, yang mewakili kemunculan atau tidak adanya suatu kejadian yang biasanya diberi angka 0 atau 1.Tidak seperti regresi linier biasa, regresi logistik tidak mengasumsikan hubungan antara variabel independen dan dependen secara linier. Regresi logistik merupakan regresi non linier dimana model yang ditentukan akan mengikuti pola kurva seperti gambar di bawah ini.
Gambar 1.1 Kurva Resgresi Logistik Biner
Model yang digunakan pada regresi logistik adalah
Log (P / 1 – p) = β0 + β1X1 + β2X2 + …. + βkXk
Dimana p adalah kemungkinan bahwa Y = 1, dan X1, X2, X3 adalah variabel independen, dan b adalah koefisien regresi.
Regresi logistik akan membentuk variabel prediktor/respon (log (p/(1-p)) yang merupakan kombinasi linier dari variabel independen. Nilai variabel prediktor ini kemudian ditransformasikan menjadi probabilitas dengan fungsi logit.
Regresi logistik juga menghasilkan rasio peluang (odds ratios) terkait dengan nilai setiap prediktor. Peluang (odds) dari suatu kejadian diartikan sebagai probabilitas hasil yang muncul yang dibagi dengan probabilitas suatu kejadian tidak terjadi. Secara umum, rasio peluang (odds ratios) merupakan sekumpulan peluang yang dibagi oleh peluang lainnya. Rasio peluang bagi prediktor diartikan sebagai jumlah relatif dimana peluang hasil meningkat (rasio peluang > 1) atau turun (rasio peluang < 1) ketika nilai variabel prediktor meningkat sebesar 1 unit.
Pengertian Regresi Biner
Analisis regresi logistik digunakan untuk menjelaskan hubungan antara variabel respon yang berupa data dikotomik/biner dengan variabel bebas yang berupa data berskala interval dan atau kategorik (Hosmer dan Lemeshow, 1989). Variabel yang dikotomi/biner adalah variabel yang hanya mempunyai dua kategori saja, yaitu kategori yang menyatakan kejadian sukses (Y=1) dan kategori yang menyatakan kejadian gagal (Y=0).
Model regresi logistik biner merupakan salah satu model regresi logistik yang digunakan untuk menganalisa hubungan antara satu variabel respon dan beberapa variabel prediktor, dengan variabel responnya berupa data kualitatif dikotomi yaitu bernilai 1 untuk menyatakan keberadaan sebuah karakteristik dan bernilai 0 untuk menyatakan ketidakberadaan sebuah karakteristik. Model regresi logistik biner dengan satu variabel respon dapat dikembangkan menjadi model regresi logistik biner dengan menggunakan dua variabel respon, dimana model ini disebut model regresi logistik biner bivariat.
Asumsi-asumsi dalam regresi logistik
Tidak mengasumsikan hubungan linier antar variabel dependen dan independent
Variabel dependen harus bersifat dikotomi (2 variabel)
Variabel independent tidak harus memiliki keragaman yang sama antar kelompok variabel
Kategori dalam variabel independent harus terpisah satu sama lain atau bersifat eksklusif
Sampel yang diperlukan dalam jumlah relatif besar, minimum dibutuhkan hingga 50 sampel data untuk sebuah variabel prediktor (bebas).
Penduga Parameter
Metode untuk mengestimasi parameter-parameter yang tidak diketahui dalam model regresi logistik ada 3 yaitu:
Metode kemungkinan maksimum (Maximum Likelihood Method)
Metode kuadrat terkecil tertimbang noniterasi (Noniterative Weight Least Square Method)
Analisis fungsi diskriminan (Discriminant Fuction Analysis).
Metode maksimum Likelihood merupakan metode kuadrat terkecil tertimbang dengan beberapa proses iterasi, sedangkan metode noniterative weight least square method hanya menggunakan satu kali iterasi. kedua metode ini asymptoticaly equivalent, artinya jika ukuran sampel besar keduanya akan menghasilkan estimator yang identik. Penggunaan fungsi diskriminan mensyaratkan variabel penjelas yang kuantitatif berdistribusi normal. Oleh karena itu, penduga dari fungsi diskriminan akan over estimate bila variabel penjelas tidak berdistribusi normal.
Dari ketiga metode di atas, metode yang banyak digunakan adalah metode maksimum likelihood dengan alasan lebih praktis (Nachrowi dan Usman, 2002). Metode maksimum likelihoood ini menduga parameter dengan nilai yang memaksimumkan fungsi likelihood (likelihood function).
Pengertian Odds Ratio
Odds ratio merupakan ukuran risiko atau kecenderungan untuk mengalami kejadian 'sukses ' antara satu kategori dengan kategori lainnya, didefinisikan sebagai ratio dari odds untuk xj = 1 terhadap xj = 0. Odds ratio ini menyatakan risiko atau kecenderungan pengaruh observasi dengan xj = 1 adalah berapa kali lipat jika dibandingkan dengan observasi dengan xj = 0. Untuk variabel bebas yang berskala kontinyu maka interpretasi dari koefisien βj pada model regresi logistik adalah setiap kenaikan c unit pada variabel bebas akan menyebabkan risiko terjadinya Y = 1, adalah exp(c.βj) kali lebih besar. Odds ratio dilambangkan dengan θ, didefinisikan sebagai perbandingan dua nilai odds xj = 1 dan xj = 0. Dengan Rumus :
BAB III
PEMBAHASAN, SUMBER DATA DAN MODEL ANALISIS
Jenis dan Sumber Data
Jenis data yang digunakan dalam penelitian ini berupa data sekunder yang diambil dari data yang berisi informasi dari 1 - 3 rancangan yang cocok mempelajari faktor risiko yang terkait dengan penyakit payudara jinak. Data ini terdiri dari subset dari penelitian besar di mana data asli berasal dari rumah sakit berdasarkan studi kasus-kontrol yang dirancang untuk memeriksa epidemiologi fibrokistik penyakit payudara. Data yang disediakan pada 50 perempuan yang didiagnosis memiliki penyakit payudara jinak dan 128 usia cocok kontrol, dengan tiga kontrol perkasus. Pencocokan didasarkan pada usia subjek pada saat wawancara. Kasus termasuk wanita dengan diagnosis biopsi dikonfirmasi fibrokistik penyakit payudara diidentifikasi melalui dua rumah sakit di New Haven, Connecticut. Kontrol dipilih dari antara pasien dirawat di bedah umum, ortopedi, atau Otolaryngologic layanan di dua rumah sakit yang sama. Terlatih pewawancara diberikan kuesioner terstruktur standar untuk mengumpulkan informasi dari masing-masing subjek [lihat Pastides et. al. (1983) dan Pastides, et al. (1985)].
Tabel 2.1 Data keterangan pasien kanker payudara jinak
NO
USSW
DA
PUM
UPKH
UPKM
JK
SBB
UTKM
1
39
1
1
23
13
5
118
39
2
39
0
2
16
11
3
175
39
3
39
0
2
20
12
3
135
39
4
39
0
1
21
11
3
125
40
5
38
0
2
20
15
2
183
38
6
38
0
2
19
11
5
218
38
7
38
0
1
23
13
2
192
37
8
38
1
1
22
15
2
125
38
9
38
0
2
20
14
2
123
38
10
38
0
1
19
13
2
140
37
11
38
0
1
18
13
2
160
38
12
38
1
1
24
14
3
150
38
13
38
0
1
26
13
1
130
38
14
38
0
2
23
14
4
140
38
15
38
0
1
25
16
2
130
38
16
38
1
1
21
17
2
150
38
17
38
0
2
20
12
2
148
38
18
38
0
1
16
14
6
138
38
19
38
1
1
24
12
3
116
39
20
38
0
2
19
12
2
145
35
21
38
0
2
21
10
3
195
35
22
38
0
1
25
8
1
180
38
23
37
0
1
20
11
2
135
37
24
37
0
1
18
10
3
155
37
25
37
0
2
22
13
2
120
38
26
36
0
1
20
12
2
191
36
27
36
0
2
17
10
3
185
37
28
36
0
2
23
12
2
119
37
29
35
1
1
23
14
3
129
36
30
35
0
2
21
11
3
170
34
31
36
0
1
22
14
4
110
36
32
35
0
2
24
11
2
155
35
33
35
1
2
21
12
2
105
29
34
36
0
1
26
13
2
115
36
35
36
0
2
22
12
3
120
36
36
36
0
1
33
16
1
150
36
37
35
0
2
18
13
2
110
35
38
35
0
1
19
11
3
170
36
39
35
0
1
21
12
2
145
36
40
34
1
2
25
10
1
170
34
41
35
0
1
27
13
4
140
35
42
34
0
1
20
11
3
240
34
43
34
0
2
25
16
1
100
35
44
33
0
2
21
11
1
160
33
45
32
0
2
24
12
2
155
32
46
33
0
1
25
12
2
132
33
47
33
1
1
28
14
5
110
33
48
33
0
1
21
12
2
145
29
49
33
0
2
20
13
2
155
29
50
33
0
1
21
13
1
110
33
51
32
1
1
30
13
1
129
32
52
32
0
1
25
11
2
131
32
53
32
0
2
20
9
2
218
26
54
32
0
1
23
16
2
115
32
55
31
1
1
30
14
0
110
30
56
30
0
1
21
14
3
130
30
57
31
0
2
23
11
2
97
31
58
31
0
2
24
13
3
120
31
59
68
1
1
22
12
3
130
50
60
68
0
1
34
14
3
150
53
61
68
0
2
19
12
7
145
46
62
64
1
2
30
14
3
135
53
63
64
0
1
26
11
5
205
42
64
64
0
1
25
10
2
127
50
65
63
1
1
21
15
5
120
52
66
63
0
2
24
11
3
144
50
67
62
0
1
26
15
2
170
39
68
62
0
2
32
12
2
134
53
69
62
0
1
22
12
3
155
39
70
61
1
1
28
14
3
125
53
71
61
0
2
26
13
1
140
50
72
61
0
2
28
15
3
120
41
73
61
0
1
27
14
2
134
45
74
61
1
1
22
16
4
150
56
75
62
0
2
30
11
1
117
36
76
62
0
2
25
15
4
147
52
77
61
0
2
26
13
3
124
52
78
61
1
1
26
17
2
129
34
79
62
0
1
33
11
1
170
54
80
61
0
2
25
13
3
153
50
81
61
0
1
29
13
2
130
55
82
61
1
2
21
15
3
145
53
83
61
0
1
18
13
5
140
56
84
61
0
1
22
17
2
155
55
85
61
0
1
23
15
3
116
43
86
60
1
1
28
17
2
115
51
87
60
0
2
25
11
2
175
42
88
60
0
2
24
13
2
179
50
89
60
0
1
33
15
3
119
47
90
58
1
1
20
12
5
153
53
91
58
0
2
25
16
3
185
55
92
58
0
1
24
10
0
140
25
93
55
1
1
30
16
2
126
44
94
55
0
2
30
13
2
193
50
95
55
0
1
24
14
6
116
47
96
55
1
1
24
14
4
140
52
97
55
0
1
16
12
3
175
47
98
55
0
1
26
15
4
155
50
99
52
0
1
28
12
2
113
45
100
52
0
2
20
14
6
110
40
101
52
0
2
25
13
3
190
48
102
52
1
1
23
14
3
114
50
103
52
0
2
21
12
3
126
43
104
52
0
2
23
11
2
159
42
105
52
0
1
20
11
5
170
42
106
51
1
2
24
16
5
156
52
107
51
0
2
24
12
4
161
50
108
51
0
1
22
13
2
150
45
109
51
0
1
24
13
5
115
51
110
49
0
2
25
12
2
235
44
111
49
0
2
24
13
3
145
44
112
49
0
1
25
13
3
123
49
113
48
1
1
22
11
3
145
48
114
48
0
2
22
11
1
155
48
115
48
0
2
19
11
0
190
29
116
47
1
1
26
14
4
120
47
117
47
0
2
20
12
5
110
47
118
47
0
1
24
14
2
148
45
119
47
0
1
22
13
3
120
45
120
47
1
1
19
12
1
132
47
121
47
0
2
23
15
3
115
29
122
47
0
1
23
13
2
125
47
123
47
0
1
21
12
5
120
39
124
46
1
2
27
15
11
155
46
125
46
0
2
19
11
3
170
45
126
46
0
1
26
13
7
180
46
127
46
0
1
15
13
1
179
40
128
46
1
1
27
12
4
137
46
129
46
0
2
23
12
4
107
46
130
46
0
1
22
11
6
144
46
131
46
0
1
17
13
3
189
39
132
45
1
1
33
14
2
80
45
133
45
0
1
25
13
1
142
38
134
45
0
2
20
11
1
150
45
135
45
0
1
22
11
3
154
46
136
45
0
2
23
11
2
150
45
137
45
0
1
20
12
1
102
28
138
45
0
1
30
12
3
110
45
139
45
1
1
18
15
4
101
45
140
45
0
2
22
17
2
109
40
141
45
0
2
30
13
2
210
40
142
45
0
1
22
10
5
198
33
143
45
1
1
25
16
4
124
45
144
45
0
2
23
12
3
133
45
145
45
0
1
23
13
3
120
46
146
45
0
2
23
12
4
165
35
147
44
1
1
25
12
3
130
44
148
44
0
1
27
13
3
240
45
149
44
0
1
27
14
1
125
44
150
44
1
1
24
15
1
130
44
151
44
0
2
22
15
1
105
44
152
44
0
1
23
12
5
123
33
153
44
0
2
18
17
7
180
44
154
43
1
1
27
15
2
130
43
155
43
0
1
31
12
1
104
43
156
43
0
1
14
12
2
158
21
157
43
0
1
20
14
6
160
39
158
27
0
2
22
12
1
127
27
159
28
0
2
20
11
2
145
27
160
28
0
1
23
16
2
127
29
161
53
1
1
29
12
4
132
50
162
53
0
1
28
11
3
140
49
163
53
0
1
26
11
1
130
49
164
56
1
1
21
17
6
130
47
165
56
0
2
27
11
4
265
42
166
56
0
1
26
13
4
195
50
167
56
0
2
25
12
2
125
47
168
41
1
1
25
16
3
105
27
169
41
0
1
20
13
4
161
31
170
41
0
2
21
14
5
135
36
171
41
0
1
22
12
4
185
41
172
41
1
1
40
15
1
115
41
173
41
0
1
21
16
3
140
41
174
40
0
1
21
12
4
145
40
175
41
0
2
26
14
3
195
41
176
41
1
1
34
13
2
138
42
177
41
0
2
30
12
2
129
41
178
39
1
1
23
13
5
118
39
(Sumber : Appendix 5 of Hosmer, D.W. and Lemeshow, S. (1989) Applied Logistic Regression, John Wiley and Sons, New York. )
Operasional Variabel
Variabel terkait :
Diagnosa Akhir (DA)
Variabel bebas :
Usia Subjek saat wawancara (USSW)
Pemeriksaan umum medis (PUM)
Usia pertama kali hamil (UPKH)
Usia pertama kali menstruasi (UPKM)
Jumlah Kelahiran / Anak (JK)
Berat badan subjek (SBB)
Usia terakhir kali menstruasi (UTKM)
Metode Penelitian
Metode penelitian yang digunakan yakni dengan analisis inferensial menggunakan model multivariat. Analisis dilakukan menggunakan perangkat lunak komuter SPSS 16.0.
Definisi metode
Analisis inferensial dilakukan dengan membuat sebuah model multivariat menggunakan metode regresi logistok biner. Dari model ini akan diketahui signifikasi dari tiap-tiap variabel independen yang secara bersama-sama mempengaruhi variabel dependen ketika dimasukkan ke dalam model. Regresi logistik biner sendiri merupakan salah satu contoh dari model regresi logistik atau biasa disebut model logit.
Model logit adalah model regresi non-linear yang menghasilkan sebuah persamaan dimana variabel dependen bersifat kategorikal. Berdasarkan jenis variabel dependennya, regresi logistik dapat dibedakan menjadi 2, yaitu : Binary Logistic Regression ( Regresi Logistik Biner ) dan Multinomial Logistic Regression ( Regresi Logistik Multinomial ). Regresi logistik biner digunakan ketika hanya ada 2 kemungkinan variabel respon (Y), misalnya membeli dan tidak membeli. Sedangkan Regresi Logistik Multinomial digunakan ketika pada veriabel respon (Y) terdapat lebih dari 2 kategorisasi. Penelitian mengenai diagnosa penyakit kanker payudara jinak hanya memiliki 2 kemungkinan variabel dependen Y, yaitu terdiagnosa atau tidak terdiagnosa hasil tersebut, sehingga model yang digunakan adalah regresi logistik biner. Dua kategori kemungkinan variabel dependen diwakili oleh angka 0 dan 1. Angka yang dihasilkan mewakilkan suatu kategori tertentu yang dihasilkan dari perhitungan probabilitas terjadinya kategori tersebut. Bentuk dasar probabilitas dalam model logit dapat dijelaskan pada tabel berikut :
Tabel 3.2 Probailitas dalam model logit
Yi
Probabilitas
0
1
1 – Pi
Pi
Total
1
Prosedur Analisis Regresi
Identifikasi Model
Gambar 3.1 Output Variable in the Equation
Dengan studi kasus yang telah dipaparkan, maka didapatkan model sebagai berikut :
Model regresi
Y = -7,061- 0,048 X1 – 1,286 X2 + 0,071 X3 + 0,409 X4 - 0,25
X5 + 0,111 X6
Model logit
Π ( Y ) = eY1+eY
exp-7,061-0,048 x1-1,286x2+0,071 x3+0,409 x4-0,025 x5+0,11 x61+exp-7,061-0,048 x1-1,286x2+0,071 x3+0,409 x4-0,025 x5+0,11 x6
Dimana:
X1 : Usia subjek saat diwawancara
X2 : Pemeriksaan umum medis
X3 : Usia pertama kali hamil
X4 : Usia pertama kali menstruasi
X5 : Jumlah Anak
X6 : Usia terakhir menstruasi
Model Summary
Gambar 3.2 Output Model Summary
Cox & Snell R Square merupaan ukuran yang mencoba meniru kuran R Square pada multiple regression yang didasarkan pada teknik estimasi likelihood dengan nilai maksimum kurang dari 1 sehingga sulit untuk diinterpretasikan. Oleh karena it, Nagelkerke R Square yang merupakan modifikasi dari Cox & Snell di mana nilainya bervariasi dari 0-1, akan lebih mudah untuk diinterpretasikan sebagaimana interpretasi atas R Square pada multiple regression atau Pseudo R-Square dalam multinomial logistic regression.
Nagelkerke R Square pada tabel diatas menunjukkan nilai sebesar 0,365 atau 36,5 %. Hal ini berarti, variabilitas variabel dependen dapat dijelaskan oleh variabilitas variabel-variabel independen sebesar 36,5 %. Artinya, seluruh variabel independen mempengaruhi variabel dependen secara serentask pada kisaran 36,5 %, sedangkan 63,5 % lainya dipengaruhi atau dijelaskan oleh variabel-variabel yang tidak dimasukkan dalam penelitian ini. Namun nilai ini hanya pendekatan saja karena pada regresi logistik koefisien determinasi tidak dapat dihitung seperti regresi linier, sehingga yang perlu lebih diperhatikan adalah seberapa banyak kita dapat memprediksi dengan benar yang tercermin dari nilai Classification Table.
Gambar 3.3 Output Classification Table
Dari tabel diatas didapatkan penjelasan mengenai variabel dependen. Dari hasil tersebut didapatkan bahwa hasil diagnosa 178 orang wanita yang melakukan pemeriksaan medis dan dinyatakan positif mengidap penyakit kanker payudara sebanyak 25 orang dan yang dinyatakan negattif mengidap penyakit kanker payudara sebanyak 153 orang. Tapi pada kenyataanya dari 178 wanita yang melakukan pemeriksaan medis dan dinyatakan positif mengidap kanker payudara sebanyak 40 orang dan yang dinyatakan negatif sebanyak 138 orang. jadi, model regresi logistik yang digunakan cukup baik karena mampu menebak dengan benar 79,2 % kondisi yang terjadi.
Uji Kecocokan Model ( Goodness of fit )
Gambar 3.4 Output Omnimbus Test
Berdasarkan tabel diatas, untuk mendapatkan model yang layak digunakan dilakukan uji hipotesis dalam anova yaitu digunakan uji Overall. Berikut analisisnya :
Hipotesis
H0 : β1 = β2 = ... βp = 0 ( Model layak digunakan / tidak ada pengaruh variabel bebas terhadap variabel terikat )
H1 : ada β1 0, dimana i = 1,2,..., p (Model layak digunakan / ada pengaruh variabel bebas terhadap variabel terikat )
Tingkat Signifikansi (tingkat risiko)
Tingkat signifikansinya (α) = 5% = 0.05, dengan begitu tingkat kepercayaan (Confidence Interval) yang digunakan praktikan adalah 95%.
Daerah kritis
Tolak H0 jika:
P-Value <α
Chi-Square > Chi- Square tabel
Statistika Uji
Model : P-Value (0.000) <α (0.05)
Keputusan
Tolak H0
Kesimpulan
Dengan menggunakan α sebesar 5%, maka keputusannya tolak H0, artinya ada βi yang tidak sama dengan 0 (Model layak digunakan / ada pengaruh variabel bebas terhadap variabel terikat).
Uji Parsial
Gambar 3.5 Output Variable in the Equation
Hasil output gambar diatas menampilkan uji t yang digunakan untuk menguji parameter secara parsial, dengan kata lain untuk mengetahui apakah variabel independen (x) berpengaruh secra signifikan (nyata) terhadap variabel dependen.
Berikut merupakan hipotesis untuk uji parsial dari model yng didapat :
Gambar 3.3 Hipotesis Uji Parsial
Model
Hipotesis
Tingkat Sig.
Statistik Uji
Keputusan
Kesimpulan
Constanta
H0 : β0 = 0 (konstanta tidak signifikan)
H1 : β0 0 (konstanta signifikan)
α = 0,05
Sig. = 0,013 < α
Tolak H0 jika Sig. <α
konstanta signifikan
USSW
H0 : β1 = 0 (koefisien regresi XUSSW tidak signifikan)
H1 : β1 0 (koefisien regresi Xkinerja signifikan)
α = 0,05
Sig. = 0,191 > α
Gagal tolak H0 jika Sig. > α
koefisien regresi usia subjek saat diwawancara tidak signifikan
PUM
H0 : β2 = 0 (koefisien regresi XPUM tidak signifikan)
H1 : β2 0 (koefisien regresi XPUM signifikan)
α = 0,05
Sig. = 0,013 < α
Tolak H0 jika Sig. < α
koefisien regresi pemerikaan umum medis signifikan
UPKH
H0 : β3 = 0 (koefisien regresi XUPKH tidak signifikan)
H1 : β3 0 (koefisien regresi XUPKH signifikan)
α = 0,05
Sig. = 0,187> α
Gagal tolak H0 jika Sig. > α
koefisien regresi Usia pertama kali hamil tidak signifikan
UPKM
H0 : β4 = 0 (koefisien regresi XUPKM tidak signifikan)
H1 : β4 0 (koefisien regresi XUPKM signifikan)
α = 0,05
Sig. = 0,001 < α
Tolak H0 jika Sig. < α
koefisien regresi usia pertama kali menstruasi signifikan
SBB
H0 : β5 = 0 (koefisien regresi XSBB tidak signifikan)
H1 : β5 0 (koefisien regresi XSBB signifikan)
α = 0,05
Sig. = 0,016 < α
Tolak H0 jika Sig. < α
koefisien regresi subjek berat badan signifikan
UTKM
H0 : β6 = 0 (koefisien regresi XUTKM tidak signifikan)
H1 : β6 0 (koefisien regresi XUTKM signifikan)
α = 0,05
Sig. = 0,031 < α
Tolak H0 jika Sig. < α
koefisien regresi usia terakhir kali menstruasi signifikan
Parameter Model
Uji parameter model dengan data (uji hosmer and lemeshow), uji ini untuk mengukur apakah probabilitas yang diprediksi sesuai dengan probabilitas yang diobservasi. Namun uji ini dapat dilakukan ketika sudah dapat dipastikan bahwa model yang diperoleh refresentatif dengan menggunakan Tabel 3.6 berikut.
Gambar 3.6 Output Hosmer and Lemeshow Test
Hipotesis
H0= model sesuai dengan data atau tidak ada perbedaan antara model dengan data sehingga dapat dikatakan fit
H1= model tidak sesuai dengan data atau ada perbedaan antara model dengan data sehingga dapat dikatakan fit ( peluang data asli dengan peluang data prediksi sama atau sesuai )
Tingkat signifikansi : α : 0,05
Daerah Kritis
p-value <α, maka tolak H0
Statistik uji
p-value =0.024
Keputusan
p-value (0.024)<α (0,05) maka tolak H0
Kesimpulan
karena nilai p-value signifikan maka probabilitas yang diprediksi tidak sesuai dengan probabilitas yang diobservasi.
Dari serangkaian uji yang telah dilakukan, dapat diinterpretasikan model yang diperoleh sebagai berikut.
Exp (β1) = 0,953
Artinya setiap pertambahan usia subjek saat diwawancara sebesar 1 satuan akan meningkatkan peluang wanita tidak mengidap peyakit kanker payudara jinak sebesar 0,953 kali, dengan nilai variabel lain tetap. Atau dengan kata lain semakin bertambah usia wanita maka akan semakin mempunyai kecenderungan untuk tidak mengidap penyakit kanker payudara jinak.
Exp (β2) = 0,276
Artinya setiap wanita yang melakukan pemeriksaan umum medis akan didiagnosa mengidap penyakit kanker payudara jinak sebesar 0,276 kali dari pada yang tidak melakukan pemeriksaan medis.
Exp. β3 = 1.073
Artinya setiap pertambahan usia pertama kali hamil sebesar 1 satuan akan meningkatkan peluang wanita tidak mengidap peyakit kanker payudara jinak sebesar 1,073 kali, dengan nilai variabel lain tetap. Atau dengan kata lain semakin bertambah usia wanita untuk pertama kali hamil maka akan semakin mempunyai kecenderungan untuk tidak mengidap penyakit kanker payudara jinak.
Exp. β4 = 1,505
Artinya setiap pertambahan usia pertama kali menstruasi sebesar 1 satuan akan meningkatkan peluang wanita tidak mengidap peyakit kanker payudara jinak sebesar 1,073 kali, dengan nilai variabel lain tetap. Atau dengan kata lain semakin bertambah usia wanita untuk pertama kali menstruasi maka akan semakin mempunyai kecenderungan untuk tidak mengidap penyakit kanker payudara jinak.
Exp. β5 = 0,975
Artinya setiap pertambahan berat badan wanita sebesar 1 satuan akan meningkatkan peluang wanita tidak mengidap peyakit kanker payudara jinak sebesar 0,975 kali, dengan nilai variabel lain tetap. Atau dengan kata lain semakin bertambah berat badan wanita maka akan semakin mempunyai kecenderungan untuk tidak mengidap penyakit kanker payudara jinak.
Exp. β6 = 1,118
Artinya setiap pertambahan usia wanita untuk menopouse sebesar 1 satuan meningkatkan kelipatan seorang wanita sebesar 1,118 kali untuk tidak mengidap penyakit kanker payudara jinak.
Dari persamaan regresi logistik yang diperoleh, maka kami mengambil sebuah contoh pada salah satu seorang pasien yang telah terdiagnosa positif mengidap penyakit kanker payudara jinak dengan usia pada saat wawancara 36 tahun, dengan usia pertama kali hamil pada saat 25 tahun, pertama kali menstruasi pada saat 17 tahun serta usia terakhir kali menstruasi atau menopouse pada saat usia 38 tahun. Pasien telah melakukan pemeriksaan medis di sebuah rumah sakit di New Haven dan diketahui berat badan pasien tersebut sebesar 118 pound. Maka carilah peluang wanita tersebut terdiagnosa penyakit kanker payudara jinak.
Sehingga peluang terdiagnosa wanita tersebut mengidap penyakit kanker payudara adalah sebagai berikut :
Y = -7,061- 0,048 X1 – 1,286 X2 + 0,071 X3 + 0,409 X4 - 0,25 X5 + 0,111
X6
= -7,061- 0,048 (36) – 1,286 (1)+ 0,071 (25)+ 0,409 (17) - 0,25 (118) +
0,111 (38)
= -0,11
Π ( Y ) = eY1+eY
= 0,4722
Dari contoh permasalahan diatas, maka dapat diambil kesimpulan bahwa pasien tersebut menderita penyakit kanker payudara jinak dengan peluang terjangkitnya sebesar 0,4722.
BAB IV
PENUTUP
Kesimpulan
Dari pembahasan yang ada pada bab-bab sebelumnya, kami bertujuan menggunakan analisis regresi logistik biner dalam makalah ini untuk mengetahui apa saja faktor-faktor yang mempengaruhi timbulnya penyakit kanker payudara jinak karena banyaknya wanita yang menderita penyakit kanker payudara di New Haven, Amerika Serikat. Oleh sebab itu, dalam makalah ini kami mengambil judul Regresi logistic biner dan penerapannya dalam bidang kesehatan (studi kasus : Faktor-faktor yang mempengaruhi timbulnya penyakit kanker payudara jinak di New Haven, Amerika Serikat).
Ada beberapa faktor resiko yang erat kaitannya dengan terjadinya kanker payudara dalam makalah ini, antara lain yaitu umur, usia menarche dini (pertama kali menstruasi), usia terakhir kali menopouse, berat badan subyek pada saat wawancara apakah mengalami obesitas atau kegemukan dan pemeriksaan umum medis.
Regresi logistik adalah bagian dari analisis regresi yang digunakan ketika variabel dependen (respon) merupakan variabel dikotomi. Sedangkan Variabel yang dikotomi/biner adalah variabel yang hanya mempunyai dua kategori saja, yaitu kategori yang menyatakan kejadian sukses (Y=1) dan kategori yang menyatakan kejadian gagal (Y=0).
Dalam kasus ini setelah dilakukan analisis regresi logistik biner, didapatkan model regresinya adalah Y = -7,061- 0,048 X1 – 1,286 X2 + 0,071 X3 + 0,409 X4 - 0,25 X5 + 0,111 X6 dan model logitnya adalah Π ( Y ) = eY1+eY
=exp-7,061-0,048 x1-1,286x2+0,071 x3+0,409 x4-0,025 x5+0,11 x61+exp-7,061-0,048 x1-1,286x2+0,071 x3+0,409 x4-0,025 x5+0,11 x6 Nilai Nagelkerke R Square yang didapatkan adalah sebesar 0,365 atau 36,5 % yang berarti seluruh variabel independen mempengaruhi variabel dependen secara serentask pada kisaran 36,5 %, sedangkan 63,5 % lainya dipengaruhi atau dijelaskan oleh variabel-variabel yang tidak dimasukkan dalam penelitian ini.
Dari analisis yang dilakukan, terdapat 178 orang wanita yang melakukan pemeriksaan medis dan dinyatakan positif mengidap penyakit kanker payudara sebanyak 25 orang dan yang dinyatakan negattif mengidap penyakit kanker payudara sebanyak 153 orang. Tapi pada kenyataanya dari 178 wanita yang melakukan pemeriksaan medis dan dinyatakan positif mengidap kanker payudara sebanyak 40 orang dan yang dinyatakan negatif sebanyak 138 orang. jadi, model regresi logistik yang digunakan cukup baik karena mampu menebak dengan benar 79,2 % kondisi yang terjadi. Dari keseluruhan model yang didapatkan, terbukti bahwa modelnya layak untuk digunakan.
Saran
1. Dalam kasus ini, para wanita diharapkan mengerti dan mengetahui factor-faktor apa saja yang dapat menimbulkan penyakit kanker payudara sehingga dapat melakukan pencegahan dini yang faktornya dapat dilihat setelah dilakukan analisis regresi logistik biner.
2. Dari model yang didapat, diharapkan para wanita sadar akan pentingnya memelihara kesehatan organ tubuh.
3. Untuk pengetahuan, diharapkan peneliti lain dapat mengembangkan aplikasi regresi logistik biner di bidang lainnya, selain dalam bidang kesehatan.
DAFTAR PUSTAKA
Setiawan, Nasrul. 2013. Konsep Regresi Biner/Dikotomi. http://statistikceria.blogspot.com/2013/01/konsep-regresi-logistik-biner-dikotomi.html
Ariyoso. 2009. Regresi Logistik. http://statistik4life.blogspot.com/2009/12/regresi-logistik.html
Armhest, University Massachusetts. 2004. Benign Breast Disease. http://www.umass.edu/statdata/statdata/stat-logistic.html. Amerika Serikat: University Massachusetts of Armhest.
Akbar, Nur. 2013. Makalah Kanker Jinak Payudara. http://akbarnurnhijranahstikesandinipersada.blogspot.com/.
Finit, Maria. 2013. Makalah Patologi dan Patofisiologi Kanker Payudara. https://www.academia.edu/5746613/MAKALAH. Makassar.
Hanafi, Darmawan. 2012. Kanker Payudara. http://watowaihory.blogspot.com/. Kupang.