MULTIPLE LINEAR REGRESSION
1. HIKMALIA 2. MAYASARI 3. RUMINDA 4. TUANI TUANI M. NAPITUPULU
1. HIKMALIA 2. MAYASARI 3. RUMINDA 4. TUANI TUANI M. NAPITUPULU
(A( ) I
Pemodelan matematika adalah bahasa matematika yang digunakan untuk menyederhanakan menyederha nakan suatu enomena atau ke!adian ke!a dian nyata ham"ir di segala bidang di suatu kondisi tertentu untuk memudahkan "enyelesaian# $ase dalam melakukan "emodelan matematika sebelumnya telah di!elaskan kelom"ok satu dimana ase satu dimulai dari konse konse" " atau logika yang ada "ada enomena dilan!utkan ormulasi% kemudian simulasi atau u!i &oba dan yang terakhir a"likasi# 'alam dunia "enelitian% kera" kali metode statistika digunkan sebagai
(A( ) II
Pemodelan matematika mem"rediksi !a*aban angka yang mendekati kebenaran% hal ini dinamakan kete"atan# Analisis regresi mungkin sering meningkatkan kete"atan terhada" kete"atan dari model regresi linier sederhana dengan adanya +ariabel tambahan# ,ebenarannya"un lebih akurat# -ontoh ./Mayer.0123% h.0245 'a"atkah kamu mengukur berat badan seseorang dengan menggunakan alat 66### ,ita semua tahu bah*a orang yang lebih tinggi akan lebih berat badannya% !adi !ika kamu tahu tinggi seseorang mungkin kamu bisa lebih &e"at mem"rediksi berat badan seseorang
Contoh:
Pada tabel 1 berikut meu!ukka berat da ti""i utuk 1# $ra" %i%&a. Sis*
Ukura
Ukuran
Ukuran
Tinggi
(erat
a
n
Pinggang
Leher
(adan
(adan
/In&hi5
/"on5
Se"atu 0
1
78
03%3
92
094
:
04
7:
03%3
;4
094
7
04%3
70
09
;0
034
8
;%3
:1
08%3
92
0:4
3
2
78
09
92
0;3
9
04%3
78
03%3
;9
014
;
0:
72
09%3
;7%3
:43
2
0:
78
0;%3
;3%3
:03
1
00
79
09%3
;7
023
04
1%3
7:
03%3
;:
0;4
A Tabel 1
Tbl 1
sambungan
Ada"un asumsi garis regresi yang &o&ok da"at dilihat "ada gambar 0 yang rumusnya#
'erat 'ada ( ).#) Ti""i 'ada * 333 Pers )0
A
mun&ul "ertanyaan a"akah asumsi ini masuk akal 66### sis*a 0 yang memiliki tinggi 92% !ika dimasukkan ke rumus maka berat yang dida"at 08;%;9 seharusnya 094 sis*a 8 yang memiliki tinggi 92 !ika dimasukkan ke rumus maka berat yang dida"at 08;%;9 seharusnya 0:4
kita juga bisa menambahkan model ukuran kerah dan mencari persamaan seperti:
'erat 'ada ( a Ti""i 'ada + b Pi""a" + , Kera-+ d
Pada "rinsi"nya kita da"at mengambil se!umlah +ariabel yang ada% teknik inilah yang disebut regresi linier ganda# Regresi linier ganda adalah analisis yang digunakan untuk menganalisis hubungan antara +ariabel bebas />5 dan +ariabel terikat /y5# Namun "ada regresi linier ganda ini% +ariabel bebas />5 yang digunakan lebih dari dari satu# Misalkan kita diberi nilai untuk tiga kuantitas% se"erti "engukuran "inggang% tinggi badan% dan berat untuk berbagai indi+idu se"erti &ontoh sebelumnya# ,etiga +ariabel disebut / 0 dan sehingga setia" baris tabel da"at diangga" sebagai tri"le / / 0/ 5 yang "ada gilirannya% diangga" sebagai titik dalam 7)ruang
kita akan mem"ertimbangkan kasus tersebut dan kita sedang men&ari "en!elasan linier yang te"at% yaitu dengan menggunakan "ersamaan.
( a + b0 + ,
Pers )7
,arena "ersamaan 7 adalah "ersamaan ruang dimensi tiga% kita da"at menasirkan masalah geometris yang sedekat mungkin da"at mele*ati titik)titik /gambar :5# ?ika d i/ 0i/ i 5 i meru"akan !arak +ertikal dari / dengan bebera"a bidang% kita mende@nisikan !arak dari him"unan titik)titik terhada" bidang sebagai.
Gambar :
Untuk memudahkan "erhitungan al!abar kita akan membahas dengan !arak kuadrat yang kita sebut S# ?ika bidang memiliki "ersamaan ( a + b0 + ,% maka. Pers )8
Tugas kita adalah memilih nilai)nilai untuk a/ b dan , sehingga membuat S seke&il mungkin dengan &ara ini kita !uga akan meminimalkan D# Oleh karena itu nilai) nilai a/ b dan , akan sesuai dengan bidang terdekat# Untuk meminimalkan S% kami meneta"kan deri+ati "arsial terhada" a/ b dan , ( #
Pers )3
,ita gunakan ilmu al!abar untuk mengubah "ersamaan /35 ke"ersamaan berikut dalam +ariabel a/ b dan ,
Pers )9
Persamaan ini disebut "ersamaan normal a/ b dan ,% yang terdiri dari tiga "ersamaan linier dalam a/ b dan , dan da"at diselesaikan dengan berbagai &ara se"erti Eliminasi Gauss
Contoh 2
Mari kita "erhatikan +ersi singkat dari tabel 0% yang hanya terdiri dari lima sis*a "ertama# ,ita "erlu menghitung 0: koe@sien untuk disubsitusi ke dalam "ersamaan /95# Se"erti sebelumnya ( ukura i""a"/ yB ti""i bada% dan ( berat bada# Untuk "ersamaan "ertama kita "erlukan.
sekarang kita memiliki koe@sien% yaitu .135a + 11.#3)b + 16#, ( 24.64#Pers ); 11.#3)a + 23.513b + 34, ( 2.)7# 16#a + 34b + , ()6
solusi dari "ersamaan ini adalah a ( 7/7/ b ( 4/22/ , ( *44/3# Oleh karena itu bidang yang sesuai adalah ( 7/7 + 4/220 * 4/3#
Pers )2
?ika "rosedur dalam &ontoh terakhir dilakukan untuk seluruh tabel 0 dari lima entri "ertama% kita menda"atkan sistem yang berbeda dari "ersamaan /;5 dan mengikuti bidang yang sesuai. ( 6/3 + 4/70 8 365
Pers )1 Pers# /05 dan /15 memberikan dua model yang ter"isah yang memungkinkan kita untuk membuat "rediksi berat badan dengan "engukur yang mana lebih baik6
,ita membutuhkan sesuatu yang lebih baik untuk menyelesaikan "ertanyaan itu# ,ita membutuhkan &ara matematis untuk mengukur ke&o&okan yang terbaik# Pemakalah akan men!elaskan salah satu dari semuanya yaitu yang disebut koe@sien korelasi berganda% dilambangkan R /koe@sien korelasi sam"el5# ,oe@sienkorelasi berganda dide@nisikan sebagai%
Pers )04
Page
16
Contoh
,ita hitung R2 ke dalam "ersamaan regresi "ers#/15. ( 6/3 + 4/70 8 365
Gunakan ormula% kita hitung. .
.
.
.
.
.
Maka di da"at
Sebagai "erbandingan% kita melaksanakan "erhitungan "ersamaan regresi "ers# /05% yang men&oba untuk men!elaskan data yang sama dengan hanya 0 /tinggi5 sebagai +ariabel "en!elas#
Setelah menggunakan ormula% maka dida"atlah
'ilihat dengan dua nilai dari /4%318 dan 4%29:5% kita melihat telah ter!adi kenaikan yang &uku" besar dalam akurasi dengan mengambil +ariabel tambahan "engukuran "inggang ke "erhitungan tinggi dan "inggang bersama)sama melalui "ersamaan /15% dan "eker!aan tersebut lebih akurat dari "ada mem"rediksi berat dari ketinggian sa!a% melalui "ersamaan/05#
Contoh: Kanker dan Fluoridasi (Real Data)
TA'9L 2 City
Cancer Mortality rate
Number of years fluoridates
!ercent age "# or more
New York
215
5
0,70
12,1
Chicago
204
14
1,15
10,6
Philadelphia
217
16
1,20
11,7
Detroit
213
3
0,48
11,5
Baltiore
223
17
1,23
10,6
Dalla!
1"1
4
0,60
7,"
#a!hi$gto$
200
18
1,26
",4
Cle%ela$d
21"
14
1,15
10,6
Cit&
Ca$cer
N'(er o) &ear!
Perce$t age 65 or
ortalit&
)l'oridated
*
ore
14
1,1
10,6
rate Cle%ela$d
21"
5 +ilwa'kee
18"
16
1,2
11,0
0 a$
24"
17
-ra$!i!co t. *o'i!
1,2
14,0
3 207
14
1,1
14,7
5 Pitt!('rgh
243
17
1,2
13,5
3 De$%er
157
16
1,2
11,5
0 B'))alo
248
15
1,1
13,3
8 +i$$eapoli!
228
12
1,0 8
15,0
Cit&
Ca$cer
N'(er o) &ear!
Perce$t age 65 or
ortalit&
)l'oridated
*
ore
5
0,7
",6
rate -ort #orth
16"
0 /klahoa
170
15
Cit& *o'i!%ille
1,1
",8
8 230
18
1,2
12,4
6 +iai
266
18
1,2
14,5
5 'l!a
15"
16
1,2 0
",1
Pendekatan sederhana untuk data tersebut adalah untuk men&ari hubungan antara angka kematian kanker dan tahun Cuoridasi% tan"a mem"erhitungkan "ro@l usia masing)masing kota# 'alam hal ini% kita akan meren&anakan "asangan :L/ ;< dan men&ari garis regresi# Pada bagian ini% kita menggunakan L sebagai satu)satunya +ariabel "en!elas untuk mem"rediksi ;% angka kematian kanker#
Maka dida"at R2 B 4%48;# Semakin L lebih tinggi /lebih tahun Cuoridasi5% maka akan semakin tinggi "ula -# Nilai R2 sangatlah rendah dan &uku" untuk membuat seorang ahli statistik yang bi!aksana gelisah tentang model ini#
Pendekatan yang lebih baik untuk "ertanyaan ini adalah untuk mengambil +ariabel "en!elas lain ke "erhitungan#
-ara untuk mengu!i ini adalah untuk melakukan regresi linier berganda di mana L dan A /"ro@l usia5 digunakan sebagai +ariabel "en!elas untuk ;# ,etika kita melakukan ini% kita mem"eroleh ; ( #/66L + 1#/6A + 5/5 R2 ( #/473
Teta"i koe@sien ini 4%399 !auh lebih ke&il dari"ada koe@sien :;%0 yang ditemukan di model sebelumnya sehingga dugaan hubungan antara Cuoride dan kanker adalah sekitar 34 kali lebih lemah dalam model yang lebih masuk akal#
Contoh$ %arak dan &aktu (Real Data)
?ika &ontoh sebelumnya meyakinkan ,ita bah*a menambahkan +ariabel "en!elas untuk meningkatkan R: adalah strategi yang baik% maka bagian selan!utnyanya mungkin tam"ak mengganggu. menambahkan +ariabel "en!elas kadang)kadang ide yang buruk% bahkan +ariabel yang tidak ada sama sekali hubungannya dengan a"a yang akan &oba kita !elaskan% se"erti dalam &ontoh berikut.
Mil Jaminan Tabel 7 berisi data Waktu yang No.dikum"ulkan untuk Sosial men&oba mem"rediksi bera"a lama *aktu yang 10 "5 27 dibutuhkan sis*a dari rumah menu!u Uni+ersitas 15 0" 4 Adel"hi% dalam satuan mil# Tabel ) 25,8
50
10
9
24
43
5,8
20
35
2,8
11
62
15,2
50
15
7
regresi linear "ada dua kolom "ertama% menggunakan !arak sebagai +ariabel "en!elas% kita mem"eroleh. =aktu B 0%21 mil D 2%43R : B 4#29;
Regresi selan!utnya di mana nomor !aminan sosial digunakan sebagai +ariabel "en!elas kedua# Ini hasilnya. aktu B 0%; mil ) 4%42;: nomor !aminan sosial D 07%: R2 B 4#227
Perhatikan bah*a dalam model ini nilai R2 sedikit lebih tinggi dari sebelumnya#
Pada &ontoh sebelumnya% menambahkan nomor !aminan sosial tidak membuat model deskri"ti realistis% dan kita tidak "erlu "erhitungan yang rumit untuk memberitahu bah*a itu adalah ide yang buruk# Namun% yang lebih masuk akal tentang realisme deskri"ti tidak selalu da"at diandalkan dengan baik# Ini adalah subyek dari &ontoh berikut#
-ONTO< 'i tengah tahun 0194)an 'inas Pendidikan Amerika Serikat men&oba untuk men&ari tahu a"a yang membuat sis*a berhasil di sekolah# Se&ara khusus% mereka ingin tahu a"akah kualitas sistem sekolah% yang diukur dengan uang yang dihabiskan untuk "endidikan% kualitas guru% dan aktor)aktor yang sama bisa men!elaskan menga"a bebera"a sis*a% terutama sis*a minoritas% menun!ukkan nilai yang lebih rendah "ada tes standar#
,ita "erhatikan tabel berikut Ketera"a> SLRY*Rata*rata "a!i "uru er %i%&a =HT;*Per%eta%e %i%&a kulit utiS9S*ukura ti"kat %$%ial ek$$mi %i%&a T;HR*%k$r te% ?erbal "uru M@M*le?el edidika $ra" tua %i%&a :1 %atua(2 ta-u< S;@R*%k$r te% ?erbal %i%&a
Pendekatan "ertama% untuk S-OR boleh digunakan "ada semua +ariabel "en!elas#