206
Bab 12 • Regresi dan Korelasi Linier Sederhana
12.1.1 Analisis Regresi dan Korelasi Sebelum suatu keputusan Sebelum keputusan diamb diambil il seri seringka ngkali li perl perlu u dila dilakukan kukan suat suatu u pera peramalan malan (Jorecas (Jor ecasting ting ) mengenai kemungkinan yang terjadi/harapan di masa depan yang berkaitan dengan keputusan tersebut. Hal tersebut dapat lebih mudah dilakukan bila suatu hubungan (relasi) dapat ditentukan antara variabel yang akan diramal dengan variabel lain yang telah diketahui ataupun sangat mudah untuk diantisipasi. Untuk keperluan tersebut, regresi dan krelasi sangat luas digunakan sebagai perangkat sebagai perangkat analisisnya. Analisis regr regresi esi digunakan untuk mempelajari dan mengukur hubungan sta tistik yang terjadi antara antara dua atau lebih variabel. !alam regresi sederhana sederhana dikaji dua variabel, sedangkan dalam regresi majemuk dikaji lebih dari dua variabel. !alam analisis regresi, suatu persamaan regresi hendak ditentukan dan digunakan untuk menggambarkan pla atau "ungsi "ungsi hubungan yang terdapat antar variabel. #ariabel yang akan diestimasi nilainya disebut variabel terikat (dependent variable atau response variable) an biasanya diplt pada sumbu tegak (sumbu$y). Sedang kan varia variabel bel bebas (independent (independent variable atau explanatory explanatory variable) adalah variabel yang diasumsikan memberikan pengaruh terhadap variasi variabel terikat dan biasanya diplt pada sumbu datar (sumbu$%). Analisis korelas korelasii bertujuan untuk mengukur &seberapa kuat&, atau &derajat kedekatan&, suatu relasi yang terjadi antar variabel. 'adi, kalau analisis regresi ingin ingi n menge mengetahu tahuii pla relasi dalam bent bentuk uk per persamaa samaan n regr regresi, esi, maka anal analisis isis krelasi ingin mengetahui kekuatan hubungan tersebut dalam ke"isien krelasinya. !eng !engan an demi demikian kian bias biasanya anya aaal aaalisis isis regr regresi esi dan kre krelasi lasi seri sering ng dilakukan bersama sama sama..
12.1.2
Relasi yang Logis !alam !al am men menent entuka ukan n apa apakah kah tr trdapa dapatt sua suatu tu hub hubunga ungan n yan yang g lg lgis is ant antar ar var variab iabel, el, terutama bila penilaian dilakukan terhadap angka$angka statistik saja, perlu di perhatikan beberapa hal yang berkaitan dengan masuk akal atau tidaknya hubungan tersebut jika ditinjau dari si"at dasar hubungan tersebut. !alam hal hal ini terdapat beberapa kemungkinan bentuk relasi, ineliputi hubungan sebab akibat ( cause ande.ffect relationship ), hubungan akibat penyebab yang sama ( common-cause factor relationship ) , ) , dan hubungan semu ( spurious relationshi relationship p ). elasi antara kenaikan temperatur dengan keepatan reaksi prses kimia termasuk suatu relasi sebab-akibat. !alam nth lain, seserang bisa menemukan suat*+ hubungan yang yan g dekat antara peningkatar. peningkatar. pnjualan rumah dan peningkatan pi+jualan kendaraan kendaraan benntr. benntr. amun relasi relasi yang berlak.u berlak.u disini bukan merupakan relasi sebab akibat, akibat , namun merupakan relasi akibat penyebab yang sama ( common cause factor ) factor ) yang dikarenabn dikarenabn tingkat pendapatan masyarakat masyarakat yang jug a me ningkat. Sedangkan jika yang dikaitkan adalah variabel$variabel variabel$variabel yang tidak bisa seara lgis menunjukkan adanya hubungan maka akan didapatkan relasi semu. -isal nya seserang menba menari persamaan regresi antara data kenaikan penjualan "urniture "urniture di 'akarta 'akarta dengan data perubahan perubahan temperatur temperatur harian rata$rata maka kemu ngkinan besar per samaan regresi yang diperlehnya tidak mempunyai . arti apa$ apa $apa apa..
Prinsip-prinsip Statistik untuk Teknik dan Sains
12.1.3
2
Diagra Pen!ar ( Scatter Diagram) angkah pertama dalam menganalisis relasi antar variabel adalah dengan membuat diagram penar ( scatter diagram) yang menggambarkan titik$tili k plt dari data yang diperleh . !iagram penar ini berguna u ntuk
membantu melihat apakah ada relasi yang bergu na antar variabel. membant u menent u kan jenis persamaan yang akan digu nakan u nt u k menentukan hubungan tersebut. ambar +2.+ menunjukkan beberapa nth dari diagram penar .
12.2.1
Persaaan Regresi Linier Sederhana !alam analisis regresi linier sederhana ini akan ditentukan persamaan yang meng hubungkan dua variabel yang dapat dinyatakan sebagai bentuk persamaan pangkat satu (persamaan linier/per amaan garis lurus), 1ersamaan umum garis regresi untuk regresi linier sederhana adalah
y
= a bx
(+2.+)
di mana y " nilai estimate variabel terikat
" titik ptng garis regresi pada sumbu y atau nilai estimate
a
y bila
x = O
b
gradien garis regresi
(perubahan nilai estimate
y
per satuan perubahan
nilai x) x
12.2.2
nilai
variabel bebas
Si#at-si#at $aris Regresi Linier 3erdapat dua si"at yang harus dipenuhi sebuah garis lurus untuk dapat menjadi garis regresi yang k (fit) dengan titik$titik data pada diagram penar , yaitu
I.
'umlah simpangan (deviasi ) psiti" dari titik$titik yang tersebar di atas garis regresi sama dengan (sating menghilangkan) jumlah simpangan negati" dari titik$titik yang tersebar di ba4ah garis regresi (lihat ambar 12%2&% !engan kata lai n , 5,.+.v " 5,( y $ 6v)
2% 7uadrat dari simpangan$si mpangan menapai ni lai minimu m (least s!uare value nf deviations ) . 'adi ,
...., (.+y)
2
,
" "....,( # $ y )
2
" mi ni mu m
!engan si"at kedua, metde regresi ini sering juga disebut sebagai metod e least s!uare.
0
• ••
99
,9 9
•••
%
-
./*$,:
208 -
lJ•
•
2 • Regrsi dan Korelasi Linier Sederhana
9
$abar 12%1 Beberapa bentuk diagra pen!ar
r
Linier negati#
Linier positi#
'ur(elinier negati# 'ur(elinier positi#
'ur(elinier
. Taktentu
!engan menggunakan kedua si"at di atas dan menggabu ngkannya dengan prinsip$prinsip kalkulus di"erensial untuk menentukan nilai ekstrim sebuah "ungsi, maka dapat ditu ru nkan hubu ngan$h ubu ngan u ntuk mendapatkan nilai$nilai knstanta a dan b pada persamaan garis regresi, yang hasilnya sebagai berikut
n( $,xy ) $ ( $,x ) ( "# )
n( $,x % ) $ (2:X )2 a ::= y
$
bx
di mana jumlah titik (pasangan pengamatan (%,y)) n x mean dari variabel x y mean dari variabel y
)12%*L& +
(+2.8)
Prinsip-prinsip Statistik untuk Teknik dan Sains
$abar 12%2 $aris regresi linier pada diagra pen!ar
/
y
)3&
t.y )0&
&r
t.y
•2
( f
($)
t.y
%
)3&
t.y
($)
)-&
%%%% % % a • %% x
!ari suatu praktikum "isik a dasar diperleh data yang rnenghubungka n variabel bebas x dan variabel terikat y seperti ditunjukkan dalarn tabel be rikut.
x
y
.
6
80
2
9
49
Uj i k e$
8
-
4
88
5
7
$
$
$
42 •39
:$$
6
;
7
8
41
8
10
52
s
56
296
25
$
' i k a berdas arkan k aj ian te r i ti s dan s i "at dari " e n m ena y ang m eng h u bungk a n x
da n y da pat di as um si kan te rda pa t suatu bentuk h ubu n g an yang li ni er , mak a pers ama a n g a ri s r gr esin ya d apat d i ten t uk a n se ba g ai be r i k u t.
210
Bab 12 • Regresi dan Korelasi Linier Sederhana
3abel perhi tu ngan
x
Uji ke$.
y
xy
x%
.
6
80
+<0
86
=00
2
=
>=
>>+
<+
2>0+
8
8
+<
;>
=
82>
>
<
>2
886
6>
+?6>
;
?
8=
2?8
>=
+;2+
6
;
2;
+ 2;
2;
62;
?
<
>+
82<
6>
+6<+
<
+0
;2
;20
+00
2?0>
s
;6
2=6
22;?
>2<
+2=20
6 $,x x =< -
;6
=
n
- = y
" " # 2=6 8? 8
n
. 7lm y2 ditambahkan pada label meski pun bel m digunakan untuk perhitungan persamaan garis regresi. ilai tersebut akan digunakan kemudian. 'adi dengan meng gunakan hasil pada tabel, nilai dari knstanta a dan b dapat ditentukan 'ataran
b n( $,xy ) - @5,%)(5,y) " <(22;?) $ (;6)(2=6) +><0 n(5,% 2 &-
a
" y
($,x )2
$ bx " 8?
$
<(>2<) $ (;6)
2
2<<
; +8<=
A
(;,+8<=)(?) " +,02??
'adi persamaan garis regresi tinier yang menggambarkan hubungan antara variabel x dan y dari data sampel pada perba2n/praktikum di alas adalah
ya
bx " +,02?? 3 ;,+8<=%
!engan menggunakan persamaan garis regresi yang diperleh (arnbar +2 .8), maka dapat diperkirakan hasil yang akan diperleh (nilai y& untuk suatu nilai x tertentu . -isalnya u ntuk x > dapat diperkirakan bah4a v akan bernilai
y =a am bar 12.3 $aris regr!si
untu k nth soal 12%1
bx = +,02?? 3 ;,+8<=.% " +,02?? 3 ;,+ 8<=(>)
2+,;<8
60
------------------------ y
40
2
4 % 15678 3 1%0296
/0 50 20
10 0 0
2
y2
/
6 x
6
10
12
Prinsip-prinsip Statistik untuk Teknik dan Sains
2++
3erdapat beberapa hal yang perl u diperhatikan dalam menggu nakan per sama an garis regresi untuk menghitu ng perkiraan suatu hasil. 1ertama adalah belum diketahui seberapa akurat hasil perkiraan tersebut. 7edua kita tidak bisa mlakuk an perkiraan untuk nilai$nilai di luar kisaran yang digunakan u ntuk membuat per samaan regresi tersebut, karena kita tidak bisa memastikan bagaimana si"at hubung an antara variabel bebas dan variabel terikat u ntuk nilai$nilai yang 'ebih besar ataupun 'ebih keil dari yang diamati .
12.2.3
Standard :rror :stiasi !alam menggunakan persamaan regresi u ntuk melakukan suatu perkiraan, terdapat satu pertanyaan penting mengenai seberapa kuat hubu ngan antar variabel bebas dan terikatnya* atau, dngan kata 'ain, seberapa besar dera*at ketergantungan
(dependability) hasil perkiraan tersebut. Hal ini dapat lebih dimengerti dengan memperhatikan ambar +2.>, yang menunjukkan dua diagram penar yang me miliki persamaan garis regresi yang sama. 1ada ambar +2.> (a), terlihat bah4a titik$titik data terpenar 'ebih rapat di sekitar garis regresi dibandingkan dengan titik$titik data pada ambar +2.> (b). !engan nalar seara a4am saja, kita dapat mengatakan bah4a suatu estimasi yang dilakukan dengan persamaan garis regresi u ntuk keadaan pada ambar +2.> (a) an lebih baik dibandingkan untuk keadaan pada arr.bar +2.> (b).
$abar 12%/ Dera;at (ariasi dari sebaran )pen!aran& data
y
y
1 .
9 x
x
(a)
)b&
U ku ran yang mengi ndikasi kan derajat variasi sebara n data d i sekitar garis regr esi dapat men u nju kkan sebera pa besar derajat keterikatan perkiraa n yang diperleh dengan menggu nakan persamaa n regresi tersebut. U ku ran i ni dinarnakan sebagai standa rd error estimasi. !alam de"inisi yang lebih tepat standard errr : esti rnasi (.B. ) adalah deviasi standard yang mem berikan u k u ra n pen yeba ran. :A nilai$ni lai yang tera mati di sekitar garis regresi , d i ru m uka n sebagai beri k u t
5\'
. X
"
",( #
$
$,xy )
+i ++
$
.<)= & - a( $,y ) $ b(
2
$
2
( + 2.>)
212
Bab 12 • Regresi dan Korelasi Linier Sederhana
%%ContQh 12.2 +
·
1'
·
!engan menggunakan data dan tabel perhitungan pada Cnth +2.+, maka standard errr estimasi dari garis regresi yang diperleh adalah
s
"
:
l (,# $ n $ 2
y)2 "
2<)=& - a( $,y ) $ b( $,xy ) n $ 2
(++,=20) $ +,02??(2=6) $ ;,+8<=(2,2;?) " l6=< <$ 2 A
12.3.1
Relasi pada Sampel vs Relasi pada Populasi Suatu pertanyaan akan timbul jika kemudian ingin diketahui apakah relasi antar variabel yang diperleh dari sampel berlaku juga untuk ppulasinya. Sebagai ilustrasi, perhatikan diagram penar ppulasi pada ambar +2.;. ambar l 2.;(a) menunjukkan diagram penar untuk seluruh ppulasi yang menggambarkan hubungan antara variabel bebas X dan variabel terikat Y (simbl huru" besar digunakan untuk ppulasi) . 7emudian, andaikan pada pengambilan sampel kebetulan terpilih titik$titik data seprti yang ditunjukkan leh ambar +2.; (b) dan selanjutnya dihitung persamaan garis regresinya. 3erlihat jelas bah4a interpretasi dari persamaan garis regresi yang diperleh dari data sampel dapat memberikan pemahaman yang menyesatkan (misleading ) jika akan diterapkan pada ppulasinya. Untuk itulah perlu dilakukan uji$uji relasi dan interval prediksi dalam suatu analisis regresi . 1ada prinsipnya untuk uji$uji relasi bisa digunakan uji$uji hiptesis yang telah dipelajari pada bab$bab sebelurnnya dengan tambahan bah4a uji$uji tersebut dikaitkan dengan hasil dari analisis regresi. Deberapa teknik uji relasi akan dijelaskan pada bagian berikut ini.
12.3.2
Uji-t untuk Kemiringan (Slope) Garis Regresi !alam melakukan in"erensi statistik dengan menggu nakan analisis regresi sederhana terdapat beberapa asumsi dasar yang harus terpenuhi, yaitu y
amba r +2.; y Diagra pen!ar oopulasi>
c-
oP o <9'
)a&
)b&
+
- - - - - - - - - - - - ---
-
-Pr insip-prinsip Statistik untuk Teknik dan Sains
-
2+8
5 . 1pulasi memiliki variabel dan # yang berhu bu ngan seara l i nier dan persamaan garisnya memiliki nilai perptngan dengan sumbu Y (E) dan kemiringan (!) yang tetap. ilai$nilai a dan b yang diperleh dar i bservasi sampel adalah nilai$nilai perkiraan u ntuk A dan /. 'adi,
2.
Untuk setiap nilai terdapat distribusi nilai # pada diagram penar ppulasi yang mana nilai tersebut terdistribusi seara nrmal di sekitar garis regresi (lihat ambar +2.6).
3.
-asing$masing distribusi nilai # memiliki deviasi standard yang sama (sering disebut sebagai kndisi homoscedasticity ).
4.
-asing$masing nilai Y pada distribusi ini saling bebas satu sama 'ainnya .
!engan berdasarkan asumsi$asumsi dasar tersebut maka dapat dilakukan sebuah uji hiptesis mengenai kemiringan (slpe) garis regresi menggunakan uji t yang mengikuti ? langkah uji hiptesis yang biasa diterapkan sebagai berikut l%
0emyataan 1ipotesis 2ol dan 1ipotesis Altematif !alam persalan ini ingin diketahui apakah terdapat hubungan antara variabel X dan Y yang diindikasikan melalui kemiringan garis regresi. 'ika tidak terdapat hubungan, maka nilai D (kemiringanlslope dari garis regresi untuk ppulasi) adalah nl. 'adi, hiptesis nl dan hiptesis alternati" yang akan diuji adalah
1 3 / 0 1 1 : / ":t F
2.
0emilihan ingkat 4epentingan ("eve l of +ignificance ) Diasanya digunakan tingkat kepentingan 0,0+ atau 0,0;
3.
0enentuan 5istribusi 0engu*ian yang 5igunakan !alam uji ini yang digunakan adalah distribusi t. ilai$nilai dari distribusi ditentukan dengan mengetahui
a. b.
3ingkat kepentingan ( level of significance ) a% (uji dua$ujung).
!erajat kebebasan/degree " "reedm, d" " n jumlah data pasangan.
$
2 di mana n "
$abar 12%? Distribusi noral di sekitar garis regresi
L-
----------------------.
x
Prinsip-prinsip Statistik untuk Teknik dan Sains
?.
2+;
1engambilan keputusan 7arena #$% = +<, +;= bernilai jauh lebih besar daripada nilai batas t6 " 2,>>?, maka & 3 ! " 0 ditlak. 5ni berarti bah4a hiptesis alternati" yang menyatak an bah4a terdapat kemiringan pada garis regresi untuk ppulasi serta suatu hubung an regresi yang berarti benar$benar ada antara variabel dan #. 7esimpulan di atas dapat juga diperkuat dengan menentukan perkiraan interval nilai / dengan tingkat keperayaan =; persen sebagai
b - t('b) @ ! @ b - t('b) ;,+8<= $ 2,>>?(0,2<8) @ / @ ;,+8<= 3 2,>>?(0,2<8) >,>>6> @ / @ ;,<8+>
12.3.3
Uji !"# untuk Kemiringan (Slope) Garis Regresi 3eknik lain untuk menguji keberadaan slpe suatu garis regresi ppulasi adalah dengan analisis varians (EF#E). Uji EF#E ini akan rnernberi hasil yang sama dengan uji t dalam menentukan apakah ada relasi antara variabel bebas dan terikat dalarn suatu analisis regresi linier sederhana. amun uji EF#E rne miliki kelebihan dibanding uji t karena uji EF#E dapat digunakan pula dalarn analisis regresi majernuk ( multiple regression). Untuk analisis regresi linier sederhana, uji EF#E untuk rnengetahui apakah ada hubungan antara X dan Y (terdapat kemiringan/slpe yang signi"ikan pada garis regresinya) mengikuti prsedur sebagai berikut.
1.
0ernyataan 1ipotesis 2ol dan 1ipotesis Alternatif 1 3 / 3idak terdapat relasi antara dan # 1 + / 3erdapat relasi antara G dan #
2.
0emilihan 7ingkat 4epentingan. ( "evel of +ignificance) Diasanya digunakan tingkat kepentingan 0,0+ atau 0,0;.
3.
0enentuan 5istribusi 0engu*ian yang 5igunakan !alam uji EF#E ini yang digunakan adalah distribusi . ilai$nila i dari dari distribusi telah disajikan dalam bentuk tabel, yang dapat ditentukan dengan mengetahui tiga hal sebagai berikut
a. b.
c.
4. 5.
3ingkat kepentingan !erajat kebebasan8degree of freedom (d"num) yang digu nakan sebagai pembilang dalam rasi uji adalah dfnum " m di mana m jurnlah variabel bebas (untuk regresi tinier sederhana, m l) !erajat kebebasar'degree of freedom ( dfcte.) unt uk sampel yang rli gunakan sebagai enyebut ,l+lam rasi adalah dfcten " ( n $ m $ l ) di mana n jumlah bservasi (data pasangan) 6
0endefinisian 5aerah-daerah 0enolakan atau 4ritis !aerah penerimaan dan penlakan dibatasi leh nilai kritis 9er . % 0ernyataan Aturan 4eputusan ( 5ecision :ule)
3lak 1 3 dan terima 1 jika :; < 9er 'ika tidak dernikian , terima 1
6.
0erhitungan :asio ;*i (#$): u mus yang digunakan untuk menghitung rasi uji ( :; 9 ) adalah
3
.
2+6
Bab 12 • Regresi dan Korelasi Linier Sederhana
) 12 %9&
A 2
A (J A A a2 ntara ( J da>am
1erhitu ngan untuk bagian pembilang dan penyebut dari ru m u s rasi uji dilakukan seperti pada uji EF#E yang telah diuraikan dala m bab 5 5 , dengan penyesuaian pada nihi$nilai derajat kebebasannya .
7.
0engambilan 4epucusan +ecara +tatistik 'ika nilai rasi uji berada d i daerah penerimaan maka hiptesis nl diterima, sedangkan jika berada di daerah penlakan maka hiptesis nt ditlak .
!engan menggunakan data dan tabel perhitungan pada Cnth +2.+ maka uji kemiringan (slpe) garis regresi dapat diBakukan sebagai berikut
1.
Hiptesi;
1 3 H1
*
3idak terdapat relasi antara dan # 3erdapat relasi antara X dan Y
2.
a = 0,0;
3. 4.
!igunakan distribusi 9 dengan dfnum
m 5 , dfden n
$
m$ 5 6
!ari tabeB diperleh daerah penerimaan /penlakan dib atasi leh nilai kriti s 9 er
;,== 5. 6.
Eturan keputusan 3Bak 1 3 dan terima H
+
jika :; 9 < ;,==. 'ika tidak demikian, terima 1 3.
Uji rasi diringkas dan disajikan da lam tabeB EF#E berikut
Sure " #ariatin
!egree " reedm (d")
Sum " SIuares (SS)
-ean SIuares (-S)
:; 9 ( 9,,,,)
+
=;0,6=
=;0,6=
82=,6+
Jrrr
6
+?,8+
2,<<
3tal
?
=6<,00
egressin
7.
1engam bilan k e pu tusan 7ar ena : ;9
12.3.4
82=,6+ a = 2,>>?, maka 1 3
ditl ak dan H
+
diteri rna .
:stiasi .nter(al ilai esti ma si dari sebuah variabel te r ikat, yang diperleh deng a n m enggu nakan suatu persamaan regre s i untuk suatu nilai variabel bebas tertentu meru pakan suatu nilai esti masi titik (point estimat e ) . 1ad a ken yataan nya , ni l a i es ti m as i i ni tidakl a h mutlak tepat , meng i ngat dat a te rp enar di sekitar gari s r egre si. !en g an meng e tahu i be samya standard errr estim a si 'y . x maka estimasi titik dapat di p erlua s menjadi estimasi inte rval.
+ Prinsip-prinsip Statistik untuk Teknik ! 1n S
2+?
12.3.4.1 Untuk Sampel Desar ( 80) !engan menganggap nilai variabel ter ikat, y, yang sesungguhny a ter distribusi nrmal di sekitar garis regresi maka suatu estimasi interval dapat diperleh sebag ai (+2.<) !alam relasi (+2.<), ? adalah skr ? yang akan menentukan tingkat k e perayaan x dari penerimaan estimasi interval yang dilakukan. ambar +2.? meng ilustrasikan estimasi interval untuk ? 2.
ambar +2.? lnterpretasi
dan ap*ikasi estiasi inter(al untuk sapel besar
y1
!ari ambar +2.?, estimasi interval dengan * " 2 u ntuk x C 2(s y. x ), yang memiliki prbabilitas :prediksi =;,> persen .
1
adalah
12.3.4.2 Untuk Sampel 7eil ( @ 80) a.
0r ediksi 4isaran 2ilai :ata-rata y Jika 5ik etahui x Jstimasi interval untuk sampel keil dengan situasi ini dapat diperleh dengan ru mus beriku t
+ = C
ta,%
'+ ·
%
" (/, $ 2<)8 &
-
( + 2 .=)
-
l"
x ) @ n
di mana y
estimasi titik yang dihitung dengan persamaan regr esi u ntuk nil ai x tertentu
2+<
Bab 12 • Regresi dan Korelasi Linier Sederhana
ta% " nilai t untuk a,2 )" tingkat keperayaan) dengan derajal kebebasan n - 2
x
A
" nilai x yang ditentukan jumlah bservasi pasangan pada sampe l
n
b.
0rediksi 4isaran 2ilai +pesifik y Jika 5iketahui x Jstimasi interval untuk sampel keil dengan situasi ini dapat diperleh dengan rumus berikut
Y E KLSy % x
-a.2
. l3 -
x )2
$$$
) 12%.&
5,(%2 ) $ (5,%M2
n n
( x
$$ $$$$
3
!engan menggunakan data dan tabel perhitungan pada Cnth +2.+ dan persamaan garis regresi yang dihasilkan serta nilai y. < pada Cnth 5 2.2, dapat diprediksi bah4a , dengan tingkat keperayaan =; persen dan derajat kebebasan n $ 2 " < 2 " 6, untuk x " >,
# A
C
ta>%
l
. $** 3
( x /
+ y, x
-
x ) 1
( / /,G)2
+
2
$,( x ) $ " 2+,;<8 C 2,>>? L+,6=<
%EA 3 <
$
$n
)
$
$
)B
> ? >2< $ (;6) /<
l
'adi dengan derajat keperayaan =; persen diperleh +=,08< @ y @ 2>,+2<.
Seperti telah diuraikan sebelu mnya, u ntu mengetahui seberapa dekat hubu uga n antara variabel dipdukan su$atu uku ran yang menyatakan &kekuatari A relasi tersebut. !alam statistik, uku ran ter sebut dperleh melal ui suatu analis+s krela si. 1ada bagian ini akan dibahas dua buah ukuran krelasi tersebut yaitu koefisien determinasi dan koefisien korelasi .
+2.>.+
Fariasi Total Untuk 'ebih memahami pengertian ke"isien determinasi (r2), kita terlebih dahulu akan membahas beberapa istilah dan knsep seperti yang diilustrasikan pada ambar 12%6%
217
Prinsip-prinsip Statistik unt+ •>@ Teknik dan Sains
abar 12%6 onsep de(iasi taE
Sebuah nilai tunggal pada diagra pen!ar< y0
De(iasi total dari y0
l
.v
= a bx
l
9 De(iasi ter;elaskan
9
1
dari y6
$ $ $$$$ $ $ $$ $ $$$ *i
•
9
e
5eviasi total merupakan penyimpangan nilai sesungguhnya suatu variabel terikat terhadap nilai rata$ratanya . !eviasi ttal dapat diuraikan atas dua deviasi yaitu deviasi ter*elaskan ( explained deviati!n) dan deviasi tak ter*elaskan ( un explained deviation) . !eviasi terjelaskan merupakan penyimpangan nilai variabel terikat menurut prediksi prsamaan regresi terhadap nilai rnta$ratanya , sedangkan deviasi tak terjelaskan merupakan penyimpangan nilai variabel sesungguhnya terhadap nilai variabel menurut prediksi persamaan regresi. !engan menggunakan knsep di atas, dapat dide"inisikan suatu variasi iotaB (total variation ) yang merupakan jumlah dari variasi terjelaskan ( explained variation) dan variasi tak terjelaskan ( unexplained variation) sebagai berikut
5,(.vN 6 y)2
"
$,( y 6 y)2
3 $,(
yC
6 6y)2
(+2.l l)
di mana
=( yC $ y)2
deviasi ttal
( y - y$)2 ( yC $ y )%
deviasi terjelaskan deviasi tak terjelaskan
7nsep$knsep di atas akan digunakan dalam mende"inisikan ke"isien determinasi dan ke"isien krelasi.
12%/%2
Koe#isien Deterinasi 4oefisien determinasi (r2) dide"inisikan sebagai perbandingan dari variasi ter ieiaskan dengan variasi ttal.
5,(;A $ y)2 ",(#
$
6y)2
(+2 .+2)
!engan menggunakan knstanta$knstanta dari persamaan regresi , ru mu s ( +2.+2) dapat dinyatakan sebagai
a(5,y) 3 b( $,xy D $ n(y)% ,(O)2 $ n(y)2
(+2.+8)
220
Bab 12 • Regresi dan Korelasi Linier SP>EAerhana
--------------- ilai ke"isien detenninasi berkisar antara F (tidak ada relasi) dan 5 (relasi sempuma).
12.4.3
Koe$isien Korelasi 7e"isien krelasi (r) mempunyai nilai yang meru pakan akar dari ke"isien determinasi dan mempunyai tanda dengan ketentuan sebagai berikut
r=
EF
)12%1/&
3anda r mengikuti tanda knstanta b persamaan regresi ( r psiti" jika b psiti" dan r negati" b negati") . !engan demikian r berkisar antara $5 sampai K 5 .
0 l h# t % G,r 1 %t 3" %
,
·
.
---
-
---- --------
--
!engan menggunakan data dan tabel perhitungan pada Cnth +2.+ dan persamaan garis regresi yang dihasilkan, dapat diperleh ke"isien deterrninasi dan ke"isien krelasi sebagai berikut. !ari persamaan regresi, a " +,02?? dan b " ;, +8<=. 'umlah pasangan pengamatan n " <. -aka
a(B y ) 3 b( $,xy ) $ n (.yf
2
r
2<)y)2 $ )( y )2 2
+,02??(2=6) K ;,+8<=(22;?) $ <(8?) - " 0,=<2 ---->---+-->++=20 $ <(8?)2
-- ---- -r
12.4.4
" K0,=<2
K0,==i
lnterpretasi Relasi !ari Cnth +2.6, apakah yang bisa diartikan dari nilai ke"isien determinasi sebesar r% " 0,=<2P !engan mengingat kembali bah4a ke"isien deterrninasi merupakan rasi variasi terjelaskan dengan variasi ttal, kita dapat mengartikar bah4a sekitar =<,2 persen variasi dari nilai varibel terikat dapat dijelaskan , artiny memang benar bah4a variasi tersebut dapat dijelaskan leh variasi nilai variabe bebasnya (tentu saja masih terdapat sekitar +,< persen variasi yang tidak terjelaskar dengan sebab$sebab yang belum diketahui) . 7arena nilai r% tidak dapat melebi h 5, maka n ilai 0,=<2 merupakan nilai yang uku p ti nggi. -eski pu n anal isis krela si meru pakan metde penti ng da l am menar e.ksitensi hubu ngan antara variabel bebas dan terikat, terdapat dua hal ya ng seri nr disalahartikan dari sebuah analisis krelasi , sehi ngga harus dih i ndari 5 . 7relasi sering digunakan u ntuk membu ktikan adanya hubu ngan sebab aldbat. Hal ini merupakan suatu kesalahan interpretasi , sebab ke"isien deter minasi tidak memberikan in"rmasi apapu n mengenai jenis r elasi yang terjad antar dua variabel. 7e"isien determi nasi han ya menu nju kka n eksistem dan &kekuatan& hubungan antara variabel bebas dan terikat tan pa rnenil2 si"at relasi tersebu t.
y. % @ gabar sy. gabar )!& )d& " , .. y. t2 0 6> 2 o>%5? t2 @
r "
+
0<6
b
2> 0
A
0
2
0
0
.t2 " 0
22+
Prinsip-prinsip Statistik untuk Teknik dan Sains -
2.
12.4.5
-'-
7e"isien krelasi sering diinterpretasikan sebagai nilai persentase . 5ni dapat menimbulkan kesalahan yang sangat serius. -isalnya untuk ke"isien krelasi 0,? tidak berarti ?0 persen variasi variabel t.erikat dapat terjelaskan, karena yang sebenarnya terjelaskan adalah sebesar (0,?)2 atau >= persen.
Rangkuan $ra#ik Deberapa relasi linier sederhana dapat dirangkum seara gra"ts dengan men g gunakan diagram penar seperti yang ditunjukkan ambar +2.=
(a) (b) (c) (d)
ambar
+2.=
Rangkuan gra#ik beberapa relasi linier saderhana
krelasi psiti" sempurna krelasi negati" sempurna dan (d) krelasi psiti" dengan kekuatan relasi () lebih besar daripada (d) tidak ada krelasi
sr . x 0
.t2
r b B
sy. x 0
.r2
+
r
+
0
b
)b&
)a&
)!&
)d&
•
)e&
+
@ 0
+
222
Bab 12 • Regresi dan K0relasi Linier Sederhana
1.
Epakah terdapat hubungan yang berarti antara kapasitas angkut sebuah mbil -1# dengan knsumsi bahan bakarnyaP 1engukuran terhadap +2 jenis mbi l -1# dilakukan untuk mengetahui hubungan tersebut dan hasilnya ditunjukkan dalam data berikut, di mana x adalah kapasitas dalam meter kubik dan y adalah knsumsi bahan bakar dalarn (km jarak tempuh per liter). 7apasitas Engkut
7nsumsi Dahan Dakar
.
0,8>
=,8
2
0,8>
=,6
8
0,8?
=,0
>
0,>0
<,?
;
0,>0
?,<
6
0,>0
<,0
?
0,>8
?,8
<
0,;>
6,=
=
0,>0
<,0
+0
0,8>
+0,0
55
0,;?
6,0
+2
0,;?
6,8
-bil
(a) (b) (c)
ambarkan diagram penamya .
(d) (e)
Hitung errr standard estimasi.
2.
Hitung persamaan regesi dan gambarkan pada diagram penarnya.
unakan persarnaan regresi untuk memprediksi knsumsi bahan bakar untuk mbil dengan kapasitas +2 meter kubik . .
akukan uji kemiringan t.Epakah memang terdapat hubungan yang sebenamya antara kapasitas a.ngkut dengan knsumsi bahan bakar untuk tingkat kepentingan 0,0;P
(f)
3entukan rata$rata pemakaian bahan bakar untuk mbil dengan kapasitas angkut +2 meter kubik dalarn selang/interval keperayaan =; persen.
(g)
3entukan pemakaian bahan bakar untuk mbil tipe !G 5 00 yang mempu nyai kapasitas angkut meter kubik . Hitung ke"isien determinasi .
(h)
1
-etde regresi.linier digunakan untuk menganal isi s data dari suatu penel itian yang mengkaji hubungan antar. temperatur pe+ nukaan jalan (x) dengan de"leksi perkerasan jalan (pmement). !ata yang diperleh adnlah sebagai berikut 0
3emperatur (%)
!e"leksi (y)
3emperatur (%)
!e"leksi )y&
0,62+
?2,?
0,68?
0,6;?
6?,<
0,62?
?2,+
0,6>0
?6,6
0,6;2
?2,<
0,628
?8,>
0,680
?<,8
0,66+
?0,;
0,62?
?0,0
??.0
$
0
Prinsip-prinsip Statistik untuk Teknik dan Sains
!e"leksi (y)
3emperatur (x)
!e"leksi (y)
?>,;
0,6>+
?2,+
0,68+
?>,0
0,68?
?+,2
0,6>+
?2,>
0,680
?8,0
0,68+
?;,2
0,6>>
?2,?
0,68>
?6,0
0,68=
91
0,68<
3emperatur (%)
(a) (b) (c) (d)
ambarkan diagram penamya.
Gitung persamaan regresi dan gambarkau pada diagram penamya. Hitung errr standard estimasi. akukan uji kemiringan t. Epakah memang terdapat hubungan yang sebenamya antara temperatur dengan de"leksi untuk tingkat kepentingan 0,0;P Hitung ke"isien determinasi.
(e) 3.
223
Sebuah makalah di Journal of +ound and Fibration (#l. +;+, +==+, hal. 8<8$8=>) menggambarkan hubungan antara besamya kebisingan yang diterima dengan tekanan darah manusia. !ata berikut ini dilaprkan dalam makalah tersebut.
?0
x
.
60
.
68
6;
.
?0
.
y
l
0
+
2
;
y
;
>
6
<
>
x
.
<;
.
<=
90
70
.
=0
?0
<0 >
;
?
.
=0 <0 6
9
. => . 100
.2
. i--1
?
6
+00
+00
90
di mana y adalah kenaikan tekanan darah dalam mm Hg, dan x adalah tingkat kekerasan
suara dalam desibel (dD).
(a) (b) (c)
ambarkan diagram penamya.
(d) (e)
Hitung errr standard estimasi.
)#&
Hitung persamaan regresi dan gambarkan pada diagram penarnya. unakan persamaan regresi untuk memprediksi kenaikan tekanan darah untuk tingkat kekerasan suaran <; dD.
akukan uji kemiringan t. Epakah memang terdapat hubungan yang sebenamya antara peningkatan tekanan darah dengan tingkat kekerasan suara untuk tingkat kepentingan 0,0;P
Hitung ke"isien detenninasi.