40
KORELASI
Korelasi merupakan suatu hubungan antara satu variabel dengan variabel lainnya. Hubungan antara variabel tersebut bisa secara korelasional dan secara kausal.
Korelasi dikatakan korelasional jika hubungan tersebut tidak menunjukkan sebab akibat, artinya sifat hubungan variabel satu dengan variabel lainnya tidak jelas mana variabel sebab, dan mana variabel akibat.
Korelasi dikatakan kausal jika hubungan tersebut menunjukkan sifat sebab akibat, artinya jika variabel yang satu merupakan sebab, maka variabel lainnya merupakan akibat.
Untuk mengukur seberapa kuat hubungan antara variabel, maka digunakan metode analisis korelasi. Analisis korelasi adalah alat statistik yang dapat digunakan untuk mengetahui derajat keeratan (tingkat hubungan) linear antara satu variabel dengan variabel yang lain.
Umumnya analisis korelasi digunakan dalam hubungan dengan analisis regresi, yaitu untuk mengukur ketepatan garis regresi dalam menjelaskan variasi nilai variabel dependen (variabel tak bebas/ terikat).
Dalam analisis korelasi tidak mempersoalkan apakah variabel yang satu tergantung pada variabel yang lain atau sebaliknya. Jadi metode korelasi dapat dipakai untuk mengukur derajat hubungan antara variabel bebas satu dengan variabel bebas yang lainnya, atau antar dua variabel.
Hubungan dua variabel ada yang positif dan ada yang negatif. Hubungan X dan Y dikatakan positif apabila kenaikan (penurunan) X pada umumnya diikuti oleh kenaikan (penurunan) Y. Sebaliknya, dikatakan negatif jika kenaikan (penurunan) X pada umumnya diikuti oleh penurunan (kenaikan) Y.
Berikut diagram pencar yang menggambarkan hubungan antara variabel X dan variabel Y.
Gambar Diagram Pencar
Korelasi Positif Korelasi Negatif
Tidak Ada Korelasi Korelasi Sempurna
Contoh Soal
Berikut data tentang hubungan antara hasil penjualan dengan biaya iklan suatu perusahaan.
Biaya Iklan
(Juta Rupiah)
Biaya Penjualan
(Juta Rupiah)
0.50
5.00
1.00
10.00
1.75
12.50
2.75
20.00
3.25
30.00
4.00
35.00
5.50
40.00
5.25
42.50
6.50
50.00
Buatlah diagram pencar dari data tersebut!
Sebutkan jenis korelasi yang terjadi!
Jawab:
Gambar diagram pencar (Scatter plot)
Jenis korelasi yang terbentuk adalah korelasi positif.
Jika variabel X dan Y ada hubungan, maka diagram pencarnya adalah lurus atau teratur. Apabila diagram pencarnya tidak teratur, artinya kenaikan atau penurunan X pada umumnya tidak diikuti oleh naik turunnya Y, maka dikatakan X dan Y tidak berkorelasi. Kuat dan tidaknya hubungan antara X dan Y apabila dapat dinyatakan dengan fungsi linear (paling mendekati), diukur dengan suatu nilai yang disebut koefisien korelasi (r). Nilai koefisien korelasi ini paling sedikit -1 dan paling banyak +1. Jadi, jika r sama dengan koefisien korelasi, maka r dapat dinyatakan sebagai berikut.
-1 r +1
Kuat (-)Kuat (+)Lemah (-)Lemah (+)Kuat (-)Kuat (+)Lemah (-)Lemah (+)
Kuat (-)
Kuat (+)
Lemah (-)
Lemah (+)
Kuat (-)
Kuat (+)
Lemah (-)
Lemah (+)
Jika : r=+ korelasi positif mendekati +1 (kuat)
r=- korelasi negatif mendekati -1 (kuat)
r=0 tidak ada korelasi.
JENIS-JENIS KOEFISIEN KORELASI
Koefisien Korelasi Linear (Korelasi Pearson)
Untuk mencari koefisien korelasi dapat digunakan rumus koefisien korelasi Pearson atau koefisien korelasi produk momen (Product Moment Corelation).
Syarat:
Berskala interval atau rasio
Keduanya memiliki rentangan nilai yang relatif sama.
rxy=n i=1nXiYi-i=1nXii=1nYin i=1nXi2-i=1nXi2n i=1nYi2-i=1nYi2
atau
rxy=i=1nxiyii=1nxi2i=1nyi2
Dimana:
x=X-X
y=Y-Y
Koefisien korelasi dikuadratkan disebut Koefisien Determinasi (r2) artinya pengaruh variabel X terhadap variabel Y sebesar:
r2×100%
Koefisien Korelasi Rank
Koefisien korelasi rank adalah indeks angka-angka yang digunakan untuk mengukur keeratan (erat atau tidaknya) korelasi antara dua variabel yang digunakan ranking (tingkatan).
Rumus:
r=1-6d2n(n2-1)
dengan,
r : koefisien korelasi rank
d : selisih ranking (beda)
n : banyaknya pasangan rank.
Catatan:
Pemberian rank disini dimulai dari data terbesar atau terkecil.
Contoh Soal
Berikut merupakan data nilai matematika dan statistika dari 10 Mahasiswa.
Matematika
82
75
85
70
77
60
63
66
88
89
Statistika
79
80
89
65
67
62
61
68
81
84
Hitunglah koefisien korelasi rank-nya
Sebutkan jenis korelasinya, dan apa artinya
Penyelesaian:
Matematika
(X)
Statistika
(Y)
Rank
(X)
Rank
(Y)
d
d2
82
79
4
5
-1
1
75
80
6
4
2
4
85
89
3
1
2
4
70
65
7
8
-1
1
77
67
5
7
-2
4
60
62
10
9
1
1
63
61
9
10
-1
1
66
68
8
6
2
4
88
81
2
3
-1
1
89
84
1
2
-1
1
28
Menentukan koefisien korelasi rank-nya
r=1-6d2n(n2-1)
=1-6 (22)10 (102-1)
=1-132990
=0,87
Jenis korelasinya adalah korelasi positif kuat (mendekati +1)
r2×100%=(0,87)2×100%
=75%
Artinya, nilai matematika siswa mempengaruhi nilai statistika siswa sebesar 75%.
Korelasi Kontingensi (Koefisien Korelasi Bersyarat)
Korelasi kontingensi digunakan jika data berbentuk kualitatif (data yang tak berbentuk angka atau bilangan).
Rumus:
C=χ2χ2+n
dengan,
χ2=i=1pj=1qfij-eij2eij
0 C 1
dimana,
i : baris
j : kolom
n : jumlah semua frekuensi
eij : frekuensi harapan, yaitu eij=ni-njn
fij : frekuensi per sel.
Contoh Soal
Seseorang ingin mengetahui apakah ada hubungan antara tingkat pendidikan
dan kebiasaan rekreasi diambil sampel sebanyak 400 orang untuk diteliti.
Tabel Kontingensi
Pendidikan
Rekreasi
Jumlah
Tidak pernah
Jarang
Sering
Tidak ada
145
58
8
211
Menengah
77
13
27
117
Sarjana
21
32
19
72
Jumlah
243
103
54
400
L1 : menentukan eij
* e11=211×243400=128,1825
* e12=211×103400=54,3325
* e13=211×54400=28,485
* e21=117×243400=71,0775
* e22=117×103400=30,1275
* e23=117×54400=15,795
* e31=72×243400=43,74
* e32=72×103400=18,54
* e33=72×54400=9,72
L2 : menentukan fij-eij2eij
* f11-e112e11=145-128,18252128,1825=2,20
* f12-e122e12=58-54,3325254,3325=0,24
* f13-e132e13=8-28,485228,485=14,73
* f21-e212e21=77-71,0775271,0775=0,49
* f22-e22e2=13-30,1275230,1275=9,73
* f23-e232e23=27-15,795215,795=7,94
* f31-e312e31=21-43,74243,74=11,82
* f32-e322e32=32-18,54218,54=9,77
* f33-e332e33=19-9,7229,72=8,85
L3 : menentukan χ2
χ2=i=1pj=1qfij-eij2eij
χ2=2,20+0,24+14,73+0,49+9,73+7,94+11,82+9,77+8,85
=65,77
C=χ2χ2+n
=65,7765,77+400=65,77465,77=0,41207033
=0,375
Koefisien Korelasi Linear Berganda
Digunakan untuk menghitung dan mengukur keeratan hubungan antara tiga variabel atau lebih.
Rumus:
RY.12=rY12+rY22-2rY1 rY2 r121-r122
dengan,
rY1 : koefisien korelasi antara Y dan X1
rY2 : koefisien korelasi antara Y dan X2
r12 : koefisien korelasi antara X1 dan X2
Variabel 1 : Y
Variabel 2 : X1
Variabel 3 : X2
Untuk:
rY.X1=nYX1-Y X1nY2-Y2nX12-X12
rY.X2=nYX2-Y X2nY2-Y2nX22-X22
rX1.X2=nX1X2-X1 X2nX12-X12nX22-X22
Contoh Soal
Seorang peneliti ingin mengetahui apakah ada hubungan yang positif antara pengeluaran, pendapatan, dan banyaknya anggota keluarga untuk keperluan tersebut diambil sampel sebanyak 7 rumah tangga.
Variabel
Rumah Tangga
I
II
III
IV
V
VI
VII
Y
3
5
6
7
4
6
9
X1
5
8
9
10
7
7
11
X2
4
3
2
3
2
4
5
Tentukan koefisien korelasi linearnya, dan apa artinya!
Penyelesaian:
Menentukan tabel regresi linear sederhana
Tabel regresi linear sederhana
Y
X1
X2
Y2
X12
X22
YX1
YX2
X1X2
3
5
4
9
25
16
15
12
20
5
8
3
25
64
9
40
15
24
6
9
2
36
81
4
54
12
18
7
10
3
49
100
9
70
21
30
4
7
2
16
49
4
28
8
14
6
7
4
36
49
16
42
24
28
9
11
5
81
121
25
99
45
55
40
57
23
252
489
83
348
137
189
* rY.X1=nYX1-Y X1nY2-Y2nX12-X12
=7384-(40)(57)7252-(40)27489-(57)2
=2436-2280(1764-1600)(3423-3249)
=15628536
=0,92
* rY.X2=nYX2-Y X2nY2-Y2nX22-X22
=7137-40237(252)-4027(83)-232
=959-920(164)(52)
=398528
=0,42
* rX1.X2=nX1X2-X1 X2nX12-X12nX22-X22
=7189-(57)(23)7489-(57)2783-(23)2
=1323-1311(174)(52)
=129048
=0,126
Maka,
RY.12=rY12+rY22-2rY1 rY2 r121-r122
=0,922+0,422-20,920,420,121-0,122
=0,093010,9856
=0,97
(korelasi positif kuat, mendekati +1)
Jadi, ada hubungan yang positif antara pengeluaran, pendapatan, dan banyaknya anggota keluarga.
Koefisien korelasi parsial
Pada koefisien korelasi linier berganda, masih bersifat umum untuk mengetahui besarnya kontribusi masing-masing variabel bebas terhadap variabel terikat dengan mempertimbangkan hubungan variabel bebas lainnya, baik terhadap variabel terikat maupun variabel bebas yang dicari kontribusinya diperlukan analisis sendiri.
Koefisien korelasi parsial antara Y dan X1 apabila X2 kontinu
ry1.2=ry1-ry2.r12(1-ry22)(1-r122)
Koefisien korelasi parsial antara Y dan X1 apabila X2 kontinu
ry2.1=ry2-ry1.r12(1-ry12)(1-r122)
Jika variabel-variabel Y,X1,X2 dan X3 maka akan didapatkan koefisien korelasi parsial ry1.23,ry2.13,ry3.12 misal koefisien korelasi parsial antara Y dan X1 jika X2 dan X3 tetap.
ry1.2=ry1.2-ry3.2.r13.2(1-ry3.22)(1-r13.22)
Contoh Soal
Seorang peneliti ingin mengetahui apakah ada hubungan yang positif antara pengeluaran, pendapatan, dan banyaknya anggota keluarga untuk keperluan tersebut diambil sampel sebanyak 7 rumah tangga.
Variabel
Rumah Tangga
I
II
III
IV
V
VI
VII
Y
3
5
6
7
4
6
9
X1
5
8
9
10
7
7
11
X2
4
3
2
3
2
4
5
Telah diperoleh sebelumnya,
ry1=0,92
ry2=0,42
r12=0,12
Maka,
ry1.2=ry1-ry2.r121-ry221-r122
=0,92-0,42.0,1261-0,4221-0,1262
=0,92-0,050,80,98
=0,870,784=0,870,88=0,9
ry2.1=ry2-ry1.r12(1-ry12)(1-r122)
=0,42-(0,92.0,126)1-0,922(1-0,1262)
=0,42-0,120,150,98
=0,30,147=0,30,38=0,78
PENGUJIAN SIGNIFIKANSI KORELASI
Menyusun hipotesis
H0: r = 0 tidak ada korelasi
H1: r 0 ada korelasi
Menentukan taraf nyata/tingkat sgnifikasi (α)
α = 5% = 0,05
α = 1% = 0,01
Menentukan daerah kritis
Ttabel = (α : n- 2) Prof. Agus
Ttabel = t (1- 12α ) : n – 2 Sudjana
Uji t
Untuk sampel kecil gunakan uji t
Nilai t untuk korelasi peason dapat dicari dengan rumus:
t=rn-21-r2
Nilai t untuk korelasi Spearmann dapar dicari dengan rumus:
t=rsn-21-rs2
Derajat kebenaran dk = n – 2
Jika sampel besar gunakan Z
Untuk korelasi pearson dihitung dengan rumus:
z = r n-1
Untuk korelasi spearman
z = rs n-1
Catatan:
Asumsikan bahwa sampling distribusi dari sampel berdistribusi normal dengan x=0 dan s=1n-1
Kriteria uji
thitung > ttabel tolak H0
Tolak H0-ttTolak H0-tt
Tolak H0
-t
t
Tolak H0
-t
t
Contoh Soal
Suatu penelitian yang ingin melihat apakah ada hubungan antara banyaknya kredit yang diambil dengan indeks prestasinya yang dicapai mahasiswa dalam satu semester. Setelah dilakukan pengumpulan data dari 10 mahasiswa ternyata penyebaran kredit dan IP yang dicapai sebagai berikut:
Mahasiswa ke-
1
2
3
4
5
6
7
8
9
10
Jumlah kredit diambil
20
18
15
20
10
12
16
14
18
12
IP
3,1
4,0
2,8
4,0
3,0
3,6
4,0
3,2
3,5
4,0
Penyelesaian:
H0 : r=0
H1 : r 0
Taraf signifikasi
α = 0,05
Daerah kritis ( t tabel)
ttabel=α:n-2 ttabel = t1- 12α: n – 2
=0,05:10-2 =t1-12.0,05:10-2
=0,05:8 =t1-0,025:8
=2,306 =t 0,975:8
=2,31
Tabel Regresi Sederhana
X
Y
X2
Y2
XY
20
3,1
400
9,61
62
18
4,0
324
16,00
72
15
2,8
225
7,84
42
20
4,0
400
16,00
80
10
3,0
100
9,00
30
12
3,6
144
12,96
43,2
16
4,0
256
16,00
64
14
3,2
196
10,24
44,8
18
3,5
324
12,25
63
12
4,0
144
16,00
48
155
35,2
2513
125,9
549
r=nxy-xy(n.x2-(x)2)(n.y2-(y)2)
=10.549-155.35,210.2513-155210.125,9-35,22
=5490-5456110519,96
=34148,51=0,23
Uji t
t=rn-21-r2
=0,2310-21-0,232
=0,2380,947
=0,67
Kriteria uji t
thitung
-2,312,31Terima H00,67-2,312,31Terima H00,67
-2,31
2,31
Terima H0
0,67
-2,31
2,31
Terima H0
0,67
Kesimpulan
Antara variabel jumlah kredit yang diambil tidak mempunyai hubungan dengan Indeks Prestasi.
PENGUJIAN SIGNIFIKASI KOEFISIEN
KORELASI LINIER GANDA
Setelah koefisien korelasi linier ganda diperoleh maka langkah selanjutnya adalah uji signifikansi korelasi linear tersebut. Apabila koefisien korelasi tersebut signifikasi barulah dapat digunakan untuk menyatakan besarnya kontribusi bersama dari variabel bebas terhadap variabel terikatnya. Pengujian koefisien korelasi linier ganda menggunakan f-test.
F hitung diperoleh dengan rumus sebagai berikut:
F=R2/k(1-R2)/(n-k-1)
Keterangan:
R : koefisien korelasi ganda
K : derajat kebebasan (banyak variabel bebas)
n-k-1 : derajat kebebasan sisa
Contoh Soal
Seorang peneliti ingin mengetahui apakah ada hubungan yang positif antara pengeluaran, pendapatan, dan banyaknya anggota keluarga untuk keperluan tersebut diambil sampel sebanyak 7 rumah tangga.
Variabel
Rumah Tangga
I
II
III
IV
V
VI
VII
Y
3
5
6
7
4
6
9
X1
5
8
9
10
7
7
11
X2
4
3
2
3
2
4
5
Telah diperoleh sebelumnya,
R=0,97
n=7
k=2
Maka,
F=(0,97)2/2(1-(0,97)2)/(7-2-1)
=0,470450,014775
=31,8
Taraf signifikansi
Ftabel=F0,05( 2 :7-2-1)
=F0,05(2 :4)=6,94
Kriteria uji
Fhitung>Ftabel
Tolak H0-6,946,9431,8Tolak H0-6,946,9431,8
Tolak H0
-6,94
6,94
31,8
Tolak H0
-6,94
6,94
31,8
Kesimpulan
Walaupun kita ambil α=1% koefisien korelasi dinyatakan signifikal hal ini berarti kedua variabel bebas secara bersama-sama mempunyai kontribusi yang sangat signifikal sebesar 24,09% terhadap pembentukan variabel terikat sisanya 5,91% dibentuk oleh variabel lain yang tidak diperhitungkan dalam soal.
Sampai sejauh ini kesimpulan yang diambil masih bersifat umum sehingga tidak dapat memberikan informasinya yang spesifik. Mengingat kemungkinan variabel beas yang satu dengan yang lainnya tidak benar-benar independen maka besarnya kontribusi masih dipertanyakan lagi. Apakah besarnya kontribusi itu ditentukan oleh kedua variabel secara seimbang?
Berapa persen yang benar-benar dipengaruhi oleh variabel bebas pertama dan berapa persen yang di pengaruhi oleh variabel bebas yang kedua. Untuk menjawab dilakukan analisis lanjutan.
Untuk mencari F pada pengujian signifikansi koefisien korelasi parsial antara variabel terikat dengan variabel bebas pertama digunakan rumus.
F=ry1.221-ry1.22n-k-1
Untuk mencari F pada pengujian signifikansi koefisien korelasi parsial antara variabel terikat dengan variabel bebas kedua digunakan rumus.
F=ry2.121-ry2.12n-k-1
Contoh Soal
Seorang peneliti ingin mengetahui apakah ada hubungan yang positif antara pengeluaran, pendapatan, dan banyaknya anggota keluarga untuk keperluan tersebut diambil sampel sebanyak 7 rumah tangga.
Variabel
Rumah Tangga
I
II
III
IV
V
VI
VII
Y
3
5
6
7
4
6
9
X1
5
8
9
10
7
7
11
X2
4
3
2
3
2
4
5
Telah diperoleh sebelumnya,
ry1.2=0,98
ry2.1=0,78
Maka,
Menentukan F hitung
F=ry1.221-ry1.22n-k-1
=(0,98)21-(0,98)27-1-1
=0,96040,03965
=4,8020,0396=121,26
Menentukan F hitung
F=ry2.121-ry2.12n-k-1
=(0,78)21-(0,78)25
=0,60841-0,60845
=3,0420,3916=7,76
Menentukan Ftabel
Ftabel
Fα k,n-k-1
F0,05 1,7-1-1
F0,05 1,5 6,61
F0,01 (1,5) 16,26
Kriteria Uji
Fhitung>Ftabel
121,26 >6,61 Tolak H0
Fhitung>Ftabel
7,76 > 6,61 Tolak H0
Kesimpulan
Variabel 1 dan 2 memiliki kontribusi
REGRESI LINEAR SEDERHANA
Tujuan analisis regresi adalah untuk membangun model regresi atau persamaan prediktif yang dapat digunakan untuk menggambarkan memprediksi dan mengendalikan variabel tak bebas berkaitan dengan variabel bebas.
Manfaat regresi linier sederhana:
Untuk memprediksi atau meramalakan nilai suatu variabel misal meramalkan konsumsi masa depan pada tingkat pendapatan tertentu.
Untuk mengetahui apakah variabel-variabel yang sedang diteliti sering berhubungan dimana keadaan suatu variabel membutuhkan adanya variabel yang lain dan sejauh mana pengaruhnya serta dapat mengestimasi nilai suatu variabel.
Dalam regresi linier sederhana pemodelan diadakan diantara dua variabel, variabel Y disebut variabel tak bebas atau variabel respon dan variabel X disebut variabel bebas atau variabel rediktor. Model hubungan antara X dan Y berupa hubungan yang berbentuk garis lurus. Model regresi linier populasi:
Y=β0+β1x+ε
Keterangan :
Y : Variabel tak bebas β1 : Slope/Koefisien garis
β0 : Intersep X : Variabel bebas
ε : Galat (error)/ sisaan (residual)
YXεiIntersep β0Slope β1Observed ValuexiY=β0+β1X+εYXεiIntersep β0Slope β1Observed ValuexiY=β0+β1X+ε
Y
X
εi
Intersep β0
Slope β1
Observed Value
xi
Y=β0+β1X+ε
Y
X
εi
Intersep β0
Slope β1
Observed Value
xi
Y=β0+β1X+ε
PENENTUAN GARIS REGRESI LINEAR SEDERHANA
Metode Tangan Bebas
Metode tangan bebas merupakan suatu metode yang berdasarkan kira-kira dari diagram titik ke diagram pencar (scaterplot) yang diperoleh dari pengamatan antara variabel X dan variabel Y.
Diagram pencar didapatkan dengan menggambarkan titik-titik pasangan pada absis x dan ordinat y, maka kumpulan titik-titik tersebut dapat member petunjuk untuk memperkirakan garis regresi yang akan dibuat. Metode ini hanya dapat dilakukan oleh ahli/orang yang berpengalaman.
Pendekatan Matematis dengan Metode Kuadrat Terkecil
Bahwa suatu garis regresi akan didapat dan akan mendekati titik-titik pasangan
xy. Inti metode OLS adalah mengestimasi suatu garis regresi dengan jalan meminimalkan jumlah dari kuadrat kesalahan setiap observasi terhadap garis tersebut.
Contoh Soal Metode Tangan Bebas
Tabel pengaruh tingkat pendapatan terhadap konsumsi makanan bagi petani.
No
Pendapatan
Konsumsi
1
125
75
2
150
100
Xx1x2β0Y1 X=X2-X1β1 X=X2-X1Y2Xx1x2β0Y1 X=X2-X1β1 X=X2-X1Y2
X
x1
x2
β0
Y1
X=X2-X1
β1
X=X2-X1
Y2
X
x1
x2
β0
Y1
X=X2-X1
β1
X=X2-X1
Y2
PENDUGAAN METODE KUADRAT TERKECIL
Pendugaan parameter model regresi linier sederhana untuk mencari nilai dugaan dari Intersep dan Slope (koefisien garis) regresi.
Persamaan regresi dugaan sampel
Y=b0+b1x+e
Dimana,
b0 : Intersep β0
b1 : Slope β1
e : Dugaan galat/sisaan
Pendugaan model atau garis regresi linier sederhana
yi=b0+b1x
Dimana:
yi : pendugaan nilai Y
b0 : pendugaan intersep
b1 : pendugaan slope
x : variabel bebas
Y : Ytopi / Ycup/Ypenduga
Dalam metode kuadrat terkecil (Ordinary Least Square, OLS) b0 dan b1 diperoleh dengan cara meminimalkan jumlah kuadrat galat.
e2=y-y2
=y-β0+β1x2
Misal:
Q=Y-β0+β1x2
Q diminimumkan, Q diturunkan terhadap b0 dan b1
Q β0=-2Y-β0+β1x
Q β0=-2XY-β0+β1x
Samakan dengan 0, maka diperoleh persamaan bagi pendugaan:
-2y-b0-b1x=0
-2xy-b0-b1x=0
Setelah disederhanakan, diperoleh:
y-b0-b1x=0
xy-b0-b1x=0
Dan diperoleh persamaan normal:
y-nb0-b1x=0
xy-b0x-b1x2=0
Sehingga:
y=nb0-b1x
xy=b0x-b1x2
Catatan:
Jumlah kuadrat (Sum Of Square)
* SSx=x-x2=x2-x2n
* SSy=y-y2=y2-y2n
* SSy=x-xy-y=xy-xyn
Berdasarkan persamaan normal diperoleh b0 dan b1:
b1=xy-xynx2-x2n
atau
b1=x-xy-yx-x2
atau
b1=nxy-xynx2-x2
dengan,
b0=y-b1x
Catatan:
y=yn x=xn
Interprestasi dari Intersep dan Slope
b0 nilai rata-rata dugaan dari y pada saat x=0
b1 nilai dugaan perubahan dari nilai rata-rata y pada saat x berubah satu satuan
Contoh Soal
Pengaruh Motivasi Belajar Terhadap Prestasi Belajar.
Mahasiswa
Motivasi (X)
Prestasi (Y)
X2
Y2
XY
1
6
4
36
16
24
2
6
5
36
25
30
3
5
4
25
16
20
4
7
6
49
36
42
5
8
7
64
49
56
6
8
9
64
81
72
7
9
9
81
81
81
8
7
6
49
36
42
9
9
6
54
36
54
10
9
9
81
81
81
11
6
6
36
36
36
12
9
8
81
64
72
89
79
683
557
610
Tentukan persamaan regresinya!
Jawab:
Menentukan b0 dan b1
b1=nxy-xynx2-x2
=12610-897912683-892
=289275
=1,05
b0=y-b1xn
=79-1,058912
=-14,5312=-1,21
Persamaan regresinya:
y=b0+b1x
=-1,21+1,05x
Penafsiran parameternya:
y=-1,21+1,05x
Koefisien garis sebesar 1,05 menunjukan bahwa setiap kenaikan x sebanyak satu satuan, prediksi rata-rata y akan naik sebesar 1,05 satuan.
Jadi , jika skor motivasi belajar naik sebesar 1 point akan mengakibatkan kenaikan predikasi skor prestasi belajar sebesar 1,05.
Jadi, jika skor motivasi belajar naik sebesar 1 point akan mengakibatkan kenaikan prediksi skor prestasi belajar sebesar 1,05.
b0 = -1,21 artinya apabila variabel x (motivasi) mempunyai nilai/skor sebesar 0 (tidak ada) maka variabel y (prestasi mempunyai nilai sebesar -1,21.
b1 = 1,05 artinya apabila setiap kenaikan skor variabel x (motivasi) sebesar 1 satuan, maka akan menaikan skor variabel y (prestasi) sebesar 1,05 dengan konstanta -1,21, sebaliknya.
Gambar Scatter Plot
Garis regresiy=-1,21+1,05xGaris regresiy=-1,21+1,05x
Garis regresi
y=-1,21+1,05x
Garis regresi
y=-1,21+1,05x
ANALISIS RAGAM (ANOVA) UJI F
Keragaman total di dekomposisi menjadi 2 komponen.
SST=SSE+SSR
Dimana,
SST : jumlah kuadrat total (Total Sum Of Square)
SSE : jumlah kuadrat galat ( Sum Of Square Error)
SSR : jumlah kuadrat regresi (Sum Of Square Regretion)
SST : (y-y)2
SSE : (y-y)2
SSR : (y-y)2
Dimana,
y=rata-rata y
y=nilai observasi dari variabel y
y=nilai dugaan dari y pada nilai x tertentu
SST : total Sum Of Square (jumlah kuadrat total) "Mengukur keragaman nilai y disekitar mean y".
SSE : Error Sum Of Square (jumlah kuadrat galat) "Mengukur keragaman diluar hubungan antara x dan y".
SSR : Regresion Sum Of Square "Mengukur atau menjelaskan keragaman hubungan antara x dan y".
Tabel ANOVA Model Regresi
Sumber Variansi
Jumlah Kuadrat
(Sum Of square)
Derajat Kebebasan
Kuadrat Tengah
(Mean Square)
F. Rasio
Regresi
SSR
1
MSR=SSRdb R
F=MSRMSE
Error/Galat
SSE
(n-2)
MSE=SSEdb E
Total
SST
(n-1)
MST=SSTdb T
Koefisien Determinasi (R2)
Koefisien determinasi adalah proporsi total keragaman data yang dijelaskan oleh model regresi.
R2=SSRSST
=1-SSESST, 0 R2 1
R2 yang kecil berarti kemampuan variabel-variabel bebas dalam menjelaskan variabel-variabel tak bebas amat terbatas.
R2 mendekati 1 berarti variabel-variabel bebas memberikan hamper semua informasi yang dibutuhkan untuk mempredikasi variansi variabel tak bebas.
KESALAHAN STANDAR ESTIMASI
(STANDAR EROR)
Untuk mengetahui ketepatan persamaan estimasi dapat digunakan dengan mengukur besar kecilnya kesalahan kesadaran standar estimasi. Semakin kecil nilai kesalahan standar estimasi (standar eror) maka semakin tinggi ketepatan persamaan estimasi dihasilkan untuk menjelaskan nilai variabel yang sesungguhnya. Dan sebaliknya, semakin besar nilai kesalahan standar estimasi maka semakin rendah ketepatan persamaan estimasi dihasilkan.
Rumus:
Se=Y2-b0Y-b1XYn-2
Uji t secara Parsial
Standar error dan koefisien slope regresi dapat digunakan dengan:
Sb1=Se(x-x)2=Sex2-(x)n2
Uji t untuk Slope populasi
Apakah ada hubungan linier antara x dan y?
Hipotesis nol dan hipotesis alternatifnya
H0: β1=0 (tidak ada hubungan linier)
H1: β1 0 (ada hubungan linier)
Uji Statistik
t=b1-β1Sb1, db = n-2
dimana,
b1 : Koefisien Slope regresi sampel
β1 : Hipotesis Slope
Sb1 : Standar error koefisien Slope
db : Derajat bebas
Langkah-langkah Pengujian Hipotesis
Tentukan hipotesis nol (H0) dan hipotesis alternative (H1)
H0: β1 K H1: β1>K
H1: β1 K H1: β1
H1: β1=K H1: β1 K
Tentukan arah uji hipotesis (satu arah/dua arah)
Tentukan taraf signifikansi (α)
Jika satu arah α2
Jika dua arah =α2
Tentukan wilayah kritis/daerah kritis (ttabel)
Ttabel = (α:db) db=n-2
Tentukan nilai hitung (thitung)
Gambar dan keputusan
Kesimpulan
Contoh Soal
Diketahui suatu penelitian terhadap hubungan antara nilai biaya periklanan dengan tingkat penjualan dari sebuah koprasi adalah sebagai berikut (dalam ribuan):
Tingkat Peringkat
Tingkat Penjualan
50
40
51
46
52
44
53
55
54
49
Tentukan persamaan regresinya dan apa maksud dari persamaan tersebut.
Berapa besarnya koefisien korelasi dan koefisien determinasinya dan apa maksud dari nilai keduanya.
Berapa besarnya kesalahan standar estimasinya/standar eror.
Dengan tingkat signifikansi 10% ujilah hipotesis yang menyatakan bahwa hubungan antara biaya periklanan dan tingkat penjualan sedikitnya 40%.
Penyelesaian:
Menentukan persamaan regresinya
*Langkah 1
Menentukan variabel x dan variabel y.
X : biaya periklanan
Y : tingkat penjualan
*Langkah 2
Tabel regresi linear sederhana
Periklanan
(X)
Tingkat Penjualan (Y)
X2
Y2
XY
50
40
2500
1000
2000
51
46
2601
2116
2346
52
44
2704
1936
2288
53
55
2809
3025
2915
54
49
2916
2401
2646
260
234
13530
11078
12195
*Langkah 3
Menentukan koefisien b0 dan b1.
b1=nXY-XYnX2-X2
=512195-260234513530-2602
=2,7
b0=Y-b1Xn
=234-2,7(260)5
=-93,6
*Langkah 4
Menentukan persamaan regresinya,
y=b0+b1x
=-1,21+1,05x
Penafsiran parameternya:
y=-1,21+1,05x
Koefisien garis sebesar 2,7 menunjukan bahwa setiap kenaikan x sebanyak satu satuan, prediksi rata-rata y akan naik sebesar 2,7 satuan.
Jadi, jika tingkat periklanan (variabel X) nilai sebesar Rp.1,- akan mengakibatkan kenaikan prediksi biaya penjualan (variabel Y) sebesar Rp.2,7.
b0=-93,6 artinya apabila variabel X (biaya periklanan) mempunyai nilai/skor sebesar 0 (tidak ada) maka variabel Y (tingkat penjualan) mempunyai nilai sebesar -93,6.
b1 = 2,7 artinya apabila setiap kenaikan skor variabel X (biaya periklanan) sebesar 1 satuan, maka akan menaikan skor variabel Y (tingkat penjualan) sebesar Rp.2,7.-
Menentukan besar koefisien korelasi dan koefisien determinasi.
Koefisien Korelasi
r=nxy-xynx2-(x)2
r=512195-260234513530-2602511078-2342
=0,76 korelasi positif kuat
Artinya, hubungan biaya periklanan dengan tingkat penjualan kuat.
Koefisien Determinasi
r2×100%=0,76×100%=57,76%
Hal ini berarti kontribusi (pengaruh) variabel x dengan variabel y sebesar 57,76%.
Kesalahan Standar Estimasi (Standar Error)
Se=Y2-b0Y-b1XYn-2
=(11078)2--93,6234-2,7(12195)5-2
=4,24
Pengujian Hipotesis
Tentukan H0 dan H1
H0 : β1 0,4
H1 : β1<0 ,4
Uji hipotesis satu arah
Tingkat signifikansi
α=10%
Daerah kritis (ttabel)
db=n-2
=5-2=3
Maka, tα;db tα;3=-1,638
Nilai hitung /Statistik Uji
Sb1=Sex2-x2n
=4,2413530-26025
=1,342
Maka,
t=b1-β1Sb1
=2,7-0,41,342
=1,714
Gambar dan Keputusan
Tolak H0-1,6381,6381,714Tolak H0-1,6381,6381,714
Tolak H0
-1,638
1,638
1,714
Tolak H0
-1,638
1,638
1,714
Kesimpulan
Pendapat yang menyatakan bahwa hubungan biaya periklanan dengan tingkat penjualan sedikitnya 40% adalah benar, dimana biaya mempengaruhi tingkat penjualan sebesar 57,76%.
REGRESI LINEAR BERGANDA
Menguji hubungan linear antara variabel tak bebas (Y) dengan dua atau lebih variabel bebas (X).
Model regresi linear berganda dari populasi
y= β0 +β1 x1+β2 x2+ …+βk xk+ε
dengan,
β0 : intersep
β1 ,β2,βk : slope
ε : galat/random error
Model regresi linear berganda untuk sampel
y= b0 +b1 x1+b2 x2+ …+bk xk
dengan,
y : penduga nilai Y
b0 : penduga intersep
b1,b2,bk : penduga slope
Model 2 variabel
YX2Y=b0+b1x1+b2x2Slope X1Slope X2X1YX2Y=b0+b1x1+b2x2Slope X1Slope X2X1
Y
X2
Y=b0+b1x1+b2x2
Slope X1
Slope X2
X1
Y
X2
Y=b0+b1x1+b2x2
Slope X1
Slope X2
X1
X2y=b0+b1x1+b2x2X1x1x2YX2y=b0+b1x1+b2x2X1x1x2Y
X2
y=b0+b1x1+b2x2
X1
x1
x2
Y
X2
y=b0+b1x1+b2x2
X1
x1
x2
Y
Persamaan peubah y dicari dengan meminimumkan jumlah kuadrat galat e2.
Asumsi-asumsi dalam model regresi linear berganda adalah :
Galat berdistribusi normal
Mean dari galat 0
Galat memiliki ragam konstan
Galat model saling bebas
Tidak ada ultikolinear
Galat dari model regresi
e=(y- y)
Model regresi linear berganda dengan notasi matriks
y=y1y2......yn=x11x12….x1kx21x22x2k......xn1xn2xnk×β1β2......βk+ε1ε2......εk
=xβ+ε
2 Variabel bebas :
Y=b0+b1x1 +b2x2
Koefisien regresinya adalah :
Y= b0n+b1x1 +b2x2
X1Y= b0x1 +b1x12+b2x1 x2
X2Y= b0x2 +b1x1 x2+b2x22
3 Variabel bebas :
Y=b0+b1x1 +b2x2+b3x3
Y= b0n+b1x1 +b2x2+ b3x3
X1Y= b0x1 +b1x12+ b2x1 x2+ b3 x1x3
X2Y= b0x2 +b1x1 x2+b2x22 + b3 x1x3
X3Y= b0x3 +b1x1 x3+b2x2 x3+b3x32
ANALISIS RAGAM (ANOVA)
(ANALYSIS OF VARIANCE)
Analisis ragam ANOVA digunakan untuk menguji apakah perbedaan yang signifikan/berbeda nyata antar mean perlakuan.
Hipotesis:
H0 : μ1 =μ2 =…=μp
H1 : paling tidak ada sepasang μ1 , μ2 ,……., μp yang berbeda
Pengujian dilakukan dengan analisis ragam (ANOVA) dengan statistik F. Analisys of Variance (ANOVA) digunakan untuk mengevaluasi apakah ada perbedaan yang signifikan diantara mean lebih dari 2 perlakuan. ANOVA ditemukan oleh R.A Fisher tahun 1920.
ANOVA dilakukan dengan cara mendekomposisikan total data menjadi komponen keragaman Between-Treatment dan keragaman Within-Treatment. Perbedaan atau deviasi setiap observasi/data terhadap mean keseluruhan/mean umum (Overall mean) dapat didekomposisi menjadi 2 komponen. Deviasi antara mean perlakuan dengan overall mean (Between).
Deviasi antara data dengan mean perlakuan (Within). ANOVA menggunakan informasi dekomposisi keragaman dari dua komponen tersebut.
Data = Model + Galat
Keragaman total data = keragaman model + keragaman galat
Ragam Between-Treatment
Perbedaan (deviasi) dari memperlakukan dengan mean keseluruhan (overall)
(x1-x )
Ragam Within-Treatment
Perbedaan dari data dengan mean perlakuan
(xij-x1)
Total Variation
Sum of Square total (SST)/ jumlah kuadrat total (JKT)
JKT (total) =(x11-x1)2+(x21-x1)2+…+(xij-x)2
Treatment Variation
Sum of Square treatment (SST)/ jumlah kuadrat perlakuan (JKP)
JKP =n1(x1-x)2+n2(x2-x)2+…+nt(xt-x)2
Random (error) Variation
Sum of Square Error (SSE)/ jumlah kuadrat galat (JKG)
JKG =(xn-x1)2+(x21-x1)2+…+(xtj-xt)2
The mean Square (kuadrat tengah)
KTG=JKGN-j
V2:db=N-j ; N : Banyak data pengamatan
j : Jumlah kelompok
KTP=JKPJ-1
V1:db=j-1 ; j : jumlah kelompok
Statistik uji yang digunakan dalam ANOVA adalah F = Statistik, yaitu rasio antara Ragam Between-Treatment dibagi dengan ragam Within-Treatment.
F=Betweenwithin=KTPKTG
Nilai F yang besar merupakan fakta tolak HO karena menunjukkan adanya perbedaan yang lebih besar Between-Treatment daripada Within-Treatment. Dengan kata lain F yang lebih besar menunjukkan adanya perbedaan pengaruh perlakuan.
Tabel ANOVA
Sumber
Variansi
Sum of Square (Jumlah Kuadrat)
Derajat
Bebas
Mean Squares
(Kuadrat Tengah)
F
Treatment/ perlakuan
JKP
j-1
JKPJ-1
KTPKTG
Error/ galat
JKG
N-j
JKGN-j
Total
JKT
N-1
Tabel F
Reject H0Fα(j-1,N-j)Do NotReject H0Reject H0Fα(j-1,N-j)Do NotReject H0αFα(V1,V2)αFα(V1,V2)
Reject H0
Fα(j-1,N-j)
Do Not
Reject H0
Reject H0
Fα(j-1,N-j)
Do Not
Reject H0
α
Fα(V1,V2)
α
Fα(V1,V2)
Contoh soal
Food I
Food II
Food III
25,40
23,40
20,00
26,31
21,80
23,20
24,10
23,50
19,75
23,74
22,75
20,60
25,10
21,40
20,40
124,65
113,05
102,95
Sebagai ahli epidemologi, Anda ingin melihat apakah 3 suplemen makanan memiliki hasil rata-rata susu yang berbeda. Anda menetapkan 15 sapi dengan 5 persuplemen makanan. Pada tingkat signifikansi 5% apakah ada perbedaan hasil rata-ratanya?
Penyelesaian:
Dimana
n1 =5 x1=24,93
n2 =5 x2=22,61
n3 =5 x3=20,59
x=21,71
JKP = 11,0532
Tabel ANOVA
Sumber
Variansi
Sum of Square (Jumlah Kuadrat)
Derajat
Bebas
Mean Squares
(Kuadrat Tengah)
F
Treatment/ perlakuan
47,1640
3-1=2
23, 5820
25,60
Error/Galat
11,0532
15-3=12
0,9211
total
58,2172
15-1=14
H0 : μ1 =μ2 =μ3
H1 : μ1 μ2 μ3
Taraf signifikansi
α=5%=0,05
Derajat kebebasan
3,883,88V2:db=N-j=15-3=12
3,88
3,88
V1:db=j-1=3-1=2
Statistik uji
F=KTPKTG=23,58200,9211=25,60
Daerah kritis
Tolak H03,8825,60Tolak H03,8825,60
Tolak H0
3,88
25,60
Tolak H0
3,88
25,60
Kesimpulan
Ada perbedaan hasil rata-rata antara makanan 1,2 dan 3.