REGRESI DAN KORELASI SEDERHANA
STATISKA DESKRIPTIF Semester III Rahmat Darmawan Muhammad Yansilu Aksan R. Abdullah Dennies Rossi Bumulo Radovan Eshakas
Pendahuluan Analisa pasangan Variabel mumbutuhkan data yang terdiri dari 2 kelompok hasil ovservasi atau pengukuran. Data yang dapat diperoleh dari berbagai bidang kegiatan yang menghasilkan pasangan observasi sebanyak n, dinyatakan sebagai (x; y). Di dalam penelitian ilmiah, selain ingin menunjukkan hubungan antara dua variabel atau lebih dan mengukur hubungan itu, juga ingin dapat meramalkan sesuatu, yaitu menentukan nilai suatu variabel sesudah mengetahui nilai-nilai variabel yang lain. Untuk dapat meramal harus diketahui dulu hubungan antara variabel-variabel itu. Yang berhubungan dengan peramalan dan kesalahan peramalan, dinamakan proses regresi. Sedangkan pengukuran hubungan antara variabel, dinamakan proses korelasi.
Defenisi : “Regresi dan korelasi sederhana adalah suatu cara untuk mengetahui hubungan antara satu variabel dengan satu variabel yang lain”
Regresi dan korelasi digunakan untuk mempelajari pola dan mengukur hubungan statistik antara dua atau lebih variabel. Jika digunakan hanya dua variabel disebut regresi dan korelasi sederhana. Jika digunakan lebih dari dua variabel disebut regresi dan korelasi berganda.
Variabel yang akan diduga disebut variabel terikat (tidak bebas) atau dependent variable, biasa dinyatakan dengan variabel Y. Variabel yang menerangkan perubahan variable terikat disebut variabel bebas atau independent variable, biasa dinyatakan dengan variabel X. Persamaan regresi (penduga/perkiraan/peramalan) dibentuk untuk menerangkan pola hubungan variabelvariabel. Analisa korelasi digunakan untuk mengukur keeratan hubungan antara variabel-variabel.
Langkah menentukan persamaan hubungan Antara vriabel, 1. Mengumpulkan data dari variabel yang dibutuhkan misalnya X sebagai variabel bebas dan Y sebagai variabel tidak bebas. 2. Menggambarkan titik-titik pasangan (x,y) dalam sebuah sistem koordinat bidang. Hasil dari gambar itu disebut SCATTER DIAGRAM (Diagram Pencar/Tebaran) dimana dapat dibayangkan bentuk kurva halus yang sesuai dengan data. 3. Dari diagaram pencar dapat ditarik suatu garis menggambarkan nilai rata-rata y terhadap x, sehingga diperoleh persamaan garis regresi. Fungsi Diagram Pencar 1. Membantu Menunjukan apakah terdapat hubungan yang bermanfaat antara dua variabel. 2. Membantu menetapkan tipe persamaan yang menunjukkan hubungan antara kedua variabel tersebut.
3. Menentukan persamaan garis regresi atau mencari nilai-nilai konstan.
Gambar Scatter Diagram
Gambar Scratter Diagram dengan Garis lengkung
Gambar Scatter Diagram dengan garis Linear Biasanya yang sering digunakan dan mudah untuk perhitungan, digunakan persamaan garis linear dari Scatter Diagram dengan garis lurus seperti di atas. Analisa Regresi Sederhana
Persamaan garis regresi linier sederhana untuk sampel : y = a + bx , yang diperoleh dengan menggunakan Metode Kuadrat Terkecil. Bila diberikan data sampel {(xi, yi); i = 1, 2, …, n} maka nilai dugaan kuadrat terkecil bagi parameter dalam garis regresi : y = a + bx Dimana : y = rata-rata populasi Y terhadap X A = jarak antara 0 dengan sumbu Y Bx = Koefesien regresi / kemiringan Dapat diperoleh dari rumus sebagai berikut : b
= n ∑x y - ∑x . ∑y n∑x2 – (∑x)2 ӯ = ∑y n
x
= ∑x n = ӯ - bӿ
a
Keterangan : Y = nilai yang diukur atau dihitung pada variabel tidak bebas X = nilai tertentu dari variabel bebas a = intersep/ perpotongan garis regresi dengan sumbu y b = koefisien regres atau untuk mengukur kenaikan atau penurunan y untuk setiap perubahan satu-satuan x atau untuk mengukur besarnya pengaruh x terhadap y kalau x naik satu unit dengan prinsip kuadrat minimum (principle of least squares), dapat dibuat suatu garis lurus yang memiliki “kesesuaian terbaik”, yaitu pilih sebuah garis dengan “kesesuaian terbaik” yang meminimumkan jumlah kuadrat penyimpangan nilai yang diamati dengan yang diramalkan. Atau meminimumkan : n SSE = ∑ (Y1 – ӯ1) i=1 Istilah SSE menyatakan jumlah Kuadrat penyimpangan, yang biasa disebut jumlah kuadrat kesalahan (sum of squares for error). Kalau disubstitusikan rumus persamaan garis regresi dalam rumus SSE, maka : n SSE = ∑ [Y1 – (a+b1x1)]2 i=1
Analisa Korelasi Sederhana
ANALISA KORELASI digunakan untuk mengukur kekuatan keeratan hubungan antara dua variabel melalui sebuah bilangan yang disebut koefisien korelasi.
Koefisien korelasi linier ( r ) adalah ukuran hubungan linier antara dua variabel/peubah acak X dan Y untuk mengukur sejauh mana titik-titik menggerombol sekitar sebuah garis lurus regresi.
Jika b positif maka r postif sedangkan jika b negatif maka r negatif.
Nilai r terletak dari –1 sampai +1 atau ditulis –1£ r £+1 Bila r mendekati +1 dan –1 maka terjadi korelasi tinggi dan terjadi hubungan linier yang sempurna antara X dan Y. Bila r mendekati 0 hubungan liniernya sangat lemah atau tidak ada. Misalnya:
Koefisien Determinasi ( r2 ) nilainya antara 0 dan 1 untuk menyatakan proporsi keragaman total nilai-nilai peubah Y yang dapat dijelaskan oleh nilai-nilai peubah X melalui hubungan linier tersebut Contoh : r = 0,6 artinya 0,36 atau 36 % diantara keragaman total nilai-nilai Y dapat dijelaskan oleh hubungan liniernya dengan nilai-nilai X. atau Besarnya sumbangan X terhadap naik turunnya Y adalah 36 % sedangkan 64 % disebabkan oleh faktor lain. Contoh : Pengeluaran untuk konsumsi rumah tangga berkaitan dengan pendapatan rumah tangga. Data yang diperoleh sebagai berikut : Pendapatan X 18 23 28 32 41 59 86 99 Pengeluaran (Y) 17 20 23 27 32 46 63 74 Dalam 10 ribu rupiah per bulan. a). Buatlah diagram pencarnya. b). Tentukan persamaan regresinya. c). Perkirakanlah besarnya pengeluaran untuk konsumsi jika pendapatannya Rp. 950.000,00 d). Koefisien Korelasi ( r ).
e). Koefisien Determinasi (r2). Sebuah penelitian dilakukan oleh seorang pedagang eceran untuk menentukan hubungan antara biaya pemasangan iklan per minggu dan hasil penjualannya. Data yang diperoleh adalah sebagai berikut : a). Buatlah diagram pencarnya. b). Tentukan persamaan regresinya. c). Perkirakanlah besarnya penjualan mingguan jika pengeluaran untuk iklan sebesar 35. d). Koefisien korelasi (r ) e). Koefisien determinasi (r2). Biaya Iklan Penjualan
40 20 25 20 30 50 40 20 50 40 25 50 385 400 395 365 475 440 490 420 560 525 480 510
Menentukan Persamaan Regresi dan Koefisien Korelasi Sederhana antara dua variabel dengan SPS Menentukan persamaan regresi dan koefisien korelasi sederhana antara dua variabel dengan Excel 2013 Regresi Langkah-langkahnya: 1. Ketik data X pada kolom A dan data Y pada kolom B 2. Pilih Data pada menu utama 3. Pilih Data Analysis 4. Pilih Regression 5. Klik OK Setelah muncul kotak dialog Pada input Y range , sorot pada range B2:B7 Pada input X range, sorot pada range A2:A7 Pada output range, ketik D2 Klik OK
Korelasi (dengan excel 2013) Langkah-langkahnya: 1. Pilih Data pada menu utama 2. Pilih Data analysis 3. Pilih Correlation 4. Klik OK Setelah muncul kotak dialog Pada Input Range, sorot pada range A2:B7 Pada Output Range, ketik D2 Klik OK Nilai koefisien korelasi ( r2 ) antara variabel X dan Y adalah 0,93505
Menentukan persamaan regresi dan koefisien korelasi sederhana antara dua variabel dengan SPSS Langkah-langkahnya: 1. Klik Analyze 2. Klik regressi, pilih Linear 3. Klik variabel x lalu masukkan pada kotak Independent 4. Klik variabel y lalu masukkan pada kotak Dependent 5. Klik Statistics, pilih Estimates, Model fit, Descriptive 6. Klik Continue 7. Klik Plot, lalu masukkan Dependent kekotak Y axis. 8. Kilk Continue 9. Klik Save , pada Predicted value anda pilih Unstandardized 10. Klik Continue 11. Klik OK
Pearson Correlation Sig. (1-tailed) N
Model 1 Regession Residual Total
Model 1
Sum Of Squares 78.251 11.249 89.500
Correlations Penjualan Biaya Iklan Penjualan Biaya iklan Penjualan Biaya Iklan
1.000 .935 .003 6 6
ANOVAb df Mean Square 1 4 5
F
.935 1.000 .003 6 6
Sig.
78.251 27.826 2.812
Model Summaryb R R Square Adjusted R Std. Error of the Square Estimate a .935 .874 .843 1.68
a. Predictors: (Constant), biaya iklan b. Dependent Variable: penjualan
.006a
Contoh Soal : Diketahui 2 kelompok data : Kelompok data pertama : 7, 4, 10, 9, 15, 12, 12, 7, 9, 7 Kelompok data kedua : 8, 11, 4, 3, 2, 5, 10, 6, 4, 1, 10, 8, 12, 6, 5, 7 1. Simpangan rata-ratanya........ JAWAB : Untuk kelompok data pertama Urutan data : 4, 7, 7, 7, 9, 9, 10, 12, 12, 15 ̅= SR = ∑
̅│
=
│+
+
+
+
+
+
+
+
=
. 5,2 + 2,2 +2,2 + 2,2 + 0,2 + 0,2 + 0,8 + 2,8 + 2,8 + 5,8
=
. 24,4
= 2,44 Untuk kelompok data ke-dua Urutan data : 1, 2, 3,4, 4, 5, 5, 6, 6, 7, 8, 8, 10, 10 , 11, 12 ̅= SR
=
∑
̅│ │+ │+ │+
│+ │+ │+
│+ │+ │+
│+ │+ │+
│+ │+ │+
│
=
. 5,375 +4,375 +3,375 +2,375 +2,375 +1,375 +1,375 +0,375 +0,375 +0,625 +1,625 +1,625 +3,625 +3,625 +4,625 +5,625
=
.42.75 = 2,67
2. Variansinya….. JAWAB : Untuk kelompok data pertama
S2
∑
=
̅ )2 )2 +
=
)2 +
+
)2 + )2 +
)2 +
)2 +
)2 +
)2
)2 +
)2
= . -5,22+ -2,22 +-2,22 + -2,22 + 0,22 + 0,22 + 0,82 + 2,82 + 2,82 + 5,82 = . 27,04 + 4.84 +4.84 + 4.84 + 0,04 + 0,04 + 0,64 + 7,84 + 7,84 + 33,64 = . 91,6 = 10, 178
Untuk kelompok data ke-dua S2
∑
=
̅ )2 )2 +
=
=
+
)2 +
+
)2 +
+
)2
)2 + )2 + )2 +
)2 + )2 + )2 +
)2 +
)2
)2 +
)2
)2 +
)2
. -5,3752 + -4,3752 + -3,3752 + -2,3752 + -2,3752 + -1,3752 + -1,3752 +0,3752 +0,3752 +0,6252 +1,6252 +1,6252 +3,6252 +3,6252 +4,6252 +5,6252
=
. 28,89 + 19,14 + 11,39 + 56,4 + 56,4 + 1,89 + 1,89 + 0,14 + 0,14 + 0,39 + 2,64 + 2,64 + 13.14 + 13.14 + 21,39 + 31,64
=
. 261,26 = 17,417
3. Standard deviasinya……. JAWAB : Untuk kelompok data pertama S=√
=√
= 3,19
Untuk kelompok data ke-dua S=√
=√
= 4,17
Diketahui data sebagai berikut : 30, 50, 45, 55, 40, 65, 70, 60, 80, 35, 85, 95,100 1. Nilai Q1………… JAWAB : Urutan data : 30, 35, 40, 45, 50, 55, 60, 65, 70, 80, 85, 95, 100 Letak Qi
=
Letak Q1
=
Q1
) )
=
)
=
= X3 + 0,5 ( X4 – X3) = 40 + 0,5 (45-40) = 40 + 0,5 . 5 = 40 + 2,5 = 42,5
2. Jangkauan kuartilnya……. JAWAB : Letak Qi
=
Letak Q3
=
Q3
) )
=
= X10 + 0,5 ( X11 – X10) = 80 + 0,5 (85-80) = 80 + 0,5 . 5 = 80 + 2,5 = 82,5
JK = (Q3-Q1) JK = (82,5 - 42,5) = . 40 = 20
)
=
Diketahui data sebagai berikut : 8, 11, 4, 3, 2, 5, 10, 6, 4, 1, 10, 8, 12, 6, 5, 7 Tentukan ukuran penyimpangan Urutan data : 1, 2, 3,4, 4, 5, 5, 6, 6, 7, 8, 8, 10, 10 , 11, 12 Jangkauan (Range) R
= Xmax - Xmin = 12 – 1 = 11
Simpangan Rata-rata (Mean Deviation) ̅= SR =
∑
̅│ │+
│+
│+
│+
│+
│+
│+
│+
│+
│+
│+
│+
│+
│+
│+
│ =
. 5,375 + 4,375 + 3,375 + 2,375 + 2,375 + 1,375 + 1,375 + 0,375 +0,375 + 0,625 + 1,625 + 1,625 + 3,625 + 3,625 + 4,625 + 5,625
=
.42,75
= 2,67
Variansi (Variance) S2
∑
=
̅ )2 )2 +
=
=
+
)2 +
+
)2 +
+
)2
)2 + )2 + )2 +
)2 + )2 + )2 +
)2 +
)2
)2 +
)2
)2 +
)2
. -5,3752 + -4,3752 + -3,3752 + -2,3752 + -2,3752 + -1,3752 + -1,3752 +0,3752 +0,3752 +0,6252 +1,6252 +1,6252 +3,6252 +3,6252 +4,6252 +5,6252
=
. 28,89 + 19,14 + 11,39 + 56,4 + 56,4 + 1,89 + 1,89 + 0,14 + 0,14 + 0,39 + 2,64 + 2,64 + 13.14 + 13.14 + 21,39 + 31,64
=
. 261,26
= 17,417
Simpangan baku (Standard Deviation) S=√
=√
= 4,17
Jangkauan Kuartil Letak Qi
=
Letak Q1
=
Q1
) )
)
=
=
= X4 + 0,25 ( X5 – X4) = 4 + 0,25 (4-4) =4 )
Letak Q3 = Q3
=
)
=
= X12 + 0,75 ( X13 – X12) = 12 + 0,75 (10-8) = 12 + 0,75 . 2 = 12 – 1.5 = 10,5
JK
= (Q3 - Q1)
JK
=
(10,5-4)
= . 6,5 = 3,25
Jangkauan Persentil )
Pi
=
P10
= Letak =
)
=
= 1,7= 1 + 0,7
P10
= X1 + 0,7(X2-X1) = 1 + 0,7 (2-1) = 1 + 0,7 = 1,7
= Letak =
P90
= X15 + 0,3(X16-X15) = 11 + 0,3 (12-11) = 11 + 0,3 = 11,3
JP10-90
= P90 - P10 = 11,3-1,7
= 9,6
)
P90
=
= 15,3 = 15 + 0,3