REGRESI LINIER SEDERHANA
Tugas Disusun Untuk Memenuhi Tugas Analisis Regresi Disusun Oleh : Zaki Hidayat (3115106662)
PROGRAM STUDI PENDIDIKAN MATEMATIKA NON REGULER 2010 JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS NEGERI JAKARTA JAKARTA 2013
A. PENDAHULUAN Dalam mengolah data si peneliti akan selalu berkepentingan menentukan hubungan antara dua atau lebih peubah. Hubungan tersebut mungkin renggang, seperti dalam asosiasi, atau mungkin pula erat. Pada satu pihak, dua peubah mungkin bebas satu sama lain. Dalam keadaan seperti itu, korelasinya nol. Pada pihak yang lain, kedua peubah bergantung sepenuhnya pada yang lain. Bila hubungan kedua peubah tersebut linier (keduanya disebut kolinier) maka harga mutlak korelasinya satu. Dalam asosiasi kita hanya memasangkan nilai x dengan nilai y tanpa
mempersoalkan
bentuk
hubungan
tersebut.
Hubungan
seperti ini merupakan yang terlemah. Dalam penelitian, orang biasa bekerja menggunakan model, suatu hubungan fungsional antara peubah. Dengan model itu kita berusaha memahami, menerangkan, mengendalikan dan kemudian memprediksikan kelakuan sistem yang kita teliti. Di sini digunakan istilah memprediksi dan bukan meramalkan. Prediksi mempunyai arti yang khusus, yaitu inter atau ekstrapolasi. Model juga menolong peneliti dalam menentukan hubungan kausal (sebab akibat) antara dua atau lebih peubah. Secara umum, model merupakan penyederhanaan dan abstraksi dari keadaan alam yang sesungguhnya. Keadaan alam yang ingin diteliti biasanya amat rumit dan kemampuan kita menelitinya secara
keseluruhan
menyederhanakannya
amat sesuai
terbatas, dengan
karena
itu
kemampuan
kita akal
perlu kita
menghadapinya. Dari pengalaman di masa lalu atau dari dugaan mengenai hubungan antara peubah dalam sistem yang diteliti, dirumuskan perkiraan kelakuan sistem tersebut dalam berbagai situasi. Si peneliti mengharapkan bahwa model tersebut merupakan
teori tentang cara kerja sistem yang dia teliti. Rumusan hubungan tersebut yang selanjutnya dinyatakan dalam bentuk hipotesis, seterusnya di uji berdasarkan data statistik yang dikumpulkan kemudian. Pendekatan seperti ini sering disebut bersifat induksi, sebagai lawan dari yang bersifat aksioma (deduksi). Model yang dibicarakan di sini akan selalu berbentuk fungsi dan regresi merupakan alat yang ampuh dalam pembentukannya. Analisis regresi yang akan dibahas di sini, yaitu analisis regresi sederhana. Dimana, analisis regresi linier sederhana yaitu berfungsi untuk mengetahui hubungan linier antara dua variabel, satu variabel dependen dan satu variabel independen. Dalam regresi linier sederhana, metode yang biasa digunakan dalam mengestimasi parameter regresi adalah metode kuadrat terkecil atau Ordinary Least Squares (OLS). Konsep metode ini adalah untuk mengestimasi parameter dengan memilih garis regresi yang terdekat dengan garis dari semua data. Secara matematika
penentuan
parameter
regresi
ini
dengan
cara
meminimumkan jumlah kuadrat dari residualnya (Walpole dan Myers, 1986). B. TUJUAN Tujuan menggunakan analisis regresi linier sederhana ialah 1. Untuk mengetahui asumsi yang digunakan dalam regresi linier sederhana 2. Untuk memprediksikan nilai variabel regresi 3. Untuk mengetahui ditolak atau diterima H0 dengan uji hipotesis. C. PEMBAHASAN
1. ASUMSI LINIER REGRESI SEDERHANA Regresi linear sederhana didasarkan pada asumsi uji, diantaranya sebagai berikut : a. Uji Normalitas. Uji normalitas adalah untuk melihat apakah nilai residual terdistribusi normal atau tidak. Model regresi yang baik adalah memiliki nilai residual yang terdistribusi normal. Jadi uji normalitas bukan dilakukan pada masing-masing variabel tetapi pada nilai residualnya. Sering terjadi kesalahan yang jamak yaitu bahwa uji normalitas dilakukan pada masing-masing variabel. Hal ini tidak dilarang tetapi model regresi memerlukan normalitas pada nilai residualnya bukan pada masing-masing variabel penelitian. Pengertian normal secara sederhana dapat dianalogikan dengan sebuah kelas. Dalam kelas siswa yang bodoh sekali dan pandai sekali jumlahnya hanya sedikit dan sebagian besar berada pada kategori sedang atau rata-rata. Jika kelas tersebut bodoh semua maka tidak normal, atau sekolah luar biasa. Dan sebaliknya jika suatu kelas banyak yang pandai maka kelas tersebut tidak normal atau merupakan kelas unggulan. Pengamatan data yang normal akan memberikan nilai ekstrim rendah dan ekstrim tinggi yang sedikit dan kebanyakan mengumpul di tengah. Demikian juga nilai rata-rata, modus dan median relatif dekat. Uji normalitas dapat dilakukan dengan uji histogram, uji normal P Plot, uji Chi Square, Skewness dan Kurtosis atau uji Kolmogorov Smirnov. Tidak ada metode yang paling baik atau paling tepat. Tipsnya adalah bahwa pengujian dengan metode grafik sering menimbulkan perbedaan persepsi di antara beberapa pengamat, sehingga penggunaan uji normalitas dengan uji statistik bebas dari
keragu-raguan, meskipun tidak ada jaminan bahwa pengujian dengan uji statistik lebih baik dari pada pengujian dengan metode grafik. Jika residual tidak normal tetapi dekat dengan nilai kritis (misalnya signifikansi Kolmogorov Smirnov sebesar 0,049) maka dapat dicoba dengan metode lain yang mungkin memberikan justifikasi normal. Tetapi jika jauh dari nilai normal, maka dapat dilakukan beberapa langkah yaitu: melakukan transformasi data, melakukan trimming data outliers atau menambah data observasi. Transformasi dapat dilakukan ke dalam bentuk Logaritma natural, akar kuadrat, inverse, atau bentuk yang lain tergantung dari bentuk kurva normalnya, apakah condong ke kiri, ke kanan, mengumpul di tengah
atau
menyebar
ke
samping
kanan
dan
kiri.
b. Uji Multikolinearitas. Uji multikolinearitas adalah untuk melihat ada atau tidaknya korelasi yang tinggi antara variabel-variabel bebas dalam suatu model regresi linear berganda. Jika ada korelasi yang tinggi di antara variabel-variabel bebasnya, maka hubungan antara variabel bebas terhadap variabel terikatnya menjadi terganggu. Sebagai ilustrasi, adalah model regresi dengan variabel bebasnya motivasi, kepemimpinan dan kepuasan kerja dengan variabel terikatnya adalah kinerja. Logika sederhananya adalah bahwa model tersebut untuk mencari pengaruh antara motivasi, kepemimpinan dan kepuasan kerja terhadap kinerja. Jadi tidak boleh ada korelasi yang tinggi antara motivasi dengan kepemimpinan, motivasi dengan kepuasan kerja atau antara kepemimpinan dengan kepuasan kerja.
Alat statistik yang sering dipergunakan untuk menguji gangguan multikolinearitas adalah dengan variance inflation factor (VIF), korelasi pearson antara variabel-variabel bebas, atau dengan melihat eigenvalues dan condition index (CI). Beberapa
alternatif
cara
untuk
mengatasi
masalah
multikolinearitas adalah sebagai berikut: •
Mengganti atau mengeluarkan variabel yang mempunyai korelasi yang tinggi.
•
Menambah jumlah observasi.
•
Mentransformasikan
data
ke
dalam
bentuk
lain,
misalnya
logaritma natural, akar kuadrat atau bentuk first difference delta. •
Dalam tingkat lanjut dapat digunakan metode regresi bayessian yang masih jarang sekali digunakan.
c. Uji Heteroskeditas. Uji heteroskedastisitas adalah untuk melihat apakah terdapat ketidaksamaan varians dari residual satu ke pengamatan ke pengamatan yang lain. Model regresi yang memenuhi persyaratan adalah di mana terdapat kesamaan varians dari residual satu pengamatan
ke
pengamatan
yang
lain
tetap
atau
disebut
homoskedastisitas. Deteksi heteroskedastisitas dapat dilakukan dengan metode scatter plot dengan memplotkan nilai ZPRED (nilai prediksi) dengan SRESID (nilai residualnya). Model yang baik didapatkan jika tidak terdapat pola tertentu pada grafik, seperti mengumpul di tengah, menyempit kemudian melebar atau sebaliknya melebar kemudian
menyempit. Uji statistik yang dapat digunakan adalah uji Glejser, uji Park atau uji White. Beberapa
alternatif
solusi
jika
model
menyalahi
asumsi
heteroskedastisitas adalah dengan mentransformasikan ke dalam bentuk logaritma, yang hanya dapat dilakukan jika semua data bernilai positif. Atau dapat juga dilakukan dengan membagi semua variabel
dengan
variabel
yang
mengalami
gangguan
heteroskedastisitas. d. Uji Autokorelasi. Uji autokorelasi adalah untuk melihat apakah terjadi korelasi antara suatu periode t dengan periode sebelumnya (t -1). Secara sederhana adalah bahwa analisis regresi adalah untuk melihat pengaruh antara variabel bebas terhadap variabel terikat, jadi tidak boleh
ada
korelasi
antara
observasi
dengan data
observasi
sebelumnya. Sebagai contoh adalah pengaruh antara tingkat inflasi bulanan terhadap nilai tukar rupiah terhadap dollar. Data tingkat inflasi pada bulan tertentu, katakanlah bulan Februari, akan dipengaruhi oleh tingkat inflasi bulan Januari. Berarti terdapat gangguan
autokorelasi
pada
model
tersebut.
Contoh
lain,
pengeluaran rutin dalam suatu rumah tangga. Ketika pada bulan Januari suatu keluarga mengeluarkan belanja bulanan yang relatif tinggi, maka tanpa ada pengaruh dari apapun, pengeluaran pada bulan Februari akan rendah. Uji autokorelasi hanya dilakukan pada data time series (runtut waktu) dan tidak perlu dilakukan pada data cross section seperti pada kuesioner di mana pengukuran semua variabel dilakukan secara serempak pada saat yang bersamaan. Model regresi pada
penelitian di Bursa Efek Indonesia di mana periodenya lebih dari satu tahun biasanya memerlukan uji autokorelasi. Beberapa uji statistik yang sering dipergunakan adalah uji Durbin-Watson, uji dengan Run Test dan jika data observasi di atas 100 data sebaiknya menggunakan uji Lagrange Multiplier. Beberapa cara untuk menanggulangi masalah autokorelasi adalah dengan mentransformasikan data atau bisa juga dengan mengubah model regresi ke dalam bentuk persamaan beda umum (generalized difference equation). Selain itu juga dapat dilakukan dengan memasukkan variabel lag dari variabel terikatnya menjadi salah satu variabel bebas, sehingga data observasi menjadi berkurang. e. Uji Linearitas. Uji linearitas dipergunakan untuk melihat apakah model yang dibangun mempunyai hubungan linear atau tidak. Uji ini jarang digunakan pada berbagai penelitian, karena biasanya model dibentuk berdasarkan telaah teoretis bahwa hubungan antara variabel bebas dengan variabel terikatnya adalah linear. Hubungan antar variabel yang secara teori bukan merupakan hubungan linear sebenarnya sudah tidak dapat dianalisis dengan regresi linear, misalnya masalah elastisitas. Jika ada hubungan antara dua variabel yang belum diketahui apakah linear atau tidak, uji linearitas tidak dapat digunakan untuk memberikan adjustment bahwa hubungan tersebut bersifat linear atau tidak. Uji linearitas digunakan untuk mengkonfirmasikan apakah sifat linear antara dua variabel yang diidentifikasikan secara teori sesuai atau tidak dengan hasil observasi yang ada. Uji
linearitas dapat menggunakan uji Durbin-Watson, Ramsey Test atau uji Lagrange Multiplier. 2. METODE KUADRAT TERKECIL Misalkan
untuk menentukan koefisien regresi
sedemikian sehingga
minimum.
dan
berubah bila garis regresinya berubah. Ini
berarti kita haru mencari turunan J terhadap terhadap
.
Terhadap
menjadi
Terhadap
menjadi
Kemudian
dan
Sehingga menjadi
Dan
dan turunan
diganti dengan taksirannya yaitu
dan .
Diketahui
dan
sehingga persamaan diatas
dapat ditulis
dan bagian kedua menjadi
Sehingga dapat disederhanakan menjadi
Taksiran persamaan regresi dapat ditulis
Contoh soal : Data berikut adalah nilai rapor Zaki pada bidang studi Fisika (X) dan Kimia (Y), Selama 6 semester : Fisika (X) 70 88 73 80 75 85
Kimia (Y) 80 87 90 93 90 95
a. Tentukan persamaan garis regresi linear pada data tersebut b. Taksirlah nilai Kimia yang didapatkan oleh Zaki, bila ia mendapatkan nilai Fisika di rapor adalah 77 Jawaban : a. Buatlah tabel : X 70 88 73 80 75 85 ƩX = 471
Y 80 87 90 93 90 95 ƩY = 535
X2 4900 7744 5329 6400 5625 7225 ƩX2 = 37223
XY 5600 7656 6570 7440 6750 8075 ƩXY = 42091
n n n n n n∑ xi yi − ∑ xi ÷ ∑ yi ÷ i =1 i =1 i =1 y − b xi ∑ ∑ i b= dan 2 i =1 i =1 n n a= n∑ xi 2 − ∑ xi ÷ n i =1 i =1 ( 6 ) ( 42091) − ( 471) ( 535 ) = 0,374 535 − ( 0,374 ) ( 471) b= dan a = = 59,807 2 6 ( 37223) − 471 6
(
)
Jadi Persamaan garis regresinya adalah : yˆ = 59,807 + 0,374 x b. Nilai prediksi kimia zaki yang didapatkan adalah yˆ = 59,807 + ( 0,374 ) ( 77 ) = 88, 605 ≈ 89 3. UJI HIPOTESIS PARAMETER REGRESI Uji ini digunakan untuk mengetahui apakah variabel independen (X) berpengaruh secara signifikan terhadap variabel dependen (Y). Signifikan berarti pengaruh yang terjadi dapat berlaku untuk populasi (dapat digeneralisasikan).
Untuk menguji hipotesis nol (H0) bahwa β = 0 lawan suatu tandingan yang sesuai dengan persoalan, kembali digunakan distribusi-t dengan derajat kebebasan
n-2 untuk mendapatkan
suatu daerah kritis dan kemudian mendasarkan keputusan atas nilai thit =
s=
b
dimana :
s / J xx
J yy − bJ xy n−2
s = jumlah tak bias b = gradien persamaan regresi linier n = jumlah populasi Jxx, Jxy, Jyy adalah simpangan kuadrat n
J xx = S xx = ∑ ( xi − x )
2
i =1
1 n = ∑ x i − ∑ xi n i =1 i =1 n
2
n n 1 n J yy = S yy = ∑ ( y i − y ) = ∑ y 2i − ∑ y i n i =1 i =1 i =1
n
n
i=1
i=1
2
2
J xy = S xy = ∑ ( xi − x )( yi − y ) = ∑ xi yi −
2
1 n n ∑ xi ∑ y i n i=1 i=1
Jika harga mutlak t-hitung lebih besar dari t tabel, maka tolak H 0 Contoh soal : Dengan memperhatikan tabel pada contoh sebelumnya, ujilah hipotesis bahwa β = 0 pada taraf keberartian 0,05 lawan tandingan bahwa β ≠ 0. Jawab : 2
1 n J xx = ∑ xi − ∑ xi ÷ n i =1 i =1 n
2
= 37223 −
4712 = 249,5 6
2
1 n J yy = ∑ yi − ∑ yi ÷ n i =1 i =1 n
2
= 47843 −
5352 = 138,333 6
n 1 n n J xy = ∑ xi yi − ∑ xi ÷ ∑ yi ÷ n i =1 i =1 i =1 ( 471) ( 535 ) = 93,5 = 42091 − 6
Simpangan bakunya J yy − bJ xy s= n−2 =
138,333 − ( 0,374 ) ( 93,5 ) 6−2
= 5, 083
Proses Uji hipotesis : 1. 2. 3. 4. 5. thit = =
H0 : β = 0 H1 : β ≠ 0 Taraf keberartian 0,05 T-tabel 2,776 Cari t-hitung : b
s / J xx
0,374 = 1, 617 ( 5, 083) / 249,5 6. Karena harga mutlak t-hitung lebih kecil dari t-tabel, maka dapat disimpulkan terima H0
RANGKUMAN 1. Pengujian estimasi dan hipotesis membentuk dua cabang utama statistika klasik. 2. Terdapata lima asumsi dalam regresi linier sederhana yaitu dengan
asumsi
uji
normalitas,
heteroskeditas,
linieritas,
autokorelasi dan multikolinearitas 3. Yang mendasari pendekatan interval kepercayaan adalah konsep dari estimasi interval. Sebuah estimasi interval adalah sebuah interval atau jarak yang dibentuk dengan memilki probabilitas yang telah dibentuk, termasuk mencakup batasan dari nilai parameter yang tidak diketahui. 4. Dalam prosedur pengujian signifikansi, seseorang menyusun sebuah pengujian statistik dan memeriksa distribusi sampling dibawah hipotesis nol.
TES FORMATIF 1. Diketahui data di bawah ini, carilah persamaan regresinya 1 2 3 4 5
2 1 4 5 3
2 1 4 5 3 15
2 2 12 20 15 51
Jawab : 1 2 3 4 5 15
1 4 9 16 25 55
Jadi persamaan regresinya 2. Berdasarkan data diatas, tentukan apakah variabel x mempengaruhi variabel y ( H0 : β = 0, taraf keberartian 0,05 lawan tandingannya β ≠ 0 )
2
1 n J xx = ∑ xi − ∑ xi ÷ n i =1 i =1 n
2
= 55 −
152 = 10 5 2
1 n J yy = ∑ yi − ∑ yi ÷ n i =1 i =1 n
2
= 55 −
152 = 10 5
n 1 n n J xy = ∑ xi yi − ∑ xi ÷ ∑ yi ÷ n i =1 i =1 i =1 ( 15 ) ( 15) = 6 = 51 − 5
Simpangan bakunya J yy − bJ xy s= n−2 =
10 − ( 0, 6 ) ( 6 ) 5−2
= 1, 460
Proses Uji hipotesis : 1. 2. 3. 4. 5. thit = =
H0 : β = 0 H1 : β ≠ 0 Taraf keberartian 0,05 T-tabel 3,182 Cari t-hitung : b
s / J xx
0, 6 = 1, 299 ( 1, 460 ) 10 6. Karena harga mutlak t-hitung lebih kecil dari t-tabel, maka dapat disimpulkan terima H0 maka tidak ada pengaruh antara variabel x dengan variabel y.
3. Nilai 9 murid dari suatu kelas pada ujian tengah semester (x) dan pada ujian akhir (y) sebagai berikut. X Y
77 50 71 72 82 66 78 34 Taksirlah garis regresi linear.
81 47
94 85
96 99
99 99
67 68
Jawab : X 77 50 71 72 81 94 96 99 67 ƩX = 707
Y 82 66 78 34 47 85 99 99 68 ƩY = 658
XY 6314 3300 5538 2448 3807 7990 9504 9801 4556 ƩXY = 53258
X2 5929 2500 5041 5184 6561 8836 9216 9801 4489 2 ƩX = 57557
n n n n n n∑ xi yi − ∑ xi ÷ ∑ yi ÷ i =1 i =1 i =1 y − b xi ∑ ∑ i b= dan 2 i =1 i =1 n n a= n∑ xi 2 − ∑ xi ÷ n i =1 i =1 ( 9 ) ( 53258) − ( 707 ) ( 568 ) = 0, 777 658 − ( 0, 777 ) ( 707 ) b= dan a = = 12, 062 2 9 ( 57557 ) − 707 6
(
)
Jadi Persamaan garis regresinya adalah : yˆ = 12, 062 + 0, 777 x
DAFTAR PUSTAKA Aunuddin. 2005. Rancangan dan Analisis Data. Bogor : IPB Press. (Hal. 108-110 , 171-202) Jonathan Sarwono. Regresi Linear Sederhana http://www.jonathansarwono.info/regresi/regresi.htm. (online) ( diakses 16 Februari 2013) Kismiantini. Handout Analisis Regresi. (online). http//staff.uny.ac.id/sites/default/files/Handout %20Analisis%20Regresi.pdf (diakses 25 September 2012) Sembiring, S.K. 1995. Analisis Regresi. Bandung : Penerbit ITB. (Hal. 35-90) Uswatun Khasanah. Regresi Linear Sederhana. (online). http//elearning.uad.ac.id/file.php/kuliah1.ppt (diakses 16 Februari
2013) Walpole, Ronald E. Dan Myers, Raymond H. 1995 Ilmu Peluang dan Statistika untuk Insinyur dan Ilmuwan, Edisi 4, Bandung: Penerbit ITB ( hal. 421 – 423)