4.1 beberapa ide tentang perkiraan interval
Bagian yang penting dalam ilmu statistik adalah statistik induktif atau statistical inference. Statistic induktif mencakup dua hal pokok, yakni teori estimasi dan pengujian hipotesis. Teori perkiraan terdirir dari dua hal penting. Yaitu perkiraan tunggal dan perkiraan interval. Perkiraan tunggal mengenai koefisien regresi, koefisien korelasi dan varian sudah dibahas panjang lebar dengan menggunakan metode kuadrat terkecil sederhana (OLS) dan juga disinggung sedikit mengenai metode maximum likelihood (ML). Dalam bab ini akan dibahas mengenai perkiraan interval dan pengujian hipotesis , baik mengenai koefisien-koefisien, individu dan nilai harapan Y, maupun varian kesalahan pengganggu. pen gganggu. Untuk membahas ide dasar perkiraan interval, perkiraan koefisien regresi , ini artinya kalau upah karyawan naik 1 unit, maka konsumsi karyawan naik 0,8556 kali. Jadi seandainya upah karyawan naik Rp 1.000,00 maka diperkirakan konsumsi karyawan akan naik Rp 855,60. Menurut Keynes, kenaikan konsumsi selalu lebih kecil dari kenaikan pendapatan (karena upah merupakan satu-satunya pendapatan), hal itu dinyatakan dalam konsep MPC ( marginal propensity to consume). consume). Nilai b= 0,8556 ini merupakan perkiraan tunggal parameter B, yaitu koefisien regresi sebenarnya (Yi = A + BXi +
) . khusus dalam hal ini, kalau i
X=pendapatan dan Y= konsumsi, koefisien regresi merupakan MPC. Pertanyaan yang timbul : seberapa juga perkiraan b ini dapat dipercaya ? Karena adanya fluktuasi sampling, perkiraan tunggal ini akan berbeda dengan nilai sebenarnya (B), walaupun dalam sampling yang diulang, nilai ratarata b akan sama dengan nilai B sebab b pemerkira tidak bias. Dalam statistika, tingkat kepercayaan (reliability (reliability)) pemerkira tunggal diukur oleh standar eror atau variannya. Maka, daripada percaya pada perkiraan tunggal saja, kita mungkin lebih baik kalau memberikan pernyataan probabilitas, bahwa pemerkira tunggal tersebut terletak dalam suatu interval disekitar nilai parameternya (b akan terletak disekitar B), sejauh 1,2 atau 3 standard erornya. Jadi, perkiraan interval bebarti kita mengharapkan bahwa nilai B yang sebernarnya itu akan terletak dalam suatu interval (dengan nilai batas bawah dan batas atas) dengan tingkat keyakinan
tertentu, katakanlah 95% Inilah yang merupakan ide dasar di belakang perkiraan interval tersebut. Untuk lebih jelasnya, anggap bahwa kita akan mencari kenyataan betapa dekatnya nilai b tersebut dengan B. untuk maksud ini, kita mencoba mencoba mencari dua nilai positif, katakan d dan
, dimana nilai alpha terletak diantara 0 dan 1,
sedemikian rupa sehingga probabilitas bahwa interval (b-d, b+d) mencakup nilai
sebenarnya (B) sebesar (1- ) Dengan symbol dapat ditulis : P(b-d
B b+d = 1-
b – d
b+d
(4.1)
confidence interval
batas bawah
batas atas
disebut tingkat nyata/ berarti (level of significance). Di dalam pengujian hipotesis, disebut kesalahan 1-
interval
disebut koefisisen keyakinan/ tingkat keyakinan.
tipe pertama, yaitu kesalahan yang terjadi karena kita menolak hipotesis nol, padahal hipotesis tersebut benar (keputusan yang benar, hipoteisis tersebut harus kita termia). Alpha juga dapat diartikan sebagai besarnya kesalahan yang kita torerir di dalam membuat suatu keputusan. Kalau 1-
= 0,95; = 1-0,95 = 0,05;
ini berarti kita mentorerir kesalahan sebesar 5%. Salah dalam hal ini, berarti interval tidak memuat B lebih kecil dari (b – d) atau lebih besar dari (b+d). kesalahan ini menimbulkan resiko dalam pembuatan keputusan, maka dari itu untuk memperkecil resiko, kesalahan harus dibuat sekecil mungkin. Titik akhir pada interval disebut batas keyakinan (confidende limit) atau nilai kritis (critical (critical value) b – d = batas keyakinan bawah atau nilai batas bawah b + d = batas keyakinan atas atau nilai batas atas
dan (1 – bukan dinyatakan sebagai proporsi, tetapi sebagai presentase, yaitu 100% dan 100(1- dalam praktiknya,
Persamaan (4.1) menunjukkan bahwa suatu pemerkira interval merupakan suatu interval yang dibuat sedemikian rupa sehingga interval tersebut mempunyai nilai probabilitas sebesar (1-
akan memuat nilai parameter B. misalnya kalau
= 0,05 (5%), maka persamaan (4.1) harus dibaca : probabilitas bahwa interval antara ( b – d ) dan ( b + d ) akan memuat nilai B sebesar 0,95 atau 95%. Perkiraan interval memberikan berbagai nilai dalam suatu interval, diharapkan nilai B akan terletak di dalamnya. Kemungkinan tidak memuat ( B terletak di luarnya, B < b-d atau B > b + d ) sebesar s ebesar 5% Perlu diperhatikan beberapa aspek penting tenatang perkiraan interval ini, yaitu sebagai berikut: (1) Persamaan (4.1) tidak berarti bahwa probabilitas parameter B terletak dalam interval yang dibatasi nilai batas bawah dan atas tersebut sebesar (1-
,
katakana 90% atau 95 %. Sebab parameter B, walaupun tidak diketahui nilainya, dianggap mempunyai nilai tetap/konstan (tidak berubah-ubah) bisa terletak dalam interval dan bisa juga tidak. Arti persamaan (4.1) yang sebenarnya ialah bahwa dengan menggunakan metode yang dijelaskan, probabilitas untuk meperoleh suatu interval yang memuat B sebesar (1-
.
Penjelasan lebih lanjut : kalau seluruh sample dari suatu populasi sebanyak k kita hitung perkiraan intervalnya, akan kita peroleh k interval. Apabilak kita tentukan (1-
= 0,95 misalnya, maka setelah kita teliti hasil hitungan kita,
akan diperoleh kurang lebih 95 % dari k interval tersebut memuat parameter
B, selebihnya / sisanya sebanyak 5% tidak memuat B. oleh karena di dalam praktiknya, kita hanya mengambil sampel secara random satu kali saja dari populasi yang bersangkutan, maka kita harapkan dengan tingkat keyakinan sebesar 95%, sampel tersebut akan memuat parameter B.
Perhatikan gambar berikut ini : Setiap titik menunjukkan interval yang dibuat berdasarkan sampel sampel
Ada k interval, karena ada k sampel
.
.
.
....
.
.
Memuat parameter B ..
..
.
..
..
. .
Bagian yang diarsir terdiri dari interval yang tidak memuat B
Bagian yang tidak diarsir terdiri dari interval yang memuat parameter B
Berdasarkan gambar di atas, maka probabilitas untuk memperoleh interval yang memuat B merupakan hasil bagi daerah yang memuat B (tidak diarsir) dengan seluruh daerah :
X 100% = 95% atatu 100(1
%= 95% disebut tingkat keyakinan (confidence level). level).
(2) Interval (4.1) adalah interval acak (random interval) , yang berarti akan berubah dari sampel ke sampel, sebab nilainya tergantung pada b yang berbeda dari sampel satu ke sampel yang lainnya.
Perhatikan gambar berikut :
Sampel 1, interval 1 = I 1
memuat B memuat B
Sampel 2, interval 2 = I 2
tak memuat B memuat B
Sampel 3, interval 3 = I 3
memuat B tak memuat B
Sampel i, interval i = I i
memuat B memuat B
Sampel k, interval k = I k
memuat B tak memuat B
Keterangan : interval yang memotong garis tegak lurus memuat B, sedangkan yang tidak memotong tidak memuat B. Garis tegak lurus tempat letaknya B. ada beberapa interval. (3) Oleh karena confidence interval merupakan acak (random (random), ), pernyataan probabilitas
yang
menyangkut
dirinya
harus
dimengerti,
bahwa
mempunyai pengertian jangka panjang (in the long sense), sense), yaitu yang berlaku dalam sampling yang berulang-ulang (repeated (repeated sampling ). ). Secara khusus persamaan (4.1) berarti : apabila dalam sampling yang berulang-ulang confidence interval semacam itu dibuat, lihat gambar dari keterangan (2), maka dengan probabilitas sebesar (1-
, kita harapkan
dalam jangka panjang, secara rata-rata, interval seperti (4.1), kurang lebih 100(1-
, katakanlah 90% atau 95%, akan memuat nilai parameter B.
(4) Seperti diterangkan dalam (2), interval (4.1) sifatnya acak selama nilai b tidak diketahui. Akan tetapi, begitu kita mengambil satu sampel dan menghitung nilai b dan membuat interval, maka kita memperoleh satu interval saja, yang mungkin memuat B atau tidak memuat B, dalam hal ini interval (4.1) tidak lagi random, tetapi sudah merupakan nilai yang
tetap/konstan, misalnya antara 0,50-0,75 atau antara 0,60-0,80. Dalam hal ini kita tidak boleh membuat pernyataan probabilitas mengenai persamaan (4.1), artinya kita tidak dapat menyatakan probabbilitas sebesar (1-
,
bahwa suatu interval yang nilainya tetap tersebut memuat parameter B. dalam situasi semacam ini hanya ada dua kemungkinan untuk B, yaitu B berada dalam interval itu atau tidak. Jadi, probabilitasnya hanya ada dua kemungkinan nilai, yaitu 1 atau 0. Probabilitas 1 kalau B berada dalam interval dan 0 kalau B berada di luar interval.
Kemudian bagaimana caranya interval keyakinan (confidence interval) tersebut dibuat? Kalau distribusi sampling atau distribusi probabilitas dari pemerkira diketahui, maka kita dapat membuat pernyataan interval keyakinan seperti persamaan (4.1). kita ketahui bahwa dengan asumsi kenormalan tentang kesalahan pengganggu
, pemerkira hasil metode kuadrat terkecil biasa (OLS), I
pemerkira a dan b juga mengikuti distribusi normal, dan bahwa pemerkira akan mengikuti distribusi khai-kuadrat(chi-square) khai-kuadrat (chi-square) =
. Sebelum kita membuat
interval keyakinan tentang koefisien A dan B dalam regresi, terlebih dahulu akan disinggung beberapa jenis distribusi yang erat sekali hubungannya dengan distribusi normal. Beberapa teori yang diungkapkan disini.
4.1.1 Beberapa teori tentang beberapa jenis distribusi yang erat sekali hubungannya hubungannya dengan distribusi distr ibusi normal.
Berikut ini akan diuraikan beberapa teori yang erat hubungannya dengan teori normal. Teori yang dikemukakan tanpa bukti ini sangat berguna dalam pemabahasan, baik teori perkiraan maupun pengujian hipotesis, antara lain fungsi fun gsi t,
, dan F.
Teori 4.1. kalau Z1, Z2,….
Zn merupakan variable bebas dan normal, masing-
masing dengan rata-rata maka Z =
dan variance
∑ Z , dimana i
,
yaitu Zi
N ( , ),
konstan dan semuanya nol, juga
∑ dan variance = ∑ , yaitu Z N (M, ) = N (∑ ∑ . mempunyai distribusi normal dengan rata-rata =
Teori 4.2. kalau Z1, Z2,….
Zn merupakan variabel bebas dan normal, masing-
N (0,1) merupakan normal yang baku (standar normal), maka Z = ∑ mengikuti distribusi dengan derajat kebesar sebesar n, dinyatakan dengan symbol Z masing dengan rata-rata nol dan variance 1, yaitu Zi
.
Teori 4.3. kalau Z1, Z2,….
Zn merupakan variable acak yang bebas dan normal,
masing-masing mempunyai distribusi dengan derajat kebebasan
∑ akan mengikuti distribusi dengan derajat kebebasan sebesar k, dimana k = ∑ , dinyatakan dengan symbol Z Teori 4.4. kalau Z merupakan variable normal standard, yaitu Z N (0,1) dan Z mengikuti distribusi dengan derajat kebebasan sebesar k, dimana Z sebesar k, kemudian Z =
.
1
i
2 2
bebas terhadap Z1, maka variabel t yang kita definisikan sebagai berikut :
t= = √ √ (4.2)
mengikuti distribusi t dari student dengan derajat kebebasan k. Teori 4.5. kalau Z1, dan Z2 masing-masing merupakan variabel bebas yang mengikuti distribusi
dengan derajat kebebasan k dan k yaitu Z 1
2 ,
dan Z maka variabel F kita definisikan sebagai berikut. 2
F=
(4.3)
1
Mempunyai distribusi F dengan derajat kebebasan k 1 dan k 2 Baik distribusi t,
, dan F sudah dibuat tabelnya. Untuk keperluan
pembuatan perkiraan interval dan pengujian hipotesis tabel – tabel tersebut sangat penting artinya.
4.2 Perkiraan Interval untuk Koefisien dan Kesalahan Pengganggu Pengganggu
Bahwa dengan asumsi kenormalan tentang
, pemerkira hasil OLS a dan
b juga mengikuti distribusi normal dengan rata-rata dan varian masing-masing. Dengan demikian, maka variabel Z yang kita definisikan adalah sebagai beri kut.
∑
Merupakan variabel normal yang standar, yaitu Z N (0,1). Berdasarkan hal ini, kita bisa menggunakan distribusi normal untuk membuat pernyataan probabilitas tentang b dengan syarat bahwa varian kesalahan pengganggu
diketahui..
diketahui, suatu sifat penting yang memiliki variabel dengan distribusi normal dengan kata-kata dan varian ialah bahwa daerah di bawah kurva normal antara (berjarak satu deviasi standar dari rata-rata), kurang lebih sebanyak 68%; antara (berjarak dua standar deviasi dari rata-rata), kurang lebih sebanyak 95%; dan antara (berjarak tiga deviasi standar dari rataApabila
rata), kurang lebih sebanyak 99,7%
Perhatikan gambar berikut!
jarang sekali diketahui, sehingga harus diperkirakan dengan perkiraan tidak bias , di mana Dengan jalan mengganti dengan dalam persamaan (4.4), maka kita peroleh Dalam praktiknya,
persamaan sebagai berikut.
∑ Dapat ditunjukan bahwa t mengikuti distribusi t dengan derajat kebebasan sebesar (n-2). Persamaan (4.4) menggunakan sedangkan persamaan (4.5) menggunakan
mengikuti ditribusi normal,
mengikuti ditribusi t. Uraian lebih
lanjut tentang persamaan (4.5) adalah sebagai berikut. Misalkan :
∑
Dan Apabila diketahui, Z akan mengikuti distribusi normal yang baku (standar normal), yaitu , artinya mempunyai rata-rata nol dan varian satu. Sedangkan mengikuti distribusi khai-kuadrat dengan derajat kebebasan (n-2), berdasarkan teori 4.4, variabel t berikut.
√ Akan mengikuti distribusi t dengan derajat kebebasan (n-2). Apabila
dan di
atas kita masukan, akan kita peroleh hasil berikut.
√ √ √ ∑ Oleh karenanya, untuk membuat perkiraan interval B, kita akan menggunakan distribusi t sebagai pengganti normal berikut.
Di mana t seperti dalam persamaan (4.5),
diperoleh dari tabel t dengan derajat
kebebasan sebesar (n-2). Dengan mengganti t seperti dalam persamaan (4.5), maka kita peroleh pernyataan probabilitas sebagai berikut.
Sekarang perhatikan gambar berikut!
I II
menjadi menjadi menjadi menjadi — — II. I.
Kemudian I dan II digabung dan kita peroleh bentuk pernyataan probabilitas sebagai berikut.
Rumus perkiraan interval B menjadi :
∑ ∑ Di mana
∑ ∑ ∑ Contoh soal 4.1 :
Buat perkiraan interval untuk B, kalau tingkat keyakinan sebesar 95%, apabila diketahui : b
= 0,5446
Se
=
√ =
= 1,4318880898403
1-a
= 0,95
Tingkat keyakinan 95%
a
= 0,5
Kesalahan yang diterima
a/2
= 0,25
Jawaban :
Sb =
√ ∑
√ √ Sb = Sb =
Sb = 0,1120902477704 0,1120902477704
0,5446+ 0,5446- 0,5446 – 0.3566711684054 0,5446+ 0.3566711684054 0.3566711684054 0,1879288315946 0,9012711684054 0,1879 0,9013 Dari tabel t,
Kalau upah naik Rp50.000,00 maka interval antara Rp1.879 sampai Rp9.013 diharapkan akan memuat nilai B sebenarnya dengan tingkat keyakinan 95%
Contoh soal 4.2 :
Buat perkiraan interval untuk B, kalau tingkat keyakinan sebesar 95%, apabila diketahui : b
= 0,653102123 0,653102123
n
= 5
(1-a) = 0,95 a
= 0,05
Dari tabel t,
Jawaban :
0,653102123+ 0,653102123- 0,653102123 – 0.098840773 0,653102123+ 0.098840773 0,55426135 0,751942896 0,5543 0,7519 Dengan tingkat keyakinan sebesar 95%, dalam jangka panjang kita harapkan bahwa interval seperti (0,55426135 - 0,751942896) akan memuat nilai parameter yang sebenarnya. Kita tidak dapat mengatakan bahwa dengan probabilitas sebesar 95%, interval khusus 0,55426135 sampai 0,751942896 akan memuat nilai parameter B yang sebenarnya. Oleh karena interval ini konstan, bukan acak (random) lagi, maka nilai parameter B sebenarnya bisa di dalam interval atau tidak. Probabilitas bahwa suatu interval khusus yang konstan memuat B ialah 1 dan 0.
Soal 4.3
Berdasarkan data dari Biro Pusat Satistik, dimana X
= PDRB dalam milliar
Y
= Konsumsi dalam milliar TAHUN 2006
X 29.473,644
Y 9.824,3
2007
31.907,546
10.568,85
2008
34.595,450
9.230,04
2009
37.570,568
8.298,59
2010
40.545,686
8.851,38
Buat perkiraan interval koefisien regresi dengan tingkat keyakinan sebesar 95%!
Jawab : Tahun 2006 2007 2008 2009 2010 Total
X 29.473,64400 31.907,54600 34.595,45000 37.570,56800 40.545,68600
Y 9.824,30000 10.586,85000 9.230,04000 8.298,59000 8.851,38000
X2 868.695.690,63874 1.018.091.491,74212 1.196.845.160,70250 1.411.547.579,84262 1.643.952.653,21060
Y2 96.516.870,49000 112.081.392,92250 85.193.638,40160 68.866.595,98810 78.346.927,90440
XY 289.557.920,74920 337.800.403,37010 319.317.387,31800 311.782.739,89912 358.885.274,14668
174.092,89400
46.791,16000
6.139.132.576,13657
441.005.425,70660
1.617.343.725,48310
Belanja statistic : N=5
̅ = 34.818,5788 ̅ = 9.358,232 ∑ ∑ ∑ ∑ = = -11.857.966,1203077
∑ ∑ ∑
=
= 77.465.427,8775263 77.465.427,8775263
∑ ∑ ∑
=
= 3.122.894,87748
∑ ∑ =
b =
= -0,1530743
∑ =
= 1.815.149,8592724
= ∑ =
= 435.915,0060692
Var(b)= = = 0,0056272
=
S b =
= 0,0750147
ta/2 = 0,025
pembuatan interval keyakinan
= b – t Sb
b + tS
b
= -0,1530743 – 3,182(0,0750147) 0,1530743 + 3,182(0,0750147) 3,182(0,0750147) = -0,1530743 – 0,2386968 -0,1530743 + 0,2386968 = -0,3917711 0,0856225
Dengan tingkat keyakinan sebesar 95%, diharapkan dalam jangka panjang, interval seperti -0,3917711 sampai 0,0856225 akan memuat B.
Contoh soal 4.4 :
Buat perkiraan interval
= 2,050303333 Df = n-2 = 5-2 =3
dengan tingkat keyakinan 95% apabila diketahui :
Jawaban :
Artinya dengan probabilitas 95%, dalam jangka panjang kita harapkan bahwa interval antara
sampai akan memuat
Contoh soal 4.5
Buat perkiraan interval
= 80,88625987
dengan tingkat keyakinan 95% apabila diketahui :
Df = n-2 = 5-2 =3
Jawaban :
Dengan tingkat keyakinan 95%, diharapkan dalam jangka panjang internal seperti 25,96 sampai 1124,46
4.3 Pengujian Hipotesis Koefisien Regresi
Pengujian hipotesis statistik (statistical testing hypothesis) sifatnya kuantitatif, jadi setiap hipotesis yang kita maksudkan harus dinyatakan dengan angka-angka. Persoalan pengujian hipotesis secara statistika mungkin bisa dinyatakan secara sederhana sebagai berikut: Apakah data observasi / empiris dari hasil penelitian sampel cukup erat hubungannya dengan hipotesis yang dinyatakan / disebutkan, atau tidak ? sehingga kita bisa sampai kepada keputusan untuk menolak atau menerima hipotesis yang telah dinyatakan. Jadi, apabila beberapa teori atau pengalaman yang telah lalu membuat kita mempercayai bahwa koefisien arah B dari regresi konsumsi mingguan terhadap upah mingguan, dalam contoh soal diketahui tingkat keyakinan sebesar 0,90, apakah hasil hitungan b = 0,5446 yang diperoleh dari sampel akan konsisten dengan hipotesis yang sudah dinyatakan sebelumnya? Kalau memang ya, kita dapat menerima hipotesis, tetapi kalau tidak kita harus menolak hipotesis tersebut. Dengan menggunakan bahasa statistik, hipotesis yang telah dinyatakan
. Hipotesis nol ini diuji melawan hipotesis alternative (alternative hypothesis) dengan symbol dikenal dengan hipotesis nol (null hypothesis) dan diberi simbol
, yang menyatakan misalnya, bahwa koefisien arah atau koefisien regresi tidak sama dengan 0,90. Hipotesis alternative bisa sederhana (simple) atau komposit (composite). Misalnya,
: B = 0,90, ini sederhana, sedangkan kalau : B ≠
0,90, ini komposit. Teori pengujian hipotesis berkenaan dengan pengembangan aturan-aturan atau prosedur untuk memutuskan apakah kita harus menerima atau menolak
berarti menerima , sebaliknya, kalau menerima berarti menolak . Biasanya kita berkenaan dengan , keputusan menerima hanya merupakan kosekuensi logis saja. Sebetulnya, ada dua hipotesis nol. Sebetulnya, menolak
pendekatan yang saling berkomplementer, untuk menentukan aturan-aturan yang dimkasud, yaitu interval keyakinan (confidence intervals) dan uji signifikan (test of significant). Kedua pendekatan tersebut menyebutkan bahwa pengujian hipotesis meliputi pembuatan pernyataan tentang nilai-nilai parameter dari distribusi tersebut.
Sebagai contoh, kita tahu bahwa dengan asumsi kenormalan, b juga mengikuti fungsi normal dengan rata-rata = E(b) dan var(b) =
/ ∑ . Kalau
kita membuat hipotesis bahwa B = 0,90, kita telah membuat pernyataan tentang salah satu parameter dari distibusi normal, yaitu mengenai rata-ratanya. Sebagian besar dari pengujian hipotesis hipote sis yang dibahas akan mempunyai semacam ini, yaitu membuat pernyataan tentang satu atau beberapa nilai parameter dari beberapa distribusi probabilitas, seperti normal, t, F, dan khai kuadrat.
4.3.1 Pengujian Hipotesis dengan Pendekatan Pendekatan Interval Keyakinan
Untuk membahas pendekatan interval keyakinan, misalnya kita mempunyai hipotesis sebagai berikut:
: B = 0,90 : B ≠ 0,90 Perhatikan bahwa pengujian hipotesis nol merupakan hipotesis sederhana, sedangkan hipotesis alternatifnya komposit. Apakah perkiraan b = 0,5446cukup
?
dekat dengan
Apabila diketahui : 0,1879
≤ B ≤ 0,9013
Kita mengetahui bahwa dalam jangka panjang interval keyakinan tersebut akan memuat nilai B sebenarnya, dengan probabilitas (tingkat keyakinan) sebesar 0,95 atau 95%. Konsekuensinya, dalam jangka panjang (sampel yang di ulangulang), interval yang demikian itu akan merupakan suatu jarak (range) di mana di dalamnya akan terletak nilai B dengan tingkat/koefisien keyakinan sebesar 95%. Dengan demikian, interval keyakinan merupakan suatu himpunan dari hipotesis nol yang dapat diterima. Oleh karena itu, kalau ternyata nilai B sesuai
: B =0,90, ternyata tercakup di dalam interval keyakinan dengan koefisien/tingkat keyakinan sebesar 95%, maka dengan hipotesis nol, dalam hal ini
diputuskan untuk diterima, kalau ternyata tidak tercakup (terletak di luarnya),
tersebut.
harus ditolak
Pengujian hipotesis dengan pendekatan interval keyakinan terdiri dari langkah-langkah berikut:
Pertama: Menghitung perkiraan interval dengan tingkat keyakinan yang sudah
ditentukan, dalam hal ini 95%. Perkiraan interval yang diperoleh adalah 0,70995 ≤ B ≤ 1,00125. Kedua: Kita cek, apakah nilai B sesuai dengan nilai hipotesis nol, dalam hal ini,
: B = 0,90, terletak dalam interval tersebut atau tidak? Kalau ya, kita terima, kalau tidak, kita tolak. Dalam soal yang kita hadapi, : B = 0,90 ternyata terletak dalam interval, jadi kita terima. Contoh Soal 4.6
X = Pendapatan per bulan dalam ribuan Rp Y = Konsumsi per bulan dalam ribuan Rp X
100
90
80
125
150
200
Y
80
70
60
85
100
150
Uji pendapatan bahwa koefisien regresi sebesar 0,80 dengan alternative tidak sama
dengan
itu.
Penggunaan
tingkat
menggunakan pendekatan interval keyakinan. Pemecahan
: B = 0,80 : B ≠ 0,80 = 0,10, Jadi 1 – = 1 – 0,10 = 0,90
signifikan
sebesar
0,10
dengan
X
Y
XY
100
80
10000
6400
8000
90
70
8100
4900
6300
80
60
6400
3600
4800
125
85
15625
7225
10625
150
100
22500
10000
15000
200
150
40000
22500
30000
745
545
102.625
54.625
74.725
∑ = ∑ ⁄ ⁄ ∑ ∑ ∑ ∑ ⁄ ⁄ 49.504,17 ∑ ∑ ∑ ∑ ⁄ ∑∑ 0,6970 ∑ ∑ ∑
∑ ∑ Dari tabel t, 2,132, derajat kebebasan = df = 4 Perkiraan interval B sebagai berikut:
Oleh karena interval keyakinan antara 0,5456 dan 0,8484 memuat nilai B = 0,80, maka
kita terima dengan tingkat kepercayaan sebesar 0,90 atau 90%. Dengan
perkataan lain, pendapat yang menyatakan bahwa bahwa B = 0,80 dapat diterima.
Contoh Soal 4.7 Dengan menggunakan contoh soal 3.2, misalnya kita menganggap bahwa
besarnya MPC (Marginal propensity to consume) yang dinyatakan dalam parameter B sebesar 0,4 dengan alternative tidak sama. Pergunakan tingkat signifikan sebesar 0,05 dengan pendekatan perkiraan interval. Pemecahan
Berdasarkan contoh soal 4.2, sudah kita hitung bahwa dengan tingkat keyakinan sebesar 95%, dalam jangka panjang, interval 0,55426135 sampai dengan 0,751942896 akan memuat nilai parameter B. Interval keyakinan 0,55426135 < B < 0,751942896 ternyata tidak memuat nilao hipotesis nol B = 0,4 ditolak. Jadi, hipotesis atau pendapat bahwa MPC = B = 0,4 ditolak. Probabilitas untuk mendapatkan nilai B = 0,4 (sebelah kiri nilai batas bawah) sebesar 0,025 (2,5%).
2,5%
2.5% 0,55426135
0,751942896
95% nilai batas bawah
nilai batas atas
Pengujian hipotesis dengan pendekatan perkiraan interval terdiri dari dua tahap yang harus diperhatikan, Pertama : Dihitung perkiraan interval dari parameter yang bersangkutan, dengan tingkat keyakinan tertentu, yaitu
. Nilai atau 0,05.
Kedua : Kemudian dicek, apakah nilai parameter berdasarkan hipotesis nol terletak di dalam interval atau tidak. Kalau ya,
diterima, kalau tidak,
ditolak.
4.3.2 Pengujian Hipotesis dengan Pendekatan Pendekatan Uji Signifikan (Nyata)
Pendekatan lainnya yang sifatnya komplementer terhadap metode interval keyakinan dalam pengujian hipotesis secara statistik ialah pendekatan ujisignifikan yang dikembangkan oleh R.A. Fisher secara independen dan bersamasama oleh Neyman dan Pearson. Secara umum, dapat dikatakan bahwa suatu uji-signifikan adalah suatu prosuder untuk suatu hasil perhitungan berdasarkan sampel, untuk memeriksa benar tidaknya suatu hipotesis nol. Ide pokok yang mendasari me ndasari uji-signifikan ialah suatu pemerkira (estimator) dan distribusi sampling dari pemerkira yang demikian itu di bawah hipotesis nol. Keputusan untuk menerima atau menolak
dibuat
atas dasar nilai pemerkira yang diperoleh dari data empiris / hasil observasi dari sampel. Maksudnya, untuk menguji benar tidaknya nilai parameter yang dinyatakan dalam
, akan dipergunakan suatu criteria uji (btest criteria) yang
dihitung berdasarkan sampel yang diteliti. Untuk ilustrasi, ingat bahwa dengan asumsi kenormalan, variable t berikut ini:
∑
akan mengikuti mengikuti t dengan kebebasan kebebasan sebesar (n - 2). Apabila Apabila nilai B sudah jelas
∑ dinyatakan dalam , maka nilai t dari langsung dapat dihitung dari sampel yang bersangkutan, sehingga dapat dipergunakan sebagai criteria uji, sebagai dasar untuk memutuskan menerima atau menolak
. Oleh karena uji
criteria ini mengikuti distribusi t, maka pernyataan interval keyakinan seperti berikut ini dapat dibuat.
⁄ ⁄ di mana ialah nilai B sesuai dengan . Nilai ⁄ , ⁄ dapat diperoleh dari tabel t dengan derajat kebebasan sebesar (n - 2). Perhatikan uraian berikut :
⁄ ⁄ ⁄ ⁄ ⁄ akan menjadi ⁄ I. ⁄ akan menjadi II. Setelah I dan II digabung, kita peroleh hasil berikut.
(⁄ ⁄) yang merupakan interval di mana b akan tercakup (terletak di dalamnya) dengan probalitas sebesar (1
) dan .
Dengan menggunakan bahasa pengujian hipotesis, 100(1
)% interval
keyakinan di kenal dengan daerah penerimaan (accepted region) dari pengujian hipotesis, sedangkan daerah di luar interval keyakinan tersebut dinamakan daerah penolakan (rejected region) dan sering disebut daerah kritis (critical region). Betapa eratnya hubungan antara pendekatan interval keyakinandan uji
(⁄ (⁄
hipotesis dapat dilihat dengan jalan membandingkan persamaan
⁄) ⁄) .
dengan
persamaan
Di dalam prosedur interval keyakinan, kita mencoba membuat suatu batas (limit) berupa interval yang dihitung berdasarkan sampel, di mana dalam jangka panjang (sampel yang diulang-ulang), dengan tingkat keyakinan tertentu, kita harapkan
nilai parameter B yang tidak diketahui akan terletak; sedangkan dalam pendekatan uji-signifikan, kita membuat hipotesis atau anggapan mengenai nilai parameter B yang sebenarnya dan mencoba melihat apakah perkiraan b untuk parameter B yang dihitung berdasarkan sampel akan terletak dalam batas-batas yang pantas, sekitar nilai hipotesis tadi. Contoh Soal 4.8
Dengan menggunakan contoh soal 3.2, coba dicek apakah dapat diterima atau ditolak, dengan tingkat signifikan
.
Pemecahan
Hasil perhitungan dari sampel sa mpel menunjukkan bahwa nilai b = 0,653102123, 0,653102123,
, df = 3. Dengan dari tabel t kita peroleh = 3,182 (dengan df = 3)
0,301159227 0,498840773 Ternyata, nilai b = 0,653102123 terletak di luar interval keyakinan 0,301159227 sampai dengan 0,498840773, maka dari itu, keputusan yang harus kita ambil adalah menolak anggapan/hipotesis bahwa MPC = B = 0,4. Dalam praktiknya, kita tidak perlu menghitung interval keyakinan seperti dalam persamaan (4.16) secara eksplisit, kita hanya perlu menghitung nilai t berdasarkan rumus berikut
Kemudian kita lihat apakah nilai t ini terletak dalam interval antara dan
, kalau ya, diterima, kalau tidak, ditolak.
GAMBAR 4.2
Jelasnya sebagai berikut.
, diterima. Kalau t < atau t > , ditolak. Kalau
Dalam contoh ini,
Oleh karena t > , maka ditolak. Untuk lebih jelasnya lihat gambar 4.3. Oleh karena menggunakan distribusi t, maka prosedur pengujian hipotesis di atas disebut uji t (t-test). Di dalam bahasa uji signifikan, dalam ilmu statistika, suatu nilai perkiraan ( statistic, tanpa s) dikatakan signifikan secara statistik apabila uji statistik berada dalam daerah kritis, yaitu daerah yang diarsir. Daerah ini disebut juga daerah penolakan. Dalam hal ini,
diterima).
ditolak (dengan sendirinya
GAMBAR 4.3
Dengan argumentasi yang sama, suatu uji dikatakan signifikan secara statistik apabila nilai uji berada di dalam daerah penerimaan. Dalam hal ini,
) diterima. Dalam contoh ini, uji t (t test) ternyata signifikan, hipotesis nol ( ) harus ditolak. Jadi, pendapat (hipotesis) yang menyatakan
hipotesis nol (
bahwa B = MPC = 0,4 tidak dapat diterima. Contoh pengujian hipotesis yang kita bahas di atas dikenal dengan nama uji dua arah atau two-sided atau two-sided atau two-tail test, karena kita berhubungan dengan dua ekor distribusi probabilitas (normal (normal test, t test ) yang merupakan daerah kritis (daerah penolakan) dan tolak
kalau nilai t yang dihitung berdasarkan data hasil
observasi jatuh/berada dalam daerah penolakan tersebut. Perhatikan gambar berikut.
, diterima. Kalau t < atau t > , ditolak. Kalau
Disebut dua arah, karena hipotesis alternative dua arah, yaitu
merupakan hipotesis komposit
, yang berarti B bisa lebih besar atau lebih kecil dari
0,4. Misalkan pengalaman sebelumnya sebelumnya membuat kita mempunyai mempunyai
(lebih besar dari 0,4).
Dalam hal ini,
Walaupun masih merupakan hipotesis komposit, tetapi sekarang hanya satu arah saja. Dalam hal ini, kita berhubungan dengan uji satu arah ( one-tail test ). ).
GAMBAR 4.4 Uji Signifikan Satu Arah Prosedur pengujian sama saja, kecuali bahwa nilai kritis atau batas keyakinan atas menjadi
, yaitu sebesar 5%, bukan 2,5% seperti sebelumnya (lihat
gambar 4.4)
Ada dua cara uji satu arah, yaitu sebagai berikut.
Contoh Soal 4.9
Juga dari contoh soal 3.2, uji pendapatbahwa MPC = B sebesar 0,4 dengan alternative lebih besar dari itu, dengan tingkat signifikan sebesar 0,05. Pemecahan
Contoh Soal 4.10
Dengan menggunakan contoh soal 3.2, uji pendapat bahwa dengan alternatif tidak sama dengan 75, dengan menggunakan
= 5%.
= 75
Pemecahan :
= 3,235450395
Oleh karena = 3,235450395 terletk dalam interval 0,216 dan 9,348, maka dapat diterima. Jadi, pendapat bahwa =75 dapat dibenarkan. Uji semacam ini Karena
disebut uji signifikan khai-kuadrat (the ( the chi-square test of significance). significance).
4.4 Analisis Varian dalam Regresi
Dalam subbab 4.4 ini akan dipelajari analisis regresi dari sudut pandangan analisis varian dan mengenalkan kepada pembaca terhadap suatu cara yang komplementer dan jelas dalam melihat persoalan-persoalan statistic induktif atau statistical inference. Telah kita tunjukan suatu persamaan sebagai berikut.
∑ ∑ ∑ ∑ ∑
Kalau
∑ = TSS (=total sum of square) ∑ = ESS (=explained sum of square) ∑ = RSS (=residual sum of square) maka
∑ ∑ ∑ menjadi TSS = ESS + RSS, yang menunjukkan pemecahan / penguraian TSS menjadi dua komponen/bagian, yaitu ESS dan RSS TSS diperguanakan untuk menunjukkan jumlah variasi Y yang terdiri dari dua sumber variasi, yaitu ESS
berasal dari regresi, merupakan sumbangan/
penguraian TSS menjadi dua komponen/bagian, komponen/bagian, yaitu ESS dan RSS TSS dipergunakan untuk menunjukkan jumlah variasi Y yang terdiri dari dua sumber variasi, yaitu ESS berasal dari regresi, merupakan sumbangan yang disebabkan oloeh variable bebas X, dan RSS berasal dari kesalahan pengganggu. Studi mengenai komponen-komponen TSS disebut analisis vari9an (anavar), yang berarti analisis sumber-sumber variasi yang diukur dengan varian.
∑̂ disebut explained sum of square atau jumlah kuadrat yang bisa diterangkan, maksudnya ialah bahwa sumbernya itu jelas, yaitu pengaruh linear ( linear effect ) effect ) dari X. Sedangkan
∑ diksebut unexplained sum of square atau
jumlah kuadrat yang tidak bisa diterangkan , oleh karena sumber variasi memang tidak begitu jelas, sebab kesalahan pengganggu e meliputi variabel-variabel atau factor-faktor yang mempengaruhi Y, tetapi tidak dimasukkan kedalam persamaan regresi linear. Pada dasarnya, besarnya nilai derajat kebebasan merupakan selisih antara banyaknya observasi atau elemen sampel dengan banyaknya perkiraan yang akan dibuat. Jadi, kalau ada k perkiraan yang akan dibuat untuk memperkirakan k parameter, maka derajat kebebasan (df) sebesar ( n-k ). Untuk menghitung satu perkiraan, kita mempunyai df = ( n-1 ), sebab kehilangan kehilangan 1 kebebasan.
Contoh :
Tentukan 5 nilai variabel Y, sehingga rata-ratanya 5. Dalam hal ini, df = ( n -1)= 5-1 = 4, maksudnya kita bebas menentukan nilai dari 4 variabel yang pertama (4 kebebasan), sedangkan nilai variabel yang kelima tidak bebas lagi (kehilangan 1 kebebasan), sebab jumlah harus 25.
∑ = 25 ̅ = 5
(bebas) (bebas) (bebas) (bebas) (bebas) ∑ = 25 ̅ = 5
Misalnya,
atau ,
(bebas) (bebas ) (bebas) (bebas) (bebas) ∑ = 25 ̅ = 5
Satu perkiraan yang dibuat, satu kebebasan hilang. Tabel Anavar Untuk Model Regresi Sederhana
Rata – rata
Sumber
Jumlah
Varian
Kuadrat (SS)
Dari Regresi (ESS)
∑ ∑
1
ESS/df =
∑
(n-2)
RSS/df=
Dari kesalahan Pengganggu (RSS)
df
Kuadrat (MS)
∑
∑ /(n-2) =
Total jumlah Kuadrat (TSS)
∑
(n-1)
Dengan menganggap bahwa kesalahan pengganggu
i
mempunyai
distribusi normal dan H0 : B = ), da[at ditunjukkan bahwa variabel F sebagai berikut.
∑ ⁄ ⁄ = ∑ mengikuti fungsi F dengan derajat kebebasan 1 dan (n-2)
Contoh Soal 4.11
Berdasarkan contoh soal 3.2, uji pendekatan bahwa B = MPC = 0 dengan alternatif tidak sama dengan itu. Pergunakan analisis varian (anavar). Pemecahan : Diketahui
b
= 0,653102123
∑ ∑ ∑ n
= 83.830,6875 = 4.360.500 = 4.650 =5 Tabel Anavar
Sumber Variasi Dari regresi (ESS) Dari Kesalahan
Jumlah Kuadrat
f
(SS) 35.757,34122
35.757,34122
242, 65878
3
80,88626
36.000,00000
4
Total jumlah
F=
rata-rata kuadrat regresi Rata-rata kesalahan pengganggu
F= ESS RSS
Kuadrat (MS)
1
Pengganggu (RSS)
Kuadrat (TSS)
Rata-Rata
F 442,0694098
= 35.757,34122 35.757,34122 80, 88626 = 442,0694098 (**)
Tabel F
F0,05 (1)(3) = 10,13 F0.01(1)(3) = 34,12
Untuk
= 0,05 (5%). Oleh karena F > F
0,05(1)(3)
, maka H0 ditolak. Pendapat /
hipotesis bahwa MPC=0 ditolak. Tidak benar B= 0. Untuk
= 0,01 (1%). Oleh karena F > F
0,05(1)(3)
, maka H0 ditolak. Pendapat
bahwa B=0 Tidak benar .
Soal 4.12
Uji anggapan PDRB mempunyai konsumsi nasional dengan alternatif tidak ada pengaruhnya. Pergunakan analisis varian dengan
. Data dari BPS
adalah sebagai berikut :
TAHUN 2006
X 29.473,644
Y 9.824,3
2007
31.907,546
2008
34.595,450
10.568,8 5 9.230,04
2009
37.570,568
8.298,59
2010
40.545,686
8.851,38
Jawab: b= -0,5130743
∑ 2
=
=
1.815.149,8592724
∑ ∑ ∑
=
= 3.122.894,87748
∑ = ∑- ∑ 2
= 3.122.894,87748 - 1.815.149,8592724 = 1.307.745,0182077 1.307.745,0182077 Sumber variasi
Dari regresi (ESS)
Jumlah kuadrat (ss) 1.815.149,8592724
df
Ratarata kuadrat (MS)
1
1.815.149,8592724
3
435.915,0060692
F
4,16399482
Dari kesalahan pengganggu (RSS)
Total jumlah kuadrat (TSS)
F= =
1.307.745,0182077
3.122.894,8774800
4
= 4,16399482 Dari table F0,05(1)(3) F 0,01(1)(3)
= 10,13 = 34,12
Oleh karena F< F0,05(1)(3), maka H0 diterima yang artinya memang ada pengaruh PDRB terhadap konsumsi daerah Kalimantan selatan.
4.5 Ramalan dengan Menggunakan Garis Regresi Linear Sederhana
Berdasarkan contoh soal 3.2, kita peroleh regresi sampel dengan persamaan sebagai berikut.
(4.21) di mana merupakan pemeriksaan ( ) dengan nilai variabel bebas X tertentu.
Persamaan regresi linear sederhana ini dapat dipergunakan untuk meramalkan (to forecast or to predict) besarnya konsumsi (Y) untuk waktu yang akan datang apabila besarnya pendapatan (X) sudah diketahui. X diketahui, artinya sebagai berikut. a) Sudah terjadi, misalnya merupakan pendapatan waktu yang lalu. Dalam hal ini, X disebut variabel beda kala (lagged variabel) dengan simbol .
b) Hasil ramalan, misalnya misaln ya pendapatan tahun depan,dengan simbol . c) Pendapatan sekarang,dalam waktu yang bersangkutan, dengan simbol . Untuk meramalkan Y, nilai variabel X harus diketahui terlebih dahulu. Itulah sebabnya X disebut variabel bebas (independent variable) dan sering disebut explanatory variable, variable, artinya variabel yang menerangkan. Sedangkan, Y disebut variabel tidak bebas (dependent variable), variable), karena memang nilainya tergantung pada nilai X. Y = nilai hasil observasi, hasil pencatatan. Ŷ = nilai perhitungan berdasarkan persamaan garis regresi, sering disebut nilai regresi atau nilai teoretis. Y merupakan perkiraan atau ramalan Y. Ramalan pada dasarnya merupakan perkiraan terjadinya suatu kejadian (peristiwa) untuk waktu yang akan datang. Ada perkiraan jangka pendek, ada juga ramalan jangka panjang (short term and long term forecasting) . Ramalan (produksi, penjualan, ekspor, penerimaan negara, pendapatan nasional, konsumsi, dan variabel ekonomi lainnya) sangat diperlukan untuk dasar perencanaan. Ada dua macam ramalan untuk variable tidak bebas Y, yaitu ramalan untuk rata-rata Y dan individu Y nilai X tertentu, katakan = . Untuk selanjutnya, kita sebut ramalan rata-rata Y atau ramalAn (Y) dan ramalan individu Y. (Y)=expected (Y)=expected (Y) merupakan rata-rata. Dalam praktiknya, meramalkan (Y) juah lebih mudah dari pada meramalkan individu Y, sebab ratarata Y kurang bervariasi dibandingkan dengan Y, sebabnya ialah (Y) = A+BX terletak tepat pada garis regresi populasi, sedangkan Y terletak di sekitar garis regresi populasi. Lihat gambar berikut!
Y, E(Y)
E(Y/X) = A + BX
X
(Y), lengkapnya ditulis (/), dibaca rata-rata Y atau nilai harapan (expected value) Y, untuk X= Titik-titik pada gambar menunjukkan nilai individu Y, untuk X tertentu, yaitu merupakan titik-titik koordinat: ( ),
), ...,( . Ramalan (Y/) disebut ramalan bersyarat (coditional forecast) , maksudnya hasil ramalan sangat tergantung pada nilai X= . (
Misalnya, kalau X=biaya advertensi dan Y= hasil penjualan, maka ramalan hasil penjualan untuk waktu yang akan datang sangat tergantung kepada biaya advertensi. Juga misalnya, kalau X = pendapatan nasional atau investasi nasional dan Y = konsumsi nasional atau PDB, maka ramalan konsumsi nasional atau ramalan PDB yang akan datang sangat tergantung kepada tinggi rendahnya pendapatan nasional atau investasi nasional yang kita beri simbol X= . Untuk membedakan nilai ramalan atau bukan, maka untuk nilai ramalan rata-rata Y kita beri simbol ( ), kita baca ramalan rata-rata Y kalau X =
dan ramalan individu Y diberi simbol (
), dibaca untuk meramalkan rata-rata
Y = (Y) maupun individu Y, nilai X harus diketahui terlebih dahulu. Perlu dibedakan nilai ramalan tunggal (point forecast) , yaitu ramalan yang terdiri dari satu nilai saja, dan ramalan interval, di mana kita harapkan bahwa nilai yang kita ramalkan tersebut akan terletak dalam interval yang kita buat berdasarkan data sampel dengan menggunakn tingkat atau koefisien keyakinan tertentu, katakan 90% atau 95%
4.5.1 Ramalan Rata-Rata Y atau (Y) Dengan menggunakan persamaan garis regresi yang sudah di buat berdasarkan data sampel berikut:
, maka Y nol topi menjadi = a + b , di mana a = 24,4545 dan b = 0,5091. Sekarang, misalnya sudah diketahui X = = 100, kita ingin meramalkan nilai rata-rata Y, yaitu ( ), maka perkiraan tunggal dari rata-rata Y dapat diperoleh dengan jalan memasukkan X = = 100 ke dalam persamaan garis regresi: = a + b Ŷ = a + bX, maka kalau X =
= 24,4545 + 0,5091(100) = 24,4545 + 50,91 = 75,3645
(). Dapat ditunjukkan bahwa merupakan perkiraan linear tunggal ( ) yang tidak bias dan varian yang minimum atau Di mana perkiraan
BLUE (best linear unbiased estimators) .
Oleh karena (Y nol topi) merupakan suatu pemerkira (estimator) ), maka nilainya sebagai perkiraan akan berbeda-beda, dari sampel ke
(
() akan memberikan gambaran mengenai kesalahan tersebut, kita perlu mengetahui distribusi sampling . Hal ini dapat ditunjukkan oleh karena merupakan sampel akan bervariasi. Perbedaan antara nilai
dengan
fungsi kesalahan pengganggu yang berdasarkan asumsi mempunyai distribusi
normal dengan rata-rata nol dan varian , maka normal dengan rata-rata ( ) = (A + ) dan
juga mempunyai distribusi
var( ) = [ + ∑ Dengan jalan mengganti t sebagai berikut. t = (4.23) Di mana
(4.22)
dengan , perkiraannya kita peroleh variabel
= (perkiraan standard error ), = perkiraan var(,
Ŷ
Ŷ
maka t mengikuti distribusi dengan derajat kebebasan (n – 2). Dengan demikian, maka t ini dapat digunakan untuk membuat perkiraan interval atau menguji hipotesis mengenai .
= A + B t =
≤ t ) = 1 – ≤ - ≤ - ≤ ≤
P(-
I I.
≤ ) ≤ + ≤ ≤ ) -
II.
II
I dan II digabung akan memperoleh perkiraan interval untuk tingkat keyakinan sebesar (1 – ) sebagai berikut.
) dengan
≤ ≤ +
(4.24)
= ∑
di mana = a + b
diperoleh dari tabel t dengan derajat kebebasan (n – 2)
Contoh Soal 4.13
Dengan menggunakan data contoh soal 3.2, buat perkiraan/ramalan interval E(Y) kalau X = Pemecahan
= 100! Pergunakan tingkat keyakinan 95%.
var( ) = [ + ∑ = 80,88625987 = 80,88625987
[ ] ] [
= 80,88625987 ( 10,75936375 ) = 870,2846921
= 29,500588 = a + b =
= 250,218655 + 0,653102123(100) = 250,218655 + 65,3102123 = 315,5288673
+ ≤
)≤
315,5288673 –
3,182(29,500588)
3,182(29,500588) 315,5288673 – 93,870871 ≤ 221,6579963 ≤
≤
)
≤
315,5288673
+
) ≤ 315,5288673 + 93,870871
) ≤ 409,3997383
Kalau X = 100, dengan tingkat keyakinan 95%, dalam jangka panjang interval 221,6579963 sampai 409,3997383 akan memuat
Perkiraan tunggal untuk (Y), yaitu
= 315,5288673
(Y) = rata-rata Y.
SOAL 4.14 Dengan menggunakan data berikut, buat ramalan interval rata-rata Y kalau
X=1000 dengan tingkat keyakinan 95%. Dimana X Y
= pendapatan rata-rata per bulan dalam jutaan rupiah = tabungan rata-rata perbulan dalam jutaan rupiah
TAHUN 2006
X 72.445,766
Y 40.854,481
2007
83.312,633
51.095,756
2008
95.809,466
71.434,944
2009
110.180,883
82.408,203
2010
126.708,025
99.318,846
Jawab : X
Y
X2
Y2
XY
72.445,7660000
40.854,4810000
5.248.389.011,326760
1.669.088.617,77936
2.959.734.170,57745
83.312,6330000
51.095,7560000
6.940.994.817,392690
2.610.776.281,21154
4.256.921.967,48555
95.809,4660000
71.434,9440000
9.179.453.775,205160
5.102.951.224,28314
6.844.143.838,37990
110.180,8830000
82.408,2030000
12.139.826.978,659700
6.791.111.921,68921
9.079.808.572,98325
126.708,0250000
99.318,8460000
16.054.923.599,400600
9.864.233.170,77172
12.584.494.821,93910
488.456,7730000
345.112,2300000
49.563.588.181,9849000
26.038.161.215,7350000
35.725.103.371,365300
N=5
∑ ∑ ∑ = 49.563.588.181,9849 49.563.588.181,9849 ∑ = ∑ ∑ ∑ ∑ ∑ 26.038.161.215,735
=
= 2.010.622.133,63854
∑ ∑ ∑
=
= 1.845.364,07019
∑ ∑ ∑
= = 2.217.670.956,62038
∑ ∑ =
b =
= 1,0894230
̅ ̅
a= = 69.022,446 - 1,0894230(97.691,354) = -37.404,7667830
Untuk X = 00.000
= a +b ̅
= -37.404,7667830 -37.404,7667830 + (1,0894230)(97.691,354) (1,0894230)(97.691,354) = 71.537,5374964 71.537,5374964
∑ =
=
2.190.418.082,737640
= ∑ =
= 9.084.291,2942476 Se = 3.014,015808
= S ∑̅ = 3.014,015808 3.014,015808 3.014,015808 = 3.014,015808 e
=
= 3.014,015808 ( 1,7573405) = 5.296,652104
= = 3,182 + ≤
)≤
71.537,5374964 – 3,182(5.296,652104) ≤ +3,182(5.296,652104) 71.537,5374964 – 16.853,94699 ≤ 54.683,59050 ≤
) ≤ 71.537,5374964
) ≤ 71.537,5374964 + 16.853,94699
) ≤ 88.391,48448
Kalau X = 100.000, dengan tingkat keyakinan 95%, dalam jangka panjang
interval 54.683,59050 sampai 88.391,48448 akan memuat (Y) = rata-rata Y. Jadi, kalau pendapatan Rp100.000.000, dengan tingkat keyakinan 95%, dalam jangka panjang, interval antara Rp5.469.359.050.000,00 sampai Rp8.839.148.448.000,00 akan memuat rata-rata tabungan sebenarnya. 95% 2,5 %
2,5 %
Rp5.469.359.050.000,00
Rp8.839.148.448.000,00
Rata-rata tabungan yang sebenarnya dalam interval
4.5.2. Ramalan Individu Y Apabila kita ingin meramalkan individu Y, yaitu untuk nilai X =
,
dapat ditunjukkan bahwa pemerkira = a + b selain untuk memperkirakan rata-rata Y, yaitu ), juga dapat untuk memperkirakan individu Y, yaitu
. Artinya, baik perkiraan untuk maupun untuk sama, yaitu nol topi), tetapi var ( ) sebagai berikut.
var( ) = [1 + + ∑ ]
diganti , maka = ∑ = perkiraan standard perkiraan standard error
Kalau
(Y
(4.25)
t
, (
=
di baca dengan syarat X =
akan mengikuti fungsi t dengan derajat kebebasan sebesar (n – 2).
≤ t ) = 1 – - ≤ ≤ - ≤ ≤ P(-
I I.
≤ ≤ + ≤ ≤ -
II.
II
I dan II digabung, diperoleh rumus perkiraan interval individu Y dengan tingkat keyakinan sebesar (1 – ) sebagai berikut.
≤ ≤
(4.26)
+
di mana
= ∑ = a + b
dari tabel t dengan derajat kebebasan (n – 2). Contoh Soal 4.15
Dengan menggunakan contoh soal 3.2, buat ramalan interval individu Y, dengan tingkat keyakinan 95%, kalau X = 100!
Pemecahan
+ ≤
≤
di mana
= ∑
= 250,218655 + 0,653102123
X = 100
= 250,218655 + 0,653102123(100) = 250,218655+ 65,3102123 = 315,5288673
= 80,88625987 8,993678884 = 8,993678884 = 8,993678884
= 8,993678884
= 8,993678884 (3,429192871) = 30,84105951
= 3,183 315,5288673 – 3,182(30,84105951) ≤ 315,5288673 – 98,13625136 ≤ 217,3926159 ≤
≤ 315,5288673 + 3,182(30,84105951)
≤ 315,5288673 + 98,13625136
≤ 413,6651187
Kalau X = 100, dengan tingkat keyakinan 95%, interval antara 217,3926159 sampai 413,6651187 , dalam jangka panjang akan memuat nilai individu Y.
4.5.3 Cara Melaporkan Hasil Analisis Regresi Banyak hasil penelitiaan ekonomi secara kuantitatif yang hasilnya sukar di mengerti, khususnya hasil analisis ekonometri dengan disertai berbagai macam angka atau simbol-simbol yang sering kali kurang dimengerti oleh penbaca. Dalam hal ini, untuk melaporkan analisis regresi, perlu diperhatikan hal-hal berikut. Pertama : Persamaan garis regresi yang dihitung dari sampel, lengkap dengan segala koefisiennya Ŷ = a + bX.
bagi setiap koefisiennya, Ŷ = a + bX : Diikutsertakan standard Diikutsertakan standard error bagi ( )( = standard error (a), error (a), diletakkan di bawah a = standard error (b), error (b), diletakkan di bawah b Ketiga : Diikutsertakan nilai t yang masing0masing berdasarkan sampel langsung di bawah dan . t di bawah dan , masing-masing berdasarkan sampel rumus berikut.
Kedua
= dan =
Y = a + bX
( )( ) ( )( ) Keempat :Diikutsertakan nilai koefisien determinasi ( ) dan standard error regresi atau standard error kesalahan pengganggu ( ) Ŷ = a + bX ( ) ( ) ( ) ( ) df = n – 2
Kegunaan masing-masing di dalam penyajian hasil analisis regresi adalah sebagai berikut. Pertama : persamaan regresi Ŷ = a + bX digunakan untuk meramalkan )
atau ) setelah X= diketahui. = a + b selain merupakan ramalan untuk ) juga merupakan ramalan ). Kedua : Standard error dan untuk mengukur tingkat ketelitian pemerkira a dan b. Makin kecil standard error suatu pemerkira, makin teliti pemerkira tersebut, maksudnya makin dekat dengan nilai parameter yang akan diperkirakan. Jadi, makin kecil dan , makin dekat a dengan A dan b dengan B. 0, berarti a A, kalau =0,a=A 0, berarti b B, kalau = 0, b = B (Dalam praktiknya, standard praktiknya, standard error tidak pernah nol). Ketiga : Nilai t, dan dan dapat untuk menguji hipotesis tentang parameter A dan B.
Keempat : Koefisien determinasi ( ) untuk mengukur tepat / cocoknya persamaan regresi untuk meramalkan. Makin besar , makin tepat garis untuk meramalkan Y, sebab makin besar persentase sumbangan X, terhadap varian (naik turunnya) Y digunakan standard error er ror regresi atau standard error kesalahan pengganggu untuk mengukur betapa dekatnya nilai-nilai individu Y hasil garis regresi Ŷ = a + bX.
Makin kecil , berarti makin dekat nilai-nilai individu Y terhadap garis regresi, sehingga makin tepat / cocok garis regresi tersebut untuk meramalkan Y kalau X sudah diketahui Perhatikan gambar berikut. (Y, Ŷ)
(Y, Ŷ)
. .
.
.
. .
.
.
.
. .
.
. .
.
.
.
Garis regresi
.
. .
.
.
Garis regresi
. . .
.
Se besar
(Titik-titik menunjukkan letak individu Y, jauh dari garis regresi)
Se kecil
(Titik-titik menunjukkan letak individu Y, jauh dari garis regresi)
Jadi, untuk mengukur kecocokan / ketepatan suatu garis regresi untuk meramalkan ( goodness of fit ), ), dapat dipergunakan nilai yang makin besar, makin baik atau yang makin kecil baik.
46
DAFTAR PUSTAKA Supranto, J. 2005. Ek onometri. Jakarta. Ghalia Indonesia Badan Pusat Statistika. Kalimantan Selatan dalam angka.
47