Perkiraan Interval Dan Pengujian Hipotesis Dalam Regresi Sederhana

4.1 beberapa ide tentang perkiraan interval

Bagian yang penting dalam ilmu statistik adalah statistik induktif atau statistical inference. Statistic induktif mencakup dua hal pokok, yakni teori estimasi dan pengujian hipotesis. Teori perkiraan terdirir dari dua hal penting. Yaitu perkiraan tunggal dan perkiraan interval. Perkiraan tunggal mengenai koefisien regresi, koefisien korelasi dan varian sudah dibahas panjang lebar dengan menggunakan metode kuadrat terkecil sederhana (OLS) dan juga disinggung sedikit mengenai metode maximum likelihood (ML). Dalam bab ini akan dibahas mengenai perkiraan interval dan pengujian hipotesis , baik mengenai koefisien-koefisien, individu dan nilai harapan Y, maupun varian kesalahan pengganggu. pen gganggu. Untuk membahas ide dasar perkiraan interval, perkiraan koefisien regresi , ini artinya kalau upah karyawan naik 1 unit, maka konsumsi karyawan naik 0,8556 kali. Jadi seandainya upah karyawan naik Rp 1.000,00 maka diperkirakan konsumsi karyawan akan naik Rp 855,60. Menurut Keynes, kenaikan konsumsi selalu lebih kecil dari kenaikan pendapatan (karena upah merupakan satu-satunya pendapatan), hal itu dinyatakan dalam konsep MPC ( marginal propensity to consume). consume). Nilai b= 0,8556 ini merupakan perkiraan tunggal parameter B, yaitu koefisien regresi sebenarnya (Yi = A + BXi +

 ) . khusus dalam hal ini, kalau i

X=pendapatan dan Y= konsumsi, koefisien regresi merupakan MPC. Pertanyaan yang timbul : seberapa juga perkiraan b ini dapat dipercaya ? Karena adanya fluktuasi sampling, perkiraan tunggal ini akan berbeda dengan nilai sebenarnya (B), walaupun dalam sampling yang diulang, nilai ratarata b akan sama dengan nilai B sebab b pemerkira tidak bias. Dalam statistika, tingkat kepercayaan (reliability (reliability)) pemerkira tunggal diukur oleh standar eror atau variannya. Maka, daripada percaya pada perkiraan tunggal saja, kita mungkin lebih baik kalau memberikan pernyataan probabilitas, bahwa pemerkira tunggal tersebut terletak dalam suatu interval disekitar nilai parameternya (b akan terletak disekitar B), sejauh 1,2 atau 3 standard erornya. Jadi, perkiraan interval bebarti kita mengharapkan bahwa nilai B yang sebernarnya itu akan terletak dalam suatu interval (dengan nilai batas bawah dan batas atas) dengan tingkat keyakinan

tertentu, katakanlah 95% Inilah yang merupakan ide dasar di belakang perkiraan interval tersebut. Untuk lebih jelasnya, anggap bahwa kita akan mencari kenyataan betapa dekatnya nilai b tersebut dengan B. untuk maksud ini, kita mencoba mencoba mencari dua nilai positif, katakan d dan

, dimana nilai alpha terletak diantara 0 dan 1,

sedemikian rupa sehingga probabilitas bahwa interval (b-d, b+d) mencakup nilai



sebenarnya (B) sebesar (1- ) Dengan symbol dapat ditulis : P(b-d

 B  b+d = 1- 

b – d

b+d

(4.1)

confidence interval

batas bawah

batas atas

 disebut tingkat nyata/ berarti (level of significance). Di dalam pengujian hipotesis,  disebut kesalahan 1-



interval

disebut koefisisen keyakinan/ tingkat keyakinan.

tipe pertama, yaitu kesalahan yang terjadi karena kita menolak hipotesis nol, padahal hipotesis tersebut benar (keputusan yang benar, hipoteisis tersebut harus kita termia). Alpha juga dapat diartikan sebagai besarnya kesalahan yang kita torerir di dalam membuat suatu keputusan. Kalau 1-

 = 0,95;  = 1-0,95 = 0,05;

ini berarti kita mentorerir kesalahan sebesar 5%. Salah dalam hal ini, berarti interval tidak memuat B lebih kecil dari (b – d) atau lebih besar dari (b+d). kesalahan ini menimbulkan resiko dalam pembuatan keputusan, maka dari itu untuk memperkecil resiko, kesalahan harus dibuat sekecil mungkin. Titik akhir pada interval disebut batas keyakinan (confidende limit) atau nilai kritis (critical (critical value) b – d = batas keyakinan bawah atau nilai batas bawah b + d = batas keyakinan atas atau nilai batas atas

 dan (1 –  bukan dinyatakan sebagai proporsi, tetapi sebagai presentase, yaitu 100% dan 100(1-  dalam praktiknya,

Persamaan (4.1) menunjukkan bahwa suatu pemerkira interval merupakan suatu interval yang dibuat sedemikian rupa sehingga interval tersebut mempunyai nilai probabilitas sebesar (1-

 akan memuat nilai parameter B. misalnya kalau 

= 0,05 (5%), maka persamaan (4.1) harus dibaca : probabilitas bahwa interval antara ( b – d ) dan ( b + d ) akan memuat nilai B sebesar 0,95 atau 95%. Perkiraan interval memberikan berbagai nilai dalam suatu interval, diharapkan nilai B akan terletak di dalamnya. Kemungkinan tidak memuat ( B terletak di luarnya, B < b-d atau B > b + d ) sebesar s ebesar 5% Perlu diperhatikan beberapa aspek penting tenatang perkiraan interval ini, yaitu sebagai berikut: (1) Persamaan (4.1) tidak berarti bahwa probabilitas parameter B terletak dalam interval yang dibatasi nilai batas bawah dan atas tersebut sebesar (1-

,

katakana 90% atau 95 %. Sebab parameter B, walaupun tidak diketahui nilainya, dianggap mempunyai nilai tetap/konstan (tidak berubah-ubah) bisa terletak dalam interval dan bisa juga tidak. Arti persamaan (4.1) yang sebenarnya ialah bahwa dengan menggunakan metode yang dijelaskan, probabilitas untuk meperoleh suatu interval yang memuat B sebesar (1-

 .

Penjelasan lebih lanjut : kalau seluruh sample dari suatu populasi sebanyak k kita hitung perkiraan intervalnya, akan kita peroleh k interval. Apabilak kita tentukan (1-

 = 0,95 misalnya, maka setelah kita teliti hasil hitungan kita,

akan diperoleh kurang lebih 95 % dari k interval tersebut memuat parameter



B, selebihnya / sisanya sebanyak 5% tidak memuat B. oleh karena di dalam praktiknya, kita hanya mengambil sampel secara random satu kali saja dari populasi yang bersangkutan, maka kita harapkan dengan tingkat keyakinan sebesar 95%, sampel tersebut akan memuat parameter B.

Perhatikan gambar berikut ini : Setiap titik menunjukkan interval yang dibuat berdasarkan sampel sampel

Ada k interval, karena ada k sampel

.

.

.

....

.

.

Memuat parameter B ..

..

.

..

..

. .

Bagian yang diarsir terdiri dari interval yang tidak memuat B

Bagian yang tidak diarsir terdiri dari interval yang memuat parameter B

Berdasarkan gambar di atas, maka probabilitas untuk memperoleh interval yang memuat B merupakan hasil bagi daerah yang memuat B (tidak diarsir) dengan seluruh daerah :

 X 100% = 95% atatu 100(1

%= 95% disebut tingkat keyakinan (confidence level). level).

(2) Interval (4.1) adalah interval acak (random interval) , yang berarti akan berubah dari sampel ke sampel, sebab nilainya tergantung pada b yang berbeda dari sampel satu ke sampel yang lainnya.

Perhatikan gambar berikut :

Sampel 1, interval 1 = I 1

memuat B memuat B


tak memuat B memuat B


memuat B tak memuat B

Sampel i, interval i = I i

memuat B memuat B

Sampel k, interval k = I k

memuat B tak memuat B

Keterangan : interval yang memotong garis tegak lurus memuat B, sedangkan yang tidak memotong tidak memuat B. Garis tegak lurus tempat letaknya B. ada beberapa interval. (3) Oleh karena confidence interval merupakan acak (random (random), ), pernyataan probabilitas

yang

menyangkut

dirinya

harus

dimengerti,

bahwa

mempunyai pengertian jangka panjang (in the long sense), sense), yaitu yang berlaku dalam sampling yang berulang-ulang (repeated (repeated sampling ). ). Secara khusus persamaan (4.1) berarti : apabila dalam sampling yang berulang-ulang confidence interval semacam itu dibuat, lihat gambar dari keterangan (2), maka dengan probabilitas sebesar (1-

, kita harapkan

dalam jangka panjang, secara rata-rata, interval seperti (4.1), kurang lebih 100(1-

, katakanlah 90% atau 95%, akan memuat nilai parameter B.

(4) Seperti diterangkan dalam (2), interval (4.1) sifatnya acak selama nilai b tidak diketahui. Akan tetapi, begitu kita mengambil satu sampel dan menghitung nilai b dan membuat interval, maka kita memperoleh satu interval saja, yang mungkin memuat B atau tidak memuat B, dalam hal ini interval (4.1) tidak lagi random, tetapi sudah merupakan nilai yang

tetap/konstan, misalnya antara 0,50-0,75 atau antara 0,60-0,80. Dalam hal ini kita tidak boleh membuat pernyataan probabilitas mengenai persamaan (4.1), artinya kita tidak dapat menyatakan probabbilitas sebesar (1-

,

bahwa suatu interval yang nilainya tetap tersebut memuat parameter B. dalam situasi semacam ini hanya ada dua kemungkinan untuk B, yaitu B berada dalam interval itu atau tidak. Jadi, probabilitasnya hanya ada dua kemungkinan nilai, yaitu 1 atau 0. Probabilitas 1 kalau B berada dalam interval dan 0 kalau B berada di luar interval.

Kemudian bagaimana caranya interval keyakinan (confidence interval) tersebut dibuat? Kalau distribusi sampling atau distribusi probabilitas dari pemerkira diketahui, maka kita dapat membuat pernyataan interval keyakinan seperti persamaan (4.1). kita ketahui bahwa dengan asumsi kenormalan tentang kesalahan pengganggu

 , pemerkira hasil metode kuadrat terkecil biasa (OLS), I

pemerkira a dan b juga mengikuti distribusi normal, dan bahwa pemerkira akan mengikuti distribusi khai-kuadrat(chi-square) khai-kuadrat (chi-square) =



. Sebelum kita membuat

interval keyakinan tentang koefisien A dan B dalam regresi, terlebih dahulu akan disinggung beberapa jenis distribusi yang erat sekali hubungannya dengan distribusi normal. Beberapa teori yang diungkapkan disini.

4.1.1 Beberapa teori tentang beberapa jenis distribusi yang erat sekali hubungannya hubungannya dengan distribusi distr ibusi normal.

Berikut ini akan diuraikan beberapa teori yang erat hubungannya dengan teori normal. Teori yang dikemukakan tanpa bukti ini sangat berguna dalam pemabahasan, baik teori perkiraan maupun pengujian hipotesis, antara lain fungsi fun gsi t,

, dan F.

Teori 4.1. kalau Z1, Z2,….

Zn merupakan variable bebas dan normal, masing-

masing dengan rata-rata maka Z =



dan variance

∑ Z , dimana  i

 ,

yaitu Zi

 N ( ,  ),

konstan dan semuanya nol, juga

 ∑   dan variance = ∑   , yaitu Z  N (M,  ) = N (∑    ∑  . mempunyai distribusi normal dengan rata-rata =


Zn merupakan variabel bebas dan normal, masing-

 N (0,1) merupakan normal yang baku (standar normal), maka Z = ∑  mengikuti distribusi   dengan derajat kebesar sebesar n, dinyatakan dengan symbol Z   masing dengan rata-rata nol dan variance 1, yaitu Zi

.


Zn merupakan variable acak yang bebas dan normal,

masing-masing mempunyai distribusi dengan derajat kebebasan

∑  akan mengikuti distribusi  dengan derajat kebebasan sebesar k, dimana k = ∑  , dinyatakan dengan symbol Z   Teori 4.4. kalau Z merupakan variable normal standard, yaitu Z  N (0,1) dan Z mengikuti distribusi   dengan derajat kebebasan sebesar k, dimana Z sebesar k, kemudian Z =

.

1

i

2 2

bebas terhadap Z1, maka variabel t yang kita definisikan sebagai berikut :

   t= =  √    √    (4.2)

mengikuti distribusi t dari student dengan derajat kebebasan k. Teori 4.5. kalau Z1, dan Z2 masing-masing merupakan variabel bebas yang mengikuti distribusi

 dengan derajat kebebasan k dan k yaitu Z  1

2 ,

 dan Z   maka variabel F kita definisikan sebagai berikut. 2

F=

  (4.3)

1

Mempunyai distribusi F dengan derajat kebebasan k 1 dan k 2 Baik distribusi t,

, dan F sudah dibuat tabelnya. Untuk keperluan

pembuatan perkiraan interval dan pengujian hipotesis tabel – tabel tersebut sangat penting artinya.

4.2 Perkiraan Interval untuk Koefisien dan Kesalahan Pengganggu Pengganggu

Bahwa dengan asumsi kenormalan tentang

, pemerkira hasil OLS a dan

b juga mengikuti distribusi normal dengan rata-rata dan varian masing-masing. Dengan demikian, maka variabel Z yang kita definisikan adalah sebagai beri kut.

    ∑    



Merupakan variabel normal yang standar, yaitu Z N (0,1). Berdasarkan hal ini, kita bisa menggunakan distribusi normal untuk membuat pernyataan probabilitas tentang b dengan syarat bahwa varian kesalahan pengganggu

 diketahui..

 diketahui, suatu sifat penting yang memiliki variabel dengan distribusi normal dengan kata-kata  dan varian   ialah bahwa daerah di bawah kurva normal antara    (berjarak satu deviasi standar dari rata-rata), kurang lebih sebanyak 68%; antara  (berjarak dua standar deviasi dari rata-rata), kurang lebih sebanyak 95%; dan antara  (berjarak tiga deviasi standar dari rataApabila

rata), kurang lebih sebanyak 99,7%

Perhatikan gambar berikut!







    

 

 jarang sekali diketahui, sehingga harus diperkirakan dengan perkiraan tidak bias  , di mana       Dengan jalan mengganti  dengan  dalam persamaan (4.4), maka kita peroleh Dalam praktiknya,

persamaan sebagai berikut.

        ∑     Dapat ditunjukan bahwa t mengikuti distribusi t dengan derajat kebebasan sebesar (n-2). Persamaan (4.4) menggunakan sedangkan persamaan (4.5) menggunakan

 mengikuti ditribusi normal,

 mengikuti ditribusi t. Uraian lebih

lanjut tentang persamaan (4.5) adalah sebagai berikut. Misalkan :

        ∑ 

     Dan     Apabila   diketahui, Z akan mengikuti distribusi normal yang baku (standar normal), yaitu   , artinya mempunyai rata-rata nol dan varian satu. Sedangkan  mengikuti distribusi khai-kuadrat dengan derajat kebebasan (n-2), berdasarkan teori 4.4, variabel t berikut.

 √    Akan mengikuti distribusi t dengan derajat kebebasan (n-2). Apabila

dan  di

atas kita masukan, akan kita peroleh hasil berikut.

  √     √     √       ∑        Oleh karenanya, untuk membuat perkiraan interval B, kita akan menggunakan distribusi t sebagai pengganti normal berikut.

       Di mana t seperti dalam persamaan (4.5),

 diperoleh dari tabel t dengan derajat

kebebasan sebesar (n-2). Dengan mengganti t seperti dalam persamaan (4.5), maka kita peroleh pernyataan probabilitas sebagai berikut.

       

Sekarang perhatikan gambar berikut!

     I II

   menjadi       menjadi         menjadi      menjadi — —    II.    I.

Kemudian I dan II digabung dan kita peroleh bentuk pernyataan probabilitas sebagai berikut.

         Rumus perkiraan interval B menjadi :

                         ∑  ∑  Di mana

   ∑    ∑    ∑  Contoh soal 4.1 :

Buat perkiraan interval untuk B, kalau tingkat keyakinan sebesar 95%, apabila diketahui : b

= 0,5446

Se

=

√  =  

= 1,4318880898403

   1-a

= 0,95

Tingkat keyakinan 95%

a

= 0,5

Kesalahan yang diterima

a/2

= 0,25

Jawaban :

Sb =

√   ∑ 

√   √   Sb =  Sb =

Sb = 0,1120902477704 0,1120902477704

                      0,5446+   0,5446-  0,5446 – 0.3566711684054    0,5446+ 0.3566711684054 0.3566711684054 0,1879288315946    0,9012711684054 0,1879    0,9013 Dari tabel t,

Kalau upah naik Rp50.000,00 maka interval antara Rp1.879 sampai Rp9.013 diharapkan akan memuat nilai B sebenarnya dengan tingkat keyakinan 95%

Contoh soal 4.2 :

Buat perkiraan interval untuk B, kalau tingkat keyakinan sebesar 95%, apabila diketahui : b

= 0,653102123 0,653102123

  n

= 5

(1-a) = 0,95 a

= 0,05

Dari tabel t,

     

Jawaban :

                0,653102123+    0,653102123-  0,653102123 – 0.098840773    0,653102123+ 0.098840773 0,55426135    0,751942896 0,5543    0,7519 Dengan tingkat keyakinan sebesar 95%, dalam jangka panjang kita harapkan bahwa interval seperti (0,55426135 - 0,751942896) akan memuat nilai parameter yang sebenarnya. Kita tidak dapat mengatakan bahwa dengan probabilitas sebesar 95%, interval khusus 0,55426135 sampai 0,751942896 akan memuat nilai parameter B yang sebenarnya. Oleh karena interval ini konstan, bukan acak (random) lagi, maka nilai parameter B sebenarnya bisa di dalam interval atau tidak. Probabilitas bahwa suatu interval khusus yang konstan memuat B ialah 1 dan 0.

Soal 4.3

Berdasarkan data dari Biro Pusat Satistik, dimana X

= PDRB dalam milliar

Y

= Konsumsi dalam milliar TAHUN 2006

X 29.473,644

Y 9.824,3

2007

31.907,546

10.568,85

2008

34.595,450

9.230,04

2009

37.570,568

8.298,59

2010

40.545,686

8.851,38

Buat perkiraan interval koefisien regresi dengan tingkat keyakinan sebesar 95%!

Jawab : Tahun 2006 2007 2008 2009 2010 Total

X 29.473,64400 31.907,54600 34.595,45000 37.570,56800 40.545,68600

Y 9.824,30000 10.586,85000 9.230,04000 8.298,59000 8.851,38000

X2 868.695.690,63874 1.018.091.491,74212 1.196.845.160,70250 1.411.547.579,84262 1.643.952.653,21060

Y2 96.516.870,49000 112.081.392,92250 85.193.638,40160 68.866.595,98810 78.346.927,90440

XY 289.557.920,74920 337.800.403,37010 319.317.387,31800 311.782.739,89912 358.885.274,14668

174.092,89400

46.791,16000

6.139.132.576,13657

441.005.425,70660

1.617.343.725,48310

Belanja statistic : N=5

̅ = 34.818,5788 ̅ = 9.358,232 ∑ ∑ ∑ ∑  =   = -11.857.966,1203077

   ∑   ∑ ∑ 

  =  

= 77.465.427,8775263 77.465.427,8775263

   ∑   ∑ ∑ 

   =  

= 3.122.894,87748

∑  ∑   = 

b =

= -0,1530743

∑    =

= 1.815.149,8592724

   = ∑ =

  

= 435.915,0060692

   Var(b)=    =  = 0,0056272

    =  

S b =

= 0,0750147

  ta/2 = 0,025

pembuatan interval keyakinan

 

= b – t Sb

   b + tS

b

   

= -0,1530743 – 3,182(0,0750147) 0,1530743 + 3,182(0,0750147) 3,182(0,0750147) = -0,1530743 – 0,2386968 -0,1530743 + 0,2386968 = -0,3917711 0,0856225

 

Dengan tingkat keyakinan sebesar 95%, diharapkan dalam jangka panjang, interval seperti -0,3917711 sampai 0,0856225 akan memuat B.

Contoh soal 4.4 :

Buat perkiraan interval

 = 2,050303333 Df = n-2 = 5-2 =3



dengan tingkat keyakinan 95% apabila diketahui :

Jawaban :

                         Artinya dengan probabilitas 95%, dalam jangka panjang kita harapkan bahwa interval antara

 sampai  akan memuat 

Contoh soal 4.5

Buat perkiraan interval

 = 80,88625987



dengan tingkat keyakinan 95% apabila diketahui :

Df = n-2 = 5-2 =3

    Jawaban :

                               Dengan tingkat keyakinan 95%, diharapkan dalam jangka panjang internal seperti 25,96 sampai 1124,46

4.3 Pengujian Hipotesis Koefisien Regresi

Pengujian hipotesis statistik (statistical testing hypothesis) sifatnya kuantitatif, jadi setiap hipotesis yang kita maksudkan harus dinyatakan dengan angka-angka. Persoalan pengujian hipotesis secara statistika mungkin bisa dinyatakan secara sederhana sebagai berikut: Apakah data observasi / empiris dari hasil penelitian sampel cukup erat hubungannya dengan hipotesis yang dinyatakan / disebutkan, atau tidak ? sehingga kita bisa sampai kepada keputusan untuk menolak atau menerima hipotesis yang telah dinyatakan. Jadi, apabila beberapa teori atau pengalaman yang telah lalu membuat kita mempercayai bahwa koefisien arah B dari regresi konsumsi mingguan terhadap upah mingguan, dalam contoh soal diketahui tingkat keyakinan sebesar 0,90, apakah hasil hitungan b = 0,5446 yang diperoleh dari sampel akan konsisten dengan hipotesis yang sudah dinyatakan sebelumnya? Kalau memang ya, kita dapat menerima hipotesis, tetapi kalau tidak kita harus menolak hipotesis tersebut. Dengan menggunakan bahasa statistik, hipotesis yang telah dinyatakan

. Hipotesis nol ini diuji melawan hipotesis alternative (alternative hypothesis) dengan symbol  dikenal dengan hipotesis nol (null hypothesis) dan diberi simbol

, yang menyatakan misalnya, bahwa koefisien arah atau koefisien regresi tidak sama dengan 0,90. Hipotesis alternative bisa sederhana (simple) atau komposit (composite). Misalnya,

 : B = 0,90, ini sederhana, sedangkan kalau  : B ≠

0,90, ini komposit. Teori pengujian hipotesis berkenaan dengan pengembangan aturan-aturan atau prosedur untuk memutuskan apakah kita harus menerima atau menolak

 berarti menerima , sebaliknya, kalau menerima  berarti menolak  . Biasanya kita berkenaan dengan  , keputusan menerima  hanya merupakan kosekuensi logis saja. Sebetulnya, ada dua hipotesis nol. Sebetulnya, menolak

pendekatan yang saling berkomplementer, untuk menentukan aturan-aturan yang dimkasud, yaitu interval keyakinan (confidence intervals) dan uji signifikan (test of significant). Kedua pendekatan tersebut menyebutkan bahwa pengujian hipotesis meliputi pembuatan pernyataan tentang nilai-nilai parameter dari distribusi tersebut.

Sebagai contoh, kita tahu bahwa dengan asumsi kenormalan, b juga mengikuti fungsi normal dengan rata-rata = E(b) dan var(b) =

 / ∑  . Kalau

kita membuat hipotesis bahwa B = 0,90, kita telah membuat pernyataan tentang salah satu parameter dari distibusi normal, yaitu mengenai rata-ratanya. Sebagian besar dari pengujian hipotesis hipote sis yang dibahas akan mempunyai semacam ini, yaitu membuat pernyataan tentang satu atau beberapa nilai parameter dari beberapa distribusi probabilitas, seperti normal, t, F, dan khai kuadrat.

4.3.1 Pengujian Hipotesis dengan Pendekatan Pendekatan Interval Keyakinan

Untuk membahas pendekatan interval keyakinan, misalnya kita mempunyai hipotesis sebagai berikut:

 : B = 0,90  : B ≠ 0,90 Perhatikan bahwa pengujian hipotesis nol merupakan hipotesis sederhana, sedangkan hipotesis alternatifnya komposit. Apakah perkiraan b = 0,5446cukup

 ?

dekat dengan

Apabila diketahui : 0,1879

≤ B ≤ 0,9013

Kita mengetahui bahwa dalam jangka panjang interval keyakinan tersebut akan memuat nilai B sebenarnya, dengan probabilitas (tingkat keyakinan) sebesar 0,95 atau 95%. Konsekuensinya, dalam jangka panjang (sampel yang di ulangulang), interval yang demikian itu akan merupakan suatu jarak (range) di mana di dalamnya akan terletak nilai B dengan tingkat/koefisien keyakinan sebesar 95%. Dengan demikian, interval keyakinan merupakan suatu himpunan dari hipotesis nol yang dapat diterima. Oleh karena itu, kalau ternyata nilai B sesuai

 : B =0,90, ternyata tercakup di dalam interval keyakinan dengan koefisien/tingkat keyakinan sebesar 95%, maka  dengan hipotesis nol, dalam hal ini

diputuskan untuk diterima, kalau ternyata tidak tercakup (terletak di luarnya),

 tersebut.

harus ditolak

Pengujian hipotesis dengan pendekatan interval keyakinan terdiri dari langkah-langkah berikut:

Pertama: Menghitung perkiraan interval dengan tingkat keyakinan yang sudah

ditentukan, dalam hal ini 95%. Perkiraan interval yang diperoleh adalah 0,70995 ≤ B ≤ 1,00125. Kedua: Kita cek, apakah nilai B sesuai dengan nilai hipotesis nol, dalam hal ini,

 : B = 0,90, terletak dalam interval tersebut atau tidak? Kalau ya,  kita terima, kalau tidak,  kita tolak. Dalam soal yang kita hadapi,  : B = 0,90 ternyata terletak dalam interval, jadi  kita terima. Contoh Soal 4.6

X = Pendapatan per bulan dalam ribuan Rp Y = Konsumsi per bulan dalam ribuan Rp X

100

90

80

125

150

200

Y

80

70

60

85

100

150

Uji pendapatan bahwa koefisien regresi sebesar 0,80 dengan alternative tidak sama

dengan

itu.

Penggunaan

tingkat

menggunakan pendekatan interval keyakinan. Pemecahan

 : B = 0,80  : B ≠ 0,80  = 0,10, Jadi 1 –  = 1 – 0,10 = 0,90                    

signifikan

sebesar

0,10

dengan

X

Y





XY

100

80

10000

6400

8000

90

70

8100

4900

6300

80

60

6400

3600

4800

125

85

15625

7225

10625

150

100

22500

10000

15000

200

150

40000

22500

30000





 

 

 

745

545

102.625

54.625

74.725

∑  = ∑    ⁄ ⁄   ∑  ∑  ∑ ∑ ⁄ ⁄  49.504,17  ∑   ∑    ∑  ∑       ⁄    ∑∑  0,6970 ∑  ∑    ∑     

 ∑        ∑     Dari tabel t,  2,132, derajat kebebasan = df = 4 Perkiraan interval B sebagai berikut:

    Oleh karena interval keyakinan antara 0,5456 dan 0,8484 memuat nilai B = 0,80, maka

 kita terima dengan tingkat kepercayaan sebesar 0,90 atau 90%. Dengan

perkataan lain, pendapat yang menyatakan bahwa bahwa B = 0,80 dapat diterima.

Contoh Soal 4.7 Dengan menggunakan contoh soal 3.2, misalnya kita menganggap bahwa

besarnya MPC (Marginal propensity to consume) yang dinyatakan dalam parameter B sebesar 0,4 dengan alternative tidak sama. Pergunakan tingkat signifikan sebesar 0,05 dengan pendekatan perkiraan interval. Pemecahan

     Berdasarkan contoh soal 4.2, sudah kita hitung bahwa dengan tingkat keyakinan sebesar 95%, dalam jangka panjang, interval 0,55426135 sampai dengan 0,751942896 akan memuat nilai parameter B. Interval keyakinan 0,55426135 < B < 0,751942896 ternyata tidak memuat nilao hipotesis nol B = 0,4 ditolak. Jadi, hipotesis atau pendapat bahwa MPC = B = 0,4 ditolak. Probabilitas untuk mendapatkan nilai B = 0,4 (sebelah kiri nilai batas bawah) sebesar 0,025 (2,5%).

2,5%

2.5% 0,55426135

0,751942896

95% nilai batas bawah

nilai batas atas

Pengujian hipotesis dengan pendekatan perkiraan interval terdiri dari dua tahap yang harus diperhatikan, Pertama : Dihitung perkiraan interval dari parameter yang bersangkutan, dengan tingkat keyakinan tertentu, yaitu

. Nilai   atau 0,05.

Kedua : Kemudian dicek, apakah nilai parameter berdasarkan hipotesis nol terletak di dalam interval atau tidak. Kalau ya,

 diterima, kalau tidak, 

ditolak.

4.3.2 Pengujian Hipotesis dengan Pendekatan Pendekatan Uji Signifikan (Nyata)

Pendekatan lainnya yang sifatnya komplementer terhadap metode interval keyakinan dalam pengujian hipotesis secara statistik ialah pendekatan ujisignifikan yang dikembangkan oleh R.A. Fisher secara independen dan bersamasama oleh Neyman dan Pearson. Secara umum, dapat dikatakan bahwa suatu uji-signifikan adalah suatu prosuder untuk suatu hasil perhitungan berdasarkan sampel, untuk memeriksa benar tidaknya suatu hipotesis nol. Ide pokok yang mendasari me ndasari uji-signifikan ialah suatu pemerkira (estimator) dan distribusi sampling dari pemerkira yang demikian itu di bawah hipotesis nol. Keputusan untuk menerima atau menolak

 dibuat

atas dasar nilai pemerkira yang diperoleh dari data empiris / hasil observasi dari sampel. Maksudnya, untuk menguji benar tidaknya nilai parameter yang dinyatakan dalam

, akan dipergunakan suatu criteria uji (btest criteria) yang

dihitung berdasarkan sampel yang diteliti. Untuk ilustrasi, ingat bahwa dengan asumsi kenormalan, variable t berikut ini:

    ∑   

akan mengikuti mengikuti t dengan kebebasan kebebasan sebesar (n - 2). Apabila Apabila nilai B sudah jelas

  ∑  dinyatakan dalam  , maka nilai t dari   langsung dapat dihitung dari sampel yang bersangkutan, sehingga dapat dipergunakan sebagai criteria uji, sebagai dasar untuk memutuskan menerima atau menolak

. Oleh karena uji

criteria ini mengikuti distribusi t, maka pernyataan interval keyakinan seperti berikut ini dapat dibuat.

⁄     ⁄    di mana  ialah nilai B sesuai dengan  . Nilai ⁄ , ⁄ dapat diperoleh dari tabel t dengan derajat kebebasan sebesar (n - 2). Perhatikan uraian berikut :

⁄     ⁄ ⁄      ⁄ ⁄     akan menjadi ⁄   I.     ⁄ akan menjadi   II. Setelah I dan II digabung, kita peroleh hasil berikut.

(⁄      ⁄)    yang merupakan interval di mana b akan tercakup (terletak di dalamnya) dengan probalitas sebesar (1

) dan    .

Dengan menggunakan bahasa pengujian hipotesis, 100(1

 )% interval

keyakinan di kenal dengan daerah penerimaan (accepted region) dari pengujian hipotesis, sedangkan daerah di luar interval keyakinan tersebut dinamakan daerah penolakan (rejected region) dan sering disebut daerah kritis (critical region). Betapa eratnya hubungan antara pendekatan interval keyakinandan uji

(⁄  (⁄     

hipotesis dapat dilihat dengan jalan membandingkan persamaan

    ⁄)    ⁄)   .

dengan

persamaan

Di dalam prosedur interval keyakinan, kita mencoba membuat suatu batas (limit) berupa interval yang dihitung berdasarkan sampel, di mana dalam jangka panjang (sampel yang diulang-ulang), dengan tingkat keyakinan tertentu, kita harapkan

nilai parameter B yang tidak diketahui akan terletak; sedangkan dalam pendekatan uji-signifikan, kita membuat hipotesis atau anggapan mengenai nilai parameter B yang sebenarnya dan mencoba melihat apakah perkiraan b untuk parameter B yang dihitung berdasarkan sampel akan terletak dalam batas-batas yang pantas, sekitar nilai hipotesis tadi. Contoh Soal 4.8

Dengan menggunakan contoh soal 3.2, coba dicek apakah dapat diterima atau ditolak, dengan tingkat signifikan

 .

  

Pemecahan

Hasil perhitungan dari sampel sa mpel menunjukkan bahwa nilai b = 0,653102123, 0,653102123,

 , df = 3. Dengan   dari tabel t kita peroleh   = 3,182 (dengan df = 3)

                   0,301159227    0,498840773 Ternyata, nilai b = 0,653102123 terletak di luar interval keyakinan 0,301159227 sampai dengan 0,498840773, maka dari itu, keputusan yang harus kita ambil adalah menolak anggapan/hipotesis bahwa MPC = B = 0,4. Dalam praktiknya, kita tidak perlu menghitung interval keyakinan seperti dalam persamaan (4.16) secara eksplisit, kita hanya perlu menghitung nilai t berdasarkan rumus berikut

   

Kemudian kita lihat apakah nilai t ini terletak dalam interval antara dan

, kalau ya,  diterima, kalau tidak,  ditolak.



GAMBAR 4.2

Jelasnya sebagai berikut.

    ,  diterima. Kalau t <  atau t >  ,  ditolak.   Kalau

Dalam contoh ini,

     Oleh karena t >  , maka ditolak.  Untuk lebih jelasnya lihat gambar 4.3. Oleh karena menggunakan distribusi t, maka prosedur pengujian hipotesis di atas disebut uji t (t-test). Di dalam bahasa uji signifikan, dalam ilmu statistika, suatu nilai perkiraan ( statistic, tanpa s) dikatakan signifikan secara statistik apabila uji statistik berada dalam daerah kritis, yaitu daerah yang diarsir. Daerah ini disebut juga daerah penolakan. Dalam hal ini,

 diterima).

 ditolak (dengan sendirinya

GAMBAR 4.3

Dengan argumentasi yang sama, suatu uji dikatakan signifikan secara statistik apabila nilai uji berada di dalam daerah penerimaan. Dalam hal ini,

) diterima. Dalam contoh ini, uji t (t test) ternyata signifikan, hipotesis nol ( ) harus ditolak. Jadi, pendapat (hipotesis) yang menyatakan

hipotesis nol (

bahwa B = MPC = 0,4 tidak dapat diterima. Contoh pengujian hipotesis yang kita bahas di atas dikenal dengan nama uji dua arah atau two-sided atau two-sided atau two-tail test, karena kita berhubungan dengan dua ekor distribusi probabilitas (normal (normal test, t test ) yang merupakan daerah kritis (daerah penolakan) dan tolak

 kalau nilai t yang dihitung berdasarkan data hasil

observasi jatuh/berada dalam daerah penolakan tersebut. Perhatikan gambar berikut.

    ,  diterima. Kalau t <  atau t >  ,  ditolak.   Kalau

Disebut dua arah, karena hipotesis alternative dua arah, yaitu

 merupakan hipotesis komposit

 , yang berarti B bisa lebih besar atau lebih kecil dari

0,4. Misalkan pengalaman sebelumnya sebelumnya membuat kita mempunyai mempunyai

 (lebih besar dari 0,4).

 

Dalam hal ini,

     Walaupun  masih merupakan hipotesis komposit, tetapi sekarang hanya satu arah saja. Dalam hal ini, kita berhubungan dengan uji satu arah ( one-tail test ). ).

GAMBAR 4.4 Uji Signifikan Satu Arah Prosedur pengujian sama saja, kecuali bahwa nilai kritis atau batas keyakinan atas menjadi

 , yaitu sebesar 5%, bukan 2,5% seperti sebelumnya (lihat

gambar 4.4)

Ada dua cara uji satu arah, yaitu sebagai berikut.

Contoh Soal 4.9

Juga dari contoh soal 3.2, uji pendapatbahwa MPC = B sebesar 0,4 dengan alternative lebih besar dari itu, dengan tingkat signifikan sebesar 0,05. Pemecahan

              

Contoh Soal 4.10

Dengan menggunakan contoh soal 3.2, uji pendapat bahwa dengan alternatif tidak sama dengan 75, dengan menggunakan

 = 5%.

 = 75

Pemecahan :

                      = 3,235450395

        Oleh karena   = 3,235450395 terletk dalam interval 0,216 dan 9,348, maka  dapat diterima. Jadi, pendapat bahwa   =75 dapat dibenarkan. Uji semacam ini Karena

disebut uji signifikan khai-kuadrat (the ( the chi-square test of significance). significance).

4.4 Analisis Varian dalam Regresi

Dalam subbab 4.4 ini akan dipelajari analisis regresi dari sudut pandangan analisis varian dan mengenalkan kepada pembaca terhadap suatu cara yang komplementer dan jelas dalam melihat persoalan-persoalan statistic induktif atau statistical inference. Telah kita tunjukan suatu persamaan sebagai berikut.

∑  ∑    ∑   ∑   ∑ 

Kalau

∑  = TSS (=total sum of square) ∑   = ESS (=explained sum of square) ∑  = RSS (=residual sum of square) maka

∑  ∑    ∑  menjadi TSS = ESS + RSS, yang menunjukkan pemecahan / penguraian TSS menjadi dua komponen/bagian, yaitu ESS dan RSS TSS diperguanakan untuk menunjukkan jumlah variasi Y yang terdiri dari dua sumber variasi, yaitu ESS

berasal dari regresi, merupakan sumbangan/

penguraian TSS menjadi dua komponen/bagian, komponen/bagian, yaitu ESS dan RSS TSS dipergunakan untuk menunjukkan jumlah variasi Y yang terdiri dari dua sumber variasi, yaitu ESS berasal dari regresi, merupakan sumbangan yang disebabkan oloeh variable bebas X, dan RSS berasal dari kesalahan pengganggu. Studi mengenai komponen-komponen TSS disebut analisis vari9an (anavar), yang berarti analisis sumber-sumber variasi yang diukur dengan varian.

∑̂ disebut explained sum of square atau jumlah kuadrat yang bisa diterangkan, maksudnya ialah bahwa sumbernya itu jelas, yaitu pengaruh linear ( linear effect ) effect ) dari X. Sedangkan

∑  diksebut unexplained sum of square atau

jumlah kuadrat yang tidak bisa diterangkan , oleh karena sumber variasi memang tidak begitu jelas, sebab kesalahan pengganggu e meliputi variabel-variabel atau factor-faktor yang mempengaruhi Y, tetapi tidak dimasukkan kedalam persamaan regresi linear. Pada dasarnya, besarnya nilai derajat kebebasan merupakan selisih antara banyaknya observasi atau elemen sampel dengan banyaknya perkiraan yang akan dibuat. Jadi, kalau ada k perkiraan yang akan dibuat untuk memperkirakan k parameter, maka derajat kebebasan (df) sebesar ( n-k ). Untuk menghitung satu perkiraan, kita mempunyai df = ( n-1 ), sebab kehilangan kehilangan 1 kebebasan.

Contoh :

Tentukan 5 nilai variabel Y, sehingga rata-ratanya 5. Dalam hal ini, df = ( n -1)= 5-1 = 4, maksudnya kita bebas menentukan nilai dari 4 variabel yang pertama (4 kebebasan), sedangkan nilai variabel yang kelima tidak bebas lagi (kehilangan 1 kebebasan), sebab jumlah harus 25.

          ∑  = 25 ̅ = 5

  (bebas)   (bebas)   (bebas)   (bebas)   (bebas) ∑  = 25 ̅ = 5

Misalnya,

atau ,

  (bebas)   (bebas )   (bebas)   (bebas)   (bebas) ∑  = 25 ̅ = 5

Satu perkiraan yang dibuat, satu kebebasan hilang. Tabel Anavar Untuk Model Regresi Sederhana

Rata – rata

Sumber

Jumlah

Varian

Kuadrat (SS)

Dari Regresi (ESS)

∑    ∑ 

1

ESS/df =

∑ 

(n-2)

RSS/df=

Dari kesalahan Pengganggu (RSS)

df

Kuadrat (MS)

 ∑ 

∑ /(n-2) = 

Total jumlah Kuadrat (TSS)

∑ 

(n-1)

Dengan menganggap bahwa kesalahan pengganggu

i

mempunyai

distribusi normal dan H0 : B = ), da[at ditunjukkan bahwa variabel F sebagai berikut.

        ∑  ⁄        ⁄ = ∑  mengikuti fungsi F dengan derajat kebebasan 1 dan (n-2)

Contoh Soal 4.11

Berdasarkan contoh soal 3.2, uji pendekatan bahwa B = MPC = 0 dengan alternatif tidak sama dengan itu. Pergunakan analisis varian (anavar). Pemecahan : Diketahui

b

= 0,653102123

∑  ∑  ∑  n

= 83.830,6875 = 4.360.500 = 4.650 =5 Tabel Anavar

Sumber Variasi Dari regresi (ESS) Dari Kesalahan

Jumlah Kuadrat

f

(SS) 35.757,34122

35.757,34122

242, 65878

3

80,88626

36.000,00000

4

Total jumlah

F=

rata-rata kuadrat regresi Rata-rata kesalahan pengganggu

F= ESS RSS

Kuadrat (MS)

1

Pengganggu (RSS)

Kuadrat (TSS)

Rata-Rata

F 442,0694098

= 35.757,34122 35.757,34122 80, 88626 = 442,0694098 (**)

Tabel F

F0,05 (1)(3) = 10,13 F0.01(1)(3) = 34,12

Untuk

 = 0,05 (5%). Oleh karena F > F

0,05(1)(3)

, maka H0 ditolak. Pendapat /

hipotesis bahwa MPC=0 ditolak. Tidak benar B= 0. Untuk

 = 0,01 (1%). Oleh karena F > F

0,05(1)(3)

, maka H0 ditolak. Pendapat

bahwa B=0 Tidak benar .

Soal 4.12

Uji anggapan PDRB mempunyai konsumsi nasional dengan alternatif tidak ada pengaruhnya. Pergunakan analisis varian dengan

    . Data dari BPS

adalah sebagai berikut :

TAHUN 2006

X 29.473,644

Y 9.824,3

2007

31.907,546

2008

34.595,450

10.568,8 5 9.230,04

2009

37.570,568

8.298,59

2010

40.545,686

8.851,38

Jawab: b= -0,5130743

∑      2

=

=

1.815.149,8592724

   ∑   ∑ ∑ 

   =  

= 3.122.894,87748

∑ = ∑- ∑   2

= 3.122.894,87748 - 1.815.149,8592724 = 1.307.745,0182077 1.307.745,0182077 Sumber variasi

Dari regresi (ESS)

Jumlah kuadrat (ss) 1.815.149,8592724

df

Ratarata kuadrat (MS)

1

1.815.149,8592724

3

435.915,0060692

F

4,16399482

Dari kesalahan pengganggu (RSS)

Total jumlah kuadrat (TSS)

F= =

1.307.745,0182077

3.122.894,8774800

4

 

 

= 4,16399482 Dari table F0,05(1)(3) F 0,01(1)(3)

= 10,13 = 34,12

Oleh karena F< F0,05(1)(3), maka H0 diterima yang artinya memang ada pengaruh PDRB terhadap konsumsi daerah Kalimantan selatan.

4.5 Ramalan dengan Menggunakan Garis Regresi Linear Sederhana

Berdasarkan contoh soal 3.2, kita peroleh regresi sampel dengan persamaan sebagai berikut.

(4.21)   di mana   merupakan pemeriksaan ( ) dengan nilai variabel bebas X tertentu. 

Persamaan regresi linear sederhana ini dapat dipergunakan untuk meramalkan (to forecast or to predict) besarnya konsumsi (Y) untuk waktu yang akan datang apabila besarnya pendapatan (X) sudah diketahui. X diketahui, artinya sebagai berikut. a) Sudah terjadi, misalnya merupakan pendapatan waktu yang lalu. Dalam hal ini, X disebut variabel beda kala (lagged variabel) dengan simbol .





b) Hasil ramalan, misalnya misaln ya pendapatan tahun depan,dengan simbol . c) Pendapatan sekarang,dalam waktu yang bersangkutan, dengan simbol . Untuk meramalkan Y, nilai variabel X harus diketahui terlebih dahulu. Itulah sebabnya X disebut variabel bebas (independent variable) dan sering disebut explanatory variable, variable, artinya variabel yang menerangkan. Sedangkan, Y disebut variabel tidak bebas (dependent variable), variable), karena memang nilainya tergantung pada nilai X. Y = nilai hasil observasi, hasil pencatatan. Ŷ = nilai perhitungan berdasarkan persamaan garis regresi, sering disebut nilai regresi atau nilai teoretis. Y merupakan perkiraan atau ramalan Y. Ramalan pada dasarnya merupakan perkiraan terjadinya suatu kejadian (peristiwa) untuk waktu yang akan datang. Ada perkiraan jangka pendek, ada juga ramalan jangka panjang (short term and long term forecasting) . Ramalan (produksi, penjualan, ekspor, penerimaan negara, pendapatan nasional, konsumsi, dan variabel ekonomi lainnya) sangat diperlukan untuk dasar perencanaan. Ada dua macam ramalan untuk variable tidak bebas Y, yaitu ramalan untuk rata-rata Y dan individu Y nilai X tertentu, katakan = . Untuk selanjutnya, kita sebut ramalan rata-rata Y atau ramalAn (Y) dan ramalan individu Y. (Y)=expected (Y)=expected (Y) merupakan rata-rata. Dalam praktiknya, meramalkan (Y) juah lebih mudah dari pada meramalkan individu Y, sebab ratarata Y kurang bervariasi dibandingkan dengan Y, sebabnya ialah (Y) = A+BX terletak tepat pada garis regresi populasi, sedangkan Y terletak di sekitar garis regresi populasi. Lihat gambar berikut!









 



Y, E(Y)

E(Y/X) = A + BX

X

(Y), lengkapnya ditulis (/), dibaca rata-rata Y atau nilai harapan (expected value) Y, untuk X=   Titik-titik pada gambar menunjukkan nilai individu Y, untuk X tertentu, yaitu merupakan titik-titik koordinat: (   ),

), ...,( . Ramalan (Y/) disebut ramalan bersyarat (coditional forecast) , maksudnya hasil ramalan sangat tergantung pada nilai X=   . (

Misalnya, kalau X=biaya advertensi dan Y= hasil penjualan, maka ramalan hasil penjualan untuk waktu yang akan datang sangat tergantung kepada biaya advertensi. Juga misalnya, kalau X = pendapatan nasional atau investasi nasional dan Y = konsumsi nasional atau PDB, maka ramalan konsumsi nasional atau ramalan PDB yang akan datang sangat tergantung kepada tinggi rendahnya pendapatan nasional atau investasi nasional yang kita beri simbol X= . Untuk membedakan nilai ramalan atau bukan, maka untuk nilai ramalan rata-rata Y kita beri simbol ( ), kita baca ramalan rata-rata Y kalau X =



 

dan ramalan individu Y diberi simbol (





), dibaca untuk meramalkan rata-rata

Y = (Y) maupun individu Y, nilai X harus diketahui terlebih dahulu. Perlu dibedakan nilai ramalan tunggal (point forecast) , yaitu ramalan yang terdiri dari satu nilai saja, dan ramalan interval, di mana kita harapkan bahwa nilai yang kita ramalkan tersebut akan terletak dalam interval yang kita buat berdasarkan data sampel dengan menggunakn tingkat atau koefisien keyakinan tertentu, katakan 90% atau 95%



4.5.1 Ramalan Rata-Rata Y atau (Y) Dengan menggunakan persamaan garis regresi yang sudah di buat berdasarkan data sampel berikut:

 , maka Y nol topi menjadi = a + b  , di mana a = 24,4545 dan b = 0,5091. Sekarang, misalnya sudah diketahui X =   = 100, kita ingin meramalkan nilai rata-rata Y, yaitu (   ), maka perkiraan tunggal dari rata-rata Y dapat diperoleh dengan jalan memasukkan X =   = 100 ke dalam persamaan garis regresi:  = a + b  Ŷ = a + bX, maka kalau X =





= 24,4545 + 0,5091(100) = 24,4545 + 50,91 = 75,3645

(). Dapat ditunjukkan bahwa  merupakan perkiraan linear tunggal (   ) yang tidak bias dan varian yang minimum atau Di mana  perkiraan





BLUE (best linear unbiased estimators) .

Oleh karena  (Y nol topi) merupakan suatu pemerkira (estimator) ), maka nilainya sebagai perkiraan akan berbeda-beda, dari sampel ke

(



() akan memberikan gambaran mengenai kesalahan tersebut, kita perlu mengetahui distribusi sampling  . Hal ini dapat ditunjukkan oleh karena  merupakan sampel akan bervariasi. Perbedaan antara nilai



dengan

fungsi kesalahan pengganggu yang berdasarkan asumsi mempunyai distribusi

normal dengan rata-rata nol dan varian  , maka normal dengan rata-rata ( ) = (A + ) dan

 





 juga mempunyai distribusi

         var(  ) =  [ +  ∑   Dengan jalan mengganti t sebagai berikut. t = (4.23) Di mana

(4.22)

 dengan , perkiraannya kita peroleh variabel

  





  =    (perkiraan standard error ),   = perkiraan var(, 

Ŷ

Ŷ

maka t mengikuti distribusi dengan derajat kebebasan (n – 2). Dengan demikian, maka t ini dapat digunakan untuk membuat perkiraan interval atau menguji hipotesis mengenai .

    = A + B t =

  





 ≤ t   ) = 1 –    ≤  - ≤   -   ≤       ≤   

P(-











I I.

   ≤   )   ≤  +        ≤         ≤ ) -







II.

II

 







I dan II digabung akan memperoleh perkiraan interval untuk tingkat keyakinan sebesar (1 – ) sebagai berikut.



) dengan

     ≤  ≤   +   



(4.24)





   =    ∑

di mana  = a + b





  

diperoleh dari tabel t dengan derajat kebebasan (n – 2)



Contoh Soal 4.13

Dengan menggunakan data contoh soal 3.2, buat perkiraan/ramalan interval E(Y) kalau X = Pemecahan

 = 100! Pergunakan tingkat keyakinan 95%.

         var( ) =  [ +  ∑  = 80,88625987 = 80,88625987

        [    ]  ] [  

= 80,88625987 ( 10,75936375 ) = 870,2846921

  

   = 29,500588 = a + b  =

= 250,218655 + 0,653102123(100) = 250,218655 + 65,3102123 = 315,5288673

      +  ≤

)≤

315,5288673 –

3,182(29,500588)

3,182(29,500588) 315,5288673 – 93,870871 ≤ 221,6579963 ≤





≤



)

≤

315,5288673

+

) ≤ 315,5288673 + 93,870871

) ≤ 409,3997383

Kalau X = 100, dengan tingkat keyakinan 95%, dalam jangka panjang interval 221,6579963 sampai 409,3997383 akan memuat



Perkiraan tunggal untuk (Y), yaitu

 = 315,5288673

(Y) = rata-rata Y.

SOAL 4.14 Dengan menggunakan data berikut, buat ramalan interval rata-rata Y kalau

X=1000 dengan tingkat keyakinan 95%. Dimana X Y

= pendapatan rata-rata per bulan dalam jutaan rupiah = tabungan rata-rata perbulan dalam jutaan rupiah

TAHUN 2006

X 72.445,766

Y 40.854,481

2007

83.312,633

51.095,756

2008

95.809,466

71.434,944

2009

110.180,883

82.408,203

2010

126.708,025

99.318,846

Jawab : X

Y

X2

Y2

XY

72.445,7660000

40.854,4810000

5.248.389.011,326760

1.669.088.617,77936

2.959.734.170,57745

83.312,6330000

51.095,7560000

6.940.994.817,392690

2.610.776.281,21154

4.256.921.967,48555

95.809,4660000

71.434,9440000

9.179.453.775,205160

5.102.951.224,28314

6.844.143.838,37990

110.180,8830000

82.408,2030000

12.139.826.978,659700

6.791.111.921,68921

9.079.808.572,98325

126.708,0250000

99.318,8460000

16.054.923.599,400600

9.864.233.170,77172

12.584.494.821,93910

488.456,7730000

345.112,2300000

49.563.588.181,9849000

26.038.161.215,7350000

35.725.103.371,365300

N=5

∑   ∑   ∑  = 49.563.588.181,9849 49.563.588.181,9849 ∑  = ∑   ∑ ∑ ∑ ∑ 26.038.161.215,735

=

  

= 2.010.622.133,63854

   ∑   ∑ ∑ 



=

  

= 1.845.364,07019

   ∑   ∑ ∑ 

  =  = 2.217.670.956,62038

∑  ∑   = 

b =

= 1,0894230

̅  ̅

a= = 69.022,446 - 1,0894230(97.691,354) = -37.404,7667830



Untuk X = 00.000

 = a +b ̅

= -37.404,7667830 -37.404,7667830 + (1,0894230)(97.691,354) (1,0894230)(97.691,354) = 71.537,5374964 71.537,5374964

 ∑   =

=

2.190.418.082,737640

   = ∑ =

 

= 9.084.291,2942476 Se = 3.014,015808

 = S    ∑̅     = 3.014,015808 3.014,015808         3.014,015808    = 3.014,015808   e

=

= 3.014,015808 ( 1,7573405) = 5.296,652104

  = = 3,182       +  ≤

)≤

71.537,5374964 – 3,182(5.296,652104) ≤ +3,182(5.296,652104) 71.537,5374964 – 16.853,94699 ≤ 54.683,59050 ≤







) ≤ 71.537,5374964

) ≤ 71.537,5374964 + 16.853,94699

) ≤ 88.391,48448

Kalau X = 100.000, dengan tingkat keyakinan 95%, dalam jangka panjang



interval 54.683,59050 sampai 88.391,48448 akan memuat (Y) = rata-rata Y. Jadi, kalau pendapatan Rp100.000.000, dengan tingkat keyakinan 95%, dalam jangka panjang, interval antara Rp5.469.359.050.000,00 sampai Rp8.839.148.448.000,00 akan memuat rata-rata tabungan sebenarnya. 95% 2,5 %

2,5 %

Rp5.469.359.050.000,00

Rp8.839.148.448.000,00

Rata-rata tabungan yang sebenarnya dalam interval

4.5.2. Ramalan Individu Y Apabila kita ingin meramalkan individu Y, yaitu  untuk nilai X =





,

dapat ditunjukkan bahwa pemerkira  = a + b selain untuk memperkirakan rata-rata Y, yaitu ), juga dapat untuk memperkirakan individu Y, yaitu



 . Artinya, baik perkiraan untuk  maupun untuk  sama, yaitu nol topi), tetapi var (  ) sebagai berikut. 

         var( ) =  [1 + +  ∑  ]

 diganti , maka   =      ∑   = perkiraan standard perkiraan standard error 

Kalau







 (Y



(4.25)

t

   , ( 



=



 di baca  dengan syarat X = 

akan mengikuti fungsi t dengan derajat kebebasan sebesar (n – 2).

≤ t  ) = 1 –     - ≤    ≤   -   ≤      ≤    P(-











I I.

   ≤     ≤  +       ≤         ≤  -







II.

II

 







I dan II digabung, diperoleh rumus perkiraan interval individu Y dengan tingkat keyakinan sebesar (1 – ) sebagai berikut.

      ≤  ≤



(4.26)



   

 +



di mana

   =      ∑  = a + b





 dari tabel t dengan derajat kebebasan (n – 2). Contoh Soal 4.15

Dengan menggunakan contoh soal 3.2, buat ramalan interval individu Y, dengan tingkat keyakinan 95%, kalau X = 100!

Pemecahan

      +   ≤

≤

di mana

         =       ∑ 





= 250,218655 + 0,653102123

X = 100

= 250,218655 + 0,653102123(100) = 250,218655+ 65,3102123 = 315,5288673

 = 80,88625987  8,993678884            = 8,993678884  = 8,993678884

  

= 8,993678884

  

= 8,993678884 (3,429192871) = 30,84105951

 = 3,183 315,5288673 – 3,182(30,84105951) ≤ 315,5288673 – 98,13625136 ≤ 217,3926159 ≤







≤ 315,5288673 + 3,182(30,84105951)

≤ 315,5288673 + 98,13625136

≤ 413,6651187

Kalau X = 100, dengan tingkat keyakinan 95%, interval antara 217,3926159 sampai 413,6651187 , dalam jangka panjang akan memuat nilai individu Y.

4.5.3 Cara Melaporkan Hasil Analisis Regresi Banyak hasil penelitiaan ekonomi secara kuantitatif yang hasilnya sukar di mengerti, khususnya hasil analisis ekonometri dengan disertai berbagai macam angka atau simbol-simbol yang sering kali kurang dimengerti oleh penbaca. Dalam hal ini, untuk melaporkan analisis regresi, perlu diperhatikan hal-hal berikut. Pertama : Persamaan garis regresi yang dihitung dari sampel, lengkap dengan segala koefisiennya Ŷ = a + bX.

bagi setiap koefisiennya, Ŷ = a + bX : Diikutsertakan standard Diikutsertakan standard error bagi ( )( = standard error (a), error (a), diletakkan di bawah a = standard error (b), error (b), diletakkan di bawah b Ketiga : Diikutsertakan nilai t yang masing0masing berdasarkan sampel langsung di bawah dan . t di bawah dan , masing-masing berdasarkan sampel rumus berikut.

Kedua

  

 

 

    =  dan  = 

Y = a + bX

    

( )( ) ( )( ) Keempat :Diikutsertakan nilai koefisien determinasi ( ) dan standard error regresi atau standard error kesalahan pengganggu ( ) Ŷ = a + bX ( ) ( ) ( ) ( ) df = n – 2

 



      

Kegunaan masing-masing di dalam penyajian hasil analisis regresi adalah sebagai berikut. Pertama : persamaan regresi Ŷ = a + bX digunakan untuk meramalkan )



  

 



atau ) setelah X= diketahui.  = a + b selain merupakan ramalan untuk ) juga merupakan ramalan ). Kedua : Standard error dan untuk mengukur tingkat ketelitian pemerkira a dan b. Makin kecil standard error suatu pemerkira, makin teliti pemerkira tersebut, maksudnya makin dekat dengan nilai parameter yang akan diperkirakan. Jadi, makin kecil dan , makin dekat a dengan A dan b dengan B. 0, berarti a A, kalau =0,a=A 0, berarti b B, kalau = 0, b = B (Dalam praktiknya, standard praktiknya, standard error tidak pernah nol). Ketiga : Nilai t, dan dan dapat untuk menguji hipotesis tentang parameter A dan B.







 



 

 



Keempat : Koefisien determinasi ( ) untuk mengukur tepat / cocoknya persamaan regresi untuk meramalkan. Makin besar , makin tepat garis untuk meramalkan Y, sebab makin besar persentase sumbangan X, terhadap varian (naik turunnya) Y digunakan standard error er ror regresi atau standard error kesalahan pengganggu untuk mengukur betapa dekatnya nilai-nilai individu Y hasil garis regresi Ŷ = a + bX.







Makin kecil , berarti makin dekat nilai-nilai individu Y terhadap garis regresi, sehingga makin tepat / cocok garis regresi tersebut untuk meramalkan Y kalau X sudah diketahui Perhatikan gambar berikut. (Y, Ŷ)

(Y, Ŷ)

. .

.

.

. .

.

.

.

. .

.

. .

.

.

.

Garis regresi

.

. .

.

.

Garis regresi

. . .

.

Se besar

(Titik-titik menunjukkan letak individu Y, jauh dari garis regresi)

Se kecil

(Titik-titik menunjukkan letak individu Y, jauh dari garis regresi)

Jadi, untuk mengukur kecocokan / ketepatan suatu garis regresi untuk meramalkan ( goodness of fit ), ), dapat dipergunakan nilai yang makin besar, makin baik atau yang makin kecil baik.





46

DAFTAR PUSTAKA Supranto, J. 2005. Ek onometri. Jakarta. Ghalia Indonesia Badan Pusat Statistika. Kalimantan Selatan dalam angka.

47

Perkiraan Interval Dan Pengujian Hipotesis Dalam Regresi Sederhana

Recommend Documents