Modul Ordinary Ordinary Least Square Square dan Simultan Wisnu Harto Adi W June 12, 2012 Abstract
Dalam modul ini, akan akan disampaik disampaikan an secara sederhana penggunaan penggunaan software Stata (versi 11 maupun 12) untuk pengolahan statistik secara sederhana. sederhana. Model yang dipilih adalah OLS dan Simultan, dikarenak dikarenakan an penggunaan OLS maupun Simultan lebih luas jika dibandingkan metode pengolahan statistik yang lain (seperti GMM, Panel, ARIMA, dsb). Modul ini boleh dibagikan secara bebas sesuai dengan lisensi bebas GNU/Linux. GNU/Linux. Software Software yang dipergunak dipergunakan an untuk penulisan modul dan presentasi (slide ) juga mempergunakan software bebas berlisensi GNU/Linux. Terimakasih untuk SloveniaX TPB untuk Stata 12 SE, Linux, serta Acer 4530 gue SchachNoir.
1
Penge engena nala lan n Data Data
Dalam setiap penelitian, bagian pertama yang harus kita lakukan pasti adalah manajemen data. Secara Secara sederhana, sederhana, Stata dapat mempergunak mempergunakan an fungsi copy copy - paste yang ada secara langsung. langsung. Perinta Perintah h yang dipergunakan dipergunakan adalah “edit “ edit ”, ”, selanjutnya dipergunakan “bro” atau browse (read-only ). ). Beberapa perintah dalam Stata untuk data manajemen: •
edit —— Mengubah / Input Data
•
bro —— Melakukan Pembacaan data
•
sysuse —— Untuk mengambil *.dta dari sistem internal
•
webuse —— Import *.dta dari internet
Untuk mempermudah input data, dalam modul akan dipergunakan data automobile di USA (auto.dta)1 dengan menggunakan perintah: clear sysuse sysuse auto 1
*.dta adalah format file dalam Stata, sama seperti *.db dalam Database Query , ataupun *.wf1 (Eviews), *.sav (SPSS / PSPP), dan *.xlsx (Excel 2007 / 2010)
1
Figure 1: Browse dan Edit Maka kita akan Maka akan mendapatk mendapatkan an dataset dataset secara secara otomatis otomatis dari sistem untuk untuk bisa kita pakai. pakai. Jika Jika tidak, kita bisa melakukan melakukan impor data secara secara langsung dari file spreadsheet seperti Lotus123, Excel, maupun LibreSpreadsheet dengan cara melakukan copy - paste ke spreadsheet Stata (ketik edit).
2
Data Data Desk Deskri ript ptif if Sede Sederh rhan ana a
Stata bisa dipergunakan untuk berbagai pengolahan data deskriptif, dari pengolahan berbasis statistik sederhana (tabulasi, cross-tab, cross-tab , ranking, statistik sebaran data, deviasi, dsb.) maupun pengolahan data dengan statistik parametrik maupun non-parametrik (Spearman, ANOVA, MANOVA, dsb.). Beberapa perintah yang bisa dilakukan adalah: No 1
Syntax sum
Efek Pre-installed Statistik Deskriptif Sederhana Ya (mean,max,min,s.dev) 2 sum, sum, deta detail il Sta Statis tistik tik Deskr eskrip ipti tiff Lanj Lanju utan tan (sk (skew, Ya kurtosis, kurtosis, obs, dsb.) 3 tab tabstat tat Tabel bel sederhana s.deskriptif lanjutan tan Ya 4 Describe Deskripsi Label Ya 5 Ta Tab Tabulasi Data Sederhana Ya 6 Tab, row chi Ta Tabel Interaksi Lengkap Ya 7 Swilk melihat error model / data Ya 8 Graph Box Cek nilai Outliers Ya 9 Wins Winsor oriz izee Pengh enghap apus usan an nila nilaii outl outlie iers rs dan dan diga digan nti Tidak dengan data baru Dari beberapa perintah yang penulis sebutkan, akan dipraktekan beberapa 2
Figure 2: Perintah Summary dan Sysuse yang yang releva relevan n dengan dengan sesi pelatihan hari ini. Perinta Perintah h yang yang akan akan penu p enulis lis bahas adalah: a. Sum, b. Describe, c. Boxplot, d. Matrix-Plot
2.1
Summary
Perintah summary , atau biasa disingka disingkatt menjadi menjadi sum di Stata dipergunakan dipergunakan ketika kita ingin melakukan ekstraksi sederhana terhadap dataset dari tiap tiap variabel variabel yang kita punya. punya. Data yang bisa diekstraksi diekstraksi dari perin p erintah tah sum cukup sederhana, sederhana, yaitu: obs (jumlah observasi), observasi), mean (nilai rata - rata varivariabel), max dan min (nilai maksimum dan minimum masing - masing variabel), serta s.dev (standar deviasi, atau simpangan). Perintahnya dapat berupa: sum observasi>, , ataupun; ataupun; sum X1
Hasil dapat dilihat pada figur 2 (Perintah Summary dan Sysuse). Dari hasilnya, didapatkan keseluruhan ekstraksi dari dataset auto yang di impor dari sistem internal.
2.2 2.2
Desc Descri ribe be
Describe secara sederhana merupakan perintah Stata untuk melihat hasil dari labelisasi labelisasi variabel variabel - variabel variabel yang ada. Untuk Untuk lebih ringkasny ringkasnyaa dapat dilihat pada figur 3.
3
Figure 3: Describe Command
Figure 4: Kernel Densitas Error Perintah describe sangat berguna bila dipergunakan untuk pengolahan data tingkat tinggi (dengan berbagai label rumit dari sumber data) seperti Sakernas, Susenas, IFLS, dsb.
2.3 2.3
Boxp Boxplo lott
Boxplot sangat berguna bila kita ingin membuat data yang timpang menjadi lebih mendekati mendekati normal. Data dibilang terdistribusi terdistribusi mendekati mendekati normal ketik ketika distribusi datanya menyerupai lonceng terbalik (kecuali jika distribusinya logistik). gistik). Semakin Semakin normal normal suatu distribusi distribusi data, mengindikasik mengindikasikan an nilai pencilan (outliers ) yang semakin kecil. kecil. Box Boxplot plot dipergunak dipergunakan untuk mengecek mengecek setiap variabel dalam dataset apakah terdistribusi normal / tidak. Dari gambar diatas, titik - titik diluar garis deviasi tertinggi (garis terluar dari box) disebut sebagai sebaran data outliers . Solusi Solusi terbaiknya terbaiknya adalah adalah se4
Figure 5: Boxplot Dataset Auto cara manual membuang data yang membuat bias, ataupun penggunaan teknik winsorized 2 .
2
Teknik Winsorized tidak dijelaskan dalam materi ini
5
Figure 6: Matriks-Plot
2.4 2.4
Matr Matrix ix-P -Plo lott
Matriks Plot (atau di Stata dipergunakan perintah graph matrix), adalah matriksasi dari scatter plot hubungan dua arah (baik Y dan X, maupun X dengan X lain). Penggunaan matriks plot mempermudah kita untuk melihat data scatterplot lebih lengkap daripada melakukannya satu per satu. Perintah yang biasa dipakai adalah graph matrix y x1 x2, sehingga didapatkan hasil seperti pada gambar matriks di atas.
3
Pengo engola laha han n OL OLS S (Ordinary Ordinary Least Square Square )
Regresi linear adalah teknik statistika yang memberikan memberikan pendugaan dari kemiringan suatu garis lurus (linear) dan posisi dimana garis tersebut memotong sumbu y, berdasark berdasarkan an sejumlah sejumlah informasi informasi mengenai hubungan antar variabel. variabel. Memberikan pendugaan nilai a dan b, berdasarkan sejumlah informasi mengenai x dan y , pada persamaan berikut: y = α + βX •
x disebut variabel independent, karena nilainya tidak tergantung variabel lain.
•
y disebut variabel dependent, karena nilainya tergantung nilai x.
•
α dan β disebut parameter, α adalah intercept dan β adalah slope .
Regresi linear sederhana, apabila variabel dependent hanya ditentukan oleh satu variabel variabel independent independent.. Contohn Contohnya: ya: y = α + βX + . Sedang Sedangk kan Jik Jika Regresi Linear berganda, apabila variabel dependent ditentukan oleh lebih dari satu variabel independent. Contohnya: y = α + β 1X 1 + β 2X 2 + .... + βnXn + . Dimana, = error term = perbedaan antara y aktual dengan y hasil estimasi garis regresi. 6
Metode yang digunakan untuk mengestimasi parameter garis regresi disebut metode Ordinary Least Square Square (OLS). Metode ini meminimisasi jumlah dari error yang dikuadratkan ( 2 ) dari setiap observasi. Pada dasarnya, model regresi dengan OLS dibangun atas asumsi CLRM (Classical (Classical Linear Regression Model ). Model ). Asumsi tersebut memiliki properti sesuai dengan Gauss-Markov Theorem Theorem yang menuntut adanya karakteristik Best Linier Unbiassed Estimator / BLUE dari penduga / estimatornya (Gujarati,2003), yakni: •
•
•
3.1 3.1
Linier: Linier: Estimator Estimator OLS merupak merupakan an fungsi linier linier dari variabel variabel acak (random). Contoh: variabel terikat Y dalam model regresi Tidak Bias. Nilai rata-rata atau nilai ekspektasi dari estimator sama dengan nilai aktual/sesungguhnya, Varians Minimum. Minimum. Estimator Estimator OLS memiliki memiliki nilai varians varians minimum. minimum. Kriter Kriteria ia ini pentin pentingg untuk untuk mem memast astik ikan an bahwa bahwa estima estimator tor efisien efisien.. DenDengan kata lain, estimator estimator yang tidak bias dengan varians varians terkecil terkecil dapat dikatakan sebagai estimator yang efisien.
Mem Memulai ulai Regr Regres esii OLS OLS
Dari teori diatas, kita dapat melakukan modeling untuk di regresi dengan OLS. Data yang kita pergunakan adalah dataset auto.dta yang didapatkan dari perintah: sysuse sysuse auto , atau atau webuse webuse auto
Setela Setelah h kita kita dapatk dapatkan an data data auto.d auto.dta ta diimpor diimpor ke Stata, mak makaa kita kita dapat dapat melanjutkan dengan perintah deskriptif sederhana: sum describe sum, detail detail graph graph matrix matrix price price - foreig foreign, n, half half
Setelah itu, dengan model sederhana yang akan dibuat jadi OLS: lnPrice
= α + β 1M pg + β 2Turn + β 3GearR atio + β 4Foreign +
lnPrice didapatkan dari generalisasi logaritma natural dengan cara: gen lnprice=ln(price) lnprice=ln(price) reg y x1 x2 x3 x4 reg price price mpg turn turn gear_r gear_rati atio o foreig foreign n
Maka dari regresi tersebut didapatkan hasil:
7
Figure 7: OLS Regression 3.1.1 3.1.1
Mem Membaca baca Hasi Hasill OLS OLS
Setelah melakukan regresi, tahapan selanjutnya adalah intepretasi hasil regresi tersebut. tersebut. Seperti yang kita ketahui, ketahui, penyertaa penyertaan n variabel variabel atau error dalam model regresi secara langsung menyatakan regresi sebagai model stokastik (tidak pasti), berbeda dengan hasil deterministik yang sudah pasti dapat diukur. Besaran error dapat dilihat dari simpangan baku (standar deviasi) maupun permasalah dalam hipotesis BLUE. Semakin besar error model, maka semakin bias hasil regresi regresi tersebut (jauh dari kenyataan) kenyataan).. Beberapa Beberapa indikator indikator yang patut dibaca dan diintepretasikan dalam rankingnya (OLS) adalah:
•
•
•
•
Pertama dilihat adalah nilai Prob - F. F. Prob F mengindikasikan signifikansi dari model, secara sederhana ketika model tidak signifikan, maka bisa dianggap sia - sia penelitian terhadap model tersebut. Kedua Kedua adalah adalah nilai nilai besaran besaran R2 maupun R2 Adjusted. Keduanya menggambarkan setiap variabel dalam persamaan mampu menggambarkan barkan model dengan dengan baik. Semakin Semakin tinggi nilainya, nilainya, semakin bagus.3 −
Arah koefisien (β dan α). Arah dari koefisien koefisien (positif (positif ataupun negatif) negatif) mengindikasikan hubungan antara variabel independen (X) dengan dependen (Y), serta kaitannya dengan penyusunan hipotesis awal dari model. Perbandingan dengan hipotesis harus bisa dijelaskan dengan baik, tidak harus bernilai signifikan. Signifikansi variabel. variabel. Bukan Bukan berart b erartii signifik signifikansi ansi dari variabel variabel menjadi yang utama dalam penelitian, namun hasil yang signifikan mengindikasikan mengindikasikan
3
nilai R2 − adjusted bisa negatif bila nilai MSE(Mean Square Error ) dari tabel ANOVA sangat besar
8
marjin perubahan nilai yang bersar ketika implementasi kebijakan / shock terjadi. terjadi. Semakin Semakin kecil errornya errornya (ditunjukka (ditunjukkan n dengan nilai prob-t atau prob-Z lebih kecil dari nilai α) Dari figur 7 (OLS Regression ), ), kita dapati nilai Prob-F (Model) adalah 0.000. Nilai prob-F sebesar 0.000 < nilai α = 5%, sehingga dapat kita nyatakan model regresi lnprice signfikan. signfikan. Berlanjut Berlanjut pada nilai R2 dan R2 Adjusted masing masing sebesar 0.3931 (39%) dan 0.3579 (35 .8%) yang dapat diinterpetasikan sebagai “Model mampu digambarkan dengan baik oleh variabel - variabel independen sebesar 35.8% setelah dibagi nilai MSEnya. Untuk tiap variabel hampir semuany semuanyaa signifik signifikan an (nilai prob-t < α) kecuali kecuali untuk variabel variabel turn yang nilainya lebih dari α. Koefisien Koefisien regresi regresi dibandingk dibandingkan an dengan dengan hipotesis hipotesis yang telah diberik diberikan an pada bab 2 / 3 penelit penelitian ian masing masing - masing masing.. Secara Secara ringk ringkas dapat ditulis: −
No 1 2 3 4
3.2 3.2
Prob Prob-S -Sta tatt F Ch Chi t Z
Inte Intepr preetasi tasi Model Model Variabel (> 30) Variabel (< 30)
Syar Syaraat Sign Signifi ifik kans ansi <α <α <α <α
Uji BLUE BLUE - Gau Gauss ss Mark Marko ov dala dalam m OLS
Pada bab OLS di Gujarati (2003), terdapat 10 asumsi klasik dalam regresi linear yang harus dipenuhi, yaitu: 1. Model linear dalam dalam parameter. parameter. 2. Nilai x tetap dalam pengambilan pengambilan sampel yang diulang. diulang. 3. Nilai rata-rata rata-rata dari error sama dengan dengan nol. 4. Homosked Homoskedastis astis yaitu nilai varians varians dari setiap setiap error sama. 5. Tidak ada korelasi korelasi antar antar error. 6. Covarian Covarianss antara ui dan xi adalah adalah nol. 7. Banyak Banyakny nyaa observa observasi si n harus lebih besar daripada banyakny banyaknyaa parameter parameter yang diestimasi. 8. Nilai dari xi harus bervarias bervariasii (tidak boleh sama). 9. Model regresi dispesifikasik dispesifikasikan an dengan dengan benar. 10. Tidak ada multikolinearitas multikolinearitas sempurna. Namun terkadang dalam penelitian nyata, cukup susah untuk melakukan pemenuhan 10 asumsi klasik dari OLS. Hal itu menyebabkan bias dalam regresi gresi jika jika beberapa beberapa asumsi asumsiny nyaa tidak tidak terpen terpenuhi uhi,, am ambil bil saja asumsi asumsi nomor nomor 6 (heteroke (heterokedastis dastisitas) itas) dan asumsi asumsi nomor 10 (multiko (multikolinea linearitas) ritas).. Oleh sebab itu, dalam Stata setelah melakukan regresi OLS, kita disarankan untuk melakukan
9
Figure 8: Heterokedastisitas OLS penguji pengujian an BLUE yang bisa memenu memenuhi hi 10 asumsi asumsi dalam dalam OLS, OLS, yaitu: yaitu: a. HetHeterokedast erokedastisitas isitas (White), (White), b. Uji Multikol Multikol (VIF dan Indeks Indeks Korelasi), Korelasi), serta c. Autokorelasi (Bgodfrey ataupun Durbin-Watson).
3.2.1 3.2.1
Hetero Heteroke kedas dastisi tisitas tas
Dalam estimasi menggunakan data cross section, masalah yang umum timbul adalah heteroskedastisitas atau varians residual yang tidak seragam. Salah satu metode untuk menguji adanya heteroskedastisitas dalam ekonometrik adalah Cook and Weisberg’s test. Stata dapat melakukan pengujian ini dengan perintah hettest [varlist] [,rhs] atau szroeter [varlist] [,rhs] setelah melakukan regresi. Hipotesis: ρ H0 : Constant Variance H1 : NO Constant Variance Intepreta Intepretasi si : Berdasarkan hasil uji Breusch-Pagan / Cook-Weisberg, dimana nilai Prob > chi2 = 0.043, lebih besar dari alfa (0.05) maka dapat disimpulkan bahwa estimasi kita terbelenggu masalah heteroskedastisitas 4 . 3.2.2 3.2.2
Mutik Mutikole oleniar niarita itass
Didalam asumsi BLUE, antar variabel tidak ada hubungan exact collinearity antar antar variabel variabel independen. Jika Jika ada mak maka a OLS meskipun meskipun BLUE namun es4
heteroke heterokedasti dastisitas sitas adalah nilai varians varians yang tidak konstan, konstan, kalau kalau diibaratk diibaratkan an jaman sekarang seperti mahasiswa labil
10
Figure 9: Corr dan VIF timator akan mempunyai nilai varians dan covarians yang besar, maka cukup sulit untuk menentuka menentukan n estimasi estimasi yang benar. Deteksi Deteksi : 1. Nilai R tapi sangan sangan sedikit variabel variabel yang signifikan. signifikan. 2. High pair-wise (zero-order) correlations among regressors 3.2.3 3.2.3
Penguj Pengujian ian Mult Multik ikol ol dalam dalam Stata Stata
Dengan menggunakan indeks korelasi (perintah corr) maupun perintah vif (vari( variance inflating factor ). factor ). Gudjarati (2003) menyatakan dua hal, yaitu: 1. nilai VIF diatas 10 mengindikasikan adanya multikolinearitas yang kuat antara variabel independen, sedangkan untuk indeks korelasi (corr), hasil korelasi diatas 0.8 (80%) menyatakan adanya hubungan hubungan multikoline multikolinearita aritass yang yang kuat antar variabel independenny independennya. a. Kedua hasil di figur ”Corr dan VIF“ mengindikasikan tidak adanya multikolinearitas dalam model lnprice. Mengatasi Multikol : •
Do nothing If the main purpose of modeling is predicting Y only, “Don’t worry about about then don’t don’t worry . (since ESS is left the same ) “Don’t
multicollinearity if the R-squared from the regression exceeds the R-squared of any independent variable regressed on the other independent variables.” •
First difference difference , dibuat First difference pada salah satu variabel yang
bermasalah bermasalah multicol, multicol, pada stata dapat dilakuka dilakukan n dengan dengan perintah: perintah: gen
11
[namaa [namaa variabel first difference] difference] = D.[variabe D.[variabell awal] awal] contoh : gen fdx1= D.x1 •
•
3.2.4 3.2.4
Diubah rumus dalam mendapatkan mendapatkan variabel tersebut tersebut,, dapat diubah menjadi ln atau dibuat selisih antar waktu. Menambah jumlah data. data. Hilangkan salah satu variabel yang berkaitan erat, dapat dilihat pada perinta corr, yaitu Pearson correlation coefficient yang lebih dari 0.8 atau 0.75 Autok Autokore orelas lasii
Autokorelasi suatu keadan dimana terjadi korelasi eror antar periode waktu. Adanya autokolareasi autokolareasi akan membuat OLS linear unbiased, unbiased, consistent consistent dan asymptotically totically normally normally distribute distributed d dan tidak lag lagii efisien efisien.. Autok Autokore orelas lasii umumn umumnya ya terjadi pada data time series , sebelum melakukan regresi kita harus mendefinisikan terlebih dahulu time variable kita dengan perintah tsset [timevar] [timevar].. Atau seperti yang penulis lakukan, penulis melakukan generalisasi waktu pada dataset auto secara otomatis dengan stata. Perinta Perintah h yang yang bisa dipakai dipakai adalah: adalah: gen gen time time = (200 (2000) 0) + _n-1 _n-1 --> --> tahu tahun n awal awal 2000 2000 tsset time, yearly yearly
Tes Autokorelasi dengan Dwstat dan Bgodfrey Durbin Watson statistic Hipotesis: ρ = H0 : Tidak ada Autokorelasi H1 : Ada Autokorelasi Keputusan : Jika nilai DWstat disekitar 2 atau 1,54¡Dwstat¡2,5 maka tidak ada cukup bukti untuk menolak H0. Breusch–Godfrey (BG) Test / LM test Hipotesis: ρ H0: ρ1 = ρ2 = ρ3 = Tidak Ada Autokorelasi H1 : Ada Autokorelasi Keputusan: Jika p-value < 5%, maka tolak hipotesis nol (ada autokorelasi).
3.3 3.3
Robu Robust stne ness ss da dan n Prai Praiβ
Perintah Perintah robust secara otomatis menghilangkan heteroskedastisitas dengan jalan membobotkan dengan robust standard error . Hasil regresi regresi yang yang didapat didapat telah dapat dipastikan dipastikan telah terbebas dari heteroskedasti heteroskedastisitas sitas.. Perinta Perintahny hnyaa secara secara sederhana adalah menambahkan opsi di belakang regresi berupa *, robust ataupun *, vce(robust). Sebagai contoh:
12
Figure 10: Tes Autokorelasi
Figure 11: Robustness Heterokedastisitas
13
Figure 12: Prais - Robust, Autokol - Hetero Dan penambahan fungsi Prais dipergunakan jika terdapat autokorelasi dalam regresi OLS Time-series . Setelah dilakukan treatment tersebut, diharapkan hasil dari OLS sudah tidak bias dan memenuhi asumsi BLUE Gauss-Markov.
4 4.0.1
Regr Regres esii Sim Simulta ultan n Inkonsisten Inkonsistensi si Metode Kuadrat Terkecil erkecil (Ordinary Least Squares ) dan Permasalahan Identifikasi
Metode OLS tidak dapat digunaka digunakan n untuk untuk mengestima mengestimasi si sebuah sebuah persamaan persamaan tunggal yang merupakan bagian pembentuk sistem jika satu atau lebih variabel penjelasnya berkorelasi dengan error. Oleh sebab itu persamaan simultan dipergunakan untuk menjelaskan model seperti ini. Dalam persamaan simultan, akan ditemui dua istilah yang sering dipakai, yaitu: Variabel Endogen dan Eksogen, serta model struktural. Variabel endogen (endogeneous variabel ) variabel ) adalah variabel tak bebas dalam persamaan simultan yang nilainya ditentukan ditentukan di dalam sistem persaman, walaupun variabel-variabel tersebut mungkin juga muncul sebagai variabel bebas di dalam sistem persamaan. Cari variabel endogen dari contoh (a, b, dan c) di atas. Variabel eksogen (disebut juga predetermine) adalah variabel yang nilainya tidak ditentuk ditentukan an secara secara langsung langsung di dalam sistem. Variabel ini menyeb menyebabk abkan an pergerakan erakan variabel variabel endogen endogen di dalam sistem. sistem. Contohn Contohnya ya adalah adalah konstanta konstanta dan variabel lag (lagged endogeneous variable). Variabel lag dikategorikan dikategorikan sebagai predetermine dengan asumsi tidak ada korelasi serial dengan error di dalam 14
persamaan persamaan yang mengandung mengandung variabel lag tersebut. tersebut. Variabel ariabel eksogen eksogen adalah adalah variabel yang bebas dan benar - benar independen dari error variabel lainnya. Model struktural (structural model ) adalah model yang mengandung variabel endogen di bagian kiri dan kanan persamaan, dimana pada sisi kanannya nya juga terdapat variabel variabel eksogen. eksogen. Contoh Contoh (a, b, dan c) di atas merupak merupakan an contoh model struktural, karena diambil dari landasan teori dan kemudian diturunkan turunkan dalam bentu b entuk k model ( yaitu : suatu simplifik simplifikasi) dan diberi asumsi (yait (yaitu u : ala alatt untuk untuk menjaga menjaga agar model model dapat dapat berjalan) berjalan).. Secara Secara umum, umum, ada 2 cara untuk menyatakan suatu model, yaitu implisit (tidak langsung) dan eksplisit (langsung). Model implisit menggambarkan suatu keadaan secara umum, dan tidak menyatakan hubungan secara langsung antara suatu variabel dengan variabel yang lain. Model implisit sering dinyatakan dalam Y = f (X1, X2,....). Sedangkan model eksplisit menunjukkan hubungan secara langsung antara suatu variabel dengan variabel yang lain, seperti misalnya linier, kuadratik, dan lain-lain. Contoh (a, b, dan c) di atas merupakan bentuk model yang eksplisit. Bentuk persamaan sederhana/reduksi (reduced form) adalah sebuah penyelesaian sistem persamaan simultan dimana variabel endogen dinyatakan dalam variabel variabel predetermine predetermine dan error. error. Diperoleh Diperoleh dengan memecahkan memecahkan sistem persamaaan struktural sedemikian rupa sehingga bisa dinyatakan setiap variabel endogen dalam modell sebagai fungsi hanya dari variabel eksogen atau predetremined variables dan error dalam model. Secara umum, juga bisa dinyatakan dalam bentuk implisit maupun eksplisit. eksplisit. Cara implisit lebih mudah mudah dilakuk dilakukan, sedangkan cara eksplisit cukup susah karena harus mencari besarnya nilai-nilai koefisien. Persamaan simultan yang bias ialah suatu keadaan di mana terjadi ‘over estimation or under estimation’ daripada parameter struktural yang diperoleh sebagai hasil dari pengetrapan OLS pada persamaan struktural dari suatu model persamaan simultan. Bias tersebut disebabkan karena karena variabel endogen dalam model yang juga merupakan variabel bebas berkorelasi dengan kesalahan pengganggu, jadi terjadi pelanggaran asumsi OLS (variabel bebas tak berkorelasi dengan kesalahan pengganggu) Secara Secara umum, umum, sistem persamaan simultan simultan mencakup mencakup : Persa Persamaa maan n strukt struktura urall atau atau tingk tingkah ah laku (struc (structur tural al or behavio behavioral ral equations). Persamaan ini menggambarkan respon agen-agen (tingkah laku dari para pelaku) ekonomi dan mencakup hubungan-hubungan ekonomi seperti: fungsi fungsi permintaan permintaan dan fungsi konsumsi konsumsi yang menggambark menggambarkan an perilaku perilaku konkonsumen, atau fungsi penawaran yang menggambarkan perilaku produsen. Ada satu satu persama persamaan an strukt struktura urall untuk untuk setiap setiap variabel ariabel endoge endogen n di dalam dalam model/sistem persamaan simultan. Koefisien setiap persamaan struktural disebut parameter struktural (structural parameters) dan menunjukkan pengaruh langsung (direct effect) dari setiap variabel bebas terhadap variabel tak bebas. Persamaa Persamaan n teknis. teknis. Persamaa Persamaan n ini mengekspre mengekspresik sikan an hubungan hubungan teknis, seperti : fungsi produksi yang menggambarkan hubungan antara faktor-faktor input dan output produksi. Persamaa Persamaan n kelemb kelembagaan agaan dan persamaan persamaan identitas identitas akuntansi akuntansi atau definisi. Contoh : Keuntungan = TR – TC ; Y = C + I + G + (X – M). Persamaan tersebut tidak mengandung error (bukan persamaan ekonometrika), karena menunjukkan hubungan yang sudah pasti, bukan perkiraan (estimasi). 15
Namun akan berbeda jika menjadi model stokastik dengan error ditambahkan. Lebih jauh lagi, secara sederhana model dari persamaan simultan adalah sebagai berikut: Y X 2
dimana = α + β 1X 1 + β 2X 2 + β 3X 3 + , dimana = α + β 1X 1 + β 4X 4 + υ
(1) (2)
Jadi diantara kedua model tersebutm nilai variabel β 2X 2 tidak benar - benar independen terhadap Y . Hal itu dikarenakan adanya hubungannya terhadap error model kedua ( υ ). Dari persamaan tersebut, kita dapat melanjutkan pada identifikasi model simultan yang paling baik untuk dipakai.
4.0.2
Identifik Identifikasi asi Persamaan Persamaan Simultan Simultan
Identifikasi masalah berarti menentukan apakah nilai estimasi parameter persamaan samaan struktural struktural dapat diperoleh dari estimasi persamaan reduksi. reduksi. Masalah Masalah identifikasi muncul karena kumpulan koefisien struktural yang berbeda mungkin cocok dengan sekumpulan data yang sama. Sebuah sistem persaman dikatakan: 1. Exactly identified / Just Identified jika nilai parameter yang unik dapat diperoleh, artinya hanya ada satu nilai untuk setiap koefisien parameter struktural.(ILS atau IV) 2. Over identified jika nilai parameter persamaan struktural yang diperoleh lebih dari satu.(2SLS atau IV) 3. Under identified jika nilai parameter persamaan struktural tidak dapat diperoleh.(Tidak Simultan) 4. Identified jika mungkin untuk mendapatkan nilai parameter dari estimasi persamaan reduksi. Penyel Penyelesaia esaian n sebuah sebuah persamaan persamaan simultan simultan diawali diawali dengan dengan mengident mengidentifik ifikasi asi variabel dalam persamaan. Order and Rank Condition merupakan aturan yang menjadi acuan apakah suatu sistem persamaan dapat diselesaikan sehingga nilai koefisien persamaan struktural dapat diperoleh. Menurut Order and Rank Condition, agar sebuah sistem persamaan simultan dengan M persamaan struktural dapat diidentifikasi maka setidaknya harus memiliki M 1 variabel endogen. Jika jumlah variabel endogen tepat M 1 maka persamaan tersebut dikatakan exactly identified dan jika jumlah variabel endogen lebih dari M 1 maka persamaan tersebut dikatakan over identified atau agar sebuah sistem persamaan simultan dengan M persamaan struktural dapat diselesaikan, jumlah variabel predetermine yang ada dalam persamaan tersebut harus tidak kurang dari jumlah variabel endogen yang ada dalam persamaan dikurangi satu. −
−
−
16
Berdasarkan keterangan diatas, jika 5 M =
Endogen − Model
= Endogen Persamaan K = P redetermine(eksogen) k = P redetermine(eksogen) m
−
−
Struktural
−
Model
−
Persamaan − Struktural,
maka : •
•
•
4.1
Jika K k = m identified −
Jika K
−
−
1 maka persamaan tersebut dikatakan exactly (just)
k > m − 1 maka persamaan tersebut over identified
Jika K –k < m 1 maka persamaan tersebut under identified Yang hanya bisa diolah adalah apabila model tersebut adalah over identified dan atau exactly (just) identified −
Pengg Pengguna unaan an Stata Stata Dalam Dalam Regre Regresi si Simult Simultan an
Seandainya dimodelkan dari data auto.dta (sama seperti di modul OLS dan Data Manajemen), dihasilkan model: = α + β 1M pg + β 2Turn + β 3dForeign + β 4GearR atio + (3) (4) GearR atio = α + β 1Trunk + β 2Turn + υ lnPrice
Dapat kita ketahui beberapa hal, yaitu: •
Persamaan pertama adalah just-identified (5-4 just-identified (5-4 = 2-1) K=α+Mpg,Turn,Trunk,dForeign
•
Persamaan kedua adalah over-identified (5-3 ¿ 1-1)
•
Karena hasil tidak konsisten, IV dapat dipergunakan
Regresi Regresi Instrumental Variable , memiliki memiliki perin p erintah tah dasar dalam Stata dengan bentuk: ivre ivreg g Y X1 X2 X3 (X4 (X4 = X3 X5) X5) --> --> X4 = Endo Endoge geno nous us; ; X1 X2 X3 X5 = Inst Instru rume ment nts s ivreg ivreg lnpric lnprice e mpg turn turn foreig foreign n (gear_ (gear_rat ratio io = trunk trunk turn) turn)
Bisa juga dilakukan 2SLS IV jika nilai diasumsikan keduanya keduanya Over-identification . ivregr ivregress ess 2sls 2sls lnpric lnprice e mpg turn turn foreig foreign n (gear_ (gear_rat ratio io = trunk trunk turn) turn)
Ataupun cara manual 2SLS dengan metode: 5
nilai α dihitung dihitung sebagai 1 predetermi predetermine ne / eksogen, eksogen, dan tidak ada pengulangan pengulangan untuk setiap predetermine yang sudah dihitung
17
Figure 13: IVregress reg gear_ratio gear_ratio trunk turn predic predict t gearha gearhat t --> mempre mempredik diksi si nilai nilai Y-hat Y-hat model model kedua kedua reg lnprice lnprice mpg turn turn foreig foreign n gearha gearhat t --> memasukk memasukkan an yang yang sudah sudah mencak mencakup up error error u ke dalam dalam
Dan hasilnya dapat dilihat dalam figur berikut:
18
Figure 14: 2SLS
Figure 15: Step1-Manual 2SLS
19
Figure 16: Step2-Manual 2SLS
4.2 4.2
Uji Uji Ha Haus usma man n
Terakhir, modul ini akan membahas mengenai model terbaik jika memperbandingkan OLS ataupun Simultan. Pada dasarnya prinsip OLS dan Simultan tidak jauh berbeda, hanya saja beberapa cakupan yang belum bisa dibahas dalam OLS bisa dijelaskan dijelaskan dengan baik dalam model simultan. simultan. Nam Namun un tidak semua model sesuai dengan simultan, terkadang metode OLS saja sudah cukup men jelaskan jelaskan dengan baik. Agar bisa diidentifikasi, diidentifikasi, Stata dapat melakukan melakukan uji hausman untuk memperbandingkan hasil estimasi dengan OLS ataupun dengan IV - 2SLS, manakah yang lebih sesuai untuk model lnprice dari data auto.dta. Tahapan yang dilakukan oleh penulis: ivreg ivreg lnpric lnprice e mpg turn turn foreig foreign n (gear_ (gear_rat ratio io = trunk trunk turn) turn) estimates estimates store store ivreg ivreg reg price price mpg turn turn gear_r gear_rati atio o foreig foreign n estimates estimates store ols hausma hausman n ivreg ivreg ols
Sehingga didapatkan hasil uji Hausman sebesar 0.9 (lebih dari α, terima h0=model OLS, tolak h1=model simultan). Dengan begitu disimpulkan bahwa dari dari datase datasett auto.d auto.dta ta dengan dengan model model lnpric lnprice, e, didapa didapatk tkan an model model OLS sudah sudah mampu menjelaskan dengan baik tanpa harus memasukan persamaan simultan.
20
Figure 17: Uji Hausman Endogenitas
5
Ring Ringk kasan asan
Regresi OLS dan Simultan dalam Stata memberikan gambaran yang lebih mudah dibandingkan dibandingkan pekerjaan pekerjaan regresi secara manual. Beberapa Beberapa catatan catatan penting penting dalam materi kali ini adalah fundamental perbedaan antara OLS dan Simultan, terutama terutama dalam spesifikasi spesifikasi model regresi. regresi. Pengujia Pengujian n hausman hausman dipergunakan dipergunakan untuk melihat ada atau tidaknya endogenitas dalam persamaan.[]
21
6
Daft Daftar ar Pust Pustak aka a
References []
Gudjar Gudjarati ati,, Damodar Damodar N. (2003) (2003).. Essential Econometrics . New York, USA: McGraw-Hill.
[]
Nachrowi, Nachro wi, D.N., D.N., dan dan Usma Usman, n, H. H. (2006 (2006). ). Pendekatan Populer dan Praktis Ekonometrikan Untuk Analisis Ekonomi dan Keuangan . Jakarta, Indoensia: Lembaga Penerbit Fakultas Ekonomi Universitas Indonesia.
[]
Suw Suwardi ardi,, A. (201 (2011) 1).. STATA: Dasar Pengolahan Data (edisi Juni). Juni). Depok, Indonesia: Laboratorium Komputasi Departemen Ilmu Ekonomi FEUI.
[]
Wijo Wijoyo yo,, W.H. W.H.A. A. (201 (2011) 1).. Tutorial Penulisan JEPI (Jurnal Ekonomi Pembangun bangunan an Indonesia) Indonesia) dengan dengan LAT E X . Depok, Indone Indonesia sia:: Laborat Laboratori orium um Komputasi Departemen Ilmu Ekonomi FEUI.
22