1 Sifat Dasar Analisis Regresi
Seperti yang telah disebutkan pada Bab Pendahuluan, regresi adalah alat utama dari ekonometrika dan dalam bab ini, kita akan mempelajari sifat dasar dari alat ini. 1.1 Asal Mula Istilah Regresi Istilah regresi diperkenalkan oleh seseorang yang bernama Francis Galton. Menurut hasil penelitian Francis Galton, Hukum regresi yang universal dari Galton telah dibuktikan oleh temannya yang bernama Karl Pearson, Karl Pearson menemukan bahwa rata-rata tinggi anak dari kelompok orangtua yang tinggi ternyata lebih kecil dari tinggi ayahnya, dan rata-rata tinggi anak dari kelompok orangtua yang pendek ternyata lebih besar daripada tinggi ayah, jadi seolah-olah semua anak yang tinggi dan yang pendek bergerak menuju ke rata-rata tinggi dari seluruh orang laki-laki. Menurut istilah Galton: regression to mediocrity. 1.2 Interpretasi Modern Dari Regresi Interpretasi modern dari regresi, walaupun sedikit berbeda, dapat dikatakan sebagai berikut: Analisis regresi berkenaan dengan studi ketergantungan dari satu variabel yang disebut variabel tidak bebas (dependent variable), pada satu atau lebih variabel, yaitu yait u variabel penjelas, dengan tujuan untuk memperkirakan dan atau meramalkan nilai rata-rata dari variabel tidak bebas apabila nilai variabel penjelas sudah diketahui. Variabel penjelas sering disebut variabel bebas (independent variable) atau explanatory variable. Penjelasan dari keseluruhan materi dari analisis rehresi ini akan menjadi lebih jelas, tetapi dengan beberapa contoh yang simpel akan membuat konsep dasar ini lebih jelas. Contoh-Contoh
1. Mempertimbangkan kembali hukum regresi universal Galton. Galton tertarik untuk menemukan mengapa ada stabilitas dalam distribusi tinggi dalam sebuah populasi. Tetapi dalam pandangan modern, perhatian kita tidak dengan penjelasan ini tetapi lebih ke penemuan bagaimana rata-rata tinggi dariperubahan anak laki-laki, terhadap tinggi ayahnya. Dengan kata lain, perhatian kita adalah dengan memprediksikan tinggi rata-rata dari anak laki-laki yang telah diketahui tingginya dari ayah mereka. Untuk melihat bagaimana hal ini dapat terjadi, mari perhatikan Gambar 1.1, dimana ini adalah Diagram Scatter atau Scattergram.
Gambar 1.1
Distribusi tinggi anak sesuai dengan tinggi yang diberikan dari ayah.
Gambar ini memperlihatkan distribusi dari tinggi anak dalam populasi memiliki kemiripan dengan nilai tetap dari tinggi ayah. Catat bahwa kemiripan dari tinggi ayah adalah pergerakan atau distribusi dari tinggi anaknya. Walaupun variabelitas dari tinggi anaknya terhadap tinggi ayahnya, rata-rata tinggi anak meningkat secara general sama seperti peninkatan tinggi dari ayahnya. Untuk memperlihatkan hal ini lebih jelas, garis bulat yang ada dalam gambar mengindikasikan rata-rata tinggi anak memiliki kemiripan dengan tinggi ayahnya. Penghubungkan rata-rata ini, kita dapat memperolehnya seperti dalam gambar. Garis ini, seperti yang kita lihat, dikenal dengan istilah garis regrrasi (regression line) Itu menunjukkan bagaimana rata-rata tinggi anak mengingkat dengan tinggi ayah. 2. Mengingat scattergram pada Gambar 1.2, dimana distribusi dalam populasi tinggi dari anak laki-laki ini dipertimbangkan menurut umur ( fixed ages). Kemiripan dari penyumbahn umur, kita memiliki pergerakan atau distribusi tinggi. Tidak semua anak laki-laki yang seumur memiliki tinggi yang mirip. Tapi tinggi pada rata-rata meningkat seirinf dengan umur, dimana dapat dilihat dengan jelas jika kita menggambar garis sepanjang titik lingkaran yang mewakili tinggi rata-rata. Dengan mengetahui umur,
kita dapat memprediksikan dari garis regresi rata-rata tinggi dengan umur yang segitu.
Gambar 1.2
Distribusi tinggi anak sesuai dengan umur
3. Kembali kepada contoh ekonomi, para ahli ekonomi / ekonom mungkin tertarik dalam mempelajari ketergantungan pengeluaran konsumsi seseorang setelah pajak atau pendapatan riil seseorang yang dapat dibuang. Seperti seorang analisis mungkin dapat membantu dalam mengestimasikan marginal propensity untuk menkonsumsi seseorang (MOC), yang adalah rata-rata perubahan dalam konsumsi pengeluaran. (lihat dalam Gambar 1.3) 4. Seorang monopolist yang dapat memberbaiki harga atau output (tetapi tidak keduaduanya) ingin untuk mencari tau respon permintaan terhadap barang terhadap perubahan pada harga. Seperti dalam percobaan, dapat memungkinkan untuk mengestimasikan elastisitas harga dari permintaan terhadap barang dan dapat membantu menentukan harga yang paling cocok. 5. Seorang ahli ekonomi perburuhan ingin memperlajari tingkat perubahan dari gaji dan hubungannya dengan tingkat pengangguran. Asal mulanya data dapat terlihat dalam scatterrgram pada Gambar 1.3. Kurva dalam gambar 1.3 adalah sebuah contoh dari kurva Phillips yang berhubungan dengan perubahan gaji terhdap tingkat pengangguran. Seperti scattergram memungkinkan para ahli ekonomi perburuhan untuk memprediksikan ratarata perubahan gaji terhadap tingkat pengangguran tertentu. Seperti pengetahuan yang dapat membantu dalam menyatakan sesuatu tentang proses inflasi dalam ilmu ekonomi ntuk meningkatkan gaji yang berdampak pada kenaikan harga.
Gambar 1.3
Hipotesis Kurva Phillips
Gambar 1.4
Peranan uang dalam hubungannya dengan tingkat inflasi π
6. Seorang ahli moneter mengetahui bahwa hal sisa lainnya yang sama, lebih tinggi tingkat inflasi π, lebih rendah proporsi k dari pendapatan mereka bahwa orang-orang mau memegang uang mereka seperi yang tergambarkan pada Gambar 1.4. Sebuah analisis kuantitas dari hubungan ini akan memungkinkan para ahli moneter untuk memprediksikan jumlah uang, sebagai proporsi dari pendapatan mereka, bahwa orang akan mau untuk memegang tingkat inflasi yang bervariasi. 7. Seorang direktur pemasaran suatu perusahaan ingin mengetahui bagaimana permintaan sebuah barang perusahaan berhubungan dengan pengeluaran untuk pengiklanan. Seperti sebuah studi akan membantu dalam mencari tau tentang elastisitas permintaan dengan pengeluaran untuk pengiklana, yang adalah, perubahan persen terhadap permintaan. Pengetahuain ini akan berguna untuk mengetahui optimum dari anggaran iklan/advertensi.
8. Terakhir, seorang ahli pertanian tertarik untuk mempelajari tentang ketergantungan lahan, katakanlah gandum, terhadap temperatur, curah hujan, jumlah sinar matahari, dan pemupukan. Seperti analisis ketergantungan dapat memungkinkan untuk memprediksi atau meramalkan rata-rata penerimaan dari lahan tersebut
Para pembaca dapat menawarkan nilai seperti contoh pada ketergantungan suatu variabel terhadap satu atau lebih variabel yang lain. Teknik-teknik analisis regresi yang dibahas dalam teks ini secara khusus dirancang untuk mempelajari ketergantungan antar variabel tersebut. 1.3 Perbedaan Ketergantungan Secara Statistik dan Fungsional Dari beberapa contoh yang dikeukakan dalam subbab 1.2, para pembaca akan menyadari bahwa analisis regresi yang kita pergunakan berkenaan dengan ketergantungan statistik ( statistical dependent ), bukan ketergantungan fungsional secara deterministik, seperti halnya dalam ilmu alam (fisika). Hubungan antarvariabel secara statistik berkenaan dengan variabel yang acak atau stokastik (random or stochastic variables), yaitu variabel yang mempunyai distribusi probabilitas ( probability distribution). Di dalam hubungan fungsional ( functional relationship), variabelnya tidak acak atau stokastik.
Jumlah produksi padi dipengaruhi oleh temperatur, curah hujan, sinar matahari, dan pupuk, sebagai contoh, secara statistik dapat diartikan bahwa explanatory variable atau yang biasa disebut variabel penjelas tidak dapat memungkinkan para ahli ilmu tanah atau agronomist untuk memprediksikan keadaan padi yang sebenarnyam karena adanya berbagai kesalahan ( error ) dalam mengukur variabel ini maupun faktor-faktor lainnya (variabel) yang secara kolektif mempengaruhi lahan tapi bisa jadi sulit untu diidentifikasi secara individual. Dengan demikian, ada loncatan untuk menjadi hakiki atau perubahan yang acak dalam variabel tidak bebas (dependent variable) yang tidakdapat secara penuh dijelaskan, sebanyak apapun variabel penjelas tersebut kita pertimbangkan Hubungan fungsional yang deterministik sifatnya tidak memperhitungkan adanya kesalahan, seolah-olah hubungan itu pasti. Hubungan semacam ini, misalnya dipergunakan untuk menunjukkan hukum gaya berat dari Newton ( Newton’s law of gravity), yang menyatakan bahwa setiap partikel dalam alam semesta menarik partikel lainnya dengan suatu daya yang proporsinoal secara langsung dengan hasil kali massa, dan proporsional secara terbalik dengan kuadrat dari jarak antara kedua partikel tersebut. Yang secara simbolik, F = k(m1m2/r 2), dimana F = daya, m1 dan m2 adalah massa masing-masiing partikel, r = jarak, dan k = konstan, untuk mengukur proporsionalitas. Contoh lainnya, hukum Ohm, yang menyatakan “untuk konduktor (penerus arus
listrik) metal pada tingkat temperatur tertentu, arus listrik C proporsional dengan voltase V, yaitu C = (1/k)V dimana (1/k) adalah konstan, untuk mengukur proporsionalitas. Contoh-contoh lainnya yang menggunakan hubungan fungsional atau hubungan deterministik, antara lain hukum gas dari Boyle, hukum kelistrikan dari Kirchoff, dan hukum Gerakan Newton. Dalam konteks ini, tidak akan berkenaan dengan hubungan deterinistik. Jelas, jika ada kesalahan-kesalahan dalam perhitungannya, katakanlah, k dalam hukum graviti Newton, atau sebaliknya hubugan deerministik menjadi sebuah hubungan statistikal. Dalam situasi ini, daya hanya dapat memprediksikan perkiraan dari pemberi nilai k (dan m1m2, dan r), yang dimana berisi kesalahan-kesalahan. Variabel F dalam kasus ini menjadi variabel acak. 1.4 Regresi Hubungan Sebab Akibat dan Korelasi Walaupun analisis regresi berkenaan dengan ketegantungan suatu variabel dengan variabel lainnya, tidak harus diartikan sebagai hubungan sebab dan akibat (causal relationship). Di dalam bukunya, The Advanced Theory of Statistic, Kendall dan Stuart mengatakan sebagai berikut, Hubungan statistik, sebagaimanapun kuatnya, tidak akan pernah bisa membangun hubungan sebab dan akibat. Hubungan sebab dan akibat harus berasal dari luar statistik, yang berakhir pada beberapa teori atau yang lainnya. Misalnya, kita menganggap bahwa curah hujan mempengaruhi produksi padi, anggapan atau hipotesis ini bukan karena alasan atau pertimbangan statistik, tetapi common sense menunjukkan bahwa kita tidak boleh mengatakan bahwa sebaliknya padi mempengaruhi curah hujan, sebab kita tidak dapat mengontrol curah hujan dengan mengubah hasil produksi padi. Yang jelas, berdasarkan pengalaman sehari-hari, kalau hujan kurang, produksi padi juga kurang berhasil.
Dalam semua contoh pada subbab 1.2 hal yang perlu digaris bahawi adalah hubungan statistikal itu sendiri tidak dapat medinyatakan secara logikal segabai hubungan sebab dan akibat. Untuk menganggap hubungan sebab dan akibat, satu hal yang harus menarik untuk konsiderisasi teoritikal. Demikian, dalam ketiga contoh yang telah disebutkan sebelumnya, hal ini berdasarkan teori ekonomi bahwa pendapatan mempengaruhi konsumsi. Jadi, kalau tingkat pendapatan sudah diketahui, diharapkan kita dapat memperkirakan atau eramalkan tingkat konsumsi. 1.5 Regresi Versus Korelasi
Sedikit berhubungan tetapi secara konseptual sangat berbeda jauh dari analisis regresi yaitu analisis korelasi, di mana tujuan utamanya adalah untuk mengukur kekuatan atau derajat hubungan linier antara dua variabel.Koefisien
korelasi , yang akan kita pelajari secara rinci dalam Bab 3, mengukur kekuatan asosiasi ini ( linear ).Misalnya , kita mungkin tertarik untuk mencari korelasi (koefisien) antara merokok dan kanker paru-paru, antara skor pada statistik dan pemeriksaan matematika, antara nilai sekolah dan nilai perguruan tinggi, dan sebagainya. Dalam analisis regresi, sebagaimana telah dicatat, kita tidak tertarik pada tindakan demikian. Sebaliknya, kami mencoba untuk memperkirakan atau memprediksi nilai rata-rata ingin tahu apakah kita bisa memprediksi nilai rata-rata pada pemeriksaan statistik dengan mengetahui nilai siswa pada ujian matematika. Regresi dan korelasi memiliki perbedaan mendasar yang sama yang layak disebut. Dalam analisis regresi ada asimetri dalam cara variabel dependen dan jelas yang diperlakukan. Variabel terikat diasumsikan statistik, acak, atau stokastik, yaitu, memiliki distribusi probabilitas . Variabel penjelas, di sisi lain, diasumsikan memiliki nilai tetap (dalam pengambilan sampel berulang) yang dibuat eksplisit dalam definisi regresi diberikan dalam Subbab 1.2. Pasalnya, pada gambar 1.2 kita mengasumsikan variabel umur ditetapkan pada diberikan tingkat dan pengukuran tinggi diperoleh pada tingkat ini. Dalam analisis korelasi, di sisi lain, kami memperlakukan setiap (dua) variabel simetris, tidak ada perbedaan antara variabel dependen dan jelas. Setelah semua korelasi antara skor pada matematika dan ujian statistik adalah sama dengan antara skor pada statistik dan pemeriksaan matematika . Selain itu, kedua variabel diasumsikan acak. Sebagaimana akan kita lihat, sebagian besar teori korelasi didasarkan pada asumsi keacakan variabel, sedangkan sebagian besar teori regresi yang akan diuraikan dalam buku ini tergantung pada asumsi bahwa variabel dependen adalah stokastik tetapi variabel penjelas yang tetap atau nonstochastic.
1.6 Terminologi dan Notasi Sebelum kita melanjutkan ke analisis formal teori regresi, mari kita diam sebentar pada soal terminologi dan notasi. Dalam literatur istilah sebentar pada soal terminologi dan notasi. Dalam literatur istilah variabel dan penjelas variabel dependen yang dijelaskan berbagai. Sebuah daftar representatif adalah:
Walaupun itu merupakan masalah selera pribadi dan tradisi, dalam buku ini kita akan menggunakan variabel dependen /variabel penjelas atau lebih netral, regresi dan terminologi regressor . Jika kami sedang mempelajari ketergantungan pada variabel hanya variabel penjelas tunggal, seperti yang dari pengeluaran konsumsi pada pendapatan riil, studi semacam ini dikenal sebagai sederhana, atau dua - variabel, analisis regresi . Namun, jika kita sedang mempelajari ketergantungan satu variabel pada lebih dari pada variabel penjelas, seperti pada tanaman - hasil, curah hujan, suhu , sinar matahari , dan contoh pupuk , ini dikenal sebagai analisis regresi ganda. Dengan kata lain, dalam regresi dua variabel ada lebih dari satu variabel penjelas. Istilah random adalah sinonim untuk stochastic panjang. Seperti disebutkan sebelumnya, variabel acak atau stokastik adalah variabel yang dapat mengambil setiap set nilai-nilai, positif atau negatif, dengan probability. Kecuali dinyatakan lain, Y nantinya akan menunjukkan variabel dependen dan X’s ( X 1 , X 2 , ... , X k) akan menunjukkan variabel penjelas, X k menjadi k variabel penjelas . Subskrip i atau t akan menunjukkan pengamatan engan atau t th atau nilai X ki ( atau X kt ) wiil melambangkan engan (atau t th) observasi terhadap variabel X k. N (atau T ) akan menunjukkan jumlah observasi atau nilai dalam populasi, dan n (atau t ) jumlah pengamatan dalam sampel. Sebagai soal konvensi, subsckripsi pengamatan saya akan digunakan untuk data cross-sectional (yaitu, data yang dikumpulkan pada satu titik waktu) dan subscript t akan digunakan untuk data time series (yaitu, data yang dikumpulkan selama periode waktu). Sifat data seri cross-sectional dan waktu , baik sebagai topik penting dari alam dan sumber data untuk analisis empiris, dibahas dalam bagian berikut .
1.7 Sifat dan Sumber Data untuk Analisis Ekonomi
Keberhasilan setiap analisis ekonometrik akhirnya tergantung pada ketersediaan data yang sesuai. Oleh karena itu penting bahwa kita meluangkan waktu untuk mendiskusikan sifat, sumber, dan keterbatasan data yang mungkin ditemui dalam analisis empiris. Jenis-Jenis Data
Ada jenis data mungkin tersedia untuk analisis empiris, time series, cross section, dan pooled (yaitu,kombinasi time series dan cross-section) data. Data Series Time Data yang ditampilkan dalam tabel 1.1 dalam pendahuluan adalah contoh dari data time series. Serangkaian adalah satu set pengamatan pada nilai-nilai bahwa variabel mengambil pada waktu yang berbeda. Data tersebut dapat dikumpulkan secara berkala, seperti harian (misalnya, harga saham, laporan cuaca), mingguan (misalnya, angka jumlah uang beredar), bulanan [misalnya, tingkat pengangguran, Indeks Harga Konsumen (IHK)], kuartalan (misalnya, GPD), setiap tahunnya (misalnya, anggaran pemerintah), quinquennially, yaitu, setiap 5 tahun (misalny, sensus manufaktur), atau decennially (misalnya, konsensus dari populasi).
Kadang-kadang data yang tersedia baik triwulanan maupun tahunan, seperti dalam kasus data GDP dan pengeluaran konsumen. Dengan munculnya komputer berkecepatan tinggi, data yang sekarang dapat dikumpulkan pada interval yang sangat singkat, seperti data terhadap harga saham, yang dapat diperoleh secara harfiah terus menerus (yang disebut real-time kutipan). Meskipun data time-series yang digunakan berat dalam studi ekonometrik, mereka menimbulkan masalah khusus untuk ekonometri. Seperti kita akan ditampilkan dalam bab-bab tentang time-series ekonometrik nanti, pekerjaan yang paling empiris berdasarkan data time series mengasumsikan bahwa time series yang mendasarinya adalah stasioner. Walaupun terlalu dini untuk memperkenalkan makna teknis yang tepat dari stasioneritas pada saat ini, longgar berbicara time-series adalah stasioner jika mean dan varian tidak bervariasi secara sistematis dari waktu ke waktu . Untuk melihat apa artinya ini, perhatikan Gambar 1.5, yang menggambarkan perilaku uang beredar M 1 di Amerika Serikat dari tahun 1959, hingga Juli 3 . (Data aktual yang diberikan dalam latihan 1.4) Seperti yang dapat Anda lihat dari angka ini, jumlah uang beredar M1 menunjukkan tren stabil serta variabilitas selama setahun, menunjukkan bahwa time series M 1 tidak stationary. Kami akan menjelajahi topik sepenuhnya dalam bab 21.
Gambar 1.5
Uang beredar M 1 . Amerika Serikat , 1951:01-1999:09
Cross-Section Data Penampang, adalah data pada satu atau lebih variabel yang dikumpulkan pada poin yang sama dalam waktu, seperti sensus penduduk yang dilakukan oleh Biro Sensus setiap 10 tahun (yang terbaru berada di tahun 2000), survei konsumen pengeluaran yang dilakukan oleh University of Michigan, dan tentu saja, jajak pendapat Gallup dan organisasi othe3r upteen. Contoh nyata dari data cross-sectional diberikan dalam tabel 1.1. Tabel ini memberikan data produksi telur dan harga telur untuk 50 negara bagian di serikat untuk tahun 1990 dan 1991. Untuk setiap tahun data pada 50 negara merupakan data cross-sectional. Dengan demikian, pada tabel 1.1 kita memiliki dua sampel cross-sectional.
Sama seperti data time series menciptakan masalah khusus mereka sendiri (karena khusus masalah heterogenitas. Dari data yang diberikan dalam tabel 1.1 kita melihat bahwa kita memiliki satu beberapa negara yang menghasilkan sejumlah besar telur (misalnya, Pennsylvania) dan beberapa yang memproduksi sangat sedikit (misalnya, Alaska ). Ketika meliputi unit heterogen seperti dalam analisis statistik, efek ukuran atau skala harus diperhitungkan agar tidak mencampur apel dengan jeruk. untuk melihat ini dengan jelas, kita plot Gambar 1.6 data pada telur yang dihasilkan dan harga mereka di 50 negara untuk tahun 1990. Angka ini menunjukkan seberapa luas tersebar pengamatan berada. dalam Bab 11 kita akan melihat bagaimana efek skala dapat menjadi faktor penting dalam menilai hubungan antara variabel ekonomi.
Gambar 1.6
Hubugan antara produksi telur dan harga,1990
Pooled Data Dalam Pemusatan, atau digabungkan, data elemen dari kedua time-series dan data cross-section, Data dalam tabel 1.1 adalah contoh data dikumpulkan. Untuk setiap tahun kami memiliki 50 observasi cross-sectional dan untuk setiap negara kita memiliki dua waktu pengamatan seri harga dan output telur, total 100 menggenang (atau gabungan) pengamatan. Data Demikian juga, data yang diberikan dalam latihan 1.1 dikumpulkan dalam Indeks Harga Konsumen (CPI) untuk setiap negara untuk 1973-1997 adalah
data time series, sedangkan data CPI untuk tujuh negara untuk tahun tunggal data cross-sectional. Dalam data yang diperoleh kita memiliki 175 observasi observasi 25 tahunan untuk masing-masing dari tujuh negara. Data panel, Longitudinal atau Micropanel Ini adalah tipe khusus dari data yang dikumpulkan di mana unit cross-sectional yang sama (misalnya, keluarga atau perusahaan) yang disurvei dari waktu ke waktu. Sebagai contoh, Departemen Perdagangan AS karies keluar sensus perumahan secara berkala. Pada setiap survei periodik rumah yang sama (atau orang-orang yang tinggal di alamat yang sama) yang diwawancarai untuk mengetahui apakah telah terjadi perubahan dalam kondisi perumahan dan keuangan rumah tangga yang sejak survei terakhir. Dengan mewawancarai rumah yang sama secara berkala, data panel memberikan informasi yang sangat berguna pada dinamika perilaku rumah tangga, seperti akan kita lihat dalam bab 16. Sumber-Sumber Data
Data yang digunakan analisis empiris saya dikumpulkan badan pemerintah (misalnya, Departemen Perdagangan), sebuah lembaga internasional (misalnya, Dana Moneter Internasional (IMF atau Bank Dunia), sebuah organisasi swasta (misalnya standar & Poor Corporation), atau individu. Secara harfiah, ada ribuan lembaga tersebut mengumpulkan data untuk satu tujuan atau yang lain. The Internet Internet telah benar-benar merevolusi pengumpulan data. Jika Anda hanya " surfing internet " dengan kata kunci (misalnya, nilai tukar), Anda akan dibanjiri dengan semua anak-anak dari sumber data. Dalam Lampiran E kami menyediakan beberapa situs web yang sering dikunjungi yang menyediakan data ekonomi dan keuangan dari semua jenis. Sebagian besar data yang dapat didownload tanpa banyak biaya. Anda mungkin ingin menandai berbagai situs web yang mungkin memberikan yo dengan data ekonomi yang berguna.
Data yang dikumpulkan oleh berbagai lembaga dapat eksperimental atau nonexperimental. Dalam data eksperimen, seringkali dikumpulkan dalam ilmu alam, penyidik mungkin ingin mengumpulkan data sambil memegang faktor tertentu konstan untuk menilai dampak dari faktor yang sama pada fenomena tertentu. Misalnya, dalam menilai dampak obesitas terhadap tekanan darah, peneliti ingin mengumpulkan data sambil memegang konstan kebiasaan makan, merokok, dan minum dari orang-orang untuk meminimalkan pengaruh variabel pada tekanan darah . Dalam ilmu sosial , data yang satu umumnya pertemuan yang nonexperimental di alam, yang tidak tunduk pada kontrol researcher. Misalnya, data pada GNP, pengangguran, harga saham dll, tidak langsung di bawah kendali penyidik. Sebagaimana akan kita lihat, kurangnya kontrol
sering menimbulkan masalah khusus bagi peneliti dalam pinning down penyebab pasti atau menyebabkan mempengaruhi situasi tertentu. Misalnya, apakah uang beredar yang menentukan (nominal) GDP ataukah sebaliknya? Akurasi Data
Meskipun banyak data yang tersedia untuk penelitian ekonomi, kualitas data sering tidak baik. Ada beberapa alasan untuk itu. Pertama seperti dicatat, data ilmu pengetahuan yang paling sosial nonexperimental di alam, walapun, ada kemungkinan kesalahan pengamatan, baik dari kelalaian atau komisi. Kedua, bahkan dalam kesalahan data eksperimen dikumpulkan pengukuran timbul dari perkiraan dan roundoffs. Ketiga, dalam survei kuesioner -jenis, masalah nonresponse dapat serius, peneliti mendapatkan respon 40 persen kuesioner. Analisis berdasarkan respon parsial tersebut tidak mungkin benar-benar perilaku 60 persen yang tidak menanggapi, sehingga menyebabkan apa yang dikenal sebagai id (sample) selektivitas Bias. Lalu ada masalah lebih lanjut bahwa mereka yang merespon kuesioner mungkin tidak menjawab semua pertanyaan, terutama pertanyaan tentang sifat sensitif secara finansial, sehingga menyebabkan bias selektivitas tambahan. Keempat, metode pengambilan sampel yang digunakan dalam memperoleh data mungkin bervariasi secara luas bahwa seringkali sulit untuk membandingkan hasil yang diperoleh dari berbagai sampel , data ekonomi Kelima umumnya tersedia pada tingkat yang sangat agregat. Sebagai contoh, sebagian macrodata (misalnya GNP, kerja, inflasi, pengangguran) yang tersedia bagi perekonomian secara keseluruhan atau sebagian untuk wilayah geografis yang sama luas. Data yang sangat agregat tersebut mungkin tidak memberitahu kita banyak tentang individu atau microunits yang mungkin menjadi objek utama dari penelitian. Keenam, karena kerahasiaan, data yang tertentu dapat diterbitkan hanya dalam sangat agregat. IRS, misalnya, tidak diperbolehkan menjadi hukum untuk mengungkapkan data tentang pajak individu, yang hanya dapat melepaskan beberapa data gambaran umum yang luas . Walaupun, jika seseorang ingin untuk mencari tahu berapa banyak individu dengan tingkat penghasilan tertentu dihabiskan untuk perawatan kesehatan, seseorang tidak bisa melakukan analisis itu kecuali pada tingkat yang sangat tinggi agregat. Tapi macroanalysis seperti itu sering gagal dalam mengungkapkan dinamika perilaku microunits. Demikian pula, Departemen Perdagangan, yang melakukan sensus bisnis setiap 5 tahun, tidak diperbolehkan untuk mengungkapkan informasi mengenai produksi, tenaga kerja, konsumsi energi, penelitian dan pengembangan, dll, pada tingkat perusahaan. Oleh karena itu sulit untuk mempelajari perbedaan antar perusahaan pada item ini. Karena semua ini dan banyak masalah lain, peneliti harus selalu diingat bahwa hasil dari penelitian ini adalah hanya sebagai baik sebagai kualitas data.
Karena itu, jika dalam situasi tertentu peneliti menemukan bahwa hasil dari penelitian ini adalah " tidak memuaskan " penyebabnya mungkin tidak bahwa mereka menggunakan model yang salah tetapi kualitas data miskin: Sayangnya , karena sifat nonexperimental dari data yang digunakan dalam studi ilmu sosial yang paling, peneliti sangat sering tidak punya pilihan selain tergantung pada data yang tersedia. Tapi mereka harus selalu diingat bahwa data yang digunakan mungkin tidak menjadi yang terbaik dan harus mencoba untuk tidak terlalu tobe domatic tentang hasil yang diperoleh dari studi yang diberikan, terutama ketika kualitas data adalah tersangka.
Sebuah Catatan tentang Skala Pengukuran Variabel
Variabel yang umumnya akan menghadapi jatuh ke dalam empat kategori besar: skala rasio, skala interval, dan skala nominal. Adalah penting bahwa kita memahami Skala Rasio Untuk variabel X, mengambil dua nilai, X 1 dan X2, rasio X1/X2 dan jarak (X2 - X1) adalah jumlah yang berarti. Juga, ada anatural memesan (menaik atau menurun) dari nilai sepanjang skala. Oleh karena itu, perbandingan seperti X2 X 1 bermakna. Variabel ekonomi masuk kategori ini. Dengan demikian, itu berarti untuk bertanya seberapa besar tahun ini GDP dibandingkan dengan tahun sebelumnya GDP. Skala Interval Variabel skala intervl statisfies dua sifat terakhir dari variabel skala rasio tetapi bukan yang pertama. Dengan demikian, jarak antara dua periode waktu, katakanlah (2000-1995) sangat berarti, tapi tidak rasio dua periode itme (2000/1995) Skala Ordinal Variabel termasuk kategori ini hanya jika statisfies properti ketiga dari skala rasio (yaitu, pemesanan alam). Contohnya adalah sistem gradasi (A, B, nilai C) atau kelas penghasilan (atas, tengah, bawah) Untuk variabel pengurutan ada namun jarak antara kategori tidak dapat diukur. Mahasiswa ekonomi akan mengingat kurva indiferen antara dua barang, masing-masing kurva indiferens yang lebih tinggi menunjukkan tuas utilitas yang lebih tinggi, tapi kita tidak bisa mengukur seberapa banyak satu kurva indiferen yang lebih tinggi daripada yang lain . Variabel Skala Nominal dalam kategori ini memiliki tidak ada fitur dari variabel skala rasio. Variabel seperti jenis kelamin (laki-laki, perempuan) dan status perkawinan (menikah, belum menikah, bercerai, dipisahkan) menunjukkan cagories, Pertanyaan: apa alasan mengapa variabel tersebut tidak dapat diekspresikan pada rasio, interval, skala ordinal?Sebagaimana akan kita lihat, teknik ekonometrik yang mungkin cocok untuk variabel skala rasio mungkin tidak cocok untuk variabel skala nominal. Oleh karena itu, penting
untuk diingat perbedaan antara empat jenis skala pengukuran yang dibahas di atas.
1.8 Ringkasan
1. Ide kunci di balik analisis regresi adalah ketergantungan statistik satu variabel, variabel dependen, pada satu atau lebih variabel lain, variabel penjelas. 2. Tujuan dari analisis tersebut adalah perkiraan dan / atau memprediksi nilai rata-rata atau rata-rata variabel dependen atas dasar nilai-nilai yang diketahui atau tetap dari variabel penjelas. 3. Dalam prakteknya keberhasilan analisis regresi tergantung pada ketersediaan data yang sesuai. Bab ini membahas sifat, sumber dan keterbatasan data yang umumnya tersedia untuk penelitian, terutama dalam ilmu-ilmu sosial. 4. Dalam penelitian, peneliti harus dengan jelas menyatakan sumber data yang digunakan dalam analisis. definisi mereka koleksi, dan setiap celah atau kelalaian dalam data serta setiap revisi dalam data. Perlu diingat bahwa data makroekonomi yang diterbitkan oleh pemerintah sering direvisi. 5. Karena pembaca mungkin tidak memiliki waktu, energi, atau sumber daya untuk memakukan bawah data, pembaca memiliki hak untuk menganggap bahwa data yang digunakan oleh peneliti secara tepat dikumpulkan dan bahwa perhitungan dan analisis yang benar.