PROF. DR. ALBERT QARRI EKONOMETRIA
Kapitulli 6 STUDIMI I MULTIKOLINEARITETIT Sic e pame nje nga supozimet e modelit klasik linear te regresionit eshte qe nuk ka multikolinearitet perfekt, pra lidhje ekzakte lineare midis variablave te pavarur x , te perfshire ne nje regresion te shumefishte. Spjeguam ne menyre intuitive kuptimin e multikolinearitetit perfekt dhe arsyet per supozimin pse s`mund te ekzistoje ne popullimin e regresionit te shumefishte. Ne kete kapitull ne do te studiojme me nga afer temen e multikolinearitetit . Praktikisht ndeshemi rralle me multikolinearitet perfekt , por raste multikolineariteti shume te larte (ku variblat e pavarur jane perafersisht te lidhur linearisht) shpesh dalin ne shume aplikime. Eshte e rendesishme te njohesh se cfare problemesh, keto variabla te korreluar, do te shkaktojne per vleresuesite parametrave te modeleve te regresionit te shumefishte, te gjetur me MKV. Nje analize e plote e multikolineritetit do te behej ne se do te mund t`u pergjigjemi pyetjeve te meposhtme : 1-Cila eshte natyra e multikolinearitetit ? 2-A eshte multikolineariteti vertet nje problem ? 3-Cilat jane pasojat teorike te multikolinearitetit? 4-Cilat jane pasojat praktike te multikolinearitetit? 5-Si mund, praktikisht, ta zbulojme multikolinearitetin? 6-Nese deshirohet te eliminohet problemi i multikolinearitetit, cilat masa rregulluese jane te realizueshme?
PROF. DR. ALBERT QARRI EKONOMETRIA 6.1 NATYRA E MULTIKOLINEARITETIT Rasti i multikolinearitetit perfekt Per t`iu pergjigjur ketyre pyetjeve, konsiderojme fillimisht nje shembull te thjeshte numerik, qe eshte ndertuar per te nxjerre ne pah disa pika kritike rreth multikolinearitetit. Te dhenat e meposhtme tregojne kerkesen e konsideruar per nje produkt konsumi ne funksion te cmimit te tij dhe te ardhurave te disponueshme, te vleresuara per dy zgjedhje te ndryshme.( nga dy kerkues) TABELA 1. Y (sasia) 49 45 44 39 38 37 34 33 30 29
X1 (cmimi) 1 2 3 4 5 6 7 8 9 10
X2 (te ardhurat javore) 298 296 294 292 290 288 286 284 282 280
X3 ( te ardhura javore) 297.5 294.9 293.5 292.8 290.2 289.7 285.8 284.6 281.1 278.8
Meqe pervec cmimit, te ardhurat e konsumatorit jane gjithashtu determinante per kerkesen per mallra, e shkruajme funksionin e zgjeruar te kerkeses :
yi = α 0 + α1 x1i + α 2 x2i + ui
(6.1)
yi = β 0 + β1 x1i + β 2 x3i + ui
(6.2)
Keto funksione kerkesash ndryshojne ne masen e te ardhurave te perdorura. Apriori ose sipas teorise, α 1 dhe β1 pritet te jene negative, dhe α 2 dhe β 2 pritet te jene pozitive. Nese kerkuesi i pare do te perpunonte te dhenat per te pershtatur regresionin(1.1) me to, nuk do te mund te arrinte te bente vleresimin e parametrave te tij. Pse duhet te ndodh nje gje e tille ? Cfare ishte gabim? Asgje. Ne baze te dhenave per variablat x1 (cmimi) dhe x 2 (te ardhurat), duke provuar te pershtatim varesine e x 2 nga x1 , do marrim rezultatin e meposhtem:
PROF. DR. ALBERT QARRI EKONOMETRIA
x2i = 300 − 2 x1i
r2 =1
(6.3)
Me fjale te tjera, variabli i te ardhurave x 2 dhe i cmimit x1 jane te lidhur linearisht ne menyre perfekte, pra kemi kolinearitet perfekt ose multikolinearitet. Per shkak te lidhjes ne ekuacionin (6.3) nuk mund te vleresojme regresionin (1.1), por nese zevendesojme ekuacionin.(6.3) ne ekuacionin(6.1) ne fitojme:
yi = α 0 + α1 x1i + α 2 (300 − 2 x1i ) + ui = (α 0 + 300α 2 ) + (α1 − 2α 2 ) x1i + ui = c0 + c1 x1i + ui ku
(6.4) (6.5) (6.6)
c0 = α 0 + 300α 2 c1 = α1 − 2α 2
Ne nuk mund te vleresonim (6.1) por me sa tregon (6.4) ne nuk kemi me nje regresion te shumefishte, por nje regresion te thjeshte me dy variabla midis y dhe x1 . Tani, edhe pse ne mund te vleresojme (6.4) dhe te perftojme vleresimet e c0 dhe c1 , nga keto dy vlera ne s`mund te marrim vleresimet e parametrave fillestare α 0 , α 1 , α 2 , pasi ne kemi 2 ekuacione, por ka 3 te panjohura per te vleresuar. Rezultatet e vleresimit te regresionit (6.4) thuajse jepen ne: Ŷi = 49.667 – 2.1576X1i se = (0.746) (0.1203) t = (66.538) (-17.935)
r2 = 0.9757
(6.7)
Sic mund ta shohim c0=49.667dhe c1=(-2.1576), nga keto dy vlera ne asnje menyre ne s`mund te perftojme vlerat e tre te panjohurave α 0 , α1 , α 2 . Perfundimi i diskutimit te mesiperm eshte qe ne raste te lidhjes perfekte lineare ose multikolinearitetit midis variablave te pavarur , ne s`mund te perftojme vleresime unike te te gjithe parametrave. Perderisa nuk kemi vleresimet e tyre unike, ne nuk mund te skicojme asnje konkluzion statistikor rreth tyre nga nje model i dhene. Pra, ne raste te multikolinearitetit perfekt, vleresimi dhe testimi i hipotezave mbi koeficientet individuale te regresionit ne nje regresion te shumefishte, nuk eshte i mundur. Sigurisht, ashtu si ek.(6.5)dhe (6.6) tregojne, ne mund te perftojme vleresime te nje kombinimi linear te koeficienteve origjinale por jo secilin prej tyre individualisht.
PROF. DR. ALBERT QARRI EKONOMETRIA Rasti i multikolinearitetit imperfekt Rasti i multikolinearitetit perfekt eshte ekstrem. Ne shume aplikime qe perfshijne te dhenat ekonomike me dy ose me shume variabla te pavarur, keta nuk jane tamam te lidhur linearisht, por mund te jene pothuajse te tille. Pra kolineariteti mund te jete ”i larte” por jo perfekt. Ky eshte rasti i multikolinearitetit te perafert, imperfekt ose te larte. Se cfare duhet te kuptojme me kolinearitet te larte do ta spjegojme shkurt. Tani e tutje, kur te flasim per multikolinearitet do te kemi parasysh ate imperfekt. Per te pare se c`kuptojme me te, le te kthehemi te te dhenat e tabeles (6.1), por kete here ndjekim regresionin (6.2) me variablin e te ardhurave x3 . Ekuacioni i vleresuar i regresionit rezulton si me poshte : Ŷi = 145.37 - 2.7975X1i - 0.3191X3i se = (120.06) (0.8122) (0.4003) t = (1.2107) (-3.4444) (-0.7971)
(6.8) R2=0.9778
Keto rezultate jane interesante per keto arsye: a.Megjithese regresioni (6.1) nuk mund te vleresohet, ne mund te vleresojme regresionin (6.2), ndonese diferenca midis dy variablave te te ardhurave eshte shume i vogel. b.Sic pritej, koeficientet e cmimit jane negative ne te dy ekuacionet (6.7) dhe (6.8), dhe diferenca numerike midis te dyve nuk eshte mjaft e dukshme. Secili prej koeficienteve te cmimit eshte statistikisht i ndryshem nga zero, por vini re qe relativisht vlera e ketij koeficienti ne ek.(6.7) eshte shume me i madh se vlera koresponduese ne ek.(6.8). Ose, cfare na con tek e njejta gje, gabimi standard (se) i koeficientit te cmimit ne ek.(6.7) eshte shume me i vogel se ne ek.(6.8). c.Vlera e R2 ne ek. (6.7) me nje variabel te pavarur eshte 0.9757, kurse ne ek.(6.8) me dy variabla te pavarur ajo eshte 0.9778, nje rritje prej vetem 0.0021, qe nuk duket se eshte ndonje rritje e madhe. Mund te tregohet se kjo rritje ne vleren e R2 nuk eshte statistikisht e rendesishme. d.Koeficienti i variablit te te ardhurave eshte statistikisht i parendesishem, por me me rendesi eshte se ka shenjen e gabuar. Per shume te mira, te ardhurat kane nje efekt pozitiv ne sasine e kerkuar, pervec rastit kur e mira ne fjale eshte inferiore. e.Pavaresisht nga parendesia e variablit te te ardhurave nese ne do te testonim hipotezen se β1 = β 2 = 0 , hipoteza mund te hidhet poshte me lehtesi duke aplikuar kriterin F. Me fjale te tjera cmimi dhe te ardhurat se bashku kane nje ndikim te rendesishem ne sasine e kerkuar.
PROF. DR. ALBERT QARRI EKONOMETRIA
Po cfare i spjegon keto rezultate “te cuditshme”? Si celes te enigmes le te vendosim x1 kundrejt x3 , pra cmimin kundrejt te ardhura te zgjedhjes se dyte. Ndryshe nga zgjedhja e pare, shohim se megjithese cmimi dhe te ardhurat e disponueshme te kerkuesit te dyte, nuk kane nje lidhje lineare perfekte, ekziston nje shkalle e larte varesie midis te dyve. Kjo mund te shihet me qarte nga regresioni i meposhtem : X3i= 299.92 - 2.0055X1i + ei se = (0.6748) (0.1088) t = (444.44) (-18.44)
2
(6.9)
r =0.9884
Sic tregon dhe ky regresion, cmimi dhe te ardhurat jane fort te koreluar, koeficienti i korrelacionit eshte -0.9884. Ky eshte rasti i nje lidhje pothuajse perfekte lineare ose pothuaj multikolinearitet perfekt. Nese koeficienti i korelacionit do te ishte -1, si ne ek.(6.3), ky do te kishte qene rasti i multikolinearitetit perfekt.Vereni me kujdes ne ek.(6.3) ne nuk e shtuam ei sepse lidhja lineare midis X1i dhe X2i eshte perfekte, kurse ne ek.(1.9) e kemi shtuar ate per te treguar se lidhja midis X3i dhe X1i nuk eshte perfekte. Pra veme re se, nese jane vetem dy variabla te pavarur, koeficienti i korrelacionit r mund te perdoret si mase e shkalles ose fortesise se kolinearitetit. Por nese perfshihen me shume se dy variabla, sic do te tregojme me vone, koeficienti i korrelacionit mund te mos jete nje mase e pershtatshme e kolinearitetit.
PROF. DR. ALBERT QARRI EKONOMETRIA 6.2-PASOJAT TEORIKE TE MULTIKOLINEARITETIT Tani qe diskutuam natyren e multikolinearitetit perfekt dhe imperfekt, le te bejme te ditur pasojat e multikolinearitetit. Por mbani parasysh qe tani e tutje do te konsiderojme vetem rastin e multikolinearitetit imperfekt. Sic e dime, kur dhame supozimet e modelit klasik linear te regresionit , vleresuesit MKV (katrori me i vogel i zakonshem) jane vleresuesit me te mire e te paanshem lineare (BLUE). Ne klasen e BLUE, vleresuesit MKV kane variancen me te vogel te mundshme. Eshte interesante qe sa kohe qe kolineariteti s`eshte perfekt, vleresuesit MKV mbeten ende BLUE edhe pse nje ose me shume prej koeficienteve te pjesshem ne nje regresion te shumefishte mund te mos jene vec e vec statistikisht te rendesishem. Keshtu, ne ek(6.8) koeficienti i te ardhurave eshte statistikisht i parendesishem megjithese koeficienti i cmimit eshte statistikisht i rendesishem. Por vleresimet MKV te dhene ne ek.(6.8) a i ruajne ende cilesite si BLUE ? Atehere pse gjithe kjo zhurme rreth multikolinearitetit? Ka arsye te ndryshme : a.Eshte e vertete qe edhe ne prezencen e kolinearitetit te larte, vleresuesit MKV jane te paanshem, por mos harroni qe paanshmeria eshte nje cilesi e perseritur ne shembujt e marre. Kjo do te thote qe, duke mbajtur vlerat e variablave X te fiksuar, nese ne perftojme modele te ndryshme dhe llogarisim vleresimet MKV per secilin prej tyre, vlera mesatare e vleresimeve do te tentoje te perputhet me vleren e vertete te popullimit te vleresimeve. Por kjo s`do te thote asgje rreth vetive te vleresimeve te dhena ne cdo model te dhene . Aq me teper qe ne realitet, ne rralle kemi luksin e replikimit te modeleve. b.Eshte gjithashtu e vertete qe kolineariteti i larte nuk e shkaterron vetine e variances minimum te vleresuesve MKV. Ne klasen e te gjithe vleresuesve lineare te paanshem, vleresuesit MKV kane variance minimale. Megjithate, kjo nuk do te thote qe varianca e nje vleresuesi MKV do te jete e vogel ne lidhje me vleren e vleresuesit ne cdo model te dhene, ashtu si tregon shume qarte regresioni (6.8). Eshte e vertete qe vleresuesi i koeficientit te te ardhurave eshte BLUE, por ne modelin tone varianca e tij eshte kaq e madhe krahasuar me vleresimin , saqe vlera e llogaritur t eshte vetem -0.7971. Kjo do te na conte te pranonim hipotezen qe te ardhurat nuk kane asnje efekt mbi sasine e kerkuar. Shkurt, varianca minimale nuk do te thote qe vlera numerike e variances do te jete e vogel. c.Multikolineariteti eshte kryesisht nje fenomen zgjedhjeje, ne kuptimin qe edhe nese variablat X nuk jane te lidhur linearisht ne popullim, ata mund te jene te lidhur keshtu ne nje model te vecante si ai i tabeles 6.1. Kur ne themi keshtu, ne besojme qe gjithe variablat X te perfshire ne model kane nje efekt te vecante ose te pavarur ne variablin e varur Y. Por mund te ndodhe qe ne cdo model te dhene, disa ose gjithe variablat X te jene kaq shume te korreluar saqe ne nuk mund te vecojme ndikimin e tyre individual mbi Y.
PROF. DR. ALBERT QARRI EKONOMETRIA Pra, modeli yne na “braktis” megjithese teoria thote se te gjithe X-et jane te rendesishem. Edhe kjo ndodh sepse te dhenat me te shumta ekonomike nuk perftohen nga eksperimente te kontrolluara laboratori. Te dhenat mbi variablat si GNP, cmimet, papunesia, fitimet, dividentet, etj vezhgohen normalisht kur ndodhin dhe nuk perftohen eksperimentalisht. Nese te dhenat mund te perftoheshin eksperimentalisht, si fillim, ne nuk do te lejonim ekzistencen e kolinearitetit. Por perderisa te dhenat zakonisht perftohen joeksperimentalisht, dhe perderisa ka kolinearitet te larte ne dy ose me shume variabla te pavarur, shpesh jemi ne pozicionin statistikor te te mos qenit i afte per te bere vleresimet e duhura. Per te gjitha keto arsye, fakti qe vleresuesit MKV jane BLUE pervec multikolinearitetit (perfekt) na ngushellon pak praktikisht. Prandaj ne duhet te mundohemi te gjejme cfare ndodh ose mund te ndodhe ne cdo model te dhene .Sic e vume re kolineariteti eshte zakonisht fenomen i nje modeli specifik.
PROF. DR. ALBERT QARRI EKONOMETRIA 6.3 – PASOJAT PRAKTIKE TE MULTIKOLINEARITETIT Ne rastet e multikolinearitetit te larte ,si ne regresionin e kerkeses se dhene per produktin e mesiperm te konsumit , na duhet te numerojme pasojat e meposhtme : a-Variancat e gjera dhe gabimi standard i vleresuesve MKV. Kjo shihet qarte nga regresionet (6.7) dhe (6.8) . Sic diskutuam me pare, per shkak te kolinearitetit te larte midis cmimit X1 dhe te hyrave X3, kur te dy variablat jane te perfshire ne regresionin (6.8), gabimi standard i koeficientit te variablit cmim rritet drastikisht ne krahasim me regresionin (6.7). Sic e dime, nese gabimi standard i nje vleresuesi rritet, behet me i veshtire vleresimi i vleres se vertete te vleresuesit. Kjo spjegon nje renie te mundshme ne saktesine e vleresuesve MKV. b-Intervale sigurie me te gjere. Per shkak te gabimit te madh standard,intervalet e sigurise per parametrat e popullimit perkates priren te jene te gjere. c-Raportet t “te parendesishme”. Kujtoni qe, per te kontrolluar hipotezen qe ne regresionin tone (6.8) β 2 = 0, ne perdorem raportin t dhe krahasojme vleren t te vrojtuar me t kritike nga tabela. Por eshte vene re qe me pare, qe ne raste te kolinearitetit te larte, gabimet e vleresuara standarde rriten drastikisht, duke i bere vlerat t me te vogla. Prandaj ne te tilla raste do te pranojme gjithmone e me shume hipotezen zero qe koeficienti i vertete i popullimit perkates eshte zero. Keshtu, ne regresionin (6.8), perderisa vlera t eshte vetem –0.7971, ne duhet te dalim ne konkluzionin qe ne shembullin e produktit ne studim te ardhurat nuk kane asnje efekt mbi sasine e kerkuar. d-Nje vlere e larte e R2 , por pak raporte t te rendesishem . Regresioni (6.8) e tregon kete qarte R2 ne kete regresion eshte mjaft i larte 0.98 , por vetem raporti t i variablit cmim eshte i rendesishem. Dhe akoma ne baze te raportit F, sic e kemi pare, mund te hedhim poshte hipotezen qe cmimi dhe variabli i te ardhurave njekohesisht, nuk kane asnje efekt ne sasine e kerkuar te produktit ne studim. e-Vleresuesit MKV dhe gabimet e tyre standarde behen shume te ndjeshem ndaj ndryshimeve te vogla ne te dhenat, qe do te thote se priren te jene te paqendrueshem. Per te pare kete kthehemi te tabela 6.1. Supozojme se ndryshojme te dhenat e variablit te te hyrave (X3) shume pak.Vrojtimi i pare, i peste dhe i dhjete do te jene tani respektivisht 295, 287 dhe 274. Te gjitha vlerat e tjera qendrojne njesoj. Rezultati i ketij ndryshimi jep regresionin e meposhtem: Ŷ= 100.56 - 2.5164X1i - 0.16995X3i se=(48.030) (0.35906) (0.1604) t= (2.0936) (-7.0083) (-1.0597)
2
R =0.9791
(6.10)
PROF. DR. ALBERT QARRI EKONOMETRIA Duke krahasuar ekuacionin (6.8)me regresionin (6.10) verejme qe si rezultat i nje ndryshimi shume te vogel ne te dhena , regresioni ndryshon mjaft thelbesisht. Relativisht, gabimet standarde jane zvogeluar ne ek. (6.10), si rezultat raportet t jane rritur ne vlere absolute dhe variabli i te ardhurave tani eshte bere me pak negativ se me pare. Pse ky ndryshim? Ne regresionin (6.8) koeficienti i korelacionit midis X1 dhe X3 ishte –0.9884, ndersa ne regresionin (6.10) ai ishte 0.9431. Me fjale te tjera , shkalla e kolinearitetit midis X1 dhe X3 eshte zvogeluar duke kaluar nga ek.(6.8) ne ate (6.10). Edhe pse kjo renie ne koeficientin e korelacionit nuk duket befasues, ndryshimi ne rezultatet e regresionit eshte i dukshem. Dhe kjo eshte saktesisht ajo cka ndodh ne raste te kolinearitetit perfekt. f-Shenja te gabuara per koeficientet e regresionit. Sic e shohim te regresionet (6.8) dhe (6.10), variabli i te hyrave ka shenje te gabuar, pasi teoria ekonomike na ka bere te besojme se per shumicen e te mirave efekti i te ardhurave eshte pozitiv. Sigurisht, per nje te mire inferiore kjo nuk eshte shenje e gabuar. Prandaj ne na duhet te jemi te kujdesshem ne atribuimin e shenjes se gabuar te multikolinearitetit, por nuk duhet as te dalim nga rregullat. g-Veshtiresi ne vleresimin e kontributit individual te variablave te pavarur ne shumen e spjeguar te katroreve (SKG) ose R2. Ne mund ta ilustrojme kete pike perseri me shembullin e produktit te mesiperm. Ne ek.(6.7)ne gjetem regresionin e sasise (Y) per cmimin (X1) duke dhene nje vlere regresioni 0.9757. Ne regresionin (6.8) ne gjetem regresionin e (Y) si per cmimin dhe per te hyrat duke perftuar nje R2 =0.9778.Tani nese ne gjejme regresionin e (Y) vetem per X3 do te marrim rezultatet e meposhtme. Ŷ= -263.74 + 1.0438X3i se= (26.929) (0.0932) t= (-9.794) (11.200)
2
(6.11)
R =0.9400
Vini re qe vetem te hyrat X3 spjegojne 94% te variacionit ne sasine e kerkuar.Pervec kesaj koeficienti i te ardhurave te kerkuesit te dyte nuk eshte vetem statistikisht i rendesishem por gjithashtu pozitiv, ne lidhje me pritjet teorike ! Sic u tregua qe me pare, ne regresionin e shumefishte (6.8) vlera e R2 eshte 0.9778. Cila pjese e tij i detyrohet X1shit dhe cila X3-shit ? Ne nuk mund ta themi saktesisht, sepse te dy variablat jane kaq shume kolineare saqe kur njeri leviz, tjetri leviz me te automatikisht, sic shihet qarte ne regresionin (6.9). Prandaj ne raste te kolinearitetit te larte eshte e padobishme te vleresohet kontributi i cdo variabli te pavarur tek R2 e pergjithshme. Nje pyetje do te ishte: A mund pasojat e multikolinearitetit qe ne ilustruam te percaktohen rigorozisht? Po! Por ne do te kapercejme argumentat ketu , perderisa ato nuk mund te gjenden diku tjeter.
PROF. DR. ALBERT QARRI EKONOMETRIA
6.4-ZBULIMI I MULTIKOLINEARITETIT Sic u tregua ne pjesen e meparshme, pasojat praktike te multikolinearitetit mund te jene te largeta, pavaresisht vetive te BLUE. Pra, c’mund te bejme per te zgjidhur problemin e multikolinearitetit? Por para se ta zgjidhim ate, ne duhet fillimisht te gjejme nese kemi nje problem kolineariteti. Shkurt, si e zbulojme pranine dhe rendesine e multikolinearitetit? Tani lind nje problem, pasi sic e pame multikolineariteti eshte specifik zgjedhjeje, pra eshte nje fenomen i saj. Ketu eshte e nevojshme te mbajme mend paralajmerimet e meposhtme : 1. Multikolineariteti eshte nje ceshtje shkalle dhe jo lloji. Dallimi thelbesor nuk eshte midis pranise apo mungeses se multikolinearitetit, por midis shkalleve te ndryshme te tij. 2. Perderisa multikolineariteti i referohet kushtit te variablave te pavarur, qe supozohet te jene te paderivuar, ai eshte nje karakteristike e zgjedhjes dhe jo e popullimit. Prandaj ne nuk” kontrollojme per multikolinearitet”, por mundemi, nese duam, te matim shkallen e tij ne cdo model te vecante. Na duhet te shtojme menjehere se nuk kemi nje mates te vetem multikolineariteti, keshtu ne te dhenat e mbledhura joeksperimentalisht ne s`mund te jemi kurre te sigurt rreth natyres dhe shkalles se kolinearitetit. Ajo cka ne disponojme jane disa rregulla elementare ose tregues qe do te na sigurojne celesa rreth ekzistences se multikolinearitetit ne aplikime konkrete. Disa prej ketyre treguesve jane : 1-R2 i larte, por pak raporte t te rendesishme. Sic e theksuam, kjo eshte “simptoma “ klasike e multikolinearitetit.Nese R2 eshte e larte le te themi mbi 0.8, testimi me F ne shumicen e rasteve do te hedhe poshte hipotezen baze qe koeficientet e pjesshem jane njekohesisht baraz me zero. Por testimi individual me t do te tregoje qe asnje ose shume pak koeficiente te pjesshem kendore jane statistikisht te ndryshem nga zero. Regresioni yne (6.8) e verteton kete plotesisht. 2-Korelacione te larte ciftesh midis variablave te pavarur. Nese ne nje regresion te shumefishte qe perfshin, le te themi 6 variabla te pavarur, ne llogarisim koeficientin e korelacionit midis cdo cifti variablash duke perdorur formulen dhe nese disa nga keto korelacione jane te larte, te themi mbi 0.8, ka mundesi te ekzistoje kolinearitet “serioz” . Fatkeqesisht ky kriter nuk eshte shpesh i besueshem, por ka raste kur korelacioni i cifteve mund te jete i ulet (duke sugjeruar mungese kolineariteti serioz), dhe ende kolineariteti eshte i dyshueshem sepse shume pak raporte t jane statistikisht te rendesishem. 3-Shqyrtimi i korelacionit te pjesshem. Supozoni se kemi tre variabla te pavarur X1,X2 dhe X3. Le te perfaqesojne r12, r13 dhe r23 korelacionet e cifteve perkatesisht midis X1 dhe X2, X1 dhe X3, X2 dhe X3. Supozojme r12=0.90, qe tregon kolinearitet te larte midis X1 dhe X2. Nese koeficienti i korelacionit, i
PROF. DR. ALBERT QARRI EKONOMETRIA quajtur koeficient i pjesshem korelacioni, r12.3, qe eshte koeficienti i korelacionit midis X1 dhe X2,duke mbajtur ndikimin e variances X3 konstant, koeficienti i korelacionit midis X1 dhe X2 eshte vetem 0.43, ndersa duke mos marre parasysh ndikimin e X3 ,eshte 0.90. Pra, gjykuar nga korrelacioni i pjesshem, ne s`mund te themi qe kolineariteti midis X1 dhe X2 eshte domosdoshmerisht i larte. Sic e shohim, ne kontekstin e variablave te ndryshem te pavarur, besimi ne korrelacionet e cifteve si tregues te multikolinearitetit mund te jete corientues. Fatkeqesisht, zevendesimi i korrelacionit te cifteve me koeficiente te pjesshem te korrelacionit nuk siguron nje pasje definitive te pranise se multikolinearitetit. I dyti siguron vetem nje tjeter mekanizem per te kontrolluar natyren e multikolinearitetit. 4-Regresionet dytesore ose ndihmes. Perderisa multikolineariteti lind, sepse nje ose me shume prej variablave te pavarur jane kombinime lineare ose pothuaj lineare, nje menyre per te gjetur se cili variabel X eshte shume kolinear me variabla te tjere X ne model, duhet bere regresioni i cdo variabli X me te tjeret qe mbeten dhe te llogaritet R2 koresponduese. Secili prej ketyre regresioneve eshte quajtur ndihmes ose dytesor per regresionin kryesor te Y per te gjithe X-et. P.sh. konsideroni regresionin e Y per X1, X2, X3, X4, X5 dhe X6 variabla te pavarur. Nese ky regresion tregon se ne kemi nje problem multikolineariteti per shkak se kemi te nje R2 te larte, por ku shume pak koeficiente te X-it jane statistikisht te rendesishem, atehere ne kerkojme me pas “fajtorin”, variabli qe mund te jete nje kombinim linear ose pothuajse linear me X-et e tjere. Procedura do te jete si me poshte: a.Krijojme regresionin e X1 me X-et e tjere dhe perftojme koeficientin e percaktueshmerise R12. b.Krijojme regresionin e X2 me X-et e tjere dhe perftojme koeficientin e percaktueshmerise R22. Vazhdojme kete procedure per te gjithe variablat X ne model. Ne shembullin tone, ne do te kemi keshtu gjashte regresionet ndihmes, nje per cdo variabel te pavarur. Por si e vendosim se cilet prej variablave jane kolineare? Ri2 i gjetur do te levize midis 0 dhe 1. Nese nje variabel X nuk eshte kombinim linear i X-ve te tjere, Ri2 i atij regresioni nuk do te ishte statistikisht shume i ndryshem nga zero. Dime si te kontrollojme supozimin se nje koeficient i vecante percaktueshmerie eshte statistikisht zero. Duke vazhduar me shembullin tone hipotetik, qe perfshin gjashte variabla te pavarur, supozojme se duam te kontrollojme hipotezen qe R12 =0, qe do te thote qe X1 nuk eshte kolinear me pese te tjeret. F = R2 / (k-1) (1-R2)/(n-k) ku n eshte numri i vrojtimeve dhe k-1 numri i variablave te pavarur.
PROF. DR. ALBERT QARRI EKONOMETRIA Le ta ilustrojme : Ne shembullin tone hipotetik qe perfshin gjashte variabla te pavarur, shohim lidhjen e secilit prej variablave X me X-et e tjere ne nje shembull me 50 vrojtime.Vlerat e R2 te perftuara nga regresionet e ndryshem ndihmes jane si me poshte: R12 = R22 = R32 = R42 = R52 = R62 =
0.90 0.18 0.36 0.86 0.09 0.24
Rezultatet e aplikimit te kriterit F jane dhene ne tabelen (2). Sic e tregon kjo tabele variablat X1, X3, X4 dhe X6 duket se jane kolineare me X-et e tjere, megjithese shkalla e kolinaritetit e matur nga R2 varion konsiderueshem. Ky shembull tregon faktin e rendesishem qe nje R2=0.36 qe duket si e ulet, mund te jete statistikisht e ndryshme nga zero. Teknika e regresionit ndihmes mbart ne vetvete nje mangesi. Nese nje regresion permban variabla te pavarur te ndryshem, duhet te llogariten regresione te ndryshem ndihmes dhe prandaj kjo metode per zbulimin e kolinaritetit mund te kete vlere te kufizuar praktike. TABELA 6.2 Vlera e R 0.90 0.18 0.36 0.86 0.09 0.24
2
Duke testuar rendesine e R2 Vlera e F Eshte F domethenese 79.20 PO 1.93 JO 4.95 PO 54.06 PO 0.87 JO 2.78 PO
5-Faktori inflacion i variances (VIF). Edhe nese nje model nuk permban variabla te pavarur te ndryshem, vlerat e perftuara te R2 nga regresionet e ndryshem ndihmes mund te mos jene diagnoza teknikisht te besueshme te kolinaritetit. Kjo mund te shihet me qarte nese ne kthehemi te regresioni me dy apo me shume variabla i diskutuar ne kapitujt e meparshem. Ne kemi dhene formulat per te llogaritur variancat e dy koeficienteve kendore te pjesshem b1 dhe b2 . Me nderhyrje te thjeshta algjebrike keto formula variance mund te shkruhen si:
PROF. DR. ALBERT QARRI EKONOMETRIA
VAR(b1 ) =
VAR(b2 ) =
σ2 2 1i
(1 − R12 )
∑x
σ2
∑x
2 2i
(1 − R12 )
=
=
σ2 2 1i
∑x
σ2
∑x
2 2i
(6.12)
VIF
(6.13)
VIF
Ne keto formula R12 eshte koficienti i percaktueshmerise ne regresionin (ndihmes) te X1 me X2. Ne formulat e mesiperme:
VIF = 1 /(1 − R12 )
(6.14)
Kjo shprehje eshte quajtur me te drejte faktori inflacion i variances (VIF) sepse ndersa R2 rritet, varianca, dhe prej ketej gabimi standard si i b1 dhe i b2 rritet. Ne rastin ekstrem, kur ky koeficient i percaktueshmerise eshte 1 keto varianca dhe gabime standarde jane te pacaktuar. Dhe nese R2 eshte 0, pra aspak kolinear, VIF do te jete 1, dhe ne nuk do na duhet te shqetesohemi per variancat e gjera dhe gabimet standarde qe shqetesojne situatat e kolinearitetit . Tani nje ceshtje e rendesishme: Supozojme se Ri2 ne nje regresion ndihmes eshte shume i larte , qe nenkupton nje shkalle te larte kolineariteti si per kriterin e diskutuar me larte. Por sic tregojne qarte ek.(6.12) ,(6.13) dhe (6.14) varianca te themi e b1 nuk varet vetem nga VIF, por edhe nga varianca e u i . Keshtu eshte mjaft e mundur qe nje R12 te jete shume e larte, te themi 0.91, ose σ2 te jete e ulet ose ΣX12 e larte, ose te dyja, keshtu qe varianca e b1 mund te jete me e ulet dhe raporti t me i larte. Me fjale te tjera, termat”i ulet” dhe i “ i larte” perdoren me kuptim relativ. E gjithe kjo sugjeron qe nje R2 e larte e perftuar nga nje regresion ndihmes mund te jete vetem nje tregues siperfaqesor i multikolinearitetit. Ai mund jo domosdoshmerisht te rrise gabimet standarde te kritereve, si tregon diskutimi i mesiperm. Me formalisht, Ri2 e larte nuk eshte as e nevojshme as e mjaftueshme per te bere te larte gabimet standarde dhe keshtu multikolineariteti vete s’ka nevoje te krijoje gabime standarde “te larte”. C’fare perfundime te pergjithshme mund te nxjerrim nga analizat e ndryshme te multikolinearitetit te sapo diskutuar? Ka tregues te ndryshem te multikolinearitetit dhe asnje analize e vetme s’do te na jape nje trajtim te kompletuar mbi problemin e kolinearitetit. Kujtojme qe multikolineariteti eshte nje ceshtje shkalle dhe fenomen specifik zgjedhjeje. Ne disa situata mund te jete i lehte diagnostikimi, por ne te tjera do te na duhet te perdorim nje ose me shume prej metodave te mesiperme per te gjetur ashpersine e problemit. Nuk ka zgjidhje te lehte per problemin. Kerkimi mbi diagnozat e multikolinearitetit vazhdojne. Ka disa teknika te reja si ai i indeksit te kushteve , por ato shkojne pertej qellimit te ketij libri, keshtu qe nuk po thellohemi ne trajtimin e tyre.
PROF. DR. ALBERT QARRI EKONOMETRIA 6.5- A ESHTE MULTIKOLINEARITETI DOMOSDOSHMERISHT I KEQ? Para se te vazhdojme te konsiderojme masat permiresuese per problemin e multikolinearitetit,na duhet t’i pergjigjemi fillimisht nje pyetjeje: A eshte multikolineariteti domosdoshmerisht nje “e keqe”? Pergjigja varet nga qellimi i studimit. Nese qellimi i studimit eshte te krijohet modeli per te parashikuar vleren e ardhme te variablit te varur, kolineariteti ne vetvete mund te mos jete i keq. Duke u kthyer tek ek.(6.8)i funksionit te kerkeses per produktin e mesiperm te konsumit, megjithese variabli i te ardhurave nuk eshte individualisht statistikisht i rendesishem, Ri2 i pergjithshem prej 0.9778 eshte disi me i larte se ai i ek.(6.7), i cili le jashte variablin X3 te te ardhurave te kerkuesit te dyte. Prandaj per qellime parashikimi ek.(6.8) eshte disi me i mire se ek.(6.7). Shpesh parashikuesit zgjedhin nje model ne baze te fuqise se tij spjeguese te matur nga R2. A eshte kjo nje strategji e mire? Mund te jete, nese ne supozojme qe kolineariteti i vezhguar mes cmimit dhe te ardhurave te kerkuesit te dyte, te dhena ne tabelen 6.1 , do te vazhdojne ne te ardhmen. Ne ek.(6.9) ne treguam si X3 dhe X1 jane te lidhura. Nese e njejta marredhenie pritet te vazhdoje edhe ne te ardhmen, atehere ek(6.8) mund te perdoret per qellim parashikimi. Por kjo eshte nje “nese” e madhe. Nese ne nje model tjeter, shkalla e kolinearitetit midis dy variablava s’eshte aq e madhe, natyrisht qe nje parashikim i bazuar ne ek .(6.8) ka pak vlere . Nga ana tjeter, nese objektivi i studimit s’eshte vetem parashikimi, por gjithashtu vleresimi i besueshem i parametrave individuale te modelit te zgjedhur, atehere kolineariteti serioz mund te jete “i keq”, sepse ne kemi pare qe kjo priret te rrise gabime standarde te kritereve. Sidoqofte, sic e kemi vene re, nese objektivi i studimit eshte te vleresohet nje grup i koeficienteve (p.sh shuma ose diferenca e dy koeficienteve) kjo mund te behet dhe ne prani te multikolinearitetit. Ne kete rast multikolineariteti mund te mos jete problem . Keshtu ne ek .(6.7), koeficienti kendor prej -2,1576 eshte nje vleresim i c1 qe mund te matet me kujdes nga procedura e zakonshme MKV, megjithese as α 1 , as α 2 s’mund te maten individualisht . Mund te kete disa situata „te kenaqshme“ ku me gjithe kolinearitetin e larte, R2 e vleresuar dhe shumica e koeficienteve individuale te regresionit jane statistikisht te rendesishem ne baze te kriterit t ne nivelin tradicional te rendesise , si p.sh 5 %. Kjo mund te lind nese koeficientet e vecante ndodh te jene numerikisht shume mbi vleren e vertete, te tille qe efekti ende shfaqet pavaresisht gabimit standard te rritur ose sepse vlera e vertete ne vetvete eshte kaq e madhe saqe edhe nje vleresim me i ulet ende shfaqet si i rendesishem.
PROF. DR. ALBERT QARRI EKONOMETRIA 6.6- CFARE TE BEJME ME MULTIKOLINEARITETIN: MASAT RREGULLUESE Supozojme mbi bazen e nje ose me shume prej testeve te diagnozave te diskutuara se nje problem i vecante eshte „i bezdisur“ prej multikolinearitetit. Cfare zgjidhjesh, nese ka, mund te perdoren per te reduktuar “ashpersine“ e problemit te kolinearitetit, nese s’mund ta eleminojme plotesisht? Fatkeqesisht, si ne rastin e diagnozave te kolinearitetit, nuk ka nje mjet te sigurt, ka vec disa rregulla elementare. Kjo sepse multikolineariteti eshte veti e nje zgjedhjeje te vecante dhe jo domosdoshmerisht veti e popullimit.Pervec kolinearitetit te larte vleresuesit MKV ende i mbajne cilesite e tyre BLUE. Eshte e vertete qe nje ose me shume koeficiente te regresionit mund te jene individualisht statistikisht te parendesishem, ose qe disa prej tyre mund te kene shenjat e gabuara . Nese kerkuesi eshte i vendosur per reduktimin e ashpersise se problemit te kolinearitetit , atehere ai mund te provoje nje ose me shume prej metodave te meposhtme, duke mbajtur parasysh se nese modeli i vecante eshte „i semure“, nuk mund te behet dot shume per te. Le te konsiderojme rregullimet e mundshme qe jane diskutuar ne literaturen ekonometrike . Largimi i nje variabli prej modelit. Kur perballemi me multikolinearitet te forte zgjidhja me e thjeshte mund te duket largimi i nje ose me shume prej variablave kolineare. Por ky rregullim mund te jete me i keq se semundja(multikolineariteti). Gjate formulimit te nje modeli ekonomik, ne e bazojme modelin ne disa konsiderata teorike . Mund qe ekonomikisht regresioni i gjetur pasi larguam ata variabla qe mendojme se duhet te largohen, eshte nje funksion i pershtatshem. Por duke larguar keto variabla nga modeli do te shkojme tek ai qe eshte i njohur si gabimi specifik i modelit, teme kjo qe do te trajtohet ne vazhdimesi te temave. Sic do te tregojme me vone, nese ne largojme nje variabel nga modeli thjesht per te eleminuar problemin e kolinearitetit dhe te vleresojme nje model pa kete variabel, parametrat e vleresuar te modelit te reduktuar mund te behen te njeanshem . Duhet te mendojme se, duke reduktuar ashpersine e problemit te kolinearitetit , ne mund te jemi duke perftuar vleresues te njeanshem te koeficenteve te mbajtur ne model . Keshilla me e mire praktike s’eshte largimi i nje variabli nga nje model ekonomikisht i qendrueshem thjesht sepse problemi i kolinearitetit eshte serioz . N.q.s nje model i zgjedhur eshte ekonomikisht i sakte patjeter qe eshte nje qellim i rendesishem, qe do te konsiderohet ne vazhdim. Duke perftuar te dhena shtese ose nje model te ri . Perderisa multikolineariteti eshte nje veti zgjedhjeje, eshte e mundur qe ne nje model tjeter qe perfshin te njejtet variabla, kolineariteti mund te mos jete aq serioz sa ne modelin e pare . Ceshtja e rendesishme praktike eshte nese mund te perftohet nje model tjeter, por mbledhja e te dhenave mund te jete e kushtueshme . Shpesh duke perftuar te dhena shtese – rritje te mases se modelit- mund te reduktohet ashpersia e problemit te kolinearitetit . Kjo mund te shihet lehte nga formulat (6.12)dhe (6.13) . P.sh ne formulen : Var(b2) = σ2 / Σx22i(1-R12)
PROF. DR. ALBERT QARRI EKONOMETRIA Per nje σ2 dhe R2 te dhena , nese masa e modelit te X2 rritet , Σx22i pergjithesisht do te rritet , si rezultat i te cilit varianca e b2 do te priret te ulet, dhe bashke me te gabimi standart i b2 . Sigurisht si ne rastin e perftimit te nje modeli te ri, marrja e te dhenave shtese mbi variablat e modelit , mund te mos jete e mundur per shkak te kostove dhe konsideratave te tjera . Por nese keto detyrime nuk jane shume penguese, me te gjitha mjetet ky rregullim eshte sigurisht i mundshem . Duke rimenduar modelin . Shpesh nje model i zgjedhur per analiza empirike nuk eshte i menduar kujdesshem- ndoshta disa variabla te rendesishem mungojne, ose ndoshta forma funksionale e modelit eshte zgjedhur ne menyre jokorrekte. Ne prani te nje shkalle te larte kolineariteti s’eshte e mundur te vleresohet nje koeficient i vetem regresioni shume saktesisht (pra me nje gabim me te vogel standard). Pra mosspecifikimi i modelit mund te jete shkaku i kolinearitetit ne modelin e pershtatur keq. Informacion i meparshem rreth disa parametrave . Shpesh nje fenomen i vecante , si nje funksion kerkese, studiohet here pas here. Megjithese si metode intuitive na terheq vemendjen, thelbi i metodes qendron ne perftimin e informacionit te jashtem ose te meparshem, qe nuk eshte gjithmone i mundur. Por me kritikisht, edhe nese mund te perftojme kete informacion, supozimi qe informacioni i meparshem vazhdon te mbaje modelin nen studim mund te jete nje supozim i tepert. Transformimi i variablave . Rastesisht, transformimi i variablave te perfshire ne model mund te minimizoje, nese nuk zgjidh, problemin e kolinearitetit . Rregullime te tjera. Ka rregullime te tjera kryesore te sugjeruara ne literature, si kombinimi i serive kohore dhe te dhenave te terthorta te grupit, faktor, ose analiza e komponenteve kryesore dhe regresioni kulmor . Por nje diskutim i plote i ketyre temave nuk do te na merrte vetem shume kohe, do te kerkonte gjithashtu njohuri statistikore qe shkojne pertej atyre te dhena ne kete tekst .