Manua uall de Eco Econo nome mett ría Alfonso Novales April 29, 2003
Contents 1 I nt nt rro oducci ón . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Algu Algunos conceptos tos estad tadístico ticos básico icos . . . . . . . . . . . . . . . . . . 2.1 Me Med dida idas de po pos sició ición n y medida idas de dispe ispers rsió ión n . . . . . . . . . . . . 2.1.1 La media muestral tral co como pred redicto ictorr . . . . . . . . . . . . . . 2.1.2 .1.2 La de des sviac viación ión t ípic ípica a como indic indica ado dorr de de vola volatt ilidad ilidad . . . . . 2.2 M ed edi da das de asoci aci ón ón . . . . . . . . . . . . . . . . . . . . . . . . 3 Contras trastac tación ión de hipó ipótes tesis estad tadístic ística as . . . . . . . . . . . . . . . . . . 3.1 Contras trastes tes de Norma rmalid lidad . . . . . . . . . . . . . . . . . . . . . . 3.2 Contrate trates s de asociac iación ión . . . . . . . . . . . . . . . . . . . . . . . . 4 Tr at am ami ent o de dat os os . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1 A ju j ust e est ac aci on onal . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Tasas de var ia iaci ón ón . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Estima timación ión de componentes tes . . . . . . . . . . . . . . . . . . . . . 5 El mo modelo line lineal sim simp ple de reg regres resión ión . . . . . . . . . . . . . . . . . . . . 5.1 Descrip ripción ión del modelo . . . . . . . . . . . . . . . . . . . . . . . . 5.1.1 Nube de punt os os . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Esti Esti mación ión po porr mín mínimo imos s cuadrado rados s (ord (ordina inario rios s) . . . . . . . . . . 5.2.1 5.2 .1 Re Repre pres senta nt ación gr áfi ca de la rec rect a de reg regres resión ión est imada imada . 5.3 Propie Propieda dade des s de dell est imado imadorr de mí mínim nimo os cua uadra drado dos s ordinarios rdinarios . . . 5.4 Re Res siduos de dell mode modelo. lo. Gráfi cos de r es esi du duos . . . . . . . . . . . . . 5.4.1 .4.1 Est Est imac imación ión de la varianz rianza de dell término término de pe pert rt urbac urbación ión . . 5.5 Cu Cua ando los coefi ci ente nt es de dell modelo modelo de r egresión resión cam ambian bian a lo l o larg l argo o de l a muest ra ra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.5.1 .5.1 Ca Camb mbio io est ruct ruct ural ural en en los coefi ci ente nt es de dell modelo modelo de r egresi resi ón
5 5 5 5 7 9 9 14 14 15 15 15 15 15 15 15 15 15 15 16 17 17 18
5.5.2 .5.2 Vari Vari ación gradual radual en en l os coefi cien ientes tes del modelo . . . . . . 5.6 Algu Algunos modelos los de reg regres resión ión sencillos illos . . . . . . . . . . . . . . . 5.6.1 El modelo constan tante . . . . . . . . . . . . . . . . . . . . . 5.6.2 .6.2 El mo mode delo lo co con vari vari ables bles en des desvia vi aciones iones res respe pec ct o a la media media 5.6.3 .6.3 El mode modelo lo con tende tendenc ncia ia de dett erminist rminist a line li nea al y cua cuadrá drátt ica . 5.6.4 Mo Mod delos los no line lineales les en las las variab riables les . . . . . . . . . . . . . 5.7 ¿Cómo especi peci fi car un un modelo de reg regres resión ión? . . . . . . . . . . . . . 5.7.1 .7.1 ¿De Debe be incluir incluir se una const nst ant e en el mode modelo lo de reg regres resión? ión? . 5.7.2 5.7 .2 ¿De Debe bemo mos s es est imar en valor valore es or or iginales iginales o en en l oga gari ri t mo mos s de l as as var ia iabl es es? . . . . . . . . . . . . . . . . . . . . . . . . . 5.7.3 5.7 .3 ¿De Debe be e es st imarse imarse el el model model o con con vari vari able bl es en en nivel nivel es o en di fe fer en enci as? . . . . . . . . . . . . . . . . . . . . . . . . . . 5.7.4 .7.4 La frec frecue uenc ncia ia de obse bservac rvación ión de las las variable riables s . . . . . . . . 6 Co Con nt rast rast es de hipót hipót esis en el mode modelo lo de reg regres resión ión line li nea al simple simple . . . . . 6.1 Signi ignifi cación ión estad tadís ístt ica ica vers versu us prec precisió isión n . . . . . . . . . . . . . . 6.1.1 .1.1 ¿Se ha hac ce un una a vari varia able má más s o me meno nos s signi igni fi cat i va va? . . . . . . 6.1.2 6.1 .2 ¿Có Cómo mo pue puede de dis di scut ir se qué vari vari able es más rele releva vant nte ee en n una r eg egr es esi ón ón? . . . . . . . . . . . . . . . . . . . . . . . . . 7 Correla rrelac ción ión versu rsus causalida lidad . . . . . . . . . . . . . . . . . . . . . . . 8 Varia riables les no estac tacion ionaria rias . . . . . . . . . . . . . . . . . . . . . . . . . 8.1 Carac racterís terísti ti cas de una variab riable est acion ionaria . . . . . . . . . . . . . 8.2 Tend Tende encia ncias s de dett erminis rministt as y tend tende encia ncias s est ocást ica icas . . . . . . . . . 8.3 Regres resión ión espúrea rea . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3.1 .3.1 Re Reg gres resión espú púre rea a ba bajj o t ende ndenc ncias ias de dett erminist rminist as . . . . . . 8.3.2 .3.2 Re Reg gres resión espú púre rea a ba bajj o t ende ndenc ncias ias est ocá ocást icas icas . . . . . . . 8.4 Trata Tratam mien iento de ten tendencias ias determ termin inis ista tas s . . . . . . . . . . . . . . 8.5 Ej er er ci ci ci ci os os de si mu mul ac aci ón ón . . . . . . . . . . . . . . . . . . . . . . . 8.6 Tend Tende encias ias est ocásti cas y raíc raíce es unit arias rias . . . . . . . . . . . . . . 8.7 Contras trastes tes de raí raíz unitari itaria a . . . . . . . . . . . . . . . . . . . . . . 8.8 Coi nt nt eg egr aci ón . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.8.1 Contras traste de cointe integ grac ración ión . . . . . . . . . . . . . . . . . . 8.8.2 .8.2 Co Contr ntr ast e de hipóte hipót esis sobre la relac relación ión de coi nte nteg gración ración estima timada po porr mínimo imos cuadrad rados . . . . . . . . . . . . . . . 8.8.3 Correla rrelac ción ión y cointe integ grac ración ión . . . . . . . . . . . . . . . . . 8.8.4 Variab riables les cointe integ grad radas: un un ejem jemplo . . . . . . . . . . . . . 8.8.5 El mo modelo de correc rrección ión de error rror . . . . . . . . . . . . . . . 8.8.6 .8.6 El contr aste de coint int egrac ración ión de Joha Johans nse en . . . . . . . . . 2
21 21 21 23 24 25 26 26 27 27 27 30 30 32 32 32 32 32 33 36 38 39 42 44 44 45 45 45 47 47 48 49 51
8.8.7 8.8 .7
9
10 11 12 13 14
15 16
17 18
A spe pec ct osc os com omune unes s a var var ias var var iables iables t emporales mporales: t ende ndenc ncii as comunes, volatilid latilida ad común. . . . . . . . . . . . . . . . . . 8.8.8 ¿Quéha Qué hace cerr en en pres presenci nci a de vari vari able bl es con con t ende ndenc ncii as est ocás ocás-tica ticas (ra (raíces unitari itaria as)? . . . . . . . . . . . . . . . . . . . . Matric Ma trice es de covarian rianzas no escalare lares s. . . . . . . . . . . . . . . . . . . . 9.1 De Dete tec cción ión de la autoc tocorrela rrelac ción ión . . . . . . . . . . . . . . . . . . . 9.2 Tra Tratam tamien iento de la autoc tocorrela rrelac ción ión. . . . . . . . . . . . . . . . . . 9.3 El est imado imadorr de de mí mínim nimo os cua uadra drado dos s gene nera raliza lizado dos s . . . . . . . . . 9.4 De Dete tec cción ión de la hetero teros scedasticid ticida ad . . . . . . . . . . . . . . . . . 9.5 Co Con nt ras rast e de igua igualda ldad d de varianz rianza a ent re sub ubm mue ues st ras ras . . . . . . . 9.6 Trata Tratam mien iento de la hetero teros scedasticid ticida ad . . . . . . . . . . . . . . . . El mo modelo de reg regres resión ión line lineal mú múltiple . . . . . . . . . . . . . . . . . . . 10.1 Estima Estimac ción ión po porr mín mínim imo os cuadrad rados . . . . . . . . . . . . . . . . . Propie Propieda dade des s de dell es est imado imadorr de de mí mínim nimo os cua uadra drado dos s. . . . . . . . . . . . . Bondad de ajus juste del mo modelo . . . . . . . . . . . . . . . . . . . . . . . . Contras trastes tes de hipó ipótes tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . Matric Ma trice es de covarian rianzas no escalare lares s. . . . . . . . . . . . . . . . . . . . 14.1 Co Compa mparac ración ión de est imado imadores res de la reg regres resión múlt múlt iple ipl e y l a reg regres resión si mpl e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.2 Re Regres resión ión particio rticion nada . . . . . . . . . . . . . . . . . . . . . . . . Grad rado de ajus ajuste del mo modelo de reg regres resión ión múltiple . . . . . . . . . . . . 15.1 15 .1 Coefi ciente ientes s de corre rr elación lación pa parcia rciall y de de dett erminación rminación pa parcia rciall . . . Coli Coline nea ali da dad d en ent re vari varia ables bles explicat xplicat ivas ivas en un mod mode elo de reg regres resión . . . 16.1 Efec Efect os de la colinea linealidad lidad ent re variable riables s explic xplica at iva ivas . . . . . . . 16.2 Dete Detec cción ión de la coline linealida lidad . . . . . . . . . . . . . . . . . . . . . 16.3 Trata Tratam mien iento de la coline linealida lidad . . . . . . . . . . . . . . . . . . . . 16.3. .3.1 Regres resión ión ortog rtogonaliza lizada . . . . . . . . . . . . . . . . . . . 16.3.2 Otros tros trata tratam mien ientos tos . . . . . . . . . . . . . . . . . . . . . . Pr edi cci ón . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Mod Mo delos los univa ivarian riantes tes de series ries tem tempo pora rale les s . . . . . . . . . . . . . . . . 18.1 Pri Prim meros ros conceptos tos . . . . . . . . . . . . . . . . . . . . . . . . . . 18.1.1 Proc rocesos estoc tocástico ticos . . . . . . . . . . . . . . . . . . . . . 18.1.2 .1.2 Fun unc cione iones s de autoco utocorrela rrelac ción ión simple imple y pa parc rcia iall . . . . . . . 18.2 Proc Procesos autore toreg gres resivo ivos, AR AR(p (p)) . . . . . . . . . . . . . . . . . . . 18.2.1 El model o A R( R( 1) 1) . . . . . . . . . . . . . . . . . . . . . . . 18.2.2 El model o A R( R( 2) 2) . . . . . . . . . . . . . . . . . . . . . . . 18.3 Proc Procesos de medias ias móvile viles s, MA(q) MA(q) . . . . . . . . . . . . . . . . . 3
51 51 54 54 54 54 54 54 54 54 59 60 68 68 74 75 77 77 78 80 81 84 85 85 87 87 88 88 88 88 88 88 88 88
18.4 Pro Proc cesos mixto ixtos s, AR ARMA( MA(p p,q) . . . . . . . . . . . . . . . . . 18.5 Pro Proc cesos inte integ grad rados AR ARIMA(p IMA(p,,d,q) . . . . . . . . . . . . . . 18.6 Pred Predicc icción ión con modelos los univa ivarian riantes tes . . . . . . . . . . . . . . 18.6. .6.1 Pred redicc icción ión con modelos los AR AR(p (p)) . . . . . . . . . . . . . 18.6.2 Pred redicc icción ión con modelos los MA(q) MA(q) . . . . . . . . . . . . 18.6. .6.3 Pred redicc icción ión con modelos los AR ARMA(p MA(p,q ,q)) . . . . . . . . . 18.6.4 .6.4 Predic Predicc ción ión con modelos los ARIMA(p,d ARIMA(p,d,q) ,q) . . . . . . . . 18.7 Est Est imac imación ión de mo mode delo los s un univa ivarian riantt es de series ries t emporale mporales s . . 18.7.1 .7.1 Est Est imac imación ión de mo mode delo los s auto utore reg gres resivos ivos . . . . . . . . . 18.7.2 .7.2 Esti Esti mación ión de mode delo los s de medias dias mó móvile viles s . . . . . . 18.7.3 .7.3 Est Est imac imación ión de mode delo los s ARMA(p,q) ARMA(p,q) y ARIM A(p,d,q A(p,d,q)) 19 El proc rocedimie imien nt o de variab riables les instrum instrume entale tales s . . . . . . . . . . . . 19.1 Corre Correla lac ción ión ent re variable riables s explic xplica at ivas ivas y términ término o de error rror . 19.2 Er Er ro ror es es de medi da da . . . . . . . . . . . . . . . . . . . . . . . . 20 M od odel os os di ná námi co cos . . . . . . . . . . . . . . . . . . . . . . . . . . 20.1 Co Colinea linealidad lidad entr e variable riables s explic xplica ati vas . . . . . . . . . . . 20.2 E Es st im i maci ón ón . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20.2.1 .2.1 Pert urbac rbación ión sin aut ocorrela rrelac ción ión . . . . . . . . . . . . 20.2.2 .2.2 Pert urbac rbación ión con autoco tocorrela rrelac ción ión . . . . . . . . . . . 21 Si mu mul ta t anei dad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.1 I de dent ntii fi caci ón . . . . . . . . . . . . . . . . . . . . . . . . . . 21.2 Esti Esti mación ión de una ecuación ión del sis sistt ema . . . . . . . . . . . .
4
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
88 88 88 88 88 88 88 88 88 88 88 88 88 88 88 88 88 88 88 88 88 88
1. Introducción Ha sido t radicional dejar muchas decisiones a los mét odos est adíst icos. La discusión import ant e es si el invest igador debe plant ear su invest igación incorporando sus creencias a priori o, por el contrario, la investigación ha de ser asépt ica en ese sentido, no debiendo est ar condicionada en ni ngún aspecto por las creencias iniciales del invest igador.
2. A lgunos concept os est adíst icos básicos 2.1. M edi das de posición y m edi das de di spersión Media, media ponderada, mediana, moda, varianza, desviación t ípica. Medidas alt ernat ivas de volatili dad. La media, muest ral o poblacional, es la const ante con r espect o a la cual el err or cuadrático medio de la vari able aleat ori a es menor. Conveniencia de su utilización. 2.1.1. L a m edia muest r al como pr edict or La esperanza matemática de una variable tiene una propiedad de gran import ancia: es la const ante alr ededor de la cual la vari able aleat ori a experi menta fl uctuaciones de menor t amaño. Análogamente, dada una det erminada muest ra, la media muestral es la constante con respecto a la cual la variable experimenta unas menores desviaciones. Es decir, si nos plantemos resolver el probelma, £ ¤ M in F (a) M in E (X a)2
≡
a
−
a
donde la incógnita es la constante a, la solución es a = µ. El valor mínimo de la función objetivo es: F (µ) = V ar(X ). Dada una determinada muestra de tamaño n, la solución al problema,
M in F (a) a
≡
Xn £ (X i 1
− a) ¤ 2
¯. El valor mínimo de la función obj et ivo es: F (¯x) = viene dada por a = x V ar(X ), varianza muestral de X. Quizá sorprendentemente, est a pr opiedad t iene implicaciones en relación con la predicción: un ejercicio de predicción consiste en anti cipar un valor de una 5
ˆt a part ir de observaciones t emporales variable X t en un instante futuro t0, x x1, x2,...,x T , T < t0. Por supuest o que una predicción no se verá exact amente corr oborada por los dat os fut uros: el dat o que se reciba en el inst ante t0, xt , podrá exceder de la previsión xˆt que efect uamos en el inst ante T , o ser inferior a la misma. Lo que el invest igador quiere es que su mét odo de predicción garant ice que el error que espera comet er sea el menor posible. no t endría sentido ut il izar un método de predicción que incumpla esta propiedad, pues equivaldría a creer que existe algún método de predicción alternativo con una expectativa de error inferior. Ahora bien, como el err or de predicción (defi nido como la diferencia ent re x ˆt ) que se materialice en t0 puede ser valor realizado y valor anticipado, xt posit ivo o negat ivo, es razonable buscar un mét odo de predicción que minimice la expresión, 0
0
0
0
−
0
£ Min E (xt
0
x ˆ t0
− xˆt ) ¤ 2
0
(2.1)
Ahora bien, si la variable X t iene una dist ri bución de probabilidad const ante en el tiempo, como ocurr iría si est amos considerando una muest ra aleat oria simple, y en ausencia de t endencias, cambios est ructurales en media, et c., la propiedad anterior nos sugiere que el mejor procedimiento de predicción será,
x ˆt = x¯ 0
Por t anto, si hemos de predecir un valor fut uro de una vari able aleat ori a, sin disponer de dat os de la misma, su esperanza mat emát ica, si es conocida, minimiza el Error Cuadrático M edio entre t odas las predicciones posibles. Si conocemos únicamente la media muest ral, pero no disponemos delosdat os individuales, dicha media muest ral t iene una propiedad análoga a la que acabamos de enunciar. Tan import ante es est a propiedad que la media muest ral debe util izarse como referencia con r espect o a la cual t rat ar de obt ener una predicción mejor. Cuando decimos que una variable es impredecible, no nos referimos a que su predicción es cero, o que no puede obtenerse, sino a que propondremos como predicción su media muest ral, sin hacer ningún cálculo adicional. Lo import ante es observar que, si se conoce la esperanza mat emát ica de la vari able, o se dispone de una media muest ral, ést as son predicciones sencillas de obtener, y acept ables, al menos en ausencia de información adicional. Como matiz puede añadir se que, si el cri t eri o a minimizar cuando se calcula una predicción no es el ECM como en (2.1) , sino el Ar ror Absolut o M edio de la predicción, 6
M in E | xt
0
x ˆt0
− xˆt
0
|
(2.2)
entonces la predicción debe ser la Mediana poblacional, o la mediana muest ral, si se dispone de dicha información, x ˆt = Mediana(x). Hay que resalt ar, sin embargo, que, con más información que simplemente la media muest ral, el invest igador puede aspirar a obtener una predicción mejor que la proprcionada por la media muest ral; para ell o, deberá sust it uir el promedio muest ral por la esperanza condicional E T xt . Si por ejemplo, el invest igador cree que la vari able que pret ende predecir obedece una est ructura AR(1), entonces la predicción que minimiza el Err or Cuadrático Condicional Medio vendrá dada por E T xt = ρ( t −T ) xT , como vi mos al examinar est e tipo de procesos. La vari anza condicional no es nunca superior a l a varianza i ncondicional y es, en la mayoría de los casos, muy i nferior. La media muest ral minimiza la vari anza incondicional, mientras que E T xt minimiza l a varianza condicional, alcanzando un result ado menor de est e cri t eri o y, por t anto, preferi ble. El modo en que puede util izarse la i nformación muest ral det all ada disponible para obt ener el valor numérico dela vari anza condicional E T xt es el obj et o de XXX. 0
0
0
0
0
0
2.1.2. L a desvi ación t ípica como i ndicador de volat il idad Ha sido t radicional en el análi sis de dat os económicos util izar la desviación t ípica como medida de volatil idad de una vari able. Est o es especialmente ciert o en el analisis de datos fi nancieros, donde, aunque recientemente se han introducido otras medidas de volatilidad, el uso de la desviación típica es todavía habitual. Est a práct ica se deri va de la interpret ación direct a de la desviación t ípica,como la desviación promedio entr e los valores que t oma una det erminada vari able aleat ori a, y su valor medio. Sin embargo, exist en múlt ipl es sit uaciones en las que t al caract erización de la volat ili dad puede proporcionar una imagen engañosa de lo que el invest igader pret ende medir . Tomamos como punt o de part ida l a idea de que, al medir volatilidad, el invest igador pretende cuanti fi car el tamaño medio de las fl uctuaciones que experimenta una determinada variable aleatoria. La simple lect ura de est a afi rmación debería sugeri r al lect or que, como posibl e defi nición de volatilidad, resulta fundament almente incomplet a. Las fl uctucaioens que experimenta una variable aleatoria no pueden est udiarse si no se defi ne previamente el valor que sirve de referencia respecto al cual medir dichas fl uct uaciones. 7
En una pri mera lect ura, podría pensarse que es evidente que la pret ensión es la de cuanti fi car las fl uct uaciones que experi menta una vari able aleat ori a respecto a su nivel medio. Est a es la i dea que subyace al uso de la desviación t ípica como medida de volat ili dad; sin embargo, es fácil ver que exist en sit uaciones en que dicha uti lización no est á tot almente just i fi cada:
• Cambio est ruct ural en media: supongamos una vari able X que es const ante a lo largo de cada una de l as dos submuest ras enque podemos divi dir el período muest ral. Es decir , X = µ1 en la primera parte de la muestra, y X = µ2 en la segunda part e de la muest ra. En muchos sentidos, podríamos decir que est a vari able es const ante, y ha experi menat do una volatil idad nula a lo largo del intervalo muest ral, si bien es verdad que en el inst ante t0 se produjo un cambio est ruct ural, de carácter permanente, en el nivel medio de la variable. Si no se t iene en cuenta dicho cambio en la media, la varianza de X result a ser no nula, mient ras que si t enemos en cuenta el cambio en media, la varianza que calculemos será cero. • Presencia de una t endencia determinist a: supongamos una variable X que crece a una t asa media de γ , a la vez que experimenta fl uctuaciones alrededor de dicha tasa media de crecimiento. En est e caso, la vari anza muest ral de la variables, así como su desviación t ípica, serán import ant es, y t anto más elevadas cuant o mayor sea la t endencia o t asa de crecimiento γ . Esta sit uación es muy fr ecuente en Economía en general y en Fi nanzas en part icular, y se ut il iza la desviación t ípica como indicador de volatil idad. Hay dos di fi cult ades que suelen ignorarse: una, que, en presencia de endencia, carecemos de valor central de referencia. En presencia de una t endencia o crecimiento const ant e γ , el valor medio t enderá a ser el valor que tomó la vari able hacia el período central de la muest ra, pero no es representati vo de los valores muest rales de la variable: la primera part e de la muest ra t enderá a est ar por debajo de la media, est ando la segunda part e de la muest ra por encima de la media muest ral; en t al sit uación la media muest ral no es un valor representati vo de la vari able y, en consecuencia, no t iene mucho sentido calcular el t amaño de las fl uct uaciones alrededor de dicha media. En est e contexto, el tamaño medio de las fl uctuaciones alrededor de la media será, en realidad, un i ndicati vo de la magnitud de γ , la tasa media de crecimiento o tendencia determinista. Est e es un caso donde debemos dist inguir entre cort o y largo plazo: a largo plazo, el uso de la desviación t ípica podría est ar just i fi cado, si entendemos que la 8
t endencia media de crecimiento γ será eventualmente sust it uida por un descenso en la variable, y la sucesión de un ciclo u oscil ación de período ampli o, que t ermi naría just i fi cando el cálculo de un valor central de referencia. La volati lidad a cort o plazo será el t amaño medio de las fl uctuaciones alrededor de la t endencia det erminist a. Por t anto, tendría plena just i fi cación ext raer de la vari able el crecimiento t endencial, que había que est imar previamente, y calcular el t amaño medio de las fl uct uaciones que experimente el component e que result a t ras la ext racción de la t endencia det erminist a. Una vez más, no se t rata de discutir cuál es el modo correct o de proceder; más bien, hay que entender que est amos hablando de est imar caract eríst icas diferentes y, alguna de ell as puede no est ar est adíst icamente just i fi cada. De acuerdo con l a discusión ant eri or, medir la volatil idad mediante la desviación t ípica de una vari able con tendencia determinista, tiene poca justi fi cación. Est o es especialmente cierto en el análisis fi nanciero: en un período en que el precio de un act ivo experimente un sólido crecimiento, su avrianza muest ral result ará r elat ivamente alt a, por lo que podría concluirse que ofrece un riesgo importante; en consecuencia, a pesar de su sost enida rentabili dad (variación porcentual en precio), un inversor podría decidir no incorporarl o en su cart era; est e análisis sería incorrect o. 2.2. M edidas de asociación Coefi ciente de corr elación. Coefi ciente de corr elación parcial.
3. Contrastación de hipótesis estadísticas Uno de los procedimientos básicos dela inferencia est adíst ica es la contrast ación de hipótesis, mediante el cual el invest igador pret ende conocer el grado en que la información muest ral de que dispone es compat ible con una det erminada hipótesis. La hipótesis quee contr ast a, denominada hipótesis nula, hace referencia a una determinada característica de la distribución de probabilidad de la que procede la información muest ral disponible. Así, la hipótesis nula, denot ada como H 0, puede ser del t ipo: H 0 : ” La población de la que se extrajo la muestra es Normal” o referirse a valores numéricos para algún parámetro de dicha distribución de probabil idad poblacional, como H 0 : ” La esperanza matemáti ca poblacional es igual a 10” : H 0 : µ = 10, ó ” La vari anza poblacional es igual a 25” : H 0 : σ 2 = 25, ó ambas propiedades a l a vez: H 0 : µ = 10, σ 2 = 25. Generalmente, l os contrast es anteri ores se reali zan bajo el supuest o de que el caráct er de la dist ri bución de 9
probabilidad poblacional es conocido, por ejemplo, Normal. Est e t ipo de cont rast es son contrastes paramétricos, puesto que se basan en la estimación de algunos parámet ros de la dist ri bución de probabilidad poblacional. El invest igador no debe olvidar nunca que las propiedades de est os cont rast es dependen de que sea correct a la hipótesis que se haya est ablecido acerca del t ipo de dist ribución poblacional de la que se ext raj o l a muest ra disponibl e, así como del caráct er de dicha muestra (muestra aleatoria simple). Un cont rast e que t iene muy buenas propiedades XX XX Existen contrastesno paramétr icos, queno precisan dela est imación deparámet ros poblaiconales, ni descansan en ningún supuest o acerca de la dist ribución de probabil idad poblacional, que son de un enorme interés en el análisis de dat os económicos, a pesar de ser poco habit uales. Son cont rast es cuyas propiedades son muy robust as (es decir, continúan siendo válidas t ot al o aproximadamente) con independencia del t ipo de dist ri bución poblacional. Una segunda razón que con fi ere enorme interés a los contrates no paramét ri cos es que nos permit en discernir el grado en que son válidas hipót esis que no pueden representarse en t érmi os de valores numéri cos para los parámet ros de la dist ri bución de probabilidad poblaiconal. Así, en el primero de los ejemplos mant es mencionados, queremos cont rast ar la hipótesis de que la población de la que se ext raj o la muest ra sigue una dist ri bución Normal. Por supuest o, que también podría contr ast arse la hipótesis nula de que obedecve una distribución t de St udent, o chi-cuadrao, o cualquier ot ra. Asimismo, podemos contr ast ar la hipótesis de que dos muest ra proceden de igual distribución de probabilidad, sin necesidad de especfi car de qué tipo es ninguna de ellas. Un t ipo de contr aste de gran int erés para las cuest iones examinadas en el trabajo específi co econométrico est riba en el grado de asociacin entre variables. Precisamente la Economet ría consiste en el cnojunto de mét odos estadíst icos que permit en asignar valores numéricos a l os coefi cientes de un modelo que trata de representar la relación exist ente entre un conjunto de vari ables económicas. Es, por t anto, un análi sis de t ipo paramét ri co; una vez asigndaos valores numéri cos a los parámet ros del modelo, generalmente se llevarán a cabo contrast es paramét ricos de hipótesis, utilizando los valores numéricos est imados. Exist en, asimismo, contrat es no paramét ricos que, sin necesidad de pasar por una fase de est imación, permit en discutir si la evidencia muest ral es consist ente con l a hipótesis de quedos vari ables det erminadas est án relacionadas entr e sí. Es t an fácil ll evar a cabo est e t ipo de contrast es que deberían formar part e, como paso previo a la est imación de t odo modelo econmét ri co. No sería razonable que las conclusiones de t ales 10
contrastes dictaminen la relación de variables que deben incluirse en un modelo economét rico, pero es sumamente iliust rat ivo compementar la información proporcionada por ambos tipos de cont rast es. En defi nitivia, como proponíamos en la Introducción a est e t ext o, precisamente por su nat uraleza probabilíst ica, los mét odos est adíst icos no deben ut il izarse de manera dogmát ica. En defi nitiva, se t rata de examinar la cuest ión que est á siendo obj et o de análi sis en un det erminado est udio, a la luz de la información muest ral disponible, desde diversas ópticas, con el objet o de proporcionar dist int os t ipos de evidencia. Por supuest o que en la generalidad de los casos, esas distint as perspect ivas no serán t odas consist entes entre sí. Debe esperarse del invest igador que proporcione t oda la informcaion generada en relación con la cuestión que defi nía la investigación, para que cada lector pueda ext raer sus propias conclusiones. En un cont ext o probabil íst ico no exist en las verdades absolut as, y un det emrinado análisis puede conducir a conclusiones diferentes. En un contraste paramétrico se establece, como confrontación a la hipótesis nula, una hipótesis alternativa. La forma que adopte dicha hipótesis no es irrelevante en cuanto a l a r esolución del contrast e de hipótesis. Como ejemplo, tomando como un hecho cierto que la distribución de probabilidad poblacional es Normal, y qeu la varianza de dicha distribución es conocida, un investigador puede desear cont rast ar la hipótesis nula H 0 : µ = 10, frente a la hipótesis al= 10. En este caso, la hipótesis nula es simple, por cuanto que ternativa H 1 : µ 6 incluyeun único valor posible para la esperanza mat emát ica poblaiconal, mientr as que la hipótesis alt ernativa es compuesta, por cuanto que incluye todo un rango de valores, t odos los dist int os del incluido en la hipótesis nula. Est e contr ast e tiene, por tanto, otra característica, y es que el conjunto de valores incluidos en ambas hipótesis cubre t odo el espacio paramét rico. Un cont rast e diferente, con la misma hipótesis nula, sería aquél que considerase como hipótesis alt ernat iva, H 1 : µ < 10. Est a es la hipótesis que debería especi fi car un invest igador que sabe que, dada la naturaleza del problema con el que trat a, exist en razones t eóricas para creer que el valor numérico de µ no puede exceder de 10. Cuando se dispone dedicha información, el últ imo contr ast e descri t o, querest ri nge el rango devalores numéri cos en la hipótesis alt ernati va fi jando 10 como cot a superior, t iene mejores propiedades que el pri mero de los contrast es, que no est ablecía t al relación. En la mayoría de las aplicaciones económicas, se dispone de información de est e t ipo, por lo que el invest igador debe especi fi car cuidadosamente no sólo la hipótesis nual que contrast a, sino t ambién la hipótesis que considera como alt ernati va, de modo que su contraste de hipótesis tenga las mejores propiedades posibles. 0
11
Lament ablememnt e, est e hecho no suele t enerse en cuenta, est ableciéndose con = 10. No sólo el contr ast e se redemaisad frecuencia hipót esis del t ipo H 1 : µ 6 suelve de distinta manera, según sea ésta o H 1 la hipótesis alternativa; además, cmoo hemos mencionado, las propiedades del contrast e son di st intas, y mejoran si introducimos en la defi nición del mismo, información procedente del modelo t eórico que sea, por t anto, incuest ionable. 0
• En un contraste de hipótesis, se rechaza la hipótesis nula cuando la información muest ral es: i) signi fi cativamente contrari a a la hipótesis nula, ii) a la vez que es favorable a l a hipótesis alt ernat iva. Est e pri ncipi o, absolut amente básico en la t eoría est adíst ica de contrast ación de hipótesis, t ambién suele ignorarse con demasiada fr ecuencia. Por ejemplo, uno de las act uaciones incorrectas en el análi sis est adíst ico de dat oseconómicos, quese producecon ciert a frecuencia, se refi ere a ocasiones en quela información muest ral es contr ari a al rango devalores numéri cos contenidos en la hipótesis nula, pero aún más contr ari a al rango considerado bajo la hipótesis alt ernativa. Est e sería el caso si al confrontar H 0 frente a H 1 obtenemos que la media muest ral, un est adíst ico muest ral que es est imador efi ciente de la esperanza matemát ica, result a ser igual a 22, por ejemplo. Otro ejemplo (crecimiento monet ari o e in fl ación) En t al caso, los mét odos est adíst icos de contr ast ación de hipótesis conducir án a no rechazar la hipótesis nula, a pesar de que la información muest ral es contr ari a a la mi sma. Cuando est o sucede, es muy frecuente comprobar que el invest igador concluye que su hipótesis nula es válida (con éste u otro cali fi cativo de simialres connotaciones). Sin embargo, est amos en una sit uación donda información muest ral es contr ari a a dicha hipótesis nula; lo que el invest igador debería hacer en est e caso es reconocer est e hecho, cuest ionar la validez de su hipótesis nula, pero cuest ionar asimismo el razonamiento que le ll evó a est ablecer la hipótesis alt ernat iva de su contrast e, pues la información muest ral ha sido aún más contr ari a a la misma. En cuant o a la resolución de los contrast es paramét ri cos de hipótesis, es preciso llevar a cabo previamente un ejercicio de est imación que proporcione una θ (x1, x2 ,...,x n ) a partir del cálculo del valor numérico que est imación numérica ˆ θ del parámet ro o vector de parámet ros θ metoma un determinado estimador ˆ diant e el que se defi ne la hipót esis nula. Recordemos que un est imador es una función de l a información muest ral; evidentemente, no t odas las funciones de la información muest ral, es decir, t odos los est imadores posibl es, t ienen buenas propiedades est adíst icas. Para l levar a cabo el contrast e de hipótesis es preciso 0
12
que la dist ri bución de probabilidad del est adíst ico ˆθ (x1, x2,...,xn ) dependa del parámet ro o parámet ros incluidos en la hipót esis nula. Por ejemplo,.... A su vez, el contr ast e de hipótesis t endrá buenas propiedades si: i) ambas hipótesis est án corr ect amente est ablecidas, ii) lossupuest ossobre losquese condiciona el contr ast e, que pueden referirse al t ipo de dist ri bución poblacional, así como al valor numéri co de alunos parámet ros que no aparecen explícit amente en el contrast e, sean corr ect os, ii i) el est adíst ico util izado en la resolución del contrast e t enga buenas propiedades est adíst icas. Cuando la hipótesis nula es simple, es decir , incluye un único valor numéri co, y l a hipót esis alt ernat iva es del t ipo H 1, la resolución del cont rast e se ll eva a cabo mediant e la const rucción deun intervalo de confi anza alrededor del valor numérico del est imador, util izando la dist ri bución de probabilidad del mismo. Así, l legamos a una afi rmación del tipo, h ³ ´ i ˆ (3.1) b α = P a g θ (X ) , θ 0
≤
≤
donde α, un número posit ivo próximo a 1, es el nivel de confi anza del contrast e. El cont rast e se resuelve despejando el valor t eórico del parámet ro desconocido θ dentro de la expresión anteri or, para obtener una igualdad del t ipo, h i ˆ ˆ α = P h1 (θ (X )) f (θ) h2(θ (X )) (3.2)
≤
≤
θ (X )) son números reales que dependen de: i) el valor donde h1(ˆθ (X )), h2(ˆ θ (x1, x2,...,xn ) en la muest ra disponibl e, ii ) el supuest o numérico del est imador ˆ acerca de la distribución poblacional, iii) el nivel de con fi anza (o el nivel de signifcación) escogidos para el contrast e. En est a expresión, dada una det erminada muest ra, el valor numérico del est iθ (X ) es conocido, por lo que puede comprobarse si se satisfacen o no l as mador ˆ desigualdades,
h1(ˆθ (X ))
≤ f ¡ θ ¢ ≤ h (ˆθ (X )) 0
2
(3.3)
donde hemos sust it uido el valor desconocido de θ por el valor numérico inclui do en la hipótesis nula, θ0. S Bajo el supuest o que se ha hecho acerca de la dist ri bución de probabilidad poblacional, y de l os valores numéri cos de los parámet ros que se han supuest o conocidos (si haya alguno), la probabil idad de que el valor numéri co de la función f (θ ) caiga fuera del int ervalo (3.3) es de 1- α y, por t anto, pequeña. Es decir, 13
ést e sería un suceso poco probable; si para θ = θ 0, la función f (θ) incumple las cot as defi nidas en (3.3) diremos quedicho valor del parámet ro θ es poco verosímil , rechazando, en consecuencia, la hipót esis nula. A modo de ejemplo, recordemos cómo se ll eva a cabo un contr ast e dehipótresis acerca del valor numérico de la esperanza matemática de una población Normal cuya vari anza se supone conocida. El punt o de part ida es la propiedad de la media muest ral de t al población, que sigue una dist ri bución asimismo Normal, con la misma esperanza matemática que la población, y con una varianza igual a la vari anza poblacional dividida por el t amaño muest ral. Así, si la población N (µ, 25), la media muest ral es una vari able aleat ori a con dist ri bución es X x N (µ, 25 ¯ ). Por t ant o, si se t rabaja a un nivel del con fi anza del 95%, por n ejemplo, t endremos, · ¸ x¯ µ 0, 95 = P 1, 96 1, 96 5/ n N (0, 1). ¯ µ N (0, 25 ) y x¯ −µ donde hemos ut ilizado el hecho de que x
∼
∼
−
≤ −√ ≤ − ∼
n
√ /n ∼ 25
Est a igualdad es la corr espondiente a (3.1) , donde el parámet ro poblacional sobre el que se est ablece el contrast e es la esperanza matemática, θ = µ; el est imador ˆθ (x1, x2,...,xn ) = x¯ = 1 P n xi es la media muest ral, α = 0, 95, y a = 1, 96; b = i= 1 n 1, 96. De est a igualdad, obtenemos, · ¸ · ¸ 5 5 5 5 x¯ µ 1, 96 x µ x 0, 95 = P 1, 96 ¯ = P x¯ 1, 96 ¯ + 1, 96 n n n n
−
√ − √ ≤ ≤ x) = x¯ − 1, 96 √ n , h (¯ x) = x¯ + que es una igualdad análoga a (3.2) , con h (¯ −
√ − ≤ − ≤
√ −
1
5
2
1, 96 √ 5n ,
f (µ) = µ. En defi nit iva, nos queda comprobar si cuando se intr oduce en est a últ ima igualdad el valor de µ que defi ne l a hipótesis nula, la cadena de desigualdades se satisface o no. Supongamos que en la muest ra di sponibl e, de t amaño 400, se ¯ = 7, 5;en consecuencia, el ha calculado para la variable X una media muestral x intervalo anterior es: 0, 95 = P [7, 0 µ 8, 0] .
≤ ≤
3.1. Contr ast es de N ormalid ad 3.2. Cont r ates de asociación Antes de proceder a la est imación de un modelo especí fi co que establezca una relación paramét rica entre dos variables, conviene explorar la posibl e exist encia 14
de una relación entre ellas por los procedimientos est adíst icos disponibles. Uno de ellos son los contrast es no paramét ricos. Como ya hemos comentado anteri ormente, una de las virt udes de est e t ipo de análi sis es que su vali dez y, en part icular, los umbrales crít icos que debe sobrepasar el est adíst ico que defi ne el contraste, no dependen de ningún supuesto acerca de la distribución de probabilidad seguida por las vari ables cuya relación se t rata de caract eri zar. Frente a otros procedimientos que forman el núcleo tradicional de la Econometría, esto es una ventaja pues, en el caso de los últ imos, la Normali dad de la vari able cuyo comport amient o se pret ende explicar es clave. Como, además, el supuest o de Normalidad acerca de la distribución de probabilidad de una variable económica es mucha veces rechazado, result a que las buenas propiedades de las est imaciones de un modelo economét rico quedan muchasveces en cuest ión. Por eso es conveniente su uso en combinación con otr o t ipo de procedimi entosest adíst icos, especialmente si sus propiedades no precisan t al hipótesis.
4. Tratamiento de datos 4.1. A j ust e est acional 4.2. Tasas de variación 4.3. Estimación de componentes
5. El modelo lineal simple de regresión 5.1. Descripción del modelo 5.1.1. Nube de puntos 5.2. Est im ación por míni mos cuadrados (ord inari os) 5.2.1. R epr esent ación gr áfi ca de la recta de regresión estimada 5.3. Propiedades del estimador de mínimos cuadrados ordinarios Generalmente, estamos muy interesados en contrat ar hipótesis de disti nto t ipo: a) si una vari able explicat iva contiene información signi fi cat iva acerca de la vari able dependiente, b) si el coefi ciente de imapact o de una det erminada variable es igual a 1, c) si dos vari ables explicat ivas t ienen el mismo coefi ciente, etc... Sin embargo, aunque los coefi cientes del modelo de regresión son const antes, si bien desconocidas, sus est imaciones, por cualquier procedimiento que podamos 15
util izar, son aleat ori as, pues son función de la muest ra que ut il icemos, que es aleat ori a. Si el modelo que est amos est imando es corr ect o, como hemos de suponer, la pert urbación aleat ori a del mismo, ut, otorga nat uraleza asimismo aleat ori a a la vari able dependiente, yt. Est o signifi ca que si cambiamos por ejemplo el período muest ral que ut il izamos en la est imación, la reali zación de dicha pert urbación, es decir, sus valores numéricos, serán diferentes, con lo que las observaciones de yt también los erán, y la estimación de los parámetros diferirá de la obt enida con ot ro período muest ral. Asimismo, si cambiamos la frecuencia de observación de los dat os, de diaria a mensual, por ejemplo t omando el últ imo dat o de cada mes, la muest ra cambia, y con ella, las est iamciones de los coefi cientes de las variables explicat ivas en el modelo. Siendo variables aleat orias, nos interesa que los est imadores t engan ciert as propiedades deseables, lo cual dependerá del procedimiento de est imación ut ili zado, y de lasc aract eríst icas del modelo que est amos est imando. Las principales propiedades en que podemos est ar interesados son: insesgo, efi ciencia y consistencia. El insesgo consiste en que la esperanza mat emát ica del est imador coincida con el verdadero valor numérico del coefi ciente que est amos est imando. Un est imador efi ciente es un est imador de mínima vari anza. El procedimiento demínimos cuadrados proporciona el est imador lineal de mínima varianza, si bien pueden existir ot ros est imadores no lineales de varianza t odavía menor. Un est imador es consistente si, al aumentar el tamaño muestral, converge en probabilidad al verdadero valor del parámet ro desconocido que se est á est imando. Se dice entonces que su límit e en probabilidad es dicho parámet ro. Bien podría ocurrir que el est imador fuese sesgado en muest ra pequeñas, pero si es consist ent e, dicho sesgo irá reduciéndose si ampliamos el t amaño muest ral. El est imador de mínimos cuadrados no es siempre consistente. El est imador de máxima verosimi li t ud lo es, pero siempre que la hipót esis acerca de la dist ri bución de probabilidad en que se basa, sea corr ect a, sobre lo que no se puede t ener seguri dad. 5.4. R esiduos del modelo. Gr áfi cos de residuos Los residuos del modelo, a veces denominados los err ores del modelo de regresión, son aquél componente de la variable dependiente que no est á explicado por los valores que toma l a variable independiente o explicati va. En consecuencia, los residuos u ˆt se calculan a part ir de la expresión,
ˆ + β ˆ xt + uˆt yt = β 0 1 16
de la que se obti ene,
uˆt = yt
− β ˆ − β ˆ xt 0
1
en el caso de dat os de seri e t emporal, y
u ˆi = yi
− β ˆ − β ˆ xi 0
1
en el caso de dat os de sección cruzada. Gráfi camente, si volvemos a la nube de punt os que representa la posible relación entre x e y , y dibujamos sobre ell a la rect a de regresió n, el residuo no es sino la dist ancia vert ical ent re la alt ura (ordenada) de cada punto de la nube, y la alt ura que le corr espondería de acuerdo con la rect a de regresión est imada. Dicha alt ura debe t omarse con signo, de modo que el residuo es posit ivo cuando el punto de la nube est á por encima de la r ect a de regresión est imada, y negati vo cuando el punto queda por debajo de la recta de regresión est imada. 5.4.1. Estimación de la varianza del término de perturbación 5.5. Cuando los coefi cient es del mod elo de r egresi ón cambi an a l o l argo de la muestra Supongamos que se dispne de dat os de seri e t emporal, y que el co fi ciente que mide la relación entre las variables x e y, es decir, la pendiente del modelo, ha vari ado a lo largo del t iempo. Es claro que un procedimiento de est imación como mínimos cuadrados nos proporcina un único valor numéri co de dicho coefi ciente y, por t anto, cobra pleno interés únicamente bajo el supuest o de que dicho valor nméri co ha permanecido const ante a l o largo del período muest ral. Sin embargo, en la mayoría de las apli caciones económicas que pueden considerarse, t al supuest o parece demasiado rest rict ivo pues, más bien, el valor numéri co de dicha elast icida habrá variado a lo largo de la muest ra. ¿Qué proporciona en t al caso el mét odo de mínimos cuadrados? Lo pr imero que debemos entender es que el invest igador no observa en ningún caso si el coefi ciente ha variado en el t iempo o no, dado que no observa el valor numéri co de dicho coefi cient e. Est a es, precisamente, la razón que le mueve a est imar su valor numérico. En muchas sit uaciones, sin embargo, el invest igador puede t ener fundadas creencias acerca de que se han producido variaciones en el mismo. Por ejemplo, muchas veces se afi rma que la capacidad de la polít ica monet aria para cont rolar la infl ación se ha reducido signi fi cati vamente recientemente; t al afi rmación se debe 17
a la observación, en dat os reales, de que una fuert e expansión monet ari a solía venir acompañada de un claro repunte in fl acionist a, mientras que, más recientemente, un robusto cecimeinto monetario puede ser compatible con una in fl ación cont enida. En una sit uación de t al t ipo, un procedimient o de est imación como MCO proporciona como valor numéri co del parámet ro un promedio de los valores numéri cos que ha tomado durant e el int ervalo de t iempo corr espondinte a la muest ra de dat os disponible. Por t anto, result a de suma import ancia el modo en que el coefi ciente ha variado en el t iempo, como vamos a ver en los ejercicios de simulación siguient es. 5.5.1. C ambi o est r uctu r al en los coefi cient es del modelo de r egresión Supongamos que el coefi cient e ha sido const ant e enla primera mitad de la muest ra e igual a 0,5, mientars que en la segunda mitad de la muestra ha sido asimismo const ant e, e igual a 1,5. El est imador de mínimos cuadrados proporcionaría enˆ 1 = 1, 0 no es representati vo t onces una est imación en t orno a 1,0. En r ealidad, β de lo que ha ocurrido en ningún momento de la muestra, como ilustra el gráfi co XX . Est e t ipo de sit uaciones puede conducir a impr esiones engañosas, como ocurri ría si en una part e de la muest ra la pendiente ha sido posit iva, invirt iéndose el signo de la relación entre x e y en la segunda mit ad de la muest ra. Si en ambas part es el valor numéri co de la pendiente ha sido el mismo, cambiando únicamente ˆ 1 = 0, 0, sugiriendo la ausensu signo, la estimación resultante será próxima a β cia de relación entre ambas variables. Tal conclusión será bast ante err ónea, pues habría existido una relación, posiblemente bast ante exact a entre x e y a lo largo de t oda la muest ra, pero el signo de la misma habría cambiado de la primera a la segunda submuest ra, conduciendo a l a equívoca est imación mencionada. Que la est imación proporcionada por un procedimeit no del t ipo de MCO sea un promedio de los verdaderos valores numéri cos (no observados) de la pendiente, no debe t omarse en el senti do de que es l a media ari t met ica de dichos valores numéri cos. Sin embargo, t al int uición es aproximadamente corr ect a. Así, por ejemplo, si en el primer t ercio de la muest ra la pendiente hubiese sido β 1 = 1, 0, y en las dos t erceras part es fi nales de la muest ra la pendiente hubiese sido β 1 = 1 , 0, ˆ 1 = 0, 33, como la est imación numérica del parámetro no seri a muy diferent e de β correspondería a l a media arit mét ica de los verdaderos valores, ponderados por el número de observaciones a los que aplica cada uno de ell os.
−
18
Ejercicios de simulación
• Ejercicio 1: Simule 300 observaciones de un camino aleat ori o N(10,25) como dat os muest rales de la variable explicat iva x. Utilizando un valor numerico de -1,0 para l a pendiente, e ignorando el t érmino de pret urbación del modelo, simule los 100 primeros datos para la variable dependiente y. Luego, uti lice un valor igual a 1,0 para la pendiente y genere los dat os fi cticios correspondientes a las observaciones 101 a 300 de la variable dependiente. Est ime el modelo de regresión simple con dichos dat os. Comentari o: Al ejecutar el programa XX X, el lect or comprobará que la est imación de la pendiente del modelo se comport a de acuerdo con l o comentado en la sección previa. Es recomendable ejecutar el programa varias veces, para obtener así un con junt o de est imaciones numéri cas de dicho parámet ro. En ningún caso se obtendrá est imaciones próximas al verdadero valor de la pendiente, que es de + 1,0 en una part e de la muest ra, y de -1,0 en l a ot ra, sino más bien un promedio, ponderado de acuerdo con el número de dat os u observaciones en el que la pendiente ha tomado uno u otro valor numérico. El lector puede comprobar que, si aumenta la longit ud muest ral, las est imaciones que obt iene al ejecut ar repet idas veces el programa, se aproximan aún más al promedio que cabría esperar, dado el porcentaje de datos con pendiente igual a + 1,0 ó -1,0. Los estadísticos resultantes de la estimación presentan toda la apariencia de proceder de un problema est adíst ico de relación entr e dos vari ables aleat ori as. Sin embargo, es muy import ant e observar que el problema que acabamos de est imar es, en realidad, puramente det erminista. No hay en el mismo ningún componente est ocást ico o aleatorio pues, no hemos ut il izado un lemento de pert urbación. En nuestra simulación, la relación entre las variables x e y es, en todos los perídos exact a, no falt ando ninguna ot ra variable, ni est ando sujet a a ningún elemento de error impredecible. Es pr ecisamente el hecho de t rat ar como const ante un coefi ciente del modelo que no lo es, lo que produce la apariencia de ser un problema de naturaleza est ocást ica. Considerar t al supuest o ( erróneo, aunque no l o sabíamos), es comparable a introducir una pert urbación est ocást ica en el verdadero modelo, que incorporaría la variación temporal en la pendiente. En dicha est imación, aparentemente est adíst ica, obt enemos un R-cuadrado reducido, junto con una pendiente estimada que resulta estadísticamente signifi cat iva, si juzgamos por su est adíst ico tipo-t. 19
Exist e asimi smo evidencia de autocorrelación en los residuos, como sugiere el est adíst ico Durbi n-Wat son. La presencia de autocorr elación es, en pri ncipi o, sorprendet e, pues hemos generado una variable x con est ructura de ruido blanco y, por t anto, sin autocorrelación y la variable y presenta una dependencia exact a y est ri ct amente contemporánea con ella. Por t anto, no hay ni est ructuras de autocorr elación, ni est ructuras dinámicas que pudieran producir la. Los indicios de aut ocorrelación provienen del cambio est ruct ural que se produce en el valor numéri co de la pendiente. En el programa se calculan las funciones de aut ocorrelación simpl e de ambas variables del modelo; mientras que la variable independiente (explicat iva) no pr esenta aut ocorrelación, como corresponde a su est ructura de ruido blanco que hemos util izado en su generación, la función de aut ocorr elación de la variable dependiente sugiere indicios claros de autocorr elación. En realidad, est a variable, por const rucción, carece de autocorrelación, lo que sugiere una llamada de atención al uso indiscriminado de las funciones de autocorrelación para det ect ar aut ocorrelación seri al en una variable o en los residuos de una regresión. El gráfi co XX que representa las observaciones de la vari able dependiente junt o con los residuos dela regresión muestra la similitud entre ambas variables, loque es, evidentemente, sinónimo de una relación est imada pobre, a pesar de la signi fi cación est adíst ica de la pendiente del modelo. De hecho, puede observarse que la desviación típica de los residuos es similar a la desviación típica dela variable dependiente, lo que signi fi ca, como ya discutimos en la Sección XX, que el modelo no t iene una capacidad explicat iva import ante. Nuevamente, es import ante apreciar que ello ocurre junto con una valor claramente signi fi cat ivo del est adíst ico F (F = T.R2) de signi fi cación conjunta de l a regresión est imada. Est a apari encia de validez del modelo, de acuerdo con los est adíst icos habit uales es, en est e caso, falsa, lo que const it uye una impoirt ante ll amada de atención sobre el uso indiscutido de contrast es de hipótesis.. De modo análogo, el gráfi co XX, que presenta los valores observados de la vari able dependiente, junto con sus valores aj ust ados, muest ra que el ajust e no se adecúa en modo alguno al comport amient o de la variable que pret endíamos explicar con el modelo, y que ha experi emntado un cambio est ructural entr e la primera y la segunda submuest ras. Por el contrario, precisamente porque hemos impuest o una pendiente const ante a lo largo de t oda la muest ra, l os valores ajust ados, que uti li zan dicho valor const ante de la pendiente, dibujan un comportamiento constante, promedio, durante toda la muestra, que no representa adecuadamente ninguna de las dos submuest ras. 20
• Simule asimismo con pert urbación. Const ruya un gráfi co de vari anza de la pert urbación y varianza de la dist ribución de la pendient e est imada para un número de observaciones muest rales dado. 5.5.2. Variación gradual en los coefi cientes del modelo 5.6. A lgunos m odelos de r egresión sencill os 5.6.1. El modelo constante Como representación analít ica dle comport amiento de una vari able, no cabe duda de que el modelo est adístico más sencil lo es,
yt = β 0 + ut que especifi ca que, except o por un t érmi no de pert urbación de nat uraleza aleat oria, la variable yt es const ante. Con est e modelo, el invest igador declara l a i mposibili dad de encontr ar ninguna vari able que pueda expli car el comport amiento de yt. Puest o que la mat riz de dat os de la (única) variable explicat iva es en est e caso,
X = (1, 1, 1, ..., 1) un vector P t= T de dimensión T, se tiene X = 1T , y recordando que 1T 1T = T, y 1T y = t= 1 yt podemos adapt ar la expresión general (XX) del est imador de mínimos cuadrados a est e caso part icular, t eniendo, 0
0
P
ˆ = (1 1T ) β T 0 0
−1
0
= y¯ (5.1) T de modo que la est imación de mínimos cuadrados de la const ante es la media muest ral de lavariable que pretendemos explicar. En consecuencia, el residuo es, en cada período, uˆt = yt
1T y =
t= T t= 1 yt
− β ˆ
0
= yt
− y¯
es decir , el dat o correspondiente, en la forma de desviación respect o a la media muest ral. Por t anto, la Suma Residual, o suma de los residuos al cuadrado es,
SR =
uˆ2t
=
t= T X
(yt
t= 1
21
− y¯)
2
= T S y2
es decir , igual al product o del t amaño muest ral por la vari anza muest ral de la variable dependiente yt. Por ot ra part e, la Suma Total es, como en cualquier modelo de regresión,
ST =
t= T X
(yt
t= 1
2
− y¯)
= T S y2
y, por t anto, es específi co de este modelo que SR = ST . En consecuencia, puest o que el modelo t iene una const ante, se t iene: SE = ST SR = 0. En este modelo, la Suma Residual coincide con la Suma Tot al, indicador de las vari aciones en yt que se pret ende explicar, por lo que la Suma Explicada es igual a cero. En consecuencia, el R-cuadrado de la regresión es asimismo cero,
−
R2 = 1
SE − SR = =0 ST ST
Esto puede parecer paradójico a primera vista; sin embargo, tiene una interpret ación t otalmente acorde con la naturaleza del modelo de regresión. Como discutimos en la Sección XX, aunque el modelo de regresión se especi fi ca generalmente para relacionar los valores numéricos observados para variables yt , xt , en r ealidad, su ut ilización fundamental en Economía est riba en est ablecer alguna inferencia acerca de la relación que pueda exist ir entre las variaciones que experimentan las vari ables expli cat ivas por un lado, y la vari able dependiente por ot ro. Son las fl uctuaciones en ambas variables lo que fundamentalmente pret endemos caracterizar. Como vimos al caract eri zar el est imador MCO, una vez que t enemos est imaciones numéricas para los coefi cientes aosicados a las variables explicat ivas del modelo, obt enemos la est imación numérica de la const ant e del modelo mediante,
ˆ 0 = y¯ β
− β ˆ xβ ˆ β ˆ 1
0 0
que relaciona las medias muest rales de t odas las vari ables del modelo. Por tanto, la relevancia de la constante en el modelo estriba en ajustar las distintas medias muest rales de las variables del mismo, corri gido cada una de ellas por el coefi ciente asociado. Pero est e es un ajust e generalmnente poco relevante para el invest igador, que se interesa básicamente en el modo en que variacioens en las variables xt generan fl uctuaciones en yt . Por t ant o, en est e modelo const ant e, en que no se explican l as fl uct uacioens de yt , llevándose únicamente a cabo el ajust e de medias muestrales a través de (5.1) ,es lógico que el indicador de ajust e R2 22
result e igual a cero. Nótese, por últ imo, que no hemos impuest o est a condición, sino que est amosmint erpret an la propiedad del modelo const ant e, de t ener un R2 igual a cero. 5.6.2. El modelo con variables en desviaciones respecto a la media Consideremos un modelo lineal,
yt = β 0 + β 1x1t + β 2x2t + ut
(5.2)
cuya versión est imada es,
ˆ + β ˆ x1t + β ˆ x2t + uˆt yˆt = β 0 1 2
(5.3)
y calculemos su promedio a t ravés de t odas las observaciones muest rales. Tendremos, t= T X
yt =
t= 1
t= T X
ˆ 0 + β ˆ1 β
t= 1
t= T X
ˆ2 x1t + β
t= 1
t= T X
x2t +
t= 1
t= T X
u ˆt
(5.4)
t= 1
y t eniendo en cuenta la propiedad de los residuos MCO de t ener suma igual a cero, se conviert e en,
ˆ 0 + β ˆ 1x¯1 + β ˆ 2x¯2 y¯ = β
(5.5)
Rest ando (5.5) de (5.3) se t iene,
yˆt
− y¯ = β ˆ (x t − x¯ ) + β ˆ (x t − x¯ ) + uˆt 1
1
1
2
2
2
en el que se observa que el modelo (5.2) es consistente con un modelo cuyas vari ables son las de (5.2)pero medidas cada una de ell as en desviaciones respect o a su promedio muest ral; los coefi cientes est imados por MCO en est e modelo coincidirían con los que se est imarían para el modelo ori ginal, excepto por el hecho de que el modelo en desviaciones respecto a la media carece de t érmino const ant e. Por últ imo, los residuos MCO del modelo en desviaciones son, observación a observación, los mismos que se t endrían para el modelo en las vari ables ori ginales. La diferencia entre ambosmodelos es queel modelo con las vari ables en desviaciones respcto a la media no precisa de t érmino const ant e. Es fácil entender por qué: de acuerdo con (XX ) , la estimación MCO de la constante es la diferencia entr e la media muest ral de la vari able dependiente y las medias muest rales de 23
las vari ables explicat ivas, cada una de ell as corr egida por el coefi cient e asociado. Pero en el modelo con vari ables en desviaciones r espect o a la media, t odas las vriables, dependiente y expli cat ivas, t iene media muest ral igual a cero. Por t anto, la est imación MCO de una hipot ét ica const ante en dicho modelo sería igual a cero. incluso si incluimos dicha const ante, su est imación de mínimos cuadrados será numéricamente igual a cero. 5.6.3. El modelo con tendencia determinista lineal y cuadrática Un modelo sencillo interesant e es aquél que incluye una t endencia det erminist a como única variable explicat iva, además del t érmino const ante,
ln yt = β 0 + β 1t + ut
(5.6)
en el que la est imación del coefi ciente β 1 nos proporciona una estimación de la t asa de crecimiento muest ral de la vari able yt . En efect o, si consideramos la estructura,
yt = Aeβ t
(5.7)
1
t endremos una t asa de crecimiento dada por,
dyt /dt d (ln yt ) d (ln A + β 1t) = = = β 1 yt dt dt En defi nitiva, el modelo (5.6) no es sino la versión logarít mica de la ecuación de crecimiento (5.7), con β 0 = ln(A), y donde el t érmino de pert urbación ut pude recoger cualquier fl uct uacion de cort o pl azo alrededor de la t asa de crecimeinto const ant e, β 1. Este modelo es, por tanto, apropiado cuando se pretende estimar la tasa de crecimiento media de una variable yt a lo largo del período muestral. Hay que t ener en cuenta, sin emabrgo que el parámet ro β 1 proporciona la tasa de crecimiento, supuest a const ant e, entre cada dos observaciones consecutivas. Si l os dat os de que disponemos son de nat uraleza anual, entonces habremos est imado el crecimiento anual de la variable. Si losdat osson tr imest rales, el crecimiento anual se obtendrá a part ir de la est imación de β 1 mediant e γ = (1 + β 1)4 1, quehabremos de mult ipl icar por 100 si queremos presentar en términos porcentuales. Si l os datos de base son de naturaleza mensual, entonces obt endremos una est imación del crecimeinto anual a partir de γ = (1 + β 1)12 1. Est e modelo det endencia det erminist a li neal es t ambién muy útil precisamente para ext raer de una vari able su comport amiento de largo plazo, cuando se supone
−
−
24
que ést e est á bi en representado por el supuest o de una t asa de crecimiento conˆt nos proporcionan el st ante. Así, una vez est imado el modelo (5.6) , los residuos u ˆ 0 β ˆ 1t, ˆt = ln yt β logarit mo de la variable yt desprovist o de t endencia, es decir, u recogiendo así el comport amiento de la variables según fl uct úa alrededor de su t endencia de largo plazo. Diremos t ambién que est a es la representación de la variable corregida de t endencia lineal. Como hemos vi st o, est e ejercicio, efect uado sobre el logaritmo de la variable original, incorpora el supuesto implícito de que la t asa de crecimiento de dicha vari able es const ante.
− −
5.6.4. M odelos no lineales en las variables Algunos modelos no lineales pueden t rat arse de modo muy sencill o, sin necesidad de desarr ollar mét odos dist int os de los est udiados en los capítulos anteri ores. Ello ocurr e en muchas sit uaciones en que el modelo presenta no li nealidades exclusivamente en las variables que aparecen en la relación que se pret ende estimar, como,
yt = β 0 + β 1xt + β 2x2t + ut
(5.8)
que es un modelo con una única vari able explicat iva, que aparece t anto en su forma original, como al cuadrado. Es interesant e observar que, en est e modelo, la deri vada parcial, que recoge la magnit ud de los cambios inducidos en yt por un cambio en el valor numérico de xt viene dada por,
dyt = β 1 + 2β 2xt dxt A diferencia de la quet eníamos en el caso del modelo de regresión li neal simple, que era,
dyt = β 1 dxt y, por tanto, constante, la derivada parcial del modelo (5.8) depende del valor numérico de la variable explicat iva. Est o puede ser muy interesante en muchas relaciones económicas, en las quees lógico pensar queel impacto quesobre yt tiene una variación unitaria en xt depende del valor numérico de xt a partir del cual se produce dicha vari ación unit ari a. Así, no t endría el mismo impact o negat ivo sobre el consumo un incremento de un punto en el t ipo imposit ivo del IVA si ést e 25
se produce cuando dicho t ipo es del 3%, que si dicho incremento se produce a part ir de un t ipo del 15%. Parece lógico que así sea. Si las variables ut il izadas en la r egresión son los logari t mos naturales de las vari ables para las que inicialmente obtuvimos dat os, como consumo y renta, yt = ln(Y t ), xt = ln(X t ), est aríamos recogiendo en (5.8) la creencia en una elast icidad no const ante, como aparece en muchos modelos teóricos económicos. Si el valor numérico del coefi ciente β 2 es negativo, tendremos que la variable yt crece menos que proporcionalmente con un aumento en xt , lo que corr espondería a una nube de puntos en la forma de una función cóncava, mient ras que si est imamos un valor numérico positivo para β 2, tendremos que la variable yt crece más que proporcionalmente con un aumento en xt , lo cual correspondería a una nube de puntos convexa. Por cont raposición, en el modelo lineal incorporamos a priori la hipót esis de elast icidad const ante, es decir, el supuest o de que la variable yt crece proporcionalmente con xt .Sin duda que, aunque no se considera habitualmente, parece conveniente permit ir en un pri emr análi sis la posibili dad de una relación cuadrática contrast ando, si se desea, la signi fi cat ividad est adíst ica del coefi ciente β 2, si bien dicho contr ast e habría que verl o a la luz de la discusión de la Seccion XX. Así, en muchas ocasiones (como puede ser si se quiere utili zar el modelo est imado con fi nes predictivos) puede result ar conveniente mantener un posible término cuadrático incluso si el coefi ciente β 2 asociado aparece como est adíst icamente no signifi cat ivo, en t érminos del habit ual contrast e de la t de St udent. Queda por discutir cómo obt ener est imaciones de mínimos cuadrados para est e modelo, a pesar de ser una relación no lineal entre variables. Pero est e tipo de modelos es muy sencil lo de est imar, pues bast a defi nir una nueva vari able x2t = x2t para t ener el modelo de regresión,
yt = β 0 + β 1xt + β 2x2t + ut
(5.9)
que, como modelo lineal que es en lasvari ables explicat ivas xt y x2t, est imamos por medio de los procedimientos descri t os en la Sección XX, t eniendo el est imador MCO de est e modelo las propiedades habit uales. 5.7. ¿Cómo especi fi car un modelo de regresión? 5.7.1. ¿Debe incluirse una constante en el modelo de regresión? Consideremos el modelo de regresión simple,
26
5.7.2. ¿D ebemos est im ar en valores ori ginales o en logar it mos de las variables? 5.7.3. ¿D ebe est im arse el m odelo con var iables en ni veles o en di fer encias? 5.7.4. L a fr ecuencia de obser vación de l as var iabl es Muchas veces se alusión al aparent e principi o de que, en cualquier t rabajo est adíst ico con dat os, más información es preferibl e a menos, por l os que, un mayor número de dat os es preferi ble a un número inferi or. En est e sentido, si el invest igador t iene la posibil idad de trabajar con dat os mensuales de las variables dependiente e independiente, debe util izar est os en preferencia al uso de dat os anuales. Est o no es en modo alguno ciert o, debido al menos a dos consideraciones. Er r ores de medida Por un lado, lasvariables económicas, especialment e si son de carácter fi nanciero, t ienen un nivel de volatil idad potencialmente import ante, por lo que cada dat o frecuente que se publica (digamos que mensual) recoge, no sólo la evolución subyacente o verdadera de la vari able que se observa, sino t ambién el componente de volat ili dad en l a misma. est o quiere decir que, al observar una vari able cada mes, los datos t ienen un componente de naturaleza err áti ca, es decir , puramente aleat ori o o impredecible, que puede venir sucedido por un compoenente de igual naturaleza, pero signo opuest o, al mes siguiente. En consecuencia, si sólo observáramos el dat o t rimest ral, que se forma bien mediante un promedio de los t ri mest rales, (si la vari able es un st ock), o acumulando l o t res dat os mensuales correspondientes a dicho t ri mest re (si la vari able es un fl ujo), una buena part e de los componentes errát icos habrá desaparecido por compensación, y el dat o t ri mest ral sería, muy posiblemente, más fi able, que los t res dat os mensuales. Algo similar puede decir se en cuanto a observar dat os t ri mest rales o anuales. Est a observación est á det rás de l a sensación que muchas veces se t iene al asist ir a la divulgación en los medios de comunicación de un nuevo dat o mensual de expectativas de empresarios, infl ación, et c.. No es ext raño asist ir , en variables tan import ant es, a un dat o mensual aparentemente posit ivo sigue que se interpr et a como negat ivo, quizá uno siguiente posit ivo, et c.. De est e modo, la avalancha de datos frecuentes genera una incertidumbre que podría evitarse en cierta medida si, aun recogiendo dat os mensualmente, se evaluaran sólo con menos fr ecuencia. Est o t iene implicaciones cuande se t rata de caract eri zar la relación que exist e entre variables. Si, por ejemplo, est amos int eresados en analizar el modo en que
27
las expectativas de los empresarios acerca de la demanda futura incide en sus decisiones de inversión, la presencia de los componentes err át icos en los dat os que se publican nos llevaría a est imar un modelo,
inversio´n∗t = β 0 + β 1 exp ectativas∗t donde,
inversio´n∗t = inversio´nt + εt exp ectativas∗t = exp ectativast + ξ t siendo εt , ξ t , los componentes err át icos a los quenos hemos referido, quesupondremosno relacionados, Corr(εt, ξ t ) = 0 . Incluso si Corr(inversio´nt, exp ectativast) eselevada, la presencia de εt, ξ t, hará que, generalmente, Corr(inversio´n∗t , exp ectativas∗t ) sea inferi or a Corr(inversio´nt , exp ectativast), proporcionando un ajust e pero del que habríamos t enido en ausencia de dichos componentes erráticos. Como consecuencia dequesólo podemos util izar en la regresión lasmedidas inversio´n∗t , exp ectativas∗t , quizá incluso tengamos una estimación del coefi ciente β 1 no signi fi cativa, debido a la pérdida de precisión en su est imación. Ejercicio de simulación Ot ra posibil idad sería examinar los dat os mensuales a la luz de una referencia t emporal adecuada. L a fr ecuencia en las r elaciones est r uct ur ales Otra razón por la cual no es necesariamente preferible ut ilizar datos más fr ecuentes que menos re refi ere a la propia naturaleza de la r elación que se est á t ratando de medir. Por ejemplo, consideremos la import ante relación exist ente entr e crecimeint o monet ari o e in fl ación. Ningún economist a duda de que t al relación exist a; algunos, incluso defi enden la idea de que la in fl ación es puramente un fenómeno monet ario, est ando complet amente det erminada, por t anto, por la t asa decreciemit no dela cantidad dedinero. Ot ros economist as no ll egan t an l ejos, pero aceptan que hay una relación posit iva ent re creciemit no moentario e infl ación; precisamente contrast ar si dicha relación es más o menos est recha, o si un mayor crecimient o monet ari o se t ransmit e completamente (es decir, con coefi ciente β 1 = 1) a una mayor infl ación, puede ser la motivación para estimar un modelo,
inf lacio´nt = β 0 + β 1crecimiento monetario + ut 28
Ahora bien, ¿verdaderamente creemos que un mayor crecimiento monet ario en marzo, por ejemplo, genera una mayor in fl ación en dicho mes? Muy pocos economist as suscri bir ían t al concept o. Mucha mayor uniformidad de pareceres encontraríamos en cuanto a creer que observado año a año, mayor crecimiento monet ario viene asociado con mayor in fl ación, mientras que un año en que se instrumenta una política monetaria más restrictiva, defi nida por una reducción del crecimiento monet ari o, es un año de in fl ación menor. Es decir, l a proposición conceptual que relaciona positivamente crecimiento monetario e in fl ación es una proposición referent e al medio o largo plazo. Incluso con dat os anuales surgir á, lógicamente, la cuest ión de si un menor crecimeinto monet ario conduce a una menor in fl ación ese mismo año, el año siguiente, o en ambos. Est a será una cuest ión que puede discut ir se mediante los procedimientos economét ricos y los contrast es est adíst icos adecuados, y que conduce a una i nvest igación siempre interesante. Pero ést a es la perspectiva adecuada: en modo alguno t iene sentido pensar que las fl uctuaciones que, mes a mes, experimenta el crecimiento monet ario se corresponden con las fl uct uaciones mensuales que se observan en la tasa de in fl ación. est e t ipo deinvest uigaciones, con dat os mensuales, est án condenados al fr acaso; incluso si est adíst icament e det ectásemos una r elación posit iva, deberíamos est ar dispuest os a cali fi carla de espúrea, en el sentido de no ser la relación est ruct ural quecualquier economist a est aría dispuest o a admitir ent re crecimiento monet ario e infl ación. Est e ejemplo no debe sino sugerir que las proposiciones económicas t eóricas no dicen nada acerca de cuál es la frecuencia en la que se cumplen, y no debemos en modo alguno inferi r que una proposición t eóri ca debe cumplirse en t odo t ipo de dat os. Por el contrari o, cuando nos proponemos examinar empíri camente una proposición t eórica, hemos de pensar cuidadosamente acerca de la fr ecuencia de dat os en que esperamos que ést a se mani fi este, y ello debe determinar el tipo de dat os a util izar. El posible cumplimiento de la proposición puede apreciarse en dat os de una frecuencia pero no en dat os de frecuencia diferente. Est r uct ur a dinámica de una relación y fr ecuencia de observación de los datos Un aspecto relacionado se refi ere a las características dinámicas de la relación que se est á t rat ando de est imar: supongamos que exist e una relación entre variables económicas que t arda un mes en manifest arse. Así, con dat os mensuales, un modelo apropiado sería,
yt = β 0 + β 1xt−1 + ut 29
afi rmando en est e caso que la relación es dinámica, por cuanto que no se mani fi est a contemporáneamente, esdecir, durant e el mismo mes. De acuerdo con est e modelo, un incremento en xt t endería a conducir a un valor más elevado de yt pero no est e mes, sino al mes siguiente. Supongamos ahora que sólo disponemos de dat os t ri mest rales: por ejemplo, el dat o del primer t ri mest re será, para ambas vari ables, el promedio de l os dat os de enero, febrero y marzo, t eniéndose las relaciones,
yfebrero = β 0 + β 1xenero + ufebrero ymarzo = β 0 + β 1xfebrero + umarzo Aunque yenero no est á relacionado con xenero, xfebrero, o xmarzo, las relaciones exist entes entre yfebrero, ymarzo y xenero, xfebrero son sufi cientes para que los datos del pri mer t ri mestre de ambas vari ables,
y primer
trimestre
=
yenero + yfebrero + ymarzo xenero + xfebrero + xmarzo , x primer trimestre = 3 3
est én relacionados. Sin embargo, debe apreciarse que la relación será ent re lso datos de x e y correspondientes ambos al primer t rimest re. En consecuencia, una r elación que con datos mensuales t enía una naturaleza dinámica, pasa a ser est rict amente cont emporánea con dat os triemst rales. Así, es import ante recordar que algunas de las propiedades de una relación economét rica dependen de la frecuencia de observación de los datos, no siendo, por t anto, propiedades de caráct er absolut o de la relación entr e x e y.
6. Contrastes de hipótesis en el modelo de regresión lineal simple Como se ha comentado anteriormente, t res son las fi nalidades posibles que se deri van de la est imación de un modelo economét ri co: a) la posibili dad de contrastar hipótesis económicas teóricas alternativas, b) la predicción de los valores futuros de la variable dependient e 6.1. Signi fi cación est adíst ica ver sus p r ecisión Uno de los contrastes más habituales tras estiamr un modelo de regresión se refi ere a la hipótesis del t ipo H 0 : β = 0, con la que el invest igador se pregunta si la 30
variable asciada a dicho coefi cente t iene un impact o signi fi cat ivo sobre la vari able dependiente, cuyo comport amiento se pret ende explicar. No debemos olvidar que con ello, lo queest amos contrast ando es si dicho impacto es est adíst icamente signifi cat ivo, y t ratando deidenti fi car dicha caract eríst ica con la exist encia deun efect o estructural signi fi cat ivo de la vari able expli cat iva sobre la vari ables dependiente. Pues bien, ya hemos vist o que la manera de resolver el contr ast e de dicha hipótesis consist e en util izar el t est t de St udent, que en el caso de la hipót esis de signi fi cación adopta la forma,
ˆ β ˆ) DT (β
∼ tT −k
donde T k denot a el número de grados de li bert ad del modelo de regresión, defi nido como la diferencia entre el número de observaciones ut ili zado en la est imación del mismo y el número de coefi cientes est imados. Por t anto, para decidir acerca de la hipótesis nula de signi fi cación de un coefi ciente β , se const ruye el cociente entre la estimación numérica de dicho coefi ciente y su desviación típica est imada, y se compara con el umbral crít ico de la dist ri bución tT −k al nivel de signi fi cación escogido de antemano. La práct ica habit ual consist e en concluir que la vari able explciati va x no es relevante para explicar el comport amiento de la vari able y si el valor numérico de su est adíst ico t de St udent es inferi or al nivel crít ico proporcionado por las t ablas de dicha dist ri bución al nivel de signi fi cación deseado. Que la comparación se est ablezca en t érminos del valor absolut o del est adíst ico muest ral o no depende de que el contrast e sea de una o dos colas, lo cual depende a su vez de la forma = 0 , o adopte alguna de que adopte la hipótesis alt ernat iva, según sea ést a H 1 : β 6 las formas H 1 : β < 0, H 1 : β > 0. La forma que adopta est e cont rast e sugiere de modo bast ante evidente que el est adíst ico t puede ser inferior al umbral crítico de la distribución de referencia ˆ sea pequeño incluso cuando se tie en cuenta a) bien porque el valor est imado β ˆ sufi ciente el rango de variación de la vari able asociada, o b) porque, aun siendo β como para generar un impacto cuantitati vo apreciable de x sobre y , dicho valor numéri co se est ima con poca precisión, es decir, con una desviación típica elevada. Mientr as el primer caso corresponde a una sit uación en la quequerr íamos concluir que, efect ivamente, la vari able x no es relevante para explicar y , en el segundo caso, t al conclusión sería errónea; lo queest á sucediendo en est e caso es únicamente que la muestra disponible no nos permite asignar un valor numérico concreto al
−
31
cofi ciente asociado, a pesar de que la vari able x es un fact or explicat ivo relevante de la variable y. A pesar de sus import ant es implicaciones para el contrast e de hipótesis est adíst icas, est a discusión se ignora con demasiada frecuencia en el t rabajo empíri co. Su importancia deriva de que, como hemos ido revisando con anterioridad, existen distintas razones que pueden implicar una pérdida de precisión en la estimación puntual, con independencia del contenido informativo que la variable x tiene sobre y. Por ejemplo, aparece una pérdida de pr ecisión apreciable cuando el valor numéri co del coefi ciente β ha vari ado a lo largo del intervalo muestral [Recuérdese el ejercicio de simulación X XX ]. en dist intos puntosEst a se numéri camente de Con mucha fr ecuencia se ignora 6.1.1. ¿Se hace una variable más o menos signi fi cativa? 6.1.2. ¿Cómo puede discuti r se qué var iable es más r elevant e en una regresión? mayor valor numérico mayor estadístico t
7. Correlación versus causalidad 8. Variables no estacionarias La no estacionariedad de las variables involucradas en una regresión es uno de las sit uaciones que requiere una consideración más cuidadosa en el análi sis de regresión. La ausencia de est acionari edad se produce con mucha frecuencia en variables económicas; además, como vamos a ver, sus implicaciones en la est imación de modelos de regresión pueden ser bast ante negat ivas e import antes. Por últ imo, su det ección y t rat amiento no son siempre evidentes. 8.1. Características de una variable estacionaria Una variable est acionaria t iene generalmente varianza fi nita (salvo que obedezca a una distri bución que como la Cauchy, carece de est e momento); más precisamente, su varianza no cambia con el paso del t iempo y, desde luego, no t iende a infi nit o. una pert urbación t ransit oria sobre una variable est acionaria t iene efect os 32
puramente transitorios; pueden durar varios períodos, pero sus efectos terminan desapareciendo. Los valores sucesivos de su función de auocorrelación convergen rápidamente hacia cero, except o quizá en los ret ardos de carácter est acional. la serie temporal correspondiente a una variable estacionaria no deambula durante períodos largos de t iempo a un mismo lado de su media muest ral, sino que cruza frecuentemente dicho nivel medio. El número medio de períodos que transcurr e entre dos cruces consecut ivos del nivel medio muest ral es pequeño. Por el contrario, una perturbación de carácter transitorio sobre una variable no est acionaria t iene efect os permanentes. La función de aut ocorrelación de una variable no est acionaria converge a cero muy lentamente, y su serie t emporal muest ra claramente largos períodos de t iempo en que deambula sin cruzar su nivel medio. 8.2. Tendencias d et er m ini st as y t endencias est ocást icas La ausencia de est acionariedad en variables económicas puede refl ejarse mediante la presencia de t endencias est ocást icas o de tendencias deterministas en losprecios de mercado, a t ravés de volatil idad cambiant e en el t iempo, et c.. Una tendencia estocástica es un componente est ocást ico cuya varianza t iende a in fi nito con el paso del t iempo. Una tendencia determinista es una función exacta del tiempo, generalmente li neal o cuadrát ica, lo que hace que el valor de la variable crezca o disminuya const antemente; si la t endencia es lineal, la variable t enderá a más o menos in fi nit o; si la t endencia es cuadrát ica o de orden superior, la variable puede est ar acotada. Si una variable presenta una tendencia determinista lineal, su valor esperado t enderá a aumentar o di sminuir continuamente, con lo que será imposibl e mant ener el supuest o de que la esperanza mat emát ica de la sucesión de variables aleatorias que confi gura el proceso est ocást ico corr espondiente a dicha variable, es const ante. En consecuencia, t ampoco podrá mant enerse que la dist ribución de probabilidad de dichas vari ables es la misma a t ravés del t iempo. Sin embargo, si efect uamos una corr ecta especi fi cación de la est ructura de dicha t endencia, podrá est imarse y ext raerse del precio, para obt ener una variable est acionaria, que no presentaría las di fi cult ades ant es mencionadas. Mayor di fi cultad entraña el caso en que una variable precio incluye una tendencia est ocást ica pues, en t al caso, su esperanza y varianza no est án defi nidas. La presencia de una t endencia est ocást ica requiere transformar la variable, generalmente en primeras diferencias t emporales, o t omando las diferencias entre las
33
observaciones correspondientes a una misma est ación cronológica, en el caso de una vari able est acional. La t ransformación mediant e diferencias result a bast ante nat ural en el análi sis de dat os fi nancieros, por cuanto que la primera diferencia del logari t mo de un precio, en logari t mos, es la rentabilidad del act ivo, loq ue hace que la t ransformación logarít mica sea ut ilizada muy frecuentemente. Como prácticamente ningún precio o índice fi nanciero es est acionario, el uso indiscri minado de un est adíst ico como la vari anza o la desviación t ípica como indi cador de ri esgo conduce a medidas de volatil idad sesgadas al alza. Consideremos un modelo muy popular en el análi sis de mercados fi nancieros, el camino aleatorio:
yt = µ + yt−1 + εt, t = 1, 2,... que evoluciona a part ir de un valor inicial y0dado, donde εt es un ruido blanco: sucesión de variables aleatorias, independientes, con media const ant e (que suponemos cero), y varianza asimismo const ant e σ 2ε . Mediant e sucesivas sust it uciones, est e proceso puede escribirse, de modo equivalent e:
yt = y0 + tµ +
Xt
εs
s= 1
En consecuencia, un camino aleatorio yt t iene varianza creciente en el t iempo:
V ar(yt) = tσ 2ε Ell o se debe a que el últ imo sumando en la representación anteri or es un ejemplo de tendencia estocástica. Cuant o mayor sea el número de observaciones consideradas, mayor será la varianza muest ral del camino aleat orio: un camino aleat orio t iene menor varianza a lo largo de una hora que a l o largo de un día, a lo l argo de un día que a lo l argo de una semana, et c.. Est o es lo que ocurrir á con l a inmensa mayoría de los precios cot izados en l os mercados fi nancieros. Aunque la presencia de t endencias est ocást icas se produce generalmente junt o con est ructuras más complejas que la de un camino aleat ori o, la implicación acerca de una vari anza creciente con el t iempo se mantiene cuando se añaden a ésta componentes autoregresivos o de medias móviles para yt . Para evitarlo, caracterizamos la volatilidad de un mercado o de un activo analizando el comportamiento de la rentabilidad que ofrece a lo largo del tiempo, no de su precio o cotización. 34
En el ejemplo anteri or, deun camino aleat ori o, la t endencia est ocást ica aparece debido al coefi ciente unit ario del ret ardo de yt en la ecuación queexpli ca el comport amiento de est a vari able, por lo que una t endencia est ocást ica se conoce asimismo como una raíz unitari a. Con más generali dad, recordemos que por la descomposición de Wald, t odo proceso est acionario acept a una representación aut oregresiva, quizá de orden in fi nito,
yt = α0 +
X∞ s= 1
α j yt− j = α (L) yt
donde L denot a el operador de retardos, defi nido como L j yt = yt− j. SiQobten p L α ( ) = emoslas raícesdedicho polínomio deret ardos, podremos escribir , i= 1 (1 Q q 2 ai L) j= 1 (1 b j L c j L ), donde los últ imos fact ores t ienen como raíces dos números complejos conjugados. una raíz unit ari a es un fact or del primer t ipo, con ai = 1. En el lenguaje est adíst ico, se dice que el proceso yt t ieneuna raíz unit aria. Si el proceso yt siguiese una est ructura dependiente de su pasado, pero del tipo:
−
−
−
yt = φ0 + φ1yt−1 + εt t = 1, 2,...,
−1 < φ
1
<1
sus propiedades serían bast ante dist intas, con:
1 yt = φ0 1
− φt + φs y −φ 1
1 0
1
+
Xt
φt1−s εs
s= 1
y si consideramos que el proceso ha durado in fi nit os períodos, φ0 σ 2ε E (yt ) = ; V ar(yt ) = 1 φ1 1 φ21
−
−
est arían bi en defi nidas, son const ant es, y el proceso es est acionario. Est e proceso se denomina proceso autoregresivo de primer orden y en él hay quedist inguir entre momentos incondicionales, cuyas expresiones analít icas acabamos de calcular en el caso de esperanza matemática y vari anza, y momentos condicionales. donde suponemos que ut es un proceso sin autocorrelación (correlación temporal consigo mismo). Es decir, Corr(ut, ut−k ) = 0 k. En est as condiciones, si ut sigue una distribución Normal ut N (0, σ2u ), ent onces yt sigue una dist ri bución
∀
35
∼
yt
∼
φ0 σ 2u N ( , ) 1 φ1 1 φ21
−
−
Est a es la dist ri bución marginal o incondicional, de yt . Por otra parte, condicional en la historia pasada de yt , sin incluir el dato de fecha t, la dist ri bu8ción de probabilidad condicional de yt es,
yt
∼ N (φ
0
+ φ1yt−1, σ 2u )
que tiene una menor varianza. De hecho, la varianza i ncondicional de yt es t ant o mayor cuant o más se acerque el parámet ro φ1 a 1, creciendo dicha varianza sin límit e. Sin embargo, la vari anza condicional es siempre σ 2u , con independencia del valor numérico del parámetro φ1. La varianza condicional de yt es igual a la vari anza de ut , σ 2u , mient ras que la varianza incondicional de yt es siempre mayor que σ2u . Además,
E (yt /yt−1) = φ0 + φ1yt−1; E (yt) =
φ0 1 φ1
−
Como veremos más adelant e, el concept o de proceso browniano est á bast ant e li gado al de camino aleat ori o. Por t anto, la afi rmación ant erior es coherente con establecer la hipótesis de que la rentabilidad de un determinado activo sigue un proceso browniano, pero no t anto con efect uar dicha hipótesis sobre su precio. 8.3. Regresión espúrea El problema de la regresión espúrea fue anali zado por Granger y Newbold (1974), quienes most raron la posibil idad de que, en det erminadas sit uaciones, est imaciones mínimocuadráticas de un modelo de regresión lineal que sugieren una est recha relación entre vari able dependiente y variables independientes, est án refl ejando, en realidad, una relación espúrea o fi cticia, que en realidad no existe. Es evidente que tal posibi li dad sería ext remadamente peligrosa, t ant o en la estimacion de coefi cientes de imapcto o elast icidades, como en la contrast ación de hipótesis t eóricas. Lo que suele i gnorarse con demasiada frecuencia es que las condiciones para que una regresión sea espúrea se dan con mucha frecuencia en la invest igación aplicada en Economía, en general, y en Fi nanzas, en part icular. 36
Comenz Come nzam amo os de des scr ibi endo el t ipo ip o de di fi cult ade des s a qu que e puede puede dar dar lugar lugar la ausencia de estacionariedad de las variables dependiente e independiente en un model model o de re r egres gresi ón li l i ne neal. al. Par Par a el el l o, pe pens nse emos en en el si guient guiente ee ejj er cicio: come comennzamo zamos s simula imul ando do dos s rui do dos s blancos blancosii nde ndepe pendie ndient nte es, εxt , εyt , t = 1, 2,...,T, a partir de distr i bucione buciones s de probabil probabil i da dad d Nor Nor ma mall , con con espe perr anza nza ma matt emá mátt i ca µεx , µεy (por 2 2 ej emplo, mpl o, igua i guall es a ce cer o) y var var i anzas anzas σεx , σεy ; el coefi cient ciente e de cor relación relación mues muest r al entre nt re las se seri es t emporales mporales r esult an antt es se ser á, por con ons st r ucció ucción, n, muy reduc reducido, si bien bien no exac exactt am ame ente nt e i gua uall a cer cer o. Nota:: Cua Nota Cuanto nto ma mayo yorr sea el el t ama maño ño mue muest ral, má más s proba probable es qu que e dicha dicha co correlaci relaci ón sea igu i gua al a cero, cero, de debido bido a que la l a cor cor relación relación mues muest r al, es dec deci r, l a cor cor rel rel ación ción entr nt r e l as dos se seri es t emporal mporal es si si muladas muladas es es, por l a l ey de lo l os grandes grandes números números,, un est imador imador cons consist iste ente nt e de su análogo nálogo poblaci poblaci ona nal, l, que es el coefi ciente de corr elación lación t eóri co entr e los do dos s proce procesos εxt , εyt , qu que e es i gua uall a cero. Por Por t anto nt o, al aument aument ar T , la l a dist dist ri bución bución deproba de probabil bilidad idad de del coefi cient ciente e de cor cor r el aci aci ón mues muest r al se con onc centr nt r a al al rede rededo dorr de cero. cero. El gráfi co de am amba bas s vari vari ables prese presentará nt ará una pa paut ut a oscil oscilan ando do alr ede dedo dorr de su me medi dia a mues muest r al que que,, por la misma misma raz r azón ón apunt apunt ada para el coefi cente de correlaci relaci ón, ser án próxima próxi mas s, si bien bien no igu i gua al es, a µεx , µεy . Observaremos que cada ser ie t emporal cr uza uza repet repet idament idamente e su su nivel nivel me medio. dio. Si est imamos imamos una r egres gresión del tipo: εyt = β 0 + β 1εxt + ut , t = 1, 2,...,T
deberr íamos debe íamos obte obt ene nerr una est i maci maci ón de β 1 no signi fi cativamente diferente de 2 cero, y un R práct práct icame icament nte e nulo. nulo. En efec fect o, sal vo por el err or est adíst díst ico, ico, así ocurre ocurre cua uando ndo lle ll evamo vamos s a cabo un ej ercicio rcicio de simulac imulación de Mont Mont e Ca Carl rlo o: al 95% de confi anza nza, el el ha habit bit ua uall contras nt rastt e t ipo t r echa haza zarr á la hipótes hip ótesis is nula de au aus sencia de capa capac ci da dad d expli xpl i cat cat iva de εxt H 0 : β 1 = 0 aproximadame proximadament nte e en en un 5% de 2 l os cas casos os,, y el val val or me medi diana ana del del coe coefi cient ciente e de det det er minac mi nacii ón R para todas las simula imul aci on one es es es muy reduc reducii do do.. El t érmi no cons constt an antt e sólo sólo r esult ul t ar ía signi fi cativo si en la gene nerac ración ión de las seri es t emporale mporales s, he hemo mos s util ut il izado izado valore valores s difere diferente ntes s de µεx , µεy . Est Est e result result ad ado o no se se ve afe afec ct ado signi signi fi cati vame vament nte e en ni ng ngún ún otr ot r o se sentido nt ido po p or la pres presenci nci a de t al es t ér minos cons constt ante nt es, ni t am ampoc poco o por cam ambios bios en en el valor valor de las res respe pec ct ivas ivas vari vari anza nzas. Al vari vari ar el valor valor relat relativo ivo de σε2y /σ ε2x t an sólo se obse bser va un comport comport amient miento o algo err err át i co de del t am amañ año o del del cont contrat rat e de si gni fi cación del parámetro β 0. En defi nitiva, en esta primera parte del ejercicio tendremos el 37
r esult ul t ado que espe perr aríamos aríamos: una r egres gresi ón no si gni fi cativa, excepto en lo relativo al nive ni vell escogido cogido para el cont contrr ast ast e. 8.3.1. Regresión espúrea bajo tendencias deterministas A con ontt inuaci inuaci ón ón,, añ aña adimo di mos s una t ende ndenc ncii a li l i ne nea al de dett ermini rmi nis st a a cada cada una de ell os,
yt∗ = at + εyt xt∗ = bt + εxt donde a y b son constantes arbitrarias y t es una tendencia determinista, es dec de cir , una vari vari able que aument umenta a cada cada perí período odo en en una cant cantii da dad d cons constt an antt e, ∆. Si cal cal culamos culamos el coe coefi ci ente nt e de cor cor relaci relaci ón mue mues st r al ent entrr e xt e yt , apreciaremos que es es el evado vado.. Est Est o es sorpre orpr ende ndent nte e porque, porque, com omo o mues muest ran las expre xpr esiones iones ante nteri ri ores res, cada vari vari able es la suma de un compo compone nente nte de na natt uralez uraleza de dett erminis rmi nistt a, que no experimenta ninguna fl uctuac uct uacii ón aleat aleatori oria, a, y un segundo compo compone nent nte e de natur nat urale aleza za est ocás ocástt i ca. ca. El coe coefi cient ciente e de corr corr el ación ción de debe berí ría a indica i ndicarr l a asoc asocii ación ción est adíst díst i ca entre nt re ambas mbas variab vari abll es, que es es lo mismo mismo que la l a asoci oci ación ación entr nt r e sus sus compone component nte es est ocás ocástt i cos cos, es de decir cir,, entr nt r e sus i nno nnova vacione ciones s. Per Per o dic di cha cor cor r el aci aci ón debe de berr ía se ser, por const nst rucción, rucción, práct práct i came cament nte e i gua uall a cero, cero, en contra nt ra de dell r esult ado que qu e se obtie bt iene ne cua uando ndo se se ll eva a cabo cabo es est e ej ercicio de simulaci imulaci ón. En t odo ca caso, tal elevada correlación no refl eja ninguna relación real entre las variables, por lo que qu e se de deno nomina mina correlación espúrea. espúrea. Como cons conse ecuencia cuencia de la l a mi sma, si se es est i ma una un a re r egres gresi ón l i ne neal, al, t omando omando cual cual quiera de es est as var var i ables ables como como var var i able depe dependi ndie ente nt e y l a otr ot r a como indepenindependiente,
yt∗ = β 0 + β 1xt∗ + vt , t = 1, 2,...,T l os resul resultt ad ados os cambian cambian sust ust an anc ci al me ment nte e: se obti obt i ene un R-cuadrado elevado pues pue s, como como ya sabe abemos mos,, es igua i guall al cuadr cuadrado ado del coefi ciente de correlación entre ambas mbas variab vari abll es, a l a vez vez que una pe pendie ndient nte e β 1 apa aparr ente nt eme ment nte e signi fi cativa, de acuerdo con el criterio habitual de utilizar su estadístico tipo t-Student. t-Student . Amba Ambas cosas ocurr ocurr i r án en un elevad levado o porcent porcentaj aje e de las si mulacione mulaciones s que r eal i cemo mos s, pa parr a dist dist i nta nt as ser ies ies t emporales mporales de εxt , εyt , t = 1, 2,...,T. Por cons consii guiente guient e, creer creer íamos ∗ ∗ que la capacidad explicativa de la variable xt sobre yt es muy muy i mport mport ante nt e. Est Est e ∗ ∗ r esult ad ado o es sor sor prende prendent nte e, por cua cuanto nt o que la l as varia vari ables bles yt , xt tienen la misma 38
estructura estocástica que εxt , εyt , por lo que a amba mbas s r elaci laci one nes s debe deberr ían ían proporcionar cionar r esult ul t ado ados s aná análl og ogo os. Est Est a apari aparie encia fi ct icia de capa pac cidad expli expli cat iva es es lo que qu e se cono noc ce como r egr esi esi ón espúr espúre ea. El gr ado de corr corr el aci ón ob obs servado ent entrr e yt∗ , xt∗ de depe pende nde de dos fact fact ores: res: l a simili imi li t ud entr e la l as cons constt ante nt es a y b, y la relación entre ambas y las desviaciones típicas de los ruidos blancos originales, εxt , εyt . Si , por ej emplo, fi ja j amo mos s el el val val or numérico de b en b = 1, y vamo vamos s t oma mando ndo en cada cada ej er cicio de si si mulaci mulaci ón val val ores: a = [0, 1; 0, 5; 0, 9;1;3;10;100] el coe coefi cient ciente e de det det ermi na nación ción res result an antt e, 2 R aument umenta a mo monó nótt onicame nicament nte e con con el valor valor de a. Es decir decir,, l a mayor mayor corre orr el ación ción no se obtiene cuando hay a ambos lados de la igualdad la misma pendiente, lo que equivaldría a utilizar a = 1, si no que dic di cha corre corr el aci aci ón aument aumenta a con con a. Esto se de debe be a que que,, según aument aumenta a a, cad ada a vez vez ha hay y má más s t ende ndenc ncii a de dett er minis mini st a en ∗ yt , en el senti nt i dod e ques ques és ést a pre pr edomina sobre el el compone component nte ee es st ocás ocástt i co εyt , y dic di cha t ende ndencia ncia de dett er mini mi nis st a pue puede de expl explii carse carse muya decuada decuadame ment nte e medi median antt e el el ∗ compone component nte e aná análl og ogo o de xt . 8.3.2. 8.3 .2. R egresión gresión espúr ea b aj o t end encias es est ocás ocást icas En su t rabajo pione pionero, Grange Granger y Ne Newbo wbold ld (197 (1974) t rata rat aron el problema problema de no est aci on ona ar ieda iedad producido producido por la pres presencia ncia de t ende ndenc ncias ias est ocá ocást i cas o r aíces íces unit ari as. Para Para ell ell o, rea reali zaron el el siguiente iguiente ej ercicio: rcicio: a part part ir de la simulac simulación ión de dos do s r uidos blancos blancos i nde ndepe pendie ndient nte es que t endrán, por cons constt rucci rucci ón, como como ant ante es, un coefi cient ciente e de cor cor r elaci laci ón mues muest r al muy r educi duci do do,, añ añad adieron ieron una raíz unitaria o tendencia estocástica a cada cada uno de el l os,
yt = yt−1 + εyt xt = xt−1 + εxt obt enie obte ni endo que el el coe coefi ciente de correlación entre xt e yt era muy próximo a la unidad. unidad. Est Est o es es sorpre rpr ende ndent nte e, po porr cua uant nto o que, que, a part ir de condicione ndiciones s inic ini ciales iales conoc conocidas idas,, l os val val or es de ambas mbas vari vari ables en en cad ada a inst inst an antt e de t i empo pue puede den n escribi cri birr se como, como,
yt = y0 +
Xt
εys
s= 1
que indican que indican que que la evoluc volución ión t emporal mporal de cada una de las vari varia ables bles se de debe be a la acumulaci umulaci ón t emporal de sus innova innovaciones ciones. Por Por t anto nt o, la l a na natt uraleza uraleza est ocá ocást ica de 39
cada cada vari vari able est á t ot al me ment nte e de dett er minada por por l a nat nat uraleza uraleza de sus i nno nnova vacione ciones s. Si εxt y εyt son inde i ndependi pendie ent es, entonc ent once es t ambién deberí deberían an se ser l o xt e yt , en cont contrr a delos de losva valore lores s obt enidos nidos pa para ra susc us coefi ci ente nt es de deco corr rr el aci ón mues muest r al es en r epe pett idas si mulaciones mulaciones. En todo t odo cas caso, nue nueva vame ment nte e, tal t al el el evada vada corr corr el aci aci ón no r efl ej a ninguna ninguna relac relación ión re r eal entre nt re las vari varia ables bles, po porr lo que se de deno nomina mina correlación espúrea. espúrea. Si est est i mamos mamos una r egres gresi ón l i ne nea al entre nt re est asva as varr i ables ables, en en cual cual quier orden, orden, t endremo dremos s de nue nuevo vo un R-cua -cuadrado drado eleva levado do y una pe pendie ndiente nte signi fi cati va, va, de acue uerdo rdo con el el cri t eri o habit habit ua uall de uti ut i li zar su es est adíst díst ico ti po t-Student, pero la evidencia de capac capacii dad expl explii cat cat i va proporciona proporci onada da por est a re r egres gresi ón se ser ía espúrea. espúrea. Si las seri es t emporale mporales s obte bt enidas nidas me median diantt e simulación imulación pa para ra las innova innovac ci one nes so ruido rui dos s blanco blancos εxt y εyt t uvies uviesen corre rr elación lación dist dist int a de cero, las vari vari ables bles xt e yt de los ej emplos ante nteri ri ores res mo mos st rarían co corr elaci laci one nes s mu mue est rales rales similare imi lares s a las qu que e se encue encuent ntrr an en l os ej ej er cicios de si mulación de des scrit cri t os. os. En ese cas caso, l os el el evados vados coefi cient ciente es de cor cor r el aci aci ón no ser ían t an enga engaños ñosos os,, si bie bi en ser ían numér numér i came cament nte e más má s alt os de lo que la correla rrelac ción ión ent re xt e yt haría esperar. En un ej er cicio de si si mulaci mulaci ón com omo o el de des scr it o, Grange Granger y Ne Newbold wbold enco ncont raron una fre fr ecue uenc ncia ia aproxi proxima mada da de rec recha haz zos de la hipótes hipótesis nula H 0 : β 1 = 0 de dell 76%. 6%. L a fre fr ecue cuenci nci a de recha rechaz zos de l a capa capacida cidad d explica xpl icatt i va globa globall de la regr regr esión se eleva muy signi fi cat cat ivament ivamente e al aument umenta ar el númer númer o de var var i ables bles expl explii cat cat ivas indepe independie ndient nte es con con est ructura ruct ura de ruido r uido blanco blanco. Nue Nueva vame ment nte e lo l os coe coefi cientes de dett er minac de mi nacii ón son son muy el evados vados,, l o que sorpre orpr ende nde,, pue pues s r ealment almente e, xt no explica apenas a yt . El est adíst díst ico de Durbin-Wa Dur bin-Watt son ha habit bit ua ualme lmente nte util ut il izado izado pa para ra cont r ast ar au aus sencia ncia de aut ocorrelac ocorrelacii ón se r educe duce ha hac cia cero, cero, por por lo que quell a combinac combinacii ón 2 de est e he hec cho con con un el evado vado R sue uele le uti ut i l i zarse como como indicio i ndicio de una regres regresii ón espúrea.
• Ejercicio de simulación En espureo.xls se han ge gene nerr ado dos ser ser i es t emporales mpor ales cor cor r espondie pondi ente nt es a una poblaci poblaci ón No N ormal N(0 N( 0,1). El gene nerr ado dorr de núme números alea aleatt ori os de Excel Excel produce produce obse obser vacione vaciones s i nde ndepe pendi ndie ente nt es ent ent r e sí, por l o que ambas ambas ser ser i es t emporale mporal es se obt i ene nen n asi asi mismo mismo de ma mane nera ra indepe independie ndient nte e. L a corr corr elaci laci ón poblaci poblaci ona nall entre nt re el las es cero, si bien la correlación muestral, al fi nal de ambas var var i ables, ables, es de 0,0278. 0,0278. Tampoco Tampoco la l a me media dia y de des sviac vi ación ión t ípica mues muest rales rales de cada cada var var iable son exact xact amente me nte 0 y 1, como sus sus valore valores s t eóri cos, si bien bien no di fi eren mucho mucho de el el los. los. El coefi cient ciente e de asi asi me mett r ía t eórico óri co,, así así como como el exces xceso de d e curt osi osi s (r ( r espe pect cto o de 3.0, 3.0, que qu e es la curt osis de t od oda a poblac población ión Normal) Normal),, de debe berían rían se ser ambos mbos igual igual a ce cero l o que,, nue que nueva vame ment nte e, ocur ocurrr e sól o con con car car áct áct er aproximado. 40
En regresion_ ori se presentan los result ados de est imar una regresión entre las vari ables ori ginalmente obtenidas por simulación, la pri mera de ell as act uando como variable dependiente, la segunda como variable explicati va. El coefi ciente de det erminación es el cuadrado de su coefi ciente de corr elación y, por t anto, muy reducido. La est imación del coefi ciente asociado a la variable explicativa aparece como no signi fi cati vamente diferente de cero, de acuerdo con el est adíst ico t habitual. El gráfi co que presenta el ajust e dela rect a a la nubedepuntosmuest ra un línea sin apenas pendiente, y una nube de punt os bast ante circular. Ambos hechos refl ejan una escasa correlación: una pendiente no signi fi cat iva sugiere que la vari able explicat iva puede cambiar de valor sin que l a vari able dependiente cambie; una nube de punt os cir cular muest ra que el rango de valores de cada una de las dos vari ables asociado a un valor det erminado de la ot ra es muy amplio. En consecuencia, un valor numéri co de cualquiera de ell as apenas nos informa acerca del valor de la ot ra variable. Est a es la manifest ación de la ausencia de corr elación entre ambas. Lo contrario ocurr e al est imar una regresión li neal entre las variables [regresion_ t end], una vez que se ha añadido una t endencia det erminist a a cada una de ell as. Para ell o, en la hoja Datos se han generado dos nuevas vari ables, sumando una t endencia li neal a l a vari able Y, y 0,6 veces la misma t endencia lineal a l a variable X. Los est adíst icos muest rales que aparecen al pie de di chas variables carecen de just i fi cación est adíst ica, como comentaremos en una sección posterior. Aunque el componente est ocást ico en ambas variables es el mismo de ant es, la nuebe de punt os ent re ambas t iene un per fi l t ot almente dist int o, siendo práct icamente una li nea rect a. Est o se debe a que el componente t endencial predomina sobe el est ocást ico; como consecuencia, la regresión est imada entre ambas vari ables muest ra un coefi ciente de det erminación muy próximo a la unidad. Lo que es quizá más preocupant e, es que la pendiente est imada en dicha regresión, que es sust ancialmente más elevada que la est imada con las variables originales, aparece como claramente signi fi cativa, sugiriendo una importante capacidad explicat iva a la vari able independiente, contr ari amentea lo que det ect amos en la pri mera regresión. Aquí cabe discut ir si est e es un resjult ado razonable: podría argumentarse que ambas vari ables t ienen un componente t endecial import ante y que, en ese sentido, no es sorprendent e que el coefi ciente de determinación entre ambas sea elevado. Es ciert o, pero sólo refl eja la relación entre los componentes det erminist as, que no son los quedeben concentrar la at ención del analist a: si hay componentes det erminist as en las variables dependiente y explicat ivas, el anali st a debería indagar las razones queexplican la presencia simult ánea de t ales elementos 41
en las variables. Est a sería uno de los elementosdel análisis; el segundo consistiría en evaluar la relación entre los componentes est ocát icos en variables dependiente y explicat ivas; ést e elemento es import ante, pues nos proporciona información acerca del impact o que sobre la vari able dependiente puede t ener una intervención sobre alguna de las vari ables explicat ivas, o una alt eración exógena en su valor numéri co. La di fi cult ad con la regresión ant erior est riba en que si no se ll eva a cabo est e análisis por componentes, el examen mecánico de losresult adosde la regresión sugeri ría quela vari able dependiente reacciona a fl uctuaciones inesperadas en l a variable explicativa, cuando no es así; t al conclusión sería un error. Post eriormente, hemosmant enido losmismoselementos t endenciales de ambas variables, pero hemos incrementado de manera apreciable el componente aleat ori o en ellas. Siendo t ales componentes variables aleatorias de esperanza mat emát ica igual a cero, su t amaño queda representao por su desviación t ípica, queera unit ari a para ambas en l as regresiones ant eri ores. En l a hoja Datos hemos generado ot ras dos vari ablescon desviacionest ípicas 20 y 30; la correlación entreellasdesciende, si bien no de manera dramát ica, situándose en 0,9349. Por últ imo, hemos mantenido est os compoenntes est ocást icos, pero reduciendo el incremento período a período de la t endencia, que pasa de ser 1,0 a ser ahora 0,10. El coefi ciente de corr elación entr e ambas vari ables se reduce ahora a 0,2446; la regresión entre ambas vari ables todavía muestra una pendiente signi fi cativamente diferente de cero de acuerdo con el uso habit ual del est adíst ico t, pero de manera menos evidente que antes; el coefi ciente de det erminación es iguala 0, 24462 = 0, 0598, bast ant e reducido. El gráfi co que muestra la nube de puntos, junto con la recta ajustada, ilustra la difi cultad de precisar la pendiente de la recta que mejor se ajusta a dicha nube de punt os, es decir, la di fi cult ad de est imar con precisión dicha pendiente. 8.4. Tr at ami ent o de t endencias det er mi nist as De l as dos sit uaciones descrit as en el apart ado ant erior, es algo más sencill a de t rat ar la presencia de t endencias det ermi nist as, cuando se anticipa correctamente que la presencia de las mismas es la única causa de no est acionari edad de las variables que se pret ende relacionar, es decir , cuando las vari ables t ienen est ructura,
yt = α0 + α1t + εyt xt = δ 0 + δ 1t + εxt
(8.1) (8.2)
Para ell o, hay dosposibil idades: la pri mera consiste en incorporar en el modelo de regresión una t endencia determinist a lineal como variable explicati va, 42
yt = α + γ t + β xt + ut (8.3) ˆ y su desviación típica serán, aproximadaen la que el coefi ciente estimado β mente, los mismos que habríamos est imado en l a regresión, εyt = η 0 + η 1εxt
(8.4)
Esto signi fi ca que si ambas innovaciones son independientes, en la regresión (8.3) se t endrá un coefi ciente reducido en magnit ud, y est adíst icamente no signifi cat ivo, en t érminos de su est adíst ico t de St udent. Esto es distinto del resultado que se obtiene en la estimación de la regresión habitual,
yt = α + β xt + ut
(8.5)
cuando las vari ables t ienena est ructura (8.2), (8.1), en la que se t endría un Rcuadrado muy elevado, una est imación numérica de β relat ivamente elevada, y un est adíst ico t para dicho coefi ciente, claramente por encima de2,0 en valor absolut o, sugir iendo que la capacidad de xt para explicar yt es signifi cativa, contrariamente a lo que, en realidad, ocurre. La di fi cult ad con el procedimiento quehemos sugeri do es quet odavía mantendrá un R-cuadrado muy elevado, debido a la capacidad explicat iva que el t érmino γ t tiene sobre yt , debido a la presencia de una tendencia determinista en esta últ ima vari able. est e t érmi no aparecerá como claramente signi fi cat ivo, con un est adíst ico t muy elevado. La diferenciación elimina asimismo las tendencias deterministas, como fácilmente puede comprobarse algebraicamente. De est e modo, si el precio de un det erminado act ivo t iene una t endencia t emporal det erminist a li neal, su primera diferencia est ará li bre de di cha t endencia. Un proceso con una t endencia det ermini st a cuadrát ica sigue t rayect orias con formasparabólicas, cóncavas o convexas. Su primera diferencia presentará una tendencia lineal, mientras que su segunda diferencia est ará li bre de t endencia. Un proceso con una t endencia det erminista representada por un polinomio de grado t res puede tener ciclos. La pri mera diferencia de est e proceso t endrá una t endencia cuadrática. Como ejemplo, consideremos:
yt = β 0 + β 1t + β 2t2 + εt cuya primera diferencia es: 43
∆yt
= yt
− yt−
1
= ( β 1
− β ) + 2β t + (εt − εt− ) 2
2
1
y su segunda diferencia: ∆
2
yt = ∆yt
− ∆yt−
1
= yt
− 2yt−
1
+ yt−2 = 2β 2 + (εt
− 2εt−
1
+ εt−2)
Por t ant o, aparentemente, una solución en el caso en que sospechamos que puede haber t endenciasdet erministas en las vari ables quepret endemos relacionar, consisti ría en est imar la posible relación entre ellas después de haber t omado diferencias t emporales. Sin embargo, con dicha t ransformación perdemosbast ant e información acerca de las fl uct uaciones de cort o plazo en las variables, por lo que los procedimientos anteri ormente descrit os son más recomendables. 8.5. Ejercicios de simulación
• Ejercicio 1: Simule 300 observaciones de dos ruidos blancos independientes, con dist ribuciones N (µx, σ 2x ), N (µy , σ 2y ), como observaciones muestrales para las innovaciones εxt , εyt . A continuación, genere observaciones para una t endencia determinista t. Los valores numéri cos para las vari ables x e y se obtienen añadiendo l a t endencia t, multiplicada por sendas constantes a, b, a las respect ivas innovaciones, para reproducir las est ruct uras (8.2) , (8.1). El ejercicio consiste en comparar el coefi ciente de correlación que se obtiene para εxt , εyt , que será muy reducido, con el que se obt iene entr e xt e yt , que debería ser simil ar, pero será, sin embargo, muy elevado. En segundo lugar, deben est imarse regresiones análogas a (8.4) , (8.5) , (8.3) . 8.6. Tendencias est ocást i cas y r aíces uni t ari as De modo análogo, un proceso puede t ener asimi smo vari as raíces unit arias. Los t ipos de int erés ya son rentabilidades, por lo que t ienen, generalmente, un orden de no est acionari edad (es decir, un número de t endencias) menos que las series de índices bursát il es o de precios de deri vados, por ejemplo. En ocasiones, sin embargo, algunas series de precios son no est acionarias de orden 2 (t ienen 2 raíces unit ari as), por lo queincluso las rentabilidades pueden ser no est acionari as, presentando una raíz unitaria.
44
8.7. Contrastes de raíz unitaria Si utilizamos la t eoría de la cointegración, comenzaríamos llevando a cabo contrastes de raiz unitaria para ambas variables, que detectarían en un 95% de las simulaciones que ambas variables son I (1). 8.8. Coint egración Un vector z de variables de naturaleza I (1) se dicen cointegradas si existe una combinaciónn li neal de las mismas, defi nida por un vector α tal que α z es una variable aleatoria I (0), es decir, estacionaria. Más generalmente, se dice que un vector z de variables cuyo máximo orden de integración es q est án cointegradas si existe una combinación lineal de las mismas, defi nida por un vector α tal que α z es una variable aleatoria I ( p), con p < q. El vector α se denomina vector de cointegración. 0
0
8.8.1. Contraste de cointegración Si part imosde vari ables yt , xt denaturaleza I (1), sus primerasdiferencias, ∆yt, ∆xt son est acionarias. Cont rast aríamos entonces la coint egración de yt , xt est imando una regresión,
yt = β 0 + β 1xt + vt , t = 1 , 2,...,T
(8.6)
y contrastando la estacionariedad de los residuos, como propusieron Engle y Granger (1987). Sin embargo, los niveles crít icos para el contr ast e de est a hipótesis no son los mismos que para el contrast e de raíces unit ari as en una variable, pues ahora, el contrast e se lleva a cabo después de haber est imado el modelo de regresión (8.6). Est o no es ir relevante: el procedimi ento de mínimos cuadrados busca los valores del espacio paramét rico ( β 0 y β 1 en la regresión ant erior) que minimizan la vari anza del residuo result ante, y ést e t iene una vari anza in fi nita para los valores de β 1 que no hacen que las vari ables est én cointegradas. Por t anto, si yt , xt est án cointegradas, el mét odo de M CO t enderá a seleccionar el valor de β 1 que genera residuos est acionarios, es decir, la const ant e de cointegración. Aunque est o es lo que pret endemos, ell o signi fi ca que hay una ciert a t endencia a concluir con más frecuencia de la que debiéramos que l as variables est án cointegradas. en consecuencia, los valores crít icos para el contrast e de raíz unit ari a de los residuos de (8.6) deben ser más elevados en valor absolut o que los uti li zados para el contrast e de raíz unit aria habit ual. 45
Si los residuos de est a regresión result an ser est acionarios, decimos que las variables yt, xt están cointegradas, siendo (8.6) la relación de cointegración entre ambas. Est a relación sería el producto α z anteri or después de normalizar una de las coordenadas del vector α lo cual, evidentemente, siempre es posibl e. Se int erpret a como la r elación de largo plazo entr e ell as, alr ededor de la cual experimentan desviaciones a cort o pl azo que revierten post eriormente. Es decir, si en un determinado período, yt est á por encima del valor numérico de β 0 + β 1xt para ese mismo período, generalmente yt crecerá por encima de β 0 + β 1∆xt , de manera que yt+ 1 t enderá a acercarse a β 0 + β 1xt+ 1. En el caso de dos vari ables yt , xt , decimos que β 1 es la const ante de coint egración entre ambas. En el análisis de simulación ant erior, en el que generamos ambas series t emporales a part ir de procesos independientes, est e contrast e nos sugerir á en una mayoría de simulaciones que yt , xt no est án cointegradas, lo que aparecerá en la forma de residuos de nat uraleza I (1) en (8.6). En tal caso, habríamos de est imar un modelo en diferencias de ambas vari ables, 0
∆yt
= β 0 + β 1∆xt + vt , t = 1 , 2,...,T
quearrojará un coefi ciente β 1 no signifi cat ivo y un coefi cientededeterminación muy reducido. Al contr ast ar coint egración, est amos t ratando de det ectar la posible existencia de relaciones de largo plazo entre las variables del modelo. En ese sentido, la nat uraleza del cont rast e sugiere el uso de una dat os no necesariamente frecuentes, y una muestra temporal sufi cientemente amplia. De lo contr ari o, predominará en la muestra, en términos relativos, la información acerca de las fl uctuaciones de corto plazo en las variables, frente a la de su evolución tendencial, que es lo que t rat amos de det ect ar. Por t anto, una elección inapropiada de la muest ra, ya sea por una frecuencia alt a de observación de los dat os, o por el uso de un período muest ral no muy ampli o, sesgará el result ado del cont rast e hacia la no det ección de relaciones de cointegración. Efect uar un análi sis de cointegración signi fi ca relacionar los nivelesde variables como ofert a monet ari a y precios, y no sus t asas de vari ación. Por el contr ari o, basar la caract eri zación de la r elación entr e vari ables como las cit adas util izando coefi cientes de corr elación est ándar es deli cado, pues puede conducir a la det ección de regresiones espúreas. El concept o de cointegración generaliza el concept o de correlación en la dirección adecuada. La exist encia de una t endencia est ocást ica común generaría una relación sost enible a largo plazo entr e ambas vari ables, lo que hará que sus diferenciales reviert an a t ravés del t iempo, es decir , que sean mean46
reverting. No t iene sentido analizar las relaciones entre los niveles de variables I (1) si no est án coint egradas. 8.8.2. C ont r ast e de hip ótesis sobre la relación de coint egración est im ada por mínimos cuadrados Al est imar la relación anteri or por mínimos cuadrados hay que t ener en cuenta que las propiedades de dicho est imador son válidas únicamente en el caso de variables est acionarias. Cuando las variables est án coint egradas, el uso de mínimos cuadrados en la est imación de la regresión est a j ust i fi cado est adíst icamente, pero la dist ri bución de probabili dad del est imador MCO no es la habit ual. Por t anto, aunque el programa de est imación que utilicemos nos proporcionará las desviaciones t ípicas est imadas y los ratios t ipo-t de cada coefi ciente, est osno son válidos en est e caso, y no deben ut il izarse, por ejemplo, para contrast ar hipótesis sobre los coefi cientes de la relación de coint egración. Hay muchos casos, sin embargo, en que el modelo t eórico sugiere que las variables yt, xt deben est ar relacionadas con un det erminado valor numérico del coefi ciente, por ejemplo, β 0 = 1, por lo que el invest igador est ará interesado en contrast ar dicha hipótesis. Est o puede hacerse por un procedimiento indirecto, sust it uyendo el valor t eóri co de β , β = β 0en la relación entre ambas variables. Ell o signifi ca que const ruimos la variable auxili ar wt = yt β 0xt , y cont rast amos la est acionariedad de est a variable. Cuando se procede de est e modo, es improt ante repet ir el contrast e para valores de β 0 en un entorno de β 0, con el obj et o de anali zar la precisión con que hemos identi fi cado la const ante de coint egración.
−
8.8.3. Correlación y cointegración Sin embargo, corr elación y cointegración no son sinónimos. El problema de correlación espúrea surge entre vari ables no est acionarias, con independencia de que est én o no cointegradas, luego puede haber alt a correlación (de hecho, muy elevada) sin cointegración. Alt ernativamente, el hecho de que exist a una r elación de largo plazo entr e vari ables no est acionari as no impide que ést as experi menten desviaciones respect o de la misma que, si son de apreciable magnit ud, reducirán la correlación exist ente entre dichas vari ables. Un ejemplo sería la evolución t emporal de la cot ización de un valor en Bolsa, anali zada conjuntamente con un índice que lo incluya, ya sea el índice de mercado, un índice de los valores más capitalizados, o un índice sectorial; dado que todo índice es un promedio ponderado 47
de las cot izaciones de los valores en él incluidos, cabría esperar que ambas series t emporales est uvieran correlacionadas. Sin embargo, las fl uctuaciones que ambos experimentan a cort o pl azo pueden ser su fi cientes para que su coefi ciente de correlación sea reducido. 8.8.4. Var i abl es coint egradas: un ej emp lo Un ejemplo típico de variables posiblemente correlacionadas pero habitualmente no cointegradas l o const it uye algunos t ipos de cambio. A part ir de dos variables no est acionarias, pero cointegradas, es sencil lo const ruir dos variabls no cointegradas, sin más que añadir en cada período a una de ellas, un incremento no correlacionado t emporalmente. Si la varianza de est e componente no es muy grande, mantendremos una correlación análoga a la inicial, que podía ser elevada; sin embargo, por const rucción, las dos variables no est án cointegradas. Ejemplo de variables cointegradas es,
xt = αx + β x wt + εxt yt = αy + β y wt + εyt wt = wt−1 + εt donde z t es la tendencia común a xt e yt , siendo εxt , εyt variables aleatorias N (0, σ 2x ), N (0, σ2y ), sin aut ocorrelación. Las variables xt e yt est án cointegradas, puest o que µ ¶ µ ¶ β y β y yt β y /β x xt = αy αx + εyt εx β x β x t ¡ ¢ que es una vari able est acionari a. El vect or 1, β y /β x se denomina vect or de cointegración, y la combinación lineal ξ t = yt β y /β x xt , que es est acionari a, es la cuantía en la que se incumple la r elación de equil ibrio a largo plazo en el período t. Cuando el vector z t const a de n variables, con n > 2, pueden exist ir vari as relaciones de cointegración. Est o es lo quesucede, por ejempo, al considerar un vect or de t ipos de int erés a dist int o vencimiento, dentr o de un mismo mercado, ya sea el mercado secundario de deuda pública, un mercado de swap en una det erminada divisa, et c.. En est e caso, el procedimiento de Engle-Granger para est imar vect ores de coint egración es problemát ico, pues est imaremos una combinación lineal
−
−
−
−
48
−
de las posibles relaciones de coint egración exist entes entr e las vari ables que componen el vect or. De hecho, la est imación result ante dependerá de la normalización de coefi cientes utilizada en (8.6), a diferencia de lo que ocurre en el caso de dos variables. 8.8.5. El modelo de corrección de error Teorema de representación de Engle y Granger Este teorema afi rma que si dos variables yt , xt de nat uraleza I (1),est án coint egradas, sus relaciones dinámicas est án caract erizadaspor el modelo de corrección de error ,
∆yt
∆xt
= αy + = αx +
Xm i= 1 X p i= 1
y δ 1i ∆xt−i
+
δ x1i ∆xt−i +
Xn i= 1 Xq i= 1
y
δ 2i ∆yt−i + γ y ξ t−1 + εyt
(8.7)
δ x2i ∆yt−i + γ x ξ t−1 + εxt
donde ξ t−1 denot a la desviación del período ant erior respecto de la relación de equilibrio a largo plazo ξ t−1 = yt−1 β xt−1, siendo β el coefi ciente de cointegración entre yt y xt , y ∆ es el operador de primeras diferencias. En el modelo de corrección de error t odas las variables son est acionarias, I (0), por lo que las propiedades habit uales del est imador MCO en dicho context o, son válidas. Los términos γ y ξ t−1 y γ x ξ t−1 se denominan términos de corrección de error , y han de aparecer en las ecuaciones anteri ores con un det erminado signo, que depende del modo en que se haya defi nido el desequilibrio ξ t−1. Con nuestra defi nición, ha de t enerse γ y < 0, γ x > 0; un valor negativo de γ y indicará que períodos en que yt es alto, es decir, superior a β xt , tenderán a venir seguidos de crecimientos relativamente reducidos de dicha variable. Un valor positivo de γ x indica que siguiendo a períodos en que yt es alto, xt t enderá a experimentar un crecimiento mayor; la conjunción de ambos efectos hace que yt+ 1 tienda a aproximarse a β xt+ 1 . Lo dual ocurrirá tras períodos en que yt haya sido bajo, es decir, inferior a β xt. Si hubiéramos normalizado la relación de cointegración de otr o modo, habráimos defi nido el t érmino de desequil ibrio como ξ t−1 = β yt−1 xt−1, y los signos de los coefi cientes γ y , γ x en (8.7) deberían ser entonces los contrari os a los antes descri t os. Es fácil ver, sin embargo, que est o no es preciso: la aproximación entre ambas variables puede conseguirse asimismo si ambas aumentan o disminuyen simult áneamente, pero xt experi menta la mayor vari ación. Por t anto, si ambos
−
−
49
coefi cientes t ienen igual signo, γ x debe ser signi fi cat ivamente mayor que γ y en valor absolut o. De hecho, podría ocurrir t ambién que sólo unos de los dos coefi cientes result e estadíst icamente signifi cativo, lo que podría interpretarse en el sent ido de que la vari able asociada soport a t odo el peso del ajust e hacia la relación de equil ibrio a largo plazo. La coint egración entr e vari ables no ll eva añadida ninguna int erpret ación concret a en t érminos de causalidad entre dichas variables. De hecho, como la relación de cointegracion puede normali zarse de disti ntas maneras, puede presentarse una apariencia de causalidad en cualquiera de las dos direcciones. El modelo de corrección de error muest ra que, en presencia de coint egración, exist e import ante causalidad entre ambas variables, en principi o, con caráct er bidi reccional. Sólo si algunos de los coefi cientes del modelo MCE result an ser est adísticamente no signi fi cati vos, podría hablarse de causalidad unidireccional. Si dos variables est án coint egradas, al menos una de ellas causa a la otra; sin embargo, ell o podría también refl ejar el efect o común de una t ercera variable, no considerada en el modelo. Por ejemplo, al t rabajar con dat os de precios de contado y del fut uro sobre un det erminado act ivo fi nanciero, es habit ual hallar un mayor número de retardos del precio del fut uro en l a ecuación del contado, que viceversa, lo que sugiere que los mercados de derivados (en est e caso, de fut uros), incorporan la nueva información más r ápidamente que los mercados de cont ado, por lo que los últ imos parecen responder a fl uct uaciones en l os pri meros. En est e t ipo de ejemplos, en ocasiones el t érmino de corrección de err or result a no signi fi cat ivo en la ecuación de precios del mercado de contado. Cuando el vect or z t incorpora más dedosvari ables, y existe másdeuna relación de cointegración entre ellas, el modelo de corrección de err or adopt a una expresión similar a la antes propuest a. La diferencia est riba en que aparecen ret ardos de t odas l as variables, en diferencias, en t odas las ecuaciones, y aparecen t antos t érminos de corrección de error como relaciones de cointegración en cada una de las ecuaciones. Dichos términos serán los valores ret ardados de di chas relaciones de cointegración; la normalización esocgida afect a únicamente a la interpretación de los valores numéri cos est imados. La búsqueda de vari ables coint egradas abundan en la li t eratura fi nanciera, donde trata de caracterizarse las posibles relaciones de equilibrio a largo plazo entre precios de act ivos. Así, se han analizado las posibl es r elaciones de cointegración ent re t ipos de cambio, ent re t ipos de interés dent ro de una misma est ruct ura t emporal, entr e mercados de contado y fut uro, entr e commodit ies, valoración 50
de divisas. También se ha ut il izado est e t ipo de análi sis para discutir el grado de integración entre mercados de valores o de deuda, si bien parece exist ir más evidencia favorable en el pri mer t ipo de mercados. Est e análisis t iene asimismo impli caciones para la gest ión fi nanciera: en pri ncipio, debería ser posible encont rar una cest a reducida de valores cointegrada con el índice, lo que podría util izarse en la gest ión pasiva de cart eras. Lo mismo debería ocurri r con un pequeño conjunto de índices sectori ales, et c.. 8.8.6. El contraste de cointegración de Johansen Si consideramos un vector autoregresivo V AR( p),
yt = A1yt−1 + A2yt−2 + ... + A p yt− p + Bx t + ²t donde yt es un vector de variables no est acionarias, I (1), xt es un vect or de variables deterministas, y ²t es unvector de innovaciones. El V AR( p) puede escribirse, ∆yt
= Πyt−1 +
p X−1 i= 1
Γi ∆yt−i
+ Bx t + ²t
con Π
=
X p i= 1
Ai
− I, Γi =
X p
A j
j = i+ 1
8.8.7. A spect os comunes a var ias vari ables t emp orales: t endencias comunes, volat il idad común. 8.8.8. ¿Qué hacer en pr esencia de var iabl es con t endencias est ocást icas (r aíces unit ar ias)? De acuerdo con l a discusión que hemos llevado a cabo en l as secciones ant eriores, el procedimiento a seguir en caso de presencia de raíces unit arias en l as variables de una r egresión li neal simple es claro. Si t anto xt como yt son variables I (1), es decir, t ienen una raíz unit aria, entonces el t rat amiento que hemos de apli car depende de si est án o no cointegradas. Si lo est án, hemos de especi fi car est imar un modelo de corrección de error . Si no est án coint egradas, hemos de est imar un
51
modelo en diferencias. En el ejercicio de simulación descrit o, la est imación de la relación en primeras diferencias, ∆yt
= β 0 + β 1∆xt + vt , t = 1 , 2,...,T
arrojará un coefi ciente β 1 no signi fi cativo y un coefi ciente de determinación muy reducido en la mayoría de las simulaciones. Esto signi fi ca, entre ot ras cosas, que la recomendación de t rat ar la no est acionariedad diferenciando las variables, no es correcta. Tal sugerencia es válida cuando, exist iendo raíces uniatri as en ambas variables, no est án cointegradas. Cuando est án cointegradas, el modelo que se est ima relaciona las variables en diferencias, pero incorpora asimi smo un t érmino de corr ección de error. Aún así, subsist en algunos matices:
• Modelo uniecuacional: como hemos comentado ant eriormente, la cointegración entre vari ables no dice nada acerca de la posible relación de causali dad entre ambas. De hecho, de acuerdo con el t eorema de representación de Engle y Granger, el modelo de relación entr e ambas vari ables es un modelo de corrección de error, que es un modelo de dos ecuaciones, una para yt en diferencias, y otra para xt en diferencias. En ambas aparece el término de corrección de error retardado como una de las variables explicat ivas, debiendo esperar que t ome signo opuest o en cada una de l as dos ecuaciones, según como se haya defi nido dicho término, por las razones antes expuest as. Además de dicho t érmino, aparecerán posiblemente algunos ret ardos de las diferencias, tanto de xt como de yt . Sin embargo, es práct ica habit ual utilizar t al representación para especi fi car un modelo de regresión con una única ecuación, como proponen Engle y Granger (19xx). Al act uar así, hemos de int erpret ar que estamos est imando por separado t an sólo una de las ecuaciones del modelo de corr ección de error, lo cual puede hacernos perder efi ciencia en l a est imación, salvo si: a) las innovaciones en l as dos ecuaciones est án incorrelacionadas, o b) las dos ecuaciones t uvieran exactamente las mismas vari ables expli cat ivas.
• ¿Qué di ferencias? Ya sabemos que, en caso de cointegración, el modelo a est iamr es una relación entre las vari ables xt e yt en diferencias. En muchos casos, el invest igador dispone de observaciones mensuales o t ri mest rales de variables como el consumo agregado, el PIB de un país, la inversión, un 52
agregado monet ari o, et c. Est as variables t ienen, generalmente, una raíz unit aria, por lo que, en caso de querer relacionar dos de ell as, y en presencia de coint egración, deberíamos est imar un modelo de corrección de err or. Sin embargo, no sólo la primera diferencia, es decir, la variación entre meses o t rimest res sucesivos, yt yt−1, sino la diferencia anual, yt yt−4 en el caso de dat os t ri mest rales, o yt yt−12 en el caso de datos anuales, t ambién son variables I (0), es decir, est acionari as. Por t anto, el modelo de corrección de error puede especi fi carse en unas u ot ras diferencias, siempre queseamos consistent es en t rat ar tanto xt como yt de igual manera. Y, sin embargo, las propiedades est adíst icas de unas u ot ras diferencias son bien diferentes; por ejemplo, su volatil idad es muy dist int a. Además, es perfectamente concebibl e que la variación anual (es decir, la t asa interanual) de in fl ación est é correlacionada con la t asa internual de crecimiento monetario, a la vez que las tasas de variación intermensuales (es decir , mes a mes) de ambas vari ables, no muest ren una relación signi fi cativa. Por consiguiente, no sería l o mismo est imar un modelo de relación,
−
∆12yt
≡ yt − yt−
12
−
−
= β 0 + β 1 (xt
12)
− xt−
+ γ (yt−1
− δ − δ xt− ) + ut 0
1
1
que un modelo, ∆yt
≡ yt − yt−
1
= β 0 + β 1 (xt
− xt− ) + γ (yt− − δ − δ xt− ) + ut 1
1
0
1
1
de l os que no cabe esperar result ados comparables. Tampoco debe pensarse que es ést a una cuest ión est adíst ica. Por el contrario, es el propio invest igador quien debe decidir si piensa que la relación entre las variables se debe a l as fl uct uaciones que experimentan en períodos breves de t iempo, como un mes, o en períodos más ampli os, como un año.
53
9. M at r ices d e covar ianzas n o escalar es 9.1. Detección de la autocorrelación 9.2. Tratamiento de la autocorrelación. 9.3. El estimador de mínimos cuadrados generalizados 9.4. D et ecci ón d e la het er oscedast ici dad 9.5. Contraste de igualdad de varianza entre submuestras 9.6. Tratamiento de la heteroscedasticidad
10. El modelo de regresión lineal múltiple Aunque hast a ahora hemos considerado únicamente modelos con una sola vari able explicat iva, no hay ninguna razón para rest ri ngir se a t al sit uación. Además, en l a mayoría de la sit uaciones, el invest igador creerá que hay más de una vari able que condiciona la evolución del fenómeno que pretende caract erizar. Por ejemplo, es razonable creer que en l a det erminación de los t ipos de int erés juega un papel la t asa decrecimient o monet ari o, pero t ambién la t asa deinfl ación (o lasexpect at ivas de infl ación fut ura), e incluso el nivel de endeudamiento. Sin embargo, el análi sis que hast a ahora hemos presentado es de suma import ancia, pues la mayoría de las cuest iones se ext ienden sin mucha di fi cult ad al caso en quehay vari as variables explicat ivas en el modelo. Hay dos di fi cult ades básicas a que nos enfrentamos al est imar un modelo de regresión múlt iple: una es la int erpret ación de los efect os de una de las vari ables expli cat ivas separadamente de las demás. Por ot ro l ado, la posibili dad de que la vari able endógena se det ermine simult áneamente con algunae las vari ables expli cat ivas es indudablemente mayor cuantasmás variables explicat ivas se incluyen en el modelo; est o sería import ant e, pues los procedimientos de est imación que hast a ahora hemos examinado no t endrían las propiedades que hemos descrit o. Cuando hay det erminación simult ánea de alguna vari able expli cat iva con la vari able dependiente del modelo de regresión uniecuacional, el est imador de mínimos cuadrados es no sólo sesgado, sino inconsist ente, y est o aplica a los coefi cientes de t odas las vari ables explicat ivas, no sólo aquell a que plantea al problema de det erminación simult ánea. La razón por la que trabajamos en muchas ocasiones con modelos de regresión múlt iple es sencil lamente, porque hay más de una variable con capacidad explicativa signi fi cat iva sobre la evolución de la variable endógena, yt . Si, en tal 54
sit uación, sólo explicit amos una de ell as como variables expliactivas, las rest antes est arán incluidas en el t érmino de err or, con lo que ést e recogerá, además de ot ros componentes, la evolución de las variables explicat ivas omit idas del modelo de regresión. Con ello, su fl uctuación será importante, por lo que tendrá una varianza notable. La única manera de reducir dicha vari anza del t érmino de error es haciendo explícit as t odas las vari ables pot encialmente expli cat ivas. El invest igador nunca t iene convencimiento acerca de la capacidad explicat iva de un det emri nado conjunto de variables. Lo que debe hacer es est imar el modelo con ellas, y proceder a contrast ar la signi fi cación de cada una de ellas por separado, del modo que describimos en est e capít ulo. En est e proceso incide negativamente la di fi cultad en estimar por separado el efecto de cada una de las vari ables expli cat ivas sobre la vari able endógena, por lo que no puede sorprender que dediquemos a este asunt o una buena part e del capítulo. Si, queriendo caract erizar la det erminación de t ipos de interés, est imamos el modelo,
rt = β 0 + β 1mt + β 2π t + ut
(10.1)
en el que aparecen el crecimiento monetario y la tasa de in fl ación como variables explicat ivas. El coefi ciente β 1 mide el efect o sobre los t ipos de int erés de un incremento (o disminución) unitario en la tasa de expansión monetaria, dada una determi nada tasa de in fl ación, es decir, manteniendo la tasa de infl ación constante. Aunque indudablemente est a es una evaluación int eresante, el hecho de que sólo sea válida en ausencia de variaciones en la tasa de in fl ación limita algo su uso. En t odo caso, es claro que junto con est e t ipo de est imaciones, nos int eresaría di sponer asimi smo de una est imación del efecto que t endría dicha variación en el crecimeint o monet ari o t eniendo en cuanta asimismo el impacto que dicha vari ación puede t ener sobre la t asa de in fl ación. Podría pensarse que si lo que se pret ende es est imar el impact o que sobre los t ipos de interés t iene una variación unit aria en la t asa de crecimient o monet ario, podemos est imar el modelo de regresión lineal simple,
rt = β 0 + β 1mt + vt
(10.2)
Ahora bien, si el verdadero modelo es (10.1), entonces en el modelo (10.2), la tasa de infl ación forma part e del t érmino de error. De hecho, t endríamos la relación entr e los t érminos de err or de ambas ecuaciones,
vt = β 2π t + ut 55
Como consecuencia, en la medida en que crecimiento monet ario e in fl ación no son independientes, la variable explicat iva mt y el t érmino de error vt en el modelo (10.2) est arían correlacionados,
Corr(mt , vt) = β 2Corr(mt, π t ) + Corr(mt , ut ) = β 2Corr (mt , π t) 6 =0 po lo que el est imador de mínimos cuadrados de (10.2) no t endría las propiedades que para él probamos en la sección XX. En part icular, sería inconsist ente. En general, un modelo de regresión múltiple incorpora un número k de vari ables explicati vas, ya sea con dat os t emporales,
yt = β 0 + β 1x1t + β 2x2t + ... + β k xkt + ut, t = 1, 2,...,T
(10.3)
o con datos de sección cruzada,
yi = β 0 + β 1x1i + β 2x2i + ... + β k xki + ui , i = 1, 2,...,N Es útil que consideremos inicialmente un modelo más simple,
yt = β 0 + β 1x1t + β 2x2t + β 3x3t + ut
(10.4)
que, al i gual quehicimos en el modelo de regresión simple, podemos interpret ar en diferencias t emporlaes. Para ell o, escribimos el modelo en dos inst ant es de t iempo sucesivos,
yt−1 = β 0 + β 1x1t−1 + β 2x2t−1 + β 3x3t−1 + ut−1 y rest ando, con lo que t enemos, ∆yt
= β 1∆x1t + β 2∆x2t + β 3∆x3t + ∆ut
que nos muest ra que la fouct uaciçon t emporal en yt puede explicarse a part ir de las vari aciones t emporales en x1t , x2t , x3t . Por t ant o, una vez más, el modelo es int erpr et ado en términos de variaciones, a pesar de est imarsecon dat os originales, en niveles de las vari ables. Una vez que hayamos est imado el modelo, y disponiendo de dat os de las vari ables incluidas en el msmo, podremos calcular los dos miembros de la igualdad, ∆yt
ˆ ∆x1t + β ˆ ∆x2t + β ˆ ∆x3t = β 1 2 3 56
que, en realidad, no coincidir án.La diferencia entre la vari ación en yt y la variación quepara dicha variable se habría previst o en función de los cambios que ˆ 1∆x1t + β ˆ 2∆x2t + β ˆ 3∆x3t , se debe, han experimentado las vari ables explicat ivas, β por supuest o, a la existencia del err or o residuo, que con fi amos que, en media, no será muy grande. En t odo caso, la diferencia entr e los dos miembros de la igualdad anterior será ∆u ˆt . ˆ ∆x1t mide el efect o que sobre yt habría tenido la variación en El término β 1 x1t si las otras dos variables explicat ivas no hubiesen cambiado. Sin embargo, est e es un supuest o fi ct icio, pues las t res vari ables habrán vist o alt erado su valor numérico. A pesar de ell o, el ejercicio ceteris paribus puede t ener interés en el diseño de polít ica económica. Por ejemplo, retomando el modelo (10.1), el coefi ciente ˆ 2 nos daría el efect o que sobre los t ipos de int erés t endrá una variación est imado β unitaria (positiva o negativa) en la tasa de in fl ación, si mant enemos inalt erada la t asa de crecimiento moenat ri o. Como ést a es una vari able de contr ol de la autoridad moneria en la puest a en práct ica del a polít ica monet aria, el ejercicio que acabamos dedescribir es razonable. Incluso, una vez realizado, la propia aut oridad monet aria podría pregunt arse por el impact o que sobre lost ipos de interés t endría un increment o de un punt o en la t asa de in fl ación (que t enderá a elevar los t ipos de interés), parcialmente compensada con una mayor restricción monetaria (que t enderá a reducir los t ipos de interés), por ejemplo, recort ando en dos punt os el crecimiento monet ario. Dicho impact o sobre los tipos de interés, sería, ∆rt = ˆ + β ˆ donde, una vez más, hay que apunt ar que, muy probablemente, β ˆ tomará 2β 1 2 1 un valor negativo. Si, por ejemplo, la ecuación estimada es,
rt = 4, 25
− 0, 42mt + 0, 96πt + uˆt
(10.5)
entonces la elevación de un punt o en la t asa dein fl ación t endería a incrementar los t ipos de int erés en 0,96. Si se reduce en dos puntos el crecimi ento monet ario ˆ 1 + β ˆ 2 = 0, 84 + 0, 96 = 0, 12. el efect o combinado será mucho menor, ∆rt = 2β El modelo lineal de regresión especi fi ca una relación del tipo,
−
yt = β 0 + β 1x1t + β 2x2t + ... + β k xkt + ut , t = 1, 2,...,T en la que se uti lizan k vari ables para t ratar de expli car el comport amiento de la variable yt . Est a últ ima se conoce como variable dependiente, mient ras que las variables que aparecen en el miembro derecho del modelo se denominan variables 57
explicativas. El término ut se conoce como la perturbación o término de error del modelo, y es una vari able aleat ori a. También yt se considera que es una vari able aleat ori a. La vari able ut es el componente de yt que el modelo no puede explicar. Seentiendequela li st a devari ables explicat ivas recoge t odas lasvari ables que pueden est ar relacionadas con yt , de modo que ut es el componente que el invest igador reconoce no poder explicar. En un modelo de regresión interesa que est e t érmi no sea l o más pequeño posibl e. La expresión anterior refl eja el supuest o de que disponemos de observaciones de seri es t emporales para cada una de las vari ables del modelo. Los dat os de seri es t emporales recogen información acerca de una det ermi nada unidad económica (un país, un mercado fi nanciero, et c...) en dist int os inst antes de ti empo, refl ejando así la evolución t emporal de un conjunt o de vari ables relativas a dicha unidad económica. Un ejemplo sería un modelo que pret ende explicar la i n fl ación mensual en la zona euro util izando como vari ables explicat ivas la t asa de crecimiento de la M 3, las vari aciones en el precio del barr il de pet róleo, et c.. Otros ejemplos serían: a) t ratar de explicar la evolución t emporal de las rentabilidades diarias ofrecidas por una cest a IBEX35 util izando l as r entabilidades ofrecidas por una cesta S&P500, b) explicar la evolución de la volatilidad del IBEX35 a partir de la volati lidad del Futuro sobre el IBEX35, c) t ratar de explicar la volati lidad implícit a en una opción put sobre Telefónica a part ir dela volati lidad en la cot ización de dicha acción, et c... En ot ras ocasiones, los dat os disponibles no son de dicho t ipo, sino de sección cruzada, es decir, recogen información acerca de di st intas unidades est adíst icas, en un mismo inst ant e de t iempo,
yi = β 0 + β 1x1i + β 2x2i + ... + β k xki + ui , i = 1, 2,...,N aunque ambos modelos se t ratan de igual modo. Est imar el modelo consiste en asignar valores numéricos a los coefi cient es β 0, β 1 , β 2 ,..., β k. Una vez que se dispone de dichos valores numéricos, puede calcularse el residuo del modelo, mediante la expresión,
u ˆt = yt
− β ˆ + β ˆ x t + β ˆ x t + ... + β ˆ k xkt 0
1 1
2 2
t = 1, 2,...,T
que t iene la misma nat uraleza que los dat os util izados, es decir , será bien una serie t emporal o una sección cruzada de dat os. Un buen aj ust e consiste en que los residuos sean l o menor posibl es, si bi en no es evidente cómo medir el t amaño de una variable aleat oria de est e t ipo. 58
10.1. Est im ación por míni mos cuadrados Los dat os disponibles pueden organizarse en la forma de una mat ri z X , de dimesnción Txk o Nxkpara las variables explicativas, y de un vector y, de dimensión Tx1 o Nx1 para la variable dependiente. Asimismo, podemos considerar el vect or u, de dimensión Tx1 o Nx1, que contiene las T (o N ) variables aleatorias correspondientes a l a pert urbación corr espondiente a cada observación muest ral. Con ellas, el modelo de regresión lineal puede escribirse,
y = XB + u El estimador de mínimoscuadrados ordinari osseobtienemediante la expresión matricial,
ˆ = (X X )−1X y β 0
0
que, como puede comprobarse, es un vector columna de dimensión kx1. Es, por t ant o, una t ransformación lineal de la variable dependiente y. En ese sentido, se dice que el est imador MCO es un est imador lineal. Est e est imador proporciona un buen ajust e a los dat os, en el sentido de que los residuos que genera proporcionan la menor suma de cuadrados posible. Es conveniente uti lizar crit erios como el de la suma de los cuadrados de los residuos porque est os pueden ser posit ivos o negat ivos, de modo que su suma di recta no debe utilizarse como crit erio de bondad de ajust e. En el caso de un modelo de regresión lineal simple,
yt = β 0 + β 1xt + ut , t = 1, 2,...,T est e est imador se conviert e en,
ˆ = β 1
Cov (xt , yt ) DT (yt ) ˆ , β 0 = y¯ = ρxy V ar(xt ) DT (xt )
− β ˆ x¯ 1
por lo que el coefi ciente de corr elación entr e xt e yt est á muy relacionado con la est imación de mínimos cuadrados de la pendiente de la rect a de regresión. Sin embargo, como puede verse, dicho coefi ciente de correlación debe corregirse por la volatil idad relativa de vari able dependiente e independiente. La pendiente del modelo mide el efect o que una det erminada variación en xt t iene sobre yt . Si, por ejemplo, la correlación fuese perfecta (supngamos que de signo posit ivo), pero la vari able dependiente fuese el doble de volát il que la vari able expli cat iva, el coefi ciente de corr elación sería 1, pero el coefi ciente del model. 59
11. Propiedades del estimador de mínimos cuadrados. Generalmente, estamos muy interesados en contrat ar hipótesis de disti nto t ipo: a) si una vari able explicat iva contiene información signi fi cat iva acerca de la vari able dependiente, b) si el coefi ciente de imapact o de una det erminada variable es igual a 1, c) si dos vari ables explicat ivas t ienen el mismo coefi ciente, etc... Sin embargo, aunque los coefi cientes del modelo de regresión son const antes, si bien desconocidas, sus est imaciones, por cualquier procedimiento que podamos util izar, son aleat ori as, pues son función de la muest ra que ut il icemos, que es aleat ori a. Si el modelo que est amos est imando es corr ect o, como hemos de suponer, la pert urbación aleat ori a del mismo, ut, otr oga nat uraleza asimismo aleat ori a a la vari able dependiente, yt. Est o signifi ca que si cambiamos por ejemplo el período muest ral que ut il izamos en la est imación, la reali zación de dicha pert urbación, es decir, sus valores numéricos, serán diferentes, con lo que las observaciones de yt también los erán, y la estimación de los parámetros diferirá de la obt enida con ot ro período muest ral. Asimismo, si cambiamos la frecuencia de observación de los dat os, de diaria a mensual, por ejemplo t omando el últ imo dat o de cada mes, la muest ra cambia, y con ella, las est imaciones de los coefi cientes de las variables explicat ivas en el modelo. Siendo variables aleat orias, nos interesa que los est imadores t engan ciert as propiedades deseables, lo cual dependerá del procedimiento de est imación ut ili zado, y de lasc aract eríst icas del modelo que est amos est imando. Las principales propiedades en que podemos est ar interesados son: insesgo, efi ciencia y consistencia. El insesgo consiste en que la esperanza mat emát ica del est imador coincida con el verdadero valor numérico del coefi ciente que est amos est imando. Un est imador efi ciente es un est imador de mínima vari anza. El procedimiento demínimos cuadrados proporciona el est imador lineal de mínima varianza, si bien pueden existir ot ros est imadores no lineales de varianza t odavía menor. Un est imador es consistente si, al aumentar el tamaño muestral, converge en probabilidad al verdadero valor del parámet ro desconocido que se est á est imando. Se dice entonces que su límit e en probabilidad es dicho parámet ro. Bien podría ocurrir que el est imador fuese sesgado en muest ra pequeñas, pero si es consist ent e, dicho sesgo irá reduciéndose si ampliamos el t amaño muest ral. El est imador de mínimos cuadrados no es siempre consist ente. El est imador de máxima verosimil it ud lo es, pero siempre que la hipót esis acerca de la dist ribución de probabil idad en que se basa, sea correcta, sobre l o que no se puede t ener
60
seguridad. Por const rucción, el est imador MCO proporciona aquél conjunto de valores numéricos para los coefi cientes del modelo de regresión que generan unos residuos cuya suma de cuadrados es menor. Como est e es el cri t eri o seguido para calcular el est imador de mínimos cuadrados, t al propiedad es incuest ionable, y caract eri za a dicho estimador.
• Propiedad 1: No puede hall arse ot ro conjunt o de valores numéri cos para los coefi cientes del modelo que generen unos residuos con una suma de cuadrados inferi or a la obtenida a part ir del est imador MCO. Además de est a propiedad el est imador posee otr as caract erísticas, que examinamos a continuación. En t odo modelo lineal de regresión, los residuos generados por el est imador de mínimos cuadrados sat isfacen las propiedades:
• Propiedad 2: Losresiduosdemínimos cuadradosserelacionan con el t érmino de pert urbación del modelo mediante, u ˆ = Mu siendo M = I T
1
− X (X X )− 0
X , una mat ri z cuadrada de orden T . 0
• Propiedad 3: La matriz M es simét ri ca e idempot ente Demostración.- Inmediat a, a part ir de la defi nición de la mat riz M. Por ejemplo, ³ 0
0
M M = MM = I T
=
´ ³
−1
0
´
−1
0
0
− X (X X ) X I T − X (X X ) X = I T − X (X X )− X − X (X X )− X + X (X X )− X X (X X )− 0
1
0
1
0
0
0
1
0
0
1
0
X = I T
Ahora podemos calcular las propiedades est adíst icas (esperanza mat emát ica y ˆ, de dimensión Tx1: mat riz de covarianzas) del vector de residuos u
• Propiedad 4: Si el térmi no de pertur bación satisface E (u) = 0T, V ar(u) = u) = 0, V ar (ˆu) = σ 2u M. σ2u I T , se t iene E (ˆ 61
0
− X (X
Demostración.- La primera part ees inmediat a a part ir dela propiedad anterior. Para pr obar la segunda part e, t enemos, 0
0
0
0
V ar(ˆu) = E (u ˆ uˆ ) = E (u M M u) = E (u Mu) = = tr(u Mu) = E (uu M ) = E (uu )M = σ 2u I T M = σ 2u M 0
0
0
Por t anto, incluso si el t érmino depert urbación del modelo t ieneuna est ructura de covari anzas sencilla, el vector de residuos t endrá una mat riz de covari anzas bast ante más compleja. El vect or de residuos ti ene, al igual que el t érmino de pert urbación, esperanza matemática igual a cero para cada observación muest ral.
• Propiedad 5: Los residuos M CO est án incorrelacionados con cada una de las vari ables expli cat ivas del modelo.
ˆ el vector de T residuos del modelo est iDemostración.- Si denotamos por u mado, t enemos 0
0
X u ˆ = X (y
− X β ˆ ) = X (y − X (X X )− X y) = 0 0
0
1
0
Est a propiedad es muy import ante si recordamos la int erperet ación del coefi ciente de correlación en el senti do de que una corr elación no nula entr e vari ables permit e ciert a capacidad de predecir el comport amiento de una cualquiera de ell as a part ir de los valores observados para la otra. por t anto, si los residuos del modelo t uvieran correlació posit iva o negat iva con alguna de las variables explicat ivas, signi fi caría que la información muest ral relatiuva a dicha vari able permit e explicar el comport amiento del residuo, l a part e de yt que hemos dejado sin explicar. Est o defi niría la estimación que hemos obtenido como inefi ciente, pues no habría hecho uso de t oda la ingformación muest ral disponible. por t ant o, est a ausencia de correlación es muy deseable.
• Propiedad 6: En t odo modelo de regresión que incorpora un t érmion const ate, la suma de los residuos generados por el est imador MCO es igual a cero. Como consecuencia, su promedio es asimismo nulo. Demostración.- Es consecuencia de la propiedad anterior, si t enemos en cuenta que el t érmino const ante acompaña a una vari able expli cat iva que t oma un valor igual a uno en todos los períodos. 62
• Propiedad 7: El est imador MCO es insesgado
£ ¤ £ ¤ ˆ ) = E (X X )−1X y = E (X X )−1X (X β + u) = E (β £ ¤ = E β + (X X )−1X u = β + (X X )−1X E (u) = 0 0
0
0
0
0
0
0
0
• Propiedad 8: Si la mat ri z de covari anzas del t érmino de pert urbación es ˆ MCO ) = V ar(u) = σ 2u I T , la mat riz decovari anzasdel est imador M CO es: Var( β −1 σ2u (X X ) . 0
ˆ ) = E V ar(β
·³
ˆ β
− E (β ˆ )
´ ³
ˆ β
− E (β ˆ)
´ ¸
·³
0
= E
ˆ β
−
´ ³ ˆ β β
´ ¸ β = 0
−
£ ¤ = E (X X )−1X uu X (X X )−1 = (X X )−1X E (uu ) X (X X )−1 = = (X X )−1X V ar (u) X (X X )−1 = (X X )−1X V ar (u) X (X X )−1 0
0
0
0
0
0
0
0
0
0
0
0
0
0
• Propiedad 9: Si la mat ri z de covari anzas del t érmino de pert urbación es V ar(u) = σ 2u I T , el est imador MCO es el est imador lineal insesgado de menor varianza.
˜ = Ay. Si Demostración.- Cualquier ot ro est imador lineal puede escribir se, β defi nimos la diferencia ent re las mat rices que defi nen est e est imador y el est imador MCO, D=A
1
0
0
− (X X )− X
t enemos, £ ¤ £ ¤ £ ¤ − − − 1 1 1 ˜ D X X X y D X X X X u DX D X X X u β = +( ) = +( ) ( β + ) = β +β + +( ) ³ ´ ˜ = DX β + β . El estimador β ˜ será insesgado sólo si la matriz por lo que E β D sat isface la propiedad DX = 0, que equivale a la propiedad AX = I k . Supongamos que se cumple est a propiedad. La mat riz de covari anzas del ˜ es ent onces, est imador β 0
0
0
0
63
0
0
˜ ) = E V ar(β
·³
˜ β
−
´ ³ ˜ β β
´ ¸ h¡ ¢ ¡ ¢i − − 1 1 β = E D + (X X ) X uu D + (X X ) X 0
−
= σ2u (X X )−1 + σ2u DD 0
0
0
0
0
0
0
siendo el segundo sumando una mat ri z semidefi nida posit iva. En consecuencia, ˜ y el est imador MCO la diferencia entre las mat ri ces de covari anza del est imador β es una matriz defi nida posit iva, lo que prueba que est e últ imo es el est imador li neal insegado de mínima varianza.
• Propiedad 10: Si el t érmino de pert urbación del modelo de regresión se N (0T , σ 2u I T ), entonces el est imador MCO del vect or de distribuye: u coefi cientes β se dist ri buye,
∼
ˆ β
2
1
∼ N (β , σu (X X )− ) 0
Demostración.- Se basa en el hecho de que el vector que defi ne el est imador de mínimos cuadrados (de dimensión kx1) es una t ransformación li neal del vect or de pert urbaciones (de dimensión Tx1)
ˆ = β + (X X )−1X u β 0
0
siendo determini st a el rest o de los elementos que aparecen en est a expresión. Ello implica que el estimador de cada uno de los coe fi cient es sigue asimismo una distribución Normal,
ˆi β
∼ N (β i, σuaii) 1 ≤ i ≤ k 2
donde aii denota el elemento i-ésimo en la diagonal de la mat riz (X X ) t iene dimensión kxk. 0
−1
, que
• Propiedad 12: Si el término de perturbación del modelo de regresión se N (0T , σ2u I T ), entonces el esti mador MCO del vector de distribuye: u coefi cientes β coincide con el esti mador de Máxima Verosimili tud de dichos coefi cientes.
∼
64
0
Demostración.- Recordemos quela función dedensidad deuna varaible Normal multivariante ξ N (µ, Σ) de dimensión T es, µ ¶ 1 1 1 −1 f (ξ ) = exp ξ Σ ξ 2 (2π )T /2 | Σ |1/2
∼
−
0
de modo que, si suponemos Normalidad del t érmino de pert urbación, t enemos, µ ¶ 1 1 1 f (u) = uu exp 2σ2u (2π )T/2 (σ 2u )T /2 0
−
y la verosimili t ud del vect or de observaciones de l a vari able dependiente y resulta, µ ¶ 1 1 1 L(y,X/β , σ 2u) = exp (y X β ) (y X β ) 2σ 2u (2π )T/2 (σ 2u )T /2
−
−
0
−
donde hemos util izado el hecho de que el Jacobiano de la t ransformación que conviert e el vect or u en el vector y es igual a la mat riz identi dad de orden T , por lo que t iene det erminante igual a 1. Por t anto, dada una muest ra y,X,maximizar la función de verosimilitud respect o a los valores paramét ri cos β , σ 2u , equivale a minimizar la suma de cuadrados de los residuos del modelo. La única diferenciae st riba en que el est imador M V del parámet ro result a ser, σ ˆ 2u =
SR T
frente al est imador que suele calcularse en la ut il ización del procedimiento de mínimos cuadrados, que es, σ ˆ 2u =
SR T k
−
y que suele conocerse como est imador de mínimos cuadrados de σ 2u . Ambos se aproximan para tamaños muest rales moderados. El est imador MV de σ2u es sesgado, mient ras que el segundo es insesgado. El est imador M CO del vector de coefi cientes β alcanza la cota de Cramer-Rao (umbral inferior para la vari anza de t odo est imador insesgado), lo que no le sucede al est imador M CO de σ2u , que excede de dicha cot a, si bien no exist e ningún est imador insesgado de σ2u 65
que alcance dicha cot a. El est imador M V de σ 2u es inferior a dicha cota, pero es sesgado, como ya hemos dicho. Est e result ado es i mport ante, por cuanto que impli ca que si, además de l os supuest os más básicos, de t ener esperanza cero y matriz de covarianzas escalar, añadimos el supuest o de que el t érmi no de pert urbación sigue una dist ribución Normal, entonces el est imador MCO tiene las mismas propiedades que el est imador MV. Ahora bien, sabemos que, bajo condicioens bast ante generales, el est imador MV es efi ciente; es decir, no puede encont rarse ot ro est imador, li neal o no lineal, que t enga una mat riz decovarianzas menor que la del est imador MV . En t érminos del concepto de precisión que int rodujimos en la Sección X X, no puede encont rarse un est imador de mayor precisión que el est imador MV. En consecuencia, la ut ilización del procedimiento de mínimos cuadrados est á totalmente justi fi cada bajo el supuest o de Normalidad del t érmino de pert urbación, y algo menos cuando t al supuest o no se est ablece. Evi dentemente, no se t rata de que el invest igador haga o no una hipótesis acerca del t ipode dist ri bución que sigue el t érmino de pert urbación, sino de que se preocupe acerca de si el supust o de Normalidad es aceptable Por eso es que los contr ast es de normalidad deben t ener una ciert a import ancia en el análi sis empíri co.o de regresión sería igual a 2. Si las variables explicati vas no son determinist as, sino aleat orias, como cabe esperar, entonces el cálculo de laspropiedades del est imador de mínimoscuadrados es algo más complejo, y sus propiedades varían. En general, el est imador será sesgado, pero será consist ente, salvo que alguna de las variables explicat ivas t enga un comport amiento t endencial. Cuando aparecen t endencias, el est imador de mínimos cuadrados es asintóti camente insesgado y efi ciente,
ˆ ) = β ; lim V ar (β ˆ) = 0 lim E (β
T →∞
T →∞
La fuert e est ruct ura que hemos impuest o sobre el vect or de pert urbaciones, V ar(u) = σ 2u I T no es necesaria para garant izar la consist encia del est imador de mínimos cuadrados. De hecho, incluso en presencia de variables explicat ivas est ocást icas, el est imador de mínimos cuadrados t odavía es insesgado si las vari ables explicati vas est én incorr elacionadas con el t érmino de pert urbación del modelo de regresión. En reali dad, todo lo quenecesit amos es que la esperanza del t érmino de pert urbación, condicional en la información proporcionadad por las variables explicat ivas, sea cero: E (u/X ) = 0 . Est o i mpli ca l a ausencia de correlación, puest o que, 66
0
0
0
0
E (X u) = E [E (X u/X )] = E [EX (u/X )] = E [X E (u/X )] = E (0) = 0 En t ales condiciones, t omando esperanzas condicionales, t enemos, £ ¤ £ ¤ ˆ /X ) = E (X X )−1X y/X = E (X X )−1X (X β + u)/X = E (β £ ¤ = E β + (X X )−1X u/X = β + (X X )−1X E (u/X ) = 0 0
0
0
0
0
0
0
0
Sin embargo, si bien será insesgado, el est imador MCO no será ya efi cient e. La consist encia del est imador MCO requiere que las vari ables expli cat ivas est én incorrelacionadas asint ót icamente (es decir, en el límit e al aumentar el t amaño muest ral) con el t érmino de pert urbación,
p lim
1 X u = 0 T 0
Como µ
¶ −1 X X X u ˆ = β + p lim p lim β p lim ) T T ¡ ¢ y si se existe el límite p lim X T X y la matriz X X es invert ible, entonces un ¡ ¢−1 argumento de continuidad garantiza la existencia de p lim X T X . En t al caso, p lim T 1 X u = 0 garantiza la consist encia del est imador MCO, puest o que se t iene, 0
0
0
0
0
0
ˆ = β p lim β 0
Dado que la matriz X T X se compone de momentos muestrales de orden 2, la exist encia del límit e de dicha mat riz requiere exist encia de segundos momentos para el vector de vari ables explicat ivas. La presencia de una t endencia, aun siendo det erminist a, genera t érminos del t ipo, P
T 2 t= 1 t
T
P
;
T t= 1
txit
T
cuyo límit e no exist irá si las rest ant es variables xit tienen un comportamiento est able alrededor de un nivel de referencia. 67
En presencia de variables explicat ivas est ocást icas, el est imador MCO no t iene distribución Normal en muestras fi nitas incluso si u N (0T , σ 2u I T ). Por el cont rario, bajo ciert as condiciones de regularidad, se t iene,
∼
√
ˆ T (β
2
1
− β ) →d N (0, σu (X X )− ) 0
mediante apli cación del t eorema central del límit e al caso en que el t érmino de perturbación presenta la misma distribución de probabilidad para todas las observaciones, con esperanza nula y varianza fi nita, y las variables explicativas sat isfacen condiciones de exist encia de moemtnos como la que antes discut imos.
12. Bondad de ajuste del modelo Al t ener los residuos media cero, es claro que debemos preocuparnos por el modo en que oscil an alr ededor de cero. En part icular, lo que nos interesa es que las desviaciones que experimentan con respecto a cero sean l o menor posibles. Es decir, que su varianza sea posible, pero su varianza muest ral es, precisaP T l o menor 2 mente, proporcional a t= 1 u ˆt . Por ot ra part e, puest o que el residuo no es sino una componente de la vari able dependiente, aquella que no podemos explicar, tiene perfecto sentido comparar la varianza de los residuos con la de la variable dependiente. Ambas son posit ivas, y su cociente será necesariamente inferior a la unidad, de modo que oscil a entr e 0 y 1. Pero est o es lo que hacemos con el coefi ciente de det erminación. La bondad del ajust e del modelo de regresión se representa por el coefi ciente de determinación del modelo, P T 2 SR u ˆ R2 = 1 = 1 P T t= 1 t 2 ST y¯) t= 1 (yt
−
−
−
sonde SR denot a la suma de los cuadrados de los residuos, y ST lo que conocemos como Suma Total, la suma de las desviaciones al cuadrado de la variable dependiente respecto de su media muest ral. Est a suma es igual a la varianza de yt multiplicada por el tamaño muestral.
13. Contrastes de hipótesis Generalmente, estamos muy interesados en contrat ar hipótesis de disti nto t ipo: a) si una vari able explicat iva contiene información signi fi cat iva acerca de la vari able 68
dependiente, b) si el coefi ciente de impact o de una det erminada variable es igual a 1, c) si dos vari ables explicat ivas t ienen el mismo coefi ciente, etc... Para ll evar a cabo contrast es de est e t ipo, necesit amos hacer alguna hipót esis acerca de la dist ri bución de probabilidad del t érmino de err or o pert urbación del modelo de regresión. Generalmente suponemos que dicho t érmino sigue una di st ri bución Normal, si bien est o debe contr astarse util izando los t est s paramét ri cos o no paramét ricos apropiados. Como hemos vist o en la sección ant eri or, wbajo ciert as condiciones t enemos,
ˆ β
2
1
∼ N (β , σu (X X )− ) 0
en cutyo caso, cada uno de los coefi cientes del modelo sigue asimismo una distribución Normal,
ˆ β i
∼ N (β i, σuaii) 1 ≤ i ≤ k 2
donde aii denota el elemento i-ésimo en la diagonal de la mat riz (X X )−1 , que t iene dimensión kxk. Si queremos contrast ar una det erminada hipótesis acerca del valor numérico del coefi ciente asociado a una det erminada variable xi , 1 i k , 0
≤ ≤
H 0 : β i = β 0i podríamos utilizar esta propiedad, pues t endremos que,
ˆ β pi
0
− β i ∼ N (0, 1) σ aii 2 u
demodo que bast aría fi jar un nivel de signi fi cación para el contrast e, obtener el nivel crít ico corr espondiente al mismo en la t abla de una Normal(0,1), y comparar ˆ −β β el valor numéri co del est adíst ico i ii i con dicho umbral cri t ico. Por supuest o
√
0
σ 2u a
que el nivel crít ico que obtengaos en l a t abla de la N (0, 1) debe depender de que el contr ast e sea de una o de dos colas, es decir , de que la hipót esis alt ernativa sea del tipo,
H 1 : β i 6 = β 0i o de alguno de los t ipos, 69
H 1 : β i < β 0i ó,
H 1 : β i > β 0i La hipót esis de signi fi cación de la vari able xi , 1
≤ i ≤ k consist e en contrast ar
H 0 : β i = 0 frente a una alt ernat iva,
H 1 : β i 6 =0 aunque también podría ser de una sóla cola, si tenemos información a priori rest ri ngiendo el signo de dicho coefi ciente. Sin embargo, el contr ast e de hipótesis no puede ll evarse a cabo de est e modo porque desconocemos el valor numéri co de la vari anza del t érmino de error. Puede sin embargo est imarse, lo cual hacemos mediant e la expresión, σ ˆ 2u =
SR T k
−
Ahora bien, si sust it uimossu valor t eóricopor su valor est imado, laspropiedades est adíst icas del contrast e de hipótesis cambian. Concret amente, habremos de ut ilizar la propiedad,
(T
−
σ ˆ 2u k) 2 σu
∼ χT −k
ˆ . Como consecuencia, t enemos que, independiente de β ˆ β i
β 0i
√ − a σ 2u
q
(T
− k)
σ ˆ 2u σ2u
ii
/(T
− k)
es decir ,
ˆi β p
0
− β i ∼ tT −k ii
σ ˆ 2u a
70
∼ tT −k
con lo que podremos llevar a cabo contrast es como los mencionados. Especí fi camente al llevar a cabo contrast es de signi fi cación, conviene que dist inguir entre las sit uaciones en que no rechazamos la hipót esis nula de ausencia de signi fi cación de una det erminada vari able porque efecti vamente, no t iene capacidad expli cat iva, de aquell os casos en que no rechazamos la hipótesis nula porque la est imacion del coefi cient e asociado a dicha variable se ll eva a cabo no una precisión reducida. Baj a precisión impli ca una varianza elevada para el est imador de dicho coefi ciente, con lo que el valor numéri co del r ati o que aparece en el est adíst ico t de St udent será reducido, y posiblemente inferior al nivel crít ico proporcionado por las t ablas. En defi nitiva, hay que distinguir entre los caos en que dicho ratio es pequeño porque el numerador es pequeño, de los casos en que el rat io es reducido porque su denominador es muy elevado. Asimismo, conviene r ecordar que para rechazar una hipót esis nula, requerimos que la información muest ral cont enga evidencia signi fi cativa en contra de la hipótesis nula y favorable a la hipótesis alt ernativa. Est a segunda condición suele olvidarse con demasiada frecuencia, pero es i mport ant e, especialment e en contrast es de una cola. En el contrast e de hipótesis
H 0 : β i = 0 frente a la alt ernat iva,
H 1 : β i > 0
ˆ i = 3, 5 est aríamos en una sit uación en si obt enemos una est imación puntual β que la evidencia muest ral escontr ari a a la hipótesis nula, pero también es contraria a la hipótesis alternativa. En t al caso, los mét odos est adíst icos habit uales para el contrast e de hipótesis nos ll evarán a no rechazar la hipótesis nula, a pesar de que la estimación numérica del coefi ciente β puede considerarse elevada. Ello se debe a queal est ablecer la hipótesis alt ernativa, no hemos considerado la posibi li dad de que dicho coefi ciente t ome valores negat ivos, seguramente por algun conocimiento previo o alguna razón t eórica. No es que nosotr os queramos o no rechazar H 0, sino que los pprocedimientos habit uals nos llevarán a no rechazar dicha hipótesis. En una sit uación así, el investigador debería cuest ionar las razones que le han llevado a est ablecer una hi pótesis alt ernativa como la que hemos presentado. Si continúa pensando que t al alt ernativa es razonable, deberá desechar la muest ra que ha ut il izado; por el contrario, el result ado de la est imación podría en algunos casos reconsiderar la hipótesis alt ernativa, est ableciéndola en la forma H 1 : β i 6 = 0, y volver a contr ast ar la hipót esis nula H 0 : β i = 0 de nuevo.
−
71
Para llevar a cabo el contr ast e de hipótesis de una cola
H 0 : β i = β 0i frente a la alt ernat iva,
H 1 : β i > β 0i utilizaríamos el hecho de que para t oda vari able tn se t iene,
0, 95 = P [ξ
≤ tn, ] α
siendo tn,α el nivel crít ico proporcionado por las t ablas de la dist ri bución tn al nivel de confi anza α, que habremos de fi jar previamente. Por t ant o, bajo el supuest o de que la hipót esis nula es ciert a " # · ¸ q 0 ˆ β i β i ˆ i β 0i + tn,α σˆ 2u aii tn,α = P β 0, 95 = P p 2 σ ˆ u aii
− ≤
≤
de modo que los valores admisibles del coefi ciente están por debajo dei β 0i + h p p tn,α σ ˆ 2u aii . Esto delimita una región crítica RC β 0i + tn,α σ ˆ 2u aii ; + cuyo
≡
∞
umbral inferior es superior al valor teórico, β 0i . Es decir, rechazamos la hi pótesis nula si nuest ra est imación, con las muest ra disponibl e, excede de dicho umbral, que es a su vez mayor que el valor t eóri co β 0i . En el caso part icular de que contr ast emos si un coefi ciente es cero, cuando la alt ernat iva cont emplada es que t ome valores únicamente posit ivos, rechazaremos la hipótesis nula cuando la est imación punt p ual de dicho coefi ciente exceda de un ˆ 2u aii . Est e t ipo de evidencia sería siciert o umbral est ri ct amente posit ivo, tn,α σ mult áneament e contraria a la hipót esis nula, y favorable a la hipót esis alt ernat iva. Para contrast ar hipót esis más complejas, como
H 0 : β 1 + β 2 = 5 frent ea unaalt ernat iva como H 1 : β 1+β 2 < 5, bast a t ratar β 1+β 2 5 como una nueva variable aleatoria z cuya varianza puede det erminarse sin ningún problema ˆ , y pensar en contrast ar H 0 : a partir de la matriz de varianzas-covarianzas de β z = 0 , frent e a l a alternat iva H 1 : z = 0. Así,
−
72
z DT (z )
∼ N (0, 1)
y si sust it uimos en est a expresión el verdadero valor de σ 2u por su estimación, z −5 tT −k y podremos proceder a contrast ar H 0. t endremos DT ( z) Lo que est amos haciendo es comparar la magnit ud de la holgura o incumplimiento de una restricción, utilizando su desviación típica como unidad de medida, para poder decidir si dicha holgura es grande o pequeña. Est e argumento puede ext ender al cont rast e simult áneo de vari asrest ri cciones. Calculamos para cada una de ell as su holgura, obteniendo así un vect or de dimensión igual al número de rest ricciones, cuyas coordenadas pueden ser posit ivas o negativas. Igualmente, podemos pensar en obt ener la mat riz de covari anzas de las restricciones, una vez que tratamos cada una de ellas como una sóla variable alet oria, como hemos hecho en el ejemplo anterior. Finalmente, decidimos si el vector de holguras es grande o pequeña calculando su t amaño utilizando la mat riz de covarianzas como unidad de medida,
∼
(V ector de ho lg uras) [V ar (V ector de ho lg uras)]−1 (V ector de ho lg uras)
0
que puede probarse que sigue una distr ibución F q,T −k , siendo q el número de rest ri cciones que se contr ast an. Por ejemplo, si contrast amos las hipót esis,... Para contrast ar un conjunto de hipót esis li neales de la forma,
H 0 : Rβ = r frente a la alt ernat iva,
H 1 : Rβ 6 =r el est adíst ico, ³
ˆ Rβ
´
−r
0
³ −1 − 1 ˆ Rβ [R(X X ) R ] 0
u ˆ uˆ/(T 0
0
− k)
´
−r
/q
∼ F q,T −k
Ut il izar est e est adíst ico matricial es equivalente al ejercicio que hemos propuest o arri ba. De hecho, no es difñicil ver en el corchet e centr al de est e est adíst ico 73
tipo F la matri z de covari anzas del vect or de holguras, donde el parámet ro σ2u se ha sust it uido por su est imación en el denominador. Est amos, por t ant o, calculando el t amaño del vect or de holguras, ut il izando su desviación t ípica como unidad de medida. Por últ imo, en ocasiones pueden sust it uir se en el modelo las regresiones que se pret ende calcular. En ese caso, otro modo equivalente de calcular el est adíst ico F anterior consiste en comparar la suma de cuadrados de los residuos quese obtienen en el modelo sin rest ringir y el modelo rest ringido, mediante el est adíst ico,
(SRR SS R) /q SSR/(T k)
−
−
que es idénti co al anteri or y obedece, por t anto, a una dist ri bución de probabilidad F q,T −k . Otros est adíst icos son,
− SS R) Wald − k) (SRRSRR (SRR − SS R) Multiplicadores de Lagrange (T − k + q ) SRR T (ln SRR − ln SSR) Raz o´n de verosimilitudes (T
14. M at r ices d e covar ianzas n o escalar es Si el t érmino de pert urbación sat isface las condiciones, E (uT ) = 0T , V ar(uT ): σ2u Σ, siendo Σ una mat riz simét rica, defi nida posit iva, T xT , el est imador M CO es ˆ MCO ) = σ2 (X X )−1(X ΣX )(X X )−1. insesgado, con mat riz decovari anzas : Var( β u La demost ración de est a propiedad es t ot almente análoga a la de las Propiedades 7 y 8. Si el término de perturbación del modelo se distribuye N (0T , σ2u Σ) siendo Σ una mat riz simét rica, defi nida posit iva, TxT , entonces el est imador MCO del vect or de coefi cient es β se dist ri buye, 0
ˆ M CO β
2
1
0
∼ N (β , σu(X X )−
0
0
(X ΣX ) (X X )−1) 0
0
• La demost ración es análoga a la reali zada en la Propiedad 10, basándose el result ado en el hecho de que, cuando las variables explicat ivas son det erministas, el estimador M CO es una t ransformación l ineal del vect or u. 74
En est as circunst ancias, el est imador M CO ya no es el est imador lineal insesgado de mínima varianza. 14.1. Comparación de estimadores de la regresión múltiple y la regresión simple Consideremos la est imación por mínimos cuadrados del modelo,
yt = β 0 + β 1x1t + β 2x2t + ut supongamos que est imamos una regresión auxili ar,
x2t = δ 0 + δ 1x1t + ε2t
(14.1)
y const ruimos los residuos,
ˆε2t = x2t
− ˆδ + ˆδ x t , 0
1 1
(14.2)
ε2t , x1t ) = 0. que, como vimos en XX , t endrán, entr e ot ras, la propiedad Corr(ˆ Si, a conti nuación, est imamos el modelo de r egresión simple de la vari able dependiente de int erés sobre los residuos de est a regresión auxiliar,
yt = α0 + α2ˆε2t + vt t endremos (como vimos en XX ), P α ˆ2 =
T ˆε2t yt Pt=T 1 2 ε2t t= 1 ˆ
Result a sorprendente que, como puede probarse sin mucha di fi cult ad, est e est imador coincide con el est imador de mínimos cuadrados ordinari os de β 2 en (10.4), MCO
ˆ β 2
=α ˆ2
Lo quehemos hecho es ext raer de x2t el efecto de x1t debido a la corr elación que, en general, exist irá entre est as variables. Así, el residuo ˆε2t mide el componente de x2t que no t iene nada en común con x1t y, de hecho, t iene correlación nula con est a variable.
75
Est e result ado se ext iendeal modelo más general, (10.3), en el que si est imamos la regresión auxiliar,
x1t = α0 + α2x2t + ... + αk xkt + ε1t, t = 1, 2,...,T
(14.3)
y ut il izamos los residuos de est a regresión
ˆε1t = x1t
− αˆ − αˆ x t − ... − αˆ k xkt , t = 1 , 2,...,T 0
2 2
para estimar la regresión simple,
yt = α0 + α1ˆε1t + vt
(14.4)
t edremos que la est imación de mínimos cuadrados de α1 en (14.4) coincidirá con la est imación de mínimos cuadrados de β 1 en (10.3). Supongamos por un momento que en un det erminado análi sis, la vari able explicativa x1t t iene corr elación cero con el rest o de las variables explicat ivas. Ent onces, en (14.3) los coefi cientes est imados deberían ser práct icamente cero, al igual que el coefi ciente de det ermi nación de dicha ecuación.En t al caso, el residuo ˆε1t será pract icamente igual a x1t , ˆε1t ' x1t , por lo que el modelo (14.4) será esencialmente,
yt = α0 + α1x1t + vt
(14.5)
Pero hemos dicho que la est imación de mínimos cuadrados de α1 en esta regresión coincide con la estimación de mínimos cuadrados de β 1 en (10.3). Por t ant o, cuando una variable explicat iva est á incorrelacionada con t odas las demás, su coefi ciente puede est imarse igualmente bien en la regresión mult iple complet a, o en la regresión simple de yt sobre est a única variable. Una segunda sit uación en que se produce est e mismo result ado es cuando la corr elación muest ral entre cada una de las vari ables explicat ivas e yt es cero. La razón es que en t al caso, las est imaciones t eóricas de l os coefi cienet s asociados a cada una de est as vari ablessería cero, por lo queest imar el modelo (10.3) equivale, al menos t eóricamente, a est imar (14.5). Es int eresante saber que nest e result ado puede asimismo aplicarse a bloques de variables. Así, supongamos que en el modelo de regresión múlt iple, las k variables explicat ivas pueden agruparse en dos bloques, con la condición de que ni nguna vari able de un bloque est á correlacionada con ninguna variable del ot ro bloque. Permit imos, sin embargo, quevariables de un mismo bloqueest én correlacionadas, 76
posit iva o negat ivamente entr e sí. Pues bien, en t al sit uación, los coefi cient es asociados a las variables en el primer bloque pueden est imarse en una regresión de yt unicmente sobre est e subgrupo de variables explicat ivas, y lo mismo puede decir se acerca de los coefi cientes asociados a l as variables en el segundo bloque. 14.2. Regresión particionada
15. Grado de ajuste del modelo de regresión múltiple Una vez estimados los coefi cientes del modelo de regresión múltiple, y obtenidos los valores numéri cos de los residuos, la vari anza r esidual se obtiene,
yt = β 0 + β 1x1t + β 2x2t + β 3x3t + ut
σ ˆ 2u
=
Xn
1
−3 i
n
u ˆ2i
=
=1
S uˆ2 n
−
S y.2 123 = 3 n 3
−
donde la not ación que hemos int roducido enla últ ima igualdad hace referencia a que se t rata de la suma residual que resjult a al est imar una regresión en que la variable dependiente Y aparece explicada por x1, x2, x3. La Suma Residual puede expresarse,
S y.2 123
=
Xn i= 1
yi2
− β ˆ
Xn
0
i= 1
yi
− β ˆ
Xn
1
yi x1i
i= 1
− β ˆ
Xn
yi x2i
2
i= 1
− β ˆ
Xn
3
yi x3i
(15.1)
i= 1
expresión que puede expresarse mat ri cialmente,
S y.2 123 = y y 0
− β ˆX y 0
y que puede descomponerse en la forma,
S y2
=
S y.2 123 +
Xn i= 1
(ˆyi
2
− y¯)
(15.2)
de modo que la Suma Total, o suma de cuadrados de las desviaciones entre las observaciones de la vari able dependiente y su media, es igual a la suma de la Suma Residual de la regresión, más la Suma Explicada por la misma. 77
El coefi cient e de det erminación múlt iple se defi ne, 2 Ry. 123
=1
−
S y.2 123 S y2
que puede obtenerse sin necesidad de calcularP previamente los residuos de la n regresión pues, utilizando (15.1) junto con S y2 = i= 1 (yi y¯)2 se ll ega a,
−
2 Ry. 123 =
ˆ 1S x y + β ˆ 2S x y + β ˆ 3S x y β 1 2 3 S y2
Por la descomposición de la Suma Residual (15.2), t enemos que el coefi ciente 2 de det ermi nación Ry. 123 es posit ivo, y no superi or a la unidad. El coefi ciente de correlación múltiple es la raíz cuadrada, con signo positivo, del coefi ciente de det erminación múlt iple, s s 2 S y.123 S y2 S y.2 123 2 ρy.123 = 1 = S y2 S y2
−
−
15.1. Coefi cientes de correlación parcial y de determinación parcial El modelo de regresión múlt ipl e nos permit e considerar asimismo la capacidad explicat iva que cada una de las vari ables independientes por separado, tiene sobre la vari able dependiente, lo cual es de sumo int erés para el invest igador. Para ell o utilizamos los coefi cientes de corr elación parcial,
• Defi nición.- El coefi ciente de correlación parcial entre Y y X 1, denot ado por ρy 1.2, en el universo de variables Y, X 1, X 2, X 3, es el coefi ciente de correlación simple entre las variables Y y X 1, una vez que se ha extraído de ellas la infl uencia común que puedan t ener de la vari able X 2. El coefi ciente de correlación parcial entre Y y X 2, denotado por ρy2.1, en el universo de vari ables Y, X 1, X 2, X 3, se defi nir ía análogamente. Suele int erpret arse el coefi ciente ρy1.2 como el grado de correlación exist ente entre Y y X 1, cuando X 2 se mantiene fi j a, pero consideramos bast ante más adecuada la int eret ación que hemos dado: dicho coefi ciente mide la corr elación exist ente entre las vari ables Y y X 1que no es debida a la posible in fl uencia común que ambas avriables puedan 78
experimentar respecto de X 2. Cuando hay más de dos variables explicativas, las posibil idades de defi nir coefi cientes de corr elación parcial se mult iplican. En el caso de dos vari ables expli cat ivas,
yt = β 0 + β 1x1t + β 2x2t + ut si denot amos por ρy1, ρy2, ρ12 los coefi cientes de corr elación simple entr e cada par de vari ables, puede probarse que,
ρy1.2 = q ¡ ρy2.1 =
ρy1
− ρy ρ 2 2
1
¢
2 12 2 12)
− ρy (1 − ρ ρy − ρy ρ q ¡ ¢ 1 − ρy (1 − ρ 2
1 12
2 1
2 12)
Los coefi cientes de correlación parcial pueden escribir se asimismo en t érminos de varianzas muest rales. Por ejemplo, el coefi ciente de corr elación parcial entre Y y X 2 es igual a, s s S y.2 12 S y.2 1 S y.2 12 ρy2.1 = 1 = S y.2 1 S y.2 1
−
−
que depende de la comparación entr e dos sumas de cuadrados de residuos: la que procede de la regresión múltiple de Y sobre X 1 y X 2, y la correspondiente a la regresión simple de Y sobre X 1. El coefi ciente de correlación parcial entre Y y X 2 es igual a l a reducción que la vari anza del modelo de regresión simple se obtiene cuando se añade al mismo, como vari able explicat iva adicional, la vari able X 2. Es claro que S y.2 1 > S y.2 12, pues la suma r esidual nunca disminuye al añadir una variable explicat iva al modelo de regresión. Si, por ejemplo, X 2 no aporta 2 explicación alguna sobre Y que no est é ya contenida en X 1, ent onces S y.2 1 = S y. 12 y ρy2.1 = 0, a pesar de que ρy2 habrá sido, en general, diferente de cero. Analogámente, tendríamos, el coefi ciente de correlación parcial entr e Y y X 1, s s 2 S y.12 S y.2 2 S y.2 12 ρy1.2 = 1 = S y.2 2 S y.2 2
−
−
Sus cuadrados son los coefi cientes de det ermianción parcial, 79
Ry21.2
= 1
−
Ry22.1 = 1
−
S y.2 12 S y.2 2 S y.2 12 = S y.2 2 S y.2 2 S y.2 12 S y.2 1 S y.2 12 = S y.2 1 S y.2 1
− −
16. Colinealidad entre variables explicativas en un modelo de regresión En un modelo de regresión li neal múlt iple, la int erpret ación de los coefi cient es est imados no es inmediata. De hecho, lo verdaderamente import ante es entender que hay diversas maneras de interpr et ar los valores numéri cos obt enidos en el proceso de est imación, no t odas equivalent es. La lect ura más inmediat a dela est imación de un modelo deregresión, utilizada con excesiva frecuencia, consist e en interpret ar cada coefi ciente como el impacto que la vari able explicativa asociada al mismo t iene sobre la vari able dependiente. Lamentablemente, una interpretación t an directa no es siempre válida. Es fácil ver que el valor numéri co de un coefi ciente como β 2 en la regresión,
yt = β 0 + β 1x1t + β 2x2t + β 3x3t + ut es la vari ación, posit iva o negat iva, según su signo, que experi mentaría la variable yt si la variable x3t aumentase en una uni dad, y supuesto que ninguna otra de las vari ables expli cati vas, alterase su valor numérico. Ahora bien, recordemos la interpret ación que llevamos a cabo acerca del signifi cado del coefi ciente de correlación en la Sección XX. Si x3t est uviera alt amente correlacionada con x2t , ρ(x3t , x3t) = 0, 85, por ejemplo, sería poco realist a hacer el supuest o ceteris paribus del párrafo anterior, pues el valor numérico del coefi ciente de correlación entre ambas variables indica que cuando una de ellas aumenta, la ot ra generalmente disminuye. Por t anto, para calcular el efect o que sobre yt tendría un aumento de una unidad en x3t, habría que restar de β 3, que mide el efecto directo, el producto de β 2 por el cambio producido en x2t . Este producto mediría el efecto indirecto. Para calcular l a magnit ud de la variación en x2t que cabría esperar quevini era asociada con un aumento de una unidad en x3t , hemos de apelar nuevamente al concepto de coefi ciente de corr elación,
−
80
ρ(x3t , x3t ) =
σ 23 σ 2σ 3
16.1. Efectos de la colinealidad entre variables explicativas No se pr oducen efectos sobre las caract eríst icas globales de la regresión: Rcuadrado, residuos numéricos, desviación t ípica de la pert urbación, est adíst ico de signifi cación global de la regresión, et c. Consideremos un modelo deregresión con las variables medidasen desviaciones respecto a su valor medio,
y˜t = β 1x˜1t + β 2x˜2t + ut A part ir de la mat ri z de covari anzas muest ral entre las vari ables explicat ivas del modelo de regresión, µ ¶ µ ¶ var (x1) cov (x1, x2) a b V ar(X ) = , a, c > 0, b Q 0, = cov (x1, x2) var (x2) b c obt enemos l a mat ri z de covarianzas de los estimadores M CO del modelo de regresión múlt iple, µ 2 ˆ V ar(β MCO ) = σ
a b b c
¶ −1
µ
=
σ 2 ac−c b2 σ 2 ac−b b2
−
−σ σ
2
2
b
ac−b2 a ac−b2
¶
= σ2
µ
1 ac
2
−b
c b
−
−b ¶ a
1. Que las variables explicat ivas del modelo de regresión est én alt amente correlacionadas signi fi ca que, en valor absoluto, su coefi ciente de correlación (covarianza dividido entre producto de desviaciones típicas) sea próximo a b la unidad o, lo que es equivalente, que ac est é próximo a la unidad. Est o 2 implica, evidentemente, que b es aproximadamente igual al product o ac. 2
Una primera consecuencia es que el det erminante de la mat ri z de covari anzas de las variables explicat ivas, ac b2, será próximo a cero, es decir, dicha matriz de covari anzas es próxima a ser singular. Como el inverso de dicho det erminante ˆ M CO ), se t iene que t anto las vari anzas aparece como un factor común en V ar(β de los est imadores MCO como sus covarianzas, son numéricamente elevadas. Por ejemplo, con una mat riz de covarianzas entre variables,
−
81
µ
V ar(X ) =
4 6.2 6.2 10
¶
, Corr(x1, x2) = p
6.2 = . 98031 (4) (10)
t enemos una mat ri z de covari anzas entre est imadores MCO, µ ¶ −1 µ ¶ 4 6.2 19. 231 11. 923 ˆ MCO ) = 3.0 V ar(β = 6.2 10 11. 923 7. 6923
−
−
con,
ˆ 1) = DT (β
√
ˆ 2) = 19. 231 = 4. 3853, DT (β
√
7. 6923 = 2. 7735
1. Por t anto, se produce una pérdida de precisión en las est iamciones, al aumentar las desviaciones t ípicas de los est imadores MCO. En est e caso, por t anto, est imamos con una baja precisión no porque exist an vari aciones en el valor de los coefi cientes, sino porque las vari ables asociadas est án alt amente correlacionadas, posit iva o negat ivamente. 2. Como discutimos en la Sección XX al hablar de los contrast es de hipótesis estadísticas, la pérdida de precisión tiene implicaciones importantes en cuanto a efect uar contrast es acerca de valores numéricos con dichos coefi cient es, por cuanto que la menor precisión, que es equivalente a una mayor varianza est imada t ermina plasmándose en intervalos de con fi anza más amplios. Est o hace mucho más fácil que el valor numéri co que se contr ast a en una hipótesis nula simple caiga dentro de dicho int ervalo, no rechánzadose, en consecuencia, dicha hipótesis nula. En est e caso, que mla hi pótesis nula no se rechace no se debe necesariamente a que el valor hipotét ico del coefi ciente sea muy similar al valor est imado, sino a que la desviación t ípica asociada a est e ult imo es muy grande, lo que puede ampliar el int ervalo de confi anza asociado de manera muy import ante. En defi nitiva, como vimos en su momento, la menor precisión en la esti mación viene asociada a una pérdida de potencia en la contrastación de hipotesis est adísticas. 3. Otra consecuencia de la correlación entre variables explicat ivas es que la correlación entre coefi cientes est imados, √ bac tendrá signo contrario al de la correlación entre las variables explicativas x1, x2, y será cercano a 1 en valor absolut o. Si las variables explicat ivas est án posit ivamente correlacionadas, entonces los est imadores MCO de sus coefi cientes asociados est án negativamente correlacionados. En el ejemplo anterior,
−
82
³
´ ˆ ˆ Corr β 1, β 2 = p
−11. 923
(19. 231) (7. 6923)
=
−. 98029
Ell o quiere decir que, mientr as que, a lo largo de la muest ra, las dos vari ables t ienden a est ar simult áneamente por encima o por debajo de sus respect ivas medias muest rales, las estimaciones numéricas de sus coefi cientes est arán una por encima de su media, y ot ra por debajo. Est o signi fi ca que el procedimiento t iende a sobre-est imar uno de dichos coefi cientes y a sub-est imar el ot ro, sin que, por supuest o, sepamos cuál de ellos est á en cada sit uación. Pero además, que su correlación sea elevada implica que tendremos una seria ³ di fi´cultad en distinguir ˆ , β ˆ , que se dist inguen entre una colección de posibles pares de est imaciones β 1 2 ˆ 1, tienen un valor inferior unas de ot ras porque las que t ienen un valor mayor de β ˆ . Este es un problema que se conoce como de falta de identi fi cación en la de β 2
est imación del modelo economét rico. Como hemos visto, el efect o de la colinealidad es aumentar las varianzas de los est imadores de mínimos cuadrados, así como sus covari anzas. En general, las correlaciones entre coefi centes son asimismo elevadas. Esto signi fi ca no sólo que exista una tendencia a que cada coefi ciente individual t ienda a aparecer como est adíst icamente no signifi cat ivo, sino que, además, es difícil est imar numéri camente cada coefi ciente por separado. Es lógico esperar queasí sea: si dos variables x2 y x3 est án posit ivamente correlacionadas, entonces las dos t ienden a desviarse en igual dirección respecto a sus medias muest rales. Por t ant o, ambas tienden a est ar simult áneamente por encima o por debajo de sus r especti vas medias; por consiguiente, la mi sma capacidad explicat iva genera l a combinación β 2x2+ β 3x3 que la combinación ( β 2 + θ)x2+ (β 3 φ) x3. Es decir , puest o que ambas vari ables se mueven generalmente en igual sentido, exist en proporciones θ y φ de ambas variables quet oman valores numéri cos muy similares, compensándose entre sí. Por consiguiente, ambas combinaciones t omarán aproximadamente los mismosvalores numéri cos. Como esta sust it ución entr e las vari ables x2 y x3 puede ll evarse a cabo en cuanlquier cuantía, siempre que se respet e la proporción dada por θ/φ, identifi car con precisión por separado los valores numéricos de los parámet ros β 2 y β 3 resulta muy difícil.
−
83
16.2. Detección de la colinealidad Puesto que la colinealidad se refi ere a la presencia de cor fi cientes de correlación de elevados en magniot ud entre las vari ables explciat ivas, nada mejor para det ectar esta situación que examinar dichos coefi cientes de correlación en la muestra. Aunque parezca sorprendente, hay dist intos procediemit nos que deben seguirse, pues son t odos ellos de una enorme sencil lez. 1. En pri mer lugar, el cálculo dedichos coefi cientes de correlación entre t odos los pares de variables explicat ivas; en el modelo del ejemplo anterior, hay t an sólo uno de t ales pares. 2. En segundo lugar, deben examinarse las nubes de punt os entr e t ales pares de vari ables; como dij imosen su momento, un gráfi co t an simple como una nueb de punt os nos proporciona una perspect iva muest ral complet a, a diferencia del único valor numéri co proporcionado por un coefi ciente de correlación muest ral. por ejemplo, en una nube de punt os podemos percibir que lo que aparece como un coefi ciente de correlacion muest ral sólo moderado, se debe a la existencia de ua submuestra, de reducida magnitud, enla que las dos variables en cuest ión se desconectan, exist iendo en el rest o de la muest ra una r elación estrecha ent re ambas. 3. En t ercer lugar, pueden calcularse los valores propios de la mat riz de covarianzas de las vari ables observadas. Como hemos vist o en el ejemplo anteri or, en presencia de colinealidad, dicha matr iz est ará cercana a la singularidad, lo que se ha de refl ejar en que el menor de l os valores propios debe ser muy inferi or al mayor de los mismos. Ha de t enerse en cuenta que t odos los valores propios de dicha matriz serán no negativos, como corresponde a una matriz de covarianazs, que es semi-defi nida posit iva. Por ot ra part e, el det erminante de una mat ri z cuadrada es igual al product o de sus valores propios, y ha de ser cercano a cero si la matri z es casi singular. para que el product o de los valores propios sea cercano a cero, es necesario que se cumpla la relación cit ada entr e el menor y el mayor de t odos ell os. 4. Por últ imo, pueden est imarse regresiones parciales entre pares de variables explicat ivas. El R-cuadrado de dichas regresiones será el coefi ciente de correlación entre ambas, al cuadrado, por lo que la estimación de estas regresiones auxiliares engloban como caso part icular a la primera de nuest ras sugerencias. De est e modo, obt enemos información adicional útil , especialmente 84
a t ravés de los residuos de cada regresión, cuyo examen nos proporciona el componente de una de las variables explicativas que no está explicado por la util izada como vari able explicat iva en la regresión auxiliar. 5. Sensibilidad a variaciones en un número reducido de observaciones muestrales. 16.3. Tr at ami ent o de l a colineali dad Como hemos vist o, uno de los dos problemas producidos por la coli neali dad entr e las vari ables explicat ivas del modelo de regresión est ri ba en la di fi cult ad de interpret ar separadamente cada uno de los coefi cientes est imados. Concret amente, no podemos interpretar el valor numérico de un coefi ciente est imado como el efect o de la vari able explicat iva asociada sobre la vari able dependiente. 16.3.1. R egresión ort ogonali zada Puesto que una de las di fi cult ades generadas por la colinealidad entre variables explicat ivas est riba en la di fi cult ad de int erpret ar los valores numéri cos est imados para los coefi cientes del modelo de regresión, uno de los posibles trat amientos de la colinealidad consiste en modi fi car las vari ables explicat ivas del modelo, de modo que las nuevas vari ables sean incorr elacionadas entr e sí. Para ello, el invest igador debe comenzar est ableciendo un ranking de import ancia entre las variables explicat ivas originales, entendiendo por ello, su creencia acerca de l a capacidad explicat iva individual de cada una de ell as respecto a la vari able dependiente. La pri mera de dichas variables en import ancia se conserva inalt erada. A conti nuación, se est ima una regresión lineal de la vari able que ocupa el segundo puest o en el ranking, sobre la primera,
x2t = δ 0 + δ 1x1t + ε2t
(16.1)
los residuos de dicha regresión van a sust it uir a l a segunda variable. Dichos residuos son el componente de x2t que no está explicada por x1t ; además, por const rucción, est án incorrelacionados con x1t , ρ(ε2t , x1t ) = 0. A cont inuación, se estima una regresión de la tercera variable sobre las dos primeras; por construcción, los residuos de mínimos cuadrados de dicha regresión tienen corr elación nula con x1t y con x2t , y se procede de este modo hasta llegar a la variable colocada en el último lugar del ranking.
85
Para est ablecer el ranking inicial, el invest igador puede servir se de regresiones parciales de la variable dependiente sobre cada una de las variables explicativas ori ginales. El R2 de dichas regresiones, las desviaciones t ípicas residuales, así como un examen gráfi co de los residuos de cada una de ellas, será generalmente sufi ciente para est ablecer dicho ranking. La única di fi cult ad en est e análisis surge si hay duda entr e dos vari ables acerca de cuál de ell as asignar alguno de los pri meros lugares del ranking; est o sería import ant e, pues si dos variables t ienen una capacidad explicat iva similar, elevada en ambos casos, entonces la vari able que result ase menos favorecida en la selección sería sust it uída por lo residuos en una r egresión de dicha variable por la que se seleccionó como priori t aria en el ranking, y dichos residuos tendrán una capacidad explicat iva muy reducida, debido a que est as dos vari ables eran ori ginalmente muy similares. En ot ras palabras, si dudamos entre seleccionar x1t o x2t para ocupar el primer lugar en el ranking..... De est e modo, alt eramos la regresión ini cial por otra,
yt = β 0 + β 1x1t + β 2ε2t + β 3ε3t + ut
(16.2)
donde ε2t y ε2t denot an los residuos de las regresiones auxil iares, (16.1) y
x3t = ϕ0 + ϕ1x1t + ϕ2x2t + ε3t ,
ˆε2t = x2t ˆε3t = x3t
− ˆδ + ˆδ x t , 0
(16.4)
1 1
− ϕˆ − ϕˆ x t + ϕˆ x t, 1 1
0
(16.3)
2 2
(16.5)
En est a regresión, el coefi ciente de corr elación entr e dos vari ables explicat ivas cualesquiera es cero. Por ejemplo, si consideramos ε2t y ε3t , t enemos que ε3t tiene corr elación nula con x1t y con x2t, mientrasque ε2t es una combinación lineal de x1t y x2t ; en consecuencia, el coefi ciente de corr elación entr e ε2t y ε3t es igual a cero. Por tanto, a diferencia de lo que ocurría en la regresión original, los coe fi cient es est imados en (16.2) pueden interpretarse como el impact o, posit ivo o negati vo, que se tendría sobre yt si la variable asociada, digamos que ε3t, aumenta en una unidad. La est rategia propuest a habría resuelt o, por t anto, el problema deint erpret ación de los coefi cientes individuales estiamdos; sin embargo, surge otra di fi cultad evidente, y es que el invest igador no est á int eresado en est imar el impact o que sobre yt puede t ener una variación unit aria en ε3t, sino en la vari able ori ginal, x3t . 86
Sin emabrgo, no t odo est á perdido: supongamos que, una vez est imada (16.2) el invest igador dispone de dat os yt , x1t ,x2t y x3t . Sustituiría,
x2t = δ 0 + δ 1x1t + ε2t ε3t = x3t (ˆ ϕ0 + ϕ ˆ 1x1t + ϕ ˆ 2x2t )
−
(16.6) (16.7)
en (16.2) , obteniendo XXX. 16.3.2. Otros tratamientos Regresión cresta Componentes principales
17. Predicción Como mínimo, una vari able puede predecir se a part ir de su valor medio muest ral.
87