Extensiones del modelo de regresión lineal con dos variables
Regresión origen
a
través
del
Hay ocasiones en las cuales la función de regresión poblacional (FRP) de dos variables adquiere la siguiente forma:
En este modelo, el término del intercepto está ausente o es cero, lo cual explica el nombre: regresión a través del origen . A manera de ilustración consideremos consideremos el modelo de asignación de precios de activos de capital (CAPM, del inglés capital asset pricing model ) de la teoría moderna de portafolios, la cual, en su versión de prima por riesgo, se expresa como:
Donde: ERi = tasa esperada de rendimiento del título i. ERm = tasa esperada de rendimiento del portafolios del mercado como la representa, por ejemplo, el índice compuesto de acciones S&P 500. r f = tasa de rendimiento libre de riesgo, por ejemplo, el rendimiento de los bonos del Tesoro Tesoro estadounidense a 90 días. βi = el coeficiente Beta, una medida de riesgo sistemático, es decir, el riesgo que no se ha eliminado con la diversificación. Asimismo, es una medida del grado en el cual la i -ésima -ésima tasa de rendimiento del título se mueve con el mercado. Un βi > 1 implica un título volátil o riesgoso, mientras que βi < 1 es un título seguro. (Nota: No confunda esta βi con el coeficiente de la pendiente de la regresión con dos variables, β2.)
Si los mercados de capitales funcionan de manera eficiente, el CAPM postula que la prima esperada por el riesgo del título (= ERi − r f ) es igual a ese coeficiente β del título multiplicado por la prima esperada del riesgo del mercado (= ER m − r f ). Si el CAPM se mantiene se da la situación que se indica a continuación:
La línea que aparece en la figura se conoce como línea del mercado de valores (LMV).
Para fines empíricos, el CAPM suele expresarse así:
Este último modelo se conoce como el Modelo del Mercado. Si el CAPM es válido, se espera que α i sea cero, como se muestra a continuación:
Observen que la última ecuación, la variable dependiente, Y , es (R i − r f) , y la variable explicativa, X , es βi , el coeficiente de volatilidad, y no (R m − r f) . Por consiguiente, para realizar la regresión, se debe estimar primero βi , el cual se obtiene por lo general de la línea característica.
Como muestra este ejemplo, algunas veces la teoría que sirve de base requiere que el término del intercepto esté ausente del modelo. La hipótesis del ingreso permanente de Milton Friedman, que afirma que el consumo permanente es proporcional al ingreso permanente, es otro caso en el que el modelo de intercepto cero puede ser apropiado, como también en la teoría del análisis de costos, que postula que la variable costo de producción es proporcional a la producción; y algunas versiones de la teoría monetarista que afirman que la tasa de cambio de los precios (es decir, la tasa de inflación) es proporcional a la tasa de cambio de la oferta monetaria.
¿Cómo se estiman modelos éstos modelos y qué problemas presentan? Para responder, primero escribimos la FRM, a saber:
Ahora aplicamos el método MCO a (6.1.5) y se obtienen las siguientes fórmulas para 2 y su varianza :
Es interesante comparar estas fórmulas con las obtenidas cuando se incluye el término del intercepto en el modelo:
Deben ser obvias las diferencias entre estos dos conjuntos de fórmulas: en el modelo sin término de intercepto se utilizan sumas de cuadrados simples y productos cruzados, pero en el modelo con intercepto, se utilizan sumas de cuadrados ajustadas (de la media) y productos cruzados. Segundo, los gl para calcular 2 son (n − 1) en el primer caso y (n − 2) en el segundo
Aunque el modelo sin intercepto o con intercepto cero puede ser apropiado en algunas ocasiones, deben observarse algunas características de este modelo. Primero, , que es siempre cero en el modelo con intercepto (el modelo convencional), no necesita serlo cuando ese término está ausente. En resumen, no necesita ser cero en la regresión a través del origen. Segundo, 2 , el coeficiente de determinación, que siempre es no negativo en el modelo convencional, en ocasiones puede volverse negativo en el modelo sin intercepto. Este resultado anómalo surge porque el 2 que presentamos, supone explícitamente que el intercepto está incluido en el modelo. Por consiguiente, el 2 calculado convencionalmente puede no ser apropiado en los modelos de regresión a través del origen.
2
para el modelo de regresión a través del origen El 2 convencional no es apropiado en regresiones que no incluyan o no consideren el intercepto. Pero se puede calcular para tales modelos, lo que se conoce como el simple, el cual se define como:
Nota: Se trata de sumas de cuadrados simples (es decir, no corregidas por la media) y de productos cruzados.
A pesar de que este 2 simple satisface la relación 0 < 2 < 1, no es directamente comparable con el valor 2 convencional. Por esta razón, algunos autores no presentan el valor 2 en los modelos de regresión con intercepto cero. Debido a las características especiales de este modelo, se debe tener mucho cuidado al utilizar el modelo de regresión con intercepto cero. A menos que haya una expectativa a priori muy sólida, es aconsejable apegarse al modelo convencional con presencia de intercepto. Esto tiene una doble ventaja. Primero, si se incluye en el modelo el término del intercepto pero es estadísticamente no significativo (es decir, estadísticamente igual a cero), para todos los fines prácticos se tiene una regresión a través del origen. Segundo y más importante, si el modelo sí tiene un intercepto pero insistimos en ajustar una regresión a través del origen, cometeríamos un error de especificación.
Formas funcionales de modelos de regresión
los
Como se menciono anteriormente, la Cátedra trata sobre todo con modelos lineales en los parámetros, que pueden ser o no lineales en las variables. En las secciones que siguen consideraremos algunos modelos de regresión muy comunes, que pueden ser no lineales en las variables pero sí lineales en los parámetros, o que pueden serlo mediante transformaciones apropiadas de las variables. En particular, analizaremos los siguientes modelos de regresión: 1. 2. 3. 4.
El modelo log-lineal. Modelos semilogarítmicos. Modelos recíprocos. El modelo logarítmico recíproco.
A continuación, analizaremos las características especiales de cada modelo, los casos en los cuales su uso es apropiado y la forma de estimarlos.
Cómo medir la elasticidad: modelo log-lineal Considere el siguiente modelo, conocido como modelo de regresión exponencial:
que puede expresarse también como:
donde ln = logaritmo natural (es decir, logaritmo en base e y donde e = 2,718).
Si escribimos la ecuación anterior como:
donde α = ln β1, este modelo es lineal en los parámetros α y β2, lineal en los logaritmos de las variables Y y X, y se estima por regresión MCO. Debido a esta linealidad, tales modelos se denominan modelos log-log, doble-log o log-lineales. Si se cumplen los supuestos del modelo clásico de regresión lineal, los parámetros de la última ecuación se estiman por el método MCO, considerando que
donde ∗ = y ∗ = . Los estimadores de MCO obtenidos, 2 , serán los mejores estimadores lineales insesgados de α y β2, respectivamente.
Una característica atractiva del modelo log-log, que lo ha hecho muy popular en el trabajo empírico, es que el coeficiente de la pendiente β2 mide la elasticidad de Y respecto de X , es decir, el cambio porcentual en Y ante un pequeño cambio porcentual en X . Así, si Y representa la cantidad demandada de un bien y X su precio unitario, β2 mide la elasticidad-precio de la demanda, parámetro de gran interés en economía. Si la relación entre la cantidad demandada y el precio es como se muestra en la figura a), la transformación doble-log de la figura b) dará entonces la estimación de la elasticidad-precio ( − β2).
Pueden observarse dos características especiales del modelo log-lineal: el modelo supone que el coeficiente de la elasticidad entre Y y X , β2, permanece constante a través del tiempo (¿por qué?), de aquí su otro nombre, modelo de elasticidad constante. En otras palabras, como lo indica la figura b), el cambio en ln(Y) por unidad de cambio en ln( X) (es decir, la elasticidad, β2) permanece igual sin importar en cuál ln( X) se mida la elasticidad. Otro aspecto del modelo es que, a pesar de que 2 son estimadores insesgados de α y β2, β1 (el parámetro del modelooriginal) al estimarse como = antilog ( ) es, en sí, un estimador sesgado. En la mayor parte de los problemas prácticos, sin embargo, el término del intercepto es de importancia secundaria y no es necesario preocuparse por obtener este estimador insesgado. En el modelo de dos variables, la forma más simple de decidir si el modelo log-lineal se ajusta a los datos es graficar el diagrama de dispersión de ln( ) frente a ln( ) y ver si las observaciones caen más o menos sobre una línea recta, como en la figura b).
Modelos semilogarítmicos: log-lin y lin-log Cómo medir la tasa de crecimiento: modelo log-lin A los economistas, comerciantes y gobiernos con frecuencia les interesa encontrar la tasa de crecimiento de ciertas variables económicas, como población, PNB, oferta monetaria, empleo, productividad y déficit comercial. Supongan que deseamos conocer la tasa de crecimiento del gasto de consumo personal en servicios para los datos de la tabla que se indica a continaución. Sea Y t el gasto real en servicios en el tiempo t y Y 0 el valor inicial del gasto en servicios (es decir, el valor al final del cuarto trimestre de 2002).
Gasto personal total y categorías (miles de millones de dólares de 2000 ajustados por la inflación; datos trimestrales con tasas anuales ajustadas por estacionalidad)
Recordaran la muy conocida fórmula del interés compuesto, vista en los cursos básicos de economía.
donde r es la tasa de crecimiento compuesta de Y (es decir, a través del tiempo). Con el logaritmo natural anterior, nos queda:
Escribimos entonces,
Al agregar el término de perturbación, obtenemos:
Este modelo es como cualquier otro modelo de regresión lineal en el sentido de que los parámetros β1 y β2 son lineales. La única diferencia es que la variable dependiente o regresada es el logaritmo de Y y la regresora o variable explicativa es el “tiempo”, que adquiere valores de 1, 2, 3, etcétera. Los modelos recién vistos, se denominan modelos semilog porque sólo una variable (en este caso, la regresada) aparece en forma logarítmica. Para fines descriptivos, un modelo en el cual la variable regresada es logarítmica se denomina modelo log-lin. Más adelante, consideraremos un modelo en el cual la variable regresada es lineal pero la(s) regresora(s) es (son) logarítmica(s): un modelo lin-log.
Antes de presentar los resultados de la regresión, examinemos las propiedades del modelo anterior. En este modelo, el coeficiente de la pendiente mide el cambio proporcional constante o relativo en Y para un cambio absoluto dado en el valor de la regresora (en este caso, la variable t ), es decir,
Si multiplicamos el cambio relativo en Y por 100, el ratio anterior dará entonces el cambio porcentual, o la tasa de crecimiento, en Y ocasionada por un cambio absoluto en X , la variable regresora. Es decir, 100 por β2 da como resultado la tasa de crecimiento en Y ; 100 por β2 se conoce, en la bibliografía, como la semielasticidad de Y respecto de X .
El modelo lin-log A diferencia del modelo de crecimiento recién estudiado, en el cual nos interesaba encontrar el crecimiento porcentual en Y ante un cambio unitario absoluto en X , ahora deseamos encontrar el cambio absoluto en Y debido a un cambio porcentual en X . Un modelo que cumple este propósito, se escribe como:
Con fines descriptivos se le llama modelo lin-log. Interpretemos el coeficiente de la pendiente β2. Como de costumbre,
El segundo paso se deriva de que un cambio en el log de un número es un cambio relativo. Simbólicamente, tenemos:
donde, como es usual, ∆ denota un cambio pequeño. La ecuación anterior se escribe, en forma equivalente, así:
Esta ecuación plantea que el cambio absoluto en Y (= ∆Y ) es igual a la pendiente multiplicada por el cambio relativo en X . Si este último se multiplica por 100, entonces la última ecuación da el cambio absoluto en Y ocasionado por un cambio porcentual en X . Así, si ∆ X/X cambia en 0,01 unidades (o 1%), el cambio absoluto en Y es 0,01( β2). Por tanto, si en una aplicación se encuentra que β2 =500, el cambio absoluto en Y es (0,01)(500) = 5,0. Por consiguiente, cuando se utiliza MCO para estimar regresiones como en modelo lin-log, se debe multiplicar el valor del coeficiente estimado de la pendiente por 0,01, o, lo que es lo mismo, dividirlo entre 100. Si no tiene presente lo anterior, la interpretación en una aplicación será muy equivocada. La pregunta práctica es: ¿cuándo resulta útil un modelo lin-log? Se ha encontrado una interesante aplicación en los así llamados modelos de gasto Engel. Engel postuló que: “el gasto total que se dedica a los alimentos tiende a incrementarse en progresión aritmética, mientras que el gasto total aumenta en progresión geométrica ”.
Debe señalarse que, algunas veces, la transformación logarítmica se emplea para reducir la heteroscedasticidad, así como la asimetría. Una característica común de muchas variables económicas es que tienen asimetría positiva (por ejemplo, distribución del tamaño de las empresas, o distribución del ingreso o riqueza) y son heteroscedásticas. Una transformación logarítmica de dichas variables reduce tanto la asimetría como la heteroscedasticidad.
Por eso, los economistas laborales acostumbran usar logaritmos de los salarios en la regresión de éstos sobre, por poner un ejemplo, el nivel de escolaridad, medido éste por los años de educación recibida.
Modelos recíprocos Los modelos del siguiente tipo se conocen como modelos recíprocos:
A pesar de que este modelo es no lineal en la variable X porque entra inversamente o en forma recíproca, el modelo es lineal en β1 y β2, y, por consiguiente, es un modelo de regresión lineal. Este modelo tiene las siguientes características: a medida que X aumenta indefinidamente, el término β2 (1 /X ) se acerca a cero (nota: β2 es una constante) y Y se aproxima al valor límite o asintótico β1. Por consiguiente, modelos como recíprocos contienen un valor asintótico o límite que tomará la variable dependiente cuando el valor de la variable X aumente indefinidamente.
Algunas formas probables de la curva correspondiente al modelo se muestran en las siguientes gráficas:
Ejemplo: La curva de Phillips Una aplicación importante es la conocida curva de Phillips de macroeconomía. Con base en los datos de tasa de variación porcentual de los salarios nominales (Y ) y la tasa porcentual de desempleo ( X ) en el Reino Unido durante el periodo 1861 a 1957, Phillips obtuvo una curva cuya forma general se parece a la figura b) (de la gráfica anterior).
Existe asimetría en la respuesta de los cambios salariales en el nivel de la tasa de desempleo: los salarios aumentan con mayor rapidez por cada unidad de cambio en el desempleo si la tasa de desempleo está por debajo de , denominada por los economistas tasa natural de desempleo (que se define como la tasa de desempleo requerida para mantener constante la inflación [salarial]), y luego disminuyen despacio por un cambio equivalente cuando la tasa de desempleo está por encima del nivel natural, , lo que indica el piso asintótico, o − β1, para el cambio salarial. Esta característica particular de la curva de Phillips puede deberse a factores institucionales, como el poder de negociación de los sindicatos, los salarios mínimos, compensaciones por desempleo, etcétera.
Desde la publicación del artículo de Phillips se efectuó una muy extensa investigación sobre la curva de Phillips tanto en el nivel teórico como en el empírico. El espacio de este libro no permite estudiar los detalles de la controversia en torno a la curva de Phillips. La curva misma ha pasado por diversas representaciones. Una formulación comparativamente reciente la proporciona Olivier Blanchard. Si denota la tasa de inflación en el tiempo t , que se define como el cambio porcentual en el nivel de precios medido por un índice de precios representativo, como el índice de precios al consumidor (IPC), y si UN t denota la tasa de desempleo en el tiempo t , entonces la versión moderna de la curva de Phillips se expresa según el siguiente formato:
Como no se puede observar de manera directa, en primer lugar se simplifica con la suposición de que = 1 ; es decir, la inflación esperada este año es la tasa de inflación que prevaleció el año anterior; por supuesto, se pueden formular suposiciones más complicadas respecto de la formación de expectativas. Al sustituir esta suposición en la ecuación anterior y escribir el modelo de regresión en la forma estándar, obtenemos la siguiente ecuación de estimación:
donde β1 = − β2 . La última ecuación establece que el cambio en la tasa de inflación entre los dos periodos está linealmente relacionado con la tasa de desempleo real. A priori , se espera que β2 sea negativa y β1 positiva (porque β2 es negativa y es positiva). A propósito, la relación de Phillips, se conoce en la bibliografía como la curva de Phillips modificada, curva de Phillips de expectativas aumentadas (para indicar que − representa la inflación esperada) o curva aceleradora de Phillips (para indicar que una tasa de desempleo baja propicia un incremento en la tasa de inflación y, por consiguiente, una aceleración del nivel de precios).