Universidad Nacional Autónoma de Nicaragua-León Facultad de Ciencias Económicas y Empresariales Departamento de Economía Nombre: René José Pérez Vázquez. Carn: 2013-02086-0. Carrera y a!o: Economía IV B.
Resumen capítulo 6 Gujarati: Extensiones del modelo de d e regresión lineal con dos do s variables Sumario: a) Regres Regresión ión a travé travéss del orige origenn (el inter intercep cepto, to, β 1 está ausente del modelo o es cero). b) Unid Unidad ades es de de medi medici ción ón.. c) Formas Formas func funcion ionale aless para el mode modelo lo de regres regresión ión linea lineal.l. Regresión a través del origen: a Función de Regresión !oblacional (FR!) de dos variables se presenta as"#:
Y i = β 2 X i + u i
$.%.%
# el intercepto está ausente o es cero. &plicando el ' al modelo $.%.% tenemos *ue:
Y i = β 2 X i + ^ ui
$.%.%
^
+ se obtienen las siguientes formulas (modelo sin intercepto):
XiYi ^ = Ʃ XiYi β 2
$.%.$
2
Ʃ Xi
^ )= var ( β 2
2
σ 2 Ʃ Xi
$.%.
2
σ =
^
Ʃ ui
2
n −1
$.%.-
Si comparamos las formulas anteriores, *ue tienen presente la falta de intercepto con la de a*uellos modelos *ue si tienen intercepto, tenemos *ue %:
^ = Ʃ xiyi β 2
Ʃ xi
.%.$
2
2
σ 2 Ʃ xi
^ )= var ( β 2
^ = Ʃ u^ σ 2
..%
2
i
n −2
$.%.-
/stas diferencias se deben a *ue en el modelo sin término de intercepto, se utili0an suma de cuadrados simples 1 simples 1 productos cruzados, cruzados, pero en el modelo con intercepto se utili0a la suma de cuadrados cuadrados ajustados ajustados (de (de la media) 1 productos cruzados. cruzados. Segundo, los gl para calcular
^
2
σ son (n2%) en el primer caso 1 (n23) en el segundo.
4ebemos tener en cuentas algunas cosas:
^
Ʃ ui
%)
, *ue en el modelo con intercepto es siempre cero, no necesita serlo cuando este término está
ausente. 3) /l coeficient coeficientee de determinación, determinación,
r
2
, *ue es siempre no negativo en el modelo convencional, en
ocasiones lo es en el modelo sin intercepto (o de regresión a través del origen), esto debido a *ue el
r
2
conven convencio cional nal contem contempla pla la presen presencia cia del interce intercepto pto.. !ara !ara resolv resolver er este este proble problema, ma, se calcul calculaa el 2
r simple el cual se define como:
1 5i 1 1i (en min6sculas) se utili0an por convención en 7u8arati para representar las desviaciones respecto a los valores
´ ´ medios: xi=( Xi − X ) y yi=( Yi −Y ) .
2
2
r simple =
( Ʃ XiYi XiYi ) 2
Ʃ Xi Ʃ Yi
2
9ota: se trata de sumas de cuadrados simples (no corregidos por la media) 1 de productos cru0ados. 2
4ebido a *ue no presentan al
r simple no es directamente comparable con el r
r
2
convencional, algunos autores
2
en modelos de regresión sin intercepto.
&menos de *ue a1a una e5pectativa a priori mu1 sólida, es aconse8able apegarse al modelo convencional 1 en caso de *ue nuestro modelo si tenga un intercepto pero insistimos en a8ustar una regresión a través del origen, cometer"amos un error de especificación. ;er e8emplo $.%
Escalas y unidades de medición: as unidades 1 la escala en *ue se e5presan la regresada 1 la(s) regresora(s) son mu1 importantes, pues la interpretación de los coeficientes de regresión depende de ellas en gran medida.
Y i = β 2 X i + u^ i . 4efina: ^
!or e8emplo, tenemos el siguiente modelo: ¿
Yi =w 1 Y i
¿
Xi = w2 X i
$.3.3
$.3.
4onde <% 1 <3 son constantes, constantes, denominadas denominadas factores factores de escala. (/stos factores factores pueden ser iguales iguales o diferentes diferentes ¿
entre s").
Yi
¿
Yi son Yi 1 Xi reescaladas. !or tanto si
1
Yi 1 Xi se e5presan en miles de ¿
millones 1 se desean e5presar en millones de dólares, se tendrá *ue:
¿
Yi =1000 Y i 1 Xi =1000 X i , en
este caso <%=<3=%>>>. ¿
Yi
Recuerde las siguientes relaciones3
=w 1 Y i
¿
(o
yi = w1 y i )?
Xi
¿
= w1 X i
¿
(o
xi = w1 xi )?
´ =w Y ´ ? X ´ =w 1 X ´ . & partir Y 1 partir de las definiciones anteriores, se puede verificar *ue:
¿
¿
u^ i =w1 ^ui ?
¿
4e los resultados anteriores debe *uedar claro *ue, con los resultados de regresión basados en una escala de medición, se pueden obtener los resultados basados en otra, una ve0 *ue se cono0can los factores de escala, w . Si la escala escala X no se cambia cambia (es decir, decir, w 3 = %), pero la escal escalaa Y se cambia cambia por el factor factor w %, %, el coeficiente de la pendiente, al igual *ue el intercepto 1 sus errores estándar respectivos, se multiplican por el mismo factor w %. %. !or 6ltimo 6ltimo,, si la escala escala Y permanece permanece inalterada inalterada (es decir, w % = %), %), pero la escal escalaa X se cambia cambia por el factor factor w 3, 3 , el coeficiente de la pendiente 1 su error estándar se multiplican por el factor (% /w (% /w 3), 3), pero el coeficiente del intercepto 1 su error estándar permanecen permanecen inalterados. ;er e8emplo e8emplo $.3. @@ Advertencia Advertencia sobre la interpretación** omo el coeficiente de la pendiente, β pendiente, β3, 3, es tan sólo la tasa de cambio, ésta se mide en las unidades de la ra0ón:
β 2 =
Unidade Unidadess de la variabledepen variabledependie diente nte Unidade Unidadess de la variable variable explicat explicativa iva
Regresión sobre variables estandarizadas omo se vio anteriormente, las unidades en las *ue se e5presan las va. dependiente 1 la va independiente influ1en en la interpretación de los coeficientes de regresión. /sto se evita si ambas variables (independiente 1 dependiente) se e5presan en variables estandari0adas. Se dice *ue una variable es estandari0ada si se resta el valor de la media de esta variable de sus valores individuales 1 se divide esa diferencia entre la desviación estándar de la variable (S1, S5). ¿
Yi =
´ i Yi−Y S y
6.3.1
2 ;éase e5plicación e5tendida en página %AA.
¿
Xi =
´ i Xi − X S x
6.3.2
se llaman variables estandari0adas. Una propiedad interesante de una variable estandarizada es que el valor de su media siempre es cero y que su desviación estándar siempre es . .
Yi* y Xi*
/n lugar de tener una regresión bivariada o estándar, tenemos una regresión sobre variables estandari0adas: ¿ ¿ ¿ ¿ ¿ $..B Y i = β 1 + β 2 X i + u i !ero en el caso de una regresión de variables estandari0adas, el intercepto es siempre cero , por lo *ue la regresión será una a través del origen. ¿ ¿ ¿ ¿ $..A Y i = β 2 X i + ui os coeficientes betas de la regresión con va. estandari0adas se llaman coeficientes beta. Cómo se interpretan los coeficientes betaD a interpretación es *ue si la regresora (estandari0ada) se incrementa una desviación estándar, en promedio, la regresada (estandari0ada) aumenta β* aumenta β* 3 unidades de desviación estándar. !or tanto, a diferencia del modelo tradicional ($..), se mide el efecto no en términos de las unidades originales en las e5presadas X e5presadas X 1 Y , sino en unidades de desviación estándar. ; ;ease ease e8emplo desarrollado pág %ARecuerde: al igual *ue las regresiones a
^ = β^ Sx β ¿
2
2
$..-
Sy
través del origen, el
r
2
usual no se
aplica. Segundo, e5iste una relación interesante entre los coeficientes E del modelo convencional 1 los coeficientes beta. !ara el caso bivariado, la elación es como sigue:
Se pueden intercambiar los β los β con los coeficientes beta si se conoce la desviación estándar (muestral) de la regresora 1 de la regresada.
Formas uncionales de los modelos de regresión &lgunos modelos de regresión mu1 comunes, *ue pueden ser no lineales en las variables pero s" lineales en los parámetros, o *ue pueden serlo mediante transformaciones apropiadas de las variables. &lgunas de estas formas son: a 'odelo oglineal ogli neal (loglog, (logl og, doblelog) doble log) Se ace uso de este modelo en los casos *ue se presenten modelos conocidos como de regresión e5ponencial: β ui $.A.% Yi = β 1 X e 2
i
+ *ue mediante transformación apropiada, sus parámetros se pueden lineali0ar 1 *ueda: $.A.3 lnYi = ln β 1+ β 2 Xi + ui $.A.
lnYi= ∝+ β 2 Xi + ui
= ln β 1
∝
.
Siendo lineal en los parámetros
∝
1 β 2
, se
puede estimar por '.
3 Recuerde, de la ecuación (.%.), *ue el intercepto es igual al valor de la media de la variable dependiente menos la pendiente multiplicada por el valor de la media de la regresora.
β 2 mide la
Una caracter"stica sumamente importante del modelo loglog, es *ue el coeficiente de la pendiente
elasticidad de + con respecto de G, es decir, el cambio porcentual en + ante un pe*ueHo cambio porcentual en G. !ueden observarse dos caracter"sticas especiales del modelo loglineal: el modelo supone *ue el coeficiente de la elasticidad elasticidad entre Y 1 X ,
β 2 , permanece constante a través del tiempo, de a*u" su otro nombre, modelo de
elasticidad constante !. tro tro aspect aspectoo del del mode modelo lo es *ue, *ue, a pesa pesarr de *ue insesgados de ! 1 β3, β3, β β%% (el parámetro del modelo original) al estimarse como
∝ ^
1
β 2 son estimadores estimadores ^
β 1 .= antilog (
∝ ^
) es, en s", un
estimador sesgado. /n la ma1or parte de los problemas prácticos, sin embargo, el término del intercepto es de importancia secundaria 1 no es necesario preocuparse por obtener este estimador insesgado
Un modelo de elasticidad constante permitirá obtener un cambio constante en el i ngreso total ante un cambio porcentual dado en precios sin importar el nivel absoluto del precio.
/n el modelo de dos variables, la forma más simple de decidir si el modelo loglineal se a8usta a los datos es graficar el diagrama de dispersión de lnYi ln Yi frente a ln Xi 1 ver si las observaciones caen más o menos sobre una l"nea recta, como en la fi gura $.b $. b. Advertencia" /l lector debe tener presente la distinción entre un cambio porcentual 1 uno en puntos porcentuales.
;er e8emplo $.
b 'odelos 'odelos semi semilog logar" ar"tm tmico icos: s: logli loglinn 1 linlog linlog on frecuencia, frecuencia, generalment generalmentee se utili0an los modelos log"lin # para medir tasas de crecimientos. Se procede a partir de un modelo *ue no es lineal en sus parámetros 1 luego por ln se transforma en lineal por e8emplo: t $.$.% Yi =Y 0 0 ( 1 + r ) &plicando ln tenemos:
os modelos como ($.$.$) se denominan modelos semilog por*ue sólo una variable (en este caso, la regresada) aparece en forma logar"tmica. /n este modelo, el coe#iciente de la pendiente mide el cambio proporcional constante o relativo en Y para un cambio absoluto dado en el valor de la re$resora (en este caso, la variable t ), ), es decir:
β 2 =
Cambiorelativoen regre regresada sada Cambio Cambio absolutoen absolutoen laregreso laregresora ra
$.$.
Si multip multiplic licamo amoss el cambio cambio relativo relativo en Y por %>>, ($.$.) ($.$.) dará dará entonc entonces es el cambio cambio porcen porcentua tual,l, o la tasa de crecimiento, crecimiento, en Y ocasionada por un cambio absoluto en X en X , la variable regresora. & β & β33 se conoce en la bibliograf"a como la semielasticidad de Y respecto de X de X . β3, β3, da la tasa de crecimiento instantánea (en un momento dado) 1 no la compuesta (durante un periodo). !ero esta 6ltima se calcula fácilmente a partir de ($.$.B). !ara ello, se obtiene el antilogaritmo de la β3 estimada, se resta % 1 se multiplica la diferencia por %>>. ;éase e8emplo $.B %odelo de tendencia lineal /n lugar de estimar el modelo ($.$.$), los investigadores algunas veces estiman el siguiente modelo: Yt = β% β% I β I β33t I ut $6%6%&'
! 9os interesaba encontrar el crecimiento porcentual en Y ante un cambio unitario absoluto en X en X
/s decir, en lugar de regresar el log de Y sobre el tiempo, regresan Y sobre el tiempo, tiempo, donde Y es la variable regresada en consideración. Un modelo de este tipo se denomina modelo de tendencia lineal, lineal , 1 la variable tiempo t se conoce conoce como como variable de tendencia. tendencia. Si el coeficiente de la pendiente en ($.$.J) es positivo, e5iste una tendencia creciente en Y , mientras *ue si es negativa, e5iste una tendencia decreciente en Y& a elección entre el modelo de crecimiento ($.$.A) 1 el modelo de tendencia lineal ($.$.J) dependerá de *ue el interés recaiga en el cambio relativo o absoluto del gasto en servicios, aun*ue, para propósitos de comparación, es el cambio relativo el *ue tiene ma1or importancia.
os modelos lin"log: con este modelo lo *ue deseamos es encontrar el cambio absoluto en Y debido a un cambio porcentual en X en X . Un modelo *ue cumple este propósito se escribe como: Yi ( β)* β+ln Xi *ui
$6%6%))'
Knterpretemos el coeficiente de la pendiente β pendiente β3. 3. omo de costumbre:
β 2 =
Camb Cambio io enY CambioenY = Cambi Cambio o enlnX Cambi Cambiorel orelat ativo ivo en X
/l segundo paso se deriva de *ue un cambio en el lo$ de un n'mero es un cambio relativo. relativo . Simbólicamente, tenemos:
β 2 =
∆ Y ∆ X / X
$.$.%3
a ecuación $.$.%3 se reordena de la forma siguiente:
∆ Y = β 2 ( ∆ X / X )
$.$.%
/sta ecuación plantea *ue el cambio absoluto en Y (= Y ) es igual a la pendiente multiplicada por el cambio relativo en X en X . Si este 6ltimo se multiplica por %>>, entonces ($.$.%) da el cambio absoluto en Y ocasionado por un cambio porcentual en X en X . &s", si (X/X si (X/X cambia en >.>% unidades (o %L), el cambio absoluto en Y es >.>%( β3). β3). /8emplo de ello es el modelo de gasto de /ngel (ver e8emplo $.A). &lgunas veces, se utili0a la transformación logar"tmica para reducir la etereoscedasticidad, as" como la simetr"a. c 'ode 'odelo loss rec" rec"pr proc ocos os@@ @@
Y i = β 1 + β 2
1
Xi
+u i
$..%
# no lineal en la variable X variable X por*ue entra inversamente o en forma rec"proca, el modelo es lineal en β en β% 1 β 1 β3. /ste modelo tiene las siguientes siguientes caracter"stica caracter"sticas: s: a medida medida *ue X *ue X aumenta indefinidamente, el término β término β33 (% /X ) se acerca a cero (nota" (nota" β3 β3 es una constante) 1 Y se apro5ima al valor l"mite o asintótico β%. β%. !or consiguiente, modelos como ($..%) contienen un valor asintótico o l"mite *ue tomará la variable dependiente cuando el valor de la variable X aumente indefinidamente. &lgunas formas probables de la curva correspondiente a ($..%) se muestran en la figura $.$:
;er e8emplos $.$ 1 $.
d 'odelos 'odelos log log ipér ipérbol bolaa o rec"pro rec"proco co logar" logar"tmi tmico co /stos modelos adoptan la siguiente forma: 1
ln Y i = β 1 + β 2 Xi + u i
$..-
Su forma se ilustra en la figura $.%>. omo se muestra a", al principio Y se incrementa con una tasa creciente (es decir, la curva es conve5a al inicio) 1 luego aumenta con una tasa decreciente (la curva se convierte en cóncava).
Elección de orma uncional a elección de una forma funcional particular puede ser relativamente fácil para el caso de dos variables, pues se pueden graficar las variables 1 tener as" una ligera idea respecto del modelo adecuado. a elección se complica muco más cuando se considera el modelo de regresión m6ltiple *ue implica más de una regresora. &lgunas sugerencias: /s una buena costumbre calcular la tasa de cambio (es decir, la pendiente) de la regresada respecto de la regresora, as" como conocer la elasticidad de la regresada respecto de la regresora. !ara los diversos modelos estudiados en este cap"tulo, en la tabla $.$ se ofrecen las fórmulas necesarias para los coeficientes de la pendiente 1 la elasticidad de los distintos modelos. os coeficientes del modelo escogido deberán satisfacer determinadas e5pectativas a priori . Se debe asegurar de *ue, al comparar dos valores de r 3, la variable dependiente (o regresada) de los dos modelos sea la misma? la(s) regresora(s) pueden tomar cual*uier forma. 9o se debe sobrevaluar la medida de r 3 en el sentido de creer *ue mientras más alta sea r 3 me8or será el modelo. o *ue reviste ma1or importancia es la 8ustificación teórica del modelo elegido, los signos de los coeficientes estimados 1 su importancia estad"stica. /n algunas situaciones tal ve0 no sea fácil ponerse de acuerdo sobre una forma funcional concreta, en • cu1o caso se pueden usar las llamadas transformaciones Mo5o5. /n vista de *ue este tema es mu1 técnico, anali0amos el procedimiento Mo5o5 en el apéndice $&.A. •
• •
•