SEMANA 2
ANALISIS DE REGRESION LINE LINEAL AL Y MUL MULTIPL TIPLE E Docente:
Mercedes Aida Osorio Maza
[email protected]
2017 - I TEORIA
TEMAS A DESARROLLAR DESARROLLAR
Análisis de Regresión Lineal Lineal Simple; Coeficiente de determinación, Coeficiente de correlación. Análisis de Regresión Polinomial de de 1er y 2do grado. Regresión Lineal Múltiple. Múltiple. Regresión Lineal Múltiple con 2 variables variables independientes.
TEMAS A DESARROLLAR DESARROLLAR
Análisis de Regresión Lineal Lineal Simple; Coeficiente de determinación, Coeficiente de correlación. Análisis de Regresión Polinomial de de 1er y 2do grado. Regresión Lineal Múltiple. Múltiple. Regresión Lineal Múltiple con 2 variables variables independientes.
ANÁLISIS DE REGRESIÓN Consiste en emplear métodos estadísticos que determinen matemáticamente un modelo de la curva que más se ajusta a los datos. Es decir:
y = f ( xi xi )
Donde: y = variable dependiente x = variable independiente f = función Para elegir la relación funcional que más se ajusta a los datos lo 1ro que debemos hacer es el diagrama de dispersión.
DIAGRAMA DE DISPERSIÓN Es la gráfica de los valores (x i , yi) este diagrama permite visualizar la tendencia que siguen los puntos ya sea lineal, exponencial, etc.
Otros diagramas de dispersión:
En base a la tendencia que siguen los datos nosotros analizamos los diferentes tipos de regresión.
1.-
ANÁLISIS DE REGRESIÓN LINEAL
2.-
ANALISIS DE REGRESION EXPONENCIAL
3.-
ANALISIS DE REGRESION POTENCIAL
4.- ANALISIS DE REGRESIÓN POLINOMIAL
5.-ANALISIS DE REGRESIÓN LINEAL MÚLTIPLE
1.-
ANÁLISIS DE REGRESIÓN LINEAL
Es aquel análisis cuando la relación entre “x” e “y” es de
tipo lineal. Matemáticamente el modelo será:
yi
A Bxi i
Donde: Variable dependiente x i Variable indenpendiente A, B Coeficient es i Error yi
Si tenemos un diagrama de dispersión lineal y si asumimos un modelo de estimación de la forma: Tendremos:
yi ˆ
yi ˆ
a bxi
a bxi
(Modelo Muestral)
i yi
A Bx i
(Modelo Poblacional)
Para que el modelo estimado este muy próximo al modelo real, nosotros debemos minimizar el error.
Tomando una observación el error será
1
y1 y1 ˆ
Luego la recta que mejor se ajusta será aquella que minimice la suma cuadrado del error: i2 yi yi 2 min. ˆ
Es decir: n
y1 y1 y 2 y2 ..................yi yi yi yi 2 2 i
2
2
ˆ
ˆ
2
ˆ
ˆ
i 1
Para hallar los estimadores “a” y “b” que hagan mínimo el error se estimara de: i2 0 a
i2 0 b
Ecuaciones Normales
Obtenemos las Ecuaciones Normales: 1 era Ecuación Normal n
y i 1
n
i
na b x i i 1
2 da Ecuación Normal n
n
x y a x i
i 1
i
i 1
n
i
b x 0 2 i
i 1
2.- ANÁLISIS DE REGRESIÓN EXPONENCIAL Cuando el diagrama de dispersión se nos presenta en la siguiente forma:
El modelo será linealizado tomando logaritmo natural y/o función logaritmo. y ab lny
x
lna xlnb
y * a * b * x
La estimación de a* y b* se halla igual que la regresión lineal simple de las ecuaciones:
y* na * b * x Ecuaciones normales xy* a * x b * x i
i
2 i
La regresión exponencial se presenta en muchos problemas de Física, Química Economía. Etc.
3.- ANÁLISIS DE REGRESIÓN POTENCIAL Si se presenta un modelo la manera de linealizarlo es mediante ln y/o log. lny ln(ax b ) lny lna blnx
Las ecuaciones serán:
x y *
yi
* i
na * b * x*i * i
a * x i b x*i2
COEFICIENTE DE DETERMINACIÓN (r 2) Es aquella medida conocida también como coeficiente de bondad de ajuste ya que indica en que porcentaje se ajusta la línea de regresión al conjuntos de datos.
y - y r y - y
2
2
ˆ
i
2
i
Valor observado yi Valor estimado en base al modelo yi a bx i yi ˆ
ˆ
Gráficamente:
r 2
Mide el %de la variacion de " y"explicada por la variable" x"
Gráficamente el coeficiente de determinación se observa:
Se sabe:
y i Valor Observado y i Valor Estimado ˆ
yi - y Desviación yi con respecto al promedio y. yi - y desviación de yi con respecto al promedio y. ˆ
i yi yi ˆ
Luego: 2 2 2 y y y y i i i ˆ
.
S.Cuad.Tot al S.C. Regresión S.C. Error
Coeficiente de No Determinación (1 – r2) Nos indica el % porcentaje de la variación de y que no depende de la variación de “x”, su variación se debe a los factores aleatorios. Coeficiente de Correlación (r) Mide el grado de asociación entre “x” e “y”.
En la regresión múltiple: 2 r y.12
2Variables Independientes
4.- ANÁLISIS DE REGRESIÓN POLINOMIAL yi Bo B1x B2 x 2 B3 x 3 .................. i
Se aplica cuando en el diagrama de dispersión los puntos no siguen una tendencia lineal sino una tendencia curva. Ya sea de 2do grado, 3ro grado, etc.
Para poder hallar los parámetros: Bo , B1 , B2 ,..............., etc. ˆ
ˆ
ˆ
Aplicaremos el criterio de los mínimos cuadráticos: n
2 i
min
i 1
Luego:
i2 0 Bo Nos genera estimadores que minimicen la suma cuadrado del error.
Luego obtendremos:
................ y
2 3 B0 x B1 x B2 x .......... yx Ecuaciones Normales 2 3 4 2 B0 x B1 x B2 x ........ yx B0 n B1 ˆ
ˆ
ˆ
ˆ
x B2
ˆ
ˆ
x2
ˆ
ˆ
ˆ
(Así sucesivamente)
4.1) REGRESIÓN POLINOMIAL (2do Grado) Gráficamente:
Expresando matricialmente tenemos:
y
2 3 B0 x B1 x B2 x yx 2 3 4 2 B0 x B1 x B2 x yx B0 n B1
x B2
x2
Los estimadores B0 , B1 , B2 se hallan ˆ
ˆ
ˆ
de las Ecuaciones Normales
Del modelo:
yi
Bo B1x i B2 x i ˆ
ˆ
ˆ
2 i
Matricialmente será:
xB i y i y i i yi
ˆ
ˆ
Luego: Ejemplo (n = 4) y1 1 y 2 1 y 3 1 y 4 1
x1
x 12
i B0 2 x2 i B1 2 i x3 B 2 2 x 4 i ˆ
x2
ˆ
x3
ˆ
x4
Para poder hallar los parámetros, aplicamos el método de los mínimos cuadrados. 12 y xB y xB 0 0 Bi Bi ˆ
xx B xy 1 B x x xy ˆ
ˆ
NOTA : Si
ˆ
xB i i y i xB
yi
Hallamos (x’x) y (x’y)
n x x x i x i2
x x x x xi
xi 2
2 i
3 i
3 i
4 i
yi xy xi yi xi2 yi El vector de coeficiente será:
B0 1 B x x xy B1 B2 ˆ
ˆ
ˆ
ˆ
El modelo matricial será: yi ˆ
xB y/o yi Bo B1x i B2 x i2 ˆ
ˆ
ˆ
ˆ
ˆ
5.-
ANÁLISIS DE REGRESIÓN LINEAL MULTIPLE
Sean x1, x2, ..................., x P, p variables independientes, y una variable aleatoria que depende de las “k” variables independientes. El método matemático de regresión lineal múltiple es: yi
B0 B1x1 B2 x 2 B3X 3 .................B p x p i
El problema al igual que en la regresión lineal es estimar los parámetros: B 0 , B1 , B 2 ,.............B P ˆ
ˆ
ˆ
ˆ
Esto se halla minimizando la suma cuadrado del error
Si: Q
n
i i 1
n
n
y i y i 2
ˆ
i 1
yi
B0 B1x1 B2 x 2 ........B p x p ˆ
ˆ
ˆ
i 1
Luego:
Q 0. Bk Nos dará estimadores mínimos cuadrados
Q Q 0, 0,.................. B2 B1
ˆ
2
5.1)
REGRESIÓN LINEAL MULTIPLE (2 Variables Independientes)
Si: Q
n
n
n
yi yi yi B0 B1x1 B2 x 2 2
2 I
2
ˆ
ˆ
ˆ
ˆ
i 1
i 1
i 1
Luego las ecuaciones normales son:
x B x y B x B x B x x x y B x B x x B x x y nB0 B1 ˆ
ˆ
ˆ
0
0
ˆ
1
2
ˆ
ˆ
1 1
ˆ
1
2 1 1
ˆ
2
2
2
2
1
ˆ
2
i
2
1
i
2 2
2
i
Expresando matricialmente :
yi
xB i i
Ejemplo (n = 4)
y1 1 y 1 2 y3 1 y 4 1 Luego:
x11
1 B0 x 22 2 B1 x 23 3 B2 x 24 4 x 21
ˆ
x12
ˆ
x13
ˆ
x14
Los valores de B i se hallan de:
i2 Bi i2 y xB y xB 0 Bi Bi Luego:
x x B x y B x x x y ˆ
1
ˆ
Hallamos(x’x) 1 1 1 1 x x11 x12 x13 x14 2 2 2 2 x 21 x 22 x 23 x 24
1 1 x 1 1
x11
x 221
x12
x 222
x13 x14
x 223
x 2 24
Luego:
n n xx x1i i1 n x 2i i1
n
x
1i
i 1 n
x 21i
i 1 n
x x 1i
2i
i 1
1 1 1 1 x x 11 x12 x13 x14 2 2 2 2 x 21 x 22 x 23 x 24
Luego:
x 2i i 1 n x x 1i 2i i 1 n x 2i i 1 n
y1 y 2 y y3 y4
Entonces: 1 x x xy
Bi ˆ
Matriz Inversa. (Metodo Gauss - Jordan y / o cofactores)
Coeficiente de determinación en la regresión lineal múltiple
B0 B1x1 B2 x 2 (Modelo Estimado) yi Valor Observado yi ˆ
ˆ
ˆ
ˆ
VIDEO INTRODUCTORIO DE ANÁLISIS DE REGRESIÓN LINEAL Y MÚLTIPLE
VIDEO DE RESOLUCIÓN DE EJERCICIOS DE ANÁLISIS DE REGRESIÓN LINEAL Y MÚLTIPLE