UNIDAD I REGRESION LINEAL SIMPLE Y CORRELACION
1.1 EL MODELO DE REGRESIÓN SIMPLE. La regresión y correlación son las dos herramientas estadsticas m!s "oderosas y #ers!tiles $%e se "%eden %tili&ar "ara sol%cionar "ro'lemas com%nes en los negocios •
(i"os de #aria'les )aria'le )aria'le de"endiente. Desea e*"licar o "redecir. )aria'le de res"%esta )aria'le )aria'le inde"endiente. )aria'le )aria'le e*"licati#a o regresor –
•
–
•
•
El "rimero en desarrollar %n analisis de regresión +%e le cienti+ico Sir ,rancis Galton -1//01112 Se dice $%e Y est! est! regresando "or X
•
Diagrama de dis"ersión
•
Lineal. 3 medida $%e X cam'ia4 Y cam'ia en %na cantidad constante Curvilínea. 5 cam'ia en %na cantidad di+erente a medida de $%e 6 cam'ia
El modelo de regresión más sencillo es el Modelo de Regresión Lineal Sim"le que esudi! l! rel!ción line!l enre l! "!ri!#le res$ues! % l! "!ri!#le n regresor! & ! $!rir de un! muesr! i ' ( & que sigue el siguiene modelo) *+,(Por !no& es un modelo de regresión $!r!m.rico de dise/o 0i1o, En 0orm! m!rici!l *+,2, t ' , t ' , t ' . donde t ' Se su$one que se "eri0ic!n l!s siguienes 3i$óesis) (, L! 0unción de regresión es line!l& o& equi"!lenemene& E ' 4, i ' (,...,n. 2, L! "!ri!n5! es cons!ne *homocedasticidad-& o& equi"!lenemene& V ar 6, L! disri#ución es norm!l& o& equi"!lenemene&
7 N
i
'
2
, i ' (,...,n.
, i ' (,...,n.
8, L!s o#ser"!ciones Y i son inde$endienes, 9!1o l!s 3i$óesis de norm!lid!d& eso equi"!le ! que l! Cov *Y i,Y j- ' 4,si i j. Es! 3i$óesis en 0unción de los errores ser:! ;los i son inde$endienes<& que #!1o norm!lid!d& equi"!le ! que Cov ' 4, si i j.
1.2 SUPUESTOS Supuesto 1 El termino error en una variable aleatoria distribuida normalmente Supuesto 2 Varianzas iguales de los valores Y (homocedasticidad) Supuesto 3 Los terminos de error son independientes uno de otro Supuesto 4 Supuesto de linealidad
•
–
•
–
•
–
•
–
ε i
= (Y − Y ˆ )
∑
i
ε
i
= 0 Y = b0 + b1 X + ε
1. Linealidad. Si no se tiene linealidad se dice que tenemos un error de especifcación. En el caso de que sean varias variables independientes, la opción Analizar-RegresiónLineal-r!fcos-enerar todos los gr!fcos parciales nos da los diagramas de dispersión parcial para cada variable independiente. En ellos se "a eliminado el e#ecto proveniente de las otras variables $ as% la relación que muestran es la relación neta entre las variables representadas. &. 'ndependencia de la variable aleatoria (residuos) *especialmente importante si los datos se "an obtenidos siguiendo una secuencia temporal+. 'ndependencia entre los residuos mediante el estad%stico de urbinatson que toma valor & cuando los residuos son completamente independientes *entre 1. $ &. se considera que e/iste independencia+, 0& indica autocorrelación positiva $ & autocorrelación negativa
2. 3omocedasticidad o igualdad de varianzas de los residuos $ los pronósticos. Esta condición se estudia utilizando las variables4 56RE7pronósticos tipifcados $ 5RES'7residuos tipifcados mediante4 8 el estad%stico de Levene *ver e/plorar+ 8 un gr!fco de dispersión .9ue se obtiene en Analizar-Regresión-Linealr!fcos. El supuesto de "omocedasticidad implica que la variación de los residuos sea uni#orme en todo el rango de valores de los pronósticos *gr!fco sin pautas de asociación+. :. ;ormalidad de los residuos tipifcados. 6odemos contrastarla mediante4 8 La prueba de
ade una curva ;*?,1+ r!fco de 6robabilidad ;ormal de tipo 6-64 Representa las proporciones acumuladas de la variable esperada respecto a las proporciones acumuladas de la variable observada. . ;o-colinealidad, es decir la ine/istencia de colinealidad. Esta puede ser4 colinealidad per#ecta si una de las variables independientes tiene una relación lineal con otra@as independientes, colinealidad parcial si entre las variables independientes e/isten altas correlaciones
1.3 DETERMINACIÓN DE LA ECUACIÓN DE REGRESIÓN Ecuación de regreión !c"n MCO#$ •
b1 __
b0
__
= Y − b1 X
=
∑
∑ X ∑ Y XY −
∑
n
X
2
−
( ∑ X ) n
2
ˆ Y
= b0 + b1 X
Donde : b0
: Intercepto
b1
: Pendiente de la recta
•
E%e&'(" Se au&e )ue *i+a , P(u- Inc.- rec"(ec+a da+" "re (" ga+" 'u(ici+ari" / (" ingre" '"r 0en+a de &ee- c"&" e &ue+ra en (a +a(a Rea(ice un an(ii de regreión E%ecici" La gerencia de "' Sc"+c4 Air(ine- (a e&'rea +ran'"r+ad"ra & 'e)ue5a de( &und"- c"nidera )ue e6i+e una re(ación direc+a en+re (" ga+" 'u(ici+ari" / e( n7&er" de 'aa%er" )ue ec"ge 0ia%ar c"n e((". Para de+er&inar i (a re(ación e6i+e/ i e a8 cu( '"dr8a er (a na+ura(e9a e6ac+a- (" e+ad8+ic" e&'(ead" '"r (a aer"(8nea decidier"n u+i(i9ar (" 'r"cedi&ien+" MCO 'ara de+er&inar e( &"de(" de regreión (inea(. Se rec"(ec+ar"n (" 0a("re &enua(e '"r (" ga+" de 'u(icidad / e( n7&er" de 'aa%er" 'ara (" n:1 &ee & recien+e –
–
•
–
–
1.; MEDIDAS DE *ARIACIÓN
1. CALCULO DE LOS COEcien+e de c"rre(ación Car( Pear"n C"e>cien+e de c"rre(ación 'r"duc+"?&"&en+" Se re'reen+a c"n r *a("re en+re ?1 / 1 •
– – – –
(∑
∑ ∑ ∑ ∑ )2 − XY − ∑ 2 r = r = X 2 − ( ∑ ) Y 2 − ( ∑ ) X 2 − ( ∑ ) Y 2 − ( ∑ ) ∑ ∑ ∑ ∑ X
n
•
X
XY
Y
X
n
2
Y
n
Y
2
X
n
n
2
Y
2
n
C"e>cien+e de de+er&inación Medida de "ndad de a%u+e @ue '"rcen+a%e de ca&i" en Y e e6'(ica '"r un ca&i" en Se re'reen+a c"n r 2 – –
–
1. ANBLISIS RESIDUAL Err"r e+ndar de e+i&ación Medida de "ndad de a%u+e Grad" de di'erión de (" 0a("re = a(reded"r de (a rec+a de regreión E( err"r e+ndar ie&'re e re'reen+a en (a &i&a unidade )ue (a 0aria(e de'endien+e Y •
– –
–
∑ ∑ Y 2 − ( ∑ ) − (∑ XY − ∑ (∑ ) 2 X − ∑ Se = n−2 X
Y
n
Y
2
n
X
n
2
) 2
Y ± Se
•
Ti'" de 0aria(e *aria(e de'endien+e. Deea e6'(icar " 'redecir. *aria(e de re'ue+a *aria(e inde'endien+e. *aria(e e6'(ica+i0a " regre"r –
•
–
•
1. IN
1. APLICACIONES