Rosmery Mayta
29/04/2014
Objetivo:
29/04/2014
Rosm eri Mayta H.
1
Hacer un diagrama de dispersión Calcular el coeficiente de Pearson Calcular e interpretar el Coeficiente de Correlación, coeficiente de Determinación y no determinación. determinación. Calcular el coeficiente de correlación de rango. En este capitulo se verá la relación que existe entre dos variables, se usaran medidas para medir el grado de relación como el coeficiente de de determinación y el coeficiente de correlación
29/04/2014
Rosm eri Mayta H.
2
Prue Prueba ba de hipó hipóte tesi siss de los los coef coefic icie ient ntes es lcular los intervalo valoss de confianza y de Calcu predicción. de Estudiar las técnicas de análisis influencia
29/04/2014
Rosm eri Mayta H.
3
29/04/2014
Diagrama de dispersión
•
•
•
•
Y
•
•
•
•
•
•
•
•
• •
• •
• •
•
•
•
•
•
•
•
•
X
Rosm eri Mayta H.
•
• • •
•
( d) d) Cu Cu rv rv il in in ea ea in in ve ve rs rs a
•
•
X
•
• •
•
• •
• •
Y •
•
•
•
•
X
Y •
LA variable independiente se representa en al escala del eje X, y es la variable que proporciona las bases para el calculo. Es la variable de predicción.
• •
•
X
•
4
Y
•
• • • • •
Rosm eri Mayta H.
( c) c) Cu Cu rv rv il ín ín ea ea di di re re ct ct a
Y •
Relaciones posibles entre X y Y vistos en diagramas de dispersión
29/04/2014
( b) b) L in ea ea l i nv nv er er sa sa
(a) Lineal directa Y
Análisi Análisiss de correl correlaci ación. ón.-- Es el con conjun junto de téc técnica nicass esta estadí díst stic icaas emple pleado para para medi edir la inte intennsid sidad de la rel relación que existe entre tre dos varia riables. Para esto, to, norm normalm almen ente te,, el prim primer er paso paso es most mostra rarr los los dato datoss en un . Perm Permit itir iráá pred predec ecir ir la vari variab able le depe depend ndie ient ntee Y con con base base en la vari variab able le inde indepe pend ndie ient ntee X. Gráf Gráfic icaa que que repr repres esen enta ta la relaci relación ón entre entre dos dos variab variables les.. La vari variab able le depe depend ndie ient ntee se repr repres esen enta ta en la esca escala la del del eje eje Y, y es la vari variab able le que que se estim estima, a, pred predic icee o calc calcul ula. a.
• •
•
•
•
•
• • •
•• • ••
X
( e) e) L in ea ea l i nv nv er er sa sa con más dispersión
X
(d) Ninguna relación
5
29/04/2014
Rosm eri Mayta H.
6
1
Rosmery Mayta
29/04/2014
Fuerte Moderada Negativa Negativa -1 -0,9 Perfecta Negativa
29/04/2014
-0,5
Débil Negativa
Débil Positiva 0
Moderada Positiva 0,5
No existe correlación
Rosm eri Mayta H.
(r 2).
Una Una preg pregun unta ta impo import rtan ante te que que se plant lantea ea en el anál anális isis is de reg regres resión es la sigu iguiente ente:: ¿Qué porce rcentaje de la variación total en Y se debe a la variación en X? En otra otrass pala palabbras, ras, ¿cuá ¿cuáll es la prop roporci orción ón de la vari variaación ción tota totall en Y que que pued puedee ser ser “exp “explilica cada da”” por por la vari variac ació iónn en X? El esta estadí díst stic icoo que que mide mide esta esta prop propor orci ción ón o porc porcen enta taje je se deno denomina mina coeficien coeficiente te de determina determinación ción::
Fuerte Positiva 0 ,9 1 Perfecta Positiva
7
: Esta dado por 1- r 2 Es proporción de la variación de y que no es explic explicada ada por por X
29/04/2014
Rosm eri Mayta H.
8
Es una técnica estadística que permite det determi erminnar la mejo mejorr ecua ecuaci cióón que que repr epresent sentee la relaci relación ón entre entre dos variab variables les relaci relaciona onadas das.. Para pode poderr esta establ bleecer cer la rela relaci cióón cuan cuanti tita tattiva iva Par entre X e Y es necesario disponer de pares de obse observ rvac acio ione nes. s. Cada Cada par par ha sido sido regi regist strrado ado a la misma misma unidad unidad elemen elemental tal..
a) Normalidad: los valores de Y estarán distribuidos distribuidos normalmente para cada valor de X. X. b) Homo Homosc sced edaastic sticid idad ad:: la vari variac ació iónn alre alrede dedo dorr de la línea de regres resión sea con constante para todos los valo valore ress de X. c) Inde Indepen pende denci nciaa de error error:: el error error (difer (diferen encia cia residu residual al entre un valor observado y uno estimado de Y) sea indep indepen endie diente ntemen mente te de cada cada valor valor de X. d) Linealid Linealidad ad:: la relaci relación ón entre entre las variab variables les es lineal lineal..
29/04/2014
29/04/2014
Rosm eri Mayta H.
9
Empleada para obtener la ecuación de regresión, minimizando la suma de los cuadrados de las distancias verticales entre los valores verdaderos de Yi y los valores valores prono pronosti sticad cados os de Y.
Rosm eri Mayta H.
10
El método consiste en determinar una ecuación que la suma de los errores al cuadra cuadrado do sea mín mínima. ima. Y
Y
i
- Y = err or
Línea de estimación
.
10
8
Y ˆ
6
Min Y - Y
i
2
4
•
Error=-6
2
• •
.
Error= 2
10
12
X 2
29/04/2014
Rosm eri Mayta H.
11
29/04/2014
Rosm eri Mayta H.
4
6
8
14
12
2
Rosmery Mayta
29/04/2014
El méto método do util utiliz izaa un sist sistem emaa de ecua ecuaci ción ón llam llamad adoo ecuaci ecuacione oness normal normales es, que tienen la siguiente forma: X
Y nb0 + b1 X 2 XY b0 X b1X Par Para aplic plicar ar las fór fórmula mulas, s, tene tenemo moss que que conf confec ecci cion onar ar un cuadro como el siguiente: 29/04/2014
Rosm eri Mayta H.
X
8.0 15.0 18.0 30.0 42.0 45.5 60.0 76.5 70.0 77.0
Yˆ 7,479
126.0 126.3 442.0
Y
2
X
XY 13
XY X Y n X X
Sustituyendo los valores Y 126,0, n = 5, X 3 2,5 2 XY442 y X 12 6 , 3 ,en las ecuaciones normales, obtenemos el siguiente sistema de ecuaciones. 126 = 10b0 + 32,5b1 442 = 32,5b0 + 126,3b1 Resolviendo el sistema tenemos: b0 = 7,479 b1= 1,576 ,por lo tanto,
2
29/04/2014
n
Rosm eri Mayta H.
15
14
Mide la disp disper ersi sión ón de Error Err or est estánd ándar ar de est estima imació ción.n.- Mide los valores observados, con respecto a la línea de regresión regresión.. Tiene las siguiente siguientess característi características: cas: Está en las mismas unidades que la variable dependiente. Se basa basa en las las desv desvia iaci cion ones es al cuad cuadrad radoo resp respec ecto to de la recta recta de regres regresión ión.. . Se calcula así:
Y b X n
1,576X Rosm eri Mayta H.
Syx=
Cons Consta tant ntee de la regr regres esió ión n li line neal al (bo).- Punt Puntoo dond dondee se inte interc rcep epta ta con con el eje eje Y, se calc calcul ulaa asi asi :
29/04/2014
32. 5
1.0 2.3 4.0 6.3 9.0 12.3 16.0 20.3 25.0 30.3
Pendiente de la regresión lineal (b1): Indica la magnitu nitudd del cam cambio bio en Y por cada unid nidad de cam cambio de X a
8.0 10.0 9.0 12.0 14.0 13.0 15.0 17.0 14.0 14.0
XY
n
2
1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5
X2
De las ecuaciones normales se obtiene las siguientes relaciones b
Y
(Y-Y)
2
ˆ
n2
29/ 04/ 2014
Rosm eri M ayta H.
16
29/ 04/ 2014
Rosm eri M ayta H.
18
El intervalo garantiza una confianza del 68%. Es decir decir que el valor de se encontrará dentro dentro de ese intervalo con un nivel de confianza del 68%. El intervalo garantiza una confianza del 95%. Es decir decir que el valor de se encontrará dentro dentro de ese intervalo con un nivel de confianza del 95% El intervalo garantiza una confianza del 99.9%. Es decir que el valor de se encontrará dentro dentro de ese intervalo con un nivel de confianza del 99.9%
29/04/2014
Rosm eri Mayta H.
17
3
Rosmery Mayta
29/04/2014
Problema
Problema
La EMPRESA COPI COPIER ER SALE SALES S OF AMER AMERIC ICAN AN ENC. ENC... Vende copi as as a negociaci on ones grandes , medi an anas y pequeñas en Estados Uni do dos y Canadá . La señora Marcy fue pr om omovi da da rec recien ientem temente nte al pue puesto de gere gerent ntee nac naciona ionall de ventas ntas.. A la próxim próximaa junta junta de venta ventass asist asistiránlos iránlos repres represent entant antes es de todo todo el país. país. A ella le gustaría hacerles notar la importancia de hacer llamadas extra tra cad cada día día. Dec Decide ide reun eunir algu lguna inf informa rmación ción acerc cercaa de la rela relaci cióón entr entree el núm número ero de llam llamad adas as y el núm número ero de prod produc ucto toss vend vendid idos os . Sele Selecc ccion ionóó al azar azar una una mues muestr traa de 10 repres represen enta tant ntes es y dete determ rmin inóó el núme número ro de llama llamada dass que que hici hicier eron on el ulti ultimo mo mes mes , y el de copiad copiadora orass quevendiero quevendieronn La inform informaci ación ón mensu mensual al se tiene tiene en la siguiente siguiente tabla.
29/04/2014
Rosm eri Mayta H.
19
Repres Repres deVentas
29/04/2014
Numero_Llamadas( Número X) Copiadoras(Y)
TOM
20
30
JE FT
40
60
B RIA N
20
40
JUAN
30
60
S US A N
10
30
CARLOS
10
40
RICH
20
40
LUIS
20
50
M ARK
20
30
S ONI
30
70
de
Rosm eri Mayta H.
20
Preguntas (solucionado en clase) a) Calcular el coeficiente de correlación de correlación Calcula larr el coef coefici icien ente te de dete determ rmin inac ació iónn y no b) Calcu determinació determinaciónn e interprete interprete Hallarr la ecua ecuació ciónn de regr regres esió iónn c) Halla Interpre pretar tar los coefici coeficient entes es de regres regresión ión d) Inter Hallarr el erro errorr está estánd ndar ar.. e) Halla f) Si hago 45 llamadas cuantas copiadoras venderé
29/04/2014
Rosm eri Mayta H.
21
Se utiliza el estadístico F para probar la significación de la ecuación de regresión muestral o la existencia de regresión en la población.
Las hipótesis nula y alternativa para esta prueba son respectivamente:
29/04/2014
Rosm eri Mayta H.
22
Si Tt < Tcal , se rechaza la Ho y se acepta la Ha.
1.- Plante Planteand andoo Ho Ho y Ha Ho: β1=0 ( No hay r elación) Ha: β1 ≠ 0 ( Hay una relación) 2.- Nivel de significancia significancia de 0.05 3.- T STUDEN STUDENT T 4.- Definir la región de aceptación y la región critica Hallar el T (n-2,alfa) = tablas 5.- El Tcal.
Sb1 : Error estándar de b1 Sb1 = Syx / √ { ΣX i 2 – ( ΣXi ) 2/ n }
T cal = (b1 – B1)/Sb )/Sb11 y
Si Tt < Tcal , se rechaza la Ho y se acepta la Ha.
29/04/2014
Rosm eri Mayta H.
23
29/04/2014
Rosm eri Mayta H.
24
4
Rosmery Mayta
29/04/2014
Se aplica el estadístico t. Planteando la hipótesis nula y la alternativa 1.- Ho: ρ = 0 La correlación en la población es nula 2.- Ha: ρ ≠ 0 La correlación en la población no es nula 3.-T student R.C 4.- Definir la R.A y la R.C Para Tt ( ( n-2),alfa) ) = Tabla
29/04/2014
Rosm eri Mayta H.
25
5.5.- Si Tt < Tcal entonces rechaza la hipótesis nula de lo contrario se acepta
29/04/2014
Rosm eri Mayta H.
26
29/04/2014
Rosm eri Mayta H.
28
El valor de b1 puede variar entre un limite superior e inferior
b1 – T (α ,n-2) Sb1 < β1
Calcular el estimado del intervalo de confianza del 95%
29/04/2014
Rosm eri Mayta H.
27
Problema
29/04/2014
Rosm eri Mayta H.
29
En un departamento de producción de una empr empres esaa se dese deseaa exam examin inar ar la rela relaci ción ón entr entree el número de trabajadores que arman un sube subems msaamble mble y el núme númerro de sube subem msamb samble less prod produc ucid idos os.. Como Como expe experrimen imentto se asig asignnaron aron dos empleados para armar el dispositivo elec electr trón ónic ico. o. Prod Produj ujer eron on 15 dura durant ntee el laps lapsoo de una una hora hora.. Desp Despué uéss se asig asigna naro ronn cuat cuatro ro obre obrero ross al mism mismoo trab trabaj ajo, o, y prod produj ujer eron on 25 dura durant ntee dich dichoo perí períod odo. o. A cont contin inua uaci ción ón se pres presen enta ta el conj conjun unto to completo de pares de observaciones. Cons Consid ider erar ar un nivel nivel de signi signific fican ancia cia de 0.05 0.05..
29/04/2014
Rosm eri Mayta H.
30
5
Rosmery Mayta
29/04/2014
a.- Calcule la ecuación de regresión regresión e intérprete los resultados
Se ha obtenido un coeficiente de correlación de 0.927. Este coeficiente indica que las variables están muy relacionadas 29/04/2014
Rosm eri Mayta H.
31
La ecuación de de regresión y graficar el diagrama de dispersión
29/04/2014
Rosm eri Mayta H.
32
b.- Calcule Calcule e interprete el coeficient coeficientee de determinación Se obtu obtuvo vo un coef coefic icie ient ntee de dete determ rmin inac ació iónn 2 de r = 0.8596; esto quiere decir, que el 85.96% de la producción de subemsambles se debe al número de trabaj trabajado adores res que los arman. arman. coefic icie ient ntee de no dete determ rmin inac ació iónn indi indica ca El coef que el 14.04% de la producción no será expl explica icada da por por el núme número ro de em empl plea eado dos. s.
29/04/2014
Rosm eri Mayta H.
33
Rosm eri Mayta H.
Rosm eri Mayta H.
34
d. Calcular el intervalo de confianza y predicción para X=4
c.- Calcular e interpretar interpretar el error error standard
29/04/2014
29/04/2014
35
29/04/2014
Rosm eri Mayta H.
36
6
Rosmery Mayta
29/04/2014
f.- Realizar la prueba de hipótesis para para B1
e. Intervalo de predicción para x=4
Una empresa que disponga de 4 trabajadores para la fabricación de subemsambles estará en el intervalo entre 12.265 12.265 y 49.735 de piezas producidas.
29/04/2014
Rosm eri Mayta H.
37
29/04/2014
Rosm eri Mayta H.
38
CALCULO CON MINITAB The regression equation is PROD_HORA = 3.00 + 7.00 CANT_EMPLEA
Predictor Coef SE Coef T P Constant 3.000 5.416 0.55 0.618 CANT_EMPLEA 7.000 1.633 4.29 0.023
S = 5.16398 5.16398 R-Sq = 86.0% R-Sq(adj) = 81.3%
Analysis of Variance Variance
29/04/2014
Rosm eri Mayta H.
39
SS MS F P 490.0 490.000 490.00 18.37 0.023 80. 00 26.67 570.00
Predicted Values for New Observations New Obs Fit SE Fit 95% CI 95% PI 1 31.00 2.83 (22.00, 40.00) (12.26, 49.74) Values of Predictors for New Observations
29/04/2014
ANÁLISIS DE VARIANZA EN LA REGRESIÓN
Source DF Regression 1 Residual Error 3 Total 4
Rosm eri Mayta H.
New
40
Obs CANT_EMPLEA 1 4.
MEDIDAS DE VARIACIÓN EN REGRESIÓN Y CORRELACIÓN
El análisis de varianza es una técnica que perm permititee loca localiliza zarr las las fuen fuente tess de vari variab abililid idad ad que que ayud ayuden en a expl explic icar ar el comp compor orta tami mien ento to de la variable variable dependien dependiente. te.
SCtotal =
SCerror + SCregresión (SCresidual)
29/04/2014
Rosm eri Mayta H.
41
29/04/2014
Rosm eri Mayta H.
42
7
Rosmery Mayta
29/04/2014
SUMA DE CUADRADO TOTAL SST = Suma total de cuadrados (Variación Total
Es una medida de variación de los valores Yi alrededor de su media Y . SST = SSR + SSE
SST : suma cuadrado totales totales SSR : Suma de los cuadrados debido a la regresión (variación explicada) SSE : Suma de los cuadrados del Error (variación No explicada) 29/04/2014
Rosm eri Mayta H.
SSR = Suma de cuadrados explicada(Variación de Regresión)
43
29/ 04/ 2014
Rosm eri M ayta H.
44
COEFICIENTE DE DETERMINACIÓN r 2 = SSR SST
SSE = Suma de cuadrados no
o
r2 = 1 - SSE SSTotal
explicada.(Variación de Error)
r ajusta ajustado do = 1 – [(1-r [(1-r 2) [(n-1)/(n-2)] SSR = bo ∑ Yi Yi + b1 ∑ Xi Xi Yi - ( ∑ Yi )2/n SSE = ∑ Yi 2+ b o ∑ Xi Xi Yi Yi - b 1 ∑ Xi Yi
SSR=. Suma de cuadrado de regression SSE = Suma de cuadrado de error SST= Suma de cuadrado totales Suma de cuadrado total = Suma de cuadrado explicada+Suma de cuadrado no explicada
29/04/2014
Rosm eri Mayta H.
45
29/04/2014
Rosm eri Mayta H.
AJUSTE DE UNA TENDENCIA TENDENCIA CUADRATICA POR EL MÉTODO DE MÍNIMOS CUADRADOS
ANOVA REGRESIÓN REGRESIÓN SIMPLE FUENTE DE
GL
SS
MS
F
REGRESION
1
SSR
MSR= SSR/1
MSR MSE
ERROR
n-2
SSE
MSE = SSE /n-2
Ŷi = bo + bi Xi + bii Xi
1)
n-1
2)
SST
Rosm eri Mayta H.
47
29/04/2014
∑ Xi Yi Yi =
29/04/2014
∑ Xi Yi = bo ∑ Xi + bi ∑ Xi + bii ∑ Xi
3)
∑ Yi = nbo + bi ∑ Xi + bii ∑ Xi
TOTAL
46
bo
∑ Xi + bi ∑ Xi + bii ∑ Xi
Rosm eri Mayta H.
48
8
Rosmery Mayta
29/04/2014
AJUSTE DE UNA TENDENCIA TENDENCIA EXPONENCIAL MEDIANTE EL MÉTODO DE MÍNIMOS CUADRADOS Y lo g lo g
i
Y
b
ˆ
i
|
b
.b
o
lo g
i
|
b
o
29/04/2014
o
lo g
i
n
X
lo g
i
Y
i
1
i
b
i
i
b
X
n
X
2
i
i
n
X
i
1
i
i
n
X 1
i
n
lo g
Y
i
1
2
n
1
n
lo g 1
n
Y
i
X
lo g
b
|
Rosm eri Mayta H.
49
DIAGNÓSTICO DE LA REGRESIÓN : ANÁLISIS DE LA INFLUENCIA
1 n
29/04/2014
Rosm eri Mayta H.
50
Cálculos con minitab
PROBLEMA Se supo supone ne que que el deca decano no de un cole colegi gioo de admi admini nist stra raci ción ón de empr empres esas as quer quería ía pred predec ecir ir el apro aprove vech cham amie ient ntoo de los los estu estudi dian antes tes ( de acue acuerd rdoo a sus sus índi índice cess de calificación) ficación) en un programa programa de maestría maestría de administra administración ción de empresas empresas (MBA). se seleccio selecciono no unamuestra aleatoriade aleatoriade 20 estudiante estudiantess que habían habían tomado tomado por lo menos menos 30 créd crédit itos os en el prog progra rama ma , con con el fin de desa desarr rrol olla larr un mode modelo lo esta estadís dísti tico co para para prede predecir cir su índicede índicede califica i ficacio ciones nes.. Al desarr desarroll ollar a r el modeloasí modeloasí sepodrían sepodrían tomar tomar en cuenta cuenta muchas muchas variables ables explicatorios icatorios.. Estasincluyen Estasincluyen variables ables cuantitat cuantitativascomo ivascomo el result resultad adoo de la prueba prueba de aptitu aptitudd para para gradu graduad ados os en admini administrac s tración ión ( GMAT) y el índice ce de calificaci cacionesde onesde no graduados graduados,, así comolas variablescualitativascomo ablescualitativascomo la espec especial ializació i zaciónn del gradua graduado do y si la perso persona na esta esta o no regist registrad radaa como como estud estudian iante te graduad graduadoo de tiempo tiempo completo completo Para Para fines fines pedag pedagógi ógicosse c osse iniciar c iar el estud estudio io conun modelode modelode regres regresiónsimp iónsimple le en el cual cual se usa usa una una sola sola varia variable ble explic explicato atorio rio cuanti cuantitativa t ativa para para predec predecir ir los valor valores es de una una varia variable ble depen dependie dient nte. e. Por lo tanto tanto se desarr desarroll ollara ara un modelo modelo para para predec predecir ir el índic índicee de califi califica cacio cione ness ( la varia variable ble depen dependie diente nte Y) basadoen basadoen el resul resultad tadoo GMAT GMAT ( la varia variabl blee explic explicato atorio rio)) o indep indepen endie dient ntee X). En las sigui siguiente e nte tabla tabla se encue encuentr ntraa los datos. datos. Hacer Hacer un diagnos diagnostico tico de regresió regresión: n: Análisi Análisis de residu residuales ales Tabla 1
29/04/2014
hi
ANÁLISIS DE INFLUENCIAS EN REGRESIÓN SIMPLE
Se estudiara 3 métodos que miden la influencia de ciertos datos: 1)Los métodos de la matriz sombrero hi. 2)Los residuales eliminados de student t* i 3)El estadístico de distancia de cook Di.
X i
lo g
x
x
Rosm eri Mayta H.
2
51
29/04/2014
Rosm eri Mayta H.
52
x
2
i
x
n
2
Se aplica tres técnicas Según HOAGLIN WELCH 1) Los elementos matriz sombrero, hi
Cada hi refleja la influencia de cada Xi sobre el modelo de regres regresión ión ajusta ajustado. do. Si exist existen en esos esos punto puntoss de influe influenci nciaa quizá quizáss sea neces ecesaario rio eva evalua luar de nuevo evo la nec necesida sidadd de mante antennerlo erlo en el model modelo. o. Se sugierela sugierela siguien siguienteregla teregla de decisió decisiónn Si hi > 4/n , ento entonc ncees Xi es un punt unto de inf influen luenccia y se puede ede conside considerarcandid rarcandidatoa atoa ser retirad retiradoo del modelo modelo..
29/04/2014
Rosm eri Mayta H.
Para los datos de desempeño del estudiante , puesto que n = 20, los criterios deben ser destacar cualquier i supe superio riorr a 4/20 4/20= = 0.2. 0.2. bla se encu encuen enttra que h20 h20 = 0.3049 3049 En la tabla Es un cand candid idat atoo pote potenc ncia iall a ser ser remo removi vido do,, pero pero toma tomare remo moss en cuen cuenta ta otro otross crit criter erio ioss
53
29/04/2014
Rosm eri Mayta H.
54
9
Rosmery Mayta
29/04/2014
2) Para los residuales de Student eliminados, ti* Si se cumple que
S( i ) : Es el error rror está stándar dar de la esti estim mació ción para ara un modelo delo que que incluyetoda incluyetodass las observ observacio acione ness except exceptoo la observa observacióni. cióni. .e i = Es la diferencia entre los val or ores obser va vados (Yi ) y los predic predichos hos Yi | t i*| i*| > t .010 .010,n ,n-3 -3 Si gn gni fifi ca ca que l os os valores Y observados y predi ch chos son tan dife difere rent ntes es que que Xi es un punt puntoo de infl influe uenc ncia ia que que afec afecta ta de modo odo adve advers rsoo el model odeloo y se pued puedee cons consid ider erar ar com como n cand candid idat atoo para para ser eliminado. eliminado.
29/04/2014
Rosm eri Mayta H.
55
3) Estadístico de distancia de Cook, Di El uso de h i* y t i* en la búsqueda de puntos de datos potencialmente problemáticos es complementario. io. Ninguno de los crite iterios es sufi sufici cien ente te por por si mism mismo. o. Para Para deci decidi dirr si un punt puntoo que ha sido sido dest destac acad adoo med mediant iantee el crit criter erio io hi o el ti* ti* esta esta afec afecttand ando ind indebid ebidaament mentee al mod modelo Cook Cook y Weisb Weisber ergg sugi sugier eren en el uso uso del del esta estadí díst stic icoo Di. Di = Sr i 2 hi / 2(1-hi ) SRi : es el residual estandarizado F(.50,2 n -2) = 0.720 0.720 Di > F(.50,2
29/04/2014
Rosm eri Mayta H.
Para el problema, problema, para cualquier valor ti* superior a 1.7396 se eliminaríat3* = 1..879, t5* =2.216, t14*=-2.228 y t20*= -1.961, Estos cuatro pueden tener efectos adversos sobre el modelo.
57
29/04/2014
D20 = 0.729 > 0.720 D5 = 0.21 es < 0.720 Se debe eliminar la observación 20 El nuevo modelo ajustado, eliminado la observación 20 es:
29/04/2014
Rosm eri Mayta H.
59
56
29/04/2014
Rosm eri Mayta H.
Rosm eri Mayta H.
58
SOLUCIÓN Presentando el diagrama de dispersión.
29/04/2014
Rosm eri Mayta H.
60
10
Rosmery Mayta
29/04/2014
29/04/2014
Rosm eri Mayta H.
61
29/04/2014
Rosm eri Mayta H.
62
29/04/2014
Rosm eri Mayta H.
63
29/04/2014
Rosm eri Mayta H.
64
29/04/2014
Rosm eri Mayta H.
65
29/04/2014
Rosm eri Mayta H.
66
11
Rosmery Mayta
29/04/2014
29/04/2014
Rosm eri Mayta H.
67
29/04/2014
Rosm eri Mayta H.
68
Problema
29/04/2014
Rosm eri Mayta H.
69
Los siguie siguient ntes es datos datos repres represent entaa las calific calificac acion iones es de químic químicaa para para una una muest uestra ra alea aleato tori riaa de 12 alum alumno noss de prim primer er grad gradoo en cier cierta ta universidad junto con sus cali fifi ca caci on ones de una prueba de intel intelig igen enci ciaa que que se les les aplic aplicòò cuan cuando do aun aun eran eran alum alumno noss de ùltim ùltimoo año de preparatori preparatoriaa a.- Calculee Calculee interp interpret retee el coefic coeficien ientede tede correla correlació ciónn de la muest muestra ra b.- Cal cu cul e l a ecuaci ón ón de regresión y reali za zar l a Prueba de hipót hipótes esispara ispara β1y ρ con con un nive nivell de signif significa icanc nciade iade 0.01 0.01.. Calc Calcul ulee in inte interv rval aloo de conf confia ianz nzaa para para un inte interva rvalo lo de pred predicc icció iónn del 95%, para l a cali fifi ca caci ón ón promedi o en quími ca ca , ,para l a calificaciónpromedio calificaciónpromedio de 60
29/04/2014
Rosm eri Mayta H.
70
PROBLEMA
Estudiant Calif_Prueba_ Califi_Prue e X ba_y
29/04/2014
1
65
83
2
50
74
3
55
76
4
65
90
5
55
85
6
70
87
7
65
94
8
70
98
9
55
81
10
70
91
11
50
76
12
55
74
Rosm eri Mayta H.
71
Un reciente artículo en Business Week presentó una lista de las “mejores comp compañ añía íass pequ pequeñ eñas as”. ”. Hay Hay inte interé réss en los los resultados actuales de las ventas y gana gananc ncia iass de las las em empr pres esas as.. Se sele selecc ccio ionó nó una una mu mues estr traa alea aleato tori riaa de 12 comp compañ añía ías. s. A continuación se indican las ventas y gananc gan ancias ias,, en millon millones es de dólare dólares. s.
29/04/2014
Rosm eri Mayta H.
72
12
Rosmery Mayta
29/04/2014
DATOS a.- Calcular el coeficiente coeficiente de correlación correlación e interpretar. b.-Calcular la ecuación de regresión lineal c. realizar una inferencia para los coeficientes de regresión y el coeficiente de correlación análisis álisis residual residual d.- Realizar un an
29/04/2014
Rosm eri Mayta H.
73
29/04/2014
Rosm eri Mayta H.
74
13