A NÁL ISIS DE REG RES IÓN Y COR REL A CIÓN CIÓN LINEAL SIMPLE. SIMPLE. 1. Se tomó una muestra para analizar cuál es la relación entre la edad (en meses) y el peso (en kilogramos) de niños en edad pre escolar, en donde se obtuvo los siguientes resultados.
∑ ∑
∑ ∑
∑
a) Hallar la edad promedio de la muestra y sus medidas de dispersión.
̅ ∑ *Varianza: ∑ ∑
*Promedio:
*Desviación *Desviación estándar:
̅ ̅ ̅ ̅ ̅ *Coeficiente de variación: variación:
̅ La muestra es homogénea
b) Hallar el peso promedio de la muestra y sus medidas de dispersión.
*Promedio: *Varianza:
̅ ∑
∑
∑
*Desviación *Desviación estándar:
̅ ̅ ̅ ̅ *Coeficiente de variación:
̅ La muestra es homogénea
c) Estime un modelo según una relación lineal entre la edad y el peso de los niños, interprete el coeficiente de regresión.
*El modelo es:
̂ *Dónde: ∑ ∑ ∑ ∑ ∑
∑ ∑ *Luego:
=>Interpretación: El coeficiente de regresión nos indica que por cada mes que pasa, el peso en promedio aumenta en 500 gr.
d) Estimar cuanto será el peso para un niño de 58 meses de edad.
e) Estimar que edad aproximada tiene un niño que pesa 12.5 Kg.
f) Hallar la varianza residual de la regresión.
∑ ∑ ∑ es confiable. Desviación estándar:
g) Determinar el coeficiente de correlación, interprete.
̅ ̅ √ ∑ ∑ ̅ √ ∑ ̅ √ √ =>Existe una relación positiva fuerte entre la edad y el peso de los niños. h) Hallar el coeficiente de determinación, interprete. E indicar a su criterio que otros factores determinan el peso de los niños.
=>La variabilidad en el peso de los niños es explicado en un 76.3% por la variabilidad En su edad. Otros factores que determinan el peso de los niños en edad pre escolar es La alimentación (número de comidas por día), altura, ingreso económico de los Padres.
2. En la comunidades A y B se realizó un estudio para determinar si la agilidad mental de los niños esta en relación directa con su edad. Se escogieron 10 niños de cada comunidad y se les aplico un test para medir su agilidad mental con los siguientes resultados. Comunidad A
̅ ̅ ∑
Comunidad B
̅ ̅ ∑
Comunidad A n=10
̅ ∑ ∑ (10) = 80 ̅ ∑ => ∑ =22.5 (10) = 225
Comunidad B n=10
̅ => ̅ => ∑ n̅ = 4368.10 => ̅ => ∑ 209
a) Encontrar por el método de mínimos cuadrados la curva que mejor se ajuste entre la edad y la agilidad mental de los niños, interprete el coeficiente de regresión.
*El modelo es:
1.-Comunidad A *Dónde:
̂
∑ ∑ ∑ ∑ ∑ ∑ ∑
*Luego:
=>Interpretación: El coeficiente de regresión nos indica que a medida
q’ pasan los años su agilidad mental es mayor. 2.-Comunidad B *Dónde:
∑ ∑ ∑ ∑ ∑ ∑ ∑
*Luego:
=>Interpretación: El coeficiente de regresión nos indica que a medida
q’ pasan los años su agilidad mental es mayor.
b) Estimar cuanto será la agilidad mental de un niño de 7años de edad
Entonces: 1.-Comunidad A:
19.75 2. -Comunidad B: 17.32
c) Hallar la varianza residual de la regresión.
1.-Comunidad A:
∑ ∑ ∑
Desviación estándar: 2.-Comunidad B:
es confiable.
∑ ∑ ∑
Desviación estándar:
es confiable.
d) Determinar el coeficiente de correlación, interprete.
1.-Comunidad A:
̅ ̅ √ ∑ ∑ ̅ √ ∑ ̅
√ √ =>Existe una relación positiva fuerte entre la edad y la agilidad mental de los niños. 2.-Comunidad B:
̅ ̅ √ ∑ ∑ ̅ √ ∑ ̅
√ √ => Existe una relación positiva fuerte entre la edad y la agilidad mental de los niños.
e) Hallar el coeficiente de determinación, interprete. E indicar a su criterio que otros factores determinan la agilidad mental de los niños.
1.-Comunidad A:
=>La variabilidad en la agilidad mental de los niños es un 50.41% por la variabilidad de su edad. Otros factores q’ determinan la agilidad mental de los niños es
2.-Comunidad B:
==>La variabilidad en la agilidad mental de los niños es un 33.64% por la variabilidad de su edad. Otros factores q’ determinan la agilidad mental de los niños es .
3. Los siguientes datos corresponden a las notas obtenidas en dos exámenes parciales aplicados a ocho alumnos. Primer examen
8
13
14
7
10
11
13
9
Segundo examen
10
12
11
9
14
13
11
8
X: Primer examen (puntos) Y: Segundo examen (puntos) a) Realizar el diagrama de dispersión para estos datos y analizar.
Gráfica de línea ajustada Segundo examen = 7,294 + 0,3488 Primer examen S R-cuad. R-cuad.(ajustado )
14 13 n e 12 m a x e o 11 d n u g 10 e S
9 8 7
8
9
10
11
Primer examen
12
13
14
1,93303 19,9% 6,6%
*Análisis de varianza: Fuente GL SC MC F P Regresión 1 5,5804 5,58038 1,49 0,268 Error 6 22,4196 3,73660 Total 7 28,0000 =>Se observa que no existe una relación lineal notoria, sin embargo ajustaremos un modelo lineal. b) Hallar la ecuación de regresión lineal considerando como dependiente al segundo examen.
variable
El modelo es:
=>Interpretación: el coeficiente de regresión indica que por cada
punto que aumente la nota en el primer examen, en promedio el segundo examen aumentara en 0.35 puntos.
c) Hallar la varianza residual de la regresión
∑ ∑ ∑ ¿será confiable? Desviación estándar: =>Otra forma: Ho: b=0 el modelo no es confiable
Ho: b 0 el modelo es confiable Análisis de varianza P = 0.268 (minitab) Si p > 0.05 se acepta Ho Si p < 0.05 se rechaza Ho Como p= 0.268 > 0.05 entonces se acepta Ho es decir el modelo no es confiable.
d) Determinar el coeficiente de correlación, interprete. Existe una correlación positiva débil.
e) Hallar el coeficiente de determinación, interprete. E indicar a su criterio que otros factores determinan las notas obtenidas en el segundo examen. .La variabilidad en el segundo examen es explicado en un 19.92% por la variabilidad en el primer examen, otros factores que determinan las notas obtenidas en el segundo examen son horas de asistencia a clase, horas de estudio fuera de clase, métodos estudio.
4. Durante 10 años consecutivos , se registró la importación y la exportación de productos( en miles de TM) Importación 12.3 10.8
9.6
8.4
6.7
5
4.8
3.6
2.8
2.2
1.8
Exportación 11.6 11.9
8.9
7.8
7.4
6.5
4.3
5.3
3.3
2.8
1.7
X: Importación (miles) Y: Exportación (miles) a) Realizar el diagrama de dispersión para estos datos y analizar la tendencia.
Análisis de varianza:
Fuente Regresión Error Total
GL 1 9 10
SC 2991,2 46099,3 49090,5
MC 2991,24 5122,15
F 0,58
P 0,464
=>Se observa que no existe una relación lineal notoria, sin embargo ajustaremos un modelo lineal y observamos q’ existe una tendencia lineal decreciente, es decir a mayor importación le corresponde menor exportación.
b)
Encontrar por el método de mínimos cuadrados la curva que mejor se ajuste entre la importación y exportación de productos, interprete el coeficiente de regresión.
El modelo es:
̂ ∑ ∑ ∑ ∑ ∑
*Dónde:
∑ ∑
0.86
*Luego:
=>Interpretación: El coeficiente de regresión , nos indica que por
cada unidad exportada hay una importación de 910 unidades.
c)
Graficar la recta de regresión en el diagrama de dispersión.
d)
Estimar cuanto será la importación si se exporta 8.5 tm.
– a = 8.06178 (1000) = 8062 unidades. Importación = b
e)
Estimar cuanto será la exportación si se importa 7.3 tm.
= 0.86+ 0.91 (7.3) = 7.5 (1000) = 7503 unidades. f)
Hallar la importación promedio y su desviación estándar. X: Importación (miles) 1.-Promedio:
Varianza:
̅ ∑ = 6.1818 (1000) = 6182 unidades.
∑ ∑ 13.2096
2.-Desviación estándar:
√ ̅ ̅ ̅ ̅
g)
Hallar la exportación promedio y su desviación estándar Y: Importación (miles)
1.-Promedio: Varianza:
̅ ∑
∑ ∑ 11.668
2.-Desviación estándar:
̅ ̅ ̅ ̅ h)
Hallar la varianza residual de la regresión.
∑∑ ∑ = 0.7671
Desviación estándar: i)
√
es confiable.
Determinar el coeficiente de correlación, interprete.
̅ ̅ √ ∑ ∑ ̅ √ ∑ ̅
= 0.97
=>Interpretación: Existe una relación positiva fuerte entre la exportación y la importación de los productos. j)
Hallar el coeficiente de determinación, interprete. E indicar a su criterio que otros factores determinan la variable dependiente.
La variabilidad de los productos exportados es un 94.08% por la variabilidad de la producción. Otros factores q’ determinan la variabilidad de los productos exportados son
5. Se desea saber si hay relación entre el tiempo que le dedican al estudio fuera de horas de clase y el rendimiento académico en un determinado curso, dando los siguientes resultados:
∑ ∑ ∑ ∑ X: tiempo Y: Rendimiento académico
∑
a)
Hallar el tiempo promedio de estudio fuera de clases y sus medidas de dispersión. 1.- Tiempo promedio:
2.- Varianza:
̅ ∑
=
horas.
∑ 3.- Desviación Estándar: √ ̅ ̅ ̅ ̅
∑
4.- Coeficiente de variación:
̅
b)
La muestra no es homogénea.
Hallar el rendimiento académico promedio y sus medidas de dispersión.
̅ ∑
1.- Promedio: 2.- Varianza:
∑ ∑
11.425 horas/día.
3.- Desviación estándar:
√ . ̅ ̅ ̅ ̅
4.-Coeficiente de variación:
̅
c)
La muestra no es homogénea.
Estime un modelo según una relación lineal entre horas de estudio fuera de clase y su rendimiento académico, interprete el coeficiente de regresión.
El modelo es:
̂
Dónde:
∑∑ ∑∑ ∑
∑ ∑ Luego:
=> Interpretación: el coeficiente de regresión nos indica que por cada
día q’ pasa, el rendimiento académico aumenta en 1.7 horas/día.
d)
Estimar cuanto será el rendimiento académico para un alumno que estudio 3.5 horas
Entonces:
e)
Estimar cuantas horas estudio un alumno que obtuvo una nota de 14 puntos.
Tiempo =
b
f)
Tiempo = 14 – 3.8 = 6 horas. 1.7 Hallar la varianza residual de la regresión.
g)
Determinar el coeficiente de correlación, interprete.
h)
Hallar el coeficiente de determinación, interprete. E indicar a su criterio que otros factores determinan el rendimiento académico.
6. Las pruebas acerca del consumo de combustible de un vehículo que viaja a diferentes velocidades produjeron los siguientes resultados.
Velocidad Consumo
20
30 40 50 60 18.3 18.8 19.1 19.6 19.8
70
80
90
20 20.6
21
Realizar el diagrama de dispersión para estos datos y analizar la tendencia. b) Encontrar por el método de mínimos cuadrados la curva que mejor se ajuste entre la velocidad y el consumo, interprete el coeficiente de regresión. c) Graficar la recta de regresión en el diagrama de dispersión. d) Estimar cuanto será el consumo de combustible si el auto va a una velocidad de 75 k/h. e) Estimar cuanto será la velocidad del auto si ha consumido 25 galones de combustible. f) Hallar consumo de combustible promedio y su desviación estándar. g) Hallar la velocidad promedio y su desviación estándar. h) Hallar la varianza residual de la regresión. i) Determinar el coeficiente de correlación, interprete. j) Hallar el coeficiente de determinación, interprete. E indicar a su criterio que otros factores determinan el consumo de combustible. 7. Sea Y la producción (en millones ) de un determinado articulo fabricado por una compañía durante los años 1999 al 2008 como se observa en el siguiente cuadro: a)
Años
1999 2000 2001 2002 2003 2004 2005 2006 2007 2008
Producción 92.2 a) b) c)
92.3
80
89.1 83.5
68.9 69.2
67.1 58.3
61.2
Trazar un grafico de líneas para estos datos y analizar la tendencia. Hallar al recta de regresión (serie de tiempo) de mínimos cuadrados de la producción en función de los años Estimar la producción de artículos para el año 2009.
8. Se sabe que la producción de algodón de un país, expresada en millones de toneladas, fueron: Años Producción a) b) c)
1995 1996 1997 1998 1999 2000 2001 2002 2003 8
10
12
15
15
18
19
23
30
Trazar un grafico de líneas para estos datos y analizar la tendencia. Hallar al recta de regresión (serie de tiempo) de mínimos cuadrados de la producción en función de los años Estimar la producción de algodón para los tres años siguientes.
9. El auditor del sistema educativo público ha estudiado los registros del inventario para averiguar si el inventario actual de libros de texto es típico. Las siguientes existencias corresponden a los 5 años anteriores. Año 2004 2005 2006 2007 2008 Inventario 4620 4910 5490 5730 5990
a) Trazar un grafico de líneas para estos datos y analizar la tendencia. b) Hallar al recta de regresión (serie de tiempo) de mínimos cuadrados del inventario en función de los años c) Estimar el inventario para el año 2009.