2012
[LABORATORIO PRIMERA UNIDAD] UNIDAD] ANÁLISIS DE REGRESIÓN I
[LABORATORIO PRIMERA UNIDAD] UNIDAD ] 11 de mayo de 2012
UNIVERSIDAD NACIONAL DE TRUJILLO
1
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] UNIDAD ] 11 de mayo de 2012 2.4.
La tabla B – B – 3 3 del apéndice contiene datos sobre el rendimiento de la gasolina, en millas, de 32 automóviles diferentes. Nº 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
2
Automóvil Y = Millas / Galón X 1 = Cilindrada (pulg 3) Apollo 18.90 350.0 Omega 27.00 350.0 Nova 20.00 250.0 Monarch 18.25 351.0 Duster 20.07 225.0 JensonConv. 11.20 440.0 Skyhawk 22.12 231.0 Monza 21.47 262.0 Scirocco 34.70 89.7 Corolla SR-5 30.40 96.9 Camaro 16.50 350.0 Datsun B210 36.50 85.3 Capri II 21.50 171.0 Pacer 19.70 258.0 Babcat 20.30 140.0 Granada 17.80 302.0 Eldorado 14.39 500.0 Imperial 14.89 440.0 Nova LN 17.80 350.0 Valiant 16.41 318.0 Starfire 23.54 231.0 Cordoba 21.47 360.0 Trans AM 16.59 400.0 Corolla S-5 31.90 96.9 Astre 29.40 140.0 Mark IV 13.27 460.0 Celica GT 23.90 133.6 Charger SE 19.73 318.0 Cougar 13.90 351.0 Elite 13.27 351.0 Matador 13.77 360.0 Corvette 16.50 350.0 Tabla B.3 - Rendimiento de la gasolina para 32 automóviles
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 a) Ajustar un modelo de regresión lineal simple que relacione el rendimiento de la gasolina (millas por galón) y la cilindrada del motor X 1 (pulgadas cúbicas).
Nº 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
Automóvil Apollo Omega Nova Monarch Duster JensonConv. Skyhawk Monza Scirocco Corolla SR-5 Camaro Datsun B210 Capri II Pacer Babcat Granada Eldorado Imperial Nova LN Valiant Starfire Cordoba Trans AM Corolla S-5 Astre Mark IV Celica GT Charger SE Cougar Elite Matador Corvette Σ
3
Y = Millas / Galón 18.90 27.00 20.00 18.25 20.07 11.20 22.12 21.47 34.70 30.40 16.50 36.50 21.50 19.70 20.30 17.80 14.39 14.89 17.80 16.41 23.54 21.47 16.59 31.90 29.40 13.27 23.90 19.73 13.90 13.27 13.77 16.50 657.14
X1 = Cilindrada (pulg3) 350.0 350.0 250.0 351.0 225.0 440.0 231.0 262.0 89.7 96.9 350.0 85.3 171.0 258.0 140.0 302.0 500.0 440.0 350.0 318.0 231.0 360.0 400.0 96.9 140.0 460.0 133.6 318.0 351.0 351.0 360.0 350.0 9111.40
UNIVERSIDAD NACIONAL DE TRUJILLO
Xi2 122500.00 122500.00 62500.00 123201.00 50625.00 193600.00 53361.00 68644.00 8046.09 9389.61 122500.00 7276.09 29241.00 66564.00 19600.00 91204.00 250000.00 193600.00 122500.00 101124.00 53361.00 129600.00 160000.00 9389.61 19600.00 211600.00 17848.96 101124.00 123201.00 123201.00 129600.00 122500.00 3019001.36
Yi2 357.21 729.00 400.00 333.06 402.80 125.44 489.29 460.96 1204.09 924.16 272.25 1332.25 462.25 388.09 412.09 316.84 207.07 221.71 316.84 269.29 554.13 460.96 275.23 1017.61 864.36 176.09 571.21 389.27 193.21 176.09 189.61 272.25 14764.74
XiYi 6615.00 9450.00 5000.00 6405.75 4515.75 4928.00 5109.72 5625.14 3112.59 2945.76 5775.00 3113.45 3676.50 5082.60 2842.00 5375.60 7195.00 6551.60 6230.00 5218.38 5437.74 7729.20 6636.00 3091.11 4116.00 6104.20 3193.04 6274.14 4878.90 4657.77 4957.20 5775.00 167618.14
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
Realizamos nuestro gráfico de dispersión para visualizar el comportamiento o relación entre las variables:
Gráfico de dispersion del rendimiento de la gasolina (millas por galón) y la cilindrada del motor (pulg 3) 40 35 y = -0.0459x + 33.602 R² = 0.7043
30 25 20 15 10 5 0 0
100
200
400
500
Sabemos que:
n
300
Hallamos
:
32 284.7313 20.5356
∑
4
UNIVERSIDAD NACIONAL DE TRUJILLO
600
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
Hallamos
:
∑ ∑
Hallamos
:
Hallamos
:
Reemplazamos en nuestro modelo
:
Interpretación: El rendimiento de la gasolina disminuye en 0,046 millas/galón con respecto a la cilindrada del motor X 1 unidades en pulgadas cúbicas.
5
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 b) Formar la tabla de análisis de varianza y prueba de significancia de la regresión.
Se desea probar lo siguiente:
Entonces hallamos:
6
∑ :
:
:
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
:
Armamos la tabla de análisis de varianza con los datos obtenidos anteriormente: F.de V. Regresión Error Total
SC 894.432 375.525 1269.957
gl 1 30 31
CM 894.432 12.517
F
Valor - P
71.4545
0.0000
Se debe tener en cuenta que:
Interpretación: Se Rechaza H 0: No es significativa, por lo que podemos decir que nuestro modelo de regresión estimada es significativo implicado por el rendimiento de la gasolina dado la cilindrada del motor X 1.
7
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 c) ¿Qué porcentaje de la variabilidad total del rendimiento de la gasolina explica la relación lineal con la cilindrada del motor?
Si:
Interpretación: Existe un 70.43% de variabilidad total del rendimiento de la gasolina expresada por la variable cilindrada del motor en el modelo de regresión lineal estimado.
d) Determinar un intervalo de confianza de 95% para el rendimiento promedio de gasolina, si el desplazamiento del motor es 275 pulg 3.
Si:
∑
Para ello tenemos que tener en cuenta lo siguiente:
8
:
( ) :
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
( ) ( ) ∑ :
:
Reemplazamos
Interpretación: Se estima con un nivel confianza de 95% el rendimiento promedio de gasolina, si el desplazamiento del motor es 275 pulg 3, se encuentra entre 19.7003 y 22.2641 (millas/ galón).
9
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 e) Suponer que se desea pronosticar el rendimiento de gasolina que tiene un coche con motor de 275 pulg 3. Determine un estimado puntual para el rendimiento. Determinar un intervalo de predicción de 95% para el rendimiento.
Si:
Debemos tener en cuenta los siguientes parámetros:
10
∑
:
:
:
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
Reemplazamos:
∑
Interpretación: Se estima con un 95% de confianza que un motor nuevo de 275 pulg 3tuviera un rendimiento de gasolina entre 13.6438 y 28.3206 (millas por galón).
f) Comparar los dos intervalos obtenidos en las partes de d y e. explicar la diferencia entre ellos. ¿Cuál es más amplio y por qué?
Intervalo de la respuesta media:
Intervalo de nuevas observaciones:
11
La estimación del intervalo para las nuevas observaciones es más amplio que la estimación del intervalo para la respuesta media debido a las k nuevas observaciones futuras y debido a que en la fórmula de la varianza a las nuevas observaciones se le agrega el 1.
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 2.7 Se cree que la pureza del oxígeno producido con su proceso de fraccionamiento está relacionada con el porcentaje de hidrocarburos en el condensador principal de la unidad de procesamiento. A continuación se muestran los datos de veinte muestras. Pureza (%) Y 86.91 89.85 90.28 86.34 92.58 87.33 86.29 91.86 95.61 89.86 96.73 99.42 98.66 96.07 93.65 87.31 95.00 96.85 85.20 90.56
Hidrocarburos (%) X 1.02 1.11 1.43 1.11 1.01 0.95 1.11 0.87 1.43 1.02 1.46 1.55 1.55 1.55 1.40 1.15 1.01 0.99 0.95 0.98
a) Ajustar un modelo de regresión lineal simple a los datos. Hidrocarburos(%) Pureza (%) Nº 1 2 3 4 5 6 7 8 9 10 12
X 1.02 1.11 1.43 1.11 1.01 0.95 1.11 0.87 1.43 1.02
Y 86.91 89.85 90.28 86.34 92.58 87.33 86.29 91.86 95.61 89.86
UNIVERSIDAD NACIONAL DE TRUJILLO
Xi2
Yi2
XiYi
1.0404 1.2321 2.0449 1.2321 1.0201 0.9025 1.2321 0.7569 2.0449 1.0404
7553.3481 8073.0225 8150.4784 7454.5956 8571.0564 7626.5289 7445.9641 8438.2596 9141.2721 8074.8196
88.6482 99.7335 129.1004 95.8374 93.5058 82.9635 95.7819 79.9182 136.7223 91.6572
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 11 12 13 14 15 16 17 18 19 20 Σ
1.46 1.55 1.55 1.55 1.40 1.15 1.01 0.99 0.95 0.98 23.65
96.73 99.42 98.66 96.07 93.65 87.31 95.00 96.85 85.20 90.56 1836.36
2.1316 2.4025 2.4025 2.4025 1.96 1.3225 1.0201 0.9801 0.9025 0.9604 29.03
9356.6929 9884.3364 9733.7956 9229.4449 8770.3225 7623.0361 9025 9379.9225 7259.04 8201.1136 168992.05
141.2258 154.101 152.923 148.9085 131.11 100.4065 95.95 95.8815 80.94 88.7488 2184.06
Realizamos nuestro gráfico de dispersión para visualizar el comportamiento o relación entre las variables:
Gráfico de dispersion del % de Hidrocarburos con respecto al % de pureza. y = 11.801x + 77.863 R² = 0.3891
102.00 100.00 98.00 a 96.00 z r e u 94.00 P e 92.00 d % 90.00 88.00 86.00 84.00
Series1 Lineal (Series1)
0.00 0.20 0.40 0.60 0.80 1.00 1.20 1.40 1.60 1.80 % de Hidrocarburo
Sabemos que:
n
13
UNIVERSIDAD NACIONAL DE TRUJILLO
20 1.1825 91.8180
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
Hallamos
:
∑
14
Hallamos
:
∑ ∑
Hallamos
:
Hallamos
:
Reemplazamos en nuestro modelo
UNIVERSIDAD NACIONAL DE TRUJILLO
:
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
Interpretación: El porcentaje de pureza aumenta en 11.8010 con respecto al porcentaje de hidrocarburos X 1(unidades porcentuales).
b) Probar la hipótesis H 0: β1 = 0.
Se desea probar lo siguiente:
Entonces hallamos:
∑ :
148.3130
15
:
:
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
:
Armamos la tabla de análisis de varianza con los datos obtenidos anteriormente: F.de V
SC
gl
CM
F
Valor - P
Regresión Error Total
148.313 232.834 381.147
1 18 19
148.313 12.935
11.466
0.0033
Se debe tener en cuenta que:
Interpretación: Se Rechaza H 0: No es significativa, por lo que podemos decir que nuestro modelo de regresión estimada es significativo implicado por el por el porcentaje de hidrocarburos X 1.
16
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 c) Calcular R2.
Si:
Interpretación:
El 38.91% de la variabilidad total de la pureza del modelo estimado de regresión lineal explica la relación lineal con el porcentaje de hidrocarburos. d) Determinar un intervalo de confianza de 95 % para la pendiente.
Si:
∑ Para hallar nuestro intervalo debemos tener en cuenta lo siguientes:
17
∑
∑ ∑
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
Reemplazamos los datos obtenidos en la fórmula del intervalo presentado anteriormente:
e) Determinar un intervalo de confianza de 95% para la pureza media, cuando el porcentaje de hidrocarburos es 1.00.
Si:
∑
Para ello tenemos que tener en cuenta lo siguiente:
18
) ( ( ) ( ) ( ) :
:
:
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
:
Reemplazamos
Interpretación:
∑
Se estima con un nivel confianza de 95% la pureza media de gasolina, cuando el porcentaje de hidrocarburos es 1.00, donde se encuentra entre 87.5102 y 91.8185 (unidades porcentuales). 2.12. Se cree que la cantidad de libras de vapor usadas en una planta por mes está relacionada con la temperatura ambiente promedio. A continuación se presentan los consumos y las temperaturas del último año.
Temperatura Mes Xi Enero 21 Febrero 24 Marzo 32 Abril 47 Mayo 50 Junio 59 Julio 68 Agosto 74 Septiembre 62 Octubre 50 Noviembre 41 Diciembre 30
19
UNIVERSIDAD NACIONAL DE TRUJILLO
Uso/1000 Yi 185.79 214.47 288.03 424.84 454.68 539.03 621.55 675.06 562.03 452.93 369.95 273.98
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 a) Ajustar un modelo de regresión lineal simple a los datos.
Temperatura
Uso/1000
Mes
Xi
Yi
Xi2
Yi2
XiYi
Enero Febrero
21 24
185.79 214.47
441 576
34517.9241 45997.3809
3901.59 5147.28
Marzo
32
288.03
1024
82961.2809
9216.96
Abril Mayo
47 50
424.84 454.68
2209 2500
180489.026 206733.902
19967.48 22734
Junio
59
539.03
3481
290553.341
31802.77
Julio
68
621.55
4624
386324.403
42265.4
Agosto
74
675.06
5476
455706.004
49954.44
Septiembre Octubre
62 50
562.03 452.93
3844 2500
315877.721 205145.585
34845.86 22646.5
Noviembre
41
369.95
1681
136863.003
15167.95
Diciembre
30
273.98
900
75065.0404
8219.4
Σ
558
5062.34
29256
2416234.61
265869.63
Realizamos nuestro gráfico de dispersión para visualizar el comportamiento o relación entre las variables:
Gráfico de dispersión de la temperatura con respecto al uso/1000. 800
y = 9.2085x - 6.3321 R² = 0.9999
700 600 500 400
Yi
300
Lineal (Yi)
200 100 0 0
20
20
40
UNIVERSIDAD NACIONAL DE TRUJILLO
60
80
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
Sabemos que:
n
Hallamos
:
12 46.5000 421.8617
∑
21
Hallamos
:
∑ ∑
Hallamos
:
Hallamos
:
Reemplazamos en nuestro modelo
UNIVERSIDAD NACIONAL DE TRUJILLO
:
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
Interpretación: La cantidad de vapor aumenta en 9.2085 libras con respecto al porcentaje de temperatura. X 1.
b) Probar la significancia de la regresión.
Se desea probar lo siguiente:
Entonces hallamos:
22
∑ :
:
:
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
∑ :
t tabulado:
Interpretación: Por lo tanto se rechaza la H 0 = 0, ya que el valor absoluto de mi valor calculado es mayor que mi valor tabulado t. podemos concluir que nuestro modelo de regresión lineal es estadísticamente significativo.
c) En la administración de la planta se cree que un aumento de 1 grado en la temperatura ambiente promedio hace aumentar 10000 libas el consumo mensual de vapor. ¿Estos datos respaldan la afirmación?
Si:
∑
23
Para ello tenemos que tener en cuenta lo siguiente: UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
( ) ( ) ( ) ∑ () :
:
:
:
Reemplazamos
Interpretación:
24
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
Se estima que un aumento de 1 grado en la temperatura ambiente promedio hace aumentar 10000 libas el consumo mensual de vapor el cual se estimo en un intervalo al 95% de confianza donde se encuentra entre 82.7306 y 88.7746 libras. Por lo cual se puede decir que si se respaldan. d) Determinar un intervalo de predicción de 99% para el uso de vapor en un mes con temperatura ambiente promedio de 58 0.
Si:
∑ Debemos tener en cuenta lo siguiente:
25
∑ :
:
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
:
Reemplazamos con nuestros datos hallados anteriormente y tenemos nuestro intervalo:
Interpretación:
Se estima un intervalo de predicción de 99% de confianza para el uso de vapor en un mes con temperatura ambiente promedio de 58 0, donde se aprecia claramente que dicho uso de vapor varía entre 521.2237 y 534.2944 libras.
26
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 2.15. Byers y Williams estudiaron el impacto de la temperatura sobre la viscosidad de mezclas de tolueno y tetralina. La tabla siguiente muestra los datos para mezclas con fracción molar de tolueno igual a 0.4. Temperatura °C 24.9
Viscosidad (mPa*s) 1.133
35 44.9 55.1 65.2 75.2 85.2 95.2
0.9772 0.8532 0.775 0.6723 0.6021 0.542 0.5074
a. Estimar la ecuación de predicción. Primero graficaremos los datos para ver el comportamiento y elegir el modelo adecuado:
Diagrama de Dispersión de Temperatura (°C) y Viscosidad (mPa*s) 1.2 1 ) s * 0.8 a P m ( d 0.6 a d i s o c s i 0.4 V
y = -0.476ln(x) + 2.6676
0.2 0 20
30
40
50
60
70
Temperatura (°C)
27
UNIVERSIDAD NACIONAL DE TRUJILLO
80
90
100
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 Observamos que el modelo que se ajusta mejor a los datos es el logarítmico que tiene la siguiente ecuación:
̂
Para utilizar las fórmulas de un modelo lineal, tenemos que hallar una columna en la tabla con lnX y la columna de la variable dependiente y: X Y ln X Temperatura °C Viscosidad (mPa*s) 1 24.9 1.133 3.21487 2 3 4 5 6 7 8
35 44.9 55.1 65.2 75.2 85.2 95.2
0.9772 0.8532 0.775 0.6723 0.6021 0.542 0.5074
Necesitaremos además las siguientes sumatorias: ∑lnX
32.0824
∑lnX2
130.1528
∑lnX*Y
∑Y
23.6003 4.0103 6.0622
∑Y2
4.9329
Y
0.7578
Utilizamos las fórmulas: Para hallar 1:
28
UNIVERSIDAD NACIONAL DE TRUJILLO
3.55535 3.80444 4.00915 4.17746 4.32015 4.44500 4.55598
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 Dónde:
∑ ∑ Y:
∑ Entonces:
INTERPRETACIÓN: Cada vez que la temperatura aumenta en un °C la viscosidad disminuye en 0.4762 mPa*s.
Para hallar 0:
Entonces remplazando en la ecuación del modelo:
29
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 b. Hacer un análisis completo del modelo. Probar la significancia del modelo:
Para hacer la tabla de ANVA necesitamos: SCR:
SCT:
SCE:
CMR:
30
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 CME:
Estadístico de prueba F:
Hacemos la tabla de ANVA: F.V. SC gl CM F Regresión 0.33856 1 0.33856 3547.91857 Error 0.00057 6 0.000954 Total 0.33913 7
Hallamos:
Si:
Rechazamos la hipótesis nula, es decir 1 es significativo en el modelo propuesto. Contraste de la hipótesis usando la probabilidad (p):
Si:
31
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 Probar la significancia individual de los estimadores: PARA β0:
Para contrastar la hipótesis necesitamos: 2:
(β0):
Estadístico de prueba:
Hallamos:
32
̂ () ̅ ̂ () () () √
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 Si:
|| Rechazamos la hipótesis nula, es decir 0 es significativo en el modelo propuesto. Contraste de la hipótesis usando la probabilidad (p):
Entonces:
Si:
PARA β1:
Para contrastar la hipótesis necesitamos: 2:
̂
33
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 (β1):
Estadístico de prueba:
Hallamos:
Si:
() ̂ () () () √ ||
Rechazamos la hipótesis nula, es decir 1 es significativo en el modelo propuesto. Contraste de la hipótesis usando la probabilidad (p):
Entonces:
34
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 Si:
R2:
INTERPRETACIÓN: El 99.83% del porcentaje de variación de “y” es explicada por la ecuación:
̂
c. Calcular y graficar las bandas de 95% de confianza y de predicción. Intervalo de confianza para β0:
⁄ () ()
Sabemos:
Entonces:
35
UNIVERSIDAD NACIONAL DE TRUJILLO
INTERPRETACIÓN: Se estima al 95% de confianza que el intervalo del parámetro β0̂ está entre 2.5887 y 2.7465.
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 Intervalo de confianza para β1:
⁄ () ()
Sabemos:
Entonces:
INTERPRETACIÓN: Se estima al 95% de confianza que el intervalo del parámetro β1̂ está entre -0.4958 y -0.4567.
Intervalo de predicción: Agregamos un nuevo valor de x para hacer el intervalo de predicción, para este caso:
Hallamos el lnX:
Necesitamos:
36
̂ ̂ ̂
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 Además:
̅
Entonces:
̂ ̅ INTERPRETACIÓN: Se estima al 95% de confianza que el intervalo para una nueva observación x0 = 99°C, y0 estará entre -2.3725 y 3.3223 mPa*s
2.19. Se tiene el modelo de regresión lineal simple y no correlacionado.
a. Demostrar que
Sabemos que:
Entonces:
37
() ()* () ()+ ̅ ()̅ ()̅ ̅ ()̅ ( ) .
UNIVERSIDAD NACIONAL DE TRUJILLO
, con
y
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 Remplazando en la fórmula:
b. Demostrar que
38
()*̅( )( )+ ()̅ *( )+ ()̅ () () () ()*() ()+ ()[( )] ()[( )] () () .
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 3.5. Véanse los datos de rendimiento de gasolina de la siguiente tabla: y Automóvil 1
Apollo
2 Omega 3 Nova 4 Monarch 5 Duster 6 Jenson Cov. 7 Skyhawk 8 Monza 9 Scirocco 10 Corolla SR-5 11 Camaro 12 Datsun B210 13 Capri II 14 Pacer 15 Babcat 16 Granada 17 Eldorado 18 Imperial 19 Nova LN 20 Valiant 21 Starfire 22 Cordoba 23 Trans AM 24 Corolla E-5 25 Astre 26 Mark IV 27 Celica GT 28 Charger SE 29 Cougar 30 Elite 31 Matador 32 Corvette
39
x1
x6
Millas/galón Cilindrada (pulgadas cúbicas) Carburador (gargantas) 18.9
350
4
17 20 18.25 20.07 11.2 22.12 21.47 34.7 30.4 16.5 36.5 21.5 19.7 20.3 17.8 14.39 14.89 17.8 16.41 23.54 21.47 16.59 31.9 29.4 13.27 23.9 19.73 13.9 13.27 13.77 16.5
350 250 351 225 440 231 262 89.7 96.9 350 85.3 171 258 140 302 500 440 350 318 231 360 400 96.9 140 460 133.6 318 351 351 360 350
4 1 2 1 4 2 2 2 2 4 2 2 1 2 2 4 4 4 2 2 2 4 2 2 4 2 2 2 2 4 4
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 a. Ajustar un modelo de regresión lineal múltiple que relacione el rendimiento de la gasolina y , en millas por galón, la cilindrada del motor x 1 y la cantidad de gargantas en el carburador, x 6. Hacemos los cálculos de las matrices necesarias:
X'X =
-1
(X'X) =
32 9111.4 83
9111.4 3019001.36 26189.8
83 26189.8 251
0.2602 -0.00041 -0.0433
-0.00041 0.000004138 -0.000296
-0.0433 -0.000296 0.04921
X'Y =
647.14 164118.14 1576.13
Para estimar la matriz utilizamos la siguiente fórmula:
Entonces la ecuación del modelo es:
̂
INTERPRETACIÓN DE β1:
INTERPRETACIÓN: Si la cilindrada del motor aumenta en una pulgada cúbica y el número de carburadores permanece constante, el rendimiento de la gasolina disminuye 0.053 millas /galón.
40
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 INTERPRETACIÓN DE β6:
INTERPRETACIÓN: Si el número de carburadores aumenta en una unidad y la cilindrada del motor permanece constante, el rendimiento de la gasolina disminuye 0.9295 millas /galón.
b. Formar la tabla de análisis de varianza, y probar la significancia de la regresión. Para formar la tabla de ANVA necesitamos los siguientes datos: Hipótesis:
Error tipo I:
Suma de cuadrados de la regresión:
Suma de cuadrados del total:
41
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 Suma de cuadrados del error:
Hacemos el cuadro de análisis de varianza: F.V.
SC
gl
CM
F
Regresión 972.8984 2 486.4492 53.305333 Error 264.6457 29 9.1257 Total 1237.5441 31
Estadístico de prueba:
Contraste de la hipótesis: Se rechazará H0 si:
Hallamos:
Entonces:
Contraste usando la probabilidad (p):
INTERPRETACIÓN: Se pude afirmar con un 95% de confianza que al menos uno de los estimadores es significativo, por lo que podemos concluir que el modelo es significativo. 42
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 c. Calcular R2 y R2adj para el modelo. Compararlas con la R2 y R2adj de regresión lineal simple, que relacionaba las millas con la cilindrada en el problema 2.4. Calculamos R2:
Calculamos R2ajustado:
INTERPRETACIÓN: como no existe diferencia significativa entre R2 y R2ajustado podemos afirmar que todos los términos del modelo son significativos.
Comparación con el ejercicio 2.4.:
COMPARACIÓN: debido a que R 2 es menor cuando se trabaja con el modelo simple con una sola variable que cuando se trabaja con un modelo múltiple con 2 variables (x1 y x2), y R2 es la explicación de la variabilidad de y explicada por la ecuación de regresión es conveniente trabajar con el modelo de regresión múltiple con x1 y x2 como variables independientes.
43
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 d. Determinar un intervalo de confianza de 95% para β1. Para determinar el intervalo necesitamos: 2:
̂
̂ ̂ V(β1): Necesitamos la matriz C: C00 C01 C06 C = (X'X) = C10 C11 C16 C60 C61 C66 -1
0.260195 -0.000410 -0.043272 C = (X'X)-1 = -0.000410 0.000004 -0.000296 -0.043272 -0.000296 0.049206
La fórmula para V(1):
()̂ () ()
Entonces la fórmula para el intervalo:
⁄ () Dónde:
Entonces:
44
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
INTERPRETACIÓN: se estima al 95% de confianza que el valor del parámetro 1 oscilará entre -0.0656 y -0.0405
e. Calcular el estadístico t para probar pueden sacar? Prueba de significancia individual para β1:
Estadístico de prueba:
Hallamos:
Si:
y
. ¿Qué conclusiones se
() √ ||
Existe evidencia para rechazar H0, es decir 1 no es significativo en el modelo propuesto. Contraste de la hipótesis usando la probabilidad (p):
45
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 Entonces:
Si:
()̂ () () () √ ||
Prueba de significancia individual para β6:
Hallamos V(6):
Estadístico de prueba:
Hallamos:
Si:
No existe evidencia para rechazar H0, es decir 6 no es significativo en el modelo propuesto. 46
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 Contraste de la hipótesis usando la probabilidad (p):
Entonces:
Si:
f.
Determinar un intervalo de predicción de 95% para una nueva observación de rendimiento de gasolina cuando x1 = 275 pulg3 y x6 = 2 gargantas.
Hallamos la matriz x0 y su transpuesta: 1 x0 =
x0'
Hallamos ŷ0:
Hallamos la V(ŷ0):
47
275 2
1
275
̂ ̂ ̂̂ ̂
UNIVERSIDAD NACIONAL DE TRUJILLO
2
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 Hacemos el intervalo:
⁄̂ ⁄ ̂ ⁄ INTERPRETACIÓN: se estima al 95% de confianza que la dureza promedio cuando x 1 es 275 pulg3 y x6 es 2 gargantas estará comprendida entre 18.869 y 21.5059 millas/galón. g. Determinar un intervalo de predicción de 95% para una nueva observación de rendimiento de gasolina cuando x1 = 275 pulg3 y x6 = 2 gargantas. De item anterior sabemos que:
Hallamos la V(ŷ0):
̂ ̂ ̂ ̂ ⁄ ̂ ⁄
La fórmula del intervalo para una nueva predicción es:
Sabemos que:
El intervalo será:
INTERPRETACIÓN: se estima al 95% de confianza que la dureza para nuevas observaciones cuando x1 es 275 pulg3 y x6 es 2 gargantas estará comprendida entre 18.869 y 21.5059 millas/galón.
48
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 3.8. Los datos de la siguiente tabla presentan la eficiencia de un proceso químico, en función de varias variables controlables del proceso.
49
N°
y:CO2
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
36.98 13.74 10.08 8.53 36.42 26.59 19.07 5.96 15.52 56.61 26.72 20.8 6.99 45.93 43.09 15.79 21.6 35.19 26.14 8.6 11.63 9.59 4.42 38.89 11.19 75.62 36.03
X6:Solvente Total X 7:Consumo de Hidrógeno 2227.25 434.9 481.19 247.14 1645.89 907.59 608.05 380.55 213.4 2043.36 761.48 566.4 237.08 1961.49 1023.89 411.3 2244.77 978.64 687.62 468.28 460.62 290.42 233.95 2088.12 994.63 2196.17 1080.11
UNIVERSIDAD NACIONAL DE TRUJILLO
2.06 1.33 0.97 0.62 0.22 0.76 1.71 3.93 1.97 5.08 0.6 0.9 0.63 2.04 1.57 2.38 0.32 0.44 8.82 0.02 1.72 1.88 1.43 1.35 1.61 4.78 5.88
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 a. Ajustar un modelo de regresión múltiple que relaciona el CO2 del producto(y) con el solvente total (X 6 ) y el consumo de hidrogeno (X 7 )
Donde:
Y=
50
UNIVERSIDAD NACIONAL DE TRUJILLO
36.98 13.74 10.08 8.53 36.42 26.59 19.07 5.96 15.52 56.61 26.72 20.8 6.99 45.93 43.09 15.79 21.6 35.19 26.14 8.6 11.63 9.59 4.42 38.89 11.19 75.62 36.03
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 1 1 1 1 1 1 1 1 1 1 1 1 1 X= 1 1 1 1 1 1 1 1 1 1 1 1 1 1
2227.25 434.9 481.19 247.14 1645.89 907.59 608.05 380.55 213.4 2043.36 761.48 566.4 237.08 1961.49 1023.89 411.3 2244.77 978.64 687.62 468.28 460.62 290.42 233.95 2088.12 994.63 2196.17 1080.11
2.06 1.33 0.97 0.62 0.22 0.76 1.71 3.93 1.97 5.08 0.6 0.9 0.63 2.04 1.57 2.38 0.32 0.44 8.82 0.02 1.72 1.88 1.43 1.35 1.61 4.78 5.88
27 25874.29 55.02 X'X= 25874.29 38111725.38 58043.2026 55.02 58043.2026 218.3418
0.132317504 -6.56168E-05 -0.015899372 (X'X)-1= -6.56168E-05 7.6628E-08 -3.83572E-06 -0.015899372 -3.83572E-06 0.009606136
667.72 X'Y= 898144.97 1691.3233
51
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
2
2
b. Probar la significancia de la regresión. Calcular R y R Adj
b.1) Probar la significancia de la regresión: H0: 1=2=…=k = 0 H1: j≠0 al menos una j
Estadístico de Prueba
⁄⁄
Se rechaza H0 si:
F0 > F(p-1,n-p)
667.72 X'Y= 898144.97 1691.3233
n=27
52
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
p= 3
F(0.05,2,24)= 3.402826
F. de V
SC
GL
CM
F0
Valor P
Regresión Error Total
5506.287 2363.825 7870.112
2 24 26
2753.143 98.493
27.953
5.39031E-07
Comparamos:
F0 > F(0.05,2,24) 27.953> 3.402826
Interpretación:
Al rechazarse Ho entonces tenemos que al menos una de los regresores X6(solvente total) o X7(consumo de hidrógeno) contribuye al modelo Y=2.52663+0.01852X6+2.18572X7 en forma significativa.
53
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 b.2) Calcular R2
SCR= 5506.286737
SCT= SCE + SCR SCT= 2363.82536 + 5506.286737 SCT=7870.112
Interpretación: Existe un 69,96% de variabilidad total de la variable Y expresada por la variable X en el modelo de regresión múltiple estimada.
b.3) Calcular R2Adj
() c.
Usar pruebas t para determinar la contribución de X 6 y X 7 al modelo. c.1) Contribución de X 6:
54
Estadístico de Prueba:
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 Se rechaza H0 si:
||
Datos:
C jj=diagonal de la matriz C=(X’X)-1 0.132317504 -6.56168E-05 -0.015899372 (X'X)-1= -6.56168E-05
7.6628E-08
-3.83572E-06
-0.015899372 -3.83572E-06 0.009606136
̂ Tenemos:
Comparamos:
√
||
Interpretación: El coeficiente 6 es individualmente significativo al modelo de regresión lineal múltiple.
55
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 c.2) Contribución de X 7:
Estadístico de Prueba:
Se rechaza H0 si:
||
Desarrollo:
C jj=diagonal de la matriz C=(X’X)-1 0.132317504 -6.56168E-05 -0.015899372 (X'X)-1= -6.56168E-05
7.6628E-08
-3.83572E-06
-0.015899372 -3.83572E-06 0.009606136
̂ Tenemos:
√
56
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
Comparamos:
Interpretación: El coeficiente β7 es individualmente
||
significativo al modelo de regresión lineal múltiple.
d. Establecer intervalos de confianza de 95% para β6 y β7
Para β6:
√
Para β7:
√
57
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 e. Volver a ajustar el modelo solo con X6 como regresor. Probar la significancia de la regresión y calcular R 2 Y R2Adj. Comentar los resultados. Con base en estos estadísticos. ¿Es satisfactorio el modelo? N° y :CO2
58
X6 : Solvente Total
1 2
36.98 13.74
2227.25 434.9
3
10.08
481.19
4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
8.53 36.42 26.59 19.07 5.96 15.52 56.61 26.72 20.8 6.99 45.93 43.09 15.79 21.6 35.19 26.14 8.6 11.63 9.59 4.42 38.89 11.19 75.62 36.03
247.14 1645.89 907.59 608.05 380.55 213.4 2043.36 761.48 566.4 237.08 1961.49 1023.89 411.3 2244.77 978.64 687.62 468.28 460.62 290.42 233.95 2088.12 994.63 2196.17 1080.11
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
Eficiencia de un Proceso Químico 80 70
y = 0.0985x0.8016 R² = 0.7078
60 2 O C
50 40 30 20 10 0 0
500
1000
1500
2000
Solvente Total
59
Ajustamos los datos a un Modelo Potencial de Regresión Lineal:
X6
Y
2227.25
36.98
1.56796691 3.34776897
434.9
13.74
1.13798673 2.63838941
471.19
10.08
1.00346053 2.67319606
247.14
8.53
0.93094903 2.39294304
1645.89
36.42
1.56133994 3.21640081
907.59
26.59
1.42471834
608.05
19.07
1.28035069 2.78393929
380.55
5.96
0.77524626 2.58041173
213.4
15.52
1.19089172 2.32919442
2043.36
56.61
1.75289315 3.31034489
761.48
26.72
1.42683645
566.4
20.8
1.31806333 2.75312324
237.08
6.99
0.84447718 2.37489492
1961.49
45.93
1.66209645
3.2925861
1023.89
43.09
1.63437649
3.0102533
UNIVERSIDAD NACIONAL DE TRUJILLO
Log Y
Log X6
2.9578897
2.8816585
2500
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
15.79
1.19838213 2.61415871
2244.77
21.6
1.33445375 3.35117185
978.64
35.19
1.54641927 2.99062296
687.62
26.14
1.41730558
468.28
8.6
0.93449845 2.67050561
460.62
11.63
1.06557971 2.66334279
290.42
9.59
0.98181861 2.46302652
233.95
4.42
0.64542227 2.36912305
2088.12
38.89
1.58983794 3.31975545
994.63
11.19
1.04883009 2.99766155
2196.17
75.62
1.87863667 3.34166595
1080.11
36.03
1.55666426 3.03346799
Desarrollando
∑XY= 101.631286
n= 27
2.8373485
∑ ∑
60
411.3
:
∑X2= 223.692245
Sxx= 2.9869061
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
Interpretación: Si
el solvente total aumenta en una unidad, el CO2 del
producto aumentará en 0.0816482.
Desarrollando
: Para el caso de Potencia:
Significancia de la regresión:
Estadístico de Prueba:
Regresión Residuos Total
Grados de libertad
Suma de cuadrados
Cuadrado Medio
F
Valor crítico de F(Valor P)
1 25 26
1.91950462 0.79253668 2.7120413
1.91950462 0.03170147
60.5493936
3.8797E-08
61
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
Comparando:
Interpretación: Como el Ho> H se dice que existe al menos un coeficiente del
modelo de regresión que influye en el comportamiento de Y (CO2).
Calcular R2
Interpretación: Existe un 70.78% de variabilidad total en el CO2 (Y) en el producto
expresado por el solvente total del producto (X 6) en el modelo de regresión estimada.
Calcular R2Adj
()
¿Es satisfactorio el modelo? El Modelo de Regresión Simple para X (CO2) y el Solvente Total(X6) es satisfactorio ya que tiene un 70% de significancia.
62
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 f.
Establecer un intervalo de confianza de 95% para β6, con el modelo que se ajusto en el punto e. Comparar la longitud de este intervalo de confianza con la del determinado en la parte d. ¿Se deduce algo importante acerca de la contribución de X7 al modelo?
∑
Comparamos los intervalos:
Intervalo de Regresión Lineal Múltiple(inciso d)
Intervalo de Regresión Lineal Simple(inciso e)
g. Comparar los valores del CME obtenidos con los dos modelos que se ajustaron (partes a y e) ¿Cómo cambio el CME al quitar X7 del modelo? ¿Indica lo anterior algo importante acerca de la contribución de X7 al modelo?
CME del inciso a:
CME del inciso e
63
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
¿Cómo cambio el CME al quitar X7?
Al obtener el CME del Modelo de Regresión Simple de las variables Y y X6 este valor disminuyo, lo cual nos dice que X7 no es tan significativo para este modelo; ya que al estudiar solo X6 tenemos menos error.
¿Indica lo anterior algo importante acerca de la contribución de X7 al modelo? Nos indica que X7 no contribuye mucho a nuestro Modelo de Regresión Múltiple.
3.12. Un ingeniero químico estudió el efecto de la cantidad de surfactante y el tiempo sobre la formación de catrato. Los catratos se usan como medio de conservación en frio. La siguiente tabla resume los resultados experimentales. Cant.Surfactante Tiempo(min) Form.Catrato X1 X2 Y 0 10 7.5 0 50 15 0 85 22 0 110 28.6 0 140 31.6 0 170 34 0 200 35 0 230 35.5 0 260 36.5 0 290 38.5 0 10 12.3 0 30 18 0 62 20.8 0 90 25.7 0 150 32.5 0 210 34 0 270 35 0.02 10 14.4 0.02 30 19 0.02 60 26.4 0.02 90 28.5 0.02 120 29 0.02 210 35 0.02 30 15.1 0.02 60 26.4 0.02 120 27 0.02 150 29 0.05 20 21 0.05 40 27.3 0.05 130 48.5 0.05 190 50.4 0.05 250 52.5 64
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 0.05 0.05 0.05 0.05
60 90 120 150
34.4 46.5 50 51.9
a. Ajustar un modelo de regresión lineal múltiple que relacione la formación de catrato con estos regresores
Donde:
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 X= 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
65
UNIVERSIDAD NACIONAL DE TRUJILLO
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.02 0.02 0.02 0.02 0.02 0.02 0.02 0.02 0.02 0.02 0.05 0.05 0.05 0.05 0.05
10 50 85 110 140 170 200 230 260 290 10 30 62 90 150 210 270 10 30 60 90 120 210 30 60 120 150 20 40 130 190 250
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 1 1 1 1
0.05 0.05 0.05 0.05
60 90 120 150
7.5 15 22 28.6 31.6 34 35 35.5 36.5 38.5 12.3 18 20.8 25.7 32.5 Y = 34 35 14.4 19 26.4 28.5 29 35 15.1 26.4 27 29 21 27.3 48.5 50.4 52.5 34.4 46.5 50 51.9
36 0.65 4297 X'X = 0.65 0.0265 70.1 4297 70.1 746169 66
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
0.12183 -1.50687 -0.00056 (X'X)- 1= -1.50687 68.85280 0.00221 -0.00056 0.00221 0.000004
1094.8 X'Y : 24.121 153467.6
b. Probar la significancia de la regresión ¿A qué conclusiones se puede llegar? H0: β1=β2=…=βk = 0 H1: β j≠0 al menos una j
Estadístico de Prueba
⁄⁄
Se rechaza H0 si: F0 > F(α,p-1,n-p)
n=36
x'y =
67
UNIVERSIDAD NACIONAL DE TRUJILLO
1094.8 24.121 153467.6
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
p= 3
F(0.05,2,33)= 3.4028
F. de V Regresión Error Total
SC 4007.072 754.744 4761.816
GL 2 33 35
CM 2003.536 22.871
F 87.601
Valor P 6.316E-14
Comparamos: F0 > F(0.05,2,24) 87.601 > 3.4028; rechazamos H0
Interpretación: Se puede concluir que al menos una de los regresores X1(cantidad de surfactante) o X2(tiempo) contribuye al modelo Y=11.0870+350.1192 X1+0.1089 X2 en forma significativa.
c. Hacer pruebas t para evaluar la contribución de cada regresor al modelo. Comentar los resultados c.1) Contribución de β1:
68
Estadístico de Prueba:
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 Se rechaza H0 si:
||
Desarrollo:
C jj=diagonal de la matriz C=(X’X)-1 0.12183 -1.50687 -0.00056 (X'X)-1 = -1.50687 68.85280 0.00221 -0.00056 0.00221 0.000004
̂ Tenemos:
√
Comparamos:
||
69
Interpretación: El coeficiente 1 es individualmente significativo al modelo de regresión lineal múltiple.
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 c.2) Contribución de β2:
Estadístico de Prueba:
Se rechaza H0 si:
Desarrollo:
||
C jj=diagonal de la matriz C=(X’X)-1 0.12183 -1.50687 -0.00056 (X'X)-1 : -1.50687 68.85280 0.00221 -0.00056 0.00221 0.000004
̂ Tenemos:
√
70
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012
Comparamos:
||
d.
Interpretación: El coeficiente β2 es individualmente significativo al modelo de regresión lineal múltiple.
Calcular R2 y R2Adj para este modelo. Comparar esos valores con los de R2 y R2Adj para el modelo de regresión lineal simple que relaciona la formación de catrato con el tiempo. Comentar los resultados d.1) R2 y R2Adj para este modelo:
F. de V Regresión Error Total
SC 4007.072 754.744 4761.816
GL 2 33 35
CM 2003.536 22.871
F 87.601
Interpretación: Existe un 84.15% de variabilidad total en la formación de catrato expresada por la variable X (cantidad de surfactante y tiempo) en el modelo de regresión múltiple estimada.
() 71
UNIVERSIDAD NACIONAL DE TRUJILLO
Valor P 6.316E-14
[LABORATORIO PRIMERA UNIDAD] UNIDAD ] 11 de mayo de 2012 d.1) R2 y R2Adj para X2:
72
X2
Y
10 50 85 110 140 170 200 230 260 290 10 30 62 90 150 210 270 10 30 60 90 120 210 30 60 120 150 20 40 130 190 250 60 90 120 150
7.5 15 22 28.6 31.6 34 35 35.5 36.5 38.5 12.3 18 20.8 25.7 32.5 34 35 14.4 19 26.4 28.5 29 35 15.1 26.4 27 29 21 27.3 48.5 50.4 52.5 34.4 46.5 50 51.9
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] UNIDAD ] 11 de mayo de 2012 n=
36 119.4 30.41 Sxy= 22791.1 Sxx= 233274.3
SCR = 2226.701 SCE = 2535.114 SCT = 4761.816
Hallamos R2 y R2Ajus
Interpretación: Existe Interpretación: Existe un 46.8% de variabilidad total en la formación de catrato expresada por el tiempo en el modelo de regresión múltiple estimada.
( )
73
Comentario de los resultados: resultados: Como se observa anteriormente el R2 y R2Ajus en el Modelo de Regresión Lineal Múltiple es mayor que el de Modelo de Regresión Lineal, por lo que se concluye que el Modelo de Regresión Lineal Múltiple es mayor debido a que tiene una variable mas y dicha variable proporciona mas variabilidad además que el Cuadrado Medio del Erros es menor.
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] UNIDAD ] 11 de mayo de 2012 e. Determinar un intervalo de confianza de 95% para el coeficiente de regresión del tiempo para los dos modelos de la l a parte d. Comentar las diferencias encontradas
e.1) Para
e.2) Para
∑
del Modelo de Regresión Lineal L ineal Múltiple
del Modelo de Regresión Lineal
√
Comentario de las diferencias encontradas: Podemos observar que 1 en el Modelo de Regresión R egresión Lineal Simple tiene mayor amplitud que el Modelos de Regresión Lineal Múltiple; por lo cual podemos decir que 1(MRLS) es más conveniente.
3.16. Demostrar que una forma equivalente de hacer la prueba de la significancia de una regresión lineal múltiple es basar la prueba de R2 como sigue: H0: β1=β2=…=βk H1: al menos una β j≠0 Calcular lo siguiente:
Y rechazar H0 si el valor calculado de F0 > F (α,k,n-p) (α,k,n-p), siendo p=k+1 74
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 DEMOSTRACION:
⁄ ⁄ ⁄
Tenemos que p = k+1:
75
UNIVERSIDAD NACIONAL DE TRUJILLO
[LABORATORIO PRIMERA UNIDAD] 11 de mayo de 2012 3.17. Suponer que se ha ajustado un modelo de regresión lineal con k=2 regresores, a n=25 observaciones, y que R2=0.9 a. Probar el significado de la regresión con α=0.05. Usar los resultados del problema anterior H0: β1=β2=…=βk = 0 H1: β j≠0 al menos una j
Estadístico de Prueba
()
Se rechaza H0 si: F0 > F(α,p-1,n-p)
Datos: k=2 p= k+1=3 n= 25 R2=0.9 α=0.05
Reemplazando:
Comparamos Fo > F
F0 > F(0.05,2,22) 99 > 3.443, se rechaza H0
Interpretación:
Se puede concluir que al menos una de los regresores X1 o X2 contribuye en el Modelo de Regresión Lineal Múltiple en forma significativa.
76
UNIVERSIDAD NACIONAL DE TRUJILLO