Ejercicios de RLM
1.- El Gobierno Municipal de Aguascalientes desea estimar la recaudación de adeudos en los servicios públicos en función de los gastos de publicidad en TV y en volantes de los descuentos disponibles que ofrece a sus habitantes. Los datos históricos de una muestra de 8 semanas son los siguientes.
Recaudación semanal (miles de $)
Anuncios en TV (miles de $)
Anuncios en volantes (miles de $)
96
5.0
1.5
90
2.0
2.0
95
4.0
1.5
92
2.5
2.5
95
3.0
3.3
94
3.5
2.3
94
2.5
4.2
94
3.0
2.5
Resolver los ejercicios con r.
Deduzca una ecuación de regresión estimada con la cantidad de anuncios por TV como variable independiente. Interprete los coeficientes estimados.
La ecuación de regresión es
Recaudación (miles de $) = 88.6 + 1.60 TV (miles de $)
Esto quiere decir que la recaudación aumentará en $1,000 cada vez que los anuncios en TV aumenten $1,600
Determine el coeficiente de correlación, el coeficiente de determinación y el coeficiente de determinación ajustado. Interprete y comente sus resultados.
Coef. Correlación = 80.80%
Coef. Determinación = 65.3%
Coef. Determinación Ajustado = 59.5%
Existen una correlación fuerte entre los valores, aunque no llega a ser una correlación perfecta.
Obtenga un diagrama de dispersión para las tres variables: Recaudación semanal, anuncios en TV y anuncios en volantes. Interprete.
Deduzca una ecuación de regresión estimada con la cantidad de anuncios por TV y volantes como variables independientes. Interprete los coeficientes estimados.
Recaudación (miles de $) = 83.2 + 2.29 TV (miles de $) + 1.30 volantes (miles de $)
Por cada $1000 pesos gastados en anuncios de TV, se recaudarán $2290
Al igual que en el caso anterior, por cada $1000 pesos gastados en Volantes, se recaudarán $1300
Obtenga una superficie de respuesta.
Determine el coeficiente de correlación, el coeficiente de determinación múltiple y el coeficiente de determinación múltiple ajustado. Interprete y comente sus resultados.
R-cuad. = 91.9%
R-cuad.(ajustado) = 88.7%
Con la información obtenida en los incisos b) y e), explique si existió un mejora en el modelo.
Existió una mejora en el nivel de ajuste del modelo de regresión lineal múltiple, en comparación de la regresión lineal simple. (El coeficiente cambió de 65.3% a 91.9%)
¿Cuál es el ingreso bruto estimado para una semana en la que se gastarán $3.5 miles en publicidad en TV y $1.8 miles en publicidad en periódicos?
Valores pronosticados para nuevas observaciones
EE de
Nueva obs Ajuste ajuste IC de 95% IP de 95%
1 93.588 0.291 (92.840, 94.335) (91.774, 95.401)
Valores de predictores para nuevas observaciones
Anuncios
en TV Anuncios en
(miles volantes
Nueva obs de $) (miles de
1 3.50 1.80
El ingreso bruto estimado es de $9358.8.00 m/n, asumiendo un gasto de $350000 m/n en anuncios de TV y de $180000 m/n en anuncios por volantes.
Aplique una prueba de hipótesis para determinar si el modelo completo es significativo. Use 0.05.
Tabla ANOVA
Análisis de varianza
Fuente GL SC MC F P
Regresión 2 23.435 11.718 28.38 0.002
Error residual 5 2.065 0.413
Total 7 25.500
Ho: β0=0
H1: β0 0
EP>PC, Se rechaza Ho, por lo tanto, el modelo es significativo.
P α (0.002 0.05), por lo tanto se rechaza Ho, el modelo es significativo.
Aplique una prueba de hipótesis para cada coeficiente , y . Use .05.
Predictor Coef SE Coef T P
Constante 83.230 1.574 52.88 0.000
Anuncios en TV (miles de $) 2.2902 0.3041 7.53 0.001
Anuncios en volantes (miles de 1.3010 0.3207 4.06 0.010
β0
β1
β2
Los 3 coeficientes son individualmente significativos, dado que:
P(β0)<α
P(β1)<α
P(β2)<α
Estime un intervalo de confianza y un intervalo de predicción del 90%, para $3.7 miles en publicidad en TV y $1.9 miles en publicidad en volantes. Interprete sus resultados.
EE de
Nueva obs Ajuste ajuste IC de 90% IP de 90%
1 94.176 0.279 (93.613, 94.738) (92.764, 95.587)
Asumiendo un gasto de $3700 pesos en Publicidad de TV y $1900 en Publicidad en volantes, se puede esperar obtener una ganancia desde $93,613 hasta $94,738 con un 90% de confiabilidad.
Determine si se cumplen los supuestos básicos de regresión múltiple.
Existe un ligero problema de normalidad, ya que hay 2 datos aberrantes. (Gráfica de Probabilidad Normal)
En cuanto a la homocedasticidad, se presentan problemas. (vs. Ajustes)
No hay problemas en cuanto a Linealidad. (vs Ajustes)
No existen problemas de Independencia, ya que los residuales se encuentran en forma de Zig-Zag. (vs. Orden)
Valores Atípicos y de influencia:
RESIDEST1
RESIDT1
HI1
COOK1
-1.625
-2.115
0.633
1.517
-1.078
-1.100
0.645
0.704
1.225
1.309
0.301
0.216
-0.368
-0.334
0.226
0.013
1.098
1.127
0.262
0.142
-0.399
-0.363
0.140
0.009
-1.121
-1.158
0.660
0.814
1.080
1.104
0.132
0.059
No hay valores atípicos
Vabs(2)
No hay valores de Influencia
3.16338145
No hay valores de Influencia
2*(2+1)/8
0.75
Existen 2 valores de influencia
0.799
Alfa
0.05
0.025
N
8
K
2
L
1
Grados Libertad
5
2. Los siguientes datos describen el experimento para determinar la influencia de:
: temperatura del baño ácido.
: concentración de ácido de cascada.
: temperatura del agua.
: concentración de sulfuro.
: cantidad de blanqueador de cloro.
Sobre una medida adecuada de blancura del rayón ().
Temperatura de ácido
concentración de ácido de cascada
temperatura del agua
concentración de sulfuro
cantidad de blanqueador de cloro
blancura del rayón
x1
x2
x3
x4
x5
y
35
0.3
82
0.2
0.3
76.5
35
0.3
82
0.3
0.5
76
35
0.3
88
0.2
0.5
79.9
35
0.3
88
0.3
0.3
83.5
35
0.7
82
0.2
0.5
89.5
35
0.7
82
0.3
0.3
54.2
35
0.7
88
0.2
0.3
85.7
35
0.7
88
0.3
0.5
99.5
55
0.3
82
0.2
0.5
89.4
55
0.3
82
0.3
0.3
97.5
55
0.3
88
0.2
0.3
103.2
55
0.3
88
0.3
0.5
108.7
55
0.7
82
0.2
0.3
115.2
55
0.7
82
0.3
0.5
111.5
55
0.7
88
0.2
0.5
102.3
55
0.7
88
0.3
0.3
108.1
25
0.5
85
0.25
0.4
80.2
65
0.5
85
0.25
0.4
89.1
45
0.1
85
0.25
0.4
77.2
45
0.9
85
0.25
0.4
85.1
45
0.5
79
0.25
0.4
71.5
45
0.5
91
0.25
0.4
84.5
45
0.5
85
0.15
0.4
77.5
45
0.5
85
0.35
0.4
79.2
45
0.5
85
0.25
0.2
71
45
0.5
85
0.25
0.6
90.2
Resolver los ejercicios matricialmente en Excel y r.
Deduzca una ecuación de regresión estimada con la blancura del rayón como variable dependiente. Interprete los coeficientes estimados.
blancura del rayón = - 73.1 + 0.870 Temperatura de ácido
+ 14.0 concentración de ácido de casca
+ 1.21 temperatura del agua + 0.6 concentración de sulfuro
+ 29.7 cantidad de blanqueador de cloro
La blancura del rayón aumentará cada vez que: la temperatura del ácido aumente 0.87°C, la concentración del ácido cascada aumente en 14 mL/L, la temperatura del agua aumente 1.21°C, la concentración del sulfuro aumente en 0.6% y la cantidad de blanqueador de cloro aumente en 29.7 mL/L
Determine el coeficiente de correlación, el coeficiente de determinación y el coeficiente de determinación ajustado. Interprete y comente sus resultados.
Coeficientes Blancura Rayón vs Temperatura ácido
Correlación: 0.5881
Determinación: 0.346
Determinación ajustado: 0.319
Coeficientes Blancura Rayón vs Concentración ácido cascada
Correlación: 0.1897
Determinación: 0.036
Determinación ajustado: 0
Coeficientes Blancura Rayón vs Temperatura Agua
Correlación: 0.2449
Determinación: 0.06
Determinación ajustado: 0.021
Coeficientes Blancura Rayón vs % Sulfuro
Correlación: 0
Determinación: 0.0
Determinación ajustado: 0.0
Coeficientes Blancura Rayón vs Cantidad Cloro
Correlación: 0.2
Determinación: 0.04
Determinación ajustado: 0.0
Determine el coeficiente de correlación, el coeficiente de determinación múltiple y el coeficiente de determinación múltiple ajustado. Interprete y comente sus resultados.
R-cuad. = 48.3% R-cuad.(ajustado) = 35.3%
Correlación: 0.6949
Determinación: 0.483
Determinación ajustado: 0.353
Aplique una prueba de hipótesis para determinar si el modelo completo es significativo. Use 0.05.
Ho: β0=0
H1: β0 0
Se rechaza Ho Valor P α
TABLA ANOVA:
Fuente GL SC MC F P
Regresión 5 2533.8 506.8 3.73 0.015
Error residual 20 2715.8 135.8
Total 25 5249.7
0.015<α , Se rechaza Ho, el modelo es significativo
Aplique una prueba de hipótesis para cada coeficiente. Use 0.05.
Ho: β=0
H1: β 0
Aceptar Ho significa que ningún término o variable en el modelo tiene una contribución significativa al explicar la variable de respuesta. Mientras que rechazar Ho implica que por lo menos un término en el modelo contribuye de manera significativa a explicar Y.
Predictor Coef SE Coef T P
Constante -73.08 70.21 -1.04 0.310
Temperatura de ácido 0.8704 0.2379 3.66 0.002
concentración de ácido de casca 13.98 11.89 1.18 0.254
temperatura del agua 1.2097 0.7929 1.53 0.143
concentración de sulfuro 0.58 47.57 0.01 0.990
cantidad de blanqueador de clor 29.71 23.79 1.25 0.226
β0 Valor P > α β0 Valor P > α
β1 Valor P < α
β2 Valor P > α
β3 Valor P > α
β4 Valor P > α
En este caso, solo el coeficiente β1 es significativo.
Estime un intervalo de confianza y un intervalo de predicción del 95%, para X1=40, X2=0.4, X3=80, X4=0.25 y X5=0.3. Interprete sus resultados.
Determine si se cumplen los supuestos básicos de regresión múltiple.
¿Qué puede hacer para mejorar el modelo de regresión?
Se hace un análisis paso a paso de la regresión, usando el método de eliminación hacia atrás (α=0.05) y los resultados muestran que sería mejor hacer una regresión lineal simple con la blancura del rayón como variable dependiente y temperatura del ácido como variable independiente.
Regresión paso a paso: blancura del vs. Temperatura , concentració, ...
Eliminación hacia atrás. Alfa a retirar: 0.05
La respuesta es blancura del rayón en 5 predictores, con N = 26
Paso 1 2 3 4 5
Constante -73.08 -72.94 -65.95 -54.06 48.76
Temperatura de ácido 0.87 0.87 0.87 0.87 0.87
Valor T 3.66 3.75 3.71 3.66 3.57
Valor P 0.002 0.001 0.001 0.001 0.002
concentración de ácido de casca 14 14
Valor T 1.18 1.20
Valor P 0.254 0.242
temperatura del agua 1.21 1.21 1.21 1.21
Valor T 1.53 1.56 1.55 1.53
Valor P 0.143 0.133 0.136 0.140
concentración de sulfuro 1
Valor T 0.01
Valor P 0.990
cantidad de blanqueador de clor 30 30 30
Valor T 1.25 1.28 1.27
Valor P 0.226 0.215 0.218
S 11.7 11.4 11.5 11.6 12.0
R-cuad. 48.27 48.27 44.69 40.66 34.64
R-cuad.(ajustado) 35.33 38.41 37.15 35.50 31.91
Cp de Mallows 6.0 4.0 3.4 2.9 3.3
10
Estadística / UAA / fjds