Cuarta Práctica Calificada Estadística y Probabilidades MB-613 A
Profesora: -Liliana Huaman del Pino
Integrantes:
-Pérez-Palma Vásquez, Edgard -Yaranga Cá Cáceres, Le Leonardo An Andrés
20080094a 2 00 80 06 2 b
Rimac 09 de marzo del 2010 UNI-FIM
1.- La experiencia en la crianza en pollos New Jersey Red, reveló que el peso promedio de tales aves a la edad de cinco cinco meses meses es de 4.35 libras. libras. Los pesos están distribuid distribuidos os normalmente. A fin de aumentar su peso, un aditivo especial se mezcló a su alimento común. común. Lo Loss pesos pesos subse subsecue cuente ntess de una mues muestra tra de pollo polloss de cinco cinco meses meses fueron fueron:: 4.41 4.37 4.33 4.35 4.25 4.68 4.40 4.26. Al nivel de 0.01, Incrementó el aditivo especial el peso de las aves? Tomamos nuestra hipótesis: H0 : µ ≥ 4.35 H1 : µ < 4.35 Estandarizando la distribución: z =
x − µ
δ n
Como el
α
= 0.01, nuestro Z critico sera: z 0.01 = −2,33 , quiere decir que para z < -2,33 se rechazara H0 , pues nuestra zona crítica se encuentra en la cola izquierda. Usando los valores de la muestra : z =
4,368
− 4.35
0.034
=1,6776
el cual es mayor al Z crítico, por lo que se acepta el H0 .
10
El aditivo favorece al peso de las aves.
2.- El cloro líquido que se agrega al agua de piscinas para combatir organismos de la especie alga tiene una duración de almacenamiento relativamente corta antes de que pierda su eficacia. Los registros indican que la duración promedio de almacenamiento
de una botella con 5 galones de cloro es 2 160 horas (90 días). Como un experimento, se agregó el producto Holdlonger al cloro para averiguar si permite incrementar esta duración. Una muestra de nueve botellas de cloro proporcionó os siguientes valores (en horas): 2159, 2170, 2180, 2179, 2160, 2167, 2171, 2181, 2185. Al nivel de significancia de 0.025, Incrementó Holdlonger el tiempo útil de almacenamiento de cloro? Tomamos nuestra hipótesis: H0 : µ ≥ 2160 H1 : µ < 2160 Estandarizando la distribución: z =
x − µ
δ n
Como el
= 0.025, nuestro Z critico sera: = −1,96 , quiere decir que para z < -1,96 se rechazara H0 , pues nuestra zona z 0.025 crítica se encuentra en la cola izquierda. α
Usando los valores de la muestra: z =
2172 ,44
− 2160
9,38
=13,98
el cual es mayor al Z crítico, por lo que se acepta el H0 .
9
El producto Holdlonger resulta beneficioso para el propósito.
3.- Las pescaderías de Wyoming afirman que el número medio de truchas que se atraparon durante un día completo de pesca con caña en los ríos Snake, Bufalo y otros ríos y arroyos en el área de Jackson Hole, es de 4,0. Para realizar su actualización anual, se pidió a una muestra de pescadores con caña que anotaran el número de truchas que atrapan durante el dia. Las cantidades fueron: 4, 4, 3, 2, 6,8,7,1,9,3,1,6. Al nivel de 0.05,
hay evidencia convincente de que ha aumentado el número de truchas que se atrapan al dia? Tomamos nuestra hipótesis: H0 : µ ≥ 4.0 H1 : µ < 4.0 Estandarizando la distribución: z =
x − µ
δ n
Como el
α
= 0.05, nuestro Z critico sera: z 0.05 = −1,65 , quiere decir que para z < -1,65 se rechazara H0 , pues nuestra zona crítica se encuentra en la cola izquierda. Usando los valores de la muestra : z =
4,5 − 4.0 2,68
= 0,646
el cual es mayor al Z crítico, por lo que se acepta el H0 .
12
Es evidente que el número de truchas pescadas ha aumentado.
4.- Una empresa de encuestas afirma que un agente realiza 53 investigaciones a fondo en hogares cada semana. S presentó un formulario de encuesta moderno y la compañía desea evaluar su eficiencia. Las encuestas realizadas durante una semana por una muestra aleatoria de agentes son: 53, 57, 50, 55, 54, 60, 52, 59, 63, 60, 60, 61, 51, 56. Al nivel de significancia de 0.05, Se puede concluir que el número medio de encuestas realizadas por los agentes es mayor que 53 a la semana?
Tomamos nuestra hipótesis: H0 : µ ≥ 53 H1 : µ < 53 Estandarizando la distribución: z =
x − µ
δ n
Como el
α
= 0.05, nuestro Z critico sera: z 0.05 = −1,65 , quiere decir que para z < -1,65 se rechazara H0 , pues nuestra zona crítica se encuentra en la cola izquierda. Usando los valores de la muestra: z =
56 ,4 − 53 3,738
= 3,523
el cual es mayor al Z crítico, por lo que se acepta el H0 .
15
Las encuestas realizadas en la semana son mayores a 53.
5.- En forma reciente se ha incrementado el interés de avaluar el efecto del ruido sobre la habilidad de las personas para llevar a cabo una determinada tarea. Un investigador diseña un experimento en el que se pedirá un determinado número de sujetos que lleven a cabo una tarea específica en un medio controlado y bajo 2 niveles de ruido de fondo. El investigador selecciona 32 personas que son capaces de realizar la misma tarea y de manera práctica en el mismo tiempo. Del total de personas, 16 seleccionadas al azar realizan esta tarea bajo un mismo nivel modesto de ruido de fondo 1. Las restantes 16 personas llevarán a cabo la misma tarea bajo un ruido de nivel 2, el cual es más severo que el ruido de nivel 1. Los siguientes datos representan los tiempos observados en
minutos que fueron necesarios para completar la tarea para cada una de las 16 personas de cada nivel. a) Las varianzas de ambos niveles de ruido son homogéneas?, haga la prueba de homogeneidad de varianzas correspondientes. b) Existe alguna razón para creer que el tiempo promedio para el nivel 2 es mayor por más de dos minutos que para el nivel 1 con α = 0.05?
Nivel1: media: 14.375 Desv. Std.: 2.2044, n=16, s 2 =4.8593 Nivel2: media: 18.5 Desv. Std.: 2.3717, n=16, s 2 =5.625 Suponemos H0: σ 12 σ 22 =
α =
F
=
0.05 2
2
2
2
s1 σ 2 s 2 σ 1
2
=
s1
…. F(15,15) / H0 verdadera
2
s 2
P(X
1 X
1- P( P(
1 X
>
1 X
≤
x
≤
1 x
1
)= 0.05
1 x
)= 0.05
)= 0.95… F(15,15) ….
1/X=2.4 X=0.416 2
F
=
s1 σ 2 2
s 2 σ 1
2 2
2
=
s1
2
s 2
=
4.8593 5.625
= 0.8638
, 0.8638>0.416
Por lo tanto se acepta H0, eso quiere decir que las varianzas de ambos niveles son homogéneas.
6.- Una muestra de las calificaciones en un examen presentado en un curso de Estadistica es: Hombres: 72 69 98 68 85 76 79 80 77 Mujeres : 81 67 90 78 81 80 76 Al nivel de significancia 0.01, La calificación media de las mujeres es más alta que la de los hombres? De los resultados:
Estadísticos de muestras relacionadas
Par 1
hombres mujeres
Media 77.86
7
Desviación típ. 10.915
Error típ. de la media 4.126
7
6.880
2.600
N
79.00
Correlaciones de muestras relacionadas N Par 1
hombres y mujeres
7
Correlación .748
Sig. .053
Prueba de muestras relacionadas
Media Par 1
hombres mujeres
-1.143
Diferencias relacionadas 95% Intervalo de confianza para la Error típ. diferencia Desviació de la Superio n típ. media r Inferior 7.358
2.781
-7.948
5.662
gl Sig. (bilateral) Desviación típ. t -.411
Inferior 6
Haciendo una prueba de hipótesis t -0.411 H0=las medias son iguales Observamos el SIG bilateral es de 0.695 SIG=0.695>0.01 Por lo tanto no se rechaza H0. Lo que quiere decir que las medias de ambos son razonablemente cercanas. Concluimos que tienen las mismas calificaciones medias.
7.- Un estudio reciente comparó el tiempo que pasan juntos los matrimonios en los que solo un conyuge trabaja, y que parejas en las que los dos lo hacen. De acuerdo con los registros elaborados por las esposas durante el estudio, el tiempo medio que pasan juntos viendo la televisión las parejas en las que solamente uno labora fue de 61 minutos por día, con una desviación estándar de 15.5 min. Para los matrimonios en los que los dos conyugues trabajan, el número medio de minutos ante el televisor fue de 48.4 min, con una desviación estándar de 18.1 min. Al nivel de significancia de 0.01, Se puede concluir que las parejas donde solamente una persona trabaja, pasan en promedio mayor tiempo observado la televisión juntos? Se estudiaron quince parejas en las que solo un conyugue labora y 12 donde los 2 laboran. Caso1: media: 61.0 Desv. Std.: 15.5, n=15, s 2 =240.25
.695
Caso2: media: 48.4 Desv. Std.: 18.1, n=12, s 2 =327.61 Suponemos 2 2 H0: σ 1 σ 2 =
α = 0.01
F
=
2
2
2
2
s1 σ 2 s 2 σ 1
2
=
s1
…. F(14,11) / H0 verdadera
2
s 2
P(X
1 X
2- P( P(
1 X
>
1 X
≤
x
≤
1 x
1
)= 0.01
1 x
)= 0.01
)= 0.99… F(11,14) …. Asumimos un F(10,15) ya que estos
grados de libertad se encuentran en las tablas 1/X=3.8 X=0.263 2
F
=
s1 σ 2 2
s 2 σ 1
2 2
2
=
s1
2
s 2
=
240 .25 327 .61
= 0.733
, 0.733>0.263
Por lo tanto se acepta H0, eso quiere decir que ambas parejas observan el mismo tiempo televisión.
8.- Lisa Monnin, directora de presupuesto en la empresa New Process Company, desearía comparar los gastos diarios de transporte del equipo de ventas y del personal de cobranza. Recopilo la siguiente información muestral. Ventas 131 135 146 165 136 142 Cobranza 130 102 129 143 149 120 139 Al nivel de significancia de 0.1, Puede concluirse que los gastos medios diarios son mayores para el equipo de ventas? Según los datos: Estadísticos de muestras relacionadas
Par 1
ventas cobranza
Media 142.50
6
Desviación típ. 12.243
Error típ. de la media 4.998
6
16.774
6.848
N
128.83
Correlaciones de muestras relacionadas N Par 1
ventas y cobranza
6
Correlación .371
Sig. .470
Prueba de muestras relacionadas
Media Par 1
ventas cobranza
13.667
Diferencias relacionadas 95% Intervalo de confianza para la Error típ. diferencia Desviación de la típ. media Superior Inferior 16.705
6.820
-3.864
31.198
gl
t
Sig. (bilateral) Desviación típ. Inferior
2.004
5
Haciendo una prueba de hipótesis t 2.004 H0=las medias son iguales Observamos el SIG bilateral es de 0.101 SIG=0.101>0.01 Por lo tanto no se rechaza H0. Lo que quiere decir que las medias de ambos son razonablemente cercanas. Concluimos que tienen los mismos gastos medios.
9.- La Cámara de Comercio del área Booty Bay desea saber si el sueldo medio semanal de enfermeras fue mayor que el de maestros de escuela primaria. Para investigar recopilaron la siguiente información de muestra. Maestros 545 526 527 575 484 509 502 520 529 530 542 532 Enfermeras 541 590 521 471 550 559 525 529 Es razonable concluir que el sueldo medio semanal de enfermeras es mayor? Utilice nivel de significancia 0.01. Obteniendo los resultados Estadísticos de muestras relacionadas
.101
Par 1
maestros enfermeras
Media 523.50
8
Desviación típ. 27.718
Error típ. de la media 9.800
8
34.404
12.164
N
535.75
Correlaciones de muestras relacionadas N Par 1
maestros y enfermeras
8
Correlación -.567
Sig. .143
Prueba de muestras relacionadas Diferencias relacionadas 95% Intervalo de confianza para la Error típ. diferencia Desviación de la Par 1
maestros enfermeras
Media
típ.
-12.250
55.071
media 19.470
Superior -58.290
Inferior 33.790
Desviación típ. t
Inferior
-.629
Haciendo una prueba de hipótesis t -0.629 H0=las medias son iguales Observamos el SIG bilateral es de 0.549 SIG=0.549Z>0.01 Por lo tanto no se rechaza H0. Lo que quiere decir que los sueldos de ambos son razonables cercanos. En conclusión no es razonable concluir que el sueldo de las enfermeras sea mayor.
. 10.- Dado el siguiente conjunto de datos, utilice el paquete de cómputo que tenga disponible para encontrar la ecuación de regresión de mejor ajuste y responda a lo siguiente: a) b) c) d) e)
Cual es la ecuación de regresión? Cual es el error estándar de la estimación? Cual es el R² para esta regresión? Cual es el valor predicho para Y cuando X1=5.8, X2=4.2, X3=5.1? Analice si el modelo tiene buen ajuste.
Y X1 X2 X3 ------------------------------------
Sig. (bilateral)
gl
7
.549
64.7 80.9 24.6 43.9 77.7 20.6 66.8 34.3
3.5 7.4 2.5 3.7 5.5 8.3 6.7 1.2
5.3 1.6 6.3 9.4 1.4 9.2 2.5 2.2
8.5 2.6 4.5 8.8 3.6 2.5 2.7 1.3
Los resultados son: Variables introducidas/eliminadas(b) Variables Variables introducidas eliminadas Método x3, x1, x2(a) . Introducir a Todas las variables solicitadas introducidas b Variable dependiente: y Modelo 1
Resumen del modelo R cuadrado R R cuadrado corregida .992(a) .983 .971 a Variables predictoras: (Constante), x3, x1, x2
Error típ. de la estimación 4.0688
Modelo 1
ANOVA(b)
Modelo 1
Regresión Residual Total
Suma de cuadrados 3927.678
3
Media cuadrática 1309.226
66.222
4
16.555
3993.900
7
gl
F 79.082
Sig. .001(a)
a Variables predictoras: (Constante), x3, x1, x2 b Variable dependiente: y
Coeficientes(a) Coeficientes estandarizado s
Coeficientes no estandarizados Modelo 1
(Constante) x1
B 34.808
Error típ. 4.708
Beta
t 7.394
Sig. .002
5.262
.651
.554
8.077
.001
x2
-8.019
.556
-1.112
-14.413
.000
x3
6.808
.680
.807
10.016
.001
a Variable dependiente: y
A). La ecuación de regresión es: Y= 34.808 + 5.262X1 – 8.019X2 + 6.808X3
B). El error estándar de la estimación es 4.068. C). El R2 para esta regresión es 0.983. Esto explica que X1, X2 y X3 afecta linealmente a Y en un 98.3% la linealidad. Al tener un alto porcentaje es un buen ajuste. D). Reemplazando: Y= 34.808 + 5.262(5.8) – 8.019(4.2) + 6.808(5.1) = 66.3686 E). Para eso haremos una prueba de hipótesis F 79.082 H0=0 Observamos el SIG de la ecuación es de 0.001 SIG=0.001<0.05 Por lo tanto se rechaza H0. Lo que quiere decir que tiene buen ajuste.
11.- El consejo municipal de la cuidad de ThunderBluff esta considerando aumentar el número de agentes de policía, en un esfuerzo por reducir los delitos. Antes de tomar una decisión final, el organismo pide al jefe de policía que haga una encuesta en otras ciudades de tamaño similar, a fin de determinar la relación entre el número de vigilantes y el de delitos reportados. El funcionario recopilo la siguiente información: Cuidad Agentes Delitos ---------------------------------------------------Oxford 15 17 Stormwind 17 13 Danville 25 5 Athens 27 7 Orgrimmar 17 7 Carey 12 21
Whistler Woodville
11 22
19 6
a) Si se desea evaluar los delitos con base en la cantidad de guardianes, Cual es la variable dependiente y cual es la independiente. b) Trace un diagrama de dispersión c) Determine el coeficiente de correlación. d) Calcule el coeficiente de determinación. e) Analice si el modelo tiene buen ajuste.
Los resultados obtenidos por el SPSS son: Variables introducidas/eliminadas(b)
Variables Variables introducidas eliminadas agentes(a) . a Todas las variables solicitadas introducidas b Variable dependiente: delitos Modelo 1
Método Introducir
Resumen del modelo
Modelo 1
R R cuadrado .874(a) .765 a Variables predictoras: (Constante), agentes
R cuadrado corregida .725
Error típ. de la estimación 3.378
ANOVA(b)
Modelo 1
Regresión Residual
Suma de cuadrados 222.394
Total
1
Media cuadrática 222.394
68.481
6
11.414
290.875
7
gl
F 19.485
Sig. .004(a)
a Variables predictoras: (Constante), agentes b Variable dependiente: delitos
Coeficientes(a)
Coeficientes no estandarizados Modelo 1
(Constante) agentes
Coeficientes estandarizados
B 29.388
Error típ. 4.143
-.960
.217
Beta
t -.874
Sig. 7.093
.000
-4.414
.004
a Variable dependiente: delitos
A). La variable dependiente es Numero de delitos, mientras que Agentes de policía será la variable independiente. B). El diagrama de dispersión es:
25
20
s o t i 15 l e d
10
5
10
15
20
25
30
agentes
C). El coeficiente de correlación es 0.874 D). El coeficiente de determinación es 0.765. Esto quiere que X1 influencia linealmente a Y en un 76.5%. Al ser un valor alto tiene un buen ajuste. E). Para eso haremos una prueba de hipótesis F 19.485 H0=0 Observamos el SIG de la ecuación es de 0.004 SIG=0.004<0.05 Por lo tanto se rechaza H0. Lo que quiere decir que tiene buen ajuste.
12.- El dueño de Mulgore Motors desea estudiar la relación entre la antigüedad de un automóvil y su precio de venta. A continuación aparece la lista de una muestra aleatoria de 12 autos usados vendidos en ese establecimiento durante el último año. a) Si se desea calcular el precio de venta con base en la antigüedad del vehículo, Cual es la variable dependiente y cual es la independiente? b) Trace el diagrama de dispersión c) Establezca el coeficiente de correlación d) Calcule el coeficiente de determinación e) Analice si el modelo tiene buen ajuste Obteniendo estos datos del SPSS Resumen del modelo
R cuadrado Modelo R R cuadrado corregida 1 .544(a) .296 .225 a Variables predictoras: (Constante), antiguedad
Error típ. de la estimación 1.7321
ANOVA(b)
Modelo 1
Regresión
Suma de cuadrados 12.587
gl 1
Media cuadrática 12.587
Residual
30.002
10
3.000
Total
42.589
11
F 4.195
Sig. .068(a)
a Variables predictoras: (Constante), antiguedad b Variable dependiente: precio
A). La variable dependiente será el precio de venta mientras que la variable independiente será la antigüedad.
B). El diagrama de dispersión es:
10,0
8,0
o i c e r p
6,0
4,0
6
7
8
9
10
11
12
antiguedad
C). El coeficiente de correlación (R) es de 0.544 D). El coeficiente de determinación (R2) es de 0.296. Esto quiere que X1 influencia linealmente a Y en un 29.6%. Al ser un número bajo la ecuación no tiene buen ajuste E). Para eso haremos una prueba de hipótesis F 4.195 H0=0 Observamos el SIG de la ecuación es de 0.68 SIG=0.068>0.05 Por lo tanto no se rechaza H0. Lo que quiere decir que no tiene buen ajuste.
13.- El departamento de personal de la empresa HoS está interesando en estudiar la relación que tiene el salario, el tamaño de la familia y la antigüedad en el trabajo con los gastos (Y). Para este estudio, el especialista en la materia escogió una muestra al azar de 10 miembros de todo el personal de la empresa, considerando: Y = Gasto semanal X2 = Tamaño de familia
X1 = Salario semanal X3 = Antigüedad en el trabajo
A partir de la salida SPSS que estaba a continuación responda lo siguiente: a) Escriba el modelo de regresión lineal múltiple estimado, reemplazando los coeficientes de regresión. b) Usando el ANOVA haga la prueba de hipótesis para saber si el modelo de regresión lineal tiene buen ajuste y por que? Use α =0.05 c) Diga si las variables X1, X2, X3 son importantes en el modelo, ósea si las variables tienen una buena contribución lineal al modelo. Use α =0.05 d) Comente el valor del coeficiente R² Según la salida del SPSS observamos: A). La ecuación de mejor ajuste es: Y= -2.79 + 0.584X1 + 3.42X2 – 0.409X3 Gasto Semanal: Y Salario Semanal: X1 Tamaño de la familia: X2 Antigüedad en el trabajo: X3 B). Para eso haremos una prueba de hipótesis F 99.102 H0=0 Observamos el SIG de la ecuación es de 0.0 SIG=0.0<0.05 Por lo tanto se rechaza H0. Lo que quiere decir que tiene buen ajuste. C). Para X1 t 11.09 H0=0 Observamos el SIG de X1 es de 0.0 SIG=0.0<0.05 Por lo tanto se rechaza H0, esto quiere decir que la variable Salario es importante en el ajuste. Para X2 t
3.473
H0=0 Observamos el SIG de X2 es de 0.013 SIG=0.013<0.05 Por lo tanto se rechaza H0, esto quiere decir que la variable Tamaño de la familia es importante en el ajuste.
Para X3 t
-0.932
H0=0 Observamos el SIG de X3 es de 0.387 SIG=0.387>0.05 Por lo tanto no se rechaza H0, esto quiere decir que la variable Antigüedad no es importante en el ajuste. D). El valor de R 2 es 0.98 esto quiere que X1, X2 y X3 influencian linealmente a Y en un 98%. Al ser un valor alto, la ecuación tiene un buen ajuste.
14.- Una línea aérea cuya base esta en Nueva Inglaterra ha efectuado una investigación sobre sus 15 terminales y ha obtenido los siguientes datos correspondientes al mes de febrero en los que: Ventas = recuperación total basada en el número de boletos vendidos. Pormoc = cantidad gastada en promover la línea aérea Compet = numero de aerolíneas competidoras en ese aeropuerto Gratis = porcentaje de pasajeros que vuelan gratis a) Utilize un programa para determinar la ecuación de regresión de mejor ajuste para la aerolínea. b) Los pasajeros que vuelan gratis ocasionan que las ventas bajen significativamente? Establezca y prueba las hipótesis apropiadas. Use α =0.05 c) Un aumento en las promociones de 1000 cambia las ventas en 28000, o es el cambio significativamente diferente a 28000? Establezca y pruebe las hipótesis apropiadas.
Los análisis estadísticos son: Variables introducidas/eliminadas(b)
Modelo 1
Variables introducidas
Variables eliminadas
Método
gratis, competencia, promcion(a)
.
Introducir
a Todas las variables solicitadas introducidas b Variable dependiente: ventas Resumen del modelo
R cuadrado Error típ. de la Modelo R R cuadrado corregida estimación 1 .953(a) .908 .883 27.3120 a Variables predictoras: (Constante), gratis, competencia, promcion ANOVA(b)
Modelo 1
Regresión Residual Total
Suma de cuadrados 81341.725
gl 3
Media cuadrática 27113.908
8205.392
11
745.945
89547.117
14
a Variables predictoras: (Constante), gratis, competencia, promcion b Variable dependiente: ventas
Coeficientes(a)
F 36.348
Sig. .000(a)
Coeficientes estandarizados Modelo 1
no
Coeficientes estandarizados
B 160.619
Error típ. 50.352
Beta
(Constante)
t 3.190
Sig. .009
promcion
24.927
4.461
.716
5.587
.000
competencia
-11.851
3.682
-.378
-3.219
.008
gratis
-2.479
1.873
-.135
-1.324
.212
a Variable dependiente: ventas
A). La ecuación de mejor ajuste es: Y= 160.619 + 24.927X1 – 11.851X2 - 2.479X3 Siendo: Ventas: Y Promoción: X1 Competencia: X2 Usuarios Gratis: X3 B).Para eso haremos una prueba de hipótesis t -1.324 H0=0 Observamos el SIG de la componente Gratis es de 0.212 SIG=0.212>0.05 Por lo tanto no se rechaza H0, esto quiere decir que la variable de usuarios que viajan gratis no es importante en el ajuste.
15.- Rick Darkspear está pensando en vender su casa con el fin de decidir qué precio pedir por ella. Ha recogido daros de doce ventas recientes, Registró el precio de las ventas, el número de pies cuadrados de construcción, el número de pisos, el número de baños y la antigüedad de la casa. a) Utilizando cualquier paquete de computadora que tenga, determine la ecuación de regresión de mejor ajuste para los datos. b) Cual es el valor de R² para esta ecuación? c) Si la casa de Rick tiene 1800 pies cuadrados, un piso, 1.5 baños y seis años de antigüedad, Que precio de venta podría esperar Rick? Digitando los datos en el SPSS nos arrojó los siguientes datos: Variables introducidas/eliminadas(b)
Modelo 1
Variables introducidas
Variables eliminadas
Método
antiguedad, baños, pisos, . pies(a)
Introducir
a Todas las variables solicitadas introducidas b Variable dependiente: precio Resumen del modelo
R cuadrado Error típ. de la R R cuadrado corregida estimación .976(a) .952 .925 13.50726 a Variables predictoras: (Constante), antiguedad, baños, pisos, pies Modelo 1
ANOVA(b)
Modelo 1
Regresión Residual Total
Suma de cuadrados 25608.547
gl 4
Media cuadrática 6402.137
1277.123
7
182.446
26885.670
11
F 35.091
Sig. .000(a)
a Variables predictoras: (Constante), antiguedad, baños, pisos, pies b Variable dependiente: precio Coeficientes(a)
Coeficientes estandarizados Modelo 1
no
Coeficientes estandarizados
B -1.381
Error típ. 13.360
Beta
(Constante)
t -.103
Sig. .921
pies
2.852
1.507
.493
1.893
.100
pisos
-3.713
10.125
-.047
-.367
.725
baños
30.285
15.563
.511
1.946
.093
antigüedad
1.172
1.102
.131
1.064
.323
a Variable dependiente: precio
A). Podemos ver que la ecuación de regresión es de Y= - 1.381 + 2.852X1 - 3.713X2 + 30.285 X3 + 1.172X4 Siendo: Precio de Venta: Y Pies Cuadrados: X1 Pisos: X2 Baños: X3 Antigüedad: X4 B). El valor de R 2 nos aparece en el ANOVA y es .952. Esto nos indica que X1, X2, X3 y X4 influencian linealmente a Y en un 95.2%. C). El valor esperado seria el de reemplazar en la ecuación: Y= -1.381 + 2.852(18) - 3.713(1) + 30.285(1.5) + 1.172(6) = 98.7015 El valor esperado será de 98701.5 $