Facultad de Ciencias Económicas y Administrativas Administración de Empresas AE0301 MATERIA: Estadística
TEMA: Aplicaciones prácticas en el programa SPSS
DOCENTE: Ing. Gabriela Alava
INTEGRANTES: MAURICIO PALOMEQUE MICHELL HERRERA ALEJANDRA ZAMBRANO CICLO: III
CUENCA, 15 DE MAYO DE 2017
DESARROLLO Ejercicio 1 Resumen del procesamiento de los casos Indicador geográfico
Casos Incluidos
Excluidos
Total
N
Porcentaje N
Porcentaje N
Porcentaje
Zona 1
Miembro de sindicatos * Edad en años
1009
100,0%
0
0,0%
1009
100,0%
Zona 2
Miembro de sindicatos * Edad en años
995
100,0%
0
0,0%
995
100,0%
Zona 3
Miembro de sindicatos * Edad en años
1003
100,0%
0
0,0%
1003
100,0%
Zona 4
Miembro de sindicatos * Edad en años
966
100,0%
0
0,0%
966
100,0%
Miembro de sindicatos * Edad en años
1027
100,0%
0
0,0%
1027
100,0%
Zona 5
Cubos OLAP Edad en años: 73 Indicador geográfico
Suma
N
Media
Desv. típ. % de la suma % del total de N total
Zona 1
Miembro de sindicatos
6
13
,46
,519
3,7%
1,3%
Zona 2
Miembro de sindicatos
2
16
,13
,342
1,3%
1,6%
Zona 3
Miembro de sindicatos
0
9
,00
,000
0,0%
0,9%
Zona 4
Miembro de sindicatos
2
15
,13
,352
1,5%
1,6%
Zona 5
Miembro de sindicatos
2
12
,17
,389
1,3%
1,2%
Ejercicio 2 Resumen del procesamiento de los casos Indicador geográfico
Casos Incluidos
Excluidos
Total
N
Porcentaje N
Porcentaje N
Porcentaje
Zona 1
Voto en las últimas elecciones * Género
1009
100,0%
0
0,0%
1009
100,0%
Zona 2
Voto en las últimas elecciones * Género
995
100,0%
0
0,0%
995
100,0%
Zona 3
Voto en las últimas elecciones * Género
1003
100,0%
0
0,0%
1003
100,0%
Zona 4
Voto en las últimas elecciones * Género
966
100,0%
0
0,0%
966
100,0%
Zona 5
Voto en las últimas elecciones * Género
1027
100,0%
0
0,0%
1027
100,0%
Cubos OLAP Género: Mujer Indicador geográfico
Suma
N
Media
Desv. típ. % de la suma % del total de total N
Zona 1
Voto en las últimas elecciones
265
519
,51
,500
50,0%
51,4%
Zona 2
Voto en las últimas elecciones
268
507
,53
,500
50,6%
51,0%
Zona 3
Voto en las últimas elecciones
241
506
,48
,500
47,1%
50,4%
Zona 4
Voto en las últimas elecciones
223
469
,48
,500
46,3%
48,6%
Zona 5
Voto en las últimas elecciones
262
517
,51
,500
48,9%
50,3%
Ejercicio 3 En una encuesta aplicada a una muestra de 1111 personas con estudios universitarios, se obtuvo que el número de horas promedio que vieron Tv la semana pasada es de 19.65 con una desviación estándar de 5.049. Construya el intervalo de confianza de 95% de la media de la población. 1) Sacar Información Estadísticos para una muestra N
Media
Desviación típ.
Error típ. de la media
Horas viendo TV la
1111
19,65
5,049
,151
semana pasada a.
Nivel educativo = Estudios universitarios
𝒙𝓲: Horas viendo TV la semana pasada 𝒇𝒂: personas con estudios universitarios 𝑛 = 1111 𝑥̅ = 19.65 𝜎 = 5.049
Población Virtualmente Infinita Muestra grande. Distribución Normal Z
2) Gráfica
3) Fórmula ̅ ± 𝒛𝓲 { 𝑰, 𝑪. 𝒆𝒔𝒕𝒊𝒎𝒂𝒓 𝝁 = 𝒙
𝜎
} √𝒏 𝟓. 𝟎𝟒𝟗 𝑰, 𝑪. 𝒆𝒔𝒕𝒊𝒎𝒂𝒓 𝝁 = 𝟏𝟗. 𝟔𝟓 ± 𝟏. 𝟗𝟔 { } √𝟏𝟏𝟏𝟏
Estadísticos para una muestraa N
Media
Desviación típ.
Error típ. de la media
Ingresos familiares en miles a.
1009
51,0387
45,96183
1,44694
Indicador geográfico = Zona 1
𝒙𝓲: Ingresos familiares en miles 𝒇𝒂: habitantes de la zona 1 Prueba para una muestraa Valor de prueba = 0 T
gl
Sig.
Diferencia
95% Intervalo de confianza
(bilateral)
de medias
para la diferencia Inferior
Horas viendo TV la
129,738
1110
,000
19,653
Superior
19,36
19,95
semana pasada a. Nivel educativo = Estudios universitarios
4) Interpretación Con un nivel de significancia del 95% de las personas que están viendo tv se establece que no hay diferencia significativa ya que si intervalo de confianza esta entre el 19,36 y 19,95
Ejercicio 4
En una muestra de 1009 personas que habitan en la zona 1 de una poblacion, se tuvo que el ingreso promedio familiar en miles es de $51.0387 con una desviación estándar de $45.96183. Construya un intervalo de confianza de 95% de la media de la poblacion. 1) Sacar Información 𝑛 = 1009 𝑥̅ = 51.0387 𝜎 = 45.96183
Población Virtualmente Infinita Muestra grande. Distribución Normal Z
2) Gráfica
3) Fórmula ̅ ± 𝒛𝓲 { 𝑰, 𝑪. 𝒆𝒔𝒕𝒊𝒎𝒂𝒓 𝝁 = 𝒙
𝜎
} √𝒏 𝟒𝟓. 𝟗𝟔𝟏𝟖𝟑 𝑰, 𝑪. 𝒆𝒔𝒕𝒊𝒎𝒂𝒓 𝝁 = 𝟏𝟓𝟏. 𝟎𝟑𝟖𝟕 ± 𝟏. 𝟗𝟔 { } √𝟏𝟎𝟎𝟗
Prueba para una muestra Valor de prueba = 0 T
gl
Sig.
Diferencia
95% Intervalo de confianza
(bilateral)
de medias
para la diferencia Inferior
Ingresos familiares en
35,273
1008
,000
51,03865
48,1993
Superior 53,8780
miles a. Indicador geográfico = Zona 1
4) Interpretación 5) Con un nivel de significancia del 95% de los ingresos familiares encontramos que no existe diferencia significativa del estudio ya que si intervalo de confianza se encuentra entre 48,19 y 53,87 Ejercicio 5
En una encuesta aplicada a una muestra de 622 personas , se obtuvo que el número promedio de coches que poseen las personas entre 18 y 24 años de edad es de 2.09 coches con una desviación estándar de 1.279. Construya el intervalo de confianza de 95% de la media poblacional.
1) Sacar Información Estadísticos para una muestraa N
Media
Desviación típ.
Error típ. de la media
Número de coches
622
2,09
1,279
,051
poseídos/financiados a. Categoría de edad = 18-24
𝒙𝓲: Número de coches poseídos/financiados 𝒇𝒂: personas entre 18 y 24 años 𝑛 = 622 𝑥̅ = 2.09 𝜎 = 1.279
Población Virtualmente Infinita Muestra grande. Distribución Normal Z
2) Gráfica
3) Fórmula ̅ ± 𝒛𝓲 { 𝑰, 𝑪. 𝒆𝒔𝒕𝒊𝒎𝒂𝒓 𝝁 = 𝒙
𝜎 √𝒏
𝑰, 𝑪. 𝒆𝒔𝒕𝒊𝒎𝒂𝒓 𝝁 = 𝟐. 𝟎𝟗 ± 𝟏. 𝟗𝟔 {
}
𝟏. 𝟐𝟕𝟗 } √𝟔𝟐𝟐
Prueba para una muestraa Valor de prueba = 0 T
gl
Sig.
Diferencia
95% Intervalo de
(bilateral)
de medias
confianza para la diferencia Inferior
Número de coches
40,858
621
,000
2,095
1,99
Superior 2,20
poseídos/financiados a. Categoría de edad = 18-24
4) Interpretación Con un nivel de significancia del 95% de los números de coches poseídos o financiados se encuentra que no existe diferencia significativa ya que su intervalo de confianza esta entre el 1,99 y 2,20
1) Datos Xi principal= puntuación de acuerdo al sexo Fa= # personas
Estadísticos de grupo sexo femenino masculino
N
Media
Desviación típ.
Error típ. de la media
femenino
10
53,6000
27,54471
8,71040
masculino
14
57,2857
28,79217
7,69503
puntuación
Población virtualmente infinita Independiente Muestra pequeña t student Sin proporción Desviación desconocida 2) Prueba de hipótesis Ho: u=53,60 H1: u≠ 557,29
0,05
3) α= 2
= 0,025
4) Valor critico n= 24 gl= 23 t= 2,069 5) Regla de decisión Opc.1 No se rechaza Ho cuando t sea mayor a 2,69 o menor a 2,69y se rechaza H1 Opc.2 Se rechaza Ho cuando t sea menor 2,69 o mayor a 2,69 y se acepta H1 6) Prueba de estadígrafo
7) Toma de decisión Con un estadígrafo de prueba de 3,15 aceptamos H0 y rechazamos H1 que plantea que toda la población de hombres como de mujeres puntúan de forma similar en las escalas que se les suministro. 8) Valor p gl= 23 t= 3,15
valor p 0,01
Rechazo Ho en mediano plazo
˂
α 0,05
1) Datos Xi análisis: tiempo de espera de los clientes en minutos hasta ser atendidos Fa: # clientes de KFC 2) Prueba de hipótesis H0: u= 16 H1: u˂ 16 3) α=0,05 4) Valor critico Z= 1,96 5) Regla de decisión Opc.1 NO rechazamos H0 cuando z sea mayor a 1,96 y rechazamos H1 Opc.2 Rechazamos H0 cuando z sea menor a 1,96 y aceptamos H1 6) Prueba de estadígrafo
7) Toma de decisión Con un estadígrafo de prueba de 0,998 aceptamos H0 que plantea que en toda la población de clientes que esperan para ser atendidos en KFC es inferior a lo establecido esto con un nivel de confianza del 95%. 8) Valor p
Valor p
α
0,457
0,05 no se rechaza Ho
EJERCICIO 8 1) Datos Xi análisis: edad en años de los empleados de la empresa AA Fa: # personas
Informe edad en años Media 50,08
N
Desv. típ. 50
17,332
2) Prueba de hipótesis H0: u= 50,08 H1: u>50,08
3) α=0,05 4) Valor critico Z= 1,96 5) Regla de decisión Opc.1 NO rechazamos H0 cuando z sea mayor a 1,96 y rechazamos H1 Opc.2 Rechazamos H0 cuando z sea menor a 1,96 y aceptamos H1 6) Prueba de estadígrafo
7) Toma de decisión Con un estadígrafo de prueba de 0,715 aceptamos H0 que plantea que en toda la población de empleados de la empresa AA la edad en años es inferior a lo establecido esto con un nivel de confianza del 95%. 8) Valor p Valor p
α
0,715
0,05 no se rechaza H0
EJERCICIO 9 1) Datos Xi: distribución de peso en las bolsas Fa: # de bolsas
Estadísticos para una muestra Bootstrapa
Statistic Sesgo
Típ. Error
Intervalo de confianza al 99% Inferior
N
Superior
10
Media
48,1800
-,0054
,8678
46,6101
50,9598
Desviación típ.
2,88590
-,39438
1,14291
,56014
4,66979
distribución de peso Error típ. de la media
,91260
a. A no ser que se indique lo contrario, los resultados autodocimantes se basan en 1000 bootstrap samples
2) Prueba de hipótesis H0: u=50 H1: u˂50
3) α=0,01 4) valor critico gl=9 t= -2,821 5) regla de decisión opc.1 no se rechaza H0 cuando t sea mayor a -2,821 y rechaza H1 opc.2 se rechaza H0 cuando t sea menor a -2,821y aceptamos H1
6) regla decisión
Prueba para una muestra Valor de prueba = -1,99 t
gl
Sig. (bilateral)
Diferencia de
99% Intervalo de confianza para la
medias
diferencia Inferior
distribución de peso
52,794
9
,000
48,18000
45,2142
7) tomar decisión Con un nivel de confianza del 99% en toda la población de bolsas y un estadígrafo de prueba de -2,821 rechazamos H1 que plantea que la distribución de peso en las bolsas es inferior a 50 libras. 8) valor p Valor p 0,05 a 0,025
α >
0,01 No rechazamos H0 M/P
EJERCICIO 10 A continuación, se enlistan las notas de cinco de cinco estudiantes de la universidad de cuenca de la facultad de ciencias económicas y administrativas SEXO
SALARIO
HOMBRE
6
MUJER
7
HOMBRE
9
HOMBRE
8
MUJER 9 Asuma que existen varianzas poblaciones iguales para ambos. Prueba la hipótesis de que las notas medias de las mujeres no son iguales con la de los hombres, con un nivel de confianza del 0,01 1) Sacar Datos Xi análisis = estudiantes de la universidad de cuenca Xi tratamiento = sexo de los estudiantes de la universidad de cuenca Fa = puntaje obtenido de los estudiantes 2) Plantear Hipótesis 𝐻0: 𝜇1 = 𝜇2 𝐻1: 𝜇1 ≠ 𝜇2
Superior 51,1458
3) Nivel de Significancia ∝ = 0,01 4) Valor Crítico g.l.= 4 t =4,604 5) Regla de Decisión Aceptar hipótesis nula y rechazar hipótesis alternativa cuando el valor t sea mayor a 4,604 y sea menor a 4,604 o rechazar nula y aceptar alternativa cuando el valor t sea menor a -4,604 y mayor a 4,604
6) Estadígrafo de Prueba 99% de intervalo de confianza de la diferencia t SALARIO
gl
Inferior
Superior
Se asumen varianzas iguales
-,245
3
-8,28180
7,61514
No se asumen varianzas iguales
-,250
2,427
-10,25768
9,59102
7) Tomar decisión Con un nivel de significancia del 0,01 aceptamos hipótesis nula y rechazamos alternativa que nos dice que SI existe diferencia significativa en las calificaciones de los estudiantes de la universidad de cuenca entre sexos para la prueba de hipotesis Ejercicio 11) A continuación, se enlistan los salarios de cinco de jugadores de la jornada inicial del equipo de los Yanquis de Nueva York de las ligas mayores de beisbol POSICION
SALARIO
JARDINERO
1500
PITCHER
1200
JARDINERO
2500
JARDINERO
1970
PITCHER 1550 Asuma que existen varianzas poblaciones iguales para ambos. Prueba la hipótesis de que los salarios medios de los pitchers no son iguales con los de los jardinero, con un nivel de confianza del 0,01
1) Sacar Datos Xi análisis = posiciones del equipo de beisbol Xi tratamiento = posiciones de los jugadores (jardinero y pitcher) Fa = # de jugadores
Estadísticas de grupo
POSICION SALARIO
N
Desviación
Media de error
estándar
estándar
Media
JARDINERO
3
1990,0000
500,29991
288,84829
PITCHER
2
1375,0000
247,48737
175,00000
2) Plantear Hipótesis 𝐻0: 𝜇1 = 𝜇2 𝐻1: 𝜇1 ≠ 𝜇2
4,604
3) Nivel de Significancia ∝ = 0,01 4) Valor Crítico g.l.= 4 t =4,604 5) Regla de Decisión Aceptar hipótesis nula y rechazar hipótesis alternativa cuando el valor t sea mayor a 4,604 y sea menor a 4,604 o rechazar nula y aceptar alternativa cuando el valor t sea menor a -4,604 y mayor a 4,604
6) Estadígrafo de Prueba
99% de intervalo de confianza de la diferencia t SALARIO
gl
Inferior
Superior
Se asumen varianzas iguales
1,557
3
-1692,48776
2922,48776
No se asumen varianzas iguales
1,821
2,944
-1395,07045
2625,07045
7) Tomar decisión Con un nivel de significancia del 0,01 aceptamos hipótesis nula y rechazamos alternativa que nos dice que SI existe diferencia significativa en salarios de los jugadores futbolistas para esta prueba de hipótesis
8) Valor p 1,533
0,2
2,132
0,1
>
0,01
Prueba de Hipótesis muestra pareada Ejercicio 12) Hace poco el gobierno federal estadounidense otorgo fondos para un programa especial diseñado para reducir los delitos en áreas de alto riesgo. Un estudio de los resultados del programa en ocho áreas de alto riesgo de Miami produjo los resultados siguientes. NUMERO DE DELITOS POR AREA A B C D E F G H ANTES 14 7 4 5 17 12 8 9 DESPUES 2 7 3 6 8 13 3 5 Hubo alguna diferencia en el número de delitos desde la inauguración del programa. Utilice el nivel de significancia del 0,10 1) Sacar Datos Xi análisis = delitos en florida Xi tratamiento = antes y después de incorporar un programa
Fa = # de áreas de florida
Estadísticas de muestras emparejadas
Media
N
Desviación
Media de error
estándar
estándar
Progra ANTES
9,50
8
4,504
1,592
ma
5,88
8
3,563
1,260
DESPUES
Correlaciones de muestras emparejadas N Progra ANTES & DESPUES ma
Correlación 8
,298
Sig. ,473
2) Plantear Hipótesis 𝐻0: 𝜇𝑎 = 𝜇𝑑 𝐻1: 𝜇𝑎 ≠ 𝜇𝑏
3) Nivel de Significancia ∝ = 0,01 4) Valor Crítico g.l.= 7 t =3,499 5) Regla de Decisión Aceptar hipótesis nula y rechazar hipótesis alternativa cuando el valor t sea mayor a -3,499 y sea menor a 3.499 o rechazar nula y aceptar alternativa cuando el valor t sea menor a 3,499 y mayor a 3,499 6) Estadígrafo de Prueba 𝑑 − (𝜇1 − 𝜇2) 𝑡= 𝑠𝑑/√𝑛
Prueba de muestras emparejadas Sig. Diferencias emparejadas Media de
99% de intervalo de
Desviación
error
confianza de la diferencia
estándar
estándar
Media Par
ANTES -
1
DESPUES
(bilateral)
3,625
4,838
Inferior
1,711
Superior
-2,361
t
9,611
gl
2,119
7
7) Tomar decisión Con un nivel de significancia del 0,01 aceptamos hipótesis nula y rechazamos alternativa que nos dice que no existe diferencia significativa en los delitos cometidos antes y después de incorporar el programa 8) Valor p Pruebas de normalidad Kolmogorov-Smirnova Estadístico DESPUES
gl
,165
ANTES
,169
Shapiro-Wilk Sig.
Estadístico
gl
Sig.
8
,200*
,910
8
,355
8
,200*
,955
8
,760
*. Esto es un límite inferior de la significación verdadera. a. Corrección de significación de Lilliefors
t= 2,119 valor p
∞
1,895
0,05 >
2,365
0,025
0,01
aceptamos H0 y rechazamos H1 a corto plazo
Ejercicio 13) Una investigación acerca de la eficiencia de un jabón antibacterial para reducir la contaminación de una sala de operaciones genero la tabla siguiente. El jabón nuevo se probó en una muestra de 8 salas de operación el año pasado.
A ANTES DESPUES
B 6,6 6,8
C 6,5 2,4
SALA DE OPERACIONES D E F 9 10,3 11,2 7,4 8,5 8,1
G 8,1 6,1
H 6,3 3,4
11,6 2
,072
A un nivel de significancia de 0,05. ¿se puede concluir que las mediciones de contaminación son menores después del uso del jabón nuevo? 1) Sacar Datos Xi análisis = eficiencia del jabon antibacterial Xi tratamiento = antes y después de probar el jabon en las salas Fa = # de salas de operación
Estadísticas de muestras emparejadas
Media Par 1
N
Desviación
Media de error
estándar
estándar
ANTES
8,700
8
2,1607
,7639
DESPUES
5,588
8
2,6085
,9222
2) Plantear Hipótesis 𝐻0: 𝜇𝑎 = 𝜇𝑑 𝐻1: 𝜇𝑎 < 𝜇𝑏
2,365
3) Nivel de Significancia ∝ = 0,05 4) Valor Crítico 5) g.l.= 7 t =2,365 5)Regla de Decisión Aceptar hipótesis nula y rechazar hipótesis alternativa cuando el valor t sea mayor a -2,365 y sea menor a 2,365 o rechazar nula y aceptar alternativa cuando el valor t sea menor a 2,365 y mayor a 2,365 6) Estadígrafo de Prueba 𝑑 − (𝜇1 − 𝜇2) 𝑡= 𝑠𝑑/√𝑛
Prueba de muestras emparejadas Diferencias emparejadas 95% de intervalo de
Media Par ANTES 1
3,112
DESPUES
5
Desviació
Media de
confianza de la
n
error
diferencia
estándar
estándar
2,9113
Inferior
1,0293
Sig.
Superior
,6786
t
5,5464
3,024
gl
(bilateral) 7
,019
7) Tomar decisión Con un nivel de significancia del 0,05 aceptamos hipótesis alternativa y rechazamos hipótesis nula que nos dice que existe diferencia significativa en el estudio que si son menores la contaminación dentro de los laboratorios.
8) Valor p Pruebas de normalidad Kolmogorov-Smirnova Estadístico DESPUES
,203
ANTES
,209
gl
Shapiro-Wilk Sig.
Estadístico
gl
Sig.
8
,200*
,880
8
,190
8
,200*
,890
8
,233
*. Esto es un límite inferior de la significación verdadera. a. Corrección de significación de Lilliefors
t= 3,024 valor p
∞
2,998
0,01
3,449
0,005
<
0,05
aceptamos H1 y rechazamos H0 a