PRUEBA DE BONDAD DE AJUSTE: CHI-CUADRADO
EJERCICIO N°3: Estamos interesados en comprobar la perfección de un dado cúbico (un dado normal de 6 caras). Para esto realizamos 100 lanzamientos del dado anotando los puntos obtenidos en cada lanzamiento. A la vista de los resultados obtenidos, ¿podemos concluir que el dado no es perfecto? Nivel de significación (5%).
Puntuación en el dado
Número de veces que se obtiene la puntuación
1 2 3 4 5 6
14 22 18 17 20 9
1) Planteamiento de la hipótesis:
H0: El dado es perfecto H1: El dado no es perfecto 2) Nivel de significancia: α= 0,05
3) Calculo del estadístico de prueba:
Prueba de chi-cuadrado Frecuencias Dado N observado
N esperado
Residual
1,00
14
16,7
-2,7
2,00
22
16,7
5,3
3,00
18
16,7
1,3
4,00
17
16,7
,3
5,00
20
16,7
3,3
6,00
9
16,7
-7,7
Total
100
Estadísticos de contraste Dado Chi-cuadrado(a)
6,440
gl
5
Sig. asintót. Sig. Monte Carlo
,266 Sig.
,270(b)
Intervalo de confianza de 95%
Límite inferior
,261
Límite superior
,279
a 0 casillas (,0%) tienen frecuencias esperadas menores que 5. La frecuencia de casilla esperada mínima es 16,7. b Basado en 10000 tablas muestrales con semilla de inicio 1993510611.
4) Establecer la regla de decisión:
5) Toma de la decisión: Por lo tanto el dado es perfecto.
PRUEBA DE INDEPENDENCIA EJERCICIO N°1: La empresa Limpia Ya S.A. comercializa tres tipos de detergentes A, B y C. En un análisis de segmentación de mercado para los tres productos, el grupo de investigación encargado ha planteado la duda de si las preferencias para los tres detergentes son diferentes entre los consumidores de los sectores Alto, Medio y Bajo. Si la preferencia de los detergentes fuera independiente del sector consumidor, se iniciaría una única campaña de publicidad para los tres productos; sin embargo, si la preferencia depende del sector de consumo, se ajustarán las promociones para tener en cuenta los distintos mercados de venta. Supongamos que se tomó una muestra de 120 consumidores. Después de usar los tres tipos de detergentes, se les pide manifestar su preferencia. Los resultados de la muestra se presentan en la siguiente tabla:
Alto Medio Sector Bajo Total
Producto Detergente A 14 21 15 50
Planteamiento de la hipótesis:
Detergente B 12 16 12 40
Detergente C 10 8 12 30
Total 36 45 39 n= 120
H0: La preferencia de detergente es independiente del sector de consumo H1: La preferencia de detergente no es independiente del sector de consumo
1) Nivel de significancia α= 0,05
2) Calculo del estadístico de prueba
Tablas de contingencia [Conjunto_de_datos0]
Resumen del procesamiento de los casos Casos Válidos N Porcentaje Sector * Producto
120
Perdidos N Porcentaje
100,0%
0
,0%
Tabla de contingencia Sector * Producto Recuento
Sector
DETERG ENTE A
Producto DETERG ENTE B
DETERG ENTE C
14 21 15 50
12 16 12 40
10 8 12 30
ALTO MEDIO BAJO
Total
Total 36 45 39 120
Pruebas de chi-cuadrado
Valor Chi-cuadrado de Pearson Razón de verosimilitudes Asociación lineal por lineal N de casos válidos
Sig. asintótica (bilateral)
gl
2,146(a)
4
,709
2,207
4
,698
,047
1
,829
120
3) Establecer la regla de decisión
N
Total Porcentaje 120
100,0%
4) Toma de la decisión Entonces, podemos afirmar que existe evidencia para sospechar que la preferencia por los detergentes es independiente del sector al que pertenece el consumidor.
EJERCICIO N°2: En un estudio para determinar si existe relación entre el sexo y el propósito de elegir una carrera técnica se entrevistaron a 120 aspirantes a la universidad. Los resultados se observan en la siguiente tabla de contingencia: Aspira a Carrera Técnica
Total
Sexo Si
No
Masculino
40
30
Femenino
10
40
Total
50
70
70 50 120
1) Planteamiento de la hipótesis:
H0: El propósito de elegir una carrera técnica es independiente del sexo H1: El propósito de elegir una carrera técnica no es independiente del sexo 2) Nivel de significancia: α= 0,05
3) Calculo del estadístico de prueba:
Tablas de contingencia [Conjunto_de_datos3]
Resumen del procesamiento de los casos Casos Válidos N Porcentaje Sexo * Carrera_Tecnica
120
Perdidos N Porcentaje
100,0%
Tabla de contingencia Sexo * Carrera_Tecnica
0
,0%
N
Total Porcentaje 120
100,0%
Recuento Carrera_Tecnica NO Sexo
MASCULIN O FEMENINO
Total
SI
Total
30
40
70
40 70
10 50
50 120
Pruebas de chi-cuadrado
Valor Chi-cuadrado de Pearson Corrección por continuidad(a) Razón de verosimilitudes Estadístico exacto de Fisher Asociación lineal por lineal N de casos válidos
Sig. asintótica (bilateral)
gl
16,555(b)
1
,000
15,062
1
,000
17,359
1
,000
16,417
1
,000
120 a Calculado sólo para una tabla de 2x2. b 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 20,83. 4) Establecer la regla de decisión:
5) Toma de la decisión: Por lo tanto, el propósito de elegir una carrera técnica en la universidad depende del sexo del aspirante a la universidad. EJERCICIO N°3: El área de Psicología del Colegio XYZ, desea estudiar la dependencia entre la práctica de algún deporte y la depresión de los estudiantes, con el propósito de saber si la práctica deportiva disminuye o no el riesgo de depresión. Se seleccionó una muestra aleatoria simple de 100 jóvenes, con los siguientes resultados: Estudiantes
Sin depresión Con depresión total
Deportista
38
9
47
No deportista
31
22
53
Total
69
31
100
1) Planteamiento de la hipótesis:
H0: La depresión en los estudiantes es independiente de la práctica deportiva H1: La depresión en los estudiantes es dependiente de la práctica deportiva 2) Nivel de significancia: α= 0,05
3) Calculo del estadístico de prueba:
Resumen del procesamiento de los casos Casos Válidos N Porcentaje Estudiante * Depresion
100
Perdidos N Porcentaje
100,0%
0
,0%
N
Total Porcentaje 100
100,0%
Tabla de contingencia Estudiante * Depresión Recuento Depresion sin depresion Estudiante
deportista no deportista
con depresion
38 31 69
Total
Total
9 22 31
47 53 100
Pruebas de chi-cuadrado
Valor Chi-cuadrado de Pearson Corrección por continuidad(a) Razón de verosimilitudes Estadístico exacto de Fisher Asociación lineal por lineal N de casos válidos
Sig. asintótica (bilateral)
gl
5,823(b)
1
,016
4,824
1
,028
5,975
1
,015
5,764
1
,016
100
a Calculado sólo para una tabla de 2x2. b 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 14,57.
4) Establecer la regla de decisión:
5) Toma de la decisión: Por lo tanto las prácticas deportiva si disminuye el riesgo de depresión.
PRUEBA DE NORMALIDAD O DE KOLMOGOROV-SMIRNOV EJERCICIO N°1:
n° eritrocitos en millones 1'5 -2'5 2'5- 3'5 3'5-4'5 4'5-5'5 5'5-6'5 6'5-7'5 7'5-8'5
n° de analisis 8 52 140 210 160 70 10
1) Planteamiento de la hipótesis:
H0: Los datos siguen una distribución normal H1: Los datos no siguen una distribución normal 2) Nivel de significancia: α= 0,05
3) Calculo del estadístico de prueba:
Pruebas no paramétricas [Conjunto_de_datos6] Prueba de Kolmogorov-Smirnov para una muestra
num_eritrocitos N
650
Parámetros normales(a,b) Diferencias más extremas
Media
4,0954
Desviación típica
1,20610
Absoluta
,162
Positiva
,162
Negativa
-,161
Z de Kolmogorov-Smirnov
4,138
Sig. asintót. (bilateral) Sig. Monte Carlo (bilateral)
,000 Sig.
,000(c)
Intervalo de confianza de 95%
Límite inferior
,000
Límite superior
,000
a La distribución de contraste es la Normal. b Se han calculado a partir de los datos. c Basado en 10000 tablas muestrales con semilla de inicio 1241531719.
4) Establecer la regla de decisión:
5) Toma de la decisión: Por lo tanto los datos no siguen una distribución normal. EJERCICIO N° 2:
EDAD(AÑOS) 0-15 15-30 30-45 45-60 >60
n° DE INDIVIDUOS 16 22 20 19 23
1) Planteamiento de la hipótesis:
H0: Los datos siguen una distribución uniforme H1: Los datos no siguen una distribución uniforme 2) Nivel de significancia: α= 0,05
3) Calculo del estadístico de prueba:
Pruebas no paramétricas [Conjunto_de_datos7] Prueba de Kolmogorov-Smirnov para una muestra edad N
100
Parámetros uniformes(a,b) Diferencias más extremas
Mínimo
1,00
Máximo
5,00
Absoluta
,230
Positiva
,160
Negativa
-,230
Z de Kolmogorov-Smirnov
2,300
Sig. asintót. (bilateral) Sig. Monte Carlo (bilateral)
,000 Sig.
,000(c)
Intervalo de confianza de 95%
Límite inferior
,000
Límite superior
,000
a La distribución de contraste es la Uniforme. b Se han calculado a partir de los datos. c Basado en 10000 tablas muestrales con semilla de inicio 562334227.
4) Establecer la regla de decisión:
5) Toma de la decisión: Por lo tanto los datos no siguen una distribución uniforme.
EJERCICIO N° 3: Decir si los siguientes datos: 0, 5, 3,-1, 2,-4,-2 y 7 provienen de una distribución normal para un nivel de significancia de 0,01.
NUM_DATO dato 1 2 3 4 5 6 7 8
0 5 3 -1 2 -4 2 7
1) Planteamiento de la hipótesis:
H0: Los datos provienen de una distribución normal H1: Los datos no provienen de una distribución normal 2) Nivel de significancia: α= 0,01
3) Calculo del estadístico de prueba:
Pruebas no paramétricas [Conjunto_de_datos8]
Prueba de Kolmogorov-Smirnov para una muestra num_dato N
20
Parámetros normales(a,b) Diferencias más extremas
Media
5,0000
Desviación típica
2,75299
Absoluta
,216
Positiva
,216
Negativa
-,216
Z de Kolmogorov-Smirnov
,967
Sig. asintót. (bilateral)
,307
Sig. Monte Carlo (bilateral)
Sig. Intervalo de confianza de 99%
,270(c) Límite inferior
,259
Límite superior
,282
a La distribución de contraste es la Normal. b Se han calculado a partir de los datos. c Basado en 10000 tablas muestrales con semilla de inicio 79654295.
4) Establecer la regla de decisión:
5) Toma de la decisión: Por lo tanto los datos provienen de una distribución normal