1
Conceptos generales La prueba de hipótesis, denominada también prueba de significación, tiene como objeto principal evaluaracerca de los suposiciones o afirmaciones valores estadísticos de la población, denominados parámetros. «Docimar = probar» 2
Hipótesis estadística Es un supuesto acerca de un parámetro o algún valor estadístico de una población (media aritmética, varianza, etc.)
3
Ejemplo Se efectúan 100 lanzamientos de una moneda y se obtienen 60 caras (40 sellos). Vamos a probar la legitimidad de la moneda tomando en cuenta cayeran que al lanzar 50 caras 100 ymonedas, 50 sellos.loSin lógico embargo, sería que al realizar el experimento se presentaron 60 caras en vez de obtener 50; esta pequeña diferencia puede llevarnos a pensar, que la probabilidad de presentación de cara es mayor que la de sello, dicho en otras palabras, que la moneda está cargada o arreglada. 4
Ejemplo i)
Determinando la probabilidad de que se obtenga 60 caras a más ≥ 60 = =
=
=50 =
por lo tanto:
=
=5
=
−
=
≥ 60 = 0,02275 = 2,28%
Lo que se considera una probabilidad muy pequeña
5
Ejemplo Este resultado (N° mayor o menor de caras) nos lleva a pensar sobre lo sucedido y tenemos 2 explicaciones: i) La moneda o monedas utilizadas en este experimento es o son fabricadas perfectamente, por lo tanto el resultado obtenido es el correcto, pero ha sucedido algo raro, pues esperábamos igual número de caras y sellos. 6
Ejemplo ii.
La moneda tiene falla de fabricación, por lo que se explica que una de las caras puede aparecer con mayor frecuencia. Se está diciendo que la moneda no estálados. equilibrada, es decir, está cargada en uno de los
7
Clases de Hipótesis Hipótesis Nula se formula con el fin de rechazarla. a)
Hipótesis alternativa Enunciado opuesto a la a)
8
Tipos de errores Información muestral
Aceptar H0
Rechazar H0
H0 es cierta Decisión
H0 es falsa 9
Ejemplo Supongamos que se detiene a una persona por robo y se lo envía al juez quien podrá declararlo inocente olos pro y culpable. Al juez se le presentan los contra y, con base en toda la información, decide dejarlo libre o condenarlo. El juez, no sabrá si hubo error en su decisión, sólo podrá saber la persona que ha sido juzgada. 10
Ejemplo Persona juzgada
Inocente
Culpable
Libre Decisión
Condena do 11
Pasos a seguir en una Prueba de Hipótesis
Paso 1: Planteo de hipótesis. Paso 2: Nivel de significación. Paso 3: Prueba estadística. Paso 4: Suposiciones. Paso 5: Regiones críticas. Criterios de decisión. Paso 6: Realización de la prueba. Paso 7: Resultados y conclusiones. 12
Situaciones especiales
13
14
Estadístico de la prueba
Distribución de medias muestrales: =
−
o
=
−
> 30
Distribución de proporciones muestrales: =
−
iendo > 30
15
Estadístico de la prueba
Distribución de diferencias entre dos medias muestrales: (Siendo n1 y n2 mayores que 30) =
− −( − ) +
o
=
− −( − )
+
Distribución de proporciones muestrales: =
− −( − ) +
> 30
16
Prueba de hipótesis para una media poblacional (varianza conocida) Ejemplo 1. Un inspector de calidad investiga las acusaciones contra una embotelladora por su deficiente llenado que debe ser, en promedio, de 32,5 onzas. Para ellocontenido toma unamedio muestra de31,9 60 botellas, que el es de onzas deencontrando líquido. Se sabe que la máquina embotelladora debe producir un llenado con una desviación típica de 3,6 onzas. ¿Puede el inspector llegar a la conclusión, a un nivel de significación del 5%, que se están llenando las botellas por debajo de su especificación de contenido?
17
Prueba de hipótesis para una media poblacional (varianza conocida)
Como -1,29 se sitúa en la zona de aceptación, es válida la hipótesis nula, lo cual significa que el inspector no debe llegar a la conclusión, que se esté llenando y vendiendo un producto por debajo de su especificación, al nivel del 5%. 18
Prueba de hipótesis para una media poblacional (varianza conocida)
Un proceso está programado para empacar la cantidad media, una libra (16 onzas) de café. Se toma una muestra aleatoria de 36 paquetes; resulta una media de 14,2 onzas y desviación típica de 5,3 onzas. Al nivel del 5%, ¿Se podrá afirmar que no se está cumpliendo con lo indicado en el empaque?
19
= 16 = 36 = 14,2 = 5,3
16 H a : 16 H0 :
Z
14,2 16 5,3
2,04
36
Al nivel del 5%, se podrá afirmar que no se está cumpliendo con lo indicado por la fábrica. Se puede ver que -2,04 se ubica en la región crítica, por lo tanto se estará rechazando la hipótesis nula, y aceptando la hipótesis alternativa. 20
Prueba de hipótesis para una media poblacional (varianza conocida)
Una empresa eléctrica fabrica focos cuya duración se distribuye de forma aproximadamente normalestándar con media de 800 horas y desviación de 40 horas. Pruebe la hipótesis de que horas contra la alternativa horas si una muestra aleatoria de 28 focos tiene una duración promedio de 784 horas. Utilice un nivel de significancia de 0.05. 21
1.
Planteo de hipótesis.
2.
Nivel de significación: a = 0.05
3.
Prueba estadística
H 0 : 800 H 1 : 800
_
Zc
4.
x
/
n
~ N(0.1)
Supuestos.
a.
Población normal.
b.
Muestra tomada al azar. 22
5. Regiones críticas. Criterios de
decisión.
6. Cálculos Zc
784 800 2.12 40 / 28
Conclusiones. Con 5% de nivel de significación y a partir de la información muestral, el tiempo promedio de duración de los focos es diferente de 800 horas. 23
Prueba de hipótesis para una media poblacional (varianza desconocida)
Problema1: Antes de publicar un nuevo libro de Estadística, El autor desea probar la
hipótesis, con unpromedio nivel de significancia deles2% de que el precio de tales libros de S/. 35.00. ¿Esta afirmación se sustenta si una muestra de 50 libros tiene una media de S/. 32.97 y una desviación estándar de S/. 12.87?
24
Distribución de proporciones muestrales =
−
iendo > 30
25
Distribución de proporciones muestrales p Por estadísticas que se tienen, se ha podido establecer que por lo menos el 40% de los jóvenes toman regularmente Coca-cola, cuando tienen sed. Una muestra aleatoria de 450 jóvenes reveló que 200 de ellos solían tomar dicha bebida, cuando tenían sed. ¿Cuál podría ser su conclusión al nivel del 1%, acerca de lo que muestran las estadísticas?
26
Distribución de proporciones muestrales p =
200 450
= 0,44 = 44% = 450 =
250 450
= 0,56
pP
H 0 : P 0,40 H a : P 0,40
Z
0,01 s p pq
Z
a
pq n
0,44 0,40 0,44(0,56)
1,71
450
Al nivel del 1%, se podrá afirmar que
27
Distribución de proporciones muestrales p Un gerente de una empresa afirma que el porcentaje de atrasos en las horas de llegada al trabajo cobija al 25% de sus empleados. Solicita al jefe de personal la revisión de 40 tarjetas marcadas con las horas de llegada, en la quincena, y encuentra que 8 han llegado tarde. Al nivel del 5%, ¿hay razón para concluir que el gerente de la empresa está exagerando?
28
Prueba de hipótesis para proporciones El expendio Pollos Deliciosos asegura que 90% de sus órdenes se entregan en menos de 10 minutos. En una muestra de 100 órdenes, 82 se entregaron dentro de ese lapso. Puede concluirse en el nivel de significancia 0,01, que menos de 90% de las órdenes se entregan en menos de 10 minutos?
Prueba de hipótesis para proporciones Un artículo reciente, publicado en el diario USA today, indica que solo a uno de cada tres egresados de de unatrabajo. universidad les espera un puesto En una investigación a 200 egresados recientes de su universidad, se encontró que 80 tenían un puesto de trabajo. Puede concluirse en el nivel de significancia 0,02, que en su universidad la proporción de estudiantes ue tienen traba o es
Prueba de hipótesis para proporciones A una muestra a nivel nacional (en Estados Unidos) de ciudadanos influyentes de los partidos republicano y demócrata, se les preguntó entre otras cosas, si estaban de acuerdo con la disminución de los estándares ambientales para permitir el uso del carbón con alto contenido de azufre como combustible. Los republicanos Demócratas resultados fueron:
Cantidad muestreada Cantidad a favor
1000
800
200
168
Al nivel de significancia 0,02, puede decirse que hay una proporción mayor de Demócratas a favor de reducir los estándares?
Distribución de diferencias entre dos medias muestrales:
(Siendo n1 y n2 mayores que 30) =
−( − ) − +
o
=
− −( − )
+
35
Distribución de diferencias entre dos medias muestrales Ejemplo 1. Supongamos que la empresa desarrollo un
curso de entrenamiento para sus técnicos, formando dos grupos y aplicando métodos distintos de entrenamiento. Los dos grupos se consideran homogéneos en capacidad. El primer grupo lo componen 36 técnicos que obtuvieron un puntaje de 6 (en una escala de 0 a 10 puntos) y una desviación típica de 4 puntos y el segundo grupo de 40 técnicos cuyo promedio fue 8,2 y desviación típica de 4,3 puntos. ¿Se puede concluir que el método aplicado al segundo grupo fue superior al primero? Nivel 1%. 36
Distribución de diferencias entre dos medias muestrales
37
Distribución de diferencias entre dos medias muestrales Ejemplo 2. una prueba de resistencia al
esfuerzo de dos tipos diferentes de cables, que presentan desviaciones típicas de seleccionando 35 y 45 respectivamente, se llevó a cabo, dos muestras de tamaño 32 y 40, con medias de 905 y 925. ¿proporcionan estos resultados, al nivel del 10%, suficiente evidencia de que la resistencia de B es superior a la de A?
38
Distribución de diferencias entre dos medias muestrales
39
Distribución de diferencias entre dos medias muestrales Ejemplo 3. Una firma que tiene dos fábricas ubicadas
en dos regiones del país, desea establecer el promedio de antigüedad que tienen sus trabajadores, a fin de instaurar un programa para sus pensionados. Se toma de la primera fábrica una muestra de 60 obreros, la cual reflejó un promedio de trabajo de 16,4 años, con desviación estándar de 5 años, mientras que en la segunda fábrica una muestra de 40, fue de 15,8 años, con desviación estándar de 4,2 años ¿Al nivel del 5% se podrá afirmar que hay una diferencia significativa en cuanto a la antigüedad en la empresa? 40
Distribución de diferencias entre dos medias muestrales
41
Distribución de diferencias entre dos proporciones muestrales =
− −( − ) +
> 30
42
Distribución de diferencias entre dos proporciones
Ejemplo 1. En una encuesta se preguntó sobre los
hábitos de lectura, utilizando una muestra aleatoria de 350 señoras que trabajan y otra muestra independiente de 325 que no lo hacen. En el primer caso, 105 manifestaron que estaban suscritas a cierto tipo de revista. En el segundo, la respuesta fue de 130 que no estaban suscritas ni mostraban interés por ninguna revista, argumentando la falta de tiempo. ¿Al nivel del 1% se podrá afirmar que las eñoras que trabajan leen menos que las señoras que no trabajan? 43
Distribución de diferencias entre dos proporciones
44
Distribución de diferencias entre dos proporciones Ejemplo 2. Un gerente de una compañía realiza
dos muestras de tamaño de 120 empleados, una en cada fábrica, con el fin de determinar el porcentaje de accidentes de trabajo en el trimestre. En la primera fábrica durante el trimestre de observación se presentaron 12 casos, mientras que en la segunda, 16. ¿Al nivel del 5% se podrá afirmar que los accidentes de trabajo son iguales en las dos fábricas? 45
Distribución de diferencias entre dos proporciones
46
Distribución de diferencias entre dos proporciones Dos grupos A y B de 100 personas cada uno tienen determinada enfermedad. Un Ejemplo 3.
suero es al grupo A, peroidénticamente. no al B. Por otra parte, losdado grupos son tratados Sí encontramos que en el grupo A, 75 personas se recobran de la enfermedad y en el B, 65, pruebe la hipótesis de que el suero cura la enfermedad.
47
48
Distribución de diferencias entre dos proporciones Ejemplo 4. Al investigar la "imagen" de calidad de cierta marca de
reloj de pulso, se seleccionó una muestra de 120 profesionales y 80 talleres de reparación y se obtuvo la siguiente información. Con los resultados que se dan a continuación, ¿se podría interpretar, al nivel del 5% que existe una diferencia significativa, en cuanto a opinión sobre la marca del reloj?
49
50
PRUEBAS DE HIPÓTESIS PARA LA VARIANZA POBLACIONAL
Se cree que si la varianza de los puntajes de agresión de un grupo de estudiantes es superior a 0.30, entonces habrá que preocuparse por su conducta. Si en una muestra aleatoria de 10 estudiantes se encontró que el puntaje promedio de agresión fue 31.55 y la desviación estándar 0.48; ¿a qué conclusión llegarás con una confianza del 95%?
51
52
EJERCICIOS
53
Problema: Un químico ha desarrollado un material plástico que, según él, tiene una
resistencia media a Para la ruptura de 29 la onzas por pulgada cuadrada. comprobar bondad del método se tomaron 20 láminas de plástico en mención hallándose que en cada una de éstas la resistencia a la ruptura es, respectivamente, 54
30.1
22.5
28.9
29.8
31.4
32.7
27.5
27.7
28.9
30.4
27.0 31.2
24.3 26.4
22.8 29.4
22.3 29.1
33.4 23.5
Al nivel de significación 0.05 y suponiendo normalidad, ¿se admite la hipótesis del químico? 55
Prueba de hipótesis para la varianza
: Se reporta que la desviación estándar de la resistencia al rompimiento de ciertos cables producidos por una compañía es 240 lb. Después de que se introdujo un cambio en el proceso de producción de estos cables, la resistencia al rompimiento de una muestra de 8 cables mostró una desviación estándar de 300 lb. Investigue la significancia del aumento aparente en la variación usando un nivel de significancia de 0.05
56
Pruebas de hipótesis para una proporción poblacional
Problema. En cierta universidad se estima que el 25% de los estudiantes van a
bicicleta a la universidad. ¿Esta parece ser una estimación válida si, en una muestra aleatoria de 90 estudiantes universitarios, se encuentra que 28 van en bicicleta a la universidad? Utilice un nivel de significancia de 0.05 57
Pruebas de hipótesis para dos varianzas poblacionales
Suponga que el director de capacitación de una compañía manufacturera desea comparar dos enfoques de trabajo en equipo. Cada miembro de un grupo de 16 empleados nuevos se asigna al azar a uno de los tres métodos. Una vez terminada la capacitación de los participantes, se evalúa el tiempo que tardan (en minutos) en ensamblar el producto. Los resultados se resumen como sigue: 58
A 8.82 9.26
8.7
8.97 8.64 8.29 9.45 9.42
B 8.21 6.65 7.44 7.95
8.2
7.75 8.84
8.4
a) ¿Existe homogeneidad de varianzas? Analice los datos considerando un nivel de significación del 5%.
59
Pruebas de hipótesis para la diferencia de medias (varianzas desconocidas e iguales)
2: Clean All es un nuevo limpiador de uso múltiple cuya demanda se prueba exhibiéndolo en dos lugares diferentes dentro de varios supermercados. A continuación se muestra el número de botellas de 12 onzas que se vendieron en cada ubicación. Cerca de las cervezas Con otros limpiadores
12
18
10
15
25
28
30
32 60
a) Analice los datos, formule las hipótesis adecuadas y contrástelas considerando un nivel de significación del 5%. b)Determine si es posible, ¿Cuál es el lugar dentro del supermercado más efectivo para la venta del limpiador Clean All? 61
Pruebas de hipótesis para la diferencia de medias (varianzas desconocidas y diferentes)
Ejemplo: Para investigar la influencia
de la especialización en el salario inicial de los graduados en Ingeniería, se entrevistó a dos grupos de estudiantes recién graduados especializados en ingeniería y en otras profesiones. Los resultados fueron como sigue:
62
Ingeniería
Otras profesiones
70000
109000
95000
97000
100000 110000
95000 99000
85000
105000
75000
110000
70000
106000 98000
Si se asume poblaciones normales, ¿se puede concluir que el salario de promedio otras profesiones es mayor que en ingeniería? Use = 0.05. a
63