Estadística Estadí stica Inferencial Inferencial
Profesor: Ing. Ricardo Ricardo Rosas Roque
Prueba de Hipótesis para una proporción Los investigadores en muchas ocasiones están interesados en un fenómeno cuyo comportamiento es expresado en porcentajes. Por eje jem mplo lo,, se pu pueede est star ar int nter ereesado doss en probar pro bar si s i la propor proporción ción de d e potenci p otenciales ales elect electores ores que planean votar por el candidato 1 es estadísticamente distinta de la proporción que declaró preferir el candidato 2.
Estadístico de Prueba
• P es la proporción muestral. • p0: Es el valor supuesto de la proporción
poblacional en la hipótesis nula. • n: Es el tamaño de la muestra. • Z denota la distribución normal estándar. • α es el nivel de significación de la prueba.
Una encuesta realizada por Bancomer a 35 clientes indicó que un poco más del 74% tenían un ingreso familiar de más de $200,000 al año. Si esto es cierto, el banco desarrollará un paquete especial de servicios para este grupo. La administración quiere determinar si el porcentaje verdadero es mayor del 60% antes de desarrollar e introducir este nuevo paquete de servicios. Los resultados mostraron que 74.29 por ciento de los clientes encuestados reportaron ingresos de $200,000 o más al año. α = 0.05
Solución: H0: P ≤ 0.60 H1: P > 0.60 Zc = p - P0
Zt = 1,64
√P0 Q0 /n = 0.7429 - 0.60
√
0.6 x 0.4 / 35
=
1.73
Problema Un fabricante de televisores afirma que en promedio el 90% de sus televisores de color no necesitan de ninguna reparación durante sus primeros 2 años de funcionamiento. El Instituto de Protección del Consumidor (IPC) selecciona una muestra aleatoria de 100 televisores y encuentra que 15 de ellos necesitan alguna reparación durante sus primeros dos años de operación. Si el IPC desea rechazar una afirmación verdadera no más de 5 en 100 veces. Qué decidirá en relación con la afirmación del fabricante?
Prueba de Hipótesis acerca de la diferencia entre dos proporciones
Prueba de Hipótesis acerca de la diferencia entre dos proporciones
Ejemplo Un investigador selecciona muestras aleatorias de 120 psicólogos, y 80 psiquiatras para investigar sus opiniones acerca de si la esquizofrenia es causada por anormalidad bioquímica o una inadaptación originada en la niñez. La tabla que sigue da los resultados de esta investigación: Anormalidad bioquímica Inadaptación de la niñez Total
Psicólogos 60 60 120
Psiquiatras 50 30 80
Si usted esta dispuesto a rechazar una hipótesis verdadera no más de una vez en 100, rechazaría la H de que las opiniones de psicólogos y psiquiatras acerca de las causas de la esquizofrenia son las
Solución Muestra 1: p1 = 60 / 120 = 0,5 Muestra 2: p2 = 50 / 80 = 0,625
H0: P1 = P2 H1: P1 ≠ P2
Zt = ± 2,58
= 60 + 50 / 120 + 80 = 0,55
Zc = -1,74
Ejercicio En una prueba de calidad de dos comerciales de televisión se pasó cada uno en un área de prueba seis veces, durante un período de una semana. La semana siguiente se llevó a cabo una encuesta telefónica para identificar a quiénes habían visto esos comerciales. A las personas que los vieron se les pidió definieran el principal mensaje en ellos. Se obtuvieron los siguientes resultados:
Use α = 0.06 para probar la hipótesis de que no hay diferencia en las proporciones que recuerdan
Intervalo de confianza para la varianza poblacional: (σ 2) Si S 2 es la varianza de una muestra aleatoria de tamaño n de una población normal, un intervalo de confianza de (1 - α) 100% para σ 2 es: Χ2 con n -1 G de L, con áreas a la derecha de α / 2 y 1- α / 2, O respectivamente.
Ejemplo Un fabricante de baterías para automóviles hace un estudio para determinar la variabilidad de la duración de su producto. Selecciona 5 baterías al azar registra sus duraciones obteniendo los siguientes resultados: 1,9; 2,4; 3,0; 3,5 y 4,2 años, a partir de esta muestra estime la varianza de la duración de las baterías de su producto con una confianza del 95%. Suponga que la población de duraciones de las baterías es de forma aproximadamente normal.
La estimación puntual de σ 2 es S2 = 0.815. Los valores de chi cuadrado usados son: a = Χ2 (0.975, 4) = 0.484 y b = Χ2 (0.025, 4) = 11.143
“Con 95% de confianza se
estima que, entre 0.3 y 6.7 se encontrará la varianza de la duración de la baterías”.
Intervalo de confianza para el cociente de varianzas poblacionales: σ 12 = σ 22 Si S12 y S22 son las varianzas de muestras independientes de tamaño n 1 y n2 de poblaciones normales respectivamente, entonces un intervalo de confianza para σ 12 / σ 22 con un nivel de confianza del (1 – α)100%
Ejemplo: Una compañía tiene una política singular relativa a los bonos de fin de año destinados al personal gerencial de bajo rango (los bonos son expresados como un porcentaje del salario anual). El director de personal considera que el sexo del empleado influye en los bonos recibidos, para esto toma muestras de 16 mujeres y 25 hombres que desempeñan cargos gerenciales y registra los porcentajes del salario anual percibido obteniéndose los datos siguientes:
Calcule un intervalo de confianza del 95% para la razón de varianzas de los porcentajes de salario anual de las mujeres y los hombres. Con este resultado, ¿es posible afirmar que hay homogeneidad de varianzas?
Con 95% de confianza, el cociente de las varianzas de los % de salario anual de las mujeres y hombres está contenido entre 0,7905 a 5,2033. Por tanto existe Homogeneidad de varianzas.
Ejercicio Para estimar la variabilidad de los contenidos de un producto que una empresa comercializa en bolsas de 150 gramos. Una muestra aleatoria de 10 unidades del producto resultando los siguientes pesos en gramos: 150,5 150,7 149 150,4 149,6 151 150,9 149,2 150,3 149,3 Obtener el IC del 95% para la varianza de los contenidos de todas las unidades del producto en mención.
0,2634
≤
σ 2
≤ 1,8553
Ejercicio Un fabricante va a instalar una nueva máquina N sólo si hay prueba de que es menos variante en los tiempos de producción que la actual máquina A. Con este fin ha escogido una muestra aleatoria de tamaño n 1 = 8 de A y otra de tamaño n2 = 6 de N, de los tiempos en segundo, que se emplearon para producir cada unidad en un experimento de prueba. Los resultados son: Mue stra de A
2.17
2.23
2.21
2.18
2.22
2.2
Mue stra de N
2.13
2.16
2.14
2.12
2.15
2.14
2.21
2.19
Aplicar un IC de 95% y el criterio para decidir ¿cree usted que el fabricante debería cambiar su máquina actual?
Ejercicio Una fábrica de tornillos está interesada en la uniformidad de la máquina que los corta. En concreto es deseable que la desviación típica, σ del proceso de cortado sea menor que cierta medida pequeña. Supuesto que la longitud de los tornillos cortados por esa máquina está distribuida normalmente y que se ha obtenido s2 = 0,0153 mm2, en una muestra de 20 tornillos, obtener un intervalo del 95 % de confianza para σ .
Prueba de hipótesis para la varianza • La varianza como medida de dispersión es importante porque ofrece una mejor visión de dispersión de datos
• En control de calidad; cuando un producto se elabora el área de control de calidad busca que los productos estén dentro de ciertos límites de tolerancia, pero también que la variabilidad de un producto sea lo menor posible.
Estadístico de Prueba
Con n – 1 Grados libertad
Ejemplo: • Una empresa del giro alimenticio desea determinar si el lote de una materia prima tiene o no una varianza poblacional mayor a 15 en su grado de endulzamiento. Se realiza un muestreo de 20 elementos y se obtiene una varianza muestral de 20,98; realizar la prueba de hipótesis con alfa = 0.05.
H0: σ 2 ≤ 15 H1: σ 2 > 15
α = 0,05
• No se rechaza H0
Ejemplo 2: Un negocio debe pagar horas extra dada la demanda incierta de su producto, por lo cual en promedio se pagan 50 horas extra a la semana. El gerente de recursos humanos considera que siempre se ha tenido una varianza de 25 en las horas extras demandadas. Si se toma una muestra de 16 semanas se obtiene una varianza muestral de 28,1. Determine con alfa = 0,10 si la varianza poblacional de las horas extras demandadas a la semana puede considerarse igual a 25.
Pruebas de hipótesis para 2 varianzas poblacionales En algunas aplicaciones estadísticas interesa comparar las varianzas de las calidades de producto obtenido mediante dos métodos de producción diferentes, o las varianzas de tiempos de fabricación empleando dos métodos diferentes, o las varianzas de temperaturas que se tienen con dos dispositivos distintos de calentamiento
• Cuando se planteen las hipótesis debe quedar en el numerador la población cuya muestra tenga mayor varianza.
H0: σ 12 = σ 22 H1: σ 12 ≠ σ 22
ó ó
H0: σ 12 / σ 22 = 1 H1: σ 12 / σ 22 ≠ 1
Ejemplo: Dos fuentes de materias primas están siendo consideradas. Ambas fuentes parecen tener características similares, pero no se está seguro de su homogeneidad. Una muestra de 10 grupos de la fuente A produce una varianza de 250 y una muestra de 11 grupos de la fuente B produce una varianza de 195. Con base en ésta información se puede concluir que la varianza de la fuente A es significativamente mayor que la de la fuente B?. Asuma un nivel de confianza del 99 por ciento.
Ejemplo: Se supone que los diámetros de cierta marca de válvulas están distribuidos normalmente con una varianza poblacional de 0,2 pulgadas2 , pero se cree que últimamente ha aumentado. Se toma una muestra aleatoria de válvulas a las que se les mide su diámetro, obteniéndose los siguientes resultados en pulgadas: 5,5 5,4 5,4 5,6 5,8 5,4 5,5 5,4 5,6 5,7 Con ésta información pruebe si lo que se cree es cierto.
Se quiere comprobar si la variabilidad en la duración de unas lámparas marca A es igualmente variable que la duración de otra marca B de la competencia. Para tal fin, se toma una muestra aleatoria de 13 lámparas tipo A y se encuentra que la desviación estándar muestral es S=8, mientras que en otra muestra aleatoria de 13 lámparas tipo B se encuentra que la desviación estándar muestral es de S=4. Se pide probar la hipótesis nula de que la variabilidad es igual en ambas poblaciones con un nivel de significación del 5%. Se supone que la duración de las lámparas se distribuye normalmente para ambas marcas.