Estadística Inferencial Aplicada
PRUEBAS DE HIPÓTESIS PARA DOS MUESTRAS INDEPENDIENTES Importancia de las pruebas de hipótesis para dos muestras independientes. De acuerdo al avance que ha tenido últimamente el estudio de fenómenos sociales en base al campo de análisis estadístico, podemos ver que se torna fundamental tomar en consideración los resultados que podemos inferir en base a las decisiones que se planteen para un caso determinado. Vemos que muy a menudo, en la práctica, se tienen que tomar decisiones sobre poblaciones, partiendo de la información muestral de las mismas. Es por ello que tenemos que considerar mucha seriedad acerca de las conclusiones a las que podemos llegar, al evaluar las decisiones estadísticas que se tomen, en base a los datos que se puedan obtener para un estudio específico, y como las mismas pueden resultar en determinar que ciertas hipótesis planteadas se tomen como ciertas o en su defecto como no valederas. (1).
Aplicaciones en administración y economía En cuanto se refiere a la utilidad que tienen las decisiones estadísticas en lo que concierne a las aplicaciones que se encuentran en varios campos de las ciencias económicas, podemos afirmar que es de especial interés el uso que se da al análisis estadístico y muy particularmente al concepto de medias diferenciales para contrastar los parámetros poblacionales, utilizando una prueba de hipótesis para dos muestras independientes, a las siguientes aplicaciones en administración y economía:
Pronósticos acerca del futuro de la economía o sobre algunos aspectos de la misma.
El control de calidad que se hace para controlar procesos de producción
Análisis bursátil para estudiar el comportamiento de los mercados financieros
Medición de los índices financieros para PYMES.
Conceptualización y fórmulas En el problema de estimación se trata de elegir el valor de un parámetro de la población, mientras que en las pruebas de hipótesis se trata de decidir entre aceptar o rechazar un valor especificado.
Prueba de hipótesis: Estadísticamente una prueba de hipótesis es cualquier afirmación acerca de una población y/o sus parámetros. Una prueba de hipótesis consiste en contrastar dos hipótesis estadísticas. Tal contraste involucra la toma de decisión acerca de las hipótesis. La decisión consiste en rechazar o no una hipótesis en favor de la otra. Una hipótesis estadística se denota por “H” y son dos: - Ho: hipótesis nula - H1: hipótesis
alternativa (2) Al tomar la decisión con respecto a la hipótesis nula, se debe determinar el valor crítico en la distribución estadística que divide la región del rechazo (en la cual la hipótesis nula no se puede rechazar) de la región de rechazo. A hora bien el valor crítico depende del tamaño de la región de rechazo. Contraste de diferencia de medias en dos muestras independientes Para realizar esta prueba, se requiere de tres suposiciones: • Las dos poblaciones siguen distribuciones normales. • Las dos muestras no deben estar relacionadas, es decir, deben ser independientes. • Debe conocerse la desviación estándar de las dos poblaciones. (3)
Para desarrollar los ejemplos y problemas con respecto a las pruebas de hipótesis para dos muestras independientes se utilizan las fórmulas: VARIANZA DE LA DISTRIBUCIÓN DE LAS DIFERENCIAS ENTRE MEDIAS
PRUEBA DE DOS MEDIAS DE MUESTRAS CONOCIDA
= = ̅−+̅
Ejemplo Se realiza un estudio acerca del impacto que tiene el Programa de Planificación Familiar que lleva a cabo el HMI Ramos Larrea en dos asentamientos humanos de su jurisdicción, uno ubicado en área urbana (A) y otro en área rural(B), tomando para ello dos muestras de mujeres en edad fértil y con actividad sexual: nA = 30 y nB = 30. Después de aplicado el instrumento de medición, se obtienen los siguientes datos:
1. Planteamiento de hipótesis: Ho: μ1 ≤ μ2 H1: μ1 > μ2
2. Nivel de significancia: α = 0.05 3. Prueba estadística:
̅ ̅ =
Con los supuestos: Las distribuciones son normales Las muestras se seleccionaron al azar.
Muestra A:
̅ = ∑ ̅ = 53002 ̅ = 16.73 ̅ ∑ ( ) = 1 = 1773.29 87 = 7.82 Muestra B:
̅ = ∑ ̅ = 43004 ̅ = 13.47 ̅ ∑ ( ) = 1 = 831.2947 = 5.35
4. Regla de decisión
Grafica: Regla de decisión de una prueba de una cola con un nivel de significancia 0.05 Ho: μ1 ≤ μ2 H1: μ1 > μ2
Región de rechazo:0.05
0.5
0.45
Valor crítico:1.64
5. Cálculo/análisis de datos:
= ̅−+̅ 7313. 4 7 = 16. √ 7.3082 5.3035 z = 1.88
para un valor de z=1.88p=0.5-0.4706=0.0294
Se rechaza la hipótesis nula (Ho), se acepta la hipótesis alterna (H1) a un nivel de significancia de α = 0.05. La prueba resultó ser significativa.
La evidencia estadística no permite aceptar la hipótesis nula.
La evidencia estadística disponible permite concluir que probablemente el impacto del Programa de Planificación Familiar fue mayor en las mujeres del asentamiento humano del área urbana
Resolución con aplicación de software Minitab Muestras
Resultados
Podemos ver que de igual manera se concluye en rechazar la hipótesis nula, de igual forma de verifica el valor de p en el software Minitab.
Ejercicios Propuestos 1. La compañía Gibbs Baby desea comparar el aumento de peso de bebés que consumen su producto en comparación con el producto de su competidor. Una muestra de 40 bebés que consumen los productos Gibbs reveló un aumento de peso medio de 7.6 libras en sus primeros tres meses de vida, con una desviación estándar de la población de la muestra de 2.3 libras. Una muestra de 55 bebés que consumen la marca del competidor reveló un aumento medio de 8.1 libras, con una desviación estándar de la población de 2.9 libras. Con un nivel de significancia de 0.05, ¿es posible concluir que los bebés que consumieron la marca Gibbs ganaron menos peso? Calcule el valor p e interprételo.
2. Se sospecha que la altura de las mujeres es un factor para tener partos difíciles; esto es, una mujer más bajita tiene más probabilidades de necesitar una cesárea. Un investigador médico encontró, en una muestra de 45 mujeres que habían tenido un parto normal, que su estatura media era de 61.4 pulgadas. Una segunda muestra de 39 mujeres que fueron sometidas a cesárea tuvo una estatura media de 60.6 pulgadas. Suponga que la población de estaturas relacionadas con los partos normales tiene una desviación estándar de 1.2 pulgadas. También, que las estaturas de la población de mujeres que tuvieron partos por cesárea tiene una desviación estándar de 1.1 pulgadas. ¿Eran más bajas las que tuvieron parto por cesárea? Utilice un nivel de significancia de 0.05. Encuentre el valor p y explique lo que significa.
3. Mary Jo Fitzpatrick es la vicepresidenta de servicios de enfermería del hospital Luke’s Memorial. Hace poco observó que, en las ofertas de trabajo para enfermeras sindicalizadas, los sueldos son más altos que para las no sindicalizadas. Decidió investigar y reunió la información siguiente.
¿Es razonable concluir que las enfermeras sindicalizadas ganan más? Utilice un nivel de significancia de 0.02. ¿Cuál es el valor p?
Solución a los ejercicios propuestos Ejercicio ·1 Grupo
Peso medio
Desviación estándar de
Tamaño de la muestra
la población Compañía Gibbs Baby
7.6 lbs.
2.3 lbs.
40
Grupo competidor
8.1 lbs.
2.9 lbs.
55
1. Planteamiento de hipótesis: Ho: μ1 ≥ μ2 H1: μ1< μ2
2. Nivel de significancia: α = 0.05 3. Prueba estadística:
̅ ̅ =
Con los supuestos: Las distribuciones son normales Las muestras se seleccionaron al azar.
4. Regla de decisión
Grafica: Regla de decisión de una prueba de una cola con un nivel de significancia 0.05 Para un nivel de significancia de 0.05 el valor crítico de z es -1.64 Ho: μ1 ≤ μ2 H1: μ1 > μ2
Región de rechazo:0.05
0.45
Valor crítico: -1.64
0.50
5. Cálculo/análisis de datos:
= ̅−+̅ = √ 27..368. 2.19 40 55 z = 0.94
para un valor de z=-0.94 p=0.5+0.3264=0.8264
Conclusión:
El valor calculado de z cae dentro de la zona de aceptación Se acepta la hipótesis nula, la diferencia de 0.5 lbs. no es tan grande para tomar en cuenta que los bebes que consumieron el grupo competidor ganaron más peso. En consecuencia, al calcular el valor de p se nota que existe una probabilidad considerable de alrededor del 83% que nos permite decir que los bebes que consumieron la marca Gibbs Baby no ganaron menos peso.
Solución del ejercicio con software
Ejercicio ·2
Grupo
Estatura media
Desviación estándar de
Tamaño de la muestra
la población Parto normal
61.4 plg.
1.2 plg.
45
Parto por cesárea
60.6 plg.
1.1 plg.
39
1. Planteamiento de hipótesis: Ho: μ1 ≤ μ2 H1: μ1> μ2
2. Nivel de significancia: α = 0.05 3. Prueba estadística:
̅ ̅ =
Con los supuestos: Las distribuciones son normales Las muestras se seleccionaron al azar.
4. Regla de decisión
Grafica: Regla de decisión de una prueba de una cola con un nivel de significancia 0.05 Para un nivel de significancia de 0.05 el valor crítico de z es 1.64 Ho: μ1 ≤ μ2 H1: μ1 > μ2 Región de rechazo:0.05
0.5
0.45
Valor crítico:1.64
5. Cálculo/análisis de datos:
= ̅−+̅ 460.6 = 61. √ 145.2 1.391 z = 3.19
para un valor de z=3.19p=0.5-0.3264=0.1736
Conclusión:
El valor calculado, 3.19, es mayor que el valor crítico 1.64; en consecuencia, se debe rechazar la hipótesis nula y aceptar la alternativa. La diferencia de 0.8 pulgadas entre las mujeres que dieron a luz por parto normal y las que lo hicieron por cesárea es considerable para deberse a la casualidad. En otras palabras, la conclusión es que las mujeres más bajas tuvieron parto por cesárea En la tabla Z no aparece la probabilidad asociada con 3.19. El mayor valor disponible es 3.09. El área que corresponde a 3.09 es 0.4990. En este caso, el valor p es menor que 0.0010, calculado mediante 0.5000 – 0.4900. La conclusión es que hay muy pocas probabilidades de que la hipótesis nula sea verdadera.
Solución del ejercicio con software
Ejercicio ·3
Grupo
Salario medio
Desviación estándar de
Tamaño de la muestra
la población Sindicalizadas
$20.75
$2.25
40
No sindicalizadas
$19.80
$1.90
45
1. Planteamiento de hipótesis: Ho: μ1 ≤ μ2 H1: μ1> μ2
2. Nivel de significancia: α = 0.02 3. Prueba estadística:
= ̅̅
Con los supuestos: Las distribuciones son normales Las muestras se seleccionaron al azar.
4. Regla de decisión
Grafica: Regla de decisión de una prueba de una cola con un nivel de significancia 0.05 Para un nivel de significancia de 0.02 el valor crítico de z es 2.05 Ho: μ1 ≤ μ2 H1: μ1 > μ2 Región de rechazo:0.02
0.5
0.48
Valor crítico:2.05
5. Cálculo/análisis de datos:
= ̅−+̅ 7519. 8 0 = 20. √ 2.4025 1.4590 z = 2.09
para un valor de z=2.09p=0.5-0.4817=0.0183
Conclusión:
El valor de z esta fuera del rango máximo especificado con el valor critico de 2.05 Por tanto, se rechaza la hipótesis nula, de este modo se puede decir al respecto que las enfermeras sindicalizadas evidentemente ganan más, ya que la diferencia de $0.95 es grande para que se deba a la casualidad, además de verificar que el valor de p es muy pequeño.
Solución del ejercicio con software
Bibliografía
(1) Murray R. Estadística, teoría y 875 problemas resueltos. Ed McGrawHill. 1976 Colombia. Pag 167-9.
(2) Torino H. Resumen del libro de estadística de Berenson y Levine [monografía en Internet]. Monografía .com; 1997 [citado 29 Ago 2005]. Disponible en: http://www.monografias.com/trabajos/beren/bern.shtml
(3) Douglas A. Lind, William G. Marchal, Samuel A.Wathen; Estadística para la Administración y la Economía; México, MacGrawHill, 15 ed. Pag. 372