PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE PROPORCIONES En ocasiones deseamos saber si dados dos muestras derivadas de poblaciones diferentes o iguales, presentan diferencias significativas en sus parámetros o no presentan alguna diferencia dada una variable dada, en este caso, el parámetro seleccionado viene dado por la proporción entre cada una de las poblaciones . Por ello al seleccionar dos muestras aleatorias, debemos tener en cuenta que tiene las siguientes condiciones:
POBLACIÓN 1
̅
POBLACIÓN 2
̅
DEFINICIÓN Elementos de la muestra de cada población Proporción poblacional Proporción dela muestra escogida
Una vez obtenidos cada uno de los parámetros anteriormente definidos, queda definir el estadístico Z que se contrastara con los resultados generados en la prueba de hipótesis de las dos muestras:
Una vez definida los parámetros de cada una de las muestras aleatorias, en lo que nos centraremos en la proporción de cada una de las poblaciones estudiadas, realizaremos el planteamiento de la prueba de hipótesis tanto nula como alternativa de la siguiente manera
:: ≠= 00 :: ≠= , o que
, o que
La hipótesis nula nos indica que las proporciones de ambas poblaciones no tienen ninguna diferencia estadísticamente significativa por lo l o tanto pueden considerarse iguales (mirándolo desde un punto de vista estadístico), en cambio la hipótesis alternativa nos plantean que existen diferencias significativas en las proporciones poblacionales con un nivel de confianza de α%(alfa)
Como se mencionó anteriormente, se especificara un nivel de significación de
= 5% 5%0,055, 1% 1%0,011 10%0,1
entre otros (estos son los más habituales)
definiendo de esta manera el valor critico que presentara nuestra prueba de hipótesis
Estimaremos el error estándar de la diferencia de las dos proporciones, esta será de mucha ayuda a la hora de calcular el estadístico Z.
− = √ ̅ + ̅
Donde
Los datos de cada una de las formulas provienen de
POBLACIÓN 1
̅
POBLACIÓN 2
̅
DEFINICIÓN Elementos de la muestra de cada población Proporción poblacional Proporción dela muestra escogida
Para calcular el estadístico Z para la media que sigue la distribución normal es:
= (1 2)12
Nota: En algunos ejercicios de este tipo de prueba generalmente no se conoce las proporciones poblaciones, en ese caso la diferencia en algunos ejemplos utilizaremos el estadístico Z
= 0
, por lo que
2) = (112 Donde a raíz del resultado obtenido de este Z calculado realizaremos el contraste para determinar si se rechaza o no la hipótesis nula y se acepta o no la alternativa.
EJEMPLOS EJEMPLO DOS COLA Un gerente preocupado por los accidentes laborales que se pueden presentar dentro de su compañía, realiza dos muestras de tamaño de 120 empleados, una en cada una de sus fábricas para d eterminar el porcentaje de accidentes de trabajo durante el primer semestre. En su primera fábrica encuestada arrojo que 12 empleados sufrieron de algún tipo de accidente, mientras que en la segunda se observaron 16. ¿Con un nivel de confianza del 5%, se podrá concluir que los accidentes de trabajo son iguales en cada una de las fábricas? Según lo anterior tenemos:
Fabrica A
Fabrica B
DEFINICION
120
120
Elementos muestra
̅ = 12012 = 0,1 ̅ = 12016 = 0,13 = 1̅ = 0,9 = 1̅ = 0,87 NO ESPECIFICADA
1.
2.
Proporción muestral y sus complementos
Proporción poblacional
:P = :P ≠ = 5%0,05 = 0.05 ∓ 8 7 − = √ ̅ + ̅ = √ 0.11200.9 + 0.130. 120 = 0,041
3. Como es para una cola, entonces el nivel de significancia que se tiene es
, el z para esta área según la tabla es de Z= 1,96,
4. Hallamos el erros estandar
5. Hallamos el z para comparar.
2) = (112 = 0,10,0 0410,13 = 0,0,04103 = 0,73
Como Z=-0,73 cae en la zona de aceptación, aceptamos la hipótesis nula de nuestro estudio por lo tanto:
Podemos concluir que la accidentalidad laboral presentada en las dos fábricas es igual, con un nivel de investigación del 5%,
EJEMPLO UNA COLA Dos grupos A y B de 100 personas cada uno tienen tuberculosis, por lo tanto se le desea aplicar un suero desarrollado para ver si existen diferencias significativa en este nuevo tratamiento. Un suero es dado en el grupo A pero
no al B. si encontramos en el grupo A que 70 personas se recuperaron de la enfermedad y en el B 55 personas , pruebe la hipotesis que el suero cura la enfermedad de la tuberculosis. Según lo anterior , tenemos los siguientes datos
Grupo A
Grupo B
DEFINICION
100
100
Elementos muestra
̅ = 10070 = 0,7 ̅ = 10055 = 0,55 = 1̅ = 0,3 = 1̅ = 0,45 NO ESPECIFICADA
Proporción muestral y sus complementos
Proporción poblacional
6.
7.
:P = :P > = 5%0,05 = 0.05 3 0 0. 5 50. 4 5 − = √ ̅ + ̅ = √ 0.700. + 100 100 = 0,068
8. Como es para una cola, entonces el nivel de significancia que se tiene es
, el z para esta área según la tabla es de Z= 1,64,
9. Hallamos el erros estandar
10. Hallamos el z para comparar.
2) = (112 = 0,70,0 0680,55 = 0,0,01685 = 2,20 Al nivel de investigación del 5%, podemos decir que existen diferencias significativas en el momento de la aplicación del suero al grupo A, por lo tanto podemos decir que en efecto el suero curo la enfermedad