PRUEBA DE HIPÓTESIS Diferencia de medias o proporciones proporciones Métodos Cuantitativos Avanzados Avanzados Nincen Figueroa Carrera de Ciencia Política Universidad Diego Portales
[email protected]
2015
PRUEBA DE HIPÓTESIS: MUESTRA PAREADAS O MUESTRAS INDEPENDIENTES
El cálculo de intervalo de confianza y el procedimiento de prueba de hipótesis visto vis to en los cap capítu ítulos los ant anteri erior ores es re refie fiere renn a cá cálcu lculo loss que im impl plica icann una sol solaa muestra, que permiten hacer inferencia inferencia acerca de un parámetro poblacional.
Sin embargo, cuando realizamos realizamos inferencia estadística existen existen muchas situaciones situaciones en que nec neces esitam itamos os com compara pararr do doss co conju njunto ntoss de dat datos os mue muestra strales les.. En es esee sentido, podemos considerar considerar dos casos: casos: 1.
Muestras Muest ras pareadas pareadas (empa (emparej rejados) ados) o depen dependien dientes. tes. Los datos se obtienes de la
misma fuente, es decir, decir, las muestras están relacionadas relacionadas entre ellas. 2.
Muestras Independientes. Independientes. Los datos provienen de distintas fuentes o diferentes
grupos,en grupos, en otras palabras, las muestras muestras NO están relacionadas relacionadas entre entre sí.
PRUEBA DE HIPÓTESIS DIFERENCIA DE MEDIAS PARA MUESTRAS PAREADAS Bibliografía para esta sesión: • • • •
Weiss, N.A. (2011). Elementary Statistics (8th ed.). Pearson. Blalock, H. M. (1978). Estadística social. México: Fondo de Cultura Económica. Johnson, R., & Romo Muñoz, J. H. (2008). Estadística elemental: lo esencial. México: Cengage Learning. Triola, M., Pineda Ayala, L. E., & Hernández Ramírez, R. (2009). Estadística. Naucalpán de Juárez: Pearson Educación.
PRUEBA DE HIPÓTESIS: DIFERENCIA DE MEDIAS PARA MUESTRA PAREADAS
Cuando nos referimos a muestras pareadas es porque entre ellas existe alguna relación para que cada valor en una muestra se aparee con un valor correspondiente en la otra muestra.
Por ejemplo:
Promedio de notas de evaluación a Sebastián Piñera y Michelle Bachelet Evaluación sobre la confianza en diferentes instituciones Notas de un curso inicial y luego notas después de haber aplicado un programa especial de enseñanza.
Al momento de trabajar con muestras pareadas deberemos utilizar estadístiscos de prueba (puntaje z o t) que consideren la diferencia entre ambas mediciones (por ej. Medición de Piñera y Bachelet)
PRUEBA DE HIPÓTESIS: DIFERENCIA DE MEDIAS PARA MUESTRA PAREADAS
La diferencia entre ambas mediciones estará dada por:
d
x
i1
xi 2
En este caso, el promedio de las diferencias entre ambas mediciones está dada por: xi1 xi 2 d n Y la desviación estándar se encuentra determinada por la fórmula:
sd
(d d ) i
n 1
d 2 d n sd n 1 2
PRUEBA DE HIPÓTESIS: DIFERENCIA DE MEDIAS PARA MUESTRA PAREADAS
Considerando el promedio y la desviación estándar de la diferencia entre ambas mediciones, es posible calcular los estadísticos de prueba dependiendo del tamaño muestral: Si nuestra muestra es mayor que 30 casos
z
d d d
n
Si nuestra muestra es menor que 30 casos
d d t sd n
PRUEBA DE HIPÓTESIS: DIFERENCIA DE MEDIAS PARA MUESTRA PAREADAS
Pudiendo calcular un estadístico de pruebas basado en el promedio de las diferencias de las medias, la prueba de hipótesis sigue los mismos pasos que una prueba de hipótesis para una muestra: 1. 2. 3. 4. 5.
Planteamiento de hipótesis Calcular el valor de tabla en base al nivel de significación α Dibujar regiones de aceptación y rechazo Cálculo de estadístico de prueba Decidir y concluir respecto de la prueba de hipótesis
PRUEBA DE HIPÓTESIS: DIFERENCIA DE MEDIAS PARA MUESTRA PAREADAS
Para el caso de diferencia de media para muestras pareadas, las hipótesis pueden formularse igualmente de manera bilateral o unilateral, siguiendo la forma: H0: µd = 0 valor de la hipótesis nula o valor “teórico” H1: µd ≠ 0 Bilateral µd >0 Unilateral (derecha) µd < 0 Unilateral (izquierda)
Recuerde que H0: µd = 0, por lo tanto este será el valor que se utilice al calcular el estadístico. Se prueba si las diferencias son aleatorias u obedecen a un cambio real en la población.
PRUEBA DE HIPÓTESIS: DIFERENCIA DE MEDIAS PARA MUESTRA PAREADAS . E JEMPLO.
Un balneario de aguas curativas anuncia un programa de reducción de peso y afirma que el participante promedio pierde más de 6 kilos. En la siguiente tabla se muestra elresultado en 10 personas, cuál sería su decisión con nivel de significación del 1% Sujeto Nº 1 2 3 4 5 6 7 8 9 10
Antes 85,9 91,8 100 94,1 88,2 80,4 87,7 91,8 94,5 105,9
Después 77,2 86,4 96,8 87,3 81,8 73,2 79,0 85 84,5 92,7
1. Planteamiento de hipótesis
H0: µd = 6 H1: µd >6
PRUEBA DE HIPÓTESIS: DIFERENCIA DE MEDIAS PARA MUESTRA PAREADAS . E JEMPLO. 2. Calcular el valor de tabla en base al nivel de significación α
t 1 (n 1) t 10.01 (10 1) t 0.99 (9) 2,821 3. Dibujar regiones de aceptación y rechazo
2,821
PRUEBA DE HIPÓTESIS: DIFERENCIA DE MEDIAS PARA MUESTRA PAREADAS . E JEMPLO. 4.
1 2 3 4 5 6 7 8 9 10
Cálculo de estadístico de prueba Antes Después 85,9 77,2 91,8 86,4 100 96,8 94,1 87,3 88,2 81,8 80,4 73,2 87,7 79 91,8 85 94,5 84,5 105,9 92,7 Suma
d 8,7 5,4 3,2 6,8 6,4 7,2 8,7 6,8 10 13,2 76,4
d2 75,69 29,16 10,24 46,24 40,96 51,84 75,69 46,24 100 174,24 650,3
d
76,4 10
7,64
Sd 7,4 2,72 d 0 7,64 6 1,64 1,9 t 2,72 S d 0,86 10 n
PRUEBA DE HIPÓTESIS: DIFERENCIA DE MEDIAS PARA MUESTRA PAREADAS . E JEMPLO. 5.
Decisión y conclusión acerca de la hipótesis nula Como el valor calculado t=1.9 no pertenece al área de rechazo, entonces con un nivel de confianza del 90% no es posible rechazar la hipótesis nula, por lo que no es posible concluir que la pérdida de peso después del programa es superior a 6 kg. Caso contrario, si el t calculado (o el valor del estadístico de prueba) hubiera caído en el área de rechazo, rechazo la hipótesis nula en favor de la alternativa.
1,9
2,821
PRUEBA DE HIPÓTESIS DIFERENCIA DE MEDIAS PARA MUESTRAS INDEPENDIENTES Bibliografía para esta sesión: • • • •
Weiss, N.A. (2011). Elementary Statistics (8th ed.). Pearson. Blalock, H. M. (1978). Estadística social. México: Fondo de Cultura Económica. Johnson, R., & Romo Muñoz, J. H. (2008). Estadística elemental: lo esencial. México: Cengage Learning. Triola, M., Pineda Ayala, L. E., & Hernández Ramírez, R. (2009). Estadística. Naucalpán de Juárez: Pearson Educación.
PRUEBA DE HIPÓTESIS: DIFERENCIA DE MEDIAS PARA MUESTRA INDEPENDIENTES
Dos muestras son independientes cuando los valores muestrales seleccionados de una población no están relacionados, emparejados o asociados con los valores muestrales de la otra población.
Promedio de notas de evaluación a Sebastián Piñera según sexo de la persona encuestada Evaluación sobre la confianza en diferentes instituciones según pertenencia o no la región Metropolitana. Notas de un curso inicial y luego notas después de haber aplicado un programa especial de enseñanza, según si asistió o no más del 80% a las clases.
Cuando hacemos esto, por lo general pensamos que un grupo tiene un comportamiento diferente que el otro. Lo que nos interesará es la diferencia en el promedio entre ambos grupos respecto de una determinada característica. x x 1 2 1
2
Por lo tanto, la hipótesis nula que usaremos es que los dos grupos tiene en el mismo comportamiento, es decir, la diferencia entre ellos es cero:
H 0 : 1 2
H 0 : H 1 2 0
PRUEBA DE HIPÓTESIS: DIFERENCIA DE MEDIAS PARA MUESTRA INDEPENDIENTES
Las hipótesis alternativas en el caso de la diferencia de medias para muestras independientes pueden tener tres formas, las cuales son: H 0 : 1
2
0
H a : 1
2
0
1
2
1
2
0
1
2
1
2
0
1
2
Al igual que en casos anteriores, la prueba de hipótesis para diferencia de medias en muestras independientes será distinto dependiendo si conocemos o no la varianza.
PRUEBA DE HIPÓTESIS: DIFERENCIA DE MEDIAS PARA MUESTRA INDEPENDIENTES
Si las muestras son independientes, elegidas aleatoriamente y con varianzas conocidas, podemos suponer que la diferencia de medias tiene una distribución normal. La fórmula de desviación estándar para esta distribución está determinada por: 2
x
x 2
1
n1
2
2
n2
En este caso, el estadístico de prueba (puntaje z) estará determinado por: z
1
( x1 x1 ) ( 1 2 )
12 22 n1 n2
Calculando el estadístico de prueba, el procedimiento para la prueba de hipótesis se realiza siguiendo las etapas ya señaladas anteriormente.
PRUEBA DE HIPÓTESIS: DIFERENCIA DE MEDIAS PARA MUESTRA INDEPENDIENTES
Si no conocemos la varianza, al igual que en casos anteriores, el estadístico de prueba a utilizar será el asociado a la distribución t-de Student. En este caso, nos encontraremos frente a dos posibles situaciones respecto de las varianzas de los grupos:
Ambas poblaciones tienen varianzas iguales Ambas poblaciones tienen varianzas distintas
Para determinar en cual de los dos escenarios nos encontramos, deberemos realizar una prueba de inferencia respecto a la varianza utilizando el estadístico F de Snedecor/Fisher antes de realizar nuestra prueba de hipótesis de las diferencia de medias.
PRUEBA DE HIPÓTESIS: DIFERENCIA DE MEDIAS PARA MUESTRA INDEPENDIENTES
La inferencia respecto a la varianza para dos muestras independientes se basa en la utilización de la distribución F de Snedecor, cuyas características son: No tiene valores negativos, por lo que F es igual a 0 o positiva Es asimétrica y se encuentra sesgada hacia la derecha Existen muchas distribuciones F diferentes, la que será diferente para cada par de grados de libertad
gl n n1 1 gl d n2 1 t ( gl , ) Unilateral
t ( gl ,
2
) Bilateral
PRUEBA DE HIPÓTESIS: DIFERENCIA DE MEDIAS PARA MUESTRA INDEPENDIENTES
Las hipótesis a plantear respecto a las varianzas buscarán dar cuenta si estas son iguales o distintas, por lo que tendrán la forma: 2
H 0 : H a :
1
2
1
1
1
1
2
1 2
2
22
2
22
El estadístico de prueba se encuentra representado por la fórmula:
F
S 12 S 22
PRUEBA DE HIPÓTESIS: DIFERENCIA DE MEDIAS PARA MUESTRA INDEPENDIENTES
Dependiendo si rechazamos o no nuestra hipótesis nula debemos calcular el estadístico de prueba de distintas formas: 2
2
iguales
gl n1 n2 2 t
gl:Valor más pequeño entre n 1 – 1 y n2 - 1
( x1 x2 )
1
s p
n1
s p
distintas
1
n2
(n1 1) s (n2 1) s 2 1
n1 n2 2
t
( x1 x2 ) 2
s1 2 2
n1
2
s2
n2
PRUEBA DE HIPÓTESIS DIFERENCIA DE PROPORCIONES PARA MUESTRAS INDEPENDIENTES Bibliografía para esta sesión: • • • •
Weiss, N.A. (2011). Elementary Statistics (8th ed.). Pearson. Blalock, H. M. (1978). Estadística social. México: Fondo de Cultura Económica. Johnson, R., & Romo Muñoz, J. H. (2008). Estadística elemental: lo esencial. México: Cengage Learning. Triola, M., Pineda Ayala, L. E., & Hernández Ramírez, R. (2009). Estadística. Naucalpán de Juárez: Pearson Educación.
PRUEBA DE HIPÓTESIS: DIFERENCIA DE PROPORCIONES PARA MUESTRA INDEPENDIENTES
En el caso de diferencia de proporciones para muestras independientes, debemos utilizar el estadístico de prueba z determinado por: p1 p2 z p1q1 p2 q2 ˆ
ˆ
ˆ
ˆ
ˆ
n1
ˆ
n2
Las hipótesis a plantear, adquirirán la forma:
H 0 : p1 p2 0
p1 p2
H a : p1 p2 0
p1 p2
p1 p2 0
p1 p2
p1 p2 0
p1 p2