Solucionarios de Bioestadística Dr. Ricardo Terukina Terukina ______________________ __________________________________ ______________________ _______________________ _________________________ _______________________ __________________ _______
SOLUCIONARIO DE LA PRÁCTICA Nº 09 PRUEBAS DE HIPÓTESIS PARA UNA MEDIA Y UNA PROPORCIÓN (Martes 15 de Noviembre del 2016)
Objetivos de la práctica: El alumno debe desarrollar el procedimiento de prueba de hipótesis para una media y una proporción. En todos los ejercicios se debe seguir los siguientes pasos de prueba de hipótesis: 1. Formulación de la hipótesis nula y alternativa 2. Nivel de significación significación 3. Selección de la prueba estadística (distribución de probabilidad a emplear) 4. Regla de decisión 5. Cálculo de la prueba 6. Decisión estadística (se rechaza rechaza o no la hipótesis nula) y conclusión Recordar que las situaciones de uso de pruebas de hipótesis para una proporción o una media no es muy usual en medicina, y si se emplean, suelen ser unilaterales. Por ello, todos los ejercicios corresponden a pruebas unilaterales, unilaterales, ya sea sea a la izquierda izquierda o a la derecha. derecha. En todos los ejercicios se supone que las variables variables de estudio siguen una distribución normal.
Ejercicio 1. Uno de los criterios para determinar la endemicidad de la infección por hepatitis B es la prevalencia de positividad (seroprevalencia) del HBsAg (antígeno de superficie). Así, prevalencias menores al 2% indican que una población presenta baja endemicidad. Se seleccionó una muestra aleatoria de 239 pobladores de una una región, detectando detectando entre ellos 3 casos casos positivos al al HBsAg. ¿Puede ¿Puede concluirse que que la región en estudio corresponde a una población de baja endemicidad para hepatitis B? Emplear un nivel de significancia de 0.05.
Datos: p = 3/239 = 0.01255 ≈ 0.0126 ó 1.26% 1.26% = 0.02 ó 2% n = 239 personas personas 0,05 Paso 1: Formulación de Hipótesis H0: ≥ 2% H1: < 2% Para formular las hipótesis se recomienda identificar la hipótesis de investigación y ésta se plantea como la hipótesis alterna; en este caso la hipótesis de investigación es determinar si la región en estudio corresponde a una población de baja endemicidad (Prevalencia menor al 2%). Por consiguiente, la hipótesis alterna sería: 7 La forma cómo se plantea la hipótesis alterna (H 1) es muy importante para determinar el tipo de o μ ≥ μ0 se trata de una prueba unilateral que trata el problema. Si la H1 se plantea como o μ ≤ μ0 se prueba de hipótesis unilateral a la l a derecha o mayor que y si se plantea como trata de una prueba de hipótesis unilateral a la izquierda o menor que.
< 2% ℎó ℎó í í:: ≥2%. ≥ ≤
Paso 2: Nivel de significación = 0.05 Paso 3: Selección de la prueba estadística: Prueba Z (prueba (prueba de hipótesis hipótesis para una proporción), proporción), unilateral a la izquierda (ya que la H1 es )
<2%
Página 1 de 6
Solucionarios de Bioestadística Dr. Ricardo Terukina Terukina _______________________________________________________________________________________
Paso 4: Regla de decisión: Para tomar la decisión de rechazar la hipótesis nula (H 0), debemos tomar en cuenta el tipo de prueba unilateral que trata el problema. Si se trata de una prueba unilateral a la derecha se rechaza la H 0 cuando el valor de Z calculado es mayor que el valor de Z tabular, y si se trata de una prueba unilateral a la izquierda se rechaza la H 0 cuando el valor de Z calculado es menor que el de Z tabular. En este caso, como se trata de una prueba unilateral a la izquierda, se rechaza la H 0: si Z calculado es menor que Z tabular (-1.645) Paso 5: Cálculo de la prueba:
= (0.0126)0.02 =0.822 = (1) 0.02(10.02) 239 Paso 6: Toma de decisión y conclusión Como la Zcalc (-0.822) es mayor que Ztab (-1.645), no se rechaza la H0 Se recomienda que además de expresar si se rechaza o acepta la hipótesis nula
se determine el
valor de la probabilidad Z. (valor de p) Como se trata de una prueba unilateral a la izquierda, para determinar el valor de p se consulta directamente la tabla de la distribución Z para Z ≤ -0.822 y se halla que p = 0.2061. También podemos consultar Excel para una prueba unilateral o de una cola a la izquierda (Función Estadística: DISTR. NORM. ESTAND.N) y hallamos que p = 0.20553845. La pequeña diferencia se debe a que en la tabla el valor de Z tiene 2 cifras decimales y en Excel hemos empleado tres cifras decimales. Conclusión: No podemos afirmar con un nivel de significación de 0.05 que la media poblacional corresponde a una población de baja endemicidad...
Ejercicio 2. Se considera que los valores séricos de triglicéridos mayores a 200 mg/dL determinan una hipertrigliceridemia, la cual se constituye en un factor de riesgo cardiovascular. Un grupo de 48 pacientes seleccionados al azar fue sometido a un análisis del perfil lipídico, encontrando una media de triglicéridos séricos de 220 mg/dL con una desviación estándar de 38 mg/dL. ¿Puede concluirse que la población en estudio corresponde a una población con una media de triglicéridos séricos en un nivel de hipertrigliceridemia? Emplear un nivel de significancia de 0.05. Como se trata de una prueba de hipótesis para una media, previamente debemos señalar los casos que se presentan y cuáles son las pruebas más adecuadas: A.
Prueba de hipótesis para una media poblacional conocida )
de poblaciones normales con varianza
Se dice que la varianza es conocida cuando se refiere a la varianza poblacional y ésta se conoce; se simboliza por
1. Cuando el tamaño de la muestra es grande (n ≥ 30 ) se utiliza la Prueba de distribución Z
Z
x
n
Donde
Z Estadístico Z x Media muestral Media poblacional 2 Varianza poblacional n Tamaño de la muestra
2. Cuando el tamaño de la muestra es pequeña (n < 30 ) se recomienda utilizar la Prueba de distribución t o de Student Página 2 de 6
Solucionarios de Bioestadística Dr. Ricardo Terukina Terukina _______________________________________________________________________________________
También se puede emplear cuando el tamaño de muestra es grande.
t
x
Donde
n
t Estadístico t x Media muestral Media poblacional 2 Varianza poblacional n Tamaño de la muestra
Grados de libertad = n - 1
B.
Prueba de hipótesis para una media poblacional desconocida (s2)
de poblaciones normales con varianza
Se dice que la varianza es desconocida cuando no se conoce la varianza poblacional y sólo se cuenta con la varianza de la muestra para estimarla (La varianza de la muestra se considera como una varianza desconocida, ya que es una varianza estimada). La prueba más adecuada es la prueba de la distribución t o de student t
x s n
Donde
t Estadístico t x Media muestral Media poblacional s 2 Varianza de la muestra n Tamaño de la muestra
Grados de libertad = n - 1 Cuando el tamaño de la muestra es grande (n ≥ 30 ) la estimación de la varianza (o desviación estándar) es confiable y se maneja como si fuera una varianza conocida . Caso A-1. Conocido las pruebas de hipótesis más adecuadas para una media, pasemos a la solución de los ejercicios. Datos: x
s n µ α
= = = = =
220 mg/dL 38 mg/dL 48 pacientes 200 mg/dL 0.05 o 5%.
Paso 1: Formulación de Hipótesis H0: ≤ 200 mg/dL H1: > 200 mg/dL Para plantear las hipótesis correspondientes, hay que analizar qué se quiere demostrar. Lo que se quiere demostrar es que la población en estudio corresponde a una población con una media de triglicéridos séricos en un nivel de hipertrigliceridemia (Triglicéridos mayores de 200 mg/dL); es decir, la hipótesis alterna sería: mg/dL.
> 200 mg/dL y por consiguiente, la hipótesis nula sería ≤ 200
Paso 2: Nivel de significación = 0.05 Paso 3: Selección de la prueba estadística: Página 3 de 6
Solucionarios de Bioestadística Dr. Ricardo Terukina Terukina _______________________________________________________________________________________
Prueba Z (prueba de hipótesis para una media, donde se desconoce la varianza poblacional y la muestra es grande) para una prueba unilateral a la derecha porque la H 1: > 200 mg/dL . Paso 4: Regla de decisión: Rechazar H0: si Z calculado es mayor que Z tabular (1.645) Paso 5: Cálculo de la prueba:
= /̅−√ = − /√ =3.646
Paso 6: Toma de decisión y conclusión Como se trata de una prueba unilateral a la derecha, se rechaza H 0 cuando Zcalc > Ztabular; por lo tanto se rechaza la H0 (p = 0.00051797) Conclusión: Con un nivel de significación de 0.05 podemos afirmar que la población presenta una media de triglicéridos en un nivel de hipertrigliceridemia.
Ejercicio 3. La distribución poblacional de los valores del retinol sérico y la prevalencia de individuos con valores inferiores a un punto de corte determinado reflejan la intensidad de la avitaminosis A como problema de salud pública. Así, la OMS plantea que si la prevalencia de concentración baja de retinol sérico (0,70 μmol/L o menos) es superior al 20% en niños entre 6 meses y cinco años, se considera un problema de salud pública intenso. En una investigación se seleccionó una muestra aleatoria de 158 niños entre 6 meses y cinco años, resultando que 35 de ellos presentaban concentraciones séricas de retinol ≤ 0,70 μmol/L. ¿Puede concluirse que la población en estudio corresponde a una población con un problema intenso de avitaminosis A? Emplear un nivel de significancia de 0.05.
Datos: p = 35/158 = 0.221518 ≈ 0.2215 ó 22.15% = 0.20 ó 20% n = 158 niños entre 6 meses y 5 años. 0,05 Paso 1: Formulación de Hipótesis H0: ≤ 0.20 o 20% H1: > 0.20 o 20% Se quiere investigar si la población en estudio corresponde a una población con un problema intenso de avitaminosis A (Superior a 20%); es decir, la hipótesis alterna sería: > 20% y por consiguiente, la hipótesis nula sería ≤ 20%. Paso 2: Nivel de significación = 0.05 Paso 3: Selección de la prueba estadística: Prueba Z (prueba de hipótesis para una proporción) para una prueba unilateral a la derecha. Paso 4: Regla de decisión: Rechazar H0: si Z calculado es mayor que Z tabular (1.645) Paso 5: Cálculo de la prueba:
Página 4 de 6
Solucionarios de Bioestadística Dr. Ricardo Terukina Terukina _______________________________________________________________________________________
= (0 .2215)0.20 =0.676 = (1) 0.20(10.20) 157 Paso 6: Toma de decisión y conclusión Se rechaza H0 cuando Zcalc > Ztabular; por lo tanto, no se rechaza la H0 (p = 0.31745267) Conclusión: Con un nivel de significación de 0.05 no podemos afirmar que la población corresponde a una con problema intenso de avitaminosis A.
Ejercicio 4. El índice de masa corporal (IMC) se obtiene por el cociente del peso de una persona (en kilogramos) entre el cuadrado de su talla (en metros). Así, un IMC superior o igual a 30 es considerado como obesidad. Una muestra de 25 pobladores, seleccionada al azar, fue pesada y tallada, obteniendo una media de IMC de 27 kg/m2 y una desviación estándar de 3.3 kg/m. ¿Puede concluirse que la población en estudio corresponde a una población con una media de IMC en un rango de obesidad? Emplear un nivel de significancia de 0.05. Datos: x
s n µ α
= 27 kg/m2 = 3.3 kg/m2 = 25 personas = 30 kg/m2 = 0.05 o 5%.
Paso 1: Formulación de Hipótesis H0: ≥ 30 kg/m2 H1: < 30 kg/m2 Se quiere averiguar si la población de estudio corresponde a una población con una media de IMC en un rango de obesidad ( superior o igual a 30); es decir , la hipótesis de investigación sería ≥ 30; en este caso, a pesar de ser la hipótesis de investigación vanos a tener que plantearla como hipótesis nula ya que tiene el símbolo de enlace ≥ y la hipótesis alterna sería < 30. Paso 2: Nivel de significación = 0.05 Paso 3: Selección de la prueba estadística: Prueba t (prueba de hipótesis para una media, donde se desconoce la varianza poblacional y la muestra es pequeña) para una prueba unilateral a la izquierda Paso 4: Regla de decisión: Como se3 trata de una prueba unilateral a la izquierda, se rechaza la H0: si t calculado es menor que t tabular (-1.7109 para 24 grados de libertad) Paso 5: Cálculo de la prueba:
= ̅/√ = 3.2730 3/√ 25 =4.545
Paso 6: Toma de decisión y conclusión Como tcalc (-4.5435) es menor que t tab (-1.71) se rechaza la H 0 y se acepta la H 1 que nos dice que 2 < 30 kg/m ; por consiguiente no corresponde a una población en rango de obesidad. Como ya hemos mencionado anteriormente, se recomienda determinar el valor de la probabilidad (p). Consultando Excel se halla que p = 0.0000660429. Página 5 de 6
Solucionarios de Bioestadística Dr. Ricardo Terukina Terukina _______________________________________________________________________________________
Conclusión: Con un nivel de significación de 0.05 podemos afirmar que la población no presenta una media de IMC en el rango de obesidad. Otra alternativa: Vamos a plantear las hipótesis en otra forma. Paso 1: Formulación de Hipótesis H0: < 30 kg/m2 H1: ≥ 30 kg/m2 Ahora hemos planteado como hipótesis alterna que H1: nula sería < 30 kg/m2
≥ 30 kg/m2 y por consiguiente la hipótesis
Paso 2: Nivel de significación = 0.05 Paso 3: Selección de la prueba estadística: Prueba t (prueba de hipótesis para una media, donde se desconoce la varianza poblacional y la muestra es pequeña), pero esta vez sería una prueba unilateral a la derecha Paso 4: Regla de decisión: Rechazar H0 si t calculado es mayor que t tabular (1.7109 para 24 grados de libertad) Paso 5: Cálculo de la prueba:
= ̅/√ = 3.2730 3/√ 25 =4.545
Paso 6: Toma de decisión y conclusión Como tcalc (-4.5435) es menor que t tab (1.71) NOSE RECHAZA LA H0.y ésta nos expresa que 30 kg/m2 ; por consiguiente, la media del IMC no se halla dentro del rango de obesidad. Como ya hemos mencionado anteriormente, se recomienda determinar el valor de la probabilidad (p). Consultando Excel se halla que p = 0,999933957 <
. Conclusión: Con un nivel de significación de 0.05 podemos afirmar que la población no presenta una media de IMC en el rango de obesidad. Al cambiarse la hipótesis alterna (y por consiguiente la hipótesis nula) también cambió el resultado de la prueba de significación estadística; en lugar de rechazar la hipótesis se acepta, pero en este caso no se rechaza la hipótesis nula de que la media es menor de 30 y por consiguiente no se halla dentro del rango de obesidad.
Revisado Dr. R. Terukina 4-11-2017 Página 6 de 6