www.elsolucionario.net Capítulo 8
412
Prueba de hipótesis
48. Cálculo del tamaño de de muestra para lograr lograr potencia Un grupo de investigadores
planean realizar una prueba a un método para la selección del género, y piensan usar la hipótesis alternativa de H 1: p 7 0.5 y un nivel de significancia de a = 0.05. Calcule el tamaño de muestra que se requiere para lograr una potencia de al menos el 80% que permita detectar un aumento en p de 0.5 a 0.55. ( Este ejercicio es muy difícil. Sugerencia: Consulte el ejercicio 47).
8-3
Prueba de una afirmación respecto de una proporción
Concepto clave En la sección 8-2 se presentaron los componentes individuales de una prueba de hipótesis. En esta sección se describen procedimientos completos para someter a prueba una hipótesis (o afirmación) respecto de una proporción poblacional. Se ilustra la prueba de hipótesis con el método del valor P , el método tradicional y el uso de intervalos de confianza. Además de someter a prueba afirmaciones respecto de proporciones poblacionales, podemos utilizar los mismos procedimientos para someter a prueba afirmaciones sobre probabilidades o equivalentes decimales de porcentajes. Los siguientes son ejemplos de los tipos de afirmaciones que podremos someter a prueba: • Genética: El Genetics & IVF Institute afirma que con su método XSORT las parejas incrementan la probabilidad de tener una niña, de manera que la proporción de niñas con este método es mayor que 0.5. • Medicina: Las mujeres embarazadas pueden conjeturar de forma correcta el sexo de
su bebé, de manera que están en lo correcto más del 50% de las veces. • Entretenimiento: Del número de televisores que estaban encendidos
durante un
reciente Súper Bowl, el 64% estaba sintonizando el juego. Dos métodos comunes para someter a prueba una afirmación sobre una proporción poblacional son: 1. utilizar una distribución normal como aproximación de la distribución binomial y 2. utilizar un método exacto basado en la distribución de probabilidad binomial. En la parte 1 de esta sección se utiliza el método de la aproximación con la distribución normal, y en la parte 2 se describe brevemente el método exacto.
Parte 1: Métodos básicos para la prueba de afirmaciones acerca de una proporción poblacional p El siguiente recuadro incluye los elementos básicos que se usan para someter a prueba una afirmación acerca de una proporción poblacional.
Requisitos Objetivo Someter a prueba una afirmación acerca de una proporción poblacional utilizando un método formal para la prueba de hipótesis. Notación
n = tamaño de muestra o número de ensayos p N N
=
x (proporción muestral ) n
p = proporción de la población (basada en la afirmación, p es el valor que se usa en la hipótesis nula) q = = 1 - p
www.elsolucionario.net 8-3 Prueba de una afirmación respecto de una proporción
413
Requisitos 1. 2.
Las observaciones muestrales son una muestra aleatoria simple. Se satisfacen las condiciones para una distribución binomial . (Existe un número fijo de ensayos independientes con probabilidades constantes, y cada ensayo tiene dos categorías de resultados: “éxito” y “fracaso”).
3.
Se satisfacen las condiciones np Ú 5 y nq Ú 5 por lo tanto, la distribución binomial de proporciones muestrales puede aproximarse mediante una distribución normal, con M = np y S 1 npq (como se describió en la sección 6-6). Observe que p es la proporción supuesta que se utiliza en la afirmación y no la proporción muestral.
Estadístico de prueba para probar una afirmación acerca de una proporción
z =
p N
p pq n
-
A
Valores P:
Utilice la distribución normal estándar (tabla A-2) y remítase a la figura 8-5. Valores críticos: Utilice la distribución normal estándar (tabla A-2).
ADVERTENCIA
Recordatorio: Evite confundir un valor P con una proporción p. Valor P = probabilidad de obtener un estadístico de prueba al menos tan extremo como el que representa a los datos muestrales, en tanto que p = proporción poblacional.
La prueba estadística anterior no incluye una corrección por continuidad (como se describió en la sección 6-6), ya que su efecto tiende a ser muy pequeño con muestras grandes.
1
Prueba de la eficacia del método MicroSort para la selección del género En el problema del capítulo se describieron los siguientes resultados de ensayos del método XSORT para la selección del género, creado por el Genetics & IVF Institute: de 726 bebés de parejas que utilizaron el método XSORT con la intención de tener una niña, 668 fueron niñas y el resto fueron varones. Utilice esos resultados, con un nivel de significancia de 0.05, para someter a prueba la afirmación de que, de los bebés nacidos de parejas que utilizaron el método XSORT, la proporción de niñas es mayor que el valor de 0.5, que es el esperado sin tratamiento. El siguiente es un resumen de la afirmación y de los datos muestrales: Afirmación: Con el método XSORT, la proporción de niñas es mayor que 0.5. Es decir, p 7 0.5. 668 Datos muestrales: n = 726 y p = = 0.920 726 Antes de iniciar la prueba de hipótesis, verifique si se cumplen los requisitos necesarios. N
VERIFICACIÓN DE REQUISITOS Primero verificamos los tres requisitos. 1. No es probable que los sujetos del ensayo clínico constituyan una muestra aleatoria simple, pero en este caso el sesgo no es un gran problema, ya que una pareja que desea tener una niña no puede incidir sobre el sexo de su bebé sin el uso de un tratamiento eficaz. Las parejas voluntarias son autoseleccionadas, pero ello no afecta el resultado en esta situación. continúa
www.elsolucionario.net 414
Capítulo 8
Prueba de hipótesis
2.
Hay un número fijo (726) de ensayos independientes con dos categorías (el bebé es niño o niña).
3.
Los requisitos np Ú 5 y nq Ú 5 se satisfacen con n = 726, p = 0.5 y q = 0.5. [Obtenemos np = (726)(0.5) = 363 Ú 5 y nq = (726)(0.5) = 363 Ú 5].
Los tres requisitos se satisfacen.
El método del valor
P En la figura 8-8, de la página 406, se describen los pasos correspondientes al método del valor P . Al seguir los pasos de esa figura, podemos someter a prueba la afirmación del ejemplo 1, como sigue: Paso 1. La afirmación original en forma simbólica es p 7 0.5. Paso 2. El opuesto de la afirmación original es p … 0.5. Paso 3. De las dos expresiones simbólicas anteriores, la expresión p 7 0.5 no contiene igualdad, por lo que se convierte en la hipótesis alternativa. La hipótesis nula es la afirmación de que p iguala el valor fijo de 0.5. Por consiguiente, podemos expresar H 0 y H 1 de la siguiente manera:
H 0: p H 1: p Paso 4.
Paso 5.
= 7
0.5 0.5
Seleccionamos a = 0.05, para el nivel de significancia, que es una opción muy común. En virtud de que estamos sometiendo a prueba una afirmación acerca de una proporción poblacional p, el estadístico de prueba p es relevante, y en este caso podemos aproximar la distribución muestral de las proporciones muestrales p por medio de una distribución normal. El estadístico de prueba es z = 22.63, que se calcula de la siguiente manera: N
N
Paso 6.
Paso 7.
Paso 8.
p
p pq n
-
0.920 - 0.5 = 22.63 (0.5) (0.5) 726 Ahora obtenemos el valor P utilizando el siguiente procedimiento, que se muestra en la figura 8-5: Prueba de cola izquierda: Valor P = área a la izquierda del estadístico de prueba z Prueba de cola derecha: Valor P = área a la derecha del estadístico de prueba z Prueba de dos colas: Valor P = dos veces el área de la región extrema limitada por el estadístico de prueba z Puesto que la prueba de hipótesis que estamos realizando es de cola derecha, con un estadístico de prueba z = 22.63, el valor P es el área a la derecha de z = 22.63. Si nos remitimos a la tabla A-2, observamos que para los valores de z = 3.50 y mayores, utilizamos 0.0001 para el área acumulada a la derecha del estadístico de prueba. Por lo tanto, el valor P es 0.0001. (Con las herramientas tecnológicas, el valor P resulta mucho más cercano a 0). La figura 8-10 muestra el estadístico de prueba y el valor P para este ejemplo. Puesto que el valor P de 0.0001 es menor que o igual al nivel de significancia a = 0.05, rechazamos la hipótesis nula. Concluimos que existe suficiente evidencia muestral para sustentar la afirmación de que, de los bebés nacidos de parejas que utilizaron el método XSORT, la proporción de niñas es mayor que 0.5. (Consulte la figura 8-7 para ayudarse a redactar esta conclusión final). Parece que el método XSORT es eficaz.
z =
N
A
=
A
www.elsolucionario.net 8-3 Prueba de una afirmación respecto de una proporción
Valor P 0.0001
p 0 5 . o z 0
p 0.920 o z 22 . 63 Estadístico de prueba
Figura 8-10
Método del valor
Figura 8-11
P
Método tradicional
El método tradicional El método tradicional de prueba de hipótesis se resume en la figura 8-9. Si utilizamos el método tradicional con la afirmación enunciada en el ejemplo 1, los pasos 1 al 5 son iguales a los pasos 1 al 5 del método del valor P , como se vio antes. Así que continuamos con el paso 6 del método tradicional. Paso 6. El estadístico de prueba es z = 22.63, como vimos con el método del valor P . En el método tradicional, ahora calculamos el valor crítico (en vez del valor P ). Se trata de una prueba de cola derecha, de manera que el área de la región crítica es un área de a = 0.05 en la cola derecha. Si nos remitimos a la tabla A-2 y aplicamos los métodos de la sección 6-2, obtenemos que el valor crítico de z = 1.645 se encuentra en el límite de la región crítica. Observe la figura 8-11. Paso 7. Como el estadístico de prueba se localiza dentro de la región crítica, rechazamos la hipótesis nula. Paso 8. Concluimos que existe suficiente evidencia muestral para sustentar la afirmación de que, entre los bebés de parejas que utilizan el método XSORT, la proporción de niñas es mayor que 0.5, por lo que parece que el método XSORT es eficaz.
Método del intervalo de confianza La afirmación de p 7 0.5 puede someterse a prueba con un nivel de significancia de 0.05, construyendo un intervalo de confianza del 90% (como se observa en la tabla 8-2, de la página 406). (En general, para las pruebas de hipótesis de dos colas , construya un intervalo de confianza con un nivel de confianza correspondiente al nivel de significancia, pero para las pruebas de hipótesis de una cola , utilice un nivel de confianza correspondiente al doble del nivel de significancia, como se observa en la tabla 8-2). La estimación del intervalo de confianza del 90% de la proporción poblacional p se calcula utilizando los datos muestrales n = 726 y p = 668> 726 = 0.920. Si usamos los métodos de la sección 7-2, obtenemos: 0.904 6 p 6 0.937. Todo el intervalo está por arriba de 0.5. Como tenemos una confianza del 90% de que el valor verdadero de p está contenido dentro de los límites de 0.904 y 0.937, tenemos evidencia suficiente para sustentar la afirmación de que p 7 0.5. Por lo tanto, llegamos a la misma conclusión con el método del valor P y con el método tradicional. N
ADVERTENCIA
Cuando se someten a prueba afirmaciones acerca de una proporción poblacional, el método tradicional y el método del valor P son equivalentes en el sentido de que siempre dan los mismos resultados, pero el método del intervalo de confianza no es equivalente a los anteriores y en ocasiones puede llevar a conclusiones diferentes. (Tanto el método tradicional como el método del valor P utilizan la misma desviación estándar basada en la proporción establecida p, pero el intervalo de confianza emplea una desviación estándar estimada con base en la proporción muestral p). He aquí una buena estrategia: utilice un intervalo de confianza para estimar una proporción poblacional, pero utilice el método del valor P o el método tradicional para someter a prueba una afirmación acerca de una proporción. N
415
www.elsolucionario.net 416
Capítulo 8
Gane $1,000,000 por sus poderes sobrenaturales El mago James Randi instituyó una fundación educativa que ofrece un premio de $1 millón a quien pueda demostrar poderes paranormales, sobrenaturales u ocultos. Cualquiera que posea un poder como el de adivinar e l futuro, capacidad de percepción extrasensorial (PES) o la habilidad para comunicarse con los muertos puede ganar el premio si pasa ciertos procedimientos de prueba. Primero se realiza una prueba preliminar y después una formal, pero hasta ahora nadie ha salido con éxito de la prueba preliminar. La prueba formal se diseñaría con métodos estadísticos sólidos, y probablemente incluiría un análisis con una prueba de hipótesis formal. Según la fundación, se consulta a “especialistas competentes en estadística cuando se necesita evaluar los resultados o diseñar experimentos”.
Prueba de hipótesis
Cálculo del número de éxitos x Los programas de cómputo y las calculadoras diseñadas para realizar pruebas de hipótesis de proporciones generalmente requieren datos que consisten en el tamaño de muestra n y el número de éxitos x , aunque a menudo se da la proporción muestral en vez de x . El número de éxitos x se obtiene como se ilustra en el ejemplo 2. Observe que x se debe redondear al entero más cercano. 2
Cálculo del número de éxitos x Un estudio examinó el tema de si las mujeres embarazadas pueden conjeturar de manera correcta el sexo de su bebé. De 104 mujeres reclutadas, el 55% conjeturó de manera correcta el sexo del bebé (según datos de “Are Women Carrying ‘Basketballs’ Really Having Boys? Testing Pregnancy Folklore”, de Perry, DiPietro y Constigan, Birth, vol. 26, núm 3). De las 104 mujeres, ¿cuántas hicieron conjeturas correctas?
El número de mujeres que hicieron conjeturas correctas es el 55% de 104, o 0.55 * 104 = 57.2. El producto de 0.55 * 104 es 57.2, pero el número de mujeres que hicieron conjeturas correctas debe ser un número entero, de manera que redondeamos el producto al número entero más cercano de 57. Aunque un informe de los medios de comunicación acerca de este estudio mencionó que se trataba de un “55%”, el porcentaje más exacto del 54.8% se obtuvo utilizando el número real de conjeturas correctas (57) y el tamaño de muestra (104). Al realizar una prueba de hipótesis, se pueden obtener mejores resultados utilizando la proporción muestral de 0.548 (en vez de 0.55).
3
¿Puede una mujer embarazada predecir el sexo de su hijo? En el ejemplo 2 nos referimos a un estudio en el que 57 de 104 mujeres embarazadas conjeturaron de manera correcta el sexo de sus hijos. Utilice los mismos datos muestrales para someter a prueba la afirmación de que la tasa de éxito de ese tipo de conjeturas no difiere de la tasa del 50% de éxitos que se esperaría por el azar. Utilice un nivel de significancia de 0.05.
VERIFICACIÓN DE REQUISITOS 1. Puesto que se reclutó a los sujetos, y considerando las demás condiciones descritas en el estudio, es razonable considerar que se trata de una muestra aleatoria simple. 2. Existe un número fijo (104) de ensayos independientes con dos categorías (la madre conjetura de forma correcta o no el sexo de su bebé). 3. Los requisitos de np Ú 5 y nq Ú 5 se satisfacen con n = 104, p = 0.5 y q = 0.5. Obtenemos np = (104)(0.5) = 52 Ú 5 y nq = (104)(0.5) = 52 Ú 5. Los tres requisitos se cumplen. Procedemos a realizar la prueba de hipótesis utilizando el método del valor P que se resume en la figura 8-8. Paso 1: La afirmación original es que la tasa de éxito no es diferente del 50%, y esto se expresa en forma simbólica como p = 0.50.
Paso 2: Lo contrario a la afirmación original es p Z 0.50. Paso 3: Como p Z 0.50 no contiene la igualdad, se convierte en H 1. Así, se obtiene H 0: p
=
0.50
(hipótesis nula y afirmación original)
H 1: p
Z
0.50
(hipótesis alternativa)
Paso 4: El nivel de significancia es a = 0.05.