PRUEBAS DE HIPÓTESIS En investigaciones empíricas muchas veces existe una conjetura preconcebida relativa al objeto de estudio. En este tipo de circunstancias circunstancias se realiza un estudio que implicará la existencia de dos hipótesis que reflejarán esa idea a priori y que tendremos que contrastar con la realidad. A este estudio se le llama PRUEBA DE HIPÓTESIS ó CONTRASTE DE HIPÓTESIS ó DOCIMACIA DE HIPÓTESIS. La finalidad del contraste de hipótesis es decidir si esa idea o teoría preconcebida es confirmada o invalidada estadísticamente a partir de las observaciones en una muestra. •
•
Hipótesis Nula: H0 Es la idea que tenemos a priori, la hipótesis que se contrasta, que se rechazará o no, teniendo en cuenta su diferencia con lo observado, es decir, con los datos suminist suministrados rados por una muestra muestra del experime experimento nto aleatori aleatorio. o. Esta hipótesis hipótesis se mantendrá a no ser que haya suficiencia evidencia para rechazarla (pero esto no significa que podamos probarla). Hipótesis alternativa: H1 Es la hipótesis que aceptamos cuando rechazamos la hipótesis nula. H0 y H1 han de ser excluyentes, normalmente se construye negando la hipótesis nula y teniendo como referencia lo que se ha observado en la muestra. Hay de dos tipos principales de hipótesis alternativa: Por ejemplo, si H 0: θ = θ0 o Si no se sabe en que sentido H 0 es falsa, entonces se toma H 1:θ ≠ θ0. En este caso se llama un contraste bilateral o de dos colas. o
Si se sabe que de cuando H 0 no es cierta entonces debe cumplirse una de las siguient siguientes es condicio condiciones nes θ > θ 0 ó θ < θ0, o sea que H 1:θ > θ0 ó H1:θ < θ0. En este caso se llama un contraste unilateral o de una cola.
La hipótesis nula está relacionada con una concepción parsimoniosa de la realidad. Corresponde al estado actual de conocimiento, por el cual, si no se hiciese el estudio sería la (hipótesis) que prevalecería. La hipótesis alternativa, por el contrario, está relacionada con el objetivo del estudio. Es la hipótesis que necesita la evidencia experimental y la recogida de evidencia para ser aceptada .
Las pruebas estadísticas se construyen para decidir si “aceptamos” o rechazamos la hipótesis de trabajo o la hipótesis alternativa. Conceptualmente no se pueden aplicar para aceptar las hipótesis nulas, puesto que son temporalmente aceptadas hasta que se reúna evidencia en algún estudio que las rechace definitivamente. Durante este periodo las hipótesis nulas son sencillamente "no rechazadas". Observación. El contraste de hipótesis trata de rechazar o no rechazar la idea a priori que se tiene acerca objeto de estudio. Para ello:
Primero se va a suponer que es cierta. Desp Despué uéss se repe repeti tirá rá el expe experi rime ment ntoo alea aleato tori rioo vari varias as vece vecess (rec (recog ogie iend ndoo información). Para luego, comparar lo supuesto cierto (ESPERADO) con lo que se ha obtenido al observar varias veces al experimento experimento (OBSERVADO). La hipótesis nula se mantendrá cierta si al compararla con lo observado en la muestra no existe fuerte evidencia en contra, es decir, si no hay una diferencia significativa entre la idea a priori (ESPERADO) con lo recogido en la muestra (OBSERVADO). Si a partir de lo observado se decide rechazar la hipótesis nula (es decir, hay difere diferenc ncia ia signif signific icati ativa va entre entre lo espera esperado do y lo obser observa vado) do),, entonc entonces es nos quedaríamos con la hipótesis alternativa.
Ejemplo. Supongamos que un juez tiene que decidir si una persona será condenada o no.
A priori, se supone que esa persona será inocente hasta que no se demuestre lo contrario. Se dispone entonces del siguiente par de hipótesis: H0: la persona es inocente vs. H1: la persona es culpable.
El siguiente paso del juez, será obtener información información acerca del asunto, y con ella tomar una decisión, sabiendo que su postura será dejar a la persona en libertad si no tiene suficiente evidencia de que sea culpable.
El juez podrá cometer dos tipos de errores: - Condenar a la persona cuando en realidad es inocente inocente o - Dejar a la la persona en libertad libertad siendo realmente culpable. culpable. ¿Cuál de estos dos errores sería el más grave?
TIPOS DE ERRORES. La siguiente tabla muestra los posibles errores que se pueden cometer: DECISIÓN No se rechaza H0 Rechazar H0
H0 cierta Decisión Correcta Error de Tipo I
H0 falsa Error de Tipo II Decisión Correcta
Error de tipo I: Es el error que se comete cuando se rechaza H 0 siendo cierta. Error de tipo II: Es el error que se comete cuando no se rechaza H 0 y es falsa.
No podremos cometer los dos errores al mismo tiempo, puesto que la decisión tiene que inclinarse por alguna de las dos hipótesis. Lo ideal es que estos errores no se cometan o que la posibilidad de que sucedan sean pocas. Una manera de medir estos errores es a través de sus probabilidades: La probabilidad de cometer el error de tipo I (se denota por α por α) se puede escribir como: α = P(Rechazar H 0/ H0 es cierta) y recibe el nombre de nivel de significación de la prueba. La probabilidad de cometer el error de tipo II (se denota por β) se puede escribir como: β = P(No rechazar H 0/ H0 es falsa) y 1- β recibe el nombre de potencia de la prueba: Potencia = 1-β = P(Rechazar H 0/ H0 es falsa) Lo deseado es que la prueba de tal naturaleza, naturaleza, que las probabilidades probabilidades de cometer los dos tipos de errores (α y β) sean lo más pequeñas posibles. posibles. PRUEBA DE HIPÓTESIS PARA LA MEDIA Prueba Prueba de Hipóte Hipótesis sis para para la media media de una una distribuc distribución ión Normal Normal con varian varianza za conocida. Ejemplo: Supongamos que X representa la longitud de una pieza y se distribuye según una Normal de media μ (desconocida) y varianza conocida σ 2 = 202. Para determinar la longit lon gitud ud media media se tom tomaa una muestr muestraa de 70 pieza piezass obt obteni eniénd éndose ose que x = 80,1 80,1.. Queremos contrastar si realmente la máquina que fabrica dicha pieza lo hace con longitud media de 75. Supongamos que X 1, X2,....., Xn es una muestra aleatoria simple de una población Normal de media μ desconocida y varianza conocida σ 2 =202, con lo cual sabemos que: X - µ
Z=
σ
se distribuye según una N(0,1).
n
Propondremos el siguiente siguiente contraste: H0: μ = 75
frente a
H1: μ > 75.
o
Supongamos que H 0 es cierta, luego tenemos que: X - 75
Z=
se distribuye según una N(0,1)
20 70
o
Fijamos el nivel de significación α (sea α=0,05).
o
Rechazaremos Rechazaremos H0 si el valor de: ( 80,1 - 75)
Z0 =
20
es significativamente grande.
70
Aquí tenemos la diferencia entre lo observado y lo esperado. o
¿Cómo de grande? 80,1 - 75
Rechazaremos Rechazaremos H0 si Z0 =
20
> Z1-α donde Z1-α es el valor que verifica que
70
P(Z < Z1-α) = 1-α. En este caso: Z 0 > Z0,95 (ya que 2,13 > 1,65), luego se rechaza H 0. Otra manera equivalente de encarar el problema de la prueba de hipótesis hipótesis es mediante el p-valor, es decir: Se calcula p = P(Z>Z 0 / H0 es cierta) y si p es menor que el nivel de significación α se rechaza la hipótesis nula. En el ejemplo: p = P(Z>2,13 / H 0 es cierta) =1-0,9834 =0,0166 como p < α (0,0166 < 0,05) luego rechazamos H 0. RESUMEN Prueba de Hipótesis para la media de una distribución Normal con varianza varianza conocida. conocida.
H0: μ = μ0 H1: μ > μ0 X - µ 0
Se rechaza H0 si
σ
> Z1-α
n
H0: μ = μ0 H1: μ < μ0 X - µ 0
Se rechaza H0 si
σ
< - Z1-α
n
H0: μ = μ0 H1: μ ≠ μ0 X - µ 0
Se rechaza H0 si
σ
> Z1-
n
α/2
Prueba de Hipótesis para la media de una distribución Normal con varianza desconocida. Ejemplo: Supongamos que X representa la longitud de una pieza y se distribuye según una Normal de media μ desconocida y varianza desconocida σ 2. Para determinar la longitud media se toma una muestra de 70 piezas obteniéndose que x = 80,1 y cuasivarianza muestral sˆ = 21,42. Queremos contrastar si realmente la máquina que fabrica dicha pieza lo hace con longitud media de 75. 2
Supongamos que X 1, X2,....., Xn es una muestra aleatoria simple de una población Normal de media μ desconocida desconocida y varianza desconocida desconocida σ 2, con lo cual sabemos que: X - µ
t=
ˆ s
se distribuye según una t de Student con n-1 grados de libertad.
n
Propondremos el siguiente contraste:
H0: μ = 75 o
frente a
H1: μ > 75.
Supongamos que H 0 es cierta, luego tenemos que: X - 75
t=
21,4
se distribuye según una t de Student con 69 grados de libertad
70 o
Fijamos el nivel de significación α (α=0,05),
o
Rechazaremos Rechazaremos H0 si el valor de: t0 =
80 ,1 − 75 21 ,4
es significativamente grande.
70
Aquí tenemos la diferencia entre lo observado y lo esperado. o
¿Cómo de grande?
Rechazaremos Rechazaremos H0 si
80 ,1 −75 t0 = 21,4 70
> t1-α donde t1-α es el valor que verifica que
P(t(69) < t1-α) = 1-α. En nuestro caso, t 0 > t1-α (1,99 > 1,65) luego rechazaremos H 0. Otra manera equivalente de encarar el problema de la prueba de hipótesis hipótesis es mediante el p-valor, es decir: Se calcula p = P(t>t 0 / H0 es cierta) y si p es menor que el nivel de significación α se rechaza la hipótesis nula. En el ejemplo: p = P(t > 1,99 / H 0 es cierta) = 0,025 como p < α (0,0166 < 0,05) luego rechazamos H 0. RESUMEN Prueba de Hipótesis para la media de una distribución Normal Normal con varianza varianza desconocida. desconocida.
H0: μ = μ0 H1: μ > μ0 X - µ 0
Se rechaza H0 si
> t1-α(n-1)
S
n
H0: μ = μ0 H1: μ < μ0 X - µ 0
Se rechaza H0 si
< - t1-α(n-1)
S
n
H0: μ = μ0 H1: μ ≠ μ0 X - µ 0
Se rechaza H0 si
S n
1)
> t1-α/2(n-