Estadística Aplicada 1
Procedimientos gener Procedimientos generales ales de una prueba de hipótesis estadística estadística
Hipótesis Estadística Hipótesis Estadística es es una proposición concerniente a uno o más pará paráme metr tros os de una una o más más pobl poblac acio ione nes. s. Siempre existirá existirán n dos hipótesi hipótesiss contra contrapues puestas: tas:
H0: Hipót Hipótesi esiss nula (afirma (afirmació ción n que inicia inicialme lment ntee se supone supone cierta cierta)) Ha: Hipótesis alternativa (afirmación contradictoria a H 0 y donde cae cae el peso peso de la prue prueba ba))
Por definición, H0 se acepta como cierta a no ser que la evidencia mues mu estr tral al ap apo oye fu fuer erttem emen entte a Ha.
Existen 2 conclusiones: 1) Re Recha chazar zar H0 2) No Rec echa haza zarr H0
Prueba de Hipótesis es un método que emplea datos de una muestra par para deci decidi dirr si se se debe debe rech rechaz azar ar la hip hipót ótes esis is nul nulaa o no. no.
Procedimientos gener Procedimientos generales ales de una prueba de hipótesis estadística estadística
Si es el parámetro de interés, H0 será siempre de la forma: donde es un número
: =
denominado valor denominado valor nulo del parámetro.
Mientras que Ha tendrá una de las siguientes siguie ntes formas:
1) : >
2): <
3) : ≠
Ejemplo: Un fabricante de automóviles asegura que su nuevo modelo tiene un rendimiento de no menos de 10 [km/l]. No sería aconsejable contradecir al fabricante sin contar con fuerte evidencia en contra de lo que él afirma. ¿Cuál serí seríaa un unaa form formul ulac ació ión n ap apro ropi piad adaa pa parra el prob proble lema ma??
Procedimientos generales de una prueba de hipótesis estadística
Procedimiento de Prueba es una regla, con base en datos muestrales, para determinar si se rechaza H0. Posee dos componentes:. 1.
Estadístico de prueba: Estadístico en el que se basa la decisión de rechazar o no H0. Su distribución de probabilidad se basa en que H0 es cierta.
2.
Región de Rechazo: Conjunto de todos los valores del estadístico de prueba para los cuales H0 será rechazada.
Ejemplo Un fabricante de cigarrillos indica que el promedio de nicotina de la marca Kent de cigarrillos es de a lo sumo 1,5 [mg].
Formulación:
H 0 : 1,5 H a : 1,5
Regla de decisión basada en una muestra de 32 cigarrillos Estadístico de prueba: X Región de rechazo: X 1,6
No se rechaza H0 1,6
¿Cómo elegir la región de rechazo?
Se rechaza H0
X
Errores Tipo I y II I: Rechazar H0 cuando es verdadera. ERROR TIPO II: No Rechazar H0 cuando es falsa. Cuando se trabaja con muestras, siempre es posible cometer alguno de estos errores (independiente de la región de rechazo que se elija). Al probar cualquier hipótesis estadística se puede presentar lo siguiente: ERROR TIPO
Decisión
H0 es verdadera
H0 es falsa
No Rechazar H0
No hay error
Error tipo II
Rechazar H0
Error tipo I
No hay error
P Error tipo I P Rechazar H0 | H0 es verdadera P Error tipo II P No rechazar H0 | H0 es falsa
Lo que se busca son procedimientos en los que se minimicen las probabilidades de cometer ambos errores ( y respectivamente)
Ejemplo
Represente con , el nivel de radiactividad promedio real (picocuries por litro). El valor 5 [pCi/lt] es considerado la línea divisora entre el agua segura e insegura. ¿Recomendaría probar: H0: = 5 v/s Ha: > 5 ó H0: = 5 v/s Ha: < 5? Explique su razonamiento. (Sugerencia: considere las consecuencias de un error de tipo I y tipo II para cada posibilidad).
Ejemplo Muchos hogares antiguos tienen sistemas eléctricos que utilizan fusibles en vez de interruptores de circuito. Un fabricante de fusibles de 40 [A] quiere asegurarse de que el amperaje promedio al que se queman los fusibles es de hecho 40. Si el amperaje promedio es menor que 40, los clientes reclamarán porque los fusibles requerirán ser cambiados con mucha frecuencia. Si el amperaje promedio es mayor que 40, el fabricante podría ser responsable de daño a un sistema eléctrico debido al mal funcionamiento del fusible. Para comprobar el amperaje de los fusibles, se elige e inspecciona una muestra de fusibles. Si se realizara una prueba de hipótesis a partir de los datos resultantes, ¿cuáles hipótesis nula y alternativa serían de interés para el fabricante? Describa los errores tipo I y tipo II en el contexto de esta situación del problema.
Pasos para realizar un procedimiento de prueba de hipótesis 1. Identificar el parámetro de interés y describirlo en el
contexto de la situación del problema. 2. Determinar el valor nulo y establecer la hipótesis nula. 3. Establecer la hipótesis alternativa adecuada. 4. Dar la fórmula para el valor calculado del estadístico de prueba (sustituyendo valores conocidos). 5. Establecer la región de rechazo para el nivel especificado. 6. Calcular las cantidades muestrales necesarias, sustituir en la fórmula del estadístico de prueba y calcular ese valor. 7. Determinar si H0 debe ser rechazada o no y establecer una conclusión en el contexto del problema.
En CCU se toma una muestra de 20 botellas llenadas desde la línea de producción, y se mide el volumen de llenado promedio. Si el verdadero promedio de llenado supera los 300 cc., habrá que detener el proceso productivo y volver a configurarlo. A partir de la muestra obtenida, ¿habrá que detener el proceso? En Falabella desean conocer si las mujeres gastan, en promedio, en las liquidaciones más que los hombres para así determinar el stock de mercadería apropiado y la distribución (layout) apropiada en sus tiendas.
Pruebas de hipótesis para una media poblacional Existen tres casos para realizar este tipo de prueba: 1.
conocido, población normal, no importa el tamaño
muestral.
2.
− Estadístico: = / ~ (0,1)
conocido o desconocido, población no importa, tamaño muestral grande ( ≥ 30, aplica el TCL). − − Estadístico: = / ⟶ 0,1 ó = / ⟶ (0,1) desconocido, población normal, tamaño muestral pequeño ( < 30, no aplica el TCL). −
3.
Estadístico:
= / ~ −
Pruebas de hipótesis para una media poblacional Por lo tanto, el procedimiento de prueba y las regiones de rechazo para el caso 1 son las siguientes: Procedimiento de prueba: Si H0:
=
0
Z
X 0
...es el estadístico de prueba.
n
Regiones de rechazo: Hipótesis alternativa
Región de rechazo para prueba de nivel
Ha : > 0
z ≥ z
Ha : < 0
z ≤ – z
Ha : 0
z ≤ – z / 2 ó z ≥ z / 2
Determinación de la probabilidad de cometer un error tipo II Para la prueba de cola superior: Ha: > 0 , la región de rechazo es: z z
o
bien
X
0 z
n
Para: X 0 z
H0 no es rechazada
n
Entonces para una prueba de nivel , y siendo un valor de mayor al valor nulo 0: ’
' P H 0 no sea rechazada | '
P X 0 z ' n Mientras crece X ' 0 ' P z ( ) disminuye. n n ' z 0 Donde (z) = P(Z z) n ’
’
Determinación de la probabilidad de cometer un error tipo II Análogamente, para una prueba de nivel , Para Ha: < 0
Para Ha: 0
0 ' ' 1 z n
0 ' 0 ' z 2 ' z 2 n n
Determinación del tamaño muestral Si se especifica , ´ y , es decir: P(error tipo I) = y (´) = , entonces: Para una prueba de cola superior n debe ser tal que: 0 ' 0 ' z z z n n
Despejando n, se tiene:
z z 2 0 ' n 2 z 2 z 0 '
Prueba de una cola (superior o inferior) Prueba de dos colas (aproximación)
Pruebas de hipótesis para una media poblacional
Caso 2: Cuando es grande se encuentra cercana a muestras, de modo que la VA: Z
X S
n
para la mayoría de las
Tiene aproximadamente una distribución normal estándar
Sustituyendo 0 en lugar de , produce el siguiente estadístico: Z
X 0 S
n
...se distribuye aproximadamente de forma normal estándar cuando H0 es verdadera.
Los procedimientos anteriores resultan en niveles de significación aproximados a (en lugar de exactamente).
Regiones de Rechazo para Pruebas Z PRUEBA DE COLA SUPERIOR
PRUEBA DE COLA INFERIOR
0
z 0 Región de Rechazo: z
z
Región de Rechazo: z
z
PRUEBA DE DOS COLAS
2
z
2
Región de Rechazo: z
0
z
z
/2
2
2
ó
zz
/2
z
Pruebas de hipótesis para una media poblacional Caso
Si H0:
3: Población Normal con desconocido (muestra pequeña) =
0
T
Hipótesis alternativa
X 0 S
n
...es el estadístico de prueba cuando H0 es verdadera.
Región de rechazo para prueba de nivel
Ha : > 0
t ≥ t ,n-1
Ha : < 0
t ≤ – t ,n-1
Ha : 0
t ≤ – t / 2 ,n
–
1
ó t ≥ t / 2 , n
–
1
Ejemplo Un fabricante de sistemas de aspersión utilizados para protección de incendios en edificios de oficina, afirma que el verdadero promedio de temperatura de activación del sistema es de . Al probar sistemas de aspersión, se produjo un promedio muestral de temperatura de activación de . Si la distribución de los tiempos de activación se distribuye normal con , ¿la muestra obtenida contradice la afirmación del fabricante? Utilice un nivel de significancia .
130° 131,08°
= 0,01
=9
= 1,5 °
Pruebas de hipótesis para comparar dos medias poblacionales Suposiciones básicas: 1. X1, X2, ..., Xm es una muestra aleatoria de una población N 1 , 12 2. Y1, Y2, ..., Yn es una muestra aleatoria de una población N 2 , 22 3. Las muestras X e Y son independientes entre sí.
Por otra parte:
Como E X Y 1 2 X Y es estimador insesgado de 1 2
X Y
12 m
22 n
Luego, la estandarización resulta en la variable normal estándar,
Z
X
Y 1 2 12 m
22 n
Prueba Z para poblaciones Normales y Varianza Conocida Estadístico de prueba:
H 0 : 1 2
0
Z
X
Y 0 12 m
22 n
Regiones de rechazo:
Hipótesis alternativa
Región de rechazo para prueba de nivel
Ha: 1 – 2 > 0
z z
H a: 1 – 2 < 0
z – z
H a: 1 – 2 0
z – z / 2 ó z z / 2
Ejemplo
= 20
El análisis de una muestra aleatoria formada por especímenes de acero laminado en frío, para determinar su resistencia, dio por resultado una resistencia promedio muestral de . Una segunda muestra de especímenes de acero galvanizado de 2 lados mostró una resistencia promedio muestral de . Si se supone que las dos distribuciones de resistencia son normales con y ¿indican los datos que las verdaderas resistencias promedio y son diferentes? Realice una prueba al nivel de significancia de 0,01.
= 29,8
= 25
= 34,7
= 4 = 5
y Selección del Tamaño Muestral Suponga un test de cola superior (Ha: 1 – 2 > 0) en el que la región de rechazo es de la forma: z z o bien X Y 0 z X Y Para: X Y 0 z X Y H0 no es rechazada Por lo tanto, la probabilidad de un error tipo II cuando 1 – 2 = es:
β Δ' P No rechazar H 0
cuando
μ1 μ 2
Δ '
P X Y Δ 0 z σ X Y cuando μ1 μ 2 Δ ' Cuando 1 – 2 = , la diferencia de las medias muestrales se distribuye normalmente con media y desviación estándar X Y . Utilizando esto para estandarizar, se obtiene:
y Selección del Tamaño Muestral Hipótesis alternativa () = P ( No Rechazar H 0 | 1 – 2 = ) Ha: 1 – 2 > 0
' 0 z X Y
H a: 1 – 2 < 0
' 0 1 z X Y
H a: 1 – 2 0
' 0 ' 0 z / 2 z / 2 X Y X Y
y Selección del Tamaño Muestral
Es posible determinar también los tamaños muestrales m y n que satisfagan P (error tipo I) = y P(error tipo II cuando 1 - 2 = ’) = específicas. Para una prueba de cola superior:
' 0 ( ) z z X Y '
Igualando ambos términos se obtiene:
2 1
m
Cuando m = n esta ecuación se traduce en: m n
2 2
n 2 1
(
2
'
0
z z
2
) z z 2 ' 2 2
2
Prueba Z para Muestras Grandes Según el Teorema Central del Límite, independiente de cual sea la distribución de las poblaciones de origen, si ambas muestras son suficientemente grandes (vale decir y ), los promedios muestrales se distribuirán en forma aproximadamente normal. Luego, las diferencias de las medias muestrales también tendrán aproximadamente una distribución normal. Por lo tanto, es adecuado el uso del estadístico de prueba:
> 30 > 30
Z
X Y 0 S 12 m
S 22
Estadístico que tiene aproximadamente una distribución normal estándar cuando H0 es verdadera
n
Los procedimientos anteriores resultan en niveles de significación aproximados a (en lugar de exactamente).
Ejemplo El gerente del supermercado R&P, el cual atiende las 24 hrs., preocupado por la satisfacción de sus clientes no sólo en los alimentos adquiridos, si no también en la calidad del servicio, desea saber si la cantidad de personas que esperan en horarios “ Peak” es mayor a la misma variable en horarios normales (los horarios nocturnos no son relevantes para el gerente debido a que el flujo de clientes es significativamente menor). Para realizar este estudio, el gerente decidió que c/u de las 24 hrs. de un día fueran divididas en 48 horarios de 30 min. c/u. Además, los horarios “Peak” definidos fueron: 6AM - 9AM, 11:30AM - 1:30PM, 4:30PM 6:30PM , mientras que el horario nocturno considerado es desde las 11 PM hasta las 6 AM. De esta forma, los horarios normales son aquellos que no quedaron anteriormente definidos.
Ejemplo (continuación) El periodo de estudio considerado fue de 1 semana, vale decir 24 x 7 = 168 hrs., o bien 168 x 2 = 336 horarios de 30 minutos, medidos continuamente durante una semana. Un día Lunes a las 8 AM comenzó el estudio. A modo de ejemplo, se muestran los datos recopilados en los 32 horarios de 30 min. de ese día. En base al estudio realizado, ¿puede concluir el gerente del supermercado R&P que el número promedio de clientes que esperan en los horarios “Peak” es mayor que en los horarios normales? Utilice la cantidad de clientes que esperan al final de cada horario para realizar su análisis. Use un nivel de significancia del 1%.
Día
Com ienzo
Tipo de Horario
Esperas Iniciales
Llegadas
Salidas
Esperas Finales
Cajeros
Clientes Totales
Lun
8:00 AM
Peak
2
21
22
1
3
23
Lun
8:30 AM
Peak
1
25
18
8
3
26
Lun
9:00 AM
Normal
8
27
28
7
3
35
Lun
9:30 AM
Normal
7
21
23
5
3
28
Lun
10:00 AM
Normal
5
20
23
2
5
25
Lun
10:30 AM
Normal
2
36
31
7
5
38
Lun
11:00 AM
Normal
7
30
36
1
5
37
Lun
11:30 AM
Peak
1
34
29
6
5
35
Lun
12:00 PM
Peak
6
56
48
14
7
62
Lun
12:30 PM
Peak
14
58
64
8
7
72
Lun
1:00 PM
Peak
8
53
52
9
7
61
Lun
1:30 PM
Normal
9
30
36
3
5
39
Lun
2:00 PM
Normal
3
34
31
6
5
37
Lun
2:30 PM
Normal
6
36
37
5
5
42
Lun
3:00 PM
Normal
5
30
28
7
5
35
Lun
3:30 PM
Normal
7
29
34
2
5
36
Lun
4:00 PM
Normal
2
35
33
4
5
37
Lun
4:30 PM
Peak
4
32
25
11
5
36
Lun
5:00 PM
Peak
11
46
43
14
6
57
Lun
5:30 PM
Peak
14
39
45
8
6
53
Prueba T para la diferencia entre dos medias poblacionales ( )
≠
Para usar este procedimiento de prueba, debe cumplirse que:
Ambas poblaciones son normales, independientes y con distinta varianza.
T
X
Y 1 2 S12 m
S 22 n
Variable estandarizada que tiene aproximadamente una distribución t, con grados de libertad, estimados a partir de:
2 s12 s22 m n 2 2 2 2 s m s n / / 2 1 m 1 n 1
Prueba T para la diferencia entre dos medias poblacionales ( )
≠
Luego, la prueba t con dos muestras para probar H0: 1 – 2 = 0 se basa en:
Valor del estadístico de prueba:
t
x y 0 2
s1
m
2
s2 n
Hipótesis alternativa
Región de rechazo para prueba de nivel aproximado
Ha: 1 – 2 > 0
t t ,
H a: 1 – 2 < 0
t – t ,
H a: 1 – 2 0
t – t / 2 ó t t / 2
Ejemplo La siguiente tabla informa sobre la resistencia a la tensión, en psi, de especímenes de forros (que podrían ser utilizados para proteger tuberías), en procesos con y sin fusión. Proceso
Tamaño muestral
Sin fusión Con fusión
m = 10 n=8
Promedio muestral de Desviación estándar resistencia a la tensión muestral 2.902,80 3.108,10
277,3 205,9
Investigadores afirman que el proceso de fusión aumenta la resistencia promedio a la tensión. Suponiendo normalidad y que las varianzas poblacionales son distintas, ¿respaldan los datos esta conclusión? Utilice un nivel de significancia del 10%.
Prueba T para la diferencia entre dos medias poblacionales ( )
=
Para usar este procedimiento de prueba, debe cumplirse que:
Ambas poblaciones sean normales, independientes y con igual varianza.
Varianza del estimador :
V X
indep .
Y
V X V Y
2
m
2
n
2
1 1 m n
Si se utiliza un estimador de sigma cuadrado apropiado, la variable resultante de la estandarización tendrá una distribución t. Este estimador , el cual es un estimador insesgado para 2
S p
m 1 mn2
2 S 1
n 1 mn2
2 S 2
2,
es:
m 1S 12 n 1S 22 mn2
Es conocido como el ESTIMADOR AGRUPADO o PONDERADO de la varianza.
Prueba T para la diferencia entre dos medias poblacionales ( )
=
Reemplazando Sp en la estandarización de la variable T se obtiene el estadístico,
T
X
Y 1 2 S p
1 m
1 n
...que obedece a una distribución t con (m + n – 2) grados de libertad. Entonces, el valor del estadístico de prueba t de dos muestras para probar H 0: 1 - 2 = 0 se obtiene sustituyendo en la v.a. T. 0 en lugar de 1 - 2 .
Prueba T para la diferencia entre dos medias poblacionales ( )
=
Luego, la prueba t con dos muestras para probar H0: 1 – 2 = 0 es: Valor del
estadístico de prueba:
t
y 0
x
1
s p
Hipótesis alternativa
m
1 n
Región de rechazo para prueba de nivel
Ha: 1 – 2 > 0
t t , m + n
H a: 1 – 2 < 0
t – t , m + n
H a: 1 – 2 0
t – t / 2 , m + n
–
2
–
2
–
2
ó t t / 2 , m + n
–
2
Ejemplo
La Compañía SureStep fabrica trotadoras de alta calidad para gimnasios. Actualmente, SureStep compra los motores de sus trotadoras al proveedor A. Sin embargo, está considerando cambiar a un nuevo proveedor B, el cual ofrece un costo ligeramente menor. Para tomar la decisión de cambiar de proveedor, SureStep sólo necesita validar que los motores del proveedor B sean tan confiables como los del proveedor A. Para corroborar esto, SureStep decide instalar 30 motores del proveedor A en 30 trotadoras, así como 30 motores del proveedor B en otras 30 trotadoras. Una vez instalados los 60 motores (30 de cada proveedor), hace funcionar las trotadores bajo condiciones regulares (imitando el uso dado en un típico gimnasio) y registra la duración, en hrs. cerradas, de cada motor instalado en la trotadora respectiva hasta su falla. Los datos obtenidos se muestran a continuación. Proveedor A 1358 Proveedor B 658
793 404
587 735
608 457
472 431
562 658
879 453
575 488
1293 1457 705 522 1247 1095
623 430
725 726
569 793
424 498
Proveedor A 436 Proveedor B 502
1250 589
493 975
485 808
462 456
765 731
854 491
634 487
1109 503
522 508
791 846
684 732
666 507
800 465
883 1475
Asumiendo las duraciones de los motores de ambos proveedores son normales, y con igual varianza, ¿se puede concluir que son igualmente confiables los proveedores? Use un nivel de significación del 5%.
Análisis para relación entre datos en pares A diferencia de lo que hemos estudiado hasta ahora, hay casos en los que hay un conjunto de individuos u objetos y se hacen dos observaciones en cada individuo u objeto. En este caso claramente las observaciones no son independientes.
Suponga: - pares (X 1,Y 1),...,(X n,Y n) seleccionados de manera independiente. - E(X i) = 1 y E(Y i) = 2 - Sean Di las diferencias dentro de pares.
Se supone que las D i se distribuyen normalmente con varianza D2.
Debido a que no hay independencia entre las observaciones de cada par la prueba t tradicional con dos muestras no es válida.
Prueba t para Pares Si los diferentes pares son independientes entre sí, luego las D i son independientes. Si definimos D = X – Y, donde X e Y son la primera y segunda observaciones, dentro de un par arbitrario, entonces la diferencia esperada es:
D
E X Y E X E Y 1 2
Luego, en el caso de información por pares, se forman las diferencias Di. Como las Di constituyen una muestra aleatoria normal con media D las hipótesis sobre D se pueden probar usando una prueba t de una muestra. La Hipótesis nula es de la forma: El estadístico de prueba es:
H 0 : D T
0
D 0 S D / n
Con n - 1 grados de libertad (GL)
Prueba t para Pares Por lo tanto, la prueba t para pares es:
H 0 : D
0
(Donde D = X – Y y D = 1 - 2)
Estadístico de prueba: T
Hipótesis alternativa
D 0 S D / n
Región de rechazo para prueba de nivel
Ha: D > 0
t t , n
–
1
H a: D < 0
t – t , n
–
H a: D 0
t – t / 2 , n
–
1
1
ó t t / 2 , n
–
1
Ejemplo
El concesionario de automóviles Steven Honda-Olds a menudo vende sus automóviles a parejas, digamos marido-mujer. El encargado quisiera saber si los vendedores que actualmente está usando son mejor evaluados por los maridos que sus esposas, o viceversa o bien son evaluados de forma similar. De encontrar diferencias, se realizaría una capacitación especial en los vendedores para lograr cautivar a los clientes insatisfechos. Para poder detectar la existencia o no de tales diferencias, se les solicita a 35 parejas escogidas al azar (maridos y esposas) que califiquen el servicio entregado por el vendedor, de manera independiente, en una escala de 1 a 10, siendo 10 la nota más favorable. La información recopilada se muestra a continuación: Pareja 1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
Marido
6
7
8
6
8
7
8
6
7
7
6
5
8
7
7
7
6
5
Esposa
3
8
5
4
5
6
5
7
8
5
3
4
5
8
5
6
5
4
Pareja 19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
Marido
6
9
7
9
6
6
6
8
9
7
5
7
7
5
7
7
10
Esposa
5
10
9
6
5
4
5
5
7
5
5
3
5
1
5
4
5
A partir de la información entregada por las parejas, ¿qué puede concluir el encargado de la concesionaria? Use un nivel de significancia del 5%
¿Cuánta evidencia existe en la muestra obtenida para cambiar el proceso que actua act ualme lment ntee se re reali aliza za y as asum umir ir to todos dos los co cost stos os aso asociad ciados os al cam cambio bio?? ¿Qué probabilidad hay de que al obtener una nueva muestra la tendencia actual se siga produciendo? ¿Cuá uáll es la pr prob obab abil ilid idad ad de ca camb mbia iarr el pr proc oces eso o ac actu tuaal po porrqu quee rea ealm lmen entte corresponde hacerlo?
Introducción al Valor p Considere un procedimiento procedimiento de prueba en el el que H0: = 1,5 y Ha: > 1,5 (Cola superior), luego H0 se rechaza si z ≥ z Si se calcula que z = 2,1, entonces: Nivel Significación
Región de Rechazo
Conclusión
0,05
z ≥ 1,645
Rechazar H0
0,025
z ≥ 1,96
Rechazar H0
0,01
z ≥ 2,33
No rechazar H0
0,005
z ≥ 2,58
No rechazar H0
Definiciones del Valor p (1) Conceptual: Es el mínimo valor de significación al que H0 sería sería recha rechaza zada da cuando se utiliza un procedimiento de prueba especificado en un conjunto dado dado de inf informa ormaci ción ón.. La conc conclu lusi sión ón resul esultta de compa omparrar p con . (2) Práctica: El valor p de una muestra es la probabilidad de encontrar en una muestra al menos tanta evidencia a favor de la hipótesis alternativ tiva como la que que se ha enco encont ntrrado ado en la mues muestr traa actu actual alme men nte obse observ rvad ada. a. 1. Valor
P
2. Valor
P
Rechazar H 0 No rechazar
al
nivel
H 0 al
nivel
Valor alor P : mínimo nivel en el cual H 0 puede ser rechazada
0
No Rechazar H0
Rechazar H0
1
Significancia desde los Valores p
Este enfoque es actualmente más popular que el nivel de significancia y el enfoque de región de rechazo. Este enfoque sirve para evitar el uso del nivel de significancia e indicar simplemente “cuan significativa” es la evidencia de la muestra. Cuánto menor sea el valor p, existirá más evidencia a favor (o en apoyo) de la hipótesis alternativa. Si un valor p es suficientemente pequeño, casi cualquier tomador de decisiones concluirá que rechazar la hipótesis nula es la decisión más razonable.
¿Cuán pequeño debe ser el Valor p para apoyar a Ha? La respuesta no es única, depende del tomador de decisiones. Pero: Un valor p menor que 0,01, proporciona evidencia convincente que la hipótesis alternativa es cierta; Un valor p entre 0,01 y 0,05, proporciona evidencia fuerte a favor de la hipótesis alternativa; Un valor p entre 0,05 y 0,10, proporciona evidencia moderada a favor de la hipótesis alternativa; Valor p mayor que 0,10 se interpreta como débil o ninguna evidencia en apoyo de la hipótesis alternativa.
0
0,01
0,05
0,10 valor p
convincente
fuerte
moderada
débil o ninguna
¿Cómo calcular el Valor p?: Caso Distribución Normal 1. Prueba de Cola Superior Ha:
>
0
0
z
Región de Rechazo: z
Valor P P Z
≥
z
z 1 z
¿Cómo calcular el Valor p?: Caso Distribución Normal 2. Prueba de Cola Inferior Ha:
<
0
z 0 Región de Rechazo: z
Valor P P Z
≤
- z
z z
¿Cómo calcular el Valor p?: Caso Distribución Normal 3. Prueba de Dos Colas Ha:
0
2
2
z
2
0
z
2
Región de Rechazo: z ≤ - z / 2 ó z ≥ z / 2
Valor P 2 min P Z
z , P Z z 2 1 z
¿Cómo calcular el Valor p?: Caso Distribución Normal En Resumen para una Prueba Z:
Valor
1 z P z 2 1 z
Prueba de cola superior Prueba de cola inferior Prueba de dos colas
¿Cómo calcular el Valor p?: Caso General Para los casos de prueba de cola superior y de cola inferior, se basa en lo mismo que para la prueba Z. Sin embargo, para el Caso de las prueba de dos colas es diferente, esto se presenta a continuación. Prueba de Dos Colas Ha:
0
Suponga que X es una variable aleatoria que tiene cierta distribución y que el valor observado de X es x. Se rechazará H0 si: P X x
2
o bien si:
P X x
2
¿Cómo calcular el Valor p?: Caso General De aquí se desprende que el contraste, a nivel de significación , rechazará H0 si:
min P X x , P X x
2
O, equivalentemente, si
2 min P X
x, P X x
Por lo tanto el Valor P para una prueba de dos colas, se calcula a partir de la siguiente expresión:
Valor P 2 min P X
x , P X x
¿Por qué debe ser el MÍNIMO entre ambas áreas?
0,40
0,60
0,60
0,60
Si NO se elige el área MÍNIMA, las áreas se superponen
¿Cómo calcular el Valor p?: Caso General En Resumen para cualquier distribución:
P X x Valor P P X x 2 min P X x , P X x
Prueba de cola superior Prueba de cola inferior Prueba de dos colas
Potencia de una Prueba de Hipótesis
Definición Conceptual: Es la probabilidad de rechazar una Hipótesis Nula cuando la Hipótesis Alternativa es VERDADERA. . Forma de cálculo: POTENCIA = Definición Práctica: Es la probabilidad de rechazar correctamente una Hipótesis Nula FALSA.
1
La potencia es una medida muy descriptiva de la sensibilidad de una prueba estadística, es decir de su capacidad para detectar diferencias.
Ejemplo Considere que corresponde al verdadero calor promedio emanado de una mezcla de cemento (en calorías). Se prueba H0: = 50 [cal] v/s Ha : 50 [cal]. Supóngase que el verdadero calor promedio es de 52 [cal]. Cuando n = 10, se tiene que = 0,2643. ¿Cuál es la potencia de esta prueba? ¿Cómo interpretamos este valor?
Si al encuestar a 1.000 chilenos sobre si son fumadores o no, el 45% afirma que sí, y el Ministerio de Salud está pensando en implementar una nueva campaña anti-tabaco si descubre que más del 40% de la población chilena fuma, ¿existe información concluyente para que el MinSal comience esta campaña? Una compañía manufactera que posee dos plantas productivas que producen los mismos productos desea saber hasta qué punto la proporción de productos fuera de los rangos de especificación válidos difiere entre las dos plantas, para asegurar la calidad de sus productos independiente de la planta de donde provengan.
Pruebas de hipótesis para una proporción poblacional Pruebas
para muestras grandes: p p0 Si H0: p = p0 Z p0 1 p0 n ˆ
Hipótesis alternativa
...es el estadístico de prueba cuando H0 es verdadera.
Región de rechazo para prueba de nivel
Ha : p > p0
z ≥ z
Ha : p < p0
z ≤ – z
Ha : p p0
z ≤ – z / 2 ó z ≥ z / 2
Estos procedimientos son válidos siempre que np0 5, n (1–p0) 5, n p0 no sea muy pequeño (cercano a 0) ni muy grande (cercano a 1).
30, y
Ejemplo Muchos consumidores están incurriendo a productos genéricos para reducir el costo de medicamentos por prescripción. Un estudio realizado a 102 médicos reveló que sólo 47 de ellos conocía el nombre genérico de la metadona. ¿Proporciona esto fuerte evidencia para concluir que menos de la mitad de todos los médicos conocen el nombre genérico de la metadona? Utilice un nivel de significancia de 0,01.
Determinación de
Si H0 no es verdadera y p = p , entonces para una prueba de cola superior, cuya región de rechazo es ’
Tenemos que
z z
P No Rechazar H 0 | H 0 es falsa
P Z z | p p ' Luego, las expresiones para son las que se muestran a continuación.
Determinación de Hipótesis alternativa
( p’)
Ha : p > p0
p0 p ' z p0 1 p0 p ' 1 p ' n
Ha : p < p0
p0 p' z p0 1 p0 n 1 p' 1 p' n
Ha : p p0
n
p0 p' z 2 p0 1 p0 n p ' 1 p ' n p0 p ' z 2 p0 1 p0 n p ' 1 p ' n
Pruebas de hipótesis para comparar dos proporciones poblacionales Sean p 1 y p2 las proporciones de individuos en las poblaciones 1 y 2 respectivamente. m : tamaño de la muestra de la población 1 n : tamaño de la muestra de la población 2 X : número de individuos en la muestra de la población 1 que poseen la característica definida por p1. Y : número de individuos en la muestra de la población 2 que poseen la característica definida por p2. Siempre que los tamaños poblacionales sean mucho más grandes que los tamaños muestrales, la distribución de:
X ~ Bin (m, p1) y Y ~ Bin (n, p2). Además se supone que las muestras son independientes entre sí, por lo que X e Y son v.a. independientes
Pruebas de hipótesis para comparar dos proporciones poblacionales El estimador para p1 – p2, es la diferencia entre las proporciones muestrales X/m – Y/n. Con p1 X m y p2 Y n el estimador de p1 – p2 es p1 p2 . ˆ
ˆ
ˆ
ˆ
Proposición: Sea X ~ Bin (m, p1) y Y ~ Bin (n, p2) con X e Y independientes. Entonces:
E p1 p2 p1 p2 ˆ
V p1 p2 ˆ
Estimador Insesgado
ˆ
p1q1
ˆ
m
p2 q2 n
Estadístico de prueba distribuido de forma aproximada normal estándar:
(donde qi = 1 – pi)
Z
p1 p2 ˆ
ˆ
p1 p2
p1q1 m
p2 q2 n
Pruebas de hipótesis para comparar dos proporciones poblacionales El caso más común lo constituye la prueba: H 0 : p1 p2 0 En este caso el estadístico de prueba es igual al anterior pero asumiendo que p1 = p2 = p, es decir p1 p2 0 Z
ˆ
ˆ
1 1 pq m n
Si se asume que la H0 es verdadera, entonces p1 = p2 y se utilizará entonces, un estimador único para p.
El estimador p único se obtiene asumiendo que p1 p2 ˆ
p
Entonces se calcula: p ˆ
X Y mn
m mn
p1 ˆ
n mn
p2 ˆ
Prueba para diferencia entre proporciones para muestras grandes H 0 : p1 p2
0
Estadístico de prueba:
Z
p1 p2 ˆ
ˆ
1 1 pq m n ˆ
ˆ
Hipótesis alternativa
Región de rechazo para prueba de nivel
Ha: p1 – p2 > 0
z z
H a: p1 – p2 < 0
z – z
H a: p1 – p2 0
z – z / 2 ó z z / 2
Ejemplo Una tienda de electrodomésticos está a punto de lanzar un nuevo producto estrella al mercado. Desde sus bases de datos, selecciona 300 de sus mejores clientes y los divide aleatoriamente en dos grupos de 150 clientes cada uno. A continuación, envía por correo electrónico un anuncio de venta a c/u de los 300 clientes, pero sólo incluye un cupón de descuento del 5% al segundo grupo de 150 clientes. El estudio consideró un periodo de tiempo de 1 mes (tiempo de validez de los cupones de descuento). Tras dicho periodo, los resultados obtenidos por la tienda fueron los siguientes: de los 150 clientes que recibieron sólo el aviso del nuevo producto (sin un cupón de descuento adjunto), sólo 35 compraron el producto; mientras que de los 150 clientes que recibieron el aviso y el cupón de descuento, sólo 55 compraron el producto. ¿Qué puede concluir el gerente de la tienda sobre la eficacia de los cupones de descuento? Use el criterio del valor p.
Variabilidad en la producción de un proceso es un factor clave en diversas industrias. Si existe mucha variabilidad en el diámetro de las ruedas producidas, el proceso tendrá que ser detenido y revisar las causas asociadas a esta variabilidad (desajuste). La administración del TranSantiago siente que la variabilidad en los tiempos de servicio prestados por dos operadores no es la misma, debido a la gran cantidad de reclamos surgidos al respecto. A partir de dos muestras aleatorias se busca medir la variabilidad en los tiempos de servicio. Si se determina que los tiempos de servicio presentan diferentes variabilidades, se tomarán medidas mitigación para mejorar la calidad del servicio.
Pruebas de hipótesis para y de una población normal
Suponga que deseamos probar la hipótesis que la varianza de una población normal 2 es igual a algún valor específico 02, o equivalentemente, que la desviación estándar es igual a 0. S e a X1, X2, …., Xn una muestra aleatoria de tamaño n de esta población. Para probar:
02 2 2 H a : 0 H 0 :
02 2 2 H a : 0
2
H 0 :
ó
2
ó
usaremos el estadístico de prueba: 2
X 0
n 1 S 2 2
0
2
~ n 1
02 2 2 H a : 0 H 0 :
2
Pruebas de hipótesis para y de una población normal
Las regiones de rechazo, dependiendo de la Ha son: Hipótesis alternativa
Ha : 2 > 02
H a : 2 < 02 H a : 2 02
Región de rechazo para prueba de nivel
2, n 1 2 2 X 0 1 , n 1 2
X 0
X 02 12 / 2, n 1 ó X 02
2 / 2, n 1
A continuación se muestran las regiones de rechazo en forma gráfica.
Pruebas de hipótesis para y de una población normal
Región de Rechazo para Ha: (a) Ha: 2 02
Región de Rechazo para Ha: (b)Ha: 2 > 02
Región de Rechazo para H : (c) H
2
2
Ejemplo Un fabricante de detergente líquido está interesado en la uniformidad de la máquina utilizada para llenar las botellas. Al tomar una muestra aleatoria de 20 botellas, se obtuvo una varianza muestral para el volumen de llenado de s2 = 0,0153 [oz2]. Si la varianza del volumen de llenado es mayor a 0,01 [oz2], entonces existe una proporción inaceptable de botellas que serán llenadas con una cantidad menor o mayor que la especificada. ¿Existe evidencia en los datos muestrales que sugiera que el fabricante tiene un problema con el llenado de las botellas? Use = 0,05, y asuma que el volumen de llenado de detergente en las botellas sigue una distribución normal. Use el criterio del valor p.
Determinación de muestral
y el tamaño
En el caso de prueba de cola superior, tenemos que: ' P No Rechazar H 0 | H 0 es falsa
P X 2 2 , n 1 | ' n 1 S 2 2 P , n 1 | ' 2 0 2 n 1 S 2 2 0 P , n 1 2 2 ' ' 2 2 P n 1 2 ,n 1 0 2 '
Pruebas de hipótesis para comparar dos varianzas de poblaciones En muchas ocasiones estamos interesados en saber si la variabilidad de dos poblaciones es la misma o no. Por ejemplo saber si la calibración de dos máquinas fue la misma o no, a partir de la calidad de los productos que cada una de ellas genera. Sin ir más lejos, cuando queremos realizar una prueba de hipótesis para comparar dos medias, en algunas ocasiones (prueba t) necesitamos saber si las poblaciones tienen igual varianza o no. Por estas y otras razones esta prueba es importante. Para realizar esta prueba necesitamos definir una nueva distribución de probabilidad en la cual se basa, la cual se define a continuación.
Distribución F de Fisher Snedecor
Sean y dos v.a. chi cuadrado independientes grados de libertad, respectivamente. Entonces el cociente:
= ~,
y
Distribución F de Fisher Snedecor = = ℝ+ = 2
Γ
− Γ 2 + Γ 1 2 2
0
≥0
, ∈ ℕ = 2 2 2 4 1 −,, = ,,
Distribución F de Fisher Snedecor Uso en el muestreo Sean una muestra aleatoria tomada de una distribución normal cuya desviación típica resultó ser , y una muestra aleatoria tomada de una distribución normal cuya desviación típica resultó ser . Es posible demostrar que la estadística:
, ,…, , ,…,
= ~−,−
Prueba para el cociente entre Varianzas Poblacionales H 0 :
2 1
2 2
Hipótesis alternativa
H a : 12
22
H a : 1
2
22
H a : 12
22
Estadístico de prueba:
F
S 12 S 22
Regió n de rechazo para prueba de nivel
f F , m 1,n 1
F 1 ,m1,n1 F1 /2,m1,n1 ó f F /2,m1,n1 f
f