DR. LUIS J. CASTILLO VASQUEZ
--------------------------------------------------------------------------------------------------------------------------
PRUEBA DE HIPÓTESIS Hipótesis es una afirmación o suposición respecto al valor de un parámetro poblacional Todas estas hipótesis tienen algo en común, las poblaciones de interés son tan grandes que no es factible estudiar todos sus elementos. Como ya sabemos, una alternativa a estudiar la población entera es tomar una muestra de la población de interés. De esta manera podemos probar una afirmación para determinar si la evidencia soporta o no la afirmación.
Prueba de hipótesis
Una prueba de hipótesis comienza con una afirmación o suposición acerca de un parámetro poblacional, tal como la media poblacional. Prueba de hipótesis es un procedimiento basado en una evidencia muestral y la teoría de la probabilidad, usado para determinar si la hipótesis es una afirmación razonable para no ser rechazada, o es una afirmación poco razonable y ser rechazada.
Procedimiento de 4 pasos para probar una hipótesis Hay un procedimiento de cuatro pasos que sistematizan la prueba de
hipótesis. Para ilustrar el procedimiento, completemos el ejemplo anterior. Supongamos que la muestra es de 20 estudiantes y el nivel de significancia es de α=0.05. Los cuatro pasos son los siguientes:
Paso 1. Establecer las hipótesis nula y alterna
El primer paso es establecer la hipótesis a ser probada. Esta es llamada la hipótesis nula, simbolizada por H0, el subíndice cero implica “cero diferencia”. Usualmente el término “no” es encontrado en la hipótesis nula significando “no cambio”.
1
DR. LUIS J. CASTILLO VASQUEZ
--------------------------------------------------------------------------------------------------------------------------
La hipótesis nula es una afirmación que será aceptada si los datos de la muestra no nos proveen de evidencia convincente de que es falsa, es decir, si se acepta la hipótesis nula decimos que la evidencia no es suficiente para rechazarla pero no podemos afirmar que es verdadera. La hipótesis alterna es la afirmación que se acepta si se rechaza la hipótesis nula. Esta hipótesis, también llamada hipótesis de investigación, se simboliza con Ha. La hipótesis alterna es aceptada si la evidencia proporcionada por la muestra es suficiente para afirmar que la Ho es falsa.
Paso 2. Determinar el criterio de contraste Determinar el criterio de contraste consiste en especificar el nivel de
significancia, el tipo de distribución, y los valores críticos. Existen cuatro posibilidades al tomar una decisión respecto a una hipótesis: Aceptar Ho Rechazar Ho Ho Verdadera Decisión correcta Error Tipo I : α Ho Falsa Error Tipo II: β Decisión correcta Nivel de significancia es la probabilidad de rechazar una hipótesis nula verdadera El nivel de significancia es simbolizado por α, y también es conocido como nivel de riesgo. Este último término es más apropiado porque es el riesgo que se toma de rechazar una hipótesis verdadera. No hay un nivel de significancia para todos los estudios, se puede utilizar cualquier valor de probabilidad entre 0 y 1. Tradicionalmente, el nivel de 0,05 es aplicado a proyectos de investigación, el nivel 0,01 a control de calidad, y 0,10 a sondeos políticos. Generalmente el investigador debe decidir el nivel de significancia antes de colectar la muestra de datos. El tipo de distribución se determinará dependiendo de la naturaleza de la hipótesis y del tamaño de la muestra. Cuando la hipótesis es relativa a medias poblacionales y las muestras son grandes (n>30) se utiliza la distribución
2
DR. LUIS J. CASTILLO VASQUEZ
--------------------------------------------------------------------------------------------------------------------------
normal. Cuando es relativa a la media y la muestra es chica (n≤30) se utiliza la distribución t de student. Los valores críticos son los valores de la variable de la distribución que limitan el área crítica, que es la parte de la curva que corresponde al nivel de significancia. En este ejemplo el nivel de significancia es de α=0.05, se utiliza la distribución t de student porque la muestra es pequeña, los valores críticos se encontraron de la siguiente manera El área crítica cuando la hipótesis alterna tiene el símbolo (≠) se divide en dos y se dice que el problema es de dos colas, y cada cola vale α/2. Si la Ha tiene el signo (<) el problema es de la cola izquierda, si tiene el signo (>) es de la cola derecha, y en ambos casos la cola vale α. Este problema es de dos colas:
Paso 3. Calcular el estadístico de prueba
El estadístico de prueba es un valor obtenido de la información de la muestra para compararlo con el criterio de contraste y rechazar o aceptar la hipótesis. El estadístico de prueba cambia de acuerdo a la distribución que se utilice. En este problema el estadístico de prueba es t y se simboliza t*
3
DR. LUIS J. CASTILLO VASQUEZ
--------------------------------------------------------------------------------------------------------------------------
Paso 4. Tomar decisión y conclusión
Una regla de decisión es establecer las condiciones sobre las cuales la hipótesis nula es rechazada o no rechazada. Si el estadístico de prueba queda dentro de la zona crítica la hipótesis nula deberá ser rechazada. Si el estadístico de prueba queda fuera de la zona crítica
la hipótesis nula no
deberá ser rechazada.
Prueba de hipótesis relativas a dos medias 1.- Establecer las hipótesis Ho: µ1 ≤ µ2 Ho: «La orientación hacia contenidos sexuales no es mayor en la prensa popular que en la prensa de clase media» Ha: µ1 > µ2 4
DR. LUIS J. CASTILLO VASQUEZ
--------------------------------------------------------------------------------------------------------------------------
Ha: «La orientación hacia contenidos sexuales es mayor en la prensa popular que en la prensa de clase media». 2.- Establecer el criterio de contraste Como en este problema, la hipótesis alterna contiene el signo (>) el problema es de una cola, es decir, la región crítica se ubica en el extremo derecho de la curva. Para determinar que tipo de distribución se utilizará: ·
Si
n1 + n2 - 2 > 30
entonces se busca en la tabla el valor de z
correspondiente a α/2. ·
Si n1 + n2 - 2 ≤ 30 se busca en la tabla el valor t correspondiente a Φ =
n1+n2-2 y a α/2. Z 1.6
4 .05050
? .05
5 .04947
3.- Calcular el valor del estadístico de prueba Se calcula el error estándar de la diferencia de las medias
Se calcula el valor del estadístico de prueba, en este caso Z* 5
DR. LUIS J. CASTILLO VASQUEZ
--------------------------------------------------------------------------------------------------------------------------
4.- Tomar una decisión e interpretar
El estadístico de prueba queda localizado fuera de la zona crítica, entonces no podemos rechazar la hipótesis nula (Ho), de tal suerte que se concluye lo siguiente: No hay evidencia suficiente, con un nivel de significancia de 0.05, de que la prensa popular tenga una mayor orientación al tema sexual que la prensa de clase media
6
DR. LUIS J. CASTILLO VASQUEZ
--------------------------------------------------------------------------------------------------------------------------
PROBLEMAS 1. Los datos siguientes muestran los años de experiencia de las trabajadoras de la fábrica de tejidos “La Hilacha”. 4 5 7 6 4
6 5 9 7 6
6 9 4 7 9
10 8 7 15 6
4 12 7 8 6
6 6 4 3 7
5 13 11 6 7
5 6 7 6 5
6 5 7 7 7
5 7 3 6 4
¿Sirven estos datos de soporte a la hipótesis de que el tiempo promedio de experiencia de todas las trabajadoras de esta empresa está por debajo de los 5 años? SOLUCION Asumimos un nivel de confianza del 95%. La hipótesis planteada es que las trabajadoras tienen una experiencia mínima de 5 años. Los valores para calcular la media y la desviación Standard son: xi 3 4 5 6 7 8 9 10 11 12
De donde:
X =6,62
H0: =5
Datos:
xifi 6 24 35 78 84 16 27 10 11 36 327
(x i - X )²fi 25,06 38,71 16,60 3,79 2,54 4,26 18,15 11,97 19,89 89,43 230,42
S=2,406
H1: >5
X Z= S/ n
De la tabla:
fi 2 6 7 13 12 2 3 1 1 3 50
=0,05
n=50
6.62 5 4.764 = 2.406 ; pertenece a la R:R 50
=0,05
z0=1,645
Decision: Z0=1,6454.764 ZR/H0 7
DR. LUIS J. CASTILLO VASQUEZ
--------------------------------------------------------------------------------------------------------------------------
Conclusión: Se rechaza H0
Si sirven estos datos para verificar la hipótesis, de que el tiempo promedio de experiencia de todas las trabajadoras de esta empresa está por encima de los 5 años
0,95 RA/H0 z=1.65
2. Se espera que dos operadores produzcan en promedio, el mismo numero de unidades terminadas en el mismo tiempo. Los siguientes datos son los números de unidades terminadas para ambos trabajadores en una semana de trabajo. Operador Operador 1 12 11 18 16 13
2 14 18 18 17 16
Si se supone que el número de unidades terminadas diariamente por los dos
trabajadores
son
variables
aleatorias
independientes
distribuidas
normalmente, ¿se puede discernir alguna diferencia entre las medias a un nivel de =0,1? SOLUCION Datos del problema: Las medias y las desviaciones calculadas para ambos datos son: x 1 =14 H0:1=2
H1: 12
x 2 =16,6
S1=2,92
S2=1,67
=0,01 t0=-1,64 8
DR. LUIS J. CASTILLO VASQUEZ
--------------------------------------------------------------------------------------------------------------------------
Parámetro estadístico: x1 x 2 t= ( n 1 1)S (n 2 1)S n1 n 2 2 2 1
14 16,6 2 2
1 =-1,729 1 = 4( 2,915) 2 4(1,67) 2 (2 / 5) 552 n1 n 2
Discusión: Como t0=-1,729-1,64 t0R/H0
Se rechaza H0
Se concluye:
Si hay diferencia entre las medias. Decisión: xC2 =0,53,32
xC2 RR/H0
Concluimos que el fabricante acepta lo manifestado por los compradores. 3. Una encuesta de 64 empleados profesionales de una institución correccional reveló que el tiempo promedio de empleo en el campo correccional era de 5 años con una desviación estándar de 4 años. ¿Sirven estos datos de soporte a la hipótesis de que el tiempo promedio de empleo de todos los empleados de este tipo está por debajo de los 7 años? SOLUCION Datos del problema: =0,02
H0: =7 Z0=
X S/ n
H1: 7 =
57 4 / 64
=0,05
n=64
=-4
Decision: Z0=-4-1,64 Z0RR/H0
Se concluye:
Si sirven estos datos para verificar la hipótesis. 4. Las puntuaciones en un test que mide la variable creatividad siguen, en la población general de adolescentes, una distribución normal de media 11,5. En un centro escolar que ha implantado un programa de estimulación de la
9
DR. LUIS J. CASTILLO VASQUEZ
--------------------------------------------------------------------------------------------------------------------------
creatividad una muestra de 30 alumnos ha proporcionado las siguientes puntuaciones: 11, 9, 12, 17, 8, 11, 9, 4, 5, 9, 14, 9, 17, 24, 19, 10, 17, 17, 8, 23, 8, 6, 14, 16, 6, 7, 15, 20, 14, 15. A un nivel de confianza del 95% ¿Puede afirmarse que el programa es efectivo? SOLUCION Datos del problema: x =12,47
H0: 1=11,5
H1: 111,5
=0,05
n=30
SD=5,31
El estadístico de contraste en este caso es: t 12.47 11.5 x 5.31 tc= = 0.81 20 SD / n
Como el contraste es unilateral, buscamos en las tablas de la t de Student, con 29 grados de libertad, el valor que deja por debajo de sí una probabilidad de 0,95, que resulta ser t 0=1,699. tc=11,699 El valor del estadístico es menor que el valor crítico, por consiguiente se acepta la hipótesis nula. La interpretación sería que no hay evidencia de que el programa sea efectivo. 5. En una muestra de 1000 nacimientos el número de varones ha sido 542 ¿Puede considerarse, con un nivel de significación del 10%, que en general nacen más niños que niñas? SOLUCION La hipótesis nula sería que nacen igual número de niños que de niñas, o lo que es lo mismo que la proporción de niños nacidos es igual 1/2. Datos del problema:
H0: p=0,5
H1: p0,5
=0,1
n=1000
El estadístico de contraste en este caso es: z Como la proporción muestral es 542/1000=0,542, sustituyendo se obtiene el valor del estadístico:
10
DR. LUIS J. CASTILLO VASQUEZ
--------------------------------------------------------------------------------------------------------------------------
zc=
x np npq
=
542 / 1000 0,5 0,5(0,5) / 1000
=2,66
Como el contraste es unilateral, buscamos en las tablas de la Normal el valor de la variable que deja por debajo de sí una probabilidad de 0,9, este valor es z0=1,282. De donde: zc=2,661,282 El valor del estadístico 2,66 es mayor que el valor crítico 1,282 por consiguiente, se rechaza la hipótesis nula. Efectivamente, nacen en mayor proporción niños que niñas. 6. Las notas obtenidas en Análisis de Datos de 5 individuos elegidos al azar del grupo T1 y de 6 individuos, elegidos también al azar, del grupo T2 son las siguientes: T1 10 6 4 5 4 T2 4 8 6 6 2 3 Puede concluirse a un nivel de confianza del 95% que las puntuaciones medias de ambos grupos son iguales? o por el contrario que hay diferencia entre ambas. SOLUCION H0: 1-2=0
Datos del problema:
H1: 1-20
=0,05
n1=5 n2=6
Calculando las medias de ambas tablas se obtiene: 1=5,8
2=4,96
S1=4,96
S2=4,14
1 2 =0,05
tC=
tC=
n 1S12 n 2S22 n1 n 2 2
1 1 n1 n 2
5,8 4,96 5(4,96) 6(4,14) 1 1 9 5 6
=
=0,68
Con 9 grados de libertad en la tabla t: p=0,975 t 0=2,262
11
DR. LUIS J. CASTILLO VASQUEZ
--------------------------------------------------------------------------------------------------------------------------
De donde
tc=0,682,262. La interpretación sería que no hay evidencia de
diferencias significativas entre ambos grupos. 7. Los errores aleatorios cometidos en las pesadas de una cierta balanza siguen una distribución normal de media 0 y desviación estancar 1 mgr. Después de 9 pesadas se ha comprobado los siguientes errores (en mgr): -0,07 0,3 1,8 -0,1 2 2,3 0,52 0,12 1,4 a) Demostrar que existe una región critica U.M.P. para contrastar las hipótesis de que la balanza funciona correctamente, frente a la alternativa de que tiene un error sistemático positivo. b) ¿Cual de las dos hipótesis, puede acercarse con un nivel de significancia =0,1? SOLUCION Datos del problema: H0: =0
=0
=1
H1: 0
n=9 =0,05
x =0,92
S=0,95
z0=1,29 (tablas)
El estadístico de contraste en este caso es: z z0=
x / n
=
0,92 0 =2,79 1/ 9
Decision: Z0=2,791,29 Z0RR/H0
Se concluye:
Se acepta H1: 0, es decir, la balanza no funciona correctamente. 8. El salario promedio de los empleados de las industrias siderúrgicas es de 2,5 salarios mínimos, con una desviación estándar de 0,5 salarios mínimos. Si una firma particular tiene 49 empleados con un salario medio de 2,3 salarios mínimos apodemos afirmar que esta industria paga salarios inferiores? SOLUCION
12
DR. LUIS J. CASTILLO VASQUEZ
--------------------------------------------------------------------------------------------------------------------------
Datos del problema: H0: =2,3
=2,5
=0,5
H1: 2,3
n=49 =0,05
z0=-1,64 (tablas)
El estadístico de contraste en este caso es: z z0=
x / n
=
2,3 2,5 =-2,8 0,5 / 49
Decisionón: Z0=-2,79-1,29 Z0RR/H0
Se concluye:
Se acepta H1: 2,3, es decir, la industria si paga salarios inferiores. 9. La precipitación pluviométrica anual en la Sierra tiene desviación estándar conocida =3,1 y media desconocida. Para los últimos años fueron obtenidos os siguientes resultados: 30,50 34,10 27,90 35,00 26,90 30,20 28,30 31,70 25,80 a) Construya una prueba de hipótesis para saber si la media de la precipitación pluviométrica anuales menor o igual que 30 unidades. Utilice un nivel de significancia del 5%. b) Discuta el mismo problema, considerando 2 desconocida. c) Suponiendo que, en realidad, =33, ¿cuál es la probabilidad de llegar a una conclusión errada en el caso a? SOLUCION Datos del problema:
H 0: =30
H 1: 30
=0,05
z0=-1,64
(tablas) Con la tabla anterior, se calcula el promedio y la desviación Standard: x =30,04
S=3,15 13
DR. LUIS J. CASTILLO VASQUEZ
--------------------------------------------------------------------------------------------------------------------------
El estadístico de contraste en este caso es: z z0=
x / n
=
30,04 30 =0,038 3,15 / 9
Decisión: Z0=0,038-1,64 Z0RA/H0
Se concluye:
Se acepta H1: =30, es decir, la medida de la precipitación es menor o igual a 30. b) De la tabla t: t=-1,86 El estadístico de contraste en este caso es: z tc=
x / n
=
30,04 30 =0,038 3,15 / 9
Decisión: t0=0,038-1,86 Z0RA/H0
Se concluye:
Se acepta H1: =30, es decir, la medida de la precipitación es menor o igual a 30. 10. La cantidad promedio que se coloca en un recipiente en un proceso de llenado se supone que es de 20 onzas. En forma periódica, se escogen al azar 25 recipientes y el contenido de cada uno de estos se pesa. Se juzga el proceso como fuera de control cuando la media muestra! es menor o igual a 19,8 o mayor o igual a 20,2 onzas. Se supone que la cantidad que se vacía en cada recipiente se encuentra aproximada, en forma adecuada, por una distribución normal con una desviación estándar de 0,5 onzas. Enuncie las hipótesis nula y alternativa que son propias para esta situación. SOLUCION Datos del problema: H0: =20
=19,8
=0,5
H1: 20
n=25
=0,05
El estadístico de contraste en este caso es: z z1=
x / n
=
19,8 20 =-2 0,5 / 25 14
DR. LUIS J. CASTILLO VASQUEZ
--------------------------------------------------------------------------------------------------------------------------
z2=
x / n
=
20,2 20 =2 0,5 / 25
En las tablas de distribución Standard: p (z-2)=0,0275
p (z2)=0,075
hipótesis nula: La situación esta controlada si el proceso tiene una media muestral entre 19,8 y 20,2 al 94,5% de confianza.
11. Un médico desea saber si una cierta droga reduce la presión arterial media. El medió la presión arterial en 5 voluntarios, antes y después de la aplicación de la droga, obteniendo los resultados que se dan en la siguiente tabla. Voluntario Antes Después
A 68 60
B 80 71
C 90 88
D 72 74
E 80 76
¿Usted cree que existe evidencia estadista de que la droga reduce la presión arterial media? SOLUCION Con los datos dados obtenemos las medias y desviaciones estándar: nA=5 nB=5 X A =75 X B =73,8 SA=6 H0:AB
H1: AB
SB=10,59
=0,05 t0=1,86
Estadístico: x1 x 2 TC= ( n 1 1)S (n 2 1)S n1 n 2 2 2 1
75 73,8 2 2
1 1 n1 n 2
= 4(36) 4(10,59) 2 =0,229 (2 / 5) 552
Decisión: Como TC=0,2291,86 TCRA/H0 Al nivel de 5% no hay evidencia estadística de que la droga reduce la
presión. 12. La asociación de los propietarios de industrias metalúrgicas están muy preocupados por el tiempo perdido en accidentes de trabajo cuya media en los últimos tiempos ha sido del orden de 60 horas/hombre por año y desviación estándar de 20 horas/hombre. Se probó un programa de 15
DR. LUIS J. CASTILLO VASQUEZ
--------------------------------------------------------------------------------------------------------------------------
prevención de accidentes y, después del mismo, se tomó una m.a. de 9 industrias y se determinó el número de horas/hombre perdidas accidentes que fue de 50 horas. ¿usted diría, al nivel de 5%, que hay evidencia de mejoría? SOLUCION =60
=20
n=9 x =50
H0: =60
H1: 0
=0,05
z0=1,64 (tablas)
El estadístico de contraste en este caso es: z z0=
x / n
=
50 60 =-1,5 20 / 9
Decisión: Z0=-1,5-1,64 Z0RA/H0
Se concluye:
No hay mejoría. 13. Los errores aleatorios cometidos en las pesadas de una cierta balanza siguen una distribución normal de media 0 y desviación estancar 1 mgr. Después de 9 pesadas se ha comprobado los siguientes errores (en mgr): -0,07 0,3 1,8 -0,1 2 2,3 0,52 0,12 1,4 a) Demostrar que existe una región critica U.M.P. para contrastar las hipótesis de que la balanza funciona correctamente, frente a la alternativa de que tiene un error sistemático positivo. b) ¿Cual de las dos hipótesis, puede acercarse con un nivel de significancia =0,1? SOLUCION =0
=1
n=9
H0: =0
x =0,92
S=0,95
H1: 0
=0,05
z0=1,29 (tablas)
El estadístico de contraste en este caso es: z z0=
x / n
=
0,92 0 =2,79 1/ 9
Decisión: Z0=2,791,29 Z0RR/H0 16
DR. LUIS J. CASTILLO VASQUEZ
--------------------------------------------------------------------------------------------------------------------------
Se concluye:
Se acepta H1: 0, es decir, la balanza no funciona correctamente. 14. El salario promedio de los empleados de las industrias siderúrgicas es de 2,5 salarios mínimos, con una desviación estándar de 0,5 salarios mínimos. Si una firma particular tiene 49 empleados con un salario medio de 2,3 salarios mínimos apodemos afirmar que esta industria paga salarios inferiores? SOLUCION =2,5
=0,5
n=49
H0: =2,3
H1: 2,3
=0,05
z0=-1,64 (tablas)
El estadístico de contraste en este caso es: z z0=
x / n
=
2,3 2,5 =-2,8 0,5 / 49
Decisión: Z0=-2,79-1,29 Z0RR/H0
Se concluye:
Se acepta H1: 2,3, es decir, la industria si paga salarios inferiores. 15. La precipitación pluviométrica anual en la Sierra tiene desviación estándar conocida =3,1 y media desconocida. Para los últimos años fueron obtenidos os siguientes resultados: 30,50
34,10
27,90
35,00 26,90 30,20 28,30 31,70 25,80
a) Construya una prueba de hipótesis para saber si la media de la precipitación pluviométrica anuales menor o igual que 30 unidades. Utilice un nivel de significancia del 5%. b) Discuta el mismo problema, considerando 2 desconocida. c) Suponiendo que, en realidad, =33, ¿cuál es la probabilidad de llegar a una conclusión errada en el caso a? SOLUCION H0: =30
H1: 30
=0,05
z0=-1,64 (tablas)
Con la tabla anterior, se calcula el promedio y la desviación Standard: x =30,04
S=3,15
El estadístico de contraste en este caso es: z 17
DR. LUIS J. CASTILLO VASQUEZ
--------------------------------------------------------------------------------------------------------------------------
z0=
x / n
=
30,04 30 =0,038 3,15 / 9
Decisión: Z0=0,038-1,64 Z0RA/H0
Se concluye:
Se acepta H1: =30, es decir, la medida de la precipitación es menor o igual a 30. b) De la tabla t: t=-1,86 El estadístico de contraste en este caso es: z tc=
x / n
=
30,04 30 =0,038 3,15 / 9
Decisión: t0=0,038-1,86 Z0RA/H0
Se concluye:
Se acepta H1: =30, es decir, la medida de la precipitación es menor o igual a 30. 16. La cantidad promedio que se coloca en un recipiente en un proceso de llenado se supone que es de 20 onzas. En forma periódica, se escogen al azar 25 recipientes y el contenido de cada uno de estos se pesa. Se juzga el proceso como fuera de control cuando la media muestra! es menor o igual a 19,8 o mayor o igual a 20,2 onzas. Se supone que la cantidad que se vacía en cada recipiente se encuentra aproximada, en forma adecuada, por una distribución normal con una desviación estándar de 0,5 onzas. Enuncie las hipótesis nula y alternativa que son propias para esta situación. SOLUCION =19,8
=0,5
H0: =20
n=25 H1: 20
=0,05
El estadístico de contraste en este caso es: z z1=
x / n
=
19,8 20 =-2 0,5 / 25
18
DR. LUIS J. CASTILLO VASQUEZ
--------------------------------------------------------------------------------------------------------------------------
z2=
x / n
=
20,2 20 =2 0,5 / 25
En las tablas de distribución Standard: p (z-2)=0,0275
p (z2)=0,075
hipótesis nula: La situación esta controlada si el proceso tiene una media muestral entre 19,8 y 20,2 al 94,5% de confianza.
17. Una m. a. de 25 elementos dio una media de 13,5 y una desviación estándar de 4,4. Efectuar un contraste de las hipótesis H 0:=16 VS H1: 16 al nivel de 5%. Suponga que la muestra fue extraída de una población N (,2), donde 2 es conocida. RPTA: n=25 elementos H0:=16
H1: 16
x =25 S=4.4 =0,05
Estadístico: t=
x S/ n
=
13,5 16 4,4 / 25
=-2,841
Discusión: Como t0=-2,841-1,96 t0R/H0
Se concluye: H1: 16
18. Un inversionista En una determinada población juvenil, el peso, en Kg sigue una distribución normal N(50,10). Si se extrae una muestra aleatoria de 25 jóvenes y para un nivel de significación del 5%, ¿en qué condiciones se rechazaría la hipótesis de que la media de la población es de 50 Kg? SOLUCION Determinamos z/2 para un nivel de significancia del 5%: P z / 2 z z / 2 =0,95
P (zz/2)0,975
z/2=1,96
De tablas, determinamos: z/2=1,96 El intervalo de confianza: 50-1,96(10)
1.96(10) 25
z50+1,96(10)
1.96(10) 25 19
DR. LUIS J. CASTILLO VASQUEZ
--------------------------------------------------------------------------------------------------------------------------
46,08z53,92 Rechazamos la hipótesis cuando el valor de la media de la muestra no pertenezca al intervalo de confianza obtenido. 19. Un médico desea saber si una cierta droga reduce la presión arterial media. El medió la presión arterial en 5 voluntarios, antes y después de la aplicación de la droga, obteniendo los resultados que se dan en la siguiente tabla. Voluntario Antes Después
A 68 60
B 80 71
C 90 88
D 72 74
E 80 76
¿Usted cree que existe evidencia estadista de que la droga reduce la presión arterial media? SOLUCION Con los datos dados obtenemos las medias y desviaciones estándar: nA=5 nB=5 X A =75 X B =73,8 SA=6 H0:AB
H1: AB
=0,05 t0=1,86
Estadístico: x1 x 2 TC= ( n 1 1)S (n 2 1)S n1 n 2 2 2 1
SB=10,59
75 73,8 2 2
1 =0,229 1 = 4(36) 4(10,59) 2 (2 / 5) 552 n1 n 2
Decisión: Como TC=0,2291,86 TCRA/H0 Al nivel de 5% no hay evidencia estadística de que la droga reduce la
presión.
PROBLEMAS PROPUESTOS 1. El peso medio de una muestra aleatoria de 81 personas de una determinada población es de 63,6 kg. Se sabe que la desviación típica poblacional es de 6 kg. Con un nivel de significación del 0,05, ¿hay
20
DR. LUIS J. CASTILLO VASQUEZ
--------------------------------------------------------------------------------------------------------------------------
suficientes evidencias para rechazar la afirmación de que el peso medio poblacional es de 65 kg? 2. Una encuesta realizada a 64 empleados de una fábrica, concluyó que el tiempo medio de duración de un empleo en la misma es de 6,5 años, con una desviación típica de 4. ¿Sirve esta información para aceptar, con un nivel de significación del 5%, que el tiempo medio de empleo en esa fábrica es menor o igual que 6? Justifica adecuadamente la respuesta. 3. Se sabe que la renta anual de los individuos de una localidad sigue una distribución normal de media desconocida y de desviación típica 0,24 millones. Se ha observado la renta anual de 16 individuos de esa localidad escogidos al azar, y se ha obtenido un valor medio de 1,6 millones
de
pesetas.
Contrasta, a un nivel de significación del 5%, si la media de la distribución es de 1,45 millones de pesetas. i. ¿Cuáles son las hipótesis nula y alternativa del contraste? ii. Determina la forma de la región crítica. iii. ¿Se acepta la hipótesis nula con el nivel de significación indicado? 4. En los folletos de propaganda, una empresa asegura que las bombillas que fabrica tienen una duración media de 1600 horas. A fin de contrastar este dato, se tomó una muestra aleatoria de 100 bombillas, obteniéndose una duración media de 1.570 horas, con una desviación típica de 120 horas. ¿Puede aceptarse la información de los folletos con un nivel de confianza del 95%? 5. Muchos consumidores están recurriendo a productos genéricos como una forma de reducir el costo de medicamentos por prescripción. Un estudio sobre 102 médicos indica que sólo 47 de los médicos entrevistados conocía el nombre genérico de la metadona. ¿Proporciona esto fuerte evidencia para concluir que menos de la mitad de todos los médicos conocen el nombre genérico de la metadona? 6.
Una empresa desea capacitar al personal a través de un curso. Para evaluar la efectividad se eligieron 6 empleados y se los evaluó antes y después del curso. Suponga que la diferencia entre el puntaje obtenido
21
DR. LUIS J. CASTILLO VASQUEZ
--------------------------------------------------------------------------------------------------------------------------
antes y después del curso sigue una distribución normal. Los puntajes obtenidos, dados en el archivo capacitación.sx son los siguientes: Empleado 1 2 3 4 5 6 Antes 127 195 162 170 143 205 Después 135 200 160 182 147 200 Aplique el test que considere conveniente a un nivel que no supere el 3%. Para decidir si el curso fue efectivo. 7. Se realizó un experimento para medir el efecto del ozono. Un grupo de 22 ratones de 70 días de edad se mantuvo durante 7 días en un ambiente que contenía ozono y se registró el aumento de peso. Otro grupo de 21 ratones de edad similar se mantuvo en un ambiente libre de ozono por un período similar de tiempo y se registró su aumento de peso. Los datos (en gramos) se presentan en el archivo ozono.sx. i. Interesa hacer un test para decidir si en la población de ratones que viven en un ambiente con ozono el aumento medio de peso es 12.3 g. Decida qué test usará. Considere la hipótesis alternativa bilateral. ¿Cuál es la conclusión? ii. Compare el aumento de peso de los ratones sometidos a los dos tratamientos. Seleccione el test a utilizar, en base a la evaluación del cumplimiento de los supuestos. 8.
En un estudio de mercado se desea analizar la preferencia del consumidor con respecto a dos marcas de gaseosas. Se seleccionan al azar 8 personas y se les pide que clasifiquen las bebidas mediante una escala dentro del intervalo [1,10]. Se obtiene la siguiente información que se encuentra en el archivo gaseosas.sx: Persona 1 2 3 4 5 6 7 8 Marca A 9 6 6 8 2 7 3 4 Marca B 4 5 7 4 3 4 1 5 Mediante el uso del test del signo, ¿encuentra evidencias de que existe diferencia en la preferencia de estas dos bebidas? Utilice un nivel menor a 0.1.
9. Se sospecha que ser madre fumadora es un factor que tiene influencia en el bajo peso al nacer. Con el fin de analizar esta teoría se realizó un 22
DR. LUIS J. CASTILLO VASQUEZ
--------------------------------------------------------------------------------------------------------------------------
estudio para las distintas razas. ¿Proporcionan los datos del archivo fumadoras. (fuma=1, blanca=1) suficiente evidencia para concluir que la proporción de madres fumadoras es estadísticamente distinta en la raza blanca y en la raza negra? 10. Una moneda se lanza 6 veces y se obtienen 6 caras. .Puede deducirse a nivel de significación del 0’05 que la moneda esta trucada? 11. El gremio de restaurantes de Madrid afirma que el precio medio del menú del día es 5 euros. Para saber si es cierto, se toma una muestra de 40 restaurantes, resultando que el precio medio es de 5’85 euros con desviación típica 0’48 euros. ¿Que podemos decir al 95% de confianza? 12. El propietario de una pizzería sospecha que su repartidor esta utilizando la moto del reparto para uso propio. Sabe, por experiencias anteriores, que el recorrido diario de la moto sigue una distribución normal de media 14 km. y desviación típica 2 km. 13. Decide comprobar sus sospechas, y para ello contabiliza los kilómetros recorridos por la moto durante 10 días y obtiene: 14’5, 17, 16, 15, 12’5, 19, 14, 16.5, 15’5, 17 (km.). Con una confianza del 95%, .debe despedir al repartidor? 14. El estudio de un test de satisfacción de usuario que rellenan todos los demandantes de servicios de una gran empresa revela que la nota media que otorgan es de 5’70 puntos con una desviación típica de 0’5. Posteriormente, se ha realizado un muestreo a 100 usuarios de la zona de influencia A, obteniéndose la puntuación media de 5,6. Con una confianza del 95%, .se puede afirmar que la nota media es menor en esa zona o la diferencia de notas se debe al azar? Determina los errores de tipo I y II en el contexto del problema. 15. Hace 10 años, el 52% de los ciudadanos estaban en contra de una ley. Recientemente, se ha elaborado una encuesta a 400 personas y 184 se mostraron contrarios a la ley. Con estos datos y con un nivel de significación de 0,01, .podemos afirmar que la proporción de contrarios a la ley ha disminuido? 16. El peso de los pollos de una granja sigue una normal con media 2’6 kg. y desviación típica 0,5 kg. Se experimenta un nuevo tipo de alimentación con 49 cr´ıas. Cuando se hacen adultas se les pesa, resultando una 23
DR. LUIS J. CASTILLO VASQUEZ
--------------------------------------------------------------------------------------------------------------------------
media de 2’78 kg. .Puede afirmarse que el peso medio ha aumentado o por el contrario se ha mantenido, con un nivel de significación del 1 %? 17. Un experto, basado en anteriores comicios, sostiene que si se celebran elecciones generales en este momento, tan solo acudiría a votar el 48% de la población. No obstante, en un sondeo electoral realizado recientemente entre 1500 personas, 800 tienen intención de votar. .Supone esto, con un nivel de confianza del 99%, que el experto se equivoca y la intención de voto es mayor? 18. Se ha llevado a cabo un estudio en diferentes países de la Unión Europea del porcentaje de la población que accede a la enseñanza superior. En los países escogidos se han obtenido los valores siguientes, medidos en tanto por ciento: 23’5, 35, 29’5, 31, 23, 33’5, 27, 28, 30’5. Se supone que estos porcentajes siguen una distribución normal con desviación típica del 5%. Se desea contrastar con una significación del 5% si los datos anteriores son compatibles con un valor medio del porcentaje de la población que cursa estudios superiores igual al 28%. .Es posible aceptar la hipótesis con el nivel de significación indicado? 19. En los últimos tiempos, las ventas medias en un comercio rondaban los 1200 diarios. Sin embargo, hace unos meses se abrió una superficie comercial cerca del mismo. El establecimiento defiende que las ventas medias se mantienen, o incluso, han aumentado, pero que no han disminuido. 20. Según la ley electoral de cierto país, para obtener representación parlamentaria un partido político ha de conseguir, en las elecciones correspondientes, al menos el 5% de los votos. Próximas a celebrarse tales elecciones, una encuesta realizada sobre 1000 ciudadanos elegidos al azar revela que 36 de ellos votarían al partido P. .Puede estimarse, con un nivel de significación del 5%, que P obtendría representación parlamentaria? Y con una significación del 1%? 21. En una determinada población juvenil, el peso, en kg, sigue una distribución normal, de media 50 kg y desviación típica 10 kg. Si se extrae una muestra aleatoria de 25 jóvenes y para un nivel de
24
DR. LUIS J. CASTILLO VASQUEZ
--------------------------------------------------------------------------------------------------------------------------
significación del 5 %, .en qué condiciones se rechazaría la hipótesis de que la media de la población es de 50 kg? 22. El peso medio de una muestra aleatoria de 81 personas de una determinada población es de 63’5 kg. Se sabe que la desviación t´ıpica poblacional es de 6 kg. Con un nivel de significación de 0’05, .hay suficientes evidencias en la muestra para rechazar la afirmación de que el peso medio Poblacional es de 65 kg.
25