Bioestadística Problemas resueltos Manuel Angel Barea Gómez
19 de diciembre de 2012
Usted es libre de: copiar, distribuir y comunicar públicamente la obra Remezclar — transformar la obra
Bajo las siguientes condiciones: b
Reconocimiento — Debe reconocer los créditos de la obra de la manera especificada por el autor o el licenciador (pero no de una manera que sugiera que tiene su apoyo o apoyan el uso que hace de su obra).
e
No comercial — No puede utilizar esta obra para fines comerciales.
a
Compartir bajo la misma licencia — Si altera o transforma esta obra, o genera una obra derivada, sólo puede distribuir la obra generada bajo una licencia idéntica a ésta.
Este obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-CompartirIgu Reconocimiento-NoComercial-CompartirIgual al 3.0 Unported.
Manuel Angel Barea Gómez
2
Índice general
Página Índice general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
Capítulo Capítulo 1 Estadíst Estadística ica Descripti Descriptiva va . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
Capítulo 2 Variables Bidimensionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
30
Capítulo Capítulo 3 Probabili Probabilidad dad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
54
Capítulo 4 Variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
76
Capítulo 5 Intervalos de confianza y contrastes de hipótesis paramétricas de una población. población. . . . . . . . . . . . . . . . . . .
97
Capítulo 6 Intervalos de confianza y constrates constrates de hipótesis paramétricos paramétricos en dos o más poblaciones. poblaciones. . . . . . . . . . . . . . 108 Capítulo 7 Contrastes de hipótesis no paramétricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
3
CAPÍTULO CAPÍTULO 1. ESTADÍSTI ESTADÍSTICA CA DESCRIPTIV DESCRIPTIVA
2 1
0 1
8 a i c n e u c e r F
6
4
2
0
4
6
8
10
Peso
x =
∑( xi ni ) n
·
= 350 50 = 7
M o = 7 y M e = 7 R = xmax s2 =
∑( xi x) ni n
− ·
=
− x
xi2 ∑ ni x n
s=
−3 = 8 2 − x2 = 2612 50 − 7 = 3, 24
min
·
= 11
√ 3, 24 = 1, 8 1,8
CV = xs = 7 = 0, 257
·24 = 12 que se corresponde con P24 = 6 n·k Para el cálculo del P24 → 100 = 50100 Problema 1.2.
A continuación se dan los resultados obtenidos con una muestra de 50 universitarios. la característica es el tiempo de reacción ante un estímulo auditivo:
0,110 0,113 0,124 0,117 0,108 0,11 ,118
0,110 0,098 0,118 0,111 0,120 0,10 ,106
0,110 0,098 0,118 0,111 0,120 0,10 ,106
0,112 0,105 0,108 0,101 0,102 0,09 ,094
0,117 0,103 0,115 0,112 0,129 0,111 1114
0,113 0,119 0,120 0,111 0,115
(a) ¿Cuál es la amplitud total total de la distribución distribución de los datos? datos? (b) Obtenga la distribución de frecuencias frecuencias absolutas y relativas. relativas. (c) Obtenga la distribución de frecuencias frecuencias acumuladas, absolutas y relativas. relativas. (d) Calcular Calcular la media, varianza varianza y coeficiente de variación. variación. (e) Dibuje el polígono de frecuencias frecuencias relativas. relativas. (f) Dibuje el polígono de frecuencias frecuencias relativas relativas acumuladas.
Manuel Angel Barea Gómez
5
0,135 0,100 0,107 0,119 0,121
0 , 1 07 0 , 1 17 0 , 1 23 0 , 1 03 0 , 1 30
0,122 0,113 0,109 0,100 0,134
CAPÍTULO CAPÍTULO 1. ESTADÍSTI ESTADÍSTICA CA DESCRIPTIV DESCRIPTIVA
Q3 = Lin f +
n·k 100 N i−1 ni
−
· a = 30 + 200,2592−130 · 5 = 33, 82 i
El intervalo mediano n2 = 267 2 = 133, 5 será [30 − 35] M e = Lin f +
n·k 100 N i−1 ni
−
· a = 30 + 133,925−130 · 5 = 30, 19 i
Para conocer el porcentaje de mujeres mayores de 28 años que se quedaron embarazadas. Sabemos que el intervalo será [25 − 30] P = Lin f +
·
n k
100
n·k 100 N i−1 ni
−
· a = 25 + i
·
n k
100
−46 · 5 = 28, despejando
84
)·92 ·100 = 36, 10 = (28−25 + 46 = 96 luego k = 96267 5
Como lo que nos piden son los que están por encima de P28 = 1 − 0, 361 = 0, 6398
Problema 1.22.
En un reconocimiento médico realizado a los 1000 trabajadores de una factoría industrial, se ha medido la tensión arterial sistólica (mm.Hg) obteniendo la siguiente distribución de frecuencias. Completar la tabla sabiendo que la mediana de los datos es 138mm.Hg
Categoría Óptima Normal Normal-Elevada HTA-Leve HTA-Moderada HTA-Severa
Intervalo [110 − 120] (120 − 130] (130 − 140] (140 − 160] (160 − 180] (180 − 220]
ni
120 350 260 120
Llamamos a y b a las incógnitas del primer y último intervalo y construimos nuestra tabla. Categoría Óptima Normal Normal-Elevada HTA-Leve HTA-Moderada HTA-Severa
Intervalo [110 − 120] (120 − 130] (130 − 140] (140 − 160] (160 − 180] (180 − 220]
ni
N i
a 1 20 3 50 2 60 1 20 b
a 120+a 470+a 730+a 850+a 850+a+b
Del enunciado 1000 = a + b + 850 → 150 = a + b. n·k − N (470+a) · 10 = 138 luego 470 + a = − De la mediana M e = Lin f + 100 ni i−1 · ai = 130 + 500−350 tuyendo en la primera ecuación b = 150 − 100 = 50
(138 130) 350
−
10
·
− 500
→
Problema 1.23.
a = 100 y susti-
La siguiente tabla recoge la distribución de frecuencias de triglicéridos (en mg/dl) en el suero de un grupo de niños con 6 años. Completar la tabla sabiendo que el percentil 20 de esta distribución es 32 mg/dl.
Nive Nivell de trigl rigliicér céridos idos 10-2 10-200 ni
Manuel Angel Barea Gómez
20-3 20-300 10
3030-40 4040-50 15 24
24
5050-60 6060-70 18 12
70-8 70-800 4
80-9 80-900 2
C APÍTULO
2 Variables Bidimensionales
Problema 2.1.
Se realiza un estudio para establecer una ecuación mediante la cual se pueda utilizar la concentración de estrona en saliva(X ) para predecir la concentración del esteroide en plasma libre (Y ). Se extrajeron los siguientes datos de 14 varones sanos: X Y
1,4 30
77,,5 25
8,5 31,5
9 27,5
9 39,5
11 38
1133 43
1144 49
1144,5 55
16 48,5
17 51
18 64,5
20 63
2233 68
(a) Estúdiese la posible relación relación lineal entre ambas variables. (b) Obtener la ecuación que se menciona en el enunciado del problema. (c) Determinar la variación de la concentración de estrona en plasma por unidad de estrona en en saliva.
0 6
0 5 y
0 4
0 3
5
10
15
20
x
A la vista de la gráfica del diagrama de dispersión se puede comprobar que la distribución es idónea para utilizar la regresión lineal.
30
CAPÍTULO CAPÍTULO 2. VARIABLES ARIABLES BIDIMENSION BIDIMENSIONALES ALES
−6,63 = 0, 0552 = 120 ,12 Luego la recta de regresión es y = 0, 0552 x + 5, 475. a = y b x = 4, 60 + 0, 0552 15, 86 = 5, 475 b=
s xy s2
−
x
− ·
−
·
·
La recta de regresión x = b · y + a
b=
s xy s y2
a=x
,63 = −06,39 = 16, 96
−
− b · y = 15, 86 + 16, 96 · 4, 6 = 92, 63
y=
−16, 96 · x + 92, 63.
Con un nivel de creatinina y = 4, 1 obtenemos y = −16, 96 · 4, 1 + 92, 63 = 23, 094
Problema 2.6.
En un ensayo clínico realizado tras el posible efecto hipotensor de un fármaco, se evalúa la tensión arterial diastólica (TAD) en condiciones basales (X), y tras 4 semanas de tratamiento (Y), en un total de 14 pacientes hipertensos. Se obtienen los siguiente valores de TAD: X Y
25 30
40 80
120 150
75 80
150 200
3 00 3 50
2 70 2 40
4 00 3 20
4 50 4 70
5 75 5 83
(a) ¿Existe relación lineal entre entre la TAD basal y la que se observa tras el tratamiento? (b) ¿Cuál es el valor de TAD esperado tras el tratamiento, en un paciente que presentó una TAD basal de 95mm.Hg?
0 0 1
5 9
0 9 y
5 8
0 8
5 7
95
100
105 x
Manuel Angel Barea Gómez
36
110
CAPÍTULO CAPÍTULO 2. VARIABLES ARIABLES BIDIMENSION BIDIMENSIONALES ALES ∑( yi ni ) n
s y2 =
∑( yi y) ni n
− ·
=
yi2 ∑ ni y n
·
s y s xy =
∑( xi x) ( yi y) ni n
− · − ·
=
= 650 6 = 108, 33
·
y =
2 − y2 = 70748 6 − 108, 33 = 55, 22 √ = 55, 22 = 7, 43
· ·
xi y yi ∑ ni x n
− ( x · y) = 23026 ,2 − (3, 47 · 108, 33) = 8, 14
La recta de regresión y = b · x + a
= 81,,14 28 = 0, 9666 y = 0, 966 x + 86, 37. a = y b x = 108, 33 0, 9666 3, 47 = 86, 37 b=
s xy s x2
− ·
−
·
·
Para una x = 2, 7 → y = 0, 966 · 2, 7 + 86, 37 = 88, 97
Problema 2.10.
Se ha medido a un grupo de 15 pacientes el nivel de ambiente cargado de humo, obteniendo los siguientes resultados: X Y
5,70 6,10
4,40 4,80
4,90 5,30
0,70 2,20
1,60 3,10
2,10 4,00
1,50 3,20
carboxihemoglobina en sangre antes y después de respirar un
2,90 5,20
3,80 3,80
5,20 5,40
3,20 3,00
(a) Construir el diagrama de dispersión y calcular el coeficiente de correlación de Pearson. Pearson. (b) Obtener la recta de regresión regresión de X sobre Y. Y.
7
6
5 y
4
3
1
2
3
4 x
Manuel Angel Barea Gómez
41
5
6
7
1,30 3,10
1,00 2,60
6,80 6,90
0,50 2,40
CAPÍTULO CAPÍTULO 2. VARIABLES ARIABLES BIDIMENSION BIDIMENSIONALES ALES ∑( xi ni ) n
·
x = s x2 =
∑( xi x) ni n
− ·
xi2 ∑ ni x n
·
=
2 − x2 = 42075 15 − 50, 33 = 271, 55 √ = 271, 55 = 16, 48
s x y = s y2 =
∑( yi y) ni n
− ·
=
∑( xi x) ( yi y) ni n
− · − ·
∑( yi ni ) n
·
·
2 − y2 = 651630 15 − 200, 40 = 3281, 84 √ = 3281, 84 = 57, 28
· ·
xi y yi ∑ ni x n
=
= 3006 15 = 200, 40
yi2 ∑ ni y n
s y s xy =
= 775 15 = 50, 33
r =
s xy s x s y
·
− ( x · y) = 161405 15 − (50, 33 · 200, 40) = 673, 53 ,53 = 16673 ,48·57,28 = 0, 7135
R2 = r 2 = 0, 71352 = 0, 5090
La recta de regresión y = b · x + a
,53 = 673 271,55 = 2, 48 y = 2, 48 x + 75, 56. a = y b x = 200, 40 2, 48 50, 33 = 75, 56
b=
s xy s x2
− ·
−
·
·
Para un x = 50 → y = 2, 48 · 50 + 75, 56 = 199, 56
Problema 2.16.
Los siguientes datos representan las puntuaciones en un test de capacidad memorística y un test de inteligencia obtenida por 10 individuos estudiados: Memoria ( X ) Int eligencia (Y )
17 37
23 58
25 14
36 43
38 27
40 60
42 25
46 33
55 19
62 49
(a) Representar el diagrama de dispersión dispersión correspondiente. A la vista de éste, ¿p uede sacarse alguna conclusión?. (b) Obtener el coeficiente de correlación correlación lineal.
0 6
0 5
0 4 y
0 3
0 2
20
30
40 x
Manuel Angel Barea Gómez
47
50
60
C APÍTULO
3 Probabilidad
Problema 3.1.
El 60% de los individuos de una población están vacunados contra una cierta enfermedad. Durante una epidemia se sabe que el 20 % la ha contraído contraído y que 2 de cada 100 individuos están están vacunados y son enfermos. enfermos. (a) Calcular el porcentaje de vacunados que enferma y el de vacunados entre entre los que están enfermos.
P(V ) = 0, 6 P( E ) = 0, 2 P(V E ) = 0, 02
∩
P ( E /V ) = P (V / E ) =
P(V E ) P(V ) P(V E ) P( E )
∩ ∩
= 00,,02 6 = 0, 033 0,02 = 0,2 = 0, 1
Problema 3.2.
La proporción de alcohólicos que existe en la población de Málaga es, aproximadamente, un 10%; no obstante, en las bajas que dan los médicos de la Seguridad Social difícilmente se encuentra el diagnóstico de alcoholismo. Aparecen sin embargo embargo diagnosticados de hepatopatías, lumbalgias, etc., que pueden hacer sospechar alcoholismo subyacente. Se realizó un estudio que puso de manifiesto que el 85 % de los individuos alcohóli cos y el 7 % de d e los no alcohólicos a lcohólicos sufrían tales patologías. patol ogías. Se desea saber: (a) Cuál es la probabilidad de que un individuo con con esas patologías sea realmente realmente alcohólico.
E Tener patologıa ı´a A Seralcoholico P( A) = 0, 1 ´ E P( / A) = 0, 85 P( E / A) = 0, 07
→ →
→
P( E / A) = 0, 85 P ( A) = 0, 1 P( E / A) = 0, 15 P( E / A) = 0, 07 P A = 0, 9
P ( A/ E ) =
P( E / A) = 0, 93
P( A) P( E / A) P( A) P( E / A)+P( A) P( E / A)
·
·
·
54
,1·0,85 = 0,1·00,85 +0,9·0,07 = 0, 5743
CAPÍTULO CAPÍTULO 3. PROBAB PROBABILID ILIDAD AD
Problema Problema 3.3.
Dos tratamientos A y B curan una determinada enfermedad en el 20% y 30% de los casos, respectivamente. Suponiendo que ambos actúan de modo independiente, cuál de las dos siguientes estrategias utilizaría para curar a un individuo con tal enfermedad: (a) Aplicar ambos ambos tratamiento tratamientoss a la vez. (b) Aplicar primer primero o el tratamiento B y, y, si no surte efecto, aplicar aplicar el A.
A B
→ TratamientoA → P ( A) = 0, 2 → TratamientoB → P(b) = 0, 3
Cómo son sucesos independientes
P ( A B) = P ( A) + P ( B) = 0, 2 + 0, 3 = 0, 5 P ( A B) P ( A) P( B) = 0, 2 0, 3 = 0, 06
∪ ∩ →
·
·
Luego P ( A ∩ B) = 0, 06
∩
P A B = P ( A) P ( A/ B) =
P( A B)
∩
P( B)
− P ( A ∩ B) = 0, 2 − 0, 06 = 0, 14
= 00,,14 7 = 0, 2
Problema 3.4.
Se eligen al azar 3 deportistas de un equipo de 10 integrantes para realizar un control antidopaje; Se sabe que 2 de los jugadores jugadores del equipo han tomado sustancias sustancias prohibida prohibidas. s. ¿Cuál es la probabili probabilidad dad de elegir elegir para el análisis análisis a alguno de los infractores?
A
ı´bidas → No tomarsustancias prohıbidas
P ( A) =
8 3 10 3
=
56 120
= 0, 46
La probabilidad de elegir uno de los infractores es el suceso contrario P A = 1 − 0, 46 = 0, 54
Problema Problema 3.5.
Estamo Estamoss intere interesad sados os en saber saber cuál cuál de dos análisi análisiss A y B es mejor mejor para para el diagnós diagnóstic tico o de una determ determinad inada a enferm enfermeda edad, d, de la cual sabemos que la presentan un 10% de individuos de la población. El porcentaje de resultados falsos positivos del análisis A es del 15 % y el de B es del 22 %. El porcentaje de falsos negativos de A es del 7 % y de B es del 3 . ¿Cuál es la probabilidad de acertar en el diagnóstico con cada método?
Para el tratamiento A P(T +/ E ) = 0, 93 P ( E ) = 0, 1 P(T −/ E ) = 0, 07 P(T +/ E ) = 0, 15 P E = 0, 9
Manuel Angel Barea Gómez
P(T −/ E ) = 0, 85
55
CAPÍTULO CAPÍTULO 3. PROBAB PROBABILID ILIDAD AD P (T +/ E ) P ( E ) + P (T −/ E ) P E = 0, 93
·
·
Para el tratamiento B
· 0, 1 + 0, 9 · 0, 85 = 0, 858 P(T +/ E ) = 0, 97
P ( E ) = 0, 1 P(T −/ E ) = 0, 03 P(T +/ E ) = 0, 22 P E = 0, 9
P(T −/ E ) = 0, 78
P (T +/ E ) P ( E ) + P (T −/ E ) P E = 0, 97
·
·
· 0, 1 + 0, 9 · 0, 78 = 0, 799
Problema 3.6.
Con objeto de diagnosticar la colelitiasis se usan los ultrasonidos. Tal técnica tiene una sensibilidad del 91% y una especificida especificidad d del 98 %. En la población que nos ocupa la probabilidad probabilidad de colelitiasis es del 20%. (a) Si a un individuo de tal población se le aplican los ultrasonidos ultrasonidos y dan positivos, positivos, ¿cuál es la probabilidad probabilidad de que sufra la colelitiasis? (b) Si el resultado fuese negativo, negativo, ¿cuál es la probabilidad probabilidad de que no tenga la enfermedad?
Lema. Sensibilidad, es la probabilidad de el test de positivo sobre una persona que sabemos que padece la enfermedad Especificidad, es la probabilidad que el test de negativo sobre una persona que no la padece, P (T −/ E )
P (T +/ E ).
P(T +/ E ) = 0, 91 P ( E ) = 0, 2 P(T −/ E ) = 0, 09 P(T +/ E ) = 0, 02 P E = 0, 8
P ( E /T + ) =
P ( E /T − ) =
P(T / E ) = 0, 98
−
P( E ) P(T +/ E )
·
P( E ) P(T +/ E )+P( E ) P(T +/ E )
·
·
,2·0,91 = 0,2·0,091 +0,8·0,02 = 0, 9191
P( E ) P(T −/ E )
·
,8·0,98 = 0,2·0,009 +0,8·0,98 = 0, 9775 P( E )·P( −/ E )+P( E )·P(T −/ E ) T
Problema 3.7. Entre los estudiantes de una Facultad de Filosofía y Letras se dan las siguientes proporciones: el 40 % son hombres. El 70 % de los varones fuman, mientras que entre las mujeres sólo fuman el 20 %. Escogido un estudiante al azar, azar, calcúlese la probabilidad de que fume.
Manuel Angel Barea Gómez
H Hombre P ( H ) = 0, 4 F Fumador P (F / H ) = 0, 7 P (F / H ) = 0, 2
→ →
→
56
CAPÍTULO CAPÍTULO 3. PROBAB PROBABILID ILIDAD AD P(F / H ) = 0, 7 P ( H ) = 0, 4 P(F / H ) = 0, 3 P(F / H ) = 0, 2 P H = 0, 6
·
P (F ) = P ( H ) P (F / H ) + P H
·
P(F / H ) = 0, 8 P (F / H ) = 0, 4
· 0, 7 + 0, 6 · 0, 2 = 0, 4
Problema 3.8. Los estudios epidemiológicos indican que el 20% de los ancianos sufren un deterioro neuropsicológico. Sabemos que la tomografía axial computerizada (TAC) es capaz de detectar este trastorno en el 80% de los que lo sufren, pero que también da un 3 % de falsos positivos entre personas sanas. Si tomamos un anciano al azar y da positivo en el TAC, TAC, ¿cuál es la probabilidad de que esté realmente enfermo? P(T +/ E ) = 0, 8 P ( E ) = 0, 2 P(T −/ E ) = 0, 2 P(T +/ E ) = 0, 03 P E = 0, 8
P ( E /T + ) =
P(T −/ E ) = 0, 97
P( E ) P(T +/ E )
·
P( E ) P(T +/ E )+P( E ) P(T +/ E )
·
·
= 0,2·00,8,2+·00,,88·0,03 = 0, 8695
Problema 3.9.
Sabemos que tiene estudios estudios superiores el 15 % de la población española, estudios medios el 40%, estudios primarios el 35% y no tiene estudios el 10%. Los desempleados no se distribuyen proporcionalmente entre esas categorías, dado que de entre los de estudios superiores están sin trabajo el 10%, entre los de estudios medios el 35%, entre los de estudios primarios el 18%, y entre los que no tienen estudios el 37%. Obtenga las probabilidades de que extraído uno al azar, éste sea: (a) Titulado superior, superior, sabiendo que está parado. (b) Un sujeto sin estudios estudios que está está en paro. (c) Un sujeto con estudios estudios primarios primarios o que está trabajando. trabajando.
Manuel Angel Barea Gómez
S TituladoSuperior P (S ) = 0, 15 M Estud E stud ios Medios Med ios P ( M ) = 0, 40 P Est udios Primarios P (P) = 0, 35 N SinEstudios P ( N ) = 0, 10
→ → → →
→
→ → →
57
P ( D/S ) = 0, 10 P ( D/ M ) = 0, 35 P ( D/P) = 0, 18 P ( D/ N ) = 0, 37
CAPÍTULO CAPÍTULO 3. PROBAB PROBABILID ILIDAD AD P( D/S ) = 0, 10 P (S ) = 0, 15 P( D/S ) = 0, 90 P( D/ M ) = 0, 35 P ( M ) = 0, 40 P( D/ M ) = 0, 65 P( D/P) = 0, 18 P (P) = 0, 35 P( D/P) = 0, 82 P( D/ N ) = 0, 37 P ( N ) = 0, 10 P( D/ N ) = 0, 63 0,15·0,10
P(S ) P( D/S )
·
P (S / D) = P(S )·P( D/S )+ )+P( M )·P( D/ M )+ )+P(P)·P( D/P)+P( N )·P( D/ N ) = 0,15·0,10+0,4·0,35+0,35·0,18+0,1·0,37 = 0, 06 0,10·0,37
P( N ) P( D/S )
·
P ( N / D) = P(S )·P( D/S )+ )+P( M )·P( D/ M )+ )+P(P)·P( D/P)+P( N )·P( D/ N ) = 0,15·0,10+0,4·0,35+0,35·0,18+0,1·0,37 = 0, 145
Para poder resolver el tercer apartado debemos desarrollar unos cálculos previos: P D = P (S ) · P ( D/S ) + P ( M ) · P ( D/ M ) + P (P) · P ( D/P) + P ( N ) · P ( D/ N ) = 0, 15 · 0, 9 + 0, 40 · 0, 65 + 0, 35 · 0, 82 + 0, 10 · 0, 63 = 0, 745
P P D = P ( D/P) P (P) = 0, 82
∩
¯ ) = P (P) + P D P (P D
∪
Problema 3.10.
· 0, 35 = 0, 287 − P P ∩ D = 0, 35 + 0, 745 − 0, 287 = 0, 808 ·
Una enfermedad puede estar producida por tres virus A, B, y C. En el laboratorio hay 3 tubos de ensayo con el virus A, 2 tubos con el virus B y 5 tubos con el virus C. La probabilidad de que el virus A produzca la enfermedad es de 1/3 , que la produzca B es de 2/3 y que la produzca el virus C es de 1/7. Se inocula un virus a un animal y contrae la enfermedad. ¿Cuál es la probabilidad de que el virus que se inocule sea el C?
A B C
→ VirusA → P ( A) = 0, 3 → VirusB → P ( B) = 0, 2 → VirusC → P (C ) = 0, 5
P (V / A) = 1/3 P (V / B) = 2/3 P (V /C ) = 1/7 P(V / A) = 1/3
P ( A) = 0, 3 P(V / A) = 2/3 P(V / B) = 2/3 P ( B) = 0, 2 P(V / B) = 1/3 P(V /C ) = 1/7 P (C ) = 0, 5 P(V /C ) = 6/7
Manuel Angel Barea Gómez
58
CAPÍTULO CAPÍTULO 3. PROBAB PROBABILID ILIDAD AD 0,5·1/7
P(C ) P(V /C )
·
P (C /V ) = P( A)·P(V / A)+P( B)·P(V / B)+P(C )·P(V /C ) = 0,3·1/3+0,2·2/3+0,5·1/7 = 0, 231
Problema 3.11.
El 70 % de los estudiantes estudiantes aprueba aprueba una asignatura asignatura A y un 60 % aprueba otra asignatur asignatura a B. Sabemos, además, además, que un 35% del total aprueba ambas. Elegido un estudiante al azar, calcular las probabilidades de las siguientes situaciones: (a) Haya aprobado aprobado la asignatura asignatura B , sabiendo que ha aprobado la
A.
(b) Haya aprobado aprobado la asignatura asignatura B , sabiendo que no ha aprobado la A. (c) No haya aprobado aprobado la asignatur asignatura a B , sabiendo que ha aprobado la
A.
(d) No haya aprobado aprobado la asignatur asignatura a B , sabiendo que no ha aprobado la A. P ( B/ A) =
P( A B) P( A)
∩
= 00,,35 7 = 0, 5
Para el segundo apartado debemos calcular previamente
∩
P A B = P ( B A) = P ( B)
−
P ( B/ A) =
− P ( A ∩ B) = 0, 6 − 0, 35 = 0, 25
P( A B)
∩
P( A)
= 00,,25 3 = 0, 833
Para el tercer apartado debemos calcular previamente
∩
P B A = P ( A B) = P ( A)
−
P ( B/ A) =
− P ( A ∩ B) = 0, 7 − 0, 35 = 0, 35
P( B A) P( A)
∩
= 00,,35 7 = 0, 5
Para el cuarto apartado debemos calcular previamente P B A = P A B = 1 0, 95 = 0, 05 P ( A B) = P ( A) + P ( B) P ( A B) = 0, 7 + 0, 6
∩ ∪ ∪
P ( B/ A) =
− − ∩
P( B A)
∩
P( A)
− 0, 35 = 0, 95
= 00,,05 3 = 0, 167
Problema 3.12.
La cuarta parte de los conductores de coche son mujeres. La probabilidad de que una mujer sufra un accidente en un año es de 5/10000 , y para los hombres es de 1/10000. Calcúlese Calcúlese la probabilid probabilidad ad de que si acaece un accidente, accidente, el accidentado accidentado sea hombre. P( A/ H ) = 0, 0001 P ( H ) = 0, 75 P( A/ H ) = 0, 9999 P( A/ M ) = 0, 0005 P M = 0, 6
P( A/ M ) = 0, 9995 0,75·1/10000
P( H ) P( A/ H )
·
P ( H / A) = P( H )·P( A/ H )+ )+P( M )·P( A/ M ) = 0,75·1/100001/3+0,25·5/10000 = 0, 375
Manuel Angel Barea Gómez
59
CAPÍTULO CAPÍTULO 3. PROBAB PROBABILID ILIDAD AD
Problema 3.13.
En un campus universitario existen 3 carreras sanitarias. Se sabe que el 50% cursan estudios de Enfermería, el 30% Medicina y el 20% Veterinaria. Los que finalizaron sus estudios son el 20, 10 y 5% respectivamente. Elegido un estudiante al azar, hállese la probabilidad de que haya acabado la carrera. P(F / E ) = 0, 20 P ( E ) = 0, 5 P(F / E ) = 0, 8 P(F / M ) = 0, 10 P ( M ) = 0, 3 P(F / M ) = 0, 90 P(F /V ) = 0, 05 P (V ) = 0, 2 P(F /V ) = 0, 95 P (F ) = P ( E ) P (F / E ) + P ( M ) P (F / M ) + P (V ) P (F /V ) = 0, 5
·
·
·
· 0, 2 + 0, 3 · 0, 1 + 0, 2 · 0, 05 = 0, 135
Problema 3.14.
La probabilidad de que una mujer viva dentro de 30 años es 0,25 y la probabilidad de que viva su hijo es 0,9. Calcule la probabilidad de que al cabo de ese tiempo: (a) Ambos vivan. (b) Sólo viva viva la madre. madre. (c) Sólo viva viva el hijo. hijo. (d) Al menos viva viva uno de los dos.
M H
˜ → P ( M ) = 0, 25 → Mu jer vivir 30 anos → Hi jo vivir 30 anos ˜ → P ( H ) = 0, 9
Cómo ambos sucesos son independientes: P ( M H ) = P ( M ) P ( H ) = 0, 25
· 0, 8 = 0, 2 P M ∩ H = P ( M − H ) = P ( M ) − P ( M ∩ H ) = 0, 25 − 0, 2 = 0, 05 P M ∩ H = P ( H − M ) = P ( H ) − P ( M ∩ H ) = 0, 9 − 0, 2 = 0, 7 P ( M ∪ H ) = P ( M ) + P ( H ) − P ( M ∩ H ) = 0, 25 + 0, 9 − 0, 2 = 0, 95 ∩
·
Problema 3.15.
Los quinientos individuos de una muestra se distribuyen en vacunados y no vacunados, y enfermos y no enfermos, de acuerdo con la tabla:
Vacunados No Vacunados Total
Enfe Enferm rmos os 42 96 138
Si se elige un individuo de la muestra al azar Manuel Angel Barea Gómez
60
No enfe enferm rmos os 2 43 1 19 362
Total otal 2 85 2 15 5 00
CAPÍTULO CAPÍTULO 3. PROBAB PROBABILID ILIDAD AD
(a) ¿Cuál es la probabilidad probabilidad de que esté enfermo enfermo o haya sido vacunado? (b) Si el individuo individuo elegido elegido está enfermo, ¿cuál es la probabilidad probabilidad de que no haya sido vacunado? vacunado?
E V
P ( E ) = 138 500 P (V ) = 285 500 42 P ( E V ) = 500 P ( E V ) = P ( E ) + P (V )
∩ ∪
→ En f ermo → Vacunado
285 42 − P ( E ∩ V ) = 138 500 + 500 − 500 = 0, 762
P ( E ) = 138 P( E ∩V ) 500 P (V / E ) = P( E ) = 96 P E V = 500
∩
96/500 138/500
= 0, 695
Problema 3.16.
De un grupo de niños considerados considerados de alto riesgo, el 60 % tiene bronquitis, bronquitis, el 70 % tiene infección de garganta y el 40 % tiene ambas dolencias. dolencias.
Se escoge un niño al azar: (a) ¿Cuál es la probabilidad de que tenga bronquitis bronquitis o infección de garganta? (b) ¿Cuál es la probabilidad de que no tenga bronquitis y no tenga infección de garganta? (c) Si tiene los bronquitis, ¿Cuál es la probabilidad probabilidad de que tenga infección de garganta? garganta? (d) Si tiene infección de garganta, ¿Cuál es la probabilidad probabilidad de que no tenga bronquitis? bronquitis?
I In f ecciongarganta P ( I ) = 0, 7 ´ B Bronquitis P ( B) = 0, 6 P ( I B) = 0, 4
→ → ∩
→
→
− P ( B ∩ I ) = 0, 6 + 0, 7 − 0, 4 = 0, 9 P B ∩ I = P B ∪ I = 1 − 0, 9 = 0, 1
P ( B I ) = P ( B) + P ( I )
∪
∩
∩
P B I = P ( I B) = P ( I )
Problema 3.17.
−
P ( B/ I ) =
= 00,,46 = 0, 66
P( B I ) P( B)
P ( I / B) =
− P ( B ∩ I ) = 0, 7 − 0, 4 = 0, 3
P( B I ) P( I )
∩
= 00,,47 = 0, 57
Los resultados de un estudio realizado en mil mujeres se recogen en la tabla siguiente:
Clasificación OMS Normal Osteopenia Osteoporosis Total
Menopausia Si No 189 22880 108 359 6 58 303 66997
Se elige una mujer al azar. Calcule la probabilidad de que: Manuel Angel Barea Gómez
61
Total 4 69 467 64 110000
CAPÍTULO CAPÍTULO 3. PROBAB PROBABILID ILIDAD AD
(a) Tenga osteopenia o tenga osteoporosis. (b) Tenga osteoporosis osteoporosis o menopausia. (c) Pueda clasificar clasificarse se como normal. (d) Siendo menopáusica, tenga osteoporosis. osteoporosis. (e) ¿Son independientes los sucesos “tener menopausia” y “tener osteoporosis”? osteoporosis”?
→ → → →
N Normal M Meno pausica ´ Os Osteoporosis O Osteopenia
467 P (O) = 1000 64 P (Os) = 1000 P (O Os) Sucesoincompatible 467 + 64 = 0, 531 P (O Os) = P (O) + P (Os) = 1000 1000
∩ ∪
→
64 P (Os) = 1000 303 P ( M ) = 1000 6 P ( M Os) = 1000 P ( M Os) = P ( M ) + P (Os)
∩ ∪
303 + 64 − 6 = 0, 361 − P ( M ∩ Os) = 1000 1000 1000
469 = 0, 469 P ( N ) = 1000
303 P ( M ) = 1000 6 P ( M Os) = 1000 6/1000 P( M ∩Os) P (Os/ M ) = P( M ) = 303/1000 = 0, 0198
∩
No son independientes porque P ( M ∩ Os) = P ( M ) · P (Os)
Problema 3.18.
En un estudio sobre alcohólicos se informa de que el 40% de los mismos tiene padre alcohólico y el 6%, madre alcohólica. El 42% tiene al menos uno de los padres alcohólicos. Cuál es la probabilidad de que elegido uno al azar: (a) Tenga el padre y la madre madre alcohólicos. (b) Tenga madre alcohólica si lo es el padre. padre. (c) Tenga la madre alcohólica pero pero no el padre alcohólico. (d) Tenga la madre alcohólica si el padre padre no es alcohólico.
P Padrealcoholico P (P) = 0, 4 ´ M Mad realcoh re alcoh olico P ( M ) = 0, 06 ´ P (P M ) = 0, 42
→ → ∪
→ →
P (P M ) = P (P) + P ( M )
∩
− P (P ∪ M ) = 0, 4 + 0, 06 − 0, 42 = 0, 04
P ( M /P) =
∩
P M P = P ( M )
Manuel Angel Barea Gómez
P(P M ) P(P)
∩
= 00,,04 4 = 0, 1
− P ( M ∩ P) = 0, 06 − 0, 04 = 0, 02 62
CAPÍTULO CAPÍTULO 3. PROBAB PROBABILID ILIDAD AD
P ( M /P) =
Problema 3.19.
P(P M )
∩
= 00,,02 6 = 0, 033
P(P)
De los sucesos dependientes A y B, se sabe que:
Calcule:
P ( A B) = 0, 2 P ( B/ A) = 0, 5 P ( A/ B) = 0, 54
∩
(a) P( A) , P( B) y P ( A B).
∪
(b) P( A B) y P ( A B).
∩
∪
P( A B) P( B/ A) P( A B) P( A/ B)
∪ ∩ ∪ P ( A) =
∩ ∩
= 00,,25 = 0, 4
2 = 00,,54 = 0, 37 P ( A B) = P ( A) + P ( B) P ( A B) = 0, 4 + 0, 37
P ( B) =
−
∩
P A B = P ( A) P ( A B) = 0, 4 0, 2 = 0, 2 P A B = P ( A) + P B P A B = 0, 4 + 0, 63
−
∩− ∩ −
− 0, 2 = 0, 57 − 0, 2 = 0, 83
Problema 3.20.
Un laboratorio farmacéutico proyecta fabricar un fármaco, del cual ya existen en el mercado dos marcas A y B. Se sabe que a la hora de comprar ese fármaco la marca A es elegida por el 30% de los consumidores, la marca B por el 50% y el 10% compran A y B. Para decidir si compensa el nuevo proyecto el laboratorio necesita conocer, para un comprador elegido al azar, la probabilidad de que: (a) Compre Compre al menos una de las dos marcas, marcas, A o B. (b) No compre compre ni A ni B. (c) Compre Compre A , supuesto que también compra
B.
(d) No compr compree A , supuesto que tampoco compra
B.
− P ( A ∩ B) = 0, 3 + 0, 5 − 0, 1 = 0, 7 ( ∩ ) P A ∩ B = P A ∪ B = 1 − 0, 7 = 0, 3P ( / ) = ( ) = 00,,15 = 0, 2 P ( A B) = P ( A) + P ( B)
∪
P A/ B =
A B
P( A B)
∩
P( B)
P A B P B
= 00,,35 = 0, 6
Problema 3.21.
El 1% de los individuos de una determinada población padece cierta enfermedad. Una prueba para diagnosticarla da positiva en el 90% de los que la padecen y en el 5% de los que no la padecen. Se elige al azar un individuo de la población: (a) Si se le somete a la prueba de diagnóstico, diagnóstico, calcule la probabilidad probabilidad de que ésta sea positiva. (b) Supuesto Supuesto que la prueba ha sido positiva, positiva, halle la probabilid probabilidad ad de que el individuo individuo tenga la enfermedad. enfermedad.
Manuel Angel Barea Gómez
63
CAPÍTULO CAPÍTULO 3. PROBAB PROBABILID ILIDAD AD P(T +/ E ) = 0, 9 P ( E ) = 0, 01 P(T −/ E ) = 0, 1 P(T +/ E ) = 0, 05 P E = 0, 99
·
P (T + ) = P ( E ) P (T +/ E ) + P E
·
P ( E /T + ) =
P(T / E ) = 0, 95
−
P (T +/ E ) = 0, 01
P( E ) P(T +/ E )
·
T +/ E
)+P( E )·P(T +/ E )
P( E ) P(
·
· 0, 9 + 0, 99 · 0, 05 = 0, 1395
·0,9 = 0,01·00,,901 +0,99·0,05 = 0, 0796
Problema 3.22. El 20% de los fármacos depositados en el almacén de un laboratorio están en el límite de su caducidad. La probabilidad de que un u n fármaco de este tipo produzca los efectos deseados es del 40 %, y la l a de que los produzca un fármaco que no está en dicho límite es del 80%. (a) Se toma al azar un fármaco del almacén. Calcule la probabilidad probabilidad de que produzca produzca los efectos deseados. (b) Si un fármaco elegido al azar no produce los efectos deseados, ¿cuál es la probabilidad de que no se encuentr encuentre e en el límite de su caducidad?
L D
ı´mitecaducidad → Lımitecaducidad → E f ectos desead os P( D/ L) = 0, 4
P ( L) = 0, 2 P( D/ L) = 0, 6 P( D/ L) = 0, 8 P L = 0, 8
·
P ( L) = P ( L) P ( D/ L) + P L
·
P ( L/ D) =
Problema 3.23.
P( D/ L) = 0, 2 P ( D/ L) = 0, 2
P( L) P( D/ L) P( L) P( D/ L)+P( L) P( D/ L)
·
·
·
= 0,2·00,,42+·00,,48·0,8 = 0, 22
Dados dos sucesos aleatorios A y B se sabe que: P B = 34 P ( A) = P ( A/ B) = 13
(a) Razonar Razonar si los sucesos sucesos A y B son independientes. (b) Razonar Razonar si los sucesos sucesos A y B son incompatibles. (c) Calcular Calcular la P( A B)
∪
(d) Calcular las siguientes probabilidades:P probabilidades:P( A B) , P( A B) y P ( A B).
∩
Manuel Angel Barea Gómez
∩
∩
64
· 0, 4 + 0, 8 · 0, 8 = 0, 72
CAPÍTULO CAPÍTULO 3. PROBAB PROBABILID ILIDAD AD
Para saber si son independientes debe cumplirse P ( A ∩ B) = P ( A) · P ( B)
P ( B) = 1 P B = 1 34 = 14 1 P ( A B) = P ( A/ B) P ( B) = 13 14 = 12 1 P ( A B) = P ( A) P ( B) = 13 14 = 12
−
∩ ∩
·
·
−
·
·
Por tanto son independientes
Para saber si son incompatibles debe cumplirse P ( A ∩ B) = 0, luego no son incompatibles.
∪ − P ( A ∩ B) = 13 + 14 − 13 = 12 1 = 1 P( A ∩ B) = P ( A − B) = P ( A) − P ( A ∩ B) = 13 − 12 4 1 = 1 P( A ∩ B) = P ( B − A) = P ( B) − P ( A ∩ B) = 14 − 12 6 P( A ∩ B) = P A ∪ B = 1 − 12 = 12 P ( A B) = P ( A) + P ( B)
Problema 3.24.
En una Universidad de determinada población se pueden estudiar dos titulaciones, Medicina y Enfermería. Se ha realizado una encuesta sobre las preferencias de los estudiantes de segundo de bachillerato de la ciudad, que ha dado los siguientes resultad resultados: os: al 30 % les gustaría gustaría estudiar estudiar únicamente únicamente Medicina; Medicina; al 10 % únicamente únicamente Enfermería Enfermería y al 20 % ninguna de las dos. Elegido Elegido al azar un estudiante de esta ciudad, determinar razonadamente: (a) La probabilidad de que le guste guste estudiar ambas carreras. carreras. (b) La probabilidad de que, que, sabiendo que siente preferencia preferencia por Medicina, también le guste Enfermería. Enfermería. (c) La probabilidad probabilidad de que, sabiendo sabiendo que no le gusta Medicina, si le guste Enfermería Enfermería..
E n f ermer ıa ı´a → En Med icina → Medicina
E M
Por el diagrama se llega a la conclusión P ( M E ) = 1
∩
P ( E / M ) =
Problema 3.25.
−
P( M E ) P( M )
∩
− (0, 3 + 0, 1 + 0, 2) = 0, 4 = P ( E ) − ( M ∩ E ) = 0, 5 − 0, 4 = 0, 1
∩ ∩ ∩
P ( M ) + P ( E ) + P M E
= 00,,47 = 47
P M E
P ( E / M ) =
=1
P( M E ) P( M )
=
1/10 3/10
= 13
Se ha realizado un examen médico a los trabajadores de tres empresas (E 1 ,E 2 y E 3 ) y han sido declarados no aptos 5 de los 125 trabajadores de E 1 , 18 de los 180 trabajadores de E 2 y 19 de los 95 trabajador trabajadores es de E 3 .
Manuel Angel Barea Gómez
65
CAPÍTULO CAPÍTULO 3. PROBAB PROBABILID ILIDAD AD
(a) Si un trabajador elegido al azar ha sido declarado apto para para el trabajo, ¿Cuál es la probabilidad de que no pertenezca a E 1 ? (b) ¿Cuál es la probabilid probabilidad ad de que un trabajador trabajador elegido elegido al azar pertenezca pertenezca a E 2 y halla sido declarado apto para el trabajo?
P ( E 1 ) = P ( E 2 ) = P ( E 3 ) =
125 400 180 400 95 400
5 = 0, 04 = 0, 3125 P A/ E 1 = 125 18 = 0, 14 P A/ E 2 = 180 = 0, 45 = 0, 2375 P A/ E 3 = 19 95 = 0, 2
P( A/ E 1 ) = 0, 96
P ( E 1 ) = 0, 3125 P( A/ E 1 ) = 0, 04 P( A/ E 2 ) = 0, 86 P ( E 2 ) = 0, 45 P( A/ E 2 ) = 0, 14 P( A/ E 3 ) = 0, 80 P ( E 3 ) = 0, 2375 P( A/ E 3 ) = 0, 20
Para resolver el primer apartado hallamos P ( E 1/ A)para posteriormente hallar el suceso contrario que es en realidad lo que nos piden. 0,3125·0,96
P( E ) P( A/ E )
·
P ( E 1/ A) = P( E )·P( A/ E )+P( E 1 )·P( A/ E 1 )+P( E )·P( A/ E ) = 0,3125 ·0,96+0,45·0,86+0,2375 ·0,8 = 0, 3598 1 2 3 1 2 3
El suceso contrario es 1 − 0, 3598 = 0, 6401
·0,86 P ( E 2/ A) = P( E )·P( A/ E )+P( E 2 )·P( A/ E 2 )+P( E )·P( A/ E ) = 0,3125 ·0,96+00,45 ,45·0,86+0,2375·0,8 = 0, 405 1 2 3 1 2 3 P( E ) P( A/ E )
·
Problema Problema 3.26.
En la revis revista ta Journal enero de 2006se prese presenta nta un test test serológ serológico ico rápido rápido para para el diagnó diagnósti stico co Journal of Tropical TropicalPedia Pediatric tricss de ener de infección por Helicobacter Pylori . Se ha probado en 81 niños, a los que se hacen también las pruebas microbiológicas habituales para saber si están o no infectados. infectad os. He aquí los l os resultados: n ó i c c e f n I
Test rápido + + 24 24 1 - 3 53
(a) Calcular Calcular los siguientes siguientes índices de valoración de una prueba diagnóstica diagnóstica : sensibilidad sensibilidad,, especificidad especificidad y valor predictivo predictivo de resultados positivos y negativos.
Sensibilidad = 24 25 Es peci f icidad = 53 56 V PP = 24 27 V PN = 53 54
Problema 3.27. La prevalencia del carcinoma de pulmón y bronquios en fumadores de más de 50 años es de un 5%. Una de las pruebas diagnósticas preliminares preliminares para la detección de esta enfermedad es la citología de esputo, que tiene una probabilidad 0,03 de falso positivo y una probabilidad 0,16 de falso negativo. ¿Cuál es la probabilidad de que una persona fumadora con más de 50 años que ha dado positivo en el test, presente algún carcinoma de este tipo? Manuel Angel Barea Gómez
66
CAPÍTULO CAPÍTULO 3. PROBAB PROBABILID ILIDAD AD P(T +/ E ) = 0, 84 P ( E ) = 0, 05 P(T −/ E ) = 0, 16 P(T +/ E ) = 0, 03 P E = 0, 95
P ( E /T + ) =
P(T / E ) = 0, 97
−
P( E ) P(T +/ E )
·
T +/ E
P( E ) P(
·
)+P( E )·P(T +/ E )
,05·0,84 = 0,05·00,849 +0,95·0,03 = 0, 5957
Problema 3.28.
Un método simple y económico para el diagnóstico de la infección urinaria es la tinción directa de la orina con azul de metileno que permite distinguir bacterias de leucocitos. Hemos utilizado esta prueba con 1125 pacientes dando positivo en 100 de ellos. Sabiendo que este método tiene una sensibilidad sensibilidad del 64 % y una especificidad especificidad del 98 % calcular: (a) El número de pacientes que padecen padecen bacteriuria. (b) De los 100 pacientes pacientes que han dado positivo en la prueba, prueba, ¿cuántos no padecen padecen bacteriuria? bacteriuria? P(T +/ E ) = 0, 64 P ( E ) P(T −/ E ) = 0, 36 P(T +/ E ) = 0, 02
P E
P (T + ) = P ( E ) P (T +/ E ) + P E
·
·
P ( E ) (0, 64
·
P(T −/ E ) = 0, 98
P (T +/ E ) = P ( E )
100 · 0, 64 + [1 − P ( E )])] · 0, 02 = 1125
− 0, 02) = 0, 088 − 0, 02 → P ( E ) = 00,,068 62 = 0, 11 n = 1125 · 0, 11 = 125
Nuestro árbol completo será ahora P(T +/ E ) = 0, 64 P ( E ) = 0, 11 P(T −/ E ) = 0, 36 P(T +/ E ) = 0, 02 P E = 0, 89
P ( E /T + ) =
P(T −/ E ) = 0, 98
P( E ) P(T +/ E )
·
P( E ) P(T +/ E )+P( E ) P(T +/ E )
·
·
n = 100
Manuel Angel Barea Gómez
89·0,02 = 0,11·00,,64 +0,89·0,02 = 0, 20
· 0, 20 = 20 67
CAPÍTULO CAPÍTULO 3. PROBAB PROBABILID ILIDAD AD
Problema Problema 3.29.
Para el tratamiento tratamiento de una determinada determinada enfermedad enfermedad existen existen tres tres fármacos fármacos (F 1 , F 2 , F 3 ), y sabemos sabemos que el porcentaje porcentaje de enfermos que utilizan F 1 es el mismo porcentaje que utilizan F 2 , y este último porcentaje es el doble del que utilizan F 3 . Estudios previos realizados en diversos laboratorios han detectado que F 1 produce un 3% de reacciones adversas, F 2 un 5% y F 3 un 12%. (a) Si un paciente ha tenido una reacción reacción adversa, ¿cuál es el fármaco que ha tomado con mayor probabilidad? (b) Si un paciente paciente no ha tenido una reacción reacción adversa adversa,, ¿cuál es la probabilidad probabilidad de que no haya tomado F 1 ?
F 1 = F 2 F 2 = 2 F 3 1 = F 1 + F 2 + F 3
·
Resolviendo
F 1 = F 2 = F 3 =
2 5 2 5 1 5
P( A/F 1 ) = 0, 03
P (F 1 ) = 0, 4 P( A/ E 1 ) = 0, 97 P( A/F 2 ) = 0, 05 P (F 2 ) = 0, 4 P( A/ E 2 ) = 0, 97 P( A/F 3 ) = 0, 12 P (F 3 ) = 0, 2 P( A/F 3 ) = 0, 82 P (F 1/ A) = P(F )·P( A/F )+P(F 1 )·P( A/F 1 )+P(F )·P( A/F ) = 0,4·0,03+00,44·00,03 05+0,2·0,12 = 0, 214 1 2 3 1 2 3 P(F ) P( A/F )
·
,
·,
0,4·0,05
P(F ) P( A/F )
·
P (F 2/ A) = P(F )·P( A/F )+P(F 2 )·P( A/F 2 )+P(F )·P( A/F ) = 0,4·0,03+0,4·0,05+0,2·0,12 = 0, 357 1 2 3 1 2 3 P (F 3/ A) = P(F )·P( A/F )+P(F 3 )·P( A/F 3 )+P(F )·P( A/F ) = 0,4·0,03+00,24·00,12 05+0,2·0,12 = 0, 428 1 2 3 1 2 3 P(F ) P( A/F )
·
P (F 1/ A) =
,
P(F 1 ) P( A/F 1 )
· ·
P(F 1 ) P( A/F 1 )+P(F 2 ) P( A/F 2 )+P(F 3 ) P( A/F 3 )
·
·
·,
= 0,4·0,97+00,,44··00,,97 95+0,2·0,88 = 0, 411
Sin embargo nos solicitan los que no han tomado F 1 luego es el suceso inverso con valor 1 − 0, 411 = 0, 588
Problema 3.30.
Una determinada enfermedad es siempre tratada con uno de estos dos fármacos (F 1 y F 2 ). Uno de los efectos secundarios secundarios caracter característico ísticoss de estos medicamentos medicamentos es el insomnio, insomnio, que se produce produce en el 20 % de los pacientes tratados tratados con F 1 y en el 8% de los tratados con F 2 . Se sabe, por otra parte, que entre los pacientes que manifiestan padecer padecer insomnio, el consumo consumo de F 1 triplica al de F 2 . A partir de estos datos: (a) Calcular Calcular el porcentaje porcentaje de pacientes pacientes tratados tratados con F 1 y el porcentaje de pacientes tratados con F 2 . (b) ¿Que porcentaje de pacientes padece insomnio en general?
Manuel Angel Barea Gómez
68
CAPÍTULO CAPÍTULO 3. PROBAB PROBABILID ILIDAD AD P( I /F 1 ) = 0, 2 P (F 1 ) P( I / E 1 ) = 0, 8 P( I /F 2 ) = 0, 08 P (F 2 ) P( I / E 2 ) = 0, 92
P( I /F 1 ) P(F 1 ) P( I )
·
P( I F 1 ) P(F 1 ) P( I F ) P ( I /F 2) = P(F )2 2
=3
·
P( I /F 2 ) P(F 2 ) P( I )
·
P ( I /F 1) P (F 1 ) = 3 P ( I /F 2
·
∩ ∩
P ( I /F 1 ) =
·
P( I F 1 ) P( I ) ( I F ) P P (F 2/ I ) = P( I )2
P (F 1/ I ) =
∩
∩
→ P ( / ) · P (F 1) = 3 · P ( / ) · P (F 2) ) · [1 − P (F 1 )] → 0, 2 · P (F 1 ) = 3 · 0, 08 · [1 − P (F 1 )]
0, 44 · P (F 1) = 0, 24
I F 1
→
I F 2
P (F 1 ) = 0, 5455 P (F 2 ) = 0, 4545 P( I /F 1) = 0, 2
P (F 1 ) = 0, 5455 P( I / E 1 ) = 0, 8 P( I /F 2 ) = 0, 08 P (F 2 ) = 0, 4545 P( I / E 2) = 0, 92 P ( I ) = P (F 1 ) P ( I /F 1 ) + P (F 2 ) P ( I /F 2 ) = 0, 5455
·
·
· 0, 2 + 0, 4555 · 0, 08 = 0, 1454
Problema 3.31.
La ecografía abdominal es la prueba diagnóstica que suele utilizarse durante la infancia para la detección de apendicitis aguda. Se sabe que entre los pacientes sospechosos de padecer esta patología, dicha prueba genera un 4% de falsos positivos y un 8 % de falsos f alsos negativos. Para el diagnóstico de apendicitis aguda, el servicio de pediatría de un determinado d eterminado hospital realizó a lo largo del último año ecografía abdominal a un total de 400 pacientes, resultando la prueba positiva en el 37% de los casos. (a) De entre los 400 pacientes examinados examinados ¿cuántos no padecían apendicitis aguda? aguda? (b) Entre los pacientes que dieron dieron positivo en esta prueba, ¿cuántos de ellos realmente realmente padecían apendicitis aguda? P(T +/ E ) = 0, 92 P ( E ) P(T −/ E ) = 0, 08 P(T +/ E ) = 0, 04
P E
Manuel Angel Barea Gómez
P(T −/ E ) = 0, 96
69
CAPÍTULO CAPÍTULO 3. PROBAB PROBABILID ILIDAD AD P (T + ) = P ( E ) P (T +/ E ) + P E P (T +/ E ) =
·
·
0, 92 + P E · 0, 04 = 0, 37
− 0, 92) = 0, 37 − 0, 92 → P ( E ) = 00,,5588 = 0, 625 P E = 0, 625 → n = 400 · 0, 625 = 250
P ( E ) (0, 04
·
1 P E
− ·
P(T +/ E ) = 0, 92 P ( E ) = 0, 375 P(T / E ) = 0, 08
−
P(T +/ E ) = 0, 04 P E = 0, 625
P ( E /T + ) =
P(T −/ E ) = 0, 96
P( E ) P(T +/ E )
·
P( E ) P(T +/ E )+P( E ) P(T +/ E )
·
·
n = 150
·0,92 = 0,375·00,,375 92+0,625·0,04 = 0, 932
· 0, 932 ≃ 139
Problema Problema 3.32.
Tenemos cinco frascos frascos con píldoras píldoras sedantes. sedantes. Las de un frasco frasco A son gravemente gravemente tóxicas. tóxicas. Las de de los cuatro cuatro restante restantess son ligeramente tóxicas. Antes de dormir tomamos una pastilla, eligiendo aleatoriamente el frasco, pues creemos que las píldoras de los cinco frascos son del mismo tipo. Al cabo de un rato sentimos gran malestar y caemos en la cuenta de que el frasco A contiene píldoras gravemente tóxicas. Según un manual de Medicina que consultamos, las píldoras de A causan el malestar que sentimos en un 90% de los casos, mientras que las píldoras de los otros cuatro sólo lo causan en un 15%. ¿Con qué probabilidad podemos afirmar que la píldora tomada pertenecía al frasco A? ¿Y de que pertenecía a uno de los otros cuatro?. P( M / A) = 0, 9 P ( A) = 0, 2 P( M / A) = 0, 1 P( M / A) = 0, 15 P A = 0, 8
P ( A/ M ) =
P( M / A) = 0, 85
P( A) P( M / A) P( A) P( M / A)+P( A) P( M / A)
·
·
·
= 0,2·00,9,2+·00,,98·0,15 = 0, 6
Para la segunda cuestión se trata del suceso contrario anterior, por tanto, 0 , 4 una ciert cierta a pobla poblaci ción ón,, se sabe sabe que que el año pasa pasado do acud acudió ió al menosuna menosuna vez vez al médi médico co de cabe cabece cera ra el 80 %. Ademá Además, s, Problema Problema 3.33. En una el 40 % de los que acudieron lo hizo porque estaban resfriados, mientras que el 30 % de los que no a cudieron se curaron curaron el resfriado en casa. (a) Calcular la probabilidad de que un individuo se resfriara. resfriara. (b) Calcular la probabilidad de que un individuo que se resfrió, resfrió, acudiera al médico por lo menos una vez. (c) Calcular Calcular la probabilid probabilidad ad de que un individuo individuo que no se resfrió resfrió no acudiera acudiera al médico por lo menos una vez.
Manuel Angel Barea Gómez
70
CAPÍTULO CAPÍTULO 3. PROBAB PROBABILID ILIDAD AD P( R/ M ) = 0, 4 P ( M ) = 0, 8 P( R/ M ) = 0, 6 P( R/ M ) = 0, 3 P M = 0, 2
·
P( R/ M ) = 0, 7
P ( R) = P ( M ) P ( R/ M ) + P M P ( R/ M ) = 0, 8
·
·
0,4 = 0,08,·38 = 0, 84
P( M ) P( R/ M )
0,2 = 0,07,·62 = 0, 225
P ( M / R) =
P( M ) P( R/ M ) P( R)
·
P ( M / R) =
· 0, 4 + 0, 2 · 0, 3 = 0, 38
P( R)
Problema 3.34.
El porcentaje de personas de una población que manifiestan un síntoma clásico de una cierta enfermedad es del 20 %, y el porcentaj porcentajee de enfermos es del 23 %. Se sabe que el 70 % de las personas personas que tienen el síntoma, síntoma, no están enfermas. enfermas. (a) Un individuo elegido elegido al azar no tiene el síntoma, ¿cuál es la probabilid probabilidad ad de que tenga la enfermedad? enfermedad? (b) Un individuo elegido elegido al azar no está enfermo, enfermo, ¿qué es más probable, probable, que tenga el síntoma o que no lo tenga? P( E /S ) = 0, 3 P (S ) = 0, 2 P( E /S ) = 0, 7 P( E /S ) P S = 0, 8
P( E /S )
·
P ( E ) = P (S ) P ( E /S ) + P S P ( E /S )
·
P( E ) P(S ) P( E /S ) P(S )
−
P ( E /S ) =
·
= 0,23−0(0,8,2·0,3) = 0, 2125 P( E /S ) = 0, 3
P (S ) = 0, 2 P( E /S ) = 0, 7 P ( E /S ) = 1 P( E /S ) = 0, 2125 P S = 0, 8
P (S / E ) =
Manuel Angel Barea Gómez
P( E /S ) = 0, 7875 P(S ) P( E /S )
·
P(S ) P( E /S )+P(S ) P( E /S )
·
·
71
= 0,2·070+,20·,07 8·07875 = 0, 1818
− 0, 2125 = 0, 7875
CAPÍTULO CAPÍTULO 3. PROBAB PROBABILID ILIDAD AD
Problema 3.35.
La prueba de cribado del segundo trimestre de embarazo, también conocida como triple screening , se realiza habitualmente entre las semanas 15 y 20 de la gestación y trata de evaluar el riesgo de diversas alteraciones fetales. Esta prueba presenta un 3 % de positivos, de los cuáles sólo el 10 1 0 % se corresponden con bebés que tendrán realmente problemas. Si suponemos que en la población población este grupo de patologías afecta afecta al 1 % de los bebés: (a) Determina Determina la sensibilidad sensibilidad y especificidad especificidad de esta prueba. prueba. (b) De todos los resultados negativos negativos de esta prueba, ¿qué porcentaje porcentaje se confirman posteriormente como como bebés sin ningún tipo de problemas? P ( E T + ) = P ( E /T + ) P (T + ) = 0, 1
∩
·
P (T +/ E ) = P (T + ) = P ( E ) P (T +/ E ) + P E
·
·
P (T +/ E )
P (T −/ E ) = 1
P( E T + ) P( E )
∩
− P(
= 00,,003 01 = 0, 3
T +/ E ) =
→ P(
T +/ E ) =
· 0, 03 = 0, 003
P(T + ) P( E ) P(T +/ E )
−
·
P( E )
,01·0,3) = 0,03−0(0,99 = 0, 0272
1 − 0, 0272 = 0, 9727 P(T +/ E ) = 0, 3
P ( E ) = 0, 01 P(T −/ E ) = 0, 97 P(T +/ E ) = 0, 0272 P E = 0, 99
P ( E /T − ) =
P(T −/ E ) = 0, 9727
P( E ) P(T −/ E )
·
·0,9727 = 0,01·00,,99 3+0,99·0,9727 = 0, 9968 P( E )·P( −/ E )+P( E )·P(T −/ E ) T
Problema 3.36.
Se ha realizado realizado recientem recientemente ente un ensayo ensayo clínico tipo dosis-res dosis-respuesta puesta para evaluar la eficacia eficacia de un determinado determinado tratamiento farmacológico. Para ello se se han seleccionado aleatoriamente 90 pacientes que se han dividido en 4 grupos ( A , B , C y D) siguiendo el siguiente criterio: el grupo A , formado por 18 pacientes, recibió el tratamiento a dosis de 50 mg/24h; el grupo B con el 30% de los pacientes recibió el tratamiento a dosis de 75 mg/24h; el grupo C , formado por 20 pacientes, recibió el tratamiento a do sis de 150 mg/24h; el resto de los pacientes formó el grupo D , recibiendo el tratamiento a dosis de 200 mg/24h. La respuesta al tratamiento fue eficaz para el 35 % de los l os pacientes p acientes del grupo A , el 55 % de los pacientes del grupo B , el 60 % de los l os pacientes del grupo C y el 75% de los pacientes del grupo D. (a) Si seleccionarnos seleccionarnos aleatoriame aleatoriamente nte un paciente para el que no ha sido eficaz el tratamiento, tratamiento, ¿cuál es la probabilid probabilidad ad de que la dosis recibida haya sido inferior a 100 mg/24h? (b) Si seleccionarnos seleccionarnos aleatoriamen aleatoriamente te un paciente para el que sí ha sido eficaz el tratamiento, tratamiento, ordenar ordenar de mayor a menor las probabilidades de que el paciente pa ciente haya recibido las 4 dosis do sis prescritas.
Manuel Angel Barea Gómez
72
CAPÍTULO CAPÍTULO 3. PROBAB PROBABILID ILIDAD AD P( E / A) = 0, 35 P ( A) = 0, 2 P( E / A) = 0, 65 P( E / B) = 0, 55 P ( B) = 0, 3 P( E / B) = 0, 45 P( E /C ) = 0, 60 P (C ) = 0, 22 P( E /C ) = 0, 40 P( E / D) = 0, 75 P ( D) = 0, 28 P( E / D) = 0, 25
P ( A/ E ) = P ( B/ E ) =
P( A) P( E / A)
·
P( A) P( E / A)+P( B) P( E / B)+P(C ) P( E /C )+P( D) P( E / D)
·
·
·
·
P( B) P( E / B)
·
P( A) P( E / A)+P( B) P( E / B)+P(C ) P( E /C )+P( D) P( E / D)
·
·
·
·
0,2·0,65 = 0,2·0,65+0,3·0,45 +0,22·0,40+0,28·0,25 = 0, 3073 0,3·0,45 = 0,2·0,65+0,3·0,45 +0,22·0,40+0,28·0,25 = 0, 3193
La probabilidad pedida es la suma de ambas 0 , 626 P( A) P( E / A)
0,2·0,35
P( B) P( E / B)
0,3·0,55
·
P ( A/ E ) = P( A)·P( E / A)+P( B)·P( E / B)+P(C )·P( E /C )+ )+P( D)·P( E / D) = 0,2·0,35+0,3·0,55+0,22·0,60+0,28·0,75 = 0, 1213
·
P ( B/ E ) = P( A)·P( E / A)+P( B)·P( E / B)+P(C )·P( E /C )+ )+P( D)·P( E / D) = 0,2·0,35+0,3·0,55+0,22·0,60+0,28·0,75 = 0, 2859 0 22 0 60 P (C / E ) = P( A)·P( E / A)+P( B)·P( E / B)+P(C )·P( E /C )+ )+P( D)·P( E / D) = 0,2·0,35+0,3·0,55+0,22·0,60+0,28·0,75 = 0, 2287 P(C ) P( E /C )
·
,
·,
0,28·0,75
P( D) P( E / D)
·
P ( D/ E ) = P( A)·P( E / A)+P( B)·P( E / B)+P(C )·P( E /C )+ )+P( D)·P( E / D) = 0,2·0,35+0,3·0,55+0,22·0,60+0,28·0,75 = 0, 3639
Problema 3.37.
Un centro de salud recibe pacientes de tres distritos de una gran ciudad (D 1 ; D2 ; D3 ). El número de residentes en D2 y D3 es el mismo, en cambio D 1 tiene tantos residentes residentes como D2 y D3 juntos. El centro de salud comenzó hace 3 meses un programa programa de vacunación voluntaria para prevenir el virus de la gripe y hasta h asta el momento se han vacunado el 30 % de los residentes en D 1 , el 20% de los residentes en D 2 y el 60% de los residentes en D 3 . (a) Sabiendo Sabiendo que una persona persona no reside en D 1 , ¿cuál es la probabilidad de que esté vacunada? (b) Sabiendo Sabiendo que una persona no se ha vacunado, vacunado, ¿cuál es la probabilid probabilidad ad de que no sea residente residente en D 2 ?
Manuel Angel Barea Gómez
D2 = D3 D1 = D2 + D3
73
P ( D1 ) = 0, 50 P ( D2 ) = 0, 25 P ( D3 ) = 0, 25
CAPÍTULO CAPÍTULO 3. PROBAB PROBABILID ILIDAD AD P(V / D1 ) = 0, 30 P ( D1 ) = 0, 25 P(V / D1 ) = 0, 70 P(V / D2 ) = 0, 20 P ( D2 ) = 0, 25 P(V / D2 ) = 0, 80 P(V / D3 ) = 0, 60 P ( D3 ) = 0, 50 P(V / D3 ) = 0, 40 P ( D2
∩ V ) + P ( D3 ∩ V ) = P ( D2) · P ( /
V D2 ) + P ( D3 )
P ( D2/V ) =
· P( /
V D3 ) =
P( D2 ) P(V / D2 ) P( D1 ) P(V / D1 )+P( D2 ) P(V / D2 )+P( D3 ) P(V / D3 )
· ·
·
·
0, 25 · 0, 2 + 0, 25 · 0, 6 = 0, 2
25·0,7 = 0,5·0,7+00,,25 ·0,8+0,25·0,4 = 0, 28
La probabilidad solicitada es el suceso contrario al anterior por tanto será 0 , 69.
Problema 3.38.
El síndrome de Burnout o síndrome de desgast e o de agotamiento personal es un resultante específico del estrés labora laborall crónic crónico o que se suel suelee produ producir cir entr entre profe profesio sionale naless que mantien mantienen en una relaci relación ón de ayuda ayuda consta constante nte y direct directa a con otras otras person personas as (profesionales sanitarios, trabajadores sociales, profesores, etc.). Se ha realizado un estudio de este síndrome entre los médicos de una ciudad, encontrando una prevalencia del 33% en los médicos de Atención Hospitalaria ( AH) y del 44% en los médicos de Atención Primaria (AP). Por otro lado se sabe que, existen 3 veces más médicos de AH que de AP entre todos los que presentan este síndrome. Con estos datos, determina los porcentajes de médicos de AP y AH de esta ciudad.
AH = AP + 3 AP = 4 AP P ( E / AH ) = 0, 33 P ( E / AP) = 0, 44
·
P( E / AH ) P( AH ) P( E )
·
·
=4
·
P ( E / AH ) = P ( E / AP) =
P( E / AH ) P( AH ) P( E )
·
P( E AH ) P( AH ) P( E AP) P( AP)
∩ ∩
P ( AH / E ) = P ( AP/ E ) =
P( E AH ) P( E ) P( E AP) P( E )
∩ ∩
→ P ( / ) · P ( AH ) = 4 · P ( / ) · P ( AP) ) · [1 − P ( AH )] )] → 0, 33 · P ( AH ) = 4 · 0, 44 · [1 − P ( AH )] )] E AH
E AP
P ( E / AH ) P ( AH ) = 4 P ( E / AP
·
·
2, 09 · P ( AH ) = 1, 76
→
P ( AH ) = 0, 84 P ( AP) = 0, 16
Problema 3.39.
Se denominan algias vertebrales a todos aquellos dolores de origen mecánico, no traumáticos, que afectan a cualquiera de las estructuras del aparato locomotor de la columna vertebral. Se ha podido demostrar que la higiene postural tiene importantes repercusiones sobre la predisposición, desencadenamiento y agudización de las algias vertebrales. Estudios recientes han confirmado confirmado que no tienen una buena higiene postural postural el 85 % de los pacientes con algia vertebral y el 20% de los pacientes que no presentan algia vertebral. Sabiendo que la prevalencia de esta dolencia el del 10%: (a) ¿Cuál es la probabilidad de que una persona persona elegida al azar no tenga una buena higiene postural? postural? (b) Si observamos que una persona no tiene buena higiene postural, ¿cuál es la probabilidad de que presente algias vertebrales?
Manuel Angel Barea Gómez
74
CAPÍTULO CAPÍTULO 3. PROBAB PROBABILID ILIDAD AD P( H / A) = 0, 3 P ( A) = 0, 1 P( H / A) = 0, 7 P( H / A) = 0, 8 P A = 0, 9
·
P H = P ( A) P ( H / A) + P A
Manuel Angel Barea Gómez
·
P ( A/ H ) =
P( H / A) = 0, 2 P ( H / A) = 0, 1
P( A) P( H / A)
·
P( H )
75
· 0, 85 + 0, 9 · 0, 2 = 0, 265
0,85 = 0,01,·265 = 0, 321
C APÍTULO
4 Variables aleatorias
Problema 4.1.
La variable aleatoria X se define como el número de trasplantes de riñón que se realizan en un gran hospital cada mes. La función de probabilidad de X viene dada por la tabla: xi pi
0 a
1 a
2 b
3 b
4 0,3
5 0,1
(a) Calcular Calcular a y b sabiendo que E ( X ) = 2, 8. (b) Obtener y representar representar gráficamente la Función de distribución distribución acumulativa. (c) Calcular Calcular la moda, la mediana y la varianza varianza de X.
2 · a + 2 · b + 0, 3 + 0, 1 = 1 =⇒ E ( X ) = ∑ xi · pi → 2, 8 = a + 5 · b + 4 · 0, 3 + 5 · 0, 1
F ( x) =
0 0, 1 0, 2 0, 4 0, 6 0, 9 1
76
x<0 0 x < 1 1 x < 2 2 x < 3 3 x < 4 4 x < 5 x 5
≤ ≤ ≤ ≤ ≤ ≥
2 · a + 2 · b = 0, 6 =⇒ a + 5 · b = 1, 1
a = 0, 1 b = 0, 2
CAPÍTULO CAPÍTULO 4. VARIABLES ARIABLES ALEATORIA ALEATORIAS S
Función de distribucion 0 . 1
8 . 0
6 . 0 y 4 . 0
2 . 0
0 . 0
−1
0
1
2
3
4
5
6
x
xi
pi
Pi
xi pi
( xi E ( X ))2 pi
0 1 2 3 4 5
0,1 0,1 0,2 0,2 0,3 0,1
0,1 0,2 0,4 0,6 0,9 1
0 0,2 0,4 0,6 1,2 0,5 2,8
0,78 0,32 0,13 0,01 0,43 0,48 2,16
·
∑
−
·
M o = 4 M e = 3 V ( X )) = 2, 16
Problema 4.2.
La variable aleatoria X representa el número número de casos nuevos de SIDA SIDA diagnosticados en un hospital durante un día. Su función de distribución es:
F ( x) =
0 0, 1 0, 2 0, 3 0, 6 0, 8 0, 9 1
x<0 0 x < 1 1 x < 2 2 x < 3 3 x < 4 4 x < 5 5 x < 6 x 6
≤ ≤ ≤ ≤ ≤ ≤ ≥
(a) Hallar la probabilidad de que en un día cualquiera sean diagnosticados por lo menos tres tres casos nuevos. (b) Hallar la media de casos diagnostic diagnosticados ados al día. (c) HallarP HallarP[ X >1/ X <5].
La probabilidad de que diagnostiquen menos de 3 casos es del 0,3 según la tabla de distribución, por tanto, para al menos tres casos X ≥ 3] = 1 − 0, 3 = 0, 7. nuevos será P [ X Manuel Angel Barea Gómez
77
CAPÍTULO CAPÍTULO 4. VARIABLES ARIABLES ALEATORIA ALEATORIAS S E ( X ) = ∑ xi pi = 0
·
· 0, 1 + 1 · 0, 1 + 2 · 0, 1 + 3 · 0, 3 + 4 · 0, 2 + 5 · 0, 1 + 6 · 0, 1 = 3, 1 P[ X >1/ X <5] =
Problema 4.3.
Un centro de salud dispone de 8 aparatos para la medición de la glucosa en sangre de los cuales 3 están defectuosos.
(a) Si un enfermero va probando probando los aparatos hasta que encuentra uno que funciona bien, ¿Cuál es el número medio de aparatos que debe probar? (b) Si otro enfermero enfermero selecciona selecciona aleatoriament aleatoriamentee 4 de los aparatos, aparatos, ¿cuál es la probabilid probabilidad ad de que funcionen funcionen bien al menos 3 de ellos?
El primer apartado se resuelve con una distribución geométrica donde E ( X ) = p1 = 5/18 = 85 = 1, 6 B (4;0 4; 0, 625)
P [ X X
X = 4] = ≥ 3] = P [ X = 3] + P [ X
4 3
·
0, 6253
·
0, 3751 +
4 3
·
0, 6254 · 0, 3750 = 0, 5
Problema 4.4.
La variable aleatoria X mide el número número de días que necesita un paciente para recibir recibir el alta hospitalaria, hospitalaria, después de realizar realizarle le una colecistectomia (extirpación quirúrgica de la vesícula biliar) mediante abordaje lamparoscópico. La función de probabilidad de X (incompleta) se muestra en la siguiente tabla:
2
xi pi
3 0 , 34
4 0,46
5 0,06
6 0 ,0 4
7
Sabiendo que el valor medio de X es de 3,66 días: (a) Determina y representa representa gráficamente la función de distribución distribución de X. (b) Sabemos que tras la operación operación un paciente lleva ya hospitalizado hospitalizado 3 días, ¿cuál es la probabili probabilidad dad de que reciba reciba el alta antes del 6º día. xi pi
a + 0, 34 + 0, 46 + 0, 01 + 0, 05 + b = 1 E ( X ) = ∑ xi pi 3, 66 = 2 a + 3 0, 34 + 4
· →
·
·
2 a
3 0,34
4 0,46
5 0,06
· 0, 46 + 5 · 0, 06 + 7 · b
6 0,04
⇒
=
7 b
a + b = 0, 1 = 2 a + 7 b = 0, 26
·
·
⇒
a = 0, 088 b = 0, 012
La variable
aleatoria X representa el número de cesáreas de urgencia que se realizan en un centro hospitalario a lo largo de un mes. Su función de distribución vienen dada por: Función de distribución 0 . 1
8 . 0
6 . 0 Y 4 . 0
2 . 0
0 . 0
1
2
3
4
5 X
Manuel Angel Barea Gómez
78
6
7
8
CAPÍTULO CAPÍTULO 4. VARIABLES ARIABLES ALEATORIA ALEATORIAS S P [3 < X
Problema 4.5. 106 gametos.
X ≤ 6] − P [3 < X ] = 0, 988 − 0, 088 = 0, 9 ≤ 6] = P [ X
En los seres humanos, se producen mutaciones por la
enfermedad de Huntington en aproximadamente 3 de cada
(a) ¿Cuál es la probabilidad probabilidad de que en 2 millones de gametos haya haya al menos una mutación?. (b) ¿Y la probabilid probabilidad ad de que en un millón de gametos haya entre 2 y 5 mutaciones, mutaciones, inclusives?. inclusives?.
Podemos usar una distribución de Poisson X P ( X
P (6).
≤ 1) = P ( X = 0) + P ( X = 1) =
Podemos usar una distribución de Poisson X P (2
e−6 60
·
0!
−6 1 + e 1!·6 = 0, 9975
P (3).
≤ X ≤ 5) = P ( X = 2) + P ( X = 3) + P ( X = 4) + P ( X = 5) =
e−3 32
·
2!
−3 3 −3 4 −3 5 + e 3!·3 + e 4!·3 + e 5!·3 = 0, 7169
Problema 4.6.
El número de visitas que recibe cada día un paciente enfermo que permanece ingresado en planta en un centro hospitalario, se ajusta a una distribución de Poisson, cuya media es 4 visitas/d´ıa los lunes, martes, miércoles y jueves, y de 2 visitas/d´ıa los viernes, sábados y domingos. (a) Si elegimos un día al azar, azar, ¿cuál es la probabilidad de que dicho enfermo reciba al menos 3 visitas? (b) Si suponemos suponemos independencia independencia entre entre un día y otro, otro, ¿cuál ¿cuál es la probabilid probabilidad ad de que dicho dicho enfermo enfermo reciba reciba durante durante el fin de semana semana (sábado y domingo) más de 3 visitas? visitas?
Para los días laborales, X P ( X
P (4)
≥ 3) = 1 − [P ( X = 0) + P ( X = 1) + P ( X = 2)] = 1 − (0, 01832 + 0, 07326 + 0, 14653) = 0, 76189
Para los fines de semana X
P (2) P ( X
≥ 3) = 1 − [P ( X = 0) + P ( X = 1) + P ( X = 2)] = 1 − (0, 13534 + 027067 + 0, 27067) = 0, 32339
Como todos los días tienen la misma oportunidad P ( X
≥ 3) = 47 · 0, 76189 + 37 · 0, 32339 = 0, 5739
el segundo apartado es una probabilidad condicional, como son independientes, llamamos P( L) P( X 3)
≥
→ laboral → Findesemana
L F
= 00,,32339 5739 = 0, 5665
Problema 4.7.
En cierto centro hospitalario, el número de días que permanecen ingresados los pacientes tras una intervención quirúrgica se ajusta a una distribución de Poisson de media 2, 5 d´ıas . La siguiente tabla recoge el coste de hospitalización de los pacientes en función del número de días dí as de ingreso:
días C
0 100
1 175
2 2 35
3 2 75
(a) Determinar Determinar el coste medio de la estancia estancia postquirúgica postquirúgica en este hospital. hospital.
Manuel Angel Barea Gómez
79
4 o más 300
CAPÍTULO CAPÍTULO 4. VARIABLES ARIABLES ALEATORIA ALEATORIAS S
(b) ¿Qué porcentaje porcentaje de pacientes pacientes gastan 300?
Construimos nuestra función de distribución distribución X
P (2, 5)
P ( X = 0) = 0, 08208 P ( X = 1) = 0, 20521 P ( X = 2) = 0, 25651 P ( X = 3) = 0, 21376 P ( X = 4) = 0, 13360 P ( X = 5) = 0, 06680 P ( X = 6) = 0, 02783 P ( X = 7) = 0, 00994 P ( X = 8) = 0, 00310 P ( X = 9) = 0, 00862 P ( X = 10) = 0, 00022 P ( X = 11) = 0, 00005 P ( X = 12) = 0, 00001
Para hallar el coste medio Coste = 0 · 0, 08208 + 1 · 0, 20521 + ... + 11 · 0, 00005 + 12 · 0, 00001 = 235, 91 P ( X
≥ 4) = 1 − [P ( X = 0) + P ( X = 1) + P ( X = 2) + P ( X = 3)] = 1 − (0, 08208 + 0, 20521 + 0, 25651 + 0, 21376) = 0, 2424
Problema 4.8.
El Servicio de Vigilancia Epidemiológica (SVE) registra anualmente los nuevos casos de aquellas enfermedades que requieren control epidemiológico, denominadas Enfermedades de Declaración Obligatoria. Según datos del SVE, los casos de Legionelosis en A ndalucía se ajustan a una distribución d istribución de Poisson de media 8 casos al mes. A partir de estos datos responder a las siguientes cuestiones: (a) ¿Cuál es la probabili probabilidad dad de que durante los próximos próximos 10 meses meses encontremos encontremos que en más de 2 meses el número número de casos de legionelosis sea inferior a 5? (b) ¿Cuál es la probabilidad probabilidad de que en el cómputo cómputo global de los próximos 5 años encontremos encontremos que el número número de casos de legionelosis es superior a 450 e inferior a 500? X
P (8)
P ( X < 5) = P ( X = 0) + P ( X = 1) + P ( X = 2) + P ( X = 3) + P ( X = 4) = 0, 00268 + 0, 01073 + 0, 02862 + 0, 05725 + 0, 09160 =
0, 19088 Aproximamos a una distribución Normal, con λ = 5 · 12 · 8 = 480
µ = λ = 480 σ = λ = 480 = 21, 9
√ √
P (450 < X < 500) = P 45021−,9480
< Z <
5 1 0 . 0
500−480 21,9
−1, 37 < Z < 0, 91) = P ( Z < 0, 91) − P (−1, 37 < Z ) = 0, 8186 − 0, 0853 = 0, 7333
P(
y
0 1 0 . 0
5 0 0 . 0
0 0 0 . 0
4 00
450
500
550
x
Problema 4.9.
La variable aleatoria X representa el número de cesáreas de urgencia que se realizan en un centro hospitalario a lo largo de un mes. Su función de distribución vienen dada por:
Manuel Angel Barea Gómez
80
CAPÍTULO CAPÍTULO 4. VARIABLES ARIABLES ALEATORIA ALEATORIAS S
F x (t ) =
0 0, 1 0, 4 0, 65 0, 85 0, 94 1
t < 0 0 t < 1 1 t < 2 2 t < 3 3 t < 4 4 t < 5 t 5
≤ ≤ ≤ ≤ ≤ ≥
(a) Determinar Determinar la moda, media media y varianza de X. Interpreta los resultados obtenidos. (b) ¿Cuál es la probabilid probabilidad ad de que a lo largo largo de los próximos 10 años, transcurra transcurran n al menos 20 meses sin necesidad necesidad de realizar realizar ninguna cesárea de urgencia? xi
pi
Pi
xi pi
( xi E ( X ))2 pi
0 1 2 3 4 5
0,1 0, 0, 3 0, 0,25 0,2 00,,09 0,06
00,,1 0,4 0,65 00,,85 00,,94 1
0 0,3 0,5 0,6 0,36 0,3 2,06
0,42 0,34 0,00 0,18 0,34 0,52 1,80
∑
·
−
·
M o = 1 E ( X ) = 2, 06 V ( X )) = 1, 80
Para la segunda parte del problema aproximamos a una normal
µ = n p = 120 0, 1 = 12 σ = n p q = 120 0, 1 0, 9 = 3, 28
−
P ( X > 20) = P Z > 203,2812
√ · · · ·√ · ·
= P ( Z > 2, 44) = 1
2 1 . 0
0 1 . 0
8 0 . 0
− P (2, 44 < Z ) = 1 − 0, 99266 = 0, 00734
y
6 0 . 0
4 0 . 0
2 0 . 0
0 0 . 0
0
5
10
15
20
x
Problema 4.10.
Se sabe que la citastina sigue una N (0, 8;0 individuos con insuficienci insuficiencia a renal. renal. 8; 0, 3) en los sanos y una N (2;0 2; 0, 4) en los individuos Si consideramos 1, 4 como punto de corte para diagnosticar la insuficiencia renal: (a) ¿A qué percentil de cada distribución distribución corresponde corresponde este punto de corte? ¿Es el test más sensible sensible que específico? (b) En una poblac población ión que tiene tiene un 3 % de individ individuos uos con insufic insuficien iencia cia renal, renal, obtene obtenerr el valor valor predic predictivopositi tivopositivo vo del test test diagnó diagnósti stico co que considera enfermos a los individuos que tienen citastina por encima de 1,4.
Para los individuos sanos P ( X < 1, 4) = P Z < Para los individuos con insuficiencia renal Por los resultados anteriores es más específico.
1,4−0,8 0,3
= P ( Z < 2) = 0, 9772
1,4−2
P ( X < 1, 4) = P Z < 0,4
Manuel Angel Barea Gómez
81
= P ( Z < 1, 5) = 0, 0668.
−
CAPÍTULO CAPÍTULO 4. VARIABLES ARIABLES ALEATORIA ALEATORIAS S P(T +/ E ) = 0, 93 P ( E ) = 0, 03 P(T −/ E ) = 0, 07 P(T +/ E ) = 0, 02 P E = 0, 97
P ( E /T + ) =
P(T / E ) = 0, 98
−
P( E ) P(T +/ E )
·
P( E ) P(T +/ E )+P( E ) P(T +/ E )
·
·
03·0,93 = 0,03·00,,93 +0,97·0,02 = 0, 5898
Problema 4.11. La concentración de urea en sangre en una determinada enfermedad sigue una distribución normal de media 24 mg/100cc y desviación típica desconocida. En un grupo de 100 enfermos se seleccionan aquéllos cuya concentración de urea está comprendida entre 24 mg/100cc y 28 mg/100cc , resultando rechazados 66. (a) Calcular Calcular el valor de la desviación desviación típica típica de la distribuci distribución. ón. (b) Si establecemos como nuevos límites de selección las concentraciones de de enfermos rechazados.
22 mg/100cc y 30 mg/100cc , calcule ahora el porcentaje
66 = 0, 44. Del enunciado se establece que P (24 < X < 28) = 1 − 100 24 28−24 = P Z < 4 P 24− σ < Z < σ σ
P
⇒ P Z < σ 4 = 0, 34 + P ( Z < 0) = 0, 84 Dicha probabilidad se corresponde con una Z ≃ 1, por tanto σ = 4 22−24 < Z < 30 24 = P ( Z < 1, 5) − P (−0, 5 < Z ) = 0, 9332 − 0, 3085 = 0, 6247 4 4
− −
P (0 < Z ) =
Dicha probabilidad no es la de los rechazados, está será 1-0,6247=0,3753
Problema 4.12.
Una empresa ha realizado un estudio para valorar la calidad del agua que abastece a una población. En el citado estudio ha encontrado un promedio de 2 microorganismos por ml. de agua. Si extraemos al azar una muestra de agua en esta población: (a) ¿cuál es la probabilid probabilidad ad de que al tomar 3 ml de agua, encontremos al menos 4 microorganismos? (b) ¿cuál es la probabilid probabilidad ad de que al tomar 100ml de agua, encontremos más de 190 y menos de 220 microorganismos?
Utilizamos una distribución de Poisson X P ( X
P (6)
≥ 4) = 1 − [P ( X = 0) + P ( X = 1) + P ( X = 2) + P ( X = 3)] = 1 − (0, 0025 + 0, 0149 + 0, 0446 + 0, 0892) = 0, 8488
Aproximamos a una distribución normal con
−200 P 190 14,14
< Z <
220−200 14,14
µ = n λ = 100 2 = 200 σ = n λ = 200 = 14, 14
√ · ·
√ ·
= P ( 0, 7 < Z < 1, 41) = P ( Z < 1, 41)
−
Problema 4.13.
− P (−0, 7 < Z ) = 0, 9207 − 0, 242 = 06787
La diuresis (flujo de orina) sigue una distribución normal de media 105 cl/d´ıa en los hombres y de media 125 cl/d´ıaen las mujeres, teniendo en ambos casos la misma desviación típica σ . Sabiendo que el percentil 90 de la distribución de los hombres coincide con el percentil 23 de la distribución de las mujeres, ¿puedes encontrar el valor de σ y el del percentil percentil en el que coinciden coinciden ambas distribuciones?
Manuel Angel Barea Gómez
82
CAPÍTULO CAPÍTULO 4. VARIABLES ARIABLES ALEATORIA ALEATORIAS S
Para la distribución de los hombres P90 se corresponde con una z = 1, 28 Para las mujeres P23 se corresponde con una z = −0, 74
1, 28 = x−σ 105 −0, 74 = x−σ 125 =⇒
x = 1, 28 σ + 105 Resolviendo σ x = 0, 74 + 125
−
·
≈ 10
El percentil donde coinciden son los dos anteriores.
Problema 4.14.
La albúmina es la proteína que tiene mayor concentración en el plasma. Dado que se produce en el hígado, la disminución de la albúmina sérica puede ser producto de alguna enfermedad hepática. Sabiendo que la determinación de albúmina en plasma (medida en g/dl) sigue en individuos sanos una distribución N(4,4; σ 1 ) y en los pacientes con patología hepática una distribución N(2,8;σ 2), hemos construido una prueba diagnostica con el siguiente criterio: Considerar como positivas las determinaciones de albúmina inferiores a 3, 4 gr/dl . Teniendo en cuenta que el 2% de la población presenta alguna patología hepática y que nuestra prueba diagnóstica tiene una sensibilidad del 80% y una especificidad del 90% determinar: (a) Los valor valores esσ 1 y σ 2 que aparecen en el enunciado. (b) La probabilidad de que un individuo seleccionado al azar tenga una determinación de albúmina inferior a 4 gr/dl (c) El número más probable probable de enfermos enfermos que encontraremos encontraremos dentro dentro de un grupo de 8 individuos, individuos, seleccionado seleccionadoss al azar entre todos los que han dado positivo en esta prueba. P(T +/ E ) = 0, 8 P ( E ) = 0, 02 P(T −/ E ) = 0, 2 P(T +/ E ) = 0, 01 P E = 0, 98
P(T / E ) = 0, 9
−
Las personas sanas presentan un porcentaje de padecer la enfermedad del 10%. 0, 1 = P
3,4−4,4 σ 2
< Z , por las tablas le corresponde una Z = 1, 28
−
4,4 = 0, 78125 gr/dl σ 2 = 3−,41−,28
De igual modo, para los enfermos, presentan la enfermedad el 80%. 0, 8 = P
3,4−2,8 σ 1
< Z , por las tablas le corresponde una Z = 0, 84 σ 1 = 3,40,−842,8 = 0, 714 gr/dl
Si cambiamos el criterio de determinación: Para los sanos
4,4 P ( X < 4) = P Z < 40− ,781
Para los enfermos
2,8 P ( X < 4) = P Z < 40− ,714
Manuel Angel Barea Gómez
= P ( Z < 0, 512) = 0, 3050
−
= P ( Z < 1, 68) = 0, 9535, esta será su sensibilidad.
83
CAPÍTULO CAPÍTULO 4. VARIABLES ARIABLES ALEATORIA ALEATORIAS S P(T +/ E ) = 0, 9535 P ( E ) = 0, 02 P(T −/ E ) = 0, 0465 P(T +/ E ) = 0, 3050 P E = 0, 98
·
P(T / E ) = 0, 6950
−
P (T + ) = P ( E ) P (T +/ E ) + P E P (T +/ E ) = 0, 02
·
Para el tercer apartado: P ( E /T + ) =
P( E ) P(T +/ E )
·
P( E ) P(T +/ E )+P( E ) P(T +/ E )
·
·
n=8
· 0, 9535 + 0, 98 · 0, 3050 = 0, 31797
·0,8 = 0,02·00,,02 8+0,98·0,1 = 0, 14
· 0, 14 ≃ 1
Problema 4.15.
Casi la mitad del magnesio corporal está presente en el hueso, donde juega un papel estructural (al igual que el calcio, calcio, el fosfato y varias proteínas proteínas). ). Sabemos Sabemos que en población general general la concentrac concentración ión de magnesio magnesio sérico (medida en mg/dl) se distribuye según una ley Normal, donde el 80% central de los valores se encuentran en el intervalo ( 2, 08 mg/dl; 2, 72 mg/dl). (a) Determinar Determinar el valor de los parámetros parámetros µ y σ de la citada distribución normal. (b) Si seleccionamos seleccionamos aleatoriamente aleatoriamente 10 individuos, individuos, ¿cuál es la probabilidad probabilidad de que como mínimo 3 de ellos tengan una concentración de magnesio inferior a 2, 3 mg/dl? (c) Si seleccionamo seleccionamoss aleatoriamente aleatoriamente 1200 individuos todos con una concentración concentración de potasio dentro del intervalo intervalo ( 2, 08 mg/dl mg mg ;2, 72 /dl), ¿cuál es la probabilidad de que más de 350 tengan un nivel de magnesio superior a 2, 5 /dl?
Como la probabilidad está distribuida centralmente, quiere decir que tanto por encima como por debajo tenemos un 10%, según las tablas esto les corresponde los siguientes valores de Z . 1, 28 = 2,08σ −µ Resolviend o 1, 28 = 2,72σ − µ
−
µ = 2, 4 mg/dl σ = 0, 25 mg/dl
La probabilidad
P ( X < 2, 3) = P Z <
Para 10 individuos que presentan al menos 3
X P ( X
1
10 0
− ·
0, 34460
·
2,3−2,4 0,25
= P ( Z < 0, 4) = 0, 3446
−
B(10;0 , 3446)
≥ 3) = 1 − [P ( X = 0) + P ( X = 1) + P ( X = 2)]
0, 65544 +
10 1
·
0, 34461
·
0, 65543 +
10 0
·
0, 34462
La probabilidad de tener más de 2 , 5 mg/dl es
P ( X > 2, 5) = P Z >
Manuel Angel Barea Gómez
2,5−2,4 0,25
84
= P ( Z > 0, 4) = 0, 3446
·
0, 65542
= 0, 7266
CAPÍTULO CAPÍTULO 4. VARIABLES ARIABLES ALEATORIA ALEATORIAS S
Para 1200 individuos
µ = n p = 1200 0, 3446 = 413, 52 σ = n p q = 1200 0, 3446 0, 6554 = 16, 44
√ · · ·
· √
·
·
P ( X > 350) = P Z >
350−413,52 16,44
= P ( Z > 3, 86) = 0, 9994
−
Problema 4.16.
La longitud del fémur del feto hacia la semana 20 del embarazo, embarazo, obtenida obtenida mediante ecografía ecografía abdominal, abdominal, sigue una distribución Normal de media 32mm. Sabiendo que el percentil 67 dicha distribución se encuentra en el valor 33, 5 mm: (a) ¿Entre ¿Entre qué valores se encuentra encuentra el 80 % central de la distribució distribución? n? (b) Si se progr programan aman 20 ecografías ecografías de este tipo, ¿en cuántas de ellas cabe esperar que la longitud del fémur del feto se encuentre encuentre entre 28mm. y 38mm.?
→ Z = 0, 25 → 0, 25 = −σ µ → σ = 330,5,25−32 = 3, 41 Z | = 1, 28 El 80% central se encuentra en valores | Z −1, 28 = 3−,4132 → X = 27, 62 1, 28 = 3−,4132 → X = 36, 37 X
P60
X
X
P (28 < X < 38) = P 283,−4132 < Z < 383,−4132 n p = 20
·
= P ( 1, 17 < Z < 1, 75) = 0, 8389
−
· 0, 8389 = 16, 7
Problema 4.17. La tensión arterial sistólica (TAS) de los pacientes ingresados en UCI se ajusta a una distribución Normal de media µ = 130mmHg y sabemos que el 95% de estos pacientes mantiene unas cifras de TAS entre 110mmHg y 150mmHg. (a) ¿Qué porcentaje de pacientes presentan presentan una cifra de TAS superiores superiores a
120mmHg?
(b) Si seleccionamos seleccionamos aleatoriamente aleatoriamente 20 pacientes, pacientes, ¿cuál es la probabili probabilidad dad de que todos presenten presenten una TAS por debajo de 150mmHg?
Como la probabilidad está distribuida centralmente, quiere decir que tanto por encima como por debajo tenemos un 2,5%, según las tablas esto les corresponde los siguientes valores de Z . 1, 96 = 110−σ 130 Resolviend o 130 1, 96 = 150− σ
−
P ( X > 120) = P Z > 12010−,130 2
σ = 10, 2mmHg
= P ( Z > 0, 98) = 0, 8365 P ( X < 150) = P Z < 15010−,130 = P ( Z < 1, 96) = 0, 975 2
−
Para todos los pacientes, 20 en nuestro caso, será dicha probabilidad multiplicada 20 veces, es decir 0 , 97520 = 0, 6026
Problema 4.18.
Una determinada enfermedad suele generar en los pacientes 2 síntomas que denominaremos S 1 y S 2 . Sabemos que el 20% de los pacientes presentan únicamente S 1 , el 10 % presentan únicamenteS úni camenteS 2 y el 40% presentan ambos síntomas al mismo tiempo. (a) Cuál es la probabilid probabilidad ad de que un paciente paciente elegido elegido al azar presente presente al menos uno de los 2 síntomas?
Manuel Angel Barea Gómez
85
CAPÍTULO CAPÍTULO 4. VARIABLES ARIABLES ALEATORIA ALEATORIAS S
(b) Si elegimos aleatoriame aleatoriamente nte 5 pacientes pacientes ¿Cuál es la probabili probabilidad dad de que alguno de ellos presente presente uno y sólo uno de los 2 síntomas?
P (S 1
∪ S 2) = P (S 1) + P (S 2) − P (S 1 ∩ S 2) = 0, 6 + 0, 5 − 0, 4 = 0, 7
Para que se produzca tan sólo uno de los sintomas tenemos 0 , 2 + 0, 1 = 0, 3, usando una binomial X P ( X > 0) = 1
Problema 4.19.
B (5;0 5; 0, 3)
− P ( X = 0) = 1 − 0, 16807 = 0, 8319
El tiempo de vida, T (en días) de una bacteria tiene la función de densidad f (t ) =
1 − k t 10 e
0
·
sı´t > 0 enel res resto
dondek es una constante positiva. positiva. Calcúlense: (a) el valor valor de k (b) la esperanza esperanza de vida de dicha bacteria. bacteria.
Como es una distribución exponencial exponencial k = 10. 1 = 10 E ( X ) = λ
Problema 4.20.
El 75% de los alumnos matriculados en la asignatura de Bioestadística suele entregar ficha. De los que entregan ficha, aprueba habitualmente el 80 % y de los que no, el 40 %. Se supone que cada uno estudia por su cuenta y que no consulta a nadie a la hora de entregar ficha. Además, todos se suelen presentar al examen. (a) ¿Cuál es la probabilidad de que una persona, elegida al azar entre las matriculadas en la asignatura, apruebe el examen? (b) Habiendo 150 alumnos matriculados, calcular el número esperado de aprobados aprobados entre ellos. (c) Hallar la probabilidad probabilidad de que, entre los 150 matriculados matriculados,, aprueben el examen más de 110. ¿Cuál es la probabilid probabilidad ad de que aprueben entre 100 y 110 alumnos? P( A/F ) = 0, 8 P (F ) = 0, 75 P( A/F ) = 0, 2 P( A/F ) = 0, 4 P F = 0, 25
Manuel Angel Barea Gómez
P( A/F ) = 0, 6
86
CAPÍTULO CAPÍTULO 4. VARIABLES ARIABLES ALEATORIA ALEATORIAS S
·
P ( A) = P (F ) P ( A/F ) + P F
·
De 150 alumnos aprueban 150 · 0, 65 = 97, 5. Aproximamos a una normal X
P ( A/F ) = 0, 75
· 0, 8 + 0, 25 · 0, 4 = 0, 65
µ = n p = 150 0, 65 = 97, 5 σ = n p q = 150 0, 65 0, 35 = 5, 84
√ · · · ·√ ·
N (97, 5;5 5; 5, 84)
P ( X > 110) = P Z >
100−97,5 P (100 < X < 110) = P 5,84
110−97,5 5,84
< Z <
·
= P ( Z > 2, 14) = 0, 0162
110−97,5 5,84
= P (0, 42 < Z < 2, 14) = 0, 321
Problema 4.21. Suponiendo que la probabilidad de que un niño que nace sea varón es familia de 6 hijos tenga
0, 51 , hallar la probabilidad de que una
(a) por lo menos menos una niña. niña. (b) por lo menos menos un un niño. X P ( X
≥ 1) = 1 − P ( X = 0) = 1 X
P ( X
≥ 1) = 1 − P ( X = 0) = 1
B (6;0 6; 0, 49)
6 0
− ·
0, 490
·
0, 516
= 0, 9824
·
0, 496
= 0, 9861
B (6;0 6; 0, 51)
6 0
− ·
0, 510
Problema 4.22. La anchura en mm de una población de coleópteros sigue una distribució distribución n N (µ , σ ). Se estima que el 77% de la población mide menos de 12mm. y que el 84% mide más de 7 mm. (a) ¿Cuál es la anchura anchura media de la población? población? (b) Hallar Hallar σ .
Por las tablas se establece que el 77% por debajo le corresponde una Z = 0, 74 por encima del 84% Z = −1, podemos plantear un sistema de ecuaciones:
Problema 4.23.
0, 74 = 12σ −µ −1 = 7−σ µ Resolviendo
µ = 9, 87 σ = 2, 87
En una gran ciudad, ciudad, el 60% de la población fuma, el 6% tiene bronquiti bronquitiss crónica, crónica, y el 4 % fuma y padece padece bronquitis bronquitis
crónica. (a) Hallar la probabilidad de que un fumador tenga bronquitis crónica. (b) Hallar la probabilidad de que un no fumador tenga bronquitis crónica. (c) Elegimos al azar 120 personas personas de la ciudad. Hallar la probabilidad de que más de 80 de ellas sean fumadores. fumadores. P ( B/F ) =
Manuel Angel Barea Gómez
P( B F ) P(F )
∩
= 00,,04 6 = 0, 066
87
CAPÍTULO CAPÍTULO 4. VARIABLES ARIABLES ALEATORIA ALEATORIAS S
·
P ( B) = P (F ) P ( B/F ) + P F
·
Aproximamos a una normal X
P ( B/F )
= 0,06−(00,,64·0,066) = 0, 051
)] P( B) [P(F ) P( B/F )] P(F )
−
→ P( / ) = B F
·
N (72;5, 36)
−72,5 P ( X > 80) = P Z > 805,36
= P ( Z > 1, 4) = 0, 0808
Problema 4.24.
La probabilidad de que un individuo sufra una reacción por una inyección de un determinado suero es de 0,001. Determine la probabilidad de que de un total de 2000 individuos tengan reacción: (a) Exactamente Exactamente tres. tres. (b) Más de dos individuos. individuos.
Aproximamos a una distribución de Poisson X
P(2), ya que λ = 0, 001 P ( X = 3) =
P ( X > 2) = 1
e−2 23
·
3!
· 2000 = 2.
= 0, 1804
− [P ( X = 0) + P ( X = 1) + P ( X = 2)] = 1 − (0, 1353 + 0, 2707 + 0, 2707) = 0, 3233
Problema 4.25.
Una asociación de cardiología afirma que solo el 10% de los adultos mayores de 30 años logran completar una prueba de esfuerzo físico fí sico especialmente diseñada d iseñada para ellos. Se toman al azar cuatro personas mayores de 30 años y se someten a la prueba de esfuerzo. Calcule la probabilidad de que: (a) Dos personas personas pasen pasen la prueba. (b) Ninguna person persona a pase la prueba. prueba. (c) Una sola persona persona no pase la prueba. prueba. (d) Más de una pero menos de cuatro personas personas pasen la prueba. (e) Una o más pero pero tres o menos, no pasen pasen la prueba. (f) Si se toma una muestra de 50 personas, personas, cuál es la probabilidad probabilidad de que al menos dos personas personas pasen la prueba.
Se trata de una distribución binomial X
B (4;0 4; 0, 1) P ( X = 2) =
P ( X = 0) =
P ( X = 3) =
4 2
0, 12 0, 92 = 0, 0486
4 0
0, 10 0, 94 = 0, 6561
4 3
0, 13 0, 91 = 0, 0036
· · · · · · ·
P (1 < X < 4) = P ( X = 2) + P ( X = 3) =
En el apartado e, la distribución será X P (1
0, 1 2
·
4 3
0, 9 2 +
·
4 2
0, 9 2
0, 13 · 0, 91 = 0, 0522
B (4;0 4; 0, 9)
≤ X ≤ 3) = P ( X = 1) + P ( X = 2) + P ( X = 3) =
Manuel Angel Barea Gómez
4 2
4 1
·
0, 9 1
88
·
0, 13 +
·
·
0, 1 2 +
4 3
·
0, 93 · 0, 11 = 0, 6512
CAPÍTULO CAPÍTULO 4. VARIABLES ARIABLES ALEATORIA ALEATORIAS S
El último apartado se puede aproximar a una normal X
N (5;2 5; 2, 12)
P ( X > 1) = P Z > 12,−125
= P ( Z > 1, 88) = 0, 9699
−
Problema 4.26.
La diabetes mellitus tipo 1 y la enfermedad celíaca (EC) son alteraciones crónicas que comparten susceptibilidad genética, presencia de anticuerpos órgano específicos e influencia de factores ambientales. Un estudio sobre este tipo de pacientes dio como resultado resultado que el 6,4 % de los diabéticos diabéticos tienen EC. Se desea saber: (a) Si se eligen ocho diabéticos al azar, azar, ¿cuál es la probabilidad de que más de uno de ellos sea celíaco? (b) Si se eligen cinco diabéticos diabéticos al azar, azar, ¿cuál es la probabili probabilidad dad de que exactament exactamentee el primero primero y el último sean celíacos y los demás no?
Es una distribución binomial X P ( X > 1) = 1
B (8;0 8; 0, 064)
− [P ( X = 0) + P ( X = 1)] = 1
8 0
− ·
0, 0640
·
0, 9368 +
8 1
·
0, 0641
·
0, 9367
= 0, 089
El apartado b su probabilidad será 0 , 064 · 0, 936 · 0, 936 · 0, 936 · 0, 064 = 0, 00336
Problema 4.27. Al secuenciar una proteína sintetizada “ in vitro” se encuentra encuentra que está compuesta de alanina y leucina. Sabiendo Sabiendo que la alanina supone el 60 % de los aminoácidos aminoácidos que la componen, cuál es la probabilid probabilidad ad de que: (a) Al menos cuatro de los cinco primeros aminoácidos de la cadena sean leucina. (b) Exactamente tres de los cinco primeros primeros aminoácidos de la cadena sean alanina.
Es una distribución binomial X P ( X
B (5;0 5; 0, 6)
5 4
·
≥ 4) = P ( X = 4) + P ( X = 5) =
0, 6 4
P ( A A A L L) = 0, 63
∩ ∩ ∩ ∩
·
0, 4 1 +
5 5
·
0, 65 · 0, 40 = 0, 087
· 0, 42 = 0, 03456
Problema Problema 4.28.
Se supo supone ne que que la prob probabi abilid lidad ad de tene tenerr un hijo hijo albin albino o en matr matrim imoni onios os norm normale aless port portad ador ores es del del gen gen para para el albini albinism smo o es 1/4. Calcule la probabilidad de que en una de estas familias, compuesta por cinco hijo: (a) Ninguno sea albino. albino. (b) Al menos uno uno sea albino. albino. (c) Exactamente el primero primero y el tercero tercero sean albinos y los demás no. (d) No más de dos sean sean albinos. albinos. X P ( X = 0) =
P ( X
Manuel Angel Barea Gómez
B (5;0 5; 0, 25)
5 0
·
≥ 0) = 1 − P ( X = 0) = 1
0, 250 · 0, 755 = 0, 2373 5 0
− · 89
0, 250 · 0, 755 = 0, 7627
CAPÍTULO CAPÍTULO 4. VARIABLES ARIABLES ALEATORIA ALEATORIAS S P A A A A A = 0, 252
∩∩∩∩ ·
P ( X < 3) = P ( X = 0) + P ( X = 1) + P ( X = 2) =
Problema 4.29.
5 0
· 0, 753 = 0, 02636
0, 250 · 0, 755 +
5 1
·
0, 251 · 0, 754 +
5 2
·
0, 252 · 0, 753 = 0, 8965
Una determinada determinada planta nuclear nuclear desprende desprende una cantidad cantidad detectable detectable de gases radiactivos radiactivos,, un promedio promedio de dos veces
al mes. (a) Halle la probabilidad de que no se produzcan tales emisiones durante un período de tres meses. meses. (b) Halle la probabilidad de que haya, como máximo, cuatro de tales emisiones durante durante ese período. (c) ¿Cuál es el número número esperado de emisiones emisiones durante tres tres meses? Si han sido detectadas detectadas 12 o más emisiones, emisiones, ¿puede pensarse pensarse que habría que dudar del promedio de dos al mes? X
P ( X = 0) = P ( X
P (6)
e−6 60
·
0!
= 0, 00247
≤ 4) = P ( X = 0) + P ( X = 1) + P ( X = 2) + P ( X = 3) + P ( X = 4) = 0, 0025 + 0, 0149 + 0, 0446 + 0, 0892 + 0, 1339 = 0, 2851 E ( X ) = λ = 6 P ( X
≥ 12) = 0, 020092
Al ser una probabilidad pequeña es razonable dudar del promedio. Tras una serie de análisis se determinó que el número medio por cm3 de una cierta especie de bacterias contenidas en el agua de un embalse es de 4.
Problema 4.30.
(a) ¿Cuál es la distribución de probabilidad probabilidad del número de bacterias de esa especie en una gota de agua que mide 1/10 cm3 ? (b) ¿Cuál es la probabilidad de no encontrar encontrar ninguna bacteria de esa especie especie en una gota de agua? (c) ¿Y la de encontrar encontrar al menos 2 bacterias? bacterias? X
P ( X = 0) = P ( X
≥ 2) = 1 − [P ( X = 0) + P ( X = 1)] = 1
−
P (0, 4)
e−0,4 0,40
·
0!
e−0,4 0,40
·
0!
Problema 4.31.
= 0, 6703
+
e−0,4 0,41
·
1!
=1
− [0, 6703 + 0, 2681] = 0, 0616
Un agente de seguros vende pólizas individuales contra cierto tipo de accidentes. Una encuesta estima que a lo largo de un año cada persona tiene una posibilidad de cada mil de ser víctima de un accidente del tipo que cubre la póliza y que el agente podrá vender una media de cuatro mil pólizas de seguros de este tipo al año. Se pide: (a) Probabilidad de que el número número de accidentes no pase de cuatro. cuatro. (b) Número de accidentes esperados esperados por año. (c) Probabilid Probabilidad ad de que ocurran ocurran más de dos accidentes accidentes por año. (d) Probabilidad de que ocurran doce accidentes por año.
Manuel Angel Barea Gómez
90
CAPÍTULO CAPÍTULO 4. VARIABLES ARIABLES ALEATORIA ALEATORIAS S
X
P (4)
E ( X ) = λ = n p = 4000
·
P ( X
· 0, 001 = 4
≤ 4) = P ( X = 0) + P ( X = 1) + P ( X = 2) + P ( X = 3) + P ( X = 4) = (0, 0183 + 0, 0733 + 0, 1465 + 0, 1954 + 0, 1954) = 0, 6289
P ( X > 2) = 1
− [P ( X = 0) + P ( X = 1) + P ( X = 2)] = 1 − [0, 0183 + 0, 0733 + 0, 1465] = 0, 7619 P ( X = 12) =
e−12 412
·
12!
= 0, 00064
Problema 4.32.
Una especie de ranas pone entre 0 y 100 huevos en cada “ puesta”. Se tiene una población de 380 ranas hembras y se sabe que la puesta de huevos sigue una distribución normal de media 55 y desviación típica 10. (a) Calcule la probabilid probabilidad ad de que una rana ponga más de 50 huevos. (b) ¿Cuántas ¿Cuántas ranas de las 380 cabe esperar esperar que pongan entre entre 65 y 80 huevos? huevos? (c) Si se decide seleccion seleccionar ar al 5 % de las ranas más ponedoras ponedoras para para la investigac investigación, ión, ¿cuál es el mínimo número de huevos que debe poner una rana para ser seleccionada? X
N (55;10)
4 0 . 0
3 0 . 0
y
−55 = P ( Z > P ( X > 50) = P Z > 5010
2 0 . 0
1 0 . 0
−0, 5) = 0, 6915
0 0 . 0
30
40
50
60
70
80
x
4 0 . 0
3 0 . 0
y
−55 < Z < 80−55 = P (1 < Z < 2, 5) = 0, 1525 P (65 < X < 80) = P 6510 10
2 0 . 0
1 0 . 0
0 0 . 0
30
40
50
60
70
80
x
El 5% de las ranas más ponedores le corresponde una Z = 1, 645 por tanto 1, 645 = x−σ µ → x = 1, 645 · 10 + 55 ≃ 71huevos
Problema 4.33.
En la observación del número de glóbulos rojos (en millones) de los habitantes de una gran ciudad se observó que seguían aproximadamente una distribución normal de media 4,5 y desviación típica 0,5. Se pide: (a) Probabilidad de que un habitante tomado al azar azar tenga más de cinco millones de glóbulos rojos. rojos. (b) Tanto por ciento de habitantes con menos de 3,75 millones. (c) Número Número mínimo de glóbulos glóbulos rojos rojos del 20 % más alto de la ciudad.
Manuel Angel Barea Gómez
91
CAPÍTULO CAPÍTULO 4. VARIABLES ARIABLES ALEATORIA ALEATORIAS S
(d) Número Número máximo de glóbulos glóbulos rojos rojos del 10% más bajo de la ciudad. X
N (4, 5;0 5; 0, 5)
8 . 0
6 . 0
y
4,5 P ( X > 5) = P Z > 5− 0,5
4 . 0
2 . 0
= P ( Z > 1) = 0, 1587
0 . 0
3 .0
3.5
4.0
4.5
5 .0
5.5
6.0
x
8 . 0
6 . 0
y
, − , P ( X < 3, 75) = P 3 750,54 5 < Z = P (
4 . 0
2 . 0
−1, 5 < Z ) = 0, 0668
0 . 0
3 .0
3.5
4.0
4.5
5 .0
5.5
6.0
x
8 . 0
6 . 0
y
Se trata de una Z = 0, 84 0, 84 = x−0,45,5 → x = 4, 92
4 . 0
2 . 0
0 . 0
3 .0
3.5
4.0
4.5
5 .0
5.5
6.0
x
8 . 0
6 . 0
y
Se trata de una Z = −1, 28 −1, 28 = x−0,45,5 → x = 3, 86
4 . 0
2 . 0
0 . 0
3 .0
3.5
4.0
4.5
5 .0
5.5
6.0
x
Problema 4.34.
Un biólogo comprobó que la probabilidad de que al inyectar a una rata un determinado producto sobreviviera después de una semana era de 0,5. Si el biólogo inyecta el producto a un lote de cien ratas, se pide calcular la probabilidad de que vivan: (a) Más de sesenta sesenta y cinco. cinco. (b) Entre Entre cuarenta cuarenta y sesenta. (c) Menos de treinta. treinta. (d) Más de cuarenta cuarenta y cinco. cinco.
Manuel Angel Barea Gómez
92
CAPÍTULO CAPÍTULO 4. VARIABLES ARIABLES ALEATORIA ALEATORIAS S
Aproximamos a una normal con
µ = n p = 0, 5 100 = 50 X σ = n p q = 0, 5 100 0, 5 = 5
√ · · · · √ ·
·
N (50;5)
8 0 . 0
6 0 . 0
y
50 = P ( Z > 3) = 0, 00135 P ( X > 65) = P Z > 65− 5
4 0 . 0
2 0 . 0
0 0 . 0
30
40
50
60
70
x
8 0 . 0
6 0 . 0
y
50 60−50 = P ( P (40 < X < 60) = P 40− 5 < Z < 5
4 0 . 0
2 0 . 0
−2 < Z < 2) = 0, 9544
0 0 . 0
30
40
50
60
70
x
8 0 . 0
6 0 . 0
y
50 P ( X < 30) = P 30− 5 < Z = P (
4 0 . 0
2 0 . 0
−4 < Z ) = 0, 00003
0 0 . 0
30
40
50
60
70
x
8 . 0
6 . 0
y
50 = P ( Z > P ( X > 45) = P Z > 45− 5
4 . 0
2 . 0
−1) = 0, 8413
0 . 0
3 .0
3.5
4.0
4.5
5 .0
5.5
6.0
x
Problema 4.35.
En una cierta prueba, el 35% de la población examinada obtuvo una nota superior a 6; el 25%, entre 4 y 6, y el 40%, inferior a 4. Suponiendo que las notas siguen una distribución normal, halle la nota media y la desviación típica. ¿Qué porcentaje de la población tiene una nota que se diferencie de la media medi a en menos de dos unidades?
Para X = 6 → Z = 0, 385 y X = 4 → Z = −0, 255
Manuel Angel Barea Gómez
0, 385 = 6−σ µ −0, 255 = 4−σ µ Resolviendo
µ = 4, 796 X σ = 3, 125
93
N (4, 796;3, 125)
CAPÍTULO CAPÍTULO 4. VARIABLES ARIABLES ALEATORIA ALEATORIAS S
2 1 . 0
0 1 . 0
y
−4,796 P (2, 796 < X < 6, 796) = P 2,796 3,125
8 0 . 0
6 0 . 0
< Z <
6,796−4,796 3,1255
= P ( 0, 64 < Z < 0, 64) = 0, 4778
−
4 0 . 0
0
2
4
6
8
10
x
Problema 4.36.
¿Cuál sería la probabilidad de que en 1000 tiradas de un dado salga el número 5, más de 150 veces y menos de
200?
Aproximamos a una normal con
µ = n p = 16 1000 = 166, 67
· · √ σ = n · p · q =
· 1 6
N (166, 67;11, 78)
1000 · 56 = 11, 78
X
200−166,67 11,78
5 3 0 . 0 0 3 0 . 0 5 2 0 . 0
− ,67 P (150 < X < 200) = P 15011166 ,78
0 2 0 . 0 y
5 1 0 . 0 0 1 0 . 0
< Z <
= P ( 1, 41 < Z < 2, 83) = 0, 9184
−
5 0 0 . 0 0 0 0 . 0
120
14 0
1 60
1 80
200
x
Problema 4.37.
El diámetro de una válvula cardíaca en una especie animal se distribuye normalmente con media de 3, 5 mm y una desviación típica de 0, 04mm. (a) ¿Cuál es la proporción proporción de válvulas con un diámetro diámetro mayor de 3,425? (b) ¿Cuál es la probabilidad probabilidad de que una válvula válvula tenga un diámetro diámetro entre 3,4 y 3,6 mm? (c) ¿Cuál es el valor del diámetro diámetro mínimo por debajo del cual se encuentra encuentra el 20 % de las válvulas? X
Manuel Angel Barea Gómez
N (3, 5;0 5; 0, 04)
94
CAPÍTULO CAPÍTULO 4. VARIABLES ARIABLES ALEATORIA ALEATORIAS S
0 1
8
P ( X > 3, 425) = P Z >
6
y
4
3,425−3,5 0,04
= P ( Z > 1, 875) = 0, 9696
−
2
0
3 .3
3.4
3 .5
3.6
3.7
x
0 1
8
P (3, 4 < X < 3, 6) = P 3,40,−043,5 < Z < 3,60,−043,5
6
y
4
= P ( 2, 5 < Z < 2, 5) = 0, 9876
−
2
0
3 .3
3.4
3 .5
3.6
3.7
x
0 1
8
Se trata de una Z = 0, 2 −0, 2 = x0−,043,5 → x = 3, 47
6
y
4
2
0
3 .3
3.4
3 .5
3.6
3.7
x
Problema 4.38. Durante cierta epidemia de gripe, enferma el 30% de la población. En un aula con 120 estudiantes, cuál es la probabilidad de que: (a) Al menos 40 estudiantes estudiantes padezcan padezcan la enfermedad. enfermedad. (b) Haya exactamente exactamente 50 estudiantes estudiantes con gripe. gripe.
Aproximamos a una normal con
µ = n p = 0, 3 120 = 36 X σ = n p q = 0, 3 120 0, 7 = 5, 02
√ · · · · √ ·
·
N (36;5 , 02)
8 0 . 0
6 0 . 0
y
P ( X = 50) =
·
P ( X
4 0 . 0
2 0 . 0
≥ 40) = P
Z > 405,−0236
= P ( Z
≥ 0, 69) = 0, 2451
0 0 . 0
20
30
40
50
60
x
Manuel Angel Barea Gómez
95
120 50
0, 350 · 0, 770 = 0, 0018
CAPÍTULO CAPÍTULO 4. VARIABLES ARIABLES ALEATORIA ALEATORIAS S
Problema 4.39.
Se fumiga una plantación de zanahorias con un producto tóxico. Se sabe que la cantidad de producto que absorbe una zanahoria (en mg) es una variable aleatoria con distribución normal de media 4 y desviación típica 1,5. Se considera que una zanahoria está contaminada si ha absorbido más de 6 mg del producto tóxico. (a) Calcule la probabilidad de que una zanahoria zanahoria seleccionada al azar haya sido contaminada en el proceso de fumigación. (b) Si se seleccionan seleccionan al azar 5 zanahorias, zanahorias, ¿cuál ¿cuál es la probabilidad probabilidad de que al menos dos de ellas estén contaminadas? contaminadas?
La probabilidad de que una zanahoria esté contaminada es:
5 2 . 0
0 2 . 0
y
P ( X > 6) = P Z > 61−,54
5 1 . 0
0 1 . 0
= P ( Z > 1, 33) = 0, 0918
5 0 . 0
0 0 . 0
0
2
4
6
8
x
P ( X
≥ 2) = 1 − [P ( X = 0) + P ( X = 1)] = 1
Manuel Angel Barea Gómez
5 0
− ·
0, 09180
96
·
0, 90825 +
5 1
·
0, 09181
·
0, 90824
= 0, 0698
C APÍTULO
5 Intervalos de confianza y contrastes de hipótesis paramétricas de una población.
Problema 5.1.
Los valores de LH, obtenidos en una muestra aleatoria, de mujeres en estado de gestación son los siguientes: 154, 220, 206, 187, 182, 173, 169, 207, 215, 211, 165, 194, 199, 184, 177, 213, 189, 180, 191, 146. Los valores están expresados en mlU/ml. y se consideran distribuidos Normalmente. (a) Cons Constr truirun uirun inte interv rvalo alo de confi confianz anza a para para el valo valorr medio medio de LH, LH, para para unos unos nive nivele less de confia confianz nza a del del 95% y 99% respe espect ctiv ivame amente nte.. (b) Para los mismos niveles de confianza, obtener un intervalo de confianza para la varianza poblacional de los valores de LH.
Para la población dada tenemos
± − ± −
s2
t n
IC 99% 99% (µ ) = x
t n 1;α /2
IC 95% 95%
− −
√ · −· −·
=
2 IC 99% 99% σ =
s n
=
(152
−
188 10
−
−
(20 1)
−
−188,10)2
= 422, 73
s = 20, 56
= 188, 10
s 1;α /2 · √ n
IC 95% 95% ( µ ) = x
σ 2
=
2 ∑( xi x) (n 1)
∑ xi ...+ ...+191+146 = 154+220+20 = , n ...+(191 188,10)2 +(146 188,10)2 +(220 188,10)2 +...+(
x =
= 188, 10
± 2, 093 · 20√ ,2056 = 188, 10 ± 9, 62 → IC 95% 95% = µ ∈ [178, 41;197, 72]
± 2, 861 · 20√ ,2056 = 188, 10 ± 13, 15 → IC 99% 99% = µ ∈ [174, 95;201, 25]
· ·
(n 1) s2 (n 1) s2 ; 2 2 χ (n−1);α /2 χ (n−1);(1−α /2)
− ·
2 (n 1) s2 ; (n 1) s χ (2n−1);α /2 χ (2n−1);(1−α /2)
− ·
,72 19·422,72 = 1932422 = σ 2 ,85 ; 8,91
,72 19·422,72 = 1938422 = σ 2 ,58 ; 6,84
∈ [244, 50;901, 44] ∈ [208, 18;1172, 42]
Problema 5.2.
La presión presión arterial arterial diastólica diastólica para mujeres mujeres de 18 a 74 años de edad sigue una distribu distribución ción normal, normal, donde conocemos conocemos que el percentil 5 es 57mmHg y que el percentil percentil 95 es 97mmHg. (a) Si tomamos al azar un sujeto de esta población, ¿cuál es la probabilid probabilidad ad de que tenga una presión presión arterial arterial diastólica superior superior a 70mmHg? (b) Si tomamos tomamos al azar azar una muestra muestra de 25 sujetos sujetos en esta poblaci población, ón, ¿cuál es la probabili probabilidad dad de que su su media muestral muestral sea inferior inferior a 80mmHg?
Para P5 → Z = −1, 645 y P95 → Z = 1, 645 97
CAPÍTULO CAPÍTULO 5. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONTRASTES CONTRASTES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICAS ARAMÉTRICAS DE UNA UNA POBLACIÓN. POBLACIÓN.
1, 645 = 97σ −µ −1, 645 = 57σ −µ Resolviendo
µ = 83, 55 X σ = 8, 20
N (77, 01;12, 15)
0 3 0 . 0 5 2 0 . 0
0 2 0 . 0 y
P ( X > 70) = P Z >
5 1 0 . 0 0 1 0 . 0
70−77,01 12,15
= P ( Z > 0, 57) = 0, 7157
−
5 0 0 . 0 0 0 0 . 0
40
60
80
100
120
x
Al ser para una media muestral:
x µ
−√
P ( X < 80) = P Z < σ /
n
−
77√ ,01 = P 80 = P ( Z < 1, 23) = 0, 8907 12,15/ 25
Problema 5.3.
Los siguientes datos representan los porcentajes de mejorías en el número de lesiones por acné después de 16 semanas de tratamiento, de 10 individuos con este problema:
48,6
49,4
50,1
49,8
50,6
50,8
47,1
52,5
49,0
46,7
(a) Calcular Calcular un intervalo de confianza confianza del 90 % para el porcentaje porcentaje medio. (b) Calcular Calcular un intervalo intervalo de confianza del 99 % para la desviación desviación típica de los porcentajes. porcentajes. ∑ xi n
−− − ± − · √ −· s2 =
IC 90% 90% ( µ ) = x
2 ∑( xi x) ( n 1)
t n 1;α /2
IC 99% 99%
σ 2
x =
...+ ...+49,0+46,7 = 48,6+49,4+10 = 49, 46
2 2 ...+( ...+(49,0−188,10)2 +(46,7−188,10)2 = (48,6 49,46) +(49,4−49,46) +(10 =3 −1) s = 1, 73
s n
=
= 49, 46
± 1, 833 · √ 1,7310 = 49, 46 ± 1 → IC 90% 90% (µ ) = µ ∈ [48, 46;50, 46]
(n 1) s2 (n 1) s2 ; 2 2 χ (n−1);α /2 χ (n−1);(1−α /2)
− ·
· ·
IC 99% 99% (σ ) = σ
3 ; 9 3 = σ 2 = 239,59 1,73
∈ [1, 14;15, 6]
∈ [1, 06;3, 94]
Problema 5.4.
Se desea precisar precisar el porcentaje porcentaje de individuos que sufren sufren incontinencia urinaria de entre entre los internados en un hospital y, para ello, se tomó una muestra m uestra de 120 pacientes de los cuales 28 presentaron presentaron ese problema. (a) ¿Entre ¿Entre qué valores valores está tal porcentaje porcentaje (95%)?. (b) ¿Se ha conseguido conseguido una precisió precisión n del 2 % en la estimación?. estimación?. (c) Si no se ha conseguido, conseguido, ¿cuántos ¿cuántos individuos individuos se necesitan para ello?. ello?.
± · · −
IC 95% 95% (π ) = p zα /2
Manuel Angel Barea Gómez
p (1 p) n
28 = 0, 23 p = 120 q = 0, 77
= 0, 23
± 1, 96 · 98
·
0,23 0,77 120
= 0, 23
± 0, 07 = π ∈ [0, 16;0, 30]
CAPÍTULO CAPÍTULO 5. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONTRASTES CONTRASTES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICAS ARAMÉTRICAS DE UNA UNA POBLACIÓN. POBLACIÓN.
No se ha conseguido una precisión del 2% sino del 7%. ε = zα /2
· ·−
p (1 p) n
→n=
2 p zα /2 p (1 p) ε 2
·· −
2 ,23·0,77 = 1,96 0·0,02 2
≃ 1701
Problema 5.5.
Se ha realizado un estudio sobre niños que padecen dolor de pecho. Se ha hallado que de 137 niños que tenían dolor de pecho, 100 daban radiografías de tórax Normales. (a) Obtener un intervalo de confianza del 95% de la proporción de niños con dolor de pecho que dan radiografías radiografías Normales. (b) Obtener el tamaño muestral que se debe emplear para estimar la verdadera proporción proporción de niños con radiografías Normales Normales con un error de 0,03 dentro dentro de un intervalo intervalo de confianza confianza del 99 %.
± · · − · ·− p (1 p) n
IC 95% 95% (π ) = p zα /2
= 0, 729
p (1 p) n
ε = zα /2
→n
p = 100 137 = 0, 729 q = 0, 271
± 1, 96
·
0,729·0,271 137
2 p zα p (1 p) = /2 ε 2
·· −
= 0, 729
± 0, 074 = π ∈ [0, 654;0, 803]
2 729·0,271 = 2,575 ·00,,03 2
≃ 1456
Problema 5.6.
En un estudio para establecer un patrón de lectura "Normal"de Ca en personas adultas aparentemente sanas, se ha obtenido una primera muestra de 25 individuos en la que se ha medido los miligramos de calcio por decilitro de sangre, obteniendo un intervalo de confianza del 95% para la media de [9, 294;9, 706] (a) ¿Cuál sería sería el intervalo de confianza confianza para para la media al 99%? (b) ¿Cuál sería sería un intervalo de confianza confianza para la desviación desviación típica al 95 %?
9, 294 = x − t n−1,α /2 · √ sn = x − 2, 064 · √ s25 Resolviendo 9, 706 = x + t n−1,α /2 · √ sn = x + 2, 064 · √ s25
± − · √ −·
IC 99% 99% ( µ ) = x
IC 95% 95%
t n 1;α /2
σ 2
=
s n
= 9, 5
x = 9, 5 s = 0, 5
± 2, 797 · √ 0,255 = 9, 5 ± 0, 279 → IC 99% 99% ( µ ) = µ ∈ [9, 221;9, 779]
(n 1) s2 (n 1) s2 ; 2 2 χ (n−1);α /2 χ (n−1);(1−α /2)
− ·
·
24 0,25 24·0,25 39,36 ; 12,40
=
IC 95% 95% (σ ) = σ
= σ 2
∈ [0, 152;0, 483]
∈ [0, 39;0, 69]
Problema 5.7.
Para estudiar el número de pulsaciones por minuto después de realizar un esfuerzo físico concreto, se toma una muestra de 240 individuos, que dieron una media de 90 con una desviación típica de 16 pulsaciones. Suponiendo normalidad en los datos: (a) ¿Con qué nivel de confianza puede asegurars asegurarsee que la media poblacional está dentro dentro del intervalo [90
± 1, 7]?
(b) Construya Construya el intervalo de confianza confianza de µ con un nivel de confianza confianza del 98 %. Calcule el error de estimación. estimación. Obtenga el valor de n para que el error de estimación sea inferior a 2
Manuel Angel Barea Gómez
99
CAPÍTULO CAPÍTULO 5. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONTRASTES CONTRASTES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICAS ARAMÉTRICAS DE UNA UNA POBLACIÓN. POBLACIÓN.
1, 7 = t n−1;α /2 · √ sn
± −
IC 98% 98% (µ ) = x
t n
s 1;α /2 · √ n
√
= 1,7·16240 = 1, 64 Por las tablas α = 0, 90
→ t 239; /
α 2
= 90
± 2, 326 · √ 16240 = 90 ± 2, 40 → IC 98% 98% (µ ) = µ ∈ [87, 60;92, 40] ε = 2, 4
ε = t n−1;α /2
s n
· √ → n =
·
t n−1;α /2 s
ε
2
16 2 = 2,326 2
· ≃
347
Problema 5.8.
La concentración de ácido úrico en sangre mg/dl sigue una distribución normal. Se ha estudiado una muestra de 150 individuos individuos y hemos obtenido obtenido como intervalo de confianza para la media al 95 %: [5, 52;6, 48]. (a) ¿Qué tamaño muestral sería necesario para para que el error error de estimación sea inferior a 0, 1 mg/dl? (b) ¿Podemos afirmar con un 2% de significación, que la concentración media en sangre de ácido úrico úrico es superior a 5, 5 mg/dl?
s 5, 52 = x − t n−1,α /2 · √ sn = x − 1, 96 · √ 150 Resolviendo s 6, 48 = x + t n−1,α /2 · √ sn = x + 1, 96 · √ 150
s →n= ε = t n−1;α /2 · √ n
·
t n−1;α /2 s
ε
2
2 = 1,096,1 3
· ≃
x=6 s=3
3458
El apartado b es un contraste de hipótesis:
H 0 H 1
µ = 5, 5 µ > 5, 5
El valor crítico es t 149;0 149;0,01 = 2, 326, el criterio de rechazo será t > 2, 396
| x x− x|
6−5,5
t = s/√ n = 3/√ 150 = 2, 04
Por tanto pertenece no pertenece a la región de rechazo y no podemos validar H 1
Problema 5.9.
Se cree que más del 85% de todos los niños con dolor torácico presentará, a pesar del dolor, un ecocardiograma normal. Una muestra de 139 de estos niños ha dado 123 con ecocardiogramas normales. (a) Hallar un intervalo de confianza confianza al 99 % para la propor proporción ción de niños con dolor torácico que presentan presentan ecocardiogr ecocardiogramas amas normales. (b) Realizar un contraste de hipótesis para para aceptar o rechazar rechazar la hipótesis del enunciado con α = 0, 1
± · · −
IC 99% 99% (π ) = p zα /2
p (1 p) n
= 0, 885
± 2, 575
p = 123 139 = 0, 885 q = 0, 115
·
0,885·0,115 139
El valor crítico es zα /2 = 1, 64, el criterio de rechazo será zα /2 > 1, 64 Manuel Angel Barea Gómez
100
= 0, 885
± 0, 069 = π ∈ [0, 816;0, 954]
H 0 H 1
π = 0, 85 π > 0, 85
CAPÍTULO CAPÍTULO 5. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONTRASTES CONTRASTES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICAS ARAMÉTRICAS DE UNA UNA POBLACIÓN. POBLACIÓN.
zα /2 =
0,885−0,8
| ·− −| = p p p (1 p)
0,885·0,115 139
n
= 3, 14
Por tanto pertenece a la región de rechazo y podemos rechazar H 0 y si dar por válida H 1 aceptando la hipótesis
Problema 5.10.
Para determinar el aumento de peso que produce en las ratas hembras una dieta con alto contenido en proteínas, se toman 12 ratas y se determina el aumento de peso (medido en grs.) entre entre los días 28º y 84º . Sabiendo Sabiendo que la suma de estos datos es 1440, que la suma de sus cuadrados es 177832 y que los datos siguen una ley Normal, encontrar un intervalo de confianza para σ .
s2 =
(n 1) s2
− ·
x =
= 1440 12 = 120
∑ xi n
12 2 −1 · σ = 11 n
n
177832 12
· ·
− 1202
s = 21, 38
(n 1) s2
− ·
2 IC 95% ; χ 2 95% σ = χ 2 (n−1);α /2 (n−1);(1−α /2)
= 457, 45
,45 11·457,45 = 1121457 = σ 2 ,92 ; 3,82
IC 95% 95% (σ ) = σ
∈ [229, 56;1317, 26]
∈ [15, 15;36, 29]
Problema 5.11.
El servicio público de salud recomienda la vacunación contra la gripe para personas personas de más de sesenta años. Se ha tomado una muestra aleatoria aleatoria de 100 personas personas que pertenecen pertenecen a este grupo de edad, para estimar estimar el porcentaje porcentaje de individuos que tienen intención de vacunarse. (a) ¿Con qué nivel de confianza puede asegurarse asegurarse que la proporción proporción de individuos que se vacunarán se encuentra en el intervalo
[0, 725;0, 875] (b) Se han previsto previsto vacunas para el 75 % de la población formada formada por este grupo de edad, ¿serán ¿serán suficientes? suficientes?
Como el intervalo de confianza se distribuye sobre la media p = 0, 875 = 0, 8 + zα /2
· ·
0,8 0,2 100
xin f + xsup
2
= 0,725+2 0,875 = 0, 8
→ z / =1,875 → zα = 1, 54 → α = 0, 9386 α 2
H 0 H 1
π = 0, 75 π > 0, 75
El valor crítico para una α = 95% es zα /2 = 1, 96, el criterio de rechazo será z > 1, 54 z =
0,8 0,75
·− − = − · p p
0,8 0,2 100
p (1 p) n
= 1, 25
Por tanto H 0 es cierta.
Problema 5.12.
Para conocer la eficacia de un programa de entrenamiento deportivo se evalúa la frecuencia cardíaca de 40 sujetos antes y después del mismo. Con estos datos se obtiene que la diferencia de frecuencia cardíaca media (antes - después) se encuentra en el intervalo [5 3, 5] con un 95% de confianza. Suponiendo normalidad en los datos y sabiendo que una mejoría de la forma física implicaría i mplicaría un descenso de la frecuencia f recuencia cardíaca, ¿podemos asegurar la eficacia del tratamiento?
±
H 0 H 1
d D0 = 5 d D0 < 5
− −
El valor crítico es t n−1;α /2 = t 39;0 39;0,975 = 2, 022, el criterio de rechazo será t < 2, 022 Manuel Angel Barea Gómez
101
CAPÍTULO CAPÍTULO 5. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONTRASTES CONTRASTES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICAS ARAMÉTRICAS DE UNA UNA POBLACIÓN. POBLACIÓN.
ε = t
√
· 40 = 10, 94 · √ → s = 3,512,022 s n
t =
5−√ 0
= 2, 89
10,94/ 40
Por tanto se rechaza H 0 y aceptamos H 1 y la eficacia del tratamiento
Problema 5.13.
Se determinaron los porcentajes de peso corporal ideal de 18 diabéticos insulinodependientes elegidos al azar. Un porcentaje de 120 % significa que un individuo pesa 20 % más que su peso ideal; un porcentaje de 95 % significa que el individuo pesa 5 % menos que su peso ideal. Suponiendo normalidad en la distribución poblacional de la variable y a partir de los datos obtenidos:
1 07
119
99
11 4
120
104
88
114
124
1 16
101
1 21
1 52
1 00
1 25
11 4
95
1 17
(a) ¿Podemos afirmar en promedio, que la población de diabéticos insulinodependientes tiene sobrepeso? sobrepeso? (b) Construir Construir un intervalo intervalo de confianza al 99 % para la desviación desviación típica poblacional poblacional de la variable variable porcentaje porcentaje de peso corporal corporal ideal.
s2 =
2
∑( xi x) (n 1)
− −
∑ xi n
x =
=
...+95+117 = 107+119+18...+ = 112, 78
(107 112,78)2 +(119 112,78)2 +...+( ...+(95 112,78)2 +(117 112,78)2 (18 1)
−
−
−
−
−
= 208
s = 14, 42
H 0 H 1
µ = 120 µ > 120
El valor crítico es t 17;0 17;0,05 = 1, 740, el criterio de rechazo será t > 1, 740 t =
120−112 √ ,78
= 2, 124
14,42/ 18
Por tanto se rechaza H 0 y se confirma que sí que tienen sobrepeso. IC 99% 99%
σ 2
=
(n 1) s2 (n 1) s2 ; 2 2 χ (n−1);α /2 χ (n−1);(1−α /2)
− ·
− ·
·
17 208 ; 17·208 35,72 5,70
=
IC 99% 99% (σ ) = σ
= σ 2
∈ [98, 99;620, 35]
∈ [9, 94;24, 94]
Problema 5.14.
El número medio de días de clínica requeridos por determinados pacientes mayores de edad era de 17 días. Se ha puesto en marcha un nuevo programa de cuidados que se espera que reduzca esta cifra. Los datos recogidos para 16 pacientes que qu e han seguido el programa son:
3 22
18 15
5 6
9 3
12 12 2
8 36
7 38
20 43
(a) ¿Prueban los datos anteriores la hipótesis esperada? (b) Calcular Calcular un intervalo intervalo de confianza al 99 % para la propor proporción ción de pacientes que necesitan necesitan más de 17 días de clínica clínica después de seguir el programa.
Manuel Angel Barea Gómez
s2
=
2 ∑( xi x) (n 1)
− −
...+38+43 ∑ xi = 3+18+...+ n 16 2 ...+(38 15,44) +(18 15,44)2 +...+(
x =
=
(3
−
−
(16 1)
−
s = 13, 24
102
= 15, 44
−15,44)2 +(43−15,44)2
= 175, 3
CAPÍTULO CAPÍTULO 5. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONTRASTES CONTRASTES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICAS ARAMÉTRICAS DE UNA UNA POBLACIÓN. POBLACIÓN.
µ = 17 µ < 17
H 0 H 1
El valor crítico es t 15;0 15;0,025 = 2, 326, el criterio de rechazo será t < 2, 131 ,44− √ 17 t = sx/−√ xn = 15 13,24/ 16 =
−0, 47
Pertenece a la región de rechazo y podemos rechazar H 0 y aceptar H 1 6 = 0, 375 La proporción de los que necesitan más de 17 días es p = 16
± · · − p (1 p) n
IC 99% 99% (π ) = p zα /2
= 0, 375
± 2, 575
·
0,375·0,625 16
= 0, 375
± 0, 312 = π ∈ [0, 0628;0, 687]
Problema 5.15.
Los neutrófilos son leucocitos cuya función es la de eliminar agentes infecciosos de la sangre, de forma que en un individuo normal el porcentaje de neutrófilos entre los leucocitos debe ser de al menos el 60%. Al realizar un recuento de 200 leucocitos de un individuo hemos visto que 107 son neutrófilos: (a) ¿A partir de qué nivel de significación significación puede afirmarse afirmarse que este individuo tiene un porcentaje porcentaje de neutrófilos por debajo debajo de lo normal? (b) ¿Cuántos ¿Cuántos leucocitos deberíamos deberíamos contar como mínimo en este individuo para obtener obtener un intervalo intervalo de confianza confianza al 99 del porcentaje de neutrófilos con una precisión del 5 %?
IC (π ) = p + zα
· − · → · ·− p (1 p) n
p = 107 200 = 0, 535 q = 0, 465
0, 6 = 0, 535 ± zα
p (1 p) n
ε = zα /2
→n=
·
0,535·0,465 200
2 p zα p (1 p) /2 ε 2
·· −
0,535 = 0,06,− = 1, 84 535·0,465
200
2 ·0,465 = 2,58 ·00,,535 052
→ α = 0, 03
≃ 675
determinada ada marca marca de cigarrillos cigarrillos se se efectúa efectúa un experi experimento mento para comprobar comprobar el contenido contenido en alquitrán alquitrán;; a tal Problema Problema 5.16. En una determin fin se prueban veinte cigarrillos elegidos al azar de lotes diferentes. Se encuentran l os siguientes datos muestrales para el contenido de alquitrán:
x = 22mg s = 4 mg
(a) Encuentre Encuentre un intervalo intervalo de confianza del 90 % para el contenido contenido medio de alquitrán en un cigarrillo de la citada marca.
± −
IC 90% 90 % (µ ) = x
t n
s 1;α /2 · √ n
= 22
± 1, 729 · √ 420 = 22 ± 1, 546 → IC 90% 90% ( µ ) = µ ∈ [20, 45;23, 546]
Problema 5.17.
Se quiere conocer la permanencia media de pacientes en un hospital, con el fin de estudiar una posible ampliación del mismo. mismo. Se tienen datos referido referidoss a la estancia expresada expresada en días de ochociento ochocientoss pacientes, pacientes, obteniéndose obteniéndose los siguientes siguientes resultados resultados::
Manuel Angel Barea Gómez
x = 8, 1 d´ıas s = 9 d´ıas
103
CAPÍTULO CAPÍTULO 5. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONTRASTES CONTRASTES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICAS ARAMÉTRICAS DE UNA UNA POBLACIÓN. POBLACIÓN.
(a) Halle un intervalo intervalo de confianza confianza del 95 % para la estancia estancia media.
± −
IC 95% 95% ( µ ) = x
Problema 5.18.
t n 1;α /2
s n
· √
= 8, 1
9 = 8, 1 ± 0, 623 → IC ± 1, 96 · √ 800 95% 95% (µ ) = µ ∈ [7, 47;8, 723]
El porcentaje de calcio observado en dientes sanos de 10 individuos de una especie animal es:
36,6
35,9
35,6
35,4
34,9
36,5
35,6
35,2
35,6
35,4
(a) Halle el intervalo intervalo de confianza del 95 % para el porcentaje porcentaje medio de calcio. calcio. (b) ¿Se podría aceptar aceptar que el porcentaje porcentaje medio de calcio es igual a 36? (c) Intervalo Intervalo de confianza del del 95 % para la varianza de dicho porcentaj porcentaje. e. (d) ¿Se podría aceptar aceptar que la varianza varianza de dicho porcentaje porcentaje es igual a 1,5?
± −
2 ∑( xi x) (n 1)
s2 =
IC 95% 95% (µ ) = x
− −
t n 1;α /2
x =
∑ xi n
...+ ...+35,6+35,4 = 36,6+35,9+10 = 35, 67
2 2 ...+( ...+(35,6−35,67)2 +(35,4−35,67)2 = (36,6−35,67) +(35,9−35,67) (+ = 0, 28 10−1) s = 0, 53
s n
· √
= 35, 67
± 2, 262 · √ 0,5310 = 35, 67 ± 0, 38 → IC 95% 95% ( µ ) = µ ∈ [35, 29;36, 05]
Sí se puede aceptar un porcentaje medio de 36 por estar incluido en el intervalo. IC 95% 95%
No está incluido en el intervalo.
Problema 5.19.
σ 2
=
(n 1) s2 (n 1) s2 ; 2 2 χ (n−1);α /2 χ (n−1);(1−α /2)
− ·
− ·
·
9 0,28 9·0,28 19,02 ; 2,70
=
= σ 2
∈ [0, 1325;0, 933]
En una muestra de 28 virus se ha medido, mediante técnicas de microscopía electrónica, el diámetro de la cápside, o
resultando, de media, 12500 A con una desviación típica de típica desconocidas.
o
2100 A. El diámetro se distribuye normalmente con media y desviación
(a) Dé una estimación puntual puntual para la media y la varianza poblacionales poblacionales.. (b) Construya Construya un interva intervalo lo de confianza confianza del 95% para el tamaño medio del del diámetro diámetro de la cápside cápside y otro otro para la desviación desviación tipica. x = 12500
· − · s=
± − · √ −·
IC 95% 95% (µ ) = x
IC 95% 95%
t n 1;α /2
σ 2
Manuel Angel Barea Gómez
=
s n
= 12500
n
n
28 27
1 σ =
2100 = 2138, 5
√ 28,5 = 12500 ± 829, 3 → IC 95% ± 2, 052 · 2138 95% (µ ) = µ ∈ [11670, 7;13329 , 3]
(n 1) s2 (n 1) s2 ; 2 2 χ (n−1);α /2 χ (n−1);(1−α /2)
− ·
· =
27 2138,52 27·2138 ,52 43,19 ; 14,57
IC 95% 95% (σ ) = σ
= σ 2
∈ [690, 8;2910, 8]
104
∈ [2858635, 9;84729224, 0]
CAPÍTULO CAPÍTULO 5. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONTRASTES CONTRASTES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICAS ARAMÉTRICAS DE UNA UNA POBLACIÓN. POBLACIÓN.
Problema 5.20.
En el estudio del cáncer de pulmón se considera que su tamaño es una variable aleatoria con distribución aproximadamente normal. Una muestra de ocho pacientes afectados ha dado, en centímetros, los resultados siguientes:
7,5
2,5
9,0
6,5
3,3
6,5
1,5
6,5
(a) Determine Determine un intervalo de confianza confianza del 95 % para el tamaño medio de este tipo de cáncer. cáncer. (b) Calcule un intervalo intervalo de confianza confianza del 90 % para la desviación desviación tipica del tamaño.
( x x)2
−
s2 = ∑(ni−1) =
± −
IC 95% 95% (µ ) = x
t n
s 1;α /2 · √ n
2 IC 90% 90% σ =
Problema 5.21.
x =
∑ xi n
...+1,5+6,5 = 7,5+2,5+...+ = 5, 41 8
(7,5 5,41)2 +(2,5 5,41)2 +...+( ...+(1,5 5,41)2 +(6,5 5,41)2 (8 1)
−
−
s = 2, 65
= 5, 41
−
−
=7
± 2, 365 · 2√ ,658 = 5, 41 ± 2, 207 → IC 95% 95% (µ ) = µ ∈ [3, 20;7, 617]
(n 1) s2 (n 1) s2 ; 2 2 χ (n−1);α /2 χ (n−1);(1−α /2)
− ·
−
− ·
· ·
IC 90% 90% (σ ) = σ
7 = σ 2 = 147,707 ; 27,17
∈ [3, 48;22, 58]
∈ [1, 86;4, 75]
Se desea estimar la proporción de jóvenes que fuman regularmente. De 1000 jóvenes entrevistados, 200 fumaban
regularmente. (a) Calcule una estimación estimación puntual puntual para p. (b) Obtenga un intervalo de confianza del 99 % para la proporción proporción de jóvenes que fuman regularmente. regularmente. ¿Le sorprendería sorprendería leer en un artículo que esta proporción es de 0,23? Justifíquelo. 200 = 0, 2 pˆ = 1000
IC (π ) = p + zα
· − · p (1 p) n
= 0, 2
± 2, 575
· ·
0,2 0,8 1000
= 0, 2
± 0, 0325 → IC (π ) = [0, 1674;0, 2325]
No sorprende que la proporción pueda ser 0,23 ya que pertenece al intervalo de confianza
Problema 5.22.
Un avance en el tratamiento del acné es el fármaco ácido cis-13-retinoico. En un reciente estudio, se probó este fármaco en 70 pacientes afectados de un acné bastante grave. En 60 de estos pacientes se produjo una limpieza radical de sus lesiones activas. Se pide: (a) Construya un intervalo de confianza del 99% para la proporción de pacientes sobre sobre los que el fármaco sería eficaz. (b) ¿Se podría aceptar aceptar que el fármaco sería sería eficaz en el 98 % de los pacientes pacientes sobre sobre los que se aplique? (c) ¿Qué tamaño debería debería tener la muestra muestra para que la proporción proporción resultante resultante de ella esté dentro dentro de una distancia de 0,04 de la verdadera proporción, p, ˆ con una confianza del 99 %? pˆ = 60 70 = 0, 857
Manuel Angel Barea Gómez
105
CAPÍTULO CAPÍTULO 5. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONTRASTES CONTRASTES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICAS ARAMÉTRICAS DE UNA UNA POBLACIÓN. POBLACIÓN.
IC (π ) = p + zα
· − · p (1 p) n
= 0, 857
± 2, 575
·
0,857·0,143 70
= 0, 857
± 0, 107 → IC (π ) = [0, 750;0, 964]
No se puede aceptar porque no forma parte del intervalo de confianza. ε = zα /2
·
· −
p (1 p) n
→n=
2 p (1 p) zα /2 ε 2
·· −
2 857·0,143 = 2,575 ·00,,04 2
≃ 508
Problema 5.23. Un fabricante garantiza a un laboratorio farmacéutico que sus máquinas producen comprimidos con un diámetro medio de 13mm y una desviación típica de 0, 6 mm. Una muestra de 100 unidades dio como media de los diámetros 13, 12mm. ¿Cabe esperar, a partir de este dato, que el fabricante dice la verdad, a un nivel de significación del 5%?
µ 0 = 13 µ 0 = 13
H 0 H 1
z| > 1, 96 El valor crítico es zα /2 = 1, 96, el criterio de rechazo de H 0 será | z µ −µ 0 12−13 z = √ = 13,√ =2 σ 0,6 n 100
Al estar en la región de rechazo, no se puede afirmar con un 95% de probabilidad que el fabricante tiene razón.
Problema 5.24. Normalmente las hojas de la mimosa púdica son horizontales. Si se toca ligeramente una de ellas, las hojas se pliegan. Se afirma que el tiempo medio de contacto contact o hasta el cierre completo es de 2,5 segundos. Se realiza un experimento midiendo el tiempo transcurrido, en segundos, entre el contacto y el cierre completo con los siguientes resultados: 3,0
2,9
2,8
2,7
2,6
2,4
2,5
2,4
2,6
2,7
(a) ¿Puede aceptars aceptarsee la hipótesis hipótesis del enunciado con un nivel de significación significación de 0,10?
∑( x
− x)2
s2 = (ni−1) =
x =
∑ xi n
...+ ...+2,6+2,7 = 3,0+2,9+10 = 2, 66
(3,0 2,66)2 +(2,9 2,66)2 +...+( ...+(2,6 2,66)2 +(2,7 2,66)2 (10 1)
−
−
−
−
−
= 0, 04
s = 0, 20
H 0 H 1
µ 0 = 2, 5 µ 0 = 2, 5
El valor crítico es t 9;0 9;0,05 = 2, 262, el criterio de rechazo de H 0 será |t | > 1, 8332 µ −µ 0 2,66−2,5 t = √ = 2, 52 σ 0,2 √ n 10
Al estar en la región de rechazo, no se puede afirmar con un 90% de probabilidad que el tiempo de cierre completo sea de 2,5 seg.
Problema 5.25.
Un fármaco alivia cierta dolencia en el 60% de los casos. Se toma una muestra de 144 personas que sufren esa dolencia y se les hace tomar un nuevo fármaco, encontrando alivio 100 de ellas. (a) ¿Se puede afirmar afirmar al nivel del 5 % que el nuevo medicame medicamento nto es más efectivo que el antiguo?
π = 100 144 = 0, 694
Manuel Angel Barea Gómez
106
CAPÍTULO CAPÍTULO 5. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONTRASTES CONTRASTES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICAS ARAMÉTRICAS DE UNA UNA POBLACIÓN. POBLACIÓN.
H 0 H 1
π 0 = 0, 6 π 0 > 0, 6
El valor crítico es z0,95 = 1, 645, el criterio de rechazo de H 0 será z > 1, 645
z =
π π 0
0,694−0,6
−· − = π (1 π ) n
0,694·0,305 144
= 2, 45
Por tanto, aceptamos H 1 que certifica que el nuevo medicamento es más efectivo con un 95% de fiabilidad.
Problema 5.26.
Un microbiólogo quiere obtener placas para preparaciones microscópicas de espesor uniforme. Un proveedor afirma que sus placas tienen una varianza menor de 0, 0158micron2 . Utilizando un micrómetro sensible, el laboratorio toma al azar una muestra de 30 placas con una cuasivarianza muestral resultante de s 2 = 0, 0213micron2. (a) ¿Es compatible compatible con dicho resultado resultado la pretensión pretensión del proveedor proveedor a un nivel de significación significación del 5 %?
σ 02 = 0, 0158 σ 02 < 0, 0158
H 0 H 1
2 2 El valor crítico es χ 29;0 ,95 = 17, 71, el criterio de rechazo de H 0 será χ < 17, 71
χ 2 =
(n 1) s2 σ 02
− ·
,0213 = 290·,00158 = 39, 09
Por tanto se acepta H 0 y no puede aceptarse lo que indica el proveedor en H 1
Problema 5.27.
En la leucemia leucemia mieloblástica, mieloblástica, usualmente se trata al paciente intensamente intensamente con quimioterapi quimioterapia a en el momento del diagnós diagnóstic tico. o. Esto Esto ha produ producid cido o una tasa tasa de remisión emisión del del 70%. Proba Probando ndo un nuevo nuevo método método de tratam tratamien iento to se utiliz utilizar aron on 50 volunt voluntari arios. os.
(a) ¿Cuántos ¿Cuántos de los pacientes pacientes deberían deberían haber remitido remitido para para que los investi investigador gadores es pudiesen pudiesen afirmar al nivel nivel de significac significación ión 0,025 que el nuevo método produce remisiones más altas que el antiguo?
H 0 H 1
π 0 = 0, 7 π 0 > 0, 7
El valor crítico es z0,975 = 1, 96, el criterio de rechazo de H 0 será z > 1, 96
Para poder aceptar H 1 1, 96 <
π π 0
π (1 π ) n
Manuel Angel Barea Gómez
n
50 0,7 0,7 0,3 50
−· − = −·
→ n ≥ (1, 96 · 0, 065 + 0, 7)· 50 ≥ 42 107
C APÍTULO
6 Intervalos de confianza y constrates de hipótesis paramétricos en dos o más poblaciones.
Problema 6.1.
Se ha analizado el contenido de fibra dietética en dos grupos de vegetarianos, uno con enfermedad diverticular y otro sin ella. Los resultados obtenidos aparecen en la siguiente tabla:
Sin enfermedad enfermedad n1 = 18 x1 = 42, 7 gr. s1 = 9, 9 gr.
Con enfermedad enfermedad n2 = 18 x2 = 27, 7 gr. s2 = 9, 5 gr.
Suponiendo normalidad en los datos: (a) Decidir si puede afirmarse afirmarse (α = 0, 05) que la media de contenido de fibra dietética en las dietas de los que no tienen la enfermedad enfermedad es más alta que en la de aquellos que la tienen. (b) Evaluar la diferencia diferencia de contenidos contenidos medios mediante mediante un intervalo de confianza al 99 %.
Hay que contrastar primero si las varianzas poblacionales son iguales:
H 0 H 1
σ 1 = σ 2 σ 1 = σ 2
F =
s21 s22
2 = 99,,952 = 1, 08
Se rechaza H 0 si F no pertenece al intervalo de nuestro estadístico. Para una α = 0, 05
→
F 0,975;17;17 = 2, 673 1 = 0, 374 F 0,025;17;17 = 2,673
como 1, 08 ∈ (0, 374;2, 673), no se rechaza H 0 y por tanto σ 1 = σ 2
H 0 H 1
µ 1 = µ 2 µ 1 > µ 2
108
CAPÍTULO CAPÍTULO 6. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONSTRA CONSTRATES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICO ARAMÉTRICOS S EN DOS O MÁS POBLACIONES.
El valor crítico es t 34;0 34;0,05 = 1, 690, el criterio de rechazo de H 0 será t > 1, 690 t =
= 42,72−27,72 = 315 ,23 = 4, 63 9,9 9,5
−
x1 x2 2 s2 1 s2 n1 + n2
18 + 18
Por tanto se rechaza H 0 y se acepta que la media de contenido de fibra dietética en las dietas de los que no tienen la enfermedad es más alta que en la de aquellos que la tienen.
− · ·
(n1 1) s21 +(n2 1) s22 (n1 +n2 2)
s=
IC 99% 99% (µ 1
− µ 2) =
( x1 x¯2 )
− ± t −1; / n
α 2
s2 n1
− ·
−
2
+ ns 2 = 15
· ·
17 9,92 +17·9,52 34
=
± 2, 724
9,72 18
= 9, 7
2
,7 + 918 = 15
[6, 20;23, 80]
± 8, 80 → IC 99% 99% ( µ 1 − µ 2 ) = ( µ 1 − µ 2 ) ∈
Problema 6.2.
Se tiene un grupo control y otro experimental, cada uno con 100 individuos, para contrastar el efecto de una vacuna contra determinado tipo de alergia. Del grupo experimental 8 sufrieron alergia, mientras que del control la sufrieron 25. (a) Contrastar si existe existe diferencia entre ambos grupos (α = 0, 05) (b) Evaluar la diferencia diferencia existente existente entre entre ambos grupos mediante un intervalo intervalo de confianza al 99 %.
p1 = p2 =
8 100 25 100
= 0, 08 = 0, 25
π 1 = π 2 π 1 = π 2
H 0 H 1
z| > 1, 96 El valor crítico es z0,025 = 1, 96 el criterio de rechazo de H 0 será | z p = z =
· − −
n1 p1 +n2 p p2 n1 +n2
·
·
p1 p2
p (1 p) + p (n1 p) n1 2
· −
=
,08+100·0,25 = 100·0100 = 0, 165 +100
0,08−0,25
0,165·0,835 0,165·0,835 + 100 100
,17 = −00,05 = 3, 4
−
Como |−3, 4| > 1, 96 se rechaza H 0 y por tanto existen diferencias entre ambos grupos. IC 99% 99% (π 1
− π 2) =
( p1 p2 ) zα /2
− ±
· ·−
p (1 p) n1
IC 99% 99% (π 1
+
p (1 p) n2
· −
= 0, 17
−
± 2, 575
·
·0,835 0165 ·0,835 + 0,165100 100
= 0, 17
−
± 0, 12
− π 2) = (π 1 − π 2) ∈ [−0, 29; −0, 05]
Problema 6.3.
Dos investigadores de dos ciudades distintas, A y B, se conocen en un congreso médico porque han presentado dos trabajos sobre el mismo tema, la diabetes infantil. El investigador de la ciudad A, partiendo de una muestra de tamaño 13, ha presentado como intervalo de confianza al 95 % para la media de azúcar en sangre (medida en mg/100ml) el siguiente: (89, 1;90, 9). El investigador de la ciudad B, partiendo de otra muestra de tamaño tamañ o 16, ha presentado como intervalo de confianza al 99 % para pa ra la media de azúcar en sangre el siguiente: (93, 2;98, 8).
Manuel Angel Barea Gómez
109
CAPÍTULO CAPÍTULO 6. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONSTRA CONSTRATES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICO ARAMÉTRICOS S EN DOS O MÁS POBLACIONES. (a) ¿Podemos ¿Podemos afirmar afirmar con un nivel de significación significación del 1 % que el nivel medio de azúcar azúcar en la población población infantil de la ciudad A es inferior inferior al de la ciudad B?
Ciudad Ciudad A
, + , x1 = 89 1 2 90 9 = 90 √ √ Ciudad Ciudad B ε · n 0,9· 13 s1 √ s1 = t = 2,179 = 1, 49 ε = t 12;0 12;0,025 n 12;0,025
· →
, + , x2 = 93 2 2 98 8 = 96 √ √ ε · n 2,8· 16 s2 √ s2 = t = 2,861 = 3, 91 ε = t 15;0 15;0,005 n 15;0,005
· →
Hay que contrastar primero si las varianzas poblacionales son iguales:
F =
σ 1 = σ 2 σ 1 = σ 2
H 0 H 1
s21 s22
2 = 13,,49 = 0, 14 912
Se rechaza H 0 si F no pertenece al intervalo de nuestro estadístico. Para una α = 0, 05
→
F 0,975;12;15 = 2, 963 1 = 0, 314 F 0,025;12;15 = 3,177
σ 2 como 0, 14 ∈ / (0, 314;2, 963), se rechaza H 0 y por tanto σ 1 =
H 0 H 1
µ 1 = µ 2 µ 1 < µ 2
Por ser las varianzas distintas distintas el grado de libertad de nuestro estadístico sera:
2
v=
2
(s21 ·n1 +s22 ·n2 ) (1,492 ·13+3,912·16) 273,472 = = 2 2 2 2 , 69 41+3988 ,92 (s21 ·n1 ) + (s22 ·n2 ) (1,492 ·13) + (3,912 ·16) 13−1 n1 −1 n2 −1 16−1
≃ 18
El valor crítico es t 18;0 18;0,01 = 2, 522, el criterio de rechazo de H 0 será t < 2, 522 t =
−
x1 x2 2 s2 1 s2 n1 + n2
=
90−96
1,492 3,912 13 + 16
6 = 5, 65 = 1−,06
−
Como −5, 65 < 2, 467 se rechaza H 0 y se acepta H 1 que indica que el nivel medio de azúcar en la población infantil de la ciudad A es inferior al de la ciudad B
Problema 6.4.
Se ha realizado un estudio para cerciorarse de si las diferencias inmunológicas entre hemofílicos e individuos sanos podían detectarse fácilmente. Los resultados de un a prueba inmunol ógicas realizada sobre 13 hemofílicos y otros 13 controles sanos son:
Hemofílicos Sanos
11 13,5
9,8 16,9
61,2 38,3
63,4 23,2
11,1 27,6
8 22,1
40,9 33,4
47,7 55
19,3 66,9
Suponiendo normalidad en los datos y a partir de ellos: (a) ¿Existen en promedio diferencias diferencias inmunológicas entre entre hemofílicos e individuos sanos?
Manuel Angel Barea Gómez
110
18 78,6
24,6 66,6
24,4 53
11,3 49,7
CAPÍTULO CAPÍTULO 6. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONSTRA CONSTRATES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICO ARAMÉTRICOS S EN DOS O MÁS POBLACIONES. (b) Realizar Realizar una estimación de esta diferencia diferencia por medio de un intervalo de confianza. (c) Estimar mediante mediante un intervalo la probabilidad probabilidad de que un hemofílico tenga un nivel de inmunidad superior superior a 30.
Hemo f ılicos ı´licos
x1 = 26, 97 s1 = 19, 75 Sanos n1 = 13
Contrastamos primero si las varianzas poblacionales son iguales:
F =
x2 = 41, 90 s2 = 21, 21 n2 = 13
σ 1 = σ 2 σ 1 = σ 2
H 0 H 1
s21 s22
,752 = 19 = 0, 86 21,212
Se rechaza H 0 si F no pertenece al intervalo de nuestro estadístico. Para una α = 0, 05
F 0,975;12;12 = 3, 277 1 = 0, 305 F 0,025;12;12 = 3,277
→
como 0, 86 ∈ (0, 305;3, 277), se acepta H 0 y por tanto σ 1 = σ 2
µ 1 = µ 2 µ 1 = µ 2
H 0 H 1
Por tener las varianzas poblacionales iguales v = n1 + n2 − 2 El valor crítico es t 24;0 24;0,025 = 2, 060, el criterio de rechazo de H 0 será |t | > 2, 064 s=
− ·
(n1 1) s21 +(n2 1) s22 (n1 +n2 2)
t =
−
−
x1 x2 2 s2 1 + s2 n1 n2
− ·
=
·
12 19,752 +12·21,212 24
= 20, 5
,93 = 26,972−41,902 = −814 ,038 = 1, 85 20,5 20,5
−
13 + 13
|−1, 85| < 2, 064 por tanto se acepta la H 0 que indica que no existen diferencias entre hemofílicos e individuos sanos. s=
IC 95% 95% (µ 1
− µ 2) =
( x1 x¯2 )
− ·
(n1 1) s21 +(n2 1) s22 (n1 +n2 2)
−
− ·
=
· s2 n1
s2 n2
·
12 19,752 +12·21,212 24
= 20, 5
·
− ± 2, 064 2013,5 IC 95% 95% (µ 1 − µ 2 ) = ( µ 1 − µ 2 ) ∈ [−31, 52;1, 66]
− ± t −1; / n
α 2
+
= 14, 93
2
2
+ 2013,5 = 14, 93
−
± 16, 59
4 = 0, 307 p = 13
IC 95% 95% (π ) = p + zα
Manuel Angel Barea Gómez
· − · p (1 p) n
= 0, 307
± 1, 96 ·
0,307·0,693 13
111
= 0, 307
± 0, 25 → IC 95% 95% (π ) = [ 0, 056;0, 557]
CAPÍTULO CAPÍTULO 6. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONSTRA CONSTRATES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICO ARAMÉTRICOS S EN DOS O MÁS POBLACIONES.
Como |41, 48| > 2, 262 se rechaza H 0 y se admite H 1 que indica la variación del nivel de glucosa en los jóvenes. Para los datos de los adultos:
H 0 H 1
µ 1 = µ 2 µ 1 = µ 2
El valor crítico es t 9;0 9;0,025 = 2, 263, el criterio de rechazo de H 0 será |t | > 2, 262
− D 96,1 t = 0√ s D = 7,34 = 41, 40 √ 10
n
Como |41, 40| > 2, 262 se rechaza H 0 y se admite H 1 que indica la variación del nivel de glucosa en los adultos. Para comprobar sí la concentración de glucosa a los 60 minutos es mayor en adultos, J ovenes ´ 60min
x1 = 88, 8 s1 = 6, 54 Adult Adul t os 60min n1 = 10
H 0 H 1
x2 = 184, 9 s2 = 11, 91 n2 = 10
µ 1 = µ 2 µ 1 < µ 2
Contrastamos en primer lugar la igualdad entre las varianzas. considerando muestras muestras independientes.
F =
H 0 H 1
s21 s22
σ 1 = σ 2 σ 1 = σ 2
6,542 = 11 = 0, 30 ,912
Se rechaza H 0 si F no pertenece al intervalo de nuestro n uestro estadístico. Para una α = 0, 05
→
F 0,975;9;9 = 4, 026 1 = 0, 248 F 0,025;9;9 = 4,026
como 0, 30 ∈ (0, 248;4, 026), se acepta H 0 y por tanto σ 1 = σ 2
Por tener las varianzas poblacionales iguales v = n1 + n2 − 2 = 10 + 10 − 2 = 18 El valor crítico es t 18;0 18;0,95 = 1, 734, el criterio de rechazo de H 0 será t < 1, 734 s=
− ·
t =
(n1 1) s21 +(n2 1) s22 (n1 +n2 2)
−
x1 x2 s2 s2 n1 + n2
−
− ·
=
·
9 6,542 +9·11,912 18
= 9, 60
,3 = 145,62−184,92 = −439 ,29 = 9, 15 9,60 9,60
10 + 10
−
−9, 15 < 1, 734 por tanto se rechaza H 0 y se acepta H 1que indica que la concentración de glucosa en sangre a los 60 minutos, es mayor en adultos que en jóvenes
Para el apartado (c) Manuel Angel Barea Gómez
116
CAPÍTULO CAPÍTULO 6. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONSTRA CONSTRATES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICO ARAMÉTRICOS S EN DOS O MÁS POBLACIONES. J ovenesbasal ´
x1 = 82, 1 s1 = 7, 48 Adult Adul t os basal n1 = 10
x2 = 88, 8 s2 = 5, 74 n2 = 10
µ 1 = µ 2 µ 1 < µ 2
H 0 H 1
Contrastamos en primer lugar la igualdad entre las varianzas. considerando muestras muestras independientes.
F =
σ 1 = σ 2 σ 1 = σ 2
H 0 H 1
s21 s22
2 = 75,,48 = 1, 69 742
Se rechaza H 0 si F no pertenece al intervalo de nuestro n uestro estadístico. Para una α = 0, 05
F 0,975;10;10 = 3, 717 1 = 0, 269 F 0,025;10;10 = 3,115
→
como 1, 69 ∈ (0, 269;3, 717), se acepta H 0 y por tanto σ 1 = σ 2
Por tener las varianzas poblacionales iguales v = n1 + n2 − 2 = 10 + 10 − 2 = 18 El valor crítico es t 18;0 18;0,95 = 1, 734, el criterio de rechazo de H 0 será t < 1, 734 s=
− ·
t =
(n1 1) s21 +(n2 1) s22 (n1 +n2 2)
−
x1 x2 s2 s2 n1 + n2
−
=
− ·
=
·
9 7,482 +9·5,742 18
82,1−88,8
6,662 6,662 10 + 10
= 6, 66
= −2,697,7 = 2, 25
−
−2, 25 < 1, 734 por tanto se rechaza H 0 y se acepta H 1que indica que la concentración de glucosa en sangre a los 60 minutos, es menor en jóvenes que en adultos.
Para el apartado (d)
J ovenes ´
x1 = 63, 5 s1 = 4, 84 Adult Adul t os n1 = 10
−
H 0 H 1
x2 = 96, 1 s2 = 7, 34 n2 = 10
−
µ 1 = µ 2 µ 1 = µ 2
Contrastamos en primer lugar la igualdad entre las varianzas. considerando muestras muestras independientes.
Manuel Angel Barea Gómez
H 0 H 1
σ 1 = σ 2 σ 1 = σ 2
117
CAPÍTULO CAPÍTULO 6. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONSTRA CONSTRATES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICO ARAMÉTRICOS S EN DOS O MÁS POBLACIONES.
El valor crítico es t 15;0 15;0,05 = 1, 753, el criterio de rechazo de H 0 será t > 1, 753 38,875 D t = √ s D = 49,265 = 3, 13 √ n 16
Como 3, 13 > 1, 753 se rechaza H 0 y se admite H 1 que indica que en general el nivel medio de colesterol se reduce haciendo ejercicio físico La proporción donde se reduce es: p = 12 16 = 0, 75
IC 95% 95% (π ) = p + zα
· − · p (1 p) n
= 0, 75
± 1, 96
· ·
0,75 0,25 16
= 0, 75
± 0, 21 → IC 95% 95% (π ) = [ 0, 54;0, 96]
Para comparar la variación entre hombre y mujeres da las tablas se obtienen ob tienen los siguientes resultados:
Hombres
x1 = 18 s1 = 27, 58 Mu jeres n=9
µ 1 = µ 2 µ 1 = µ 2
H 0 H 1
x2 = 65, 71 s2 = 59, 65 n=7
Contrastamos en primer lugar la igualdad entre las varianzas. considerando muestras muestras independientes.
F =
σ 1 = σ 2 σ 1 = σ 2
H 0 H 1
s21 s22
,582 = 27 59,652 = 0, 21
Se rechaza H 0 si F no pertenece al intervalo de nuestro n uestro estadístico. Para una α = 0, 05
→
F 0,975;8;7 = 4, 899 1 = 0, 200 F 0,025;8;7 = 4,995
como 0, 21 ∈ (0, 200;4, 899), se acepta H 0 y por tanto σ 1 = σ 2
Por tener las varianzas poblacionales iguales v = n1 + n2 − 2 = 9 + 7 − 2 = 14 El valor crítico es t 14;0 14;0,975 = 2, 145, el criterio de rechazo de H 0 será |t | > 2, 145 s=
− ·
t =
(n1 1) s21 +(n2 1) s22 (n1 +n2 2)
−
x1 x2 s2 s2 n1 + n2
−
=
− ·
=
·
18−65,71
47,622 47,622 9 + 7
|−1, 98| < 2, 145 por tanto se acepta H 0 y se rechaza H 1 Manuel Angel Barea Gómez
9 27,582 +7·59,652 14
119
= 47, 62
,71 = −47 24 = 1, 98
−
CAPÍTULO CAPÍTULO 6. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONSTRA CONSTRATES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICO ARAMÉTRICOS S EN DOS O MÁS POBLACIONES.
Problema 6.10.
En un estudio sobre los factores de riesgo que influyen en la aparición de tuberculosis entre usuarios de drogas administrada administradass por vía intravenosa, intravenosa, se tomó un grupo de 97 individuos que compartían compartían jeringa, obteniendo un 27,4 % de resultado resultadoss positivos a la prueba de la tuberculina, mientras que de los 161 individuos que negaron negaron compartirlas, el 17,4 % obtuvo resultado positivo en la prueba. p rueba. (a) ¿Puede admitirse que hay diferencias diferencias entre ambos grupos (α = 0, 01)?. (b) Construir Construir un intervalo intervalo de confianza confianza al 98 % para la propor proporción ción de usuarios de drogas administrada administradass por vía intravenosa intravenosa que dan resultados positivos a la prueba de la tuberculina (compartiendo o no la jeringa).
p1 = 0, 274 n1 = 97
H 0 H 1
p2 = 0, 174 n2 = 161
π 1 = π 2 π 1 = π 2
z| > 2, 575 El valor crítico es z0,005 = 1, 96 el criterio de rechazo de H 0 será | z n1 p1 +n2 p2 n1 +n2
·
p = z =
· − −
·
p1 p2
=
1 p (1 p) + p (n p) n1 2
· −
+161·0,174 = 97·0,274 = 0, 211 97+161
0,274−0,174
0,274·0,726 0,174·0,876 + 161 97
,1 = 0,0055 = 1, 82
Como |1, 82| < 2, 575 se acepta H 0 y por tanto no existen diferencias entre ambos grupos.
Para el apartado (b)
n1 p1 +n2 p2 n1 +n2
·
p =
IC 98% 98 % (π ) = ( p1
− p2) ± z /
α 2
·
+161·0,174 = 97·0,274 = 0, 211 97+161
· − · p (1 p) n
= 0, 211
IC 98% 98% (π ) = ( π )
± 2, 33
·
0,211·0,789 258
= 0, 211
± 0, 059
∈ [0, 152;0, 27]
Problema 6.11.
A la hora de probar si dos medicamentos medicamentos actúan actúan de la misma forma contra una enfermedad enfermedad grave, se sabe que al tratar 10 animales de laboratorio con el primero de ellos se ha obtenido un intervalo de confianza al 80% de [1165, 89;1234 , 11] del número medio de horas que sobreviven. Por otra parte, al tratar a 16 animales de laboratorio con el segundo medicamento, el número medio de horas que sobreviven es 1400, con una cuasivarianza de 4356. (a) ¿Puede aceptars aceptarsee la igualdad igualdad de las varianzas varianzas poblacionales poblacionales(α = 0, 10)?. (b) ¿Es más efectivo el segundo segundo medicamen medicamento?. to?. (c) Construir un Intervalo de Confianza al 99% pa ra la diferencia diferencia del número medio medio de horas que sobreviven. sobreviven.
− t −1, / · √ → 1165, 89 = x − 2, 262 · √ 10 = x + t −1, / · √ → 1234, 11 = x + 2, 262 · √ 10
xin f = x xsup
n
n
α 2
α 2
s n s n
s
s
Por tanto tenemos dos muestras con los siguientes estadísticos: Manuel Angel Barea Gómez
120
Resolviendo
x = 1200 s = 60, 26
CAPÍTULO CAPÍTULO 6. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONSTRA CONSTRATES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICO ARAMÉTRICOS S EN DOS O MÁS POBLACIONES.
x1 = 1200 s1 = 60, 26 n1 = 10
H 0 H 1
s21 s22
F =
x2 = 1400 s2 = 66 n2 = 16
σ 1 = σ 2 σ 1 = σ 2
2 = 6066,262 = 0, 83
Se rechaza H 0 si F no pertenece al intervalo de nuestro n uestro estadístico. Para una α = 0, 10
→
F 0,95;9;15 = 2, 544 1 = 0, 332 F 0,15;9;15 = 3,006
como 0, 83 ∈ (0, 332;2, 544), se acepta H 0 y por tanto σ 1 = σ 2
Para comprobar si es más efectivo efectivo el medicamento, formulamos la hipótesis y calculamos para una α = 0, 05
H 0 H 1
µ 1 = µ 2 µ 1 < µ 2
Por tener las varianzas poblacionales iguales v = n1 + n2 − 2 = 10 + 16 − 2 = 24 El valor crítico es t 24;0 24;0,975 = 2, 064, el criterio de rechazo de H 0 será t < 2, 0, 64 s=
− ·
(n1 1) s21 +(n2 1) s22 (n1 +n2 2)
t =
−
x1 x2 s2 s2 n1 + n2
−
=
− ·
=
·
9 60,262 +15·662 24
1200 −1400
63,902 63,902 10 + 16
= 63, 90
−200 = 1, 98 = 25 ,75
−
|−1, 98| < 2, 145 por tanto se acepta H 0 y se rechaza H 1 IC 99% 99% (µ 2
− µ 1) = ( x2 − x1) ± t 24;0 24;0,995
·
s2 n1
IC 99% 99% (µ 2
+
s2 n2
= 200
± 2, 797
·
63,902 10
2
,90 + 6316 = 200
± 72, 04
− µ 1) ∈ [127, 96;272, 04]
Problema 6.12.
Se quiere quiere averiguar si tres tres tipos de complejos complejos vitamínicos vitamínicos (V 1 , V 2 , V 3 ) producen los mismos efectos en el aumento de peso de los conejos. Tomamos 15 conejos y le asignamos al azar un complejo vitamínico a cada uno. Después de un tiempo, el aumento de peso (grs .) ha sido:
Conejo Complejo Vitamínico Aumento en grs.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
V 1
V 2
V 3
V 1
V 2
V 3
V 3
V 2
V 1
V 1
V 2
V 1
V 3
V 3
V 1
81
91
75
75
92
83
80
97
69
77
88
71
72
60
71
(a) Suponiendo Suponiendo normalidad normalidad en los datos, ¿podemos ¿podemos afirmar que los 3 complejos complejos vitamínicos vitamínicos influyen del mismo modo en el aumento de peso? (α = 0, 05)
Manuel Angel Barea Gómez
121
CAPÍTULO CAPÍTULO 6. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONSTRA CONSTRATES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICO ARAMÉTRICOS S EN DOS O MÁS POBLACIONES.
Problema 6.13.
En el curso de un estudio para determinar los efectos de poner fin a un bloqueo renal en pacientes cuya función renal está deteriorada a causa de una metástasis maligna avanzada, se midió la tensión arterial de cada paciente antes y después de la operación. Los resultados son los siguientes (considere que la distribución de la tensión arterial es Normal):
Paciente Antes de la intervención Después de la intervención
1 150 90
2 132 102
3 130 80
4 1 16 82
5 1 07 90
6 1 00 94
7 1 01 84
8 96 98
9 90 89
10 78 85
(a) ¿Puede concluirse que la operación operación quirúrgica tiende a disminuir la tensión arterial? (b) Estimar mediante un IC la diferencia diferencia de medias de tensiones arteriales. (c) Estimar mediante mediante un IC del 99 % la varianza varianza de la tensión después después de la intervención. intervención.
Paciente Antes de la intervención X Después de la intervención Y d i = X i
− Y i
1 15 0 90 60
2 13 2 10 2 30
3 13 0 80 50
4 1 16 82 34
5 1 07 90 17
6 1 00 94 6
7 1 01 84 17
8 96 98 -2
9 90 8899 1
10 78 8855 -7
Con una α = 0, 05 tenemos:
D = 20, 6 s D = 22, 56 n = 10
H 0 H 1
µ 1 = µ 2 µ 1 < µ 2
El valor crítico es t 9;0 9;0,05 = 1, 383, el criterio de rechazo de H 0 será t < 1, 383 20,6 D t = √ s D = 22,56 = 0, 28 √ n 10
Como 0, 28 > 1, 383 se rechaza H 0 y se admite H 1 que indica que la operación quirúrgica tiende a disminuir la tensión arterial Contrastamos en primer lugar la igualdad entre las varianzas. considerando muestras muestras independientes.
Antes
x1 = 110 s1 = 21, 93 Despu es ´ n1 = 10
F =
H 0 H 1
s21 s22
x2 = 89, 40 s2 = 7, 04 n2 = 10
σ 1 = σ 2 σ 1 = σ 2
,932 = 21 = 9, 70 7,042
Se rechaza H 0 si F no pertenece al intervalo de nuestro n uestro estadístico. Manuel Angel Barea Gómez
122
CAPÍTULO CAPÍTULO 6. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONSTRA CONSTRATES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICO ARAMÉTRICOS S EN DOS O MÁS POBLACIONES.
Para una α = 0, 05
F 0,975;9;9 = 4, 026 1 = 0, 248 F 0,025;9;9 = 3,717
→
σ 2 como 9, 70 ∈ / (0, 248;4, 026), se rechaza H 0 y por tanto σ 1 =
2
n ·s2 +n ·s2 10·21,932 +10·7,042 ) 28141592 ,67 Por tener las varianzas poblacionales distintas v = ( 12 12 2 2 )2 2 = ( 2 2 = 2597167 ,91 = 10, 8 2 2 · · · · 10 21 93 10 7 04 (n1 s1 ) + (n2 s2 ) ( , ) +( , ) 9 9 n1 −1 n2 −1
IC 95% 95% = ( µ 1
− µ 2) ± t ; / · v α 2
s21 n1
+
s22 n2
= (110
IC 95% 95% ( µ 1
IC 99% 99%
σ 2
=
(n 1) s2 (n 1) s2 ; 2 2 χ (n−1);α /2 χ (n−1);(1−α /2)
− ·
− ·
− 89, 40) ± 2, 201
·
21,932 10
2
04 + 7,10 = 20, 6
≃ 11
± 16, 03
− µ 2) ∈ [4, 57;36, 63]
· =
9 7,042 9·7,042 23,59 ; 1,73
2 = IC 99% 99% σ
∈
[18, 90;257, 83]
Problema 6.14.
Una compañía farmacéutica investiga los efectos producidos por tres compuestos. La investigación consiste en aplicar los compuestos a 26 ratones de características similares y anotar los tiempos de reacción. Los animales se clasifican aleatoriamente en 3 grupos de 8, 6 y 12 ratones respectivamente. A cada grupo se le administra un compuesto diferente, obteniéndose los siguientes resultados:
Grupo 1 Grupo 2 Grupo 3
Tiempo de reacción medido en min. 6 7 5 6 5 8 4 7 10 9 9 10 10 6 3 4 8 3 7 6 3 6 4
7
6
3
(a) Suponiendo normalidad en los datos, ¿podemos afirmar afirmar que los tres compuestos producen los mismos efectos (α = 0, 05)?
Para evaluar el ejercicio se realizará un ANOVA para ello en primer lugar se obtienen los datos estadísticos de los distintos grupos:
Grupo 1
Nuestra hipótesis es:
x1 = 6 s1 = 1, 309 Grupo 2 n1 = 8
H 0 H 1
x2 = 9 s2 = 1, 549 Grupo 3 n2 = 6
x2 = 5 s2 = 1, 859 n2 = 12
µ 1 = µ 2 = µ 3 ´ µ = alasdemas
∋
Llamando K al número número de grupos,en grupos,en nuestro nuestro caso 3 y N al número total de muestras, muestras, es decir, N = 8 + 6 + 12 = 26, nuestro nuestro estadíst estadístico ico se hallará con la F de Snedecor, donde es F α ;K −1: N N −K El valor crítico es F 0,05;2,23 = 3, 439, el criterio de rechazo de H 0 será F > 3, 439 En primer lugar hallamos la media de los grupos xT =
∑ xi K
= 6+93+5 = 6, 67
Llamamos SCE ,Suma de los cuadrados entre grupos, a la expresión SCE = ∑ ( xi
Manuel Angel Barea Gómez
− x )2 · n = (6 − 6, 67)2 · 8 + (9 − 6, 67)2 · 6 + (5 − 6, 67)2 · 12 = 69, 63 T
i
123
CAPÍTULO CAPÍTULO 6. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONSTRA CONSTRATES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICO ARAMÉTRICOS S EN DOS O MÁS POBLACIONES.
Llamamos SCD ,Suma de los cuadrados dentro de los grupos o intragrupos, a la expresión SCD = ∑ (ni
− 1) · s2 = 7 · 1, 3092 + 5 · 1, 5492 + 11 · 1, 8592 = 62 i
Por último, hallamos nuestro estadístico F =
69,83 2 62 23
SCE K 1 SCD N K
− = −
= 12, 9
Como 12, 9 > 3, 439 se rechaza H 0 y se puede afirmar que los tres compuestos no producen los mismos efectos.
Problema 6.15.
En un hospital de la ciudad es relativamente frecuente que los pacientes no acudan el día en el que fueron citados. Para comprobar si una llamada telefónica el día anterior a la cita incrementa el cumplimiento, de los 45 pacientes citados un día se telefoneó a 25 pacientes, de los cuales cumplieron con su cita 20. Por otra parte, de los 20 que no fueron telefoneados, acudieron sólo 8 a su cita. (a) ¿Puede afirmars afirmarse e el efecto de la llamada telefónica? telefónica? (b) Calcule un intervalo intervalo de confianza al 98 % de la diferencia diferencia de porcentajes porcentajes de cumplimiento. cumplimiento. p 1 = 0, 8 Sinllamadad ıaanterior ı´aanterior n1 = 25
Llamad a d ıaanterior ı´aanterior
p =
n1 p1 +n2 p2 n1 +n2
·
·
p 1 = 0, 4 n1 = 20
,8+20·0,4 = 25·025 = 0, 622 +20
π 1 = π 2 π 1 = π 2
H 0 H 1
z| > 1, 96 El valor crítico es z0,975 = 1, 96, el criterio de rechazo de H 0 será | z z =
· − −
p1 p2
1 p (1 p) + p (n p) n1 2
· −
=
0,8−0,4
0,622·0,378 0,622·0,378 + 25 20
4 = 00,,14 = 2, 75
Se rechaza de H 0 porque 2, 75 > 1, 96, por tanto existen efectos de la llamada telefónica.
IC 99% 99% (π 1
− π 2) = ( p1 − p2) ± z0,99 · ·(1− ) + ·(1− ) = 0, 4 ± 2, 33 · 0, 14 = 0, 4 ± 0, 32 IC 99% 99% → (π 1 − π 2 ) ∈ [0, 08;0, 78] p
p
n1
Problema 6.16.
p
p
n2
Una de las variables que se utiliza para comparar las características físicas de las nadadoras olímpicas con las de las corredoras es la circunferencia de la parte superior del brazo, en cm., mientras están relajadas. Un investigador obtuvo con una muestra de 10 nadadoras para esta variable un intervalo de confianza al 99% para la media de (25, 35;29, 25) , mientras que con una muestra de 12 corredoras obtuvo una media de 23, 5 cm y una desviación típica de 1, 7 cm. Suponiendo normalidad normalidad en los datos:
Manuel Angel Barea Gómez
124
CAPÍTULO CAPÍTULO 6. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONSTRA CONSTRATES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICO ARAMÉTRICOS S EN DOS O MÁS POBLACIONES. (a) Obtener un intervalo intervalo de confianza al 90 % para la desviación desviación típica de esta variable en la población de nadadoras. nadadoras. (b) Decidir si puede afirmarse que la media de la circunferencia de la parte superior del brazo es mayor en las nadadoras que en las corredoras. corredoras.
− t −1, / · √ → 25, 35 = x − 3, 250 · √ 10 = x + t −1, / · √ → 29, 25 = x + 3, 250 · √ 10
xin f = x xsup
IC 90% 90%
n
n
σ 2
=
α 2
α 2
s n s n
s
s
(n 1) s2 (n 1) s2 ; 2 2 χ (n−1);α /2 χ (n−1);(1−α /2)
− ·
− ·
·
2 9·1,892 2 = 9161,,89 = IC 90% 90% σ 92 ; 3,33
s21 s22
x1 = 27, 3 s1 = 1, 89
∈
9; 9, 65] [1, 9;9
σ 1 = σ 2 σ 1 = σ 2
H 0 H 1
F =
∈ [1, 378;3, 107]
IC 90% 90% (σ )
Resolviendo
2 = 11,,89 = 1, 23 2 7
Se rechaza H 0 si F no pertenece al intervalo de nuestro n uestro estadístico. Para una α = 0, 05
F 0,975;9;11 = 3, 588 1 = 0, 255 F 0,025;9;11 = 3,912
→
como 1, 23 ∈ (0, 255;3, 588), se acepta H 0 y por tanto σ 1 = σ 2
µ 1 = µ 2 µ 1 > µ 2
H 0 H 1
Por tener las varianzas poblacionales iguales v = n1 + n2 − 2 = 10 + 12 − 2 = 20 El valor crítico es t 20;0 20;0,05 = 1, 725, el criterio de rechazo de H 0 será t > 1, 725
s=
(n1 1) s21 +(n2 1) s22 n1 +n2 2
t =
− ·
−
x1 x2 s2 s2 n1 + n2
−
− ·
=
2 +11·1,72 = 9·1,89 20 = 3, 19
27,3−23,5
3,192 3,192 10 + 12
8 = 13,,36 = 2, 79
Por tanto, como 2 , 79 > 1, 720 se rechaza H 0 y se acepta H 1 que indica que la media de la circunferencia circunferencia de la parte superior del brazo es mayor en las nadadoras que en las corredoras.
Problema 6.17.
En un tratamiento tratamiento contra la hipertensión se seleccionaron seleccionaron 21 enfermos de características características similares. similares. A cada enfermo se le administró uno de los fármacos P, A, B, al azar, formando 3 grupos. El grupo P tomó placebo (fármaco inocuo) y los otros dos tomaron A y B respectivamente. Para valorar la eficacia de los tratamientos, se registró el descenso de la presión diastólica desde el estado basal (inicio del tratamiento) hasta el estado al cabo de una semana de tratamiento. Los resultados fueron:
Manuel Angel Barea Gómez
125
CAPÍTULO CAPÍTULO 6. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONSTRA CONSTRATES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICO ARAMÉTRICOS S EN DOS O MÁS POBLACIONES.
P A B
10 20 15
0 25 10
15 33 25
-20 25 30
0 30 15
-5 18 35
0 25
22
Para un nivel de significación del 5% y suponiendo normalidad, se pide: (a) Estudiar si existen diferencias diferencias significativas entre los tres tres tratamientos. (b) Estudiar si existen diferencias diferencias significativas entre los tratamientos tratamientos A y B.
Grupo 1
Nuestra hipótesis es:
x1 = 0 s1 = 12, 247 Grupo 2 n1 = 6
x2 = 21, 571 s2 = 10, 845 Grupo 3 n2 = 7
x2 = 22, 125 s2 = 8, 391 n2 = 8
µ 1 = µ 2 = µ 3 ´ µ = alasdemas
H 0 H 1
∋
Llamando K al número número de grupos,en grupos,en nuestro nuestro caso 3 y N al número total de muestras, es decir, N = 6 + 7 + 8 = 21, nuestro estadístico se hallará con la F de Snedecor, donde es F α ;K −1: N N −K El valor crítico es F 0,05;2,18 = 3, 555, el criterio de rechazo de H 0 será F > 3, 555 En primer lugar hallamos la media de los grupos xT =
+6,25 = 0+21,571 = 9, 27 3
∑ xi K
Llamamos SCE ,Suma de los cuadrados entre grupos, a la expresión SCE = ∑ ( xi
− x )2 · n = (0 − 9, 27)2 · 6 + (21, 571 − 9, 27)2 · 7 + (22, 125 − 9, 27)2 · 8 = 2370 T
i
Llamamos SCD ,Suma de los cuadrados dentro de los grupos o intragrupos, a la expresión SCD = ∑ (ni
− 1) · s2 = 5 · 12, 2472 + 6 · 10, 8452 + 7 · 8, 3912 = 1948, 5 i
Por último, hallamos nuestro estadístico F =
SCE K 1 SCD N K
− = −
2370 2 1948,5 18
= 10, 94
Como 10, 94 > 3, 439 se rechaza H 0 y se puede afirmar que los tres fármacos no tienen la misma eficacia. El segundo apartado compara los tratamientos A y B. En primer lugar comparamos las varianzas poblacionales
F =
H 0 H 1
s22 s23
σ 2 = σ 3 σ 2 = σ 3
,8452 1 67 = 10 8,3912 = ,
Se rechaza H 0 si F no pertenece al intervalo de nuestro n uestro estadístico. Manuel Angel Barea Gómez
126
CAPÍTULO CAPÍTULO 6. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONSTRA CONSTRATES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICO ARAMÉTRICOS S EN DOS O MÁS POBLACIONES.
Para una α = 0, 05
→
F 0,975;6;7 = 5, 119 1 = 0, 195 F 0,025;6;7 = 5,119
como 1, 63 ∈ (0, 195;5, 119), se acepta H 0 y por tanto σ 2 = σ 3
Para comprobar si es más efectivo efectivo el medicamento, formulamos la hipótesis y calculamos para una α = 0, 05
H 0 H 1
µ 1 = µ 2 µ 1 = µ 2
Por tener las varianzas poblacionales iguales v = n1 + n2 − 2 = 7 + 8 − 2 = 13 El valor crítico es t 13;0 13;0,975 = 2, 160, el criterio de rechazo de H 0 será |t | > 2, 160 s=
− ·
(n1 1) s21 +(n2 1) s22 (n1 +n2 2)
t =
−
− ·
=
·
6 10,8452 +7·8,3912 13
= 7, 66
375 = 21,7512−22,125 = −30,,96 = 0, 09 7,66 7,662
−
x1 x2 s2 s2 n1 + n2
7
−
+ 8
|−0, 09| < 2, 160 por tanto se acepta H 0 que afirma que no existen diferencias entre los tratamientos A y B. Problema Problema 6.18.
Es conoci conocido do que la falta falta de oxígen oxígeno o que se resp respira ira en alta monta montaña ña es la causa causa de todos todos los males males de los escala escalador dores. es. Se ha realizado un estudio para analizar la saturación de oxígeno en sangre de los alpinistas, recogiendo para ello una muestra formada por p or 9 mujeres y 8 hombres alpinistas en la que se ha obtenido el nivel de saturación de oxígeno en sangre, medido en una escala de porcentaje de 0% a 100%:
Sexo Nivel O2
M 61
M 73
M 67
M 70
M 70
M 75
M 69
M 69
M 71
H 63
H 67
H 62
H 79
H 65
H 68
H 68
H 61
Suponiendo normalidad en los datos: (a) Estimar mediante mediante un intervalo de confianza con un nivel de significación significación de 0,02 la media de saturación saturación en el grupo de las mujeres alpinistas. (b) Niveles Niveles de oxígeno oxígeno inferiores inferiores o iguales iguales al 67 % provoca provocan n mareos y desorientación, desorientación, ¿puede afirmarse, afirmarse, con un nivel de significación de 0,05, que más del 50 % de los alpinistas alpinistas sufren mareos mareos o desorientaci desorientación? ón? (c) ¿Puede afirmarse que los niveles medios de oxígeno son distintos para ambos sexos?
Datos estadísticos por sexo:
Mu jeres
IC 98% 98% (µ ) = x¯1
± t
n1
s
−1;α /2 · n11
x1 = 68, 58 s1 = 4, 67 Hombre H ombre n1 = 9
= 68, 58
x2 = 69, 44 s2 = 3, 94 n2 = 8
± 2, 306 · 4√ ,679 = 68, 58 ± 3, 59 → IC 98% 98% (µ ) ∈ [64, 99;72, 17]
El apartado (b) es un contraste de hipótesis de proporciones 7 = 0, 41 p = 17
Manuel Angel Barea Gómez
127
CAPÍTULO CAPÍTULO 6. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONSTRA CONSTRATES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICO ARAMÉTRICOS S EN DOS O MÁS POBLACIONES.
π = 0, 5 π > 0, 5
H 0 H 1
El valor crítico para una α = 5% es zα /2 = 1, 96, el criterio de rechazo será z > 1, 54 z =
p π
·− −
π (1 π ) n
= 0,410,−5·00,,55 = 0, 742
−
17
Por tanto H 0 y no más del 50% de los alpinistas sufren mareos o desorientación.
El apartado (c) es un contraste de hipótesis de diferencias de medias En primer lugar comparamos las varianzas poblacionales
F =
σ 1 = σ 2 σ 1 = σ 2
H 0 H 1
s21 s22
2 = 43,,67 = 1, 39 952
Se rechaza H 0 si F no pertenece al intervalo de nuestro n uestro estadístico. Para una α = 0, 05
F 0,975;8;7 = 4, 899 1 = 0, 204 F 0,025;8;7 = 4,357
→
como 1, 39 ∈ (0, 204;4, 899), se acepta H 0 y por tanto σ 1 = σ 2
Para comprobar si es más efectivo efectivo el medicamento, formulamos la hipótesis y calculamos para una α = 0, 05
µ 1 = µ 2 µ 1 = µ 2
H 0 H 1
Por tener las varianzas poblacionales iguales v = n1 + n2 − 2 = 9 + 8 − 2 = 15 El valor crítico es t 15;0 15;0,975 = 2, 131, el criterio de rechazo de H 0 será |t | > 2, 131 s=
− ·
(n1 1) s21 +(n2 1) s22 (n1 +n2 2)
t =
−
x1 x2 s2 s2 n1 + n2
−
− ·
=
·
8 4,672 +7·3,952 15
= 4, 34
,86 = 68,582−69,442 = −20,10 = 0, 409 4,34 4,34
9
−
+ 8
|−0, 409| < 2, 133 por tanto se acepta H 0 que afirma que no existen diferencias entre ambos sexos Problema 6.19.
Un equipo médico asegura que la metformina rebaja los niveles de glucosa en sangre. Para comprobarlo, seleccionan un grupo de 10 pacientes con diabetes Mellitus II, a los que se le mide la cantidad de azúcar en sangre en ayunas, antes del tratamiento y después de un mes de tratamiento obteniendo los siguientes resultados:
Nivel glucosa antes Nivel glucosa después Manuel Angel Barea Gómez
125 100
160 129
110,00 89 128
1 35 105
1 25 1 16
1 29 1 05
1 48 1 22
1 40 1 13
16 9 12 5
14 5 99
CAPÍTULO CAPÍTULO 6. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONSTRA CONSTRATES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICO ARAMÉTRICOS S EN DOS O MÁS POBLACIONES.
Suponiendo que los datos son normales: (a) Podemos admitir admitir con un nivel de significación significación de (α = 0, 02) la afirmación del equipo médico. (b) Calcule un intervalo intervalo al 95 % de confianza para para la media del nivel de glucosa glucosa después del del tratamiento. tratamiento.
Nivel glucosa antes X Nivel glucosa después Y d i = X i
125 100 25
− Y i
160 129 31
110,00 89 21
1 35 1 05 30
1 25 1 16 9
1 29 1 05 24
1 48 122 26
1 40 1 13 27
1 69 1 25 44
14 5 99 46
¯ = 28, 30 D s D = 10, 71 n = 10
H 0 H 1
µ 1 = µ 2 µ 1 > µ 2
El valor crítico es z0,98 = 2, 055, el criterio de rechazo de H 0 será t > 2, 055
| D¯ |
28 30 z = √ s D = 10,71 = 8, 35 √ n ,
10
Al ser 8, 35 > 2, 055 admite H 1 que indica que el nivel de glucosa disminuye después del tratamiento.
Para el apartado (b) los datos son:
IC 95% 95% (µ ) = x¯1
± t
n1
x¯1 = 110, 30 s1 = 12, 85 n = 10
12,85
s
−1;α /2 · n11 = 110, 30 ± 2, 262 · √ 10
= 110, 30
± 9, 19 → IC 95% 95% (µ ) ∈ [101, 10;119, 49]
Problema 6.20. Un dietista toma dos muestras formadas por 50 y 60 personas, respectivamente. Propone a los primeros seguir la dieta A y a los segundos las dieta B. En ambos casos, el número de personas que consiguen reducir el peso de forma significativa es 40. Se pide: (a) Calcular el intervalo de confianza del 95% para la diferencia diferencia de las correspondientes correspondientes proporciones. proporciones. (b) ¿Se podría concluir que la proporción de personas personas que consiguen reducir reducir el peso de forma significativa es mayor con la dieta A?
A
Manuel Angel Barea Gómez
p1 = 40 50 = 0, 8 B n1 = 50
129
p2 = 40 60 = 0, 67 n2 = 60
CAPÍTULO CAPÍTULO 6. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONSTRA CONSTRATES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICO ARAMÉTRICOS S EN DOS O MÁS POBLACIONES. IC 95% 95% (π 1
− π 2) = ( p1 − p2) ± z /
α 2
· ·−
p1 (1 p1 ) n1
+
p2 (1 p2 ) n2
· −
n1 p1 +n2 p2 n1 +n2
·
− 0, 67) ± 1, 96
− π 2) ∈ [−0, 018;0, 278]
IC 95% 95% (π 1
p =
= ( 0, 8
·
· ·
0,8 0,2 50
+ 0,6760·0,23 = 0, 13
± 0, 148
8+60·0,67 = 50·0,50 = 0, 727 +60
H 0 H 1
π 1 = π 2 π 1 > π 2
El valor crítico es z0,95 = 1, 645, el criterio de rechazo de H 0 será z > 1, 645 z =
· − −
p1 p2
1 p (1 p) + p (n p) n1 2
· −
=
0,8−0,677
0,727·0,273 0,727·0,273 + 50 60
= 00,,123 085 = 1, 44
Se acepta H 0 porque 1, 44 < 1, 645, por tanto no se puede concluir la hipótesis formulada respecto a la dieta A.
Problema 6.21.
En un estudio de angina de pecho en ratas, se dividió aleatoriamente a 18 animales afectados, en dos grupos de 9 individuos cada uno. A un grupo se le suministró un placebo y al otro el fármaco experimental FL113. Después de un ejercicio controlado sobre una rueda de andar, se determinó el tiempo de recuperación de cada rata. Se piensa que el FL113 reducirá el tiempo medio de recuperación. Se dispone de la siguiente información:
Placebo
x1 = 329seg . s1 = 45seg. F L113 n1 = 9
x2 = 238seg . s2 = 43seg. n2 = 9
(a) Construya Construya un intervalo de confianza del 95 % para la diferencia diferencia de los tiempos medios de recuperació recuperación n de las ratas que recibieron placebo y las que recibieron el FL113. (b) ¿Es cierta la suposición de que el FL113 reducirá reducirá el tiempo medio de recuperación? recuperación? .
En primer lugar debemos averiguar si las varianzas poblacionales son son iguales:
H 0 H 1
σ 1 = σ 2 σ 1 = σ 2
F =
s21 s22
2 = 45 = 1, 09 432
Se rechaza H 0 si F no pertenece al intervalo de nuestro n uestro estadístico. Para una α = 0, 05
→
F 0,975;8;8 = 4, 433 1 = 0, 225 F 0,025;8;8 = 4,433
como 1, 09 ∈ (0, 225;4, 433), se acepta H 0 y por tanto σ 1 = σ 2 Por tener las varianzas poblacionales iguales v = n1 + n2 − 2 = 9 + 9 − 2 = 16
Manuel Angel Barea Gómez
130
CAPÍTULO CAPÍTULO 6. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONSTRA CONSTRATES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICO ARAMÉTRICOS S EN DOS O MÁS POBLACIONES. IC 95% 95% (µ 1
− µ 2) ± t ; / · v α 2
s21 n1
+
s22 n2
= (329
− 238) ± 2, 120
·
452 9
2
+ 439 = 90
± 43, 9
− µ 2) ∈ [46, 71;133, 29]
IC 95% 95% (µ 1
Formulamos la hipótesis y calculamos para una α = 0, 05
µ 1 = µ 2 µ 1 > µ 2
H 0 H 1
El valor crítico es t 16;0 16;0,95 = 2, 120, el criterio de rechazo de H 0 será t > 2, 120 s=
− ·
(n1 1) s21 +(n2 1) s22 (n1 +n2 2)
t =
−
−
x1 x2 s2 s2 n1 + n2
− ·
·
8 452 +8·432 16
=
= 44, 01
= 3292−2382 = 2090,74 = 4, 33 44 + 44
9
9
44, 201 > 2, 120 por tanto se rechaza H 0 y se contrasta que el fármaco FL113 reduce el tiempo de recuperación.
Problema 6.22.
Se inoculan dos organismos aislados durante dos epidemias distintas, a dos muestras diferentes obtenidas de la misma población. A las dos semanas enferma el 68,5% de las 200 pruebas realizadas con el primer organismo, y el 65,3% de las 150 pruebas efectuadas para el segundo caso. Halle un intervalo de confianza del 95% de esta diferencia de proporciones encontradas.
A
IC 95% 95% (π 1
− π 2) = ( p1 − p2) ± z / · α 2
· −
p1 (1 p1 ) n1
+
p1 = 68, 5 B n1 = 200
p2 (1 p2 ) n2
· −
IC 95% 95% (π 1
p2 = 65, 3 n2 = 150
= (0, 685
− 0, 653) ± 1, 96 ·
− π 2) ∈ [−0, 068;0, 132]
·0,347 0,685·0,315 + 0,653150 200
= 0, 032
± 0, 1
Problema 6.23.
Se está haciendo un estudio sobre hipertensión. De una ciudad se toma una muestra de trece pacientes y de otra ciudad se toma otra muestra de dieciséis pacientes. Los datos obtenidos son los siguientes:
x1 = 166mm s1 = 28mm F L113 n1 = 13
x2 = 164, 7 mm s2 = 7 mm n2 = 16
(a) Determine Determine un intervalo de confianza del 95 % para la diferencia diferencia de medias, bajo la hipótesis de normalidad normalidad de los datos.
En primer lugar debemos averiguar si las varianzas poblacionales son son iguales:
Manuel Angel Barea Gómez
H 0 H 1
σ 1 = σ 2 σ 1 = σ 2
131
CAPÍTULO CAPÍTULO 6. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONSTRA CONSTRATES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICO ARAMÉTRICOS S EN DOS O MÁS POBLACIONES. F =
s21 s22
2 = 28 = 16 2 7
Se rechaza H 0 si F no pertenece al intervalo de nuestro n uestro estadístico. Para una α = 0, 05
→
F 0,975;12;15 = 2, 963 1 = 0, 314 F 0,025;12;15 = 3,177
2 2 2 σ 2 Por tener las varianzas poblacionales distintas v = (n12·s12+n2·s2 )2 2 = como 16 ∈ / (0, 314;2, 963), se rechaza H 0 y por tanto σ 1 =
(n1 ·s1 ) n1 −1
(13·282+16·72 ) 10976 2 2 = 898,33 = 12, 26 2 2 · · 13 28 16 7 ( ) +( ) 12
15
IC 95% 95% ( µ 1
+
(n2 ·s2 ) n2 −1
≃ 13
− µ 2) ± t ; / · v α 2
s21 n1
+
s22 n2
= (166
IC 95% 95% ( µ 1
− 164, 7) ± 2, 16
·
282 13
2
+ 716 = 1, 3
± 17, 12
− µ 2) ∈ [−15, 89;18, 42]
Problema 6.24.
Se supone que en una determinada raza de ganado vacuno los terneros aumentan 12kg de peso por cada dos semanas, en los primeros meses de vida. Para comprobarlo se midió el peso de ocho terneros al cumplir las cuatro semanas, y posteriormente dos semanas más tarde, con el siguiente resultado:
Ternero Peso (4 semanas) Peso (6 semanas)
1 130 138
2 12 5 14 0
3 12 8 13 9
4 127 141
5 1 29 1 37
6 1 23 1 37
7 1 31 1 42
8 130 142
(a) Compruebe Compruebe si la suposición suposición es cierta calculando calculando un intervalo intervalo de confianza del 95 % para la diferencia diferencia media de peso. Se considera que el peso se distribuye de forma aproximadamente normal.
Ternero 1 Peso (4 semanas) X 130 Peso (6 semanas) Y 138 d 1 = Y i − X i 8
IC 95% 95% (µ 2
2 125 140 15
3 128 139 11
4 1 27 1 41 14
5 1 29 1 37 8
6 1 23 1 37 14
7 13 1 14 2 11
8 13 0 14 2 12
¯ = 11, 625 D s D = 2, 67 n=8
− µ 1) = D¯ ± t − / · √ = 11, 625 ± 2, 365 · 2√ ,678 = 11, 625 ± 2, 232 → IC 95% 95% (µ 2 − µ 1 ) ∈ [9, 393;13, 857] n
1;α 2
S d n
Problema 6.25.
El tratamiento tratamiento anticoagulant anticoagulantee por vía oral se realiza con dicumarínicos dicumarínicos.. Se midió el porcentaje porcentaje de nivel de protromprotrombina (que determina el grado de coagulación) a nueve pacientes, antes y después del tratamiento con dicho fármaco y se obtuvieron los siguientes resultados:
Antes Después
Manuel Angel Barea Gómez
95 40
85 37
77 28
100 49
132
92 37
67 21
81 45
94 52
99 37
CAPÍTULO CAPÍTULO 6. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONSTRA CONSTRATES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICO ARAMÉTRICOS S EN DOS O MÁS POBLACIONES. (a) Calcule un intervalo del 95 % para la diferencia entre los porcentajes porcentajes medios de actividad de protrombina protrombina antes y después del tratamiento. (b) ¿Se puede afirmar que con este tratamiento tratamiento el porcentaje medio puede llegar llegar a disminuir en 53 puntos? (c) ¿Cuántos pacientes deben ser estudiados para que la amplitud del intervalo de confianza se reduzca a la tercera parte?
Antes X Después Y d 1 = X i
− Y i
95 40 55
85 37 48
77 28 49
IC 95% 95% (µ 2
1 00 49 51
92 37 55
67 21 46
81 45 36
94 52 42
99 37 62
¯ = 49, 33 D s D = 7, 68 n=9
− µ 1) = D¯ ± t − / · √ = 49, 33 ± 2, 306 · 7√ ,689 = 49, 33 ± 5, 90 → IC 95% 95% (µ 2 − µ 1 ) ∈ [43, 43;55, 23] n
1;α 2
S d n
Si se puede afirmar ya que 53 ∈ [43, 43;55, 23]
Para reducir al amplitud del intervalo a la tercera parte: l = 55, 23
− 43, 43 = 11, 8 → 3 = 113,8 = 3, 93 l
s D 3, 93 = 2 · zα /2 · √ n
→n=
2 1,96 2 3,93
· ≃
59
Problema 6.26.
Se sospecha que la concentración de sulfonato de perfluorooctano (PFOS) en la sangre de las personas de una cierta región está aumentando con el tiempo. A ocho personas del lugar, elegidas aleatoriamente, se les midió la concentración de PFOS en el plasma en 1979 y en 1986, con los siguientes resultados:
Sujeto PFOS ng/ml 1979 PFOS ng/ml 1986
1 28,2 30,6
2 31,6 31,9
3 30,1 32,8
4 27,9 30,8
5 28,8 33,7
6 30,1 29,8
7 32,1 33,6
8 30,9 30,4
(a) Calcule un intervalo de confianza del 95% para la diferencia entre las concentraciones concentraciones medias de PFOS en sangre entre 1986 y 1979. (b) ¿Sería admisible afirmar, afirmar, al nivel de confianza anterior, anterior, que la concentración de PFOS en sangre ha aumentado en el período de tiempo estudiado?
Sujeto 1 ng PFOS /ml 1979 X 28,2 PFOS ng/ml 1986 Y 30,6 d 1 = Y i − X i 2,4
Manuel Angel Barea Gómez
2 31,6 31,9 0,3
3 30,1 32,8 2,7
¯ = 1, 74 D s D = 1, 85 n=8
133
4 27,9 30,8 2,9
5 28,8 33,7 4,9
6 30,1 29,8 -0,3
7 32,1 33,6 1,5
8 30,9 30,4 -0,5
CAPÍTULO CAPÍTULO 6. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONSTRA CONSTRATES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICO ARAMÉTRICOS S EN DOS O MÁS POBLACIONES. IC 95% 95% (µ 2
− µ 1) = D¯ ± t − / · √ = 1, 74 ± 2, 365 · 1√ ,858 = 1, 74 ± 1, 54 → IC 95% 95% (µ 2 − µ 1 ) ∈ [0, 20;3, 28] n
1;α 2
S d n
Si se puede afirmar ya que el intervalo es positivo lo cuál quiere decir que el nivel medio en 1986 es mayor que en 1979.
Problema 6.27.
Se hizo un muestreo en dos municipios para averiguar su opinión sobre la fluoración del agua potable antes de iniciar la campaña. Los resultados de estas encuestas (siendo p la proporción favorable) fueron
Munici pio 1
p1 = 0, 52 Municipio 2 n1 = 110
p2 = 0, 55 n2 = 75
(a) ¿Podría ¿Podría afirmarse que los dos municipios tienen iguales proporciones de partidarios de la fluoración? p =
n1 p p1 +n2 p p2 n1 +n2
·
·
,52+75·0,55 = 110·0110 = 0, 532 +75
H 0 H 1
π 1 = π 2 π 1 = π 2
z| > 1, 96 El valor crítico es z0,975 = 1, 96, el criterio de rechazo de H 0 será | z z =
· − −
p1 p2
p (1 p) + p (n1 p) n1 2
· −
=
0,52−0,55
0,532·0,468 0,532·0,468 + 110 75
,03 = −00,07 = 0, 42
−
Se acepta H 0 porque |−0, 42| < 1, 96
Problema 6.28.
Se desea averiguar si la aspirina y un producto de comparación son igualmente eficaces para el alivio de los síntomas de influenza. Se registran los tiempos, en minutos, desde la toma de la medicina hasta cuando el paciente declara sentirse mejor, y los resultados son:
Aspirina Aspir ina
x1 = 15, 2 s1 = 8, 7 Produc Producto to de comparaci comparacion ´ n1 = 10
(a) Contraste Contraste la hipótesis hipótesis al nivel nivel del 5 %
En primer lugar debemos averiguar si las varianzas poblacionales son son iguales:
H 0 H 1
σ 1 = σ 2 σ 1 = σ 2
F =
s21 s22
2 = 86,,792 = 1, 59
Se rechaza H 0 si F no pertenece al intervalo de nuestro n uestro estadístico. Manuel Angel Barea Gómez
134
x2 = 13, 4 s2 = 6, 9 n2 = 20
CAPÍTULO CAPÍTULO 6. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONSTRA CONSTRATES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICO ARAMÉTRICOS S EN DOS O MÁS POBLACIONES. F 0,975;9;19 = 2, 880 F 0,025;9;19 = 3,168 = 0, 271
→
Para una α = 0, 05
como 1, 59 ∈ (0, 271;2, 880), se acepta H 0 y por tanto σ 1 = σ 2 v = n1 + n 2
− 2 = 10 + 20 − 2 = 18
Formulamos la hipótesis y calculamos para una α = 0, 05
µ 1 = µ 2 µ 1 = µ 2
H 0 H 1
El valor crítico es t 18;0 18;0,975 = 2, 101, el criterio de rechazo de H 0 será |t | > 2, 101 s=
− ·
(n1 1) s21 +(n2 1) s22 (n1 +n2 2)
t =
− ·
−
−
x1 x2 s2 s2 n1 + n2
=
·
9 8,72 +19·6,92 28
15,2−13,4
=
7,532 7,532 10 + 20
= 7, 53
= 0, 6176
0, 6176 < 2, 101 por tanto se acepta H 0 y se contrasta que ambos fármacos son igualmente de eficaces.
Problema 6.29.
Las velocidades de difusión del bióxido de carbono a través de suelos de porosidades diferentes son:
Suelo fino Suelo poroso
20 19
27 30
22 32
23 28
23 15
28 26
23 35
26 18
22 25
26 35
20
19
22
(a) Compruebe Compruebe si puede afirmarse afirmarse que son diferentes diferentes al nivel de significación significación del 5 % (Se supone que la distribución distribución es normal).
Suelo fino
x1 = 23, 15 s1 = 2, 82 Suelo poroso n1 = 13
H 0 H 1
F =
s21 s22
x2 = 26, 30 s2 = 7, 08 n2 = 10
σ 1 = σ 2 σ 1 = σ 2
2 = 27,,82 = 0, 16 082
Se rechaza H 0 si F no pertenece al intervalo de nuestro n uestro estadístico. Para una α = 0, 05
→
F 0,975;12;9 = 3, 868 1 = 0, 291 F 0,025;12;9 = 3,436
σ 2 como 0, 16 ∈ / (0, 291;3, 868), se rechaza H 0 y por tanto σ 1 = v = n1 + n 2
Manuel Angel Barea Gómez
− 2 = 10 + 20 − 2 = 18 135
CAPÍTULO CAPÍTULO 6. INTERV INTERVALOS DE CONFIANZA CONFIANZA Y CONSTRA CONSTRATES DE HIPÓTESIS HIPÓTESIS PARAMÉTRICO ARAMÉTRICOS S EN DOS O MÁS POBLACIONES.
Formulamos la hipótesis y calculamos para una α = 0, 05
µ 1 = µ 2 µ 1 = µ 2
H 0 H 1
2
(n1 ·s21 +n2 ·s22 ) (13·2,822+10·7,082) = 2 2 2 2 (n1 ·s21 ) + (n2 ·s22 ) (13·282 ) + (10·72 ) 12 19 n1 −1 n2 −1 El valor crítico es t 11;0 11;0,975 = 2, 201, el criterio de rechazo de H 0 será t > 2, 201
Por tener las varianzas poblacionales distintas v =
≃ 11
||
t =
−
x1 x2 2 s2 1 s2 n1 + n2
−26,30 = 1, 32 = 232,15 822 7 082
,
, 13 + 10
−
|−1, 32| < 2, 201 por tanto se acepta H 0 y se contrasta que las velocidades de difusión del bióxido de carbono en suelos diferentes
son iguales.
Problema 6.30.
En un reciente estudio de lesiones de rodilla entre jugadores de fútbol que juegan sobre césped, se compararon dos tipos de calzados. En 266 jugadores que calzaban zapatos de fútbol multiabrazados, se presentaron 14 lesiones de rodilla. De 2055 jugadores que calzaban botas de fútbol convencionales, se encontraron 162 de tales lesiones. (a) ¿Se puede afirmar al nivel del 0,05 que la probabilidad de sufrir una lesión de rodilla rodilla cuando se calzan botas convencionales es más alta que la de sufrirla con zapatos multiabrazados? (b) ¿Y al nivel nivel de 0,01? 0,01? Mult iabrazados
14 = 0, 052 p1 = 266 Convencionales n1 = 266
162 = 0, 078 p2 = 2055 n2 = 2055
(a) ¿Podría ¿Podría afirmarse que los dos municipios tienen iguales proporciones de partidarios de la fluoración? p =
n1 p p1 +n2 p p2 n1 +n2
·
·
052+2055 ·0,078 = 266·0,266 = 0, 075 +2055
H 0 H 1
π 1 = π 2 π 1 < π 2
El valor crítico es z0,95 = 1, 645, el criterio de rechazo de H 0 será z > 1, 645 z =
· − −
p2 p1
p (1 n1
· 1− p) + p ( p)
=
n2
0,078−0,052
0,075·0,925 0,075·0,925 + 2055 266
= 1, 7552
Se rechaza H 0 porque 1, 755 > 1, 645, por tanto, la probabilidad de sufrir una lesión de rodilla cuando se calzan botas convencionales es más alta que la de sufrirla con zapatos multiabrazados. Para una α = 0, 01 El valor crítico es z0,99 = 2, 32, el criterio de rechazo de H 0 será z > 2, 32 z =
· − −
p2 p1
1 p (1 p) + p (n p) n1 2
· −
=
0,078−0,052
0,075·0,925 0,075·0,925 + 2055 266
Se acepta H 0 porque 1, 755 < 2, 32. Manuel Angel Barea Gómez
136
= 1, 7552
CAPÍTULO CAPÍTULO 7. CONTRASTES CONTRASTES DE HIPÓTESIS HIPÓTESIS NO PARAMÉTRICOS ARAMÉTRICOS
χ 2 =
2 ∑(O E ) E
−
2 2 = (90−6262,5,5) + ... + (64−9 9) = 90, 53
Por tanto, se rechaza H 0 y se acepta H 1 que indica que no se distribuyen de la misma forma ambas poblaciones.
Problema 7.2.
En una campaña preventiva preventiva de detección detección precoz del glaucoma glaucoma realizada realizada en una población población se pretende pretende estudiar si el grado de tal enfermedad está o no condicionado por el sexo de los sujetos explorados. Entre los varones sometidos a la prueba resultaron 4724 normales, 193 sospechosos de la enfermedad y 39 glaucomatosos, mientras que entre las mujeres resultaron 2979 normales, 55 sospechosas y 12 glaucomatosas. (a) ¿Que podemos podemos deducir deducir del test?
Frecuencias observadas Hombres Mujeres Total
Normales
Sospechoso Sospechososs
Glaucomato Glaucomatosos sos
Total
4724 2 9 79 7703
193 55 248
39 12 51
4956 3046 8002
Completamos nuestra tabla con las frecuencias esperadas
(a)
Frecuencias esperadas Hombres Mujeres
Normales
Sospechoso Sospechososs
Glaucomat Glaucomatosos osos
4770,81 2932,18
153,59 94,40
31,57 19,41
χ 2 = χ c2 χ 2 = χ c2
H 0 H 1
Sigue una distribución χ 2 con v = (2 − 1) · (3 − 1) = 2 gradosdelibertad para una α = 0, 05 2 2 Nuestro estadístico es χ 2;0 ,025 ; χ 2;0,975 = [0, 22;7, 38] dicho intervalo será nuestra región de aceptación χ c2 =
∑(O E ) E
−
2
−4770,81)2 + ... + (12−19,41)2 = 32, 33 = (47244770 ,81 19,41
Por tanto, se rechaza H 0 y se acepta H 1 que indica que no se distribuyen de la misma los hombres y mujeres con respecto al test.
Problema 7.3.
En general, se sabe que de los pacientes con leucemia mieloblástica aguda con los que se logra una remisión completa, a partir de un tratamiento convencional, el 50% sobreviven más de 21 meses. Se está estudiando un nuevo procedimiento con el que se espera espera que aumente este número número de meses meses de supervivencia. supervivencia. Este tiempo para 10 pacientes pacientes con el nuevo tratamient tratamiento o ha sido:
25,8
20,5
20,9
27,3
21,5
20,1
28,9
19,2
26,3
24,1
(a) Mediante el contraste de los signos, decidir si el nuevo procedimiento ha aumentado la mediana mediana del tiempo de supervivencia. (b) Mediante Mediante el contraste contraste de D’Agostino, D’Agostino, estudiar si los datos son normales.
Manuel Angel Barea Gómez
138
CAPÍTULO CAPÍTULO 7. CONTRASTES CONTRASTES DE HIPÓTESIS HIPÓTESIS NO PARAMÉTRICOS ARAMÉTRICOS
′ Contamos Contamos los valores valores por encima encima de 21 T exp exp = 6 no existe en nuestra muestra ningún valor 21, por tanto, n = 10, aproximamos T B(10;0, 05), por lo que para un nivel de significación α = 0, 05 hay que encontrar P ( X = k ) ≤ 0, 05.
′ Nuestra región de convergencia convergencia es Rc : T exp exp ≥ n − k Las probabilidades B (10;0, 05) que tienen valores valores menores de 0,05, es para para k = 1, por tanto Rc : T exp exp ≥ 9 como 6 ≤ 9 la hipótesis de que aumentado la mediana el tiempo de supervivencia, supervivencia, no es significativa significativa
El apartado (b)
La poblaci poblacionesnormal ´ La poblaci poblacionnoesnormal ´
H 0 H 1
Rechazamos H 0 si el valor de Dexp está fuera del intervalo de la tabla de los puntos críticos del test de D’Agostino.
Los puntos críticos son [0, 2513;0, 2849]
En primer lugar para calcular nuestro estadístico ordenamos los datos de menor a mayor.
· − X i ∑ i X
Dexp =
· n·
n
n+1
∑ X i2
2
−
·∑ X i
(∑ X i )2 n
∑ xi = 234, 6 ∑ i xi = 1382, 3 ∑ X i2 = 5610, 6
·
1382 ,3 5,5·234,6
= · · − 10
10 5610 ,6−
234,62 10
=
92 326,9
= 0, 2814
Como 0, 2814 ∈ [0, 2513;0, 2849] H 0 es aceptada y la población sigue una distribución normal.
Problema 7.4.
Se ha realizado un recuento acerca del número de ingresos hospitalarios que han tenido un grupo de 200 pacientes que padece padecen n insufic insuficienc iencia ia cardía cardíaca. ca. Ajustar Ajustar los datos datos recog recogidos idos en la siguiente siguiente tabla tabla a una distri distribuc bución ión binomia binomiall y estudiar estudiar la bondad bondad del ajuste. Ingresos Frecuencia
H 0 H 1
0 10
1 30
2 65
3 58
4 28
5 8
6 1
Losdatossea Losdatossea justana justana unad unad istrib istribuc uciionbinomial ´ Losdatosno Losdatosno sea justana justana unad unad istrib istribuc uciionbinomial ´
Para obtener los valores esperados se tiene que utilizar la formula de la distribución binomial caso n = 6. Sabemos que µ = n · p = 6 · p.
3·58+4·28+5·8+6·1 = 492 = 2, 46 También podemos hallar µ = ∑∑ f f i · x 1xi = 0·10+1·30+2·65+200 200
Manuel Angel Barea Gómez
139
· n m
· − p) −
pm (1
n m
, en nuestro
CAPÍTULO CAPÍTULO 7. CONTRASTES CONTRASTES DE HIPÓTESIS HIPÓTESIS NO PARAMÉTRICOS ARAMÉTRICOS
2, 46 = 6 · p → p = 2,646 = 0, 41
Así pues, la distribución binomial ajustada ajustada viene dada por B (6;0 6; 0, 41). Sus probabilidades son: X
P[k = X ]
0 1 2 3 4 5 6
0,04218 0,17587 0,30553 0,28309 0,14754 0,04101 0,00475
Obtenemos la frecuencia esperada y rellenamos nuestra tabla Ingresos Frecuencia Esperada
0 10 8,40
1 30 35,16
2 65 61,11
3 58 56,60
4 28 29,50
5 8 8,20
6 1 0,94
Para los grados de libertad el valor de m será 1, ya que se tuvo que estimar la media de la población para poder obtener el valor de p y así poder pod er calcular los valores esperados. v : k
−1−m= 7−1−1= 5
H 0 H 1
χ 2 χ c2 χ 2 < χ c2
≥
2 n uestro punto critico. Aceptaremos H 0 si χ 2 χ 5;0 ,05 = 11, 07 Este será nuestro
χ c2 =
2 ∑(O E ) E
−
≥ χ 2 c
2 ,16)2 (65−61,11)2 (58−56,60)2 (28−29,50)2 (8−8,20)2 (1−0,94)2 = (10−8,840,40) + (30−3535 + + + + + = 1, 43 ,16 61,11 56,60 29,50 8,20 0,94
Como 1, 47 < 11, 7 se acepta H 0
Problema Problema 7.5.
Reali Realiza zamosun mosun jue juego de azar azar que que cons consis iste te en lanza lanzarr un par par de dadosy dadosy anota anotarr la suma suma obte obtenid nida. a. Las Las tabla tabla de recue ecuento ntoss obtenida tras 200 lanzamientos es: Resultado Recuentos
2 2
3 8
4 16
5 28
6 32
7 34
8 30
9 24
10 14
11 8
(a) ¿Se ajustan las frecuencias empíricas empíricas a la distribución que les corresponde corresponde en teoría?
Manuel Angel Barea Gómez
140
12 4
CAPÍTULO CAPÍTULO 7. CONTRASTES CONTRASTES DE HIPÓTESIS HIPÓTESIS NO PARAMÉTRICOS ARAMÉTRICOS
Teniendo en cuenta frecuencia empírica es un sinónimo de frecuencia observada. Podemos ajustarla a una distribución de Poisson, por ser n grande.
H 0 H 1
Losdatossea Losdatossea justana justana unadistrib unadistribuc uciiondePoisson ´ Losdatosno Losdatosno sea justana justana unad unad istrib istribuc uciiondePoisson ´
Para obtener los valores esperados se tiene que utilizar la formula de la distribución binomial P (k = X ) =
...+ ...+12·4 También podemos hallar µ = ∑∑ f f i · x 1xi = 2·2+200 = 13962 200
e−λ λ k k !
· , sabemos µ = λ .
≃7 λ = 7
Así pues, la distribución de Poisson ajustada viene dada por P (7). Sus probabilidades son: X
P[k = X ]
2 3 4 5 6 7 8 9 10 11 12
0,02234 0,05212 0,09122 0,12771 0,14900 0,14900 0,13037 0,10140 0,07 0,0709 0988 0,04 0,0451 5177 0,02 0,0263 6344
Obtenemos la frecuencia esperada y rellenamos nuestra tabla Ingresos Frecuencia
H 0 H 1
0 10
1 30
2 65
3 58
4 28
5 8
6 1
Losdatossea Losdatossea justana justana unad unad istrib istribuc uciionbinomial ´ Losdatosno Losdatosno sea justana justana unad unad istrib istribuc uciionbinomial ´
Para obtener los valores esperados se tiene que utilizar la formula de la distribución binomial caso n = 6. Sabemos que µ = n · p = 6 · p.
3·58+4·28+5·8+6·1 = 492 = 2, 46 También podemos hallar µ = ∑∑ f f i · x 1xi = 0·10+1·30+2·65+200 200
Manuel Angel Barea Gómez
141
· n m
· − p) −
pm (1
n m
, en nuestro
CAPÍTULO CAPÍTULO 7. CONTRASTES CONTRASTES DE HIPÓTESIS HIPÓTESIS NO PARAMÉTRICOS ARAMÉTRICOS
2, 46 = 6 · p → p = 2,646 = 0, 41
Así pues, la distribución binomial ajustada ajustada viene dada por B (6;0 6; 0, 41). Sus probabilidades son: X
P[k = X ]
0 1 2 3 4 5 6
0,04218 0,17587 0,30553 0,28309 0,14754 0,04101 0,00475
Obtenemos la frecuencia esperada y rellenamos nuestra tabla Ingresos Frecuencia Esperada
0 10 8,40
1 30 35,16
2 65 61,11
3 58 56,60
4 28 29,50
5 8 8,20
6 1 0,94
Para los grados de libertad el valor de m será 1, ya que se tuvo que estimar la media de la población para poder obtener el valor de p y así poder pod er calcular los valores esperados. v : k
−1−m= 7−1−1= 5
H 0 H 1
χ 2 χ c2 χ 2 < χ c2
≥
2 n uestro punto critico. Aceptaremos H 0 si χ 2 χ 5;0 ,05 = 11, 07 Este será nuestro
χ c2 =
2 ∑(O E ) E
−
≥ χ 2 c
2 ,16)2 ,11)2 ,60)2 ,50)2 ,20)2 ,94)2 = (10−8,840,40) + (30−3535 + (65−6161 + (58−5656 + (28−2929 + (8−88,20 + (1−00,94 = 1, 43 ,16 ,11 ,60 ,50
Como 1, 47 < 11, 7 se acepta H 0 Resultado Observada Esperada
2 2 4,47
3 8 10,42
4 16 18,24
5 28 25,54
6 32 29,80
7 34 29,80
8 30 26,07
9 24 20,28
10 14 14,19
11 8 9,03
12 4 5,27
Utilizaremos como grados de libertad v = 11 − 1 − 1 = 9, por haber usado la media de la distribución estimada a partir de los datos.
H 0 H 1
χ 2 χ c2 χ 2 < χ c2
≥
2 n uestro punto critico. Aceptaremos H 0 si χ 2 χ 9;0 ,05 = 16, 92 Este será nuestro
Manuel Angel Barea Gómez
142
≥ χ 2 c
CAPÍTULO CAPÍTULO 7. CONTRASTES CONTRASTES DE HIPÓTESIS HIPÓTESIS NO PARAMÉTRICOS ARAMÉTRICOS
χ c2 =
2 ∑(O E ) E
−
,47)2 ,27)2 = (2−44,47 + ... + (4,−5,527 = 4, 89
Como 4, 89 < 16, 92 se acepta H 0
Problema 7.6.
Los datos referentes al número de partos asistidos por día en un centro hospitalario, vienen recogidos en la siguiente
tabla:
0 6
Nº de partos por día Frecuencia
1 15 15
2 20 20
3 1122
4 8
5 o más 4
(a) Ajustar a la distribución de Poisson adecuada y estudiar la bondad del ajuste. (Nota: Tomar como marca marca de la última clase el valor 5)
H 0 H 1
Losdatossea Losdatossea justana justana unadistrib unadistribuc uciiondePoisson ´ Losdatosno Losdatosno sea justana justana unad unad istrib istribuc uciiondePoisson ´
Para obtener los valores esperados se tiene que utilizar la formula de la distribución binomial P (k = X ) =
e−λ λ k k !
· , sabemos µ = λ .
También podemos hallar µ = ∑∑ f f i · x 1xi = 0·6+1·15+2·2065+3·12+4·8+5·4 = 143 65 = 2, 2
λ = 2, 2
Así pues, la distribución de Poisson ajustada viene dada por P (2, 2). Sus probabilidades son:
Nº de partos por día Frecuencia Frecuencia observada Frecuencia esperada
X
P[k = X ]
0 1 2 3 4 5
0,11080 0,24376 0,26814 0,19663 0,10815 0,07202
0 6 7,20
1 15 15,84
2 20 17,43
3 12 12,78
4 8 7,03
5 o más 4 4,68
Utilizaremos como grados de libertad v = 6 − 1 − 1 = 4, por haber usado la media de la distribución estimada a partir de los datos.
H 0 H 1
χ 2 χ c2 χ 2 < χ c2
≥
2 2 χ 4;0 ,05 = 9, 49 Este será nuestro punto critico. Aceptaremos H 0 si χ
Manuel Angel Barea Gómez
143
≥ χ 2 c
CAPÍTULO CAPÍTULO 7. CONTRASTES CONTRASTES DE HIPÓTESIS HIPÓTESIS NO PARAMÉTRICOS ARAMÉTRICOS
χ c2 =
2 ∑(O E ) E
−
,20)2 ,03)2 = (6−77,20 + ... + (8−77,03 = 0, 90
Como 0, 90 < 9, 49 se acepta H 0
Problema 7.7.
Cierta enfermedad puede presentarse en 5 estadios diferentes, según la gravedad. Las probabilidades de que un individuo con la enfermedad se encuentre en cada uno de los 4 primeros estadios son, respectivamente, 0,01; 0,12; 0,3 y 0,17. Según el estadio, el individuo sobrevive 10, 8, 6, 4 y 1 años, respectivamente. (a) Hallar la probabilidad de que un individuo que tenga esta enfermedad se encuentre encuentre en el 5º estadio. (b) En una muestra muestra de 100 individuos individuos con la enfermedad, enfermedad, el número de enfermos encontrados encontrados en cada estadio estadio ha sido, respectirespectivamente, vamente, 3, 10, 25, 24 y 38. ¿Se ajustan estos datos a la distribución distribución anterior?. anterior?.
Como tenemos los datos de 4 de los cinco estadios, el quinto tendrá una probabilidad P ( X ) = 1
− [0, 01 + 0, 12 + 0, 3 + 0, 17] = 0, 4
Estadios Frecuencia Frecuencia Observada
H 0 H 1
1 3
2 10
3 25
4 24
5 38
Losdatossea Losdatossea justana justana unad unad istrib istribuc uciionbinomial ´ Losdatosno Losdatosno sea justana justana unad unad istrib istribuc uciionbinomial ´
Obtenemos la frecuencia esperada y rellenamos nuestra tabla con los 100 pacientes y la distribución aportada en el enunciad0 Estadios Frecuencia Esperada
1 3 1
2 10 12
3 25 30
4 24 17
5 38 40
Para los grados de libertad el valor de m será 0. v : k
−1−m= 5−1−0= 4
H 0 H 1
χ 2 χ c2 χ 2 < χ c2
≥
2 2 χ 4;0 ,05 = 9, 49 Este será nuestro punto critico. Aceptaremos H 0 si χ
χ c2 =
2 ∑(O E ) E
−
c
2 2 2 2 2 = (3−11) + (10−1212) + (25−3030) + (24−1717) + (38−4040) = 8, 15
Como 8, 15 < 9, 49 se acepta H 0
Manuel Angel Barea Gómez
≥ χ 2
144
CAPÍTULO CAPÍTULO 7. CONTRASTES CONTRASTES DE HIPÓTESIS HIPÓTESIS NO PARAMÉTRICOS ARAMÉTRICOS
Problema 7.8.
Para comprobar empíricamente la teoría sobre la herencia genética de Mendel, se han clasificado guisantes de una determinada variedad, atendiendo a su color y forma, en cuatro clases: E 1 : lisos y amarillos, E 2 : lisos y verdes, E 3 : rugosos y amarillos amarillos y E 4 : rugosos y verdes. Seleccionados al azar 556 guisantes de la variedad en estudio, se obtienen 315 de E 1 , 108 de E 2 , 101 de E 3 y 32 de E 4 . Según el modelo teórico de Mendel, los datos deberían estar en la proporción 9:3:3:1. (a) ¿Los datos confirman la teoría sobre sobre la herencia genética genética de Mendel?
H 0 H 1
Lateoriade Lateoriade Mendel Mendel esacertada esacertada Lateoriade Lateoriade Mendel Mendel noesacertada noesacertada
El número total de guisantes n = 315 + 108 + 101 + 32 = 556 El total de la proporción p = 9 + 3 + 3 + 1 = 16 podemos calcular los valores esperados para cada clase: Clase Valor Esperado
556·9 16
E 1
556·3 16
= 312, 75
E 2
= 104, 25
556·3 16
E 3
= 104, 25
556·1 16
E 4
= 34, 75
Construimos nuestra tabla: Clase Valor observado Valor alor Espe Espera rado do
E 1
E 2
315 312, 312,75 75
1 08 104, 104,25 25
E 3
1 01 104, 104,25 25
E 4
32 34,7 34,755
Para los grados de libertad el valor de m será 0. v : k
−1−m= 4−1−0= 3
H 0 H 1
χ 2 χ c2 χ 2 < χ c2
≥
2 2 χ 3;0 ,05 = 7, 81 Este será nuestro punto critico. Aceptaremos H 0 si χ
χ c2 =
2 ∑(O E ) E
−
≥ χ 2 c
−312,75)2 + (108−104,25)2 + (101−104,25)2 + (32−34,75)2 = 0, 470 = (315312 ,75 104,25 104,25 34,75
Como 0, 470 < 7, 81 se acepta H 0
Problema 7.9.
Se ha realizado un estudio sobre nutrición en pacientes con insuficiencia respiratoria que requieren ventilación asistida. Una variable considerada es el índice de creatinina, que es una medida del nivel proteico del paciente. El hecho de que el índice tenga un valor inferior a 6 es indicativo de un grave déficit proteico. Si la mediana de los valores del índice en este tipo de pacientes está por debajo de 6 se pondrá en funcionamient o un nuevo programa dietético para corregir el problema. A partir de una muestra aleatoria de 15 pacientes se obtuvieron los siguientes valores:
5,7
4,2
4,7
4,6
5,3
5,4
6,8
4,9
4,9
5,8
4,1
5,5
6,4
5,1
4,7
(a) Mediante Mediante el contraste de los signos, signos, ¿hay pruebas de que la mediana de los índices índices esté por debajo de 6? (b) Mediante el contraste de D’Agostino, estudiar si los datos pueden considerarse considerarse de una población Normal. Normal.
Manuel Angel Barea Gómez
145
CAPÍTULO CAPÍTULO 7. CONTRASTES CONTRASTES DE HIPÓTESIS HIPÓTESIS NO PARAMÉTRICOS ARAMÉTRICOS
′ Contamos los valores por debajo de 6 T exp exp = 13 no existe en nuestra muestra ningún valor 6, por tanto, n = 15, aproximamos T B(15;0, 05), por lo que para un nivel de significación α = 0, 05 hay que encontrar valores P ( X = k ) ≤ 0, 05.
′ Nuestra región de convergencia convergencia es Rc : T exp exp ≤ n − k Las probabilidades B (15;0 , 05) que tienen valores menores de 0,05, es para para k = 5, por tanto Rc : T exp exp ≤ 10 como 10 ≥ 6 la hipótesis de que disminuido la mediana de los índices, no es significativa significativa
El apartado (b)
La poblaci poblacionesnormal ´ La poblaci poblacionnoesnormal ´
H 0 H 1
Rechazamos H 0 si el valor de Dexp está fuera del intervalo de la tabla de los puntos críticos del test de D’Agostino.
Los puntos críticos son [0, 2568;0, 2858]
En primer lugar para calcular nuestro estadístico ordenamos los datos de menor a mayor.
∑ xi = 78, 1 ∑ i xi = 670, 7 ∑ X i2 = 414, 65
·
n (n+1)
·
x = 5, 20 s = 0, 75
T = ∑ i xi x¯ = 670, 7 2 124,7 T Dexp = n2 ·s = 152 ·0,75 = 0, 738
· −
·
− 15·142·5,20 = 124, 7
Como 0, 738 ∈ / [0, 2568;0, 2858] H 0 es rechazada y la población no sigue una distribución normal.
Problema Problema 7.10.
Los días días de estanc estancia ia en dos hospita hospitales les,, de dos dos muestr muestras as de tamaño tamaño 5 y 10, respect espectiva ivamen mente, te, de pacien pacientes tes interve intervenido nidoss quirúrgicamente por el mismo tipo de operación, son los siguientes: Hospital Hospital A Hospital B
Datos
10 14
15 16
12 23
23 25
17 17
23
20
17
26
30
(a) Suponiendo Suponiendo que los datos no son normales, ¿puede considera considerarse rse que la duración duración de la estancia estancia es distinta distinta en ambos hospitales?.
H 0 H 1
µ 0 = µ 1 µ 0 = µ 1
Se realiza el test de Wilcoxon. En primer lugar le damos una valor ordinal a nuestros datos:
Manuel Angel Barea Gómez
146
CAPÍTULO CAPÍTULO 7. CONTRASTES CONTRASTES DE HIPÓTESIS HIPÓTESIS NO PARAMÉTRICOS ARAMÉTRICOS
·35 = 28 Para P35 el intervalo será [8 − 9) ya que 80100 P35 = Lin f +
n·k 100 N i−1 ni
−
· a = 8 + 2812−17 · 1 = 8, 75 i
·65 = 52 Para P65 el intervalo será ≥ 10 ya que 80100 n·k 100 N i−1 ni
−
P65 = Lin f +
· a = 10 + 5233−47 · 1 = 10, 15 i
Luego el 30% se encuentra en el intervalo [8, 75;10, 15] Para el apartado (b) con una significación de α = 0, 05
µ = µ 0 µ > µ 0
H 0 H 1
Nuestro estadístico es z0,95 = 1, 645 rechazaremos H 0 sí zexp > z
, − zexp = 9 11,66 9 = 0, 53
√ 80
Por tanto no podemos rechazar H 0
H 0 H 1
La poblaci poblacionesnormal ´ La poblaci poblacionnoesnormal ´
Rechazamos H 0 si el valor de Dexp está fuera del intervalo intervalo de la tabla de los puntos críticos del test test de D’Agostino, para una α = 0, 05
Los puntos críticos son [0, 2734;0, 2863]
En primer lugar para calcular nuestro estadístico ordenamos los datos de menor a mayor.
n (n+1)
·
x = 9, 10 s = 1, 66
T = ∑ i xi x¯ = 32294, 2 2 2810 ,2 T Dexp = n2 ·s = 802·1,66 = 0, 2645
· −
·
− 80·812·9,10 = 2810, 2
Como 0, 2645 ∈ / [0, 2734;0, 2863] H 0 es rechazada y la población sigue no una distribución normal.
Manuel Angel Barea Gómez
148
CAPÍTULO CAPÍTULO 7. CONTRASTES CONTRASTES DE HIPÓTESIS HIPÓTESIS NO PARAMÉTRICOS ARAMÉTRICOS
Nuestro estadístico es comparado con una α = 0, 05 . Los grados de libertad son v = 3 − 1 = 2. Luego los valores críticos en una
χ 22,0,05 = 5, 99, esta será nuestra H a
12
·
N ( N +1) ∑
· H = L = 1
−
2 ∑ Rc ni
L 3 ∑( Li Li ) 3 N N
− −
− 3 · ( N + 1)
L = 1 H =
3
H 0 H 1
Donde Li son el valor de número de empates de un rango
3
3
3
3
3
− (2 −2)+(2 −2)+(2 −412)+−(412 −2)+(2 −2)+(2 −2) = 0, 99 3
12 66049 154056,25 + 43890,25 ) 41·42 ( 15 + 11 15
·
≤
H H a H > H a
0,99
− 3 · (41 + 1) = 1480,99,67 − 126 == 24, 17
Como 24, 17 > 5, 99 se acepta H 1 con una α = 0, 005
Problema 7.17.
En un estudio sobre el hábito de fumar y sus efectos sobre las pautas del sueño, una de las variables importantes es el tiempo que se tarda en quedarse dormido. Se extrae una muestra de tamaño 12 de la población de fumadores, y otra independiente de tamaño 15 de la población de no fumadores, obteniéndose los siguientes datos: Fumadores No Fumadores Fumad ores
69,3 28,6
56,0 25,1
22,1 26,4
47,6 34,9
53,2 29,8
48,1 28,4
23,2 38,5
13,8 30,2
52,7 30,6
34,4 31,8
60,2 41,6
43,8 21,1
36.0
37,9
13,9
(a) ¿Indican estos datos que los fumadores tienden a tardar más tiempo en quedarse dormido que los no fumadores? fumadores?
H 0 H 1
µ 0 = µ 1 µ 0 > µ 1
Se realiza el test de Wilcoxon. En primer lugar le damos una valor ordinal a nuestros datos: Fumadores Rango S No Fumadores Fumad ores Rango N
69,3 27 28,6 9
56 25 25,1 6
22,1 4 26,4 7
47,6 21 34,9 15
53,2 24 29,8 10
48,1 22 28,4 8
23,2 5 38,5 18
13,8 1 30,2 11
52,7 23 30,6 12
34,4 14 31,8 13
60,2 26 41,6 19
43,8 20 21,1 3
36,0 16
37,9 17
13,9 2
Nuestros valores estadísticos R1 y R2 son respectivamente: respectivamente:
R1 = 27 + 25 + 4 + 21 + 24 + 22 + 5 + 1 + 23 + 14 + 26 + 20 = 212 R2 = 9 + 6 + 7 + 15 + 10 + 8 + 18 + 11 + 12 + 13 + 19 + 3 + 16 + 17 + 2 = 166
Tomamos el valor estadísticos hallado, en este caso R1 y observamos en la tabla que el intervalo para una α = 0, 05 es [127;209 ] Por tanto, al no pertenecer al intervalo se acepta H 1 que afirma que los fumadores tienden a tardar más tiempo en quedarse dormido que los no fumadores.
Problema 7.18.
En un tratamiento tratamiento contra la hipertensión se seleccionaron seleccionaron 21 enfermos de características características similares. similares. A cada enfermo se le administró uno de los fármacos P, A, B, al azar, formando 3 grupos. El grupo P tomó placebo (fármaco inocuo) y los otros dos tomaron A y B respectivamente. Para valorar la eficacia de los tratamientos, se registró el descenso de la presión diastólica desde el estado basal (inicio del tratamiento) hasta el estado al cabo de una semana de tratamiento. Los resultados fueron:
Manuel Angel Barea Gómez
152
CAPÍTULO CAPÍTULO 7. CONTRASTES CONTRASTES DE HIPÓTESIS HIPÓTESIS NO PARAMÉTRICOS ARAMÉTRICOS
(a) Suponiendo Suponiendo que los datos anteriores anteriores no son normales, normales, ¿Puede afirmarse afirmarse que los niveles niveles de oxígeno oxígeno son distintos para ambos sexos?
H 0 H 1
µ 0 = µ 1 µ 0 = µ 1
Se realiza el test de Wilcoxon. En primer lugar le damos una valor ordinal a nuestros datos: Mujeres Rango M Hombre Rango H
61 1, 5 63 4
73 15 67 6,5
67 6, 5 62 3
70 12,5 79 17
70 12,5 65 5
75 16 68 8, 5
69 10,5 68 8, 5
69 10, 5 61 1,5
71 14
Nuestros valores estadísticos R1 y R2 son respectivamente: respectivamente:
R1 = 1, 5 + 15 + 6, 5 + 12, 5 + 12, 5 + 16 + 10, 5 + 10, 5 + 14 = 99 R2 = 4 + 6, 5 + 3 + 17 + 5 + 8, 5 + 8, 5 + 1, 5 = 54
Tomamos el valor estadísticos hallado más pequeños, p equeños, en este caso R2 y observamos en la tabla que el intervalo para una α = 0, 01 es [45;99] Por tanto, al pertenecer al intervalo se acepta H 0 que indica que los niveles de oxigeno no son distintos para ambos sexos.
Manuel Angel Barea Gómez
154