4.1
INTRODUCCION
En el capitulo anterior se presentaron los conceptos basicos de probabilidad y los metodos para ca1cular la probabilidad de un eventQ. En este capitulo se amplla,n estos conceptos y se exploran form as para calcular las probabilidades de un evento bajo condiciones un poco mas complicadas. En este capitulo se estudian las relaciones entre los valores de la variable aleatoria y las probabilidades de que su ocurrencia pueda resumirse por medio de un mecanismo Hamado dislt"ibuci6n de probabilidad. La distribucion de probabilidad se puede expresar forma de tabla, grafica 0 formula. Conocer la distribucion de probabilidades para la variable aleatoria proporciona al medico y al investigador herramientas podero sas para simplificar y describir un conjunto de datos, y para llegar a conclusiones acerca de la poblacion de datos sobre la base de una muestra de datos extraidos de lapoblacion.
4.2 DISTRIBUCION DE PROBABllIDAD DE VARIABLES DISCRETAS Para iniciar el estudio de las distribuciones de probabilidad, se cbnsidera en primer lugar la distribucion de probabilidad de una variable discreta, ·la cual se define comosigue:
83
CAPITULO 4
DISTRIBUCIONES DE PROBABILIDAD
DEFINICION La distribucion de probabilidad de una variable aleatoria discreta es una tabla, unagratica, una fannula u otro sistelDa utilizado para especificar todos losvalores posibles de una variable aleatoria discreta junto con sus probabilidades respectivas. EJEMPLO 4.2.1
- - - - - ..
En un articulo de la revistaAmericanJournal o/Obstetrics and Gynecology, Buitendijk y Bracken (A-I) aseguran que durante 25 afios se ha tornado mayor conciencia de los efectos potencialmente dafiinos de los medicamentos y quimicos en el desarrollo de los fetos. En una poblaci6n de mujeres dadas de alta en maternidad, en un hospital del este de EUA, entre 1980 y 1982, los autores valoraron y estudiaron la asociaci6n del uso d~ medicamentos con varias caracteristicas de la madre, por ejemplo uso de alcohol, tabaco y adicci6n a farmacos. Sus hallazgos sugieren quela
TABIA4.2.1
Prevalencia del medicmnentos prescritos y no prescritos durante el embarazo enUelllujeres dadas de alta depues del parto en un hospital del este de EUA CODSUIDO de
·N6mero de medicamentos
o 1
1425
1351
2
793
3 4 5 6 7 8
348
156
58
28
15
6
9 10
12
Total
Frecuencia
3
Simone Buitendijk y Michael B. Brac ken, "Medication in Early Pregnancy: Prevalence of Use and Relationship to Maternal Characte ristics", AmericanJournal ofObstetrics and Gyneco logy, 165,33-40.. FUENTE:
4185
mujer que muestra un comportamiento mas propenso a correr riesgos durante e1 embarazo, tambien esta mas propensa a utilizar medicamentos durante el mismo. La tabla 4.2.1 muestra la prevalencia del consurno de medicamentos prescritos y no prescritos durante el embarazo entre las mujeres estudiadas.
--~
4.2
DISTRIBUCION DE PRQBABILIDAD DE VARIABLES DISCRETAS
85
TABlA 4.2.2 Distribucion de probabilldad del nUrnero de medicamentos consumidos con y sin prescripcion durante el embarazo entre las mujeres desClitas en el ejemplo 4.2. t Numero de medicamentos (x)
0 I
2 3 4 5 6 7 8 9 10 12 Total
P(X
= x)
.3405 .3228 .1895 .0832 .0373 .0139 .0067 .0036 .0014 .0007 .0002 .0002 1.0000
Se pretende construir la distribuci6n de probabilidad de la variable discreta X, donde X = nurnero de rnedicarnentos prescritos y no prescritos consurnidos por los individuos estudiados. Soluci6n: Los valores de X son XI = 0, x 2 1, ... , XlI = lOy X 12 = 12. Se calculan las probabilidades para estos valores dividiendo sus respectivas frecuencias entre el total, 4185. Asl, porejemplo. P(X x) = 1425/4185 = .3405. EI resultado se rnuestra en la tabla 4.2.2 que representa la distribuci6n de probabilidades deseada. • Altemativarnente. se puede presentar esta distribuci6n de probabilidad en forma grafica, como en la figura 4.2.1. En dicha figura, la longitud de cada barra vertical indica la probabilidad para el valor correspondiente de x. En la tabla 4.2.2 se observa que los valores de P(X = x) son todos positivos. rnenores que 1. y la surna de los rnismos es igual a 1. Estas no son caracterfsticas particulares de este ejernplo, sino que son caracterfsticas para todas las distribu ciones de probabilidad de variable discreta. Por 10 tanto, se dan las siguientes propiedades indispensables en una distribuci6n de probabilidad para una varia ble discreta:
1) 0.::;; P(X = x).::;; 1
2)
LP(X= x) = 1
86
CAPiTULO 4DISTRIBUCIONES DE PROBABILIDAD'
.35 .34
.33 .32
.31 .30
.29 .28
.27 .26
.25 .24 .23 .22
.21
.20 "0
,19
'" .18 J,l
:0
~ .17 .16
a:
,15
.14 .13 .12 .11
.10 .09 .08
.07 .06 .05 .04 " .03
.02 ,01
o
2
3
4 x (numero de medicamentos)
FIG,URA 4.2.1 tabla 4.2.1.
Representaci6n grafica de la distribuci6n de probabilidad de la
Tambien se observa que cada una de las probabilidades de la tabla 4.2.2 es la
frecuencia relativa de ocurrencia de cada valor de X. Cuando se tiene disponible la distribuci6n de probabilidad, es posible hacer afir maciones acerca de la variable aleatoria X. Se muestra con los siguientes ejemplos.
4.2
DISTRIBUCI6N DE PROBABILIDAD DE VARIABLES DISCRETAS
87
EJEMPLO 4.2.2 . . ~
.
.
~Cual
esla probabilipad d~ ,que una mujer seleq:ionada aleatoriamente sea una de las que consumieron tres medicamentos con 0 sin .prescripci6n? Solucion: Se puede escribir la probabilidad deseada comoP(X = 3). En la tabla • 4.2.2 se puede ver que la respuesta es .0832. EJEMPLO 4.2.3 ~Cual es la probabilidad de que una mujer seleccionada aleatoriamente haya con sumido uno 0 dos medicamentos?
Solucion: Para responder a la pregunta, se utiliza la regIa de adici6n para eventos mutuamente excluyentes. Mediante el uso de la notaci6n de probabili dad y los resultados de la tabla 4.2.21a respuesta se escribe como P(l u 2) P(l) + P(2) .3228 + .1895 = .5123.. •
lJiStrihuciOlles acumulqdas. AIgunas veces es mas conveniente trab~jar con la distribuci6n de probabilidad acumulada de una variable aleatoria. La distribuci6n de probabilidadacumuladaparala variable discreta cuya distribuci6n de probabilidad esta dada en la tabla 4.2.2 puede obtenerse sum'ando sucesivamente las probabili dades, P(X = x), que aparecen en la ultima columna. La probabilidad acumulada para Xi se escribe como F(x) P(X:<;; x). Estoda la probabilidad de que X sea menor o igual a un valor espedfico xi' La distribuci6n de probabilidad acumulada resultante se muestra en la tabla 4.2.3. La grafica de la distribuci6n de probabilidad acumuladase muestra en la figura 4.2.2. A una grafica de este tipo se Ie llama ojiva. La grafica de F(x) consiste solamente en las lineas horizontales. Las lfneas verticales s610 Ie dan una aparien cia conectada. La longitud de cada linea vertical representa la misma probabilidad que la de la linea correspondiente en la figura 4.2.1. Por ejemplo, la longitud de la lfnea vertical en X 3 de la figura 4.2.2 representa la misma probabilidad que la longitud de la linea levantada en X 3 de la figura 4.2.1, 0 .0832 en la escala vertical. AI consultar la distribuci6n de probabilidad acumulada es posible responder rapidamente a las preguntas de los ejemplos siguientes: . EJEMPLO 4.2.4 ~Cual es la probabilidad de que una mujer seleccionada aleatoriamente sea una de las que consumieron dos 0 menos medicamentos?
. Solucion: La probahilidad buscadase puede locaJizar directamente en la tabla 4.2.3, en ellado opuesto a x = 2, donde se observa que es .8528. Es decir, P(x :<;; 2) = .8528. Tambien se puede localizar la respuesta examinando la figura 4.2.2 y determinando la altura de la grafica (medida sobre el eje • vertical) arriba .del.valor de:J!: = 2.
88
CAPITULO 4
DISTRIBUCIONES DE PROBABILIDAD
TABlA 4.2.3 Distribucion de probabilidad acumulada del numero de medicamentos con y sin prescripcion utilizados durante el embann:o entre las mujeres descritas en el ejetUplo 4.2.1 Numero de medicamentos (x)
Frecuencia acumulada P(X:'; 2)
o
.3405 .6633
1
.8528 .9360
2 3 4
.9733 .9872
5
.9939 .9975 .9989
6
7 8
.9996 .9998
9
10 12
1.0000
1.00 .95 .90 .85 .80 .75 .70 .65 .60 .55 ~
r....
.50 .45 .40 .35 .30 .25 .20 .15 .10 .05
o
2
3
4
5
7
8
9
10
11
12
x (numero de medicamenlos)
FIGURA 4.2.2 Distribuci6n deprobabilidad acumulada del numero de medicamentos con 0 sin prescripci6n utilizados durante el embaraZo entre las mujeres descritas en el ejemplo 4.2.1.
4.3
DISTRIBUCION BINOMIAL
39
EJEMPIJO 4.2.5 ~GuaJ. es la probabilidad de que una mujer seleccionada aleatoriamente sea una de las que, consumieron menos de dos medicamentos?
SoIudon:Puesto que una mujer que consumio menos de dos medicamentos indica que consumio uno 0 ninguno, la respuesta es la probabilidad acumulada para 1, esdecir, P(x < 2) = P(x S 1) == .6633. •
EJEMPLO 4.2.6 ~Guales la probabilidad de que una mujer seleccionada aleatoriamente haya con sumido cinco 0 mas medicamentos?
Soludon: Para encontrar la respuesta se utiliza el conceptode probabilidad com plementaria. EI conjunto de mujeres que consumen cinco 0 mas medi c<:l.mentos es el complemento del conjllllto de mujeres que consumen menos de cinco (es decir, cuatro 0 menos). La suma de las probabilida des asociadas coneste conjunto es igual a 1. Esta relacion escrita en notacion de probabilidad es P(x 2 5) + P(x s ,4) == 1. Por 10 tanto, P(x 2 5) = 1 - P(x s 4) = 1- .9733 = .0267. •
EJEIUPLO 4.2.7 ~Gual es la probabilidad de que una mujer seleccionada aleatoriamente sea una de las que consumieron entre tres y cinco medicamentos, inclusive?
Soludon: P(x s 5) = .9872 es la probabilidad de que una mujer haya consumido entre cero y 5 medicamentos, inclusive. Para obtener la probabilidad de entre 3 y 5, se resta de .9872 la probabilidad de 2 0 menos. La respuesta escrita en notacion de probabilidad queda como: P(3 S x s 5) P(x s 5) - P(x s 2) = .9872 - .8528 = .1344. • La distribuci6n de probabilidad dada en la tabla 4.2.1 esta desarrollada a partir de la experiencia real, asi que de encontrar otra variable siguiendo esta distributi6n , seria s6lo por casualidad. Sin embargo, las distribuciones de probabilidad de mu chas variables de interes pueden determinarse 0 asumirse sobre la base de conside raciones te6ricas. En las siguientes secciones, se estudian con detall,e tres de estas distribuciones te6ricas de probabilidad: binomial, Poisson y normal.
4.3
DISTRIBUCION BINOMIAL La distribuciOn binomial es una de las distribuciones utilizadas mas ampliamente en estadistica aplicada. La distribuci6n se deriva de llll procedimiento conocido como ensayo de Bernoulli, nombrado as! en honor del matematico suizo James Bernoulli (1654-1705), quien realiz6 contribuciones importantes en el campo de la probabi lidad, induyehdo, particularmente, la distribucion binomial. Guanda en un proce so aleatorio 0 experimento, llamado ensayo, puedeocurrir solo uno de dos resultados mutuamente excluyentes, como vida 0 muerte, enfermo 0 sano, masculino 0 feme nino, el ensayo se llama ensayo de Bernoulli.
90
CAPITULO 4
DISTRIBUCIONES DE PROBABILIDAD
Proceso de Bernoulli Una secuencia de ensayos deB-ernoulli forma un proce so de Bernoulli, si se cumplen las siguientes condiciones: 1. En cada ensayo ocurre uno de dos posibles resultados, IIiuWamente excluyentes. Uno delos posibles resultados.se.denota (arbitrariamente) como un exito y el otro., como fracaso. ," " 2. La probabilidad de un exito, denotado porp, permanece constante de un ensayo a otro, y la probabilidad de fracaso, 1 - p, se denota con q. 3. Los ensayos son independientes, es decir, el resultado de alglin ensayo en particular no es afectado por el resultado de cualquier otro ensayo. EJEMPLO 4.3.1
Se desea calcular la probabilidadde x exitos en n ensayos de Bernoulli. Por ejem plo, suponga que en cierta poblacion 52 por ciento de todos los nacimientos que se registraron son varones. La interpretacion de esto es que la probabilidad del naci miento de un varon registrado es de .52. Si aleatoriamente se escogen cinco regis tros de nacimiento dentro de esa poblacion, ~cual es la probabilidad de que exactamente tres de ellos pertenezcan a varones? Solucion: Designe la ocurrencia de un registro para el nacimiento de un varon como "exito", y se aclara que esta es una designaciori arbitraria con fines de claridad y conveniencia y no refleja ninguna opinion respecto a la preferencia relativa del nacimiento de varones frente a m:ujeres. La ocu rrencia de un registro de nacimiento para un varon se designa como exito, puesto que 10 que se busca son registros de nacimientos de varo nes. Sise buscasen registros denacimientos de mujeres, estos sedan de signados como exitos, y el registro de nacimientos de varones sedan designados como fracasos. . Tambien es conveniente asignar el numero 1 a un exito (registro del nacimiento de un varon) y un 0 para un fracasb (registro de naci miento de una mujer). El proceso que finalmente resulta en un registro de nacimiento se considera como un proceso de Bernoulli. Suponga que, de los cinco registros de nacimiento seleccionados, resulta esta secuencia de sexos: VMVVM
En forma codificada se escribe de la siguiente forma: . .
.
10110 Puesto que la probabilidad de un exito .~e denota con pyla probabi lidad de un fracaso se denota con q, la probabilidad dela secuencia de los resultados anteriQres se calcula por medio de la regIa de multiplicacion:
P(l, 0; 1; 1, 0)
= pqppq = q2p3
4.3
DISTRIBUCION BINOMIAL
91
La regia de lamultiplicacion resulta adecuada para calcular esta proba bilidad, puesto que sebusca la probabilidad de un varon, una mujer, un varon, un varon y una mujer, en ese orden. En otras palabras, se requie re la probabilidad conjunta de cinco eventos. Por razones de sencillez, se utili zan las comas en lugar de la notacion de interseccion, para separar 10s resultados de los eventos en la expresion de la probabilidad . .La probabilidad resultante es la de obtener la secuencia espedfica en el orden en que se muestran. Sin embargo, el interes no esta en el orden de ocurrencia de los registros. del nacimiento de varones y muje res, sino, como .se ha manifestado previamente, en la probabilidad de ocurrencia exacta de tres registros de nacimiento de varones de entre cinco registros seleccionados aleatoriamente"En lugar de ocurrir en la secuencia mostrada con anterioridad (secuencia numero I), los tres exi tos y dos fracasos pueden ocurrir tambien en alguna de las secuencias adicionales dadas en la tabla adjunta. Numero 2 3 4
5 6 7 8 9 10
Secuencia
11100 10011 11010 11001 10101. 01110 00111 01011 01101
Cada una de estas secuencias tiene la misma probabilidad de ocu rrir yes igual a q2p3, probabilidad calculada para laprimera secuencia mencionada. Cuando se extrae una sola muestra de cinco elementos a partir de una poblacion espedfica, solo se obtiene una secuencia de exitos 0 fra casos. La pregunta, ahora, es: ,cual es la probabilidad de obtener la secuencia numero 1; la secuencia numero 2 ... 0 la secuencia numero 10? Con la regIa de adicion se sabe que esta probabilidad es igual a la suma de las probabilidades individuales. En este ejemplo se requiere sumar las 10 q2p3, 10 que equivale a multiplicar q2p3 por 10. Ahora se puede responder a la pregunta original: ~cual es la probabilidad de observar tres exitos (registros de nacimiento de un varon) y dos fracasos (registros de nacimiento de una mujer) en la muestra aleatoria de 5 elementos extrafda de la poblacion especificada? Puesto que en Ia poblacion, p = .52 Yq = (l - P) (1 - .52) .48, la respuesta a la pregunta es: 10(.48)2(.52)310(.2304)(.140608)
.32
•
92
CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD
Uso de la combinaci6n como procedimiento en maestros grandes Facilmente se puede anticipar que hacer una lista del numero de secuencias se hace mas y mas diffcil y tedioso segtin crece el tamano de la muestra, por 10 cual es necesario un metodo sencillo para contar el numero de secuencias. Este meto do es proporcionado por la formula de conteo que permite determinar rapida mente cuantos subcoIYuntos de objetos pueden formarse cuando en diferentes subconjuntos se utili zan numeros de objetos que componen el conjunto del cual se extraen. Cuando el orden de los objetos dentro de un subconjunto es inmaterial, el subconjunto se llama combinacion de objetos. Si un conjunto consta de n objetos y se pretende formar un subconjunto de x objetos, sin ver el orden de los objetos dentro del subconjunto, el resultado se llama combinaci6n. Por ejemplo, se define la combinacion como sigue cuando la combinacion se forma tomando x objetos de un conjunto de n objetos: DEFINICION Una cornbinaci6n de n objetos tornados x a la vez es un subconjunto desordenado de x de los n objetos.
EI numero de combinaciones de n objetos que imeden formarse tomando x a la vez esta dado por: n! .GN = - - - x!(n-x)!
(4.3.1)
donde: x!, que se lee x factorial, es el producto de todos los numeros enteros de x hasta 1. Es decir, xl = x(x - l)(x 2) ... (1). Observe que, por definicion, 01 1. En el ejemplo se tiene una muestra de n = 5 nacimientos y se tiene inten~s en encontrar la probabilidad de que tres de elIos sean nadmientos de varones. EI numero de secuencias para el ejemplo se caIcula con la ecuacion 4.3.1 como sigue: 120
10 12 En el ejemplo, x = 3 es el numero de exitos, as! que n - x 2 representa el numero de fracasos. Luegose escribe la probabilidad de obtener exactamente x exitos en n ensayos:
=
j(x) nGxqn-xpx = nG/jrqn-N para x = 0, 1, 2, ... , n = 0, en caso contrario
P(X
(4.3.2)
A esta expresion se Ie llama distribudon binomial. En la ecuacion 4.3.2fix) donde X es la variable aleatoria, el numero de exitos es n ensayos. Se
= x),
4.3
TABlA 4.3.1 binomial
1 2
93
Distribucion
Numero de exitos, x
o
DISTRIBUCION BINOMIAL
Probabilidad, f(x)
"Coq"-0pO "C1qn-lpl
nC2qn-2p2
x n 1
Total
utilizaj{x) en Iugar de P(X x) porque es muy compacta y porque es de uso casi universal. La distribuci6n binomial se puede presentar en forma tabular como se mues tra en la tabla 4.3.1. Se establece que Ia ecuacion 4.3.2 es una distribuci6n de probabilidad al mostrar 10 siguiente: 1. j{x) ~ 0 para todos los valores reales de x. Esto proviene del hecho de que n y p no son nfuneros negativos, por 10 que n ex' px y (1- p)" -xtampoco 10 son, por 10 tanto sus productos son mayores 0 iguales a cero.
= 1. Esto se considera cierto al reconocer que 2.,,,Cxq" -x px es igual a [(1 + p]" = I" = 1, que es la expresi6n binomial familiar. Si el binomio (q + p)n
2. 2.,j{x) p)
es desarrollado se tiene:
+ ... + nql pn-l + pn Si los terminos de la expansion son comparados, termino a termino, con los fix) de la tabla 4.3.1 se aprecia que son equivalentes, termino a termino, porque: f(O):::: "c~n-O pO f{l):::: n C 1q"-l. pt ::::nqn-lpl n(n
2
1)
94
CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD
FJEJ\tIPLO 4.3.2
Otro ejemplo del uso de la distribucion binomial. Suponga que se sabe que 30 por ciento de cierta poblacion es inmune a alguna enfermedad. Si se escoge una mues tra aleatoria de 10 elementos de entre esta poblacion, ~cu
= IOC4 (.7)6(.3)4 = 10!
(.1l7649)(.0081)
416! =.2001
•
Tabla binomial El calculo de una probabilidad empleando la ecuacion 4.3.1 puede ser una labor tediosa si el tamafio de la muestra es grande. Por fortuna, las probabilidades para diferentes valores de n, pyx ya estan tabuladas, por 10 que solo es necesario consultar la tabla conveniente para obtener la probabilidad de seada. La tabla B del apendice es una de muchas tab las disponibles. Dicha tabla presenta la probabilidad de que x sea menor 0 igual a alglin valor espedfico. Es decir, la tabla presenta las probabilidades acumul~tivas desde x = 0 hasta alglin numero positivo especffico de exitos. El uso de la tabla se muestra utilizando el ejemplo 4.3.2, en el que se requiere calcular la probabilidad de x = 4 cuando n 10 y P=.3. De acuerdo con el estudio de la distribticion de probabilidad acumulada de la seccion anterior, se sabe que P(x 4) puede calcularse restando P(X ~ 3) de P(X ~ 4). Si en la tabla B se localiza a p .3 para n = 10, se encuentra que P(X ~ 4) .8497 y P(X ~ 3) = .6496. La resta del primero menos el segundo es igual a .8497 .6496 = .2001, 10 cual coincide con el calculo manual. Con frecuencia el interes radica no solo en determinar las probabilidades para valores especfficos de X, sino para intervalos donde la probabilidad de X este entre, digamos, 5 y 10. Con el siguiente ejemplo se muestra 10 anterior:
r\JEJ\tIPLO 4.3.3
Suponga que se sabe que en cierta poblacion 10 por ciento es daltonica. Si se extrae una muestra aleatoria de 25 personas de esa poblacion, con la tabla B del apendice, encuentre la probabilidad de que: a) Existan cinco
0
menos daltonicos.
Solucion: La probabilidad esta en una de las entradas de la tabla. Sin la necesidad de sumar ni res tar, la probabilidad P(X ~ 5) = .9666. b) Existan seis 0 mas daltonicos. Soluci6n: Esta probabilidad no se puede encontrar directamente en la tabla. Para encontrar la respuesta, se utiliza el concepto de probabilidades comple mentarias. La probabilidad de que existan seis 0 mas daltonicos es el
95
4.3DISTRIBUCION BINOMIAL
complemento de la probabilidad de que, existan cinco 0 menos. Es decir, este conjunto es el complemento del conjunto especificado en el inciso a; por 10 tanto: ' 1 - P(X::; 5) == I
P(X?:.
.9666
.0334
c) Existan entre seis y nueve daltonicos, inclusive.
Soludon: Esta probabilidad se encuentra restando la probabilidad de que X sea me nor 0 igual a 5 de la probabilidad de que X sea mayor 0 igual a 9. Es decir: , P(6::; X::; 9) d) Existandos, tres
0
P(X::; 9) - P(X::; 5)
.9999
.9666
.0333
cuatro daltonicos:
Soludou:' Esta es la probabilidad de que X este entre 2 y 4, inclusive. P(X::; X::; 4)
P(X::; 4)-P(X::; 1)
.9020-.2712
=
.6308
•
Ulilizar la labia B cuando p > .5 La tabla B no da las probabilidades para valores de p mayores a .5. Sin embargo, pueden obtenerse las probabilidades a partir de la tabla B replanteando el problema en terminos de probabilidad de fra caso, I -p, en lugar de en terminos de probabilidadde exito p. Como parte del r:ep~antt::amiento, se debe pensar, tambien, en terrninos del numero de fracasos, n x, mas que en terrninos de exitos x. Esta idea se resume de lasiguiente manera: P(X
xln,p> .50)
= P(X
n-xln,I-p)
(4.3.3)
Puesta en palabras, la ecuacion 4.3.3 dice que: "La probabilidad de que X sea igual a algu.n valor especffico dado el tamano de la muestra y una probabilidad mayor que .5, es igual ala probabilidad de que X sea igual a n ~ x dado el tamano de la muestra y la probabilidad de un fracaso I-p". Con la finalidad de utilizar la tabla binomial, la probabilidad de un fracaso se trato como la probabilidad de un exito. _Cuando pes mayor que .5, las probabilidades acumuladas pueden obtenerse a par tir de la tabla B empleando la siguiente relacion: P(X::; x In, p > .5)
= P(X ?:. n -
x In, 1 - p)
(4.3.4)
Finalmente, al utilizar la tabla B para calcular la probabilidad de que X sea mayor 0 igual a alguna x cuando P > .5, se utiliza la siguiente relacion: P(X?:. xln,p > .5)
P(X::; n-xln, I-P)
(4.3.5)
E,JEMPLO 4.3.4
Encierta comunidad, en una tarde dada, en 85 por cientode las farnilias, alguno de los miembros esta en casa. Un equipo de investigacion sanitaria selecdona una muestra aleatoria de 12 familias para realizaruna encuesta via telefonica. Con la tabla B, calcule la probabilidad de que:
96
CAPITUL04 DISTRIBUCIONES DE PROBABILIDAD
a) EI equipo encuentre a alguien en casa en 7 familias exactamente. Soluci6n: EI replanteamiento del problema es como sigue: Si en 15 por ciento de las familias no hay nadie en casa, ~cua:l es la probabilidad de que el equipo que realiza la encuesta no obtenga respuesta en 5 de 12 llama das? La respuesta se calcula como sigue: 15)
P(X = 51n= 12,
P(Xs 5)-P(Xs 4)
=.9954 - .9761 b) EI equipo encuentre a alguien en casa en 5 familias
0
.0193
menos.
Soluci6n: La probabilidad que se busca es: P(X S 51n = 12,p =.85) = P(X 212 51n = 12,p =.15) P(X271n 12,p .15) = 1 P(Xs 61n 12,p =.15)
= 1-
.9993
.0007
c) EI equipo encuentre a alguien en casa en 80 mas familias. . ,
Soluci6n: La probabilidad que se busca es:
= 12,p
P(X 2 81n
=.85)
= P(X S
41n
= 12,p =.15) =
.9761
•
La figura 4.3.1 muestra una representaci6n visual de la soluci6n para los tres incisos del ejemplo 4.3.4. N6mero posible de exitos (alguien en casal = x P(JtxITo)
= .85
Inciso b
Numero posible de fracasos (nadie en casal = n -x, P(FRACASO) .15
Condici6n de prohabilidad
=
~
5112,
.~5)
P(X ==
7112,
.85)
8112,
.85)
P(X
CD
Inciso c
®
P(X ~
12
P(X~
7112,
.15)
P(X ==
7112,
.15 )
p(X~4112,
.15)
6
6
Inciso a
11
Condici6n de probabilidad
®
0
Representaci6n esquematica de la soluci6n del ejemplo 4.3.4 (dentro de los 6valos se encuentra el numero relevantede exitos y fracasos en cada caso).
FIGURA 4.3.1
EJERCICIOS
Parameiros bilWmiales
97
La distribucion binomial dene dos parametros, n y
p. Son parametros en el sentido de que son suficientes para especificar una distri bucion binomial. La distribucion binomial es en realidad una familia de distribu ciones con cada uno de los valores posibles de n y p designando a un miembro diferente de la familia. La media y la variancia de la distribucion binomial son J.l = np y ()2 = np( 1 - P), respectivamente. La distribucion binomial, formalmente hablando, es aplicable en situaciones donde el muestreo se realiza a partir de una poblacion infinita 0 a partir de una poblacion fin ita con restitucion. Puesto que en la pnictica real las muestras son normalmente seleccionadas sin restitucion a partir de una poblacion finita, logica mente surge la pregunta respecto a la conveniencia de una distribucion binomial en estas cirrunstancias. La conveniencia del uso de esta distribucion depende de que tan drastico es el efecto de esas condiciones en la invariabilidad de p de un ensayo a otro. Normalmente se considera que ruando n es pequeno en relacion con N, el modelo binomial es aderuado. Algunos autores coinciden en que n es peque no en relacion con N si N es al menos 10 veces mas grande que n. Se dispone de muchos programas de softwareestadfstico para realizar los calculos de la probabilidad binomial en computadoras personales. Por ejemplo, MINITAB calcula las probabilidades individualmente 0 en forma acumulada para valores espedficos de x, n y p. Suponga que se pretende encontrar las probabili dades individuales desde x = 0 hasta x = 6 cuando n = 6 YP .3. Se meten los numeros desde 0 hasta 6 en la columna 1 y se procede como 10 muestra la figura 4.3.2. Si la pretension es encontrar las probabilidades acumuladas, se procede como en la figura 4.3.3.
FJERCICIOS
En cada uno de los siguientes ejercicios, suponga que N es suficientemente grande con rela ci6n any que es posible utilizar la distribuci6n binomial para calcular las probabilidades que se piden. 4.3.1 Sobre la base del amilisis de datos recolectados por el National Center for Health Statistics, Najjar y Rowland (A-2) informaron que 25.7 por ciento (redondear a 26 por ciento para prop6sitos del calculo) de personas adultas de EVA tienen sobrepeso. Si se extrae una mues tra aleatoria simple de 20 adultos, encuentre la probabilidad de que el numero de personas con sobrepeso, dentro de la muestra, sean: a) Exactamente tres personas b) Tres 0 mas personas
c) Menos de tres d) Entre tres y siete, inclusive
4.3.2 Consulte el ejercicio 4.3.1. ~Cuantos adultos con sobrepeso se espera encontrar en la mues tra de 20? 4.3.3 Consulte el ejercicio 4.3.1. Suponga que se extrae una muestra aleatoria simple de cinco adultos. Con la ecuaci6n 4.3.2 encuentre la probabilidad de que el numero de personas con sobrepeso en la muestra sea: a) Cero b) Mas de una
c) Entre uno y tres, inclusive d) Dos 0 menos
e) Cinco
98
CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD
Datos: C1: 0
1
2
3
4
5
6
Comandos de la sesi6n:
Caja de dialogo: Calc> Probability Distributions> Binomial
MTB > SUBC>
PDF C1; BINOMIAL
6
0.3.
Seleccionar Probability. Teclear 6 en Number of trials. Teclear 0.3 en Probability of success. Se leccionar Input column y teclear Cl. Clic OK.
Resultados: Probability Density Function Binomial with n = 6 and p
x 0.00 1.00 2.00 3.00 4.00 5.00 6.00
P(X
= 0.300000
= x)
0.1176 0.3025 0.3241 0.1852 0.0595 0.0102 0.0007
FIGURA 4.3.2
individual para x
Calculo efectuado por el paquete MINITAB de la probabilidad binomial 6 y P .3.
= 0 hasta x = 6, cuando n
4.3.4 Un informe del National Center for Health Statistics, bas ado en los datos de 1985, afirma que 30 por ciento de la poblaciDn adulta de EUA son fumadores (A-3). Considere una mues tra aleatoria simple de 15 adultos seleccionados en ese momento. Encuentre la probabilidad de que el numero de fumadores en la muestra sean: a) Tres b) Menos de cinco
c) Entre cinco y nueve, inclusive d) Mas de cinco, pero menos de 10
e) Seis 0 mas
4.3.5 Consulte el ejercicio 4.3.4 y encuentre la media y variancia del numero de fumadores en la muestra de tamafio 15. 4.3.6 En referencia al ejercicio 4.3.4, suponga que se toma una muestra aleatoria simple de 25 adultos hoy dia y se encuentra que dos son fumadores. tRace sospechar este resultado que el numero de fumadores ha disminuido desde 1985? iPor que sf 0 por que no?
99
EJERCICIOS
Datos: C1: 0
1
2
3
4
5
6
Caja de dialogo:
Comandos de la sesi6n:
Calc> Probability Distributions> Binomial
MTB > SUBC>
CDF C1; BINOMIAL
6
0 •3 •
Seleccionar Cumulative probability. Teclear 6 en Number of trials. Teclear 0.3 en Probability of success. Seleccionar Input column y .teclear CI. Clic OK
Resultados: Cumulative Distribution Function Binomial with n = 6 and p = 0.300000 x
0.00 1.00 2.00 3.00 4.00 5.00 6.00
P(X = x) 0.1176 0.4202 0.7443 0.9295 0.9891 0.9993 1.0000
FIGURA 4.3.3 Calculo efectuado por el paquete MINITAB de la probabilidad binomial acumulada para x = 0 hasta x = 6, cuando n = 6 YP = .3. 4.3.7 La probabiJidad de que una persona que sufre de migrana tenga alivio con un farmaco especffico es de-,9, Se seleccionan aleatoriamente a tres personas con migrana a las que se les administra el farmaco. Encuentre la probabilidad de que el numero de personas que logran alivio sean: a) Exactamente cero
b) Exactamente uno
c) Mas de uno
d) Dos 0 menos
e) Dos 0 tres
f) Exactamente tres
4.3.8 En una investigaci6n realizada entre estudiantes de enfermerfa aspirantes al grade de maes tria, 75 por ciento declararon que esperaban ser promovidos a un puesto mas alto un mes despues de obtener el grado, Si este porcentaje representa a toda la poblaci6n, encontrar, para una muestra de 15, la probabilidad de que el numero de personas que esperan una promoci6n un mes despues de obtener eI grado sean: a) Seis
b) AI menos siete
c) No mas de cinco
4.3.9 Dado el parametro binomial p = ,8 Yn en la tabla 4,3.1 que 'i,f(x) = 1.
d) Entre seis y nueve, inclusive
= 3, muestre mediante el desarrollo binomial dado
100
4.4
CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD
DISTRIBUCION DE POISSON La siguiente distribuci6n discreta a considerar es la distribuci6n de Poisson, Hamada asf en honor del matematico frances Simeon Denis Poisson (1781-1840), quien tiene amplio reconocimiento por la publicaci6n de su trabajo en 1837. Esta distri bud6n ha sido empleada extensamente en biologfa y medicina como modelo de probabilidad. Haight (1), en el capitulo 7 de sulibro, presenta un repertorio muy amplio de aplicaciones. Si x es el numero de ocurrencias de algiin evento aleatorio en un intervalo de espacio 0 tiempo (0 algiin volumen de materia), la probabilidad de que x ocurra es dada por e-l.'),,;
f(x)=--, x=0,1,2 ... (4.4.1 ) x! La letra griega A (lambda) es el parametro de la distribuci6n y es el numero promedio de ocurrencias del evento aleatorio dentro del intervalo (0 volumen). EI sfmbolo e, es la constante (con cuatro decimales) 2.7183. Se puede mostrar que fix) ~ 0 para cada x y que r x f (x) 1; por 10 tanto, la distribuci6n satisface los requerimientos para la distribuci6n de probabilidad. Proceso tk Poisson Como se ha visto, la distribuci6n binomial resuita de un conjunto de suposiciones acerca de un proceso impHcito para formar un conjunto de observaciones numericas. Lo mismo ocurre en el caso de la distribuci6n de Poisson. Las siguientes afirmaciones describen 10 que se conoce como proceso de Poisson. 1. Las ocurrencias de los eventos son independientes. La ocurrencia de un even
to en un intervalo l de espacio 0 tiempo no tiene efecto en la probabilidad de una segunda ocurrencia del evento en el mismo, 0 en algiin otro intervalo. 2. Te6ricamente, debe ser posible la ocurrencia de un evento en un numero infinito de veces dentro del intervalo. 3. La probabilidad de una sola ocurrencia del evento en un intervalo dado es proporcional a la dimensi6n del intervalo. 4. En cualquier fracci6n infinitesimal del intervalo, la probabilidad de mas de una ocurrencia del eVf"nto es insignificante. Una caracterfstica interesante de la distribuci6n de Poisson es que la media y la variancia son iguales. La distribuci6n de Poisson se emCuundo utilizur el modelo de Poisson plea cuando se cuentan los eventos 0 entidades, distribuidos al azar en espacio 0 tiempo. Es facil intuir cuando cierto proceso obedece a la ley de Poisson, y bajo esta suposici6n se puede calcular la ocurrencia de eventos 0 entidades en alguna unidad 1 Por comodidad, la distribuci6n de Poisson se estudia en terminos de intervalos, aunque tambien inter vienen otras unidades como volumen.
4.4
DISTRIBUCION DE POISSON
101
de espacio 0 tiempo. Por ejemplo, suponiendo que la distribuci6n de alglin parasi to entre miembros individuales huespedes sigue la ley de Poisson, y conociendo el parametro A, se puede calcular la probabilidad de que al seleccionar aleatoriamente un huesped individual este produzcax nfunero de parasitos. En el siguiente capitu lo se aprendera c6mo decidir si es recomendable suponer que un proceso especffi co obedece la ley de Poisson. Se consideran los siguientes ejemplos que muestran el uso de la distribuci6n de Poisson para el calculo de probabilidades: FJEMPLO 4.4.1
En un estudio de suicidas, Gibbons et al. (A-4) encontraron que la distribuci6n men sual de adolescentes suicidas en el condado de Cook, Illinois, entre 1977 y 1987 sigui6 una distribuci6n de Poisson con parametro A 2.75. Encuentre la probabili dad de que un mes seleccionado aleatoriamente sea uno en el que ocurri6 el suici dio de tres adolescentes. Solucion: Con la ecuaci6n 4.4.1 se encuentra que la respuesta es:
e- 2.75 2.75 3 (.063928)(20.796875) P(X=3)=:::: 3!
.221584
6
•
FJEMPLO 4.4.2
En referencia al ejemplo 4.4.1, suponga que eI suicidio futuro de adolescentes en la poblaci6n analizada seguira una distribuci6n de Poisson. ~Cual es la probabilidad de que un mes seleccionado aleatoriamente sea uno en eI que ocurriran tres 0 cuatro suicidios? Solucion: Puesto que los dos eventos son mutuamente exduyentes, se utiliza la regIa de la adici6n: e-2.75 2.75 4 P(X =3) +P(X = 4) = .221584+--
4!
.221584 + .152338 = .373922
•
En los ejemplos anteriores las probabilidades se evah1an directamente con la ecua ci6n. Sin embargo, se puede utilizar la tabla C del apendice; en ella se encuentran las probabilidades acumuladas para varios valores de A y X. FJEMPLO 4.4.3
Durante eI estudio de cierto organismo acuatico, se tom6 un gran numero de mues tras de una laguna, y se cont6 eI numero de organismos en cada muestra. EI nume ro promedio de organismos encontrados por muestra fue de dos. Suponga que el numero de organismos sigue una distribuci6n de Poisson, y calcule la probabilidad de que la pr6xima muestra que se tome tenga un organismo 0 menos. Solucion: En la tabla C se aprecia que cuando A = 2, la probabilidad de que X S; 1 es .406. Es decir, P(X S; 112) = .406. •.
102
CAPITULO 4
DISTRIBUCIONES DE PROBABILIDAD
E,JEMPLO 4.4.4
Consulte el ejemplo 4.4.3 y calcule la probabilidad de que la siguiente muestra tenga exactamente tres organismos. Solucion: P(X ~ 312)
P(X ~ 3) - P(X ~ 2)
•
.857 - .677 := .180
E,JEMPLO 4.4.5
Consulte el ejemplo 4.4.3 y encuentre la probabilidad de que la siguiente muestra tenga mas de cinco organismos. Solucion: Puesto que el conjunto de mas de cinco organismos no inc1uye cinco, la pregunta se refiere a la probabilidad de observar seis 0 mas organismos. La respuesta se obtiene al restar la probabilidad de observar cinco 0 me nos (organismos) de 1. Esto es: P(X> 512):= 1 P(X~ 5):= 1
•
.983:= .017
Datos: Cl: 0
1
2
3
4
5
6
Gaja de dialogo:
Comandos de la sesi6n:
Calc> Probability Distributions> Poisson
MTB > PDF Cl; SUBC> Poisson
.70.
Seleccionar Probability. Tec1ear .70 en Mean. Seleccionar Input column y teclear Cl. Clk OK. Resultados: Probability Density Function Poisson with mu x
0.00 1.00 2.00 3.00 4.00 5.00 6.00
=
0.700000
P(X = x) 0.4966 0.3476 0.1217 0.0284 0.0050 0.0007 0.0001 .FIGURA 4.4.1 Cileulo efectuado por el paquete MINITAB de la probabilidad de Poisson individual para x = 0 hasta x 6 y A, = .7.
103
EJERCICIOS
Muchos paquetes de software estadisticos calculan las probabilidades de Poisson, y para este prop6sito se utiliz6 el paquete MINITAB. Suponga que se quiere encon trar la probabilidad individual para x desde x 0 hasta x = 6, cuando 'A = .7. Se meten los datos de x en la columna 1 y se procede como se muestra en la figura 4.4.1. Se obtienen las probabilidades acumuladas para los mismos valores de x y A. como se muestra en la figura 4.4.2.
EJERCICIOS 4.4.1 Suponga que se sabe que en cierta area de una gran ciudad el numero promedio de ratas por manzana es de cinco. Suponga que el numero promedio de ratas sigue una distribuci6n de Poisson, y calcule la probabilidad de que en una manzana elegida aleatoriamente:
a) Existan exactamente cinco ratas.
b) Existan mas de cinco ratas.
c) Existan menos de cinco ratas.
d) Existan entre cinco y siete ratas, inclusive.
Datos: Cl: 0
1
2
3
4
5
6
Caja de dialogo:
Comandos de la sesi6n:
Calc> Probability Distributions>
Poisson
Seleccionar Cumulative probability. Teclear .70 en Mean. Seleccionar Input column y teclear Cl. Clic OK.
MTB > CDF Cl; Poisson SUBC>
.70.
Resultados: Probability Distribution Function Poisson with mu x
0.00 1.00 2.00 3.00 4.00 5.00 6.00
=
0.700000
P(X = x) 0.4966 0.8442 0.9659 0.9942 0.9992 0.9999 1.0000 FIGURA 4.4.2 Calculo efectuado par el paquete MINITAB de la probabilidad de Poisson acumulada para x = 0 hasta x 6 y Ie = .7.
104
CAPiTULO 4
DISTRIBUCIONES DE PROBABILIDAD
4.4.2 Suponga que en un periodo de varios aftos el nfunero promedio de muertes por cierta enfer medad no contagiosa es de 10. Si el numero de muertes por esa enfermedad sigue la distri buci6n de Poisson, emil es la probabilidad de que durante el ano en curso: Exactamente siete personas mueran por esa enfermedad b) Diez 0 mas personas mueran por esa enfermedad c) No haya muertes por esa enfermedad a)
4.4.3 Si el numero promedio de accidentes graves por ano en una fibrica grande (donde el nfunero de empleados es constante) es de cinco, calcule la probabilidad de que en el ano en curso haya: a) Exactamente siete accidentes
b) Diez 0 mas accidentes
c) Cero accidentes
d) Menos de cinco accidentes
4.4.4 En un estudio sobre a la efectividad de un insecticida contra cierto insecto, se fumig6 una gran area de tierra que, mas tarde, se examin6 por cuadrantes elegidos aleatoriamente y en la que se cont6 el numero de insectos vivos por secci6n. Experiencias previas han demostra do que el numero promedio de insectos vivos por cuadrante, despues de fumigar, es de .5. Si el numero de insectos vivos por secci6n sigue una distribuci6n de Poisson, emil es la probabi lidad de que cierto cuadrante elegido tenga: a)
b) Cero insectos vivos
Exactamente un insecto vivo
c) Exactamente cuatro insectos vivos
d) Uno 0 mas insectos vivos
4.4.5 En cierta poblaci6n, cada ano se diagnostica un promedio de 13 nuevos casos de cancer esofagico. Si la incidencia anual de este tipo de cancer sigue una distribuci6n de Poisson, calcule la probabilidad de que en un ano determinado el numero de nuevos casos diagnosti cados de cancer sea: Exactamente 10 c) No mas de 12
a)
b) AI menos ocho
d) Entre nueve y IS, inclusive
e) Menos de siete
4.5 DISmmUCIONES DE PROBABHIDAD CONTINUA Las distribuciones de probabilidad consideradas hasta aqui, binomial y de Poisson, son distribuciones de variable discreta. Ahora se consideran las distribuciones de variable aleatoria continua. En el capitulo 1 se dijo que una variable continua es aquella que puede asumir cualquier valor en un intervalo espedfico de valores. Consecuentemente, entre cualesquiera dos valores asumidos por la variable conti nua existe un m1mero infinito de valores. Para comprender, la naturaleza de la distribuci6n de una variable aleatoria continua, considere los datos presentados en la tabla 1.4.1 yen la figura 2.3.2. En la tabla hay 169 valores para la variable aleatoria edad. EI histograma de la figura 2.3.2 esta construido con puntos espedficos localizados sobre una linea, que repre senta la medici6n de interes y que forma una serie de rectangulos, cuyas bases son las distancias entre dos puntos espedficos, sobre la linea y cuyas alturas representan el numero de val ores de la variable que caen entre los dos puntos especificados. Los intervalos delimitados por cualquier par de puntos especificados consecutivos se llaman intervalos de clase.
4.5
105
DISTRIBUCIONES DE PROBABILIDAD CONTINUA
fIx)
x
FIGURA 4.5.1 Histograma resultante de un gran numero de valo res y c1ases de intervalos pequenos.
Como se estudi6 en el capitulo 2, las subareas del histograma corresponden a las frecuencias de ocurrencia de los valores de la variable entre los lfmites de la esc ala horizontal de esas subareas. Esto proporciona un metodo para calcular la frecuen cia relativa de ocurrencia de valores entre dos puntos especfficos; tan s610 es nece sario determinar la proporci6n del area total del histograma que se encuentra entre los puntos especificados. Esto se puede hacer mas convenientemente consultando las columnas de frecuencia relativa 0 frecuencia relativa acumulada en la tabla 2.3.2. Imagine ahora una situaci6n donde el numero de valores de la variable aleatoria es muy grande y la amplitud de los intervalos de clase es muy pequefia. EI histograma resultante seria como el que se muestra en la figura 4.5.1. Si se conectan los puntos medios de las celdas del histograma en la figura 4.5.1 para formar un poligono de frecuencia, se obtendra una figura mas suave que el polfgono de frecuencia de la figura 2.3.4. En general, cuanto mas se aproximan a infinito el numero de n observacio nes, y la amplitud de los intervalos de clase se aproximan acero, el polfgono de frecuencia se aproxima a una curva mas suave como la que se muestra en la figura 4.5.2. Estas curvas suaves se utili zan para representar gnlficamente las distribucio fIx)
FIGURA 4.5.2
Representaci6n grafica de una distribuci6n continua.
106
CAPiTULO 4
DISTRIBUCIONES DE PROBABILIDAD
fIx)
a x FIGURA 4.5.3 Gratica de una distribuci6n continua que muestra el area entre a y b.
nes de las variables aleatorias continuas. Esto tiene algunas consecuencias imp or tantes cuando se trabaja con distribuciones de probabilidad. Primero, el area total bajo la curva es igual a uno, como 10 es para el histograma, y la frecuencia relativa de ocurrencia de los valores entre dos puntos especfficos cualesquiera, sobre el eje de las x, es igual al area total delimitada por la curva, el eje de las x y las rectas perpen diculares levantadas sobre ambos puntos del eje de las x, tal como 10 muestra la figura 4.5.3. La probabilidad de cualquier valor especifico de la variable aleatoria es cera. Esto es logico, puesto que un valor especffico se representa como un punto sobre el eje de las x y el area por encima de ese punto es cero. COIRO encontrar el area bajo la curva En un histograma, seg(tn se ha visto, las subareas de interes se calculan sumando areas representadas por las co lumnas (celdas). En el caso de una curva, esta no presenta celdas, por 10 que se debe buscar un metodo para calcular las subareas. Este metodo es suministrado por el cileu 10 integral. Para calcular el area bajo la curva entre dos puntos cualesquiera a y b, se integra lafunci6n de densidad de a a b. Unafunci6n de densidad es una formula em pleada para representar la distribuci6n de una variable aleatoria continua. La inte gracion es el caso lfmite de la sumatoria, aunque aqui no se efectua ninguna integracion, puesto que las materna tic as involucradas estan mas aHa del alcance de este Iibro. Tambien, como se ve mas adelante, para todas las distribuciones conti nuas a considerar existe una forma mas fadl para calcular el area bajo la curva. Aunque la definicion de distribucion de probabilidad para una variable aleatoria continua esta implfcita en el estudio anterior, a modo de resumen se pre· senta como sigue en forma mas concreta.
DEFINICION A una funci6n no negativa f(x) se Ie llama distribucion de probabilidad (tambien llamada, algunas veces, funci6n de densidad de probabilidad) para la variable aleatoria continua X, si el area total deliInitada por su curva y el eje de las x es igual a 1 y si la subarea delimitada por la curva, el eje de las x, y por las lineas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b.
4.6
4.6
DISTRIBUCI6N NORMAL
107
DISTRIBUCION NORMAL A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica: la distribucwn normal. La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733. Muchos otros matem:hicos destacan en la historia de la distribuci6n normal, induyendo a Carl Friedrich Gauss (1777-1855). A esta distribuci6n frecuentemente se Ie llama distribuciOn de Gauss como reconocimiento a las contribuciones de este matematico. La densidad normal esta dada por f(X) =
/20')
oo
(4.6.1)
En la ecuaci6n 4.6.1, 1t Ye son constantes conocidas, 3.14159 ... y 2.71828 .. " respectivamente, que se utilizan con frecuencia en matematicas. Los dos parametros de la distribuci6n son: ~, la media, y (J la desviaci6n est;indar. Para el objetivo de esta secci6n se puede pensar que ~ y (J son medidas de tendencia central y disper si6n para la distribuci6n normal, respectivamente, tal como se estudia en el capitu lo 2. Sin embargo, debido a que la variable aleatoria distribuida normalmente es continua y toma valores entre 00 y + "", su media y desviaci6n estandar se pueden definir de manera mas rigurosa, aunque estas definiciones no pueden darse sin utilizar el calculo. La grafica de la distribuci6n normal produce la ya conocida cur va en forma de campana, tal como se muestra en la figura 4.6.1. Las siguientes caracteristicas Caracleristicas de la distribuci6n normal son las mas importantes para la distribuci6n normal. 1. Es simetrica respecto a su media)1. Tal como se muestra en la figura 4.6.1, la
curva hacia cualquiera de los lados de ~ es una imagen de espejo de la del otro lado. 2. La media, la mediana y la moda son todas iguales. de las x es una unidad de area. Esta 3. EI area total bajo la curva sobre el caracterfstica se deduce del hecho de que la distribuci6n normal es una distri buci6n de probabilidad. Debido a la simetria mencionada anteriormente, 50
JL
FIGURA 4.6.1
Grifica de la distribud6n normaL
x
108
CAPiTULO 4
DISTRIBUCIONES DE PROBABILIDAD
por ciento del area esta a la derecha de la perpendicular levantada sobre Ia media, y el otro 50 por ciento dellado izquierdo. 4. Si se levantan perpendiculares a una distancia de una desviaci6n est
x
,u-1u,u,u+1u
(a)
.025
.025
x
,u (b)
.0015
.0015 ,u-3u
,u
,u+ 30'
x
{el
FIGURA 4.6.2 Subdivision del area bajo la curva normal (las areas son aproximadas).
109
4.6 DISTRIBUCION NORMAL
x
FIGURA 4.6.3 riabilidad.
Tres distribuciones normales con diferente media, pero con la misma va
5. Los parametros J..l y cr determinan completamente la distribuci6n normal. En otras palabras, por cada valor diferente de J..l y cr se especifica una distribuci6n normal distinta. Los valores diferentes de J..l desplazan la grafica de la distribu ci6n a 10 largo del eje de las x, tal como se muestra en la figura 4.6.3. Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n, tal como se muestra en la figura 4.6.4.
DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de dis tribuciones en la que un miembro se distingue de otro seglin los valores de J..l y cr. EI miembro mas importante de esta familia es la distribucion normal estdndar 0 distribucion normal unitaria, Hamada as! en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1. Esta distribuci6n se puede obtener a partir de la ecuaci6n 4.6.1, creando una variable aleatoria z = (x - J..l )/cr. La ecuaci6n para la distribuci6n normal estandar se escribe:
/2, _
00
< z < 00
(4.6.2)
x
FIGURA 4.6.4 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media.
110
CAPITULO 4
FIGllRA 4.6.5
DISTRIBUCIONES DE PROBABILIDAD
Distribuci6n normal estindar.
La grafica de la distribuci6n normal estandar se muestra en la figura 4.6.5.
Para calcular la probabilidad de que z tome un valor entre dos puntos cuales quiera sobre el eje de las z, por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos, la curva y el eje horizontal. Tal como se mendon6 anteriormente, las areas bajo la curva de una distribuci6n conti nua se calculan integrando la funci6n entre dos valores de la variable. Entonces, en el caso de la normal estandar, para calcular directamente el area entre Zo Y z,' es necesario calcular la siguiente integral:
r~-Z'f2dz
zo&
Afortunadamente, no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse. La tabla D, del apendice, es un ejemplo de estas ta bIas. En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre O<:J y los valores de z mostrados en Ia columna izquierda de la tabla. EI area sombreada de Ia figura 4.6.6 representa el area que aparece como Iista en la tabla, para los valores entre O<:J y zo' donde Zo es el valor espedfico de z. Ahora, con los siguientes ejemplos se muestra el uso de la tabla D.
FIGURA 4.6.6
Area dada por la tabla D del apendice.
4.6
DISTRIBUCION NORMAL
111
EJEMPLO 4.6.1
Dada la distribucion normal estandar, calcular el area bajo la curva, arriba del eje z, entre z = - 00 y z = 2. Soluci6n: Resulta utH dibujar la grafica de la distribudon normal estandar y som brear el area que se pide tal como se muestra en la figura 4.6.7. Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla, se encuentra que el area solicitada es .9772. Esta area se puede interpretar de diferentes formas: como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2, como la frecuencia relativa de ocurrenda (0 pro pordon) de valores de z entre -ooy 2, 0 bien se puede decir que 97.72 por ciento de los valores de z estan entre 00 y 2. •
o FIGUR-\' 4.6.7 areaentrez =
z
2
Distribuci6n normal estandar que muestra el coy z = 2.
EJEMPLO 4.6.2 ~Cual es la probabilidad de que una z, tomada al azar de entre los valores de z, este entre -2.55 y + 2.55?
Soluci6n: La figura 4.6.8 muestra e 1 area que se pide. En la tabla D se da el area entre 00 y 2.55, que se obtiene localizando el valor de 2.5 en la prime ra columna de la izquierda de la tabla y buscando sobre el renglon hasta
-2.55
HGUKA 4.6.8
o
2.55
x
Curva normal estandar para mostrar P(-2.55 < z < 2.55).
112
CAPiTULO 4
DISTRIBUCIONES DE PROBABILIDAD
eneontrar la entrada de la columna eneabezada por 0.05. EI area es de .9946. Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide, por 10 que es neeesario restar de .9946 el area a la izquierda de -2.55. AI consultar la tabla D, esta muestra que el area a la izquierda de -2.55 es .0054. Porlo tanto, la probabilidad que se busea es: P(-2.55 < z < 2.55) = .9946 - .0054
.9892
•
Suponga que se pide calcular la probabilidad de que z esta entre -2.55 y 2.55 inclu sive. La probabilidad que se pide se expresa como P(-2.55 :s; z ~ 2.55). Como se mencion6 en la seeei6n 4.5, P(z = zo) = 0, entonees, P(-2.55 :s; z :s; 2.55) = P(-2.55 < z < 2.55) = .9892. EJEMPLO 4.6.3 ~Cuantos
valores de z estan entre -2.74 y 1.53?
Soindon: La figura 4.6.9 muestra e1 area que se pide. En la tabla D se encuentra que el area que esta entre 00 y 1.53 es .9370, y el area entre - 00 y -2.74 es .0031. Para obtener la probabilidad se resta .0031 a .9370. Esto es, P(-2.74:S; z:s; 2.153)
-2.74
o
.9370 - .0031 = .9339
z
1.53
FlGUR!\ 4.6.9 CUIva normal estfuldar para mostrar la pro porci6n de los valores de z entre z -2.74 y z 1.53.
•
EJEMPLO 4.6.4
Dada la distribuci6n normal estandar, calcular P(z ;;:: 2.71). Soindon: EI area deseada se muestra en la figura 4.6.10. Para obtener el area a la derecha de z 2.71 se resta el area entre "" y 2.71 de 1. Asi, P(z;;:: 2.71) = I-P(z:S; 2.71)
= 1- .9966 .0034
EJERCICIOS
o FIGUM 4.6.10
113
z
2.71
Distribuci6n normal estindar para mostrar P(z
~
•
2.71).
EJEMPLO 4.6.5
Dada la distribuci6n normal estandar, calcule P(.84 S z s2.45). Soluci6n: EI area que se desea calcular se muestra en la figura 4.6.11. Primero se obtiene el area entre 00 y 2.45 a Ia que se Ie resta el area entre - 00 y .84. En otras pa]abras, P(.84 s z s 2.45)
= P(z s 2.45)
P(z s .84)
= .9929 - .7995 = .1934
FIGUM 4.6.11
•
Curva normal esUindar para mostrar P(.84::;; z::;; 2.45).
FJERCICIOS Dada la distribuci6n normal estandar, calcule: 0yz
4.6.1
EI area bajo la curva entre z
4.6.2
La probabilidad de que una z, sacada al azar, tenga un valor entre z
4.6.3
P(z
~
.55).
1.43.
4.6.4 pez 2: - .55).
= -2.87 Yz
2.64.
114
CAPiTULO 4
DlSTRIBUCIONES DE PROBABILIDAD
4.6.5 P(Z < -2.33). 4.6.7 P(-1.96S; Z S; l.!'J). 4.6.9 P(-1.65:::; Z S; 1.65).
4.6.6 P(z < 2.33). 4.6.8 P(-2.58 $
Z S;
2.58).
4.6.10 P(z = .74).
Dadas las siguientes probabilidades, calcule Zj: 4.6.12 P(-2.67 S; Z S; Zl) =.9718.
4.6.11 4.6.13
P(z S; Zj) .0055. P(z>Zj) =.0384.
4.6.15
P(-Zj$
Z S;Zj)
4.6.14P(zjS;z$2.98)=.11l7.
.8132.
4.7 APLICACIONES DE DISTRIBUCION NORMAL Aunque su importancia en el campo de la estadfstica es indiscutible, uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza. Sin embargo, es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente nor mal. En consecuencia, aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision, la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes. Al utilizar la distribucion normal como modelo, es posible establecer afirmaciones de proba bilidad mas utiles y mucho mas convenientes para algunas variables que si se utili zara un modelo mas complicado. _ La estatura y;la inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal. En otras palabras, muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normal.Sin embargo, si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0, en el caso de ignorarlo, se considera razonable hacer esta suposicion, la distribu cion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver pro blemas practicos relativos a esa variable. Sin embargo, se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos, y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud. Existen varias razonesmas pot las que la distribuci6n normal es muy impor tante en estadfstica, las cuales seran consideradas a su debido tiempo. Por ahora, se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe, 0 es razonable suponer, que estas presentan una distribuci6n aproximadamente normal. FJEl\IPLO 4.7.1 Como parte de un estudio de la enfermedad de Alzheimer, Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal. A partir de los datos develados, se puede calcular la media de 1076.80 gramos con una desviaci6n estandar de 105.76 gramos. Si se asume que estos resultados son aplicables a todas
4.7
APLICACIONES DE DISTRIBUCION NORMAL
t15
FIGURA 4. 7.1 De una distribuci6n normal a una distribu ci6n aproximada de pesos de los cerebros de pacientes enfer mos de Alzheimer (con estimaci6n de media y desviaci6n estandar).
las vfctimas de Alzheimer, encuentre la probabilidad de que una victima selecciQna da al azar tengaun c~rebro que pese menos de 800 gramus.
Soludom En la figura 4.7.1 se puede apreciar la gnifita que describe la distribu ci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada. Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1, serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQ.AfQrtunadamente, es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facili dad en una distribuci6n nQrmal estandar. EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z. EstQ significa que la media deX se puedevolver 0, la media de z; Enla figura 4.7.2 se muestran ambas distribuciQnes. Se puede determinar que e1 valor de z,
-2.62
0
z
FIGURA 4.7.2 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z).
116
CAPiTULO 4
DISTRIBUCIONES DE PROBABILIDAD
por decir ZO' corresponde a una x de 800. Esto se hace con la siguiente formula:
z=
x
(4.7.1)
(j
que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar. Para este ejemplo se tiene:
z = 800 -1076.80 = -2.62 105.76
•
Entonces, el valor buscado para Zo es -2.62.
AI ex~ullinar esta relacion minuciosamente, se observa que la distancia de la media, 1076.80, hasta el valor de x, 800, es 800 1076.80 -276.80, que representa una distancia de 2.62 unidades de desviacion est
P(x < 800) = p(z < 800 1076.80) =P(z < -2.62)
.0044
105.76
Para responder a la pregunta original, se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de .0044. EJEMPLO 4.7.2
Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas. ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas? Solucion: En la figura 4.7.3 se muestra la distribuci6n de las estaturas y la distribu cion z que resulta de transformar los valores originales para determinar las probabilidades deseadas. Se encuentra que el valor z correspondien te para una x de 65 es:
z 65-70 =-1.67 ...•. 3
'
4.7
APLICACIONES DE DISTRIBUCIONNQRMAL
65
70
-1.67
o
117
x
z
1.33
FIGURA 4.7.3 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z).
AnaIogamente, para x = 74 se tiene
z
74-70
= 1.33
3
En la tabla D se encuentra que el area entre - 00 y -1.67 es de .0475 y el area entre - 00 y 1.33 es .9082. El area deseada es la diferencia entre .9082 .0475 = .8607. En resumen, P(65::; x::; 74
p(65;70< z::;
°)
74 7 3
P(- 1.67::; z::; 1.33) .
P(- 00::; z::; 1.33) -P(- 00::; z::; 1.67)
.9082 .0475
.8607
Por 10 tanto, la probabilidad .8607 responde a la pregunta original. • E,JEMPLO 4.7.3
En una poblacion de 10,000 de las personas descritas en el ejemplo 4.7.2, ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas?
118
CAPITULO 4
DISTRIBUCIONES DE PROBABIUDAD
Soluci6n: Primero se calcula la probabilidad de que una persona, elegida al azar entre esa poblacion, tenga una estatura de 6 pies y 5 pulgadas; esto es, P(x? 77)
p[
z? 77;70) = P(z? 2.33)
=1- .9901 = .0099
Se puede esperar que de las 10,000 personas: 10,000(.0099) = 99 ten gan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas. •
Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada. Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z: -3, -2, -1, 0,2 Y 3. Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 4.7.4.
Datos: C 1: -3 -2 -I 0 1 2 3 Caja de dialogo:
Comandos de la sesi6n:
Calc> Probability Distributions> Normal
MTB > PDF Cl;
SUBC>
Normal
o 1.
Seleccionar Cumulative probability. Seleccionar Input column y teclear Cl. Clic OK..
R.esultados: .
.
.
Cumulative Distribution Function
=
Normal with mean 0 and standard deviation = 1.00000
x -3.0000 -2.0000 -1.0000 0.0000 LoOOO
2.0000 3.0000
P{X = x} 0.0013 0.0228 0.1587 0.5000 0.8413 0.9772 0.9987
. FIGURA 4.t4
acumuladas.
Calculos con el paquete MINITAB de-las probabilidades normales estindar
EJERCICIOS
119
FJERCICIOS 4.7.1 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximada c mente normal, con una media de 11.5 anos y una desviaci6n estandar de 3 anos. Un nino contrae recientemente la enfermedad. Cual es la probabilidad de que la edad del nino sea: a) Entre 8.5 y 14.5 anos
b) Mas de 10 afios
c) Menos de 12
4.7.2 En un estudio de dactilografia, unacaracteristica cuantitativa.muy importante es el total de surcos en los 10 dedos de unindividuo. Suponga que el total de surcos en los dedos de los individuoS'en determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50. Calcule la probabilidad de que un individuo, .elegido al azar entre esa poblaci6n, tenga un total de surcos en los dedos: a) De 200
0
mas
b) Menos de 100 c) Entre 100 y 200
d) Entre 200 y 250 e) En una poblacion de 10,000 personas,~Cuantos puede esperarse que tengan un total de
200 surcos
0
mas?
4.7.3 Si la capacidad de la cavidad craneana de una. poblacion tiene una distribuci6n aproximada mente normal, con una media de 1400 cc y una desviacion estandar de 125 cc, calcule la probabilidad de que una persona, elegida al azar entre esa poblaci6n, tenga una capacidad de cavidad craneana: a) Mayor que 1450 cc c) Entre 1300 y 1500 cc
b) Menor que 1350 cc
4.7.4. Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias, con una desviaci6n esmndar de 15. Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospita lizacion, calcule la probabilidad de que un paciente, elegido aleatoriamente entre ese grupo, tenga una hospitalizacion: a) Mayor que 50 dias
b) Menor que 30 dias
d) De mas de 90 dias
c) Entre 30 y 60 dias
4.7.5 Si el nive! total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal, con una media de 200 mgl100 m! y una desviaci6n estandar de 20 mg/lOO m!, calcule la probabilidad de que un individuo, elegido al azar de entre esa poblaci6n, tenga un nivel de colestero!: a) Entre 180 y 200 mg/100 mi
c) Menor que 150 mg/lOO ml
b) Mayor que 225 mg/lOO m!
d) Entre 190 y 210 mg/IOO mi
4.7.6 Dada un:a pobla:cion con distribuci6n normal, con una media de75 y una variancia de 625, calcule: a) P(50:::; x:s; 100) . c) P(x < 60) e) P(30:::; x:::; 110)
b) P(x > 90) d) P(x ~ 85)
120
CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD
4.7.7 Los pesos de una poblaci6n de mujeres j6venes, tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15. Calcule la probabili dad, de que unajoven, elegida al azar entre esa poblaci6n, pese: a) Mas de 155 libras
b) 100 libras
0
menos
c) Entre 105 y 1451ibras
4.8 RESllMEN En este capitulo, los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad. Se analizan los conceptos de variables aleatoria, discreta y continua, asi como las distribuciones de probabilidad. Se examinan deta lladamente, en especial, dos distribuciones de probabilidad discreta, la binomial y la de Poisson, y una distribucion de probabilidad continua, la normal. Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabi lidad para las variables aleatorias que son de interes para e1profesional de la salud.
PREGUNTAS YEJERCICIOS DE REPASO '1.
~Que es una variable aleatoria discreta? De tres ejemplos que sean de iriteres para el profe sional de la salud.
2.
~Que es una variable aleatoria continua? De tres ejemplos que sean de interes para el profe sional de la salud.
3. Defina la distribuci6n de probabilidad para una variable aleatoria discreta. 4. Defina la distribuci6n de probabilidad para una variable aleatoria continua. 5.
~Que
es la distribuci6n de probabilidad acumulada?
6.
~Que
es un ensayo de Bernoulli?
7. Describa la distribuci6n binomial. 8. De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial. 9. Describa la distribuci6n de Poisson. 10. De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson. 11. Describa la distribuci6n normal. 12. Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica. 13. De un ejemplo de variable aleatoria que pueda seguir, al menos aproximadamente, una distribuci6n normal. 14. Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada.
PREGUNTAS Y EJERCICIOS DE REPASO
121
15. El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso men tal, es efectivo en 50 por ciento de los casos. Un nuevo metodo es ensayado con 10 personas. Si el nuevo metodo no es mejor que el habitual, 2cuM es la probabilidad, de que siete 0 mas individuos 10 aprendan? 16. Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados. Si 10 nuevos em pleados son contratados: a) "-Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando
un ano despues?
b) (Cual es la probabilidad de que ninguno renuncie un ano despues?
c) 2.Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano?
17. En cierto pais en desarrollo, 30 por ciento de los ninos estan desnutridos. En una muestra aleatoria de 25 ninos de esa area, cual es la probabilidad de que el mimero de ninos desnu tridos sea: a) Exactamente 10 b) Menos de cinco
d) Entre tres y cinco, inclusive
c) Cinco 0 mas e) Menos de siete, pero mas de cuatro
18. En promedio, dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria.
a) 2Cual es la probabilidad de que durante una hora dada, tres estudiantes lleguen a la sala
de primeros auxilios para tratamiento?
b) 2Cuat es la probabilidad de que durante una hora dada, dos 0 menos estudiantes sean enviados a la sala de primeros auxilios?
c) (Cual es la probabilidad de que entre tres y cinco estudiantes, inclusive, sean enviados a la
sala de primeros auxilios durante una hora dada?
19. En promedio, cinco fumadores pasan por la esquina de cierta calle cada 10 minutos. Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de: a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho 20. En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabi lidad de que durante un mes dado, el numero de suicidios sea: b) Menos de uno a) Mas de uno c) Mas de tres 21. Los IQ de individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10.
a) Calcule la cantidad de individuos con un IQ mayor a 75.
b) 2Cmil es la probabilidad de que un individuo, elegido al azar, tenga un IQ entre 55 y 75?
c) Calcule P(50 ~ X·~ 70).
22. EI supervisor de enfermeria encontr6 que el personal de enfermeria, en promedio, termina cierta tarea en 10 minutos. Si el tiempo requerido para completar la tarea sigue una distribu ci6n aproximadamente normal con una desviaci6n estandar de 3 minutos, calcule: a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos.
122
CAPITULO 4
DlSTRIBUCIONES DE PROBABILIDAD
b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar
dicha tarea.
c) La probabilidad de. que una enfermera ala que recientemente se Ie asign6 la tarea,
termine en 3 minutos.
23. Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal, con una media de 500 y una variancia de 10,000. a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos?
b) Una persona esta por resolver el examen.(Cual es la probabilidad de que logre una
calificaci6n de 650 0 mas puntos? c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)? .
24. Dada una variable binomial con media de 20 y variancia de 16, calcule n y p. 25. Suponga que una variable X se distribuye normalmente, con una desviaci6n estandar de 10. Dado que .0985 de los valores de X son mayores que 70, (cual es valor de la media de X?
26. Dada una variable aleatoria X distribuida normalmente, calcule' el valor numerico de k, tal que P(1l kcr 5, X 5, !l +- kcr) = .754. 27. Dada la variable aleatoria X distribuida normaImente, con una media de 100 y una desvia ci6n estandar de 15, calcule el valor numerico de k, tal que: a) P(X 5, k) = .0094
b)P(Xzk)= .1093
c) P(100 5, X
~
k) = .4778
d) P(k' ::; X 5, k) = .9660, donde k' Y k son equidistantes de IL
28; Dada una variable aleatoria X distribuida normalmente, con cr calcule 11.
10 y P(X
5,
29. Dada una variable aleatoria X distribuida normalmente, con cr = 15 Y P(X calcule 11. 30. Dada unavariable aleatoriaX distribuida normalmente, con cr = calcule 11.
P(X
31. Dada una variable aleatoria X distribuida normalmente, con !l = 25y P(X
40)
~
.0080,
50) =.9904,
z 25)
= .0526,
5,
10) = .0778,
5,
50)
calcule cr. 32. Dada una variable aleatoria X distribuida normalmente, con 11 calculecr. 33. Explique por que cada una de las siguientes mediciones es Bernoulli:
0
30y P(X
.9772,
no el resultado de ensayos de
a) EI sexo de recien nacidos . . b) Lq. dasificaci6n de la condici6n de los pacientes hospitalizados: estable, en condiciones criticas, regular, buena, mala ..
c) EI peso en gramos de bebes recien nacidos ..
34. Explique por que cada una de las siguientes mediciones es Bernoulli:
0
noel resultado de ensayos de
a) EI numero de procedimientos quirfugicos aplicados en un hospital.en una semana. b) La temperatura de pacientes hospitalizados en grados Celsius.
c) El registro de los signos vitales·de pacientes hospitalizados: normaIes 0 inestables.
BIBLIOGRAFIA
35. Explique por que cada una de las siguientes distribuciones es babilidad:
a) x
0 1 2 3 4
c) x
0 1 2 3 4
P(X
= x)
b) x
0.15 0.25 0.10 0.25 0.30
P(X
= x)
0.15 -0.20 0.30 0.20 0.15.
0 1 2 3
d)
x
-1
0 1 2 3 4
0
123
no una distribuci6n de pro
. P(X= x)
0.15 0.20 0.30 0.10
P(X
= x)
0.15 0.30 0.20 0.15 0.10 0.10
BmllOGRAFIA Bibliografia de metodologia 1. Frank A. Haight, Handbook ofthe Poisson Distribution, Wiley, New York. Bibliografia de aplicaciones A·I.
Simone Buitendijk y Michael B. Bracken, "Medication in Early Pregnancy: Prevalence of Used and Relationship to Maternal Characteristics", American Journal of Obstfftrics and Gynecolof!:J, 165, 33-40.
A-2.
National Center for Health Statistics, M. F. Najjar y M. Rowland, "Anthropometric Reference Data and Prevalence of Overweight, United States, 1976-80", Vital and Health Statistics, Serie II, No. 238. DHHS Pub. No. (PHS) 87-1688, Public Health Service, U.S. Government Printing Office, Washington, DC .
.• A·3.
National Center for Health Statistics,O. T. Thornberry, R. W. Wilson y P. M. Golden, "Health Promotion Data for the 1990 Qbjectives, Estimates from the National Health Interview Survey of Health Promotion lj.nd Disease Prevention, United:States, 1985", Advance Data From Vital and Health Statistics, No. 126. DHHS Pub. No. (PHS) 86-1250, Public Health Service, Hyattsville, MD.
. A-4.
Robert D. Gibbons, David C. Clarky Jan1iawcett, "A Statistical Method for Evaluating Suici de Clusters and Implementing Cluster Surveillance'\ American Journal of Epidemiolof!:J, 132 (Suplemento No. I), SI83-S191.
A·5.
S. D. Dusheiko, "Some Questions Concerning the Pathological Anatomy of Alzheimer's Disease", Soviet Neurological Psychiatry, 7, 56-64. Publicada por Internacional Arts and Sciences Press, White Plains, NY.