DISTRIBUCIÓN BINOMIAL La distribución binomial está asociada a experimentos del siguiente tipo: - Realizamos n veces cierto experimento en el que consideramos sólo la posibilidad de éxito o fracaso. - La obtención de éxito o fracaso en cada ocasión es independiente de la obtención de éxito o fracaso en las demás ocasiones. - La probabilidad de obtener éxito o fracaso siempre es la misma en cada ocasión.
Definición de distribución binomial: Si realizamos n veces un experimento en el que podemos obtener éxito, E, con probabilidad p y fracaso, F, con probabilidad q (q = 1 − p), diremos que estamos ante una distribución binomial de parámetros n y p, y lo representaremos por Bin(n;p). En este caso la probabilidad de obtener k éxitos viene dada por:
Nota:
Observar que las probabilidades de ´exito y fracaso son complementarias, es decir, q = 1-p yp= 1-q, por lo que basta saber una de ellas para calcular la otra. EJERCICIOS PROPUESTOS DE LA DISTRIBUCIÓN BINOMIAL 1) Se considera una v.a. cuya distribución es binomial del tipo tipo B(4,1/3). Se pide: a) Determinar y representar gráficamente su función de probabilidad. b) Determinar y representar la función de distribución F(x) c) Calcular: P( 1≤ X < 3) y P( 1≤ X ≤ 3) 2) Sea X una v.a. binomial. Sabiendo que E(X) = 3 y s 2 (X)= 6/5. Determínese: a) La función de probabilidad de X b) La probabilidad del suceso P(X>3) 3) Al inspeccionar 1520 soldaduras hechas por una misma máquina, resultó que 152 eran defectuosas. Admitimos que la producción sigue en las misas condiciones. Si se eligen 5 soldaduras hechas por esa máquina, ¿cuál es la probabilidad de que por lo menos dos sean defectuosas? 4) En un determinado país, el 30% de sus habitantes tienen sangre tipo 0. Si se analiza la sangre de 10 personas: a) ¿Cuál es la probabilidad de que haya, exactamente, cinco personas con sangre tipo 0, entre las examinadas? b) ¿Cuál es la probabilidad de que menos de la mitad tengan sangre de dicho tipo? c) ¿Cuántos cabe esperar que tengan sangre tipo 0? 5) Dos personas juegan a “cara o cruz” y han convenido en acabar el juego cuando ambos sucesos se hayan presentado por lo menos tres veces. Calcúlese la probabilidad de que el juego no se acabe cuando ya se han hecho ocho lanzamientos.
6) La probabilidad de que una jugadora de golf haga hoyo en un lanzamiento a una distancia determinada es 0,2. Si lo intenta cinco veces, calcular la probabilidad de que: a) No acierte ninguna b) Acierte alguna c) Acierte dos. d) Si hace tandas de cinco lanzamientos, ¿cuál será el número medio de aciertos?; ¿cuál será su desviación típica? 7) Suponiendo que cada niño tiene la probabilidad 0,51 de ser varón, hállese la probabilidad de que en una familia de seis hijos haya tenido: a) Por lo menos un niño b) Por lo menos una niña. 8) Dada la distribución binomial B(4; 0.8), calcular: a) La función de probabilidad b) La función de distribución 9) Se ha estudiado que 1/3 de los alumnos de Bachillerato no leen nunca la prensa diaria. Tomando una muestra al azar de 10 alumnos estudiar las probabilidades siguientes: a) Encontrar dos alumnos que no leen la prensa b) Más de tres alumnos que no leen la prensa c) Por lo menos cinco alumnos que no leen la prensa 10) De la producción diaria de un pequeño electrodoméstico se estudian cinco durante 10 días, obteniéndose la siguiente tabla de los que se producen con algún defecto. DIA 1 2 3 4 5 6 7 8 9 10 DEFECTO 1 2 1 2 1 2 0 0 1 0 Se pide: a) Ajustar una distribución binomial a estos datos. b) Probabilidad de que en los cinco electrodomésticos observados a lo sumo haya uno defectuoso.
DISTRIBUCIÓN DE POISSON. Características: En este tipo de experimentos los éxitos buscados son expresados por unidad de área, tiempo, pieza, etc, etc,: - # de defectos de una tela por m2 - # de aviones que aterrizan en un aeropuerto por día, hora, minuto, etc, etc. - # de bacterias por cm2 de cultivo - # de llamadas telefónicas a un conmutador por hora, minuto, etc, etc. - # de llegadas de embarcaciones a un puerto por día, mes, etc, etc. Para determinar la probabilidad de que ocurran x éxitos por unidad de tiempo, área, o producto, la fórmula a utilizar sería: x
p( x , ) donde:
x!
p( x, ) = probabilidad de que ocurran x éxitos, cuando el número promedio de ocurrencia de ellos es = media o promedio de éxitos por unidad de tiempo, área o producto = 2.718 x = variable que nos denota el número de éxitos que se desea que ocurra Hay que hacer notar que en esta distribución el número de éxitos que ocurren por unidad de tiempo, área o producto es totalmente al azar y que cada intervalo de tiempo es independiente de otro intervalo dado, así como cada área es independiente de otra área dada y cada producto es independiente de otro producto dado. Ejemplos: 1. Si un banco recibe en promedio 6 cheques sin fondo por día, ¿cuáles son las probabilidades de que reciba, a) cuatro cheques sin fondo en un día dado, b) 10 cheques sin fondos en cualquiera de dos días consecutivos? Solución: a) x = variable que nos define el número de cheques sin fondo que llegan al banco en un día cualquiera = 0, 1, 2, 3, ....., etc, etc. = 6 cheques sin fondo por día = 2.718 6
4
p( x 4 , 6 )
( 6 ) ( 2.718 ) 4!
( 1296 )( 0.00248 ) 24
0.13392
b) x= variable que nos define el número de cheques sin fondo que llegan al banco en dos días consecutivos = 0, 1, 2, 3, ......, etc., etc. = 6 x 2 = 12 cheques sin fondo en promedio que llegan al banco en dos días consecutivos Nota: siempre debe de estar en función de x siempre o dicho de otra forma, debe “hablar” de lo mismo que x. 12
10
p( x 10 , 12 )
( 12 ) ( 2.718 )
( 6.1917364 10 )( 0.000006151 )
10!
3628800
0.104953
2. En la inspección de hojalata producida por un proceso electrolítico continuo, se identifican 0.2 imperfecciones en promedio por minuto. Determine las probabilidades de identificar a) una imperfección en 3 minutos, b) al menos dos imperfecciones en 5 minutos, c) cuando más una imperfección en 15 minutos. Solución: a) a) x = variable que nos define el número de imperfecciones en la hojalata por cada 3 minutos = 0, 1, 2, 3, ...., etc., etc. = 0.2 x 3 =0.6 imperfecciones en promedio por cada 3 minutos en la hojalata 0.6
1
p( x 1 , 0.6 )
( 0.6 ) ( 2.718 ) 1!
( 0.6 )( 0.548845 ) 1
0.329307
b) b) x = variable que nos define el número de imperfecciones en la hojalata por cada 5 minutos = 0, 1, 2, 3, ...., etc., etc. = 0.2 x 5 =1 imperfección en promedio por cada 5 minutos en la hojalata ( 1 )0 ( 2.718 )1 ( 1 )( 2.718 )1 p( x 2 ,3 ,4 ,etc.... 1 ) 1 p( x 0 ,1 , 1 ) 1 0 1 ! !
=1-(0.367918+0.367918) = 0.26416 c) c) x = variable que nos define el número de imperfecciones en la hojalata por cada 15 minutos = 0, 1, 2, 3, ....., etc., etc. = 0.2 x 15 = 3 imperfecciones en promedio por cada 15 minutos en la hojalata 3
p( x 0 ,1 , 3 ) p( x 0 , 3 ) p( x 1 , 3 )
( 3 )0 ( 2.718 )
3
0!
( 3 )1( 2.718 ) 1!
= 0.0498026 + 0.149408 = 0.1992106 EJERCICIOS PROPUESTOS DE LA DISTRIBUCION DE POISSON 1) Una compañía telefónica recibe llamadas a razón de 5 por minuto. Si la distribución del número de llamadas es de Poisson, calcular la probabilidad de recibir menos de cuatro llamadas en un determinado minuto. 2) El dueño de un criadero de árboles está especializado en la producción de abetos de Navidad. Estos crecen en filas de 300. Se sabe que por término medio 6 árboles no son aptos para su venta. Asume que la cantidad de árboles aptos para la venta por fila plantada sigue una distribución de Poisson. a) Calcula la probabilidad de encontrar 2 árboles no vendibles en una fila de árboles. b) Calcula la probabilidad de encontrar 2 árboles no vendibles en media fila de árboles. 3) El número medio de accidentes ocurridos en una planta petrolera es de 2 accidentes en 2 meses. a) Qué modelo sigue la variable número de accidentes ocurridos en la planta por 2 meses?. b) Probabilidad de que haya más de 2 accidentes en 2 meses. c) Probabilidad de que haya entre 2 y 8 inclusive, en 2 meses. d) Probabilidad de que haya más de 2 accidentes en 1 mes. 4) El número medio de robos con violencia que se registra en un barrio marginal es de 4 al mes. Determine las siguientes probabilidades indicando el modelo de probabilidad en que se basa. a) Probabilidad de que en un mes determinado no haya ningún robo de este tipo. b) Probabilidad de que haya al menos uno en un mes dado. c) Probabilidad de que haya entre 2 y 6, inclusive en un mes dado. d) Probabilidad de que haya más de dos en 15 días. 5) Suponiendo que las denuncias que realizan los trabajadores de cierta empresa a la Inspección de Trabajo siguen un modelo Poisson de media 1.5 al año, obtenga las siguientes probabilidades: a) Probabilidad de que en un año determinado la empresa no sea denunciada. b) Probabilidad de que en un año dado se produzcan más de 4 denuncias. c) Probabilidad de que en el primer cuatrimestre del año se produzcan dos o más denuncias.
6) En pruebas realizadas a un amortiguador para automóvil se encontró que el 0.04 presentaban fuga de aceite. Si se instalan 150 de estos amortiguadores, hallar la probabilidad de que, a) 4 salgan defectuosos, b) más de 5 tengan fuga de aceite. c) de 3 a 6 amortiguadores salgan defectuosos. d) Determine el promedio y la desviación estándar de amortiguadores con defectos. 7) Un ingeniero que labora en el departamento de control de calidad de una empresa eléctrica, inspecciona una muestra al azar de 200 alternadores de un lote. Si el 2% de los alternadores del lote están defectuosos. Cuál es la probabilidad de que en la muestra, a) ninguno esté defectuoso, b) uno salga defectuoso, c) al menos dos salgan defectuosos d) más de tres estén con defectos
Distribución normal estándar La última característica de la distribución normal implica que la distribución normal es realmente una familia de distribuciones en la que un miembro de la familia se diferencia de otro según los valores de μ y σ2.
El miembro más importante de esta familia es la
distribución normal estándar o distribución normal unitaria, llamada así porque tiene como media a cero y como varianza a uno. A partir de cualquier variable X con 2
distribución normal de media μ y varianza σ
, se puede obtener la distribución normal
estándar mediante la transformación:
Z=
X
Para calcular probabilidad de que Z tome un valor entre dos puntos del eje z, por ejemplo entre z1 y z2, debe calcularse el área limitada por las perpendiculares levantadas en esos puntos, la curva y el eje horizontal. Áreas bajo la curva de una distribución continua se calculan integrando la función de densidad de Z entre los dos valores de la variable. Por fortuna no es necesario efectuar esta operación, pues existen tablas con resultados de todas las integraciones. Como cualquier variable con distribución normal puede ser convertida a la distribución normal estándar mediante la transformación: Z=
X
Podemos también determinar probabilidades o áreas limitadas entre dos valores cualesquiera de X. ¿Entre qué valores se encuentran las áreas debajo de la distribución estándar de acuerdo a la característica 4 de una distribución normal general?
Uso de la tabla de la distribución normal estándar La tabla nos proporciona el área a la izquierda de un valor de la variable Z. Por ejemplo para hallar el área a la izquierda de 1.28, consideramos 1.2 en la primera columna de la tabla y al decimal 0.08 en la primera fila de la tabla, el área se encuentra en la intersección de la fila de 1.2 y la columna de 0.08, es decir es 0.8997. Se puede escribir: P (Z < 1.28) = 0.8997 Para hallar el área a la izquierda de -0.35 buscamos el número que se encuentra en la intersección de la fila de -0.3 y la columna de 0.05 y es 0.3632. Se escribe P (Z < -0.35) = 0.3632 Para determinar área a la derecha de un valor de la variable Z o el área entre dos valores de Z consideramos las propiedades de que el área debajo de la curva es igual a 1 y la simetría de la distribución. P (Z > 1.67) = 1 – P (Z < 1.67) = 1 – 0.9525 = 0.0475 P (Z > -1.74) = 1- P (Z < -1.74) = 1 – 0.0409 = 0.9591 P (1.15 < Z < 2.63) = P (Z < 2.63) – P (Z < 1.15) = 0.9957 – 0.8749 = 0.1208 P (-1.54 < Z < 2.38) = P (Z < 2.38) – P (Z < -1.54) = 0.9913 – 0.0618 = 0.9295 También se pueden hallar los puntos que delimitan áreas. Ejemplos: Hallar z P (Z < z) = 0.9881 z = 2.26 P (Z < z) = 0.3300 z = -0.44 P (Z > z) = 0.4721 P (Z < z) = 1 – P (Z > z) = 1 – 0.4721 P (Z < z)= 0.5279 z = 0.07 P (Z > z) = 0.9744 P (Z < z) = 1 – P (Z > z) = 1 – 0.9744 P (Z < z) = 0.0256 z = -1.95 P (-z < Z < z) = 0.9476 P (Z < z) = 0.9738 z = 1.94 P (-z < Z < z) = 0.9488 P (Z < z ) = 0.9744 z = 1.94
Ejemplo 1.- Dada una distribución normal con μ = 30 y σ = 6, encuentre el área de la curva normal a) a la derecha de x = 17; b) a la izquierda de x = 22; c) entre x = 32 y x = 41; Solución:
a) P (X > 17) = P ( b) P (X < 22) = P (
X
c) P ( 32 < X < 41) = P (
6
) = P (Z > -2.17) = 1 – P (Z < -2.17)= 1 – 0.0150 = 0.9850
X
17 30
>
22 30
<
6
32 30 6
<
) = P (Z < -1.33) = 0.0918
X 30 6
<
41 30 6
) = P ( 0.33 < Z < 1.83)
= P( Z < 1.83) – P (Z < 0.33) = 0.9664 – 0.6293 = 0.3371
Ejemplo 2.- En el problema anterior hallar a) el valor de x que tiene 80% del área de la curva normal a la izquierda; b) los dos valores de x equidistantes de la media que contienen 75% central del área de la curva normal. Solución: a) P (X < x) = 0.8000 P(
X 30 6
x 30 6
<
x 30 6
) = P (Z < z) = 0.8000
z = 0.85
= 0.85 x = 35.1
b) P (x1 < X < x2) = 0.7500 P (- z < Z < z) = 0.7500 donde – z = x
1
30 6
y z = x
2
30 6
P (Z < z) = 0.8750 z = 1.15
x
30
2
6
x
1
30 6
= 1.15
x2 = 36.9
= -1.15
x1 = 23.1
los valores son 23.1 y 36.9
Ejercicios: 1.- Calcular a) P (Z < 1.43) b) P (Z < -2.33) c) P (Z > 2,05) d) P (Z > -0.54) e) P (-0.72 < Z < 1.69) f) P ( -2.44 < Z -1.82) 2.- Hallar el valor de z en a) P (Z < z) = 0.2946 b) P (Z < z) = 0.9909 c) P (Z > z) = 0.0228 d) P (Z > z) = 0.9251 e) P (-z < Z < z ) = 0.9500 f) P (-z < Z < z) = 0.6476 3. Dada una población con distribución normal, con una media de 75 y una variancia de 625, calcular: a) P (50 ≤ X ≤100).
b) P(X > 90). c) P(X < 60). d) P (X ≥ 90). e) P (30 ≤ X ≤110).
4.- Un terapista físico piensa que los puntajes en una prueba de destreza manual tienen aproximadamente una distribución normal con una media de 10 y una desviación estándar de 2.5. Si a un individuo, elegido aleatoriamente, se le aplica el examen, ¿cuál es la probabilidad de que logre un puntaje de a) 15 puntos o menos b) 7.5 puntos o más c) entre 5 y 12.5 puntos d) entre 7 y 15.5 puntos 5.- Si la capacidad de la cavidad craneana de una población tiene una distribución aproximadamente normal, con una media de 1400 cc y una desviación estándar 125 cc , calcular la probabilidad de que una persona , elegida aleatoriamente de esa población , tenga una capacidad de cavidad craneana : a) Mayor que 1450 cc. b) Entre 1300 y 1500 cc. c) Menor que 1350 cc. 6.- Suponga que el tiempo de permanencia hospitalaria por enfermedad crónica para un tipo de paciente es de 60 días, con una desviación estándar de 15. Si es razonable suponer que se tiene una distribución aproximadamente normal para el tiempo de hospitalización, calcular la probabilidad de que un paciente, elegido aleatoriamente de ese grupo, tenga una hospitalización: a) Mayor que 50 días. b) Menor que 30 días. c) Entre 30 y 60 días. d) Mas de 90 días. 7.- Si el nivel total de colesterol en cierta población tiene una distribución aproximadamente normal de 200 mg/100 ml y una desviación estándar de 20 mg/100 ml , calcular la probabilidad de que un individuo , elegido al azar de entre esa población , tenga un nivel de colesterol: a) Entre 180 y 200 mg/100 ml. b) Mayor que 225 mg/100 ml. c) Menor que 150 mg/100 ml. d) Entre 190 y 210 mg/100 ml. 8.- Los pesos de una población de mujeres jóvenes con mayoría de edad tienen una distribución aproximadamente normal con una media de 132 libras y una desviación estándar 15. Calcular la probabilidad de que una joven, elegida aleatoriamente de esa población, pese: a) Más de 155 libras. b) 100 libras o menos. c) Entre 105 y 145 libras. 9.- Dada una variable aleatoria X distribuida normalmente, con σ = 15 y P( X < 50) = 0.9904, calcular μ
10.- Dada una variable aleatoria X distribuida normalmente, con μ = 5 y P ( X < 10) = 0.0778, calcular σ.
19º) Una urna contiene 4 bolas rojas y 6 blancas. Se saca una bola al azar, se apunta el color, y se devuelve a la urna. Suponiendo que esa experiencia se repite cinco veces, hallar a) la probabilidad de obtener dos bolas rojas b) la probabilidad de obtener a lo sumo dos rojas c) la media y desviación típica de la variable que describe el número de bolas rojas obtenidas. Métodos Estadísticos y numéricos Distribución binomial 3
20º) Minuciosos estudios han permitido establecer que el 20% de los tornillos fabricados por una cierta máquina son defectuosos. Si se eligen al azar 7 tornillos fabricados por ella, hállese la probabilidad de que a) Ninguno sea defectuoso b) Por lo menos tres sean defectuosos c) Haya entre 3 y 5 defectuosos. 21º) Se lanzan diez bolas obre cuatro cajas. Se supone que ninguna cae fuera de las cajas y que cada bola tiene la misma probabilidad de caer en cualquiera de ellas. Hállese la función de masa de probabilidad de la v.a que describe el número de bolas caídas en la primera caja. Hállese la probabilidad de que en dicha caja caigan por lo menos tres bolas 22º) Lanzamos cinco dados, y cobramos tantos euros como veces aparezca el 1. ¿Resulta rentable participar en ese juego si nos cobran 6 euros por jugada? 23º) De una urna que contiene 50 bolas blancas y 10 negras se extraen diez bolas, de una en una y devolviendo cada vez la bola a la urna. ¿Cuál es la probabilidad de que más de la mitad sean negras? 24º) Se lanza un dado 216 veces. Calcúlese el número de veces que cabe esperar que aparezca el 3. Hállese la varianza de la distribución correspondiente. 25º) Se lanzan dos dados cinco veces, anotando cada vez la suma de puntos alcanzada. Hállese la probabilidad de que se obtenga como suma un número primo al menos dos veces. 26º) Supóngase que la probabilidad de que una persona sea varón es ½. Si se eligen al azar 100 familias de cinco hijos cada una, ¿en cuántas es de esperar que haya 2 varones y 3 mujeres? 27º) Un vendedor de seguros vende pólizas a cinco personas, todas ellas de la misma edad y con buena salud. Según las tablas actuariales, la probabilidad de que una persona en tales
condiciones viva 30 años o más es 2/3. Hállese la probabilidad de que al cabo de 30 años vivan: a) Las cinco personas b) Por lo menos tres personas c) Sólo dos personas 28º) Se ha comprobado que el 2 por mil de las piezas producidas por una fabrica son defectuosas. En una partida de 50000 piezas, ¿cuántas se puede esperar que sean defectuosas?. Hállese la desviación típica de la variable que describe el número de piezas defectuosas 29º) Un examen tipo “test” consta de cinco preguntas, en cada una de las cuales se adjuntan tres posibles respuestas de las que sólo una es correcta. Para superar el examen, se exige acertar un mínimo de cuatro respuestas. ¿Qué probabilidad hay de que una persona aprueba el examen si responde al azar? SOLUCIONES: 1º c) 32/81, 64/81 ; 2º b) 0,087 ; 3º) E[X]= 5/4 , σ = 4 15 , 0,984 ; 4º) 0,08 ; 5º) a) 0,103 b) 0,849 c) 3 ; 6º) 27/138; 8º) b) 0,8126 ; 10º) 3 y 0’5172 11º) a) 0,2344 b) 0,3438 c) 0,0156 ; 12º) a) 0,3277 b) 0,67232 c) 0,2048 d) 0,8944 13º) a) 0,9862 b) 0,9824 ; 15º) a) 0,1951 b) 0,4408 c) 0,9235 16º) b) 0,7373 ; 17º) 0,1935 18º) a) 0,2983 b) 0,5926 ; 19º) a) 0,3456 b) 0,6826 c) 2 y 1,0954 ; 20º) a) 0,2097 b) 0,148 c) 0,1476; 21º) 0,4774; 23º) 0,0024 ; 24º) 36 y 5,47; 25º) 0,6912 ; 26º) a) 0,3060 b) 0,5187 ; 27º) a) 0,1317 b) 0,7901 c) 0,1646 ; 28º) 100 y 10 ; 29º) 0,0452