Probabilidad y Estadística
DISTRIBUCIONES DISCRETAS: BINOMIAL, GEOMÉTRICA, BINOMIAL NEGATIVA, HIPERGEOMÉTRICA Y POISSON. En este tema se presentan algunas distribuciones de variables aleatorias discretas así como su esperanza y varianza.
Distribución Binomial. Un experimento binomial tiene las siguientes propiedades: 1. El experimento consiste consiste en n ensayos idénticos. 2. Cada ensayo tiene dos resultados posibles. A uno de ellos se le denotará como como éxito y al otro fracaso. 3. La probabilidad de éxito en un ensayo es igual a p y es igual en todos los ensayos. La probabilidad de fracaso en cada ensayo es q=1-p. 4. Los ensayos son independientes. Cuando se cumplen las condiciones anteriores se dice que la variable aleatoria X que representa el número de éxitos obtenidos en los n ensayos tiene distribución Binomial y ( , ). El recorrido de la variable es = {0,1 {0,1,2 ,2,, … , }. se denota
∼
Las características de la variable X son:
− . 2. La media de la distribución es [] = . 3. La varianza es () = . representan las combinaciones de n elementos tomado en Recuérdese que = − grupos de k. 1. La función masa de probabilidad es ( = ) =
!
!(
)!
Ejemplo:
Suponga que Ana, una lanzadora de dardos, logra un objetivo con probabilidad p=1/3. Suponga que ella dispara a su objetivo 7 veces. Encuentre la probabilidad de que ella alcance el objetivo: a) b) c) d)
Exactamente 3 veces. Al menos una vez. Encuentre el número esperado de veces que ella le atinará al objetivo. objetivo. Encuentre la desviación estándar.
Solución.
Se puede observar que este experimento es un experimento binomial, pues se realizan n=7 disparos con las mismas condiciones, en cada disparo hay dos resultados posibles, a saber, atinarle al blanco o fallar, la probabilidad de éxito es p=1/3 y el resultado de cada lanzamiento es independiente de los otros lanzamientos. Por lo tanto, (7, ) . Entonces:
∼
1 3
Probabilidad y Estadística
a) La probabilidad de que le atine al objetivo exactamente 3 veces estaría dado por: 2 7 1 ( = 3) = = 0.256 3 3 3 b) La probabilidad de que alcance el objetivo al menos una vez es: 2 2 7 1 ( ( = 0) = 1 1) = 1 =1 = 0.941 0 3 3 3 c) El número esperado de veces que ella le atinará al objetivo es,
≥
d)
3
4
� �
0
7
7
� � � () = = 7 13 = 2.333, es decir, aproximadamente dos de esas siete veces le atinará Ana al objetivo. 1 2 14 14 La varianza de X es () = = 7 = por lo tanto = = 1.2472. 3 3 9 9
Distribución Geométrica. Considere ensayos repetidos de un experimento en el cual existe una probabilidad de éxito p, una probabilidad de fracaso q=1-p y se sabe que cada ensayo es independiente de los anteriores. La variable X que representa el número de veces que el experimento debe ser repetido hasta obtener finalmente un éxito es conocida como Geométrica. En tal caso se escribe ( ). El recorrido de X es = {1,2,3, … } y la función masa de probabilidad es:
∼
( = ) = −1 La expresión anterior se obtiene del hecho de que el experimento se repetirá k veces solamente en el caso de que haya una sucesión de k-1 fracasos seguidos anteriores al éxito. La esperanza de una variable aleatoria con distribución geométrica es varianza es
() = .
[ ] = 1 y su
Ejemplo:
La probabilidad de que un proyectil alcance un objetivo es p=0.2 y se disparará tantas veces como sea necesario hasta alcanzar el objetivo. a) Encuentre el número esperado de cohetes que serán disparados antes de alcanzar el objetivo. b) Encuentre la probabilidad de que 4 ó más cohetes sean requeridos para alcanzar finalmente el objetivo. Solución.
a) El número esperado de disparos antes de alcanzar el objetivo es: ( ) = = = 5.
1 012 La probabilidad de que al menos cuatro cohetes sean requeridos es: ( ≥ 4) = 1 ( ≤ 3) = 1 [0.2 + (0.8)(0.2) + (0.8)2(0.2)] = 0.512 .
b)
Probabilidad y Estadística
Distribución Binomial Negativa. La distribución binomial negativa es una generalización de la distribución geométrica, pero ahora en lugar de hacer el experimento hasta obtener el primer éxito, se hace el experimento hasta obtener el éxito número r. Considere ensayos repetidos de un experimento en el cual existe una probabilidad de éxito p, una probabilidad de fracaso q=1-p y se sabe que cada ensayo es independiente de los anteriores. La variable X que representa el número de veces que el experimento debe ser repetido hasta obtener el –ésimo éxito es conocida como Binomial negativa.
En tal caso se escribe ∼ ( , ). El recorrido de X es = { , + 1, + 2, … } y la
función masa de probabilidad es:
( = ) = 11 − La esperanza de una variable aleatoria binomial negativa es:
[] = ) () = (1 2
y su varianza es
Ejemplo:
La probabilidad de que un niño expuesto a una enfermedad se contagie es 0.4, determine: a) La probabilidad de que el décimo niño expuesto a la enfermedad sea el tercero en contraerla. b) El número esperado de niños que deben exponerse a la enfermedad para que hayan tres enfermos. Solución. a) Sea X la variable que representa el número de niños que han sido expuestos (3,0.4). Luego la probabilidad hasta obtener tres enfermos, entonces de que el décimo niño sea el tercero en contraer la enfermedad es: 10 1 9 ( = 10) = (0.4) (0.6) (0.4) (0.6) = 0.0645 = 3 1 2 b) El número esperado de niños que deben exponerse a la enfermedad para obtener tres enfermos es 3 ( ) = = = 7.5. 0.4
3
∼ 10−3 3
7
Distribución Hipergeométrica . Se tienen en total N objetos, de los cuales M tienen una característica deseada y los restantes N-M no. Si se seleccionan n de los objetos, la variable X que representa el número de objetos que poseen la característica deseada de los n seleccionados se distribuye hipergeométrica y se denota por ( , , ). El recorrido de la variable = {0,1,2, … , min{ , }} y la función masa de probabilidad es X es
∼ ℎ
Probabilidad y Estadística
( = ) = Además, la esperanza de X es, [ ] = y su varianza es, () = (2 ) 1 Observe que la distribución hipergeométrica es parecida a la distribución binomial siendo la principal diferencia que el muestreo es sin reemplazo, y por consiguiente, los eventos no son independientes y la probabilidad de éxito no permanece constante. Por ejemplo, es muy utilizada en casos de control de calidad donde al hacer las pruebas se deteriora el artículo y no se le puede reponer en el lote. Ejemplo:
Considérese un fabricante de automóviles que compra los motores a una compañía donde se fabrican bajo estrictas especificaciones. El fabricante recibe un lote de 40 motores del que se sabe que hay dos motores con serios defectos. Su plan para seleccionar el lote consiste en seleccionar ocho, de manera aleatoria, y someterlos a prueba. Si encuentra que a lo más uno de los motores presenta serios defectos, el fabricante acepta el lote; de otra forma lo rechaza. Determine: a) La probabilidad de que sea aceptado. b) El número esperado de motores en buen estado de los ocho seleccionados. Solución.
∼
a) Sea X el número de motores en buen estado en la muestra. Claramente (40,38,8). Pues hay 40 motores, 38 de los cuales están en buen estado y se van a seleccionar ocho. Como el lote es aceptado si a lo más uno presenta serios defectos, esto es equivalente a que si al menos hubieran siete en buen estado, por lo que la probabilidad de que el lote sea aceptado es, 38 2 38 2 0 = 0.3282 + 0.6359 = 0.9641. 1 + 8 ( 7) = ( = 7) + ( = 8) = 7 40 40 8 8 b) El número esperado de motores en buen estado de la muestra es, (8)(38) 38 ( ) = = = = 7.6 40 5
ℎ ≥
Distribución Poisson. Muchos eventos aleatorios ocurren de manera independiente con una velocidad constante en el tiempo o en el espacio. Algunos ejemplos típicos son el número de personas que llegan a una tienda de autoservicios en un tiempo determinado, el número de defectos en piezas similares para el material, el número de bacterias en un cultivo, etc.
Probabilidad y Estadística
Si se considera un intervalo de tiempo fijo en el que se desea contar el número de eventos que se presentan y dicho intervalo se puede dividir en subintervalos con una longitud suficientemente pequeña tal que: 1. La probabilidad de que se presente más de un evento en un subintervalo es cero. 2. La probabilidad de un evento en un subintervalo es la misma para todos los subintervalos y proporcional a la longitud del subintervalo. 3. El número de eventos en cada subintervalo es independiente de los demás subintervalos. Entonces la variable aleatoria X que representa el número de eventos que se presentan en el intervalo fijo es Poisson con parámetro , donde representa el promedio de ( ). eventos que se presentan en el intervalo. En tal caso se escribe
∼
= {0,1,2,3, … } y la función masa de probabilidad es: − ( = ) = ! . [ ] = () = . La esperanza de esta variable aleatoria y su varianza son El recorrido de la variable X es
Ejemplo:
El promedio de imperfecciones por milímetro en un alambre de cobre es 2.3. Determine: a) La probabilidad de que en un milímetro se tengan 2 imperfecciones. b) La probabilidad de que en tres milímetros se tengan al menos dos imperfecciones. c) El número esperado de imperfecciones en 10 milímetros. Solución.
a) Sea X la variable que mide el número de imperfecciones por milímetro, entonces (2.3). Por lo tanto, la probabilidad pedida es . (2.3) ( = 2) = = 0.2651 2! b) Sea X la variable que mide el número de imperfecciones por cada tres milímetros, (6.9) pues como en cada milímetro el promedio de entonces imperfecciones es 2.3 entonces en tres milímetros hay 3(2.3)=6.9 imperfecciones. Por lo tanto, la probabilidad pedida es . (6.9) . (6.9) ( ( = 0) ( = 1) = 1 2) = 1 = 0.9920 0! 1! c) Como en un milímetro hay en promedio = 2.3 imperfecciones, el número de imperfecciones en diez milímetros es = 10(2.3) = 23 y como ( ) = se concluye que ( ) = 23.
∼
−2 3
2
∼
≥
−6 9
0
−6 9
1
La distribución Poisson también sirve para aproximar probabilidades cuando la variable ( , ), es grande y pequeño; de manera tradicional la aleatoria X tiene distribución aproximación se utiliza cuando de la 20 y 0.05 . En tal caso, el parámetro distribución Poisson es = . Veamos un ejemplo.
≥ ≤
Probabilidad y Estadística
Ejemplo: Suponga que el 2% de los artículos producidos por una fábrica están defectuosos. Encuentre la probabilidad de que haya tres artículos defectuosos en una muestra de 100 artículos. Solución.
Sea X la variable que representa el número de artículos defectuosos, es claro que (100,0.02). Por lo que la probabilidad pedida es, 100 ( = 3) = (0.02) (0.98) = 0.1822 3 Si se utiliza la aproximación a la Poisson mencionada con = = 100(0.02) = 2 entonces, (2) ( = 3) = = 0.1804 3! que es aproximado al valor verdadero.
∼
3
−2
97
3