Prof. Claudio Alfredo López Miranda Probabilidades binomiales y el teorema del límite central La distribución de probabilidades binomial de parámetro y el teorema del límite central Cuando seleccionamos una muestra para algún análisis estadístico, por lo general realizamos el muestreo sin reemplazo. Por ejemplo, al probar artículos manufacturados o realizar encuestas, solemos diseñar el proceso del muestreo de modo que los artículos no se seleccionan una segunda vez. Estrictamente hablando, el muestreo sin reemplazo implica sucesos dependientes, que violan el segundo requisito de las variables binomiales. Sin embargo, la siguiente regla práctica se basa en el hecho de que si la muestra es muy pequeña, en relación con el tamaño de la población, podemos tratar a los ensayos como independientes (aún cuando en realidad sean dependientes), ya que la diferencia en los resultados será insignificante. Regla empírica: Cuando se realiza un muestreo sin reemplazo, los sucesos pueden tratarse como si fueran independientes, si el tamaño de la muestra n no es mayor que el 5% del tamaño de la población N. Es decir, n ≤ 0.05N. Nota de Jay Devore: Cuando p se acerca a 0.5, la distribución de cada Xi es razonablemente simétrica. Utilizando la aproximación del TLC sólo si tanto np ≥ 10 y n(1-p) ≥ 10 garantiza que n es suficientemente grande para superar cualquier asimetría de la distribución de Bernoulli subyacente. Sin embargo si np o nq son pequeños, la distribución binomial presenta un sesgo importante y la distribución normal simétrica no es una buena aproximación. La aproximación es buena cuando n es grande en comparación con p. Omitir esta parte: Por demostrarlo con una simulación, motivo para plática.. ¡cual es el valor mínimo de n para que np y nq sean mayor a 10 (a 5). Poner aquí grafica de 0-1 con probabilidad p = 0.52 y p = 0.9. 1. De acuerdo con la Chemical Engineering Progress (noviembre de 1990), aproximadamente 30% de todas las fallas de operación de tuberías en plantas químicas son ocasionadas por errores del operador a) ¿cuál es la probabilidad de que de las siguientes 10 fallas al menos 5 se deban a error del operador? b) Cuál es la probabilidad de que no más de cuatro de 10 fallas se deban a error del operador? c) Suponga que una planta particular se observa una muestra aleatoria de 10, de las cuales exactamente cinco fueron errores del operador. ¿considera que la cifra de 30% anterior se aplique a esa planta? ¿si, no y por qué? (sugerencia, analice la magnitud de la probabilidad de que ocurra lo que dice la muestra?) 2. [2, p.156] McDonald´s ha anunciado que utilizarán nuevo aceite de cocinar para sus papas a la francesa que reducirá sustancialmente los niveles de ácidos grasos e incrementará la cantidad de grasa polinsaturada más beneficiosa. La compañía afirma que 97 de 100 personas nos son capaces de detectar una diferencia de sabor entre los nuevos y los viejos aceites. Suponiendo que esta cifra es correcta (como proporción a largo plazo) ¿Cuál es la probabilidad aproximada de que en una muestra aleatoria con 1000 individuos que han comprado papas a la francesa en McDonald´s a) Por lo menos 40 puedan notar la diferencia de sabor entre los aceites? b) Exactamente 200 personas noten la diferencia de sabor? c) Cuando mucho 5% pueda notar la diferencia de sabor? 3. Sea X una v.a. binomial de parámetros n=25 y p, calcule cada una de las siguientes probabilidades mediante la aproximación normal (usando la corrección por continuidad) en los
1
Prof. Claudio Alfredo López Miranda Probabilidades binomiales y el teorema del límite central casos p = 0.5, 0.6 y 0.8. Compare con las probabilidades exactas usando la distribución binomial directamente. a) P(15 ≤ X ≤ 20) b) P(X ≤ 15) c) P(X > 20) 4. Suponga que 10% de todas las flechas de acero producidas por un proceso no cumplen con las especificaciones pero pueden ser retrabajadas (en lugar de ser desechadas). Considere una muestra aleatoria de 200 flechas y sea X el número entre estas que no cumplen las especificaciones pueden ser retrabajadas. ¿Cuál es la probabilidad de que X sea a) Cuando mucho 30? b) Menos que 30? c) Entre 15 y 25 inclusive? 5. Suponga que el 75% de todos los conductores de un Estado usan con regularidad el cinturón de seguridad. Se selecciona una muestra de 500 conductores. ¿Calcular la probabilidad de que a) Entre 300 y 400 inclusive de los conductores en la muestra usen con regularidad el cinturón de seguridad? b) Menos de 400 de aquellos en la muestra usen con regularidad el cinturón de seguridad? Antes de continuar con los ejercicios se recomienda al lector estudiar la sección 5-8 Aproximación normal a la distribución normal y de Poisson en la página 174 del libro “Probabilidad y Estadística aplicada a la Ingeniería” 2da. Edición. 6. En un canal de comunicación digital, suponga que el número de bits recibidos con error puede modelarse con una v.a. binomial, y suponga que la probabilidad de que un bit reciba con error es de 1 x 10-5. a) Utilizando la distribución binomial explique cómo calcula la probabilidad de que más de 150 bits presenten errores si se transmiten 16 millones de bits. b) Ahora aplique el TLC para aproximar la probabilidad binomial solicitada en el inciso a) usando la distribución normal. c) Comparando a) y b) ¿Aprecia la importancia del TLC? d) Verifique si los valores de np y n(1-p) son mayores que 10 para analizar que tan buena será la aproximación del TLC. 7. Considere de nuevo la transmisión de bits del ejercicio 7. Para juzgar que tan bien funciona la aproximación normal, suponga que sólo van a transmitirse n = 50 bits y que la probabilidad de un error es p = 0.1. a) Calcule la probabilidad exacta de que ocurran 2 o menos errores usando la distribución binomial. b) Calcule la probabilidad aproximada de que ocurran 2 o menos errores usando la distribución normal sin factor de corrección. c) Calcule la probabilidad aproximada de que ocurran 2 o menos errores usando la distribución normal con factor de corrección. d) Compare a), b) y c) ¿qué opina de la aproximación normal cuando se transmite un muestra pequeña de bits? 8. Un canal de comunicación digital binaria transmite una secuencia de bits. Suponga que ocurra que para cualquier bit particular transmitido existe una probabilidad de 0.1 de que ocurra un error en la transmisión. Suponga que los errores en los bits son independientes uno de otro. a) Considere transmitir 1000 bits. Cuál es la probabilidad de que cuando mucho ocurran 125 errores de transmisión? b) Suponga que el mismo mensaje de 1000 bits es enviado en dos momentos diferentes independientemente uno de otro. ¿Cuál es la probabilidad aproximada de que el número de errores en la primera transmisión sea dentro de 50 errores el número en la segunda? Se
2
Prof. Claudio Alfredo López Miranda Probabilidades binomiales y el teorema del límite central resuelve con probabilidad conjunta P(-50 < X1 - X2 < 50). Sugerencia: Como X1 se aproxima por una normal al igual que X2, la diferencia también se aproxima por una normal (una resta se puede ver como una suma de variables negativas); entonces, X = X1 X2 también se aproxima por una normal con media igual a la diferencia de las medias de X1 y X2 y con varianza igual a las suma de las varianzas de cada una. La distribución de Poisson se puede ver como el límite de una distribución binomial cuando el número de ensayos se incrementa a infinito. Por consiguiente, no debe sorprender encontrar que la distribución normal puede usarse para aproximar probabilidades de una v.a. de Poisson. Si X es una v.a. de Poisson recuerde que E(X) = λ y V(X) = λ. Entonces λ √λ Tiene aproximadament la distribución normal estándar (0,1). La aproximación es buena parea λ > 5. 9. Suponga que el número de partículas de asbesto en un centímetro cuadrado de polvo sigue una distribución de Poisson con una media de 1 000. Si se analiza un centímetro cuadrado de polvo, ¿cuál es la probabilidad de encontrar menos de 950 partículas de polvo? 10. Suponga que X es una v.a. binomial con n = 200 y p = 0.4 a) Aproxime la probabilidad de que X sea menor o igual que 70. b) Aproxime la probabilidad de que X sea mayor que 70 y menor que 90. 11. Suponga que X es una v.a. binomial con n = 100 y p = 0.1 a) Calcule la probabilidad exacta de que X sea menor que 4. b) Aproxime la probabilidad de que X sea menor que 4 y compare con el inciso a). c) Aproxime las probabilidades de que 8 < X ≤ 12 usando corrección por continuidad adecuada. 12. Suponga que el número de partículas de asbesto en una muestra de un centímet ro cuadrado de polvo es una variable aleatoria de Poisson con una media de 1000. ¿Cuál es la probabilidad de que 10 centímetros cuadrados de polvo contengan más de 10000 partículas? 13. En la fabricación de chips semiconductores se producen 2% de chips defectuosos. Suponga que los chips son independientes y que un lote contiene 1000 chips. a) Use la corrección de continuidad para aproximar la probabilidad de que entre 20 y 30 chips estén defectuosos. b) Use la corrección de continuidad para aproximar la probabilidad de que exactamente 20 chips estén defectuosos. c) Determine el número de chips defectuosos x, tal que la aproximación normal de la probabilidad de obtener x chips defectuosos sea la máxima. Recordatorio: Decimos que un evento es poco común si su probabilidad de ocurrencia es muy baja, generalmente se utiliza una probabilidad igual o menor al 5% como criterio para decir que el evento es poco común. Si un evento es poco común pero al realizar el experimento éste ocurre, entonces se debe sospechar lo contrario (es decir, que el evento no es poco común), por lo que el supuesto original es posible que sea falso. En adelante use la corrección por continuidad para aproximar la binomial a través de la normal.
3
Prof. Claudio Alfredo López Miranda Probabilidades binomiales y el teorema del límite central 14. [2, p. 273] Cuando un avión se carga con pasajeros, equipaje, carga y combustible, el piloto debe verificar que el peso completo no rebase el límite máximo permitido, por lo cual el peso tiene que distribuirse de forma conveniente para que el equilibrio del avión esté dentro de los límites aceptables de seguridad. Air América estableció un procedimiento según el cual debe reducirse la carga extra siempre que un avión con 200 pasajeros incluya al menos 120 hombres. Calcule la probabilidad de que, de 200 pasajeros seleccionados al azar, haya al menos 120 hombres. Suponga que la población de pasajeros potenciales consiste en un número igual de hombres y mujeres. 15. [2, p. 279] Estime la probabilidad de que resulten más de 55 niñas en 100 nacimientos. Suponga que los niños y niñas son igualmente probables. ¿Es poco común que resulten más de 55 niñas en 100 nacimientos? 16. [2, p. 279] Estime la probabilidad de que resulten al menos 65 niñas en 100 nacimientos. Suponga que los niños y niñas son igualmente probables. ¿Es poco común que resulten al menos 65 niñas en 100 nacimientos? 17. [2, p. 279] Estime la probabilidad de aprobar un examen de verdadero/falso de 100 preguntas, si el 60% (o 60 respuestas correctas) es la calificación mínima de aprobación y si todas las respuestas se hacen adivinando. ¿es la probabilidad lo suficientemente alta como para arriesgarse a aprobar adivinando en lugar de estudiar? 18. [2, p. 279] Cuando Mendel realizó sus famosos experimentos de hibridación, utilizó chícharos con vainas verdes y vainas amarillas. Uno de los experimentos implicó una cruza de chícharos, de manera que se esperaba que el 25% (145) de los 580 chícharos vástagos tuvieran vainas amarillas. En lugar de obtener 145 chícharos con vainas amarillas, obtuvo 152. Suponiendo que el porcentaje del 25% de Mendel es correcto, estime la probabilidad de obtener al menos 152 chícharos con vainas amarillas, entre los 580 chícharos vástagos. ¿Existirá una fuerte evidencia que sugiera que la probabilidad del 25% de Mendel es incorrecta? 19. [2, p. 279] La probabilidad de que una persona que no recibe ningún tratamiento tenga síntomas de gripe es de 0.019. En un ensayo clínico de Lipitor, un fármaco común para disminuir el colesterol, 863 pacientes recibieron un tratamiento con tabletas de Atorvastatin de 10 mg, y 19 de estos pacientes experimentos síntomas de gripe (según datos de Pfizer, Inc.). Suponiendo que estas tabletas no influyen en los síntomas de la gripe, estime la probabilidad de que al menos 19 de las 863 personas experimentes síntomas de gripe. ¿Sugieren estos resultados acerca de los síntomas de gripe que hay una reacción adversa al fármaco? 20. [2, p. 280] El 9% de los hombres y el 0.25% de las mujeres no pueden distinguir entre los colores rojo y verde. Este tipo de daltonismo causa problemas con las señales de tránsito. Un grupo de médicos necesitan al menos 50 hombres con este tipo de ceguera al color, de manera que seleccionan aleatoriamente a 600 hombres para un estudio de percepción de las señales de tránsito. Estime la probabilidad de que almenos 50 de los hombres no distingan entre el rojo y el verde. ¿es el resultado lo suficientemente alto para que los médicos puedan confiarse de obtener al menos 50 hombres con daltonismo? 21. [2, p. 280] Air América la nueva política de registrar 400 personas en un avión que tiene sólo 350 asientos. Estudios anteriores han revelado que el 85% de los pasajeros registrados llegan al vuelo. Estime la probabilidad de que si Air America registra a 400 pasajeros, no haya suficientes asientos disponibles. ¿Es esta probabilidad lo suficientemente baja para ser funcional, o deberá modificarse la política? 22. [2, p. 280] Recientemente, el 72.3% de los vuelos de American Airlines llegaron a tiempo. Al verificar 40 vuelos de American Airlines, seleccionados al azar, 19 llegaron a tiempo. Estime la probabilidad de que 19 vuelos o menos, entre 40, lleguen a tiempo suponiendo que el porcentaje del 72.3% sea correcto. ¿Será poco común que 19 vuelos o menos, entre 40 vuelos de American Airlines seleccionados aleatoriamente lleguen a tiempo?
4
Prof. Claudio Alfredo López Miranda Probabilidades binomiales y el teorema del límite central 23. [2, p. 280] Según representantes de asuntos de consumo de Mars (la compañía de dulces), el 10% de todos los dulces sencillos M&M son azules. En un estudio se tuvo que de 100 M&M elegidos al azar sólo cinco resultaron azules. Estime la probabilidad de obtener 5 o menos dulces azules entre 100 M&M seleccionados al azar; suponga que el porcentaje de azules del 10%, establecido por la compañía, es correcto. Con base en este resultado, ¿será poco común obtener cinco o menos M&M azules cuando se seleccionan 100 al azar? ¿considera correcta la suposición del 10% de la compañía? 24. [2, p. 280] El 45% de nosotros tiene sangre del grupo O según datos de la Secretaría de Salud. Cierto hospital está realizando una campaña de donación de sangre, ya que su abastecimiento de sangre del grupo O es baja y necesita 177 donadores de este tipo de sangre. Si 400 voluntarios donan sangre, estime la probabilidad de que el número de personas con sangre del grupo O sea al menos de 177. ¿es probable que el grupo de 400 voluntarios sea suficiente? 25. [2, p. 281] La Dyton Machine Company compra tornillos de máquina en lotes de 5000 y rechaza un lote si, cuando se saca una muestra de 50, al menos dos son defectuosos. Estime la probabilidad de rechazar un lote si el proveedor está fabricando los tornillos con una tasa de defectos del 10%. ¿Es posible que el plan de verificación identifique la tasa inaceptable de defectos? 26. [2, p. 281] Entre los conductores de 20 a 24 años de edad hay una tasa del 34% de accidentes automovilísticos en un año (según datos del National Safety Council de Estados Unidos). Un investigador de seguros encuentra que en un grupo de 500 conductores con edades entre 20 y 24 años, que se seleccionó aleatoriamente, y que viven en la ciudad de Nueva York, el 40% tuvo accidentes el año anterior. Si el porcentaje del 34% es correcto, estime la probabilidad de que en un grupo de 500 conductores seleccionados al azar, al menos el 40% tuviera accidentes el año anterior. Con base en este resultado ¿Existe fuerte evidencia que apoye la aseveración de que la tasa de accidentes en la ciudad de Nueva York es mayor al 34%? 27. [2, p. 281] Una reciente encuesta de Gallup incluyó a 1012 adultos que se seleccionaron al azar, a quienes se les preguntó si “la clonación humana debe o no permitirse”. Los resultados mostraron que el 89% de los encuestados indicaron que no debe permitirse. Un reportero de noticias desea determinar si estos resultados de encuesta constituyen una fuerte evidencia de que la mayoría (más del 50%) de las personas se oponen a dicha clonación. Suponiendo que el 50% de todas las personas se oponga, estime la probabilidad de obtener al menos 89% de oposición en una encuesta de 1012 personas al azar. Con base en este resultado, ¿hay fuerte evidencia que apoye la afirmación de que la mayoría se opone a la clonación humana? 28. [2, p. 281] Los tiempos de reemplazo de televisores se distribuyen normalmente, con una media de 8.2 años y una desviación estándar de 1.1 años. Estime la probabilidad de que, para 250 televisores seleccionados al azar, al menos 15 de ellos tengan tiempos de remplazo mayores de 10 años. 29. [2, p. 281] Suponga que un jugador de beisbol tiene un porcentaje de bateo de 350, es decir, tiene una posibilidad de 0.350 de pegar de hit en cada turno y que cada turno es independiente. a) Calcule la probabilidad de que pegue al menos un hit en cuatro intentos. b) Suponga que este jugador toma cuatro turnos al bat en cada partido, estime la probabilidad de que batee un total de al menos 56 hit en 56 juegos. c) Suponga que este jugador toma cuatro turnos al bat en cada partido, estime la probabilidad que pegue al menos un hit en cada uno de los 56 juegos consecutivos (que es el récord de George DiMaggio de 1941). d) ¿Cuál es el promedio mínimo de bateo que se requerirá para que la probabilidad del inciso c) sea mayor que 0.1? 30. [2, p. 281] Vertigo Airlines trabaja únicamente con reservaciones anticipadas y registra una tasa del 7% de personas que no se presentan. ¿Cuántas reservaciones podrían aceptarse para un avión con una capacidad de 250, si hay al menos una probabilidad de 0.95 de que todos los individuos que reservaron y se presenten se les acomode?
5
Prof. Claudio Alfredo López Miranda Probabilidades binomiales y el teorema del límite central 31. [2] (Binomial-Tamaño de muestra) Marios´s Pizza acaba de inaugurarse. Por falta de entrenamiento de los empleados existe sólo un 0.8 de probabilidad de que una pizza sea comestible. Se acaban de ordenar cinco pizzas. ¿Cuál es el número mínimo de pizzas que deben prepararse para estar al menos 99% seguros de que habrá cinco pizzas comestibles. 32. [2] (Normal) La ciudad de Newport opera un depósito de basura que se sobrecarga si las descargas de desperdicios de sus 4872 hogares exceden una media de 27.88 libras en una semana. En muchas semana se observa que las muestras de 4872 hogares tienen pesos que se distribuyen de manera normal, con media 27.44 libras y una desviación estándar de 12.46 libras. ¿Cuál es la proporción de semanas cuando el depósito de basura se sobrecarga? ¿Será un nivel aceptable o se deben tomar acciones para corregir un problema de un sistema que se sobrecargó? REFERENCIAS BIBLIOGRAFICAS [1]. Montgomery y Runger, p. 175 [2]. Mario F. Triola [3]. Meyer [4]. Lay Devore [5]. Susan Milton de computación [6]. Walpole y Myers
ALUMNOS OMITIR: NOTA la suma de variables aleatorias tiene aproximadamente una distribución normal, según el teorema de límite central, cuando no ninguno de los factores aporta grandes cantidades que predomine en la suma.
6