CAPITULO II
PROBABILIDAD Hasta ahora se ha utilizado una serie de métodos que permitían describir y sacar conclusiones de los datos que se manipulaban; sin embargo, muchas veces se desea inferir estas conclusiones a grupos de datos no observados de los cuales forman parte los primeros. Así, a partir d e los sueldos de un grupo de personas “elegidas al azar” se puede estimar y hacer hipótesis acerca de los parámetros del sueldo de toda una población. Un problema en este tipo de tareas tiene que ver con la variabilidad de los resultados. La estimación, por ejemplo, del promedio de los sueldos de toda una población depende del grupo de personas que al azar se escogió, no sabiendo a ciencia cierta si el valor estimado está cerca o lejos del verdadero. El propósito ahora es determinar un modelo que describa este tipo de situaciones y que permita establecer una medida de la incertidumbre de los resultados. La teoría de la Probabilidad proporciona los modelos para estudiar los fenómenos que se caracterizan por la variabilidad de sus resultados. Estos modelos se llaman modelos aleatorios. En general, un modelo describe las propiedades fundamentales de un fenómeno sin describir todos los detalles. A menudo se usan diferentes modelos para describir realidades: para representar un automóvil se puede utilizar un automóvil construido a escala y así se tiene un modelo físico del automóvil. Para representar a la Tierra se usan mapas o esferas de plástico. Estos modelos se llaman analógicos. Existen otros modelos propios de las ciencias experimentales, llamados modelos abstractos. Los modelos abstractos pueden clasificarse en modelos determinísticos y modelos aleatorios o estocásticos. En un modelo determinístico, los fenómenos se describen mediante funciones matemáticas. Así, para representar el área de una plancha rectangular de aluminio se determina el largo por el ancho del rectángulo que la representa. Los modelos aleatorios o estocásticos describen los resultados de los llamados experimentos aleatorios. Este tipo de experimentos se estudia a continuación.
1 44. Probabilidad.
2.1. EXPERIMENTO ALEATORIO. ESPACIO MUESTRAL. EVENTO. Experimento aleatorio. Un experimento aleatorio , es todo proceso que se puede repetir indefinidamente obteniéndose resultados imprevisibles.
Existen experiencias cuyos resultados son imprevisibles pero que no pueden repetirse cuantas veces se desee; tal es el caso del experimento consistente en observar si para cierto día lloverá o no en un lugar determinado a las 8 a.m. Esta experiencia no se puede repetir cuantas veces se desee, el mismo día y en la misma hora. Tal vez podamos conseguir situaciones semejantes en cuanto se refiere a lugar y hora pero no en el mismo instante. Estas experiencias, con resultados imprevisibles pero que no pueden repetirse cuantas veces se desee, también son consideradas como experimentos aleatorios por aquellos que suelen llamarse subjetivistas, por contraposición con los frecuentistas, quienes aceptan como experiencias aleatorias aquellas que son repetibles cuantas veces se desee y con resultados imprevisibles. Los principios generales de la Teoría de la Probabilidad que se estudian pueden aplicarse a partir de cualquiera de las dos posiciones antes indicadas. Los siguientes experimentos pueden considerarse aleatorios: a) La elección de una bola de una urna, en donde existen cuatro bolas rojas y dos negras, para luego anotar su color. b) El nacimiento de un niño, para luego anotar si es varón o mujer. c) La elección de un ciudadano, para luego anotar su grado de instrucción. d) La producción de un artículo por una determinada máquina, para luego anotar si es bueno o defectuoso.
Espacio muestral de un experimento aleatorio. Dado un experimento aleatorio E, se llama espacio muestral de E al conjunto formado por todos los resultados posibles d el experimento.
El espacio muestral se denota con Ω. 2.1. Ejemplo. Si se lanza una moneda, se tendrá que el espacio muestral de la experiencia aleatoria es Ω = {c, s}, donde c = cara, s = sello. 2.2. Ejemplo. Si se elige a un ciudadano para luego anotar su grado de instrucción: analfabeto (A), primaria (P), secundaria (S) y superior (U); se tendrá que el espacio muestral es igual a
Probabilidad. 1 45
Ω = {A, P, S, U}. 2.3. Ejemplo. Se lanza una moneda en forma sucesiva hasta que se obtiene cara. El espacio Ω de este experimento aleatorio está formado por los siguientes resultados: c,
ocurre cara en el primer lanzamiento,
sc,
ocurre cara en el segundo lanzamiento,
ssc, ... etc.
ocurre cara en el tercer lanzamiento, ...
2.4. Ejemplo. Si consideramos el experimento aleatorio que consiste en observar el día de mañana en un determinado lugar para ver si llueve o no, se tendrá que el espacio muestral está formado por los resultados: "llueve" y "no llueve". Si observamos el lugar para medir la cantidad de lluvia que cae, se tiene como espacio muestral al conjunto [0, a], en donde “a” puede ser un número pequeño o un número muy grande. No sabiendo cuál será el valor a, en ejemplos como éste se conviene en tomar como espacio muestral al intervalo [0, +∞[ . 2.5. Ejemplo. Si se eligen dos personas una después de otra para observar si son varones (v) o mujeres (m), se tendrá el siguiente espacio muestral:
Ω = {(v, v), (v, m), (m, v), (m, m)}, Para cada resultado, la primera coordenada indica si la primera persona es varón o mujer. De igual manera para la segunda coordenada. El espacio muestral puede ser finito o infinito. Un espacio muestral infinito puede ser enumerable, (ejemplo 2.3) o no enumerable, como el espacio [0, +∞[ en el ejemplo 2.4. Los elementos de un espacio muestral finito o infinito enumerable se pueden contar.
Suceso o evento. Un suceso o evento de un experimento aleatorio E, es cualquier subconjunto del espacio muestral Ω que corresponde a E.
En particular, el espacio muestral, Ω, y el conjunto vacío, Φ, son eventos, pues son subconjuntos de Ω. Al lanzar una moneda, el espacio que se obtiene es Ω = {c, s}, donde c = cara y s = sello.
Los eventos que se pueden obtener son: {c}, {s}, Ω y Φ.
1 46 . Probabilidad.
Si al realizar un experimento aleatorio el resultado pertenece a un evento A se dice que el resultado favorece al evento A o que el evento A se realiza. Si al lanzar un dado se obtiene un número par, entonces el evento A = {2, 4, 6} se real iza. El espacio muestral Ω se llama también suceso siempre cierto, siempre se realiza, mientras que Φ se llama suceso imposible, nunca se realiza. Si con cada elemento del espacio muestral se forman subconjuntos unitarios, se tendrán los eventos llamados sucesos elementales. 2.6. Ejemplo. Si el espacio muestral de un experimento está formado por todos los habitantes de un país que son mayores de 15 años, se tendrá que el conjunto formado por las mujeres del país que tienen 17 años es un evento. 2.7. Ejemplo. Un evento del espacio muestral del ejemplo 2.4 es, por ejemplo, el que se determina con la frase "que llueva a lo más 10 milímetros cúbicos". Este evento es el intervalo [0, 10].
Operaciones con eventos. Entre los eventos de Ω, se pueden definir operaciones tales como, la intersección de eventos, reunión de eventos y complemento de un evento . Dados los eventos A y B, la intersección de A y B, denotada con A ∩ B, es el evento formado por los elementos comunes a A y B. Figura 2.1 (a). El evento A ∩ B se realiza si A y B se realizan a la vez. Si A ∩ B = Φ, se dice que A y B son mutuamente excluyentes o disjuntos. La reunión o unión de A y B, que se denota con A ∪ B, es el evento que está formado por los elementos de Ω que están en A, en B o en ambos eventos a la vez. Figura 2.1.(b). El evento A ∪ B se realiza si al menos uno de los eventos A o B se realiza.
(a) A ∩ B
(b) A ∪ B Figura 2.1
(c) A
2.8. Ejemplo. Se considera el espacio muestral formado por los habitantes de la región ZZ, y los eventos: A, formado por las personas que leen el periódico "La voz" y B, formado por las
Probabilidad. 1 47
personas que leen el periódico "La tarde". Se tiene que A ∩ B es el evento formado por las personas que leen ambos periódicos a la vez, mientras que A ∪ B lo forman las personas que leen el periódico "La voz", el periódico "La tarde" o ambos a la vez. El complemento de A, que se denota con A , se define como el evento formado por los elementos de Ω que no están en A. Figura 2.1. (c). El evento A se realiza cuando el evento A no se realiza. 2.9. Ejemplo. Al lanzar tres dados, el espacio muestral que se obtiene está formado por los elementos
(1, 1, 1), (1, 1, 2), (1, 1, 3), etc. Cada resultado es una 3-tupla cuyas componentes pueden ser iguales o diferentes. Si el evento A está formado por todos los resultados en donde por lo menos hay dos números iguales, entonces el complemento de A está constituido por las 3-tuplas cuyas componentes son todas diferentes.
2.2. PROBABILIDAD DE UN EVENTO. Históricamente, para medir lo incierto se usó el concepto clásico de probabilidad. Este concepto tuvo su origen en los juegos de azar y se aplica para experiencias "aleatorias" para las cuales el espacio muestral es finito y con elementos igualmente posibles. Otra manera de medir la posibilidad de que suceda o no un evento, consiste en observar la proporción de veces que dicho evento suceda en una serie prolongada de experimentos repetidos. Se puede indicar que “la probabilidad de que un alumno asista a clase es 0.9”, si se observa en un número muy grande de veces que el 90% de ellas el alumno asiste a clases. En la siguiente sección se establece matemáticamente el concepto de probabilidad de un evento mediante una serie de axiomas que son consistentes con los conceptos mencionados anteriormente y que de manera racional resuelven el problema de medir la incertidumbre. Estos axiomas se comprenderán con mayor facilidad si se toma en cuenta lo siguiente: El espacio muestral es el evento seguro, el que siempre se realiza, de ahí que si se desea determinar una ponderación o medida para este evento, ésta debe ser máxima. En oposición, el evento vacío debe tener la menor ponderación, pues éste es el que nunca se realiza. Si decidimos que la ponderación de Ω debe ser 1 y que la de Φ debe ser 0, se tendrá, en forma natural, que para cualquier evento A, la ponderación debe ser un valor entre 0 y 1. Formalmente se tiene lo siguiente:
1 48 . Probabilidad.
Probabilidad. Dado el espacio muestral Ω , la probabilidad de un evento A, que se denota con P( A) , se define como el número que cumple con los siguientes axiomas, llamados de Kolmogorov.
1. La probabilidad de cualquier evento es un número no negativo. Esto es,
0 ≤ P( A) , para todo evento A, 2. La probabilidad del espacio muestral es 1. Esto es, P(Ω) = 1 3. Si A y B son dos eventos mutuamente excluyentes ; esto es, si A ∩ B = Φ , entonces, la probabilidad de l a unión de los dos eventos es la suma de las probabilidades de cada uno de ellos. Simbólicamente: P( A ∪ B) = P( A) + P( B), si A ∩ B = Φ.
A partir de la definición se deducen otras propiedades, como las siguientes: 4. La probabilidad del evento vacío es igual a 0. Es decir , P(Φ) = 0. 5. Si A ⊂ B, entonces P( A) ≤ P( B). 6. La probabilidad es un número entre 0 y 1. Esto es, 0 ≤ P( A) ≤ 1. 7. La probabilidad del complemento de un evento A es igual a 1 - P( A). 8. P( A ∪ B) = P( A) + P( B) − P ( A ∩ B )., para todo par de eventos A y B. El lector puede generalizar la propiedad 8 para n eventos. Probaremos las propiedades 4) y 8). 2.10. Ejemplo. Probar que P( Φ ) = 0. De mo st ra ció n . Se tiene que A ∪ Φ = A , luego P ( A ∪ Φ ) = P ( A ).
Como A ∩ Φ = Φ , P ( A ) = P ( A ∪ Φ ) = P ( A ) + P ( Φ ), según 3), y así, P ( Φ ) = 0. 2.11. Ejemplo. Probar que P( A ∪ B ) = P ( A ) + P ( B ) - P ( A ∩ B ). De mo st ra ció n . Se cumple: A ∪ B = A ∪( B ∩ A ) y B = ( A ∩ B ) ∪ ( B ∩ A ).
Probabilidad. 1 49
Aplicando la propiedad 3): P ( A ∪ B ) = P( A ) + P ( B ∩ A )
y
P ( B ) = P ( A ∩ B ) + P ( B ∩ A )
Restando miembro a miembro se llega al resultado. Aplicando dos veces la propiedad 8) en P[( A ∪ B) ∪ C )] se tiene P( A
∪ B ∪ C ) = P( A) + P( B) + P(C ) - P( A ∩ B) + P( A ∩ C ) - P( B ∩ C ) + P( A ∩ B ∩ C ).
2.12. Ejemplo. La probabilidad de que un hogar tenga teléfono es 2/3, que tenga televisor, 3/6 y de que tenga al menos uno de los aparatos, 5/6. Hallar la probabilidad de que un hogar tenga ambos aparatos. Solución. Si denotamos con A, al evento “el hogar tiene teléfono”, B , al evento “ el hogar tiene televisor, se tendrá que A ∩ B , corresponde al evento “el hogar tiene ambos aparatos y P( A ∩ B) = P( A) + P( B) − P( A ∪ B) = 2/3 + 3/6 – 5/6 = 1/3.
Medida de probabilidad. La probabilidad P se llama me dida de probab ilid ad , si en lugar de la propiedad 3) se cumple la siguiente propiedad. 3*) Para una sucesión de eventos disjuntos dos a dos: A 1 , A 2 , ... , se tiene P ( A 1 ∪ A 2 ∪ ...) = P ( A 1 ) + P ( A 2 ) + ....
Se demuestra que la propiedad 3*) implica la propiedad 3). Así, toda medida de probabilidad es una probabilidad.
Asignación de Probabilidades Los axiomas de probabilidad no indican como deben asignarse, en general, las probabilidades a los diversos resultados de una experiencia aleatoria; solamente establecen las limitaciones de las formas en que esto puede hacerse. Algunas veces esto es posible como en el caso del lanzamiento de un dado
1 50 . Probabilidad.
“equilibrado”, en donde a cada resultado se le asigna de antemano 1/6 de probabilidad, acercándose de este modo a la realidad, pues es imposible que el dado sea perfecto. Otras veces, sin embargo, tal asignación previa es imposible, por lo que es necesario lanzar el dado varias veces, digamos 200, y asignar a cada resultado su respectiva frecuencia relativa. Estas probabilidades pueden ser mejoradas lanzado un número mayor de veces, digamos 3000. En general se puede asignar probabilidades provisionales para luego “afinarlas” a partir de una mayor información de la experiencia que se estudia . A continuación se indica una manera de asignar probabilidades. 2.13. Ejemplo. ASIGNACIÓN DE PROBABILIDADES PARA UN ESPACIO MUESTRAL FINITO.
Se considera el espacio muestral finito Ω = {w1, ... , wn}. A cada resultado wi se le asigna como probabilidad el número no negativo pi, de tal manera que p1 + p2 + ... + pn = 1. Se define así una probabilidad P en el espacio muestral Ω de tal manera que P[{wi}] = pi, para i = 1, 2, ... , n. Si en la descripción anterior p1 = ... = pn = 1/ n, cada elemento de Ω se llama equiprobable. En este caso se cumple que si A es un evento de m elementos, P( A) = m / n. Si al número de elementos del conjunto A se denota con #( A), se podrá escribir P ( A) =
# ( A) # ( Ω)
En resumen, si los elementos de un espacio muestral son equiprobables, entonces la probabilidad de un evento A es P ( A ) =
Nú mero de casos favorables a A Nú mero de casos posibles
.
Esta expresión corresponde a la definición clásica de Probabilidad . A las experiencias cuyos resultados son equiprobables se les llama "experiencias al azar ". Así, "elegir una persona al azar" de un grupo de n personas equivale a asignar igual probabilidad a la elección de cada persona. En general, " elegir m objetos al azar " de un conjunto, significa que cada uno de los conjuntos formados con m elementos del conjunto tiene la misma probabilidad de ser elegido. Otros ejemplos de asignación de probabilidades son los siguientes: 2.14. Ejemplo. Si se considera que al lanzar N veces una moneda, la frecuencia relativa de cada resultado A tiende a una constante c cuando N crece indefinidamente, se podrá asignar al
Probabilidad. 1 51
resultado A la constante c como probabilidad. Este valor corresponde, en efecto, a una probabilidad. Cuando la moneda es equilibrada, la constante c es igual a 0.5. Así se puede indicar que la P(c) = P(s) = 0.5. 2.15. Ejemplo. Otra manera de asignar probabilidad a un evento, es mediante proporciones o porcentajes. A cada evento podemos asociarle un número igual a la proporción de la población que este subconjunto constituye. Así, si se observa que en un país las mujeres constituyen el 30% de la población, se podrá asignar al evento "mujer" la probabilidad 0.30.
La asignación de probabilidad con esta metodología se basa en el conocimiento de la composición de la población, previa a la realización de la experiencia. Otro ejemplo de este tipo de asignación aparece cuando se indica que la probabilidad de que el tren de Lima a Huancayo llegue a tiempo es 0.85. Esto significa que el 85% de veces el tren indicado llega a tiempo. 2.16. Ejemplo. En un grupo de personas hay 3 mujeres: N 1, N2 y N 3 y 4 varones: R1, R2, R3 y R4. Si se elige una persona "al azar", ¿cuál es la probabilidad de que ésta sea varón?. Solución.
El espacio muestral del experimento es
Ω = {N1, N2, N3, R1, R2, R3, R4}. Cada elemento de este espacio es equiprobable con probabilidad 1/7. El evento A, descrito por "elegir un varón" es {R1, R2, R3, R4}. Luego, P( A) = #( A)/#(Ω) = 4/7.
2.17. Ejemplo. Un lote de 5 artículos contiene 2 defectuosos: D1, D2 y 3 artículos no defectuosos: N1, N2 y N 3. Si se escogen 3 artículos al "azar" y de una sola vez, ¿cuál es la probabilidad de que uno de éstos sea defectuoso?. Solución. El espacio muestral de la experiencia es
Ω = {{N1, D1, D 2}, {N1, N2, N 3}, {N2, D1, D2}, {N3, D1, D2}, {N1, N2, D1}, {N1, N2, D2}, {N1, N3, D1}, {N1, N3, D2}, {N2, N3, D1}, {N2, N3, D2}}. El evento que interesa y cuya probabilidad se desea conocer es A = {{N1, N2, D1}, {N1, N2, D2}, {N1, N3, D1}, {N1, N3, D2}, {N2, N3, D1}, {N2, N3,
D2}}.
1 52 . Probabilidad.
Se sigue entonces que P( A) = #( A)/#(Ω) = 6/10. 2.18. Ejemplo. Probabilidad geométrica. Para un experimento aleatorio cuyo espacio muestral Ω es un conjunto contenido en el plano y de área diferente de cero, se define la probabilidad geométrica de un evento A contenido en Ω, como el número P ( A) =
Area ( A) Area (Ω)
La función P así definida es efectivamente una probabilidad, como puede comprobarse. La definición se extiende al caso Rn. (Cuando n = 1 el área se reemplaza por la "longitud"). 2.19. Ejemplo. 2
2
Se escoge al azar un punto del círculo C definido por x + y ≤ 4 . Hallar la probabilidad de que el punto escogido esté en el círculo D con centro el origen y radio 1. Solución. El espacio muestral Ω corresponde al círculo C y la probabilidad de que el punto elegido esté en el círculo D es Area ( D )
P ( D) =
Area ( Ω)
=
π 4π
= 0.25
2.20. Ejemplo. Hallar la probabilidad de que la suma de las coordenadas de un punto ( x, y ), elegido al azar del rectángulo con vértices (0, 0), (1, 0), (1, 1), (0, 1), esté entre los valores 0.5 y 1.5. Solución. El espacio muestral Ω corresponde al rectángulo indicado y cuya área es igual 1. Y
x+ y=1.5
1.5 1 0.5
A X
0
0.5
1
1.5
Figura 2.2
El evento A está formado por los puntos ( x, y) del rectángulo que cumplen con 0.5 ≤ x + y ≤ 15 .
Probabilidad. 1 53
y cuyo gráfico se indica en la figura 2.2. La probabilidad del evento A es P ( A ) =
Area ( A ) Area (Ω)
= 0.75.
Cuando de la definición clásica de probabilidad se trata, es necesario conocer el número de elementos de un evento más que a los mismos elementos, esto conduce al planteamiento de ciertas fórmulas de cálculo que combinadas convenientemente pueden servir, en muchos casos, como técnicas para la enumeración de puntos muestrales. El estudio de tales fórmulas podría realizarse en forma exhaustiva, pero para los fines de este texto bastará una breve introducción.
2.3. INTRODUCCION AL CALCULO COMBINATORIO. Comenzaremos por indicar el siguiente resultado. "Si A1 y A2 son dos conjuntos finitos, entonces el número de pares ordenados (a, b), donde a ∈ A1 y b ∈ A2, está dado por Número de Pares = #( A1).#( A2)".
2.21. Ejemplo. Una urna I contiene 3 esferas numeradas con 0, 1 y 2, mientras que otra, II, contiene 2 esferas numeradas con 3 y 4. De la urna I se extrae una esfera y también de la urna II. 0
3
1
4
2
Urna I
Figura 2.3
Urna II
Si con A1 denotamos al conjunto de los resultados obtenidos al extraer la primera esfera de la urna I y con A2, al conjunto formado con los resultados de extraer la segunda esfera de la urna II, se tendrá que el número de resultados que se pueden obtener al extraer las dos esferas es #( A1)#( A2) = 3×2 = 6. Los resultados son los pares que aparecen en la siguiente tabla. A1 \ A2
3
4
0
(0, 3)
(0, 4)
1
(1, 3)
(1, 4)
2
(2, 3)
(2, 4)
La fórmula del número de pares puede extenderse para 3 o más eventos.
1 54. Probabilidad.
En general , si A1, ... , An, son n conjuntos finitos, el número de n-tuplas que se pueden formar, tomando el primer elemento de A1, el segundo de A2, ... , y el n-ésimo de An es A1).#( A2)... #( A An). #( A
2.22. Ejemplo. En una urna hay dos esferas numeradas con 0 y 1. Se extraen 3 esferas de manera consecutiva y con restitución.
Se denota con A1, al evento formado por los resultados de la primera extracción, con A2, al evento formado con los de la segunda extracción y con A3, al evento formado con los de la tercera extracción. Se tiene que A1 = A2 = A3 = {0, 1}. El número de elementos del evento A, formado con las 3-tuplas de las 3 extracciones es A1).#( A2).#( A3) = 23 = 8. #( A
El ejemplo anterior es un caso particular del siguiente concepto.
Variaciones con repetición. De un conjunto E que tiene m elementos, en forma consecutiva y con restitución se escogen n de ellos. Cada n-tupla, (w1, ... , wn), que se forma con elementos de E y en donde pueden haber elementos repetidos, se llama variación con repetición. con repetición. Se puede demostrar sin dificultad que el número de variaciones con variaciones con repetición de n elementos que se pueden formar a partir de los m elementos de E de E es es m n.
2.23. Ejemplo. Dado el conjunto E = = {a, b, c, d, e }, algunas variaciones de orden 3 con repetición son:
(a, b, c), (b, a, c), (a, a, b), (b, b, b), (c, d, e), etc. Se observa que en este caso, el orden es importante; así la variación con repetición ( a, b, c) es diferente a la variación con repetición (b, a, c). En total se pueden formar 53 variaciones con repetición de orden 3, tomadas del conjunto E que tiene 5 elementos. 2.24. Ejemplo. De un grupo de 6 personas se escogen sucesivamente y con restitución 4 de ellas. ¿De cuántas maneras se pueden escoger las 4 personas?. Solución.
Probabilidad. 1 55
El evento A formado por los diferentes grupos de 4 personas elegidas con restitución tiene 64 = 1296 elementos.
Variaciones sin repetición . Dado un conjunto E con con m elementos. Las n-tuplas ordenadas, (w1, ... , wn ), sin elementos repetidos, que se pueden f orman con elementos de E, se llaman variaciones sin repetición de n elementos tomados de los m de E.
Así, del conjunto E = {a, b, c, d } se pueden formar, por ejemplo, las variaciones sin repetición de 3 elementos elementos (a, b, c), (b, c, d ), ), (c, d, b), etc. Se observa que, al igual que para las variaciones con repetición, el orden es importante; por ejemplo, la variación (b, c, d ) es diferente de la variación (c, d, b). m
El número de variaciones sin repetición se denota con V n y se puede encontrar de la siguiente manera :
El primer elemento w1 puede escogerse de m maneras. Una vez escogido w1 quedan m 1 maneras de escoger w2. Escogidos w1 y w2 quedan m - 2 maneras de escoger el elemento w3 y así sucesivamente hasta el elemento wn-1; escogido este elemento, quedan m - (n - 1) = m - n + 1 maneras de escoger el elemento wn. m
m
-
1
...
m
-
n+1
Usando la fórmula del número de n-tuplas que se pueden formar con n conjuntos se tiene que el número de variaciones sin repetición de n elementos tomados de entre los m elementos es Vnm = m(m − 1)( m − 2 ). . . (m − n + 1)
2.25. Ejemplo. Si E = {1, 2, 3, 4}, entonces el número de variaciones sin repetición de 3 elementos tomados de los 4 de E es es 4 V 3 = ( 4 )( )(3)(2 ) = 24.
Algunas variaciones variaciones de este tipo son: (1, 2, 3), (1, 2, 4), etc. 2.26 Ejemplo. De un grupo de seis personas se eligen cuatro de una en una y sin reposición. Hallar el número de grupos que así se pueden formar. Solución.
1 56. Probabilidad.
El número de grupos que de esa manera se pueden formar es igual al número de variaciones sin repetición de 4 elementos tomados de un conjunto que tiene 6 elementos. Este número es V 46 = (6 )( )(5)(4 )( )(3 ) = 360. 2.27. Ejemplo. De un grupo de 8 personas, se desea formar comités de 3 personas, donde una sea el presidente, otra el secretario y la tercera el tesorero. ¿Cuántos comités de este tipo se pueden formar?. Solución. Esta vez interesa el orden en que se escojan las 3 personas. Luego el número de tales comités es igual al número de variaciones si repetición de 3 elementos que se puedan formar con las 8 personas del grupo. Esto es, 8
V 3 = ( 8 ) ( 7 ) ( 6 ) = 336 .
Permutaciones Si en la discusión anterior, m = n, cada una de las variaciones se llama permutación de los m elementos de E y se denota con Pm.
Usando la fórmula para el número de variaciones sin repetición con n = m, se tiene m
Pm = Vm = m( m − 1)( m − 2 ) . . . 1 .
Si se define: m! = 1×2×3×...×m, para m natural mayor que cero y 0! = 1,
se podrá decir que el número de permutaciones permutaciones de m elementos es igual a Pm = m!.
OBSERVACION . m! se lee "m factorial". Se nota que cada permutación es un arreglo de los m elementos diferentes de E . 2.28. Ejemplo. Hay 6 maneras de arreglar los elementos del conjunto E = {a, b, c}; éstas son las permutaciones: (a, b, c), (b, a, c), (c, a, b), (a, c, b), (b, c, a), (c, b, a).
PROPIEDAD . El número de variaciones sin repetición de n elementos tomados de un conjunto de m elementos se puede calcular con m! V nm = (m − n ) !
Probabilidad. 1 57
Prueba. m
Vn = m( m − 1)( m − 2)... (m − n + 1) =
m( m − 1)... (m − n + 1)(m − n )...1
(m − n)...1
=
m!
(m − n)!
Combinaciones. Se trata ahora de calcular el número de subconjuntos de n elementos de un conjunto E , que tiene m elementos con n ≤ m. Cada uno de tales subconjuntos se llama combinación de n elementos tomada de los m de E m
El número de combinaciones se denota con C n y se puede hallar de la siguiente manera: m
Cada una de las C n combinaciones es un conjunto de n elementos. Por cada una de éstas hay n! permutaciones. Cada permutación así definida es una variación de n elementos tomados de un conjunto con m elementos, luego Cnm (n !) = V nm . m
Reemplazando el valor de V n se tiene m C n =
m!
.
(m − n )! n !
2.29. Ejemplo. Para A = {a, b, c, d }, las combinaciones de 2 elementos tomados de entre l os 4 de A son: {a, b}, {a, c}, {a, d }, {b, c}, {b, d } y {c, d }. Combinaciones
Permutaciones por cada combinación.
{a , b } {a, c} {a, d } {b, c} {b, d } {c, d }
(a, b), (b, a) (a, c), (c, a) (a, d ), (d , a) (b, c), (c, b) (b, d ), (d , b) (c, d ), (d , c)
Por cada una de las 6 combinaciones hay 2! permutaciones. En total hay 6(2!) = 12 variaciones de 2 elementos tomados de A. 2.30. Ejemplo. Con 8 personas se forman grupos de 3 personas cada uno, ¿cuántos de éstos se pueden obtener?.
1 58 . Probabilidad.
Solución. El número de tales grupos es igual al número de combinaciones de orden 3 que se pueden formar con las 8 personas. Se tiene entonces, 8 Num.grupos = C 3 =
8! = 56. (8 − 3)! 3!
2.31. Ejemplo. En un grupo de 50 personas hay 4 que tienen sangre con el factor RH negativo, (RH-). Hallar la probabilidad de que escogidos 5 personas al azar y de una sola vez, dos de ellas tengan el factor indicado. Solución. El espacio muestral Ω está formado por todas las maneras en que 5 personas pueden ser
escogidos de entre las 50. El número de elementos de Ω es #(Ω) = C 550 = 2118760. El evento que interesa es el evento A, descrito por "de las cinco personas escogidas, dos tienen el factor RH negativo". Se trata de encontrar P( A) = #( A)/#(Ω). Debe escogerse 2 personas con el factor RH - y 3 con RH+. Las 3 personas con RH+ deben ser escogidas de las 46 que lo tienen. Así, el número de maneras en que tales 46 4 personas pueden ser elegidos es C 3 . Por cada una de esas maneras hay C 2 maneras de 46 4
escoger 2 personas con RH-, luego el evento A tiene C3 C 2 elementos. 46
Por tanto, P( A) =
4
C3 C 2 50
C 5
= 0.0430.
2.32. Ejemplo. ¿Cuál es la probabilidad de obtener al menos dos resultados iguales al tirar 4 veces un dado equilibrado?. Solución. El espacio muestral, Ω , está formado por todas las variaciones con repetición de orden cuatro, formadas con los elementos del conjunto {1, ... , 6}.
En primer lugar, se calcula la probabilidad del evento E ⊂ Ω , que corresponde a "ninguno de los resultados son iguales". El número de elementos de E es igual al número de variaciones de orden 4 sin repetición que se pueden formar a partir de los 6 resultados posibles; esto es, #( E ) = (6)(5)(4)(3) = 360. El total de casos posibles al tirar 4 veces un dado es 64 = 1296. Luego, P ( E ) = 360/1296 = 0.2778; de este modo la probabilidad del evento pedido es
Probabilidad. 1 59
P ( E ) = 1 - P ( E ) = 1 - 0.2778 = 0.7222.
2.4. EJERCICIOS. 1. Hallar el espacio muestral de los siguientes experimentos aleatorios: E 1: Elección de tres personas de una en una sin restitución para luego anotar si cada una es “ocupado, O” o ”desocupado, D”.
E 2: Elección de un automóvil producido por una fábrica para luego anotar el espacio recorrido después de
consumir un galón de gasolina. Rpta. a) {(O,O,O), (O,O,D), (O,D,O), (D,O,O), (O,D,D), (D,O,D), (D,D,O), (D,D,D)}. b) [ 0, +∞[
2. Un experimento consiste en seleccionar al azar 4 personas y observar si su sangre tiene el factor RH+ o el factor RH-. a) Indique el espacio muestral. b) Enumerar los elementos de los sucesos que se describen a continuación: A: "Por lo menos tres personas tienen sangre con RH+". B: "A lo más dos personas tienen sangre con RH+".
3. El señor Pérez debe pasar por tres entrevistas consecutivas para ingresar a trabajar en una compañía. Las personas encargadas de las entrevistas son: Hugo, Paco y Luis, en ese orden. Sean los eventos descritos por las proposiciones que se indican. A: el veredicto de Hugo es favorable. B: el veredicto de Paco es favorable. C : el veredicto de Luis es favorable.
Usando A, B y C , escribir los eventos descritos por a) "Ninguno de los veredictos es favorable". b) "Todos los veredictos son favorables". c) "Por lo menos dos veredictos son favorables". d) "El veredicto del señor Hugo es favorable". Rpta. a) A ∩ B ∩ C c) ( A ∩ B ∩ C ) ∪ ( A ∩ B ∩ C) ∪ ( A ∩ B ∩ C) ∪ ( A ∩ B ∩ C ).
4. En una mesa hay cuatro cartas con sus respectivos sobres. Se introducen al azar las cuatro cartas, una en cada sobre. a) Usando una notación adecuada, describir el espacio muestral. b) Describir cada uno de los siguientes eventos: A: "sólo una carta se introdujo correctamente". B: "dos cartas se introdujeron correctamente". Rpta. a) Permutaciones de las cartas 1, 2, 3, 4. Así la permutación (1,2,3,4) indica que la carta 1 ha sido introducida en el sobre 1, la carta 2 se ha introducido en el sobre 2, la carta 3, en el sobre 3, etc. 5. Se escoge una persona al azar de un grupo de 100. Sean los eventos descritos por: E 1: la persona escogida es hombre, E 2: la persona escogida es mujer, E 3: la persona escogida tiene educación superior, E 4: la persona escogida proviene de un colegio estatal.
¿Qué significan los siguientes eventos: A = E 1 ∪ E 2?, B = E 2 ∩ E 3 ∩ E 4?, C = ( E 1 ∩ E 3 ∩ E 4) ∪ ( E 2 ∩ E 3 ∩ E 4)?. Rpta. B: La persona elegida es mujer con educación superior y proviene de un colegio estatal.
1 60 . Probabilidad.
6. Para comparar dos estaciones de bombeo se tiene: Para la estación 1: P( falla en la bomba ) = 0.07, P( fuga) = 0.10 y P(ambas) = 0.06. Para la estación 2: P( falla en la bomba ) = 0.09, P( fuga) = 0.12 y P(ambas) = 0.06 ¿Cuál estación tiene la mayor probabilidad de quedar fuera de servicio?. 7. Se tienen 5 computadoras de tipo A y 6 de tipo B. Si se eligen al azar 4 computadoras, a) ¿Cuál es el número de elementos que tiene el espacio muestral ?. b) ¿Cuál es el número de elementos que tiene el evento cuyos elementos están formados por dos computadoras de tipo A y dos de tipo B. Rpta. a) 330. b) C25C 26 . 8. La probabilidad de que Juan vaya a una d eterminada cita es 0.4, de que Pedro vaya a la misma cita, 0.6 y de que ambos vayan a la cita, 0.2. ¿Cuál es la probabilidad de que Juan o Pedro vayan a la cita?. Rpta. 0. 8. 9. La probabilidad de ganar el primer premio en una juego es 2/5 y la de ganar el segundo premio, 3/8.Si la probabilidad de ganar al menos uno de los dos premios es 3/4, hallar la probabilidad de ganar ambos premios. 10. Diez personas de diferentes tallas hacen cola al azar en una ventanilla. Hallar la probabilidad de que a) el más alto este al inicio de la cola. b) el más alto y el más bajo estén en los extremos de la cola c) el más alto y el más bajo estén juntos. 11. Un alumno de la universidad UU debe llevar en el segundo ciclo de estudios los cursos de Filosofía, Matemáticas y Lengua. Si la probabilidad de pasar el curso de Filosofía es 0.7, el de Lengua, 0.55, el de Matemáticas, 0.5, el de Filosofía y Matemáticas, 0.3, el de Filosofía y Lengua, 0.35, el de Matemáticas y Lengua, 0.3 y los tres a la vez, 0.2; calcular, a) la probabilidad de aprobar por lo menos dos cursos, b) la probabilidad de aprobar p or lo menos un curso, c) la probabilidad de no aprobar curso alguno. Rpta. a) 0.55 b) 0.9. 12. Una caja contiene 100 vacunas. La probabilidad de que al menos una no sea efectiva es 0.05 y de haya al menos dos no efectivas es 0.01. ¿Cuál es la probabilidad de que la caja contenga a) todas las vacunas efectivas, b) exactamente una no efectiva c) a lo más una no efectiva. 13. En una lista de electores, 3 son del partido A, 8 del partido B y 13 del partido C. Otra lista tiene 5 electores del partido A, 7 del partido B y 6 del partido C. Una persona de cada lista es elegida al azar, ¿cuál es la probabilidad de que ambas personas sean del mismo partido?. Rpta. 0.3449 14. Cinco hombres y cuatro mujeres se sientan en forma aleatoria en 9 asientos arreglados en fila. Hallar la probabilidad de que todas las mujeres estén juntas. Rpta. 0.0476. 15. Dado un segmento de longitud L, se seleccionan al azar dos puntos de éste. Hallar la probabilidad de que pueda construirse un triángulo a partir de los tres segmentos resultantes. Rpta. 0.25
Probabilidad. 1 61
16. Dos personas acuerdan encontrarse en cierto lugar entre las 8 a.m. y las 9 a.m. de un día determinado y convienen en que cada uno de ellos debe esperar al otro solamente 10 minutos. Hallar la probabilidad de que se encuentren. Rpta. 11/36. 17. Usando la probabilidad geométrica, dar un evento diferente del vacío cuya probabilidad es 0. 18. La producción de camisas de una determinada marca presenta el 2% de defectuosas. Si de un lote de 200 camisas se eligen al azar y de una sola vez 30 de ellas, ¿cuál es la probabilidad que de las camisas escogidas, 3 sean defectuosas?. Rpta. 0.0107. 19. Probar que P( A ∪ B ∪C) = P( A) + P(B) + P(C) − P (A ∩B ) − P (A ∩C ) − P (B ∩C ) + P (A ∩B ∩C ) . 20. En una caja hay n balotas numeradas del 1 al n. Las balotas se sacan de una en una sin reemplazo. Si la balota r se saca en la r - ésima extracción se considera “un éxito”. Hallar la probabilidad de obtener al menos un éxito. Rpta. 1/1! –1/2! + 1/3! - ... ( −1)n −11 / n! 21. Si la probabilidad de un evento A es p , entonces se define "la posibilidad de que ocurra A " como la razón de p a 1 - p. A menudo las posibilidades se expresan como cocientes de dos factores que no tienen un factor común y si es más probable de que no ocurra un evento, se acostumbra dar las posibilidades de que no ocurra en lugar de las que sí ocurra, ¿Cuáles son las posibilidades a favor o en contra de la ocurrencia de un evento si su probabilidad es a) 3/8; b) 0.07; c) 0.45 22. Usar la definición dada en el ejercicio anterior para probar que si las posibilidades de la ocurrencia del evento A son de a a b , donde a y b son enteros positivos, entonces P( A) =
a a +b
. Esta fórmula se usa para determinar probabilidades subjetivas. Por ejemplo, si
un alumno "siente" que las posibilidades están 7 a 4 de aprobar una materia, la probabilidad subjetiva que él se asigna es 7/11.
2.5. PROBABILIDAD CONDICIONAL Y EVENTOS INDEPENDIENTES. La probabilidad de un evento no asume condiciones especiales aparte de las que definen el experimento. Tal es el caso de la probabilidad de que una persona fume. Algunas veces; sin embargo, se requiere revisar la probabilidad de un evento a partir del conocimiento de condiciones adicionales que pueden afectar su resultado. Así, la probabilidad de que una persona fume puede ser calculada a partir de la información adicional de que la persona elegida es mujer. De este modo, el espacio muestral se ha reducido al caso de las mujeres. La probabilidad de que una persona elegida fume sabiendo que es mujer es una probabilidad condicional. Si el espacio muestral es finito y con n elementos equiprobables, la probabilidad condicional de A dado el evento B, se calcula observando que el espacio muestral se reduce a B. Así, P ( A B) =
# ( A ∩ B ) # ( A ∩ B ) / n P ( A ∩ B) = = . P( B) # ( B ) # ( B ) / n
1 62 . Probabilidad.
En general, para cualquier espacio muestral (no necesariamente finito) la probabilidad condicional se define de la siguiente manera: Dados los eventos A y B , la probabilidad del evento A sabiendo que el evento B ha sucedido, se llama probabilidad condicional de A dado B. Esta probabilidad se denota con P( A | B) y se define como P( A | B) =
P( A∩ B) P( B)
, si P ( B ) ≠ 0
Cuando P( B) = 0, se puede definir P ( A| B ) = 0. De la definición de probabilidad condicional, se deduce que P( A ∩ B) = P( A |B).P( B) o equivalentemente P( A ∩ B) = P( B |A).P( A)
A partir de la definición se obtienen también las siguientes propiedades. PROPIEDADES .
a) P( A |B) ≥ 0. b) P(Ω |B) = 1. c) P(( A1 ∪ A2)| B) = P( A1 |B) + P( A2 |B), si A1 ∩ A2 = Φ. Estas propiedades indican que la probabilidad condicional es una probabilidad en Ω. Puede obtenerse otras propiedades como la siguiente P ( A | B ) = 1 − P ( A | B) .
2.38. Ejemplo. Calcular P( A | B ) si, P( A) = 0.4, P( B) = 0.7 y P( A |B) = 0.2. Solución. Supondremos, para simplificar, que el espacio muestral Ω es un rectángulo de área igual a 1 y que los eventos A y B son como se indican. De este modo las áreas de cada región que representa a los eventos son iguales a su probabilidad.
x
x
y
A B
Figura 2.4
Probabilidad. 1 63
Como 0.2 = P ( A| B) =
P ( A ∩ B) P ( B)
,
se tiene que x = P( A ∩ B) = 0.2 P( B) = 0.2 (0.7 ) = 014 . . Se tiene: P ( A| B ) =
P( A ∩ B ) P( B )
=
y
1 − P( B)
=
0.4 − x 0.4 − 0.14 0.26 26 13 = = = = . 1 − 0.7 0.3 0.3 30 15
Eventos independientes. Si la probabilidad del evento A no depende de la realización del evento B se dice que A es independiente de B. Formalmente, Se dice que dos eventos A y B son independientes si P( A | B) = P( A).
Si la probabilidad de que una persona contraiga una enfermedad E es igual a la probabilidad de que la persona contraiga la enfermedad sabiendo que ésta es mujer, se tendrá que los eventos que indican el riesgo de contraer la enfermedad y que la persona sea mujer son independientes. La siguiente propiedad es una consecuencia directa de la definición de eventos independientes y de la probabilidad condicional. Si los eventos A y B son independientes, P( A ∩ B) = P( A)P( B)
En efecto, P( A ∩ B) = P( A | B)P( B) = P( A)P( B) 2.34. Ejemplo . En una caja hay 7 bolas rojas y 3 verdes. Se sacan dos bolas al azar de una en una. Hallar la probabilidad de que la primera sea roja y la segunda también, a) si después de sacar la primera bola, ésta se devuelve para sacar la segunda (extracción con restitución). b) si después de sacar la primera bola, ésta no se devuelve para luego sacar la segunda (extracción sin restitución). Solución. Sean los eventos: A: "La primera bola extraída es roja". B: "La segunda bola extraída es roja".
En a) como en b), se pide calcular P( A ∩ B). a) En este caso, la primera bola extraída se devuelve, la probabilidad de B no depende del evento A, éstos son independientes y P( A ∩ B) = P( A)P( B) = (7/10)(7/10) = 0.4900.
1 64 . Probabilidad.
b) Si la primera bola extraída no se devuelve, la probabilidad del evento B depende del evento A. Los eventos no son independientes y P( A ∩ B) = P( B |A)P( A) = (6/9) (7/10) = 0.4667.
2.39. Ejemplo. Se ha determinado que los motores que produce una compañía presentan dos tipos de defectos A y B. El 5% de los motores presentan el defecto A mientras que el 10% tienen el defecto B. Adicionalmente, el 3% de los motores presentan ambos defectos.
¿Cuál es la probabilidad de que un motor tenga a) el defecto A, dado q ue tiene el defecto B? b) el defecto B, dado que tiene el defecto A?. Solución. Sean los eventos A: "ocurre A" B: "ocurre B".
Se supone que P( A) = 0.05, P( B) = 0.10 y P ( A ∩ B ) = 0.03. Luego, P ( A ∩ B)
0.03 = 0.3 0 . P ( B) 0.10 P( A ∩ B) 0.03 b) P( B| A) = = = 0.60. P( A) 0.05 a) P( A| B) =
=
PROPIEDAD. Si A y B son independientes entonces A y B también lo son.
Veamos que en efecto, P ( A ∩ B ) = P ( A) P ( B ). P ( A ∩ B ) = P ( B | A) P( A) = [1 − P( B| A)] P( A) = [1 − P( B)] P( A) = P( B ) P( A).
La penúltima igualdad se cumple pues A y B son independientes. 2.40. Ejemplo. Probar que P ( A ∩ B ∩ C ) = P ( C| ( A ∩ B )) P ( B| A ) P ( A ). Solución. P ( A ∩ B ∩ C ) = P (( A ∩ B ) ∩ C ) = P ( C |( A ∩ B )) P ( A ∩ B ) = P ( C |( A ∩ B )) P ( B |A ) P ( A ).
2.41. Ejemplo. La probabilidad de que se venda un determinado producto después de ofrecerlo es 0.4. Suponiendo independencia entre las ventas, ¿cuál es la probabilidad de que la primera venta ocurra en la sexta oferta?.
Probabilidad. 1 65
Solución. Ai indica el evento: “se realiza una venta en la i-ésima oferta
La probabilidad de que no se realice la venta es 0.6. Luego la probabilidad pedida es P( A1 ∩... A5 ∩ A6 ) = P( A1 ) P( A2 )... P( A5 ) P( A6 ) = (0.65)(0.4) = 0.0311
2.42. Ejemplo. En los últimos años la Universidad ABCD ha estado llevando un registro de sus egresados que en la actualidad tienen empleo, anotando el número de años que utilizaron para terminar su carrera y su posición (Alta, media y baja) que tienen como profesionales. La siguiente información se obtuvo de 200 egresados. Alta
Media
Baja
Total
5 Años
30
70
20
120
Más de 5 años
20
30
30
80
Total
50
100
50
200
a) Basándose en la información anterior, ¿cuál es la probabilidad de que un egresado cuya duración de sus estudios fue de 5 años tenga alta posición profesional en su empleo actual?. b) Si el egresado tiene baja posición profesional en su empleo, ¿cuál es la probabilidad de que tal persona haya realizado sus estudios en más de 5 años?. c) Si el egresado tiene posición profesional media, ¿cuál es la probabilidad de que tal persona haya realizado la carrera en 5 años?. Solución. Sean los eventos descritos del siguiente modo, A: El egresado tiene alta posición profesional B: El egresado tiene mediana posición profesional C : El empleado tiene baja posición profesional D: El egresado hizo la carrera en 5 años E : El egresado hizo la carrera en más de 5 años.
a) P( A |D) = b) P( E |C ) =
P ( A ∩ D) 30 / 200 = = 0.2500. P ( D) 120 / 200 P ( E ∩ C )
c) P ( D| B ) =
= 0.6000.
P ( C ) P( D ∩ B) P( B)
= 0.7000.
2.43. Ejemplo. De acuerdo a la ‘tabla de mortalidad’ correspondiente a cien mil personas y para 1990 1995 y que se da a continuación,
a) ¿cuál es la probabilidad de que una persona esté viva a los 65 años?.
1 66 . Probabilidad.
b) ¿cuál es la probabilidad de que una persona que está viva a los 30 años lo esté a los 65 años. Edad en años 0 1 5 10 15 20
Personas vivas
Edad en años
100 000 93 823 91526 90857 90453 89848
25 30 35 40 45 50
Personas vivas
Edad en años
89937 87876 86682 85169 83210 80523
55 60 65 70 75 80
Personas vivas 76820 71569 64485 54814 42921 29703
Solución.
a) La probabilidad de que una persona esté viva a los 65 es igual a 64485/100000 = 0.64485. b) La probabilidad de que una persona esté viva a los 65 años dado que está viva a los 30 años es igual a 64485 / 100000 = 0.7338. 87876 / 100000 2.44. Ejemplo. Un alumno debe escoger entre tomar un curso de Matemáticas o llevar un curso de Letras. Si escoge el de Matemáticas la probabilidad de que lo apruebe es 1/3, mientras que si escoge el de Letras, la probabilidad de que lo apruebe es 3/4. Para decidir qué curso llevar, acuerda lanzar una moneda equilibrada. ¿Cuál es la probabilidad de que el alumno lleve el curso de Matemáticas y lo apruebe?. ¿Cuál es la probabilidad de que lleve el curso de Letras y no lo apruebe?. Solución. Sean los eventos: A, descrito por "llevar el curso de Matemáticas", M , descrito por "aprobar Matemáticas", L, descrito por "llevar el curso de Letras", y B, descrito por "aprobar el curso de Letras".
La probabilidad de llevar el curso de Matemáticas y aprobarlo es P( M ∩ A) = P( M |A)P( A) = (1/3)(1/2) = 0.1667.
La probabilidad de llevar y no aprobar el curso de Letras es P( L ∩ B ) = P( B |L)P( L) = (1 - 3/4)(1/2) = 0.1250.
(Nota: P( A) = P( L) = 1/2, pues la moneda es equilibrada)
Probabilidad. 1 67
2.45. Ejemplo. La probabilidad de fallar de cada una de las 4 piezas de un aparato es 0.001. Si el aparato funciona por lo menos con 3 de las piezas indicadas, hallar la probabilidad de que éste no funcione si cada pieza se desarrolla en forma independiente. Solución. Sea M i el evento descrito por "la pieza i no falla".
Cualquiera de los siguientes eventos indica que el aparato funciona: A = ( M 1 ∩ M 2 ∩ M 3 ∩ M 4 ), B = ( M 1 ∩ M 2 ∩ M 3 ∩ M 4 ), C = ( M 1 ∩ M 2 ∩ M 3 ∩ M 4 ), D = ( M 1 ∩ M 2 ∩ M 3 ∩ M 4 ) y E = ( M 1 ∩ M 2 ∩ M 3 ∩ M 4 ).
Como los eventos A , B , C , D y E son mutuamente excluyentes, se tiene: P ( “aparato funcione” ) = P ( A ) + P ( B ) + P ( C ) + P ( D ) + P ( E ) =
0.9994 + (0.999 3 ) (0.001) + (0.999 3 )(0.001) + (0.9993 )(0.001) + (0.9993 )(0.001) = 0.9999. La probabilidad de que el aparato no funcione es 1− 0. 9999 = 0.0001. 2.46. Ejemplo. Una tienda tiene en stock dos lavadoras al iniciar el día lunes. El stock puede renovarse sólo hasta el día miércoles. Las probabilidades de que los clientes demanden 0, 1, 2 lavadoras el día lunes son: 0.4, 0.5 y 0.1, respectivamente. Las probabilidades para el día martes son: 0.6, 0.2 y 0.2, respectivamente.
Si las demandas en los dos días indicados son independientes, hallar la probabilidad del evento A que indica que al término del día martes no exista lavadora alguna en la tienda. Solución. Si con Li y M i , denotamos los eventos que indican que i lavadoras han sido
demandadas los días lunes y martes, respectivamente, se tendrá que la probabilidad de que el día martes no exista lavadoras en stock es igual a 1 − P[( L0 ∩ M 0 ) ∪ ( L0 ∩ M1 ) ∪ ( L1 ∩ M 0 )] = 1 − (0.4 × 0.6 + 0.4 × 0.2 + 0.5 ×0.6 ) = 0 .38 . 2.47. Ejemplo. De la historia respecto de la prueba de ingreso a una Universidad se ha recabado la siguiente información: 25% de postulantes pensaron que ingresaban a la Universidad e ingresaron, 45% de los postulantes pensaron que ingresaban a la Universidad y no ingresaron, 10% no pensaban ingresar pero si ingresaron, y finalmente, 20% no pensaban
1 68 . Probabilidad.
ingresar y no ingresaron. Para un próximo examen se escoge un postulante al azar, ¿cuál es la probabilidad? a) de que no ingrese?. b) de que ingrese si piensa ingresar?. c) de que ingrese si no piensa ingresar?. Solución. Sean los eventos definidos de l a siguiente manera: A: el postulante piensa que ingresa y B: el postulante ingresa.
De la información se tiene que P ( A ∩ B ) = 0 .25, P ( A ∩ B ) = 0 .45, P ( A ∩ B ) = 0.1, P ( A ∩ B ) = 0.20.
Como A = ( A ∩ B ) ∪ ( A ∩ B ) y B = ( B ∩ A) ∪ ( B ∩ A ) , se tiene P ( A ) = P ( A ∩ B ) + P ( A ∩ B ) = 0.7 y P( B) = P( B ∩ A) + P( B ∩ A ) = 035.
Resulta entonces lo siguiente: a) la probabilidad de que el postulante no ingrese es P ( B ) = 1 − P ( B) = 1 − ( 0.25 + 0.1) = 0. 65.
b) la probabilidad de que el postulante ingrese si piensa ingresar es P ( B| A) =
0.25 = 0.3571. 0.70
c) la probabilidad de que el postulante ingrese si no piensa ingresar es P ( B| A ) =
0.1 = 0.3333. 0.3
2.48. Ejemplo. Se tiene una urna con n bolas negras y r bolas rojas. Cada vez que se saca una bola al azar se devuelve ésta a la urna conjuntamente con otras c del mismo color y otras d del color opuesto. Hallar la probabilidad de sacar negra, negra y roja en las tres primeras extracciones. Solución. La probabilidad de extraer una bola negra en la primera extracción es n /( n + r ).
Después de la primera extracción el número de bolas que hay en la urna es n + r + c + d , ( n + c negras y r + d rojas).
Probabilidad. 1 69
La probabilidad de extraer "negra, negra" en las dos primeras extracciones es n n + r
×
n+c n + r +c +d
La probabilidad de extraer "negra, negra, roja" en las 3 primeras extracciones es n n + r
×
n+c
r + 2d
×
n + r + c + d n + r + 2c + 2d
.
Nótese que si c = 0 y d = 0, se tiene una extracción sin reemplazo y si c = 0 y d = 1, se tiene una extracción con reemplazo. Si c > 0 y d = 0, se tiene el llamado "modelo de contagio ", pues cada vez aumenta la probabilidad de las extracciones del mismo color. Si c = 0 y d > 0, se tiene que después de extraer una bola de un determinado color, la probabilidad de sacar una bola del mismo color en la próxima extracción disminuye. 2.49. Ejemplo. Según una encuesta realizada,
-el 90% de los hombres ( H ) que tienen cáncer pulmonar ( C ) son fumadores ( F ). -el 70% de mujeres ( M ) que tiene cáncer pulmonar son fumadoras. -la frecuencia de cáncer pulmonar es 4 × 10 - 4 para los hombres y de 10 - 4 para las mujeres. -la proporción relativa de fumadores es 5 veces más elevada en los hombres que en las mujeres. ¿Se puede concluir que una mujer fumadora tiene más propensión de contraer cáncer pulmonar que un hombre fumador?. Solución. Los datos nos indican que: P ( F | H ∩ C ) = 0.9; es decir, P ( F |M ∩ C ) = 0.7 ; esto es,
P ( F | H ) = 5 P ( F | M ); es decir,
P( F ∩ H ∩C)
= 0.9 ,
P ( H ∩ C ) P( F ∩ M ∩ C) P ( M ∩ C ) P ( F ∩ H ) P ( H )
= 0.7 y
=5
P ( F ∩ M ) P ( M )
.
Para responder afirmativamente la pregunta es suficiente probar que P ( C| M ∩ F ) > 1. P ( C| H ∩ F )
1 70 . Probabilidad.
Usando las relaciones anteriores, se tiene: P ( C| M ∩ F ) P( C ∩ M ∩ F ) P ( H ∩ F )
=
P ( C| H ∩ F )
P( M ∩ F )
0.9 P( H ∩ C ) −4
5 P ( F | M ) 0.7 × 10 3.5 = = . 4 − P ( F | M ) 0.9 × 4 x10 3.6 Como 3.5/3.6 es mayor que 1, la respuesta es afirmativa; sin embargo, este valor es muy cercano a 1; lo que indica que una mujer fumadora tiene, prácticamente, la misma probabilidad de contraer cáncer pulmonar que un hombre fumador.
Independencia de más de dos eventos. Los eventos A1, A2, ... , An, son mutuamente independientes (o, simplemente, independientes) si para cualquier grupo de eventos diferentes Ai, A j, ..., Am , se cumple que P( Ai ∩ A j ∩ , ... , ∩ Am) = P( Ai).P( A j).....P( Am)
Según lo indicado, para que n sucesos sean independientes no es suficiente que sean independientes dos a dos; es decir, que dos cualquiera de ellos sean independientes, como lo muestra el ej emplo siguiente: Se considera el espacio muestral Ω = {a, b, c, d } sobre el que se ha definido la probabilidad P que asigna a cada elemento el valor 1/4. Sean los sucesos: A = {a, b}, B = {b, c}, C = {c, a}. Se tiene que A y B son independientes pues P ( A ∩ B ) = P ({b}) = 1 / 4 = (1 / 2 )(1 / 2 ) = P ( A ) P ( B )
De igual manera, A y C son independientes. También B y C . Sin embargo, los tres eventos A, B, C , no son mutuamente independientes puesto que P ( A ∩ B ∩ C ) = P ( Φ) = 0 ≠ P( A) P( B) P( C) = 1/ 8.
Probabilidad. 1 71
2.6. EJERCICIOS. 1. Dados P ( A) = 0.5, P( B) = 0.7 y P( A ∩ B) = 0.15, decir si A y B son independientes. Rpta. No.
2. Para dos eventos A y B se indicó P( A) = 0.65, P( B) = 0.80, P( A |B) = P( A), P( B|A) = 0.85. ¿Es correcta la asignación de probabilidades?. 3. En un estudio para introducir una nueva revista semanal se ha determinado que de 200 personas encuestados, 30 leen la revista A, 35 leen la revista B, 40 leen la revista C, 8 leen las revistas A y C, 12 leen las revistas A y B, 15 leen las revistas B y C y 6 leen las revistas A, B y C. Si con A denotamos al evento formado por todos los lectores de la revista A, con B denotamos al evento formado por todos los lectores de la revista B y con C denotamos al evento formado por todos los lectores de la revista C, hallar P( A| B), P( B| A), P( A ∩ B| C), P( A| B ∩ C) y P( A ∩ B| A ∩ C).
Rpta. P ( A| B) = 12 / 35, P( B| A) = 12 / 30.
4. Se ha determinado que las probabilidades de que un televidente vea los programas A, B, o C son: 0.5, 0. 4 y 0.7, respectivamente. ¿Cuál es el porcentaje de televidentes que ven por lo menos dos de los p rogramas?. Se asume que cada persona ve los programas independientemente uno del otro. Rpta. 0.55. 5. El 3% de la población en general padece de la enfermedad E. De ellos solamente el 40% lo saben. Si se selecciona al azar una persona, ¿cuál es la probabilidad de que padezca E pero no sea consciente de padecerla Rpta. 0.012. 6. Para que un postulante sea admitido a una Escuela Superior debe pasar con éxito al menos dos exámenes consecutivos de los tres a que es sometido en forma alternada ante dos personas A y B. Se supone que los exámenes son independientes. Por experiencia se sabe que el 40% de los postulantes aprueban el examen con A, mientras que sólo el 35% aprueban el examen con B. Si a cada postulante se le permite escoger a la persona con quien iniciar los exámenes; ¿qué recomendar al postulante, iniciar con A o con B?. Rpta. Con B. 7. Un estudiante tiene la probabilidad p (<1) de aprobar cada examen del curso C. Se le ofrecen dos alternativas: a) Dar un único examen final o b) Da r tres exámenes con la condición de aprobar por lo menos dos. ¿Cuál es la alternativa más favorable?. 8. a) Probar que si A y B son independientes, A y B también son independientes. b) Probar P( B |A) = 1 P ( B | A) .
9. En la siguiente tabla se presenta la distribución de 125 hogares de acuerdo con los ingresos de sus jefes de familia y con el hecho de ser propietarios de teléfonos y de aparatos de televisión. Hogares con ingresos de $1000 o menos
Con TV Sin TV
Hogares con ingresos de más de $1000
con teléfono
sin teléfono
con teléfono
sin teléfono
27 18
20 10
18 12
10 10
a) ¿Cuál es la probabilidad de elegir un hogar con TV?. b) Si una familia con ingresos de más de $1000 tiene teléfono, ¿cuál es la probabilidad de que tenga TV?. c) ¿Cuál es la probabilidad de elegir a un a familia que tenga un TV, dado el hecho que tiene teléfono?. d) ¿Son independientes los eventos "tener TV" y tener teléfono?. e) ¿Son independientes los eventos "ingresos de menos de $1000" y "ser propietario de TV"?. Rpta. 7. a) 0.60, b) 0.60.
1 72 . Probabilidad.
10. Doscientas p ersonas están distribuidas de acuerdo a su sexo y lugar de procedencia de la siguiente manera: 130 son varones, 110 son capitalinos, 30 son mujeres y del interior. Si se eligen dos personas al azar, ¿cuál es la probabilidad a) de que ambos sean varones y del in terior?. b) b) de que al menos una de las dos personas sea mujer?. Rpta. 8. a) 0.0889, b) 0.5786. 11. Con la finalidad de determinar la efectividad de una prueba de sangre para detectar cierta enfermedad se realizó un estudio sobre 100 personas. De las 100 personas elegidas al azar, las pruebas convencionales determinaron que 10 de ellas padecían la enfermedad y 90 de ellas no la tenían. En el grupo que no la padecían, 86 individuos resultaron con pruebas negativas y 4 resultaron con pruebas positivas. En el grupo de las personas que tenían la enfermedad se encontraron tres individuos con pruebas negativas y siete con positivas. A partir de los datos, ¿cuál es la probabilidad de que una persona con prueba positiva padezca la enfermedad?. 12. La compañía de teléfonos asegura que la fiabilidad del servicio es tal que cuando se marca correctamente el número deseado se tienen 19 chances sobre 20 de obtener tono al otro lado de la línea. a) ¿Cuál es la p robabilidad de obtener tono al otro lado de la línea en tres intentos a lo más si se supone qu e cada vez se marca el número correcto?. b) Si se estima que en el primer intento existe un chance sobre 10, de marcar un número equivocado (error de manipulación) y para el segundo intento existe 1 chance sobre 100 de equivocación; ¿cuál es la probabilidad de obtener tono al otro lado de la línea en tres ensayos a lo más?. Rpta. a) 0.9998, b) 0.9996. 13. Con el fin de probar la efectividad de un test para detectar enfermedades renales en pacientes con hipertensión, se escogieron 200 pacientes hipertensos obteniéndose los siguientes resultados: 56 pacientes tenían afecciones renales, en 55 pacientes con enfermedad renal el test resultó positivo, en 13 pacientes sin enfermedad renal el test resultó positivo. a).Hallar la "tasa falsa positiva" del test. Esto es, la probabilidad que el test resulte negativo dado que el paciente sufre de afecciones renales. b). Hallar la "tasa falsa negativa" del test. Esto es, la probabilidad que el test resulte positivo dado que el paciente no sufre de afecciones renales. 14. Una persona está expuesta al riesgo en 1000 ocasiones independientes. Si la probabilidad de que ocurra un accidente es 1/1000 cada vez, hallar la probabilidad de que un accidente ocurra en una o más ocasiones. Rpta. 0.6323. 15. Una persona tiene tiempo para jugar la ruleta cuatro veces. Gana o pierde $1 en cada juego. La persona comienza con $2 y parará de jugar antes de los cuatro juegos si pierde todo su dinero o gana $3 (o sea, si termina con $5). Hallar el número de maneras cómo pueden ocurrir los juegos. Hallar la probabilidad de ganar $2 después de 4 juegos. 16. En una urna hay dos bolas rojas y una negra. Hugo, Paco y Luis (en ese orden) deben sacar, uno después del otro, una bola sin restituirla posteriormente. ¿Cuál de las tres personas tiene mayor probabilidad de sacar la bola negra?. Rpta. Todos tienen igual probabilidad. 17. Probar que si M y D son dos eventos con probabilidad diferente de 0 entonces, P( M ) = P( M | D) si y sólo si P ( D) = P( D| M ) .
Probabilidad. 1 73
2.7. EL TEOREMA DE LAS PROBABILIDADES TOTALES Y EL TEOREMA DE BAYES. Estudiaremos previamente el teorema de las probabilidades totales. Este teorema permite el cálculo de la probabilidad de un evento A considerando la información que puede existir en un conjunto de condiciones mutuamente excluyentes.
Teorema de las probabilidades totales. Sea Ω un espacio muestral en donde se halla definida una probabilidad P. Si A1, ... , An, son eventos con la propiedad: A1 ∪ A2 ∪ ... ∪ An = Ω y disjuntos dos a dos, entonces se cumple que n
∀ A ⊂ Ω,
P ( A) =
∑ P ( A| Ai ) P ( Ai ) .
i =1
Ω
A A
1
A
...
2
A
n
Figura 2.5
Prueba.
Se tiene que A = Ω ∩ A. Reemplazando Ω por su equivalente se tiene A = ( A1 ∪ ... ∪ An) ∩ A = ( A1 ∩ A) ∪ ... ∪ ( An ∩ A).
Como Ai ∩ A j = Φ para i ≠ j resulta, ( Ai ∩ A) ∩ ( A j ∩ A) = Φ para i ≠ j, luego, P( A) = P( A1 ∩ A) + ... + P( An ∩ A) = P( A |A1)P( A1) + ... + P( A |An) P( An) n
= ∑ P( A| Ai ) P( Ai ) . i =1
2.50. Ejemplo. Una ciudad está dividida en tres distritos: A, B y C. En el distrito A vive 1/4 de la población, en el distrito B, vive 1/2 de la población y en el distrito C vive 1/4 de la población. Se ha determinado que 25 % de los que viven en el distrito A, el 20% de los que viven en B y el 18% de los que viven en C, son desocupados. Se escoge un poblador de la ciudad al azar, ¿cuál es la probabilidad de que sea desocupado?. Solución.
1 74 . Probabilidad.
Sean los eventos: A = "habitantes del distrito A", B = "habitantes del distrito B" C = "habitantes del distrito C", D = "desocupados".
Según el teorema de las probabilidades totales: P ( D ) = P ( D| A ) P ( A) + P ( D| B ) P ( B ) + P( D| C ) P( C)
= 0.25(1/4) + 0.20(1/2) + 0.18(1/4) = 0.2075. 2.51. Ejemplo. En una población en donde el 45% de las personas son mujeres, la probabilidad de que una mujer tome un seguro de vida es 0.4, mientras que l a probabilidad de que un hombre tome el mismo tipo de seguro es 0.65. ¿Cuál es la probabilidad de que una persona elegida tome un seguro de vida?. Solución.
Sean los eventos: M, descrito por "la persona elegida es mujer" V , descrito por "la persona elegida es varón". S, descrito por "la persona elegida t oma un seguro de vida".
Por el teorema de las probabilidades totales, P(S ) = P(S |M )P( M ) + P(S |V )P(V ).
Como: P(S |M ) = 0.40, P(S |V ) = 0.65, P( M ) = 0.45 y P(V ) = 0.55, se tiene P(S ) = 0.5375. Los casos descritos son experiencias aleatorias secuenciales que pueden representarse usando los llamados árboles de probabilidades , como el de la siguiente figura, en donde cada rama representa un resultado parcial de la experiencia y cada nudo terminal, un punto del espacio muestral. Sobre algunas ramas del árbol se ha escrito la probabilidad condicional del resultado que representa dada la experiencia anterior. La probabilidad de cada nudo terminal se obtiene multiplicando los números escritos sobre las ramas que conducen a él.
S
* P ( S | M )P ( M ) = (0.40)(0.45)
0.40 -
M
PERS
S
0.45
-
S
0.55
V
S
0.65
*
P ( S | V ) P ( V ) =( 0.65)(0.55)
Figura 2.6. Los nodos terminales que indican el resultado S están marcados con *.
Probabilidad. 1 75
2.52. Ejemplo. Dos máquinas producen un mismo artículo. La probabilidad de que la máquina 1 produzca un artículo defectuoso es 0.01, mientras que la máquina 2 produce un artículo defectuoso con probabilidad 0.02. De un gran lote de artículos producidos se extrae uno al azar, hallar la probabilidad de que sea defectuoso si el lote contiene 50% de artículos producidos por la máquina 1 y 50% de artículos producidos por la máquina 2. Solución. Sean los eventos: M 1 , descrito por "el artículo es producido por la máquina 1". M 2 , descrito por "el artículo es producido por la máquina 2". D , descrito por "el artículo es defectuoso".
Por el teorema de las probabilidades totales, P ( D ) = P ( D | M 1 ) P ( M 1 ) + P ( D | M 2 ) P ( M 2 ).
Como: P ( D | M 1 ) = 0.01, P ( D |M 2 ) = 0.02 y P ( M 1 ) = P ( M 2 ) = 0.5, se tiene P ( D ) = 0.015.
D
ART
D
1
0.5 M 2
= ( 0.01)(0.50) = 0.005
-
M
0.5
* P ( D | M )P ( M ) 1 1
0.01
-
D D
0.02
*
P ( D | M ) P ( M ) = 0.01
2
2
Figura 2.7 . Lo s no do s te rm in al es qu e in di ca n el ev en to D es tá n ma rc ad os co n * .
El teorema de Bayes. Un candidato a una curul parlamentaria puede recibir información indicándole que ganará las elecciones con el 80% d e probabilidad. Esta probabilidad puede ser revisada a la luz de información adicional, como por ejemplo un sondeo de opinión. De este modo tomará determinadas acciones; tal vez realize más presentaciones públicas. El teorema de Bayes (Reverendo T. Bayes 1702-161), que a continuación se desarrolla, es una herramienta que permite determinar, a partir de la probabilidad “a priori” P( Ai), la probabilidad "a posteriori" del evento Ai, dada una cierta información A, permitiendo revisar estimaciones anteriores y reducir el riesgo en la toma de decisiones.
1 76 . Probabilidad.
Teorema. (De Bayes). Con las mismas hipótesis del teorema de las probabilidades totales, se cumple P ( Ai | A ) =
P ( A| Ai ) P ( Ai )
, para i = 1,..., n
n
∑ P ( A| Ak ) P ( Ak )
k =1
Prueba. P ( Ai | A ) =
P ( A ∩ Ai ) P ( A)
=
P ( A| Ai ) P ( Ai ) n
.
∑ P ( A| Ak ) P ( Ak ) k =1
La última igualdad se obtiene usando el teorema de las probabilidades totales. 2.53. Ejemplo. La probabilidad de obtener éxito en un negocio es 0.7 si no interviene en el mercado una firma competidora, mientras que si interviene la firma competidora la probabilidad de éxito será solamente 0.4. Se ha determinado que la probabilidad de que la firma competidora intervenga en el mercado es 0.8.
a) ¿Cuál es la probabilidad de que se obtenga éxito en el negocio?. b) Si se obtuvo éxito en el negocio, ¿cuál es la probabilidad de que haya intervenido la firma competidora en el negocio?. Solución. Con I denotamos al evento descrito por “interviene la firma competidora”, y con E , al evento descrito por “la compañía obtuvo éxito.
a) Usando el teorema de las probabilidades totales, P( Exito) = P( Exito| I ).P( I ) + P( Exito| I ) P ( I ) = (0.7)(0.2) + (0.4)(0.8) = 0.46.
b) Por el teorema de Bayes, P( I | E ) =
P( E| I) P( I ) P( E )
=
(0.4 )(0.8) 0.46
=
0.32 0.46
. = 06957.
2.54. Ejemplo. Un laboratorio somete a los choferes que cometen accidentes de tránsito a un test de "dosaje etílico". ¿Cuál es la probabilidad de que un chofer de esta población esté ebrio, dado que el resultado del dosaje etílico fue positivo?, si se ha determinado que:
- cuando el chofer está ebrio, el test proporciona resultado positivo en el 95% de los casos. - cuando el chofer no está ebrio, el test proporciona resultado negativo en el 94% de los casos. - el 2% de los conductores que cometen accidentes manejan ebrios.
Probabilidad. 1 77
Solución. El espacio muestral está formado p or todos los choferes que cometen accidentes.
Sean los eventos: E , descrito por "el chofer está ebrio" y T , descrito por "el test es positivo".
Por el teorema de Bayes se tiene que a partir de la información adicional T , la probabilidad corregida de E es P( E | T ) =
P ( T | E) P ( E )
(0 .95)(0 .02 ) = 0.2 442. = = (0.95)(0.02 ) + (1 − 0.94 )(0.98 ) P( T | E ) P( E ) + P( T | E ) P ( E )
En cada uno de los siguientes ejemplos, el lector indicará el espacio muestral correspondiente. 2.55. Ejemplo. Un médico tiene duda entre tres enfermedades E1, E2, y E3, posibles en un paciente. Observando el estado general del paciente, al médico le parece que E 1 es tres veces más probable que cualquiera de las otras dos. Sin embargo, ordena un examen de sangre el que se sabe resulta positivo en el 10% de los casos cuando la E 1 es la causa de la dolencia, en el 90% de los casos cuando la causa de la dolencia es la E 2 y en el 60% de los casos cuando la causa de la dolencia es la E3. Si el resultado del análisis fue positivo ¿cuál es la probabilidad final de cada enfermedad?. A la luz de los resultados, ¿se puede afirmar que E1 es tres veces más probable que cualquiera de las otras dos enfermedades?. Solución. Se tiene que P(E1) = 3P(E2) y P(E1) = 3P(E3).
Por otro lado, P(E1) + P(E2) + P(E3) =1; de donde se tiene que P(E1) = 0.6, P(E2) = 0.2 y P(E3) = 0.2.
Aplicando el teorema de Bayes se tiene que la probabilidad final para E1, dado que el análisis fue positivo es P ( E 1 | T ) =
P ( T | E 1 ) P ( E 1 ) P ( T | E 1 ) P ( E 1 ) + P( T| E 2 ) P( E 2 ) + P( T| E 3 ) P( E 3 )
= 1 / 6 ,
en donde T indica que el resultado del análisis fue positivo. De igual manera se obtiene que: P( E 2|T ) = 1/2 y P( E 3|T ) = 1/3. A la luz de los resultados del análisis, E1 es tres veces menos probable que E2 y dos veces menos probable que E3. 2.56. Ejemplo. Al contestar una pregunta de "opción múltiple" y con 5 distractores (posibles respuestas) de los cuales sólo uno es la respuesta correcta, puede ocurrir que la
1 78 . Probabilidad.
persona que responda correctamente conozca realmente la respuesta o responda al azar. La probabilidad que conozca la respuesta es 0.6 y que recurra al azar, 0.4. Si un estudiante marcó correctamente la respuesta, ¿cuál es la probabilidad de que conozca la respuesta?. Solución. Sean los eventos: A , descrito por "el alumno conoce la respuesta", B , descrito por "el alumno contestó correctamente". La respuesta tiene cinco distractores para seleccionar uno. Se tiene entonces que la probabilidad de contestar correctamente, dado que la persona recurrió al azar es 1/5 = 0.2.
La probabilidad pedida, P( A |B ), es P ( A| B ) =
P( B | A) P( A) P ( B| A ) P ( A) + P ( B | A ) P( A)
=
1( 0.6) = 0.8824. 1( 0.6) + 0.2 (0.4 )
2.57. Ejemplo. Una fábrica de radios transistores produce 98% de radios buenos y 2% de defectuosos. Antes de ponerlos a la venta se someten a un control de calidad. Según este control, cuando un aparato es bueno, éste es declarado como tal con probabilidad 0.95 y cuando no lo es, éste es declarado como bueno con probabilidad 0.04. Si un radio fue considerado como bueno en dos verificaciones consecutivas y se considera que éstas son independientes en cualquier situación, ¿cuál es la probabilidad de que el radio sea realmente bueno?. Solución. Sean los eventos: B , descrito por "el radio es bueno realmente", B' , descrito por "el radio es considerado como bueno por el control en la primera vez". B' ' , descrito por el "radio es considerado como bueno por el control la segunda vez". B' ∩ B' ' , será entonces, el evento descrito por "el radio es considerado como bueno en la primera y segunda verificación del control".
Se desea conocer P( B |B' ∩ B'' ). P ( B | B′ ∩ B′′ ) =
=
P ( B′∩ B′′| B ) P ( B ) P ( B ′∩ B′′| B ) P ( B ) + P ( B′∩ B′′| B ) P( B )
( 0 . 95)( 0 . 95)( 0 . 98) ( 0 . 95)( 0 . 95) ( 0 . 98) + ( 0 . 04) ( 0. 04)( 0. 02)
=
P ( B′ | B ) P ( B ′′| B ) P ( B ) P ( B ′∩ B′′| B ) P ( B ) + P ( B′∩ B′′| B ) P( B )
= 0. 999 9.
Probabilidad. 179
2.58. Ejemplo. Un empresario tiene una máquina automática en su fábrica que produce determinados artículos. Con su pasada experiencia ha comprobado que si la máquina se ajusta en forma apropiada, la máquina producirá un 90% de piezas aceptables, mientras que si su acondicionamiento no es adecuado, sólo producirá un 30% de aceptables. El empresario también ha observado que el 75% de los acondicionamientos se hace en forma correcta. Si la primera pieza producida es aceptable, ¿qué probabilidad existe de que el acondicionamiento se haya hecho correctamente?. Solución.
Sean los eventos: A , descrito por "el acondicionamiento es correcto", B , descrito por "la primera pieza producida es aceptable".
Se desea calcular: P ( A |B ) =
P( A∩ B) P( B)
.
La situación puede describirse usando la siguiente gráfica: Según los datos, la probabilidad de que ocurra simultáneamente acondicionamiento correcto y que un artículo sea aceptable es P ( A ∩ B ) = P ( B |A ) P ( A ) = (0.9)(0.75) = 0.6750.
* 1 0.9
B
D
0.75 A
Ajuste
- A
B
0.25
* 2
0.3 D
Figura 2.8 . Lo s no do s te rm in al es 1 y 2 corresponden al evento B.
La probabilidad de que la primera pieza sea buena es P( B ) = P(( B ∩ A) ∪ ( B ∩ A )) = P( B| A) P( A) + P( B| A ) + P( B| A ) P ( A ).
= (0.9)(0.75) + (0.3)(0.25) = 0.7500. Por tanto, P ( A |B ) = 0.675/0.7500 = 0.9000.
un
180. Probabilidad.
2.8. EJERCICIOS. 1. De acuerdo al estado civil de sus habitantes, una p oblación está dividida de la siguiente manera: el 30% son solteros, el 40% son casados y el resto son viudos o d ivorciados. La proporción de mujeres solteras es 20%, de mujeres casadas, 25% y de mujeres viudas o divorciadas, 20%. Si se elige una persona al azar, ¿cuál es la probabilidad de que sea mujer?. Rpta. 0.22 2. La probabilidad de que un alumno estudie para su examen de Matemáticas es 0.8. Si estudia, la probabilidad de que apruebe el examen es 0.90. Si el alumno no estudia la probabilidad de que no apruebe el examen es 0.85. ¿Cuál es la probabilidad de que el alumno apruebe el examen?. Rpta. 0.75. 3. El 40% de las resistencias que se utilizan en una fábrica son de la marca A y el resto son de la marca B. El 1% de las resistencias de la marca A y el 0.5 % de la marca B son defectuosas. Si de un lote de tales resistencias adquiridas por la fábrica se elige una al azar, ¿cuál es la probabilidad que ésta resulte defectuosa?. Rpta. 0.007. 4. En una urna hay 3 esferas rojas y x negras. De la urna se sacan a l azar, dos esferas de una en una y sin reposición. Si la probabilidad de sacar una esfera roja en la segunda extracción es 6/10, hallar el número de esferas negras que existen en la urna al comienzo de la experiencia. Rpta. 2. 5. Una compañía está estudiando la posibilidad de construir una granja en un cierto sector agropecuario. La compañía considera de gran importancia la construcción de un reservorio en las cercanías del lugar. Si el gobierno aprueba este reservorio la probabilidad de que la compañía construya la granja es 0.9, de otra manera la probabilidad es de sólo 0.2. El presidente de la compañía estima que hay una probabilidad de 0.6 de que el reservorio sea aprobado. a) Hallar la probabilidad de que la compañía construya la granja. b) Si la granja fue construida, hallar la p robabilidad de que el reservorio haya sido aprobado. Rpta. a) 0.6200 b) 0.8709. 6. La compañía Kancio está considerando comercializar una computadora. La probabilidad de que la compañía tenga éxito es 0.8 si una firma competidora no introduce un producto similar en el mercado, en tanto que la probabilidad de éxito es sólo 0.4 si la firma competidora introduce un producto similar. Kancio estima en 0.3 la probabilidad de 0.3 de que la firma competidora comercialice el producto. Si Kancio no tuvo éxito, ¿cuál es la probabilidad de que la competencia haya lanzado su producto?. 7. Una compañía panificadora desea saber si es rentable o no la puesta en marcha de una panadería en cierta zona de la ciudad. Los encargados del estudio creen que los posibles niveles de demanda son: “demanda baja", cuando 5% de los habitantes de la zona comprarán en la panadería, "demanda moderada", cuando 15% de los habitantes de la zona comprarán en la panadería y "demanda alta", cuando 35% de los habitantes de la zona comprarán en la panadería. Sobre la base de experiencias pasadas en otras zonas semejantes, la compañía asigna a priori las siguientes probabilidades a los niveles de demanda:P["demanda baja"] = 0.20, P["demanda moderada"] = 0.50 y P["demanda alta"] = 0.30. La compañía decide, antes de poner en marcha el servicio, tomar una encuesta a fin de determinar la demanda en la panadería. Se seleccionan al azar 10 habitantes de la zona y se comprueba que 2 comprarán en la panadería. A la luz de esta información, revise las probabilidades establecidas a priori. Rpta. Indicaremos el resultado de la probabilidad de tener una demanda baja, dado que de 10 encuestados, 2 indican que comprarán en la panadería proyectada. Las otras probabilidades se calculan de igual manera. 10! ( 0.05) 2 ( 0.95) 8 0.20 8!2 ! P ( Baja|d e 10, 2 compraron) = 10! 10! 10! (0.05) 2 ( 0.95) 8 0.20 + ( 015) 2 ( 0.85)8 0.50 + (0.35) 2 ( 0.65) 8 0.30 8!2 ! 8!2 ! 8!2 ! 8. La SUMATT afirma que, según experiencias pasadas, la probabilidad de que el 20% de los contribuyentes no hayan realizado sus pagos de impuestos es 0.30 y que la probabilidad de que el 60% de los
Probabilidad. 181
contribuyentes no hayan realizado sus pagos de impuestos es 0.70. A fin de precisar sus apreciaciones la SUMATT escoge al azar dos contribuyentes y encuentra que los dos no hicieron sus pagos de impuestos. ¿Qué modificación a su afirmación debe hacer la SUMATT?. 9. Una empresa recibe billetes de tres bancos: A, B y C. De A recibe el 60% de todos los billetes, de B, el 30% y el resto de C. Se ha determinado que la proporción de billetes falsos que provienen de A es 0.1%, de B, 0.2% y de C, 0.1%. En cierta ocasión al elegir un billete al azar éste resultó falso; ¿de qué banco se puede sospechar que proviene el billete falso?. 10. Una prueba para la h epatitis (H) tiene la siguiente exactitud P[ +| E ] = 0.90 y P[+| E ] = 0 .01 a) Si en la población, la probabilidad de que una persona tenga la enfermedad E es 1/1000 ¿cuál es la probabilidad de que una persona tenga la enfermedad si su resultado de análisis es positivo?. b) Un paciente desea que le realicen un análisis de su sangre porque tiene ciertos síntomas sospechosos y por los cuales el médico cree que tiene hepatitis con probabilidad 0.5. Si el resultado de la prueba del paciente es positivo, ¿cuál es la probabilidad de que tenga hepatitis?. Rpta. a) 0.0826 11. Respecto del partido de fútbol que protagonizarán el día de mañana los equipos A y B, el Veco piensa lo siguiente: De todas maneras se abrirá el marcador y cualquiera de los dos equipos tiene igual probabilidad de hacerlo. Si A anota el primer gol la probabilidad de que el próximo también sea de A es 2/3 contra 1/3 que sea de B; en cambio si es B el que anota el primer gol habrá un segundo gol que puede ser con igual probabilidad para cualquier bando. Si el marcador llega a ponerse 2-0 a favor de cualquier equipo la desmoralización de uno y la apatía del otro impedirán que haya más goles; en cambio si llega a ponerse 1-1, puede ocurrir tres cosas con iguales probabilidades: que A anote y gane 2-1, que B anote y gane 2-1 o que no haya más goles. Use un diagrama de árbol para contestar lo siguiente: ¿Cuál es, de acuerdo a lo anterior, la probabilidad de que a) B gane?. b) B gane dado que abrió el marcador? c) A haya abierto el marcador dado que B ganó?. Rpta. a) 7/18. 12. Una elección tiene lugar para elegir a uno de los candidatos A y B por mayoría y a dos vueltas. En la primera vuelta, 15% de los electores inscritos votaron en blanco, 40% de los electores votaron por A y 45% votaron por B. Se estima que todos los electores que votaron en la primera vuelta lo harán en la segunda vuelta, pero una encuesta indica que en razón de las declaraciones contradictorias de los candidatos, 20% de los que votaron por A en la primera vuelta votarán por B en la segunda vuelta y 30% de los que votaron por B votarán por A. La misma encuesta indica qu e 2/3 de los que votaron en blan co en la primera vuelta votarán en la segunda, a razón de 40% por A y 60% por B. Si la encuesta es fiable, a) ¿quién saldrá elegido en la segunda vuelta?. b) Si se elige un elector al azar, ¿cuales son, en términos de probabilidades, las diferentes elecciones posibles de este elector?. Rpta. a) A tendrá el 49.5% de los votos y B el 45.5%.
182. Probabilidad.
CAPITULO III
VARIABLES ALEATORIAS Los resultados de un experimento aleatorio pueden interpretarse en términos de números reales. Así, al lanzar una moneda, se puede asociar el número 0 al resultado “sello” y el número 1 al resultado “cara”. La característica esencial de esta correspondencia es que el resultado asignado no se conoce de antemano; el valor es determinado después que se realiza la prueba. Al relacionar cada resultado de un experimento aleatorio con un número real se establece lo que se llama variable aleatoria.
3.1. VARIABLES ALEATORIAS Dado un espacio muestral Ω , en donde se encuentra definida una probabilidad P, se llama variable aleatoria a toda función X de Ω al conjunto de los números reales.
Ω X
R eales
Figura 3.1
Las variables aleatorias se denotan con letras mayúsculas tales como X , Y, etc. Los valores de las variables se denotan con letras minúsculas como x, y, etc. 3.1. Ejemplo. De un registro, en donde están inscritas todas las familias de un poblado, se elige una familia al azar y para cada familia se considera el número de hijos que tiene.
El espacio muestral Ω está formado por todas las familias que están inscritas en el registro. La variable X que a cada familia le hace corresponder el número de hijos es una variable aleatoria. También, si a cada familia se le hace corresponder el sueldo Y , que el jefe de familia percibe, se tendrá otra variable aleatoria. Como puede notarse, en una espacio muestral se pueden definir muchas variables aleatorias. En la teoría de la probabilidad, se considera que una población es cualquier colección de medidas que pueda ser descrita por una variable aleatoria.
Probabilidad. 183
3.2. Ejemplo En una universidad se considera que el número mínimo de cursos por semestre en que puede matricularse un alumno es 1 y el máximo, 5. La variable aleatoria X , que a cada alumno le hace corresponder el número de cursos en los cuales está matriculado, es una variable aleatoria cuyos valores son: 1, 2, 3, 4 y 5. La población la forman los alumnos de la universidad; sin embargo, se puede considerar que la colección de los números 1, 2, 3, 4 y 5 forman la población. 3.3. Ejemplo. Si se escoge una persona al azar de una población Ω y se le asigna su peso X , se tendrá una variable aleatoria. 3.4 Ejemplo. Si un objeto es medido, el resultado obtenido, debido al error de medida que se comete, se puede considerar como el valor de una variable aleatoria X . El espacio muestral está formado por los resultados que se obtienen de la medición. 3.5. Ejemplo.
Si se lanzan dos dados simultáneamente, el espacio muestral Ω está formado por todos los pares ( x, y), donde x representa el resultado en el primer dado e y, el resultado en el segundo. Una variable aleatoria en Ω es, por ejemplo, la definida por X (( x, y)) = x + y. Es decir, la función que a cada resultado ( x, y) le hace corresponder la suma de los resultados de ambos dados. Los valores que X puede tomar son: 2, 3, 4, ... , 12.
VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS.
Variables aleatorias discretas. Si el conjunto de valores de una variable aleatoria es finito o infinito enumerable, ésta se llama discreta. Las variables aleatorias discretas generalmente se usan cuando se quiere describir el número de veces que ha ocurrido un suceso. 3.6. Ejemplo. En la población formada por todos los alumnos de una universidad se puede definir la variable X , que a cada alumno le hace corresponder el número de libros que compró en el mes anterior.
La variable X es una variable aleatoria discreta. En el ejemplo 3.1, la variable aleatoria X = número de hijos, es discreta, En el ejemplo 3.2, la variable aleatoria X = número de cursos, es discreta. En el ejemplo 3.5, la variable aleatoria X = suma de los puntos que aparecen en los dos dados, es discreta, etc.
184. Probabilidad.
Variables aleatorias continuas . Una variable aleatoria X es continua si puede tomar cualesquiera de los valores de un intervalo. La edad, la estatura, el peso, el coeficiente de inteligencia de los habitantes de una región, la duración de un movimiento sísmico, las mediciones que se realizan de un objeto, son ejemplos de variables aleatorias continuas. Al decir que una variable aleatoria continua puede tomar cualquiera de los elementos de un intervalo, no estamos indicando que se pueda encontrar cada uno de los valores del intervalo en los datos que se tienen como muestra. Así por ejemplo, puede ser que en un conjunto de personas no se observe una que mide 1.637 m. Sin embargo, debemos considerar la posibilidad de que exista una persona con tal estatura en toda l a población.
3.2. LEY DE PROBABILIDAD O DISTRIBUCION DE PROBABILIDAD DE UNA VARIABLE ALEATORIA DISCRETA. La ley de probabilidad o distribución de probabilidad de una variable aleatoria es una manera de modelar la variabilidad o la forma como se distribuyen los valores de la variable. Para la variable X definida en el espacio muestral Ω y con valores distintos x1, ... , xn, ..., consideremos: los números no negativos p1, ..., pn, ..., con la propiedad
∑ pi
= 1, y la función definida
i
por p( xi ) = pi , i = 1, 2, 3, ... A esta función así formada se le llama ley de probabilidad o distribución de probabilidad de la variable aleatoria X. 3.7. Ejemplo. Las distintas posiciones que se obtienen al lanzar un dado forman un espacio muestral. Si a cada posición se le asigna el número de puntos que aparecen en la cara superior se obtiene una variable aleatoria X con valores 1, 2, 3, 4, 5, 6.
Si a los valores descritos les asignamos, respectivamente, los números no negativos 0.20, 0.15, 0.25, 0.30, 0.05, 0.05, (la suma de estos valores es igual a 1), se tendrá definida una ley de probabilidad o distribución de probabilidad para X : . , p( 3) = 0.25, p( 4) = 0.30, p ( 5) = 0. 05, p( 6) = 0. 05. p(1) = 0.20, p( 2) = 015
Probabilidad. 185
La asignación indicada constituye una parte del modelo probabilístico para describir los resultados obtenidos al lanzar un dado. Esta; sin embargo, es arbitraria en el sentido que puede estar lejos de la “realidad del dado”. En un espacio muestral Ω con probabilidad P, una ley de probabilidad puede obtenerse si a cada valor i de la variable, se le hace corresponder la probabilidad del evento [ X = i], formado por los elementos del espacio muestral cuya imagen, según X, es i. Así resulta la ley de probabilidad pi = P[ X = i ],
i = 1, 2, 3, 4 , 5, 6.
denominada ley de probabilidad imagen.
Si el dado lanzado es equilibrado se tiene: p1 = P[ X = 1] = 1 / 6,
p2 = P[ X = 2 ] = 1 / 6,
p 3 = P[ X = 3] = 1 / 6, p4 = P[ X = 4 ] = 1 / 6, p5 = P[ X = 5] = 1 / 6, p6 = P[ X = 6] = 1 / 6.
De este modo, p1 indica la probabilidad de que la variable tome el valor 1, p2 indica la probabilidad de que la variable tome el valor 2,
..., etc. Nótese que p( xi) ≥ 0, para todo xi y
∑ p( xi ) = 1.
Una ley de probabilidad de una variable X puede escribirse como en la siguiente tabla. X i
x1
x2
...
xi
...
Pi
p1
p2
...
pi
...
en donde se ha escrito pi en lugar de p( xi). De acuerdo a la definición de probabilidad, la probabilidad de un evento A se calcula con P( A) =
∑ p ( xi )
xi ∈ A
Esto es, la probabilidad del evento A es igual a la suma de las probabilidades de los elementos que pertenecen al conjunto A.
La ley de probabilidad puede representarse gráficamente mediante “bastones”, como se indica en la siguiente gráfica, o usando la idea de que la masa total unitaria se distribuye en “pequeñas masas” sobre los valores de la variable.
1 86 . Probabilidad.
pi
xi
xi
Figura 3.2
3.8. Ejemplo. Si se lanzan dos dados equilibrados y se considera la variable X (( x, y)) = x + y, que indica la suma de los resultados x e y que aparecen en cada uno de los dados, se tendrá que los valores de X son: 2, 3, 4, ... ,12.
Además, * X −1 ({2}) = {(1,1)}
, )}) =1 /36 , p(2 ) = P[ X = 2 ]= P({(11
y por tanto
* X −1({3}) = {(1,2 ),(2 ,1)}
y por tanto
p(3) = 2 /36 , etc.
Escribiendo pi en lugar de P [ X = xi] se obtiene la siguiente tabla: xi
2
3
4
5
6
7
8
9
10
11
12
pi
1/36
2/36
3/36
4/36
5/36
6/36
5/36
4/36
3/36
2/36
1/36
Se tiene, por ejemplo, que la p robabilidad del evento [ 2 < X ≤ 5] = {w ∈ Ω|2 < X ( w) ≤ 5} = {3, 4, 5}
es P[ 2 < X ≤ 5] = P[ X = 3] + P[ X = 4] + P[ X = 5] = 3/36. p ( X )
1/36
-6/36
-
X
2
6 78
12
Figura 3.3. Gráfico de la ley de X .
En este caso, la distribución de probabilidad o ley de probabilidad de X , se puede interpretar como la división de la "masa unitaria" en 11 "masas puntuales o ponderaciones" colocadas en los valores 2, 3, ... , 12. Las ponderaciones corresponden a las probabilidades respectivas. 3.9. Ejemplo. Un experimento se repite de manera independiente hasta obtener éxito. La probabilidad de obtener éxito cada vez es 0.7. Si X es la variable aleatoria que cuenta el número de repeticiones hasta obtener éxito,
Probabilidad. 1 87
a) hallar p(k ) = P[ X = k ], la ley de probabilidad de X ?. b) Comprobar que
∑ P[ X = k ] = 1.
Solución. a) Los valores que puede tomar X son: 1, 2, 3, ...
Si se observa que X toma el valor k cuando se ha obtenido por primera vez éxito después de k - 1 repeticiones. Se tendrá que la l ey de probabilidad de X está dada por P[ X = k ] = 0.7 k −1(0.3) para k = 1, 2, 3, ... ∞
b) Se observa que, al aplicar el resultado conocido ∑ r = k
k = 0
se obtiene:
∞
∞
∞
k =1
k =1
k = 0
1 1 − r
para
− 1 < r < 1
∑ P[ X = k ] = ∑ (0.7) k −1 0.3 = 0.3 ∑(0.7 ) k = 0.3 1 −10.7 = 1.
Esto indica que P[ X = k ] es una ley de probabilidad.
3.3. FUNCION DE DISTRIBUCION O DE ACUMULACION DE UNA VARIABLE ALEATORIA DISCRETA. Para una variable aleatoria X , su función de distribución, o también llamada función de acumulación , se define como la función F descrita por F ( x) = P[ X
≤ x], para todo número real x,
y donde P[ X ≤ x] es la probabilidad del evento [ X ≤ x], formado por todos los elementos w del espacio muestral para los cuales se cumple X (w) ≤ x. Así, para la variable aleatoria discreta X con valores 0, 1 y 2, cuya ley de probabilidad está dada por: p ( 0) = P[ X = 0] = 0.20,
p( 1) = P[ X = 1] = 0.50,
p (2 ) = P[ X = 2 ] = 0.30 ,
se tiene, por ejemplo, que F (-2) = P[ X ≤ − 2] = 0 . F (1) = P[ X ≤ 1] = p(0) + p(1) = 0.20 + 0.50 = 0.70 .
. ] = p(0) + p(1) = 0.20 + 0.50 = 0.70 F (1.5) = P[ X ≤ 15 F (2) = P[ X ≤ 2] = p (0) + p (1) + p (2 ) = 1 , etc.
1 88 . Probabilidad.
En general, para esta variable la función de distribución es 0 si 0.20 F ( x) = 0.70 1.00
x<0 si 0 ≤ x < 1 si 1 ≤ x < 2 si 2 ≤ x
En la siguiente figura se presenta l a gráfica de esta función. Y 1
F
0.70
0.20
0
1
X
2
Figura 3.4. Gráfico de la función de distribución de F
Se nota que F ( xi ) − F ( xi −1 ) = P [ X = xi ] = pi . 3.10. Ejemplo. Se lanza una moneda y se define la variable aleatoria X del espacio muestral Ω = {cara, sello} a los números reales, de la siguiente manera: X (w) = 1 si w = cara y X (w) = 0 si w = sello.
Si la probabilidad de que aparezca cara es 0.6 y la de que aparezca sello, 0.4, se tendrá que, para esta situación, la ley de probabilidad de X y su función de acumulación o distribución son, respectivamente: xi
0
1
pi
0.4
0.6
si x < 0 0 F ( x ) = 0.4 si 0 ≤ x < 1 0.4 + 0.6 si 1 ≤ x p
F
10.6 0.4
0
0.4
1 (a)
X
0
1
X
(b)
Figura 3.5. Gráficos de la ley de probabilidad y de la función de acumulación de X .
Probabilidad. 1 89
3.4. FUNCION DE DENSIDAD DE PROBABILIDAD DE UNA VARIABLE ALEATORIA CONTINUA. Si la frecuencia relativa de un grupo de valores correspondientes a una variable aleatoria continua se representa mediante un histograma, se observa que el polígono de frecuencias respectivo no sólo indica el comportamiento de los datos, sino que da la idea de algún modelo probabilístico para la variable. Se comprueba que a medida que se construyen intervalos de clase cada vez más pequeños, el polígono de frecuencias tiende a una curva que cambia suavemente. A esta función, que modela el comportamiento de X se le llama función de densidad de probabilidad o simplemente función de densidad de X . Esta función indica la manera como los valores de X se distribuyen a lo largo de la recta. Si se considera que la función de densidad f es una función límite y el histograma se ha construido de tal manera que su área sea igual a 1; se tendrá que en el límite, el área de la región que está debajo de f también debe ser 1. f
a
b
Figura 3.6. Area de la región achurada = P[ a ≤ X ≤ b]
A partir de la función de densidad , es posible calcular probabilidades usando el concepto de integración. Así por ejemplo, la probabilidad P[ a ≤ X ≤ b] de que la variable X tome valores entre a y b, se calcula como el área bajo la gráfica de f , entre las rectas x = a y x = b y por encima del eje X. Como ejemplo, supóngase, que se ha medido la vida útil en horas de 50 pilas elegidas al azar de la producción de una fábrica A y que el histograma de la frecuencia relativa es como la que se indica a continuación. Se observa que la frecuencia relativa disminuye a medida que el valor de la vida útil aumenta. Se supone que el polígono de frecuencias relativas puede aproximarse mediante la curva cuya ecuación es f ( x ) = 012 . e
f. relat.
[5, 10[
[0, 5[
0.40 0.30
[10, 15[
0.15
[20, 25]
0.10
[15, 20]
0.05
−0.12 x
.
f
0.4 0.3 0.15 0.05 0
5
10
15
20
vida útil en horas
Figura 3.7.
25
1 90 . Probabilidad.
Esta función puede considerarse como modelo matemático del comportamiento de la variable X y utilizarse para calcular, por ejemplo, la probabilidad de que una pila producida por A dure entre 5 y 10 horas:
∫510 0.12 e −0.12 x dx = 0.2467 . Este resultado se aproxima a la proporción que ya se observó en la muestra. El modelo no sólo permite calcular probabilidades para intervalos observados, sino también para intervalos como [25, 35], [25, 100], etc. La elección adecuada de la función de densidad puede hacerse con ayuda del desarrollo que a continuación se realiza y en donde se presentan los modelos teóricos más usados. Formalmente, la función de densidad de una variable aleatoria continua X es una función f ( x) que cumple las siguientes propiedades:
a) Los valores de la función son mayores o iguales que 0. ( f ( x ) ≥ 0). b) El área bajo la gráfica de la función y por encima del eje X es 1. Esto es, ∞
∫−∞ f ( x)dx = 1 . c) La probabilidad de que la variable X tome valores entre a y b es igual al área comprendida entre la gráfica de f, el eje X y las rectas paralelas al eje Y que pasan por los valores a y b. Esto es, b
P[ a ≤ X ≤ b] = ∫ f ( x ) dx a
OBSERVACIONES . 1. Según c), la probabilidad de que una variable aleatoria continua tome un valor a es cero. a
En efecto, P[ X = a] = Area bajo la gráfica de f “entre a y a” = ∫a f ( x ) dx = 0. De acuerdo a esta igualdad, la probabilidad de que el tiempo útil, X , de una pila sea 5.342 horas es 0. Ello no significa que el evento [ X = 5.342] sea imposible, sólo indica que la probabilidad de observar una pila con tal vida útil es muy pequeña. 2. Según la observación anterior, si X es una variable aleatoria continua, P[ a ≤ X ≤ b ] = P[ a ≤ X < b ] = P[ a < X ≤ b ] = P[ a < X < b ] = F (b) − F ( a) ,
en donde F es la función de acumulación de X . (No interesan los extremos del intervalo).
Probabilidad. 1 91
3. Cuando X toma todos sus valores en un intervalo finito [a, b], simplemente se establece que f ( x) = 0 para todo x que no está en [a, b]. Si la función de densidad se especifica sólo para ciertos valores de x, supondremos que es 0 para cualquier otro valor. 4. Si se considera que los valores x y x + ∆ x están en el dominio de la variable X , se podrá escribir para ∆ x pequeño, x + ∆x / 2
P[ x − ∆x / 2 ≤ X ≤ x + ∆x / 2 ] = ∫ x − ∆x / 2 f ( x ) dx ≈ f ( x ) ∆x .
f ( x )
x- ∆ x/2 x +∆ x/2
Figura 3.8.
La relación anterior permite indicar que f ( x) “mide la concentración de probabilidad ”, P ( x − ∆x / 2 ≤ X ≤ x + ∆x / 2 ) , en una vecindad de x. ∆ x 3.11. Ejemplo. Una variable aleatoria continua X tiene como función de densidad a l a función
cx si 0 ≤ x ≤ 3
f ( x ) =
0 en el resto
Hallar la probabilidad de que X tome valores entre 1 y 2.5. Solución. Y
cx
X
0
3
Figura 3.9. Función de densidad de X.
Primero calculemos c. Como el área comprendida entre el eje X, la gráfica de la función de densidad y las rectas x = 0 y x = 3, (área del triángulo), debe ser igual a 1, se tendrá 1 que ( 3) ( c 3 ) = 1 . 2 De donde c = 2/9.
1 92 . Probabilidad.
La probabilidad pedida, P[1 ≤ X ≤ 2 .5] , corresponde al área de la región que se indica en la siguiente figura: El área indicada es igual a (2.5)(2 / 9)(2.5) (1)(2 / 9 )(1 ) − = 05833 . . 2 2 Y
cx Are a= Pro ba bil ida d p ed ida X
1
2.5
Figura 3.10. P[1 ≤ X ≤ 2. 5]
3.5 FUNCION DE DISTRIBUCION O DE ACUMULACION DE UNA VARIABLE ALEATORIA CONTINUA Al igual que para una variable aleatoria discreta, la variabilidad de los valores de una variable aleatoria X continua puede conocerse a partir de las probabilidades acumuladas P[ X ≤ x ] . Estas probabilidades determinan la función de acumulación o de distribución. Se define la función de distribución o de acumulación de una variable aleatoria continua X como
F ( x ) = P[ X ≤ x ] , para todo número real x.
En el ejemplo anterior, la función de acumulación de la variable aleatoria continua X es
0 si x < 0 2 x x F ( x ) = ∫0 f ( x )dx = si 0 ≤ x < 3 9 ∫ x f ( x) = 1 si 3 ≤ x 0 Según la propiedad c), indicada en la definición de función de densidad, para una variable aleatoria continua X , la función de distribución F ( x) puede escribirse como F ( x ) = P[ X ≤ x] =
∫ x−∞ f ( t ) dt
Usando el Teorema Fundamental del Cálculo se tiene que dF ( x) dx
=
d x ∫ f (t )dt = f ( x) . dx −∞
Probabilidad. 1 93
Y
Y
1 ( x ) F ( x ) F ( x )
X
0
0
x
Función de densidad de X
x
X
Función de acumulación de X
Figura 3.11.
3.12. Ejemplo. Si la variable aleatoria continua X tiene la función de acumulación expresada por 0 si x < 0 F ( x) = x 2 si 0 ≤ x < 1 1 si x ≥ 1 ,
su función de densidad es f ( x ) =
dF ( x ) dx
2 x si 0 ≤ x ≤ 1 = 0 en el resto .
3.13. Ejemplo. El tiempo X, en horas, que demora una operación quirúrgica de cierto tipo, se midió en muchos casos en un hospital. Se consideró que las mediciones se pueden modelar con una función de densidad definida de la siguiente forma a ( x − 4) 2 2 ≤ x ≤ 6 f ( x ) = 0 en el resto
a) Hallar la probabilidad de que una futura operación, del mismo tipo, dure entre 3 y 4 horas. b) ¿Cuánto tiempo debe durar una operación si este valor sólo puede ser sobrepasado con probabilidad 0.5?. c) ¿Cuál es la probabilidad de que una operación dure más de 4 horas si se sabe que durará por lo menos 3 horas?. d) Calcular la función de distribución de X . Solución Primero calculemos el valor de a, usando la propiedad 6
∫2 a ( x − 4)
2
dx = 1
1 94 . Probabilidad.
( x − 4 ) Resolviendo la integral se tiene: a 3
3 6
= 1. De donde resulta, a = 3/16. 2
a) P[ 3 ≤ X ≤ 4 ] = ∫3 ( 3 / 16 )( x − 4 ) dx = 1 / 16 . 4
2
b) Se pide encontrar el valor t , para el cual P[ X ≥ t ] = 0.5. Es decir, se debe hallar t de 4
tal manera que ∫2 (3 / 16)( x − 4 ) 2 dx = 0.5. Resolviendo, t = 4. c) Se debe hallar P[ X ≥ 4| X ≥ 3] =
P[ X ≥ 4 y X ≥ 3] P[ X ≥ 3]
=
P[ X ≥ 4] P[ X ≥ 3]
=
56 = 08888 . 63
d) La función de acumulación de X es F ( x ) = 0 F (t ) =
si x ≤ 0
t
∫2
(3 / 16)( x − 4) 2 dx =
1 (t − 4) 3 − 8
16
3
si 2 ≤ t ≤ 6 .
F (t ) = 1, para t ≥ 6.
Propiedades de la función de acumulación. La función F de acumulación de una variable aleatoria, sea ésta discreta o continua, tiene las siguientes propiedades: a) F es una función no negativa F (t ) ≥ 0 b) F es no decreciente (sí s < t entonces F ( s) ≤ F ( t )) c)
lim F ( x) = 0 x → −∞
y
lim F ( x) = 1 x → +∞
3.6. ESPERANZA Y VARIANZA DE UNA VARIABLE ALEATORIA. La esperanza y la varianza son dos conceptos que permiten el mejor conocimiento de una variable aleatoria. Si se considera que la distribución de una variable aleatoria será un modelo teórico para la distribución de un conjunto de datos asociados a una población real, es natural que se desee establecer los conceptos de media y varianza para una variable aleatoria.
Esperanza de una variable aleatoria discreta. Se lanza una moneda y se considera que se obtiene una utilidad X, igual a 5 si resulta cara e igual a -4 si aparece sello.
Probabilidad. 1 95
Si la moneda se lanza N veces y resultan N c caras y N s sellos ( N c + N s = N ), se tendrá que la utilidad T en los N lanzamientos es T = 5 N c + (-4) N s . N + (-4) N s / N . La utilidad promedio por tirada es T/N = 5 N c /
Si la probabilidad de que aparezca cara en la moneda es 0.6 y de que aparezca sello, 0.4, N y N s / N se tendrá que cuando N es suficientemente grande, las frecuencias relativas N c / tienden a 0.6 y 0.4, respectivamente. Por consiguiente, si la moneda se lanzara infinitas veces, "esperaríamos" tener una ganancia igual a 5(0.6) + ( -4)(0.4) = 1.4 por cada jugada. Este valor se llama esperanza de X. Formalmente se tiene la siguiente definición. Si la variable aleatoria X es discreta, con ley de probabilidad p ( x i ) = P[ X = xi ], su esperanza , denotada con E ( X ), se define como
E ( X ) =
∑ xi P[ X = xi ] i
Si la variable X es discreta, con valores equiprobables x1 , ... , x n , , la esperanza de X corresponde al promedio de x1 , ..., xn.
Para representar gráficamente a la esperanza de la variable X, que toma los valores xi con probabilidad pi = p( xi ) , observemos que el producto xi .pi es igual al área sombreada Y
p i
x
1
x
F
X
2
x
i
Figura 3.12. Representación de la esperanza de X.
cuando xi es positivo y es el opuesto de esta área cuando xi es negativo. Por lo tanto, la esperanza de X, que es la suma algebraica de los valores xi pi , es igual a la diferencia de las áreas sombreadas del primer y segundo cuadrante. 3.14. Ejemplo. En un juego se puede ganar $10 con probabilidad 0.2, 5 con probabilidad 0.3 y perder $8 con probabilidad 0.5. Si con X se denota a la variable que indica la utilidad del juego se tendrá que la ley de probabilidad de X es X p
10 0.2
5 0.3
-8
0.5
1 96 . Probabilidad.
La esperanza de X es E ( X ) = 10(0.2) + 5(0.3) + (-8)(0.5) = -0.5. Participando en el juego una sola vez, se puede ganar o perder, pero si se repite el juego muchas veces, en promedio, se perderá $0.5. ("A la larga" se pierde $0.5 por juego). 3.15. Ejemplo El número de pacientes que d iariamente visitan a un médico para hacer una consulta es X
1
2
3
4
pi
0.3
0.4
0.2
0.1
Calcular el valor esperado del número diario de pacientes que visitan al médico. Solución. E ( X ) = 1(0.30) + 2(0.4) + 3(0.2) + 9(0.1) = 2.1.
3.16. Ejemplo.
Sea X una variable con ley de probabilidad definida por P[ X = k ] =
e
−3 k
3
k !
k = 1, 2, ...
La esperanza de X es ∞
E ( X ) =
∞
∑ kP[ X = k ] = ∑ k k = 0
Considerando que
k = 0
∞ x k
∑
k =0
k !
e
−3 k
3
k !
=e
−3
∞
3∑ k =1
k −1
3
( k − 1)!
=e
−3
∞ 3s
3∑
s=0
s!
, haciendo s = k
-
1.
x
= e , se tiene que E ( X ) = 3.
Esperanza de una función de una variable aleatoria discreta El concepto de esperanza de una variable aleatoria puede extenderse para una función Y = H ( X ) de la variable aleatoria X , de la siguiente manera: E ( H ( X )) = ∑ H ( x k ) P[ X = x k ], k
si X es una variable aleatoria discreta con ley de probabilidad P[ X = xk ].
3.17. Ejemplo. Cada día un canillita recibe 30 periódicos para vender. Por cada periódico que vende el canillita gana $0.40, y pierde $0.01 por cada periódico no vendido. Si la demanda X de los periódicos tiene la ley de probabilidad descrita por
Probabilidad. 1 97
x
10
20
30
pi
0.1
0.6
0.3
(vende 10 con probabilidad 0.1, etc.), entonces la ganancia del canillita es una variable aleatoria Y que es función de la variable aleatoria X y es igual a Y = 0.4( X ) - 0.01(30 - X )
La esperanza de la ganancia Y es igual a E (Y ) = [0.4(10) -0.01(30 -10)]0.1 + [0.4(20) -0.01(30 -20)]0.6 + [0.4(30) -0.01(30 -30)] 0.3
= (3.8)(0.1) + (7.9)(0.6) + (12)(0.3) = $8.72 .
Nótese que en algunos días el canillita ganará $3.8 (cuando venda 10 periódicos), en otros días ganará $7.9 (cuando venda 20 periódicos) y en otros ganará $12 (cuando venda 30 periódicos), pero en promedio ("a la larga") ganará $8.72 por día.
Esperanza de una variable aleatoria continua. La esperanza de una variable aleatoria discreta equivale a la suma ponderada de los valores de la variable con sus respectivas probabilidades. Este concepto puede extenderse para las variables continuas. Para este caso, la suma ponderada corresponde a lo que podríamos llamar "suma continua ponderada" en donde los sumandos tienen la forma xP[ x − 0.5∆x ≤ X ≤ x + 0.5∆x ]
y ∆ x tiende a 0. Si la función de densidad de X es f , la expresión anterior corresponde a xf ( x) y la "suma continua ponderada" corresponde formalmente a la integral +∞
∫−∞ xf ( x)dx. Así , cuando X es una variable aleatoria continua con función de densidad f ( x), la esperanza de X se define como +∞
E ( X ) =
∫ xf ( x )dx .
−∞
A menudo se usa la expresión media de X en lugar de la esperanza de X. 3.18. Ejemplo El tiempo X, en horas, que un niño dedica a "ver televisión" cada día se puede modelar con la función de densidad
1 98 . Probabilidad.
4 − 8 x si x ∈ [ 0 , 0.5].
f ( x ) =
.
0 en el resto.
La esperanza de X es 0
+∞
0.5
+∞
E ( X ) = ∫−∞ xf ( x )dx = ∫−∞ x (0) dx + ∫0 x (4 − 8 x) dx + ∫0.5 x(0) dx = 0.1667 .
Esperanza de una función de una variable aleatoria continua. De manera análoga al caso discreto, el concepto de esperanza de una variable aleatoria puede extenderse para una función Y = H ( X ) de una variable aleatoria X continua con función de densidad f ( x). Así, +∞
E ( H ( X )) = ∫−∞ H ( x ) f ( x ) dx,
Propiedades de la esperanza de una variable aleatoria. La esperanza de una variable aleatoria X , sea ésta discreta o continua, cumple con las siguientes propiedades: 1. E (a) = a, a constante 2. E (aX ) = aE ( X ), a constante. 3. E (aX + b) = aE ( X ) + b, a y b constantes. La igualdad 3) confirma el carácter de localización de la esperanza. Al agregar la constante b a la variable, la esperanza es trasladada b unidades. Otras propiedades muy importantes de la esperanza se indican más adelante. Demostraremos las propiedades 2 y 3 para el caso discreto y finito; así como para el caso continuo. Para el caso discreto e infinito la demostración es análoga. Para el caso continuo se usa el concepto de la función de densidad y se calcula mediante la integración. Pr ue ba de la propie da d 2 .
Caso discreto. Suponiendo que los valores de X son: x1, ... , xm, se tiene: m
E ( aX ) =
∑ axk P[ X
m
= xk ] = a
k =1
∑ x k P[ X
= x k ] = aE ( X ).
k =1
Caso continuo +∞
∞
E (aX ) = ∫−∞ axf ( x )dx = a ∫−∞ xf ( x) dx = aE ( X ) .
Probabilidad. 1 99
Pr ue ba de la propie da d 3 .
Caso discreto. E ( aX + b) =
m
m
m
k =1
k =1
k =1
∑ ( ax k + b) P[ X = x k ] = a ∑ xk P[ X = k ] + b ∑ P[ X = xk ]
= aE ( X ) + b(1) = aE ( X ) + b Análogamente para el caso continuo.
3.7. LA VARIANZA DE UNA VARIABLE ALEATORIA. En general no es suficiente una medida de centralización para conocer como están distribuidos los valores de una variable aleatoria. Dos variables pueden tener la misma esperanza pero no igual dispersión. La varianza conjuntamente con la esperanza, se usa a menudo para resumir la información de un conjunto de datos. La varianza V ( X ) de una variable aleatoria X con esperanza µ es el número V ( X ) = E [( X - µ)2]. La definición de varianza permite afirmar que ésta es un número no negativo que toma valores pequeños cuando los valores de la variable están concentrados alrededor de su media.
Si todos los datos son iguales, la varianza es i gual a 0. Al número
V ( X ) se le llama desviación estándar de X y se le denota con σ X . Usando 2
esta notación la varianza se denota con σ X . Si no hay lugar a confusión se usa simplemente σ y σ2 para la desviación estándar y varianza, respectivamente. A menudo se usa la desviación estándar de la variable, pues tiene la misma dimensión que la variable. Si X proporciona valores en metros, la desviación estándar de ésta también estará en metros. Nótese que si X es una variable aleatoria discreta con ley de probabilidad X
x1
x2
...
.xn....
...
p ( x i )
p ( x1 )
p ( x 2 )
...
p ( x n )
...
se cumple, V(X) =
∑ ( xi − E ( X )) 2 p( xi )
200. Probabilidad.
Si la variable aleatoria X es continua con función de densidad f ( x) y esperanza µ, entonces la varianza de X se expresa con +∞
V ( X ) = ∫−∞ ( x − µ ) 2 f ( x )dx .
3.19. Ejemplo. Si los valores de X son: 3, 4, 5, y 6, con probabilidades respectivas, 0.2, 0.4, 0.3 y 0.1, E ( X ) = 3(0.2) + 4(0.4) + 5(0.3) + 6(0.1) = 4.3 y V ( X ) = (3 - 4.3)20.2 + ... + (6 - 4.3)20.1 = 0.81.
3.20. Ejemplo. La función de densidad de una variable aleatoria continua X es de la forma que se indica en la siguiente figura.
Calcular E ( X ) y V ( X ). (1,1 ) ( x ) 0
2
Figura 3.13. Gráfico de la función de densidad de X .
Solución.
x si 0 ≤ x ≤ 1 f ( x ) = 2 − x si 1 < x ≤ 2 Luego, +∞
1
2
E ( X ) = ∫−∞ x f ( x ) dx = ∫0 x ( x )dx + ∫1 x (2 − x )dx = 1 +∞
1
2
2 2 2 V ( X ) = ∫−∞ ( x − µ ) f ( x ) dx = ∫0 ( x − 1) xdx +∫1 ( x − 1) (2 − x )dx =1 / 4
Propiedades de la varianza. Las siguientes propiedades son básicas en el desarrollo de los diferentes cálculos que sobre la varianza se realizan. Si X es una variable aleatoria, se cumple: 1. V ( X ) ≥ 0. 2. Si X = a, con probabilidad 1, V ( X ) = 0.
Probabilidad. 2 01
3. V (aX + b) = a2V ( X ). 4. V ( X ) = E ( X 2) - [ E ( X )]2. 3.21. Ejemplo La fracción de tiempo, X, que una computadora está en uso durante un día de trabajo de 8 horas, es una variable aleatoria con función de densidad
2 x 0 ≤ x ≤ 1
f ( x ) =
0 en el resto
Calcular la esperanza y la varianza de X. Hallar el valor esperado del costo por el uso de la computadora si éste es . X2. C( X ) = 5 + 3 X + 01
Solución. Usando la definición de esperanza se tiene:
E ( X ) =
1 ∫0 x(2 x)dx
2 x 3 = 3
1
= 0
2 . . = 06667 3
2
Para calcular la varianza, calculemos primero E ( X ) :
2
E ( X ) =
1 2 ∫0 x (2 x )dx
2 x 4 = 4
1
= 0
1 = 0.50. 2
Luego, V ( X ) = E ( X 2 ) − [ E ( X )]2 = 0.50 − 0.4444 = 0.0556. La esperanza del costo es igual a 2 2 E ( X ) = E (5 + 2 X + 0.1 X ) = 5 + 2 E ( X ) + 0.1E ( X ) = 5 + 0.6667 + 0.1(0.0556) = 5.6726.
Pr ue ba de la propie da d 4 . 2 2 2 2 2 V ( X ) = E[( X − E ( X )) ] = E ( X ) − 2 E ( X ). E ( X ) + [ E ( X )] = E ( X ) − [ E ( X )]
2 02 . Probabilidad.
3.8. TOPICOS SOBRE LA ESPERANZA Y LA VARIANZA . ESPERANZA Y VARIANZA DE UNA VARIABLE ESTANDARIZADA. A partir de la variable aleatoria X se pueden definir otras variables, por ejemplo, la variable aleatoria Y = ( X - E ( X ))/ σ, donde σ es la desviación estándar de X . A esta nueva variable aleatoria que expresa, en desviaciones estándar, las desviaciones de cada valor de la variable respecto de la media, se le llama variable estandarizada. Se comprueba que la esperanza de una variable estandarizada es 0 y su varianza es 1.
DESIGUALDAD DE CHEBYSHEV. La esperanza µ y la varianza σ 2 de una variable aleatoria proporcionan información del "centro" y de la dispersión de la distribución; sin embargo, también pueden ser utilizadas para indicar la probabilidad en diversos intervalos; así se puede decir que cuando el gráfico de la distribución es aproximadamente simétrica y de la forma que se indica a continuación,
Figura 3.14.
* la probabilidad de que los valores de X estén en el intervalo ]µ − σ, µ + σ[ es aproximadamente igual a 0.6826. * la probabilidad de que los valores de X estén en el intervalo ]µ − 2σ , µ + 2 σ[ es aproximadamente igual a 0.9500. Los resultados anteriores no se cumplen necesariamente si la forma de la distribución no es simétrica; pero la siguiente propiedad de Chebyshev que relaciona la media, la varianza y la probabilidad, que se cumple cualquiera que sea la forma de la distribución , permite calcular de manera aproximada las probabilidades de diferentes intervalos. Da da la variable X co n me di a µ y varian za σ 2 , se cumple P[| X − µ| ≤ k σ] ≥ 1 −
1 2
k en donde k ≥ 1 .
La relación indicada puede expresarse, de manera equivalente, como
Probabilidad. 2 03
P[| X − µ| > k σ] <
1 2
.
k
La desigualdad proporciona una cota para la distribución de X alrededor de la media, aún cuando la distribución no se conozca. La desigualdad establece, por ejemplo, que en el intervalo definido por | X − µ| ≤ 2 σ ; esto es, en [ µ − 2 σ , µ + 2 σ ], exi ste por lo me nos el 75% de lo s datos ; est o es , P (| X − µ | ≤ 2 σ ) ≥ 1 − 1 / 4 = 0 . 75 .
3.22. Ejemplo. En una refinería, la producción media diaria de gasolina es de 150000 galones con una desviación estándar de 1000 galones. Se sabe con certeza que la mínima producción de gasolina es 147000 galones diarios.
a) Hallar la probabilidad de que la producción diaria de gasolina esté entre 148000 y 152000. b) Calcular el intervalo más corto que contenga por lo menos 90% de los niveles de producción diaria. c) Con qué frecuencia se puede decir, que la producción será mayor que 157000 galones diarios. Solución. a) El intervalo [148000, 152000] corresponde a [ µ - 2 σ , µ + 2σ ] con µ = 150000 y σ = 1000.
Aplicando la propiedad de Chebyshev con k = 2, se tiene que, con probabilidad mayor o igual a 1 - (1 / k 2 ) = 0.75, la producción diaria estará en el intervalo indicado. Se “espera” que el 75% de los días la producción de gasolina esté en el intervalo [148000, 152000]. b) Un intervalo que satisface lo pedido es uno de la forma [µ - k σ , µ + k σ ] en 1 donde k es tal que 1 − 2 = 0.90 . Resolviendo, se tiene k = 10 = 3.1622. k
De ahí que [ µ - 3.1622 σ , µ + 3.1622 σ ] = [146837.80, 153162.20]. Como la menor producción es 147000, un intervalo que satisface la exigencia es [147000, 153162.20]. c) La distancia entre 157000 y la media 150000 expresada en desviaciones 157000 − 150000 = 7. estándar es 1000
2 04 . Probabilidad.
Aplicando la propiedad de Chebyshev, se tiene que la probabilidad de que un dato esté en el intervalo [150000 - 7(1000), 150000 + 7(1000)] = [143000, 1 1 157000] es por lo menos 1 − 2 = 1 − 2 = 1 − 0.0204 = 0.9796 . k 7 Como la menor producción es 147000 podemos decir que la producción no puede ser mayor que 157000 en más del 2.04% de los días (1- 0.9796 = 0.0204).
APROXIMACION DE LA ESPERANZA Y DE LA VARIANZA. Cuando una función g ( X ) de una variable aleatoria X tiene una expresión complicada, el cálculo de la esperanza y varianza resulta difícil pero estos valores pueden aproximarse si g ( X ) es aproximadamente lineal en la región en donde están concentrados los datos. Tomando en cuenta el desarrollo de Taylor de g alrededor de la media µ, se puede escribir: g ( X ) = g ( µ ) + g ' ( µ )( X − µ ) + R ,
en donde g' (µ ) es la derivada de g calculada en la media µ de X y R es una cantidad pequeña. Aplicando la esperanza se tiene E [ g ( X ) ] ≈ E [ g ( µ ) ] + g ' ( µ ) E ( X − µ ) .
Como E ( X - µ) = 0 y g ( µ) es constante, se tiene que E [ g ( X ) ] ≈ g ( µ ) . Aplicando la varianza se cumple: 2
V [ g ( X ) ] ≈ V [ g (µ ) ] + [ g ' ( µ )]2 V ( X − µ ) = [ g '( µ)] V ( X ).
3.23. Ejemplo. Si X es una variable aleatoria con E ( X ) diferente de 0, entonces E ( 1/ X ) ≈ 1/ E ( X )
y
V (1/ X ) ≈ V ( X ) / [ E ( X ) ]4 .
En este caso, g( X ) = 1 / X . 3.24. Ejemplo. Si X es una variable aleatoria con valores positivos y E ( X ) es diferente de 0, E [ ln ( X )] ≈ ln ( E ( X ) ),
2
V [ ln ( X )] ≈ V ( X ) / [ E ( X ) ] .
Para la transformación logaritmo, g ( X ) = ln ( X ) , la varianza de la variable transformada es aproximadamente igual al cuadrado del coeficiente de variación.
Probabilidad. 2 05
3.25. Ejemplo. Suponiendo que una variable aleatoria X tiene media 10 y varianza 4, la media
y la varianza aproximada de Y = 3 X − 1 son como sigue: 2
E ( Y ) ≈ 3 10 − 1 y V ( X ) ≈ [ 3 / 2 10 − 1 ] ( 4 ) = 1.
LA LEY DE LOS GRANDES NUMEROS . La ley de los grandes números considera que si la esperanza de una variable X existe, ésta puede ser calculada; tomando el promedio de una sucesión de n valores de X independientes entre sí. Este promedio se estabiliza alrededor de una constante cuando n aumenta indefinidamente. La constante es igual a la esperanza de X . El resultado conocido también como el prin cipi o de re gula ridad es tadí stica , se enuncia de la siguiente manera: Se a X 1 , ... , X n , una sucesión de variables aleatoria independientes todas con esperanza µ y desvia ci ón está ndar σ . Se cumple que "Con probabilidad 1, la sucesión de variables aleatorias de la fo rma X n =
X1+...+ X n n
tiende al valor µ cuando n se acerca al infinito" .
ERROR DE MEDIDA. ERROR ALEATORIO Y SISTEMATICO. Una de las aplicaciones de la media y la varianza se encuentra cuando se estudian los errores que se producen al realizar repetidamente la medición de una magnitud a. Si el instrumento que se usa en la medición está bien calibrado y quien lo utiliza hace bien las medidas (“no sesga las observaciones”), las diferencias entre las medidas obtenidas y el verdadero valor a, varía aleatoriamente. Las diferencias así generadas se llaman errores aleatorios . Se puede considerar que la distribución de los errores aleatorios es normal con media 0 y desviación estándar σ. Cuando el instrumento que se usa es consistente con las medidas pero el instrumento no está bien calibrado o quien realiza las mediciones “sesga” las mismas, aparte del error aleatorio se produce un error que se llama “error sistemático ”. Se puede considerar que el error sistemático es la diferencia entre las medidas realizadas y el verdadero valor a.
2 06 . Probabilidad.
Si la varianza de las medidas es pequeña se dice que las mediciones realizadas tienen “ alta precisió n ” y si las medidas están cercanas al verdadero valor a se dice que éstas se han realizado “ co n e xact it ud ”.
3.9. EJERCICIOS . 1. El número X de toneladas de cierto material, recolectadas en una semana, es una variable aleatoria con ley de probabilidad x i
0
2
3
4
p i
0.1
0.4
c
0.2
a) Hallar el valor de c. b) Hallar la función de acumulación de X . c) Representar gráficamente a la ley de probabilidad de X y a su función de acumulación. d) Hallar la ley de probabilidad de Y = | X 3|. Rpta. . a) c = 0.3 d) P [ Y = 0] = 0.3, P [ Y= 1] = 0.6 y P [ Y = 3] = 0.1. -
2. Suponiendo que la demanda D, diaria de un artículo, es una variable aleatoria con la siguiente ley de probabilidad P[ D = d ] = c2d / d !,
d = 1, 2, 3, 4. a) Hallar c. b) Hallar P[1 < D < 4] Rpta. a ) c = 1/6, b) P [1 < D < 4] = P [ D = 2] + P [ D = 3] = 0.5556.
3. Al examinar a los niños en una cierta población con respecto a dos tipos de defectos físicos: A y B, se encontró que el 20% de ellos no revelaban tales defectos, el 40% tenían el defecto A, y el 50% el defecto B. Algunos tenían ambos defectos. Si se escoge un niño a l azar, ¿cuál es la ley de probabilidad de la variable Y que indica el número de defectos encontrados?. Rpta. La variable puede tomar los valores 0, 1 y 2 con probabilidades: 0.2, 0.7 y 0.1, respectivamente. 4. Si se arrojan dos dados equilibrados y se considera la variable aleatoria X = máximo de los valores que aparecen, ¿cuál es la ley de probabilidad de X ?. Rpta. La variable puede tomar los valores 1, 2, 3, 4, 5, y 6 con probabilidades respectivas: 1/36, 3/36, etc. 5. Una moneda se lanza dos veces de manera independiente. Hallar la ley de probabilidad de la variable X , que indica el número de caras que aparecen en los dos lanzamientos, si la probabilidad de que aparezca cara es 0.6. Rpta. La variable X puede tomar los valores 0, 1 y 2 con probabilidades 0.16, 0.48 y 0.36, respectivamente. 6. En un cajón hay cuatro monedas de $1 y tres monedas de $5. Se extraen dos monedas al azar y de una sola vez y se define la variable X como la cantidad total de d inero extraído. Indicar la ley de probabilidad de X. Rpta. La variable puede tomar los valores 0, 1, 2 con probabilidades 0.16, 0.48 y 0.36, respectivamente. 7. Se consideran dos lotes de medicinas. En uno de los lotes existen 4 de tipo A y 96 de tipo B; en el otro hay 3 de tipo A y 75 de tipo B. De cada lote se escoge al azar una medicina y se considera la variable X que indica el número de medicinas de tipo A extraídas; hallar la ley de probabilidad de X .
Probabilidad. 2 07
8. Para ocupar una plaza de trabajo se presentan 10 personas cuyos coeficientes de inteligencia son todos diferentes e iguales a 11 1, 112, ... , 120. Se eligen tres postulantes al azar. Si X es la variable aleatoria que indica el mayor coeficiente de inteligencia entre los tres escogidos, hallar a) la ley de probabilidad de X . b) la probabilidad de que al menos uno de los seleccionados tenga un coeficiente mayor o igual a 118. 1 k − 11 1 para k = 113, ... , 120. Rpta. a) La ley de probabilidad es P [ X = k ] = C1 C 2 10 C 3
9. Un proyecto está compuesto de tres actividades: A, B, C. El orden en que las labores deben ser ejecutadas se presenta en el siguiente diagrama de redes (las líneas representan actividades). Esto es, la actividad B debe ser completada antes de que la C pueda comenzar. inicio
A
final
C
B
Figura 3.15. La actividad A no depende, para su inicio, ni de B ni de C (se ejecutan simultáneamente) pero ambas A y C deben ser completadas antes de que el proyecto se considere terminado. El tiempo necesario para completar cada actividad es incierto. Sin embargo, se asignan probabilidades a los tiempos de terminación de las actividades, como se indica en la siguiente tabla. Actividad
A B C
Tiempo posible en semanas para terminar 4 6 1 3 2 4
Probabilidad
0.50 0.50 0.25 0.75 0.80 0.20
Hallar la ley de probabilidad del tiempo, T, necesario para terminar el proyecto. Rpta. La variable T puede tomar los valores 4, 5, 6 y 7, con probabilidades 0.1, 0.325, 0.425 y 0.15, respectivamente. 10. Una variable aleatoria X tiene función de densidad
ax , 0 ≤ x ≤ 1 f ( x ) = a , 1 ≤ x ≤ 2 , − ax + 3a , 2 ≤ x ≤ 3 a) Hallar el valor de a. b) Hallar la probabilidad de que la variable X tome los valores comprendidos entre 1.5 y 2.5, incluyendo estos valores. . ≤ X ≤ 2.5] = 0.4375 . Rpta. a) a = 0.5. b) P[15 11. Sea X una variable aleatoria con función de d ensidad
2 08 . Probabilidad.
cx si x ∈ [ 0,1],
f ( x ) =
0 en el resto.
a) Hallar la probabilidad de que X tome valores mayores que 0.7. b) Hallar A de tal modo que P[ X < A] = 0.2. c) Hallar la probabilidad de que X diste de 0.5 en menos de 0.2. Rpta. c = 2, b) A = 0.4472. 12. Se supone que en cierta región, el salario mensual, en miles de unidades monetarias, es una variable aleatoria X cuya función de densidad es
kx si 0 < x < 1
f ( x ) =
k ( 5 / 4 − x / 5) si 1 ≤ x ≤ 5
Hallar: a) el valor de k . b) la probabilidad de que una persona tenga un salario mayor que 0.5 miles de unidades unitarias. c) Si el estado impone un impuesto de 10% a los ingresos de menos de 1000 unidades unitarias y de 20% al resto de ingresos, ¿cuánto espera recaudar el estado por concepto de impuestos? 13. Decir si la función x si | x| ≤ 3 2 f ( x) = π( x − 9) 0 en el resto
corresponde a la función de densidad d e una variable aleatoria X. 14. Para la variable, cuya ley de probabilidad se indica en el ejercicio 2, calcular la demanda esperada. Rpta. 2.5 15. En cada uno de los ejercicios, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, hallar la esperanza y la varianza de la variable en referencia 16. José tiene opción de participar en los juegos I y II, cuyas utilidades para el juego I, son: -4 , 5 y 9 con probabilidades 0.4, 0.2 y 0.4, respectivamente; para el juego II, son: -4, 5 y 9 con probabilidades respectivas, 0.3, 0.6 y 0.1. Si José debe participar una sola vez en uno de los dos juegos, ¿en cuál juego le recomienda participar?. Si José desea participar muchas veces en uno de los dos juegos, en cuál ju ego le recomienda participar?. Rpta. Para el primer caso, analizar la probabilidad, para el segundo caso, an alizar la esperanza. 17. En un lote hay 2 artículos defectuosos y 2 no defectuosos. Si los artículos se revisan al azar, uno después de otro y sin restitución, y se considera la variable X que indica el nú mero de artículos que se deben escoger en la revisión a fin de sacar todos los defectuosos, hallar a) La ley de probabilidad de X b) El valor esperado de X y la varianza de X Rpta. a) Los valores que puede tomar X son: 2, 3 y 4 con probabilidades 4/24, 8/24 y 12/24, respectivamente. 18. Una empresa invirtiendo en el sector industrial ganará $7000 000 con probabilidad 0.9 y perderá $2000000 con probabilidad 0.1. Invirtiendo en el sector agrícola ganaría $6000000 si se construye un determinado reservorio, pero si no se construye, perdería $2000000. La probabilidad de que se construya el reservorio es 0.6. ¿Cuál debe ser la probabilidad de realización del reservorio para que a largo plazo sea indiferente el campo de inversión?. 19. En el ejemplo 3.17, ¿cuál debe ser el número de periódicos que debería pedir el canillita para que el valor esperado de su ganancia sea máxima?.
Probabilidad. 2 09
20. Una compañía vendedora de televisores considera que éstos tienen algún defecto con probabilidad 0.1. La compañía asegura que cada aparato vendido con algún defecto será reparado sin costo para el cliente. Si se han vendido tres televisores, ¿cuánto espera gastar la compañía en reparaciones si el costo por reparación es C = Y 2 + Y + 5, donde Y es el número de televisores, con algún defecto. Rpta. 5.60. 21. Se han vendido 1310000 boletos de lotería a un valor de 20 u. m. cada uno. Hay 1, 2, 6, 77, 166, 875, 1296, 11790 y 146720 boletos con los siguientes premios, respectivamente: 500000, 100000, 50 000, 10000, 5000, 1000, 250, 100 y 50 u. m. También existen 26200 premios consistentes de un nuevo boleto. Si una persona compra un boleto, ¿cuál es la probabilidad de que obtenga algún premio?. ¿Cuál es la esperanza de su ganancia neta?. Interprete cada uno de los resultados. Rpta. -10.20. 22. La demanda diaria de cierto artículo es una variable aleatoria cuyos valores son 10, 20 o 30 con probabilidades 0.2, 0.5 y 0.3, respectivamente. El costo de cada artículo es 1.80 y el de venta es 2.00. Los artículos son perecederos de tal manera que si un artículo no se vende la pérdida es total. Hallar el número de artículos que se deben ordenar para la venta de tal manera que la ganancia sea máxima. 23. El 3% de un grupo de k personas sufren de una enfermedad A que puede detectarse mediante una prueba de sangre. El examen puede hacerse de dos maneras: 1) examinando a cada una de las k personas o 2) mezclando las muestras de todas las k personas y después analizar la mezcla. Si en este caso la prueba resulta positiva se tiene que examinar a cada una de las personas por separado, de otra manera es suficiente una sola prueba. a) Para un valor fijo de k, ¿cuál es el valor esperado del número de pruebas en el caso 2). b) ¿Cuál es el valor de k que minimiza el número esperado de pruebas en el caso 2)?. 24. La demanda X de gasolina en miles de galones y por día en una refinería tiene función de densidad
2 cx , si 0 < x ≤ 1 f ( x ) = c (3 − x ), si 1 ≤ x ≤ 3 0 en otro caso. a) Hallar el valor de c que hace que f sea función de densidad?. b) Hallar la esperanza y la varianza de la demanda diaria de gasolina. c) Hallar la probabilidad de que en un día cualquiera la demanda de gasolina sea 1500 galones o más. d) Hallar la función de acumulación de X. Construir su gráfica. e) Utilizar la función de acumulación para calcular la probabilidad de que la demanda diaria esté entre 1200 y 1500 galones. f) ¿Cuál debe ser el inventario mínimo que la refinería debe tener para que, con probabilidad 0.95, exista gasolina al final de cualquier día?. 25. El contenido X de magnesio en un cierto compuesto es una variable aleatoria, cuya función de densidad es
cx / 8 si 0 ≤ x ≤ 6
f ( x ) =
0 en otro caso.
La ganancia que se obtiene por este compuesto es G = 10 + 2 X . ¿Cuál es la ganancia esperada?. 26. Un fabricante de aparatos de TV ofrece una garantía de un año, en la que se compromete a reemplazar cada aparato, sin costo para el cliente, si alguna pieza de éste falla por primera vez. El fabricante estima que el tiempo X, en años, hasta la primera falla es una variable aleatoria con función de densidad
x / 2 si x > 0
f ( x ) =
0 en otro caso.
2 10 . Probabilidad.
a) ¿A qué porcentaje de los aparatos espera cambiar el fabricante? b) Si el beneficio por venta es de $ 50 y reemplazar un televisor cuesta $20, ¿cuál es el beneficio esperado en el negocio si se han vendido N televisores?. c) Hallar la mediana de X. 27. La demanda diaria, en cientos de kilos, de un cierto artículo en una tienda de abarrotes es
3 x 2 , 0 ≤ x ≤ 1 0, enel resto
f ( x ) =
Si un determinado día el dueño del almacén ordena 70 kilos del artículo, ¿cuál es el valor esperado de la ganancia si el kilo del artículo cuesta $8 y se vende a $10. Rpta. k =129.71. 28. La proporción de impurezas que se pueden encontrar en muestras de determinado metal precioso es una variable aleatoria X cuya función de densidad es
2 (1 − x ) si 0 ≤ x ≤ 1
f ( x ) =
0 en el resto
,
hallar la esperanza de X 2 29. En una gran empresa, el sueldo promedio de los trabajadores es $400 con una desviación estándar de 50. Usando la propiedad de Chebyshev, a) Indicar la probabilidad de que el sueldo de un trabajador esté entre $300 y $500. b) Calcular el intervalo más corto que contenga por lo menos al 85% de los sueldos de los trabajadores. c) Con qué frecuencia, se puede decir que, los sueldos de los trabajadores son mayores que $500 si se sabe que los sueldos son mayores que $400. Rpta. a) Es mayor o igual que 0.75. b) [271, 529]. 30. Una variable aleatoria tiene esperanza 30 y varianza 9. Usando el teorema de Chebyshev, a) Hallar una cota inferior para P[21 ≤ X ≤ 39] . b) Hallar el valor de c que cumple con P[| X − 30| ≥ c ] ≤ 0.05 31. Los gastos, en miles de soles, que se originan mensualmente en una dependencia tienen media 150 y varianza 4500. No conociendo la distribución de los gastos, ¿se podría considerar que es muy improbable que los gastos sean superiores a 350?. 32. Calcular aproximadamente la media y la varianza de la variable Y = la varianza de la variab le aleatoria X es, respectivamente, 8 y 1. Rpta. La esperanza es aproximadamente igual a
X
2 + X si la media y
72 .
3.10. DISTRIBUCION CONJUNTA. VARIABLES ALEATORIAS INDEPENDIENTES Muchas veces interesa el análisis de la relación que pueda existir entre dos o más variables. Es conveniente por ello, establecer modelos que describan el comportamiento de dos o más variables a la vez. La distribución conjunta , que se estudia a continuación, ayudará en este sentido.
Probabilidad. 2 11
Vector aleatorio bidimensional. Las variables aleatorias asocian a cada resultado de un experimento aleatorio un número real. Cuando un vector de dos o más dimensiones es asociado a cada resultado de un experimento aleatorio se tiene una variable aleatoria mu lt id im ens io nal o vector aleatorio . Por razones de comodidad en las notaciones, restringiremos la exposición teórica al caso de dos dimensiones. 3.26. Ejemplo. Si a cada artículo que produce una fábrica le hacemos corresponder su número de defectos, X , y su peso Y , se tendrá el par ( X , Y ) , llamado vector aleatorio de dos dimensiones . En ge ne ral, da das do s va riab le s aleato ri as X e Y defi ni da s en Ω , al par ( X , Y ) se le llama vector aleatorio bi di me nsional
Vectores aleatorios bidimensionales discretos y continuos. Si las variables X e Y, son discretas se dice que el vector aleatorio bidimensional ( X , Y ) es discreto . Cuando ambas variables son continuas, el vector se llama vector aleatorio continuo .
Distribución de probabilidad conjunta o ley de probabilidad conjunta. (Caso discreto). Consideremos el espacio Ω en donde están definidas una probabilidad P y las variables aleatorias X e Y discretas. Si el conjunto de valores de cada variable es, respectivamente, R X = { x1 , ... , xm , ...} y Ry = { y1 ,... , yn , ...} ,
la ley de probabilidad conjunta del vector bidimensional ( X , Y ) , que se denota con p( x i , y j ) , se define como p( x i , y j ) = P[ X = xi , Y = y j ], xi ∈ R X
y y j ∈ RY ,
en donde P [ X = xi , Y = y i ] = P[ X −1 ( xi ) ∩ Y −1 ( y j )] . Se cumple: p( x i , y j ) ≥ 0 y que Las funciones definidas como
∑
∑
xi ∈ R X y j ∈ RY
p( xi , y j ) = 1 .
2 12. Probabilidad.
p X ( xi ) = pY ( y j ) =
∑
p( x i , y j ) , para x i ∈ R X ,
y j ∈ R y
∑ xi ∈ R X
p( x i , y j ) , para y j ∈ RY .
st ribu buci ci ón ma rgina rg ina l de X y dist di st ri buc ión ió n ma rgin rg inal al de Y , se llaman: di stri respectivamente. Se comprueba fácilmente que cada distribución marginal es una ley de probabilidad de la variable respectiva.
3.27. Ejemplo. Se lanzan dos dados equilibrados y se consideran las variables aleatorias: X = = número de puntos que aparecen en la cara superior del dado 1, Y = = número de puntos que aparecen en la cara superior del dado 2.
La ley de probabilidad conjunta de X e e Y e e s p (i , j ) = P[ X = i , Y = j] = P[ X
−1
i = 1, 2,... , 6 y j = 1, 2, ... , 6. ( i) ∩ Y −1 ( j)] = 1/ 36 para
Se tiene, por ejemplo, que p (1, 5) = P[ X = 1, Y = 5] = P [" en el primer dado aparezca 1 punto en la cara superior y 5 punt pu nt os en la ca ra supe su pe rior ri or del de l segundo dado "] = 1/36. La distribución marginal de X calculada, calculada, por ejemplo en 3, es p X ( 3) =
∑ p ( 3, y ) = p( 3, 1) + p ( 3, 2 )+ . . .+ p (3, 6 ) = 6 /36 . y∈{1, 2 ,..., 6}
La ley de probabilidad conjunta p( x i , y j ) s e re re p r es es e n t a co co n se se g m e nt os os de de longitud p( x i , y j ) , pe per pe pe n d ic ic ul a re res a l p l an an o XY en en el p u nt o ( xi , y j ) . p( xi , y j ) y j
0
Y
xi X
Figura 3.16.
3.28. Ejemplo. En la siguiente tabla X \ Y
51
52
53
54
55
51
0.06
0.05
0.05 0.05
0.01 0.01
0.01 0.01
52
0.07
0.05
0.01 0.01
0.01 0.01
0.01 0.01
53
0.05
0.10
0.10 0.10
0.05 0.05
0.05 0.05
54
0.05
0.02
0.01 0.01
0.01 0.01
0.03 0.03
Probabilidad. 2 13
55
0.05
0.06
0.05 0.05
0.01 0.01
0.03 0.03
se considera la distribución conjunta de las variables aleatorias discretas X e Y, en donde X representa representa el número de órdenes del medicamento A durante Junio e Y representa el número de órdenes durante el mes de Julio del mismo medicamento. Hallar la distribución marginal de X Solución. La distribución marginal de X está descrita por p X (51) = 0.06 + 0.05 + 0.05 + 0.01 + 0.01 = 0.18. p X (52) = 0.07 + 0.05 + 0.01 + 0.01 + 0.01 = 0.15. p X (53) = 0.05 + 0.10 + 0.10 + 0.05 + 0.05 = 0.35. p X (54) = 0.05 + 0.02 + 0.01 + 0.01 + 0.03 = 0.12. p X (55) = 0.05 + 0.06 + 0.05 + 0.01 + 0.03 = 0.20.
El lector puede hallar, de igual manera, la ley marginal para Y.
Función de densidad conjunta. (Caso continuo). Para las variables aleatorias continuas X e e Y, se define la función de densidad conjunta.como la función y = f ( x, y) que cumple con
a) f ( x, y ) ≥ 0 +∞ +∞
b) ∫−∞ ∫−∞ f ( x , y )dxdy = 1. nd e A es un even ev ento to cont co nt enid en id o en el c) P[ A] = ∫∫ f ( x , y)dxdy . , do nde A
pl an. an .
La relación 3 indica la manera de calcular la probabilidad de un evento que está contenido en el plano. In te gran gr ando do la func fu nc ió n de dens de ns id ad con junt ju nt a con co n resp re spec ecto to a la variable Y se obtiene la funci fu nci ón de densi de nsi dad da d ma rgin rg inal al de X : +∞
f X ( x ) = ∫−∞ f ( x , y )dy . An ál ogam og am en te, pa ra la vari va riab ab le Y, su func fu nció ión n de densi de nsi dad da d e s ma rgin rg in al e +∞
f Y ( y ) = ∫−∞ f ( x , y )dx
2 14. Probabilidad.
Ley de probabilidad y función de densidad condicionales. Variables aleatorias independientes. Intuitivamente dos variables aleatorias X e e Y definidas definidas en Ω son independientes si los eventos que X determina (por ejemplo [ X < < 4]), son independientes de los que Y determina (por ejemplo [ Y > 10]). La definición exacta del concepto de variables independientes se obtienen siguiendo el camino que se usó para definir eventos independientes. Para ello presentamos previamente los conceptos de ley de probabilidad condicional y función de densidad condicional. Da das da s la s vari va ri ab le alea al ea to rias ri as X e Y, para pa ra un valo va lorr de term te rm in ado ad o x de X, la ley de probabilidad condicional de condicional de Y da do x es la función definida por pY | X ( y | x ) =
p ( x , y ) p X ( x )
pa ra el ca so di scre sc reto to y , para
la funci fu nci ón de de nsid ns idad ad co cond ndic icio io nal, na l, de Y dado da do , x es la función definida por
f Y | X ( y j | xi ) =
f ( xi , y j ) f X ( xi )
, para pa ra el caso ca so cont co ntinu inu o .
Las La s vari va riab ab les le s al eato ea to ri as X e Y se di ce qu e son so n independientes s i pY | X ( y| x ) = p Y ( y ) , pa ra el ca so di scre sc re to y f Y | X ( y| x) = f Y ( y ) , para pa ra el ca so cont co nt in uo. uo .
Nótese que si X, e Y son independientes, entonces p( x i , y j ) = p X ( x i ) pY (y j ) , para el caso discreto f ( x , y ) = f X ( x ) f Y ( y ) , para el caso continuo.
3.29. Ejemplo. Dos números aleatorios se escogen al azar y de manera independiente en el intervalo [2, 5]. Hallar la probabilidad de que uno de ellos esté en el intervalo [3, 3.5] y el otro, en el intervalo [4, 4.2].
Solución.
Probabilidad. 2 15
Sea X la variable aleatoria que representa a uno de los números escogidos e Y la variable que representa al otro. Se desea calcular P[ X ∈ [ 3, 3.5], Y ∈ [ 4 , 4.2 ]] .
Como las variables X e Y representan pruebas independientes y la distribución de cada una de ellas es uniforme en cada uno de los intervalos respectivos, se tendrá que la distribución conjunta de X e Y e s f XY ( x , y ) = f X ( x ) fY ( y ) . Luego, P [ X ∈[ 3 , 3. 5 ], Y ∈ [ 4 , 4 . 2 ]] = 3.5 4.2
∫3 ∫4
3.5
f XY ( x , y )dxdy = ∫3
4.2
f X ( x )dx ∫4
f Y ( y )dy =
3. 5 − 3 4 . 2 − 4 5− 2
5− 2
= 0. 0111.
3.30. Ejemplo. Una embotelladora de refrescos recibe botellas de la fábrica A que luego se someten a un control de calidad de la siguiente manera:
El control se hace por lotes de 50 botellas cada uno. De las 50 se toman al azar 2, sucesivamente y sin reposición. Si ninguna es defectuosa se acepta el lote, de otro modo se eligen de una en una y sin restitución otras 3 de las 48 que quedan. Si en el segundo grupo las tres son defectuosas el lote se rechaza, de otro modo se acepta. ¿Cuál es la probabilidad de que un lote de 50 botellas sea rechazado si en él existen 10 que son defectuosas?. Solución. Sean X e Y las variables que indican, respectivamente, el número de botellas defectuosas en el primer y segundo grupo.
El siguiente diagrama, en donde los nodos terminales marcados con asterisco indican "rechazo del lote", ilustra la situación. Y = 0 Y = 1 Y = 2 Y = 3 X = 2
*
rechazo
Y = 0 Y = 1
X = 1
Y = 2
X = 0
aceptac
Y = 3
*
rechazo
Figura 3.17.
P [ Se rechace el lote ] = P [ X = 1, Y = 3] + P [ X = 2, Y = 3] = = P [ Y = 3| X = 1] P [ X = 1] + P [ Y = 3| X = 2] P [ X = 2]
2 16 . Probabilidad.
=
C39 C 039 C110 C 140 C 348
C 250
+
C38 C 040 C210 C 040 C 348
C 250
= 0.0017.
Funciones de variables aleatorias. Usando la distribución conjunta o la función de densidad conjunta, se puede definir la distribución de funciones de dos o más variables, tales como: g ( X , Y ) = X + Y , g ( X , Y ) = XY , g ( X , Y ) = X / Y , g ( X 1 , ..., X n ) = c 1 X 1 + ... + c n X n , etc.
Esperanza de una función de dos o más variables aleatorias. La esperanza de una función g de dos o más variables aleatorias se establece a partir de la ley de probabilidad conjunta o de la función de densidad conjunta de las variables, según sean discretas o continuas. Así para una función g de las variables X e Y, se tiene: E ( g ( X , Y ) ) =
∑ ∑ g ( xi , y j ) p ( xi , y j ) ,
(caso discreto),
i j
+∞ +∞
E ( g ( X , Y ) =
∫ ∫ g ( x , y ) f ( x , y )dxdy , (caso continuo).
−∞ −∞
4. Para las variables aleatorias X 1 , ... , X n , se cumple que E ( c 1 X 1 + ... + c n X n ) = c 1 E ( X 1 ) + ... + c n E ( X n ), en donde las constantes c 1 , ... , c n son números reales. En partic ul ar, E ( X + Y ) = E ( X ) + E ( Y ) .
5. Si X e Y son variables aleatorias independientes, entonces E ( XY ) = E ( X ) E ( Y ).
A manera de ejemplo indicaremos la prueba de la propiedad E ( X + Y ) = E ( X ) + E (Y ) para el caso discreto y finito. Suponiendo que los valores de X son: x 1 , ... , xm y los de Y son: y 1 , ... , yn , se tiene: m n
E ( X + Y ) =
∑ ∑ [ x i + y j ] P[ X
i =1 j =1
= xi , Y = y j ]
Probabilidad. 2 17
= =
m
n
n
m
i =1 m
j =1
j =1
i =1
∑ xi ∑ P[ x = xi , Y = y j ] + ∑ y j ∑ P[ X
= xi , Y = y j ]
n
∑ xi P[ X = xi ] + ∑ y j P[ Y = y j ] = E ( X ) + E ( Y ).
i =1
j =1
Otras propiedades de la varianza. Ahora, como en el caso de la esperanza, se puede establecer la varianza para una función de dos o más variables y agregar otras propiedades de la varianza que antes no fueron indicadas pues formalmente necesitan de la ley de probabilidad conjunta o de la función de densidad conjunta. 5. Si X e Y son dos variables aleatorias independientes , a) V ( X + Y ) = V ( X ) + V ( Y ). ( σ X +Y = V ( X ) + V ( Y ) ) b) V ( X - Y ) = V ( X ) + V ( Y ).
( σ X −Y = V ( X ) + V ( Y ) ).
6. Si X 1 , ... , X n son variables aleatorias independientes y c 1 , ..., c n son constantes, entonces V ( c 1 X 1 + ... + c n X n ) = c 1 2 V ( X 1 ) + ... + c n 2 V ( X n ). 2 Caso particular : Si X 1 , ... , X n tienen la misma varianza, σ , entonces n
V ( ∑ X i ) = nσ
2
n
y
i =1
Desv . est . de ( ∑ X i ) = σ n . i =1
3.11. EJERCICIOS . 1. Se ha determinado que la distribución conjunta para las variables X e Y es como la que se indica en la siguiente tabla X \ Y
0 1 2
0 1/12 1/12 0
1 2/12 0 1/12
2 1/12 1/12 1/12
3 2/12 1/12 1/12
Calcular: a) p (2, 1), el valor de la distribución conjunta en (2, 1). b) p X ( 2 ) , la probabilidad marginal de X en 2. c) pY (1) , la probabilidad marginal de Y en 1. d) P ( X = 2|Y = 3) , la pr ob a bi li da d c on d ic i on al de l e ve n to [ X = 2] dado el evento [ Y = 3]. e) ¿Son las variables X e Y , independientes?. Rpta. a) 1/12. b) 3/12. d) 1 / 4 .
2 18 . Probabilidad.
2. En un grupo de 8 profesionales hay 2 abogados, 3 médicos y 3 ingenieros. Se seleccionan al azar tres profesionales de entre los 8 que hay y se designa con X al número de abogados seleccionados y con Y al número de ingenieros seleccionados. Hallar la distribución conjunta de ambas variables. Rpta . P[ X = 0, Y = 0] = 3 / 28, P[ X = 0, Y = 1] = 9 / 28 ,etc. 3. El precio X de compra de un artículo en miles de soles y el precio Y de venta del artículo varían de acuerdo a la función de densidad conjunta . 1 si 0 ≤ x ≤ 1 0.5 ≤ y ≤ 15
f ( x , y ) =
0 en el resto
Hallar a) la probabilidad de que el precio de compra sea mayor que el precio de venta. Esto es, P[ X > Y ] . b) f X . c) P[Y > 12 | 0.1 ≤ X ≤ 0.3] . d) Ha ll ar l a p ro ba bi li da d d e q ue e l p re ci o d e v en ta sea mayor al precio de compra.
e) Las variables X e Y , ¿son independientes?.
Rpta . a) 0.125. b) f X ( x ) = 1 para 0 ≤ x ≤ 1 . P[Y > 12 . , 01 . ≤ X ≤ 0.3] (15 . − 1.2)( 0.3 − 01 .) c) P[Y > 12 . . |01 . ≤ X ≤ 0.3] = = P[01 . ≤ X ≤ 0.3] (0.3 − 01 .)
K 0 ≤ X 2 ≤ X 1 ≤ 1 f ( x1, x2 ) = 0 en el resto Calcular a) Hallar el valor de b) La esperanza y la c) La esperanza y la d) La esperanza y la
K.
varianza del tiempo que pasa el cliente en el restaurante. varianza del tiempo esperado que demora el cliente en ser atendido. varianza del tiempo que pasa el cliente en el restaurante.
6. Probar que si las variables discretas X e Y son independientes, entonces la esperanza del producto de las dos variables es igual al producto de las esperanzas de las dos variables.
3.12. LEYES DE PROBABILIDAD DISCRETAS IMPORTANTES: Existe un gran número de modelos para estudiar la distribución de grupos de datos que provienen de una variable aleatoria. Entre los modelos que corresponden a las variables aleatorias discretas están las distribuciones: de Bernoulli, binomial, geométrica, de Poisson, etc.; y entre los que corresponden a las variables aleatorias continuas, se tienen las distribuciones: uniforme, normal o de Gauss, exponencial, ji-cuadrado, exponencial, t-student, F de Snedecor, etc.
DISTRIBUCION DE BERNOULLI . Consideremos el experimento E que tiene los únicos resultados: V ("éxito") y F ("fracaso"), con probabilidades p y q, respectivamente, donde p > 0, q > 0 y p + q = 1. Un experimento de este tipo se llama prueba de Bernoulli de parámetro p .
Probabilidad. 2 19
Consideremos ahora la variable X que toma el valor 1 cuando aparece V y el valor 0 cuando aparece F. La ley de probabilidad o distribución de probabilidad de la variable X es
xi P[ X=xi]
0
1
q
p
Esta distribución puede escribirse de la siguiente manera: 1 P[ X = k ] = p k q − k , en donde k = 0, 1.
En general, toda variable discreta X que tiene esta ley de probabilidad, se dice que sigue la distribución de Bernoulli de parámetro p.
Esperanza y varianza de una variable aleatoria con ley de Bernoulli. La esperanza y la varianza de una variable aleatoria discreta X que sigue la distribución de Bernoulli de parámetro p son: E ( X ) = 0(q) + 1( p) = p
y
V ( X ) = (0 - p)q + (1 - p) p = pq
DISTRIBUCION BINOMIAL. Una variable aleatoria discreta X, con valores 0, 1, 2, ... , n, se dice que sigue la distribución binomial con parámetros n y p si su ley de probabilidad es n p k = P[ X = k ] = C k pk qn k , -
con k = 0,1,2, ... , n.
Si X sigue la distribución binomial con parámetros n y p, se escribe X ~ ( n , p ). ¿Cuándo usar esta ley?
Consideremos, un experimento con sólo dos resultados posibles: V con probabilidad p y F con probabilidad q y repitámoslo n veces de manera independiente (la probabilidad de que aparezca éxito (V) en cada repetición es igual a la constante p). La variable aleatoria X que indica el número de V’s que aparecen en las n repeticiones es una variable aleatoria con valores 0, 1, 2, ... , n, según aparezcan 0, 1, 2, ..., n V ’s, respectivamente.
La distribución de la variable X es binomial con parámetros n y p.
2 20 . Probabilidad.
Esta afirmación se justifica pues el evento [ X = k ] está formado por n-tuplas que tienen k de sus elementos iguales a V y n − k elementos iguales a F. La probabilidad de que n
suceda cada una de éstas es pk qn k . Como el número de tales n-tuplas es C k , se tiene que efectivamente X tiene la ley binomial de parámetros n y p. -
Si se lanza una moneda n = 10 veces, entonces la variable aleatoria X , que cuenta el número caras que aparecen en los n lanzamientos, es una variable aleatoria discreta con valores 0, 1, 2, ... , n y su distribución es la binomial n 10 k 10 k P[ X = k ] = C k pk qn k , P[ X = k ] = C k p q − , -
en donde p es la probabilidad de que aparezca cara en cada lanzamiento. La siguiente propiedad indica que la expresión para P[ X = k ], corresponde efectivamente a una ley de probabilidad.
PROPIEDAD. n
n
k =0
k =0
n
n
k =0
k =0
Si X ~ ( n , p ), entonces
∑ pk = ∑ P[ X
= k ] = 1 .
En efecto,
∑ pk = ∑ Ck n pk q n − k = ( p + q )n = 1. OBSERVACION . Cuando n
= 1 la distribución binomial corresponde a la distribución de Be rnoull i con parámetro p . Se presentan a continuación gráficos de la distribución binomial para algunos valores de los parámetros. (a) (a)
B(5,0.5)
B (5,0.2)
B (5,0.8)
0.4096
0.4096
0.3125
X
012345 (a)
X
012345 (b)
Figura 3.18.
X
012345 (c)
Probabilidad. 2 21
Cuando p es 0.5, la gráfica es simétrica. (Fig. 3.18 (a)). Si p se acerca a 0 la gráfica es asimétrica con cola a la derecha (Fig. 3.18 (b)), mientras que si p se acerca a 0, la gráfica es asimétrica con cola a la izquierda. (Fig.3.18 ( c)). 3.31. Ejemplo. Si X ~ (20, 0.1), se tiene: 20
20−5
5
a) P [ X = 5 ] = C 5 ( 0.1) ( 0 . 9 ) 20 0 20 P [ X ≤ 1] = C0 0. 1 0 . 9
= 0 . 0319 .
20 1 19 + C1 0 .1 0 . 9
= 0 . 3918 . b) c) P[ X > 1] = 1 − P[ X ≤ 1] = 1 − 0.3918 = 0.6082. 3.32. Ejemplo. Una moneda se lanza 10 veces de manera independiente. Si para cada lanzamiento, la probabilidad de que aparezca cara es 0.3 entonces, la variable aleatoria X que cuenta el número de caras en los 10 lanzamientos es discreta con valores 0, 1, 2, ... , 10 y su distribución es binomial con parámetros n = 10 y p = 0.3.
Simbólicamente, X ~ (10, 0.3). La ley de probabilidad de X es P[ X = k ] = C
10 k
k
( 0.3) ( 0.7 )
10− k
. con k = 0, 1, 2, ...,10.
En particular, la probabilidad de que al lanzar 10 veces la moneda aparezcan 5 caras es igual a P[ X = 5] = C 510 (0.3) 5 ( 0.7) 10−5 = 0.1029. Muchos otros experimentos aleatorios pueden ser también modelados con la distribución binomial. Veamos el siguiente. Consideremos que de una población de N elementos, en donde existen r con la característica V y N r con la característica F, se eligen al azar n de ellos de uno en uno y con restitución. La variable aleatoria X que cuenta el número de elementos con la -
característica V entre los n elegidos, sigue una distribución binomial con parámetros n y p = r/N.
En efecto, cada extracción es una experiencia de Bernoulli (con sólo dos resultados posibles: V y F). La probabilidad de V es p y la de F es q = 1 - p. Nótese que la probabilidad p permanece constante en cada extracción . Cada extracción se realiza de manera independiente.
NOTA. Si cada extracción se realiza sin restitución, la probabilidad p en cada una de ellas no es constante, por lo tanto no es aplicable el modelo binomial; sin embargo, cuando N , es grande y n es pequeño respecto de N , la variable X tiene una distribución que se aproxima a la binomial. Se considera que la aproximación es buena si n ≤ 0.1 N .
2 22 . Probabilidad.
(Estrictamente X sigue la distribución hipergeométrica, que será analizada posteriormente). Estos resultados se obtienen igualmente cuando se toman todos los elementos a la vez. 3.33. Ejemplo. Se considera que la proporción de médicos que atienden en provincias es sólo el 5%. Si se eligen 10 médicos al azar del registro d e todos los médicos,
a) ¿cuál es la probabilidad de que 4 de ellos atiendan en provincias?. b) ¿cuál es la probabilidad de que el número de médicos que atiendan en provincias sea mayor o igual que 3 y menor o igual que 5?. Solución. Puede considerarse que la población formada por todos los médicos es muy grande. Luego, si X representa al número de médicos que atienden en provincias, de los 10 elegidos, podrá suponerse que X tiene distribución binomial (10, 0.05).
Se tiene entonces que 10
4
6
a) P [ X = 4 ] = C 4 0. 05 0 . 95 = 0.00096. b) P [ 3 ≤ X ≤ 5] = P [ X = 3 ] + P[ X = 4 ] + P[ X = 5 ] = 0.01150. 3.34. Ejemplo. Por experiencia se ha determinado que un 2% de las vacunas que se preparan en un laboratorio pierden su efectividad después del décimo día de preparadas. Hallar la probabilidad de que más de dos vacunas de una caja de 10 resulten ineficaces después del décimo día de preparadas. Solución. Si X es el número de vacunas ineficaces en cada una de las cajas de 10, se tendrá que X ~ (10, 0.02) y P [ X > 2 ] = 1 − P [ X ≤ 2 ] = 1 − { P[ X = 0 ] + P[ X = 1] + P[ X = 2 ] } 10
0
10
= 1 − {C0 0. 02 0. 98
10
1
9
10
2
8
+ C1 0 . 02 0 . 98 + C 2 0 . 02 0 . 98 } = 0. 0009 .
3.35. Ejemplo. Se supone que en un proceso de fabricación de botellas de vidrio es ideal que el porcentaje de defectuosas sea pequeño. Para comprobar si se mantiene con el tiempo esa calidad se extrae una muestra de tamaño N cada cierto tiempo. Si en una de estas muestras se encuentra por lo menos una defectuosa el proceso se detiene. Si el proceso pasara a producir el 5% de defectuosas el fabricante desearía que este cambio se notara con probabilidad igual a 0.95, ¿cuál debe ser el valor de N para que se cumplan los deseos del fabricante?. Solución. Se desea hallar el valor de N de tal modo que cuando la proporción de defectuosas es del 5% en toda la producción, la probabilidad de que se tenga por lo menos una botella defectuosa en la muestra sea 0.95. Llamando con X al
Probabilidad. 2 23
número de botellas defectuosas en cada muestra de tamaño N , se tendrá que X sigue la ley de probabilidad ( N , 0.05) y según la condición, N
0.95 = P[1 ≤ X ≤ N ] = 1 − P [ X = 0 ] = 1 − 0. 95 , de donde, N ≈ 59.
Esperanza y varianza de una variable aleatoria con ley binomial. Si una variable X tiene ley binomial con parámetros n y p entonces se cumple que la esperanza y la varianza son : E ( X ) = np y V ( X ) = npq, en donde q = 1 - p.
En efecto, n
E ( X ) =
∑ kP [ X
n
= k] =
k =0 n
p
k −1 n − k
q
k =1( n − k )!( k − 1)! n −1
( q = 1 − p ).
k =0
n!
= p ∑
∑ kCk n pk qn− k ,
n −1 s ( n −1) − s
= p ∑ nCs
p q
n
=p
n −1 k −1 n − k
∑ nCk −1 p
q
k =1
, ( haciendo k − 1 = s )
s= 0
= np ( p + q )
n −1
= np .
Para calcular la varianza de X, se calcula la esperanza de la variable aleatoria Y = X ( X - 1). n
E ( X ( X − 1)) =
k =0
Haciendo k
-
n
( n − 2 )!
∑ k ( k − 1) (n − k!)! k ! p k q n−k = p 2 n(n − 1) ∑ (n − k )!( k − 2)! p k −2 q n− k . n
k =2
2 = s, se tiene que E ( X ( X − 1)) = E ( X 2 ) − E ( X ) = p 2 n( n − 1).
Luego, V ( X ) = E ( X 2 ) − [ E ( X )]2 = p 2 n( n − 1) + np − (np ) 2 = npq . 3.36. Ejemplo. La probabilidad de que un cierto transformador falle en los primeros 10 años de operación es p = 0.06. Si se observan n = 200 de tales transformadores, entonces, el número X de transformadores que fallan en los 10 primeros años tiene distribución binomial con parámetros 200 y 0.06. El número de transformadores que se espera que fallen en el período indicado es np = 200(0.06) = 12. 3.37. Ejemplo.
2 24 . Probabilidad.
Cada día que un cliente se aloja en el hotel "Estrella" debe pagar como mínimo $100. Si ocupa una habitación de tipo 1 deberá pagar $50 más y si ocupa una habitación de tipo 2 deberá pagar $20 más. De los registros del hotel se deduce que la probabilidad de que un cliente ocupe una habitación de tipo 1 es 0.4 y de tipo 2, es 0.6. Un día se presentaron 10 clientes, a) ¿cuál es la probabilidad de que todos se hayan alojado en habitaciones de tipo 2?. b) En términos del número de clientes, indicar el total T de dinero que se recaudó por los 10 clientes. Hallar la esperanza de T. c) Hallar la probabilidad de que se haya recaudado $1320. Solución. a) Sea X al número de clientes, de los 10, que se alojan en habitaciones de tipo 2. Se tiene que X sigue una ley binomial de parámetro n = 10 y parámetro p = 0.6. Luego, la probabilidad de que los 10 se hayan alojado en habitaciones de tipo 2 es 10
10
0
P [ X = 10] = C 10 0.6 0.4 = 0.0060
b) El total de dinero T, que se recauda por los 10 clientes es igual a T = 1000 + 20 X + 50(10 - X ), X = 1, ... , 10.
La esperanza de T es E ( T ) = 1500 - 30 E ( X ) = 1500 - 30(10)(0.6) = 1320. c) Para recaudar T = $1320 es necesario y suficiente que X = 6. Luego, 10
6
P ["Recaudar $1320"] = P [ X = 6] = C 6 0.6 0.4
4
= 0.2511.
3.38. Ejemplo. El porcentaje de radios defectuosos que produce una fábrica es 1%. Si se vendieron con garantía 10 radios antes de probarlos y el costo, en soles, por hacer efectiva la garantía es 2
C = 10 + 20 X , donde X es el número de radios defectuosos de los 10 vendidos,
calcular el costo esperado de la garantía. Solución. 2
2
Se tiene que E ( C ) = E (10 + 20 X ) = 10 + 20 E ( X ). Como X es binomial con parámetros n = 10 y p = 0.01, se tiene que E ( X ) = np = 0.1 y V ( X ) = npq = 0.099. Por lo tanto 2
2
2
E ( C) = 10 + 20 E ( X ) = 10 + 20{V ( X ) + [ E ( X )] } = 10 + 20[0.099 + 0.1 ] = 12 .18 .
El valor esperado del costo por garantía es 12.18 soles. Si se venden muchos lotes de 10 radios cada uno, el costo promedio de la garantía es 12.18 por lote.
Probabilidad. 2 25
DISTRIBUCION HIPERGEOMETRICA. Una variable aleatoria X discreta, se dice que tiene dist ribuc ión hipe rgeomé tr ica con pará me tros N, r y n si su ley de prob abil id ad es r N − r
p k = P[ X = k ] =
C k C n − k N
,
C n
siempre que los valores k de la variable cumplan con máx [0, n + r - N ] ≤ k ≤ mi n [ n , r ].
Cuando X sigue la distribución hipergeométrica con parámetros N, r y n, se escribe X ~ ( N , r , n ). ¿Cuándo se usa este modelo?
Considérese una población finita con N elementos, r de los cuales tienen la característica A y los N − r restantes tienen la característica B . Se eligen al azar y de una sola vez, n elementos de la población y se considera la variable aleatoria X que indica el número de elementos con la característica A entre los n elegidos. La vari able X ti ene, co mo se puede comp robar, la di stribu ci ón hi pe rgeométrica de parámetros N, r y n.
Se tiene la misma distribución para X si la elección de los n elementos de la población se hace de uno en uno y sin restitución. El resultado de cada extracción depende de lo que haya sucedido en la anterior, y a diferencia del caso de las extracciones con restitución, estos resultados no son independientes. 3.39. Ejemplo. Con el fin de aceptar o rechazar un lote de 20 artículos embarcados por una compañía productora se toman 5 artículos de uno en uno y sin restitución. Se decide rechazar el lote si la muestra tiene más de un artículo defectuoso. ¿Cuál es la probabilidad de aceptar el lote si en éste existen 4 artículos que son defectuosos?. Solución. Si X = Núm er o de ar tí culos defe ct uosos en la mues tra , entonces, X ~ 5).
La probabilidad de que el lote sea aceptado es
(20, 4,
2 26 . Probabilidad.
4
P [ X < 2 ] = P[ X = 0 ] + P[ X = 1 ] =
16
C0 . C 5 20
4
16
C1 . C 4
+
20
C 5
= 0. 7513.
C 5
La siguiente propiedad justifica la aproximación de la distribución binomial mediante la distribución hipergeométrica, ya referida en sección anterior.
PROPIEDAD. En el esquem a ante ri or, cu ando N es su fi cien tement e gran de y n es pe queño res pe cto de N ( en la práctica cuando n ≤ 0.1N ) , la distribución hipergeométrica ( N , r , n ) se aproxima a la distribución
( n , p ), donde p es igual a r / N . En este caso, cada extracción que se realiza sin restitución afecta muy poco a la siguiente y así la probabilidad de escoger un elemento de tipo A se mantiene aproximadamente igual a r / N. r
La propiedad se justifica si la expresión
N − r
Ck . C n − k N
C n
que aparece en el segundo
miembro de la fórmula de la ley hipergeométrica, se escribe como n! r ( r − 1)... ( r − k + 1)( N − r ) ( N − r − 1)... ( N − r − n + k + 1 ) ( n − k )! k !
N ( N − 1)... ( N − n + 1)
(I)
y se considera, sobre la base de las restricciones indicadas, que k
r ( r − 1)... ( r − k + 1) ≈ r
( N − r )( N − r − 1)... ( N − r − n + k + 1) ≈ ( N − r ) n − k . N ( N − 1)... ( N − n + 1) ≈ N n .
Reemplazando las relaciones anteriores en la expresión (I), se tiene que C k C n −−k
r N r
P[ X = k ] =
C N n
n ≈ C k (r / N ) k (1 − r / N ) n − k .
Esperanza y varianza de una variable aleatoria con ley hipergeométrica Para una variable aleatoria X hipergeométrica, ( N, r, n), se cumple
E ( X ) = n ( r/N )
y V(X) = n
cuya
distribución
r r N − n 1 − . N N N − 1
es
Probabilidad. 2 27
Observamos que si N es suficientemente grande y n es pequeño respecto de N , N − n se aproxima a 1 y así, la esperanza y la varianza tienen la misma forma N − 1 que en el caso de la distribución binomial.
DISTRIBUCION GEOMETRICA. Una variable aleatoria X con valores 0, 1, 2, ... , sigue la distribución geométrica con parámetro p si su ley de probabilidad es p k = P[ X = k ] = q
k −1
p , k = 1,2,3,... con p > 0, q > 0 y p + q =1.
Cuando X tiene la ley geométrica con parámetro p se escribe X ~
( p ).
¿Cuándo usar este modelo?.
Para mostrar los casos en donde esta distribución se puede aplicar, considérese un experimento de Bernoulli, con los resultados posibles: V (éxito) y F (fracaso). El experimento se repite de manera independiente hasta obtener V . El espacio muestral que se obtiene está formado por los siguientes eventos: E 1 : V E 2 : FV E 3 : FFV
(éxito en la primera prueba). (fracaso en la primera prueba y éxito en la segunda). (fracaso hasta la segunda prueba y éxito en la tercera prueba).
... etc.
La va riab le aleato ria X que in dica el número de prueb as necesari as hasta obtener V ( éxito ) , to ma valo res : 1, 2, 3, ... , y su dist ribu ción es la geo métr ica con parámetro p. En la sigu ie nte fi gu ra se mues tra la ley ge ométri ca pa ra el valor p = 0.7. P [ X = k ]
p = 0.7
0.7 -
X
0
3.40. Ejemplo.
1
2
3
4
Figura 3.19.
2 28 . Probabilidad.
Si X es una variable aleatoria con distribución de probabilidad geométrica con parámetro p = 0.2, entonces 3
a) P[ X = 4 ] = 0.8 0.2 = 0.1024 0
b) P[ X = 1] = 0.8 0.2 = 0 .2 c) P[ X > 1] = 1 − { P[ X = 1]} = 1− 0. 2 = 0.80. 3.41. Ejemplo. Cada año, la Oficina de Tributación realiza una revisión de las declaraciones de renta presentadas. Se ha determinado que la proporción de declaraciones con errores y que anualmente se presentan es p = 0.10. a). ¿Cuál es la probabilidad de que la primera declaración con errores que se revise sea la quinta?.
b). ¿Cuál es la probabilidad de que las dos primeras declaraciones revisadas no contengan errores?. Solución. Sea X , el número de declaraciones revisadas hasta encontrar la primera declaración con errores. Considerando que el número de declaraciones es muy grande, las extracciones pueden ser tomadas como independientes y así podemos considerar que X tiene distribución geométrica con parámetro 0.10; luego,
a) P [ X = 5] = 0.90 4 0.10 = 0.0656. b) P ( de que las dos primeras declaraciones revisadas no contengan errores ) ∞
= P [ X ≥ 3] =
∑ P[ X
= k ] = 1 − ( p + pq ) = 1 − 0 .1 − ( 0 . 9 ) ( 0 .1 ) = 0.8100.
k = 3
Algunas veces se usa la distribución geométrica como modelo para la distribución de los "tiempos de espera ". Por ejemplo, el tiempo que transcurre hasta la falla de un aparato electrónico se distribuye geométricamente si se considera que el tiempo de espera es igual al número de intervalos de una hora hasta la primera falla. (En este caso una falla corresponde a un "éxito"). 3.42. Ejemplo. La probabilidad de que una resistencia de un aparato electrónico falle en cualquier intervalo de una hora es 0.02; hallar la probabilidad de que la resistencia falle en la octava hora. Solución. Sea X el número de intervalos de una hora que transcurren hasta que falla la resistencia. La distribución de X es geométrica con parámetro 0.02; luego la probabilidad pedida es P [ X = 8] = (0.98 7 )(0.02) = 0.01736.
Probabilidad. 2 29
Esperanza y varianza de una variable aleatoria con ley geométrica. Para una variable X que sigue la distribución geométrica de parámetro p, se cumple : E ( X ) =
1 p
y V ( X ) =
q p
2
.
En efecto, ∞
E ( X ) =
∞
∑ kP[ X = k ] = ∑ kq k =1
= p
k −1
p= p
k =1
d ∞
∑ q k = p
dq k =1
∞ d
∑
dq 1
k
(q )
k =
d 1
p
1
= . = dq 1 − q p 2 p
El lector puede demostrar el resultado correspondiente a la varianza. 3.43. Ejemplo. La probabilidad de encontrar petróleo al perforar un pozo en determinada zona es 0.7. Cada perforación cuesta $500000 y se gana $800000 cuando se encuentra petróleo. Si se realizan una serie de perforaciones, calcular la esperanza y la varianza del costo que se produce hasta que se encuentra petróleo por vez primera. Solución. Si X es el número de perforaciones hasta obtener petróleo, se tendrá que el costo es C = 800000 − 500000 X .
Como E ( X ) = 1/0.7 = 1.4285 y V ( X ) = (1 - 0.7)/(0.72) = 0.612, se tiene: E (C ) = 800000 - 500000(1.426) = 85700. 2
11
V (C ) = 500000 0.612 = 1.53 .
3.44. Ejemplo. En un lote de 15 artículos existe un número n de defectuosos. Los artículos se extraen de uno en uno y con restitución hasta obtener el primer defectuoso. El costo total por
inspección es $2 X , donde X es el número de artículos inspeccionados. Hallar el valor de n, si el costo esperado p or inspección es $16. Solución. La variable aleatoria X , que indica el número total de extracciones hasta obtener un artículo defectuoso tiene distribución geométrica con parámetro p, en donde p indica la
probabilidad de que un artículo sea defectuoso. El valor esperado del costo total 2 X , es 16. Luego,
2 30 . Probabilidad.
16 = E ( 2 X ) =
∞
2 (1 − p )
p
p
∑ 2 k (1 − p) k −1 p = (1 − p) 1 − 2(1 − p ) = 1 − ( 2 − 2 p )
k =1
8 . De donde, n = 8. 15
Despejando el valor de p, se tiene p =
DISTRIBUCION DE POISSON. La distribución binomial indica la probabilidad de que un número particular de observaciones en n repeticiones de un experimento exhiban alguna propiedad. Cuando el número de repeticiones es muy grande y la probabilidad p de exhibir tal propiedad es un valor pequeño, la distribución binomial puede aproximarse con la distribución llamada “de Poisson”, que a continuación se describe. Una variable aleatoria X que toma los valores 0, 1, 2, ... , se dice que sigue la distribución de Poisson de parámetro λ > 0, si su ley de probabilidad es
p k = P[ X = k ] =
e
− λ k
λ , k !
k = 0 ,1, ...
Si una variable X sigue una distribución de Poisson con parámetro λ se escribe X ~ (λ). Los gráficos de la ley de Poisson con parámetro λ = 3.7 y λ = 1.5, aparecen en las siguientes figuras: 0.55
0.16
λ = 3.7
λ = 1.5 0.22
0.07
0.12
0.02 0
1
2
3
4
5
6
0
1
2
3
4
5
6
Figura 3.20.
Aproximación de la distribución binomial mediante la distribución de Poisson. La siguiente propiedad formaliza el hecho de que una distribución binomial puede aproximarse con una distribución de Poisson. Si X tiene la distribución binomial con parámetros n y p entonces, cuando n → +∞ , p → 0 ,
P[ X = k ] ≈
e
−λ
( λ)
k !
k
donde λ = np .
Probabilidad. 2 31
Se considera que la aproximación es buena cuando n > 30 y np ≤ 5
En efecto, P[ X = k ] =
n k n −k = Ck p q
k
n − k
n ( n − 1) . . . ( n − k + 1 ) ( λ / n ) (1 − λ /n ) k !
Por otro lado, si n → + ∞ y p → 0, y λ = np , entonces n ( n − 1) . . . ( n − k + 1) n
k
tiende a 1 , (1 − λ / n ) n k n−k
De este modo P [ X = k ] = Ck p q n k n− k P[ X = k ] = Ck p q
n
tiende a e
tiende a e
−λ k
−λ
y (1 − λ / n ) − k tiende a 1.
λ / k ! y se puede escribir
≈ e − λ λk / k ! s np . i n → + ∞ y p → 0, y λ = np.
Veamos algunos casos en los que se puede realizar la aproximación. * El número de llamadas telefónicas X, recibidas en una central en un intervalo de 10 minutos, en las horas de la mañana, es una variable aleatoria que aproximadamente sigue la distribución de Poisson. En este caso, se puede imaginar el intervalo dividido en un gran número n de instantes, y a p como la fracción de los instantes en los que ocurren llamadas respecto del total de instantes. En estas condiciones, np = λ es el número promedio de llamadas por cada 10 minutos. * También se puede considerar que el número de puntos defectuosos en un metro cuadrado de tejido es una variable aleatoria que sigue aproximadamente la ley de Poisson. En este caso, n es el número total de puntos (el que se considera muy grande) contenido en un metro cuadrado de tejido, p es la fracción de puntos defectuosos respecto del total, que generalmente es pequeña, y np = λ es el promedio de puntos defectuosos por metro cuadrado en una superficie muy grande. * El número de cierto tipo de bacterias que hay en un volumen de un centímetro cúbico, es una variable aleatoria que sigue aproximadamente la distribución de Poisson. En este ejemplo, n es el número total de partículas presentes en dicho volumen; p es la fracción de bacterias presentes en dicho volumen por centímetro cúbico con respecto al total de partículas y np = λ es el promedio de bacterias por centímetro cúbico. El modelo de Poisson se usa para estudiar la ocurrencia de eventos independientes en un intervalo determinado y cuando la probabilidad de que un número k de estos eventos es cada vez más pequeña a medida que k crece. Así por ejemplo, - el número de accidentes que suceden en una fábrica durante un mes. - el número de clientes que llegan a la ventanilla de un banco en una hora, etc.
2 32. Probabilidad.
Esperanza y varianza de una variable con ley de Poisson. Si X es una variable aleatoria que sigue una distribución de Poisson con parámetro λ , su esperanza y su varianza son iguales a λ.
El lector podrá probar lo referente a la esperanza. Para probar la afirmación respecto de la varianza se considera la variable aleatoria Y = = X ( X - 1). La esperanza de esta variable es ∞
E ( Y ) =
∑ n ( n − 1) P[ X
∞
= n] =
n= 0
∑ n (n −1) n=2
e
−λ n
λ
n!
∞
e
−λ n
λ
∑ ( n − 2 )! .
=
n= 2
Haciendo n - 2 = s, resulta ∞
E ( Y ) =
∑ n= 2
e
−λ n
λ
( n − 2)!
=
∞ e − λ λs + 2
∑
s =0
s!
=e
−λ 2
λ
∞
∑
s
λ
s= 0 s !
2
=λ .
Usando esta igualdad se tiene V ( X ) = E ( X 2 ) - [ E ( X )] )] 2 = E ( X 2 ) - E ( X ) + E ( X ) - [ E ( X )] )] 2
= E [ X ( X - 1)] + E ( X ) - [ EX ] 2 = λ . Si se considera que el intervalo de tiempo [ a , b ], en donde suceden los eventos que cuenta la variable X, tiene longitud igual a la unidad, se tendrá que λ es el promedio de eventos que ocurren en la unidad de tiempo. Si además se considera que la tasa con que suceden los eventos es constante en el intervalo [ a, b ] entonces, en cualquier subintervalo de longitud t, con 0 < t ≤ 1 , la variable que indica el número de eventos en este intervalo seguirá una distribución de Poisson con parámetro λ t. t.
3.45. Ejemplo. El número promedio de clientes que llegan a un banco es 12 cada 10 minutos. Si se considera que el número X de clientes que llegan en intervalos de 10 minutos tiene el modelo de Poisson, a) ¿Cuál es la probabilidad de que entre las 9 a.m. y las 9:10 a.m. lleguen 8 clientes
b) ¿cuál es la probabilidad de que entre las 9 a.m. y las 9:05 a.m. lleguen 3 clientes?. Solución.
Probabilidad. 2 33
a) Se indica que en intervalos de 10 minutos, X sigue sigue la distribución de Poisson y que su media es 12 clientes, l uego, −12
P (" entre las 9 y las 9:10 a.m. lleguen 8 clientes ) = P[ X = 8] =
e
(12)8
8!
= 0.0655.
b) Si se supone que la tasa de clientes que llegan al banco cada 10 minutos no cambia con el tiempo, se puede indicar que el número Y de clientes que llegan al banco entre las 9 a.m. y las 9:05 a.m. sigue una ley de Poisson con parámetro λ = 12(0.5) = 6. De este modo, P (" entre las 9 y las 9:05 a.m. lleguen 3 clientes ") = P[Y = 3] =
e
−6
3
( 6) = 0.0892. 3!
3.46. Ejemplo. Un líquido contiene ciertas bacterias cuyo promedio es de 4 por cm3 . Hallar la probabilidad de que no exista bacteria alguna
a) en 0.5 cm 3 ,
b) en 1 cm3 .
Solución. Siguiendo un razonamiento análogo al que se hizo en los casos anteriores, se puede considerar que el número X de bacterias sigue una ley de Poisson con parámetro λ = 4 por cm3 del líquido.
a) La probabilidad de que no exista ninguna bacteria en 0.5 cm3 del líquido es P [ X = 0 ] =
b) P [ X = 0] =
e
( −4 )(1)
0!
(4)
e ( −4)( 0.5) [ 4 ( 0. 5 ) ]0
0!
= 0. 1353 353.
0
= 0. 0183.
3.47. Ejemplo. Un estudio confirma que la probabilidad de que cualquier pregunta, de las que se realizan para estudiar las características económicas de cierto grupo social, no sea contestada es igual a 0.08. Hallar la probabilidad de que en una encuesta que contiene 40 de tales preguntas 10 no sean contestadas. Solución.
Sea X = = el número de preguntas no contestadas de las 40 que consta la encuesta. La distribución de la variable X es Binomial con parámetros n = 40 y p = 0.08. Por la propiedad de aproximación del modelo binomial mediante el modelo de Poisson, la distribución de X se aproxima a la distribución de Poisson con parámetro λ = np = 40(0.08) = 3.2 < 5.
Se tiene entonces que P [ X = 10 ] ≈
e
− λ 10
λ 10 !
=
e
−3.2
( 3. 2 ) 10!
10
= 0. 0012 00126 6.
2 34 . Probabilidad.
3.48. Ejemplo. El 0.2% de los habitantes de una ciudad fallece por accidentes de tránsito. Una compañía de seguros tiene 2000 asegurados contra accidentes de tránsito. ¿Cuál es la probabilidad de que la compañía tenga que pagar durante un año al menos a 2 de los 2000 asegurados?. Solución Sea X la variable aleatoria que indica el número de asegurados que fallecen por accidentes de tránsito durante un año.
La variable X tiene distribución binomial con parámetros n = 2000 y p = 0.002. Como np = 4 < 5, la probabilidad pedida, P[ X ≥ 2], se puede calcular usando la aproximación de la binomial a la Poisson con parámetro λ = 4.
Se tiene entonces que P[ X ≥ 2] = 1 −
1 e−4 4 k
∑
k = 0
k !
= 1 − (e
−4
+e
−4
4) = 0.9084 .
3.49. Ejemplo. La probabilidad de que un artículo fabricado por una línea de producción sea defectuoso es p = 1/100. ¿Cuántos artículos tendrán que producirse para que con probabilidad 0.9 se tenga al menos un defectuoso?. Solución Si n es el número de artículos que deberán producirse y X es el número de defectuosos entre los n producidos, entonces la variable X tiene distribución ( n , 1/100) y se puede aproximar con la distribución (λ ), donde λ = n /1 00. Usando la condición del problema y la aproximación indicada se tiene que P [ X ≥ 1] = 1 − P[ X < 1] = 1 − P[ X = 0 ] = 1 − e − λ = 0 . 9 , donde λ = n /100 .
Resolviendo para n se tiene que n ≈ 230. PROPIEDAD. Si el número de eventos de un experimento aleatorio se produce según la ley de Poisson con parámetro λ y si cada evento puede ser : de tipo 1 con probabilidad p 1 , de tipo 2 con probabilidad p 2 ...,
..., de tipo m con probabilidad p m , entonces
Probabilidad. 2 35
la distribución del número de eventos de tipo 1 es Poisson con pa rámetr o λ p 1 , la distribución del número de eventos de tipo 2 es Poisson con pa rámetr o λ p 2 ,
...,
la distribución del número de eventos de tipo m es Poisson con pa rámetr o λ p m ,
3.50. Ejemplo. La probabilidad de que un vehículo que para en una gasolinera sea automóvil es p 1 = 0.6 y de que sea camión, p 2 = 0.4. Si a la gasolinera llegan vehículos a razón de 4 vehículos cada 5 minutos y de acuerdo al modelo de Poisson; calcular la probabilidad de que el número de automóviles que llegan en un intervalo de 5 minutos sea igual a 6. Solución Si X es el número de automóviles que llegan a la gasolinera en un intervalo de 5 minutos, se tendrá que ésta sigue la distribución de Poisson con parámetro 4(0.6); luego, P [ X = 6 ] = e ( −4)( 0.6) ( 4 ( 0 . 6 ) ) 6 / 6 ! = 0.0241.
LA DISTRIBUCION DE PASCAL . Se introduce el modelo de Pascal de la siguiente manera: Se considera una prueba de Bernoulli cuyos resultados son V y F con probabilidades p y q , respectivamente ( p > 0, q > 0 y p + q =1). La prueba se repite de manera independiente hasta obtener r veces V y se considera la variable aleatoria X = Número de intentos hasta obtener la r-ésima V,
Esta variable tiene la ley de probabilidad. k −1 k − r
P[ X = k ] = Cr −1 q
r
p para k = r , r + 1, ...
La afirmación se justifica si se considera que el evento [ X = k ] está formado por elementos del espacio muestral constituidos por una V en el k-ésimo intento precedido de r - 1 veces V y k - r veces F. La probabilidad de obtener cada orden especificado es q k r p r 1 p. El número de tales órdenes es C r k −−11 , luego, la fórmula se obtiene multiplicando estos valores. -
-
Si X es una variable aleatoria con ley de probabilidad
2 36 . Probabilidad.
k −1 k − r
P[ X = k ] = Cr −1 q
r
p para k = r , r + 1, ...
se dice que sigue la dist ribución de prob abil idad de Pa scal con pa ráme tros r y p .
A la distribución de Pascal se le llama también distribución bi nomi al ne gati va . Si r = 1, el modelo de Pascal es igual a la distribución geométrica con parámetro p . 3.51. Ejemplo. Con la finalidad de realizar un experimento biológico se introducen 50 peces marcados en un estanque en donde existen 500 peces sin marcar. Luego se extrae un pez cada vez con restitución. ¿Cuál es la probabilidad de que en la extracción número 20 se obtenga un cuarto pez marcado?. Solución. Sea X la variable aleatoria que indica el número de extracciones que se han realizado hasta obtener un cuarto pez marcado. La variable X tiene la distribución de Pascal con parámetros r = 4 y p = 50/550 ( q = 1 - 50/550).
Luego, P [ X = 20] = C 420−1−1q 20 - 4 p 4 = 0.0144.
Esperanza y varianza de una variable aleatoria con ley de Pascal. Para una variable aleatoria que tiene distribución de Pascal con parámetros r y p se cumple : E ( X ) =
r y p
V ( X ) =
rq p
2
.
3.52. Ejemplo. Una máquina produce el 1% de artículos defectuosos. Durante el proceso de producción, el control detiene la máquina cuando se produce el segundo artículo defectuoso. ¿Cuál es el número esperado de artículos producidos hasta que se detiene la máquina? Solución. Llamemos con X al número de artículos producidos hasta que el segundo artículo defectuoso se produce. La variable X sigue el modelo de Pascal con parámetros r = 2 y p = 0.01. Luego el número esperado de artículos producidos hasta que se detiene la p = 2/0.01 = 200. máquina es el valor esperado de X . Este es igual a r /
Probabilidad. 2 37
3.13. EJERCICIOS. 1. Si X es una variable aleatoria con distribución binomial con parámetro n = 10 y p = 0.01, hallar la probabilidad de que X , a) tome el valor 3; b) tome valores entre 3 y 5, incluyendo a 3 y 5. c) Construir el diagrama de la ley de probabilidad de X. d) Hallar el valor esperado y la varianza de X . Rpta. a) P [ X= 3] = 0.0001. d) 0.1. 2. Se lanza una moneda seis veces, ¿cuál es la probabilidad de que se obtengan tres caras si la probabilidad de que aparezca cara en cualquier lanzamiento es igual a 0.45?. Sugerencia. La variable X, que describe el número de caras sigue la ley binomial. 3. La probabilidad de que un estudiante termine sus estudios es 0.6. Para un grupo de cinco estudiantes, ¿cuál es la probabilidad de que a) ninguno de los cinco estudiantes termine sus estudios? b) al menos dos de los cinco estudiantes terminen sus estudios?. 4. Un test consta de 10 preguntas de tipo verdadero-falso. Un alumno que no conoce el tema en cuestión decide responder cada pregunta lanzando una moneda equilibrada. Hallar la probabilidad de a) obtener 5 respuestas correctamente respondidas. b) tener menos de tres respuestas correctamente respondidas. c) Si el test es desarrollado por un número muy grande de alumnos, cuál es número de preguntas que en promedio resolverá correctamente cada alumno con este método. 5. La probabilidad de que un artículo que produce la fábrica A sea defectuoso es 0.1. Si se venden 10 de tales artículos sin probar, ¿cuál es la probabilidad de que a) los 10 artículos vendidos sean defectuosos?. b) Si el comprador del artículo regresa las piezas defectuosas para su reparación, y el costo de reparación es C = 4 X + X 2 + 2 , en donde X es el número de artículos defectuosos; calcular el costo de reparación esperado. Rpta. b) La esperanza de X es 1. La esperanza de X 2 es 1.9, etc.
6. La probabilidad de que una aspirina de un determinado laboratorio sea defectuosa es 0.01. Hallar la probabilidad de que, a) una caja de doce aspirinas contenga 2 defectuosas. b) un paquete que contiene 6 cajas de doce pastillas, contenga al menos 2 cajas con dos defectuosas cada una. Rpta. a) 0.006. b) Calcular P[Y ≥ 2] , en donde Y indica el número de cajas con dos defectuosas cada una. 7. Un sistema de protección en un aeropuerto militar consta de n unidades de radar que funcionan independientemente. Cada unidad tiene probabilidad 0.9 de detectar un cohete que ingresa a la zona que cubren las unidades. a) Si n = 5 y un cohete entra en la zona, ¿cuál es la probabilidad de que exactamente cuatro unidades detecten el cohete?. b) ¿Cuál debe ser el valor de n para que con probabilidad 0.999 un cohete que entre en la zona sea detectado al menos por una unidad?. Rpta. a) 0.32805. b) n = 3. 8. Una compañía tiene el 45% de sus proyectos en el sector de minas y el resto en agricultura La probabilidad de que un proyecto del sector de minas se realice es 0.6 y la probabilidad de que un proyecto de agricultura se realice es 0.7. ¿Cuál es la probabilidad de que de 6 proyectos tomados al azar, 4 se realicen?. Rpta. Aplicar el teorema de las probabilidades totales. La probabilidad pedida es 0.3182.
2 38 . Probabilidad.
9. Nueve profesores están asignados para trabajar en una oficina. La probabilidad de que un profesor llegue a la oficina en determinado momento es 0.5. ¿Cuántos escritorios deben colocarse como mínimo en la oficina de tal modo que en un momento dado, la probabilidad de que un profesor encuentre por lo menos un escritorio desocupado sea 0.95?. . , en donde X es la variable que indica el Sug. Hallar n que cumpla con P[ X < n] = 095 número de profesores, de los 9, que llegan a la oficina. 10. Se ha determinado que en un lago el 80% de los peces miden menos de 5 cm de largo. a) Si se pescan al azar cinco peces, ¿cuál es la probabilidad de que a lo más cuatro tengan un largo menor que 5 cm?. b) ¿Cuál será el mínimo número de peces que se deben pescar para que con 90% de seguridad se obtengan cinco peces con largo menor que 5 cm.?. Rpta. a) 0.672. b) 8. 11. Por controles anteriores se ha podido determinar que la proporción X , de contribuyentes que defraudan al fisco, tiene la siguiente ley de probabilidad X
0.02
0.05
0.10
p
0.70
0.20
0.10
En una muestra de 10 contribuyentes no se encontró ningún mal contribuyente. Sobre la base de este resultado, ¿cómo se modifican las probabilidades "a priori" que se presentan en la tabla?. Sug. Recalcular las probabilidades, usando el teorema de Bayes. 12. Una compañía petrolera ha sido designada para perforar pozos en cierta ár ea. La probabilidad que tenga éxito en una prueba es 0.3. a). Hallar la probabilidad de que el primer pozo productivo sea el quinto perforado. b). Hallar la probabilidad de no encontrar pozo productivo, si su capital le permite perforar a lo más siete pozos. Rpta. Aplicar la distribución geométrica. a) 0.07203. b) 0.657. 13. Demostrar que la varianza de una variable con distribución geométrica de parámetro p es q / p2 . 14. Se supone que el 25% de las personas que viven en una zona industrial padece de alergia en la piel. Se decide hacer un chequeo médico a los habitantes de la zona. ¿Cuál es la probabilidad de que el primer afectado sea el quinto revisado? 15. El porcentaje de artículos que produce una máquina es 1%. Durante el proceso de producción, el control detiene la máquina cuando se p roduce el primer artículo defectuoso. a) ¿Cuál es la probabilidad de que el control detenga la máquina cuando se produce el artículo número 20? b) ¿Cuál es el valor esperado del número de artículos producidos durante el proceso sin detenerse?. Sug. Aplicar la distribución geométrica. b) 100. 16. Un banco en promedio recibe por día 5 cheques que no tienen fondos. Si se considera que el número de cheques sin fondos que recibe el banco tiene distribución de Poisson, hallar la probabilidad de que en un día determinado reciba a) 0 cheques sin fondos. b) Más de dos cheques sin fondos. Rpta. a) 0.0067. 17. Una central telefónica recibe en promedio 10 llamadas por hora. Si se considera qu e el número de llamadas que recibe la central tiene distribución de Poisson, hallar a) la probabilidad de que en una hora reciba 5 llamadas. b) la probabilidad de que en dos horas reciba más de 2 llamadas.
Probabilidad. 2 39
Rpta. b) Aplicar la distribución de Poisson con parámetro 20.
18. Se ha determinado que el número de virus de tipo A que hay en un centímetro cúbico de sangre tiene distribución de Poisson cuyo promedio es aproximadamente igual a 8. ¿Cuál es la probabilidad de que en 1.5 cm cúbicos existan a lo más 5 virus?. 19. El número de buques que llegan a un puerto siguen una distribución de Poisson con una media igual a 4 por día. ¿Cuál es la probabilidad de que por lo menos en un día de una semana determinada hayan llegado 4 buques?. Rpta. La probabilidad de que en un día lleguen 4 barcos es 0.1954. La probabilidad pedida es 0.7817. (Considerar que la semana tiene 7 días). 20. El número de máquinas en reparación durante un día en una planta sigue una distribución de Poisson con parámetro λ = 6. a) ¿Cuál es la probabilidad de que en cualquier día existan una o más máquinas en reparación?. b) ¿Cuántas máquinas de repuesto son necesarias, si se desea que la probabilidad de no tener una máquina de repuesto disponible para reemplazar una máquina en reparación durante el d ía, sea a lo más 0.10?. Rpta. b) 3. 21. Una máquina de expendio de café produce una ganancia de $50 por hora. Sin embargo, durante el día se descompone en promedio tres veces por día. Si el número de fallas, Y , que se producen durante el día es una variable aleatoria con distribución de Poisson y el ingreso diario es G = 400 - 10 Y 2 . Hallar el ingreso esperado por día. 22. Una compañía de seguros ha determinado que el número de accidentes que registran los automovilistas asegurados en su compañía tiene distribución de Poisson con media 0.5. Si un accidente automovilístico ocurre, el daño al automóvil representa el 20% de su valor de mercado con probabilidad 0.7, el 60% de su valor de mercado con probabilidad 0.25 y una pérdida total con probabilidad 0.05. Hallar el valor de la prima V que deberá cobrar la compañía para un automóvil que vale $7000 para que la ganancia esperada sea 0, considerando que los daños los asume el asegurado a partir del segundo accidente si este ocurriera. 23. El 1% de los artículos que produce una fábrica son defectuosas. Hallar de manera aproximada la probabilidad de que cinco artículos estén defectuosas en un lote de 400. Sug. Usar la aproximación de la binomial con la distribución de Poisson con parámetro 400(0.01). 24. Una empresa compra determinado artículo en grandes cantidades. Para que cada lote adquirido sea aceptado o rechazado se eligen 20 artículos al azar. Si alguno de los 20 es defectuoso, el lote se rechaza; de otro modo, se acepta. a) ¿Cuál es la probabilidad de rechazar un lote que tiene el 1% de defectuosos? b) Si en lugar de tomar 20 artículos se eligen 40, ¿cuál es la respuesta que corresponde a la pregunta anterior.? 25. Se planea comprar una computadora marca A o B. Se ha determinado que el número de reparaciones diarias se comporta como sigue A
B
Distribución
Poisson
Poisson
Media
0.7t
0.5t
Costo
7t +30 X 2
5t +30Y 2
donde t = número de horas diarias de operación, X = número de reparaciones para la marca A e Y = número de reparaciones para la marca B. De acuerdo al esperado de los costos de operación, ¿qué marca es más favorable, si la jornada diaria es a) t = 8 horas diarias de operación?. b) t = 12 horas diarias de operación?.
2 40 . Probabilidad.
26. Para promocionar un artículo cuyo costo es $100, una tienda reduce el precio a la mitad por cada cliente que compre el artículo durante un día particular. Si el número de clientes que llegan al día tiene distribución de Poisson con media 3. Hallar el valor esperado del artículo al terminar un día cualquiera. 27. Un control automático revisa las piezas producidas por una máquina. La probabilidad de que una pieza buena sea aceptada como tal es 0.98 y que una pieza defectuosa sea aceptada como buena es 0.01. Si la proporción de defectuosos es igual al 1% de la producción, a). ¿cuál es la probabilidad de que una pieza sea considerada como defectuosa por el control?. b). Si X es la variable que indica el número de piezas consideradas como defectuosas por el control, en cinco extracciones, ¿cuál es la ley de probabilidad de X . Rpta. a) Usar el teorema de las probabilidades totales. La probabilidad pedida es 0.02 97. 28. Se estima que después de una campaña publicitaria el promedio de la demanda de un artículo de tocador, que sigue la ley de Poisson con parámetro 3, será duplicado con probabilidad 0.8 y triplicada con probabilidad 0.2. Hallar la ley de probabilidad de la demanda después de la campaña. Sug. Usar el teorema de las probabilidades totales. 29. Cada cinco minutos, llegan automóviles a una gasolinera según un modelo de Poisson con parámetro λ = 4 y camiones según un modelo de Poisson con parámetro λ = 2. Si en el mismo período el 80% de los vehículos que llegan son automóviles y el resto son camiones, hallar la probabilidad de que en un período de cinco minutos lleguen 4 vehículos. 30. Una compañía de seguros ha determinado que dos de cada diez mil personas fallecen anualmente por accidentes de tránsito. Si la compañía tiene contratados 5000 seguros de vida de esta modalidad y por cada una ha de pagar en un año por lo menos $ 100000, a). ¿cuál es la probabilidad de que la compañía tenga que pagar en un año por lo menos $ 12000000?. b). ¿Qué cantidad de dinero debe mantener en reserva la compañía para tener una probabilidad de 0.95 de poder pagar a todos los familiares de las personas aseguradas fallecidas por accidentes de tránsito?. Sug. a) Considerar que la distribución de la variable X , que indica el número de fallecidos de las 5000 personas aseguradas, puede aproximarse mediante la distribución de Poisson de parámetro 1. 31. La llegada de los clientes a un banco sigue una distribución de Poisson, siendo la tasa de llegada de 2 clientes cada 10 minutos. ¿Cuál es la probabilidad de tener que esperar más de 4 minutos hasta la llegada del primer cliente?. 32. La probabilidad de que se encuentre petróleo en un pozo perforado es 0.2. ¿Cuál es la probabilidad de que el quinto pozo con petróleo sea encontrado en la p erforación número 30?. Rpta. C 429 0.8250.25 . 33. La probabilidad de realizar con éxito un experimento químico es 0.90. Si el experimento se repite bajo las mismas condiciones e independientemente cada vez, a) hallar la ley de probabilidad de la variable aleatoria X , que indica el número de repeticiones necesarias, hasta completar el primer resultado exitoso. b) hallar la ley de probabilidad de la variable aleatoria X , que indica el número de repeticiones necesarias, hasta completar dos resultados exitosos. c) calcular la probabilidad de que para completar dos resultados exitosos se necesiten más de cuatro repeticiones. Sug. a) Aplicar la ley geométrica. b) Aplicar la ley de Pascal. 34. Cierto experimento químico se repite de manera independiente hasta tener éxito. El costo por cada repetición del experimento es $25000. Si el experimento no se realiza con éxito se debe gastar una suma adicional de $5000 para reparar equipos. a) Hallar la expresión C ( X ) del costo esperado del experimento, en función del número X de veces que se repite el experimento. b) Hallar el valor esperado del costo C ( X ) si la probabilidad de éxito para cada experimento es 0.25.
Probabilidad. 2 41
c) Si se dispone de $145000, ¿cuál es la probabilidad de que esta cantidad no sea suficiente hasta alcanzar éxito?. Rpta. b) 115000. 35. Una práctica de laboratorio de química se realiza hasta que se culmine con éxito. La probabilidad de culminarla con éxito es 0.6. Si cada repetición cuesta $5 y se considera que cada repetición es independiente de las anteriores, hallar el costo esperado por estudiante que realiza el laboratorio. 36. El 5% de los motores que produce una fábrica son defectuosos. Si se seleccionan al azar los motores, uno a la vez , calcular la probabilidad a) de que se encuentre el primer motor no defectuoso en el segundo intento, b) de que se encuentre el segundo motor no defectuoso en el cuarto intento. Si los primeros dos motores son defectuosos, calcular la probabilidad de que por lo menos se deban probar dos motores más antes de que se encuentre el primer motor no defectuoso. Calcular el promedio y la varianza del número de la inspección en la cual se encuentre el cuarto artículo no defectuoso. 37. De cuatro personas de las cuales 2 son mayores de 20 años se eligen tres personas una después de otra y con restitución. Si X es el número de personas mayores de 20 años entre las 3 elegidas, hallar: a) P ( X > 2). b) la esperanza y la varianza de X . Si la extracción se realiza hasta obtener la primera persona mayor de 20 años y se considera que la variable Y representa al número de personas elegidas hasta obtener la primera persona mayor de 20 años, hallar: c) P ( Y > 2). d) la esperanza y la varianza de Y. Si la extracción se realiza hasta obtener la segunda persona mayor de 20 años y se considera que la variable W representa al número de personas elegidas hasta obtener la segunda persona mayor de 20 años, hallar: e) P ( W > 2). f) la esperanza y la varianza de W. Resolver a), b) y c) si la extracción se elección se realiza sin restitución. 38. Para estimar el tamaño N de una población de animales se puede proceder de la siguiente manera: se capturan k animales y se les marca y se les suelta en la población; cierto tiempo después se capturan n animales y se anota Y, el número de animales marcados entre los n . El valor observado de esta variable contiene in formación sobre N. Si n =3 e Y = 1, hallar N de tal manera que la probabilidad P [ Y = 1] sea máxima. 39. La cuarta parte de los donantes a un banco de sangre, durante un día, son del grupo O + , calcular la probabilidad de que el segundo donante O + sea el quinto donante del día. Si el análisis cuesta $10 por persona, calcular el valor esperado y la varianza del costo total de llevar a cabo las pruebas para encontrar tres donantes de sangre tipo O + .
2 42 . Probabilidad.
3.14. ALGUNAS DISTRIBUCIONES CONTINUAS DE USO FRECUENTE LA DISTRIBUCION UNIFORME . Se dice que una variable aleatoria continua X tiene di stribución uniforme e n [ a , b ] si su función de densidad es
1 / (b − a ) si x ∈ [ a ,b ]
f ( x ) =
0
en el resto
,
Si X tiene distribución uniforme en [ a, b ], se escribe X~
[ a , b ].
La función de acumulación de X e s 0 si x < a F ( x ) = ( x − a ) / ( b − a ) si a ≤ x ≤ b 1 si x > b Y
1/( b-a )
Y
0
-
f ( x )
-
1 F ( x )
X
0 k b a b 1 2 Figura 3.21. Función de densidad y de acumulación de X. a
k
X
Obsérvese de que la probabilidad de que X tome valores en cualquier intervalo A = [ k 1 , k 2 ] contenido en [ a , b ], es igual a la longitud de A entre b - a . En general, las probabilidades correspondientes a dos intervalos de la misma longitud y contenidos en [a, b ], son iguales. En este sentido podemos decir que la " masa de valores " de X se distribuye de manera uniforme en [ a , b ]. Muchas variables aleatorias tienen la distribución uniforme. Presentamos a continuación dos ejemplos. 3.53. Ejemplo. Si una persona llega a su centro de labores entre las 8:00 y las 8:30 de la mañana, podrá considerarse que es igualmente probable que llegue, por ejemplo, entre las 8:05 y las 8:10 o entre las 8:07 y las 8:12. La variable X, que corresponde al tiempo en horas en que sucede la llegada al centro de labores, tiene distribución uniforme en el intervalo [0, 30]. 3.54. Ejemplo. Entre las 7 a.m. y las 8 a.m., los trenes parten de una estación a los 20, 30 y 60 minutos después de las 7 a.m. Si la hora en que llega una persona a la estación
Probabilidad. 2 43
sigue una distribución uniforme en el intervalo comprendido entre las 7 a.m. y las 8 a.m., ¿cuál es la probabilidad de que tenga que esperar a lo más 5 minutos la salida de un tren?. Solución. La persona espera a lo más 5 minutos en la estación si llega entre las 7:15 y 7:20, o entre las 7:25 y 7:30 o entre las 7:55 y 8:00 a.m.
Como la distribución del tiempo de llegada es uniforme, la probabilidad de que la persona llegue en cada uno de los intervalos de tiempo indicados es 5/60. La 5 probabilidad de que tenga que esperar a lo más 5 minutos es 3 = 1/4. 60
Esperanza y varianza de una variable con distribución uniforme. Para una variable aleatoria X que tiene la distribución uniforme en el intervalo [a, b], se cumple:
E ( X ) =
a +b
2
(b − a ) 2 y V ( X ) = 12
En efecto, E ( X ) =
+∞
a
+∞
b
∫−∞ xf ( x)dx = ∫−∞ x(0)dx + ∫a x ((1 / (b − a ))dx + ∫b
x (0)dx = (a + b ) / 2 .
De igual manera para la varianza. 3.55. Ejemplo. El tiempo, X, en días que demora un taller en reparar un automóvil sigue una distribución uniforme en el intervalo [1, 6]. Si para el propietario del automóvil, el costo C "por falla" comprende: un costo fijo de $50.00 por reparación y un costo que es proporcional al
cuadrado del tiempo que dura la reparación, de tal modo que C = 50 + 2 X 2 , calcular el costo esperado. Solución. Si X tiene distribución uniforme en el intervalo [1, 6], entonces
E ( X ) =
6+1 = 3.50 2
2
, V ( X ) =
(6 − 1) 2 25 = = 2.0833 y 12 12
2
2
E ( X ) = V ( X ) + [ E ( X )] = 2 .0833 + ( 3.50 ) = 14 .3333 ,
luego,
2
E ( C ) = E ( 50 ) + 2 E ( X ) = 50 + 2 (14 .3333 ) = 78 .6666 .
2 44 . Probabilidad.
LA DISTRIBUCION NORMAL. Este es uno de los modelos probabilísticos más importante y el más utilizado en Estadística. Muchos fenómenos aleatorios que se estudian en la realidad se pueden modelar con esta distribución. Las propiedades matemáticas que este modelo posee han contribuido grandemente al desarrollo de la Estadística; sin embargo, muchas de sus propiedades son extendidas sin ningún reparo a cualquier situación, lo que ha contribuido también a un sin número de errores en la utilización de esta ciencia. En este texto indicaremos algunos procedimientos que indican hasta que punto una serie de datos pueden adaptarse a una distribución normal o no, identificando los casos en donde es posible hacer deducciones estadísticas que r equieren los supuestos de normalidad. Se dice que la variable X sigue una distribución normal con parámetros µ y σ y se escribe X ~ N (µ, σ2), si su función de densidad es
1 x − µ 2 f ( x) = exp− con − ∞ < µ < +∞, σ > 0 . σ 2π 2 σ 1
68.26%
σ
σ
σ
σ σ µ 95.4% 99.7%
σ
Figura 3.22. Función de densidad de una variable con distribución normal .
•
La gráfica de f , que se muestra, es simétrica respecto de la recta x = µ y se denomina "Campana de Gauss".
•
El área bajo la curva f ( x) y por encima del eje X es 1.
•
El área comprendida entre las rectas x = a y x = b, y que corresponde a la probabilidad P[a ≤ X ≤ b], se calcula usando los métodos de integración; sin embargo, existen tablas, como la del apéndice A, a partir de las cuales se aproximan tales áreas.
•
La distancia del punto de inflexión (en donde cambia la concavidad de la curva) a la µ es igual a σ. recta x 1 La ordenada que corresponde a la abscisa µ está a una altura . Puede notarse σ 2π que cuando σ es cada vez más pequeño la curva es más leptocúrtica, en cambio, cuando σ es cada vez más grande la curva es más platicúrtica. =
•
Probabilidad. 2 45
Usando la tabla del apéndice A se puede comprobar que * el área comprendida entre µ - σ y µ + σ es aproximadamente el 68.26% del área total, * el área comprendida entre µ - 2σ y µ + 2σ es aproximadamente el 95.4% del área total y * el área comprendida entre µ - 3σ y µ + 3σ es aproximadamente el 99.7% del área total.
Esperanza y varianza de una variable aleatoria con distribución normal . Usando la función de densidad de una variable aleatoria X con distribución normal de parámetros µ y σ, se prueba que E ( X ) = µ y V ( X ) = σ2
Cuando la esperanza es µ = 0 y la desviación estándar, σ = 1, la distribución normal N (0, 1) se llama distribución normal estándar o típica. Una variable con distribución N (0, 1), se denota con Z y sus funciones de densidad y acumulación, con ϕ y Φ, respectivamente.
Φ (2.7) φφ (2.7)
Φ (2.7)
-3
0
2. 7
-1
3
Figura 3.23
(a) Gráfica de ϕ
0
1
2 .7
(b) Gráfica de Φ
Como se indicó, la tabla del apéndice A nos permite aproximar los valores de la función de acumulación Φ. Algunos de los valores de ésta función se indican a continuación. X
0.00
0.01
0.50
1.87
2.70
2.99
Φ( x)
0.50000
0.5040
0.6915
0.9693
0.9965
0.9986
La tabla del apéndice A proporciona valores de Φ( x) para x no negativos. Para calcular Φ en valores negativos de x se usa el carácter simétrico de la gráfica de la función de densidad y de este modo se tiene que
Φ(- x) = 1 - Φ( x), ∀ x > 0 . Así,
Φ(-1.87) = 1 - Φ(1.87) = 1 - 0.9693 = 0.0307.
2 46 . Probabilidad.
3.56. Ejemplo. Para Z , hallar:
a) P[ Z ≤ 2]
c) P[0 ≤ Z ≤ 2.57]
b) P[0 ≤ Z ≤ 2]
e) P[-2 ≤ Z ≤ 2]
d) P[-1 ≤ Z ≤ 1]
g) P[-2 < Z < 1].
f) P[-3 ≤ Z ≤ 3].
Solución. Según la tabla del apéndice A,
a) P[ Z ≤ 2] = Φ(2) = 0.9772. b) P[0 ≤ Z ≤ 2] = Φ(2) - Φ(0) = 0.9772 - 0.50 = 0.4772. c) P [ 0 ≤ Z ≤ 2 . 57 ] = Φ(2.57) - Φ(0) = 0.9949 - 0.50 = 0.4949. d) Usando la simetría de la función de densidad de la normal, se tiene P[-1 ≤ Z ≤ 1] = 2 P[ 0 ≤ Z ≤ 1] = 2(Φ(1) - Φ(0)) = 2(0.8413 - 0.50) = 0.6826.
e) P[-2 ≤ Z ≤ 2] = 2(Φ(2) - Φ(0)) = 0.9544. f) P[-3 ≤ Z ≤ 3] = 2(Φ(3) - Φ(0)) = 2(0.4987) = 0.9974. g) P[-2 < Z < 1] = Φ(1) - Φ(-2) = 0.8413 - [1 - Φ(2)] = 0.8185. PROPIEDAD. (" de tipificación" o "de estandarización ")
La tabla del apéndice A corresponde a la distribución normal estándar; sin embargo, si se aplica la siguiente propiedad, puede usarse también para cualquier distribución normal. Si X ~ N (µ, σ2), entonces
X − µ
σ
sigue la distribución N (0, 1).
La transformación descrita por ( X - µ)/ σ se llama "de estandarización" o "de tipificación" y la variable que resulta puede denotarse con Z. ( Z es normal con media 0 y varianza 1). La estandarización de X equivale a expresar las desviaciones de X respecto de la media µ en desviaciones estándar. 3.57. Ejemplo. Si X ~ N (12, 4), hallar P[10 ≤ X ≤ 14]. Solución.
Probabilidad. 2 47
Se tiene: P[10 ≤ X ≤ 14] = P[(10 - µ)/ σ ≤ ( X - µ)/ σ ≤ (14 - µ)/ σ] = P[- 1 ≤ Z ≤ 1]
= Φ(1) - Φ(-1) = Φ(1) - {1 - Φ(1)} = 2Φ(1) -1 = 0.6826. Usando la tipificación, se comprueba ahora que si X ~ N (µ, σ2), P[µ - σ ≤ X ≤ µ + σ] = P[-σ ≤ X - µ ≤ σ] = P[-1 ≤ Z ≤ 1] = 0.6826, P[µ - 2σ ≤ X ≤ µ + 2σ] = 0.9544
y
P[µ - 3σ ≤ X ≤ µ + 3σ] = 0.9974.
3.58. Ejemplo. Los puntajes finales de un curso de Matemáticas están distribuidos normalmente con media µ = 50 y desviación estándar σ = 5. Si se elige un puntaje al azar,
a) ¿cuál es la probabilidad de que los puntajes estén entre 40 y 60 puntos?, b) ¿cuál es la probabilidad de que los puntajes estén por encima de los 70 puntos?. c) Hallar el valor de a para el cual, la probabilidad de que un puntaje sea menor o igual que a es 0.20. Solución. Si X denota la variable aleatoria " puntaje", entonces se tiene que X ~ N (50, 25) y
a) P[40 ≤ X ≤ 60] = P[(40 - 50)/5 ≤ Z ≤ (60 - 50)/5] = P[ -2 ≤ Z ≤ 2] = 0.9544. b) P[70 ≤ X ] = P[4 ≤ Z ] ≈ 0 . (A partir de 3.90, el área bajo la función de densidad y por encima del eje X , es aproximadamente igual a 0). c) Se debe hallar a de tal modo que P[ X ≤ a] = 0.2. Tipificando se tiene P[ Z ≤ (a - 50)/5] = 0.2. Según la tabla N (0,1), para z = -0.84, P[ Z ≤ z] = 0.2, de donde, -0.84 = (a - 50)/5. Es decir, a = 50 + 5(-0.84) = 45.8. 3.59. Ejemplo. Se informa que la cantidad X de azúcar de los paquetes marcados con "1 kilo" y que se expenden en los supermercados del distrito, tiene distribución normal con media µ kilos
2 48 . Probabilidad.
y desviación estándar 0.02 kilos. Hallar el valor de la media de X si la cantidad de azúcar que contiene cada paquete es menor o igual que 0.95 kilos con probabilidad 0. 10. Solución. Se tiene que P[ X ≤ 0 . 95] = 0. 10.
Estandarizando,
X − µ 0.95 − µ 0.95 − µ ≤ = 0.10 o P Z ≤ = 0.10 0.02 0.02 σ
P
Para la distribución normal estándar, P [ Z ≤ −1. 28 ] = 0 .10. Luego,
0 . 95 − µ = −1. 28 ; de donde µ = 0.9756 kilos. 0. 02
Otras propiedades de la distribución normal son las siguientes: 1. Si X tiene media µ y varianza σ 2 , entonces la variable Y = a + bX es una variable aleatoria que sigue la distribución normal con media a + bµ y 2 2 varianza b σ . En particular , si Z es una variable aleatoria normal estándar entonces, la variable Y = µ + σ2 Z tiene distribución normal con media µ y varianza σ2.
2. (“Propiedad reproductiva de la normal”) 2
Si X i ~ N (µi, σi ), con entonces
i = 1, 2, ..., n, son n variables independientes,
n
Y=
∑ ci X i
i =1
n
~ N ( ∑ ci µ i , i =1
n
∑ ci2 σi2 ).
i =1
3.60. Ejemplo Un censo ha determinado que en las familias en donde tanto el esposo como la esposa trabajan, el sueldo X del esposo sigue una distribución normal con media 800 unidades monetarias y desviación estándar 50 unidades monetarias, mientras que el sueldo Y de la esposa sigue una distribución normal con media 700 y desviación estándar 70 unidades monetarias. Hallar la probabilidad de que, tomada una familia al azar, el sueldo del esposo sea mayor que el sueldo de la esposa, si l os sueldos se consideran independientes. Solución. Se desea hallar P[ X > Y ] o en forma equivalente P[ X − Y > 0].
Se tiene: X ~ N (800, 50 2 ) y Y ~ N (700, 70 2 ) . Luego, según la propiedad 2,
Probabilidad. 2 49
2
2
X − Y ~ N (800 − 700, 50 + 70 ) = N (100, 7400).
Resulta entonces que
( X − Y ) − 100
P[ X − Y > 0] = P
7400
>
0 − 100
. ] = 0.8770 = P[ Z > −116
7400
3.61. Ejemplo Se supone que la distribución de la cantidad de dinero que cada cliente, de manera independiente, gasta cada día en cierta tienda es N (25, 0.4). ¿Cuál es la probabilidad de que 20 clientes de la tienda gasten más de 505?. Solución. Si llamamos, respectivamente, con X 1, X 2, ... , X 20 a lo que gasta cada cliente, se tendrá 20
que la cantidad de dinero que lo s 20 clientes gastan,
∑ X i , tiene distribución normal con i =1
media 500 y varianza 20(0.4) y así
505 − 500 = 1 − Φ(177 . ) = 0.034. 20(0.4)
20
P[ ∑ X i > 505] = 1 - Φ i =1
3.62. Ejemplo. Se cortan barras de fierro cuya longitud tiene distribución normal con media 100 cm y desviación estándar 0.01 cm. Se considera que una barra no es defectuosa si su longitud está en el intervalo [99.99, 100.01].
Si X representa a la longitud de la barra, la probabilidad de que una barra no sea defectuosa es p = P[ 99.99 ≤ X ≤ 100.01] = 0.6826 . Si se toman n barras al azar se tendrá que la variable Y , que indica el número de barras no defectuosas entre las n, tiene distribución binomial con parámetros n y p = 0.6826. Luego, si se toman muchos lotes de tamaño n, se espera encontrar un promedio por lote de np barras no defectuosas. Se espera hallar (np/n).100 = 68.26% de barras no defectuosas. 3.63 . Ejemplo. El 80% de las varillas de fierro que recibe una constructora son de la factoría A y el resto, de la factoría B. Las longitudes, en metros y representadas por X , de las varillas tienen distribución normal con los siguientes parámetros: Media
Varianza
Factoría A
8
0.04
Factoría B
9
0.09
2 50 . Probabilidad.
a) Si se elige una varilla al azar, ¿cuál es la probabilidad de que la longitud de ésta sea menor que 8.2 metros?. b) De 10 varillas elegidas al azar, ¿cuál es la probabilidad de que 4 de ellas tengan longitudes menores que 8.2 metros?. Solución. a) Sean los eventos A: “la varilla proviene de A” y B: “la varilla proviene de B”
Según el teorema de las probabilidades totales, P[ X < 8.2 ] = P[ X < 8 .2| A].P[ A] + P[ X < 8.2| B]P[ B] =
PZ <
8.2 − 8
0.80 + P[ Z < 0.2
8.2 − 9
0.3
]0.2 = 0.6738 + 0.00076 = 0.6746.
b) Si Y representa el número de varillas, de las 10, cuyas longitudes son menores que 8.2, entonces su distribución es binomial con parámetros n = 10 y p = 0.6738. Luego, 10 4 6 P[Y = 4] = C 4 (0.6746) (0.3254 ) = 0.0516.
LA DISTRIBUCION GAMMA. La función
x α−1e − β x α β con α , β > 0 , x ≥ 0 f ( x ) = Γ ( α ) 0 en el resto, en donde Γ ( α ) =
+∞ α− 1 − x
∫0
x
e
dx , corresponde a una función de densidad, pues,
como se puede probar, f ( x) ≥ 0
y
+∞
∫−∞ f ( x)dx = 1.
Si una variable aleatoria X tiene la función de densidad f ( x ) , se dice que X tiene dist ribución gamm a con pa ráme tros α y β.
Se denota con X ~
( α, β ) .
Respecto de Γ ( α), se indican a continuación algunas de sus propiedades, que se demuestran usando los métodos de integración:
Probabilidad. 2 51
a) Γ ( 1) =
+∞ − x
∫0
b) Γ ( 1/2) =
e
+∞
∫0
dx = 1 .
x
−1 / 2 − x
e
dx =
π.
c) Γ ( α + 1) = αΓ ( α ). Si α es entero positivo, usando c), se tiene
Γ ( α + 1) = αΓ ( α) = α ( α
- 1 ) Γ ( α - 1)
= ... = α ( α - 1) ... Γ ( 1) = α !.
Por esta razón, a Γ ( α) se le llama " función fact oria l ".
Esperanza y varianza de una variable con distribución gamma La es pera nza de un a variab le aleato ri a X con di stribuci ón ga mma de paráme tros α y β es α / β mientras que su varianza es α / β 2.
Veamos la demostración. La función de densidad de X es f ( x ) =
Luego, E ( X ) =
+∞
∫0
x
x
x
α −1 α − β x
β e
si x ≥ 0 .
Γ ( α )
α −1 α −β x
β e
Γ ( α )
E ( X ) =
1
dx . Haciendo β x = u , se tiene:
α −u +∞ u e
∫ Γ ( α ) 0
β
du =
Γ (α + 1) α = . Γ (α )β β
Para demostrar lo relativo a la varianza, calculemos primero E ( X 2 ) . 2
E ( X ) =
α −β x +∞ 2 α −1 β e dx x x 0 Γ α
∫
( )
2
=
2
Γ ( α + 2 ) β Γ ( α )
α
2
α +2
β
= α ( α + 1) (1/ β ) .
2
2
2
Luego, V ( X ) = E ( X ) − [ E ( X ) ] = α ( α + 1) (1/β ) − ( α /β ) = α /β . PROPIEDAD . Se demuestra que si X 1 ,..., X n son n variables aleatorias independientes, cada una con distribución gamma y con parámetros α y β, entonces la suma n
∑ X i tiene distribución gamma con parámetros nα y
β.
i =1
Los siguientes son casos particulares de la distribución gamma.
2 52 . Probabilidad.
Caso 1. LA DISTRIBUCION EXPONENCIAL . Si en la función de densidad de una variable que sigue la distribución gamma, escribimos α = 1, resulta la función de densidad f ( x ) = β e
− xβ
x ≥ 0.
cuya gráfica es como la siguiente Y
X
0
Figura 3.24. Función de densidad exponencial con parámetro β .
Una variable X que tiene esta función de densidad, se dice que sigue la distribución exponencial co n pa ráme tr o β β β . Se denota con X ~ Exp ( β ) .
Esperanza y varianza de una variable aleatoria con distribución exponencial. Ha ciendo en la di stribu ción gamma , α = 1, se tiene que la esperanza y la varianza de una variable aleatoria X con distribución exponencial de parámetro β son , respectivamente, E ( X ) = 1 / β ,
y
2 V ( X ) = 1 / ( β )
3.64. Ejemplo. El tiempo de vida en horas, X , de un cierto tipo de lámparas tiene función de densidad f ( x ) = ( 1 / 100 ) e − x / 100 con x ≥ 0 .
¿Cuál es la probabilidad de que una lámpara escogida al azar no tenga que ser sustituida durante las primeras 150 horas de uso?. Solución. Para que una lámpara no se sustituya durante las primeras 150 horas, X debe ser mayor que 50.
La distribución de X es exponencial con parámetro β = 1/100; por lo tanto,
Probabilidad. 2 53
P [ X > 150 ] =
+∞
∫150 (1/100)e
− x /100
150/ 100 = 0.2231. dx = e −
3.65. Ejemplo. Una estación de suministro de gasolina recibe gasolina una vez por semana. Si su volumen semanal de ventas V , en miles de galones, se distribuye exponencialmente con parámetro β = 0.5; calcular la capacidad que debe tener el depósito de la estación si el distribuidor desea que, con una garantía del 99%, exista gasolina en el fin de semana. Solución. Si C es la capacidad del tanque, debe cumplirse
0.99 = P [ V < C ] ó 0. 01 = P[V ≥ C ] =
+∞
∫C
0.5e −0.5 x dx ,
0.5
Exp (0.5)
0.99 C
Figura 3.25. Función de densidad exponencial con parámetro β = 0. 5
Resolviendo la integral se tiene C = 9.2103 miles de galones. 3.66. Ejemplo. Un banco tiene tres cajeros, cada uno de los cuales atiende a los clientes en un tiempo T, que puede modelarse mediante una distribución exponencial con un promedio de 5 minutos por persona. Si los cajeros atienden de manera independiente, calcular la probabilidad de que el tiempo de atención de dos de los tres cajeros sea mayor que 4 minutos. Solución. Para cualquier cajero, la probabilidad de que el tiempo de atención, sea mayor que 4, es +∞
p = P[T > 4] = ∫4 (1 / 5) e − (1/ 5) t dt = e −4 / 5 = 0.4493.
Como los cajeros atienden de manera independiente, se trata de encontrar la probabilidad de dos “éxitos” en tres repeticiones independientes, siendo P[" exito" ] = P[ T > 4] = 0.4493. Usando la distribución binomial, P[dos de los tres cajeros atiendan en más de 4 minutos a cada cliente] =
2 54 . Probabilidad.
= C 23 (0.4493) 2 (1 − 0.4493) = 0.3335.
3.67. Ejemplo. Las pensiones de los jubilados de cierto sector son pagadas al final de cada mes en un banco. El proceso que se sigue para el pago es el siguiente: el jubilado es atendido primero en una oficina en donde recibe una boleta de pago y luego con esta boleta pasa a recibir su pago en una ventanilla del banco. Si tanto el tiempo de atención en la oficina como el de la ventanilla son independientes y cada uno puede modelarse con una distribución exponencial cuyos promedios son iguales a cuatro minutos en cada caso, hallar la esperanza y varianza del tiempo total de atención. Solución. El tiempo de atención en la oficina en donde se entregan papeletas y el que se usa en la ventanilla de pago, tienen distribución exponencial con parámetro β = 1/4.
Según una propiedad de la distribución gamma, el tiempo total T de atención a cada jubilado tiene distribución gamma con parámetros 2α = 2 y β = 1/4. Luego, la esperanza y la varianza del tiempo total de atención son: E ( T ) =
2 =8 1 / 4
y
V ( T ) =
2 (1 / 4 )
2
= 32 .
3.68. Ejemplo. El número de clientes que llegan a un banco sigue la ley de Poisson con parámetro λ. Si con X denotamos el tiempo que transcurre desde el momento en que se abre el banco y el momento en que llega el primer cliente, hallar la función de densidad de X . Solución. Calculemos la función de acumulación de X, F ( x ) = P[ X ≤ x ] = 1 − P[ X > x ] para luego derivarla y obtener la función de densidad.
El evento [ X > x] indica que la primera llegada ha ocurrido después del tiempo x. Esto indica que en el intervalo [0, x] no ha ocurrido ninguna llegada. Luego, F ( x ) = P[ X ≤ x ] = 1 − P[ X > x] = 1 − e − λ x , x > 0
La función de densidad de X es f ( x) =
dF ( x ) dx
la distribución exponencial con media 1/ λ.
= λe − λ x . Así se tiene que la variable tiene
Probabilidad. 2 55
Caso 2. LA DISTRIBUCION JI-CUADRADO . Si una variable aleatoria X tiene distribución gamma con pa rámetros α = n /2, n entero positivo , y β = 1/2 , se di ce qu e sigue la distribución ji-cuadrado co n n grados de li bert ad . 2
Simbólicamente : X ~ χn .
En la siguiente figura se presenta la gráfica de la función de densidad correspondiente a la distribución ji-cuadrado para algunos valores de n y en el apéndice C se presenta una tabla que permite aproximar los percentiles de una variable con tal distribución y para determinados grados de libertad n. Cuando X sigue una distribución ji-cuadrado con n grados de libertad y n es suficientemente grande (en la práctica n ≥ 30), se puede probar que la variable aleatoria Z =
2 X − 2 n − 1 se aproxima a la distribución N (0, 1). Y n=1 n= 2
n= 4 n= 10
0
5
10
15
X
Figura 3.26. Gráficos de funciones de densidad Ji-cuadrado con n grados de libertad
Una propiedad importante, que permite obtener variables con distribución ji-cuadrado, es la siguiente.
PROPIEDAD. Si Z1 ,..., Z n son variables aleatorias independientes cada una con n
distribución normal estándar, entonces la variable aleatoria
∑ Z i2 , sigue
i =1
una distribución ji-cuadrado con n grados de libertad.
Esperanza y varianza para una variable aleatoria con distribución jicuadrado con n grados de libertad. Para una variable aleatoria X, que sigue la distribución ji-cuadrado con n grados de libertad, se cumple: E ( X ) = n y V ( X ) = 2 n 3.69. Ejemplo.
2 56 . Probabilidad.
2
Si X ~ χ10 , hallar a de tal modo que P[ X ≥ a ] = 0. 05. Solución. Según la tabla ji-cuadrado, (apéndice C), el valor de a tal que P[ X ≥ a] = 0.05 es 18.31.
3.70. Ejemplo. 2 Si X ~ χ 50 , hallar a de tal modo que P[ X ≥ a ] = 0. 05. Solución. Como n ≥ 30, Z = estándar; luego
2 X − 99 se distribuye aproximadamente como la normal
0.05 = P[ X ≥ a ] = P[ 2 X − 99 ≥ 2 a − 99 ] = P[ Z ≥
2 a − 99 ].
En la tabla N (0,1), se observa que para z = 1.645, P[ Z ≥ z] = 0.05 . Luego, 1.645 =
2a − 99 , de donde a = 67.1625.
LA DISTRIBUCION T-STUDENT . Otra distribución importante es la distribución t-student con n grados de libertad, en donde n es un número natural positivo. La forma de la gráfica de la función de densidad correspondiente a esta distribución es semejante a la que corresponde a la distribución normal estándar. Una variable X sigue la distribución t-student con n grados de libertad si su función de densidad es 2 − ( n+1)/ 2 Γ (( n + 1) / 2) x 1 + f ( x ) = 1 / 2 n ( nπ ) Γ ( n / 2 )
− ∞ < x < +∞
Si X tiene distribución t - student con n grados de libertad, se escribe X ~ t (n). La diferencia de la gráfica de la función de densidad de la t-student y la de la normal estándar está en que las colas en la t-student son "más pesadas" que las de la normal estándar. Son "más pesadas", en el sentido de que tienen mayor área y por lo tanto hay mayor probabilidad de encontrar valores extremos. Sin embargo, se demuestra que si el número de grados de libertad crece indefinidamente la distribución t-student tiende a la distribución normal estándar.
Probabilidad. 2 57
0.4 Normal Estándar 0.3
0.2
0.1
t-student
0 -5
-3
-1
1
3
5
Figura 3.27. Funciones de densidad normal estándar y t-student .
Se demuestra que si Z y X son dos variables aleatorias independientes, Z con distribución normal estándar y X con distribución Ji-cuadrado con n grados de libertad, entonces la Z variable aleatoria T = sigue la distribución t-student con n X / n grados de libertad.
Se considera en la práctica que cuando el número de grados de libertad n es mayor o igual a 30 la distribución t-student se aproxima muy bien a la distribución normal estándar. En la tabla del apéndice B aparecen los cuantiles correspondientes a la distribución tstudent para distintos grados de libertad.
Esperanza y varianza para una variable aleatoria con distribución t-student con n grados de libertad. Para una variable aleatoria X con distribución t-student con n grados de libertad se cumple: E ( X ) = 0 y
V ( X ) = n / ( n − 2 ) para n > 2
LA DISTRIBUCION F DE SNEDECOR. Una distribución también muy importante para las aplicaciones de la Estadística es la distribución F de Snedecor o simplemente F. Una variable X continua, cuya f unción de densidad es
f ( x ) =
(m / n) m / 2
β(m / 2 ,n / 2) (1 +
x (m/ 2) −1 , con x ≥ 0 , mx / n) (m+ n)/ 2
en donde m y n son enteros no negativos, se dice que sigue la distribución F con m y n grados de libertad Si X sigue la distribución F con m y n grados de libertad se usa la notación X ~ F m,n.
2 58 . Probabilidad.
Se demuestra que si X e Y son variables aleatorias independientes, X con distribución ji-cuadrado con m grados de libertad e Y con distribución ji-cuadrado con n grados de libertad, entonces la X / m variable , sigue la distribución F con m, n grados de libertad. Y / n
Las gráficas de las funciones de densidad correspondientes a las variables aleatoria con distribuciones F 10, 10, F 10, 5 y F 25, 25 se muestran a continuación. 0.8
0.6 F
0.4
10,10 F
0.2
25,25
F
10,5
0 0
2
4
6
8
Figura. 3.28. Funciones de densidad F 10, 10, F 10, 5 y F 25, 25
En la tabla del apéndice D se encuentra tabulada la distribución F para distintos grados de libertad. Para una variable X con distribución F con m, n grados de libertad y α con 0 < α < 1 , la tabla indica el valor f 1-α,,m,n para el cual P[ X > f 1-α,m,n] = α. Por ejemplo, si m = 6, n = 5 y α = 0.05 se tiene, f 1-α,6,5 = 4.95. Esta tabla está preparada para valores pequeños de α; sin embargo, también se puede usar para valores grandes de α si se toma en cuenta la siguiente propiedad:
PROPIEDAD Si una variable aleatoria X tiene distribución F con m y n grados de libertad, se cumple que P[ X ≥ x ] = 1 − P[Y > 1 / x] , en donde Y es una variable aleatoria con distribución F con n y m grados de libertad.
Así, para hallar el valor de x para el cual P[ X ≥ x] = 0.95 , siendo X una variable aleatoria con distribución F con 6 y 5 grados de libertad, bastará con encontrar en la x para el cual P[Y > 1 / x ] = 0.05 , donde Y sigue una distribución F con 5 y tabla el valor 1/ x = 4.39, de donde x = 0.2277. 6 grados de libertad. La tabla indica que 1/
Esperanza y varianza de una variable con distribución F Se demuestra que la esperanza y la varianza de una variable aleatoria con distribución F, son, respectivamente,
Probabilidad. 2 59
E ( X ) = n / ( n − 2 )
y
2
V ( X ) = 2 ( n / ( n − 2 )) ( m + n − 2 ) / m (n − 4 )
3.19. EJERCICIOS. 1. Se indica que el autobús llegará con “toda seguridad” al lugar de embarque entre las 8:00 y las 9:00 a.m. ¿Qué modelo se sugiere para describir la variable aleatoria que indica el tiempo de llegada?. ¿Cuál es la probabilidad de que el bus llegue entre las 8:00 y las 8:10 a.m.?. Rpta. 0.1667. 2. Una llamada telefónica llegó a una central telefónica entre las 8:00 a.m. y las 8 :05 a.m. Si la central estuvo ocupada durante 2 minutos de ese intervalo, ¿cuál es la probabilidad de que la llamada haya llegado cuando la central estuvo desocupada. 3. El error que se comete al medir cierto objeto tiene distribución uniforme en el intervalo [ -0.05, 0.05]. Calcular: a) la probabilidad de que el error cometido esté entre 0 y 0.01. b) la esperanza y la varianza de los errores cometidos. Rpta. b) 0 y 0.0083. 4. La coordenada X de un punto X del intervalo [0, 6] es elegido al azar, ¿cuál es la probabilidad de que el cociente de las longitudes de los intervalos [0, X ] y [ X, 6] sea menor que 1/4?. Rpta. 0.20. 5. En la industria del petróleo, la temperatura de destilación T es importante para determinar la calidad del producto final. Supongamos que T es una variable aleatoria distribuida uniformemente en [150, 300] y que cuesta $1.5 producir un galón de petróleo. Si el petróleo destila a una temperatura menor que 200 grados centígrados, el producto se vende como gasolina a $ A por galón. Si se destila a una temperatura mayor que 200 grados centígrados, el producto es un aceite refinado que se vende a $1.2 A por galón. Hallar el valor máximo que debe tener A de tal manera que la ganancia esperada mínima sea igual a $0.3 por galón. Rpta. 1.59. 6. Si X es una variable aleatoria con distribución uniforme en el intervalo [0, 4], hallar el valor esperado de X 2 . 7. Usando la función de acumulación determine la función de densidad de la variable Y =1 - 2 X. si la distribución de X es uniforme en el intervalo [1, 3]. 8. Se puede d emostrar que si un número de eventos ocurre de acuerdo a la distribución de Poisson y si uno de tales eventos ha ocurrido en el intervalo [0, t ], entonces el tiempo real de ocurrencia tiene una distribución uniforme en este intervalo. Si los clientes llegan a un banco de acuerdo a la distribución de Poisson, encontrar la probabilidad de que un cliente llegue los últimos 10 minutos de un período de 25 minutos. 9. Si Z ~ N (0, 1) , hallar: a ) P[ Z ≤ 1.7]
b) P[ −2 ≤ Z ≤ −157 . ]
c) P[ Z > 25]
d ) P[| Z| ≤ 15 .]
e) P[ Z = 2].
Rpta. a) 0.9554.
10. Si Z es una variable aleatoria con distribución N (0, 1), hallar el valor z para el cual a) P[ Z ≤ z] = 0.95 b) P[ Z > z] = 0.01 c) P[ Z ≤ z] = 0.0217
d ) P[ − z ≤ Z ≤ z] = 0.9298.
11. Si X es una variable aleatoria normal con media µ y desviación estándar σ, hallar el número c no negativo para el cual se cumple P[µ − cσ ≤ X ≤ µ + cσ] = 0.7 498. Rpta. 1.15.
2 60 . Probabilidad.
12. Si X ~ N (8,4) , hallar a ) P[ X = 8] b) P[ −4 < X − 8 < 4]
c) P[ 6 < X ≤ 8]
d) P[| X − 8| < 1] .
Rpta. a) 0 b) 0.9544.
13. Dada una variable aleatoria X con distribución normal con media 5 0 y varianza 10, hallar: a) A tal que P[ X ≤ A] = 0.1 b) A tal que P[ X > A] = 0.25. 14. Una máquina deposita refresco en botellas de tal manera que la cantidad vertida tiene distribución normal con media igual a 0.5 litros y con desviación estándar igual a 0.05. a) Hallar la probabilidad de encontrar una botella que contenga menos de 0.47 litros. b) Si se eligen 10 botellas al azar en las cua les se ha vertido refresco, ¿cuál es la probabilidad de que tres de ellas tengan una cantidad de líquido menor que 0.47 litros?. Sug. b) Aplique la ley binomial. 15. La cantidad que gasta un cliente en una conocida tienda se considera que es aleatoria con distribución normal de media $100 y desviación estándar $20. Si cada cliente gasta a lo más $A con probabilidad 0.7, ¿cuál es la suma adicional que debe gastar cada cliente para que el 50% de ellos, aproximadamente supere la cantidad $A?. 16. El diámetro interno de las tuercas que se usarán en el armado de cierto artefacto debe estar en el intervalo expresado como 0.3 ± 0.005 pulgadas. De las tuercas ofrecidas por un fabricante cuyo diámetro interno puede considerarse con distribución normal con media igual a 0.302 pulgadas y desviación estándar igual a 0.003 pulgadas, ¿qué porcentaje, aproximadamente, satisface las especificaciones?. 17. Se informa que los valores tipificados de las notas 13 y 18 de un examen de Sicología son: -0.5 y 2, respectivamente. Hallar el valor de la media y de la desviación estándar de las notas del examen. Si éstas se distribuyen normalmente, ¿cuál es la probabilidad de q ue un alumno obtenga una nota superior a 15?. Rpta. La media es igual a 14 y la desviación estándar, 2. 18. El tiempo de vida de un grupo de p ersonas tiene distribución normal con media 21 horas y varianza 25. a) Hallar la probabilidad de que la edad de una persona escogida al azar sea mayor que 23. b) Si se toman grupos al azar de 200 personas, ¿cuántas personas por muestra se espera que tengan edades entre 20 y 22 años?. 19. El diámetro de las esferas de rodamiento fabricadas por una factoría debe estar entre 29.55 mm. y 29.57 mm. para que sean consideradas como buenas. Si se considera que los diámetros tienen distribución normal con media 29.56 y desviación estándar 0.07, a) hallar el porcentaje esperado de esferas que son consideradas como buenas. b) ¿Qué porcentaje de las esferas se espera que tengan diámetros mayores a dos desviaciones estándar de la media?. c) ¿Cuál debe ser el valor k para qu e el porcentaje esp erado de los diámetros que estén en [ µ − kσ, µ + k σ] sea el 50%?. Rpta. a) 68.26%. b) 4.56%. k = 0.96. 20. Un fabricante de televisores asegura que el tiempo medio de funcionamiento sin fallas de los aparatos es de dos años con una desviación estándar de 0.25 años. Si el tiempo de vida de los aparatos sigue una distribución normal , a) ¿cuál es la probabilidad de que el tiempo de buen funcionamiento de un televisor sea menor que 2.5 años?. b) El fabricante garantiza que reemplazará gratis cualquier aparato de TV cuya duración sin fallas sea menor que k años. Aproximar k de tal modo que sólo el 1% de los aparatos vendidos tenga que ser reemplazado, aproximadamente.
Probabilidad. 2 61
21. De una mina se extrae mineral que contiene un porcentaje de cierto metal. De acuerdo a X la utilidad U será como sigue:
20 si 40 < X < 50 U = 30 X ≥ 50 0 si X ≤ 40 Hallar la utilidad esperada si se considera que la d istribución de X es aproximadamente N (45, 16). Sug. La esperanza es 20 P[40 < X < 50] + 30 P[ X ≥ 50] . 22. Una máquina automática para el llenado de paquetes de arroz puede regularse de modo que la cantidad media de arroz llenado sea la que se desee. Si la cantidad de arroz depositada se distribuye normalmente con desviación estándar igual a 10 gramos, ¿cuál debe ser la regulación media de modo que sólo el 1% de los paquetes tengan un peso neto inferior a 9 90 gramos?. Con la regulación media calculada, se escogen al azar y cada hora, 4 paquetes que luego se pesan; si el promedio de éstos no está entre 995 y 1000 gramos la máquina se detiene. Hallar la probabilidad de que la máquina se detenga. 23. El tiempo que se usa para reparar una máquina es una variable aleatoria cuya distribución es normal con media 120 minutos y varianza 16. Si la reparación dura más de 125 minutos se incurre en una pérdida de $10000, hallar la pérdida esperada total, incluyendo al costo de reparación si éste es igual a $20 0. Si se reduce la media del tiempo de reparación a 115 minutos aumentando el personal de mantenimiento, el costo de reparación aumenta una cantidad C > 200. Hallar el mayor valor de C que se debe pagar de tal manera que la nueva pérdida esperada total sea menor que la pérdida esperada anterior. 24. El peso de los alumnos de un colegio tiene distribución normal X con media 40 kilos y varianza 9 en el grupo de las mujeres y distribución normal con media 45 kilos con varianza 16 en el grupo de los varones. Hallar la probabilidad de que un estudiante pese entre 41 y 43 kilos si el 20% de alumnos son mujeres y el resto son varones. Sug. Aplicar el teorema de las probabilidades totales. 25. Si X e Y son dos variables aleatorias independientes con distribuciones N (1, 1) y N (-1, 2), respectivamente; hallar la distribución de a) X + Y . b) 2 X + 3Y . c) X - Y d) ( X + Y )/2. Rpta. La distribución de X + Y es normal con media 0 y varianza 3. 26. Si X corresponde a las n otas de un curso de Geografía y tiene distribución normal de media 12 y varianza 4 e Y , corresponde a las notas de Historia y tiene distribución normal con media 13 y varianza 5, a) hallar la distribución de X + Y de ( X + Y )/2, si se supone que X e Y son independientes. ¿Cuál es la probabilidad de que para un alumno que ha cursado las dos materias, b) la suma de las notas sea mayor que 28?. c) el promedio de sus notas esté entre 14 y 15? d) la nota de Historia sea mayor que la nota de Geografía?. 27. La distribución del tiempo X, que demora un técnico para armar un aparato, es normal con media 30 y varianza igual a 25. Si la utilidad que el técnico obtiene por tarea es $60 X, hallar la probabilidad de que la utilidad sea mayor que $1900. Rpta. La distribución de la utilidad Y = 60 X es normal con media 1800 y varianza 90000. Calcular P[Y > 1900] . 28. El tiempo que se necesita para ir de A a B en el medio de transporte R es normal con media 10 minutos y varianza 1, mientras que usando el medio de transporte S el tiempo que se usa es normal con media 10 y varianza 4. ¿Qué tipo de transporte se debe utilizar si se dispone de 9 minutos para ir de A a B?.
2 62 . Probabilidad.
29. El tiempo que demora un empleado en atender un cliente tiene distribución normal con media 10 minutos y desviación estándar igual a 2 minutos. Si el empleado dispone de 44 minutos para atender a n clientes, hallar el número n de tal manera que esto sea posible con probabilidad 0.8413. n
Sug. Considerar la variable Y =
∑ X i y hallar n de tal manera que
P[Y ≤ 44] = 0. 8413 .
i =1
30. Una fábrica produce tornillos de precisión en dos máquinas. La longitud de los tornillos es una variable aleatoria normal con una media de 13 cm en ambas máquinas y con una desviación estándar de 0.25 cm en la máquina 1 y de 0.2 en la máquina 2. Si por cada tornillo que mide entre 12.75 y 13.25 cm se gana $0.50 y por cada tornillo que no mide lo indicado, se pierde $0.10, ¿cuál es la ganancia esperada por tornillo si la máquina 1 produce el 70% del total de la producción y la máquina 2 el resto?. Sug. Para calcular la ley de probabilidad de la ganancia (que tiene los valores 0.5 y –0.1), use el teorema de las probabilidades totales. 31. El tiempo entre dos emisiones consecutivas de cierto tipo de partículas tiene distribución exponencial de media 1/5 segundos. Calcular la probabilidad de que el tiempo transcurrido entre dos emisiones sea menor que 0.7. Rpta. 0.9698. 32. El tiempo de vida de una pila tiene distribución exponencial con parámetro 1/6 horas. La utilidad por pila es el 20% de su costo C cuando el tiempo es mayor que 6 horas mientras que si dura menos que 6 horas se pierde el 10% de su costo C . ¿Para qué valor de C se obtiene una utilidad esperada mayor que 0.1 por pila?. 33. La tasa de llegada de los camiones que abastecen un almacén es 2 cada hora. Si el número de camiones que llegan tiene ley de Poisson y el tiempo que transcurre entre dos llegadas consecutivas se denota con T . a) Hallar la función de densidad de T . b) Hallar la probabilidad de que el tiempo que transcurre entre dos llegadas consecutivas sea menor que 10 minutos. c) Probar que P[T > a + b| T > a] = P[ T > b], en donde a y b son dos números reales no negativos. d) Si desde la llegada de un camión han transcurrido 30 minutos, ¿cuál es la probabilidad de que no llegue camión alguno en los 15 minutos siguientes?. Rpta. a) f ( x) = 2e −2 x , x ≥ 0 . b) 1 − e −1 / 3 . 34. El costo de mantenimiento, en miles de pesos y por mes, de una computadora es una variable aleatoria cuya función de densidad es f ( x ) =
Γ (α + β) α +1 x (1 − x) β−1, 0 ≤ x ≤ 1, α > 0, β > 0. Γ (α) Γ ( β)
Usando α = 4 y β = 2 hallar la reserva A mensual y en miles de pesos que se debe mantener para que con probabilidad 0.95 ésta no sea sobrepasada.
NOTA. A la distribución que determina esta función de densidad se le denomina distribución beta de parámetros α y β 35. Probar que para una variable aleatoria cuya distribución es beta con parámetros α y β , se cumple E ( X ) =
α α+β
y
V ( X ) =
αβ . 2 (α + β) ( α + β + 1)
36. Si X representa el tiempo de vida de un cierto elemento (focos, personas, etc.), con función de densidad f ( x) y función de acumulación F ( x), la probabilidad de que un elemento falle en el intervalo ( x, x + ∆x) , dado que han sobrevivido en al menos x unidades de tiempo es igual a P( x < X < x + ∆x | X > x ) =
P( x < X < x + ∆x ) P( X > x )