Unidad 4. VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD (I)
4.1. VARIABLE ALEATORIA Definición de variable aleatoria
Sea ζ un fenómeno aleatorio y Ω el espacio muestral asociado a dicho experimento. Diremos que la función X
es una variable aleatoria si para cada elemento s del espacio muestral, le hace corresponder un número real x tal que x = X(s). Es decir, X es una variable aleatoria si ∀ s ε Ω , ∃ un x ε RX / x = X(s) Esto se aprecia en la siguiente figura.
Ejemplo 01 ζ 1: Supongamos que se lanza al aire una moneda tres veces. Si ζ es el fenómeno aleatorio, su espacio muestral será Ω = {SSS, SSC, SCS, CSS, SCC, CSC, CCS, CCC}. Si definimos a X como la variable aleatoria que representa "el número de veces que ocurra cara" , entonces X(SSS) = 0; ; es decir, el número de caras obtenidas puede ser cero, y esto ocurre cuando se obtiene tres sellos; del mismo modo, se obtendrá una cara siempre que X(SSC) = X(SCS) = X(CSS) = 1; o dos caras cuando X(SCC) = X(CSC) = X(CCS) = 2 y también, X(CCC) = 3. De todo ello deducimos que, si se lanza una moneda tres veces y se define a X como el número de caras obtenidas, los posibles valores que tome X serán 0, 1, 2, 3. Luego el espacio rango de X será RX = { 0, 1, 2, 3 }. Ejemplo 02 ζ 1: De un lote de productos, en donde el 10% son defectuosos, se elijen al azar a 5 de ellos. Si se define a X como el número de productos defectuosos seleccionados, entonces X tomará los valores: 0, 1, 2, 3, 4, 5. Esto significa que el espacio rango de X será RX = {0, 1, 2, 3, 4, 5}. Ejemplo 03 ζ 1: De 5 varones y 4 damas, se elige un comité de tres miembros. Se define a X como el número de damas que pueden conformar el comité
En este caso X: 0, 1, 2, 3. Según esto, el espacio rango RX = {0, 1, 2, 3}. Ejemplo 04 ζ 1: Una nave de combate lanza proyectiles a una vía férrea. Ésta quedará destruida si si el proyectil cae a 30 metros de la vía. Se define a X como la distancia entre el punto de impacto del proyectil y la vía férrea. La variable aleatoria X en este caso, toma infinitos valores dentro de un rango; es decir, RX = { x ε R / -c ≤ x ≤ c }, donde "c" es la máxima distancia entre el punto de impacto del proyectil y la vía férrea. Eventos equivalentes
Sea ζ un experimento aleatorio. Sea Ω el espacio muestral asociado a ζ. Sea X una variable aleatoria definida sobre Ω con RX su espacio rango.
Si B es un evento de RX; es decir, B está contenido en RX y A se define como A = { s ε Ω / X(s) ε B } entonces diremos que A y B son dos eventos equivalentes. En otras palabras, un evento B, del espacio rango es equivalente a otro evento A, del espacio muestral, si cada elemento del evento A del espacio muestral tiene como imagen otro evento B del espacio rango, según la definición de X. Ejemplo 05 En el primer ejemplo visto en esta sección, vimos que si se define a la variable aleatoria X como el número de caras obtenidas, el evento B: “Obtener 0 caras” será equivalente con el evento A: “Obtener 0 caras”. En
efecto, A = { SSS } y según la definición, B = {x / x = X(SSS) = 0 }. Si ocurre A entonces, y sólo entonces, ocurre B. Ejemplo 06 Tomando el mismo ejemplo supongamos ahora que se define el evento B como “Salen por lo menos dos caras”. En este caso B = {x ε RX/ x = 0, 1, 2 }; B = { 0, 1, 2 }. En el espacio muestral Ω debe ocurrir el evento A: “Obtener a lo más dos caras”, lo que por extensión se define como A = {SSS, SSC, S CS, CSS, SCC,
CSC, CCS }. En este caso 0 = X(SSS), 1 = X(SSC) = X(SCS) = X(CSS) 2 = X(SCC) = X(CSC) = X(CCS) Probabilidad en eventos equivalentes
Sea X una variable aleatoria y B un evento de RX. Sea A un evento de Ω equivalente con B. Si P(A) es la probabilidad de la ocurrencia de A y P(B) es la probabilidad de la ocurrencia de B, entonces P(A) = P(B) siempre que A y B sean eventos equivalentes, es decir siempre que A = {s ε Ω / X(s) ε B}.
Ejemplo 07 Tomando en cuenta el ejemplo anterior, sea B = {X / X = 0 }. El evento equivalente a B deberá ser A = {SSS} . En consecuencia, P(B) = p(0) = P(X = 0) = P(X(SSS)) = P(A) = 1/8 Nota:
Evaluar probabilidades en el espacio rango de X es evaluar probabilidades en A. Ejemplo 08 Si se lanza al aire una moneda tres veces, ¿cuál es la probabilidad de obtener a lo más, dos caras? El espacio muestral para este ensayo ya lo hemos visto. Según la pregunta, X se debe definir “como el número de caras obtenidas”, entonces definimos a B como “Obtener a lo más dos caras”. Según esto, B = {0, 1, 2 } = {x / x ≤ 2 }. Y el evento equivalente a B será
A = {SSS, SSC, SCS, CSS, SCC, CSC, CCS } Como se sabe, P(A) = 7/8. Si B y A son eventos equivalentes, entonces P(B) = 7/8. Tipos de variable aleatoria
Una variable aleatoria es discreta si su espacio rango es finito (toma valores enteros) o numerablemente infinito (se puede identificar a cada uno de ellos y se puede ordenar) mientras que una variable aleatoria es continua si su espacio rango es infinito. Nota: Si bien en el caso de una variable discreta el espacio rango se puede expresar por comprensión o extensión, en el caso de una variable continua sólo se puede expresar por po r comprensión mediante el uso de cualquiera de las forma de intervalo. i ntervalo. Ejemplo 09: De identificación Diga si las siguientes variables aleatorias que se mencionan son discretas o continuas: a) El número de caras que se obtiene al lanzar al aire una moneda 1000 veces b) El tiempo que un cliente tarda en la cola de una caja hasta ser atendido c) El tiempo que el cajero tarda en atender el cliente d) El tiempo en minutos que un conductor espera para pagar el peaje en una garita
Si B es un evento de RX; es decir, B está contenido en RX y A se define como A = { s ε Ω / X(s) ε B } entonces diremos que A y B son dos eventos equivalentes. En otras palabras, un evento B, del espacio rango es equivalente a otro evento A, del espacio muestral, si cada elemento del evento A del espacio muestral tiene como imagen otro evento B del espacio rango, según la definición de X. Ejemplo 05 En el primer ejemplo visto en esta sección, vimos que si se define a la variable aleatoria X como el número de caras obtenidas, el evento B: “Obtener 0 caras” será equivalente con el evento A: “Obtener 0 caras”. En
efecto, A = { SSS } y según la definición, B = {x / x = X(SSS) = 0 }. Si ocurre A entonces, y sólo entonces, ocurre B. Ejemplo 06 Tomando el mismo ejemplo supongamos ahora que se define el evento B como “Salen por lo menos dos caras”. En este caso B = {x ε RX/ x = 0, 1, 2 }; B = { 0, 1, 2 }. En el espacio muestral Ω debe ocurrir el evento A: “Obtener a lo más dos caras”, lo que por extensión se define como A = {SSS, SSC, S CS, CSS, SCC,
CSC, CCS }. En este caso 0 = X(SSS), 1 = X(SSC) = X(SCS) = X(CSS) 2 = X(SCC) = X(CSC) = X(CCS) Probabilidad en eventos equivalentes
Sea X una variable aleatoria y B un evento de RX. Sea A un evento de Ω equivalente con B. Si P(A) es la probabilidad de la ocurrencia de A y P(B) es la probabilidad de la ocurrencia de B, entonces P(A) = P(B) siempre que A y B sean eventos equivalentes, es decir siempre que A = {s ε Ω / X(s) ε B}.
Ejemplo 07 Tomando en cuenta el ejemplo anterior, sea B = {X / X = 0 }. El evento equivalente a B deberá ser A = {SSS} . En consecuencia, P(B) = p(0) = P(X = 0) = P(X(SSS)) = P(A) = 1/8 Nota:
Evaluar probabilidades en el espacio rango de X es evaluar probabilidades en A. Ejemplo 08 Si se lanza al aire una moneda tres veces, ¿cuál es la probabilidad de obtener a lo más, dos caras? El espacio muestral para este ensayo ya lo hemos visto. Según la pregunta, X se debe definir “como el número de caras obtenidas”, entonces definimos a B como “Obtener a lo más dos caras”. Según esto, B = {0, 1, 2 } = {x / x ≤ 2 }. Y el evento equivalente a B será
A = {SSS, SSC, SCS, CSS, SCC, CSC, CCS } Como se sabe, P(A) = 7/8. Si B y A son eventos equivalentes, entonces P(B) = 7/8. Tipos de variable aleatoria
Una variable aleatoria es discreta si su espacio rango es finito (toma valores enteros) o numerablemente infinito (se puede identificar a cada uno de ellos y se puede ordenar) mientras que una variable aleatoria es continua si su espacio rango es infinito. Nota: Si bien en el caso de una variable discreta el espacio rango se puede expresar por comprensión o extensión, en el caso de una variable continua sólo se puede expresar por po r comprensión mediante el uso de cualquiera de las forma de intervalo. i ntervalo. Ejemplo 09: De identificación Diga si las siguientes variables aleatorias que se mencionan son discretas o continuas: a) El número de caras que se obtiene al lanzar al aire una moneda 1000 veces b) El tiempo que un cliente tarda en la cola de una caja hasta ser atendido c) El tiempo que el cajero tarda en atender el cliente d) El tiempo en minutos que un conductor espera para pagar el peaje en una garita
e) El número de alumnos que repiten el curso de Estadística en cierto semestre f) El número de veces que un alumno se matricula en una determinada asignatura g) El valor estimado en dólares de una casa de dos plantas h) El número de cuentas por pagar que una oficina bancaria tiene en cierto momento i) El número de kilómetros kil ómetros que recorre un taxista diariamente j) El número de demandas por día que recibe una compañía de seguros seguros k) El número de accidentes acc identes que se registra anualmente en la Vía Expresa l) El tiempo entre un accidente y otro durante un año, en la Vía Expresa Solución Son variables aleatorias discretas: a) e) f) j) k) Son Variables Aleatorias Continuas: b) c) d) g) h) i) l) 4.2. VARIABLES ALEATORIAS DISCRETAS
Sea X una variable aleatoria. Diremos que X es una variable aleatoria discreta si su espacio es un conjunto finito o numerablemente infinito. Nota:
Decir que es finito significa que los valores que tome pueden ser cualquier número real; por lo general, toma valores enteros. Y decir que es numerablemente infinito, significa que siendo infinito, es posible enumerar cada uno de sus elementos; es decir, se puede saber quién es el anterior o el siguiente. Ejemplo 10 Si se define a X como el número de accidentes ocurridos en la panamericana sur durante el año 2012, entonces X puede ser 0, 1, 2, 3, ... Ejemplo 11 Se elige a 20 alumnos de una sección de Estadística Aplicada de la U. de Lima y se les pregunta por sus edades en días. En este caso definiremos a X como el número de días de un alumno. Según esto, X puede tomar valores entre 5840 días y 9125 días, considerando que se puede tener alumnos entre los 16 a 25 años. Seguramente si X se define como la talla de estos alumnos, estaremos convencidos que X no constituye una variable aleatoria discreta. Función de probabilidad
Sea X una variable aleatoria discreta, con RX su espacio rango. Los posibles valores que toma X serán x 1, x2, ... xn, xn+1,... Si a cada resultado posible x i le asociamos un número real p(xi) tal que p(xi) = P(X = xi), diremos que p(x )i i es la función de probabilidad de X , siempre que cumpla las siguientes condiciones:
Podemos mostrar la función de probabilidad de X en una tabla como se indica en la siguiente figura:
Gráfica de la función de probabilidad
Sea X una variable aleatoria discreta, con (x i, p(xi)) su distribución de probabilidad. La gráfica de la función de probabilidad se muestra en la siguiente figura.
Ejemplo 12 Se lanza al aire una moneda tres veces. Supongamos que se define a X como el número de caras obtenidas. Encuentre la función de probabilidad de X. Solución Por lo ya que sabemos de este ejemplo, X = 0, 1, 2, 3. Encontremos p(x i). Si x = 0 entonces p(0) = P(X = 0) = P({SSS}) = 1/8 Si x = 1 entonces p(1) = P(X = 1) = P({SSC, SCS, CSS}) = 3/8 Si x = 2 entonces p(2) = P(X = 2) = P({SCC, CSC, CCS}) = 3/8 Si x = 3 entonces p(3) = P(X = 3) = P({CCC}) = 1/8 En consecuencia, la distribución de probabilidad se muestra en la siguiente tabla.
Ejemplo 15 Una dulcería tiene en su vitrina cinco huahuas de chocolate y cinco de guanábana, al mismo precio. Toda vez que el cliente no especifica su pedido y solicita dos, el encargado selecciona aleatoriamente dos de ellas. Si un cliente compra dos y no especifica el tipo de huahua, cuál es la función de probabilidad del número de huahuas de chocolate entregadas? Solución
Sea X la variable aleatoria definida como “El número de huahuas de chocolate seleccionadas y entregadas al cliente”. Como se extrae sólo dos huahuas, los valores posibles de X son 0, 1 y 2. Debemos observar también que el modelo de ensayo que representa seleccionar las dos huahuas implica que el ensayo es sin reposición, como es lógico. Usando la definición de probabilidad clásica para encontrar la función de distribución de probabilidad de X; es decir,
Elegir 0 huahuas de chocolate ( X = 0 ) significa que las dos elegidas son de guanábana. Es decir, debemos encontrar el número de maneras de elegir 0 huahuas de chocolate y 2 de guanábana. De cuántas maneras elegir 0 huahuas de chocolate de un total de 5 y de cuántas maneras elegir 2 huahuas de guanábana de un total de 5 significa C(5,0)xC(5,2), lo que constituye el número de casos favorables. En cuanto a los casos posibles es C(10, 2). Luego
Usando el igual razonamiento, encontramos las probabilidades para los otros valores de X. Luego la distribución de probabilidades de X viene dada por
Observación:
Si se selecciona “x” tortas de chocolate, cuál será el valor de p(x)?. Siguiendo el mismo razonamiento hecho para X=0, concluiremos que
Este será el modelo de función de probabilidad hipergeométrico cuando el ensayo es sin reposición, en el cual la probabilidad de un resultado individual, favorable cambia cada vez que se hace un nuevo ensayo; a diferencia de los modelos binomiales que son generados por ensayos con reposición, donde la probabilidad de una ocurrencia favorable es constante. Este modelo de distribución lo estudiaremos también más adelante. Ejemplo 16 Supongamos que los productos fabricados por tres máquinas A, B y C, se juntan al final del día. Supongamos que 8 productos provienen de la máquina A, 4 de la máquina B y 2 provienen de la máquina C. Un empleado que se encarga de transportar del almacén a los camiones recibe por cada producto proveniente de la máquina A, dos soles; por cada producto proveniente de B, recibe un sol; y por cada producto de C, recibe 0 soles. Si el empleado debe transportar dos productos, encuentre la función de probabilidad de la ganancia obtenida por el empleado. Solución
Sea X la variable aleatoria definida como la “cantidad de soles recibido por el empleado al tra nsportar dos productos cualquiera”.
Si los dos productos que transporta son de C, X = 0 Si los dos productos que transporta son de A, X = 4 Si los dos productos que transporta son de B, X = 2 Si transporta uno de A y uno de B, X = 3 Si transporta uno de A y uno de C, X = 2 Si transporta uno de B y uno de C, X = 1 Luego los posibles valores de X son X: 0, 1, 2, 3, 4 Como en el ejemplo anterior, usaremos la probabilidad clásica y tomaremos en cuenta que el transporte de los productos constituye un ensayo sin reposición.
Luego, la función de distribución de X será
Ejemplo 17 Una agencia bancaria tiene tres cajeros automáticos. La probabilidad de que uno cualquiera de ellos falle después de un tiempo determinado de uso, es 0.1. Los cajeros operan independientemente uno de otro. En una hora determinada, cuál será la distribución de probabilidad del número de cajeros que fallen? Solución De acuerdo al problema, el funcionamiento de cada cajero es independiente uno de otro. La probabilidad de que uno de ellos falle es igual a 0.1. Sea X la variable aleatoria definida como “el número de cajeros que fallan en una hora determinada”. Según esto, pueden fallar 0, 1, 2 o los 3 cajeros; por lo que los valores posibles de X son 0, 1, 2, 3.
Sea F el evento “Un cajero falla” tal que P(F) = 0.1 y P(F’) = 0.9. Con lo cual
p(0) = P(X=0) = P(F’F’F’) = 0.93 =0.729. Esto porque los eventos son independientes. p(1) = P(X=1) = P(FF’F’ ó F’FF’ ó F’F’F)=C(3,1)P(FF’F’)=3(0.1)(0.9) 2 = 0.243 p(2) = P(X=2) = C(3,2)P(FFF’) = 3(0. 1) 2 (0.9) = 0.027 p(3) = P(X=3) = C(3,3)P(FFF) = (0.1) 3 = 0.001 Luego la distribución de probabilidad del número de cajeros que fallen será
Ejemplo 18 Supongamos que la máquina 1 produce diariamente dos veces más items que la máquina 2. Sin embargo, el 4% de los items producidos por la máquina 1 tienden a ser defectuosos, mientras que sólo el 2% de los items producidos por la máquina 2 son defectuosos. Supongamos que la producción diaria de las dos máquinas se combina al final del día. Si se toma una muestra aleatoria de 10 items de este lote, cuál es la probabilidad de que la muestra contenga dos defectuosos?. Solución De acuerdo a los datos, de tres items que se produzca, dos provienen de la máquina 1; esto significa que si se extrae un item del lote, la probabilidad de que provenga de la máquina 1 es 2/3 y que provenga de la máquina 2 es 1/3. El diagrama siguiente refleja el resto de los datos.
P(M1) = 2/3; P(M2) = 1/3; P(D/M1) = 0.04 P(D/M2) = 0.02 Si D es el evento: el item elegido es defectuoso, entonces P(D) = (2/3)(0.04) + (1/3)(0.02) = 1/30 Sea X la variable definida como el número de items defectuosos hallados en la muestra de 10. Sea p = P(D) = 1/30 la probabilidad de éxito; es decir, de que un item de la muestra sea defectuoso. Sea A el evento definido como “La muestra contenga dos defectuosos” Según los datos, P(A) = p(2) = P(X = 2). Como la probabilidad de que un producto sea defectuoso es p = P(D) = 1/30, entonces, ocurre éxito cuando se extrae un artículo defectuoso, en este con p = 1/30. Ahora bien, el número de maneras de seleccionar x = 2 defectuosos en una muestra de tamaño 10 es C(10, 2). La probabilidad de que en un grupo cualquiera de estas C(10, 2) maneras haya 2 defectuosos es (1/30) 2 “y” los otros 10 -2 sean no defectuosos es (29/30)8. Por ello, la función de probabilidad para x defectuosos será
Ejemplo 19 Se tiene una urna con tres fichas negras y dos rojas. Si se extrae sucesivamente y sin reposición de una en una hasta obtener una negra y se define a X como el número de extracciones que se debe realizar hasta que salga una ficha negra, determine la función de probabilidad de X. Solución
, está formado por Ω = {N, RN, RRN }. Ante todo, el espacio muestral Sea X: El número de extracciones que debe realizarse hasta obtener una ficha negra Como en la urna hay dos rojas, los tres rectángulos muestran las tres situaciones que pueden presentarse, no importa el orden. En el primer caso X toma el valor 1, ya que se ha realizado una extracción. En el segundo se han realizado dos y en el tercero X tomará el valor 3. Luego los posibles valores de X son 1, 2 y 3. Si X = 1 entonces p(1) = 3/6 = 0.6 Si X = 2 entonces p(2) = (2/5(3/4) = 0.3 Si X = 3 entonces p(3) = (2/5)(3/4)(3/3) = 0.1 Luego la función de probabilidad de X viene dada por
Ejemplo 20 Se lanza un dado hasta que salga un 3 ó 5. Si se define a X como el número de veces que debe lanzarse el dado hasta obtener éxito, encuentre la función de probabilidad de X. Solución Este ejemplo es una generalización del tipo de ensayo del ejemplo anterior. Cada vez que se lanza el dado, puede ocurrir dos únicos posibles resultados: éxito (sale un 3 ó un 5) o fracaso (sale otras caras). En el momento en que ocurre éxito por primera vez, termina el ensayo. Si p = P(E) es la probabilidad de que ocurra éxito, entonces p = 1/3 y si q = P(F) es la probabilidad de fracaso, q = 1 – p = 2/3. El siguiente esquema orientará nuestro análisis.
Algunos de los elementos del espacio muestral son los siguientes:
Ω = { E, FE, FFE, FFFE, FFFFE, ...} de igual manera, los posibles valores que pueda tomar X son: 1, 2, 3, ... X = 1 significa que se obtuvo éxito en el primer ensayo. Como p(1) = P(X = 1) = P(E) tenemos p(1) = P(X=1) = 1/3. X = 2 significa que se obtuvo éxito en el segundo ensayo, lo que significa que el primero tuvo que ser fracaso. Luego p(2) = P(X = 2) = P(FE) = (2/3)(1/3). Ocurre lo mismo con X = 3. Es decir p(3) = P(X = 3) = P(FFE) = (2/3)(2/3)(1/3). Del mismo modo, X = 4 significa que p(4) = (2/3)3(1/3).
Supongamos que “X = x “ es el evento “el primer éxito” ocurre en el “x -ésimo” ensayo. Diremos entonces que en los “x -1” ésimos ensayos hubo fracaso y éxito en el último. Por ello, la función de probabilidad de X será
Ejemplo 21 Un grupo de investigadores de mercado está formado por tres hombres y tres mujeres. Si el responsable del grupo desea elegir aleatoriamente a dos de ellos para una labor especial y definimos a X como el número de mujeres seleccionadas, obtenga la función de probabilidad de X. Solución Como en el grupo hay tres mujeres y tres hombres y se extrae a dos de ellos, X tomará valores 0, 1, 2. Hallemos la probabilidad para cada valor de X X = 0 significa que debe elegirse a dos hombres. El problema consiste ahora en elegir a dos hombres de un grupo de 3. Esto constituye una combinación de 3 elementos tomados de 2 en dos. Podríamos decir lo mismo de las mujeres: El número de maneras de elegir cero mujeres de un total de 3, representa combinaciones de 3 tomados de 0 en 0. Y como deben ocurrir los eventos “cero mujeres” y “dos hombres” entonces, la probabilidad de que ocurran será el producto de ambos, por el principio de multiplicación. El espacio muestral estará constituido por el número de combinaciones de 6 elementos tomados de 2 en dos. Por ello la probabilidad de elegir “cero” mujere s es
Analicemos el caso X = 1. Se trata de elegir una mujer dentro de un total de 3, y un hombre dentro de un total de 3 hombres. La probabilidad de que esto ocurra es
Dejamos para el lector el caso X = 2. La función de probabilidad viene dada por:
Ejemplo 19: Se tiene una urna con tres fichas negras y dos rojas. Si se extrae sucesivamente y sin reposición de una en una hasta obtener una negra y se define a X como el número de extracciones que se debe realizar hasta que salga una ficha negra, determine la función de probabilidad de X. Solución
, está f ormado por Ω = {N, RN, RRN }. Ante todo, el espacio muestral Sea X: El número de extracciones que debe realizarse hasta obtener una ficha negra Como en la urna hay dos rojas, los tres rectángulos muestran las tres situaciones que pueden presentarse, no importa el orden. En el primer caso X toma el valor 1, ya que se ha realizado una extracción. En el segundo se han realizado dos y en el tercero X tomará el valor 3. Luego los posibles valores de X son 1, 2 y 3. Si X = 1 entonces p(1) = 3/6 = 0.6 Si X = 2 entonces p(2) = (2/5(3/4) = 0.3 Si X = 3 entonces p(3) = (2/5)(3/4)(3/3) = 0.1 Luego la función de probabilidad de X viene dada por
Ejemplo 20 Se lanza un dado hasta que salga un 3 ó 5. Si se define a X como el número de veces que debe lanzarse el dado hasta obtener éxito, encuentre la función de probabilidad de X. Solución Este ejemplo es una generalización del tipo de ensayo del ejemplo anterior. Cada vez que se lanza el dado, puede ocurrir dos únicos posibles resultados: éxito (sale un 3 ó un 5) o fracaso (sale otras caras). En el momento en que ocurre éxito por primera vez, termina el ensayo. Si p = P(E) es la probabilidad de que ocurra éxito, entonces p = 1/3 y si q = P(F) es la probabilidad de fracaso, q = 1 – p = 2/3. El siguiente esquema orientará nuestro análisis.
Algunos de los elementos del espacio muestral son los siguientes:
Ω = { E, FE, FFE, FFFE, FFFFE, ...} de igual manera, los posibles valores que pueda tomar X son: 1, 2, 3, ... X = 1 significa que se obtuvo éxito en el primer ensayo. Como p(1) = P(X = 1) = P(E) tenemos p(1) = P(X=1) = 1/3. X = 2 significa que se obtuvo éxito en el segundo ensayo, lo que significa que el primero tuvo que ser fracaso. Luego p(2) = P(X = 2) = P(FE) = (2/3)(1/3). Ocurre lo mismo con X = 3. Es decir p(3) = P(X = 3) = P(FFE) = (2/3)(2/3)(1/3). Del mismo modo, X = 4 significa que p(4) = (2/3)3(1/3).
Supongamos que “X = x “ es el evento “el primer éxito” ocurre en el “x -ésimo” ensayo. Diremos entonces que en los “x -1” ésimos ensayos hubo fracaso y éxito en el último . Por ello, la función de probabilidad de X será
Ejemplo 21 Un grupo de investigadores de mercado está formado por tres hombres y tres mujeres. Si el responsable del grupo desea elegir aleatoriamente a dos de ellos para una labor especial y definimos a X como el número de mujeres seleccionadas, obtenga la función de probabilidad de X. Solución Como en el grupo hay tres mujeres y tres hombres y se extrae a dos de ellos, X tomará valores 0, 1, 2. Hallemos la probabilidad para cada valor de X X = 0 significa que debe elegirse a dos hombres. El problema consiste ahora en elegir a dos hombres de un grupo de 3. Esto constituye una combinación de 3 elementos tomados de 2 en dos. Podríamos decir lo mismo de las mujeres: El número de maneras de elegir cero mujeres de un total de 3, representa combinaciones de 3 tomados de 0 en 0. Y como deben ocurrir los eventos “cero mujeres” y “dos hombres” entonces, la probabilidad de que ocurran será el producto de ambos, por el principio de multiplicación. El espacio muestral estará constituido por el número de combinaciones de 6 elementos tomados de 2 en dos. Por ello la probabilidad de elegir “cero” mujeres es
Analicemos el caso X = 1. Se trata de elegir una mujer dentro de un total de 3, y un hombre dentro de un total de 3 hombres. La probabilidad de que esto ocurra es
Dejamos para el lector el caso X = 2. La función de probabilidad viene dada por:
Ejemplo 22 La probabilidad de que un agente vendedor realice una entrevista efectiva (realice una venta) es igual a 30%. Cierto día entrevista a 3 clientes potenciales. Si se define a X como el número de clientes que firman un contrato de venta, encuentre la distribución de probabilidad de X. Solución
Sea X la variable aleatoria que representa “el número de clientes que firman un contrato de venta”. Según esto, los posibles valores de X son 0, 1, 2 y 3. Como la probabilidad de que la entrevista sea efectiva(firmen un contrato de venta) es igual a 0.30, definamos Sea F el evento: “Firma un contrato de venta”, y N el evento “No firma el contrato”. X = 0 significa que ninguno de los tres clientes firma, es decir ocurre el evento compuesto NNN. Luego p(0) = P(X = 0) = P(NNN) = 0.73 . Esto se puede expresar en función de los que firman el contrato: P(X = 0) = P(NNN) = (0.3)0 (0.7)3 . “X = 1” puede ser expresado como FNN ó NFN ó NNF. Como P(FNN) = PNFN) = P(NNF). El número de ocurrencias de una F dentro de un grupo de tres se representa mediante las combinaciones de 3 elementos tomados de uno en uno; es decir, C(3,1) = 3. Luego p(1) = P(X = 1) = C(3,1)(0.3)1(0.7)2
Del mismo modo, “X=2” tiene por probabilidad p(2) = P(X=2) = C(3,2)(0.3) 2(0.7)1 Por ello, la función de distribución de X viene dada por
Ejemplo 23
La empresa “Refrigerando” tiene dos talleres para la fabricación de refrigera doras. Al final de un día de producción se tiene 4 unidades del taller A y 4 del taller B. Puesto que uno de los talleres ha estado funcionando mal, se sospecha que la mitad de la producción de ese día sea defectuosa. Obtenga la distribución de probabilidad del número de refrigeradoras defectuosas provenientes del taller A, si se selecciona 4 del grupo y se somete a prueba. Construya su gráfica. Solución
Sea X la variable aleatoria definida como “El número de refrigeradoras del taller A que son defectuosas”. Al seleccionar una refrigeradora y probarla, esta puede ser defectuosa con probabilidad 0.5 y no defectuosa con probabilidad 0.5. Como se extraen 4 del grupo producido en un día, los valores de X son 0, 1, 2, 3 y 4. Como la forma de selección de las refrigeradoras constituye un ensayo sin reposición, usaremos combinaciones para encontrar el número de casos favorables y posibles para usar la probabilidad clásica y responder a la pregunta.
Dejamos para el lector completar para X = 3 y X = 4, con lo cual la distribución de probabilidad del número de defectuosos provenientes del taller A será
Ejemplo 24
La firma “Pregunta S.A.” realiza su acostumbrado trabajo de campo durante una campaña electoral. Para lograr una entrevista debe realizar varios intentos independientes, por la dificultad de conseguir personas que acepten la entrevista. Si la probabilidad de lograr una entrevista exitosa es
0.70, determine la distribución de probabilidad del número de intentos realizados hasta conseguir una entrevista exitosa. Solución
Sea X la variable aleatoria definida como el “Número de intentos realizados hasta obtener una entrevista exitosa”. Sea p = 0.7 la probabilidad de una entrevista exitosa. Por cada entrevista exitosa se tiene p = 0.7 y por cada entrevista fallida q = 1-p = 0.3. El siguiente esquema podría graficar la secuencia de nuestros intentos, en donde todos son fallidos hasta el último y sólo éste, que es exitoso.
Supongamos que se han realizado “x” intentos hasta que se produjo el primer éxito. Esto significa que los “x -1” – ésimos intentos han sido fracasos y sólo el “x” -ésimo ha sido éxito. Como cada fracaso ocurre con probabilidad q = 0.3, siendo independientes los intentos, los “x -1” intentos ocurren con probabilidad q(x-1) y en conjunto: los fallidos con el exitoso ocurren con probabilidad (q(x-1) )(0.7). Luego la función de probabilidad de X será p(x) = P(X = x) = (0.3)(x-1)(0.7)
para x = 1, 2, 3, ....
Ejemplo 25 Sea X la variable aleatoria definida como el número de cuentas que tiene un cliente en SUPER BANK. Suponga que la función de probabilidad de X está definida por
a) Qué porcentaje de clientes tiene? a.1) exactamente dos cuentas? a.2) a lo más dos cuentas?
b) El Gerente financiero de SUPER BANK afirma que “con las nuevas políticas ad optadas por SUPER BANK se ha logrado que más del 85% de nuestros clientes tengan al menos dos cuentas”. ¿Se puede decir que el Gerente tiene razón? Solución
De los datos del problema podemos inferir que X es una variable aleatoria discreta. Ante todo encontremos el valor de k de forma que p(x) sea la f. de probabilidad de X.
Si ∑p(x) = 1 , entonces k+2k +k(5 -3) = 1. Despejando k obtenemos k = 0.2 a) a.1) Debemos encontrar p(2) = P(X = 2) = 0.2(5-3) = 0.4. Es decir, el 40% de clientes tienen exactamente dos cuentas. a.2) Qué porcentaje de clientes tienen, a lo más dos cuentas, significa obtener la probabilidad de que X = 0, ó X = 1, ó X = 2. Es decir, debemos hallar P(X = 0 ó X = 1 ó X = 2) = p(0) + p(1) + p(2) = 0.0 + 0.2 + 0.40= 0.60. En otras palabras, el 60% de los clientes tiene a lo más dos cuentas. b) Para saber si el Gerente tiene razón o no, debemos encontrar la probabilidad de que X sea mayor o igual a 2.
En efecto P(X ≥ 2) = p(2)+p(3) = 0.2(2) + 0.2(5 -3) = 0.8. Según esto, el 80% de los clientes tiene al menos dos cuentas en el banco, lo que contradice al Gerente, por lo que diremos que él no tiene razón.
4.3 VARIABLES ALEATORIAS CONTINUAS Función de densidad de probabilidad de una variable continua
Sea Ω el espacio muestral asociado al experimento ζ. Sea X una variable aleatoria. Diremos que X es una variable aleatoria continua si existe una función f a la cual llamaremos función de densidad de probabilidad de X, que satisface las siguientes condiciones:
Observaciones
La gráfica de la función de densidad de probabilidad de X se muestra en la siguiente figura.
1. En el caso de las variables aleatorias discretas la gráfica de la función de probabilidad son barras verticales cuyo valor probabilístico viene determinado por la altura de dichas barras. En el caso continuo la gráfica de la función de densidad es una curva y las probabilidades de que X esté en un intervalo (a, b) ó a ≤ x ≤ b, es el área de la región formada por la curva y las rectas x = a y x = b, como se muestra en la figura anterior. 2. En el caso de las variables discretas existe p(x i) ≥ 0, por lo que P(X = x i) ≥ 0. Sin embargo, en el caso continuo se tiene que P(X = x i) = 0. Por ello, podemos concluir, sin mayores detalles matemáticos que
P(a ≤ x ≤ b ) = P(a ≤ x < b ) + P(X = b) = P(a ≤ x < b)+0 Luego,
P(a ≤ x ≤ b ) = P(a ≤ x < b ) = P(a < x ≤ b) = P(a < x < b) Si X es una variable aleatoria continua cuyo espacio rango es el intervalo ( α , β ) y f es su función de densidad de probabilidad, entonces
, por las condiciones para que f sea una función de densidad de probabilidad. 3. Por otro lado, si X es una variable aleatoria cuya función de densidad viene dada por
entonces
Ejemplo 26 Verifique si las siguientes son funciones de densidad de probabilidad de X
Solución a) Para que f sea función de densidad de probabilidad de X, se debe cumplir que
i) f(x) ≥ 0. En efecto, para cualquier valor de x en los intervalos dados, f(x) ≥ 0
b). En este caso, si - œ < x < 0 entonces e -œ < e x < e0 de donde 0 < f(x) < 1. Ahora vamos a verificar si se cumple la segunda condición
Luego f es una función de densidad de X
d) En este caso tenemos Si –1 ≤ x ≤ 1 entonces –1 ≤ -x3 ≤ 1. Sumando uno a la desigualdad, tenemos 0 ≤ 1 - x 3 ≤ 2 de donde 0 ≤ ¾(1- x3 ) ≤ 6/4, que satisface a la primera condición Igualmente
Ejemplo 27 Considere la siguiente función
Hallar un valor de k para que f sea una función de densidad de probabilidad Solución Usando la segunda condición
se debe cumplir que
Desarrollando la expresión del primer miembro, tenemos
Suponga que X es una variable aleatoria cuya función de densidad está representada por la siguiente figura
a) Si P(1/3 ≤ x ≤ a) = 1/2, determinar el valor de a b) Calcule P(1/2 < x < 2)
Solución Las ecuaciones de las rectas que definen a la función de densidad son: L1: y = 1/2; L2: y = -1/4x + 3/4 Por ello, la función de densidad viene dada por
(Nota: Se puede verificar que f es una función de densidad. Dejamos esto para el lector)
a) P( 1/3 ≤ x ≤ a ) = 1/3 significa que
Efectuando y simplificando tenemos: 12 = 8 + 18a - 3a2 - 15. Las soluciones son: -0.91578 y -6.91578.
Ejemplo 29 Una estación gasolinera recibe provisión semanalmente. Las estadísticas anteriores sugieren que la función de densidad de probabilidad de las ventas semanales X, medidas en miles de galones, se aproxima a la función cuya gráfica se muestra en la siguiente figura
a) Obtenga la función de densidad de X b) Evalúe P(3/2 < X < 5/2 ) Solución a) Sea f la función de densidad de X. Según la gráfica, f se define de la siguiente manera:
Por otro lado, es fácil verificar que f(x) ≥ 0 para todo valor de x
b) Encontrar P(3/2 < X < 5/2 ) significa trabajar con las dos definiciones de f ya que el intervalo cae dentro de los dos.
Ejemplo 30 Sea X una variable aleatoria cuya función de densidad viene dada por
a) Hallar el valor de k tal que X sea igualmente probable de ser mayor que k o menor que k. b) Encuentre el valor de r tal que la probabilidad de que X sea menor que r sea igual a 0.05. Solución a) De acuerdo a los datos se debe cumplir que P(X > k ) = P(X < k).
Igualando ambos términos, obtenemos 2e10-k = 0.5; de donde k = 10.69 b) P(X < r ) = 0.05 implica que
Tomando logaritmo neperiano tenemos 10 – r = Ln(0.5) . Luego r = 10.69 Ejemplo 31 Supongamos que la variable aleatoria X representa la resistencia al corte de ensayos de punto de soldadura, cuya función de densidad de probabilidad viene dada por
Determinar el valor de a y b tal que P(X < a ) = 0.50 y P(X < b ) = 0.90. Solución Para hallar el valor de a será suficiente suponer que pertenece al intervalo (0, 500). Según esto, P(X < a ) = 0.5 implica que
Ejemplo 32 Una misilera antiaérea lleva tres misiles que deben ser disparados contra una línea férrea que se extiende paralela a la costa. Si un misil cae a menos de 40 metros de la vía, ésta quedará suficientemente destruida impidiendo el flujo normal de los trenes. La densidad de impacto de un proyectil viene dada por la función
Solución
El esquema anterior muestra la situación que debe ocurrir para que la vía quede lo suficientemente dañada para quedar inutilizada. Los misiles deben caer dentro de los intervalos (-40, 0) y (0, 40).
Esto implica que, si X se define como “La distancia entre el punto donde cae el misil y la vía”, la distancia es | X-40 | > 0. La probabilidad de que esto ocurra es P( | X-40 | > 0) = 1 – P(| X-40 | ≤ 0) = 1 - P( -40 ≤ X ≤ 40 ). Evaluemos P( -40 ≤ X ≤ 40 ): P( -40 ≤ X ≤ 40 ) = P( -40 ≤, X ≤ 0 ) + P( 0 ≤ X ≤ 40 ) =
Ejemplo 33 El tiempo (en días) que una empresa constructora tarda en colocar los cimientos de un moderno edificio de 500 metros cuadrados, se define como una variable aleatoria continua cuya función de densidad de probabilidad viene dada por
i) Hallar el valor de k para que f sea reconocida como una función de densidad de X ii) Cuál es la probabilidad de que el tiempo máximo requerido sea de 60 días. iii) Cuál es la probabilidad de que se tarde por lo menos 70 días? iv) Según el proyecto la empresa constructora está obligada a completar el 80% de los cimientos en 90 días. Cumple la empresa con el proyecto? Solución Usando la segunda condición para que f sea f.d.p. de X, tenemos
Esto significa que el 90% de los cimientos serán completados hasta los 90 días. Luego la empresa sí está cumpliendo con el proyecto. Ejemplo 34 Una gasolinera tiene dos bombas que pueden bombear cada una hasta 10 mil galones de gasolina por mes. La cantidad total de gasolina bombeada en un mes es una variable aleatoria X (expresada en unidades de diez mil galones), con una función de densidad de probabilidad dada por
a) Calcule la probabilidad de que la gasolinera bombee entre 8000 y 12000 galones en un mes b) Si se sabe que la gasolinera ha bombeado más de 10000 galones en mes en particular, cuál es la probabilidad de que haya bombeado más de 15000 galones durante un mes? Solución Sea X: Cantidad de gasolina bombeada en un mes(en unidades de diez mil)
a) P(0.8 ≤ X ≤ 1.2) =
b) Esta es una probabilidad condicional donde el evento “X>1.0000” ya ha ocurrido y se debe encontrar la probabilidad del evento “X > 1.5000”. Es decir, debemos encontrar P(X>1.5 / X > 1 ) =
Ejemplo 35 La tasa principal de interés en el sistema financiero, predicho para el mes de Enero de 2010, fue considerada una variable aleatoria por la coyuntura del momento. Según los analistas, su función de densidad de probabilidad está dada por
Si se selecciona aleatoriamente a un analista a) Cuál es la probabilidad de que la predicción respecto a la tasa de interés sea mayor que 9%? b) Cuál es la probabilidad de que la predicción sea menor que 16%? Solución
Sea X la variable aleatoria definida como “Valor de la tasa de interés predicha por un analista” Según esto
Ejemplo 36 a) En un día dado, cuál es la probabilidad de que las ventas excedan 900 dólares? b) El restaurante requiere ventas diarias de por lo menos 800 dólares para cubrir sus gastos, cuál es la probabilidad de que en un día dado el establecimiento no cubra los gastos? Solución
a) De acuerdo a la definición de la variable aleatoria X debemos hallar P(X > 900). En efecto
b) Para ver si cubre o no sus gastos debemos encontrar P(X > 800). Si el valor de esta probabilidad es bastante alta(digamos 0.8 o más) diremos que es muy probable que cubra sus gastos, de otra manera no lo hará.
Podemos afirmar con cierto grado de confianza que probablemente cubra sus gastos. Ejemplo 37 Debido a la eficiente labor de publicidad desarrollada por una aerolínea de bandera nacional, la demanda de clientes se ha incrementado considerablemente a tal punto que la gerencia de operaciones se encuentra preocupada por el tiempo de vuelo entre Lima y el Cuzco. Si el tiempo de vuelo entre esas dos ciudades se define según la siguiente función de densidad de probabilidad
a) Qué porcentaje de vuelos tardará entre 84 y 96 minutos? b) Si sólo el 5% de vuelos llega retrasado, cuál es el tiempo máximo para que un vuelo no llegue retrasado? Solución Sea X la va riable aleatoria definida como “El tiempo que tarda el vuelo entre Lima y el Cuzco”. a) Según los datos,
b) Decir que un vuelo llega retrasado significa que el tiempo que tarda el vuelo debe ser mayor que un tiempo “límite”, digamos t0. Según el problema tenemos P(X> t0 )=0.05 Como lo que
queremos saber es cuál es ese límite y no sobrepasarlo, debemos hallar t0 tal que P(X &e; t 0) = 0.05.
En efecto, P(X ≤ t0 )=0.05 implica que P(X ≤ t0 )
de donde t0 = 180 + 0.05(20) = 181 Luego el tiempo máximo que debe tardar el vuelo para no llegar retrasado es 181 minutos. Ejemplo 38 La duración (en horas ) de cierto producto perecible es una variable aleatoria continua X, cuya función de densidad de probabilidad viene dada por
a) Si un producto determinado todavía es aceptable después de 200 horas, cuál es la probabilidad de que dicho producto dure a lo más, 300 horas? b) Se adquieren tres de tales productos. Cuál es la probabilidad de que ninguno tenga que ser reemplazado en las primeras 200 horas de uso? Cuál es la probabilidad de que los tres productos tengan que ser reemplazados durante las primeras 200 horas?. Cuál es la probabilidad de que, exactamente uno tenga que ser sustituida en las primeras 200 horas de uso?. Solución a) Sea X la variable aleatoria definida como la duración (en horas) de cierto producto. Debemos encontrar la probabilidad condicional de que el producto dure a lo más 300 horas, sabiendo que estuvo funcionando (mayor de) después de 200 horas. En efecto
b) i) Definamos el evento M: “Ningún p roducto tenga que ser reemplazado en las primeras 200 horas de uso”. Según esto, debemos encontrar primero la probabilidad de que uno de ellos no tenga que ser reemplazado antes de las 200 horas. Esto es debemos hallar P( X > 200 ).
Ahora, encontrar P(M) significa evaluar P(M) = P(X>200)3. Luego P(M) = 27/64
ii)Sea N el evento “Los tres transistores deben ser reemplazados en las primeras 200 horas”. Esto es P(N) = P(X ≤ 200)3 = (1 – P(X > 200) )3 = (1 – 3/4 )3 = 1/64 Definamos ahora el evento R : “Exactamente uno de los tres productos deben ser reemplazados en las primeras 200 horas de uso”. Según esto, sólo uno de los tres productos debe ser reemplazado. Esto implica el uso de combinaciones para hallar el número de maneras de elegir uno de un total de tres. Esto multiplicar por la probabilidad de que uno de ellos se reemplaza antes de las 200 horas y los otros dos, después de las 200 horas. Luego P(R) = C(3, 1)P(X ≤ 200) P(X > 200) 2 = 3(1/4)(3/4)2 = 27/64.
4.4 FUNCIÓN DE DISTRIBUCIÓN ACUMULADA Caso discreto
Si X es una variable aleatoria discreta, para un valor xi de X, F(xi) se define como
Propiedad 1:
0 ≤ F(x) ≤ 1, ∀ x εR, ya que F(x) es una funció n de probabilidad para todo valor de X = x del espacio rango de la variable. Y según sabemos, las funciones de probabilidades están limitadas entre 0 y 1.
Propiedad 2:
F(x) es una función no decreciente. Esto significa que si x 1 < x2 , entonces F(x1 ) ≤ F( x2). Propiedad 3:
F(œ ) = P(X < œ ) = 1. Y esto es cierto ya que el evento “X < œ “ incluye todos los valores posibles de X en su espacio rango. F(- œ ) = P(X < - œ ) = 0. Contrario al caso anterior, el evento “X < . Lo que implica que F( -œ) = P(X-œ “ es un evento imposible por cuanto suponemos (y estamos convencidos) que no valores de X anteriores a - < -œ ) = P(œ ) = 0. Propiedad 4
Sean xk , xk+1 ε RX . Sea x ε RX / xk ≤ x < xk+1 entonces F(x) = F(xk ). Esto implica que F(x) es constante (gráficamente es un segmento horizontal) en todo el mencionado intervalo [x k , xk+1 ). Propiedad 5
Si X es una variable aleatoria discreta, entonces
a) P( a ≤ x ≤ b ) = P( X ≤ b ) – P(X ≤ a) + P(X = a) = F(b) – F(a) + p(a) Esto se puede verificar simplemente observando el siguiente esquema
Al restar P(X ≤ a) de P(X ≤ b), estamos restando P(X = a); como se pide la probabilidad en el intervalo donde se incluye a, entonces se debe sumar p(a). Similar explicación puede darse a los siguientes casos b) P( a < X ≤ b ) = P(X ≤ b ) – P( X ≤ a) = F(b) – F(a) c) P( a ≤ X < b ) = P(X ≤ b) – P(X ≤ a ) + P(X = a) – P(X = b) = F(b) - F(a) + p(a) - p(b) d) P( a < X < b) = P(X ≤ b ) – P(X ≤ a) – P(X = b) = F(b) – F(a) – p(b) Ejemplo 39 Sea X una variable aleatoria discreta. cuya función de probabilidad viene definida en la siguiente tabla:
Luego la función distribución acumulada, presentada de manera formal, es
Ejemplo 40 Se lanza al aire una moneda tres veces. Supongamos que se define la variable aleatoria X como X = nc – ns, donde ns representa el número de caras y ns representa el número de sellos obtenidos.
a) Encuentre el espacio muestral Ω b) Obtenga el espacio rango de X, RX. c) Obtenga la distribución de probabilidad de X d) Obtenga la distribución acumulada de X e) Construya la gráfica de p(x) y F(x). Solución
a) Los elementos de Ω son Ω = { SSS, SSC, SCS, CSS, SCC, CSC, CCS, CCC }
b) Puesto que al lanzar la moneda tres veces el número de caras,nc y ns el número de sellos puede variar de 0 a 3, entonces nc - ns = {-3, -1, 1, 3 }, por lo que X toma los valores -3, -1, 1, 3; con lo cual RX = { -3, -1, 1, 3 } c) Daremos la siguiente explicación para encontrar p(x): X = -3 si se obtiene 0 caras; es decir p(-3) = 1/8 X = -1 si se obtiene una cara y dos sellos, por lo que p(-1) = 3/8 X = 1 si se obtiene dos caras y un sello, por lo que p(1) = 3/8 X = 3 si se obtiene tres caras y cero sellos, por lo que p(3) = 1/8 Luego X -3 -1 1 3 p(x) 1/8 3/8 3/8 1/8 d) Para obtener F(x), consideraremos los siguientes casos:
La gráfica de las dos funciones p(x) y F(x) se muestra en las figuras anteriores Caso continuo: Si X es una variable aleatoria continua, la función de distribución acumulada de X, F(x), se define como
Observaciones
a) Si bien la evaluación y obtención de F en el caso discreto se presta a muchas operaciones engorrosas de cálculo, en el caso continuo el problema se convierte en utilizar adecuadamente los criterios matemáticos de integración(lo que en muchos casos también puede ser engorroso).
b) A diferencia del caso discreto donde P(X < k )=P( X ≤ k ) – P(X = k) = F(k) – p(k) Si la variable aleatoria X es continua P(X < k ) = P( X ≤ k ). Y esto se demuestra matemáticamente ya que siendo
Evaluemos ahora la probabilidad del evento { X < k }.
Teorema
Si X es una variable aleatoria continua en el intervalo (a, b) y F es su función de distribución acumulada entonces P( a ≤ X ≤ b ) = F(b) – F(a) Obtención de la función de distribución de probabilidad a partir de la distribución acumulada de la variable X. Caso discreto:
Sea X una variable aleatoria discreta con valores posibles x 1, x2, …, x n, xn+1, … . Si F es la función de distribución acumulada de X, entonces p(xi) = P( X = x i) = F(xi) – F(xi-1) Esto es cierto ya que p(xi) = P( X = x i) = P(X ≤ xi) – P(X < xi)
= F(xi) – P(X ≤ xi-1 ) = F(xi) - F(xi-1) El siguiente ejemplo nos exime de mayores explicaciones: Sea X una variable aleatoria discreta cuya función de probabilidad está dada por X 0 1 2 3 p(x) 0.40 0.20 0.25 0.15
F(2) = P(X ≤ 2) = p(0) + p(1) + p(2) F(1) = P(X ≤ 1) = p(0) + p(1) Restando miembro a miembro y cambiándolos, tenemos: p(2) = F(2) – F(1) Caso continuo:
Sea X una variable aleatoria continua con f su función de densidad de probabilidad.
a) Obtener la función de distribución acumulada de X b) Usando F, obtener P(X < 1/2 ) c) Si se sabe que X es mayor que 1/2 , cuál es la probabilidad de que sea menor que3/4 ? Use F para evaluar esta probabilidad. Solución
a) Por definición F(x) = P(X ≤ x )
1/2)= P(Xb) Como X es una variable continua F(1/2) = P(X < 1/2)=1/8 c) Se nos pide evaluar la probabilidad condicional del evento {X < ¾} dado el evento {X<1/2). Es decir
Ejemplo 42 Los gastos de viajes semanales (en miles de dólares) que el personal de ventas de la Empresa TORA, justifica cada semana, es una variable aleatoria cuya función de distribución acumulada está dada por
a) Qué porcentaje de vendedores gastan semanalmente menos de 500 dólares? b) El tirano del jefe ha ofrecido unas vacaciones de dos semanas a quien justifique gastos que se encuentren en el 15% inferior. Si Ud. ha gastado 312 dólares, conseguirá unas vacaciones? c) Obtenga la función de densidad de probabilidad de X Solución a) Usemos la función de distribución acumulada F. P(X < 1/2 ) = F(1/2) = 1 – e-0.25 = 0.22121/2 ) = P(X Luego, aproximadamente el 22% de los vendedores gastan menos de $ 500 semanalmente b) Hallaremos la probabilidad de que X sea menor que 0.312. Si este valor es menor a 0.15, entonces diremos que podemos obtener dichas vacaciones.
P(X < 0.312) = P(X ≤ 0.312 ) = F(0.312) = 0.092756. Como el 9.28% han gastado menos de $ 312, entonces sí puedo obtener unas vacaciones por estar por debajo del 15% inferior. c) Para hallar la función de densidad de probabilidad de X debemos derivar a F. En efecto, derivando a F(x), respecto a x, encontramos f(x) = -2x e-x2,
x ≥ 0.
Ejemplo 43 La variable aleatoria continua X tiene por función de densidad de probabilidad a
Si se hacen dos determinaciones independientes de X. a) Encuentre la función de densidad de probabilidad de X Usando la función de distribución acumulada F, resuelva las siguientes preguntas: b) Cuál es la probabilidad de que ambas determinaciones sean mayores que uno?. c) Si se han hecho tres determinaciones independientes, cuál es la probabilidad de que exactamente dos sean mayores que uno? Solución a) De acuerdo al Teorema, para encontrar la función de densidad f debemos derivar respecto a x. Si X < 0 , entonces f(x) = 0
Si 0 ≤ X ≤2 , entonces f(x) = x/2 Si x > 2, entonces f(x) = 0
b) Sea A el evento {x/x >1} definido como la primera determinación
Sea B el evento {x/x >1} definido como la primera determinación 2. Entonces x Sabemos que F(x) = x²/4 , 0 P(A) = P({x/x >1}) = P(X > 1) = 1 - P(X ≤ 1) = 1 - F(1) = 1 - 1/4 = 0.75
Como P(A) = P(B), tenemos P(A ∩ B) = (3/4)(3/4) = 9/16 c) Ahora se sabe que se realizaron tres determinaciones. Queremos que, exactamente dos de ellas sean mayores que uno . Debemos definir otra variable que represente el número de determinaciones que cumplan dicha condición. Sea Y la variable aleatoria definida como el “Número de determinaciones que son mayores que uno”. Según esto, Y es una variable aleatoria discreta que toma valores 0, 1, 2 y 3. Si de un total de tres determinaciones, queremos encontrar la probabilidad de que dos de ellas cumplan con la condición de ser mayores que uno, podemos usar el modelo binomial para resolverlo. Afirmamos que Y es una variable binomial por cuanto se tiene n = 3 elecciones(determinaciones), cada uno de los cuales son independientes uno de otro. La probabilidad de éxito p = P(X>1) = ¾, encontrado en b). Luego la función de probabilidad para Y = 2, usando un razonamiento dado en dos ejemplos anteriores de variable discreta será: P(Y = 2 ) = C(3, 2)(3/4) 2(1/4) = 27/64 Ejemplo 44 Sea X la demanda de un producto en tiempos de recesión. Estudios anteriores han demostrado que el comportamiento de X se puede expresar mediante la siguiente función f(x) = be-bx,
x>0
Sea p j = P(j ≤ X < j + 1). a) Demuestre que, ∀ b, b>0, f es la función de densidad de probabilidad de X b) Demuestre que pj es de la forma (1 – a )aj y determine a. Solución a) f será la función de densidad de probabilidad de X si se cumple que
Ejemplo 45 La variable aleatoria continua X tiene por función de densidad de probabilidad a f(x) = 3x2 -1 ≤ x ≤ 0. Si “b” es un número que satisface – 1 < b < 0, calcule la probabilidad P(X>b / X < b/2) Solución
Ejemplo 46 Supongamos que f y g son dos funciones de densidad de probabilidad en el mismo intervalo, a ≤ x ≤ b.
a) Demuestre que f + g no es una función de densidad de probabilidad en el intervalo a ≤ x ≤ b. b) Demuestre que, ∀ β con 0 <β< 1, βf(x) + (1 - β)g(x) es una función de densidad de probabilidad en ese intervalo. Solución
a) Las dos condiciones que deben cumplirse para que una función tal como f sea una función de densidad de probabilidad de alguna variable tal como X, son
Como se cumple la segunda condición, entonces h(x) = βf(x) + (1 -β)g(x) es una función de densidad de probabilidad sobre el intervalo a ≤ x ≤ b. Ejemplo 47 Supongamos que la gráfica que se muestra en la siguiente figura representa la función de densidad de probabilidad de una variable aleatoria X. Cuál es la relación entre “a” y “b”?
Solución Encontremos la definición de f según la gráfica. La función f está formada por las rectas L 1 y L2
Ejemplo 48 El porcentaje de alcohol (100X) en cierto compuesto puede ser considerada como una variable aleatoria, en donde X, 0 < X < 1, tiene la siguiente función de densidad: f(x) = 20x3(1-x),
0 < x < 1.
a) Encuentre una expresión para la función de distribució acumulada de X grafíquela.
b) Calcular P(X ≤ 2/3) c) Supóngase que el precio de venta del compuesto anterior depende del contenido de alcohol. Específicamente, si el compuesto se vende en C1 dólares/galón, de otro modo, se vende en C2 dólares/galón. Si el costo es C3 dólares/galón, encuentre la distribución de probabilidad de la utilidad neta por galón y obtenga una expresión para la utilidad esperada. Solución a) Si f(x) = 20x3(1-x),
0 < x < 1, entonces, por definición de F, tenemos
la gráfica de esta función se muestra en la siguiente figura:
b) Usando la distribución acumulada P(X ≤ 2/3) = F(2/3) = 5(2/3) 4 - 4(2/3)5 = 0.46090535 c) Sea U la variable aleatoria definida como la utilidad neta por galón. Según el problema, Si 1/3 < X < 2/3 entonces U = C 1 en caso contrario, U = C2 dólares/galón. De acuerdo a esto y sabiendo que el costo es C 3dólares/galón, diremos que la utilidad neta por galón U, tiene por función de distribución a
Calculemos ahora el valor esperado de U. Por definición E[U] = (C1 - C3 )P(1/3 < X < 2/3) + (C2 - C3)( P(X ≤ 1/3) + P(X ≥ 2/3)) E[U] = (C1 - C3 )(F(2/3) - F(1/3))+ (C2 - C3 )(F(1/3) + (1 - F(2/3)) E[U] = (C1 + C2 )(0.46091) + (C2 - C1 )(0.04527) Ejemplo 49 Sea X una variable aleatoria continua con función de densidad definida por
Solución
c) Sea A el evento “Xi es mayor que 3/2, i = 1, 2, 3” P(A) = P(X1 >3/2 ∩ X2 >3/2 ∩ X3 >3/2 ) Puesto que los Xi son variables independientes entonces P(X>X1 ) = P(X>X2 ) = P(X>X3 ) Por lo que P(A) = (P(X > 3/2))3 = 1/8 Ejemplo 50 Supongamos que el diámetro de un cable eléctrico, digamos X, es una variable aleatoria continua con su función de densidad es f(x) = 6x(1-x) , 0 ≤ x ≤ 1. a) Verifique que f es efectivamente la función de densidad de probabilidad de X b) Obtener una expresión para F, la distribución acumulada de X c) Determinar un número b tal que P( X < b ) = 2 P(X > b)
d) Calcular P(X ≤ 1/2 / 1/3 < X < 2/3 ). Solución
4.5 EJEMPLOS PROPUESTOS Tres egresados tienen entrevistas programadas para empleo durante las vacaciones en el Montero Mark. El resultado de cada entrevista es Obtener el empleo o no obtenerlo. a) Haga una lista de los resultados obtenidos. b) Defina una variable aleatoria que represente la cantidad de ofertas hechas. Es una variable aleatoria discreta o continua? c) Indique el valor de la variable aleatoria para cada uno de los casos. 2. La tasa de interés de préstamos otorgados por las entidades financieras de la ciudad se encuentra muy diferenciada. Suponga que la variable aleatoria de interés es la cantidad de instituciones crediticias de este grupo que ofrecen una tasa fija a 30 años, de 8,5% o menos. ¿Qué valores puede asumir esta variable aleatoria? 3. YacoBas es un técnico en laboratorio y diariamente debe realizar diversos tipos de análisis de sangre para el cual debe seguir uno de dos procedimientos. El primero requiere uno o dos pasos separados, y el segundo puede requerir uno, dos o tres pasos. Haga una lista de los resultados experimentales asociados con la ejecución de un análisis.Si la variable aleatoria de interés es la cantidad de pasos requeridos para terminar el análisis, indique qué valor asumirá la variable aleatoria en cada uno de los resultados experimentales. 4. En un juego de póker una mano de cartas puede contener de cero a cuatro ases. Si X es la variable aleatoria que denota el número de ases, enumere el espacio rango de X. ¿Cuáles son las probabilidades asociadas con cada valor posible de X?
5. El encargado de un almacén de ropa de mujeres está interesado en el inventario de polos, que en ese momento es de 30(todas las tallas). El número de polos vendidos desde ahora hasta el final de la temporada se distribuye como f(x) = e-2020x/x!,
x = 0, 1, 2, ...
Encuentre la probabilidad de que le queden polos sin vender al final de la temporada. 6. Una variable aleatoria X tiene por función de distribución acumulada F(x) = 1 - (1/2)(x+1) , 2, ...
x = 0, 1,
a) Determine la función de densidad de probabilidad de X
b) Encuentre P(0 < X ≤ 8 ) 7. Dada las siguientes funciones de densidad de probabilidad de X, a) encuentre el valor de la constante k para que f sea la función de densidad de probabilidad de X b) Encuentre la función de distribución acumulativa de X
4.6 VALOR ESPERADO DE UNA VARIABLE Caso discreto
Sea X una variable aleatoria discreta cuyos valores son x1, x2, x3, ... xn , pertenecen a su espacio rango. Sea p(xi )=P(X = xi ), ∀i =1, 2,..., n su función de probabilidad. Diremos que E(X) es laEsperanza Matemáticade X y se define como
Ejemplo 51 Sea X la variable aleatoria que representa el número de caras obtenidas al lanzar una moneda 3 veces. Cuál será el número esperado de caras?
Solución Según el Ejemplo 12 la distribución de probabilidad de X es
Podríamos decir que el número de caras que esperamos que ocurra es “una cara y media”. Otra forma de interpretarlo es: El número esperado de caras es uno o dos. Ejemplo 52 Una agencia bancaria tiene tres cajeros automáticos. La probabilidad de que uno cualquiera de ellos falle después de un tiempo determinado de uso, es 0.1. Los cajeros operan independientemente uno de otro. En una hora determinada, cuál es el número esperado de cajeros que fallen? Solución La distribución del número de cajeros que fallen, resuelto anteriormente, es X p(x)
0 0.729
1 0.243
2 0.027
3 0.001
Luego el valor esperado de X es E(X) = 0(0.729) + 1(0.243) + 2(0.027) + 3(0.001) = 0.3 Ejemplo 53 La probabilidad de que un agente vendedor realice una entrevista efectiva(realice una venta) es igual a 30%. Cierto día entrevista a 3 clientes potenciales. Si se define a X como el número de clientes que firman un contrato de venta. Cuál es el número esperado de clientes que firmen el contrato?.
Solución La función de probabilidad al hemos hallado en el Ejemplo 22. Como esta función de probabilidad de X viene dada por
entonces, el número esperado de clientes que firmen el contrato será E(X) = 0x(0.7)3 + 1x3x(0.3)(0.7)2 + 2x3x(0.3)2(0.7) + 3x(0.3)3 = 0.9 ; es decir, el agente vendedor debe esperar que sólo uno de los tres clientes firmen el contrato. Ejemplo 54 Una empresa ensambladora de celulares recibe tarjetas de control en lotes de 20 cada uno. El Departamento encargado de la recepción utiliza la siguiente regla de inspección: Se prueban dos tarjetas de control de cada lote. Si ninguno de ellos es defectuoso, se pasa a otro lote. Si resulta defectuoso, por lo menos uno de ellos, se prueba el lote completo. ¿Cuál es el número esperado de tarjetas de contgrol inspeccionados por lote, si se sabe por experiencia que cada lote contiene exactamente el 25% de defectuosos? Solución
Sea X la variable aleatoria que representa el “Número de tarjetas de control inspeccionados por lote” Como en la primera fase se prueban dos, entonces X = 2. Si por lo menos uno de ellos es defectuoso, se prueban los 20, en cuyo caso X = 20. Luego los valores de X son 2, 20. En este caso, p = 0.25 es la probabilidad de que una tarjeta sea defectuosa. Esto significa que en el lote de 20 tarjetas, habrá 5 defectuosas. Sea A el evento “Una tarjeta de video es defectuosa”. Si X = 2, significará que sólo se probaron dos tarjetas, esto es, que ninguna de ellas fue defectuosa, es decir, ocurrió el evento A1’ ∩ A2’. Luego p(x = 2) = P(A1’ ∩ A2’) = C(5,0)C(15,2) / C(20, 2) = (15x14) / (20x19) = 21/38 Ahora, X = 20, significa que se encontró por lo menos una tarjeta defectuosa. Es decir, p(x = 20) = 1 – p(x=2) = 1 – P(A1 A’2’ ) = 17/38 La distribución de probabilidad de X es X p(x)
2 21/38
20 17/38
Finalmente E(X) = 2(21/38) + 20(17/38) = 10.05 Ejemplo 55 Una urna contiene 4 bolas rojas, 6 negras, 8 verdes y 2 blancas. Un jugador extrae una bola de la urna. Si esta es roja, el jugador gana $ 30.00, si es negra, gana $ 20.00. Cuánto debería pagar el jugador si extrae una verde y cuando extrae una bola blanca para que el juego sea equitativo?. Además, si extrae una bola verde el jugador deberá pagar la cuarta parte de lo que pagaría si extrae una bola blanca. Solución Nota:
Consideraremos que un juego es equitativo si su esperanza o valor esperado del beneficio obtenido con el juego es cero.
Sea B el evento “Se extrae una bola blanca” Sea N el evento “Se extrae una bola negra” Sea R el evento “Se extrae una bola roja” Sea V el evento “Se extrae una bola verde” Sea X la variable aleatoria que representa “La ganancia del jugador”. Si ocurre B, X = k con P(B) = 2/20 Si ocurre V, X = x/4 con P(V) = 8/20 Si ocurre R, X = $ 30 con P(R) = 4/20 Si ocurre N, X = $ 20 con P(N) = 6/20 Luego podemos formular la siguiente distribución R 2/20 30
N 8/20 20
V 4/20 -k/4
B 6/20 -k
Encontremos el valor esperado E(X) =- 30(4/20) + 20(6/20) +(-k/4)(8/20) + (-k)(2/20 = 0 De donde k = 15 Luego el jugador debe pagar $ 15.00 si extrae verde y $ 60.00 si extrae una bola blanca. Ejemplo 56 Una empresa comercializadora de productos con valor agregado recibe lotes de 40 artículos de vestir para damas. La empresa debe realizar la última fase que es el estampado. Esta empresa acepta las prendas de vestir sabiendo que, por lo general, el lote contiene 5% de prendas defectuosas. El plan de aceptación consiste en extraer una muestra aleatoria de 5 artículos. Si se encuentra una prenda defectuosa se rechaza el lote. a) Hallar la probabilidad de que se encuentre exactamente una prenda de vestir defectuosa en la muestra, si el lote se considera en su calidad mínima (Un lote se encuentra en su calidad máxima, si no contiene productos defectuosos). b) ¿Cuántas prendas defectuosas espera encontrar en la muestra? Solución
Sea X la variable aleatoria que representa “Número de prendas defectuosas en la muestra”. La probabilidad de que se extraiga una prenda defectuosa es 0.05. Si en la muestra de tamaño 5 deseamos
encontrar “x” prendas defectuosas, entonces (0.05)x es la probabilidad de encontrar x defectuosas y (1 – 0.05) (5-x) es la probabilidad de que las otras “5 -x” sean no defectuosas. Y como las “x” defectuosas pueden ser extraídas en cualquiera de las 5 extracciones, el número de maneras de obtener “x” defectuosas en 5 es combinaciones de 5 tomados de x en x. Todo esto nos lleva a formular la función de probabilidad de X siguiendo el modelo binomial de acuerdo a p(x) = P(X = x) = C(5, x)0.05x0.955-x,
x = 0, 1, ..., 5.
a) La probabilidad de encontrar exactamente una prenda defectuosa es p(1) = P(X = 1) = C(5, 1)(0.05)(0.95)4 = 0.2036 b) El valor esperado de X, usando la definición será
Ejemplo 57 Un conductor decide cambiar la válvula que regula el termostato de su vehículo. Para ello acude a un taller en donde el técnico dispone de cuatro válvulas, una de las cuales es el que debe usar para el vehículo en cuestión. Si las selecciona al azar una después de otra, y sin reposición, cuál es el número esperado de válvulas que ha de probar para colocar el correcto?. Solución
Sea X el “número de pruebas que debe realizar el técnico hasta encontrar la válvula correcta”. Observe que en este caso definimos a X como el número de ensayos y no como el número de veces que debe ocurrir éxito. En el caso binomial, el número de ensayos es conocido y además los ensayos se realizan con reposición, por lo que la probabilidad de éxito no cambia. Sin embargo en este caso, las pruebas implican realizar ensayos sin reposición; por lo que la probabilidad de éxito (ubicar la válvula correcta) cambia conforme se realizan más pruebas. Sea C el evento “Encontrar la válvula correcta”. Si X = 1, p(1) = P(X = 1) = P(C) = ¼ C) = (¼)(1/3)Si X = 2, p(2) = P(X = 2) = P(C’ C) = (¼)(1/3)(1/2) C’Si X = 3, p(3) = P(X = 3) = P(C’ C) = (¼)(1/3)(1/2)(1) C’ C’Si X = 4, p(4) = P(X = 4) = P(C’ Por lo que el número esperado de pruebas que debe realizarse será E(X) = 1(1/4)+2(1/4)(1/3)+3(1/4)(1/3)(1/2)+4(1/4)(1/3)(1/2)(1) = 0.70833 Ejemplo 58
Ud. lanza una moneda tres veces. Si obtiene al menos dos caras, se le permitirá lanzar un dado y recibirá tantos soles como puntos obtenga en el dado. Qué cantidad de dinero espera ganar Ud. en este juego?. Solución
Sea A el evento “Sale por lo menos dos caras”. P(A) = 4/8 Sea B el evento “Lanzar un dado y obtener un punto” Sea X la variable aleatoria que representa: “Cantidad de dinero recibido”. Los valores de X son: 1, 2, 3, 4, 5, 6. La probabilidad de que salga cualquiera de las caras, digamos x, es p(x) = P(X = x) = 1/6 El evento B ocurre sólo si ocurre A. Luego P(B) = P(A)1/6 = (4/8)x(1/6) = 4/48
Luego espero ganar S./ 1.75. Ejemplo 59 Todos los que participan en un determinado juego deben inscribirse pagando S./ 1.0. El juego consiste en lanzar tres argollas hacia una clavija, a la cual se ha amarrado una botella de vino. El jugador debe lanzar las argollas de uno en uno. Si ensarta una argolla gana un premio de S./ 5.0 Si logra ensartar dos argollas, gana S./ 10.0. Si logra ensartar las tres argollas, el premio es de S./ 50.0. Si suponemos que la probabilidad de ensartar en la clavija es 0.10. Cuál es la ganancia esperada del jugador, si juega a) sólo una vez. b) si juega diez veces?. Solución
Sea X la variable que representa: “Número de argollas que logra ensartar el jugador”. Según el problema, los valores de X son: 0, 1, 2, 3. Como la probabilidad de éxito(ensartar una argolla) es 0.1 y es constante, X es una variable que tiene distribución binomial cuya función de probabilidad viene dada por
Si se realizan diez jugadas, tendremos E(X) = 0.965 soles. Ejemplo 60 En un determinado juego de dados, Manuel debe pagar a la mesa $ 1.0, luego del cual lanza tres dados. Manuel recibe $ 2.0 si aparece un as; recibe $ 4.0 si aparecen dos ases y $ 8.0 si aparecen tres ases. En los otros casos no recibe nada. a) Es equitativo el juego? Justifique su respuesta b) Si no lo fuese, cuánto debería recibir A por sacar tres ases? Solución
Sea X la variable aleatoria definida como “Cantidad de dinero recibida por Manuel”. Sea A el evento “Sale un as al lanzar los tres dados” Según el problema: Si sale un as, X = 2; si sale dos ases, X = 4 y si sale tres ases, X = 8. Con las siguientes probabilidades:
X = 2 con P(X = 2) = P({(A, A’, A’), (A, A, A’), (A’, A’, A)}) = 3(1/6)(5/6)(5/6) = 75/216 X = 4 con P(X = 4) = P({(A, A, A’), (A, A’, A), (A’, A, A)}) = 3(1/6)(1/6)(5/6) = 15/216 X = 8 con P(X = 8) = P({(A, A, A)}) = (1/6)(1/6)(1/6) = 1/216 Obtención del valor esperado de X: E(X) = 2(75/216) + 4(15/216) + 8(1/216) = 218/216 a) Sin duda el juego no resulta equitativo. Para que esto ocurra E(X) debería ser $ 1.0 ya que al pagar $ 1.0 para jugar, al final no ganaría ni perdería. b) Para que sea equitativo, debería recibir $ 6.0, si obtiene tres ases.
Ejemplo 61 Yaco decide participar en un juego que consiste en lo siguiente: Luego de firmar una boleta en blanco para participar en el juego, recibe tres bolitas para lanzarlas hacia un depósito que contiene cuatro casilleros. Gana si logra colocar dos de las bolitas en un mismo casillero. Una bolita puede caer en cualquiera de los cuatro casilleros con igual probabilidad. Yaco tiene tres oportunidades para lograr éxito. Si tiene éxito, recibe $ 219.70. Si no logra tener éxito en los tres intentos, debe pagar una determinada cantidad. Si pierde Yaco cuánto debe pagar para que el juego resulte equitativo? Solución
Sea R el evento “En un casillero sólo caen dos bolitas”. Y sea G el evento “Gana Yaco”. La probabilidad de que una bolita caiga en cualquiera de los cuatro casilleros es 1/4 . La probabilidad de que dos bolitas caigan en el mismo casillero es 1/16. Y que la tercera bolita no caiga en dicho casillero es 3/4 . Pero este casillero pudo haber sido cualquiera de los cuatro. Luego P(R) = 4x(1/4)(1/4)(3/4) = 4x3/64 = 3/16.
Como Yaco tiene tres intentos, Sea X la variable que representa “El número de intentos que debe hacer Yaco para ganar el juego. Según esto, Yaco gana el juego si X = 1 ó X = 2 ó X = 3. Con probabilidades p(1) = P(X=1) = 3/16 p(2) = P(X = 2) = (13/16)(3/16) = 39/256 p(3) = P(X = 3) = (13/16)² (3/16) = 507/4096 Luego P(G) = 3/16 + 39/256 + 507/4096 = 1899/4096 El juego es equitativo si E(X) = 0. Esto significa que E(X) = 219.7(1899/4096) + k(2197/4096) = 0. Despejando k de la ecuación, tenemos k = 189.9 Luego, si Yaco pierde deberá pagar $ 189.9 para que el juego sea equitativo.
Ejemplo 62 Un parroquiano pasado de copas llega a su casa y desea abrir la puerta de entrada. En el llavero tiene 5 llaves las que prueba una tras otra, al azar. Suponga que se encuentra suficientemente despierto como para eliminar las llaves ya probadas. Sea X la variable que representa el “número de llaves que debe probar hasta que la puerta se abra”. Hallar el número esperado de llaves que debe probar. Solución
Sea X: Número de llaves que debe probar hasta abrir la puerta. Sea A el evento “El parroquiano logra abrir la puerta” El siguiente esquema muestra lo que podría ocurrir.
El parroquiano logra abrir la puerta si ocurre uno de los siguientes eventos: E , FE , FFE , FFFE , FFFFE Esto quiere decir que X tomará valores 1, 2, 3, 4 ó 5. Con probabilidades (1/5), (4/5)(1/4), (4/5)(3/4)(1/3), (4/5)(3/4)(2/3)(1/2) y (4/5)(3/4)(2/3)(1/2)(1), respectivamente. La distribución de probabilidades viene dada por X p(x)
1 0.2
2 0.2
3 0.2
4 0.2
5 0.2
Luego E(X) = 1(0.2) + 2(0.2) +3(0.2) + 4(0.2) + 5(0.2) = 3 Ejemplo 63 Un fabricante de televisores utiliza cierto tipo de componente electrónico en el ensamblaje de televisores a color. Cada televisor requiere de 6 de estos componentes. Un componente defectuoso no puede ser detectado hasta que el televisor haya sido ensamblado completamente. El costo de detección, reparación y reposición de un componente defectuoso es de $ 15. El fabricante ha estado comprando estos componentes en lotes de 100 a dos proveedores diferentes. El costo por lote del proveedor A es $ 100, en tanto que del proveedor B es $ 120. Basadas en experiencias anteriores, las calidades comparadas de los lotes comprados a los dos proveedores, son los siguientes: Proveedor A: Nro estimado de componentes defectuosos por lote 1 2 3 4 5 Probabilidad 0.30 0.25 0.20 0.15 0.10 Proveedor B: Nro estimado de componentes defectuosos por lote 1 2 3 Probabilidad 0.50 0.35 0.15
A qué proveedor debe comprar el fabricante dichos componentes electrónicos? Solución Sea X el número de componentes defectuosos encontrados en un lote. Encontremos el número esperado de componentes defectuosos por lote para los dos proveedores: Para el proveedor A: E(X) = 1(0.30)+2(0.25)+3(0.20)+4(0.15)+5(0.1) = 2.5 Para el proveedor B: E(X) = 1(0.50)+2(0.35)+3(0.15) = 1.5 Para una adecuada decisión calcularemos el costo total que se espera tener por lote y por cada proveedor. Sea CT la variable que representa el Costo total esperado por lote. Según el problema En el caso del proveedor A, CT = 100 + 15 X de donde E(CT ) = $ 100 + $ 15(2.5) = $ 137.5 En el caso del proveedor B, CT = 120 + 15 X de donde E(CT ) = $ 120 + $ 15(1.5) = $ 142.5 Sin duda el fabricante elegirá al proveedor A para que le suministre dichos componentes. Caso continuo
Sea X una variable aleatoria continua. Sea f su función de densidad de probabilidad. Diremos que E(X) es su Esperanza Matemática y se define como
Propiedades de la esperanza de una variable
i) E(K) = K ii) E(K + X) = K + E(X) iii) E(KX) = KE(X)
iv) Si Y = A + BX entonces E(Y) = A + B E(X) Nota: Aceptaremos esto último como propiedad excusándonos del rigor ya que siend o Y = H(X) = A + BX, una función de una variable aleatoria, debiéramos haber desarrollado dicho tema. Sin embargo, lo tomaremos como válido. Ejemplo 64 Sea X una variable aleatoria continua con función de densidad definida por
Encuentre E(X) Solución Usando la definición de esperanza de X, tenemos
Ejemplo 66
Una máquina produce un artículo que es revisado(inspección de 100%) antes de ser despachado. El instrumento de medición es tal que es difícil leer entre 1 y 1 (datos codificados). Después que se realiza el proceso de codificación, la división medida tiene la siguiente función de densidad de probabilidad
b) Sea F el evento “El producto está fuera de la zona confusa”. El producto está fuera de la zona confusa si la medida de su división se encuentra en el intervalo (0, 1). No se considera “fuera de la zona confusa” a los intervalos ( -∞, 0) y (4/3, +∞ ) por cuanto la función de densidad es 0 en dichos intervalos. Por ello, para saber qué fracción de los artículos caen fuera de la zona confusa, debemos calcular la probabilidad del evento F.
4.7 VARIANZA DE UNA VARIABLE
Sea X una variable aleatoria. Sea E(X) su valor esperado. Diremos que V(X) es la varianza de la variable aleatoria de X y la definiremos como la esperanza del cuadrado de los desvíos de la variable respecto de su valor esperado o media; es decir, V(X)= E[(X-E(X))(Y-E(Y)) ]2 TEOREMA. Si V(X) es la varianza de la variable aleatoria X, entonces V(X)= E(X2 )- (E(X))2 Notación:
V(X) = E(X2) – μ2 Desviación estándar
X como la Desviación Estándar de X tal que Sea X una variable aleatoria. Si V(X) es la varianza de X, definimos a
σX= √(V(X)) Propiedades de la varianza
V(K) = 0 V(K + X) = V(X) V(KX ) = K2 V(X) Si Y = A + BX entonces V(Y) = B2V(X) Nota:
Hacemos la misma acotación mencionada en el caso de la esperanza de X. Ejemplo 67 Si se lanza una moneda tres veces, cuál es el número esperado de caras que se obtendría? Con que varianza y desviación? Solución La función de probabilidad para X es X p(x)
0 1/8
1 3/8
2 3/8
3 1/8
Ya hemos visto que E(X) = 12/8 = 1.5 Obtención de la varianza V(X). Por el teorema V(X) = E(X 2) – (E(X))2 Cálculo de E(X2): E(X2) = 02(1/8) + 12(3/8) + 22(3/8) + 32(1/8) = 24/8 = 3 Luego V(X) = 3 – 1.52 = 0.75 La desviación estándar: σX = (0.75)(1/2) = 0.866 Ejemplo 68 La demanda de un determinado producto es una variable aleatoria cuya distribución de probabilidad es la siguiente:
a) Hallar el valor de k b) ¿Cuál será la demanda que se espera tener de dicho producto? c) ¿Cuál es la desviación estándar que experimenta la demanda? Solución a) Para que p(x) se la función de probabilidad de X se debe cumplir
Luego V(X) = 17.8 – 4.092 = 1.0644
De donde σX = 1.03173
Ejemplo 69 Sea X una variable aleatoria cuya función de distribución acumulada viene dada por
Calcule la varianza de la variable
Solución Ante todo encontremos la función de probabilidad de X. De F podemos decir que X es una variable aleatoria discreta. Si X < 0 entonces p(x) = 0
Si 0 ≤ x < 1 entonces p(x) = F( 0) – P(X < 0) = 1/8 – 0 = 1/8 Si 1 ≤ x < 2 entonces p(x) = F(1) – P(X < 1) = 1/2 – 1/8 = 3/8 Si 2 ≤ x < 3 entonces p(x) = F(2) – P(X < 2) = 5/8 - 1/2 = 1/8 Si X ≥ 3 entonces p(x) = 1 – P( X < 3 ) = 1 – F(2) = 1 – 5/8 = 3/8 En otras palabras, la función de probabilidad de X viene dada por
Para calcular la varianza debemos primero encontrar E(X) y E(X2): E(X) = 0(1/8) + 1(3/8) + 2(1/8) + 3(3/8) = 1 E(X2) = 02(1/8) + 12(3/8) + 22(1/8) + 32(3/8) = 2 Luego V(X) = E(X2) – (E(X))2 = 2 – 1 = 1 Coeficiente de variación
Sea X una variable aleatoria con μ X y σX, su media y desviación, respectivamente. Diremos que CV(X) es el coeficiente de variación de X tal que CV(X)= σ/μ En términos porcentuales el coeficiente de variación mide el porcentaje de variabilidad de los valores de una variable respecto a su media esperada. Expresa el grado de dispersión de los datos alrededor de su promedio esperado. Ejemplo 70
Una empresa dedicada a la comercialización de materiales de construcción ha establecido que la demanda de sus clientes potenciales en una nueva zona de Lima, está definida por la variable aleatoria X, en miles de unidades, con función de densidad definida por
a) ¿Cuál es la demanda esperada diaria? b) Calcule e interprete el coeficiente de variación Solución a) Obtención de la esperanza de X:
La demanda de materiales de construcción por los clientes potenciales de la empresa presentan un grado de dispersión relativa de 13.61%. Esto sin duda representa un margen de variabilidad muy leve. Ejemplo 71 La media y la varianza de una variable aleatoria X son 50 y 4, respectivamente. Calcular a) La media de X2 b) La varianza de 2X + 3
c) La desviación estándar de 2X + 3 d) La varianza de –X Solución De acuerdo a los datos
μX = E[X] = 50; &simga;X = 4, con lo cual &simga;2 = V[X] = 4 Del mismo modo, si V[X] = E[X 2] – (E[X])2, entonces E[X2] = 2504. a) La media de X2:
μX2 = E[X2] = 2504 b) La varianza de 2X + 3 Sea Y = 2X + 3. Aplicando propiedades de varianza de una variable definida como una función de otra variable ( Y = H(X)), tenemos: V[Y] = V[2X + 3] = 2 2V[X] + V[0] = 4V[X] = 4(4) = 16 c) Puesto que la desviación de una variable es la raíz cuadrada de la varianza de la variable entonces, usando el resultado del inciso anterior
σ(2X + 3) = √(2X+3) = √ 16 = 4. d) Sea Y = -X Arreglando adecuadamente a Y, tenemos Y = (-1)X. Apliquemos ahora la propiedad de varianza de una constante por una variable (P2): V[Y] = V[(-1)X] = V[X] = 4 Ejemplo 72 Una tienda de accesorios para vehículos está rematando cierto número de artículos entre ellos un lote formado por cuatro productos al precio de $ 40.0 por todo el lote. Un comerciante puede todos los artículos en buen estado a $ 20.0 cada uno, pero todo artículo defectuoso representa una pérdida completa de $ 10.0. Basado en su amplia experiencia, el comerciante asigna probabilidades de 0.1, 0.5, 0.2, 0.1 y 0.1 a los eventos que haya 0, 1, 2, 3 y 4 artículos defectuosos en el lote, respectivamente. Si no es posible ninguna inspección, deberá comprar el lote? Solución
Sea X la variable aleatoria que representa el “Número de artículos defectuosos en el lote”. Según los datos, X puede tomar valores 0, 1, 2, 3, 4 con una distribución definida por
X p(x)
0 0.1
1 0.5
2 0.2
3 0.1
4 0.1
Costo total de los cuatro productos: $ 40.0 Ingreso total si los cuatro productos son buenos: $ 80.0 Si por cada producto defectuoso se pierde $ 10.0, entonces 10X es el total de la pérdida. Para responder a la pregunta definamos a Y como la ganancia obtenida al vender los cuatro productos. Según el problema, Y = 80 – (40 + 10X) = 40 – 10X. Hallemos la esperanza de Y. Si Y = 40 – 10X entonces E[Y] = 40 – 10E[X]. Puesto que E[X] = 0(0.1) + 1(0.5) + 2(0.2) + 3(0.1) + 4(0.1) = 1.6; con lo cual E[Y] = 28. Por tanto, el comerciante debe comprar el lote. Ejemplo 73 Sea X una variable aleatoria cuya distribución de probabilidades es la siguiente: X p(x)
0 1/8
1 1/4
2 1/4
3 1/4
4 1/8
Calcular E[2X +1]; V[X]; V[2X + 1] Solución Hallaremos primero E[X] y V[X]: E[X] = 0+1/4+2(1/4)+3(1/4)+4(1/8) = 2 V[X] = E[X2] – (E[X])2 = 0+1/4+4(1/4)+9(1/4)+16(1/8) – (2)2 V[X] = 1.5 Si hacemos Y = 2X +1 entonces, aplicando propiedades E[Y] = E[2X+1] = 2E[X] + 1 = 2(2) + 1 = 5 V[Y] = V[2X+1] = 4V[X] + 0 = 4(1.5) = 6 Ejemplo 74
Sea X una variable aleatoria con función de densidad definida por
f(x) = x/18, 0 ≤ x ≤ 6. Si Y = 10 + 2X, hallar la esperanza y la varianza de Y usando dos procedimientos diferentes. Solución Usaremos propiedades de esperanza y varianza para resolver el problema: Como para hallar la esperanza y varianza de Y se requiere conocer previamente la esperanza y varianza de X, hallaremos primero estos valores: Según los datos f(x) = x/18, 0 ≤ x ≤ 6. Con lo cual
Luego V[X] = 18 – 42 = 2 Si Y = 10 + 2X entonces E[Y] = 10 + 2E[X] = 10 + 2(4) = 18. Igualmente, V[Y] = 0 + 4V[X] = 8 Ejemplo 75 Imagina es una compañía constructora de rascacielos en el centro financiero de Lima. El suministro de estos materiales está sujeto a un tiempo de demora, digamos X, cuyo comportamiento es reflejado mediante la función de densidad f(x) = 1/3 en el intervalo de uno a cuatro días. Y f(x) = 0 si el número de días cae fuera de este intervalo. Si el material almacenado le permite prescindir del pedido hasta por dos días, el costo de la demora se fijó en 100 soles, para cualquier demora de hasta dos días. Sin embargo, después de dos días, el costo de la demora es de 20 soles adicionales por cada día de demora. Calcular el valor esperado del costo para la compañía debido a la demora en el suministro de estos materiales? Solución Sea X el tiempo de demora en recibir los materiales. La función de densidad de X es
2, entonces C = 100; pero si x Sea C la variable que representa el costo por la demora en el suministro de los materiales. De acuerdo al problema, si x > 2, entonces C = 100 + 20(X – 2) ya que por cada día adicional a los dos primeros días, se tiene un costo de 20 soles. Esto no sugiere que C puede definirse de la siguiente manera
Podemos apreciar que C es una función de una variable aleatoria, por lo que, de acuerdo a los teoremas de valor esperado de una función de variable aleatoria, tenemos
Luego, el costo esperado de demora para la compañía será de 113.33 soles.
Ejemplo 76 El tiempo X, que un cajero tarda en atender a un cliente durante las horas de mayor demanda, se distribuye exponencialmente con una función de densidad dada por f(x) = 0.2e-0.2x donde x > 0. Suponga que la media y varianza de X son 5 y 25. Si el costo que el cajero tarda en atender a cada cliente se define según la ecuación C = K X 2 - 5X + 8 Obtenga el valor de K si se espera tener por cliente un costo total de 83 soles Solución Si el costo total esperado es de 83 soles, entonces E[C] = 83. Aplicando propiedades de valor esperado a la función del costo total, tenemos E[C] = E[KX2 - 5X + 8] = K E[X2] – 5 E[X] + 8 (1) Por otro lado, como V[X] = E[X2] – (E[X])2 entonces E[X2] = V[X] + (E[X]) 2 = 25 + 25 = 50 Reemplazando los valores conocidos en (1), tenemos 83 = K(50) – 5(5) + 8. Luego K = 2. Ejemplo 77 Una institución benéfica decide recaudar fondos mediante la realización de un evento popular sorteando un automóvil 0 Km. Para ello se deben vender 8000 boletos a $ 5.0 cada uno. El premio consiste en la entrega al ganador de la rifa de un automóvil cuyo costo es de $ 12,000. Si una persona adquiere dos boletos, ¿cuál será la ganancia esperada de esta persona? Solución Sea X la ganancia esperada de una persona. Veamos qué valores toma X: En principio la persona gasta $ 10.0 en los dos boletos de la rifa. Si ninguno de los boletos sale premiado, en cuyo caso su ganancia será 0 que recibe como premio menos lo que le costó los boletos: 0 – 10. Si uno de los boletos sale premiado, su ganancia será $ 12000 – 10; luego los valores de X son: -10 y 11990. Encontremos ahora sus respectivas probabilidades. X toma el valor –10 siempre que ocurre el evento P1 ∩ P2 , que corresponde al cuarto ramal inferior.
Observamos que la persona que compró los dos boletos puede ganar el automóvil por cualquiera de tres primeros ramales del árbol. Sólo pierde por el último. Como la ocurrencia de los eventos “Tres primeros ramales” y “El último ramal” son complementarios, entonces p(-10) = P(X = -10) = P(P 1' ∩ P2') = P(P1 ∩ P2’) P(P1')P(P2’/P(P1') = 7999/8000x7998/7999 = 0.99975 p(11990) = P(X = 11990) = 1 - P(P1’ ∩ P2 ’) = 1- 0.99975 = 0.00025 Luego la distribución de probabilidad de X viene dada por X p(x)
-10 0.99975
11990 0.00025
Con lo cual E(X) = (-19)(0.99975) + 11990(0.00025) = -7 Se concluye que se espera que la persona pierda $ 7.0. Ejemplo 78 Una persona desea asegurar su vehículo por un monto de $ 50,000 pagando una prima igual a K dólares. La compañía aseguradora sabe que la probabilidad de que el vehículo sufra un accidente contemplado en el contrato es 0.01. Qué prima deberá cobrar la compañía si espera ganar $1,000 dólares?. Solución Monto asegurado Monto de la prima
: $ 50,000 :$K
Probabilidad de un accidente
: 0.001
Probabilidad de que no haya accidente Si X se define como
: 0.991
: Ganancia de la compañía de seguros
Entonces los valores de X son: X = 50000 –K siempre que ocurra un accidente; es decir P(X = 50000 – K) = 0.001 X = K siempre que no ocurra ningún accidente; es decir, P(X = K) = 0.991 La distribución de probabilidades de X es la siguiente X p(x)
K - 50000 0.01
K 0.99
Puesto que la compañía desea que E[X] = 1000, entonces 1000 = E[X] = (K - 50000)(0.01) + (K)(0.99) Despejando K, obtenemos K = 1500. Luego la compañía aseguradora debe cobrar una prima de $ 1,500 por el yate. Ejemplo 79 Un agente de bolsa cobra mensualmente honorarios fijos de $ 1000 más una comisión del 5% sobre el beneficio que su empresa obtiene por gestiones de consultoría que realiza. El beneficio que la empresa recibe mensualmente(en miles de dólares) se define como una variable aleatoria cuya función de densidad de probabilidad viene dada por
a) ¿Cuánto de utilidad espera obtener el consultor? b) ¿Cuál es la probabilidad de que el consultor obtenga utilidades superiores a $ 1180? Solución a) Sea X la variable aleatoria que representa el beneficio que obtiene la empresa mensualmente. Sea Y la variable que define la utilidad que obtiene mensualmente el consultor. Como éste recibe honorarios fijos de 1000 más el 5% del beneficio que es X, entonces sus utilidades mensuales se define como Y = 1000 + 0.05X . Obtendremos ahora E[Y]. Aplicando propiedades a Y, tenemos E[Y] = E[1000 + 0.05X] = 1000 + 0.05E[X]. Obtención de E[X], que representa el beneficio mensual que la empresa espera obtener.
Es decir los beneficios de la empresa se espera que sean de $ 3000. Reemplazando en E[Y], tenemos E[Y] = 1000 + 0.05(3000) = 1150 Finalmente diremos que las utilidades esperadas del consultor son de 1150 dólares mensualmente. Utilidades del consultor superiores a $ 1180 se puede expresar como Y >1180. Luego debemos encontrar P(Y >1180). Esto es posible si pudiéramos conocer la función de densidad de Y, como no es así, usaremos el siguiente procedimiento: P(Y >1180) = P( 1.000 + 0.05X >1.180) = P(0.05X>1.180 – 1.000) = P(X > 3.6) =
Es decir, la probabilidad de que las utilidades del consultor sean superiores a $1180 es de 0.08 Ejemplo 80 Un comerciante desea adquirir una póliza de seguro de $ 20,000 para asegurar su nueva casa asentada en un área que, de acuerdo a datos históricos, puede sufrir una pérdida total en un año, con una probabilidad de 0.001 y una pérdida parcial del 50%, con una probabilidad de 0.01. ¿Qué prima tendría que cobrar la compañía de seguros por una póliza anual para “salir a mano” con todas las pólizas de $ 20,000 de ese tipo, ignorando todas las otras pérdidas parciales? Solución Según los datos: Monto de la póliza
: $ 20,000
Monto de la prima
:K
Probabilidad de una pérdida total
: 0.001
Probabilidad de una pérdida de 50%: 0.010 Sea X la variable aleatoria que representa : Ganancia de la compañía de seguros Veamos los valores que toma X: Si hay una pérdida total, entonces X = K – 20,000 con probabilidad igual a 0.001 Si hay una pérdida de 50%, entonces X = K – 10,000 con probabilidad igual a 0.01 Si no hay pérdida, entonces X = K, con probabilidad igual a 1 – (0.001 + 0.010) Luego podemos construir la distribución de probabilidad de X
X K - 20000 p(x) 0.001
K - 10000 0.010
K 0.989
Como por otro lado, E[X] debe ser cero para que la compañía pueda “salir a mano”, entonces 0 = E[X] = (K – 20000)(0.001) + (K – 10000)(0.010) + K(0.989)
de donde K = 120; es decir que la compañía de seguros debe cobrar una prima anual de $ 120 “para salir a mano”. Ejemplo 81 Los accidentes registrados por una Compañía de Seguros de automóviles, aportan la siguiente información: La probabilidad de que un automovilista asegurado tenga un accidente automovilístico, es de 0.15. Si ocurre un accidente, el daño al automóvil representa el 20% de su valor en el mercado, con una probabilidad de 0.80; representa un 60% de su valor en el mercado con una probabilidad de 0.12; mientras que la probabilidad es de 0.08, si se produce una pérdida total. ¿Cuál debe ser el valor de la prima que la Compañía de seguros debe cobrar por un automóvil que vale $ 4,000 de forma tal que su ganancia esperada sea cero? Solución Según los datos: Precio del automóvil Monto de la prima
: $ 4,000 :K
Probabilidad de accidente con 20% de daño: 0.80 Probabilidad de accidente con 60% de daño: 0.12 Probabilidad de una pérdida total
: 0.08
Sea X la variable aleatoria que representa : Ganancia de la compañía de seguros Veamos los valores que toma X:
El diagrama de árbol anterior nos permite obtener los valores de X. Como el valor del automóvil es de $ 4,000 y la prima a cobrar es K, entonces X = K – 800, si hay un accidente con 20% de daño; es decir P(X = K –800) = 0.80x0.15 X = K – 2400, si hay un accidente con 60% de daño; es decir P(X = K –2400) = 0.12x0.15 X = K – 4000, si hay un accidente del 100% de daño; es decir P(X = K – 4000) = 0.08x0.15 X = K, si no hay accidente. Y esto ocurre con probabilidad igual a 0.85 Debemos tomar en cuenta que X toma los tres primeros valores siempre que hay un accidente, y esto ocurre con probabilidad igual a 0.15. Por ello es que hemos multiplicado por 0.15 a cada uno de estos valores. Finalmente, como E[X] debe ser cero, entonces
0 = E[X] = (K - 800)(0.12) + (K - 2400)(0.018)+(K - 4000)(0.012)+K (0.85) de donde K = 187.2. Luego la Compañía debe cobrar una prima de $ 187.2 para no perder ni ganar.
Ejemplo 82 Sea X una variable aleatoria que representa el peso de un artículo en onzas, cuya función de densidad viene dada por
El precio de venta de cada artículo se fija en US $ 8.5. El costo de producción está relacionado al peso del artículo de acuerdo a la siguiente función de X: C = 0.5X + 2. Determine la utilidad esperada por artículo. Solución Sea Y la variable aleatoria que representa la utilidad por artículo. Según los datos Y = 8.5 – C; es decir Y = 6.5 – 0.5X. Tomando valor esperado a Y, de acuerdo a las propiedades tenemos: E[Y] = 6.5 – 0.5E[X]. Según esto debemos encontrar el valor esperado del precio por artículo primero. En efecto
Por tanto E[Y] = 6.5 – 0.5(9) = 2. La utilidad esperada por artículo es US$ 2.0 Ejemplo 83 Una estación de gasolina recibe provisión semanalmente. Los datos recogidos en épocas pasadas sugieren que la función de densidad de probabilidad de las ventas semanales, X, medidas en miles de galones, se aproxima a la función cuya gráfica se muestra en la siguiente figura:
a) Encuentre el promedio de ventas semanales b) Supongamos que el administrador de la estación tiene un sueldo básico de 1200 soles por semana. Tiene también una bonificación de 50 soles por cada millar de galones vendidos semanalmente. ¿Cuál será el ingreso total que espera tener el administrador por semana? Solución Obtención de la función de densidad de X. Ecuación de L1: y = cx Ecuación de L2: y = c Ecuación de L3: y = 5c – 2cx
Luego la función de densidad de X, en términos de la constante c es
a) Obtención del promedio de ventas semanales.
b) Si definimos a Y como la variable que representa el ingreso semanal del administrador, entonces Y = 1200 + 50X. El ingreso total esperado es E[Y]. Esto es E[Y] = 1200 + 50E[X] = 1200 + 50(1.357) = 1267.85 Ejemplo 84 La Futura, compañía de Seguros vende una póliza de seguros a MillWard, una empresa líder en mercadeo en Europa, pero que decide expandirse al mercado latino el cual no conoce y que por lo mismo decide cubrir las posibles pérdidas en la comercialización de su nuevo producto. Si el producto no tiene salida, la compañía sufrirá una pérdida de US $ 80,000. Si el éxito que obtiene es moderado, la pérdida será de US $ 20,000. Basados en historias de mercadeo en dicha región se sabe que las probabilidades de que el producto resulte ser un completo fracaso o un éxito moderado son 0.01 y 0.05, respectivamente. Qué prima deberá cobrar la compañía de seguros por la póliza si sólo desea cubrir sus gastos, sin considerar otros tipos de posibles pérdidas?. Solución Definamos a X como la ganancia que la compañía de seguros obtendrá. Sea K la prima a cobrar. Puesto que sólo desea cubrir sus gastos, entonces se debe cumplir que no debe tener ganancia; es decir, E[X] = 0. Ahora bien, Si el producto resulta en un completo fracaso, X = K – 80,000 con probabilidad 0.01 Si el producto resulta con éxito moderado, X = K – 20,000 con probabilidad 0.05 Pero si no hay pérdida, entonces X = K; esto ocurre con probabilidad 1 – (0.01 + 0.05) = 0.85 Luego E[X] = (K-80000)(0.01) + (k-20000)(0.05) + K(0.85) = 0 De donde se tiene K – 1800 = 0. Por tanto la compañía de seguros debe cobrar una prima de US $ 1800 si sólo desea cubrir sus gastos.
4.8 PROBLEMAS PROPUESTOS 1. Una máquina posee 10 posiciones del torno diferentes que permite productos de diferente calibración. Si dicha máquina no tiene la unidad posicionada de manera apropiada, éste cae, y la posición del torno permanece abierta, resultando de ese modo un ciclo que produce menos de diez
unidades. Un estudio del funcionamiento pasado de esta máquina indica que si X es una variable aleatoria que representa el número de posiciones abiertas, su función de probabilidad viene dada por
Si la pérdida debida a posiciones vacías viene dada por Y = 20x 2, encuentre a) la función de probabilidad de Y b) la media y varianza de Y (E(Y) y V(Y)) 2. El contenido de cloro de un determinado compuesto es una variable aleatoria dada por la siguiente función de densidad de probabilidad:
La utilidad que se obtiene de esta aleación es P = 10 + 2X a) Encuentre la distribución de probabilidad de P b) ¿Cuál es la utilidad esperada? 3. Un fabricante de aparatos de televisión a color ofrece un año de garantía de restitución gratuita si el tubo de imagen falla. El fabricante estima el tiempo de falla(en años), T, como una variable aleatoria con la siguiente distribución de probabilidad:
a) ¿Qué porcentaje de aparatos tendrá que reparar? b) Si la utilidad por venta es de $200 y la sustitución del tubo de imagen cuesta $200, encuentre la utilidad esperada del negocio. 4. Un contratista ofrece realizar un proyecto. Los días requeridos, X, para la terminación sigue la siguiente distribución de probabilidad:
La utilidad del contratista es Y = 2000(12 – X) a) Encuentre la distribución de probabilidad de Y b) Determine E(X), V(X), E(Y) y V(Y). 1. Si el porcentaje de Z es menor que 0.70, la gasolina es de 95 octanos y se vende a 9.92 soles por galón. Si el porcentaje de Z es mayor o igual a 0.70, la gasolina es de 97 octanos y se vende a 10.98 soles por galón. Z 5. El porcentaje de cierto aditivo en gasolina, determina el precio de venta. Si Z es la variable aleatoria que representa el porcentaje, entonces 0
Determine el ingreso esperado por galón en el caso en el que f(z) = 1, 0 ≤ z ≤ 1; y 0 en otros casos, f(z) = 0. 6. La estación terrena de Lurín tiene una antena rotatoria que recibe señales de dos formas. La posición rotacional(ángulo) se representa por X, y puede suponerse que esta posición en el tiempo en el que se recibe una señal es una variable aleatoria(por la variabilidad de la señal) con la densidad que se indica a continuación.
f(z) = 1/(2π)
0 ≤ x; ≤ 2π
y 0 en otros casos.
La señal puede recibirse si Y > y0, donde Y = tan(X). Por ejemplo, y0 = 1, corresponde a . Encuentre la función de densidad para Y. 7. La demanda de un anticongelante en una determinada temperatura se considera como una variable aleatoria X, con función de densidad definida por f(x) = 10-6, 106 ≤ x ≤ 2x10 6 donde X se mide en litros. Si el fabricante encuentra una utilidad de 50 centavos de dólar por cada litro que vende al final de año, y se debe conservar cualquier exceso durante el siguiente año a un costo de 25 centavos de dólar por litro, determine el nivel “óptimo” de existencias para un final de temporada particular.
4.9 DISTRIBUCIONES CONOCIDAS: CASO DE VARIABLE DISCRETA Experimento de Bernoulli
Sea ζ un experimento y Ω el espacio muestral asociado a ζ. Supongamos que estamos interesados en la ocurrencia o no, de un determinado evento A ⊆ Ω. Diremos que este experimento constituye un Ensayo de Bernoulli si posee las siguientes características: La realización de este
experimento genera dos únicos resultados posibles: ocurre el evento A o no ocurre; diremos que hay éxito si ocurre A, con p = P(A), probabilidad de éxito y diremos que hay fracaso si A no ocurre, en cuyo caso, si q representa la probabilidad de fracaso, entonces = 1 – p = 1 – P(A) = P(A’). Cada vez que se ejecuta el experimento p es siempre la misma; es decir, la probabilidad de éxito es constante. La ocurrencia o no del evento A no influye en los resultados de la repetición del experimento; es decir, los resultados son independientes Distribución de Bernoulli
Sea ζ un Experimento de Bernoulli y Ω, el espacio muestral asociado a . Supongamos que estamos interesados en la ocurrencia o no de un cierto evento tal como A. Sea p = P(A) la probabilidad de la ocurrencia de A. Si definimos a X como la variable aleatoria que representa “ El número de veces que ocurre éxito cada vez que se realiza el ensayo de Bernoulli”, diremos que X es una variable aleatoria que tiene distribución de Bernoulli con parámetro “p”, entendida como la probabilidad de éxito. Usaremos como notación la siguiente expresión: X → Be(p) para indicar que la variable aleatoria X tiene distribución de Bernoulli con parámetro p. Si X es una variable aleatoria que tiene distribución de Bernoulli, con parámetro p, entonces su función de distribución viene dada por p(x) = P(X = x ) = p ( 1 – p ) 1 – x,
para X = 0, 1
Teorema
Si X es una variable aleatoria que tiene distribución de Bernoulli, entonces μ X = E[X] = p σ²X = V[X] = p (1-p) = pq
y
4.9.1 Distribución Binomial
Sea ζ un Ensayo de Bernoulli y Ω el espacio muestral asociado a ζ. Sea A el evento en el cual estamos interesados. Supongamos que dicho ensayo se repite n veces. Supongamos también que, cada vez que ocurre el evento A, diremos que se obtuvo éxito con probabilidad py no hubo éxito con probabilidad q = 1 – p. Si X es una variable aleatoria definida como “ El número de veces que ocurre éxito en las n repeticiones del experimento ”, diremos que X es una variable aleatoria que tiene Distribución Binomial con parámetros n y p, lo cual denotaremos por X → B(n, p). Si X es una variable aleatoria que se distribuye binomialmente con parámetros n y p, entonces su distribución de probabilidad es p(x) = P(X = x) = C(n, x) px(1-p)n-x,
x = 0, 1, 2, ..., n.
Teorema
Si X es una variable aleatoria que se distribuye binomialmente con parámetros n y p, entonces
μX = E[X] = np σ2X = V[X] = n p (1-p) = npq Problemas de Binomial usando Excel
Excel dispone de la siguiente función para resolver problemas de Binomial: = Distr.Binom(m,n,p,tipo)
= P(X ≤ k)
Donde m: Representa el número de éxitos que se desea que ocurra n : representa el número de veces que se realiza el experimento p : representa la probabilidad de éxito
tipo : Es 1 o Verdadero si se desea P(X ≤ k). Es 0 o Falso si se desea P(X = k) Ejemplo 85 Se lanzan dos dados cuatro veces. ¿Cuál es la probabilidad de que la suma 9 aparezca exactamente dos veces? Solución Si lanzamos una vez los dos dados, la probabilidad de que la suma sea 9 es 1/9. Llamemos a esta ocurrencia éxito, con lo cual p = 1/9.
Sea X la variable aleatoria que representa “El número de veces en que la suma es 9”. Según lo dicho, X tiene distribución binomial B(n = 4, p = 1/9). Según la definición, su función de probabilidad será p(x) = P(X = x) = C(4, x) px(1-p)4-x
,
x = 0, 1, 2, 3, 4.
De acuerdo a la pregunta, p(2) = P(X = 2) = C(4, 2)(1/9)2(8/9)2 = 0.058527 Usando Excel:
P(X = 2) = Distr.Binom(2,4,1/9,0) Ejemplo 86 Una máquina produce cierto tipo de piezas, de las cuales el 5% en promedio son defectuosos. En una muestra aleatoria de 5 piezas ¿cuál es la probabilidad de obtener a) exactamente dos piezas defectuosas? b) por lo menos una pieza defectuosa? Solución En este ejemplo la probabilidad de extraer una pieza defectuosa es 0.05. Esta probabilidad sigue siendo la misma cuando se extrae la segunda o las siguientes piezas, hasta completar los 5 de la muestra. No sabiendo cuántas defectuosas tiene el lote, supondremos que la probabilidad de éxito(la de extraer una pieza defectuosa) es constante. Por ello si X representa el número de piezas defectuosas en la muestra, entonces diremos que X tiene distribución Binomial y X → B(n=4, p=0.05). Luego p(x) = P(X = x) = C(5, x)(0.05)x(0.95)5-x,
para x = 0, 1, 2, 3, 4, 5.
Respondamos ahora a las preguntas: a) Exactamente dos piezas defectuosas significa encontrar p(2) = P(X = 2) = C(5 , 2)(0.05)²(0.95)3 = 0.02143 Usando Excel:
P(X = 2) = Distr.Binom(2,5,0.05,0)
b) Por lo menos una pieza defectuosa significa es P(X ≥ 1) P(X ≥ 1) = 1 – P(X < 1) = 1 – P(X = 0) = 1 – C(5, 0)(0.05)0(0.95)5 = 0.22622 Usando Excel:
P(X ≥ 1 ) = 1 – P(X < 1) = 1 – Distr.Binom(0,5,0.05,1) Ejemplo 87 La probabilidad de hacer una venta en un intento, de cierto vendedor, es 1/2. ¿Cuál es la probabilidad de obtener a) exactamente dos ventas en tres intentos de ventas consecutivas? b) ¿por lo menos una venta en tres intentos de ventas consecutivas? c) ¿Cuántos intentos de ventas consecutivas deben hacerse para obtener una seguridad de 0.9375 de obtener por lo menos una venta? Solución a) Si definimos a X como “El número de ventas en tres intentos de ventas consecutivas” y p = 0.5, con n = 3, diremos que X tiene distribución binomial con función de probabilidad definida por p(x) = P(X = x) = C(3, x)(0.5)x(0.5)3-x = C(3, x)(0.5)3 , x = 0, 1, 2, 3 Según esto, p(2) = P(X = 2) = C(3,2)(0.5)3 = 0.375
b) Por lo menos una venta significa que ocurre el evento X ≥ 1. Por lo que debemos encontrar P(X ≥ 1). Como P(X ≥ 1) = 1 – P(X = 0), entonces P(X ≥ 1) = 0.875 c) Por lo menos una venta significa X ≥ 1. De acuer do a los datos, su probabilidad de ocurrencia es P(X ≥ 1) = 0.9375; es decir, P(X ≥ 1) = 1 – P(X = 0) = 0.9375, de donde P(X = 0) = 0.0625 De acuerdo a la función de distribución, P(X = 0) = C(n, 0)(0.5)n = 0.5n = 0.0625 Tomando logaritmo a ambos miembros tenemos n = Ln(0.0625)/Ln(0.5) = 4.25 Luego el número de intentos necesarios será 4, para tener la probabilidad de por lo menos una venta igual a 0.9375. Ejemplo 88 Suponga que la máquina A produce el doble de artículos que la máquina B. Se sabe que el 6% de los artículos que produce la máquina A son defectuosos, mientras que solo el 3% de los artículos producidos por la máquina B son defectuosos. Si al final de un día de producción se juntan las dos producciones y de ella se toma una muestra aleatoria de 10 artículos, calcular la probabilidad de obtener tres artículos defectuosos.
Solución
El diagrama de árbol grafica claramente la característica del problema. Como lamáquina A produce el doble de artículos que la máquina B, entonces, al seleccionar un producto, la probabilidad de que este provenga de la máquina A es 2/3, y de que provenga de la máquina B es 1/3. Por otro lado, un defectuoso puede provenir de la máquina A o de la máquina B; es decir la probabilidad de obtener un producto defectuoso del total de la producción de un día es p = (2/3)(0.06) + (1/3)(0.03) = 0.05. Esta es la probabilidad de éxito; la probabilidad de extraer un producto defectuoso. Ahora volvamos al problema. Si X es el número de productos defectuosos en una muestra de n = 10 artículos, entonces X tiene distribución binomial con parámetros n = 10 y p = 0.05. Luego su función de distribución es p(x) = P(X = x) = C(10, x)(0.05)x(0.95)10-x
;
x = 0, 1, 2, 3, …, 9, 10
Con lo cual p(3) = P(X = 3) = C(10, 3)(0.05)3(0.95)7 = 0.01047 Ejemplo 89 El departamento de finanzas de una empresa capitalina contrata los servicios de dos empleados a tiempo parcial: Yaco y Báslavi. Yaco trabajará los Lunes, Miércoles y Viernes, mientras que Báslavi lo hará los Martes, Jueves y Sábado. Yaco archivó erróneamente uno de cada cinco documentos, mientras que Báslavi lo hace uno de cada seis. Con el propósito de evaluar los errores que ellos cometen, se elige un día de la semana y en ese día se toma una muestra de 6 documentos. ¿Cuál es la probabilidad de que la muestra contenga exactamente tres documentos mal archivados? Suponiendo que la muestra contiene exactamente tres documentos mal archivados, ¿cuál es la probabilidad de que hayan sido archivados por Yaco? Solución
Definamos la variable aleatoria X como el “Número de documentos mal archivados”. En primer lugar el número de documentos mal archivados por Yaco y por Báslavi es constante. Yaco archiva mal con probabilidad 1/5 y Báslavi, con probabilidad 1/6. Como la muestra de la que se extrae los documentos a ser examinados es n = 6, entonces X → B(n=6, p). Encontremos el valor de p: la probabilidad de que el documento seleccionado de la muestra sea defectuoso. Como Yaco y Báslavi trabajan el mismo número de días de la semana, la probabilidad de que se haya elegido uno de los días en los cuales trabaja Yaco, es 1/2. De suerte que la probabilidad de extraer un documento mal archivado por Yaco será p = (1/2)(1/5) + (1/2)(1/6) = 11/60, por cuanto Yaco archiva mal uno de cada 5, mientras que Báslavi lo hace uno de cada 6. Ahora respondiendo a las preguntas, tenemos: p(3) = P(X = 3) = C(6, 3)(11/60)3(49/60)3 = 0.0671 Sea X la variable aleatoria definida como el Número de documentos mal archivados.
Sea A el evento definido como “El documento fue archivado por Yaco” Sea B el evento “Hay 3 documentos mal archivados”; es decir B = {x / x = 3 } Según esto debemos buscar la probabilidad P(A/B).
Como P(A/B) = P(A ∩ B)/P(B). Debemos encontrar P(A ∩ B) ya que P(B) = 0.0671 P(A ∩ B) = P(A ∩ X = 3) = 0.5xC(6,3)(0.2) 3x(0.8)3 = 0.04096 Luego
P(A/B) = P(A ∩ B) / P(B) = P(A ∩ X = 3) / P(X = 3) = 0.61019857 Ejemplo 90 Sea X una variable aleatoria con distribución binomial, cuya media es 12 y varianza 4.8. Calcular P(X > 5) P(5 < X < 10) P( X < 10) Solución
Si X → B(n,p) entonces μ X = np = 12 y σ² X = np(1-p) = 4.8 Resolviendo el sistema de ecuaciones: 1 – p = 4.8/12 = 0.4 de donde p = 0.6. Reemplazando p en la media obtenemos n = 12/0.6 = 20
Luego X → B(n=20, p = 0.4)
Usando Excel
P( X ≤ 10 ) = Distr.Binom(10,20,0.6,1) Ejemplo 91 Un examen consta de 20 preguntas; cada una de ellas tiene 5 respuestas posibles de las cuales sólo una es la respuesta correcta.. Si un estudiante que desconoce el curso contesta la prueba aleatoriamente, ¿Cuál es la probabilidad de que acierte en más de 10 respuestas correctas? ¿Cuál es el número esperado de respuestas correctas? Solución
De acuerdo a los datos, n = 20, p = 1/5 = 0.2 y si definimos a X como el “Número de respuestas correctas”, diremos que X tiene distribución binomial B(n=20, p = 0.2) y cuya función de probabilidad viene dada por
El número esperado de respuestas correctas será E[X] = np = 20(0.2) = 4 Ejemplo 92
El tiempo de arribo de clientes a la ventanilla de un banco, X, medido en minutos, es una variable aleatoria cuya función de densidad de probabilidad viene dada por
Si con el propósito de estudiar el comportamiento de los clientes se elige una muestra aleatoria de 8 personas, ¿cuál es la probabilidad de que al menos dos de las personas elegidas tengan un tiempo de llegada menor de 3 minutos? Solución Sea X la variable aleatoria definida como el tiempo de llegada a la ventanilla de un cliente. Esta es una variable continua. Puesto que se elige una muestra de 8 personas, y cada una de ellas tiene un tiempo de arribo determinado, estamos hablando entonces de otra variable: aquella que nos indica que pueden llegar 0, 1, 2,..., 7, 8 personas con un tiempo de arribo menor de tres minutos. Por ello definiremos a Y como la variable que representa “Número de personas que llegan en menos de 3 minutos a la ventanilla”. Según esto, los valores de Y serán 0, 1,..., 7, 8. Esta variable Y tiene distribución binomial con parámetros n = 8 y p, la probabilidad de éxito que viene dada por la probabilidad de que el valor de X sea menor de 3 minutos; es decir,
Ejemplo 93 El 1% de habitantes de una cierta ciudad de Latinoamérica sufre de problemas de daltonismo. Si con propósitos de estudio se selecciona aleatoriamente, un conjunto de n habitantes de dicha ciudad, ¿cuál es la probabilidad de que ninguna de los n habitantes sean daltonianos? ¿Cuál debe ser el tamaño de la muestra elegida para que esta probabilidad sea menor al 10%? Solución
Sea n el tamaño de la muestra y X la variable aleatoria definida como “El número de habitantes que tienen daltonismo”. Como la probabilidad de que un habitante cualquiera de dicha ciudad sea daltoniano es 0.01, entonces la probabilidad de éxito, p = 0.01; como el hecho de que uno de ellos sea daltoniano o no lo sea, no implica que algún otro lo sea, entonces X → B(n, p = 0.01).
Luego p(x) = P(X = x) = C(n, x) 0.01x0.99n-x,
x = 0, 1, 2, ..., n.
Si definimos el evento
A: “Ninguno de los habitantes es daltoniano”, entonces A = {X/ X = 0} P(A) = P(X P( X = 0) = 0.99n Ahora se trata de encontrar el valor de n, con la siguiente condición:
“La probabilidad de que ningún habitante sea daltoniano sea menor que 0.1” Esta condición podemos expresarla simbólicamente como P(X = 0) < 0.1. Si resolvemos esta inecuación, hallaremos el valor para n, ya que P( X = 0 ) = 0.99 n Según a) tenemos P( X = 0) = 0.99 n = 0.01 (Es suficiente encontrar una cota superior en la desigualdad, lo que nos permite resolver en términos de una ecuación). n 0.99n = 0.01 implica que n n Ln 0.99 = Ln 0.01, de donde n = 227, aproximadamente. Ejemplo 94 En una feria, comprando un boleto de 10 pesos se puede participar en un juego que consiste en lanzar 6 argollas para insertarlo en una botella de madera. Los premios del juego son: Una bolsa de caramelo(valor de un peso), al insertar de 1 a 3 argollas Un tarro de duraznos(valor de 4 pesos), al insertar 4 argollas Una botella de vino(valor de 17 pesos), al insertar 5 argollas Una caja de cigarrillos(valor 31 pesos), al insertar las 6 argollas Sabiendo que el jugador promedio tiene una probabilidad de 1/3 de insertar una argolla y que al día se vende en promedio 729 boletos; ¿cuáles son los ingresos netos diarios que el dueño del juego espera obtener. Solución
Sea X la variable aleatoria que representa “El número de argollas insertadas al lanzar 6 de ellas”. Según esto, los valores de X son: 0, 1, 2, 3, 4, 5, 6. Definimos a p = 1/3, la probabilidad de éxito de insertar una argolla. Como las 6 argollas representan la repetición de un ensayo de Bernoulli, entonces X tiene distribución Binomial B(n=6, p = 1/3), cuya función de densidad viene dada por
Si definimos a Y como la “Ganancia neta del dueño del juego”, entonces los valores que toma se muestran en el esquema anterior, con p(yi) = p(xi) , i = 1, 2, 3, 4, 5, 6 Debemos aclarar que ocurre Y = 9 cuando X = 1 ó X = 2 ó X = 3 con lo cual p(9) = 592/729 Encontremos ahora E[Y]: E[Y] = (10)(64/729) + (9)(592/729) + (6)(60/729) + (-7)(12/729) + (-21)(1/729) = 6223 Es decir, la ganancia neta que el dueño espera recibir diariamente será de 6223 soles.
4.9.2 Distribución hipergeométrica
Supongamos que se tiene una población finita de tamaño “N”. Supo ngamos que en esta población “r” elementos de ella poseen un determinado tipo de atributo. Supongamos también que en esta población se realiza el experimento de extraer una muestra de tamaño “n” sin reposición(sin reponer los elementos extraídos). Si se define la variable aleatoria X como “ El número de elementos en la muestra que poseen dicho atributo”, diremos que X tiene Distribución Hipergeométrica, de parámetros N, r y n lo lo cual denotaremos por X → H(N, r, n). Si se define a X: “Número de éxitos obtenido en la muestra de tamañon” y definimos al evento A comoA = { x/ X = x }, entonces P(A) = p(x) = P(X = x) debemos calcularla usando el siguiente razonamiento P(A) = Número de casos favorables / Número de casos posibles
Si deseamos obtener x elementos de un total r elementos, el número de maneras de hacerlo es C(r, x) Del mismo modo, puesto que la muestra debe tener n elementos, los restantes n – x deben ser obtenidos de un total de N – r. El número de maneras de hacer esto es C(N - r, n - x). Luego, el número de maneras de que x posean el atributo, y n – x, que no lo posean, es C(r, x) C(N - r, n - x), lo que constituye el “número de casos favorables”. Por otro lado, si del total de N elementos se desea extraer muestras de tamaño n, el número de maneras de hacer esto es C(N, n). Luego, la función de distribución de X será
Teorema Si X es una variable aleatoria que tiene distribución Hipergeométrica, H(N, r, n), de parámetros N, r y n, entonces
Ejemplo 95 De un lote que contiene 25 artículos, 5 de los cuales son defectuosos, se eligen 4 al azar. Sea X el número de artículos defectuosos encontrados. Obtener la distribución de probabilidad si los artículos se eligen sin sustitución.
Solución Sea X la variable aleatoria definida como el número de artículos defectuosos elegidos en la muestra de tamaño 4. H(25, 5, 4).Según la forma cómo se extraen los artículos, X tiene distribución Hipergeométrica con parámetros N = 25, r = 5 y n = 4; es decir X
Si X = x es el evento “Elegir x artículos defectuosos”, entonces, x defectuosos se puede elegir de C(5, x) maneras mientras que 4-x no-defectuosos se pueden seleccionar de C(20, 4-x) maneras. Por ello, el número de maneras de elegir x defectuosos y 4 -x no defectuosos es, usando el principio de la multiplicación, C(5, x) C(20, 4 -x). Por otro lado, el número de maneras de extraer 4 artículos de un total de 25 es C(25, 4). Finalmente, si B = {X = x } entonces P(B) = C(5, x) C(20, 4-x) / C(25, 4), x = 0, 1, 2, 3, 4. De manera que la función de probabilidad de X, viene dada por p(x) = P(X = x) = C(5, x) C(20, 4-x) / C(25, 4) , x = 0, 1, 2, 3, 4 Distribución Hipergeométrica en Excel:
En Excel para evaluar P(X ≤ k) se debe usar =Distr.Hipergeom(k,n,m,N) donde k : Representa el número de éxitos deseado n : Representa el número de experimentos o tamaño de la muestra m : Representa el número de elementos que tiene el atributo deseado N : Representa el tamaño de la población Ejemplo 96 Sea X una variable aleatoria con distribución Hipergeométrica de parámetros N = 10, r = 6 y n = 5. Determine la verdad o falsedad de las siguientes proposiciones: El rango de X es R X = {0, 1, 2, 3, 4, 5} La distribución de probabilidad de X es p(x) = 1/252 C(6, x) C(4, 5-x), x = 0, 1, 2, 3, 4, 5. El valor esperado de X es 3
La desviación estándar de X es 2 El valor esperado de X² es 2 El 100% de los valores de X son mayores que cero Solución
Si X → H(N=10, r = 6, n = 5) entonces su función de distribución es p(x) = C(6, x) C(4, 5 -x) / C(10, 5) , x = 0, 1, 2, 3, 4, 5 (1) donde μ = n r/N y σ 2 = r/N (1 - r/N)((N-n) / (N - 1))
por lo que μ = 3 y σ2 = 0.66667
Ahora veamos la verdad o falsedad de las proposiciones Puesto que el tamaño de las muestra es n = 5 y r = 6, X toma valores 0, 1, 2, 3, 4 y 5. Por tanto RX = {0, 1, 2, 3, 4, 5}. Luego es verdadera. Dada la distribución en (1), resolviendo el denominador tenemos C(10,5) = 252. Luego la distribución de X puede ser expresada como se muestra. Verdadera. = 3 . Luego es verdadera.El valor esperado de X, por lo que hemos visto, es
Si σ2 = 0.66667 entonces σ = 0.81649. La proposición es falsa. Si V[X] = 0.66667 y V[X] = E[X²] – (μ²) entonces E[X²] = 9.66667. Falsa. P(X > 0 ) = 1 – P(X = 0 ). El evento X = 0 significa extraer 0 de aquellos que cumplen cierta propiedad y por tanto, 5 de aquellos que no la cumplen. Puesto que éstos sólo son 4 y la muestra consta de 5, debemos extraer entonces, necesariamente un elemento de los que tienen la propiedad, es decir nunca ocurre el evento X = 0, por lo que P(X = 0) = 0. Luego P(X > 0 ) = 1. Por ello la proposición es verdadera. Ejemplo 97 En una localidad muy alejada de la capital, se impugnaron los resultados de un proceso electoral. Por ello el Jurado Nacional de Elecciones procedió a examinar 10 mesas con un total de 1450 votos. De acuerdo a las actas del escrutinio, se tenía 48 votos impugnados. ¿Cuál es la probabilidad de que al elegir 5 votos del total de las 10 mesas, se encuentren por lo menos, 2 votos impugnados? Solución
De acuerdo al esquema, X → H(1450,48,5) Por ello p(x) = P(X = x) = C(48, x) C(1402, 5-x) / C(1450, 5)
x = 0, 1, 2, 3, 4, 5.
Sea A es el evento “Se encuentren por lo menos dos votos impugnados”.
P(A) = 1 – P(A’) = 1 – P(X < 2 ) = 1 – P(X = 0) – P(X = 1 ) = 1 - 0.84488 + 0.6057 = 0.145 En Excel
P(A) = P( X ≥ 2 ) = 1 – P(X < 2) = 1 – P(X ≤ 1 ) = 1 – Distr.Hipergeom(1,5,48,1450). Ejemplo 98 María José, es la encargada de la elaboración de la planilla para los 11 trabajadores de su empresa. Debido a su estado emocional de ese día, confecciona 7 nóminas con errores. Puesto que esta no es la única vez que comete ese tipo de error, el Gerente de la empresa se encuentra descontento. Con la intención de tomar decisiones elige 5 nóminas aleatoriamente y encuentra errores en tres de ellas. La Señorita María José se defiende argumentando que el porcentaje de error es muy bajo para ser tomado en cuenta. ¿Cree Ud. que este es un buen argumento?. ¿La teoría de probabilidades respalda este argumento? Solución De acuerdo a los datos, consideraremos como tamaño de la población, N = 11, con r = 7; tamaño de muestra, n = 5. H(11, 7, 5).Sea X la variable aleatoria que representa el “Número de nóminas confeccionadas con error”. Según esto X Debemos hallar la probabilidad de que el número de errores en la muestra sea igual a 3. Si esta probabilidad es pequeña(digamos menor que 0.1), diremos que el argumento de la Señorita María José es válido y la teoría de probabilidades respalda su argumento, en caso contrario, estará equivocada y como tal, sus errores son probabilísticamente altas. Veamos P(X = 3) = C(7, 3) C(4, 2) / C(11, 5) = 0.4545455 Luego el argumento de la Señorita María José no es válido
4.9.3.Distribución de Poisson Sea X una variable aleatoria discreta que toma valores 0, 1, 2, ..., n-1, n, n+1, ... Diremos que X tiene Distribución de Poisson cuyo parámetro es λ y su función de probabilidad es
Notación
Usaremos la notación X → P(λ) para indicar que X tiene una distribución de Poisson. Teorema
Si X una variable aleatoria con distribución de Poisson, entonces μ = λ y Σ² = λ. Observación
El programa Excel no dispone de una función que permita evaluar probabilidades cuando se trata de variables con distribución de Poisson. Ejemplo 99
Si X es una variable aleatoria con distribución de Poisson, con parámetro λ y si P(X = 0) = 0.2. Calcular P(X > 2). Solución Si X tiene distribución de Poisson con λ de parámetro, entonces p(x) = e -λλx / x!. Como P(X = 0) = e-λλ0 / 0! = 0.2 entonces p(0) = = 0.2, de donde e -λ = Ln(0.2), con lo cual λ = 1.6094.= 0.2. Tomando logaritmo neperiano tenemos -λ Luego P(X > 2 ) = 1 – P(X ≤ 2) = 1 – [p(0) +p(1) + p(2) ] = 1 – 0.2(1 + 1.6094 + 1.6094²/2) P(X > 2 ) = 0.21908 Ejemplo 100 Suponga que X es una variable aleatoria con distribución de Poisson. Si P(X = 2) = 2/3 P(X = 1). Calcular P(X = 0) y P(X = 1) Solución Como P(X = 2) = 2/3 P(X = 1) entonces e-λλ2 / 2!
.Al simplificar encontramos λ = 4/3. Luego P(X = 0) = e -4/3(4/3)0 / 0! = e-4/3 ) = 0.26359 Del mismo modo, P(X = 1) = e-4/3(4/3)1 / 1! = 0.35146 Ejemplo 101 Si X es una variable aleatoria con distribución de Poisson tal que el 85% de sus valores son mayores o iguales que 1, ¿cuál es la probabilidad de que X tome como valor 2? Solución
Si X → P(λ), entonces p(x) = P[X=x] = e -λλx / x!. Por ello, según los datos P(X ≥ 1) = 0.85.
Resolvamos esta ecuación para encontrar &lambda: y después encontrar P(X = 2).
P(X ≥ 1) = 0.85 implica que 0.85 = 1 – P(X < 1) = 1 – P(X = 0), de donde e-&lamba;λ0 / 0! = 0.15. Resolviendo para λ, tenemos λ = 1.8971 Por tanto P(X = 2) = (0.15)0.8971192 / 2! = 0.26993 Ejemplo 102 El número de embarcaciones que llegan diariamente al muelle de Huacho tiene una distribución de Poisson con parámetro λ = 2. Las actuales instalaciones portuarias pueden atender un máximo tres embarcaciones por día. Si en un día determinado llegan más de 3 embarcaciones, todos los excedentes deben ser enviados al muelle de Huaura. En un día determinado, ¿cuál es la probabilidad de enviar embarcaciones a Huaura? ¿En cuánto deben ampliarse las actuales instalaciones portuarias de Huacho para permitir la atención de aproximadamente el 90% de la demanda diaria? ¿Cuál es el número esperado de embarcaciones que llega diariamente? ¿Cuál es el número más probable de embarcaciones que llegan diariamente? ¿Cuál es el número esperado de embarcaciones atendidos diariamente? ¿Cuál es el número esperado de embarcaciones enviados a Huaura diariamente? Solución
Si X → P(λ = 2) entonces p(x) = P[X=x] = e -λλx / x!. , aquí X se define como “El número de embarcaciones que llegan al muelle de Huacho diariamente”. De acuerdo a esto Si la capacidad de atención del muelle es hasta 3 embarcaciones, se debe enviar al muelle de Huaura siempre que X > 3. Esto se hace con probabilidad
Sea K la capacidad máxima de atención del muelle de Huacho después de ampliar hasta aproximadamente el 90% . La pregunta consiste en encontrar el valor de K. Para ello tomemos en cuenta la suma de los valores dentro del paréntesis y que están indicados por las flechas. Dicha suma, como lo indica el lado derecho, es 0.85712. Si a ello le sumamos P(X = 4) = 0.09022, tendremos 0.94735. Esto quiere decir que si hacemos K = 4 entonces P(X ≤ 4 ) = 0.94735. Luego las instalaciones portuarias debieran ampliarse de tal forma que pueda atender hasta 4 embarcaciones, en aproximadamente el 90% del tiempo.
= E[X] representa el “Número esperado de embarcaciones que llegan diariamente”, esto es μ = λ = 2.Por otro lado, puesto que E[X] = λ, siendo X la variable aleatoria que representa “El número de embarcaciones que llegan al muelle diariamente”, entonces Ante todo diremos que “El número más probable” es el valor que toma una variable aleatoria para el cual se tiene el mayor valor de probabilidad que en todos los otros valores de la misma. Es decir, K será el valor más probable de X siempre que se cumpla que p(K) ≥ p(x), ∀x / x ε R X . En el problema esto ocurre cuando X = 1 ó cuando X = 2. Luego es muy probable que lleguen al muelle de Huacho uno o dos embarcaciones diariamente. 3)= 0.85712. Si por otro lado llegan en promedio dos embarcaciones, entonces El número esperado de embarcaciones atendidas será 2(0.85712) = 1.71424. 3 se atiende a la embarcación. Esto ocurre con
P(XSea Y la variable aleatoria que representa “El número de embarcaciones atendidos diariamente”. Siempre que X Igualmente, si cuando ocurre X > 3 se envía embarcaciones a otro muelle, y esto ocurre con P(X > 3 ) = 0.14288, el número esperado de embarcaciones enviadas a otro muelle será 2(0.14288) = 0.28576 Aproximación de Poisson a una binomial
Supongamos que se tiene la siguiente situación: El 6% de vehículos que transitan por las calles de Lima Metropolitana tienen tubos de escape defectuosos. Si un día determinado se seleccionan al azar a 100 automóviles y se les examina el tubo de escape, ¿Cuál será la probabilidad de que más de 20 de estos vehículos presenten un tubo de escape defectuoso? B(n = 100, p = 0.06). Si definimos a X como “El número de automóviles cuyo tubo de escape es defectuoso”, con p = 0.06 y n = 100 entonces X
Esto ocurre cuando la probabilidad de éxito “p” es pequeño y n es lo suficientemente grande. Una forma de obtener un resultado más aceptable es aproximar la solución mediante la distribución de Poisson.
Siendo X → B(n, p) con μ = np, y sabiendo que en el caso de una Poisson λ = μ, podemos utilizar la distribución de Poisson como una forma de aproximar problemas con distribución Binomial. Teorema
Sea X una variable aleatoria distribuida binomialmente B(n, p) cuya función de distribución es
Ejemplo 103 Supóngase que la probabilidad de que un artículo producido por una máquina especial sea defectuoso es igual a 0.2. Si se seleccionan aleatoriamente 10 artículos producidos por esta máquina, ¿cuál es la probabilidad de que no se encuentre más de un artículo defectuoso? Use la distribución binomial y la de Poisson y luego compare los resultados.
Solución
Definamos a X como “El número de artículos defectuosos extraídos”. Según los datos del problema la probabilidad de éxito es p = 0.2 y el tamaño de muestra(número de repeticiones del experimento) es n = 10. Está demás decir que la variable tiene una distribución binomial con parámetros n y p. Por ello es natural responde a la pregunta resolviendo
Si bien n = 10 no es suficientemente grande y p = 0.2 no es muy pequeño, de acuerdo a lo pedido en el problema, encontraremos una solución aproximada por la distribución de Poisson: En este caso μ = np = 10(0.2) = 2. Por ello
Puesto que n y p no satisfacen adecuadamente las condiciones para usar el teorema, es lógico que la aproximación no sea buena. Veamos el siguiente ejemplo Ejemplo 104 Una compañía de seguros ha descubierto que sólo alrededor del 0.1 por ciento de la población tiene cierto tipo de accidente cada año. Si 10,000 asegurados fueran seleccionados aleatoriamente de la población, ¿cuál será la probabilidad de que no más de 5 de estos clientes tengan un accidente de este tipo el próximo año? Solución = np = 10000(0.001) = 10. Luego B(n=10000, p=0.001). Si Ud. compara los datos de este problema con el anterior, verá claramente que debemos usar casi necesariamente el Terorema de la aproximación por Poisson. Por ello, Sea X la variable definida como “Número de clientes de dicha compañía de seguros que tiene ese tipo de accidentes al año”. X
Sugerimos a nuestro amable lector que encuentre la probabilidad pedida por Binomial. Creemos que en este caso el resultado debe ser 0.066991373, que ahora sí vale la pena aproximar por Poisson. Ejemplo 105
En una planta ensambladora de equipos eléctricos han ocurrido cierto tipo de accidentes a razón de uno cada dos meses. Suponiendo que estos accidentes ocurren de forma independiente, ¿cuál es el número esperado de accidentes al año?. ¿Cuál es la desviación estándar del número de accidentes al año?. ¿Cuál es la probabilidad de que no haya accidentes de este tipo en un determinado año? Solución Si definimos a Y como el Número de accidentes cada mes, entonces Y es una variable aleatoria con distribución de Poisson en el cual la probabilidad de un accidente es p = 1/2 =rp = 12(½) = 6.Puesto que los accidentes ocurren en un período de tiempo cuya longitud es de un año, definiremos a X como “El número de accidentes que se registra al año”. De acuerdo a esto, diremos que X sigue un proceso poissoniano por ello
El número esperado de accidentes al año es μ = λ = 6. Como la varianza es la misma que la media, entonces %σ = √6 . Finalmente P(X = 0 ) = e-6(6)0/0! = 0.60653 Ejemplo 106 Suponga que el número de reclamos que recibe cierta compañía telefónica, por semana, sigue una Ley de Poisson, de manera que la probabilidad de que ocurran dos reclamos es 2/3 de la probabilidad de que ocurra un reclamo. Calcular la probabilidad de que no ocurra ningún reclamo en tres semanas consecutivas. Solución
Sea X la variable aleatoria definida como “El número de reclamos recibidos en una semana”. Como X tiene distribución de Poisson con parámetro λ, entonces p(x) = e -λλx / x!. Por otro lado, puesto que P(X = 2 ) = P(X = 1) entonces de donde λ = 4/3. Esto significa que el número de reclamos que la compañía telefónica reciba en un período de una semana es 4/3. Para responder a la pregunta definiremos otra variable Y que representa “El número de reclamos recibidos en tres semanas”. De acuerdo a lo dicho en el pro ceso poissoniano, Y tendrá también una distribución de Poisson con parámetro λ = rt = 3(4/3) = 4. Por ello P(Y = 0 ) = e-44-0 / 0! = 0.018316 Ejemplo 107 Se estima que un libro de 400 páginas contiene 400 errores tipográficos repartidos aleatoriamente en todo el libro. Si se supone una distribución de Poisson, ¿cuál es el número de páginas que contienen ningún error? exactamente un error?
más de dos errores? Si se seleccionan aleatoriamente 10 páginas de dicho libro, ¿cuál es la probabilidad de que ninguna de ellas tenga errores? Que 8 páginas no tengan errores? Solución
Ante todo y de acuerdo a las primeras tres preguntas, definamos a X como “Número de errores por página”. Puesto que los errores se distribuyen por todo el libro, la probabilidad de que una página contenga un error de los 400 errores que hay, constituye la probabilidad de éxito p = 1/400, el cual guarda relación con la variable X. Por ello λ = np = 400(1/400) = 1 representa el número de errores por página del libro y es el parámetro de la distribución de X. Luego, como X se define como número de errores por página. P( X = 0 ) = e -1 = 0.36789 con lo cual, El número de páginas sin errores = 400(0.36789) = 147.152 Como P(X = 1) = 0.36789 entonces, el número de páginas con un error = 147.152 Si P(X > 2 ) = 1 – P(X ≤ 2) = 1- e-1 (1 + 1 + 1/2) = 0.0803. Por tanto, el número de páginas con más de 2 errores será 400(0.0803) = 32.12
Definamos ahora a Y como el “ Número de páginas sin error tipográfico” . Piense un poco en la forma cómo se define a X y para qué y también porqué debemos definir otra variable como Y, y por qué así. En este caso, como se eligen 10 páginas, y Y es el número de páginas sin error, la probabilidad de éxito: que una página no tenga error es p = P(X = 0) = 0.36789. Con este nuevo dato, P(Y = 0) = C(10, 0)0.367890(1-0.36789)10 = 0.010184 P(Y = 8) = C(10, 8)0.367898(1-0.36789)2 = 0.0060319
Ejemplo 108 Suponga que un libro de 585 páginas contiene 43 errores tipográficos. Si estos errores se distribuyen aleatoriamente a través del libro, ¿cuál es la probabilidad de que 10 páginas seleccionadas al azar, no contengan errores? Solución
Sea X la variable aleatoria definida como “Numero de errores por página”. Según esto X puede tomar valores 0, 1, 2, ..., 43.
La probabilidad de que un error caiga en una página es p = 1/585. Usando el proceso poissoniano, X → P(λ) donde λ = np = 43(1/585) = 43/585. Luego, la probabilidad de que una página tenga 0 errores es p(0) = P(X=0) = e-43/585 =0.929 Por otro lado, para responder a la pregunta debemos definir otra variable tal como Y que represente: “Número de páginas sin errores”. Y de acuerdo a esta definición, la probabilidad de éxito será p = 0.929. Como por los datos Y → B(n=10, p = 0.929), entonces P(Y = 10) = C(10,10) 0.92910(1-0.929)0 = 0.4788 Ejemplo 109 Suponga que un libro de 1000 páginas contiene 500 errores tipográficos. Si estos errores se distribuyen aleatoriamente a través del libro, ¿Cuál es la probabilidad de que 2 páginas, de 10 seleccionadas al azar, no contengan errores. ¿Cuál es el número de páginas que no contienen errores? ¿Cuál es el número de páginas que contienen exactamente un error? Solución
Como en los dos ejemplos anteriores, definamos a X como la variable que representa “El número de errores por página”. Por ello su probabilida d de éxito es p = 1/1000; es decir, la probabilidad de que un error caiga en una página. Como son 500 los errores, definimos a λ = 500(1/1000) = 0.5 como el parámetro de la distribución de X(Poisson). Por ello, la probabilidad de que una de las 1000 páginas no contengan error es P(X = 0 ) = e-0.5 = 0.6065. Sin embargo, para responder a la pregunta en a) debemos definir otra variable Y que represente “Número de páginas que no contienen errores”. En cuyo caso, su probabilidad de éxito es p = P(X = 0) = 0.6065 y Y → B(n = 10, p = 0.6065). Por tanto P(Y = 2 ) = C(10, 2)0.606520.39358 = 0.009515 El número de páginas que no contienen ningún error es 1000(0.6065) = 607 Volviendo a la distribución de probabilidad de X, debemos hallar P(X = 1), el cual es P(X = 1 ) = e (0.5) = 0.30325. Por lo que, el número de páginas que contengan exactamente un error será 1000(0.30325) = 303 -0.5
Distribución geométrica
Sea ζ un experimento. Supongamos que estamos interesados en la ocurrencia o no de un evento, digamos A. Supongamos también que la probabilidad de que ocurra A es p, en cuyo caso diremos que ocurre éxito. Contrario a ello, q = 1 – p representa la probabilidad de la no ocurrencia de A, es decir, q es la probabilidad de fracaso. Si este experimento se realiza indefinidamente “hasta que ocurra A, por primera vez” y definimos a X como el “Número de veces que se repite el ensayo hasta obtener éxito por primera
vez” , diremos que X tiene distribución Geométrica con parámetro “p” cuya función de probabilidad
viene dada por p(x) = P(X = x) = p qx-1,
x= 1, 2, 3, ....
Notación
X → G(p) significará que X es una variable aleatoria que tiene distribución geométrica con parámetro p. Teorema
Si X es una variable que tiene distribución Geométrica entonces
μ = 1/p;
σ2 = q/p2
Ejemplo 110 Sea X una variable aleatoria que tiene una distribución geométrica con parámetro p = 0.2. Determine la verdad o falsedad de las siguientes proposiciones: El rango de X, es R X = {0, 1, 2, 3, .....} El valor esperado de X es 2 La varianza de X es 1/4 Como p = 0.2, el valor esperado de X2 es 0.04 El 80% de los valores de X son mayores que 1 Solución Puesto que X representa el número de veces que se realiza el experimento hasta que ocurra el primer éxito, X no puede tomar valor 0. Luego la proposición es falsa De acuerdo al teorema, si E[X] = 1/p, y p = 0.2 entonces E[X] = 5. Es falsa la proposición Como V[X] = q/p² = 0.8/0.04 = 20. La proposición es falsa. Si V[X] = 20 y E[X] = 5 entonces E[X²] = V[X] + E[X]² = 25. Es falsa P(X > 1) = 1 – P(X = 1 ) = 1 – pq0 = 0.8. La proposición es cierta Ejemplo 111
Un juego de dados consiste en lanzar el dado hasta que salga un número múltiplo de 3. ¿Cuál es la probabilidad de ganar el juego en el quinto lanzamiento? Solución Puesto que el experimento consiste en lanzar una moneda hasta obtener un 3 o un 6, definamos a X como “El número de veces que debe lanzarse el dado hasta obtener por primera vez un número múltiplo de 3”.
Si definimos el evento A como “Se obtiene un número múltiplo de 3” entonces A = {3, 6} por lo que p = P(A) = 1/3 es la probabilidad de éxito, de obtener un número múltiplo de 3. Luego por la definición de X diremos que tiene distribución geométrica X → G(p=1/3). Para que ocurra A en el quinto lanzamiento del dado, entonces debe ocurrir el evento X = 5. Por ello P(X = 5) = 1/3 (1-1/3)4 = 16/243 = 0.06584 Ejemplo 112 Se lanza el dado hasta que aparezca el 5. ¿Cuál es la probabilidad de que haya que lanzarlo más de 6 veces? Solución
G(p = 1/6), por lo que debemos encontrar la ocurrencia del evento “X Como en el ejemplo anterior, sea X la variable aleatoria definida como el “Número de veces que se debe lanzar el dado hasta que aparezca el 5”. Aquí, X > 6”.
Ejemplo 113 En una población muy grande el 25% de las personas tienen ojos azules. Si se escogen aleatoriamente voluntarios de esta población, uno cada vez, hasta escoger a un voluntario de ojos azules, ¿cuál es la probabilidad de que la quinta persona sea la primera que tiene ojos azules? ¿Cuál es el número esperado de personas escogidas? Solución
Sea A el evento “La persona escogida tiene ojos azules”, Si p es la probabilidad de é xito, entonces p = P(A) = 0.25. Si definimos a X como “El número de veces que debe repetirse el experimento hasta escoger a la primera persona de ojos azules”, entonces G(p = 0.25).X Pedir que la quinta persona se la primera con ojos azules significa que el experimento se repite hasta que en el quinto se obtiene éxito. Luego P(X = 5) = 0.25(0.75)4 = 0.0791 El número esperado de personas escogidas es E[X] = 1/p = 1/0.25 = 4.
Ejemplo 114 La máquina A produce el 5% de piezas defectuosas, mientras que la máquina B produce el 10%. Si se extraen piezas de la producción de cada una de ellas, alternativamente, hasta encontrar una pieza defectuosa, ¿cuál es la probabilidad de que de la producción A tenga que extraerse exactamente 4 piezas y de la producción B, exactamente 6 piezas? Solución
Sea X la variable aleatoria definida como “El número de piezas extraídas de la producción A hasta obtener una defectuosa” y sea Y la variable aleatoria definida como “El número de piezas extraídas de la producción B hasta obtener una defectuosa” Sea A el evento “Extraer una pieza defectuosa de A en la cuarta extracción” y B el evento “Extraer una pieza defectuosa de B en la sexta extracción” Según el problema, debemos encontrar P(A ∩ B). X es una variable con distribución geométrica de parámetro p A = 0.05 y Y tiene también una distribución geométrica con parámetro pB = 0.10. Luego P(A) = p(4) = P(X = 4) = 0.05(0.95)3 = 0.04286875 P(B) = p(6) = P(Y = 6) = 0.10(0.90)5 = 0.059049.
Con lo cual P(A ∩ B) = 0.002536. Ejemplo 115 En una población estudiantil que se reúnen todas las mañanas en el patio, se encuentra que, en un día determinado, los 2/3 de los alumnos están ausentes debido a una epidemia en la zona. Si el Profesor Díaz Cubas pasa lista en su sección de 25 alumnos y definimos a X como el número de alumnos que deben ser llamados hasta encontrar a uno conteste presente, ¿Cuál es la probabilidad de que el décimo niño llamado sea el primero que responda presente? Calcular P(X <3) Encuentre el número esperado de alumnos ausentes y la desviación estándar. Solución
Si X es la variable definida como “El número de alumnos que deben ser llamados hasta que uno responda presente”, entonces X tiene distr ibución Geométrica con parámetro p = 1/3. Esto es así por cuanto los 2/3 de los alumnos están ausentes. La función de distribución de X es p(x) = P(X = x) = (1/3)(2/3)10-x , x = 1, 2, ... P(X = 10) = (1/3)(2/3)9 = 0.00867
P(X < 3 ) = P(X ≤ 2) = (1/3)(2/ 3)0 + (1/3)(2/3) = 5/9 El número esperado de alumnos ausentes es E[X] de manera que E[X] = 1/p = 3
Puesto que la desviación estándar es σ2 = q/p2, entonces σ = 2.4495
4.9.4 Distribución de Pascal
Supongamos que se realiza un experimento ζ de manera repeti da observando sus resultados. Si definimos a X como el “Número de veces que debe repetirse el experimento hasta obtener r resultados exitosos” y definimos a p como la probabilidad de éxito cada vez que se realiza el experimento, diremos entonces, que X tiene Distribución de Pascal con parámetros r y p, cuya distribución de probabilidad viene dada por
Teorema
Si X es una variable que tiene distribución de Pascal, entonces μ = k(1/p) y σ 2 = k(q/p2) Ejemplo 116 Si se lanza una moneda hasta que obtener 5 caras, encuentre la probabilidad de que tenga que lanzarse 12 veces. Encuentre también el número esperado de veces que debe lanzarse la moneda para obtener 5 caras, así como su desviación estándar. Solución Definamos a X como la variable aleatoria que represen ta “El número de lanzamientos realizados hasta obtener 5 caras”. X → Pk(r = 5, p = ½ ). El espacio rango de X es 5, 6, .. Como sólo se deben realizar 12 lanzamientos, la quinta cara debe obtenerse en el décimo lanzamiento. Las otras 4 caras deben caer en los 11 lanzamientos anteriores. Ahora bien, ¿de cuántas maneras podemos repartir 4 caras en 11 posiciones? Esto se hace en C(11,4) maneras. Como por otro lado deben obtenerse 5 caras y la probabilidad de obtener una cara es ½ , entonces ( ½ ) 5 es la probabilidad de obtener 5 caras. Además, Como en 12 lanzamientos deben ocurrir 7 sellos entonces ( 1/2 )7 es la probabilidad de obtener 7 sellos. Luego, la probabilidad de obtener 5 caras y 7 sellos es ( ½ ) 5 ( ½)7. Y esto puede ocurrir en C(11,4) maneras. Luego P(X = 12) = C(11, 4) (1/2)5(1/2)7 = 0.0856 El número esperado de veces que debe lanzarse la moneda hasta tener 5 caras es 5(1/(1/2)) = 10.
Del mismo modo, la desviación estándar, es 5(1/2 / ( 1/2 )2) = 10 Ejemplo 117 La probabilidad de un lanzamiento exitoso es igual a 0.8. Suponga que se hacen ensayos de lanzamiento hasta que 3 de ellos sean exitosos. ¿Cuál es la probabilidad de que sean necesarios 6 intentos? Solución
Sea X la variable aleatoria definida como “El número de lanzamientos realizados hasta q ue tres de ellos sean exitosos”. Por la forma cómo se define a X, sin duda ella tiene distribución de Pascal con parámetros r = 3 y p = 0.8; es decir X → Pk(3, 0.8) y cuya distribución de probabilidades viene dada por p(x) = P(X = x) = C(x-1, r-1)0.8r 0.2x-r . Según esto, p(6) = P(X = 6) = C(6-1, 2)0.830.26-3 = 0.04096 Ejemplo 118 Supongamos que un inexperto vendedor sale a las calles a ofrecer un determinado producto de playa. La probabilidad de que realice una venta efectiva es 0.05. Si un día domingo él decide ofrecer su producto hasta obtener 5 ventas efectivas, ¿cuál será la probabilidad de que tenga que ofrecer su producto a 20 clientes? Solución<
Si X representa “El número de clientes a los que debe ofrecer su producto hasta lograr que 5 de ellos compren” entonces X tiene distribución de Pascal con parámetros r = 5 y p = 0.05. Luego p(5) = P(X = 5) = C(19, 4)0.0550.9515 = 0.000561 Ejemplo 119 Las máquinas A y B producen, en promedio, 5% y 10% de piezas defectuosas, respectivamente. Suponga que se extraen piezas de la producción de cada una de ellas, hasta obtener 3 piezas defectuosas. ¿Cuál es la probabilidad de que tenga que extraerse 6 piezas de la producción de A y 4 de la producción de B? Solución
Sea X la variable aleatoria definida como “El número d e piezas extraídas de la producción de A hasta obtener 3 piezas defectuosas”. Sea Y la variable aleatoria definida como “El número de piezas extraídas de la producción de A hasta obtener 3 piezas defectuosas”. Según los datos: X → Pk(r = 3, p = 0.05) y Y → Pk( r = 3, p = 0.10). En cuanto a la máquina A:
p(6) = P(X = 6) = C(5, 2) 0.0530.953 = 0.00107 En cuanto a la máquina B: p(4) = P(X = 4) = C(3, 2) 0.0530.951 = 0.000356 4.9.5 Distribución multinomial Sea X1 , X 2 , X 3,... Xr , un conjunto de variables alea torias definidas como el “Número de veces que se repite cada una de ellas” con n i el número de veces que se repite X i , diremos que X 1 , X2 , X3,... Xr tienen distribución multinomial si P(X1 = n1 ,2 = n2 , ..., r = nr ) = n! / (n1!n2!...nr !)p1n1p2n2...pr nr ) donde n = n1 + n2 + ... +nr Teorema
Si X1 , X2 , X3,... Xr son variables aleatorias que tiene una distribución multinomial, entonces su esperanza es E[X] = npi y Su varianza V[X] = np i (1- pi ) para i = 1, 2, ..., r Ejemplo 120 Un mecánico mantiene un gran número de arandelas en un depósito. El 50% de estas arandelas son de ¼ de pulgadas de diámetro; el 30% de ellas son de 1/8 de pulgadas y el 20% son de 3/8 de pulgadas de diámetro. Supongamos que se elige 10 arandelas de este depósito. ¿Cuál es la probabilidad de que haya exactamente 5 arandelas de ¼ de pulgada, 4 de 1/8 de pulgada y uno de 3/8 de pulgada? ¿Cuál es la probabilidad de que hay sólo dos tipos de arandelas entre las elegidas? ¿Cuál es la probabilidad de que haya 3 de una clase, 3 de otra clase y 4 de otra clase? Solución Sea X1 la variable aleatoria que representa el número de arandelas de ¼ de pulgada. Sea X2 la variable aleatoria que representa el número de arandelas de 3/4 de pulgada. Sea X3 la variable aleatoria que representa el número de arandelas de 3/8 de pulgada, De acuerdo a esto, el conjunto de variable X1, X2 y X3 tienen una distribución multinomial con probabilidades de éxito 0.5, 0.3 y 0.2, respectivamente. Por ello debemos encontrar
4.10 PROBLEMAS PROPUESTOS Distribución binomial
1. Deduzca la distribución de probabilidad de una variable con Binomial y obtenga su media y varianza. 2. Sea X la variable aleatoria con distribución binomial de parámetros n = 4, p = 0.5. Si el espacio rango de X es { 0, 1, 2, 3, 4 }, encuentre la función de probabilidad de X y construya su gráfica. 3. En una universidad latina, el 70% de los estudiantes de postgrado que obtienen el grado de Doctor en biología en ese país, son ciudadanos de otros países. Considere el número de estudiantes extranjeros en una muestra de 25 estudiantes de ingeniería recientemente graduados y luego a) Calcule P(X = 10)
b) Calcule P(X ≤ 15) c) Calcule la media y la desviación estándar de X. Interprete estos resultados. 4. En un trabajo de investigación se reportó que el 1% de todos los trabajadores de la industria de la construcción son mujeres. En una muestra aleatoria de 10 trabajadores de esta industria, encuentre la probabilidad de que cuando más, uno de ellos sea mujer. 5. En un estudio reciente, Data Consult encontró un gran número de casos de contaminación y errores de etiquetación de conservas en los supermercados de Lima. El estudio reveló un resultado alarmante: el 40% de trozos de anchoveta, disponible para la venta, tenía un nivel de mercurio superior al límite inferior establecido. Para una muestra aleatoria de tres trozos anchoveta, calcule la probabilidad de que
a) Los tres trozos de anchoveta tengan niveles de mercurio por encima del límite permitido. b) Exactamente uno de tales trozos esté por encima del límite permitido. c) Cuando más, uno de tales trozos esté por encima del límite. 6. Un estudio de tendencias a lo largo de cinco años en los sistemas de información logística de la industria reveló que los mayores avances en la computación, tuvieron lugar en el transporte. Actualmente el 90% de todas las industrias contienen archivos de pedidos abiertos de embarque en su base de datos computarizada. En una muestra aleatoria de 10 industrias, sea X el número de ellas que incluyen archivos de pedidos abiertos de embarque en su base de datos computarizada. a) Calcule la probabilidad de que haya más de 5 que incluyen archivos de pedidos. b) Encuentre la media y varianza de la variable X 7. Los registros de una pequeña compañía de servicios indican que el 40% de las facturas que envían son pagadas después de la fecha de vencimiento. Si se envían 14 facturas, cuál es la probabilidad de que a) ninguna se pague con retraso b) cuando menos dos se paguen con retraso c) cuando menos la mitad se pague con retraso 8. Una compañía de exploración petrolera observa que en casi el 5% de los pozos de prueba que perfora, encuentra un depósito de gas natural. Si se perfora 6 pozos, encuentre la probabilidad de que al menos en uno de ellos se encuentre gas. 9. Una prueba de opción múltiple presenta cuatro opciones por pregunta y consta de 14 preguntas. Si la calificación aprobatoria depende de obtener nueve o más respuestas correctas, cuál es la probabilidad de que un estudiante que adivina todas sus respuestas apruebe el examen? 10. Una compañía de bienes raíces observa que uno de cada diez compradores potenciales de casas prometen comprar una si vuelven a consultar por segunda vez. En 10 de estos casos, encuentre la probabilidad de que ninguno compre una casa. 11. En una encuesta reciente se concluyó que sólo el 15% de médicos de un área rural faltan a sus turnos. Se observó que dos de los ocho médicos seleccionados de una lista suministrada por el directorio médico local, también faltan a sus turnos. Suponiendo que la encuesta esté en lo correcto, ¿cuál es la probabilidad de obtener este resultado? 12. Las investigaciones médicas señalan que el 20% de la población general, sufre efectos negativos colaterales al ingerir un nuevo fármaco. Si un médico receta dicho fármaco a cuatro pacientes, ¿cuál es la probabilidad de que a) ninguno sufra efectos colaterales b) al menos uno presente efectos colaterales
13. En una reciente encuesta gubernamental se encontró que el 80% de las familias que viven en una comunidad suburbana, y cuyos ingresos brutos son superiores a $ 15,000 poseían dos autos. Suponiendo que el estudio esté en lo cierto y si selecciona una muestra de 10 familias de esta categoría, obtenga la probabilidad de que exactamente el 20% de los que integran dicha muestra tengan dos autos. 14. Un televisor que presenta 10 series de circuitos tiene uno defectuoso. Ocho de las series son difíciles de reemplazar. Encuentre la probabilidad de que la serie defectuosa no sea una de ellas. 15. Los informes de tránsito indican que el 25% de los vehículos que se detienen en una autopista interestatal no satsifacen las normas de seguridad. Si se detienen 16 vehículos y se les somete a revisión, encuentre la probabilidad de que a) dos o más no satisfagan las normas de seguridad b) cuatro o más no las satisfagan c) nueve o más no las cumplan 16. Un comentarista deportivo acierta al señalar al ganador en 6 de 10 partidos de fútbol. Si una persona simplemente está adivinando, ¿cuál es la probabilidad de que pueda igualar o superar dicha marca? 17. Según los archivos universitarios, de los estudiantes de una escuela de enseñanza media superior, el 15% cambia de especialidad por lo menos una vez durante su primer año de estudios. Si se selecciona 10 estudiantes de los grupos del primer año, encuentre la probabilidad de que por lo menos nueve hayan cambiado. 18. Una gran urna contiene 10 mil canicas de colores, distribuidos según el siguiente cuadro: Blancas Verdes Rojas Negras
5000 3000 1500 500 Si se escogen 20 canicas, encuentre la probabilidad de que haya dos verdes.
19. Remesas de 500 productos cada una son aprobadas si en una muestra aleatoria de 10 se hallan menos de dos defectuosos. Si en realidad una remesa tiene el 5% de artículos defectuosos, ¿cuál es la probabilidad de que sea aprobada? 20. En el problema anterior, qué porcentaje de lotes con 10% de productos defectuosos producirán muestras de 10 artículos en las que ninguno estuviera defectuoso? 21. Un mecánico sabe, con base en su experiencia, que el 90% de los accesorios que desecha al ser reemplazados por otros nuevos, se pueden usar de nuevo. Si para un trabajo se requieren 5 piezas reutilizables, ¿cuál es el número mínimo de piezas desechadas que deberá obtener si desea que la probabilidad de devolver partes sobrantes sea menos de 0.12?
22. La mayor cantidad de quejas de propietarios de automóviles con dos años de uso se debe al funcionamiento eléctrico. Suponga que un cuestionario anual se manda a propietarios de más de 300 modelos y marcas de automóvil, y resulta que el 10% de propietarios de automóviles con dos años de antigüedad han tenido problemas con los componentes del sistema eléctrico, incluyendo el motor de arranque, el alternador, la batería, los interruptores, los instrumentos, el cableado, las luces y el radio. a) ¿Cuál es la probabilidad de que en una muestra de 12 propietarios de automóviles con dos años de uso, haya exactamente dos con problemas en el sistema eléctrico? b) ¿Cuál es la probabilidad de que en una muestra de 12 propietarios haya cuando menos dos con problemas en el sistema eléctrico? 23. Cuando una máquina nueva funciona bien, sólo el 3% de los artículos que produce tienen defectos. Suponga que se selecciona al azar dos partes producidas por la máquina y que interesa la cantidad de partes defectuosas encontradas. a) Describa las condiciones bajo las cuales este caso sería un experimento binomial. b) Trace un diagrama de árbol que muestre un experimento binomial. c) Cuántos de los resultados experimentales consisten en encontrar exactamente un defecto? d) Calcule la probabilidades asociadas con: no encontrar defectos, encontrar exactamente un defecto y dos defectos. Distribución de poisson
24. Las llamadas de emergencia registradas en un conmutador de una estación policial son 4 por hora en un fin de semana cualquiera y el comportamiento del número de llamadas por hora se puede aproximar mediante una distribución de Poisson. a) En un lapso de 30 minutos, ¿cuántas llamadas de emergencia se espera recibir? b) En un lapso de 30 minutos, ¿cuál es la probabilidad de que no se registre llamadas? c) ¿Cuál es la probabilidad de que haya más de 3 llamadas en 30 minutos? 25. El número promedio de radios que una casa comercial vende por día sigue una distribución de Poisson con una media de 1.5. Calcule la probabilidad de que la casa venda por lo menos cuatro radios durante un período de : a) dos días b) tres días c) cuatro días 26. Los defectos en un rollo fotográfico de color promedian 0.1 defectos por rollo y la distribución que sigue el número de defectos es de Poisson. Obtenga la probabilidad de que cualquier rollo fotográfico de color presente uno o más defectos. 27. A una construcción llegan camiones de carga a razón de 2.8 camiones por hora. Obtenga la distribución de probabilidad de tener tres o más camiones que lleguen en un lapso de a) 30 minutos b) una hora c) dos horas.
28. Si el 30% de las personas que viven en una gran ciudad son empleados del gobierno, determine la probabilidad de encontrar personas que no trabajen para el gobierno en una muestra aleatoria de 20 habitantes de dicha ciudad. ¿Cuál es la probabilidad de encontrar diez o menos en la muestra? 29. El 2% de las cartas que se envía a una ciudad no tienen los timbres postales correctos. En 400 de dichas cartas: a) ¿Cuántos timbres incorrectos se esperaría encontrar? b) ¿Cuál es la probabilidad de encontrar 5 o menos cartas con timbres incorrectos. 30. La probabilidad de vender un seguro de vida a personas que contesten un anuncio especial, se estima que es de 0.01. Sobre esta base, si 1000 personas contestan el anuncio, ¿cuál es la probabilidad de que a) ninguno compre un seguro? b) por lo menos uno compre un seguro? c) más de 10 compren un seguro? 31. ¿En qué se diferenciarían las respuestas del ejercicio 29, si el porcentaje de cartas con timbres postales incorrectos fuera del 0.4%? 32. Una encuesta nacional reciente señaló que a las 9 p.m. del sábado, 40% de televidentes sintoniza el canal A, 30% el canal B y 30% el canal C. a) En una muestra aleatoria de 10 televidentes, ¿cuántos se esperaría que estuvieran viendo el canal A? b) ¿Cuál es la probabilidad de que todos estén sintonizando el canal A? c) ¿Cuál es la probabilidad de que 4 sintonicen el canal A, 3 el B y 3 el C? 33. Durante las horas de tráfico intenso los accidentes se presentan en una zona urbana con una frecuencia de dos por hora. El periodo matutino de tráfico intenso dura una hora y 30 minutos, y el vespertino do horas. a) En un determinado día ¿cuál es la probabilidad de que no haya accidentes durante el periodo matutino de tráfico intenso? b) ¿Cuál es la probabilidad de que haya dos accidentes durante el periodo vespertino de tráfico intenso? c) ¿Cuál es la probabilidad de que haya cuatro o más accidentes durante el periodo matutino de tráfico intenso? d) En un determinado día, ¿cuál es la probabilidad de que no haya accidentes durante ambos periodos de tráfico intenso?
Distribución geométrica, de Pascal y multinomial
34. Suponga que X es una variable con distribución de Pascal. Calcule la función de probabilidad para cada uno de las siguientes situaciones: a) p = 0.2, r = 2, x = 3 b) p = 0.5, r = 3, x = 5 c) p = 0.8, r = 3, x = 5 35. Suponga que la variable aleatoria X se distribuye como una binomial negativa con parámetros p = 0.6 y r = 3. a) Calcule la función de probabilidad p(x) para x = 6, 7, 8 y 9 b) Calcule la media y desviación estándar de X
c) Calcule μ + 2σ y μ - 2σ. Luego calcule P(μ - 2σ ≤ x ≤ μ + 2σ) 36. Si la variable aleatoria X tiene distribución geométrica con parámetro p = 0.7 a) Calcule la función de probabilidad p(x) para x = 1, 2, ... , 5 b) Calcule la media y desviación estándar de X
c) Calcule μ + 2σ y μ - 2σ. Luego calcule P(μ - 2σ ≤ x ≤ μ + 2σ) 37. La distribución de parásitos(solitarias) encontrados en varias especies de peces del litoral peruano, se define como una variable con distribución de Pascal. Suponga que el evento de interés es el hallazgo de un parásito en el sistema digestivo de la merlusa. Sea X el número de merlusas que debe muestrearse hasta encontrar una infección por parásitos. Los investigadores estiman la probabilidad de observar un pez infectado en 0.544. Use esta información para estimar las siguientes probabilidades:
a) P(X = 3) b) P(X ≤ 2) c) P(X > 2). 38. Tres tiendas de repuestos venden cierto tipo de autopartes. El vendedor A provee el 50 %, el vendedor B, el 40% y el vendedor C, el 10%. Si se seleccionan aleatoriamente 5 autopartes del suministro total y se les someten a prueba para ver si están defectuosos, a) ¿Cuál es la probabilidad de que los 5 los haya proporcionado el vendedor A? b) ¿Cuál es la probabilidad de que 2 sean de A, dos de B y uno de C? 39. El 30% de los alumnos de una universidad local son del primer año, 30% del segundo, 20% del tercero y 20% del cuarto año. De una lista general se toma una muestra aleatoria de 8 estudiantes. Calcule la probabilidad de que en esa muestra resulten a) dos alumnos de cada año b) tres del primer año, tres del segundo, dos del tercero y ninguno del cuarto
40. Una serie de ocho lámparas se conectan de tal forma que si una de ellas falla, el sistema no funcionará. Si dos lámparas fallan: a) ¿Cuál es la probabilidad de que la primera que se inspeccione sea la que haya fallado? b) ¿Cuál es la probabilidad de encontrar las dos que fallan si se inspeccionan cuatro de ellas? c) ¿Cuántas lámparas se deben inspeccionar para tener un 70% de probabilidad de encontrar las dos lámparas defectuosas? 41. Siete alumnos de una determinada asignatura no ha expuesto aún su tema. El profesor debe seleccionar a dos de ellos para la exposición de hoy. Sin embargo, uno de ellos se disculpa por no estar preparado debido a problemas familiares. El profesor conviene en ello, pero no puede recordar quién es este alumno. Cuál es la probabilidad de que el alumno que se disculpó no sea escogido, suponiendo una selección aleatoria de entre los siete? 42. El diez por ciento de las plantas que se adquieren en el vivero local mueren generalmente antes de dar fruto. a) Si se compran 10 plantas, ¿cuál es la probabilidad de que no muera más que una, antes de dar fruto? b) ¿Cuál es el menor número de plantas que se deben comprar si se quiere tener el 95% de seguridad de que 10 ó más no morirán antes de dar fruto? 43. La probabilidad de que un solo billete de lotería sea premiado es de 1 en 1000. Si una persona desea comprar 50 billetes, ¿cuál es la probabilidad de que con ninguno gane? 44. Se sabe que los defectos en rollos de papel tapiz se aproximan mediante una distribución de Poisson con una media de 2 defectos por cada 10 metros de rollo. Si se compra la mitad de un rollo, ¿cuál será la probabilidad de encontrar más de un defecto? 45. De acuerdo con las estimaciones de una compañía de seguros, la probabilidad de que se registre un incendio en una casa es del 1% al año. La compañía llega a asegurar 400 casas a) Si muchos de los asegurados viven en casas adyacentes, por qué invalidaría esto el uso de la distribución binomial o de Poisson? b) Suponga que los asegurados están suficientemente separados entre casa y casa. ¿cuál es la probabilidad de que no se registren incendios? ¿Al menos uno? 46. Suponga que el 5% de las facturas de venta de una compañía presentan errores en las especificaciones del material o en los números del catálogo, si se examinan cuidadosamente una muestra de 15 facturas, cual es la probabilidad de encontrar uno o menos con estos errores?. ¿Cuántas facturas se espera encontrar con estos errores? 47. Debido a la naturaleza destructiva de la verificación del estado de una tubería a prueba de explosiones, se inspecciona una muestra de partes bastante pequeña. Si de una remesa de 20, una parte está defectuosa, ¿cuál es la probabilidad de que se encuentre ésta, si se toma una muestra de 4 partes?
48. Suponga que el 20% de los adultos que viven en una ciudad nacieron allí, que el 25% nacieron en el estado pero no en la ciudad y que el 40% nacieron en el país pero no en ese estado y que el resto nacieron fuera del país. Si se toma una muestra de cuatro adultos ¿cuál es la probabilidad de que en la muestra estén representados cada uno de los 4 casos? 49. La probabilidad de que una casa se incendie en cierta área es de 0.002. El costo del daño promedio, causado por dicho incendio es de $ 20,000. ¿Cuánto estaría dispuesto a pagar el propietario de una casa por un seguro contra incendio? 50. En una escuela superior de turismo hay 25 alumnos: 14 hombres y 11 mujeres. Cinco de ellos faltaron el jueves de la presente semana. a) ¿Cuál es la probabilidad de que dos de los ausentes fueran alumnas? b) ¿Cuál es la probabilidad de que no hubiera alumnas ausentes?
4.11 DISTRIBUCIONES CONOCIDAS: CASO DE VARIABLE CONTINUA Distribución uniforme
U(a,b) y su función de densidad de probabilidad será Sea X una variable aleatoria continua definida sobre el intervalo (a, b). Diremos que X es una variable aleatoria que tiene Distribución Uniforme sobre el intervalo (a, b) y lo denotaremos por X
1. La figura 4.25 muestra la gráfica de la distribución uniforme 2. Su distribución acumulada La función de distribución acumulada F de una variable que se distribuye uniformemente es
El programa Excel no dispone de alguna herramienta para la distribución Uniforme; sin embargo podemos hacer uso de la distribución acumulada para evaluar probabilidades referidas a la distribución uniforme. Veamos:
Si X → U(a, b) entonces P(X < k) = P(X ≤ k) = (k - a) / (b - a) Teorema
Si X es una variable aleatoria que se distribuye uniformemente sobre el intervalo (a, b) entonces
μ = (a + b) / 2. σ2 = (b - a)2 / 12 Ejemplo 121 Sea X una variable aleatoria que se distribuye uniformemente sobre el intervalo (10, 20). Diga si son verdaderas o falsas las siguientes proposiciones:
El espacio rango de X es (0, +∞ ) El valor esperado de X es 15 La desviación estándar de X es 15 El valor esperado de X² es mayor que 15 El 80% de los valores de X son superiores a 18 Solución De acuerdo a la definición si X tiene distribución uniforme sobre (10, 20) entonces su función de densidad viene dada por f(x) = 1 / (b-a), a ≤ x ≤ b; como tal, su espacio rango es el conjunto RX = {x / 10 ≤ x ≤ 20 }. Por lo que la proposición es Falsa. Puesto que E[X] = entonces E[X] = 15. La proposición es Verdadera. Sabemos que V[X] =(b-a)2 . La desviación estándar σ X = 2.887. Luego la proposición es Falsa.
E[X²] es la integral de 10 hasta 20 de x2 e igual a 700/3. Esto implica que E[X²] > 15. Luego es Verdadero
“El 80% de los valores de X son superiores a 18” se interpreta matemáticamente como que P(X > 18 ) = 0.80. Veamos si esto es cierto: P(X > 18) = 1 – F(18) = 1 - (18-10) / 10 = 0.2. La proposición es Falsa. Ejemplo 122 Sea X una variable aleatoria continua con distribución uniforme sobre el intervalo (-2, 2). Calcular: a) P(X < 3/2 ) b) P( | X | > 3/2 )
P(-1 < X ≤ 1) P( | X - μ | ≤ 1)
c) P(μ - 2σ≤ X ≤ μ + 2σ ) Solución Como X es una variable aleatoria con distribución uniforme sobre (-2, 2), entonces su función de densidad viene dada por
Para hallar P( | X - μ | ≤ 1) debemos tener el valor de μ.
Como μ = E[X] = (a + b) / 2 , entonces μ = 0
Luego P( | X - μ | ≤ 1) = P( | X - 0 | ≤ 1) = P( | X | ≤ 1 ) = P( -1 < X ≤ 1 ) = 1/2
c) Obtención de la desviación estándar, σ: Como σ2 = V[X] = (b - a)2, entonces σ = √ (16/12) = 1.155 Con lo cual P(μ - 2σ ≤ X ≤ μ + 2σ ) = P(0 – 2(1.155) ≤ X ≤ 0 + 2(1.155)) = 1 ya que
Ejemplo 123 Sea X una variable aleatoria con distribución uniforme en (-a, a) , donde a > 0. Cada vez que sea posible, determinar a, de manera que se cumpla lo siguiente: a) P( | X | > 1 ) = P( | X | < 1 ) b) P( X > 1 ) = 1/3 c) P(X < 1/2 ) = 0.7 Solución a) Si P( | X | > 1 ) = P( | X | < 1 ) entonces 1 - P( | X | ≤ 1 ) = P( | X | < 1 ).
Simplificando y “despejando la incógnita”, tenemos P( | X | ≤ 1 ) = 0 .5. Esto significa que
b) Si P( X> 1 ) = 1/3 entonces P(X ≤ 1) = 2/3. Como por otro lado sabemos que F(x) = (x -a) / (b-a), entonces (1+a)/2a = 2/3 de donde a = 3. c) P(X < 1/2) = 0.7 implica que F(1/2) = 0.7, de donde a = 10/8 = 1.25 Ejemplo 124 Isabel Ventura es una eficiente y preocupada gerente de operaciones de una aerolínea local. Sus investigaciones sobre el servicio de vuelos en la ruta Lima - Miami – Lima indican que se ha incrementado considerablemente debido a una fuerte promoción al turismo. Puesto que este servicio depende de la ruta Lima – Cuzco, que también la cubre, el incremento observado puede verse afectado si el tiempo de vuelo entre Lima y Cuzco se incrementa. Ella sabe que el tiempo de vuelo en esta ruta sigue una distribución uniforme con un promedio de 1.5 horas. Sabe además que la diferencia entre el mayor y menor tiempo que puede tardar un vuelo en esta ruta, es de 20 minutos. En la idea de mejorar sus servicios a) ¿Qué porcentaje de vuelos tardará entre 84 y 96 minutos? b) Si sólo el 5% de vuelos llega retrasado en la ruta nacional, ¿cuál es el tiempo máximo para que un vuelo no llegue retrasado? Solución
Sea X la variable aleatoria definida como “El tiempo que tarda un vuelo entre Lima y Cuzco”. Puesto que X tiene distribución uniforme, supondremos que el intervalo sobre el cual está definida su función de distribución f , es (a, b); valores que debemos determinar ante todo.
Como el promedio del tiempo de vuelo es 1.5 horas, entonces (a+b) / 2 = 3 / 2, de donde a+b=180, expresado en minutos. Por otro lado, se sabe que b – a = 20 minutos. Recordando nuestros viejos métodos de solución de sistemas de ecuaciones encontramos a = 80 y b = 100, por lo que la función de densidad de X es f(x) = 1/20 con 80 ≤ X ≤ 100. Ahora resolvamos las preguntas. a) Usando la función de distribución acumulada de X, P(84 ≤ X ≤ 96 ) = (96 - 84) / 20 = 0.6 b) Un vuelo no llegará retrasado si su tiempo de vuelo, X es menor que un valor, digamos K. Esto ocurre con la probabilidad P( X< K) y como se desea que esto sea sólo el 5%, entonces P( X < K ) = 0.05, de donde (k-80)/20 = 0.05. Por tanto, el máximo valor de K será igual a 81. Ejemplo 125
La Agente de corretajes “ISA” recibe de sus clientes un pago fijo de $ 1200 más una comisión del 8% sobre el beneficio que obtiene el cliente en cada transacción realizada por la agencia. Si este beneficio varía por lo general entre $ 10,000 y $ 12,000. a) ¿Cuánto espera obtener de utilidad la agente ISA? b) ¿Cuál es la probabilidad de que su utilidad supere los $ 2,100? Solución
Sea X la variable aleatoria que representa “El benef icio obtenido por el cliente(en unidades de 10,000)”. Puesto que X se distribuye uniformemente entre 1 y 1.2 entonces su función de densidad viene dada por
Definamos también a Y como “La utilidad de la agente ISA”. Según el problema Y = 1200 + 0.08X. a) E[Y] = E[1200 + 0.08X] = 1200 + 0.08E[X] Como X tiene distribución uniforme entonces E[X] = 1.1 Luego E[Y] = 1200 + 0.08*1.1x10000 = 2080.
La agencia “ISA” espera obtener una utilidad de $ 2080. b) Debemos encontrar P( Y > 2100). Recordemos que esta probabilidad podemos hallarla usando la función de distribución de Y, pero como esta no es conocida, y no deseamos obtenerla, usaremos el procedimiento acostumbrado: Reemplazar la definición de Y y despejando X, resolveremos la probabilidad para X, ya que conocemos la función de distribución de X. En efecto P(Y > 2100 ) = P( 1200 + 0.08X > 2100) = P(0.08X > 900). Como X está en unidades de diez mil, para usar las mismas unidades en ambos lados de la inecuación tenemos P(0.08xXx10000 > 900 ) = P(X > 9/8) = P(X > 1.125) = 0.375
Ejemplo 126 El tiempo medio en minutos que cierta persona invierte en ir de su casa a la estación de trenes es un fenómeno aleatorio que obedece una ley de distribución uniforme, en el intervalo de 20 a 25 minutos. ¿Cuál es la probabilidad de que alcance el tren que sale de la estación a las 7:28 a.m. en punto, si sale de su casa exactamente a las 7:05 a.m.?
Solución
Sea X la variable aleatoria definida como “El tiempo que la persona tarda en de su casa a la estación”. Como X se distribuye uniformemente en el intervalo (20, 25), entonces su función de densidad de probabilidad es f(x) = 1/5, 20 ≤ x ≤ 25. Si sale de su casa a las 7:05 y el tren sale de su estación a las 7:28 entonces el tiempo que se tarde en llegar a la estación debe ser menor que 23 minutos; es decir, X < 23. La probabilidad de que esto ocurra es
Ejemplo 127 Los trenes que se dirigen hacia el destino A llegan a una estación cada 15 minutos, comenzando a las 7:00 a.m., mientras que los trenes que se dirigen hacia el destino B llegan a la misma estación cada 15 minutos, comenzando a las 7:05 a.m. Si cierto pasajero llega a la estación en un tiempo uniformemente distribuido entre las 7 y 8 a.m. y aborda el primer tren que llega, qué proporción de veces él va hacia el destino A? Solución El siguiente esquema pretende explicar la situación
Sea X la variable definida como “El tiempo que la persona tarda en ir de su casa a la estación”. X → U(7:00, 8:00). Esto implica que f(x) = 1/60, 0 ≤ x ≤ 60. Puesto que la persona puede llegar entre las 7:0 y 8:0 a.m., para tomar el tren que va con destino a la ciudad A, debe llegar en los siguientes intervalos : Entre las 7:05 a 7:15, entre las 7:20 y las 7:30; entre las 7:35 y las 7:45 y entre las 7:45 y las 8:0. Esto significa que el tiempo que debe tardarse debe ser a lo más, de 10 minutos. Luego, si A representa el evento “La persona llega a tiempo a la estación”, P(A) = P(0 < X ≤ 10).
P(0 < X ≤ 10) es la integral de 0 a 10 de la funció de densidad f(x) = 1/60: el cual es 1/6. Por otro lado, como dicha persona puede llegar antes de los 10 minutos, pero en cualquiera de los 4 intervalos mencionados, entonces, por el principio de la aditividad, P(A) = 4(1/6) = 2/3. Distribución exponencial
Sea X una variable aleatoria continua. Diremos que X tiene una distribución exponencial de parámetro α, si su función de densidad de probabilidad viene dada por
La gráfica de la función de densidad es aquella que se muestra en la siguiente figura
Si x = 0 entonces f(0) = ∞ Si x → ∞ entonces f(x) → 0 Si X se distribuye exponencialmente con parámetro α, entonces su función de distribución acumulada viene dada por
Nota:
Tenga presente a esta función ya que para calcular cualquier forma de probabilidad le será útil ya que no tendrá que estar integrando a f para la probabilidad pedida. Veamos algunos casos:
Teorema
Si X es una variable aleatoria con distribución exponencial, de parámetro α, entonces μ = 1/α σ2 = 1/α2 Usando MS Excel:
La función que permite resolver preguntas referidas a la distribución exponencial es:
P(X ≤ x) = Distr.Exp(x,α,opción)
Donde opción puede ser Verdadero ( 1) si se desea usar la distribución acumulada. Ejemplo 128 La vida útil (en cientos de días) de ciertos repuestos para vehículos es una variable aleatoria que se distribuye exponencialmente con parámetro 2/3. a) ¿Cuál es la probabilidad de que un repuesto de este tipo dure entre 110 y 130 horas? b) Cuántos días durará un repuesto en el 90% de las veces? c) ¿Cuántos días se espera que dure este tipo de repuesto? d) Un perito inspecciona 5 repuestos de este tipo, ¿cuál es la probabilidad de que dos de ellos dure menos de 150 días? Solución
Sea X la variable aleatoria que representa “La vida útil de dicho repuesto”. Como X tiene distribución exponencial de parámetro 2/3, entonces α = 2/3, con lo cual la función de densidad de probabilidad será
Según esto debemos hallar
a) P(110 ≤ x ≤ 130 ) = F(130) – F(110) = 1 - e-2/3(130) - ( 1 - e-2/3(110) ) = 0.244= 0.05995 Usando Excel: =Distr.Exp(1.3,2/3,1)-Distr.Exp(1.1,2/3,1)
b) De acuerdo a los datos tenemos P(X > c) = 0.90 Debemos encontrar c tal que se cumpla la igualdad. Usando la distribución acumulada, tenemos P(X > c) = 1 – P(X ≤ c) = 1 – F(c) = 1 - (1 - e-2/3c )= e-2/3c . Igualando a 0.90 y tomando logaritmo neperiano a ambos miembros tenemos: c = (3/2)Ln(0.90) de donde c = 0.158 ; por lo que el repuesto puede durar hasta 6 días aproximadamente.
c) Puesto que X representa la vida útil del repuesto en cientos de días, E[X] representa el tiempo esperado de vida útil. Y como E[X] = 1/α, entonces E[X] = 3/2 = 1.5 cientos de días; es decir el número de días que se espera que dure este repuesto es de 150 días.
d) Por la naturaleza de la pregunta podemos definir a la variable Y como el “Número de repuestos cuyo tiempo de vida es inferio r a 150 días”. Y puesto que se selecciona 5 repuestos, n = 5 y la probabilidad de éxito es p = P(X < 150 ). Lo que tenemos es que Y es una variable cuya distribución de probabilidad es Binomial con parámetros n = 5 y p = P(X < 150). Hallemos primero p: p = P(X < 150) = F(150) = 1 - e -2/3(150) = 0.6321 Luego P(Y = 2 ) = C(5, 2)0.6321 20.36793 = 0.1990 Ejemplo 129 El tiempo de vida de una batería tiene distribución exponencial, con una desviación estándar de 6 horas. La utilidad por batería es el 20% de su costo C de fabricación cuando el tiempo es mayor que 6 horas; mientras que si dura menos de 6 horas, se pierde el 10% de su costo C. Para qué valor de C se tiene una utilidad esperada mayor que 0.1 por batería? Solución Sea Y la variable aleatoria definida como la utilidad por batería. Según el problema, Y se define como
Decir que la utilidad esperada deba ser mayor que 0.1 por batería significa que E[Y] > 0.1. Será suficiente encontrar un valor de C tal que E[Y] = 0.1. De acuerdo a la definición de Y, tomando valor esperado a Y, tenemos 6) + (-0.10C P(XE[Y] = 0.20CP(X < 6) = 0.20C(1-P(X<6)) – 0.10CP(X < 6) =0.20C –0.30CP(X<6)=C(0.20 – 0.30x(1 - )= C(0.20 – 0.3x0.6321)=0.1036C Haciendo 0.1036C = 0.1, de acuerdo al problema, obtenemos C = 9.65. Para todo C / C > 9.65 se tendrá una utilidad esperada mayor que 0.1 por batería. Ejemplo 130
Supongamos que el intervalo de tiempo entre la llegada de clientes a la ventanilla de un banco sigue una distribución exponencial con una media de 0.20 minutos. ¿Cuál es la probabilidad de que los clientes lleguen en un intervalo menor a los 10 segundos? Solución
Sea X la variable aleatoria definida como “El intervalo de tiempo transcurrido entre la llegada de un cliente y el siguiente, medido en minutos”. Como X tiene distribu ción exponencial con media μ = 0.20, entonces α = 1/0.20 = 5. Luego la función de densidad de probabilidad de X viene dada por f(x) = 5e-5x,
x > 0.
Se pide encontrar la probabilidad de que los clientes lleguen a un intervalo menor a 10 segundos. Diez segundos es equivalente a 1/6 minutos. Pasamos a minutos por cuanto la variable X está definida en minutos. Luego P(X < 1/6 ) = F(1/6) = 1 - e-5(1/6) = 0.5654 Ejemplo 131 Hallar, si existe, la función de densidad de probabilidad exponencial que cumple la siguiente condición:
P(X ≤ 3) = 2/3 P(X ≤ 3) Solución
Si X tiene distribución exponencial con α su parámetro entonces, usando la condición propuesta tenemos
Si hacemos u = e -α entonces en (a), tenemos 2μu 3 – 3μ2 + 1 = 0. Resolviendo esta cúbica mediante el método de Ruffini, encontramos (u – 1)²(2u + 1) = 0 al reemplazar a μ por su valor y pretender resolver las ecuaciones con α, encontramos que no existe un α<>0 que satisfaga la condición planteada. Ejemplo 132
La longitud de vida de una especie de planta en cierto medio ambiente es una variable aleatoria continua X, que tiene una distribución exponencial con una longitud media de vida de 1000 días. a) ¿Qué proporción de plantas de esta especie mueren antes de los 1000 días? b) Si una planta individual vive durante 800 días, ¿cuál es la probabilidad de que viva otros 400 días? Solución Sea X la variable aleatoria definida con la longitud de vida de esa especie de plantas
Como X tiene distribución exponencial con μ X = 1000, entonces α f(x) = 1/1000 e -1/1000x 0, con lo cual
x>
a) La proporción de plantas que mueren antes de los 1000 días es P(X <1000 ) = F(1000) = 1 - e-1/1000(1000) = 0.6321. Nota:
Este tipo de pregunta nos da oportunidad de comentar, mediante un ejemplo, la afirmación de que la distribución exponencial es una función como “ falta de memoria”. Veamos por qué: De acuerdo a lo dicho en la propiedad en cuestión, P(X>s + t /X> s ) = P(X > t ). En este caso, según el problema s = 800 , t = 400, por lo que, aplicando la propiedad tendremos
Ejemplo 133 Considere unos focos producidos por una máquina, de los que sabemos que su duración X, en horas, es una variable aleatoria con distribución exponencial y una media de 1000 horas. a) ¿Cuál es la probabilidad de que una muestra aleatoria de 5 focos no contenga focos con duración menor que 1020 horas? b) Supongamos ahora que la muestra de 5 focos se coloca en una caja. Si se selecciona aleatoriamente un foco de la caja, ¿cuál es la probabilidad de que el foco seleccionado tenga una duración mayor a 1020 horas?
Solución
Sea X la variable aleatoria definida como “El tiempo de vida un foco producido por esa máquina”. = 1/1000 con lo cualX = 1000, entonces Como X se distribuye exponencialmente con f(x) = 1/1000 e-1/1000x ,
x > 0.
a) Como se tiene una muestra de 5 focos, n = 5. Según la pregunta debemos hallar la probabilidad de que ninguno de estos focos tenga una duración menor a 1020 horas. Esto nos obliga a definir otra variable, digamos Y como “El número de focos cuya duración sea menor a 1020 horas”. La probabilidad de éxito para una ocurrencia particular de Y es
b) Ahora se trata de seleccionar un foco de la caja que contiene 5 focos. La probabilidad de que este foco dure más de 1020 horas es P(X > 1020) = 1 – P(X ≤ 1020) = 0.3606 Relación entre la distribución Exponencial y P oisson
Sea X la variable aleatoria definida como “El número de éxitos obtenido en un período de tiempo t” Sea λ el parámetro que representa “El número de esperado de éxitos obtenidos por unidad de tiempo”. Esto significa que, en t unidades de tiempo, el número esperado de ocurrencias será λt , por ello, la distribución de probabilidad de X, así definida será
Ejemplo 134 En un conmutador telefónico se reciben llamadas de acuerdo a un proceso de Poisson con parámetro 5 por hora. Si hay una persona en el conmutador, ¿cuál es la probabilidad de que transcurran al menos 15 minutos antes de la siguiente llamada? ¿De que no pasan más de 10 minutos? Si ya han transcurrido 10 minutos desde la última llamada, ¿cuál es la probabilidad de que transcurran a lo más 5 minutos más para la siguiente llamada? Solución
Sea X la variable aleatoria definida como “El número de llamadas telefónicas llegadas a dicho conmutador por hora”. Por la forma de la definición de la variable, podemos decir que X tiene distribución de Poisson con parámetro λ = 5.
Sea Y la variable aleatoria definida como “El tiempo transcurrido antes que llegue la segunda llamada”, entonces Y tendrá distribución exponencial con parámetro α = λy. Es decir f(y) = α e-λy,
y ≤ 0.
A la pregunta: ¿Cuál es la probabilidad de que transcurran 15 minutos (0.25 horas), antes de la siguiente llamada?, respondemos encontrando la probabilidad de { Y / Y > 0.25 }; es decir, P(Y > 0.25 ) = 1 – F(0.25) = 1 – (1 - e-5(0.25) ) = 0.2865 La probabilidad de que no pasen más de 10 minutos( 1/6 horas) es
P(Y ≤ 1/6 ) = F(1/6) = 1 - e-5(1/6) = 0.5654 La última pregunta hace referencia a una probabilidad condicional. Para ello las conversiones de minutos a horas son: 15 minutos = 1/4 horas; 10 minutos = 1/6 horas.
Por ello debemos encontrar P(Y ≤ 5/12 / Y > 1/6 )
Ejemplo 135
El tiempo (en años) que un satélite permanece en el espacio es una variable aleatoria exponencial T, cuya función de distribución acumulada está dada por F(t) = 1 - e-0.5t,
t≥0
Hallar la probabilidad de que un satélite permanezca en el espacio entre uno y tres años ¿Cuál es la probabilidad de que un satélite permanezca en el espacio más de cuatro años? Si se lanzan tres satélites simultáneamente, ¿cuál es la probabilidad de que por lo menos uno permanezca en el espacio más de cuatro años? Solución
Sea T la variable aleatoria que representa el “Tiempo que un satélite permanece en el espacio”. T tiene distribución exponencial con parámetro α = 0.5, según los datos. Puesto que tenemos la función de distribución acumulada de T, usaremos a esta para responder a las preguntas
P( 1 ≤ T ≤ 3 ) = F(3) – F(1) = 1 - e-0.5(3) - (1 - e-0.5(1) ) = 0.3834 Permanezca más de 4 años significa encontrar. P( T > 4 ) = e-0.5(4) = 0.1353 En este inciso observamos las siguientes características: Número de veces que se realiza el experimento (nro. de satélites) n = 3 Probabilidad de éxito p = P(el satélite permanezca más de 4 años) = 0.1353 La permanencia de los satélites más de 4 años o no son eventos independientes.
Con estas característica, si definimos a X como el “Número de satélites que permanecen más de 4 años”, diremos que X tiene distribución Binomial con p arámetros n = 3 y p = 0.1353 ( B(3, 0.1353) ). Si definimos ahora el evento A: Por lo menos uno permanezca más de 4 años, entonces debemos hallar P(A) = P( X ≥ 1 ) = 1 – P( X < 1 ) = 1 – P(X = 0) = 1 – 0.13530(0.8647)3 = 0.35345 Ejemplo 136 Suponga que el tubo de imagen plana de un determinado tipo de televisor tiene una longitud de vida X (en años), la cual es una variable aleatoria exponencial con una vida media de 5 años. Si el costo de fabricación de un tubo para estos televisores es de $ 40.0 y el fabricante vende a estos tubos a $ 75.0, garantizando un reintegro total si el tiempo de vida del tubo es menor a 4 años, cuál es el beneficio esperado por tubo del fabricante? Solución X es una variable exponencial definida como el tiempo de vida del tubo. Como en el caso de una distribución exponencial μ = 5 = 1/α, entonces α = 0.2. Por otro lado, sea Y el beneficio del fabricante. Según el problema
De donde E[Y] = - 6.30. Esto significa que el fabricante espera tener una pérdida de $ 6.30 por tubo. Ejemplo 137 Supongamos que X representa el tiempo de vida (en unidades de 1000 horas) de un determinado producto, el cual se considera como una variable aleatoria con función de densidad dada por
Donde m representa el factor de producción. El tiempo promedio de vida del producto es de 2000 horas. a) Suponiendo que el costo de fabricación de tales productos es de $ 2.0, y el fabricante los vende por $ 5.0, pero garantiza un reembolso total si el tiempo de vida es, a lo más 900 horas. ¿Cuál es la utilidad esperada del fabricante? b) Si ahora se selecciona cinco de estos productos aleatoriamente, ¿cuál es la probabilidad de que se obtenga por lo menos cuatro productos con tiempo de vida, a lo más, 900 horas? Solución
Sea X la variable aleatoria definida como el “Tiempo de vida del producto”. Como X se distribuye exponencialmente, con una media de 2000 horas, entonces 1/α = 2000; de donde α = 1/2000. Y puesto que m es el factor de producción y además coincide con α, entonces la función de densidad de X es f(x) = 1/2e -1/2x, x>0 (recuerde que X está en miles). La función de distribución acumulada de X es F(x) = 1 - e-1/2x. a) Sea U la utilidad del fabricante. De acuerdo a los datos, la utilidad es de (5-2) por producto siempre que el tiempo de vida, x es mayor que 900 (0.9 miles) será de (0-2) cuando x es menor a 0.9 puesto que el producto se devuelve, en cuyo caso sólo hay costo. La función que define a U es
Luego el valor esperado de U será E[U] = 3P(X > 0.9) + (-2)P(X ≤ 0.9 ) = 3(1-P(X ≤ 0.9 ) –2P(X ≤ 0.9) = 3 – 5 F(0.9) E[U] = 3 – 5(1 - e-1/2(0.9)) = 1.188. Según esto, la utilidad que el fabricante espera obtener será de $1.188 b) En este caso se trata de obtener una muestra de 5 productos ( n = 5). Definamos a la variable aleatoria Y como “El número de productos cuyo tiempo de vida no sobrepasan las 900 horas”.
0.9 ) = 0.3624 Si A es el evento: “Obtener por lo menos 4 productos con tiempo de vida a lo más de 900 horas”, entonces De acuerdo al problema, Y se distribuye binomialmente con parámetros n = 5 y p; es decir Y → B(5, p), donde p = P(X
Distribución normal
Sea X una variable aleatoria continua con -∞< X <+∞.
Diremos que X tiene distribución normal con parámetros μ y σ 2 y si su función de densidad de probabilidad viene dada por
Del mismo modo
P(a ≤ X ≤ b) = F(b) – F(a) Caso particular: Distribución NormalN(0, 1).
Sea X → N(μ, σ2). Si μ = 0 y σ 2 = 1; es decir, si centramos la media de X en el origen de coordenadas y hacemos unitaria la varianza, entonces X → N(0,1) recibe el nombre de distribución normal 0,1 cuya función de densidad es f(x) = (1/√(2π)) e -x . Analicemos esta función normal para obtener importantes conclusiones válidas para la solución de los problemas de aplicación. En primer lugar , si hacemos a X = 0, entonces f(0) = 1/√(2π) = 0.39894228 La función f es una función simétrica respecto al origen de ordenadas Y. Esto implica que definimos un área bajo la curva para el intervalo (0, x0 ) con x0> 0, el área bajo la curva limitada por el intervalo (-x0 , 0), será la misma.
0) = 0.5. 0) = 0.5. Del mismo modo, también, P(X De acuerdo a lo expuesto en ii), P(X Dicho de otra manera F(0) = 0.5
Lo anterior significa que P[0 ≤ X ≤ x 0 ] = P[x0 ≤ X ≤ 0 ]. Usando la acumulada F, tenemos F(x 0 ) – F(0) = F(0) – F(-x0 ) de donde simplificando tenemos F(-x0 )= 2 F(0) - F(x0) . Luego F(-x0 ) = 1 – F(x0)
Adicionalmente, P(X ≥ x0 ) = P(X ≤ x 0 ), como se puede ver en las áreas verdes. Afirmamos que P(X ≥ 4 ) = P(X ≤ -4 ) = 0, por aproximación, lo que se puede comprobar observando la siguiente gráfica
Por esta razón las tablas que usemos tendrán tabuladas a la función de distribución acumulada F desde X = -3 hasta X = 3, aunque cabe mencionar que también algunos libros muestran tablas desde X = -3.9 hasta X = 3.9, si bien sus últimos valores son iguales, a 5 decimales.
En la siguiente figura estamos mostrando el porcentaje de área cubierta por valores de μ y σ2 en los intervalos (μ-nσ, μ+nσ), tales como (μ -σ, μ+σ), (μ-2σ, μ+2σ) y (μ -3σ, μ+3σ). En términos de probabilidades tenemos: P(-1 ≤ X ≤ 1) = 0.6826;
P(-1.645 ≤ X ≤ 1.645 ) = 0.9000; P( -1.96 ≤ X ≤ 1.96 ) = 0.95; P(-2.56 ≤ X ≤ 2.56 ) = 0.9896 Estandarizar una variable normal
Ejemplo 138 ²=25, hallar = 6 y varianza Si X es una variable aleatoria distribuida normalmente con media
a) P(5 ≤ X ≤ 11 ) c) P(-2 < X < 0)
b) P( 0 ≤ X ≤ 8 ) d) P(X > 21)
e) P(| X – 5 | < 5 )
f) P(|X - 5| < 10)
g) P(| X – 5 | > 14.8
Solución
Si X → N(5, 25), entonces μ = 5 y σ2 = 25 de donde σ = 5. Resolvamos cada pregunta:
Ejemplo 139 Suponga que X tiene una distribución N(2, 0.16). Evalúe las siguientes probabilidades:
a) P(X ≥ 2.3)
b) P(1.8 ≤ X ≤ 2.1) Solución
Si X → N(2, 0.16) entonces μ = 2 y σ2 = 0.16 de donde σ = 0.4.
Debemos hallar el z0 de la tabla para el cual Φ(z0 ) = 0.9772 Este valor es z 0 = 2. Luego c/6 ) ( z0, de donde c = 12. Ejemplo 141 Si X es una variable aleatoria que se distribuye normalmente con parámetros 3 y 4, hallara el valor de k si P(X ≥ k ) = 2 P(X < k). Solución Si X → N(3,4) entonces &my; = 3 y σ = 2. Por ello
P(X ≥ k ) = 2 P(X < k) ⇒ 1 - P(X lt; k) = 2 P(X < k) ⇒ P(X lt; k) = 1/3. Pasando a Z, tenemos que → N(0, 1), P/X < (k -3)/2) = 0.3333 de donde Φ((k-3)/2) = 0.3333. Como el área es menor que 0.5, el z que nos dé la tabla deberá ser negativo. Esto quiere decir que si se usa una tabla que muestra valores para z positivos, luego de encontrar el valor de z buscado, se debe cambiar de signo. Por esta razón, si Φ((k -3)/2) = 0.3333 y el valor de z que da la tabla es –0.43, entonces (k3)/2 = -0.43, de donde k = 2.14 Ejemplo 142
Los tubos fabricados por cierta máquina tienen un diámetro medio de μ 9.8 mm, con una desviación σ = 0.53 mm. ¿Qué porcentaje de tubos será rechazado, si no se aceptan diámetros inferiores a 9.0 mm? Asuma que los diámetros tienen una distribución normal. Solución
Sea X la variable aleatoria definida como “La longitud del diámetro de un tubo”. Sea A el evento definido como “Longitud de diámetro inferior a 9.0 mm”; es decir A = {X/X<9 }. Como X → N(9.8, 0.53²) entonces P(A) = P(X < 9) = P(Z < (9-9.8)/0.53) = P(Z < -1.51) = &Phi:(-1.51) = 0.0655. Es decir, el 6.55% de los tubos fabricados por esa máquina serán rechazados. Ejemplo 143 El diámetro de un cable eléctrico está distribuido normalmente con promedio 0.8 y varianza 0.0004. a) ¿Cuál es la probabilidad de que el diámetro sobrepase 0.81 pulgadas? b) Si el cable se considera defectuoso cuando el diámetro se diferencia en su promedio en más de 0.025, ¿cuál es la probabilidad de obtener un cable defectuoso? Solución
Sea X la variable definida como la “Longitud del diámetro del cable eléctrico”.
a) Según el problema, X → N(0.8, 0.0004); esto es, μ = 0.8 y σ = 0.02. P(Z > 0.81) = 1 - P(X ≤ 0.81) = 1 - P(Z < (0.81-0.8)/0.02) = 1-P(Z<0.5) = 1-Φ(0.5) = 1-0.6915 = 0.3085.
b) La frase “El diámetro se diferencia de su promedio en más de 0.025” se puede e xpresar matemáticamente como el evento A = {X/ |X - μ| > 0.025}. Y la probabilidad de que ocurra este evento es P(A) = 1- P(-0.025 /le; X - μ ≤ 0.025) de donde P(A) = 1 - P(-0.025/0.02 ≤ Z ≤ 0.025 / 0.02) = 1 - P(-1.25 ≤ Z ≤ 1.25) = 1 - 2Φ(1.25) = 1-0.7888 = 0.2112 Ejemplo 144 Suponiendo que la duración de los instrumentos electrónicos D1 y D2 tienen distribuciones N(40,36) y N(45, 9), respectivamente. ¿Cuál debe preferirse para usarlo durante un período de 45 horas? ¿Cuál debe preferirse para usarlo durante un período de 48 horas?
Solución Analicemos un poco los datos: La desviación en el primero es igual a 6 horas(supondremos horas ya que el problema no lo dice) mientras que en el segundo es de 3 horas. Tanto el período de 45 horas como el de 48, presentan menor diferencia de medición, respecto a su promedio. Al dividir estas diferencias entre la desviación(para obtener Z) tendremos valores z0 de Z, para los cuales, P(Z < z 0 ) será menor en el segundo tipo de instrumento, con lo cual preferiremos a éste. Bueno y qué tanto de razón tendremos en nuestra “sospecha lógica”? . Observe y analice la siguiente figura.
Analíticamente: Si D1 → N(40,36) entonces μ 1 = 40 y σ1 = 6. Del mismo modo, si D2 → N(45, 9) entonces μ 2 = 45 y σ2 = 3. Se debe preferir aquel instrumento cuya probabilidad de duración en el período de 45 ó 48 horas sea mayor. Para averiguarlo, vamos a encontrar P(D 1 < 45 ) y P(D2 < 45); y lo mismo haremos con el período de 48 horas. Veamos en el caso del período de 45 horas
Como en el primer caso, también aquí debemos preferir al segundo instrumento. Nuestra “sospecha lógica” estaba bien fundamentada. Ejemplo 145 En un examen de suficiencia para ingresar al doctorado se tiene como calificación media la nota de 11 con una desviación igual a 2. Si se desea desaprobar al 40% de los examinados, ¿cuál debe ser la máxima calificación desaprobatoria? Solución
Sea X la calificación obtenida por un postulante. Según el problema, X → N(11, 4). Por ello μ = 11 y σ = 2. Sea X 0 la calificación máxima para desaprobar el examen. De manera que si X ≤ X 0 el postulante desaprobará y P(X ≤ X 0 ) es la probabilidad de que este evento ocurra. Si queremos que el 40% desapruebe, entonces debemos hallar el valor de X 0 tal que P(X ≤ X0 ) = 0.40.
Esto significa que P(X ≤ X 0) = P(Z ≤ (X0-11)/2) = 0.40. El valor de Z 0 para el cual se tiene un área igual a 0.40 es Z 0 = -0.2575 (recuerde que siendo el área menor a 0.5 el Z que le corresponda será negativo y por otro lado, le rogamos que lea la nota para una adecuada aproximación de Z si la tabla no muestra el área que buscamos). Continuemos: igualando el valor encontrado con Z 0, tenemos (X0-11)/2) = -0.2575, de donde X0 = 10.485. Luego la máxima calificación que debe considerarse para desaprobar el examen es 10.485 Ejemplo 146 Un ictiólogo esté interesado en estimar cuánto tiempo puede sobrevivir cierto tipo de pez de mar en aguas del río Amazonas. Luego de una serie de experimentos llega a estimar que la vida media de este tipo de peces alcanza los 210 días después de haber sido colocado en el agua del río, con una desviación estándar de 40 días. El ictiólogo estima que la distribución de los días vividos es normal. Un pez particular ha sobrevivido 230 días, ¿cuál es la probabilidad de que sobreviva más de 240 días? Solución Supongamos que X representa “El número de días vida de cierto pez en las aguas del Amazonas”. Por los datos del problema X → N(210,1600), por lo que μ = 210 y σ = 40.
Sea A el evento “Un pez particular ha vivido 230 días” y B, el evento “Que dicho pez sobreviva 240 días”. Por la forma cómo se plantea la pregunta, debemos encontrar P(B/A), ya que es sab ido de antemano que dicho pez ha sobrevivido los primeros 230 días.
Ejemplo 147 Un determinado programa del gobierno consiste en construir viviendas en los sectores de mayor densidad de Lima. Para la instalación de las redes de agua y desagüe se están utilizando
tuberías en los que el 9.512% de ellos tienen una duración que exceden los 15 años y otra clase de tuberías en los que el 62.556% tienen períodos de duración que exceden los 9 años. Si se considera que la distribución de probabilidades del período de duración de estas tuberías es normal, determine los parámetros de esta distribución. Solución
Sea X la variable aleatoria definida como “El período de duración de las tuberías”. De acuerdo a los datos P(X > 15 ) = 0.09512 y P(X > 9 ) = 0.62556. Usaremos estas dos igualdades para obtener dos ecuaciones con μ y σ, y luego proceder a resolverlas; naturalmente para ello, debemos pasar a Z y plantear cada ecuación por normal.
Ejemplo 148 El gerente de producción de una fábrica piensa que la vida útil de una máquina M está distribuida normalmente con una media de 3000 horas. Si el gerente piensa además que hay una probabilidad de 0.50 de que la máquina dure menos de 2632 horas ó más de 3368 horas, ¿cuál es la desviación estándar? Solución
Ejemplo 149 Una empresa comercializadora, dedicado a la industria alimentaria distribuye harina en bolsas que llevan la etiqueta “Contenido neto: 500 Kg”.
La empresa consciente de la dificultad de los consumidores para adquirir bolsas de 500 gramos, está automatizando el llenado de las bolsas de forma que el peso medio de las mismas pueda ajustarse al nivel que se desee, a fin de bajar los precios(retirando previamente la etiqueta). Si la cantidad de harina por bolsa se considera una variable con distribución normal, con una desviación estándar de 0.2 onzas, a) ¿A qué nivel debe ajustarse el llenado medio de modo que sólo el 0.1% de las bolsas tengan un peso neto inferior a 12 onzas? b) ¿A qué nivel debe ajustarse el llenado medio de modo que sólo el 5% de las bolsas tengan un peso neto superior a 12.4 onzas? c) El Gerente de comercialización decide cambiar los parámetros de ajuste si en una muestra de 10 bolsas encuentra más de 2 bolsas con peso inferior a 12 onzas, ¿cuál es la probabilidad de que el Gerente tenga que cambiar los parámetros? Solución Sea X la variable definida como “Cantidad de harina por bolsa”. Según el problema X tiene distribución normal N(μ, 0.2). Recuerde que 500 gramos de harina igual a 17.637 onzas. a) Si se desea que sólo el 0.1% tengan peso inferior a 12 onzas, entonces P(X<12)=0.001. Esto permitirá encontrar el “llenado medio”, μ. . P(X < 12) = P(Z < (12-μ)/0.2) = Φ(12-μ)/0.2). Como esto es igual a 0.001, entonces (12-μ)/0.2 = Z0.001 = - 3.01, de donde μ = 12.602. Luego el nivel medio debe ser de 12.6 onzas. b) Como en el caso a), P(X > 12.4) = 1 - P(Z ≤ (12.4-μ)/0.2) ⇒ Φ( (12.4-μ)/0.2) = 0.95; de donde la media, μ =12.071 onzas. Esto es, el nivel medio por bolsa debe ser de 12.07 onzas. c) En este caso se elige una muestra de tamaño n = 10. Sea Y la variable aleatoria definida como “Número de bolsas con peso inferiores a 12.4 onzas”. Esta variable tiene distribución Binomial B(n=10, p) donde p = P(X < 12.4) = 0.05. Debemos encontrar P( Y > 2) que será la probabilidad pedida.
Ejemplo 150 En una distribución normal hay 40% de valores inferiores a 50 y 30% de valores superiores a 70. Determine el porcentaje de valores entre 55 y 70. Solución
Sea X la variable definida en el problema con μ y σ 2 sus parámetros.
Se sabe que P(X<50)=0.50 y P(X> 70 ) = 0.30.
Estas dos igualdades nos permitirán obtener los valores de μ y σ 2 para luego encontrar la probabilidad P( 55 ≤ X ≤ 70 ) que es el porcentaje pedido. P(X < 50) = P(Z < (50-μ)/σ) = 0.40. De donde obtenemos
Ejemplo 151 Una
persona viaja diariamente de su casa a su centro de trabajo, y ha observado que el tiempo que tarda en llegar a su oficina tiene una media & = 3.11 minutos. Si sale de su casa todos los días a las 8:20 y debe estar en su oficina a las 9:0, ¿cuántos días al año espera llegar tarde? Suponer que el tiempo que tarda de su casa a su oficina sigue una distribución normal y que realiza 240 viajes anualmente.mu; = 35.5 minutos, con una desviación estándar Solución
Sea X la variable definida como “El tiempo que se tarda la persona en ir de su casa a su oficina”. X → N(35.5, 3.11). Si sale de su casa a las 8:20 y debe estar en su oficina a las 9:0 entonces el tiempo que se tarde en el viaje debe exceder los 40 minutos para llegar tarde. Esto significa que debemos encontrar P(X > 40). Si ahora definimos a Y como “El número de veces que llega tarde a su oficina al año” , E[Y] será la cantidad de días que espera llegar después de las 9:0. Como Y sigue una distribución binomial con n = 240 y p es la probabilidad de éxito, entonces E[Y] = np = 240p.
Por lo que será suficiente encontrar el valor de p = P(X < 40). P(X > 40) = 1 - Φ(1-4471) = '-'75. Con lo cual E[Y] = 240(0.075) = 18 Luego la persona espera llegar tarde a su oficina 18 días durante el año. Ejemplo 152 Un combustible para cohetes va a contener cierto porcentaje X, de un compuesto particular. Las especificaciones exigen que X esté entre 30 y 35 por ciento. El fabricante tendrá una utilidad neta en el combustible(por galón) la que está definida según la siguiente función T
=""> Si X se distribuye normalmente como N(33,9), encuentre la utilidad neta esperada Supóngase que el fabricante desea aumentar su utilidad neta esperada en 50% aumentando su utilidad por galón en aquellas partidas de combustible que satisfacen las especificaciones 30 < X < 35. ¿Cuál debe ser su utilidad neta? Solución
Sea X la variable definida como “El porcentaje de cierto componente contenido en el combustible”. Según a), X → N(33,9) implica que μ = 33 y σ = 3. Si E[T] es la utilidad neta esperada, entonces
que al resolver obtenemos para m = 0.1656, es decir el precio de la ganancia neta en las especificaciones 30 < X < 35 debe elevarse a $ 0.1656 para poder incrementar la utilidad neta esperada en 50%. Ejemplo 153 Los gastos de publicidad que tienen el personal por la introducción en el mercado de un nuevo producto se distribuyen normalmente por semana con una media de $ 950.25 y una desviación de $ 30.35. El gerente de ventas ha decidido premiar con una bolsa de viajes al personal de mercadeo si los gastos que realiza se encuentran en el 15% inferior. Si uno de los miembros del equipo en particular ha gastado $ 912, conseguirá la bolsa de viaje? Solución Definamos a X como “Los gastos semanales realizados en publicidad por un miembro del equipo de mercadeo”. Como X → N(950.25, 30.35²), entonces encontraremos la probabilidad P(X < 912), de manera que si esta probabilidad es menor que 0.15, entonces dicho empleado recibirá la bolsa de viaje. P(X < 912) = P(Z < (912-950.25)/30.35) = Φ(-1.26) = 0.1038 Esto significa que el empleado recibirá la bolsa de viaje ya que 10.38% < 15%. Ejemplo 154 El tiempo de vida de un determinado componente en ensamblaje de un carburador de automóvil tiene una distribución normal con media μ = 1170 días con una desviación estándar
σ = 180 días. El costo de fabricación de cada uno de estos repuestos es de $ 8.0 y se vende en $ 11.0. El fabricante garantiza la calidad de estos repuestos con la devolución del dinero si dicho repuesto deja de funcionar antes de los 36 meses de uso(un mes tiene 30 días). Halle la utilidad esperada por cada repuesto ¿Qué cantidad de dinero se espera devolver en un lote de 100 repuestos vendidos? ¿Cuál es la probabilidad de que de un lote de 10 repuestos, a lo más tenga que devolverse el dinero en dos de ellos? Solución Sea X la variable definida como la vida útil del repuesto de carburador. Según los datos del problema, X → N(1170, 1802). Si U es la variable que representa la utilidad obtenida por repuesto, entonces
La utilidad esperada será E[U] = 2P(X>1080) – 3P(X<1080). Pasando a Z → N(0,1) E(U) = 2P(Z > (1080-1170)/180) - 3P(Z > (1080-1170)/180)=2-5Φ(-0.5) = 2-5(0.3085) = 0.4575
Sea A el evento: “Devolver un repuesto que resulta defectuoso” El evento A ocurre toda vez que el repuesto deja de funcionar antes de los 36 meses. La probabilidad de ocurrencia de A es P(A) = P(X < 1080) = P(Z<-0.5) = 0.3085.
La pregunta es: “¿Qué cantidad de dinero se espera devolver en un lote de 100 repuestos?”. La respuesta es: 5 x Nro. piezas que se espera devolver. El Nro. de piezas que se espera devolver es 100 x P(A) = 30.85. Por ello, la cantidad de dinero que se espera devolver será 5(30.85) aproximadamente igual a $ 154.25 Para responder a esta pregunta debemos mirar al problema desde la perspectiva de otra variable: Tenemos un lote de 10 repuestos.
Si definimos a Y como el “Número de repuestos devueltos” entonces el evento definido en b) indica que P(A) = 0.3085 es la probabilidad de éxito para Y. Los valores que pueda tomar Y son 0, 1, 2, .., 10. Como el hecho de que un repuesto sea devuelto o no, es independiente a lo que ocurra con otro, entonces podemos afirmar que Y tiene distribución binomial con B(n, p) en donde n = 10, p = P(A) = 0.3085).
Luego P(Y ≤ 2 ) = p(0) + p(1) + p(2) = 0.691510 + 10(0.3085)(0.6915)9 + 45(0.3085)2(0.6915)8 = 0.36043 Ejemplo 155 El gerente de Crédito de una determinada cadena de tiendas, estimó que los pagos mensuales, desde que asumió la dirección, siguen una distribución normal con un pago promedio de $10,000.0 y una desviación estándar de $ 1,500.0. El gerente estudia la posibilidad de una tasa de descuento preferencial a sus clientes incentivándolos al pago de sus deudas que consiste en lo siguiente: Hasta el quinto inferior la tasa de descuento será del 3% mensual. Sobre la diferencia, y hasta antes del cuarto superior, la tasa de descuento será del 4% y para el cuarto superior será del 5% mensual. a) ¿Cuáles son los límites de pago máximo y mínimo para acceder a una tasa de descuento preferencial mensual del 4%? b) ¿Cuál es la probabilidad de que un cliente logre el máximo descuento para sus pagos? Solución
a) Sea X la variable definida como “El pago realizado por los clientes de la cadena de tiendas”. El siguiente gráfico nos ayudará en expresar lo que queremos obtener.
Según esto, podemos afirmar que P(X < L1 ) = 0.20 P(X > L2 ) = 0.25 P(L1< X < L2 ) = 0.55. Resolviendo por normal la primera ecuación P(X < L 1 ) = 0.20 encontramos L1 = 8737; del mismo modo, de P(X > L2 ) = 0.25 encontramos L2 = 11,012.50 b) Puesto que el máximo descuento que se obtiene es $ 11,012.50, entonces el pago que el cliente haga debe estar en el cuarto superior, 0.25; que es justamente lo que se nos pide: P(X >11012.50) = 1 –P(Z < 1012.5/1500) = 1 – P(0.675) = 1-0.75 = 0.25
4.12 PROBLEMAS PROPUESTOS 1. Sea X una variable aleatoria continua distribuida uniformemente en el intervalo (0, 4). Encuentre las siguientes probabilidades: a) P(|X| < 3/2)
b) P(|X – E[X] | < 1)
c) P(μ - 2σ ≤ X ≤ μ + 2σ ) 2. Sea X una variable aleatoria que se distribuye uniformemente sobre el intervalo (a, b). Si gráficamente su media está en el origen y su varianza es 3, construya su gráfico. 3. María Isabel es una agente de ventas de “Laboratorios MIVMSA” cuyos honorarios se fija en $ 50.0 más una comisión de 6% sobre las ventas que tiene durante el día. Si las ventas diarias se definen como una variable aleatoria con distribución uniforme entre 0 y 2000 dólares, a) ¿Cuánto espera tener de utilidad María Isabel? b) ¿Cuál es la probabilidad de que su utilidad supere los $140.0? 4. Sea X una variable aleatoria que se distribuye uniformemente con una varianza igual a 4/3 y una media igual a 2 a) ¿Cuál es la probabilidad de que X esté entre –1 y 3.2? b) ¿Qué valor máximo tomará X con probabilidad 0.85? c) Si Y = 4 – 2X, calcule la probabilidad de que Y sea mayor que 0 5. Air Cóndor realizó un estudio sobre el comportamiento del precio de la gasolina de aviación el año pasado. Encontró que el precio promedio fue de 53.5 centavos de dólar por litro. A lo largo del año alcanzó un máximo de 59.5 centavos y parece haber seguido una distribución uniforme. ¿Durante cuántas semanas, el precio rebasó los 56 centavos por litro? 6. El proceso de destilación dela caña de azúcar depende de la temperatura a la cual se le somete el producto a ser destilado. Suponga que T representa dicha temperatura la cual varía entre 150 y 300 grados. Supongamos que el costo para producir un litro de azúcar destilada es C1 dólares. Si el destilado se realiza a temperaturas inferiores a 200, se obtiene un tipo de azúcar destilada que se vende a C2 dólares por litro, mientras que si la temperatura fuera superior a 200, se vende a C3 dólares por litro. ¿Cuál es la utilidad promedio que se espera por litro? 7. Los buses que hacen viaje en la ruta Lima – Huacho – Lima salen de su paradero inicial cada 15 minutos. Si Ud. llega a la estación, encuentre la probabilidad de que tenga que esperar el bus menos de 7 minutos. 8. En el problema anterior, si se sabe que los buses llegan uniformemente cada media hora y si Ud. llega a la estación a las 10:00, ¿cuál es la probabilidad de que Ud. tenga que esperar durante 10 minutos? Si a las 10:15 el bus aún no había llegado, ¿cuál es la probabilidad de que tenga que esperar por lo menos 10 minutos adicionales? 9. Acerca de la cantidad de materia prima demandada por una empresa textil, durante cierto período de tiempo, sólo se sabe que no supera los 1000 kilos. Determinar para dicho período de tiempo, la probabilidad a) de que la cantidad demandada no supere los 900 kilos b) de que la demanda esté comprendida entre 800 y 900 kilos 10. Las clases del Profesor Mario Bunge están programadas para comenzar a las 7:00 a.m.; pero él tiene por norma de trabajo comenzar su clase en un tiempo X, que tiene distribución uniforme en el intervalo 6:57 y 7:02 a.m. ¿Cuál es la probabilidad de que él a) inicie su clase a lo más, 2 minutos más temprano? b) inicie su clase por lo menos, 2 minutos más tarde?
11. Sea X una variable aleatoria que se distribuye exponencialmente con parámetro α. ¿Cuál es la probabilidad de que X se desvíe de su media en no más de 2σ ?
12. Se sabe que el tiempo de servicio(service time) en las cajas de un gran supermercado siguen un modelo exponencial con un promedio de 3.2 minutos. Si un cliente llega a una caja a las 5:00 p.m., encuentre la probabilidad de que a) aún se encuentre a las 5:03 b) todavía esté allí a las 5:04, si se sabe que estuvo allí a las 5:03. 13. El gerente de ventas de la Empresa “MISABEL” solicita a su diseñador más experimentado, que elija el proceso de manufactura para la fabricación de cierto componente nuevo, para el cual hay dos postores. Empleando el proceso A cuesta $ 2.50 fabricar un componente. Empleando el proceso B el costo es de $ 3.2. Los componentes tienen una distribución exponencial del tiempo transcurrido hasta la falla con medias de 200 y 300 horas, respectivamente para los dos procesos. Debido a una cláusula de garantía si un componente dura menos de 400 horas, el fabricante debe pagar una pena de $ 1.20 ¿Cuál de los procesos debe adoptar el diseñador? 14. La cantidad de algodón requerido para la elaboración de ropas de vestir de invierno tiene una distribución exponencial con una media de 4 toneladas, hasta los 25 días antes de que termine dicha estación. a) Encuentre la probabilidad de que la demanda supere las 5 toneladas b) Qué cantidad de algodón habría que almacenar para que la probabilidad de agotar la existencia sea sólo de 0.05? 15. Enfrentando a la creciente competencia en la introducción de nuevos productos de exportación, las tiendas de Gamarra deciden fijar como objetivo el realizar cada proyecto en el tiempo medio de 4 días. Las tiendas de Gamarra saben que los competidores extranjeros pueden realizar un proyecto en 1.2 días. Si la probabilidad de que dichas tiendas puedan alcanzar a la competencia es inferior al 50%, se deberá establecer un nuevo plan de fabricación. ¿Cuál es su decisión respecto al nuevo plan de fabricación? 16. El número de emisiones de una sustancia radioactiva tiene una distribución de Poisson con una media de 30 por hora. Encuentre la probabilidad de que el tiempo que transcurra entre dos emisiones sucesivas sea superior a 5 minutos. 17. Investigaciones realizadas por un estudio jurídico contable indican que el tiempo requerido para un proceso de auditoría está distribuido exponencialmente. Indican también que el 70% de las auditorías realizadas duran más de 6 días. a) Si el responsable del estudio se compromete a iniciar un trabajo de auditoría dentro de 20 días pero debe terminar una que ya ha comenzado, qué tan probable es que cumpla su promesa? b) Si el responsable del estudio realiza auditorias consecutivas independientes, ¿cuál es la probabilidad de que la cuarta auditoria que realiza sea la primera que tarda más de 15 días? 18. Supongamos que X es una variable aleatoria que tiene distribución normal con media igual a 10 y una desviación estándar de 2. Encuentre las siguientes probabilidades:
a) P(X ≤ 13.5) c) P(X < 8.2)
b) P(X > 13.5) d) P(10.4 < X < 10.6)
e) P(9.4 < X < 10.6)
f) P(|X| ≤ 11)
g) P( | X – μ | > 2σ )
h) Para qué valor de a, P(X > a ) = 0.0495
19. Una variable aleatoria que se distribuye normalmente tiene una desviación de 1.8. Si la probabilidad de que X sea mayor que 14.4 es 0.3, encuentre el valor de μ. 20. Las ventas(en miles de dólares por día) de una gran tienda comercial se distribuyen normalmente con parámetros desconocidos. Si se sabe que la probabilidad de que las ventas sean superiores a 4 es 0.9772, y la probabilidad de que las ventas sean mayores que 5 es 0.9332, encuentre dichos parámetros. 21. Los gastos mensuales de administración de una pequeña tienda de abarrotes tienen una media de $ 410.0, con una desviación estándar de $87.0. El propietario se compromete a mantener sus gastos
para el presente mes, por debajo de $ 300 .0. Si los gastos mensuales se distribuyen normalmente, el propietario cumplirá con su promesa? 22. Los ingresos semanales que tiene un humilde cuidador de vehículos en una playa de estacionamiento público se distribuyen normalmente con una desviación de 5 soles. Sabiendo que sólo el 15.87% de los propietarios de los vehículos cuidados han pagado 15 soles o más; y que 125 propietarios pagaron 8 soles o menos; ¿Cuántos propietarios parquearon sus vehículos en dicha playa durante la semana? 23. La firma TomaBien tiene dos plantas cerveceras. La planta A produce 4,000 botellas diariamente, cuyo tiempo de llenado(en segundos desde su lavado hasta que sea enchapado) es una variable aleatoria con distribución normal N(50, 0.25). La planta B produce 6,000 botellas, y su tiempo de llenado también es normal N(50, 0.16). Si se extrae al azar una botella de la producción diaria y resulta tener menos de 49 segundos de tiempo de llenado, ¿cuál es la probabilidad de que provenga de la planta B? 24. El gerente de ventas de MARSA piensa que la vida útil de sus refrigeradoras está distribuido normalmente con una media de 50 mil horas. Si además, el gerente piensa que hay una probabilidad de 0.20 de que la refrigeradora dure menos de 30 mil horas o más de 70 mil horas, ¿cuál es la desviación estándar? 25. El tiempo medio para completar una obra es de 73.2 minutos, con una desviación estándar de 6.3 minutos. Si uno de los trabajadores inicia la obra con un retraso que le significa disponer sólo de 61 minutos para completar la obra, ¿qué probabilidad hay de que lo haga? 26. Un estudio realizado respecto al tiempo de vida de ciertos componentes de computadora personal, afirma que si dicho tiempo es inferior a 115 semanas o superiores a 135 no generan las utilidades proyectadas. Si se supone que el tiempo de vida sigue una distribución normal con una media de 130 semanas y una desviación estándar de 12 semanas, y se adquieren 1000 componentes, ¿cuántos componentes no generarán las utilidades proyectadas? 27. Una imprenta recibe un pedido para elaborar un cartel publicitario. El tiempo requerido para completar el pedido se distribuye normalmente con una media de 18.6 horas y una desviación de 2.2 horas. Si el cliente desea que el cartel le sea entregado en 16 horas, se terminará el trabajo en ese tiempo?
28. La variable grosor (en mm.) en una población de coleópteros sigue una distribución N(μ, σ). Si se estima que el 77% de la población miden menos de 12 mm y el 84% más de 7 mm., ¿cuál es el ancho promedio de la población? ¿y la desviación estándar? 29. El tiempo de vida (en meses) de cierto tipo de bombillas es una variable aleatoria con distribución exponencial de media 12. Un vendedor se compromete a lo siguiente: * Si la bombilla se funde antes del cuarto mes, devuelve al comprador 60 pesetas. * Si se funde en un instante x entre el cuarto y sexto mes, le devuelve 180 – 30x pesetas. * Si se funde a partir del sexto mes, no devuelve nada Si el vendedor gana en cada bombilla 100 pesetas se pide: a) Obtener la distribución de la ganancia obtenida por bombilla, b) Calcular la ganancia media por bombilla. Si una persona compra 10 bombillas, calcular la distribución de probabilidad del número de bombillas que devolverá antes del primer mes. 30. En el grupo étnico A, la estatura de las personas(en cm.) sigue una distribución N(165, 25); en el grupo étnico B sigue una distribución N(170, 25) y en el grupo étnico C, N(175, 25). Los tres grupos étnicos son muy numerosos. a) Si elegimos aleatoriamente a una persona del grupo A, ¿cuál es la probabilidad de que mida más de 170 cm? b) Si elegimos a 10 personas del grupo A, ¿independientemente unas de otras, cuál es la probabilidad de que entre todas midan más de 1600 cm?
c) En una ciudad, el 50% de la población pertenece a la etnia A, el 20% pertenece a la etnia B y el 30% restante a C. Si elegimos una persona al azar en esta ciudad y mide más de 172 cm., ¿cuál es la probabilidad de que pertenezca al grupo étnico C? d) Si elegimos 100 personas al azar del grupo B, independientemente unas de otras, ¿cuál es la probabilidad de que al menos 40 midan más de 172 cm?.
4.13 OTRAS DISTRIBUCIONES CONTINUAS La estadística dispone de otras variables aleatorias con distribuciones conocidas las que por lo general son útiles en la aplicación de problemas de muestreo, cuando el tamaño de muestra es pequeño; es decir, cuando no se puede aplicar el TLC. Estas distribuciones son:
χ2 : La distribución Chi – cuadrado t : La distribución t de Student F : La distribución F de Fisher Haremos un estudio muy breve de cada una de ellas y emplearemos el Excel para resolver problemas de probabilidad; y más tarde volveremos a usarlas para resolver problemas de muestreo y distribución muestral en los casos en que el tamaño de muestra sea pequeño. Para ello empezaremos definiendo la distribución Gamma ya que, como veremos, las anteriores son derivaciones de ésta. Función gamma Diremos que f es la función gamma si se cumple que
Distribución gamma
Sea X una variable aleatoria continua. Diremos que X es una variable que tiene distribución Gamma, de parámetros α y β, si su función de densidad de probabilidad viene dada por
y lo denotaremos por X $rarr; G(α , β)
donde τ(α) es la función Gamma. Un esbozo de la gráfica de esta distribución es la siguiente:
En la cual se muestra la gráfica para distintos valores del parámetro α. Propiedades
P1. Si X %rarr; G(α, β) entonces µ= α β y σ 2 = α β2 P2. Si X → G(α, β) y α = 1 entonces X se define como una variable con distribución exponencial de parámetro 1/β Nota
Estas gráficas se han construido usando el programa Excel. Para ver cómo se han elaborado, abra el archivo Gráfica de Gráfica de Chi - t - F. F. Otra gráfica: La siguiente figura muestra la gráfica de la distribución gamma para diferentes valores de sus parámetros, construidos en MS Excel.
Distribución chi – cuadrado: χ
2
Sea X una variable aleatoria. Diremos que X tiene distribución Chi – cuadrado a la que denotaremos por X → χ2 , donde v es el parámetro, si su función de densidad viene dada por
Observación: Esta distribución también es un caso particular de la distribución gamma, en la cual hemos hecho β = 2 y α = v/2. Propiedades
P1. Si X → χ2(v) entonces μ = v y σ = 2v ; donde v representa los grados de libertad de la distribución. P2. Si Z → N(0, 1) entonces Z2 → χ2 (1)
Su gráfica es
Obsérvese que, a diferencia de la normal, ésta no es una distribución simétrica. La distribución sólo toma valores positivos. Distribución t de student
t(m), si su función de densidad viene dada por Sea X una variable aleatoria continua. Diremos que X tiene distribución t de Student lo que denotaremos por T
donde el parámetro m representa los grados de libertad. La gráfica de esta distribución se muestra en la figura
Observación 1:
Si expandimos los valores de la variable en los alrededores de su valor central, la gráfica podría presentar un máximo bastante suavizado visualizándose como la campana de Gauss.
Esto se aprecia en la siguiente figura
Observación 2
Como se puede apreciar en la definición, esta función es simétrica y gozar por tanto de la misma propiedad de una variable normal: P(-a < X < a) = 2 F(a) -1 Teorema
Si X → t(m) entonces μ = 0 y σ2 = m/(m-2)
,
m > 2 Propiedades
Distribución f de Fisher
Sea X una variable aleatoria continua con f su función de densidad de probabilidad. Diremos que X tiene distribución F de Fisher y lo denotaremos por X → F(n, m) con n número de grados de libertad del numerador y m número de grados de libertad del denominador , cuya función de densidad es la siguiente:
donde τ(.) es la función Gamma. La gráfica de esta distribución se puede apreciar en la siguiente figura
Propiedades
P1. Si X → F(m, n) entonces μ = n /(n-2) y σ = [2n(n+m-2)] /[ m(n-2)2(n-4)], n>4; donde n representa los grados de libertad del numerador y m los grados de libertad del denominador.
Ejemplos usando el programa Excel:
El programa Excel dispone de las siguientes funciones referidas a estas distribuciones continuas.
Distribución Gamma
≤ K)
Para calcular P(X
=Distr.Gamma(K,α, β,tipo) Donde α y β son los parámetros y tipo=1 para acumulada.
Para hallar K si P(X ≤ K) = p
=Distr.Gamma.Inv(p, α, β)
Distribución Chi – cuadrado
≤ K)
Para calcular P(X
=1-Distr.Chi(K,gl) Donde gl representa los grados de libertad
Para hallar K si P(X ≤ K) = p
Excel no dispone de una función para resolver este problema.Para ello hemos creado un procedimiento que se encuentra en el archivo Valor invChi. Para usarlo es suficiente usar el método abreviado: [Ctrl]+i
Distribución t de Student
≤ K)
Para calcular P(X
=1-2*Distr.t(K,gl,2) donde 2 indica doble cola.
=Distr.t.inv(2*p,gl)
Para hallar K si P(X ≤ K) = p
Distribución F de Fisher
≤ K)
=1-Distr.f(K,gln,gld)
Para calcular P(X
donde gln: grados de lib. en el numerador gld: grados de lib. en el denominador.
=Distr.F.Inv(1-p,gln,gld)
Para hallar K si P(X ≤ K) = p
Ejemplos de aplicación directa:
A continuación presentaremos algunos ejemplos directos que no merecen mayor comentario ni procedimiento: Para una variable aleatoria X, con distribución Chi-Cuadrado con 15 gl, encuentre: a) P(X < 3.89)
b) P (X > 12.495 )
Rpta: a) 0.0019243
c) P( 1.58 < X < 10 )
b) 1-0.358759
c) 0.180260 - 0.0000061
Para una distribución Chi-Cuadrado, encuentre el valor de a, en cada caso:
a) P(χ2(8) < a ) = 0.95; Rpta. a) 15.5073
b) P(χ2(10) > a) = 0.5; b) 18.3070
c) P( χ2(18) > a) = 0.99
c) 7.01491
Para una variable aleatoria X con distribución t de Student,con 20 grados de libertad, encuentre: a) P(X < -1.594) Rpta. a) 0.0633089
b) P(X > 2.49) b) 1-0.989154
c) P(-1.58 < X < 1)
d)P(|X| >1.89)
c) 0.835372 – 0.0648966
Para una distribución t de Student, encuentre el valor de a en cada caso:
d) 0.07334
a) P(t(10)> a) = 0.025 b) Rpta. a) 2.22814
P( t(15)> a ) = 0.10
b) 0.34061
c) P(1.476 < t(5) < a) = 0.075
c) F(a) = 0.075 + F(1.476) ; a = 0.81283
Para una variable aleatoria X con distribución F, con 5 grados de libertad en el numerador y 8 grados de libertad en el denominador, encuentre a) P(X < 2.86) Rpta. a) 0.909794
b) P(X > 0.875)
c) P(0.25 < X < 3.84 )
d) P(| X | < 5)
c) 0.95478 – 0.0716954
b) 1-0.462061
d) 0.977426
Para una distribución F, encuentre el valor de a, en cada caso: a) P(F(12,9) < a)= 0.4785 0.9584 Rpta. a) 0.984888
b) P(F(14,16)> a)=0.2475
b) 1.42265
c) P(a < F(21,19) < 2.5) =
c) F(a) = F(2.5) - 0.9584; a = 0.01694
En cada uno de los siguientes casos, hallar la probabilidad correspondiente:
Si X → χ2(17) , hallar a y b tal que P( a< X < b ) = 0.88 y P( X > b ) = 0.02 Sugerencia: Primero encuentre b, luego resuelva P(a < X < a) = 0.88
Si X → t(9), hallar P(X ≥ 1.1), P(-0.703 ≤ X ≤ 4.297 ) , P( X ≤ -2.398) Si X → t(6), hallar c tal que P(X > c) = 0.10 Si X → F(4,5), hallar P(X ≥: 5.19 ) ,
P( 3.52 ≤ X ≤ 15.56) ,
P(X ≤ 7.39)
Si X → F(2,3), hallar c de tal manera que P( X ≥ c ) = 0.05 Abra el archivo Grafica de chi-t-F. Observe la forma de la gráfica de cada una de las distribuciones. Modifique el valor de los parámetros de las distribuciones Chi – Cuadrado y t de Student y observe cuándo su comportamiento es aproximadamente normal. Modifique los valores de los grados de libertad y observe la gráfica resultante. ¿Qué conclusión obtiene si los grados de libertad (directamente relacionados con el tamaño de muestra) se incrementan?. Tomando en cuenta las gráficas que se muestran en el archivo del ejercicio anterior, ¿cuál de estas distribuciones es simétrica respecto al eje Y? ¿En cuál de estas distribuciones se puede aplicar las siguientes propiedades de la distribución acumulada?:
F(-k) = P(Z ≤ -k ) = P(Z > k) = 1- P(Z ≤ k ) = 1 – F(k) P(-k ≤ Z ≤ z ) = 2 F(k) -1 Ejemplo 156
Sean X, Y, W, U variables aleatorias independientes tales que X → N(40, 25); Y → χ² (10); W → χ² (5); U → t(7). a) Hallar el valor de k tal que: P[ (X - 40)² > k ] = 0.10
Como X → N(40, 25), al dividir la expresión entre 25 obtenemos P((X-40)2/40 > k/25) = 0.10
de donde P((X-40)/5)2>k/25) = 0.10
La expresión del primer miembro es Z² lo cual, según la propiedad 2 de χ² se distribuye χ² con un grado de libertad. Por tanto P(χ² (1) > k/25 ) =.10 De donde P(χ² ≤ k/25 ) = 0.90 Usando el archivo Valor invChi encontramos k = 67.6385 b) Hallar P(k < W + Y < 27.488 ) = 0.95
En este caso las W e Y tienen distribución χ² y como son dos variables, el número de grados es de libertad es 2. Luego P( k < χ² (12) < 27.488 ) = 0.95 Esto significa que F(27.488)-F(k) = 0.95 ⇒ F(k) = 0.974997 – 0.95 De donde k = 6.262. Hemos usado grados de libertad = 5 + 10 = 15 c) Encuentre P( W/Y < k)) = 0.90
Qué variable se genera al dividir dos variables que son χ² ? Al dividir al numerador entre 5 y al denominador entre 10, logramos construir una nueva variable de la forma: T = (W/5) / (Y/10); según esto, T tiene una distribución F de Fisher; por tanto, logramos obtener una F(5, 10) d) Hallar k talque P( | U | > k ) = 0.20
P(|U|<= k ) = 0.80 ⇒ P(-k < U < k) = 0.80) ⇒ 2f(k)-1=0.8;
de donde f(k) = 0.9
Ejemplo 157
Si X → χ2(12) resuelva las siguientes preguntas: P(X ≤ 5) P(X ≥ 5) Encuentre el valor de k tal que P(8 ≤ X < k) = 0.95 Solución Usando la distribución acumulada de la distribución Chi-cuadrado, tenemos
P(X ≤ 5) = F(5) = 0.04202 P(X ≥ 15) = 1 – P(X < 15 ) = 1 – 0.75856 = 0.24146 Como P(8 ≤ X < k ) = F(k) – F(8) entonces F(k) – F(8) = 0.65 Como F(8) = P(X ≤ 8) = 0.21487 Entonces F(k) – 0.21487 = 0.65 De donde F(k) = 0.86487 Usando el archivo mencionado en a) se puede encontrar el valor de k. Ejemplo 158
Si X → N(0, 1),
Y → χ²(8)
yR
= X / √(Y/8);
obtenga P(R ≤ 2)
Solución Observando la propiedad 1 de la distribución t de Student podemos ver que R es un cociente de una N(0, 1) y la raíz de una Chi – cuadrado que está dividida por su grado de libertad; en consecuencia R tiene distribución t(8) y luego P(R ≤ 2) = P(t(8) ≤ 2) = 0.959742 Ejemplo 159
Si X → N(0, 1), Y → t(12) y R = X / √ (Y/8), Solución
Obtenga P(R ≤ 2).
En este caso, en lugar de 8 que divide a Y debiera estar 12, que son los grados de libertad de Y. Extraeremos 1/8 del radical y multiplicaremos a Y por 12 y dividiremos entre 12, como se muestra a continuación
Ejemplo 160 Las variables X , Y , W son independientes con distribuciones respectivas:
X → χ2(10), , Y → t(20),
W → χ2(15).
Hallar : Los valores de c y k tal que: P(c < X < k) = 0.94 si P(X > k) = 0.015. P(|Y| < 2.04) El valor de h de modo que: P(h < X + W < 34.3816) = 0.65 Solución Si P(X > k ) = 0.015
⇒
P(X ≤ k) = 0.985. Por Inverse en Chi – cuadrado, se tiene k = 22.0206
P(|Y| < 2.04 ) = P(-2.04 < Y < 2.04 ) = t(20)(2.04) – t(20)(-2.04) = 0.9452 Siendo X y W variables Chi-Cuadrado, entonces X+W → χ 2(25) y P(h < X + W < 32.3819)=0.65,
tenemos P(h < χ2(25) < 32.3816) = 0.65 De donde χ2(25)(32.3816) - χ2(25) (h) = 0.65. Usando Minitab obtenemos: 0.872735 - χ²(25)(h) = 0.65 . Simplificando χ²(25) (h) = 0.222735. Y usando inverse en Chi – cuadrado, encontramos h = 19.4057
Solución
4.14 VARIABLES ALEATORIAS BIDIMENSIONALES Definición
S existe un número real x para el cual x = X(s) y también un número real y tal que y = Y(s). Bajo estas consideraciones diremos que (X, Y) recibe el nombre de variable aleatoria bidimensional. Sea ζ un experimento aleatorio y Ω el espacio muestral asociado a ζ. Sean también X = X(s) y Y = Y(s) dos funciones que asignan un número real a cada resultado s del experimento, contenido en el espacio muestral; es decir, para cada s Observaciones
1. En el gráfico podemos apreciar que si Ω es el espacio muestral asociado a ζ, entonces, la variable aleatoria X tomará los valores x1, x2, ... xn .
2. Así como las variables aleatorias X e Y tienen su espacio rango ℜX y ℜY, respectivamente, así también la variable aleatoria bidimensional (X, Y) tiene su espacio rango ℜ (X, Y). 3. El espacio rango de (X, Y), es un conjunto formado por pares ordenados del plano cartesiano. 4. La observación anterior nos sugiere entonces que, si las variables aleatorias X e Y pueden ser discretas o continuas, la variable aleatoria bidimensional (X, Y) también puede ser discreta o continua. 5. Nuevamente remitiéndonos a la observación anterior, en el caso de que (X, Y) sea una variable bidimensional discreta, su espacio rango será un conjunto de retículas (o nodos de una red) del plano cartesiano; en cambio si (X, Y) es una variable continua, su espacio rango será una región continua del plano cartesiano y será una parte del producto de los intervalos [a, b] x [c, d] ∈ R² donde a ≤ X ≤ b y c ≤ Y ≤ d. Tipos de Variable Aleatoria
Diremos que (X, Y) es una variable aleatoria bidimensional discreta si el conjunto de los valores posibles de la variable es finito o numerablemente infinito. Este conjunto, llamado espacio rango ℜ(X, Y) es un conjunto reticular.
Los valores posibles de (X, Y) pueden ser representados como pares ordenados (x i, y j) para i = 1, 2, ..., n, ... y j = 1, 2, ..., m, ... Diremos que (X, Y) es una variable aleatoria bidimensional continua si el conjunto de los valores posibles de la variable es un conjunto infinito. Este con junto constituye una región en el plano cartesiano, como se muestra en la siguiente figura
Los valores que la variable aleatoria bidimensional toma, pertenecen a una región cartesiano tales que ℜ(X, Y) = { (x, y) / a ≤ x ≤ b, c ≤ y ≤ d }.
ℜ(X, Y) del
plano
Distribución de probabilidad para (X, Y) Caso 1: variable aleatoria bidimensional discreta
Sea (X, Y) una variable aleatoria bidimensional discreta, con ℜ(X, Y) su espacio rango. Si p(x i, y j) es una función tal que a cada par (xi, yj) le asigna el número real P(X = x i, Y = y j) diremos entonces que p(x i, y j ) es función de probabilidad conjunta de (X, Y) , siempre que cumpla las siguientes condiciones:
Observaciones
p(xi, y j) = P(X = x i, Y = y j) es la probabilidad de que ocurra el evento compuesto { X = x i , Y = y j } i = 1, 2, 3, ..., n, ... ; j = 1, 2, 3, ..., m, ... La gráfica de la función de probabilidad de (X, Y), como en el caso unidimensional, son barras verticales al valor de la variable. Como en este caso el espacio rango es un espacio reticulado, el valor de probabilidad para un valor de la variable será una barra perpendicular en el nodo correspondiente, como se puede apreciar en la siguiente figura.
La función de probabilidad conjunta de (X, Y) se presenta, por lo general, en forma de un cuadro de distribución de doble entrada. Los valores de las variables X e Y se colocan en las primeras filas o columnas y en el centro del mismo, el valor de sus respectivas probabilidades, como se muestra en la siguiente figura
La distribución acumulada en el caso discreto
Unidad 4. VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD () Ejemplo 162 Sea (X, Y) una variable aleatoria bidimensional cuya función de probabilidad conjunta viene dado en el siguiente cuadro. X\Y 0 1 2 3
0 0.01 0.12 0.09 0.01
1 2 3 4 0.11 0.0 0.10 0.05 0.01 0.12 0.04 0.01 0.08 0.0 0.12 0.03 0.05 0.02 0.0 0.03
Encuentre las siguientes probabilidades: a) p(0, 3) d) P(X = 2)
b) P(X<3, Y = 2)
c) P(X > 0, Y ≥ 2)
e) P( Y = 2)
Solución a) p(0, 3) = P(X = 0, Y = 3) = 0.01 b) P(X<3, Y = 2) es la suma de todas las probabilidades conjuntas cuando la variable X toma valores X = 0, 1 y 2; mientras que Y toma valores Y = 2; es decir que P(X<3, Y = 2) = p(0, 2) + p(1, 2) + p(2, 2) = 0.09 + 0.08 + 0.00 = 0.17 c) En este caso es más cómodo usar complementos:
P(X>0, Y ≥ 2) = p(1,2) + p(1,3) + p(2,2) + p(2,3) + p(3,2) +...+ p(4,3) = 0.33 d) P(X = 2) es la probabilidad de que ocurra el evento { X = 2 }. Pero este evento ocurre cuando Y = 1; también ocurre cuando Y = 2 o cuando Y = 5 o Y = 9; por lo que, P(X = 2) = 0.0 + 0.12 + 0.0 + 0.02 = 0.14 e) Del mismo modo, P(Y = 2 ) = 0.09 + 0.08 + 0.0 + 0.12 + 0.03 = 0.32. Aquí también cuando Y = 2, la variable X toma todos los valores de su recorrido: 0, 1, 2, 3, 4. Ejemplo 163 Una urna contiene 3 bolas numeradas 1, 2, 3, respectivamente. De la urna se extraen dos bolas, una después de otra, sin reposición. Sea X el número de la primera bola extraída y Yel número de la segunda bola. Hallar la distribución de probabilidad conjunta de (X, Y).
X\Y 1 2 3
1 0.0 1/6 1/6
2 1/6 0.0 1/6
3 1/6 1/6 0.0
Solución
Sea X la variable aleatoria definida como “El número de la primera bola extraída”. Sea Y la variable aleatoria definida como “El número de la segunda bola extraída”. Según esto: X = 1, 2, 3; Y = 1, 2, 3. Por lo que el espacio rango de (X, Y) es el conjunto {(1, 2), (1, 3), (2, 1), (2, 3), (3, 1), (3, 2) }. Hallemos cada una de las probabilidades individuales p(1, 1) = 0; es decir, es imposible que ocurra el evento X = 1, Y = 1, sin reposición. Del mismo modo, p(2, 2) = 0 y p(3, 3) = 0, por ser eventos imposibles p(1, 2) = 1/6
p(1, 3) = 1/6
p(2, 1) = 1/6, ....
p(3, 2) = 1/6
Ejemplo 164 Suponga que tres objetos no diferenciables se distribuyen al azar en tres celdas numeradas. Sea X el número de celdas vacías e Y el número de objetos colocados en la primera celda. Construya la tabla de distribución de probabilidad conjunta de (X, Y). Solución
Si X es la variable definida como “El número de celdas vacías” y Y se define como “El número de objetos colocados en la primera celda” entonces X = 0, 1, 2 y Y = 0, 1, 2, 3. Puesto que 0, 1, 2 ó los 3 objetos pueden caer en cualquiera de las tres celdas, y del mismo modo, cualquier celda puede contener 0, 1, 2 ó los tres objetos, el número de casos posibles será 3 3= 27. Debemos hallar el número de casos favorables en cada caso. p(0, 0) = P(X=0, Y=0). Significa que hay 0 celdas vacías y hay 0 objetos en la primera. Esto es imposible por lo que p(0, 0) = 0. p(0, 1) = P(X=0, Y=1). Significa que todas las celdas están ocupadas y que la primera tiene un objeto. El esquema siguiente muestra las diversas situaciones que puede presentarse: 1 La primera celda puede ser ocupada por cualquiera de los tres objetos, la segunda por dos de ellos y la tercera sólo por uno. Esto es P(3, 3) = 6. Por ello p(0, 1) = 6/27 p(0, 2) = P(X=0, Y=2) significa que hay cero celdas vacías y que la primera contiene dos objetos. Esto es imposible por ello p(0, 2) = 0. p(0, 3) = P(X = 0, Y = 3) = 0, por la misma razón p(1, 0) = P(X = 1, Y = 0) significa que la hay una celda vacía y que la primera debe tener 0 objetos. En este caso los objetos deben repartirse en las dos celdas, por ello p(1, 0) = 6/27 p(1, 1) = P(X = 1, Y=1) significa que debe haber una celda vacía y la primera debe contener un objeto. Como la primera debe contener un objeto, hay dos posibilidades de tener una celda vacía. Puesto que la primera celda puede ser ocupada de 3 formas diferentes, el número de maneras de obtener un objeto en la primera y una de las restantes vacías, es 3 x 2, por ello p(1,1) = 6/27.
Encontremos ahora p(1,2) = P(X = 1,Y = 2). El razonamiento es similar a p(1,1) excepto que la celda con 0 objetos puede ser cualquiera de las restantes p(1,2) = 6/27. p(1,3) = P( X = 1, Y = 3) este es un evento imposible por lo que p(1, 3) = 0. p(2, 0) = P(X =2, Y = 0) . Esto significa que debe haber 2 celdas vacías y la primera debe contener 0 objetos. Como la primera ya está vacía, la segunda vacía puede ser la segunda celda o la tercera: dos posibilidades; por ello p(2, 0) = 2/27 p(2,1)=P(X = 2, Y = 1). Dos celdas vacías y la primera con un objeto es p(2, 1) = 0 p(2,2) = P(X =2,Y = 2) Igualmente p(2, 2) = 0 p(2,3) = P(X =2, Y =3) = 1/27. Si tiene sentido. Los tres objetos están en la primera. X\Y 0 1 2 3
0 0.0 6/27 0.0 0.0
1 6/27 6/27 6/27 0
2 2/27 0.0 0.0 1/27
Ejemplo 165 Se elige aleatoriamente uno de los números enteros 1, 2, 3, 4, 5. Después de eliminar todos los números enteros menores que el elegido(si hubiera), se elige uno de los restantes. Sean X e Y los números elegidos en la primera y segunda elección, respectivamente. Determine la distribución de probabilidad conjunta de X e Y y calcule P(X + Y > 7) y P(Y – X > 0 Solución
Definamos a X como “El número elegido en la primera vez” e Y, “El número elegido en la segunda vez”. Veamos un ejemplo de cómo se realiza el experimento: Supongamos que en la primera elección se elige al dígito 3. Según el problema, se debe eliminar los dígitos 1 y 2, que son menores que el elegido, 3. La segunda elección se hace teniendo disponibles los dígitos 3, 4 y 5. Esto quiere decir que los valores que tomará X son: 1, 2, 3, 4, 5. Los valores que pueda tomar Y son 1, 2, 3, 4, 5. Encontremos las probabilidades individuales. Antes de empezar, debemos tomar en cuenta que la primera elección se hace de un total de 5 por lo que la probabilidad de elegir cualquier dígito la primera vez siempre es 1/5. La probabilidad de elegir el segundo número es 1/(5-k) donde k es el número de dígitos eliminados. Esto quiere decir que p(x, y) = 1/5 (1/(5-k)) y k: 0, 1, 2, 3, 4 representa el número de dígitos eliminados después de la primera elección. La distribución de probabilidad en detalle se da en el siguiente cuadro. X\Y 1 2 3 4 5
1 1/25 1/25 1/25 1/25 1/25
2 0.01 1/20 1/20 1/20 1/20
3 0.0 0.0 1/15 1/15 1/15
4 0.0 0.0 0.0 1/10 1/10
5 0.0 0.0 0.0 0.0 1/5
Calculemos ahora las probabilidades pedidas
P(X+Y >7 ): Los únicos pares que cumplen la condición X + Y > 7 es el conjunto B definido como B = {(x, y) / x + y > 7} = { p(3, 5), p(4, 4), p(4, 5), p(5, 3), p(5, 4), p(5, 5)}. Luego P(B) = 19/30. Del mismo modo, si A = {(x, y)/ y – x >0 } entonces P(A) = 163/300 Caso 2: Variable aleatoria bidimensional continua
Ejemplo 166 Encuentre las distribuciones marginales de X e Y, del Ejemplo 80.
Solución La distribución de probabilidades conjunta de (X, Y) es la que se muestra en el gráfico anterior. A partir de ella, la distribución Marginal de X es: Si X = 0 entonces p(0) = p(0, 1) + p(0, 2) + p(0, 3) = 6/27 Si X = 1 entonces p(1) = p(1, 1) + p(1, 2) + p(1, 3) = 18/27 Si X = 2 entonces p(0) = p(2, 1) + p(2, 2) + p(2, 3) = 3/27 Por lo que la función marginal de X, dado en forma tabular, es X p(x)
0 6/27
1 18/27
2 3/27
Esta misma distribución se aprecia en la última fila del cuadro de la distribución conjunta. La distribución Marginal de Y es: Si Y = 0 entonces q(0) = q(0, 0) + q(1, 0) + q(2, 0) = 8/27 Si Y = 1 entonces q(1) = q(0, 1) + q(1, 1) + q(2, 1) = 12/27
Si Y = 2 entonces q(2) = q(0, 2) + q(1, 2) + q(2, 2) = 6/27 Si Y = 3 entonces q(3) = q(0, 3) + q(1, 3) + q(2, 3) = 1/27 Por lo que la función marginal de X, dado en forma tabular, es Y p(y)
0 8/27
1 12/27
2 6/27
3 1/27
Esta misma distribución se aprecia en la última columna del cuadro de la distribución conjunta. Ejemplo 167 La función de probabilidad conjunta de (X, Y) está dada por p(x, y) = (x2 + y2)/32, x = 0, 1, 2, 3 ; y = 0, 1 Encuentre las distribuciones marginales de X e Y, respectivamente. Solución Para la Marginal de X. sólo debemos reemplazar los valores de Y, para cada valor que tome X. Igualmente, para la Marginal de Y, reemplazamos valores de X, para cada valor de Y. Marginal de X: Puesto que el espacio rango de X es 0, 1, 2, 3 entonces p(0) = p(0, 0) + p(0, 1) = 0 + 1/32; p(1) = p(1, 0) + p(1, 1) = 1/32 + 2/32 p(2) = p(2, 0) + p(2, 1) = 4/32+5/32 p(3) = p(3, 0) + p(3, 1) = 9/32 + 10/32 Por ello la distribución marginal de X se muestra en el siguiente cuadro X p(x)
0 1/32
1 3/32
2 9/32
3 19/32
Otra forma de responder a la preguntas es la siguiente:
Ejemplo 168 Se extraen al azar 2 cartas de un naipe de 52 cartas, sin reemplazo. Sea X el número de ases que aparece e Y el número de espadas. Obtener la distribución de probabilidad conjunta de (X, Y) Obtener las distribuciones marginales de X e Y Evalúe P( X> Y ) Solución
Definamos a X como “El número de ases que se extraen” e Y como “El número de espadas extraídas”, según el problema. Esto significa que X toma valores: 0, 1, 2 ; así como Y toma 0, 1 y 2. Con esto, el espacio rango de (X, Y) es fácil encontrarlo(el producto cartesiano). Encontremos las probabilidades individuales: p(0, 0) = P(X = 0, Y = 0) . Como se trata de extraer 0 ases de un total de 4, el número de maneras de obtenerlo es C(4,0). Igualmente, 0 espadas se extrae de C(12,0) maneras. Hemos quitado una espada ya que el as de espadas no debe ser tomado en cuenta. Hasta este punto, tenemos 0 ases + 0 espadas ; pero como se extraen 2 cartas, seguramente las cartas que “faltan” (las dos), deben ser cualquiera del naipe; estas se extraen de C(36, 2) maneras. Luego: el número de maneras de extr aer 0 ases “y” 0 espadas “y” 2 cartas cualquiera es C(4, 0) x C(12, 0) x C(36, 2), lo que constituye “el número de casos favorables a extraer 0 ases y 0 espadas. Por otro lado, el número de casos posibles de extraer 2 cartas viene dado por C(52, 2). Por ello
p(1, 0) = P(X = 1, Y = 0). Esto significa que no debe extraerse el as de espadas. Por ello, sólo quedan 3 ases disponibles. El número de casos favorables será C(3, 1)x C(12, 0) x C(36, 1). Por ello p(1, 0) = 216/2652 p(2, 0) = P(X = 2, Y = 0). Esto significa extraer 2 ases, de los cuales ninguno debe ser el de espada, lo que hace disponible sólo a 3 de los ases. El número de maneras de lograr esto es C(3, 2) x C(12, 0) x C(36, 0). Luego p(2,0) = 6/2652 Calculemos p(0, 1): El número de maneras de obtener una espada que no sea el as y una cualquiera de las restantes, es C(4, 0) x C( 12, 1) x C(36, 1). Luego la probabilidad pedida es p(0,1) = 864/2652 Ahora p(0,2) = C(4, 0) x C(12, 2) x C(36, 0)/ 2652 = 132/2652 Calculemos ahora p(2, 1): La probabilidad de extraer el as de espadas y otro as cualquiera es 1/52 x 3/51 = 3/1326. Esto significa que hemos extraído 2 ases y una espada. Por el contrario p(1, 2) significa extraer dos espadas, de las cuales una es el as de espadas. La probabilidad de hacerlo es 1/52 x 12/51 = 12/1326 p(2, 2) = 0. No se extraen tres o cuatro cartas. Finalmente p(1,1) significa la probabilidad de extraer el as de espada y una espada que no debe ser el as de espada. La probabilidad de extraer el as de espada es 1/52. Una espada que no sea el as de espada se obtiene con probabilidad 12/51. Pero hay 12 formas diferentes de extraer una de tales cartas. Luego la probabilidad p(1,1) = (1/52) x (12/51) x 12 = 144/1326 Esto completa la distribución de probabilidad pedida, que se muestra en el siguiente cuadro:
Las distribuciones marginales también se muestran en la figura anterior.
Sea A el evento definido como “El número de ases sea mayor que el número de espadas”. Esto significa que A = {(X, Y) / X >Y }. Según esto, P(A) = P({(1,0), (2, 0), (2, 1) } ) = 228/2656
Distribuciones condicionales Caso discreto:
Sea (X, Y) una variable aleatoria bidimensional discreta, cuya función de probabilidad conjunta es p(x i, y j). Sea p(xi) y q(yj) , i =1, 2, ..., n, ...; j = 1, 2, ..., m, ... , las distribuciones de probabilidad marginal de X e Y. Diremos que pX/Y(x i/Y = y j) es la función de probabilidad condicional de X, dado Y = y j, si
Ejemplo 169 Obtener las distribuciones condicionales de X, dado Y = 1 e Y, dado X = 2, del problema planteado en el Ejemplo Nº 10. Solución Sea (X, Y) la variable aleatoria bidimensional discreta cuya función de probabilidad conjunta es, de acuerdo al Ejemplo 10, p(x, y) = (x2 + y2)/32,
x = 0, 1, 2, 3; y = 0, 1
Para obtener la distribución de probabilidad condicional de X dado Y = 1, debemos encontrar primero la distribución marginal de Y, de ella extraemos q(y = 1). Del mismo modo, para obtener la distribución de probabilidad condicional de Y dado X = 2, debemos encontrar primero la distribución marginal de X, de ella extraemos p(x = 2). En consecuencia debemos encontrar las dos distribuciones marginales y luego proceder a encontrar la condicional respectiva. Distribución Marginal de X: p(x) = (2x2 + 1) / 32, Distribución Marginal de Y: p(y) = (14 + 4y2) / 32; Distribución Condicional de X, dado Y = 1:
x = 0, 1, 2, 3. y = 0, 1.
Ejemplo 170 Un inversionista tiene que adquirir dos paquetes de acciones de un conjunto de 5 paquetes disponibles en el momento de la apertura de la bolsa. Antes de seleccionar el paquete a ser adquirido, realiza un concienzudo análisis de rentabilidad y si estos resultados le satisfacen, adquiere el paquete. Puesto que dicho análisis implica un alto costo, decide realizar las pruebas sólo hasta encontrar los dos paquetes que le satisfacen. Denotemos por X el número de pruebas que debe realizarse hasta encontrar el primer paquete aceptable e Y el número de pruebas adicionales hasta encontrar el segundo aceptable. a) Obtenga la distribución de probabilidad conjunta de (X, Y) b) Obtenga las distribuciones marginales de X e Y c) Obtenga la distribución condicional de X dado Y = 2 y la distribución condicional de Y dado X = 3. Solución
Sea X la variable aleatoria definida como “El número de pruebas realizadas hasta adquirir el primer paquete de acciones”. Igualmente sea Y, “El número de pruebas adicionales hasta adquirir el segundo paquete de acciones”. Según esto, los valores que tomen las variables serán: X: 1, 2, 3, 4; Y: 1, 2, 3, 4. Nos explicamos: Si el primer paquete le satisface al inversionista, lo adquiere, de manera que X = 1, esto implica que el segundo paquete puede adquirirse después de la primera, segunda, tercera o cuarta prueba, lo que significa que Y puede tomar valores 1, 2, 3 ó 4. El primer paquete debe ser adquirido en la primera, segunda, tercera o cuarta prueba, necesariamente.
Sea A el evento que representa la opción de “Adquirir el paquete” y B, el evento “Adquirir el segundo paquete”. De acuerdo a esto, p(1, 1) = P(X = 1, Y = 1) representa la probabilidad de que el primer paquete se adquiera en la primera prueba y el segundo, en la siguiente prueba(una prueba adicional). Usando A y B, tenemos p(1, 1) = P({AB}) = (2/5)(1/4) = 0.1. Del mismo modo, p(1, 2) = P(X = 1, Y = 2 ) = P({AB’B}) = (2/5)(3/4)(1/3) = 0.1 Es decir, la prob abilidad de que se adquiera el primero en la primera prueba y el segundo en la tercera es 0.1. p(1, 3) = P({AB’B’B}) =(2/5)(3/4)(2/3)(1/2) = 0.1 p(1, 4) = P({AB’B’B’B}) = (2/5)(3/4)(2/3)(1/2)(1/1) = 0.1 p(2, 4) = P({A’AB’B’B’B}) = 0 este es un evento impos ible a) En el siguiente cuadro se muestra la distribución de probabilidad conjunta de X e Y
b) En el mismo cuadro de distribución hemos sumado por fila para encontrar la distribución marginal de Y, y luego hemos sumado por columna para encontrar la distribución marginal de X. De manera que, la distribución marginal de X es
c) Distribución condicional de X dado Y = 2:
La marginal de Y, dado X = 3 :
Esperanza condicional Caso discreto:
Sea (X, Y) una variable aleatoria bidimensional discreta con p(xi, yj) , i = 1, 2, ..., n, ...; j = 1, 2, ..., m, ... su función de probabilidad conjunta. Sea p(xi) y q(yj) las funciones de distribución marginal de X e Y, respectivamente.
Ejemplo 171 Sea (X, Y) una variable aleatoria bidimensional discreta cuya función de probabilidad conjunta es p(x, y) = (2x + y)/63;
x = 1, 2, 3;
y = 2, 3, 4.
Encuentre las esperanzas condicionales E[X/Y] y E[Y/X], para todos los valores de X e Y. Solución Como para E[X/Y] se requiere la marginal de Y y la probabilidad condicional de X, dado Y, así como para E[Y/X] se requiere la marginal de X y luego la probabilidad condicional de Y, dado X, procedamos de manera ordenada: Distribución Marginal de X: p(x) = (6x + 9)/63;
x = 1, 2, 3.
Distribución Marginal de Y: p(y) = (12 + 3y)/63;
y = 2, 3, 4.
Distribución condicional de X, dado Y:
Con toda esta información
Ejemplo 172 Se sabe que la probabilidad de que llueva en un día cualquiera es 10% en una determinada ciudad. Si se define a X como el número de días que llueve en los cuatro primeros días de la semana y a Y como el número de días que llueve en los cuatro últimos días de la semana, a) Determine la distribución de probabilidad conjunta de X e Y b) Encuentre la probabilidad P(X < 2 / Y > 2) c) Encuentre la probabilidad de que llueva exactamente en 4 días de la semana Solución
Sea X: “Número de días que llueve entre el Lunes, Martes, Miércoles, Jueves” , del mismo modo, sea Y: “Número de días que llueve entre el Jueves, Viernes, Sábado, Domingo”. De acuerdo a esto, X: 0, 1, 2, 3, 4 y también, Y: 0, 1, 2, 3, 4. La probabilidad de que llueva en un día cualquiera de la semana es 0.10. Si sólo se definiera a X como el número de días que llueve en la semana, entonces estaríamos frente a una distribución binomial de parámetros n = 7 y p = 0.10. Sin embargo, no estamos muy alejados de ella pues por la manera cómo se define a X e Y, daría la impresión de estar frente a una distribución “binomial conjunta”, excepto por lo del Jueves que está siendo incluido tanto en X como en Y. Por ello encontraremos las probabilidades individuales y luego armaremos el cuadro de distribución para, a partir de ella encontrar resolver la(s) pregunta(s). a) p(0,0) = P(X = 0, Y = 0) significa que no debe llover los 4 primeros días, ni menos los últimos 4 días. Esto es, p(0, 0) = C(7, 0)(0.1)0(0.9)7 = 0.97.
p(0, 1) = P(X = 0, Y = 1) significa que no debe llover de Lunes a Jueves, pero sí Viernes, Sábado o Domingo; esto es, p(0, 1) = 0.94 . C(3, 1)(0.1)0.92 = 3(0.1)(0.9)6 p(1, 0) = 3(0.1)(0.9)2(0.9)4 ; es decir, p(0, 1) = p(1, 0). p(0, 2) = p(0, 2) = C(3, 2)(0.1)2(0.9)5 = 3(0.1)2(0.9)5. p(0, 3) = p(3, 0) = C(3, 3)(0.1)3(0.9)4 = (0.1)3(0.9)4. p(0, 4) = p(4, 0) = 0. Imposible. No debe llover el jueves y debe llover, también, el jueves. p(1,1)=P(Llueve Jueves)+P(No llueve Jueves) = (0.1)(0.9)6 + C(3,1)(0.1)(0.9)3C(3,1)(0.1)0.92 p(2, 2) = C(3,2)(0.1)2(0.9)2C(3,2)(0.1)2(0.9) + C(3, 2)(0.1)2(0.9)2C(3,2)(0.1)(0.9)2 p(3, 3) = (0.1)6(0.9) + 9(0.1)3(0.9)(0.1)2(0.9) p(4, 4) = (0.1)4(0.9)0(0.1)3(0.9)0 = (0.1)7 Dejamos para el lector el cálculo de las siguientes probabilidades individuales. La distribución de probabilidades se muestra en la siguiente tabla.
b) P(X < 2 / Y > 2) = P(X < 2, Y > 2) / P(Y > 2) = 0.0029 / 0.0039 = 29/39
Sea A el evento: “Que exactamente llueva 4 días en la semana”. Si definimos a la variable Z como “Número de veces que llueve en la semana” entonces Z → B(n = 7, p = 0.10). Por ello, P(A) = P(Z = 4 ) = C(7,4)0.40.93
Ejemplo 173 Si la distribución de probabilidad conjunta de (X, Y) viene dada por la siguiente tabla:
Solución En la tabla conjunta ya hemos calculado las distribuciones marginales de X e Y. E[X] = 0(.175)+1(.282)+2(.337)+3(.206) = 1.574 E[Y] = 0(.185)+1(.407)+2(.408) = 1.223 Sea Z = 3X + 4Y. Si X , Y = 0, 1, 2, 3, 4 entonces Z = 0, 3, 4, 6, 7, 8, 9, 10, 13, 14; con lo cual su distribución será
Luego E[Z] = 0(.02) + 3(.05) + 4(.015) + ... + 4(.121) + 17(.021) = 9.614 E[Y²] = 0²(.185) + 1²(.407) + 2²(.408) = 2.039 V[Y] = E[Y²] – (E[Y])² = 2.039 – 1.223² = 0.543271 Antes de evaluar E[XY], encontremos la distribución de XY. Para ello, sea Z = XY. Los valores que toma Z son: 0 = {(0,0), (1, 0), (2, 0), (3, 0), (0, 1), (0, 2)}, 1 = {(1, 1) }
2 = {(1, 2), (2, 1) }
4 = {(2, 2) }
6 = {(3, 2) }
Luego su distribución es 0 1 2 3 4 6 0.340 0.106 0.272 0.140 .121 0.021 De acuerdo a esto, E[XY] = E[Z] = 1.680
3 = {(3, 1)},
E[2X + 1 / Y = 1 ] Aplicando propiedades, E[2X + 1/Y= 1]= 2 E[X / Y = 1] + 1 = 2(2.0098) + 1= 5.0196 E[2X + Y / Y = 1]. Como ya ha ocurrido el evento { Y = 1 } entonces ya se conoce el valor de Y, por ello E[2X + Y / Y = 1] = E[2X + 1 / Y = 1] = 5.0196 Igualmente, E[XY / Y = 1 ] = E[X(1) / Y = 1] = E[X / Y = 1 ] = 2.0098 ariables aleatorias independientes Caso discreto:
Sea (X1, X 2, ..., Xn) una variable aleatoria n-dimensional discreta donde p(x1, x2, ..., xn) es su función de probabilidad conjunta y p(x 1), p(x2), ... p(xn) sus funciones de distribución marginal respectivas. Diremos que X11, X2, ..., Xn son variables aleatorias independientes si p(x1, x2, ..., xn) = p(x1,)p( x2,) ...,p(xn) Caso continuo:
Si (X1, X2, ..., Xn) es una variable aleatoria n-dimensional continua conf su distribución de probabilidad conjunta y g(x1), g(x2), ..., g(xn) son sus funciones de distribución marginales respectivas. Diremos que X1, X2, ..., Xnson variables aleatorias independientes si su función de densidad conjunta es el producto de sus respectivas distribuciones marginales. Esto quiere decir que f(x 1, x2, ..., xn) = g(x1,)g( x2,) ...,g( xn) Ejemplo 174 Dada la distribución de probabilidad conjunta de (X, Y), determine si X e Y son independientes o no. Y\X 0 1 p(x)
0 0.2 0.1 0.3
1 0.1 0.3 0.4
2 0.1 0.2 0.3
q(y) 0.40 0.6
Aplicando la definición, tenemos Según la distribución conjunta p(0, 0) = P(X = 0 , Y= 0) = 0.2 y Del mismo modo, P(X = 0) .P(Y= 0) = 0.3 x 0.4 = 0.12 Como existe un (x, y) en la cual no se cumple la definición, entonces X e Y no son variables aleatorias independientes. Ejemplo 175 Dada la distribución de probabilidad conjunta de (X, Y), determine si X e Y son independientes o no. Y\X 0 1 p(x)
0 0.21 0.09 0.30
1 0.14 0.06 0.20
2 0.35 0.15 0.50
q(y) 0.70 0.30
Aplicando la definición, tenemos
Si p(0, 0) = 0.21 y P(X ≤ 0) . P(Y ≤ 0) = 0.3 x 0.7 = 0.21
⇒
Se cumple
Si p(1, 0) = 0.14 y P(X = 1) . P(Y= 0) = 0.2 x 0.7 = 0.14
⇒
Se cumple
Si p(2, 0) = 0.35 y P(X = 2) . P(Y= 0) = 0.5 x 0.7 = 0.35
⇒
Se cumple
Si p(0, 1) = 0.09 y P(X = 0) . P(Y = 1) = 0.3 x 0.3 = 0.09 Si p(1, 1) = 0.06 y P(X = 1) . P(Y= 1) = 0.2 x 0.3 = 0.06 Si p(2, 1) = 0.15 y P(X = 2) . P(Y= 1) = 0.15
⇒
⇒ ⇒
Se cumple Se cumple
Se cumple
Por tanto, como para todo (x, y) se cumple que p(x, y) = P(X = x, Y = y) entonces X e Y son variables aleatorias independientes. Covarianza de dos variables
Sean X e Y dos variables aleatorias con μ X = E[X], μY = E[Y], del mismo modo, σ 2 = V[X] y σ2 = V[Y]. Diremos que Cov(X, Y) es la covarianza de X e Y, la que será definida como Cov(X, Y) = E[(X - μX)(Y - μY)] Teorema
Cov(X, Y) = E(XY) - E(X) E(Y) En efecto, Cov(X,Y) = E[XY - XμY- μXY + μX μY] = E(XY)-E(X) μY - μXE(Y) + μXμY =E(XY)- μX μY La covarianza permite saber si existe alguna relación entre las dos variables. En las siguientes figuras hemos trazado la gráfica de la venta del pollo y su precio. En la primera figura tenemos la demanda (X) vs el precio (Y) En la segunda, la oferta (X) vs el precio (Y) En la tercera, en la tercera gráfica, X puede ser considerada como la demanda u oferta del pollo mientras que Y será el precio. En la primera figura podemos apreciar que, cuando la demanda aumenta, también aumenta el precio mientras que en la segunda, cuando aumenta la oferta del pollo, el precio del mismo disminuye. En la tercera figura cuando la variable X aumenta, nada puede decirse de Y pues ésta aumenta o disminuye, independientemente de X. En la primera y segunda figura existe relación entre la demanda u oferta del pollo y su precio. En el primer caso hay una relación directa positiva; en la segunda existe una relación inversa negativa. En la tercera figura podemos apreciar que las dos variables (X e Y) son independientes.
Ejemplo 176 El administrador de una playa pública desea realizar un estudio sobre los ingresos que tiene en cada temporada veraniega. Estos ingresos son de preocupación ya que en cada nuevo verano se van reduciendo. Sin embargo sospecha también que esto podría deberse al incremento de la gasolina que impide que los usuarios tengan un gasto adicional. ¿Se podría decir que sus ingresos dependen del precio de la gasolina? Los datos se encuentran en el siguiente cuadro: Mes Enero Febrero Marzo Abril Mayo Junio Julio Agosto Setiembre Octubre Solución
Ingreso 290 200 250 490 410 360 300 150 200 100
Gasolina ($/litro) 0.40 0.34 0.31 0.25 0.25 0.34 0.27 0.39 0.33 0.35
Obtenga la covarianza de los ingresos y el precio de la gasolina. Sea X la variable Ingresos y Y la variable Gasolina. Ingrese los datos a una hoja del Excel, como se muestra en la siguiente gráfica:
Cómo calcular la covarianza en Excel:
Podemos hacerlo de dos formas: Primera forma:
Usando la función: =Covar(Mariz1,Matriz2) Donde Matriz1 y Matriz2 representan los rangos de la primera y segunda variable, respectivamente. En este ejemplo, En F3 digitemos: =Covar(B1:B11,C1:C11) Lo que nos dará como resultado: -3.885. Segunda forma:
Usando la herramienta Covarianza del grupo [Análisis de datos] de la ficha [Datos]
En la ventana que se obtiene a continuación, se debe ingresar los datos como se muestra en la siguiente imagen: Al hacer clic en [Aceptar] obtendremos los siguientes resultados a partir de E2:
Ingreso Gasolina
Ingreso 1305 -3.885
Gasolina 0.002541
Esta herramienta del Excel, además de la covarianza = -3.885, nos proporciona la varianza poblacional de cada una de las variables, las que se encuentran en la diagonal.
Antes de interpretar la covarianza, construyamos el diagrama de dispersión de estas dos variables. Dicha gráfica se muestra en la figura 4.49 En ella podemos apreciar que, a medida que el precio de la gasolina se incrementa, los ingresos se reducen. Interpretación de la covarianza Tomando en cuenta lo dicho anteriormente, podemos concluir en lo siguiente: La covarianza permite saber si dos variables están relacionadas o no. Si Cov(X, Y) > 0 se dirá que la relación existente es directa; es decir, cuando una variable aumenta, la otra variable también aumenta.
Si Cov(X, Y) < 0 se dirá que la relación existente es inversa; es decir, cuando una variable aumenta, la otra variable se reduce. Si Cov(X,Y) = 0 diremos que no existe relación entre las dos variables, o lo que es lo mismo, las dos variables son independientes. Coeficiente de correlación
Sean X e Y dos variables aleatorias con μ X = E[X], μY = E[Y], del mismo modo, σ 2 = V[X] y σ2 = V[Y]. Diremos que ρ es el coeficiente de correlación entre X e Y, la que estará definido como
Propiedades
1. Si las variables aleatorias X e Y son independientes entonces ρ = 0 2. Si X e Y son variables aleatorias independientes entonces Cov(X, Y) = 0 3. Si Z = aX ± bY ⇒V[aX ± bY] = a 2 V[X] + b2 V[Y] ± 2 a b Cov(X, Y)
4. Si ρ es el coeficiente de correlación entre X e Y entonces -1 ≤ ρ(X, Y) ≤ 1. Observación:
1. Si ρ = +1, diremos que entre X e Y existe una correlación perfecta positiva. 2. Si ρ = -1, diremos que entre X e Y existe una correlación perfecta negativa. 3. Para valores de ρ, cercanos a ± ½ diremos que existe una correlación moderadamente perfecta positiva o negativa, respectivamente. 4. El hecho de que ρ = ± 1, implica que existe una relación de una variabl e respecto de la otra. Por costumbre y porque coincide con el tratamiento que hemos hecho de X e Y, supondremos que, bajo las circunstancias en que ρ → ± 1, es posible definir a Y como una combinación lineal de X; es decir Y = A X + B, donde A y B son números reales con A > 0 cuando ρ = +1 y A < 0 cuando ρ = - 1. Esta última observación da origen a un teorema, que lo enunciaremos sin demostración.
Ejemplo 177 Dada la función de probabilidad conjunta de X e Y Y\X 0 1 2
0 0.13 0.25 0.25
Hallar: a) Cov(X, Y) b) V[X], V[Y]
c) ρ(X, Y) d) V[X + Y]
e) ρ(2X, 3Y + 4) Solución
1 0.13 0.13 0.13
E[X] = 0(5/8) + 1(3/8) = 3/8 E[Y] = 0(2/8) + 1(3/8) + 2(3/8) = 9/8 E[XY] = 0(6/8) + 1(1/8) + 2(1/8) = 3/8
Ejemplo 178 Un puerto tiene capacidad para acomodar 4 naves de cierto tipo durante la noche. Las tarifas del puerto producen una utilidad de $ 1,000 por nave atracada. Sea X la variable aleatoria que representa el número de naves buscando atracadero por noche, donde p(X = k) = 1/6, para k = 1, 2, 3, 4, 5 es la función de probabilidad de X. Un segundo puerto está disponible para manejar el exceso de naves, si existen. Sea Y representa el número de naves buscando atracadero en el segundo puerto (lo cual sólo ocurrirá si el primer puerto está lleno).
Calcular a) La distribución de probabilidad conjunta de X e Y b) Las distribuciones marginales de X e Y c) La distribución condicional de Y, dado X = 4 d) ¿Son independientes las variables X e Y? e) V[X], V[Y] f) La covarianza de X e Y g) El coeficiente de correlación de X e Y Solución
Sea X la variable que representa “Numero de naves que obtienen espacio en el primer puerto” Sea Y la variable que representa “Número de naves que van a un segundo puerto” Nota:
Observe que el número de naves que puede aceptar el primer puerto es hasta 4. Por lo que diremos que X = 0, 1, 2, 3, 4. Pero como k = 1, 2, 3, 4, 5, entonces P(X >4) = 2/6. Toda vez que X 4, no hay naves que vayan al segundo puerto, por lo que Y = 0 Toda vez que X > 4, las restantes naves van al segundo puerto, por lo que Y = 1, 2,... Pero por noche sólo son 5 naves que buscan atracadero. Esto quiere decir que tomará valores entre 0 y 1. Por tanto X = 0, 1, 2, 3, 4; mientras que Y = 0, 1. a) La distribución de probabilidad conjunta de X e Y es
b) Las distribuciones marginales de X e Y se muestran en el cuadro anterior c) p(y / X = 4) = p(4,y) / P/X = 4) = (p(4,0) + p(4, 1) ) / p(4) = 1. d) Puesto que p(xi)q(y j) es diferente a p(x i,y j) para algú n i = 1, 2, 3, 4, 5, ó j = 1, 2 entonces X e Y no son variables aleatorias independientes. e) Para encontrar las varianzas: E[X] = 0 + 1/6 + 2/6 + 3/6 + 12/6 = 3 E[Y] = 0 + 2/6 = 2/6 E[X2] = 0 + 1/6 + 4/6 + 9/6 + 48/6 = 62/6 E[Y2] = 0 + 2/6 = 2/6
Luego V[X] = 4/3 ; igualmente V[Y] = 2/9 f) Antes de encontrar la covarianza debemos hallar E[XY]. E[XY] = 0 + 0 + 0 + 0 + 8/6 = 4/3 Cov(X, Y) = 4/3 – (3)(2/6) = 1/3 g) Cálculo del coeficiente de correlación:
ρ(X, Y) = cov(X, Y) / √ (V(X)V(Y)) = (1/3) / &raidc; (8/27) = 0.6124. Era de esperarse este resultado. Ejemplo 179 Construya una macro que permita realizar todos los cálculos relativos a una variable aleatoria bidimensional discreta a partir de la distribución de probabilidad conjunta ingresada en una hoja del Excel. La macro debe ser capaz de recibir una tabla de cualquier tamaño y realizar todos los cálculos como las distribuciones marginales, las esperanzas, esperanzas condicionales, varianzas, covarianza y el coeficiente de correlación.La siguiente imagen corresponde a un segmento de la hoja que se debe diseñar. Toda la información obtenida a partir de la fila 8 debe ser obtenida mediante la macro.
La siguiente es la macro que resuelve lo pedido: Dim nx, ny, mx, my As Integer Sub DistrBid() 'Hoja = InputBox("Nombre de la hoja") 'Sheets(Hoja).Select Range("C2").Select
ny = Selection.End(xlToRight).Column Range("B3").Select nx = Selection.End(xlDown).Row Cells(2, ny + 1) = "Marginal de X" Cells(2, ny + 1).ColumnWidth = 14 Cells(nx + 1, 2) = "Marginal de Y" mx = nx - 2 my = ny - 2 For j = 3 To nx Cells(j, ny + 1).Select Cells(j, ny + 1) = "=Sum(RC3:RC[-1])" Next For j = 3 To ny Cells(nx + 1, j).Select Cells(nx + 1, j) = "=Sum(R3C:R[-1]C)" Next ValEsp ValEspXY End Sub Sub ValEsp() Cells(nx + 3, 2) = "E(X) = " Cells(nx + 7, 2) = "E(Y) = " Cells(nx + 4, 2) = "E(X²) = "
Cells(nx + 8, 2) = "E(Y²) = " Cells(nx + 5, 2) = "V(X) = " Cells(nx + 9, 2) = "V(Y) = " ActiveWorkbook.Names("Rx").Delete ActiveWorkbook.Names("Ry").Delete ActiveWorkbook.Names("Rpy").Delete ActiveWorkbook.Names("Rpx").Delete ActiveWorkbook.Names("Rxy").Delete ActiveWorkbook.Names("Rpxy").Delete Range(Cells(2, 3), Cells(2, ny)).Name = "Ry" Range(Cells(nx + 1, 3), Cells(nx + 1, ny)).Name = "Rpy" Range(Cells(3, 2), Cells(nx, 2)).Name = "Rx" Range(Cells(3, ny + 1), Cells(nx, ny + 1)).Name = "Rpx" Cells(nx + 3, 3).Select ActiveCell = "=SUMPRODUCT(Rx,Rpx)" ActiveCell.Name = "Ex" Cells(nx + 4, 3).Select ActiveCell = "=SUMPRODUCT(Rx,Rx,Rpx)" Cells(nx + 5, 3).Select ActiveCell = "=R[-1]C-R[-2]C^2" ActiveCell.Name = "Vx" Cells(nx + 7, 3).Select ActiveCell = "=SUMPRODUCT(Ry,Rpy)"
ActiveCell.Name = "Ey" Cells(nx + 8, 3).Select ActiveCell = "=SUMPRODUCT(Ry,Ry,Rpy)" Cells(nx + 9, 3).Select ActiveCell = "=R[-1]C-R[-2]C^2" ActiveCell.Name = "Vy" End Sub Sub ValEspXY() Cells(nx + 3, 5) = "XY " Cells(nx + 4, 5) = "p(xy)" k=5 For i = 3 To nx For j = 3 To ny k=k+1 Cells(nx + 3, k) = Cells(i, 2) * Cells(2, j) Cells(nx + 4, k) = Cells(i, j) Next Next Range(Cells(nx + 3, 6), Cells(nx + 3, 5 + mx * my)).Name = "Rxy" Range(Cells(nx + 4, 6), Cells(nx + 4, 5 + mx * my)).Name = "Rpxy" Cells(nx + 7, 5) = "E(XY) = " Cells(nx + 7, 6) = "=SumProduct(Rxy,Rpxy)" Cells(nx + 7, 6).Name = "Exy"
Cells(nx + 8, 5) = "COV(X,Y) = " Cells(nx + 9, 5) = "ro(X,Y) = " Cells(nx + 8, 6) = "=Exy-Ex*Ey" Cells(nx + 8, 6).Name = "Cov" Cells(nx + 9, 6) = "=Cov/sqrt(Vx*Vy)" 'Cells(nx + 8, 6) = Cells(nx + 7, 6) - Cells(nx + 3, 3) * Cells(nx + 7, 3) 'Cells(nx + 9, 6) = Cells(nx + 8, 6) / Sqr(Cells(nx + 5, 3) * Cells(nx + 9, 3)) End Sub Sub Clear() Range(Cells(2, ny + 1), Cells(nx + 1, ny + 1)).ClearContents Range(Cells(nx + 1, 2), Cells(nx + 1, ny + 1)).ClearContents End Sub
4.15 PROBLEMAS PROPUESTOS 1. La distribución de probabilidad conjunta de X e Y se define como
(X: 0, 1, 2, 3, 4 Y: 0, 1 ) a) Encuentre las distribuciones marginales de X e Y b) Calcular p(x / Y = 1) c) Calcular p(y / X = 3)