COMPENDIO DE PROBABILIDAD Y ESTADÍSTICA 2 PARA INGENIERÍA
Juan Manuel Jiménez Rodríguez, MBA
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Tabla de Contenido Variable Aleatoria ....................................................................................................................................................5 Ejercicio 1..............................................................................................................................................................5 Ejercicio 2..............................................................................................................................................................5 Ejercicio 3..............................................................................................................................................................6 Distribuciones discretas de probabilidad ................................................................................................................6 Ejercicio 4..............................................................................................................................................................6 Ejercicio 5..............................................................................................................................................................6 Ejercicio 6..............................................................................................................................................................7 Ejercicio 7..............................................................................................................................................................7 Ejercicio 8..............................................................................................................................................................7 Ejercicio 9..............................................................................................................................................................8 Distribuciones de probabilidad continua ................................................................................................................8 Ejercicio 10 .........................................................................................................................................................10 Ejercicio 11 .........................................................................................................................................................10 Ejercicio 12 .........................................................................................................................................................11 Distribuciones de probabilidad conjunta ..............................................................................................................11 Ejercicio 13 .........................................................................................................................................................11 Ejercicio 14 .........................................................................................................................................................12 Ejercicio 15 .........................................................................................................................................................12 Ejercicio 16 .........................................................................................................................................................13 Distribuciones de probabilidad condicional ..........................................................................................................13 Ejercicio 17 .........................................................................................................................................................14 Independencia Estadística .....................................................................................................................................15 Ejercicio 18 .........................................................................................................................................................15 Media de una variable aleatoria ...........................................................................................................................16 Ejercicio 19 .........................................................................................................................................................16 Ejercicio 20 .........................................................................................................................................................17 Ejercicio 21 .........................................................................................................................................................17 Ejercicio 22 .........................................................................................................................................................18 Ejercicio 23 .........................................................................................................................................................18 Varianza y Covarianza ...........................................................................................................................................19 Ejercicio 24 .........................................................................................................................................................19 Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 1
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Ejercicio 25 .........................................................................................................................................................20 Ejercicio 26 .........................................................................................................................................................20 Varianza de una función de una variable aleatoria............................................................................................20 Ejercicio 27 .........................................................................................................................................................21 Covarianza ..........................................................................................................................................................21 Ejercicio 28 .........................................................................................................................................................22 Coeficiente de Correlación ..................................................................................................................................22 Ejercicio 29 .........................................................................................................................................................22 Medias y Varianzas de combinaciones lineales de variables aleatorias .............................................................24 Ejercicio 30 .........................................................................................................................................................24 Ejercicio 31 .........................................................................................................................................................24 Ejercicio 32 .........................................................................................................................................................25 Ejemplo 33 ..........................................................................................................................................................26 Ejercicio 34 .........................................................................................................................................................26 Teorema de Chebyshev .........................................................................................................................................26 Ejercicio 35: ........................................................................................................................................................27 Ejercicio 36: ........................................................................................................................................................27 Distribuciones de probabilidad discreta................................................................................................................28 Distribuciones binomial y multinomial .................................................................................................................28 Ejercicio 37 .........................................................................................................................................................29 Ejercicio 38 .........................................................................................................................................................29 Ejercicio 39 .........................................................................................................................................................29 Ejercicio 40 .........................................................................................................................................................30 Ejercicio 41 .........................................................................................................................................................30 Ejercicio 42 .........................................................................................................................................................30 Ejercicio 43 .........................................................................................................................................................31 Ejercicio 44 .........................................................................................................................................................31 Experimentos Multinomiales y la Distribución Multinomial ................................................................................32 Ejercicio 45: ........................................................................................................................................................32 Ejercicio 46: ........................................................................................................................................................32 Ejercicio 47: ........................................................................................................................................................33 Distribución Hipergeométrica ...............................................................................................................................33 Ejercicio 48: ........................................................................................................................................................33 Ejercicio 49: ........................................................................................................................................................34 Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 2
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Ejercicio 50: ........................................................................................................................................................34 Relación de la distribución hipergeométrica con la distribución binomial ......................................................34 Ejercicio 51: ........................................................................................................................................................34 Distribución Hipergeométrica Multivariada .........................................................................................................35 Ejercicio 52: ........................................................................................................................................................35 Ejercicio 53: ........................................................................................................................................................35 Distribuciones binomial negativa y geométrica ...................................................................................................36 Ejercicio 54 .........................................................................................................................................................36 Ejercicio 55 .........................................................................................................................................................36 Ejercicio 56 .........................................................................................................................................................37 Ejercicio 57 .........................................................................................................................................................37 Distribución Poisson ...............................................................................................................................................37 Ejercicio 58 .........................................................................................................................................................37 Ejercicio 59 .........................................................................................................................................................38 Ejercicio 60 .........................................................................................................................................................38 Ejercicio 61 .........................................................................................................................................................38 Ejercicio 62 .........................................................................................................................................................38 Ejercicio 63 .........................................................................................................................................................38 Ejercicio 64 .........................................................................................................................................................39 Ejercicio 65 .........................................................................................................................................................39 Ejercicio 66 .........................................................................................................................................................39 Ejercicio 67 .........................................................................................................................................................39 Ejercicio 68 .........................................................................................................................................................39 Ejercicio 69 .........................................................................................................................................................39 Distribuciones continuas de probabilidad.............................................................................................................40 Distribución Uniforme Continua ............................................................................................................................40 Ejercicio 70 .........................................................................................................................................................40 Ejercicio 71 .........................................................................................................................................................40 Ejercicio 72 .........................................................................................................................................................41 Ejercicio 73 .........................................................................................................................................................41 Distribución Normal ...............................................................................................................................................41 Áreas bajo la curva normal................................................................................................................................43 Distribución normal estándar ............................................................................................................................43 Ejercicio 74 .........................................................................................................................................................43 Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 3
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Ejercicio 75 .........................................................................................................................................................44 Ejercicio 76 .........................................................................................................................................................44 Ejercicio 77 .........................................................................................................................................................45 Ejercicio 78 .........................................................................................................................................................45 Ejercicio 79 .........................................................................................................................................................45 Aplicaciones de la distribución normal .............................................................................................................45 Ejercicio 80 .........................................................................................................................................................45 Ejercicio 81 .........................................................................................................................................................45 Ejercicio 82 .........................................................................................................................................................46 Ejercicio 83 .........................................................................................................................................................46 Ejercicio 84 .........................................................................................................................................................46 Ejercicio 85 .........................................................................................................................................................46 Ejercicio 86 .........................................................................................................................................................47 Ejercicio 87 .........................................................................................................................................................47 Aproximación normal a la binomial ..................................................................................................................47 Ejercicio 88 .........................................................................................................................................................47 Ejercicio 89 .........................................................................................................................................................48 Distribución Χ2 o distribución de Pearson .............................................................................................................48 Propiedades de las distribuciones ji-cuadrada .................................................................................................48 Ejercicio 90 .........................................................................................................................................................49 Cálculo de Probabilidad .....................................................................................................................................50 Ejercicio 91 .........................................................................................................................................................50 Ejercicio 92 .........................................................................................................................................................50 Estimación de la Varianza .................................................................................................................................51 Ejercicio 93 .........................................................................................................................................................51 Ejercicio 94 .........................................................................................................................................................52 Ejercicio 95 .........................................................................................................................................................52 Distribución muestral de medias y el teorema del límite central ........................................................................53 Ejercicio 96 .........................................................................................................................................................54 Ejercicio 97 .........................................................................................................................................................54 Ejercicio 98 .........................................................................................................................................................55 Distribución muestral de la diferencia entre dos medias .....................................................................................55 Ejercicio 99 .........................................................................................................................................................56 Ejercicio 100 .......................................................................................................................................................57 Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 4
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Variable Aleatoria Concepto: Una variable aleatoria es una función que asocia un número real con cada elemento del espacio muestral. Por convención, la letra mayúscula (X) representa a la Variable Aleatoria (X) y la minúscula (x) a un valor específico de la variable. Ejercicio 1 Un empleado de una bodega de materiales de una construcción entrega cascos de seguridad al azar a tres empleados de la empresa. El orden de recepción son José, Marco y Pedro. Liste los puntos del espacio muestral para los posibles órdenes de regreso de los cascos y encuentre el valor b de la variable aleatoria B que representa el número de asociaciones acertadas. Solución: Definamos como elementos J que representa a José, M que representa a Marco y P que representa a Pedro. Los cascos se entregan en el orden JMP. Orden B JMP 3 JPM 1 PJM 0 PMJ 1 MPJ 0 MJP 1 B = {0, 1, 3} Ejercicio 2 Se sacan tres bolas de manera sucesiva, sin reemplazo, de una urna que contiene 2 bolas rojas, 3 negras y 2 azules. Determine el espacio muestral y los valores de la variable aleatoria X, que representan la cantidad de bolas negras que se sacan de la urna. Solución: Definamos como elementos R que representa al color rojo, N que representa al color negro y A que representa al color azul. Los puntos muestrales serán: Puntos X Puntos X Muestrales Muestrales NNN 3 AAR 0 NNR 2 ARA 0 NRN 2 RAA 0 RNN 2 RRA 0 NRR 1 RAR 0 RNR 1 ARR 0 RRN 1 ANR 1 NNA 2 RNA 1 NAN 2 RAN 1 ANN 2 NAR 1 NAA 1 NRA 1 ANA 1 ARN 1 AAN 1 X = {0, 1, 2, 3} Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 5
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Ejercicio 3 Se lanza un dado hasta que ocurra un tres. Determine el espacio muestral y la variable aleatoria Z de la ocurrencia del número 3. Solución: Sea F la no ocurrencia del número 3 y V la ocurrencia del mismo. Entonces el espacio muestral de la ocurrencia del número tres será {V, FV, FFV, FFFV, FFFFV, FFFFFV, FFFFFFV, ….} Z = {1, 2, 3, 4, 5, 6, 7, 8 …..} En los ejercicios 1 y 2, el espacio muestral es finito, mientras que en el número 3 el espacio muestral es infinito. Si un espacio muestral contiene un número finito de posibilidades o una serie interminable con tantos elementos como número enteros existan, se le denomina espacio muestral discreto. Si un espacio muestral contiene un número infinito de posibilidades, igual al número de puntos en un segmento de línea, se le denomina espacio muestral continuo. Una variable aleatoria se llama variable aleatoria discreta si se puede contar su conjunto de posibles resultados, caso contrario, si la variable aleatoria toma valores en la escala continua se le denomina variable aleatoria continua.
Distribuciones discretas de probabilidad Denominaremos distribución de probabilidad, función de masa de probabilidad o distribución de probabilidad de la variable aleatoria X, al conjunto de pares ordenados (x, f(x)) si para cada posible resultado de X se cumple: 𝑓(𝑥) ≥ 0 ∑𝑥 𝑓(𝑥) = 1 𝑃(𝑋 = 𝑥) = 𝑓(𝑥) Ejercicio 4 Se tiene un embarque de 8 microcomputadores iguales, que va dirigido a una tienda especializada, el cual contiene 3 computadores defectuosos. Si una empresa compra 2 computadores elegidos al azar, determine la distribución de probabilidad del número de computadores defectuosos adquirido por la empresa. Solución: Sea 𝑓(𝑥) =
5 (𝑥3)(2−𝑥 )
(82)
=
3𝐶𝑥 ∙ 5𝐶2−𝑥 8𝐶2
la función de masa de probabilidad del caso propuesto. Entonces: X 0 1 2 f(x) 5/14 15/28 3/28
Ejercicio 5 Si una agencia turística vende el 50% de su inventario de tiquetes a Rusia 2018 con hotel 5 estrellas, encuentre la fórmula de la distribución de probabilidad del número de tiquetes de dicho tipo entre los siguientes cuatro tiquetes que venda la agencia y determine la distribución de probabilidad. Solución: Dado que en cada venta puede o no venderse el tiquete con la condición indicada, por la Teorema Fundamental del Conteo sabemos que hay 24 posibles formas de vender los tiquetes, lo cual resulta en 16. Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 6
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Entonces la fórmula sería: 𝑓(𝑥) =
(𝑥4) 16
, para x = 0, 1, 2, 3, 4. X 0 1 2 3 4 f(x) 1/16 1/4 3/8 1/4 1/16
Ejercicio 6 Se tiene el conjunto de pares ordenados (x, f(x)) siguiente, determine si se trata de una distribución de probabilidad: X -3 -2 -1 0 1 2 3 f(x) 0,15 0,12 0,15 0,13 0,17 0,16 0,11 Para que sea una distribución de probabilidad, se debe cumplir 𝑓(𝑥) ≥ 0, es correcto, todas las f(x) son positivas ∑𝑥 𝑓(𝑥) = 1, la sumatoria de las f(x) = 0,99 por lo que no se cumple este requisito. Entonces no se trata de una distribución de probabilidad. La distribución acumulada F(x) de una variable aleatoria discreta X con distribución de probabilidad f(x) es: F(X) = P(X ≤ x) = ∑ 𝑓(𝑡) 𝑝𝑎𝑟𝑎 − ∞ < 𝑥 < ∞ 𝑡≤𝑥
Ejercicio 7 Determine las distribuciones acumuladas de los ejercicios 4 y 5. Solución: X 0 1 2 f(x) 5/14 15/28 3/28 F(X) 5/14 25/28 1 X 0 1 2 3 4 f(x) 1/16 1/4 3/8 1/4 1/16 F(X) 1/16 5/16 11/16 15/16 1 Ejercicio 8 Determine las distribuciones de probabilidad y las distribuciones acumuladas de los ejercicios 1 y 2. Solución: Ejercicio 1 De la tabla de puntos muestrales se obtiene: X 0 1 3 f(x) 2/6 3/6 1/6 F(X) 2/6 5/6 1 Ejercicio 2 De la tabla de puntos muestrales se obtiene: X 0 1 2 3 f(x) 6/25 12/25 6/25 1/25 F(X) 6/25 18/25 24/25 1 Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 7
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Ejercicio 9 Sea W la variable aleatoria que da el número de escudos menos el número de coronas en tres lanzamientos de una moneda. Liste los elementos del espacio muestral S para los tres lanzamientos de la moneda y asigne un valor w de W a cada punto muestral. Determine la distribución de probabilidad y la distribución acumulada. Solución: Pto Muestral EEE EEC ECE CEE ECC CEC CCE CCC W 3 1 1 1 -1 -1 -1 -3 W -3 -1 1 3 f(w) 1/8 3/8 3/8 1/8 F(w) 1/8 4/8 7/8 1
Distribuciones de probabilidad continua Una variable aleatoria continua tiene una probabilidad 0 de adoptar exactamente cualquiera de sus valores. En consecuencia, su distribución de probabilidad no se puede presentar en forma tabular. Consideremos una variable aleatoria cuyos valores son las estaturas de todas las personas mayores de 21 años de edad. Entre cualesquiera dos valores, digamos 163,5 y 164,5 centímetros hay un número infinito de estaturas, una de las cuales es 164 centímetros; la probabilidad de seleccionar al azar a una persona que tenga exactamente 164 centímetros de estatura, en conjunto infinitamente grande de estaturas tan cercanas a 164 centímetros que humanamente no sea posible medir la diferencia, es remota, por consiguiente, asignamos una probabilidad 0 a tal evento. Sin embargo, esto no ocurre si nos referimos a la probabilidad de seleccionar a una persona que mida al menos 163 centímetros pero no más de 165 centímetros de estatura. Aquí nos referimos a un intervalo en vez de a un valor puntual de nuestra variable aleatoria. Nos interesamos por el cálculo de probabilidades para varios intervalos de variables aleatorias continuas como P(a < X < b), P(W ≥ c), etc. Observe que cuando X es continua: P(a < X ≤ b) = P(a < X < b) + P(X = b) = P(a < X < b) Es decir, no importa si incluimos o no un extremo del intervalo. Sin embargo, esto no es cierto cuando X es discreta. Aunque la distribución de probabilidad de una variable aleatoria continua no se puede representar de forma tabular, sí es posible plantearla como una fórmula, la cual necesariamente será función de los valores numéricos de la variable aleatoria continua X, y como tal se representará mediante la notación funcional f(x). Cuando se trata con variables continuas, a f(x) por lo general se le llama función de densidad de probabilidad, o simplemente función de densidad de X. Como X se define sobre un espacio muestral continuo, es posible que f(x) tenga un número infinito de discontinuidades. Sin embargo, la mayoría de las funciones de densidad que tienen aplicaciones prácticas en el análisis de datos estadísticos son continuas y sus gráficas pueden tomar cualquiera de varias formas. Como se utilizarán áreas para representar probabilidades y éstas son valores numéricos positivos, la función de densidad debe caer completamente arriba del eje x.
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 8
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Una función de densidad de probabilidad se construye de manera que el área bajo su curva limitada por el eje x sea igual a 1, cuando se calcula en el rango de X para el que se define f(x). Como este rango de X es un intervalo infinito, siempre es posible extender el intervalo para que incluya a todo el conjunto de números reales definiendo f(x) como cero en todos los puntos de las partes extendidas del intervalo. En la figura la probabilidad de que X tome un valor entre a y b es igual al área sombreada bajo la función de densidad entre las ordenadas en x = a y x = b, y a partir del cálculo integral está dada por: 𝑏
𝑃(𝑎 < 𝑋 < 𝑏) = ∫ 𝑓(𝑥)𝑑𝑥 𝑎
La función f(x) es una función de densidad de probabilidad (fdp) para la variable aleatoria continua X, definida en el conjunto de números reales, si: 𝑓(𝑥) ≥ 0 para toda x ϵ ℝ ∞ ∫−∞ 𝑓(𝑥)𝑑𝑥 = 1
𝑏
𝑃(𝑎 < 𝑋 < 𝑏) = ∫𝑎 𝑓(𝑥)𝑑𝑥
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 9
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
La función de distribución acumulativa F(x), de una variable aleatoria continua X con función de densidad f (x), es: 𝑥
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∫ 𝑓(𝑡)𝑑𝑡 , 𝑝𝑎𝑟𝑎 − ∞ < 𝑥 < ∞ −∞
Como una consecuencia inmediata de lo anterior, se pueden escribir los dos resultados, si existe la derivada: 𝑃(𝑎 < 𝑋 < 𝑏) = 𝐹(𝑏) − 𝐹(𝑎) 𝑑𝐹(𝑥) 𝑓(𝑥) = 𝑑𝑥 Ejercicio 10 Suponga que el error en la temperatura de reacción, en °C, en un experimento de laboratorio controlado, es una variable aleatoria continua X que tiene la función de densidad de probabilidad 𝑥2 𝑓(𝑥) = { 3 , −1 < 𝑥 < 2 0, 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜 a) Verifique que f (x) es una función de densidad. b) Calcule P(0 < X ≤ 1). Solución: Evidentemente se cumple que 𝑓(𝑥) ≥ 0 para toda x ϵ R, dado que x está al cuadrado. Luego: ∞
2
𝑥2 𝑥3 2 8 −1 ∫ 𝑓(𝑥)𝑑𝑥 = ∫ 𝑑𝑥 = | = − =1 −1 3 9 9 9 −1
−∞
Por lo que se cumple el segundo requisito 1
1
∫ 𝑓(𝑥)𝑑𝑥 = ∫ 0
0
𝑥2 𝑥3 1 1 0 1 𝑑𝑥 = | = − = 3 9 0 9 9 9
Con lo que se cumple el tercer requisito y se logra el cálculo solicitado. Ejercicio 11 Calcule F(x) para la función de densidad del ejemplo anterior y utilice el resultado para evaluar P(0 < X ≤ 1). 𝑥
𝑥
𝐹(𝑥) = ∫ 𝑓(𝑡) 𝑑𝑡 = ∫ −∞
−1
𝑡2 𝑡3 𝑥 𝑥 3 −1 𝑥 3 + 1 𝑑𝑡 = | = − = 3 9 −1 9 9 9
Por tanto 0, 𝑥 +1 𝐹(𝑥) = { , 9 1,
𝑥 < −1
3
𝑃(0 < 𝑥 ≤ 1) =
−1 ≤ 𝑥 < 2 𝑥≥2
1 3 + 1 03 + 1 2 1 1 − = − = 9 9 9 9 9
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 10
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Ejercicio 12 La Dirección de Energía (DE) del ICE asigna proyectos mediante licitación y, por lo general, estima lo que debería ser una licitación razonable. Sea b el estimado. La DE determinó que la función de densidad de la licitación ganadora (baja) es: 5 2 𝑏 ≤ 𝑦 ≤ 2𝑏 𝑓(𝑦) = {8𝑏 , 5 0, 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜 Calcule F(y) y utilice el resultado para determinar la probabilidad de que la licitación ganadora sea menor que la estimación preliminar b de la DE. 2𝑏 El intervalo a considerar es 5 ≤ 𝑦 ≤ 2𝑏 𝑦 2𝑏 5 5𝑡 𝑦 5𝑦 5 ∙ 5 5𝑦 2𝑏 5𝑦 1 𝐹(𝑦) = ∫ 𝑑𝑡 = | 2𝑏⁄5 = − = − = − 8𝑏 8𝑏 8𝑏 8𝑏 8𝑏 8𝑏 8𝑏 4 2𝑏 5
Distribuciones de probabilidad conjunta Hay situaciones donde se quiere registrar datos simultáneos, por lo que hablaremos de distribuciones de probabilidad conjunta. Vamos a establecer que f(x, y) es una distribución de probabilidad conjunta o función de masa de probabilidad de las variables aleatorias discretas X y Y si:
𝑓(𝑥, 𝑦) ≥ 0 para toda (x, y) ∑𝑥 ∑𝑦 𝑓(𝑥, 𝑦) = 1 𝑃(𝑋 = 𝑥, 𝑌 = 𝑦) = 𝑓(𝑥, 𝑦)
Para cualquier región del plano xy, P[(X, Y) Є A] = ∑ ∑𝐴 𝑓(𝑥, 𝑦) Ejercicio 13 Se seleccionan al azar dos repuestos para un bolígrafo de una caja que contiene 3 repuestos azules, 2 rojos y 3 verdes. Si X es el número de repuestos azules y Y es el número de repuestos rojos que se seleccionan, encuentre la función de probabilidad conjunta f(x, y) y P[(X, Y) Є A] donde A es la región {(x, y)|x + y ≤ 1}. Encuentre Q[(X, Y) Є B] tal que B es la región {(x, y)|x + y ≤ 2} si se cumple que x < 2, y > 0. Solución: La función de probabilidad conjunta de este ejercicio será:
𝑓(𝑥, 𝑦) =
3 ) (𝑥3) (𝑦2 ) (2−𝑥−𝑦
(82)
=
3𝐶𝑥
∙ 2𝐶𝑦 ∙ 3𝐶(2−𝑥−𝑦) 8𝐶2
Para x = 0, 1, 2; y = 0, 1, 2; 0 ≤ x + y ≤ 2.
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 11
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Entonces, la tabla de la distribución será:
0 Y 1 2 Σ P[(X, Y) Є A] = 3/28 + 9/28 + 3/14 = 9/14
0 3/28 3/14 1/28 5/14
X 1 2 Σ 9/28 3/28 15/28 3/14 -3/7 --1/28 15/28 3/28 1
Q[(X, Y) Є B] = 3/14 + 3/14 + 1/28 = 13/28
Las distribuciones marginales son las distribuciones derivadas de la distribución de probabilidad conjunta, referidas a una sola varaible, ya sea X sola o Y sola y son: g(x) = ∑𝑦 𝑓(𝑥, 𝑦) y ℎ(𝑦) = ∑𝑥 𝑓(𝑥, 𝑦). Ejercicio 14 Encuentre las distribuciones marginales de X y de Y del ejercicio anterior. Marginal de X g(x): X 0 1 2 g(x) 5/14 15/28 3/28 Marginal de Y h(y): Y 0 1 2 h(y) 15/28 3/7 1/28 Ejercicio 15 Determine el valor de c tal que las siguientes funciones representen distribuciones de probabilidad conjunta de las variables aleatorias X, Y: a) f(x,y) = cxy, para x = 1, 2, 3; y = 1, ,2, 3. b) f(x,y) = c|x – y|, para x = -2, 0, 2; y = -2, 3. Respuesta: a) X 1 2 3 Σ 1 c 2c 3c 6c Y 2 2c 4c 6c 12c 3 3c 6c 9c 18c Σ 6c 12c 18c 1 1 = 36c c = 1/36 b) X -2 0 2 Σ -2 0 2c 4c 6c Y 3 5c 3c c 9c Σ 5c 5c 5c 1 1 = 15c c = 1/15 Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 12
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Ejercicio 16 De un costal de frutas que contiene tres naranjas, dos manzanas y tres bananos, se selecciona una muestra de cuatro frutas. Si X es el número de naranjas y Y el de manzanas en la muestra, encuentre: a) La distribución de probabilidad conjunta de X y Y. b) P[(X,Y) Є A], donde A es la región dada por [(x, y)|x + y ≤ 2] Respuesta: 𝐶 ∗ 𝐶 ∗ 𝐶 a) Considerando que 𝑓(𝑥, 𝑦) = 3 𝑥 2 𝑦 𝐶3 (4−𝑥−𝑦), entonces: 8 4
X Y 0 1 2 g(x)
0
1
-1/35 3/70 1/14
3/70 9/35 9/70 3/7
2
3
h(y)
9/70 3/70 3/14 9/35 1/35 4/7 3/70 -- 3/14 3/7 1/14 1
b) P[(X, Y) Є (x, y)| x + y ≤ 2] = 3/70 + 9/70 + 1/35 + 9/35 +3/70 = 35/70 = ½
Distribuciones de probabilidad condicional Anteriormente se estableció que el valor de la variable aleatoria X representa un evento, el cual es un subconjunto del espacio muestral. Si se utiliza la definición de probabilidad condicional: 𝑃(𝐴 ∩ 𝐵) 𝑃(𝐵|𝐴) = ; 𝑃(𝐴) > 0 𝑃(𝐴) donde A y B son ahora los eventos definidos por X = x y Y = y, respectivamente. Entonces: 𝑃(𝑋 = 𝑥, 𝑌 = 𝑦) 𝑓(𝑥, 𝑦) 𝑃(𝑌 = 𝑦|𝑋 = 𝑥) = = ; 𝑔(𝑥) > 0 𝑃(𝑋 = 𝑥) 𝑔(𝑥) 𝑓(𝑥,𝑦) donde X y Y son variables aleatorias discretas. Puede demostrarse que la función , que es estrictamente una 𝑔(𝑥)
función de y con x fija, satisface todas las condiciones de una distribución de probabilidad. Esto también es cierto cuando
𝑓(𝑥,𝑦) 𝑔(𝑥)
son la densidad conjunta y la distribución marginal de variables aleatorias continuas.
Sean X y Y dos variables aleatorias, discretas o continuas. La distribución condicional de la variable aleatoria Y, dado que X = x, es: 𝑓(𝑥, 𝑦) 𝑓(𝑦|𝑥) = , 𝑔(𝑥) > 0 𝑔(𝑥) De manera similar, la distribución condicional de la variable aleatoria X, dado que Y = y, es: 𝑓(𝑥, 𝑦) 𝑓(𝑥|𝑦) = , ℎ(𝑦) > 0 ℎ(𝑦) Si se desea encontrar la probabilidad de que la variable aleatoria discreta X caiga entre a y b, cuando se sabe que la variable discreta Y = y, evaluamos: 𝑃(𝑎 < 𝑋 < 𝑏|𝑌 = 𝑦) = ∑ 𝑓(𝑥|𝑦), 𝑥
donde la sumatoria se extiende a todos los valores de X entre a y b. Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 13
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Ejercicio 17 a) Para la siguiente distribución conjunta, encuentre la distribución condicional de X dado que Y = 1 y utilícela para determinar P(X = 0 | Y = 1).
0 1 2 g(x)
Y
3
ℎ(1) = 7
𝑓(𝑥|1) =
𝑓(𝑥,𝑦) 3⁄7
0 3/28 3/14 1/28 5/14
X 1 9/28 3/14 -15/28
2 3/28 --3/28
h(y) 15/28 3/7 1/28 1
7
= 3 𝑓(𝑥, 𝑦)
X 0 1 2 f(x|1) (7/3) ∙ (3/14) (7/3) ∙ (3/14) -f(x|1) 1/2 1/2 -P(X = 0 | Y = 1) = ½. b) Para la distribución conjunta anterior, encuentre la distribución condicional de Y dado que X = 2. 𝑔(2) =
3 28
𝑓(𝑦|2) =
𝑓(𝑥,𝑦) 3 28
=
28∙𝑓(𝑥,𝑦) 3
y 0 1 2 f(y|2) (28/3) x (3/28) - f(y|2) 1 - c) Para la siguiente distribución conjunta, determine P(Y ≤ 2 | X = 1). X 1 2 3 h(y) 1 1/36 1/18 1/12 1/6 Y 2 1/18 1/9 1/6 1/3 3 1/12 1/6 1/4 1/2 g(x) 1/6 1/3 1/2 1 𝑓(𝑦|1) =
𝑓(𝑥,𝑦) 𝑔(1)
=
𝑓(𝑥,𝑦) 1/6
= 6𝑓(𝑥, 𝑦) Y 1 2 3 f(y|1) 1/6 1/3 1/2
P(Y ≤ 2 | X = 1) = 1/2 d) Para la siguiente distribución conjunta, determine P(X = 1 | Y = 2). X Y 0 1 2 g(x)
𝑓(𝑥|𝑦) =
𝑓(𝑥,𝑦) ℎ(2)
=
0
1
1/35 3/70 1/14
3/70 9/35 9/70 3/7
2
3
h(y)
9/70 3/70 3/14 9/35 1/35 4/7 3/70 3/14 3/7 1/14 1
14 𝑓(𝑥, 𝑦) 3
X 0 1 2 3 f(x|2) 1/5 3/5 1/5 P(X = 1 | Y = 2) = 3/5 Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 14
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Independencia Estadística Sean X y Y dos variables aleatorias, discretas o continuas, con distribución de probabilidad conjunta f(x, y) y distribuciones marginales g(x) y h(y), respectivamente. Se dice que las variables aleatorias X y Y son estadísticamente independientes si y solo si: f(x, y) = g(x) ∙ h(y) Para toda (x, y) dentro de sus rangos. Si f(x|y) no depende de y, entonces: f(x|y) = g(x) Si f(y|x) no depende de x, entonces: f(y|x) = h(y) Sean X1, X2, ….., Xn n variables aleatorias, discretas o continuas, con distribución de probabilidad conjunta f(x1, x2, ….., xn) y distribuciones marginales f1(x1), f2(x2), …, fn(xn), respectivamente. Se dice que las variables aleatorias X1, X2, ….., Xn son estadísticamente independientes mutuamente si y solo si: f(x1, x2, ….., xn) = f1(x1)· f2(x2)· …· fn(xn) para toda (x1, x2, ….., xn) dentro de sus rangos. Ejercicio 18 a) Para la siguiente distribución conjunta, determine si X y Y son estadísticamente independientes.
Y
0 1 2 Σ
0 3/28 3/14 1/28 5/14
X 1 9/28 3/14 -15/28
2 3/28 --3/28
Σ 15/28 3/7 1/28 1
f(1,1) = 3/14 g(1) = 15/28 h(1) = 3/7 g(1) · h(1) = 45/196 f(1,1) ≠ g(1) ∙ h(1) No son estadísticamente independientes. b) Para la siguiente distribución conjunta, determine si X y Y son estadísticamente independientes. X 1 2 3 h(y) 1 1/36 1/18 1/12 1/6 Y 2 1/18 1/9 1/6 1/3 3 1/12 1/6 1/4 1/2 g(x) 1/6 1/3 1/2 1
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 15
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
f(2,3) = 1/6 g(2) = 1/3 h(3) = 1/2 g(2) · h(3) = 1/6 f(2,3) = g(2) · h(3)
f(3,3) = 1/4 g(3) = 1/2 h(3) = 1/2 g(3) · h(3) = 1/4 f(3,3) = g(3) · h(3)
f(1,1) = 1/36 g(1) = 1/6 h(1) = 1/6 g(1) · h(1) = 1/36 f(1,1) = g(1) · h(1)
f(3,2) = 1/6 g(3) = 1/2 h(2) = 1/3 g(3) · h(2) = 1/6 f(3,2) = g(3) · h(2)
Sí son estadísticamente independientes. c) Para la siguiente distribución conjunta, determine si X y Y son estadísticamente independientes. X Y 0 1 2 g(x)
0
1
2
1/35 3/70 1/14
3/70 9/35 9/70 3/7
3
h(y)
9/70 3/70 3/14 9/35 1/35 4/7 3/70 3/14 3/7 1/14 1
f(2,2) = 3/70 g(2) = 3/7 h(2) = 3/14 g(2) · h(2) = 9/98 f(2,2) ≠ g(2) ∙ h(2) No son estadísticamente independientes.
Media de una variable aleatoria Sea X una variable aleatoria con distribución de probabilidad f(x), se calcula la media o valor esperado de X como: 𝜇 = 𝐸(𝑋) = ∑ 𝑥𝑓(𝑥) 𝑥
si X es discreta y si X es continua:
∞
𝜇 = 𝐸(𝑋) = ∫ 𝑥𝑓(𝑥)𝑑𝑥 −∞
Si se considera una variable aleatoria g(X), que depende de X, el valor esperado de esta variable aleatoria será: 𝜇 = 𝐸(𝑋) = ∑ 𝑔(𝑥)𝑓(𝑥) 𝑥
si X es discreta y si X es continua:
∞
𝜇 = 𝐸(𝑋) = ∫ 𝑔(𝑥)𝑓(𝑥)𝑑𝑥 −∞
Ejercicio 19 Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 16
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Un inspector de calidad muestrea un lote que contiene siete componentes, tres defectuosos y cuatro buenos. El inspector toma una muestra de tres componentes. Encuentre el valor esperado del número de componentes buenos en esta muestra. Solución: La función de masa de la distribución será: 𝑓(𝑥) =
3 (𝑥4)(3−𝑥 )
(73)
X 0 1 2 3 f(x) 1/35 12/35 18/35 4/35 x∙f(x) 0 12/35 36/35 12/35 𝜇 = 𝐸(𝑋) = ∑ 𝑥𝑓(𝑥) = 12/7 𝑥
Ejercicio 20 En un juego de azar se pagarán $25 a una persona si y solo si salen escudos o coronas cuando se lanzan tres monedas, caso contrario la persona debe pagar $ 10. ¿Cuál es su ganancia esperada? Solución: Dado que cada moneda solo puede presentar dos resultados (escudo o corona) se puede establecer por el Teorema Universal del Conteo que se van a tener ocho posibles resultados (2 x 2 x 2 = 8), de los cuales solo 2 van a ser éxito (3 escudos o 3 coronas). Así las cosas, de acuerdo a la probabilidad clásica, la probabilidad de ganar es ¼ y la de perder es de ¾, por lo que la ganancia esperada es: E(X) = 0,25*25 – 0,75*10 = -1,25. Ejercicio 21 Suponga que el número de autos X que pasa por un auto lavado entre las 4 y las 5 pm, en cualquier viernes soleado tiene la siguiente distribución de probabilidad: X 4 5 6 7 8 9 f(x) = P(X = x) 1/12 1/12 1/4 1/4 1/6 1/6 Sea g(X) = 2X – 1 la cantidad de dinero en dólares que el administrador recibe como comisión sobre las ventas. Encuentre la ganancia esperada del administrador. Solución: X 4 5 6 7 8 9 f(x) = P(X = x) 1/12 1/12 1/4 1/4 1/6 1/6 g(X) 7 9 11 13 15 17 g(x)f(x) 7/12 9/12 11/4 13/4 15/6 17/6 𝜇 = 𝐸(𝑋) = ∑ 𝑔(𝑥)𝑓(𝑥) = $12,67 𝑥
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 17
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Sean X y Y variables aleatorias con distribución de probabilidad conjunta f(x, y). La media o valor esperado de la variable aleatoria g(X, Y) es: 𝜇𝑔(𝑋,𝑌) = 𝐸[𝑔(𝑋, 𝑌)] = ∑ ∑ 𝑔(𝑥, 𝑦)𝑓(𝑥, 𝑦) 𝑋
si X y Y son discretas y si X y Y son continuas:
∞
𝑌 ∞
𝜇𝑔(𝑋,𝑌) = 𝐸[𝑔(𝑋, 𝑌)] = ∫ ∫ 𝑔(𝑥, 𝑦)𝑓(𝑥, 𝑦)𝑑𝑦𝑑𝑥 −∞ −∞
Ejercicio 22 Sean X y Y variables aleatorias con distribución de probabilidad conjunta que se muestra, encuentre el valor esperado de g(X, Y) = X·Y Solución X 0 1 2 Σ 0 3/28 9/28 3/28 15/28 Y 1 3/14 3/14 -3/7 2 1/28 --1/28 Σ 5/14 15/28 3/28 1 𝜇𝑔(𝑋,𝑌) = 𝐸[𝑔(𝑋, 𝑌)] = ∑ ∑ 𝑔(𝑥, 𝑦)𝑓(𝑥, 𝑦) 𝑋
𝜇𝑔(𝑋,𝑌)
𝑌
3 3 1 9 3 3 3 =0∙0∙ +0∙1∙ +0∙2∙ +1∙0∙ +1∙1∙ +2∙0∙ = 28 14 28 28 14 28 14
𝜇𝑔(𝑋,𝑌) =
3 14
Ejercicio 23 Sean X y Y variables aleatorias con distribución de probabilidad conjunta que se muestra, encuentre el valor esperado de g(X, Y) = X – Y. X
0
1
1/35 3/70 1/14
9/70 9/35 9/70 3/7
Y 0 1 2 g(x)
2
3
h(y)
9/70 3/70 3/14 9/35 1/35 4/7 3/70 3/14 3/7 1/14 1
Solución: 9
9
3
1
9
9
1
𝜇𝑔(𝑋,𝑌) = (0 − 1) ∙ 70 + (0 − 2) ∙ 70 + (0 − 3) ∙ 70 + (1 − 0) ∙ 35 + (1 − 1) ∙ 35 + (1 − 2) ∙ 35 + (1 − 3) ∙ 35 + (2 − 0) ∙
3 70
9
3
+ (2 − 1) ∙ 70 + (2 − 2) ∙ 70
𝜇𝑔(𝑋,𝑌) = −1 ∙
9 − 70
2∙
9 70
−3∙
3 + 70
1∙
1 35
+0∙
9 − 35
1∙
9 35
−2∙
1 + 35
2∙
3 70
+1∙
9 + 70
0∙
3 70
=−
41 70
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 18
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Varianza y Covarianza Sea X una variable aleatoria con distribución de probabilidad f(x) y media μ. La varianza de X es: 𝜎 2 = 𝐸[(𝑋 − 𝜇)2 ] = ∑(𝑥 − 𝜇)2 𝑓(𝑥) 𝑥
si X es discreta y si X es continua:
∞
𝜎 2 = 𝐸[(𝑋 − 𝜇)2 ] = ∫ (𝑥 − 𝜇)2 𝑓(𝑥)𝑑𝑥 −∞
La desviación estándar σ es la raíz cuadrada de la varianza. Una fórmula alternativa para encontrar la varianza, que generalmente simplifica los cálculos, es la siguiente: 𝜎 2 = 𝐸(𝑋 2 ) − 𝜇2 = ∑ 𝑥 2 𝑓(𝑥) − 𝜇2 𝑥
Ejercicio 24 Sea la variable aleatoria X el número de automóviles que se utilizan con propósitos de negocio en un día de trabajo dado. La distribución de probabilidad para la compañía A es: x 1 2 3 f(x) 0,3 0,4 0,3 y para la compañía B es: x 0 1 2 3 4 f(x) 0,2 0,1 0,3 0,3 0,1 Demuestre que la varianza de la distribución de probabilidad para la compañía B es mayor que la de la compañía A. Solución: Para la compañía A: x 1 2 3 f(x) 0,3 0,4 0,3 ∑ E(X) = xf(x) 0,3 0,8 0,9 2,0 σ2 = E[(X – μ)2]∙f(x) (1 – 2)2∙0,3 (2 – 2)2∙0,4 (3 – 2)2∙0,3 0,6 σ2 = 0,3 0 0,3 0,6 𝜎 = √0,6 =
√15 = 0,775 5
Para la compañía B: x 0 1 2 3 4 f(x) 0,2 0,1 0,3 0,3 0,1 ∑ E(X) = xf(x) 0 0,1 0,6 0,9 0,4 2,0 σ2 = E[(x – μ)2]∙f(x) (0 – 2)2∙0,2 (1 – 2)2∙0,1 (2 – 2)2∙0,3 (3 – 2)2∙0,3 (4 – 2)2∙0,1 1,6 σ2 = 0,8 0,1 0 0,3 0,4 1,6 Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 19
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
𝜎 = √1,6 =
2√10 = 1,265 5
Es evidente la diferencia entre las varianzas: 1,6 > 0,6 es decir σ2B > σ2A. Ejercicio 25 Realice de nuevo el ejercicio anterior, aplicando la nueva fórmula. Solución Para la compañía A: x 1 2 3 f(x) 0,3 0,4 0,3 ∑ E(X) = xf(x) 0,3 0,8 0,9 2,0 x2 1 4 9 2 x f(x) 0,3 1,6 2,7 4,6 𝜎 2 = 𝐸(𝑋 2 ) − 𝜇2 = 4,6 − 4 = 0,6
Para la compañía B: x 0 1 2 3 4 f(x) 0,2 0,1 0,3 0,3 0,1 ∑ E(X) = xf(x) 0 0,1 0,6 0,9 0,4 2,0 x2 0 1 4 9 16 2 x f(x) 0 0,1 1,2 2,7 1,6 5,6 𝜎 2 = 𝐸(𝑋 2 ) − 𝜇2 = 5,6 − 4 = 1,6 Ejercicio 26 Sea la variable aleatoria X, número de partes defectuosas de una máquina cuando se muestrean tres partes de una línea de producción y se prueban. La siguiente es la distribución de probabilidad de X, encuentre la media y la varianza. x 0 1 2 3 f(x) 0,51 0,38 0,1 0,01 Solución: x 0 1 2 3 f(x) 0,51 0,38 0,1 0,01 ∑ E(X) = xf(x) 0 0,38 0,2 0,03 0,61 σ2 = E[(X – μ)2]∙f(x) (0 - 0,61)2 ∙ 0,51 (1 - 0,61)2 ∙ 0,38 (2 - 0,61)2 ∙ 0,1 (3 - 0,61)2 ∙ 0,01 σ2 0,189771 0,0577798 0,19321 0,057121 0,4978818 x2 0 1 x f(x) 0 0,38 2 2) 2 𝜎 = 𝐸(𝑋 − 𝜇 = 0,87 − 0,3721 = 0,4979 2
4 0,4
9 0,09
0,87
Varianza de una función de una variable aleatoria Sea X una variable aleatoria con distribución de probabilidad f(x). La varianza de la variable aleatoria g(X) es: Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 20
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas 2
2
2 𝜎𝑔(𝑋) = 𝐸 {[𝑔(𝑋) − 𝜇𝑔(𝑋) ] } = ∑[𝑔(𝑥) − 𝜇𝑔(𝑋) ] 𝑓(𝑥) 𝑥
si X es discreta y si X es continua: 2 𝜎𝑔(𝑋)
∞ 2
2
= 𝐸 {[𝑔(𝑋) − 𝜇𝑔(𝑋) ] } = ∫ [𝑔(𝑥) − 𝜇𝑔(𝑋) ] 𝑓(𝑥)𝑑𝑥 −∞
Ejercicio 27 Calcule la varianza de g(X) = 2X + 3, donde X es una variable aleatoria con distribución de probabilidad: Solución: x 0 1 2 3 f(x) ¼ 1/8 ½ 1/8 ∑ g(x) 3 5 7 9 μg(X) = E[g(X)] = g(x)f(x) ¾ 5/8 7/2 9/8 6 [g(X) – μg(x)]2f(x) 9/4 1/8 ½ 9/8 4 2
2 𝜎𝑔(𝑋) = 𝐸 {[𝑔(𝑋) − 𝜇𝑔(𝑋) ] } = ∑𝑥[2𝑥 + 3 − 6]2 𝑓(𝑥) = ∑𝑥[2𝑥 − 3]2 𝑓(𝑥) = ∑𝑥[4𝑥 2 − 12𝑥 + 9]𝑓(𝑥) 2
9
1
1
9
2 𝜎𝑔(𝑋) = 𝐸 {[𝑔(𝑋) − 𝜇𝑔(𝑋) ] } = ∑30[4𝑥 2 − 12𝑥 + 9]𝑓(𝑥) = 4 + 8 + 2 + 8 = 4
Covarianza
Sean dos variables aleatorias discretas X y Y, con distribución de probabilidad conjunta f(x,y), se define la covarianza de X y Y como: ∑ 𝑥𝑦 = 𝐸[( 𝑋 – 𝜇𝑥 )(𝑌 – 𝜇𝑦 )] = ∑ ∑(𝑥 − 𝜇𝑥 )(𝑦 − 𝜇𝑦 )𝑓(𝑥, 𝑦) 𝑥
𝑦
si X y Y son discretas y si X y Y son continuas. ∫ 𝑥𝑦 = 𝐸[( 𝑋 – 𝜇𝑥 )(𝑌 – 𝜇𝑦 ) = ∫ ∫ (𝑥 − 𝜇𝑥 )(𝑦 − 𝜇𝑦 )𝑓(𝑥, 𝑦)𝑑𝑥𝑑𝑦 𝑋 𝑌
La covarianza entre dos variables aleatorias es una medida de la naturaleza de la asociación entre las dos; así las cosas los valores grandes de X a menudo tienen como resultado valores grandes de Y, o que valores pequeños de X tengan como resultado valores pequeños de Y, por lo que X – μX positiva a menudo tendrá como resultado Y – μY positiva y viceversa. Entonces, el producto (X – μX)( Y – μY) tenderá a ser positivo. Por otro lado, si valores grandes de X tienen como resultado valores pequeños de Y, entonces se tendrá que el producto (X – μX)( Y – μY) tenderá a ser negativo. Por lo anterior, el signo de la covarianza indica si la relación entre dos variables aleatorias dependientes es positiva o negativa. Si X y Y son estadísticamente independientes se puede mostrar que la covarianza es cero, lo que no sucede cuando la covarianza es 0, ya que dos variables pueden tener covarianza cero y no ser estadísticamente independientes. La covarianza de dos variables aleatorias X y Y con medias μX μY, respectivamente, es: 𝜎𝑋𝑌 = 𝐸(𝑋𝑌) − 𝜇𝑋 𝜇𝑌
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 21
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Ejercicio 28 El número de repuestos azules X y el número de repuestos rojos Y, cuando se seleccionan al azar dos repuestos para bolígrafo de cierta caja, se describió en el ejercicio 13. Encuentre la covarianza de X y Y. Solución: Se tiene la siguiente distribución: X 0 1 2 Σ 0 3/28 9/28 3/28 15/28 Y 1 3/14 3/14 -3/7 2 1/28 --1/28 Σ 5/14 15/28 3/28 1 Sabemos del ejercicio 22 que E(XY) = 3/14. Calculemos μX y μY: 2
2
2
𝜇𝑋 = 𝐸(𝑋) = ∑ ∑ 𝑥𝑓(𝑥, 𝑦) = ∑ 𝑥𝑔(𝑥) = 0 ∗ 𝑥=0 𝑦=0 2 2
𝑥=0 2
5 15 3 3 +1∗ +2∗ = 14 28 28 4
𝜇𝑌 = 𝐸(𝑋) = ∑ ∑ 𝑦𝑓(𝑥, 𝑦) = ∑ 𝑦ℎ(𝑦) = 0 ∗ 𝑥=0 𝑦=0
𝑥=0
𝜎𝑋𝑌 = 𝐸(𝑋𝑌) − 𝜇𝑋 𝜇𝑌 =
15 3 1 1 +1∗ +2∗ = 28 7 28 2
3 3 1 9 −( )∙( ) = − 14 4 2 56
Coeficiente de Correlación
Aunque la covarianza entre dos variables aleatorias proporciona información respecto a la naturaleza de la relación entre las variables, la magnitud de σXY no indica nada respecto a la fuerza de la relación debido a que depende de la escala. Una versión de la covarianza libre de la escala se denomina coeficiente de correlación: 𝜌𝑋𝑌 =
𝜎𝑋𝑌 𝜎𝑋 𝜎𝑌
Ejercicio 29 Encuentre el coeficiente de correlación del ejercicio 28. Solución: X 0 1 2 g(x) 5/14 15/28 3/28 X2 0 1 4 ∑ E(X2) 0 15/28 3/7 27/28 27 9 45 − = 28 16 112 3 ∙ √35 𝜎𝑋 = 28
𝜎𝑋 2 = 𝐸(𝑋 2 ) − 𝜇𝑋 2 =
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 22
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Y 0 1 2 h(y) 15/28 3/7 1/28 Y2 0 1 4 ∑ E(Y2) 0 3/7 1/7 4/7 4 1 9 − = 7 4 28 3 ∙ √7 𝜎𝑌 = 14 9 − 𝜎𝑋𝑌 √5 56 = = =− ≈ −0,45 𝜎𝑋 𝜎𝑌 5 3 ∙ √35 3 ∙ √7 ( 28 ) ∙ ( 14 ) 𝜎𝑌 2 = 𝐸(𝑌 2 ) − 𝜇𝑌 2 =
𝜌𝑋𝑌
𝜌𝑋𝑌 es independiente de las unidades de X y Y, satisface la desigualdad -1 ≤ 𝜌𝑋𝑌 ≤ 1 y donde hay una dependencia lineal exacta Y = a + bX, 𝜌𝑋𝑌 = 1 si b > 0 y 𝜌𝑋𝑌 = −1 si b < 0.
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 23
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Medias y Varianzas de combinaciones lineales de variables aleatorias Algunos teoremas útiles para el cálculo de medias y varianzas de combinaciones lineales de variables aleatorias, son: Teorema 1: Si a y b son constantes, entonces: 𝐸(𝑎𝑋 + 𝑏) = 𝑎𝐸(𝑋) + 𝑏. Como corolarios, si hacemos a = 0, entonces E(aX + b) = b. Si hacemos b = 0, entonces E(aX + b) = aE(X). Ejercicio 30 Resuelva el ejemplo 21 mediante la aplicación del teorema 1 a la variable aleatoria discreta g(X) = 2X – 1. Solución: X 4 5 6 7 8 9 f(x) 1/12 1/12 1/4 1/4 1/6 1/6 E(X) 4/12 5/12 6/4 7/4 8/6 9/6 41/6 9
𝜇 = 𝐸(𝑋) = ∑ 𝑥𝑓(𝑥) = 4 ∙ 𝑥=4
1 1 1 1 1 1 41 +5∙ +6∙ +7∙ +8∙ +9∙ = 12 12 4 4 6 6 6
𝐸(2𝑋 − 1) = 2𝐸(𝑥) − 1 = 2 ∙
41 38 −1= = $12,67 6 3
Teorema 2: El valor esperado de la suma o diferencia de dos o más funciones de una variable aleatoria X, es la suma o diferencia de los valores esperados de las funciones: 𝐸[𝑚(𝑋) ± 𝑛(𝑋)] = 𝐸[𝑚(𝑋)] ± 𝐸[𝑛(𝑋)]. Ejercicio 31 Sea X una variable aleatoria con la distribución de probabilidad que sigue: x 0 1 2 3 f(x) 1/3 1/2 0 1/6 Encuentre el valor esperado de Y = (X – 1)2. Solución: 𝐸[(𝑋 − 1)2 ] = 𝐸(𝑋 2 − 2𝑋 + 1) = 𝐸(𝑋 2 ) − 2𝐸(𝑋) + 𝐸(1) x 0 1 2 3 f(x) 1/3 1/2 0 1/6 E(X) 0 1/2 0 1/2 1 2 X 0 1 4 9 E(X2) 0 1/2 0 3/2 2 1 1 1 𝐸(𝑋) = 0 ∙ + 1 ∙ + 2 ∙ 0 + 3 ∙ = 1 3 2 6 Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 24
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
𝐸(𝑋 2 ) = 0 ∙ Entonces:
1 1 1 +1∙ +4∙0+9∙ = 2 3 2 6
𝐸[(𝑋 − 1)2 ] = 𝐸(𝑋 2 ) − 2𝐸(𝑋) + 𝐸(1) = 2 − 2 ∙ 1 + 1 = 1 Teorema 3: El valor esperado de la suma o diferencia de dos o más funciones de las variables aleatorias X y Y, es la suma o diferencia de los valores esperados de las funciones, es decir: 𝐸[𝑔(𝑋, 𝑌) ± ℎ(𝑋, 𝑌)] = 𝐸[𝑔(𝑋, 𝑌)] ± 𝐸[ℎ(𝑋, 𝑌)] Como corolarios, al hacer g(X, Y) = g(X) y h(X, Y) = h(Y), vemos que 𝐸[𝑔(𝑋, 𝑌) ± ℎ(𝑋, 𝑌)] = 𝐸[𝑔(𝑋)] ± 𝐸[ℎ( 𝑌)]. Al hacer g(X, Y) = X y h(X, Y) = Y, vemos que 𝐸[𝑔(𝑋, 𝑌) ± ℎ(𝑋, 𝑌)] = 𝐸[𝑋] ± 𝐸[𝑌]. Si vemos los anteriores corolarios desde la perspectiva de la producción, podemos entonces pensar que si X representa la producción de una máquina en un período dado y Y la de otra máquina en el mismo período, X + Y va a representar la producción total en dicho período. El segundo corolario establece que la producción promedio para ambas máquinas en un período dado, es la suma de la producción promedio de cada máquina en dicho período. Teorema 4: Sean X y Y dos variables aleatorias independientes, entonces E(XY) = E(X)·E(Y). Ejercicio 32 Use los teoremas anteriores para evaluar E(2XY2 – X2Y) para la distribución de probabilidad conjunta que se muestra a continuación: X 0 1 2 Σ 0 3/28 9/28 3/28 15/28 Y 1 3/14 3/14 -3/7 2 1/28 --1/28 Σ 5/14 15/28 3/28 1 Solución 𝐸[𝑔(𝑋, 𝑌) ± ℎ(𝑋, 𝑌)] = 𝐸[𝑔(𝑋, 𝑌)] ± 𝐸[ℎ(𝑋, 𝑌)] = 𝐸[𝑔(𝑋)] ± 𝐸[ℎ( 𝑌)] 𝐸(2𝑋𝑌 2 − 𝑋 2 𝑌) = 2𝐸(𝑋)𝐸(𝑌 2 ) − 𝐸(𝑋 2 )𝐸(𝑌) X 0 1 2 g(x) 5/14 15/28 3/28 E(X) 0 15/28 6/28 3/4 2 X 0 1 4 E(X2) 0 15/28 12/28 27/28 Y 0 1 2 h(y) 15/28 3/7 1/28 E(Y) 0 3/7 1/14 1/2 2 Y 0 1 4 E(Y2) 0 3/7 4/28 4/7 3 4 27 1 6 27 3 𝐸(2𝑋𝑌 2 − 𝑋 2 𝑌) = 2 ∙ ∙ − ∙ = − = 4 7 28 2 7 56 8 Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected]
25
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Teorema 5: Si a y b son constantes, entonces σ2aX + b = a2σ2X = a2σ2. Como corolarios del teorema 5, al hacer a = 1, vemos que σ2X + b = σ2X = σ2, lo que significa que la varianza permanece sin cambio si se suma o se resta una constante a la variable aleatoria, o sea que la suma o resta de una constante corre los valores a la derecha o a la izquierda pero no cambia su variabilidad. Al hacer b = 0, entonces σ2aX + b = a2σ2X = a2σ2, lo que significa que si una variable aleatoria se multiplica por una constante o se divide entre una constante, entonces la varianza se multiplica por o se divide entre el cuadrado de la constante. Teorema 6: si X y Y son variables aleatorias con distribución de probabilidad conjunta f(x,y), entonces σ2aX + bY = a2σ2X + b2σ2Y + 2abσXY. Como corolarios del teorema 6, si X y Y son variables aleatorias independientes, entonces σ2aX + bY = a2σ2X + b2σ2Y, σ2aX - bY = a2σ2X + b2σ2Y, y si X1, X2, ….., Xn son variables aleatorias independientes, entonces: 𝜎𝑎21 𝑥1 +𝑎2 𝑥2 +⋯+𝑎𝑛 𝑥𝑛 = 𝑎12 𝜎𝑥21 + 𝑎22 𝜎𝑥22 + ⋯ + 𝑎𝑛2 𝜎𝑥2𝑛 Ejemplo 33 Si X y Y son variables aleatorias con varianzas 𝜎𝑋2 = 2, 𝜎𝑌2 = 4, y covarianza 𝜎𝑋𝑌 = −2, entonces encuentre la varianza de la variable aleatoria Z = 3X – 4Y + 8. Solución: 2 2 2 2 𝜎𝑍2 = 𝜎3X – 4Y + 8 = 𝜎3𝑋−4𝑌 = 9𝜎𝑋 + 16𝜎𝑌 − 24𝜎𝑋𝑌 = 9 ∙ 2 + 16 ∙ 4 − 24 ∙ −2 = 130 Ejercicio 34 Sean X y Y la cantidad de dos tipos diferentes de impurezas en un lote de cierto producto químico. Suponga que X y Y son variables aleatorias independientes con varianzas 𝜎𝑋2 = 2, 𝜎𝑌2 = 3. Encuentre la varianza de la variable aleatoria Z = 3X – 2Y + 5. Solución: 2 2 2 2 𝜎𝑍2 = 𝜎3X – 2Y + 5 = 𝜎3𝑋−2𝑌 = 9𝜎𝑋 + 4𝜎𝑌 = 9 ∗ 2 + 4 ∗ 3 = 30 Teorema de Chebyshev La varianza de una variable aleatoria ofrece información respecto a la variabilidad de las observaciones alrededor de la media aritmética, por lo que si la varianza es pequeña, se espera que la mayor parte de los valores se agrupen alrededor de la media, caso contrario se esperaría que la mayor parte de los valores se alejen de ella. La probabilidad de que una variable aleatoria tome un valor dentro de cierto intervalo alrededor de la media es mayor que para una variable aleatoria similar con una desviación estándar mayor. Si pensamos en la probabilidad en términos de áreas, esperaríamos una distribución continua con una desviación estándar pequeña que tenga la mayor parte de su área cercana a la media; caso contrario, un valor grande de la desviación estándar indica una variabilidad mayor y se esperaría entonces que el área fuera más extendida. Igual desarrollo se puede lograr para una variable aleatoria discreta. El matemático ruso Pafnuti Lvóvich Chebyshev descubrió que la fracción del área entre dos valores simétricos cualesquiera alrededor de la media, está relacionada con la desviación estándar. Como el área bajo una curva de distribución de probabilidad o en un histograma de probabilidad suma 1, el área entre cualesquiera dos números es la probabilidad de que una variable aleatoria tome un valor entre estos números. Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 26
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
El teorema de Chebyshev da una estimación conservadora de la probabilidad de que una variable aleatoria tome un valor dentro de k desviaciones estándar de su media para cualquier número real k. Teorema de Chebyshev: la probabilidad de que cualquier variable aleatoria X tome un valor dentro de k desviaciones estándar de la media es al menos 1 – 1/k2, o sea: 1 𝑃(𝜇 − 𝑘𝜎 < 𝑋 < 𝜇 + 𝑘𝜎) ≥ 1 − 2 𝑘 Ejercicio 35: Una variable aleatoria X tiene una media μ = 8, varianza σ2 = 9 y distribución de probabilidad desconocida. Encuentre a) P(-4 < X < 20) y b) P(|X – 8|≥ 6). Solución: a) –4 = μ – kσ –4 = 8 – 3k k = 4 P(-4 < X < 20) ≥ 1 – (1/16) P(-4 < X < 20) ≥ 15/16 20 = μ + kσ 20 = 8 + 3k k = 4 P(-4 < X < 20) ≥ 1 – (1/16) P(-4 < X < 20) ≥ 15/16 b) P(|X – 8|≥ 6) = 1 – P(|X – 8|< 6) = 1 – P(– 6 < X – 8 < 6) = 1 – P(8 – 6 < X < 8 + 6) = 1 – P(8 – 2*3 < X < 8 + 2*3) k = 2 1 – (1 – ¼) = ¼ Ejercicio 36: Se tiene un grupo de datos cuya μ = 4 y σ2 = 3,10. ¿Entre qué dos valores se encuentra, como mínimo, el 75% de las observaciones? Solución: 1 0,75 = (1 − 2 ) 𝑘 Entonces: 1 0,75 − 1 = (− 2 ) 𝑘 1 0,25 = 2 𝑘 2 1 𝑘 = ⁄0,25 = 4 𝑘=2 𝑥̅ − 𝑘𝜎 = 4 − 2 ∗ 1,76 = 0,48 𝑥̅ + 𝑘𝜎 = 4 + 2 ∗ 1,76 = 7,52 Por tanto, el 75% de las observaciones se encuentra entre [0,48; 7,52].
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 27
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Distribuciones de probabilidad discreta La distribución de probabilidad discreta describe el comportamiento de una variable aleatoria, independientemente de si se representa de forma gráfica o mediante un histograma, en forma tabular o con una fórmula. A menudo las observaciones que se generan mediante diferentes experimentos estadísticos tienen el mismo tipo general de comportamiento. En consecuencia, las variables aleatorias discretas asociadas con estos experimentos se pueden describir esencialmente con la misma distribución de probabilidad y, por lo tanto, es posible representarlas usando una sola fórmula. De hecho, se necesitan sólo unas cuantas distribuciones de probabilidad importantes para describir muchas de las variables aleatorias discretas que se encuentran en la práctica. Distribuciones binomial y multinomial Con frecuencia un experimento consta de pruebas repetidas, cada una con dos resultados posibles que se pueden denominar éxito o fracaso. La aplicación más evidente tiene que ver con la prueba de artículos a medida que salen de una línea de ensamble, donde cada prueba o experimento puede indicar si un artículo está o no defectuoso. Podemos elegir definir cualquiera de los resultados como éxito. El proceso se conoce como proceso de Bernoulli y cada ensayo se denomina experimento de Bernoulli. Por ejemplo, si extraemos cartas de una baraja y éstas no se reemplazan, cambian las probabilidades en la repetición de cada ensayo; es decir, la probabilidad de seleccionar una carta de corazones en la primera extracción es 1/4, pero en la segunda es una probabilidad condicional que tiene un valor de 13/51 o 12/51, dependiendo de si resulta un corazón en la primera extracción; entonces éste ya no sería considerado un conjunto de experimentos de Bernoulli. El proceso de Bernoulli En términos estrictos el proceso de Bernoulli se caracteriza por lo siguiente: 1. El experimento consta de ensayos repetidos. 2. Cada ensayo produce un resultado que se puede clasificar como éxito o fracaso. 3. La probabilidad de un éxito, que se denota con p, permanece constante de un ensayo a otro. 4. Los ensayos repetidos son independientes. Considere el conjunto de experimentos de Bernoulli en el que se seleccionan tres artículos al azar de un proceso de producción, luego se inspeccionan y se clasifican como defectuosos o no defectuosos. Un artículo defectuoso se designa como un éxito. El número de éxitos es una variable aleatoria X que toma valores integrales de cero a 3. Los ocho resultados posibles y los valores correspondientes de X son: Resultado NNN NND NDN DNN NDD DND DDN DDD X 0 1 1 1 2 2 2 3 Como los artículos se seleccionan de forma independiente y se asume que el proceso produce 25% de artículos defectuosos. 9 𝑃(𝑁𝐷𝑁) = 𝑃(𝑁)𝑃(𝐷)𝑃(𝑁) = 0,75 ∙ 0,25 ∙ 0,75 = = 0,140625 64 Cálculos similares dan las probabilidades para los otros resultados posibles. La distribución de probabilidad de X es, por lo tanto, x 0 1 2 3 f(x) 27/64 27/64 9/64 1/64 Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 28
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Distribución binomial El número X de éxitos en n experimentos de Bernoulli se denomina variable aleatoria binomial. La distribución de probabilidad de esta variable aleatoria discreta se llama distribución binomial y sus valores se denotarán como b(x; n, p), ya que dependen del número de ensayos y de la probabilidad de éxito en un ensayo dado. Por consiguiente, para la distribución de probabilidad de X el número de productos defectuosos es: 9 𝑃(𝑋 = 2) = 𝑓(2) = 𝑏(2; 3, 0,25) = 64 Generalicemos ahora la ilustración anterior con la intención de obtener una fórmula para b(x; n, p). Esto significa que deseamos encontrar una fórmula que dé la probabilidad de x éxitos en n ensayos para un experimento binomial. Un experimento de Bernoulli puede tener como resultado un éxito con probabilidad p y un fracaso con probabilidad q = 1 – p. Entonces, la distribución de probabilidad de la variable aleatoria binomial X, el número de éxitos en n ensayos independientes, es: 𝑛 𝑏(𝑥; 𝑛, 𝑝) = ( ) ∙ 𝑝 𝑥 ∙ 𝑞 𝑛−𝑥 = 𝑛𝐶𝑥 ∙ 𝑝 𝑥 ∙ 𝑞 𝑛−𝑥 , 𝑥 = 0, 1, 2, … . . , 𝑛 𝑥 La media y la varianza de la distribución binomial b (x; n, p) son μ = n∙p y σ2 = n∙p∙q. Ejercicio 37 La probabilidad de que cierta clase de componente sobreviva a una prueba de choque es de 3/4. Calcule la probabilidad de que sobrevivan exactamente 2 de los siguientes 4 componentes que se prueben. Solución: 3 4 27 𝑏 (2; 4, ) = ( ) ∙ 0,752 ∙ 0,252 = = 0,2109375 4 2 128 Ejercicio 38 La probabilidad de que un paciente se recupere de una rara enfermedad sanguínea es de 0,4. Si se sabe que 15 personas contrajeron la enfermedad, ¿cuál es la probabilidad de que a) sobrevivan al menos 10, b) sobrevivan de 3 a 8, y c) sobrevivan exactamente 5? Solución: 15 𝑖 15−𝑖 a) 𝑏(≥ 10; 15, 0,4) = ∑15 ) = 0,03383330288 = 1 − 0,966 = 0,034 𝑖=10 (( 𝑖 ) ∙ 0,4 ∙ 0,6 b) 𝑏(3 ≤ 𝑥 ≤ 8; 15, 0,4) = ∑8𝑖=3 ((15 ) ∙ 0,4𝑖 ∙ 0,615−𝑖 ) = 0,8778385911 = 0,905 − 0,027 = 0,878 𝑖 c) 𝑏(5; 15, 0,4) = (15 ) ∙ 0,45 ∙ 0,610 = 0,186 = 0,403 − 0,217 = 0,186 5 Ejercicio 39 Una cadena grande de tiendas al detalle le compra cierto tipo de dispositivo electrónico a un fabricante, el cual le indica que la tasa de dispositivos defectuosos es de 3%. a) El inspector de la cadena elige 20 artículos al azar de un cargamento. Cuál es la probabilidad de que haya al menos un artículo defectuoso entre estos 20? 20
𝑏(𝑥 ≥ 1; 20, 0,03) = ∑ ( 𝑖=1
=1−(
20 ) ∙ 0,03𝑖 ∙ 0,9720−𝑖 = 1 − 𝑏(0; 20, 0,03) = 0,4562056571 𝑖
20 ) ∙ 0,030 ∙ 0,9720 = 1 − 0,5437943429 = 0,4562 0
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 29
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
b) Suponga que el detallista recibe 10 cargamentos en un mes y que el inspector prueba aleatoriamente 20 dispositivos por cargamento. Cuál es la probabilidad de que haya exactamente tres cargamentos que contengan al menos un dispositivo defectuoso de entre los 20 seleccionados y probados? Cada cargamento puede o no contener al menos un artículo defectuoso, por lo que el hecho de probar el resultado de cada cargamento puede considerarse un experimento de Bernoulli con p = 0,4562. Si se supone la independencia de un cargamento a otro, y si se denota con Y el número de cargamentos que contienen al menos un artículo defectuoso, Y sigue otra distribución binomial: 10 𝑏(3; 10, 0,4562) = ( ) ∙ 0,45623 ∙ 0,54387 = 0,1602 3 Ejercicio 40 Se conjetura que hay impurezas en 30% del total de pozos de agua potable de cierta comunidad rural. Para obtener información sobre la verdadera magnitud del problema se determina que debe realizarse algún tipo de prueba. Como es muy costoso probar todos los pozos del área, se eligen 10 al azar para someterlos a la prueba. Solución: a) Si se utiliza la distribución binomial, cual es la probabilidad de que exactamente 3 pozos tengan impurezas, considerando que la conjetura es correcta? 𝑏(3; 10, 0,3) = (
10 ) ∙ 0,33 ∙ 0,77 = 0,2668 3
b) Cuál es la probabilidad de que más de 3 pozos tengan impurezas? 𝑃(𝑥 > 3) = 1 − 𝑏(𝑥 ≤ 3; 10, 0,3) = 1 − 0,650 = 0,350 10 10 10 𝑃(𝑥 > 3) = 1 − (0,2668 + ( ) ∙ 0,32 ∙ 0,78 + ( ) ∙ 0,31 ∙ 0,79 + ( ) ∙ 0,30 ∙ 0,710 ) 2 1 0 𝑃(𝑥 > 3) = 1 − (0,2668 + 0,2335 + 0,1211 + 0,0282) = 1 − 06496 = 0,3504 Ejercicio 41 Calcule la media y la varianza de la variable aleatoria binomial del ejemplo 37 y después utilice el teorema de Chebyshev para interpretar el intervalo μ ± 2σ. Solución: 𝜇 = 𝑛𝑝 = 15 ∗ 0,4 = 6 2 𝜎 = 𝑛𝑝𝑞 = 15 ∗ 0,4 ∗ 0,6 = 3,6 𝜎 = 1,897 El intervalo que se requiere es 6 ± 2𝑥1,897 = 6 ± 3,794 o sea de 2,206 a 9,794. El teorema de Chebyshev establece que el número de pacientes recuperados, de un total de 15 que contrajeron la enfermedad, tiene una probabilidad de al menos 3/4 de caer entre 2,206 y 9,794 o, como los datos son discretos, incluso entre 2 y 10. Ejercicio 42 Considere la situación del ejercicio 39. La idea de que el 30% de los pozos tienen impurezas es solo una conjetura del consejo local del agua. Suponga que se eligen 10 pozos de forma aleatoria y resulta que 6 contienen impurezas. ¿Que implica esto respecto de la conjetura? Utilice un enunciado de probabilidad. Solución: Debemos preguntarnos: ¿si la conjetura es correcta, podríamos haber encontrado 6 o más pozos con impurezas? Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 30
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas 10
𝑃(𝑥 ≥ 6) = ∑ 𝑏(𝑥; 10, 0,3) = 0,0473 𝑥=6
En consecuencia, es poco probable (4,73% de probabilidad) que se encuentren 6 o más pozos que contengan impurezas si solo 30% de ellos las contienen. Esto pone seriamente en duda la conjetura y sugiere que el problema de la impureza es mucho más grave. Ejercicio 43 Todos los días se seleccionan, de manera aleatoria, 15 unidades de un proceso de manufactura con el propósito de verificar el porcentaje de unidades defectuosas en la producción. Con base en información histórica, la probabilidad de tener una unidad defectuosa es de 0,05. La gerencia ha decidido detener la producción cada vez que una muestra de 15 unidades tenga dos o más defectuosas. ¿Cuál es la probabilidad de que, en cualquier día, la producción se detenga? 𝑃(𝑥 ≥ 2) = 1 − 𝑏(𝑥 ≤ 1; 15, 0,05) = 1 − 0,829 = 0,171 Ejercicio 44 Un club nacional de automovilistas comienza una campaña telefónica con el propósito de aumentar el número de miembros. Con base en experiencia previa, se sabe que una de cada 20 personas que reciben la llamada se une al club. Si en un día 25 personas reciben la llamada, ¿cuál es la probabilidad de que por lo menos dos de ellas se inscriban al club? 𝑝 = 1⁄20 = 0,05 𝑃(𝑥 ≥ 2) = 1 − 𝑃(𝑥 ≤ 1) = 1 − 𝑏(𝑥 ≤ 1; 25, 0,05) 𝑃(𝑥 ≥ 2) = 1 − 𝑏(0; 25, 0,05) − 𝑏(1; 25, 0,05) 25 25 𝑃(𝑥 ≥ 2) = 1 − ( ) ∙ 0,050 ∙ 0,9525 − ( ) ∙ 0,051 ∙ 0,9524 0 0 𝑃(𝑥 ≥ 2) = 1 − 0,2774 − 0,365 = 0,3576
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 31
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Experimentos Multinomiales y la Distribución Multinomial
El experimento binomial se convierte en un experimento multinomial si cada prueba tiene más de dos resultados posibles. Si una prueba dada puede conducir a los k resultados E1, E2, …., Ek con probabilidades p1, p2, …., pk, entonces la distribución de probabilidad de las variables aleatorias X1, X2, ….., Xk, que representan el número de ocurrencias para E1, E2, …., Ek en n pruebas independientes es: 𝑓(𝑥1 , 𝑥2 , … . . , 𝑥𝑘; 𝑝1 , 𝑝2 , … . . , 𝑝𝑘 , 𝑛) = (𝑥
𝑛 1 ,𝑥2 ,…..,𝑥𝑘
𝑥
𝑥
𝑥
) 𝑝1 1 𝑝2 2 … . . 𝑝𝑘 𝑘
con ∑𝑘𝑖=1 𝑥𝑖 = 𝑛 𝑦 ∑𝑘𝑖=1 𝑝𝑖 = 1 Ejercicio 45: Si se lanza seis veces un par de dados, ¿cuál es la probabilidad de obtener un total de 7 u 11 dos veces, un par igual una vez y cualquier otra combinación tres veces? Solución: E1: obtener 7 u 11 dos veces. E2: obtener un par una vez. E3: obtener cualquier otra combinación tres veces. P(E1) = 6/36 + 2/36 = 8/36 = 2/9 P(E2) = 6/36 = 1/6 P(E3) = 1 – 1/6 – 2/9 = 11/18 X1: 2 X2: 1 X3: 3 n: 6 2 1 11
2 2 1 1 11 3
6!
2 2 1 1 11 3
6655
6 𝑓 (2, 1, 3; 9 , 6 , 18 , 6) = (2,1,3 ) (9) (6) (18) = (2!∙1!∙3!) (9) (6) (18) = 59049 = 11,27%
Ejercicio 46: De acuerdo con la teoría genética, cierta cruza de conejillos de indias tendrá crías rojas, negras y blancas, con relación 8:4:4. Encuentre la probabilidad de que entre ocho crías 5 sean rojas, 2 negras y 1 blanca. Solución: E1: obtener 5 crías rojas. E2: obtener 2 crías negras. E3: obtener 1 cría blanca. P(E1) = 8/16 = 0,5 P(E2) = 4/16 = 0,25 P(E3) = 4/16 = 0,25 X1: 5 X2: 2 X3: 1 n=8 8! 21 8 𝑓(5, 2, 1; 0,5, 0,25, 0,25, 8) = (5,2,1 ) (0,5)5 (0,25)2 (0,25)1 = ( ) (0,5)5 (0,25)2 (0,25)1 = = 8,2% 5!2!1!
256
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 32
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Ejercicio 47: Las probabilidades de que un delegado a cierta convención llegue por aire, autobús, automóvil o tren son 0,4, 0,2, 0,3 y 0,1, respectivamente. ¿Cuál es la probabilidad de que entre nueve delegados de esta convención seleccionados al azar, tres lleguen por aire, tres por autobús, uno en automóvil y dos en tren? Solución: E1: 3 llegan por aire. E2: 3 llegan en autobús. E3: 1 llega en automóvil. E4: 2 llegan en tren. P(E1) = 0,4 P(E2) = 0,2 P(E3) = 0,3 P(E4) = 0,1 9 𝑓(3, 3, 1, 2; 0,4, 0,2, 0,3, 0,1, 9) = ( ) (0,4)3 (0,2)3 (0,3)1 (0,1)2 3, 3, 1, 2 9! 𝑓(3, 3, 1, 2; 0,4, 0,2, 0,3, 0,1, 9) = ( ) (0,4)3 (0,2)3 (0,3)1 (0,1)2 = 0,77% 3! 3! 1! 2! Distribución Hipergeométrica
La distribución hipergeométrica es una distribución discreta relacionada con muestreos aleatorios y sin reemplazo. Supóngase que se tiene una población de N elementos de los cuales, d pertenecen a la categoría A y N - d a la B. La distribución hipergeométrica mide la probabilidad de obtener x (0 ≤ x ≤ d) elementos de la categoría A en una muestra sin reemplazo de n elementos de la población original. En la distribución de probabilidad de la variable aleatoria hipergeométrica X, el número de éxitos en una muestra aleatoria de tamaño n que se selecciona de N artículos de los que k se denominan éxito y N – k fracaso, es ℎ(𝑥; 𝑁, 𝑛, 𝑘) =
(𝑘𝑥)(𝑁−𝑘 ) 𝑛−𝑥 (𝑁 ) 𝑛
, 𝑥 = 0, 1, 2, … . . , 𝑛
La media y la varianza de la distribución hipergeométrica h(x; N, n, k) son: 𝜇=
𝑛𝑘 𝑁 − 𝑛 𝑛𝑘 𝑘 𝑦 𝜎2 = ∙ (1 − ) 𝑁 𝑁−1 𝑁 𝑁
Ejercicio 48: Se selecciona al azar un comité de 5 personas entre tres ingenieros civiles y seis mecánicos, determine la distribución de probabilidad para el número de civiles en el comité. Encuentre μ y σ2. Solución: La formulación sería h(x; 9, 5, 3) por lo que la fórmula general sería: 9−3 (𝑥3)(5−𝑥 ) ℎ(𝑥; 9, 5, 3) = , 𝑥 = 0, 1, 2, 3 9 ( 5) X 0 1 2 3 h(x) 1/21 5/14 10/21 5/42 𝜇=
5∙3 9
5 = 3 = 1, 6̅
9−5 3 3 5 𝜎 2 = 9−1 ∙ 5 ∙ 9 (1 − 9) = 9 = 0, 5̅
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 33
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Ejercicio 49: Lotes de 40 componentes cada uno se denominan aceptables si no contienen más de tres componentes defectuosos. El procedimiento para muestrear el lote es seleccionar cinco componentes al azar y rechazar el lote si se encuentra un componente defectuoso. ¿Cuál es la probabilidad de que se encuentre exactamente un componente defectuoso en la muestra si hay tres defectuosos en todo el lote? Encuentre μ y σ2. Solución: (3)(40−3) (3)(37) 595 ℎ(1; 40, 5, 3) = 1 405−1 = 1 404 = = 30,11% 1976 (5) (5) 5∙3 3 40 − 5 5 ∙ 3 3 259 𝜇= = = 0,375 𝜎 2 = ∙ (1 − ) = = 0,3113 40 8 40 − 1 40 40 832 Ejercicio 50: Para el ejemplo anterior utilice el teorema de Chebyshev para interpretar el intervalo μ ± 2σ. Solución: Como 𝜎 = 0,5579 el intervalo requerido es 0,375 ± 1,1159, es decir [-0,7409, 1,4909]. Chebyshev establece: 1 𝑃(𝜇 − 𝑘𝜎 < 𝑋 < 𝜇 + 𝑘𝜎) ≥ 1 − 2 𝑘 Por lo que al menos tres cuartas partes de las veces los cinco componentes contendrán menos de dos defectuosos. Relación de la distribución hipergeométrica con la distribución binomial Si n es pequeño comparado con N, la naturaleza de los N artículos cambia muy poco en cada prueba; así la cantidad k/N se compara con el parámetro binomial p y como consecuencia la distribución binomial se puede ver como una versión de población grande de las distribuciones hipergeométricas. La media y la varianza se obtienen de las fórmulas siguientes: 𝑛𝑘 𝑛∙𝑘 𝑘 𝜇 = 𝑛𝑝 = 𝜎 2 = 𝑛𝑝𝑞 = (1 − ) 𝑁 𝑁 𝑁 Ejercicio 51: Un fabricante de neumáticos para automóvil reporta que entre un cargamento de 5000 que se manda a un distribuidor, 1000 están ligeramente manchados. Si se compran 10 de estos neumáticos al distribuidor, ¿cuál es la probabilidad de que exactamente tres estén manchados? Solución: 10 h(3; 5000, 10, 1000) ≈ b(3; 10, 0,2) = ( ) 0,23 0,87 = 0,2013 3 4000 (1000 )( ) ℎ(3; 5000, 10, 1000) = 3 5000 7 = 0,2015 ( 10 )
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 34
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Distribución Hipergeométrica Multivariada
La distribución hipergeométrica se puede extender al caso donde los N artículos se pueden dividir en k celdas A1, A2, A3, ….., Ak, con a1 elementos en la primera celda, a2 en la segunda y así sucesivamente hasta llegar a ak elementos en la k-ésima celda. Interesa entonces la probabilidad de que una muestra aleatoria de tamaño n tenga x1 elementos en la celda A1, x2 en la celda A2, ….., xk en la celda Ak, lo cual se representa como: 𝑓(𝑥1 , 𝑥2 , … . . , 𝑥𝑘 ; 𝑎1 , 𝑎2 , … . . , 𝑎𝑘 , 𝑁, 𝑛) La distribución de probabilidad requerida se define como: Si N artículos se pueden dividir en las k celdas A1, A2, A3, ….., Ak, con a1, a2, ….., ak elementos, respectivamente, entonces la distribución de probabilidad de las variables aleatorias X1, X2, X3, ….., Xk, que representan el número de elementos que se seleccionan de A1, A2, A3, ….., Ak en una muestra aleatoria de tamaño n, es 𝑓(𝑥1 , 𝑥2 , … . . , 𝑥𝑘 ; 𝑎1 , 𝑎2 , … . . , 𝑎𝑘 , 𝑁, 𝑛) = 𝑘
(𝑎𝑥1 ) (𝑎𝑥2 ) ∙∙∙∙ (𝑎𝑥𝑘 ) 1
𝑘
2
𝑘
(𝑁 ) 𝑛
𝑐𝑜𝑛 ∑ 𝑥𝑖 = 𝑛 𝑦 ∑ 𝑎𝑖 = 𝑁 𝑖=1
𝑖=1
Ejercicio 52: Un grupo de 10 individuos se usa para un estudio biológico. El grupo tiene tres personas con sangre tipo O, cuatro con sangre tipo A y tres con tipo B. ¿Cuál es la probabilidad de que una muestra aleatoria de cinco contenga una persona con sangre tipo O, dos personas con tipo A y dos personas con tipo B? Solución: (31)(42)(32) 3 𝑓(1, 2, 2; 3, 4, 3, 10, 5) = = = 0,2143 14 (10 ) 5 Ejercicio 53: Un club de estudiantes extranjeros tiene como miembros a dos canadienses, tres japoneses, cinco italianos y dos alemanes. Si se selecciona al azar u comité de cuatro, encuentre la probabilidad de que a) todas las nacionalidades estén representadas y b) todas las nacionalidades estén representadas excepto los italianos. Solución: a) 𝑓(1, 1, 1,1; 2, 3, 5, 2, 12, 4) = b) 𝑓(2, 1,0,1; 2, 3, 5, 2, 12, 4) =
(21)(31)(51)(21)
=
4 33
=
2 165
(12 4) 2 3 5 2 (2)(1)(0)(1) (12 4) 2 3 5 2 (1)(2)(0)(1) (12 4) 2 3 5 2 (1)(1)(0)(2) (12 4)
4
𝑓(1, 2, 0, 1; 2, 3, 5, 2, 12, 4) =
= 165
𝑓(1, 1, 0, 2; 2, 3, 5, 2, 12, 4) =
=
2 165
La probabilidad de que todas las naciones, excepto los italianos, estén representados es de 8/165
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 35
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Distribuciones binomial negativa y geométrica
Si consideramos un experimento con las mismas propiedades del experimento binomial, con la excepción de que las pruebas se repiten hasta lograr un número determinado de éxitos, tendremos un experimento con en el que deseamos encontrar la probabilidad de que ocurra el k-ésimo éxito en la x-ésima prueba, lo cual se denomina experimento binomial negativo. El número X de pruebas que produce k éxitos en un experimento binomial negativo se llama variable aleatoria binomial negativa y su distribución de probabilidad se llama distribución binomial negativa. Sus propiedades dependen del número de éxitos que se desean y la probabilidad de un éxito en una prueba dada y la denotaremos como b*(x; k, p). Si las pruebas independientes repetidas pueden tener como resultado un éxito con probabilidad p y un fracaso con probabilidad q = 1 – p, entonces la distribución de probabilidad de la variable aleatoria X, el número de la prueba en la que ocurre el k-ésimo éxito, es: 𝑥 − 1 𝑘 𝑥−𝑘 𝑏 ∗ (𝑥; 𝑘, 𝑝) = ( )𝑝 𝑞 𝑐𝑜𝑛 𝑥 = 𝑘, 𝑘 + 1, 𝑘 + 2, … .. 𝑘−1 Ejercicio 54 Encuentre la probabilidad de que una persona que lanza tres monedas obtenga solo escudos o coronas por segunda vez en el quinto lanzamiento. Solución: x = 5, k = 2 y p =1/4 5 − 1 1 2 3 5−2 27 𝑏 ∗ (5; 2, 1/4) = ( )( ) ( ) = ≈ 0,1055 2−1 4 4 256 Ejercicio 55 La probabilidad de que una persona que vive en Cartago tenga un perro, se estima en 30%. Encuentre la probabilidad de que la décima persona entrevistada al azar sea la quinta que tiene un perro. Solución: x = 10, k = 5 y p = 0,3 10 − 1 𝑏 ∗ (10; 5, 0,3) = ( ) (0,3)5 (0,7)5 = 0,0515 = 5,15% 5−1 Si consideramos el caso especial de la distribución binomial negativa donde k = 1, tenemos una distribución de probabilidad para el número de pruebas que se requieren para un solo éxito, por lo que la binomial negativa se reduce a la forma 𝑏 ∗ (𝑥; 1, 𝑝) = 𝑝𝑞 𝑥−1, con x = 1, 2, 3, …. Como los términos sucesivos constituyen una progresión geométrica, a este caso especial se le denomina distribución geométrica y se denota g(x;p). Entonces podemos definir que si pruebas independientes repetidas pueden tener como resultado un éxito con probabilidad p y un fracaso con probabilidad q = 1 – p, entonces la distribución de probabilidad de la variable aleatoria X, el número de la prueba en el que ocurre el primer éxito, es: 𝑔(𝑥; 𝑝) = 𝑝𝑞 𝑥−1 , 𝑐𝑜𝑛 𝑥 = 1, 2, 3, … La media y la varianza de una variable aleatoria que sigue la distribución geométrica son: 𝜇=
1 𝑝
𝜎2 =
1−𝑝 𝑞 = 2 2 𝑝 𝑝
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 36
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Ejercicio 56 Se sabe que, en cierto proceso de fabricación, en promedio, uno de cada 100 artículos es defectuoso. ¿Cuál es la probabilidad de que el quinto artículo que se inspecciona sea el primer defectuoso que se encuentra? Determine la media y la varianza de la distribución. Solución: 𝑔(5; 0,01) = 0,01 ∙ 0,994 = 0,00961 1 0,99 𝜇= = 100 𝜎2 = = 9900 0,01 0,0001 Ejercicio 57 En “tiempo ocupado” un conmutador telefónico está muy cerca de su capacidad, por lo que los usuarios tienen dificultad al hacer sus llamadas. Es de interés conocer el número de intentos necesario a fin de conseguir un enlace telefónico. Suponga que p = 0,05 es la probabilidad de conseguir un enlace durante el tiempo ocupado. Determine la probabilidad de que se necesiten cinco intentos para lograr una llamada exitosa. Determine la media y la varianza de la distribución. Solución: 𝑔(5; 0,05) = 0,05𝑥 0,954 = 0,0407 1 0,95 𝜇= = 20 𝜎2 = = 380 0,05 0,0025
Distribución Poisson
Es una distribución comúnmente usada en el trabajo científico y se puede considerar es una aproximación de la distribución binomial, cuando n es grande y p es pequeña. A partir de la distribución binomial, cuando n es grande y p pequeña, se puede determinar que la función de masa depende de la media (np) y muy pocos de los valores específicos de n y p, por lo que se puede aproximar la función de masa con una cantidad que dependa solo del producto np, a la cual llamaremos λ. Entonces la función de masa de la nueva distribución, cuyo nombre es Distribución Poisson en honor de su desarrollador, será: 𝜆𝑥 −𝜆 𝑒 𝑠𝑖 𝑥 𝑒𝑠 𝑢𝑛 𝑒𝑛𝑡𝑒𝑟𝑜 𝑛𝑜 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑜 𝑝(𝑥) = 𝑃(𝑋 = 𝑥) = { 𝑥! 0 𝑐𝑜𝑛 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑜𝑡𝑟𝑜 𝑣𝑎𝑙𝑜𝑟 𝑐𝑜𝑛 𝜇 = 𝜆 𝑦 𝜎 2 = 𝜆 Ejercicio 58 Si λ = 3, determine Poisson (x = 2), Poisson (x = 10), Poisson (x = 0), Poisson (x = -1) y Poisson (x = 0,5) Solución: 32
p(2) = 𝑒 −3 2! = 0,2240 310
p(10) = 𝑒 −3 10! = 0,0008 30
p(0) = 𝑒 −3 0! = 0,0498 𝑝(−1) = 0 𝑝(0,5) = 0 Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 37
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Ejercicio 59 Si λ = 4, determine Poisson (x ≤ 2), Poisson (x > 1) Solución: p(x ≤ 2) = 0,2381 p(x > 1) = 1 – p(x ≤ 1) = 1 – 0,0916 = 0,9084 Ejercicio 60 Unas partículas están suspendidas en una medida de concentración de 10 partículas por ml. Se agita por completo un volumen grande de la suspensión y después se extrae 1 ml. ¿Cuál es la probabilidad de que solo se extraigan 8 partículas? Solución: p(8) = 𝑒 −10
108 8!
= 0,1126
Ejercicio 61 Unas partículas están suspendidas en una medida de concentración de 6 partículas por ml. Se agita por completo un volumen grande de la suspensión y después se extrae 3 ml. ¿Cuál es la probabilidad de que solo se extraigan 15 partículas? Solución: 1815 p(15) = 𝑒 −18 = 0,0786 15! Ejercicio 62 La tía Eka hornea galletas con chispas de chocolate en grupos de 100 galletas. Agrega 300 chispas en la masa. Cuando las galletas están listas le ofrece una. ¿Cuál es la probabilidad de que su galleta no tenga chispas de chocolate? Solución: 30 p(0) = 𝑒 −3 = 0,0498 0! Ejercicio 63 Los sobrinos de la tía Eka se quejan de que ella es muy tacaña con las chispas de chocolate y le piden que agregue suficientes chispas a la masa de forma que solo un 1% de las galletas no tenga chispas de chocolate. ¿Cuántas chispas debe agregar en la masa de las 100 galletas para cumplir su propósito? Solución: 𝜆0 p(0) = 𝑒 −𝜆 = 0,01 0! 𝑛 𝜆 = 100 = 0,01𝑛 (0,01𝑛)0 𝑒 −0,01𝑛 = 0,01 0! 𝑒 −0,01𝑛 = 0,01 Por calculadora: 𝑛 = 461 Manualmente: 𝑙𝑛 𝑒 −0,01𝑛 = ln 0,01
−0,01𝑛 = −4,6052
𝑛 = 461
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 38
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Ejercicio 64 Suponga que el número de visitas a un sitio web, durante un intervalo fijo, sigue una distribución Poisson. Considere que la media de la razón de visitas es de cinco por minuto. Determine la probabilidad de que haya solo 17 visitas en los siguientes 3 minutos. Solución: 1517
p(17) = 𝑒 −15 17! = 0,0847 Ejercicio 65 Una suspensión contiene partículas en una concentración desconocida de λ por ml. Se agita por completo la suspensión y después se extraen 4 ml y se cuentan 17 partículas. Estime λ. Solución: 17 𝜆 = 4 = 4,25 𝑝𝑎𝑟𝑡í𝑐𝑢𝑙𝑎𝑠/𝑚𝑙 Ejercicio 66 Durante un experimento de laboratorio el número promedio de partículas radiactivas que pasan a través de un contador en un milisegundo es 4. ¿Cuál es la probabilidad de que entren 6 partículas al contador en un milisegundo dado? Solución: 46 p(6) = 𝑒 −4 = 0,1042 6! Ejercicio 67 El número promedio de camiones-tanque que llega cada día a cierta ciudad portuaria es 10. Las instalaciones en el puerto pueden alojar a lo sumo 15 camiones-tanque por día. ¿Cuál es la probabilidad de que en un día determinado lleguen más de 15 camiones y se tenga que rechazar algunos? Solución: 10𝑥
−10 𝑃(𝑥 > 15) = 1 − ∑15 = 1 − 0,9513 = 0,0487 𝑥=0 𝑒 𝑥! 𝑃(𝑥 > 15) = 1 − 0,9513 = 0,0487
Ejercicio 68 Un analista de empresas ha pronosticado que el 3,5% de las pequeñas empresas irán a la bancarrota en 2016. Para una muestra de 100 pequeñas empresas, estime la probabilidad de que al menos tres de ellas entren en bancarrota, suponiendo que la predicción del experto es correcta. Solución: 𝑃(𝑥 ≥ 3) = 1 − ∑2𝑥=0 𝑒 −3,5
3,5𝑥 𝑥!
= 1 − (0,0302 + 0,1057 + 0,1850) = 1 − 0,3209 = 0,6791
Ejercicio 69 Una empresa electrónica observa que el número de componentes que fallan antes de cumplir 100 horas de funcionamiento es una variable aleatoria de Poisson. Si el número promedio de estos fallos es ocho, a) ¿cuál es la probabilidad de que falle un componente en 25 horas?, b) ¿y de que fallen no más de dos componentes en 50 horas?, c) ¿cuál es la probabilidad de que fallen por lo menos diez en 125 horas? 21
a) p(0) = 𝑒 −2 1! = 0,2707 4𝑥
b) 𝑝(≤ 2) = ∑2𝑥=0 𝑒 −4 𝑥! = 0,2381 c) 𝑃(𝑥 ≥ 10) = 1 − ∑9𝑥=0 𝑒 −10
10𝑥 𝑥!
= 0,5420 Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 39
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Distribuciones continuas de probabilidad Distribución Uniforme Continua La distribución uniforme continua se caracteriza porque posee una función de densidad que es “plana” y por ello la probabilidad es uniforme en un intervalo cerrado [A, B]. La función de densidad de la variable aloeatoria uniforme continua X en el intervalo [A, B] es: 1 ,𝐴 ≤ 𝑥 ≤ 𝐵 𝑓(𝑥; 𝐴, 𝐵) = { 𝐵−𝐴 0 𝑒𝑛 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
La media y la varianza de la distribución uniforme son: 𝐴+𝐵 (𝐵 − 𝐴)2 𝜇= 𝑦 𝜎2 = 2 12 Ejercicio 70 Suponga que se puede reservar una sala de conferencias grande para cierta empresa, por no más de 4 horas. Sin embargo, el uso de la sala de conferencias es tal que a menudo tienen lugar conferencias largas y cortas. De hecho, se puede suponer que la duración X de una conferencia tiene una distribución uniforme en el intervalo [0, 4]. a) ¿Cuál es la función de densidad de la probabilidad? b) ¿Cuál es la probabilidad de que cualquier conferencia dada dure al menos tres horas? c) Determine la media y la varianza de la distribución. Solución: a) La función de densidad correspondiente a la variable aleatoria distribuida uniformemente X en este caso es: 1 ,0 ≤ 𝑥 ≤ 4 4 𝑓(𝑥; 0,4) = { 0 𝑒𝑛 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜 41 1 b) f[𝑋 ≥ 3] = 𝑓[𝑥; 3, 4] = ∫3 𝑑𝑥 = 4 4 c) 𝜇 =
0+4 2
= 2 𝑦 𝜎2 =
(4−0)2 12
4
=3
Ejercicio 71 Suponga que X tiene una distribución continua uniforme de 1 a 5. Determine la probabilidad condicional P(X > 2,5 | X < 4). 1 ,1 ≤ 𝑥 ≤ 5 4 𝑓(𝑥; 1,5) = { 0 𝑒𝑛 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜 4 1 3 f[𝑋 ≥ 3] = 𝑓[𝑥; 3, 4] = ∫2,5 4 𝑑𝑥 = 8 Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 40
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Ejercicio 72 Un reloj de manecillas se detuvo en un punto que no sabemos. Determine la probabilidad de que se haya detenido en los primeros 25 minutos luego de señalar la hora en punto. 1 , 0 ≤ 𝑥 ≤ 60 60 𝑓(𝑥; 0,60) = { 0 𝑒𝑛 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜 25 1 𝑥 25 25−0 5 𝑓(𝑥; 0,25) = ∫0 60 𝑑𝑥 = 60 | = 60 = 12 0 Ejercicio 73 Una llamada llegó a un conmutador en un tiempo, al azar, dentro de un período de un minuto. El conmutador estuvo ocupado durante 15 segundos en ese minuto. Calcule la probabilidad de que la llamada haya llegado mientras el conmutador no estuvo ocupado. 1, 0 ≤ 𝑥 ≤ 1 𝑓(𝑥; 0,60) = { 0 𝑒𝑛 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜 0,25 0,25 𝑓(𝑥; 0,25) = 1 − ∫0 1 𝑑𝑥 = 𝑥| = 1 − 0,25 = 0,75 0
Distribución Normal La más común de las distribuciones de probabilidad continua en el campo de la estadística es la distribución normal. Su gráfica tiene la forma de una campana:
Esta distribución describe aproximada y adecuadamente muchos fenómenos que ocurren en la naturaleza y en general en el campo científico. Además, los errores en las mediciones científicas se aproximan extremadamente bien mediante esta distribución. Una variable aleatoria continua X que tiene la distribución en la forma de la figura mostrada se denomina variable aleatoria normal. La ecuación matemática para la distribución de probabilidad de la variable normal depende de los parámetros μ y σ, es decir de su media aritmética y de su desviación estándar. Denotamos los valores de la densidad de X como n(x; μ, σ) y la función sería: 1 𝑥−𝜇 2 1 −( )( ) 𝑛(𝑥; 𝜇, 𝜎) = 𝑒 2 𝜎 , −∞ < 𝑥 < ∞ 𝜎√2𝜋 Ejemplos de diferentes curvas normales: En el primer ejemplo se observa que las dos curvas están centradas en su media aritmética, las cuales se ubican en diferentes lugares del eje x. Son curvas normales con μ1 < μ2 y σ1 = σ2. Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 41
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
En el segundo ejemplo se observa que las dos curvas tienen igual media aritmética, están centradas en ella, pero tienen diferente desviación estándar. Son curvas normales con μ1 = μ2 y σ1 < σ2.
En el tercer ejemplo se observa que las dos curvas tienen diferente media aritmética, están centradas en ella, y diferente desviación estándar. Son curvas normales con μ1 < μ2 y σ1 < σ2.
De la inspección de las figuras anteriores y al examinar la primera y segunda derivada de n(x; μ, σ), se pueden obtener las siguientes propiedades de la curva normal: 1. La moda ocurre en x = μ. 2. La curva es simétrica alrededor de un eje vertical que pasa por μ. 3. La curva tiene como puntos de inflexión x = μ ± σ. Es cóncava hacia abajo si μ – σ < X < μ + σ y en los demás puntos es cóncava hacia arriba. 4. La curva se aproxima en forma asintótica a eje horizontal, en cualquier dirección, conforme se aleja de μ. 5. El área total bajo la curva y sobre el eje horizontal es igual a 1. 6. E(x) = μ. 7. E[(X – μ)2] = σ2. Muchas variables aleatorias tienen distribuciones de probabilidad que se pueden describir de manera adecuada mediante la curva normal, una vez que se especifiquen μ y σ2.
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 42
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Áreas bajo la curva normal La curva de cualquier distribución continua de probabilidad o función de densidad, se construye de modo que el área bajo la curva limitada por las dos ordenadas x1, x2, es igual a la probabilidad de que la variable aleatoria X tome un valor entre x1 y x2. Así, para la curva normal de la siguiente figura:
𝑃(𝑥1 < 𝑋 < 𝑥2 ) = á𝑟𝑒𝑎 𝑑𝑒 𝑙𝑎 𝑟𝑒𝑔𝑖ó𝑛 𝑠𝑜𝑚𝑏𝑟𝑒𝑎𝑑𝑎 𝑥2
𝑃(𝑥1 < 𝑋 < 𝑥2 ) = ∫ 𝑛(𝑥; 𝜇, 𝜎)𝑑𝑥
=
1 √2𝜋𝜎
𝑥2
∫𝑒
𝑥1 1 𝑥−𝜇 2 −( )( ) 2 𝜎
𝑑𝑥
𝑥1
La dificultad se encuentra al resolver las integrales de funciones de densidad normal, por lo que se necesita de la tabulación de las áreas de la curva normal para una referencia rápida. Se puede transformar todas las observaciones de cualquier variable aleatoria normal X a un nuevo conjunto de observaciones de una variable aleatoria normal con media cero y varianza 1. Distribución normal estándar La distribución de una variable aleatoria normal con media cero y varianza 1 se llama distribución normal estándar y para estandarizar una curva normal, se utiliza la siguiente fórmula: 𝑥−𝜇 𝑍= 𝜎 Las distribuciones original y transformada se ilustran en la siguiente figura:
Como todos los valores de X caen entre x1 y x2, tienen valores correspondientes entre z1 y z2, el área bajo la curva X entre las ordenadas (x1, x2) es igual al área bajo la curva Z entre las ordenadas transformadas (z1, z2). Así las cosas, se puede construir una tabla que represente a la curva normal estándar y con esta y la transformación, se pueden calcular todos los valores de diferentes curvas normales. Ejercicio 74 Dado un fenómeno que se comporta de forma normal, encuentre la probabilidad de que se presenten 8 errores si μ = 5 y σ = 2. Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 43
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Solución: 𝑛(8; 5, 2) = 2
1 8−5 1 −( )( ) 2 2 𝑒 √2𝜋
2
= 0,06476
Por transformación: 8−5 𝑍1 = = 1,5 2 Si tomamos la probabilidad de Z = 1,5 por tabla obtenemos 0,93319, que es el valor acumulado de la probabilidad. Por ello, dado que el fenómeno es discreto y estamos usando una distribución continua, requerimos restarle el valor anterior más aproximado o calcular un área de acción. Si determinamos que el valor anterior más aproximado es Z = 1,49 y lo buscamos en la tabla obtendremos 0,93189 y luego de la resta, la probabilidad deseada nos daría P(8) ≈ 0,93319 – 0,93189 = 0,0013. Si resolvemos en el área determinada entre 7,5 y 8,5 obtendremos: 7,5 − 5 𝑍2 = = 1,25 2 8,5 − 5 𝑍3 = = 1,75 2 P(Z2) = 0,89435 P(Z3) = 0,95994 P(8) = 0,95994 - 0,89435 = 0,06559 La diferencia radica en que la comisión de errores no es un fenómeno continuo sino discreto (no se pueden cometer 7,5 errores, solo 7 u 8), por lo que no se puede aplicar la tabla, solo la fórmula.
Ejercicio 75 Dada una distribución normal estándar, encuentre el área bajo la curva que yace a la derecha de Z = 1,84 y la que yace entre Z = -1,97 y Z = 0,86.
Solución: P(Z > 1,84) = 1 - 0,96712 = 0,03288 P(-1,97 < Z < 0,86) = 0,80510 – 0,02442 = 0,78068
Ejercicio 76 Dada una distribución normal estándar, encuentre el valor de k tal que P(Z > k) = 0,3015 y de P(k < Z < -0,18) = 0,4197 Solución: P(Z > k) = 0,3015 k para P(k) = 1 – 0,3015 = 0,6985 es k = 0,52 P(k < Z < -0,18) = 0,4197 P(-0,18) = 0,42858 0,42858 – 0,4197 = 0,00888 k = -2,37
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 44
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Ejercicio 77 Dada una distribución normal con μ = 45 y σ = 12, encuentre la probabilidad de que X tome un valor entre 50 y 72. Solución: 50−45 𝑍1 = 12 = 0,42 72−45
𝑍2 = 12 = 2,25 𝑃(50 < 𝑥 < 72) = 𝑃(0,42 < 𝑍 < 2,25) = 0,98778 − 0,66276 = 0,32502 Ejercicio 78 Dada una distribución normal con μ = 200 y σ = 40, encuentre la probabilidad de que X tome un valor mayor de 252. Solución: 252−200 𝑍 = 40 = 1,30 𝑃(𝑥 > 252) = 𝑃(𝑍 > 1,30) = 1 − 0,90320 = 0,0968 Ejercicio 79 Dada una distribución normal con μ = 35 y σ = 8, encuentre el valor de x que tiene el 40% del área a la izquierda y el valor de y que tiene el 18% del área a la derecha. Solución: 𝑍40% ≈ −0,255 𝑋 = 𝑍𝜎 + 𝜇 = −0,255 ∗ 8 + 35 = 32,96 𝑍82% ≈ 0,915 𝑌 = 𝑍𝜎 + 𝜇 = 0,915 ∗ 8 + 35 = 42,32
Aplicaciones de la distribución normal Ejercicio 80 Cierto tipo de batería de almacenamiento dura en promedio 3,0 años, con una desviación estándar de 0,5 años. Suponga que las duraciones de la batería se distribuyen normalmente, encuentre la probabilidad de que una batería dada dure menos de 2,3 años. Solución: 2,3−3,0 𝑍= = −1,4 0,5
𝑃(𝑥 < 2,3) = 𝑃(𝑍 < −1,4) = 0,08076 Ejercicio 81 Una empresa fabrica focos que tienen una duración, antes de fundirse, que se distribuye normalmente con una media igual a 800 horas y una desviación estándar de 40 horas. Encuentre la posibillidad de que un foco se funda entre 778 y 834 horas. Solución: 778−800 𝑍 = 40 = −0,55 834−800
𝑍 = 40 = 0,85 𝑃(778 < 𝑥 < 834) = 𝑃(−0,55 < 𝑍 < 0,85) = 0,80234 − 0,29116 = 0,51118
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 45
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Ejercicio 82 En un proceso industrial, el diámetro de un cojinete es una parte componente importante. El comprador establece que las especificaciones en el diámetro sean de 3,0 ± 0,01 cm. La implicación es que ninguna parte que caiga fuera de estas especificaciones se aceptará. Se sabe que en el proceso el diámetro de un cojinete tiene una distribución normal con media 3,0 cm y una desviación estándar de 0,005 cm. En promedio ¿cuántos cojinetes se descartarán? Solución: 2,99−3,00 𝑍1 = = −2 𝑍2 =
0,005 3,01−3,00 0,005
=2
𝑃(2,99 < 𝑥 < 3,01) = 𝑃(−2 < 𝑍 < 2) = 1 − 2 𝑥 0,02275 = 0,9545 𝑃(𝑍 < −2 𝑈 𝑍 > 2 = 1 − 0,9545 = 0,0455 El 4,55% de los cojinetes se rechazarán. Además, obsérvese que se hace uso de la condición de simetría de la distribución normal, para hacer los cálculos. Ejercicio 83 Se utilizan medidores para rechazar todos los componentes donde cierta dimensión no está dentro de la especificación 1,50 ± d. Se sabe que esta medición se distribuye de forma normal con media 1,50 y desviación estándar 0,2. Determine el valor d tal que las especificaciones “cubran” el 95% de las mediciones. Solución: Como se requiere que cubra un 95% de las mediciones, el 5% no cubierto corresponde tanto al lado izquierdo como al derecho, por tanto, dada la simetría de la distribución, se deja un 2,5% para cada lado. Entonces, se busca Z para el 97,50% y se obtiene que Z es 1,96. Nuevamente por simetría: 𝑃(−1,96 < 𝑍 < 1,96) = 0,95 𝑋 = 𝑍𝜎 + 𝜇 1,50 + 𝑑 = 1,96 ∙ 0,2 + 1,50 𝑑 = 1,96 ∙ 0,2 + 1,50 − 1,50 = 0,392 Ó 1,50 − 𝑑 = −1,96 𝑥 0,2 + 1,50 𝑑 = −1,96 ∙ 0,2 + 1,50 − 1,50 = −0,392 𝑑 = ±0,392 Ejercicio 84 Cierta máquina fabrica resistores eléctricos que tienen una resistencia media de 40 ohmios y una desviación estándar de 2 Ω. Suponga que la resistencia sigue una distribución normal y se puede medir con cualquier grado de precisión. ¿Qué porcentaje de resistores tendrán una resistencia que exceda 43 Ω? Solución: 43 − 40 𝑍= = 1,5 2 𝑃(𝑥 > 43) = 𝑃(𝑍 > 1,5) = 1 − 0,93319 = 0,06681 = 6,68% Ejercicio 85 Encuentre el porcentaje de resistores que exceden 43 Ω para el ejemplo anterior, si la resistencia se mide al ohmio más cercano. Solución: 43,5 − 40 𝑍= = 1,75 2 𝑃(𝑥 > 43,5) = 𝑃(𝑍 > 1,75) = 1 − 0,95994 = 0,04006 = 4,01% Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 46
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Ejercicio 86 La calificación promedio para un examen es 74 y la desviación estándar es 7. Si el 12% de la clase obtiene A y las calificaciones siguen una curva que tiene distribución normal, ¿cuál es la A más baja posible y la B más alta posible? Solución: 𝑍88% ≈ 1,175 𝑋 = 𝑍𝜎 + 𝜇 = 1,175 ∙ 7 + 74 = 82,225 La A más baja posible es 83 y la B más alta posible es 82. Ejercicio 87 Refiérase al ejercicio anterior y encuentre el sexto decil. Solución: El sexto decil, D6, es el valor x que deja 60% del área a la izquiera. Entonces, por tablas, Z = 0,255. 𝑋 = 𝑍𝜎 + 𝜇 = 0,255 ∙ 7 + 74 = 75,785 Es decir, el 60% de las calificaciones es 75,785 o menos.
Aproximación normal a la binomial La distribución normal a menudo es una buena aproximación a una distribución discreta, cuando la distribución discreta adquiere una forma de campana simétrica. Desde la perspectiva teórica, algunas distribuciones convergen a la normal conforme sus parámetros se aproximan a ciertos límites. La distribución normal es una distribución de aproximación conveniente, pues la función de distribución acumulada se tabula muy fácil. La distribución binomial se aproxima bien por la normal en problemas prácticos cuando se trabaja con la función de distribución acumulada. Si X es una variable aleatoria binomial con media μ = np y varianza σ2 = npq, entonces la forma limitante de la distribución de 𝑋 − 𝑛𝑝 𝑍= √𝑛𝑝𝑞 Conforme n ∞, es la distribución normal estándar n(z; 0, 1). La distribución normal con μ = np y σ2 = npq no solo proporciona una aproximación muy precisa a la distribución binomial cuando n es grande y p no está extremadamente cercana a 0 o 1, sino que también proporciona una aproximación bastante buena aun cuando n es pequeña y p está razonablemente cercana a ½. Ejercicio 88 La probabilidad de que un paciente se recupere de una rara enfermedad de la sangre es de un 40%. Si se sabe que 100 personas contraen esta enfermedad, ¿cuál es la probabilidad de que menos de 30 sobrevivan? Solución: 𝑋 − 𝑛𝑝 29,5 − 100 ∙ 0,4 𝑍= = = −2,14 √100 ∙ 0,4 ∙ 0,6 √𝑛𝑝𝑞 𝑃(𝑥 < 30) = 𝑃(𝑍 < −2,14) = 0,01618 = 1,62%
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 47
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Ejercicio 89 Una prueba de opción múltiple tiene 200 preguntas cada una, con cuatro respuestas posibles de las cuales solo una es correcta. ¿Cuál es la probabilidad de que con puras conjeturas se obtengan de 25 a 30 respuestas correctas para 80 de los 200 problemas acerca de los que el estudiante no tiene conocimientos? Solución: 24,5 − 80 ∙ 0,25 𝑍1 = = 1,16 √80 ∙ 0,25 ∙ 0,75 30,5 − 80 ∙ 0,25 𝑍2 = = 2,71 √80 ∙ 0,25 ∙ 0,75 𝑃(25 < 𝑥 < 30) = 𝑃(1,16 < 𝑍 < 2,71) = 0,99664 − 0,87698 = 0,11966 = 11,97%
Distribución Χ2 o distribución de Pearson La distribución de Pearson o X2, ji cuadrado o chi cuadrado, es una distribución de probabilidad continua con un parámetro ν que representa los grados de libertad de la variable aleatoria. Tiene muchas aplicaciones en inferencia estadística, siendo la más conocida la denominada prueba X2 utilizada como prueba de independencia y como prueba de bondad de ajuste y en la estimación de varianzas. También está involucrada en el problema de estimar la media de una población normalmente distribuida y en el problema de estimar la pendiente de una recta de regresión lineal, a través de su papel en la distribución t de Student. Aparece también en todos los problemas de análisis de varianza por su relación con la distribución F de Snedecor, que es la distribución del cociente de dos variables aleatorias independientes con distribución X2. En realidad, la distribución ji-cuadrada es la distribución muestral de s2. O sea que, si se extraen todas las muestras posibles de una población normal y a cada muestra se le calcula su varianza, se obtendrá la distribución muestral de varianzas. Para estimar la varianza poblacional o la desviación estándar, se necesita conocer el estadístico X2. Si se elige una muestra de tamaño n de una población normal con varianza σ2, el estadístico: (𝑛 − 1)𝑠 2 𝜎2 tiene una distribución muestral que es una distribución ji-cuadrada con n-1 grados de libertad (gl = ν) y se denota X2 (χ es la minúscula de la letra griega Χ [ji] ). El estadístico ji-cuadrada está dado por: (𝑛 − 1)𝑠 2 Χ2 = 𝜎2 donde n es el tamaño de la muestra, s2 la varianza muestral y σ2 la varianza de la población de donde se extrajo la muestra. El estadístico ji-cuadrada también se puede dar con la siguiente expresión: ∑(𝑥 − 𝑥̅ )2 Χ2 = 𝜎2 Propiedades de las distribuciones ji-cuadrada 1. Los valores de X2 son mayores o iguales que 0. 2. La forma de una distribución X2 depende del gl = n - 1. En consecuencia, hay un número infinito de distribuciones X2. 3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1. Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 48
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
4. Las distribuciones X2 no son simétricas. Tienen colas estrechas que se extienden a la derecha; esto es, están sesgadas a la derecha. 5. Cuando n > 2, la media de una distribución X2 es n - 1 y la varianza es 2∙(n - 1). 6. El valor modal de una distribución X2 se da en el valor (n - 3). La siguiente figura ilustra tres distribuciones X2. Note que el valor modal aparece en el valor (n - 3) = (gl - 2).
La variable aleatoria continua X tiene una distribución ji cuadrada, con ν grados de libertad, si su función de densidad está dada por: 1 𝑥 𝜐⁄2−1 𝑒 −𝑥⁄2 𝑝𝑎𝑟𝑎 𝑥 > 0 𝑓(𝑥) = {2𝜐⁄2 Γ(𝜐⁄2) 0 𝑒𝑛 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜 Donde ν es un entero positivo. La tabla que se utiliza en varios libros da valores críticos X2α (gl) para valores especiales de α. Para denotar el valor crítico de una distribución X2 con gl grados de libertad se usa el símbolo X2α (gl); este valor crítico determina a su derecha un área de α bajo la curva X2 y sobre el eje horizontal. Ejercicio 90 Encontrar X20.05(6) Solución: En la tabla se localiza 6 gl en el lado izquierdo y α = 0,05 a lo largo del lado superior de la misma tabla:
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 49
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Cálculo de Probabilidad El cálculo de probabilidad en una distribución muestral de varianzas nos sirve para saber cómo se va a comportar la varianza o desviación estándar en una muestra que proviene de una distribución normal. Ejercicio 91 Suponga que los tiempos requeridos por un cierto autobús para alcanzar uno de sus destinos en una ciudad grande forman una distribución normal con una desviación estándar σ = 1 minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de que la varianza muestral sea mayor que 2. Solución: Primero se encontrará el valor de ji-cuadrada correspondiente a s2 = 2 como sigue: (𝑛 − 1)𝑠 2 (17 − 1) ∙ 2 Χ2 = = = 32 𝜎2 12 El valor de 32 se busca adentro de la tabla en el renglón de 16 grados de libertad y se encuentra que a este valor le corresponde un área a la derecha de 0,01. En consecuencia, el valor de la probabilidad es P(s2>2) = 1%
Ejercicio 92 Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una población normal con varianza σ2 = 6, tenga una varianza muestral: a) Mayor que 9,1 b) Entre 3,462 y 10,745 Solución: a) Primero se procede a calcular el valor de la ji-cuadrada: (𝑛 − 1)𝑠 2 (25 − 1) 𝑥 9,1 2 Χ = = = 36,4 𝜎2 6 Al buscar este número en el renglón de 24 grados de libertad nos da un área a la derecha de 0,05. Por lo que la P(s2 > 9,1) = 0,05 = 5% b) Se calcularán dos valores de ji-cuadrada: (𝑛 − 1)𝑠 2 (25 − 1) 𝑥 3,462 Χ2 = = = 13,848 𝜎2 6 2 (𝑛 − 1)𝑠 (25 − 1) 𝑥 10,745 Χ2 = = = 42,98 2 𝜎 6 Aquí se tienen que buscar los dos valores en el renglón de 24 grados de libertad. Al buscar el valor de 13,848 se encuentra un área a la derecha de 0,95. El valor de 42,98 da un área a la derecha de 0,01. Como se está pidiendo la probabilidad entre dos valores se resta el área de 0,95 – 0,01 quedando 0,94. Por lo tanto la P(3,462 < s2 < 10,745) = 0,94 = 94%. Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 50
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Estimación de la Varianza Para poder estimar la varianza de una población normal se utilizará la distribución ji-cuadrada. (𝑛 − 1)𝑠 2 Χ2 = 𝜎2 Al despejar esta fórmula la varianza poblacional nos queda: (𝑛 − 1)𝑠 2 𝑋2 2 Los valores de X dependerán de nivel de confianza que se quiera al cual le llamamos 1 - σ. Si nos ubicamos en la gráfica se tiene: 𝜎2 =
Ejercicio 93 Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de pasto distribuidas por cierta compañía: 46,4, 46,1, 45,8, 47,0, 46,1, 45,9, 45,8, 46,9, 45,2 y 46. Encuentre un intervalo de confianza de 95% para la varianza de todos los paquetes de semillas de pasto que distribuye esta compañía, suponga una población normal. Solución: Primero se calcula la desviación estándar de la muestra y se eleva al cuadrado para obtener la varianza muestral: ∑(𝑥𝑖 − 𝑥̅ )2 𝑠2 = = 0,286 𝑛−1 Para obtener un intervalo de confianza de 95% se elige un α = 0,05. Después con el uso de la tabla con 9 grados de libertad se obtienen los valores de X2: para α/2 = 0,025 sería 19,023 para 1 - α/2 = 0,975 sería 2,7004
Se puede observar en la gráfica anterior que el valor de X2 corre en forma normal, esto es de izquierda a derecha. Por lo tanto, el intervalo de confianza de 95% para la varianza es: Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 51
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas 2 𝜎𝑚𝑎𝑥 =
(10 − 1)(0,286) = 0,9532 2,7004
2 𝜎𝑚í𝑛 =
(10 − 1)(0,286) = 0,1353 19,023
Gráficamente:
Se observa que la varianza corre en sentido contrario, pero esto es sólo en la gráfica. La interpretación sería que Con un nivel de confianza del 95% se sabe que la varianza de la población de los pesos de los paquetes de semillas de pasto esta entre 0,135 y 0,935 decagramos al cuadrado. Ejercicio 94 En trabajo de laboratorio se desea llevar a cabo comprobaciones cuidadosas de la variabilidad de los resultados que producen muestras estándar. En un estudio de la cantidad de calcio en el agua potable, el cual se efectúa como parte del control de calidad, se analizó seis veces la misma muestra en el laboratorio en intervalos aleatorios. Los seis resultados en partes por millón fueron 9,54, 9,61, 9,32, 9,48, 9,70 y 9,26. Estimar la varianza de los resultados de la población para este estándar, usando un nivel de confianza del 90%. Solución: Al calcular la varianza de la muestra se obtiene un valor de s2= 0,02855. Se busca en la tabla los valores correspondientes con 5 grados de libertad, obteniéndose dos resultados. Para X2(0,95, 5) = 1,1455 y para X2(0,05, 5)= 11,070. Entonces el intervalo de confianza está dado por: 2 𝜎𝑚𝑎𝑥 =
(6−1)(0,02855)
2 𝜎𝑚𝑖𝑛 =
(6−1)(0,02855) 11,070
1,1455
= 0,1246 = 0,0129
La interpretación sería que con un nivel de confianza del 90% se sabe que la varianza de la población de la cantidad de calcio en el agua potable está entre 0,0129 y 0,1246 ppm2. Ejercicio 95 El espesor de un semiconductor se controla mediante la variación estándar no mayor a σ = 0,60 mm. Para mantener controlado el proceso se toman muestras aleatoriamente de tamaño de 20 unidades y se considera que el sistema está fuera de control cuando la probabilidad de que σ2 tome valor mayor o igual al valor de la muestra observado es que es 0,01. ¿Qué se puede concluir si s = 0,84 mm? Solución: El sistema está fuera de control si Entonces, como
(𝑛−1)𝑠2 𝜎2
=
(𝑛−1)𝑠2
19 𝑥 0,842 0,602
𝜎2
con n = 20 y σ = 0,60, excede X2(0,01, 19) = 36,191.
= 37,24 el sistema está fuera de control. Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 52
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Distribución muestral de medias y el teorema del límite central De una población normal con media μ y varianza σ2 se toma una muestra aleatoria de n observaciones. Cada observación xi, i = 1, 2,..., n, de la muestra aleatoria tendrá entonces la misma distribución normal que la población de donde se tomó. Así, por la propiedad reproductiva de la distribución normal concluimos que: 𝑋̅ = tiene una distribución normal con media: 𝜇𝑥̅ =
1 (𝑋 + 𝑋2 + ⋯ + 𝑋𝑛 ) 𝑛 1
1 (𝜇 + 𝜇 + 𝜇 + ⋯ + 𝜇) = 𝜇 𝑛 n términos
y varianza 𝜎𝑥̅2 =
1 2 𝜎2 2 2 2) (𝜎 + 𝜎 + 𝜎 + ⋯ + 𝜎 = 𝑛2 𝑛
n términos Si tomamos muestras de una población con distribución desconocida, ya sea finita o infinita, la distribución muestral de 𝑋̅ aún será aproximadamente normal con media μ y varianza σ2/n, siempre que el tamaño de la muestra sea grande. Este resultado es una consecuencia inmediata del teorema del límite central: Si 𝑋̅ es la media de una muestra aleatoria de tamaño n, tomada de una población con media μ y 𝑋̅−𝜇
varianza finita σ2, entonces la forma límite de la distribución de 𝑍 = 𝜎
⁄ 𝑛 √
a medida que n ∞, es
la distribución normal estándar n(z; 0, 1). La aproximación normal para 𝑋̅ por lo general será buena si n ≥ 30, siempre y cuando la distribución de la población no sea muy asimétrica. Si n < 30, la aproximación será buena sólo si la población no es muy diferente de una distribución normal y si se sabe que la población es normal, la distribución muestral de 𝑋̅ seguirá siendo una distribución normal exacta, sin importar qué tan pequeño sea el tamaño de las muestras. El tamaño de la muestra n = 30 es un lineamiento para el teorema del límite central. Sin embargo, como indica el planteamiento del teorema, la suposición de normalidad en la distribución de 𝑋̅ se vuelve más precisa a medida que n se hace más grande. La figura muestra cómo funciona el teorema.
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 53
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
La figura indica cómo la distribución de 𝑋̅ se acerca más a la normalidad a medida que aumenta n, empezando con la distribución claramente asimétrica de una observación individual (n = 1). También ilustra que la media de 𝑋̅ sigue siendo μ para cualquier tamaño de la muestra y que la varianza de 𝑋̅ se vuelve más pequeña a medida que aumenta n. Ejercicio 96 Una empresa de material eléctrico fabrica bombillas que tienen una duración que se distribuye aproximadamente en forma normal, con media de 800 horas y desviación estándar de 40 horas. Calcule la probabilidad de que una muestra aleatoria de 16 bombillas tenga una vida promedio de menos de 775 horas. Solución: La distribución muestral de 𝑋̅ será aproximadamente normal, con 𝜇𝑋̅ = 800 y 𝜎𝑋̅ = 40⁄√16 = 10. La probabilidad que se desea es determinada por el área de la región sombreada de la figura:
En lo que corresponde a 𝑋̅ = 775, obtenemos que: 775 − 800 𝑍= = −2,5 10 Y entonces P (𝑋̅ < 775) = P (Z <− 2,5) = 0,00621 = 0,621%. Ejercicio 97 Un importante proceso de fabricación produce partes de componentes cilíndricos para la industria automotriz. Es importante que el proceso produzca partes que tengan un diámetro medio de 5,0 milímetros. El ingeniero implicado asume que la media de la población es de 5,0 milímetros. Se lleva a cabo un experimento donde se seleccionan al azar 100 partes elaboradas por el proceso y se mide el diámetro de cada una de ellas. Se sabe que la desviación estándar de la población es σ = 0,1 milímetros. El experimento indica un diámetro promedio muestral de 𝑋̅ = 5,027 milímetros. ¿Esta información de la muestra parece apoyar o refutar la suposición del ingeniero? Solución: El hecho de que los datos apoyen o refuten la suposición depende de la probabilidad de que datos similares a los que se obtuvieron en este experimento (𝑥̅ = 5,027) puedan ocurrir con facilidad cuando de hecho μ = 5,0.
En otras palabras, ¿qué tan probable es que se pueda obtener 𝑥̅ ≥ 5,027 con n = 100, si la media de la población es μ = 5,0? Si esta probabilidad sugiere que 𝑥̅ = 5,027 no es poco razonable, no se refuta la suposición. Si la probabilidad es muy baja, se puede argumentar con certidumbre que los datos no apoyan la suposición de que Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 54
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
μ = 5,0. La probabilidad que elegimos para el cálculo es dada por P(|𝑋̅ – 5| ≥ 0,027), en otras palabras, si la media μ es 5, ¿cuál es la probabilidad de que 𝑋̅ se desvíe cuando mucho hasta 0,027 milímetros? 𝑋̅ − 5 𝑃(|𝑋̅ − 5| ≥ 0,027) = 𝑃(𝑋̅ − 5 ≥ 0,027) + 𝑃(𝑋̅ − 5 ≤ 0,027) = 2𝑃 ( ≥ 2,7) 0,1⁄√100 Aquí simplemente estandarizamos 𝑋̅ de acuerdo con el teorema del límite central. Si la suposición μ = 5,0 es 𝑋̅−5 ) debería ser √100
cierta, (0,1⁄
N(0, 1). Por consiguiente:
𝑋̅ − 5
≥ 2,7) = 2𝑃(𝑍 ≥ 2,7) = 2 ∙ (1 − 0,99653) = 0,00694 0,1⁄√100 Por lo tanto, se experimentaría por casualidad que una 𝑋̅ estaría a 0,027 milímetros de la media en tan sólo cerca 7 de 1000 experimentos. Como resultado, este experimento con 𝑋̅ = 5,027 ciertamente no ofrece evidencia que apoye la suposición de que μ = 5,0. De hecho, ¡la refuta consistentemente! 2𝑃 (
Ejercicio 98 El viaje en un autobús especial para ir de un campus de una universidad al campus de otra en una ciudad toma, en promedio, 28 minutos, con una desviación estándar de 5 minutos. En cierta semana un autobús hizo el viaje 40 veces. ¿Cuál es la probabilidad de que el tiempo promedio del viaje sea mayor a 30 minutos? Suponga que el tiempo promedio se redondea al entero más cercano. Solución: En este caso μ = 28 y σ = 5. Necesitamos calcular la probabilidad P(𝑋̅ > 30) con n = 40. Como el tiempo se mide en una escala continua redondeada al minuto más cercano, una 𝑥̅ mayor que 30 sería equivalente a 𝑥̅ ≥ 30,5. Por lo tanto, 𝑋̅ − 28 30,5 − 28 𝑃(𝑋̅ > 30) = 𝑃 ( ≥ ) = 𝑃(𝑍 ≥ 3,16) = (1 − 0,99921) = 0,00079 5⁄√40 5⁄√40 Sólo hay una ligera probabilidad de que el tiempo promedio de un viaje del autobús exceda 30 minutos.
Distribución muestral de la diferencia entre dos medias Suponga que tenemos dos poblaciones, la primera con media μ1 y varianza σ21, y la segunda con media μ2 y varianza σ22. Representemos con el estadístico 𝑋̅1 la media de una muestra aleatoria de tamaño n1, seleccionada de la primera población, y con el estadístico 𝑋̅2 la media de una muestra aleatoria de tamaño n2 seleccionada de la segunda población, independiente de la muestra de la primera población. ¿Qué podríamos decir acerca de la distribución muestral de la diferencia 𝑋̅1 – 𝑋̅2 para muestras repetidas de tamaños n1 y n2? De acuerdo con el teorema del límite central, tanto la variable 𝑋̅1 como la variable 𝑋̅2 están distribuidas más o menos de forma normal con medias μ1 y μ2 y varianzas σ21/n1 y σ22/n2, respectivamente. Esta aproximación mejora a medida que aumentan n1 y n2. Al elegir muestras independientes de las dos poblaciones nos aseguramos de que las variables 𝑋̅1 y 𝑋̅2 sean independientes y con a1 = 1 y a2 = –1, concluimos que 𝑋̅1 – 𝑋̅2 se distribuye aproximadamente de forma normal con media 𝜇𝑋̅1 −𝑋̅2 = 𝜇𝑋̅1 − 𝜇𝑋̅2 = 𝜇1 − 𝜇2 y varianza 𝜎 2𝑋̅1 −𝑋̅2 = 𝜎 2𝑋̅1 − 𝜎 2𝑋̅2 =
𝜎 21 𝜎 2 2 + 𝑛1 𝑛2
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 55
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
El teorema del límite central se puede ampliar fácilmente al caso de dos muestras y dos poblaciones: Si se extraen al azar muestras independientes de tamaños n1 y n2 de dos poblaciones, discretas o continuas, con medias μ1 y μ2 y varianzas σ21 y σ22, respectivamente, entonces la distribución muestral de las diferencias de las medias, 𝑋̅1 – 𝑋̅2 , tiene una distribución aproximadamente normal, con media y varianza dadas por: 𝜎 21 𝜎 2 2 2 𝜇𝑋̅1 −𝑋̅2 = 𝜇1 − 𝜇2 𝑦 𝜎 𝑋̅1 −𝑋̅2 = + 𝑛1 𝑛2 De donde: (𝑋̅1 − 𝑋̅2 ) − (𝜇1 − 𝜇2 ) 𝑍= 𝜎2 𝜎2 √ 1+ 2 𝑛 𝑛 1
2
Si tanto n1 como n2 son mayores o iguales que 30, la aproximación normal para la distribución de 𝑋̅1 − 𝑋̅2 es muy buena cuando las distribuciones subyacentes no están tan alejadas de la normal. Sin embargo, aun cuando n1 y n2 sean menores que 30, la aproximación normal es hasta cierto punto buena, excepto cuando las poblaciones no son definitivamente normales. Por supuesto, si ambas poblaciones son normales, entonces 𝑋̅1 − 𝑋̅2 tiene una distribución normal sin importar de qué tamaño sean n1 y n2. Ejercicio 99 Tiempo de secado de pinturas. Se llevan a cabo dos experimentos independientes en los que se comparan dos tipos diferentes de pintura, el A y el B. Con la pintura tipo A se pintan 18 especímenes y se registra el tiempo (en horas) que cada uno tarda en secar. Lo mismo se hace con la pintura tipo B. Se sabe que la desviación estándar de población de ambas es 1,0. Si se supone que los especímenes pintados se secan en el mismo tiempo medio con los dos tipos de pintura, calcule P (𝑋̅𝐴 − 𝑋̅𝐵 > 1,0), donde 𝑋̅𝐴 − 𝑋̅𝐵 son los tiempos promedio de secado para muestras de tamaño nA = nB = 18. Solución: A partir de la distribución de muestreo de 𝑋̅𝐴 − 𝑋̅𝐵 sabemos que la distribución es aproximadamente normal con media: 𝜇𝑋̅𝐴 −𝑋̅𝐵 = 𝜇𝐴 − 𝜇𝐵 = 0 y varianza 𝜎 2𝐴 𝜎 2 𝐵 1 1 1 𝜎 2𝑋̅𝐴 −𝑋̅𝐵 = + = + = 𝑛𝐴 𝑛𝐵 18 18 9 La probabilidad que se desea es dada por la región sombreada en la figura.
En correspondencia con el valor 𝑋̅𝐴 − 𝑋̅𝐵 = 1,0, tenemos Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 56
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
𝑍=
1 − (𝜇𝐴 − 𝜇𝐵 )
=
1−0
= 3,0 1 1 √ ⁄9 √ ⁄9 𝑃(𝑍 > 3,0) = 1 − 𝑃(𝑍 < 3,0) = 1 − 0,99865 = 0,00135 La mecánica en el cálculo se basa en la suposición de que μA = μB. Suponga, sin embargo, que el experimento realmente se lleva a cabo con el fin de hacer una inferencia respecto a la igualdad de μA y μB, los tiempos medios de secado de las dos poblaciones. Si se encontrara que los dos promedios difieren por una hora (o más), este resultado sería una evidencia que nos llevaría a concluir que el tiempo medio de secado de la población no es igual para los dos tipos de pintura. Por otro lado, suponga que la diferencia en los dos promedios muestrales es tan pequeña como, digamos, 15 minutos. Si μA = μB: 𝑋̅𝐴 − 𝑋̅𝐵 − 0 3 𝑃[(𝑋̅𝐴 − 𝑋̅𝐵 ) > 0,25 ℎ𝑜𝑟𝑎𝑠] = 𝑃 ( > ) = 𝑃(𝑍 > 3⁄4) 4 √1⁄9 = 1 − 𝑃(𝑍 < 0,75) = 1 − 0,77337 = 0,22663 Como esta probabilidad no es baja, se concluiría que una diferencia de 15 minutos en las medias de las muestras puede ocurrir por azar, es decir, sucede con frecuencia aunque μA = μB. Por lo tanto, este tipo de diferencia en el tiempo promedio de secado ciertamente no es una señal clara de que μA ≠ μB. Ejercicio 100 Los cinescopios para televisor del fabricante A tienen una duración media de 6,5 años y una desviación estándar de 0,9 años; mientras que los del fabricante B tienen una duración media de 6,0 años y una desviación estándar de 0,8 años. ¿Cuál es la probabilidad de que una muestra aleatoria de 36 cinescopios del fabricante A tenga por lo menos 1 año más de vida media que una muestra de 49 cinescopios del fabricante B? Solución: Tenemos la siguiente información: Población 1 Población 2 μ1 = 6,5 μ2 = 6,0 σ1 = 0,9 σ2 = 0,8 n1 = 36 n2 = 49 ̅ ̅ Si utilizamos el teorema, la distribución muestral de 𝑋𝐴 − 𝑋𝐵 será aproximadamente normal y tendrá una media y una desviación estándar de 𝜇𝑋̅1 −𝑋̅2 = 6, 5 − 6,0 = 0,5 𝑦𝜎𝑋̅1 −𝑋̅2 = √
0,81 0,64 + = 0,1886 36 49
La probabilidad de que 36 cinescopios del fabricante A tengan por lo menos 1 año más de vida media que 49 cinescopios del fabricante B es dada por el área de la región sombreada de la figura:
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 57
Probabilidad y Estadística 2 Para formar grandes profesionales hay que formar grandes personas
Con respecto al valor 𝑋̅𝐴 − 𝑋̅𝐵 = 1,0, encontramos que: 1,0 − 0,5 𝑍= = 2,65 0,1886 y de aquí: P (𝑋̅𝐴 − 𝑋̅𝐵 ≥ 1,0) = P (Z > 2,65) = 1 − P (Z < 2,65) = 1 – 0,99597 = 0,00403.
Profesor Juan Manuel Jiménez Rodríguez, MBA
[email protected] 58