Probabilidades y Estadísticas -
Se dice que X es una variable aleatoria si puede tomar distintos valores, y se tiene una probabilidad dada para que tome estos valores. Por ejemplo: Sea X el resultado del lanzamiento de un dado. X puede ser cara o sello. La probabilidad de que X sea igual a cara, es decir, Px(x=cara), es igual a 1/2.
-
La sumatoria de las probabilidades de todos los posibles valores de X tiene que ser igual a 1.
Tipos de variables: Existen las variables discretas y continuas. Las variables discretas pueden adoptar valores enteros o cualitativos, por ejemplo, el resultado del lanzamiento de un dado (1,…, 6) o el de una moneda (cara o sello). Las variables continuas adoptan valores por intervalos de números (puede ser todos los reales). Por ejemplo, la temperatura de mañana en Santiago. Estos casos no se manejan con las probabilidades de un número exacto, por ejemplo, la probabilidad de que X sea igual a 1, pero se manejan las probabilidades de intervalos de números, por ejemplo, la probabilidad de que X sea mayor o igual a 1.
Esperanza o valor esperado: Se verá solo la fórmula para el caso de variables discreta. La esperanza o valor esperado de una función cualquiera para una distribución dada, por ejemplo, g(x), está dada por: E(g(x))= ∑ g(x)*Px(x) La media o promedio está dado por: u = E(X) La varianza está dada por: Var(X) = E[(X-u)2 )] La desviación estándar corresponde a la raíz de la varianza.
Ejemplo: La siguiente tabla muestra la distribución de probabilidades de la variable X X 0 1 2 3
P(X) 0,5 0,25 0,1 0,15
Obtener la media, desviación estándar, y el valor esperado de X2 Respuesta: Se obtiene la media: E(X) = ∑X*P(X) = 0*P(0)+1*P(1)+2*P(2)+3*P(3) = 0*0,5 + 1*0,25 + 2*0,1 + 3*0,15 = 0,9 Se obtiene la varianza: E[(X-0,9)2) = ∑(X-0,9)2*P(X) = (0-0,9)2*P(0) + (1-0,9)2*P(1) + (2-0,9)2*P(2) + (30,9)2*P(3) =(0-0,9)2*0,5 + (1-0,9)2*0,25 + (2-0,9)2*0,1 + (3-0,9)2*0,15 = 1,19 Se obtiene el valor esperado de X2: E(X2)= ∑ X2*P(X) = 02*P(0) + 12*P(1) + 22*P(2)+ 32*P(3) = 02*0,5 + 12*0,25 + 22*0,1 + 32*0,15 = 2
Distribución Binomial Una variable aleatoria que se comporta según una distribución binomial representa el número de éxitos que se obtuvieron en un número definido de experimentos, en los que los únicos resultados posibles son éxito y fracaso. Es importante notar que una variable aleatoria con distribución binomial es discreta. En esta distribución se tienen dos parámetros: la probabilidad de éxito en un experimento y el número de experimentos realizados. Su distribución está dada por: X ~ Binomial (p, n) Px ( X =x ) =
n! x n− x ∗p ∗( 1− p ) x !∗ ( n−x ) !
p=probabilidad de éxito en un experimento; n=número de experimentos realizados Media = n*p Variación = n*p*(1-p) Ejemplo: Pedro tiene un control de 4 preguntas de verdadero o falso. Como tenía cosas más importantes que hacer, no pudo estudiar absolutamente nada, por lo que decide contestar todas como verdadero. Calcular la probabilidad de que Pedro obtenga por lo menos un 4 (la mitad de las preguntas buenas). Respuesta: La variable aleatoria X corresponde al número de preguntas buenas que obtuvo Pedro, y se puede notar que distribuye según una binomial de parámetros p y n. La probabilidad de que Pedro tenga al menos un 4 es la suma de las probabilidades de que tenga 2, 3 y 4 buenas. Es decir: Px ( X ≥2 )=Px ( X =2 )+ Px ( X=3 )+ Px ( X =4 )
Como no se tiene ningún prejuicio o información adicional sobre la prueba, se considera que la probabilidad de tener una pregunta correcta poniendo verdadero es igual a la probabilidad de tenerla poniendo falso, por lo tanto, p=0,5. Como son 4 preguntas, n=4. Se hace el cálculo: Px ( X =2 )=
4! ∗0,52∗( 1−0,5 )4−2 =0,375 2!∗( 4−2 ) !
Px ( X =3 )=
4! 3 4−3 ∗0,5 ∗( 1−0,5 ) =0,25 3 !∗( 4−3 ) !
Px ( X =4 )=
4! 4 4−4 ∗0,5 ∗( 1−0,5 ) =0,0625 4 !∗( 4−4 ) !
Px ( X ≥2 )=0,6875
Distribución Normal Esta distribución se da para variables continuas, y varios fenómenos se comportan de acuerdo a esta. Esta distribución cuenta con dos parámetros, μ y σ. La media es μ y la varianza es σ2.
La distribución normal estándar es un caso particular de esta distribución, y se da cuando μ=0 y σ=1. Su gráfico se ve de la siguiente forma:
Notar que el eje horizontal son los posibles valores de la variable aleatoria X y el eje vertical es la probabilidad de que X adopte esos valores. La curva es simétrica. Lo que está en azul representa el área bajo la curva, que indica la probabilidad de que X esté en un intervalo en específico. Por ejemplo, la probabilidad de que X sea mayor o igual a 0 y menor o igual a 1 (entre 0 y 1) es igual al área bajo la curva que hay entre 0 y 1. La función ɸ(C) representa la probabilidad acumulada para X=C, es decir, indica la probabilidad de que X sea menor o igual a C, y es el área bajo la curva entre -∞ y C (C perteneciente a los reales). Los valores de la función ɸ( ) están en la Tabla Normal Estándar, desde X=0. De forma más general: -
ɸ(C): Probabilidad de que X sea menor o igual a C 1 - ɸ(C): Probabilidad de que X sea mayor que C ɸ(C) - ɸ(D): Probabilidad de que X sea mayor que D y menor o igual a C, con C mayor que D Se cumple: ɸ(-C) = 1 - ɸ(C) . Esto es útil para obtener la función para valores negativos, ya que no están en la tabla.
Ejemplo: Si X es una variable aleatoria que se comporta según una distribución normal estándar, obtener la probabilidad de que X sea menor o igual que -1 y mayor que -1,6.
Respuesta: Lo que se está pidiendo es ɸ(-1) - ɸ(-1,6). En la tabla no se pueden ver los valores de ɸ(-1) ni de ɸ(-1,6), pero se sabe que ɸ(-1) = 1 - ɸ(1) y ɸ(-1,6) = 1 - ɸ(1,6). Se buscan esos valores en la tabla: ɸ(1) = 0,8413 ; entonces ɸ(-1) = 0,1587 ɸ(1,6) = 0,9452 ; entonces ɸ(-1,6) = 0,0548 ɸ(-1) - ɸ(-1,6) = 0,1039
En el caso de que no sea normal estándar, es decir, media distinta a 0 y varianza distinto a 1, el procedimiento es similar, solo que la función de distribución acumulada está dada por X −μ ɸ( ) . σ Ejemplo: La cantidad de autos que pasa por día en una autopista se comporta según una distribución normal, con media de 80 autos por día y varianza de 100. Calcular la probabilidad de que no pasen más de 90 autos en un día. Respuesta: La probabilidad de que no pasen más de 90 autos es equivalente a la probabilidad de que pasen 90 autos o menos. Se tienen los parámetros μ=80 y σ =10 , por lo tanto la probabilidad de que pasen 90 autos o menos está dada por: ɸ(
90−80 ) = ɸ ( 1 )=0,8413 10
Teorema central del límite