La Distribución Normal : Una variable aleatoria continua es la que puede asumir un número infinito de posibles valores dentro de un rango específico. Estos valores usualmente usualmente resultan de medir algo algo ( medidas de longitud, de peso, de tiempo, de temperatura temperatura etc.) El título de Normal viene de que al principio se consideraba que todos los fenómenos en su estado normal deben seguir esa distribución; distribución; sin embargo , hoy hoy día, esa concepción ha sido sido superada y la distribución normal se considera tan corriente como otro tipo de distribución
Características de la distribución de probabilidad normal: La distribución de probabilidad normal y su curva tiene l as siguientes características: 1.
La curva normal tiene forma de campana (campana de Gauss) . La media, la moda y la mediana de la distribución son iguales y se localizan en el centro de la distribución.
2.
La distribución de probabilidad normal es simétrica alrededor de su media. Por o tanto, la mitad del área bajo la curva está antes del punto central y la otra mitad después. El área total bajo la curva es igual a 1.
3.
La curva normal se aproxima de manera asintótica al eje horizontal conforme se aleja de la media en cualquier dirección. Esto significa que la curva se acerca al eje horizontal conforme se aleja de la media, pero nunca lo llega a tocar.
4.
La función de la curva normal es la siguiente:
F(x) =
1 √ 2πσ
(- ½)[(x-µ)/ σ]² e
Donde π = 3.14159 y e = 2.71828
La familia de la distribución de probabilidad normal : Cuando se habla de la distribución normal, realmente se está hablando de una familia de curvas. Como se puede apreciar en la función de la curva normal, la curva depende de dos variables además de la variable independiente x, tales como la media ( μ), y la desviación estándar ( σ). Por lo tanto se tendrán curvas diferentes para funciones con desviación estándar diferente aún cuando sus medias fuesen iguales, como se muestra enseguida.
Curvas normales con media igual y desviación estándar diferente. Si por el contrario, las curvas tienen desviación estándar igual y la media es diferente, las curvas serán idénticas pero centradas en diferente posición en el e je horizontal.
Curvas normales con desviación estándar igual y media diferente Si las curvas tienen la media diferente y también la desviación estándar diferente, aparte de estar centradas en diferentes lugares del eje x, tendrá formas diferentes.
Curvas normales con media diferente y desviación estándar diferente La distribución normal estándarEl área bajo la curva normal y sobre el eje x es igual a la probabilidad de que la variable aleatoria x tome un valor dentro de cierto intervalo. Para medir esta área es necesario calcular la integral de la función de la curva normal para un intervalo de valores. Para evitar la dificultad de resolver integrales es necesario tabular las áreas que corresponden a cada valor de x. Como el número de distribuciones normales es ilimitado sería una tarea sin fin intentar establecer tablas para cada combinación de μ y σ. Afortunadamente, un miembro de la familia de las distribuciones normales puede ser usado en todos los problemas donde la distribución normal es aplicable, esta es la distribución normal con media cero y desviación estándar 1, la cual es llamada distribución normal estándar. Cada distribución normal deberá estandarizarse, es decir, transformarse a una distribución normal estándar, utilizando un valor z, o variable aleatoria estándar.
Valor z. Distancia entre un valor seleccionado, denominado X , y la media de la distribución, en unidades de una desviación estándar.
En términos de fórmula:
z=
x–µ σ
Gracias a esta fórmula podemos transformar cualquier distribución normal a la distribución normal estándar.
Áreas bajo la curva normal: Si se quiere saber la probabilidad de que la variable aleatoria tome valores dentro de determinado rango, se necesitaría calcular el área bajo la curva, resolviendo la integral de la función para ese rango de valores. Una característica que tiene cualquier distribución normal es que el área bajo la curva, que representa la probabilidad de que la variable aleatoria tome ciertos valores, se distribuye en la misma proporción. Para facilitar los cálculos se tabularon las áreas bajo la curva normal que se encuentran a la derecha de algunos de los valores Z, de esta forma ya no es necesario resolver integrales, solo se necesita transformar la distribución normal de interés en una distribución normal estándar mediante la fórmula, y el área a la derecha del valor z será el mismo que el área a la derecha de x
Área bajo la curva Normal :
Ejemplo: Los coeficientes intelectuales de 600 aspirantes de cierta universidad se distribuyen aproximadamente de forma normal con una media de 115 y una desviación estándar de 12. Si se selecciona un aspirante al azar, encuentre la probabilidad de que: a) Tenga un coeficiente mayor de 120. b) Tenga un coeficiente menor de 100. c) Tenga un coeficiente menor de 122. d) Tenga un coeficiente entre 115 y 125. e) Tenga un coeficiente entre 90 y 105. Solución. a) Hay una distribución normal con media 115 y desviación estándar de 12 y queremos saber cual es la probabilidad de que x sea mayor de 120 , es decir, cuanto mide el área a la derecha del 120. Lo primero es transformar esta distribución normal en una distribución normal estándar (con media cero y desviación estándar 1), para lo cual hay que cambiar el valor de x por un valor Z con la fórmula.
z=
X-µ σ
=
120 – 115 12
= 0.41
La distribución ya transformada queda así:
Z 0.4
0.01 .34090
Y como el área a la derecha del valor z es el área que buscamos, entonces este es el resultado, es decir, la probabilidad de que un aspirante a la universidad tenga un coeficiente intelectual mayor de 120 es .34090.
b) Para encontrar la probabilidad de que un aspirante tenga un coeficiente intelectual menor de 100, primero se traza la curva de la distribución normal original, para luego transformarse en la distribución normal estándar. El valor z se calcula con la fórmula:
Z=
X-µ σ
=
100 - 115 12
= -1.25
En la tabla de áreas bajo la curva normal no se tabularon valores z negativos, pero como la curva normal es simétrica, el área a la izquierda del valor z = -1.25 es del mismo tamaño que el área a la derecha del valor z = 1.25, por lo que solo se necesita buscar en la tabla el área correspondiente al valor positivo.
Z 1.2
0.05 .10565
c) Para encontrar la probabilidad de que la variable aleatoria sea menor de 122 , hay que estandarizar la distribución obteniendo el valor z correspondiente al valor de x = 122.
z=
x-µ
=
σ
122 – 115 12
= 0.58
Z
0.08
0.5
.28096
El área de .28096 corresponde a la que se encuentra a la derecha del valor z, pero no es la que nos interesa en esta vez, el área que queremos encontrar es la que se encuentra a la izquierda del valor z, que podemos calcular restando el área de .28096 al área total bajo la curva que es 1.
P( x < 122 ) = 1 - .28096 = .71904 encontrar el área que se encuentra entre x = 115 y x = 125 hay que encontrar el área a la d) Para encontrar el derecha de cada uno de esos valores. A la derecha de 115 ( la media ) el área es .5, para encontrar el área a la derecha de 125 hay que que encontrar en la tabla el el valor z correspondiente.
z=
x-µ
σ
=
125 – 115 12
= 0.83
Z 0.8
3 .20327
El área a la derecha de x = 125 es parte parte del área a la derecha de x = 115, si la restamos obtendremos el área que se encuentra entre los dos valores. P( 115 < x < 125 ) = .5 - .20327 = .29673
encontrar el área que se encuentra entre x = 90 y x = 105, hay que encontrar en la tabla e) Para encontrar el el área a la izquierda de cada uno de esos valores. Al estar en el lado izquierdo de la curva, por simetría, el área es la misma que la correspondiente a los valores z positivos.
z= z=
x- µ
σ
x-µ σ
= =
90 – 115 12 105 – 115 12
= - 2.08
= -0.83
Z 2.0 Z 0.8
0.08 .01876
0.03 .20327
Restamos
P( 90 < x < 105 ) = .20327 - .01876 = .18451
Ejercicios: 1.- Al aplicar un test de habilidad numérica a 300 alumnos se obtuvo una distribución normal con
μ
= 36 y σ = 5. Se desea saber:
a) Cuál es la probabilidad de obtener una puntuación igual o inferior a 32. b) Cuál es la probabilidad de obtener una puntuación igual o mayor a 34. Solución. z=
z=
x-µ σ
x-µ σ
=
32-36 5
= -0.8
Z 0.8
=
34-36 5
= -0.4
Z 0.4
0 0.2119
0 0.3436
P( x < =34 ) = 1 – 0.3436 = 0.6554 = 65.54 % Esto significa que la cantidad de alumnos que superan la puntuación de 34 puntos es: 300*(65.54)/100=197 300*(65.54)/100=197 alumnos.
2.- Un investigador reporta que unos ratones vivirán un promedio de 40 meses cuando sus dietas se restringen drásticamente y después se enriquecen con vitaminas y proteínas. Suponga que la vida de tales ratones se distribuye normalmente con una desviación estándar de 6.3 meses, encuentre la probabilidad de que un ratón viva:
a) b) c) d) e) f)
Mas de 32 meses Menos de 28 meses Entre 37 y 49 meses Entre 45 y 50 meses Entre 40 y 43 meses ¿Cuál es la probabilidad de que de seis ratones 4 vivan más de 30 meses?
3.- Las barras de centeno que cierta panadería distribuye a las tiendas locales tienen una longitud promedio de 30 centímetros y una desviación estándar de 2 centímetros. Suponga que las longitudes se distribuyen normalmente, ¿qué porcentaje de las barras son
a) b) c) d) e) f)
Mas largas de 31.7 cm? Entre 29.3 cm. y 33.5 cm de longitud? Entre 32 cm. y 35 cm? Mas cortas de 38 cm? Entre 27.5 cm. y 30 cm? ¿Cuál es la probabilidad de que de 4 barras, tres midan más de 35 cm.?
4.- Un abogado va todos los días de su casa a su oficina en el centro de la ciudad. El tiempo promedio del viaje es 24 minutos, con una desviación estándar de 3.8 minutos. Si las duraciones de los viajes están distribuidas normalmente:
a) ¿Cuál es la probabilidad de que un viaje tome al menos ½ hora? b) Si la oficina abre a las 9:00 a.m. y él sale de su casa diariamente a las 8:45 a.m., ¿qué porcentaje de las veces llega tarde al trabajo? c) Si sale sale de su su casa casa a las 8:35 a.m. y el café se sirve en la oficina de las 8:50 a.m. a las 9:00 a.m., ¿cuál es la probabilidad de que llegue a la hora del café? d) Encuentre cual es el tiempo mínimo que duran el 15% de los viajes más lentos? e) Encuentre la probabilidad de que dos de los siguientes tres viajes tomen como máximo ½ hora. 5.- Las alturas de 1000 estudiantes se distribuyen normalmente con una media de 174.5 cm y una desviación estándar de 6.9 cm., ¿cuántos de estos estudiantes se esperaría que tuvieran alturas
a) b) c) d) e) f) g) cm? h)
Menores de 160 cm? Entre 171.5 cm y 182 cm? Mayores a 165 cm? Entre 174.5 cm y 180 cm? Entre 180 cm y 195 cm? Menores de 185 cm? ¿Cuál es la probabilidad de que de cinco estudiantes, al menos 3 midan más de 180 ¿Cuál es la probabilidad de que de 3 estudiantes, ninguno mida menos de 160 cm?
Aproximación normal a la binomial: Cuando las muestras son pequeñas, en una distribución binomial se obtienen fácilmente probabilidades asociadas a un evento mediante la fórmula de la binomial. Cuando las muestras son grandes, el cálculo nos llevaría bastante tiempo. La distribución normal es a menudo una buena aproximación a una distribución binomial cuando np y nq son mas grandes que 5.
Distribución binomial
Distribución binomial
con n = 20 y p = .5
con n = 60 y p = .5
Para utilizar la distribución normal como una aproximación de la binomial debemos estar seguros de que la distribución de interés es en efecto una distribución biniomial, para lo cual debe reunir los siguientes criterios: 1. 2. 3. 4. 5.
Hay solo dos posibles resultados éxito o fracaso Resulta de un conteo Cada prueba es independiente La probabilidad probabilidad del éxito éxito es constante en cada cada prueba prueba Hay un número fijo de pruebas.
Ejemplo: La probabilidad de que un paciente se recupere de una rara enfermedad de la sangre es 0.4. Si se sabe que 100 personas contrajeron esa enfermedad, a) ¿Cuál es la probabilidad probabilidad de que menos menos de 30 30 sobrevivan? sobrevivan? b) ¿Cuál es la probabilidad probabilidad de que exactamente exactamente 5 sobrevivan? c) ¿Cuál es la probabilidad probabilidad de que a lo más 30 sobrevivan? sobrevivan?
Solución: El primer paso es verificar si el experimento cumple con los requisitos de una distribución binomial, y si es el caso calcular la media y la desviación estándar de la distribución. µ = np = (100)(0.4) = 40
σ=√
npq
=√
(100)(0.4)(0.6)
= 4.898
P(x < 30 ) Para resolver el problema con la fórmula de la distribución binomial se tendría que calcular 30 binomiales, desde la binomial de cero hasta la binomial de 29. Mediante el uso de la aproximación normal a la binomial el procedimiento es mucho más corto. El primer paso es aplicar al valor de x el factor de corrección de continuidad, que es simplemente sumar o restar 0.5 al valor de x, dependiendo del problema. En este caso queremos la probabilidad de que x valga menos de 30, no incluye al 30, entonces se le resta 0.5.
En seguida se aplica la fórmula de Z, utilizando el valor de x = 29.5, y en seguida buscar el área en la tabla: Z=
X-µ
σ
=
29.5 – 40 4.898
= -2.14
Z 2.1
4 .01618
b) P(x = 35 ) En una distribución continua la probabilidad de que la variable aleatoria sea exactamente determinado valor no se puede calcular y se estima que es cero, mientras que en una distribución discreta la probabilidad se calcula sumando y restando el factor de corrección de continuidad para estimar el área entre ambos puntos. Sin embargo, cuando tenemos un caso como este, lo correcto y lo más fácil es calcular la probabilidad con la fórmula de la bino mial, y obtenemos el resultado exacto.
b(35) =
n! x! ( n – x )!
pxqn-x =
100! 35!(100-35)!
(.4)35(.6)100-35 = .04913
c) P( x ≤ 30 ) Aquí se pide la probabilidad de que x tome valores desde 0 hasta 30 inclusive, como el 30 está incluido el factor de corrección de continuidad se suma.
Z=
X-µ σ
=
30.5 – 40 4.898
= -1.93
Z 1.9
3 .02680
Ejercicios: 1.- Investigadores de la Universidad George Washington reportan que aproximadamente 75% de las personas creen que “los tranquilizantes funcionan muy bien para hacer que una persona
esté más tranquila y relajada”. De las siguientes 80 personas entrevistadas, ¿cual es la probabilidad de que
a) b) c) d)
Al menos 50 sean de esa opinión? A lo más 56 tengan esta opinión? Entre 60 y 70 tengan esta opinión? Exactamente 43 tengan esta opinión?
2.- Si el 20% de los residentes de una ciudad de Estados Unidos prefiere un teléfono blanco sobre cualquier otro color disponible. ¿Cuál es la probabilidad de que entre los siguientes mil teléfonos que se instalen en esta cuidad
a) b) c) d)
Entre 170 y 200 sean blancos Al menos 210 sean blancos Más de 225 sean blancos Entre 180 y 225 sean blancos
3.- Un fabricante de medicamentos sostiene que cierto medicamento cura una enfermedad de la sangre en promedio el 80% de los casos. Para verificar esta afirmación, inspectores de gobierno utilizan el medicamento en una muestra de 100 individuos y deciden aceptar la afirmación si 75 o más se curan. a) ¿Cuál es la probabilidad de que el gobierno acepte la afirmación?
b) ¿Cuál es la probabilidad de que el gobierno rechace la afirmación si en realidad la probabilidad de curarse es de .70? 4.- Un estudio sobre nuevos delincuentes juveniles reveló que el 38% de ellos vuelve a delinquir. a) ¿Cuál es la probabilidad de que de cien nuevos delincuentes juveniles 30 o más vuelvan a delinquir? b) ¿Cuál es la probabilidad de que de 50 nuevos delincuentes juveniles 40 o menos vuelvan a delinquir? c) ¿Cuál es la probabilidad de que de 35 nuevos delincuentes juveniles 15 vuelvan a delinquir?