UNIVERSIDAD NACIONAL DE INGENIERIA FACULTAD TECNOLOGÍA DE LA CONSTRUCCIÓN
MAESTRÍA EN VÍAS TERRESTRES
CURSO PROPEDEUTICO
ESTADISTICA APLICADA
PROFESOR: MSC. ELIAS MARTINEZ RAYO
1
ESTADISTICA DESCRIPTIVA INTRODUCCIÓN QUE ES LA ESTADÍSTICA? Escribiendo Escribiendo de manera manera formal formal un poco poco más acertada acertada la definición de Estadística podemos decir que: Es un conjunto de técnicas para la colección, organización, organización, presentación, manejo, descripción y análisis de información, información, de manera que las las conclusiones obtenidas obtenidas de ellas tengan un grado de confiabilidad especificado.
CONCEPTO CONCEPTOSS BÁSI COS COS Estadística Descriptiva: Estudia los métodos adecuados que nos conducen a recopilar, organizar, sintetizar y describir una información (conjunto de datos) a través de tablas, gráficos y medidas descriptivas. Estadística I nferencial nferencial:: Estudia los métodos adecuados que nos conducen a tomar decisiones generales acerca de una población, utilizando utilizando los datos de una muestra, muestra, o sea: es la interpretación y generalización de los resultados obtenidos del estudio descriptivo. Población: Una población es el conjunto total de mediciones de interés en las que se estudia una característica dada. El tamaño tamaño de las poblaciones poblaciones es el número de elementos elementos o mediciones que contiene. • Por ejemplo. En un estudio sobre los costos de construcción, la población puede consistir en los precios unitarios de los materiales de construcción. • En un estudio socio-económico, la población puede consistir en el número de personas que habitan en un municipio determinado. • En un estudio de control de calidad, la población puede consistir en la valoración (numérica o cualitativa) de cada artículo que contiene un lote. Mue M uess tr a: Es un subconjunto de la población que contiene las mediciones obtenidas mediante mediante un experimento estadístico. Los métodos estadísticos proporcionan las técnicas necesarias para el diseño de experimentos o encuestas, y su procesamiento. Da los criterios para decidir el tamaño adecuado de una muestra, como obtener una muestra, como definir y probar hipótesis y proporciona una medida medida de la bondad o confiabilidad confiabilidad de las inferencias. inferencias. VARIABLES: Una variable se simboliza con letras mayúsculas del Alfabeto tal como X, Y, H, etc; pueden tomar un conjunto prefijado de valores, llamado dominio dominio de esa variable. variable. Las variables pueden ser cualitativas o cuantitativas. 2
ESTADISTICA DESCRIPTIVA INTRODUCCIÓN QUE ES LA ESTADÍSTICA? Escribiendo Escribiendo de manera manera formal formal un poco poco más acertada acertada la definición de Estadística podemos decir que: Es un conjunto de técnicas para la colección, organización, organización, presentación, manejo, descripción y análisis de información, información, de manera que las las conclusiones obtenidas obtenidas de ellas tengan un grado de confiabilidad especificado.
CONCEPTO CONCEPTOSS BÁSI COS COS Estadística Descriptiva: Estudia los métodos adecuados que nos conducen a recopilar, organizar, sintetizar y describir una información (conjunto de datos) a través de tablas, gráficos y medidas descriptivas. Estadística I nferencial nferencial:: Estudia los métodos adecuados que nos conducen a tomar decisiones generales acerca de una población, utilizando utilizando los datos de una muestra, muestra, o sea: es la interpretación y generalización de los resultados obtenidos del estudio descriptivo. Población: Una población es el conjunto total de mediciones de interés en las que se estudia una característica dada. El tamaño tamaño de las poblaciones poblaciones es el número de elementos elementos o mediciones que contiene. • Por ejemplo. En un estudio sobre los costos de construcción, la población puede consistir en los precios unitarios de los materiales de construcción. • En un estudio socio-económico, la población puede consistir en el número de personas que habitan en un municipio determinado. • En un estudio de control de calidad, la población puede consistir en la valoración (numérica o cualitativa) de cada artículo que contiene un lote. Mue M uess tr a: Es un subconjunto de la población que contiene las mediciones obtenidas mediante mediante un experimento estadístico. Los métodos estadísticos proporcionan las técnicas necesarias para el diseño de experimentos o encuestas, y su procesamiento. Da los criterios para decidir el tamaño adecuado de una muestra, como obtener una muestra, como definir y probar hipótesis y proporciona una medida medida de la bondad o confiabilidad confiabilidad de las inferencias. inferencias. VARIABLES: Una variable se simboliza con letras mayúsculas del Alfabeto tal como X, Y, H, etc; pueden tomar un conjunto prefijado de valores, llamado dominio dominio de esa variable. variable. Las variables pueden ser cualitativas o cuantitativas. 2
Cuantitativas: Si la variable en estudio se puede expresar numéricamente, numéricamente, entonces se llama variable cuantitativa. cuantitativa. Estas pueden ser discretas disc retas o continuas. DISCRETAS: DISCRETAS: cuando únicamente asumen asumen valores enteros. Son resultado de contar un número de objetos u observaciones. observaciones. Ejemplos • Número de viviendas en una cuadra • Número de hijos por vivienda • Número de automóviles que cruzaron un puente puente en una hora determinada. determinada.
CONTINUAS: cuando pueden asumir cualquier valor en una escala continua (real). Ejemplos: Ejemplos: • La carga máxima que soporta un cable • La vida útil de una lámpara • El área de una parcela • La distancia entre dos puntos. Cualitativas: Si la variable en estudio estudio es no numérica, numérica, se llama variable cualitativa. cualitativa. Estudiaremos las nominales y ordinales. Nominales: Cuando se obtienen a partir de la definición de categorías y se pueden contar los elementos de esa categoría. Ejemplos • Sexo (masculin (masculinoo o femenin femenino) o) • Estado civil (soltero o casado) • Departamento de origen (Managua, León, Granada, etc.) pr imaria, secundaria, ect.) • Nivel educativo (Pre-escolar, primaria, Ordinales o Jerarquizados: Cuando son susceptibles de un ordenamiento relativo, pero no de mediciones cuantitativas: cuantitativas: primero, segundo, s egundo, tercero, etc. Ejemplos • Valoración de un un arbitro • Preferencias de un cliente Cuando se trabaja con datos cualitativos es adecuado codificarlos codificarlos para su posterior procesamiento. Por ejemplo, la variable sexo se puede codificar así: así: 0, si la persona es del sexo masculino X =
1, si la persona es del sexo feme nino
3
DESCRIPCIÓN DE DATOS Los datos estadísticos, obtenidos de experimentos, muestras o cualquier colección de mediciones, comúnmente son tantos que, para poder describirlos y analizarlos, requieren ser reducidos a una forma más adecuada. Comenzaremos con la presentación de datos agrupados en una tabla y posteriormente en forma de gráficos. Distribución de Frecuencia Es una ordenación tabular de datos estadísticas que muestran cuantos elementos o que parte de los estos están en diferentes intervalos (clases o categorías) en los cuales se agrupan los datos. La distribución de frecuencia pueden ser distribuciones numéricas o cualitativas. Construcción de una Tabla de Distribución de Frecuencias (TDF). Para la construcción de una TDF, existen varias técnicas, en general se recomienda que el número de clases deban oscilar entre cinco y quince; y esto dependerá del número de elementos que tenga la información que se agrupará en ella. La técnica que mostraremos a continuación, es una técnica que de antemano se debe dar el número de clases. Lo haremos con un ejemplo. Ejemplo 1 En una cooperativa de taxis de Managua se midió el consumo de gasolina, obteniendo los kilómetros que hicieron 40 vehículos por galón de consumo. Los resultados fueron los siguientes: 45 43.2 44.4 42.1
38.4 44.0 44.7 45.6
44.3 43.8 44.1 44.5
44.2 43.8 44.3 39.7
43.6 45.5 43.9 40.7
45.3 44.5 44.1 42.3
44.5 39.8 44.2 44.4 44.6 44 45.2 38.7 45.8 42.2 41.2 40.6 45.2 43.3 44.7 38.6
Agrupe estos datos en una distribución de frecuencias que tenga 7 clases Solución: 1) Hallar el rango; R = 45.8-38.4=7.4 2) Establezca el cociente R / K; K: número de intervalos,
7 .4 7
= 1 . 05 7
3) Para la selección de la amplitud de las clases, debe tomarse en cuenta el número de decimales en los datos. En este caso u = 0.1 (dos decimales). Luego, 1.057 se trunca hasta un decimal; es decir: C = 1.0 + 0.1 = 1.1 4) Construir el primer intervalo: Li = Vmenor = 38.4 (límite inferior) Ls = Vmenor + C – u = 38.4 + 1.1 – 0.1 = 39.4 (límite superior) 5) Para obtener los límites de los demás intervalos, solamente se suma la amplitud a cada límite anterior. Notas: 1) El último intervalo deberá contener al dato mayor. 2) Ls = Li +C – u; para cualquier clase. 4
La TDF contiene la siguiente información, la cual se agrega en columnas a la par de las clases: -
-
-
-
-
-
La frecuencia, denotada por f , representa el número de datos que están contenidos en cada clase. La frecuencia relativa, denotada por fr, definida como: fr = f i/n, donde i = 1 hasta k, donde k representa a las clases y n es el total de datos. El porcentaje de la frecuencia, denotada por %f , definida como: %f = 100 fr. La frecuencia acumulada, denotada por F, definida como: F = Σf i (i = 1 hasta k, donde k representa a las clases). El porciento de la frecuencia acumulada, denotada por %F, definida por: %F = F n/100. La marca de clase, denotada por X, definida como el punto medio de cada clase. X = (Li + Ls) / 2. Los limites reales, LIR = LI - u/2 y LSR = LS + u/2. Para los limites reales, vamos a convenir que tienen esta forma: (LIR, LSR], abiertos por la izquierda y cerrados por la derecha.
DIAGRAMA DE TRONCO Y HOJAS Los datos se pueden ordenar en un diagrama de Tronco y hojas, para facilitar la construcción de la TDF. Ordenación de los datos en tronco y hojas, para obtener la frecuencia absoluta, en este caso tomamos como tronco los enteros y como hojas los decimales. Tronco hojas 38. 4, 6, 7 39 7, 8, 40 6, 7 41 2 42 1, 2, 3 43 2, 3. 6, 8, 8, 9 44 0, 0, 1, 1, 2, 2, 3, 3, 4, 4, 5, 5, 5, 6. 7, 7
45
0, 2, 2, 3, 5, 6, 8
T. D. F.: Consumo de gasolina de taxis de una cooperativa de Managua
LI 38.4 39.5 40.6 41.7 42.8 43.9 45
LS 39.4 40.5 41.6 42.7 43.8 44.9 46
f 3 2 3 3 5 17 7
Fr 0.075 0.05 0.075 0.075 0.125 0.425 0.175
F 3 5 8 12 17 33 40
%F 0.075 0.125 0.2 0.275 0.4 0.825 1
5
X 38.9 40 41.1 42.2 43.3 44.4 45.5
LIR 38.35 39.45 40.55 41.65 42.75 43.85 44.95
LSR 39.45 40.55 41.65 42.75 43.85 44.95 46.05
Ejercicios 1.
En la zona baja de Managua hay 27 pozos, que suministran agua a la ciudad Capital, los caudales de dichos pozos se miden en galones por minuto (GPM) y sus mediciones son las siguientes: 80 0 1000 1200
2200 800 600
121 2 1 20 0 800 1000 550 450
2230 1200 400
1 11 5 800 380
1 100 750 350
51 .1 710 1200
1 10 0 700 1000
a) agrupe estos datos en una distribución que tenga 6 clases. 2. Los contenidos de nicotina, en miligramos, de 40 cigarrillos de cierta marca son: 1.09 1.79 2.03 1.63 1.69 0.85 1.74 1.37 1.86 2.31 1.88 2.17 1.58 1.75 0.72 1.97 1.40 1.68 2.11 1.92 2.46 1.70 2.37 1.85 1.64 1.47 1.93 1.90 1.79 2.08 a) Construya una T.D.F con 6 intervalos.
1.64 1.75 2.28 1.24 2.55
1.51 1.82 1.67 2.09 1.69
REPRESENTACIÓN GRÁFICA REGLA DE LOS ¾
La mayoría de las graficas estadísticas se presentan en el plano cartesiano. Para las dimensiones de las gráficas, se acostumbra usar el criterio de los ¾; es decir, que la altura máxima de la información que se presenta en el eje de las ordenadas, sea: 3/4 de la dimensión de la información que se presenta en el eje de las abcisas; o sea: Y = (3/4) X. HISTOGRAMA DE FRECUENCIAS
Un histograma de frecuencia consiste en una serie de rectángulos que tiene sus bases sobre el eje horizontal (x), con centros en las marcas de clases y longitud igual al tamaño de los intervalos de clase. Las alturas sobre el eje vertical (y) son proporcionales a las frecuencias de las clases.
POLIGONO DE FRECUENCIAS. Es un gráfico que une los puntos cuyas coordenadas corresponden a cada marca de clase como abcisa y su frecuencia correspondiente como ordenada. OJIVA O POLIGONO DE FRECUENCIAS ACUMULADAS. Es un gráfica que muestra las frecuencias acumuladas para cada valor o clase. Del ejemplo 1, obtendremos el histograma, el polígono y la ojiva. Solución: 6
La TDF es: T. D. F.: Consumo de gasolina de taxis de una cooperativa de Managua
LI 38.4 39.5 40.6 41.7 42.8 43.9 45
LS 39.4 40.5 41.6 42.7 43.8 44.9 46
f 3 2 3 3 5 17 7
F 3 5 8 12 17 33 40
X 38.9 40 41.1 42.2 43.3 44.4 45.5
LIR 38.35 39.45 40.55 41.65 42.75 43.85 44.95
LSR 39.45 40.55 41.65 42.75 43.85 44.95 46.05
Histogram 18 15 12 9 6 3 0 38.35 39.45 40.55 41.65 42.75
43.85 44.95 46.05
Poligono 18 15 12 9 6 3 0 38.9
40
41.1
42.2
7
43.3
44.4
45.5
Ojiva 40 35 30 25 20 15 10 5 0 39.45
40.55
41.65
42.75
43.85
44.95
46.05
DIAGRAMA DE BARRAS. Similares a los histogramas, las alturas de las barras representan las frecuencias de las clases, pero no hay una escala horizontal continua. DIAGRAMA DE BARRAS
6
5
A I C N E U C E R F
4
3
2
1
0 1
2
3
4
5
6
CLASES
DIAGRAMA CIRCULAR Es un círculo que se divide en sectores circulares proporcionales con las categorías o clases que se muestran. Los ángulos correspondientes a cada sector se encuentran a través de una regla de tres. De igual forma los porcentajes que se muestran. El diagrama circular se acompaña de una leyenda, donde se especifica la información que se muestra en cada uno de los sectores del círculo.
8
DIAGRAMA CIRCULAR
13%
40%
20%
27%
MEDIDAS DESCRIPTIVAS (ESTADIGRAFOS) Medidas de Tendencia Central: Las medidas de tendencia central son la media aritmética, la mediana y la moda, las cuales calcularemos para datos agrupados y no agrupados. Consideraremos que los datos están agrupados, cuando están representados en una TDF. MEDI A A R I TMÉTI CA La media aritmética, representa el valor promedio de los datos, se denota por: X : media aritmética para una muestra y como: μ : media aritmética para una población.
Estaremos utilizando la notación para una muestra, aunque los cálculos son validos para las medidas o parámetros poblacionales. Para datos agrupados se calcula como: k
X=
∑
f X i
i =1
n
i
; donde: f: es la frecuencia absoluta,
X: es la marca de clase y n: el número de observaciones. Para datos no agrupados se calcula como: n
x=
∑ x i =1
n
; donde:
X: es cada observación n: el número de observaciones.
9
LA MEDIANA Es un valor central que tiene la característica de dividir en dos partes iguales las observaciones. Un 50% de las observaciones son menores o iguales a la mediana y el otro 50% mayor o igual, se denota por M e. Para datos agrupados se define:
n − F Me = Li + 2 . C ; donde f
Li: Limite inferior real del intervalo que contiene a la M e. F: Frecuencia acumulada anterior al intervalo que contiene a la M e. f: Frecuencia absoluta del intervalo que contiene a la M e. C: Amplitud de clase. Para obtener la Mediana, identificamos la clase que contiene a la mediana, la cual será donde la primera frecuencia acumulada es mayor o igual a: n/2. Para datos no agrupados: se ordenan los datos y se escoge el valor central del conjunto datos; para esto se debe considerar cuando el número de datos es par o impar. Si n es impar, entonces: n +1 Me = Dato [ posición ( ) ]
2
Ejemplo: Sean los datos 3,4,4,5,6,7,,8,8,9,9,10. (n =11) Me = Dato (6) = 7 Si n es par, entonces:
Dato [ posición ( n )] + Dato [ posición ( n + 2 )] 2 2 Me = 2
O sea: el promedio de los dos datos centrales. Ejemplo: 3,4,4,5,6,7,8,8,9,9,10,11. (n =12)
Me = (Dato (6) + Dato (7))/ 2 = (7 + 8) / 2 = 7.5 LA MODA: De una serie de datos es: el número que ocurre con mayor frecuencia, el que más se repite (datos no agrupados). Basta observar el número que más se repite. Para datos agrupados, la moda esta en la mayor concentración de datos (mayor frecuencia), la clase con mayor frecuencia es la clase modal. La moda si existe puede ser no única y se denota por M o, se define como: 10
Mo = Li +
∆1 ∆ + ∆ . C 1 2
; donde
Li: Limite interior real del intervalo Modal. ∆1: Mayor frecuencia menos la inmediata anterior ∆2: Mayor frecuencia menos la inmediata posterior C: Amplitud de Clases Formas de la Distribución: -
Muchas distribuciones de variables continuas se pueden representar de manera grafica mediante una curva en forma de campana.
-
Se dice que una distribución es simétrica, si se puede doblar a lo largo de un eje vertical de modo que los lados coincidan, en este caso la x, la M e y Mo coinciden, en el punto de simetría.
Mo = Me = X
- Se dice que es “ Asimétrica positiva” o “Sesgada a la derecha” si Mo< Me < x.
Mo< Me < x -
Se dice que “ Asimétrica Negativa” o “Sesgada a la izquierda, si x < Me < Mo.
x
11
MEDIDAS DE VARIABILIDAD: Son medidas que expresan variabilidad o dispersión alrededor de un valor promedio. Una vez localizado el centro de distribución de un conjunto de datos nos vemos en la necesidad de medir el grado en que se dispersan o diseminan los datos alrededor del valor promedio. Varianza Expresa variabilidad al cuadrado de los datos alrededor del valor promedio se representa por S2 (para una muestra) y como σ 2 (para una población) y se obtiene: Datos agrupados S 2
=
n
∑
Datos no agrupados
2 i − ( ∑ xf i ) n ( n − 1)
x 2 i f
S 2
x: marca de clase f: frecuencia n: total de datos La varianza es un valor no negativo.
=
∑
−
( x − x) 2 n
−1
x: datos x: media aritmética n: total de datos
Desviación Estándar Expresa variabilidad lineal de los datos alrededor del valor promedio. Es la raíz cuadrada de la varianza. Se representa por: S, para una muestra y como: σ, para una población. Se obtiene: tanto para datos agrupados como para no agrupados. Coeficiente de Variación C V =
s −
x
Se utiliza para comparar la variabilidad de dos o más distribuciones, será más representativa (menos variabilidad) la que tenga el C V más pequeño. Del ejemplo 1 , calcularemos e interpretaremos las medidas descriptivas para datos agrupados. T. D. F.: Consumo de gasolina de taxis de una cooperativa de Managua
LI 38.4 39.5 40.6 41.7 42.8 43.9 45
LS 39.4 40.5 41.6 42.7 43.8 44.9 46
f 3 2 3 3 5 17 7
F 3 5 8 12 17 33 40
X 38.9 40 41.1 42.2 43.3 44.4 45.5
12
LIR 38.35 39.45 40.55 41.65 42.75 43.85 44.95
LSR 39.45 40.55 41.65 42.75 43.85 44.95 46.05
Solución: Medidas de tendencia central -
X = 1736..4/40 = 43.41. Los taxis recorren en promedio 43.41 Km. por galón de gasolina.
-
Para le mediana se calcula primero: n/2 = 20, luego se observa en la columna de las frecuencias acumuladas, cual es la primera clase que contiene a 20. En este caso es la sexta clase, entonces: Me = 43.85 + [(20 – 16) / 17] 1.1 = 44.3. El 50% de los vehículos usados como taxis recorren menos de 44.3 Km. Por galón de gasolina.
-
Para la moda se ubica la clase que contiene a la moda, que es: la que tiene la mayor frecuencia, en este caso la sexta. Mo = 4835 + [(12/(12+10))] 1.1 = 44.45. Lo mas común es que los vehículos usados en la cooperativa de Taxis, recorran 44.45 Km. Por galón de gasolina.
Nota: con estas medidas se deduce que la forma de la distribución es asimétrica negativa, ya que la media es menor que la mediana y la moda. Medidas de variabilidad Para la varianza se obtienen los productos de las dos últimas columnas de la tabla anterior y sus respectivas sumas. Las unidades de la varianza son cuadradas. -
S2 = [40 (75529.1) – ( 1736.4)2] / (40*39) = 3.8968 (Km por galón) 2 . La variabilidad cuadrática del kilometraje recorrido por los taxis alrededor de la media es de 3.8968 (Km por galón) 2.
La desviación estándar se obtiene extrayendo la raíz cuadrada a la varianza y sus unidades son lineales, entonces: S =1.974 La variabilidad lineal del kilometraje recorrido por los taxis es de 1.974 Km., alrededor de la media. -
-
Para el coeficiente de variación, simplemente se divide la desviación estándar entre la media. CV = 1.974/43.41 = 0.04547.
13
INTRODUCCION A LA TEORIA DE PROBABILIDAD. INTRODUCCION Cuando operamos con procesos físicos, biológicos y sociales que generan observaciones que no es posible predecir con exactitud, entonces decimos que estamos ante eventos o sucesos aleatorios. La frecuencia relativa con la cual, ocurren estos sucesos en una gran cantidad de observaciones es a menudo estable. Esto nos da una idea intuitiva, pero significativa de la probabilidad de ocurrencia de un evento aleatorio en una observación futura. CONCEPTOS BASICOS EXPERIMENTO ALEATORIO Definición Un experimento aleatorio es un proceso con diversos resultados posibles que no se conocen de antemano o que no pueden predecirse con certeza.
Ejemplos: 1) Lanzamiento de una moneda 10 veces. ¿Cuántas caras caen? 2) Seleccionar una muestra de 1000 transistores de un cargamento de artículos similares. ¿Saldrá más de un transistor defectuoso? 3) Observar diariamente la temperatura en un cierto punto al mediodía durante 90 días. ¿En cuántos días pasa de 30 grados? 4) Evaluar un proyecto de investigación y desarrollo. ¿En seis meses saldrá con éxito un nuevo producto? ESPACIO MUESTRAL Definición El conjunto de todos los resultados posibles de un experimento aleatorio se denomina espacio muestral, lo denotaremos con la letra “S”.
Ejemplos: Consideremos los siguientes experimentos 1) Lanzamiento de una moneda, el espacio muestral es: S = {C, S}, donde: C: cara; S: sol. 2) Lanzamiento de una moneda dos veces, el espacio muestral es: S = {CC, CS, SC, SS} 3) Lanzamiento de una moneda tres veces, el espacio muestral es: S = {CCC, CCS, CSC, SCC, SSS, SSC, SCS, CSS} Nota: En experimentos repetidos, como el anterior, hay una fórmula que nos permite saber cuántos elementos tiene el espacio muestral, la cual se puede expresar como: Xn : numero de resultados posibles del experimento repetido, donde X: resultados posibles del experimento n: veces que se repite el experimento.
14
Si la moneda se lanzara cinco veces, entonces el total de posibles resultados de este experimento seria: 2 5 = 16 Nota: Esta fórmula nos permite conocer el # de elementos del espacio muestral, pero no los elementos. EVENTO Definición Un subconjunto del espacio muestral se denomina evento o suceso, los denotaremos con letras mayúsculas. A, B, C, etc. denotarán sucesos.
Ejemplo En el lanzamiento de un dado, S = {1, 2, 3, 4, 5, 6} Algunos sucesos son: A: "El número que muestra la cara superior es a lo más cuatro" ó A = {1, 2, 3, 4} B: " El número que muestra la cara superior es exactamente seis" ó B = {6} C: " El número que muestra la cara superior es impar" ó C = {1, 3, 5} D: " El número que muestra la cara superior es un número menor que 7”. (D = S). E: " El número que muestra la cara superior es un número mayor que 8”. (E = φ). A los eventos D y E se le denominan evento seguro y evento imposible respectivamente. OPERACIONES CON EVENTOS Y PROPIEDADES. a) Unión: El suceso A ∪ B ocurre, si ocurre el suceso A u ocurre el suceso B o bien ocurren ámbos. La unión de sucesos tiene las siguientes propiedades: i) A U A = A, ii) A U B = B U A, iii) A U φ = A , iv) A U S = S, v) Si A < B, A U B = B b) Intersección: El suceso A ∩ B ocurre, si ocurren A y B simultáneamente. La intersección de eventos tiene las siguientes propiedades: i) A ∩ B = B ∩ A, j) ii) A ∩ A = A, k) iii) A ∩ S = A, l) iv) A ∩ φ = φ, m) v) Si A < B, A ∩ B = A Se puede generalizar la unión e intersección de eventos a una sucesión finita o infinita de eventos cualesquiera.
15
Nota: Dos eventos A y B son disjuntos o mutuamente excluyentes, si no pueden ocurrir ambos de manera simultánea, es decir, su intersección es el suceso imposible. (A ∩ B = φ) c) Complemento: Se dice que ocurre el suceso A c, si no ocurre el suceso A. El complemento de un suceso tiene las siguientes propiedades: i) (Ac)c = A, ii) ii) A U Ac = S, iii) iii) A ∩ Ac = φ, iv) iv) φc = S, v) v) Sc = φ d) Diferencia
El suceso A – B ocurre, si ocurre A y no ocurre B. La diferencia tiene las siguientes propiedades a) A – B = A Bc b) A – B ≠ B – A c) A – Ac = φ d) Ac = S – A. Además, existen otras propiedades: i) A ∩ ( B ∪ C) = (A ∩ B) ∪(A ∩ C) ii) A ∪ ( B ∩ C ) = (A ∪ B) ∩ (A ∪ C) iii) (A ∪ B ) c = Ac ∩ Bc (ley de Morgan) iv) ( A ∩ B)c = Ac ∪ Bc (ley de Morgan) EJEMPLO. Un comerciante de automóviles usados tiene dos PINOLEROS 1976 en su lote y estamos interesados en saber cuántos de ellos venderán dos vendedores en una semana dada. Puede ocurrir que los vendedores en esa semana vendan 0, 1 ó 2 automóviles, por lo tanto, sea x: la cantidad vendida por el primer vendedor, y: la cantidad vendida por el segundo vendedor, así: S = {(x, y) 0 ≤ x ≤ 2, 0 ≤ y ≤ 2} PROBABILIDAD Para describir cuantitativamente el grado de posibilidad objetiva de que se produzca uno u otro suceso observable de un experimento, se cuenta con la función numérica P(A), llamada probabilidad del suceso A. Si estamos seguros que el suceso ocurrirá decimos que su probabilidad es 1, (suceso seguro). Si estamos seguros que no ocurrirá, decimos que su probabilidad es cero (suceso imposible). - Afirmar que la probabilidad de un suceso es 0.25, significa que hay un 25% de posibilidades de que ocurra y un 75% de que no ocurra; es decir que ocurrirá con un promedio de 1 cada 4 veces. Hay dos procedimientos para asignar o estimar la probabilidad de un suceso.
16
ENFOQUE CLÁSICO CONCEPTO DE PROBABILIDAD CLASICA. Definición Si un suceso A puede ocurrir de n maneras diferentes, de un total de N maneras posibles, todas “igualmente probables” entonces: P ( A) =
n N
= números
de veces que se observa A
número total de datos
ENFOQUE COMO FRECUENCIA RELATIVA CONCEPTO DE PROBABILIDAD COMO FRECUENCIA RELATIVA Definición Si después de N repeticiones de un experimento, donde N es “muy grande”, un suceso A ocurre n veces, entonces:
P(A ) =
n N
Como se pudo observar ambos enfoques presentan “debilidades”. Una forma de superar estos aspectos es introducir un enfoque matemático del concepto de probabilidades, mediante axiomas y teoremas consistentes. POBABILIDAD MATEMATICA AXIOMAS DE PROBABILIDAD. Sea E un experimento aleatorio y S el espacio muestral asociado a dicho experimento. A cada suceso A < S se le asigna un número real P(A) denominado la probabilidad de que el suceso A ocurra. Este número debe cumplir los siguientes axiomas: a) Para cualquier suceso A, P(A) ≥ 0 b) P(S) = 1 c) Para cualquier sucesión infinita de sucesos disjuntos (o mutuamente excluyentes) A1 , A2 , A3 ,.... +∞ , se cumple que: P (A1 U A2 U…) = P (A1) + P (A2) +…; O de manera compacta P (∪ Ai) = Σ P (Ai) i=1 i=1 TEOREMAS DE PROBABILIDAD. Teorema 1. P(φ) = 0 Teorema 2. Para cualquier sucesión finita de n sucesos disjuntos, A 1 , A2, ... , A n n n P (∪ Ai ) = Σ P(Ai) i=1 i=1 Teorema 3. Para cualquier suceso A, P(A c) = 1 – P(A)
17
Teorema 4. Para cualquier suceso A, 0 ≤ P(A) ≤ 1 Teorema 5. Si A < B, P(A) ≤ P(B) Teorema 6. Para dos sucesos cualesquiera A y B, P(A∪ B) = P(A) + P(B) - P(A ∩ B). Probabilidad de la Unión de n- Sucesos. Para sucesos cualesquiera A 1, A2,...., An, se cumple que: n n P (∪ Ai) = Σ P(Ai) - Σ P(Ai A j) + Σ P(Ai A j Ak ) i=1 i =1 i
18
b) Se pide que el empleado no esté en ninguno de los cursos, o sea que no ocurra A ni ocurra B, o sea, P(A c ∩ Bc ) = P(A U B)c = 1 – P(A U B) = 1 – 0.8 = 0.2 TECNICAS DE CONTEO. REGLA MULTIPLICATIVA Si una operación puede efectuarse de n 1 maneras diferentes, y si para cada una de éstos resultados se puede efectuar una segunda operación de n 2 maneras diferentes, y si para cada pareja de resultados de las operaciones anteriores se puede efectuar una tercera operación de n3, maneras diferentes..., y finalmente una k-ésima operación puede efectuarse de nk maneras diferentes, todas la k operaciones pueden realizarse en el orden especificado en: N = n1 n2 .... nk maneras diferentes. Ejemplo Considere un experimento que consiste en lanzar una moneda equilibrada dos veces y un dado equilibrado. n1 = 2 (posibilidades de primer moneda) n2 = 2 (posibilidades de segunda moneda) n3 = 6 (posibilidades del dado) El total de posibles resultados de este experimento será: N = 2*2*6 = 24 PERMUTACIONES El número de maneras en que se pueden ordenar k objetos de un total de n objetos, se denota: nPk , sin repetición se define como: nPk = n (n – 1) (n – 2) ... (n –k + 1). Nota: si multiplicamos y dividimos la expresión anterior por (n – k)!. Obtendríamos lo siguiente: nPk
= n (n – 1) (n – 2) ... (n –k + 1) (n – k)! / (n – k)! = n! / (n – k)!. Lo cual es equivalente a la definición anterior.
Ejemplo. Cuantos números de tres cifras, sin repetir; se pueden obtener con los dígitos: 1, 2, 3, 4, y 5. Solución: El total de números es: 5P3 = 5!/2! = 60 Teorema. El numero de permutaciones de n objetos de los cuales n 1 son de un tipo, n 2 son de un segundo tipo,… y n k son de un k-ésimo tipo son: N = n! / (n1! n2! n3!... nk !)
19
Ejemplo. Si en un grupo de 8 estudiantes de la UNI, tres son civil, dos de eléctrica, dos de química y uno de arquitectura y se desean ordenar de tal forma que los de la misma carrera estén juntos, ¿de cuantas maneras diferentes se puede hacer eso? Solución: n=8 n1 = 3 n2 = 2 n3 = 2 n4 = 1 N = 8! / (3! *2!* 2!*1!) = 1680. COMBINACIONES El número de maneras de seleccionar k objetos de un total de n objetos, se denota como: nCk , (el orden es irrelevante), es: nCk = n!/ k! (n – k)! Ejemplo Se van elegir al azar cuatro estudiantes de un grupo formado por tres estudiantes no graduados y cinco estudiantes graduados, para ocupar ciertos puestos en el Consejo Estudiantil. El total de formas en que se pueden seleccionar es: 8C4 = 8! / 4!(4!) =70 (El orden de elección no interesa) Otros Ejemplos: 1. Se lanzan cinco monedas. Determinar la probabilidad de obtener cuatro caras. SOLUCION: El espacio consta de 2*2*2*2*2 = 32 posibilidades. Las sucesiones del evento A: “se obtienen cuatro caras y un sol” son: CCCCS, CSCCC, CCSCC, CCCSC, SCCCC. Así, P(A) = 5/32 2. Una moneda equilibrada va a ser lanzada diez veces. Determinar: a) la probabilidad de obtener exactamente tres caras, b) la probabilidad de obtener a lo sumo tres caras. SOLUCION: El espacio muestral consta de 2 10 = 1024 posibilidades. El número de sucesiones de tres caras es 10 C 3 = 120 a) Sea A: “caen exactamente tres caras”, entonces, P(A) = 120 / 1024 = 0.1172 c) Sea B: “obtener a lo sumo tres caras”, el número de posibilidades de que ocurra el suceso B es: 10 C 0 + 10 C 1 + 10 C 2 + 10 C 3 = 176 y P(B) = 176 / 1024 = 0.1719
20
Teorema. El total de maneras en que se puede dividir un conjunto de n elementos en p subconjuntos de los cuales n 1 elementos están en el primer subconjunto, n2 elementos están en el segundo subconjunto,… y n p elementos están en el p-ésimo subconjunto, está dado por: n n1!, n2!, n3!,..., np!
n! = ------------------------n1! n2! n3!... nk !
Ejemplo. Siete estudiantes de la UNI (Recinto Simón Bolívar) van a una reunión al Recinto Pedro Araúz Palacios en tres vehículos de las autoridades universitarias, en los cuales caben tres en un vehículo y dos en los restantes vehículos, ¿de cuantas formas pueden viajar a dicha reunión? Solución: 7 3, 2 ,2
7! = --------- = 210. 3! 2! 2
2.6 SUCESOS INDEPENDIENTES. Suponga que dos sucesos A y B ocurren independientemente uno de otro en el sentido de que la ocurrencia o no ocurrencia de cualquiera de ellos no tiene relación ni influye sobre la ocurrencia o no Ocurrencia del otro. Bajo estas condiciones, se cumple que: P(A ∩ B) = P(A) P(B). Ejemplo. Considere el experimento en el cual, una moneda y un dado se lanzan simultáneamente. Sea A: “obtener una cara en el lanzamiento de la moneda” y sea el suceso B: “obtener 1 ó 2 al lanzar el dado”. Solución: De esta forma P(A) = ½, P(B) = 1/3, P(A ∩ B) = 1/6, ya que hay 12 resultadosposibles del experimento y dos posibilidades en los sucesos: (C,1) y (C,2). (Haciendo un diagrama de árbol se aprecian muy bien estos resultados). De esta forma observe P(A ∩ B) = P(A) P(B). Teorema Si A y B son dos sucesos independientes, entonces, también lo son: A y Bc , Ac y Bc.
21
Independencia de varios sucesos: Los sucesos A1, A2, ... , A k , son independientes si: n n P(∩ Ai ) = Π P(Ai ) i=1 i=1 Además, debe cumplirse que la independencia de los sucesos debe ser: por grupos de dos, grupos de tres, grupos de cuatro,...., hasta todo el grupo de k-sucesos. Por ejemplo, para un experimento dado, sea S = {a, b, c, d} donde los elementos de S son equiprobables. Sean A = { a, b}, B = { a, c}, C = { a, d}. Entonces estos tres sucesos no son independientes ya que P(ABC) = ¼ que difiere de P(A) P(B) P(C), sin embargo son independientes por pares ya P(AB) = P(AC) = P(BC) = ¼ y P(A) = P(B) = P(C) = ½. Nota: Dos sucesos A y B mutuamente excluyentes pueden ser Independientes? Dos sucesos A y B independientes pueden ser mutuamente excluyentes? Ejemplo. Suponga que dos máquinas 1 y 2 de una fábrica funcionan independientemente una de otra. Sea A el suceso que la máquina 1 se estropee durante un período de 8 horas y sea B el suceso que la máquina 2 se estropee en el mismo período, además, suponga que P(A) = 1/3 y P(B) = 1/4. Determinar la probabilidad de que al menos una de las máquinas se estropee durante ese período. Solucion: Se desea encontrar P(A U B), como A y B son independientes, P(A ∩ B ) = P(A) P(B) = (1/3) (1/4) = 1/12 ; Así , P(A U B) = 1/3 + 1/4 - 1/12 = 0.5 PROBABILIDAD CONDICIONAL. Supóngase que se realiza un experimento cuyo espacio muestral es S y también que se han especificado las probabilidades para todos los sucesos de S. Se desea determinar la probabilidad de un suceso A cuando se sabe que otro suceso B ha ocurrido. Si B ha ocurrido, entonces, se sabe que el resultado del experimento es uno de los elementos incluidos en B. Por tanto, para evaluar que A ocurra, se debe considerar el conjunto de los elementos incluidos en B que también implican la ocurrencia de A. La probabilidad condicional se denota así: P(A| B) y se lee: probabilidad que ocurra el evento A dado que ocurrió el evento B. O de forma abreviada: la probabilidad de A dado B. Definición
La probabilidad de A dado B esta dada por :
P (A ∩ B) P(A| B) = --------------, P(B) ≠ 0 P(B)
22
De igual manera se define:
P(B ∩ A) P( B A) = --------------, P(A) ≠ 0 P(A)
EJEMPLOS. 1) Supóngase que se han lanzado dos dados y se ha observado que la Suma T de los números ha sido impar. Determinar la probabilidad de que T haya sido menor que ocho. Solucion: El espacio muestral S consta de 36 posibilidades, por la regla multiplicativa, 6 posibilidades del primero y 6 del segundo. Sea A = { T < 8 } y B = { T es impar }, se desea calcular P(A B ). Obsérvese que A ∩ B = { 3, 5, 7}, por lo que P( A ∩ B) = 2 /36 + 4 /36 + 6 /36 = 1/3 Así, P(A B ) = 1/3 / 1/2 = 2/3 2) Se lanzan dos dados repetidamente y en cada lanzamiento se observa la suma T de los dos números, determinar la probabilidad p de que el valor T = 7 sea observado antes de que se obtenga el valor T = 8. Solucion: Repetir el experimento hasta que se obtenga T = 7 ó T = 8 implica que los resultados del experimento quedan reducido a estos valores. Sea A = {T=7} y B = {T=7 ó T = 8}, de esta forma A ∩ B = A, y P(A B) = P(A) / P(B) = (6/36) / (6/36 + 5/36) = 6/11 Notas: Si dos sucesos A y B son: a) mutuamente excluyentes, entonces: P(A B) = 0 b) independientes, entonces: P(AB) = P(A) Ley Multiplicativa de Probabilidades Condicionales: Sean A y B dos sucesos que no son independientes, entonces de la definición de probabilidad condicional se deduce que: P(A∩ B) = P(B) P(A B) ó P (A ∩ B) = P(A) P(B A). La ley multiplicativa de probabilidades se puede generalizar para n sucesos de acuerdo al siguiente teorema. Teorema. Sean A1, A2, ... , A n sucesos que verifican que P(A1 ∩ A2 ∩... ∩ An - 1 ) > 0. Entonces: P(A1 A2 ... An ) = P(A1) P(A2 A1) ... P(A n A1 A2 ... An –1)
23
EJEMPLO. 1) Suponga que se van a extraer dos balones aleatoriomente y sin reemplazamiento de una urna que contiene r balones rojo y b azules. Determinar la probabilidad de que el primer balón sea rojo y el segundo sea azul SOLUCION: Sean los sucesos, A: "el primer balón extraído es rojo" y B: "el segundo balón extraído es azul". Se desea encontrar P( A ∩ B) Las probabilidades a utilizarse son las siguientes: P(A) = r/ (r + b) y P(B A) = b/(r + b - 1). Luego, P(A ∩ B) = P(A) P(B A) = (r/(r + b) ) ( b/(r + b - 1) = r b / (r + b) (r + b - 1) 2.8 PROBABILIDAD Y PARTICIONES. A
A2 B A5
A4
A3
Partición del espacio muestral con cinco eventos Mutuamente excluyentes
Sea S el espacio muestral de un experimento aleatorio y considérense los sucesos A 1, A2, ... , Ak , de S de forma que sean disjuntos y ∪ Ai = S. Entonces estos k sucesos constituyen una partición del espacio muestral S. Si los k sucesos A1, ... , A k constituyen una partición de S y B es cualquier otro suceso en S, los sucesos A1 ∩ B, A2 ∩ B, ... , A k ∩ B, constituyen una partición de B y por lo tanto B = (A1 B) ∪ ( A2 B) ∪ ... ∪ (Ak B) . Además, puesto que los k sucesos del lado derecho de la expresión anterior son disjuntos, entonces: k k P(B) = Σ P(A j B) = Σ P(A j ) P( B A j ) , con P(A j ) > 0. j = 1 j=1 A esta expresión se le conoce como probabilidad total. EJEMPLO. Dos cajas contienen cerraduras grandes y cerraduras pequeñas. Supongamos que una caja contiene 60 cerraduras grandes y 40 pequeñas y que la otra caja contiene 10 grandes y 20 pequeñas. Suponga que también se selecciona una caja al azar y que se extrae una cerradura aleatoriamente de la misma. Determinar la probabilidad de que esta cerradura sea grande.
24
Solucion: Sean: A1: "la caja seleccionada es la primera", A2: "la caja seleccionada es la segunda”, estos eventos son los de la partición, y B: "la cerradura seleccionada es grande Entonces, P(A1) = P(A2) = 1/2. Se debe determinar P(B). Se conoce además que: P(B A1) = 60/ 100 = 3/5 y P(B A2 ) = 10/ 30 = 1/3 De esta forma P(B) = (1/2) (3/5) + (1/2) (1/3) = 14/ 10 = 7/5 2.9 TEOREMA DE BAYES. Suponga que los sucesos A1, ... , A k constituyen una partición del espacio muestral S, tal que P(A j ) > 0, para j = 1, ... , k y sea B cualquier suceso, tal que, P(B) > 0. Entonces, para: i = 1,.. , k, se cumple que: P A B j
=
P ( A) P B j A n
∑ P( A) P B A i
i =1
La deducción del teorema se hace usando la definición de probabilidad condicional y que los A j forman una partición del espacio muestral. El teorema de Bayes proporciona una regla sencilla para calcular la probabilidad condicional de cada suceso A i dado B a partir de las probabilidades condicionales de B dado cada uno de los sucesos A i y la probabilidad incondicional de cada A i. EJEMPLO. Para la fabricación de un gran lote de artículos similares se utilizaron tres máquinas M 1, M2 y M3 . Suponga que el 20% de los artículos fueron fabricados por la máquina M 1, el 30% por la máquina M 2 y el 50% por la máquina M 3. Suponga además que el 1% de los artículos fabricados por la máquina M 1 son defectuosos, el 2% de los fabricados por la máquina M 2 son defectuosos y el 3% de los artículos fabricados por la máquina M 3 son defectuosos. Por último, supóngase que se selecciona al azar uno de los artículos del lote y que resulta ser defectuoso. Determinar la probabilidad de que este artículo haya sido fabricado por la máquina M 2. Solucion: Sean: B: "el artículo seleccionado fue defectuoso” A1 : El artículo seleccionado fue fabricado por la máquina 1 A2 : El artículo seleccionado fue fabricado por la máquina 2 A3 : El artículo seleccionado fue fabricado por la máquina 3 Se desea encontrar P (A 2 B). Se conoce que: P(A1) = 0.2, P(A 2) = 0.3, P(A 3) = 0.5 y además: P(B A1) = 0.01, P(B A2) = 0.02 y P(B A3) = 0.03 De esta forma, usando el teorema de Bayes tenemos: P(A2 B) = [ (0.3) (0.02)] / [ (0.2) (0.01) + (0.3) (0.02) + (0.5) (0.03)] = 0.26
25
Nota: La probabilidad P(Ai) se denomina usualmente probabilidad inicial del suceso Ai antes de haber ocurrido el suceso B y P(AiB) se denomina probabilidad final después de que ocurrió el suceso B. Así, en el ejemplo anterior, P(A2 ) es la probabilidad inicial de que el artículo seleccionado haya sido producido por la máquina 2 antes de que se conozca si el artículo es o no defectuoso, P(A2 B) es la probabilidad final de que el artículo seleccionado haya sido producido por la máquina 2, al saber que dicho artículo fue defectuoso. Si un experimento se lleva a cabo secuencial mente, entonces, la probabilidad final de cualquier suceso puede también ser calculada secuencial mente. Después de haber realizado cada paso, la probabilidad final del suceso encontrado en ese paso, sirve como probabilidad inicial para el paso siguiente. PROBLEMAS RESUELTOS. 1. Se tienen dos cajas con piezas, la primera contiene 4 piezas estándar y 5 no estándar, la segunda contiene 3 estándar y 7 no estándar. Se saca una pieza en la oscuridad de la primera caja y se introduce en la segunda caja. Cual es la probabilidad de sacar una pieza no estándar de la segunda caja? SOLUCION: Caja I
Caja II 3 st 7 no st
4 st 5 no st
Sean los eventos: A: “la pieza trasladada de la primera caja es estándar”
B: “la pieza trasladada de la primera caja es no estándar” C: “la pieza extraída de la segunda caja es no estándar” Debe notarse que C = (AC) U (BC) ya que las dos cajas constituyen una partición (eventos A y B) , por lo tanto: P(C) = P(AC) + P(BC) =P(A) P(C A)+P(B) P(CB) = (4/9) (7 /11) + (5 / 9 ) (8 /11) = 68 / 99 = 0.6868 2. Entre cinco aspirantes a puestos de Ingenieros en una empresa a dos se les considera excelentes, y a los demás se les considera buenos. Un gerente escoge al azar dos de los cinco para la entrevista. Calcular la probabilidad de que el gerente escoja: a) a los dos excelentes, b) por lo menos a uno de los excelentes, c) a los dos excelentes, dado que ya se sabe que uno de los seleccionados es excelente.
26
Solución: a) El numero de maneras de escoger a los dos aspirantes es 5 C 2 = 10 Sea A: “el gerente escoge dos excelentes”, P(A) = 2 C 2 / 10 = 1 /10 b) Sea B: “el gerente escoge al menos uno de los excelentes”, esto significa que el gerente escoge a un excelente o a los dos. Por lo tanto: P(B) =
( 2 C 2 + ( 2 C 1 ) ( 3 C 1) 10
= 7/ 10
a) Debe notarse que A ⊂ B, por lo que A ∩ B = A, así: P(AB ) = P(A) / P(B) = 1/ 7 3. Tres tiradores disparan hacia el mismo blanco. La probabilidad de que cada uno de ellos de en el blanco es 1/6, 1/4 y 1/3 respectivamente. Si cada uno dispara una vez, cual es la probabilidad de que: a) exactamente uno de en el blanco, b) al menos un tirador de en el blanco, c) si un tirador dio en el blanco, cual es la probabilidad de que este sea el primero. Solucion: Sea A: el primer tirador da en el blanco B: el segundo tirador da en el blanco C: el tercer tirador da en el blanco a) El suceso D: “exactamente uno da en el blanco” es equivalente a: ABc Cc U Ac B Cc U Ac Bc C, de esta manera: P(D) = (1/6) (3/4) (2/3) + (5/6)(1/4)(2/3) + (5/6)(3/4)(1/3) = 0.44 b) El suceso E: “ al menos un tirador da en el blanco” equivale al suceso: A U B U C, entonces: P(E) = P(A U B U C) = = 1 – P(Ac Bc CC ) = 1 – (5/6)(3/4)(2/3) = 0.5833 = 31 / 72 c) Se desea calcular la probabilidad P(A E). P A E
=
P ( A ∩ E ) P ( E )
=
P ( A) P ( E )
= / 1 / 6)(3 / 4 )(2 / 3) = 0 .1935 (31 / 72 )
4. Una urna contiene 4 bolas numeradas 1, 2, 3, 4 respectivamente. Se seleccionan dos bolas al azar y sean los eventos 27
A: la suma de los números de las bolas es 5 = { (1,4), (2,3), (3.2), (4,1)} y Bi: la primera bola seleccionada tiene el número i. Calcular: a) P(A Bi) b) P(Bi A) Solucion: a) Si el primer número es i, sólo hay tres posibilidades para el otro, solo en una de estas Posibilidades la suma es 5, por tanto, P(A Bi ) = 1 / 3 P B j A
=
P ( B j ∩ A) P( A)
=
P( B j ) P A P ( A)
B = (1 / 4 )(1 / 3) = 1 j
( 4 / 12 )
4
5. Una caja contiene 24 bombillos de las cuales 4 son defectuosas. Si una persona selecciona al azar 10 bombillas de la caja y una segunda persona selecciona las restantes, cual es la probabilidad de que la misma persona selecciones las 4 bombillas defectuosas. Solución: El número de maneras de seleccionar las bombillas es: 24C10 Sea A: la primer persona toma las 4 bombillas defectuosas B: la segunda persona toma las 4 bombillas defectuosas Se desea encontrar P(AUB). El número de maneras que ocurra el suceso A es: (20 C6) (4 C 4 ) = 20C6 y El número de maneras de que ocurra el suceso B es: (20C10 ) (4C4) = 20C10 20 C6 + 20C10 P(A U B ) = = 223516/1961256 24C10 6. Una planta armadora recibe microcircuitos provenientes de tres distintos fabricantes. El 50% del total se compra al primer fabricante, mientras que los restantes se dividen en partes iguales. El porcentaje de los circuitos defectuosos para el primero, segundo y tercer fabricante es 5%, 10% y 12% respectivamente. Si los circuitos se almacenan en las plantas sin importar quien fue el proveedor, determinar: a) la probabilidad de que una unidad armada en la planta contenga un circuito defectuoso, b) si un circuito no esta defectuoso, cual es la probabilidad de que haya sido vendido por el segundo proveedor. Solucion: Sean: A: “la planta contiene un circuito defectuoso” Bi: “el circuito proviene de la fabrica i” a) Se desea encontrar la probabilidad del evento A, se conoce que: P(B1) = 0.5 y que: P(B 2) = P(B3) = 0.25, además: P(A B1 ) = 0.05, P(A B2 ) = 0.10 y P(A B3 ) = 0.12.
28
Entonces: P(A) = Σ P(Bi) P(A Bi) = (0.5)(0.05) + (0.25)(0.10) + (0.25) (0.12) = 0.08 b) Se desea encontrar ahora P(B2 Ac) , se conoce que P(A c) = 0.92, entonces: c
P(B2 A ) =
P(B2) P( Ac B2 ) c
c
Σ P(A ) P(A B)
=
(0.25) (0.90) 0.92
=
0.2445
.
VARIABLES ALEATORIAS INTRODUCCION En la mayoría de experimentos se producen resultados cuya interpretación se puede realizar en función de números reales, como por ejemplo: el número de candidatos para determinada elección, el número de enfermedades en cierta ciudad en un periodo determinado, la estatura de un grupo de estudiantes, etc. Dichos resultados que podrían variar de un experimento a otro, reciben el nombre de variables aleatorias. En este capitulo estudiaremos el concepto de variable aleatoria, tipos de variables, valor esperado y varianza de una sola variable y la distribución de probabilidad conjunta de dos variables aleatorias. Las variables aleatorias las denotaremos con letras mayúsculas. VARIABLE ALEATORIA DEFINICIÓN Una Variable Aleatoria es una función que asocia a cada elemento del espacio muestral un numero real, su dominio es el espacio muestral.
Si X es la variable, entonces: X: S R La Variable Aleatoria X es Discreta: si el número de elementos es finito o infinito contable. Esta variable esta asociada a valores enteros. EJEMPLO 1 Consideremos el experimento de lanzar una moneda tres veces, cuyo espacio muestral es: S = {ccc, ccs, csc, scc, sss, ssc, scs, css} Si definimos la variable aleatoria X: como el # de caras que se obtienen en los tres lanzamientos, entonces los valores que se asociarían a cada uno de los elementos del espacio muestral serian: 3, 2, 2, 2, 0, 1, 1, 1, respectivamente. Estos serian los posibles valores que puede tomar X. Dicha variable es discreta. Los valores de X = {0, 1, 2, 3} (a este conjunto de valores se les llama rango de la variable). 29
La Variable Aleatoria X es Continua, si puede tomar un numero infinito de valores posibles, asociados con uno o más intervalos de los # reales. Nota: generalmente los problemas relacionados con variable aleatoria continuas vienen asociados con su función de densidad, tema que trataremos a continuación. 3.3 FUNCIÓN DE PROBABILIDAD O DE DENSIDAD Las variables aleatorias toman cada uno sus diferentes valores con cierta probabilidad. En el ejemplo anterior: P(X = 0) = f(0) = 1/8. P(X = 1) = f(1) = 3/8. P(X = 2) = f(2) = 3/8. P(X = 3) = f(3) = 1/8. Al conjunto de estas probabilidades se les llama: Función de probabilidad (para el caso discreto) Función de densidad (para el caso continuo). Nota: Para el caso discreto la función de probabilidad se puede expresar en la siguiente tabla (tomaremos el ejemplo anterior): X
0
1
2
3
F(x)
1/8
3/8
3/8
1/8
Estas funciones deben satisfacer algunas condiciones, que mostraremos en la siguiente definición.
DEFINICIÓN La función f(x) es una función de probabilidad (para X discreta) o una función de densidad (para X continua), si:
i) f (x) ≥ 0, para toda x ii) a)
n
∑= f ( x) = 1 ; (X discreta)
i 1
b)
+∞ f ( x ) dx = 1; (X continua) −∞
∫
iii) a) P(X = x) = f(x); (X discreta) b) ) P(a
b f (x ) dx ; (X continua.) a
∫ 30
Nota: Es importante señalar que: la probabilidad de que una variable continua tome un valor puntual dentro de cierto intervalo es igual a cero; o sea: P( X = k) = O, k = constante. EJEMPLO Se extraen aleatoriamente y en forma sucesiva dos pelotas de una urna que contiene 4 de color rojo y 3 de color blanco (todas de igual forma y tamaño). Sea X el número de pelotas rojas, encontrar la distribución de probabilidad asociada a la variable. Solución (la variable es discreta) El espacio muestral es: S = {RR, RB, BR, BB} Los valores que puede tomar X son: 0, 1, 2 (rango de la variable) Las probabilidades con que X puede tomar sus diferentes valores son: f(2) = P(RR) = P( x = 2 ) = (4/7)(3/6) =2/7 f(1) = P(RB o BR) = P( x = 1) = (4/7)(3/6)2 = 4/7 f(0) = P(BB) = P( x = 0 ) = (3/7)(2/6) = 1/7 Las cuales se pueden expresar así: X f(x)
0 1 2 2/7 4/7 1/7
EJEMPLO La función de densidad de una V.A. X está dada por: cos x
si 0 < x < π /2
b x
f (x) =
si 2 < x < 3
10
0
si
no
Encontrar el valor de b. Solución: Para encontrar el valor de b, usamos la condición 2), b) (para el caso continuo) de la definición anterior:
+∞ f ( x ) dx = 1; −∞
∫
∫
π2
cos x b
0
sen x b
]
dx
π2 0
+
+
3 x
∫
2 10
x2 20
dx
=1
] 32 = 1
31
1
9
+
b
20
4
−
20
=1,
b = 4/3 DISTRIBUCIÓN ACUMULADA Definición Sea X una variable aleatoria discreta o continúa, la distribución o función acumulada asociada a esta, la denotaremos con F y se define como:
∑ f ( x )
F (x) = P(X ≤ x) =
x i ≤
i
; (X discreta)
X
x
F(x) = P(X ≤ x) = ∫ −∞ f ( x ) dx ; (X continua) Nota: La distribución acumulada para el caso discreto y continuo es una función definida para todos los reales. PROPIEDADES DE LA DISTRIBUCION ACUMULADA i) ii) iii) iv) v)
P(X = n) = F( n ) - F( n - 1) ; n ∈ N P (x ≤ a ) = F (a) P ( a < X ≤ b) = F (b) - F (a) P (X > b ) = 1 - P (x ≤ b ) = 1 - F (b) (complemento) P (X ≥ b ) = 1 - P (x < b ) (otra presentación del complemento)
EJEMPLO Del problema del ejemplo 2, encontrar la distribución o función acumulada asociada a la variable. Solución: F (x) = P(X ≤ x) =
∑ xi
≤x
f (xi)
; (X discreta)
Se parte de la función de probabilidad: X
0
f(x)
1/7
1
2
4/7 2/7
F(x) =
0, si x < 0 1/7, si 0 ≤ x < 1 5/7, si 1 ≤ x < 2 1, si x ≥ 2
EJEMPLO Dada la función de densidad de la variable aleatoria X: 32
X2 , si 0< x < 1 1, si 1< x< 5/3 0, en otro valor
f(x) =
Hallar: a) F(x) b) P( 1/2 < x < 2 ) Solución: a) Usamos: F(x) = P(X ≤ x) =
∫ x
f ( x ) dx
−∞
; (X continua)
x
F(x) =
∫ 0 dx = 0 , si x < 0
−α
3
0
x
α
∫ x dx = x3 , 0
0
1
∫
F ( x ) = 0 dx +
∫
F ( x ) = 0 dx + α
si 0 < x <1
2
∫ x
x
2
∫
dx + dx
0
= 1 + x −1 = x − 2 ,
1
0
∫
F( X ) = F ( x ) = 0 dx + α
1
3
3
5 / 3
si 1 < x < 5 / 3
x
∫ x dx + ∫ dx + ∫ odx = 1 2
0
1, si x > 5/3.
5 / 3
1
La distribución acumulada podemos expresarla así: 0, x / 3, x – (2/3), 1, 3
F( X ) =
si si si si
x<0 0 5/3
b) Esta probabilidad se puede calcular con la función de densidad (f) o con la acumulada (F), usando lo siguiente: Con la función de densidad: P(a
b f ( x) dx ; (X continua.) a
∫
1
P(0.5 < x < 1.2) =
1 .2
x dx + ∫ dx = 0 .492 ∫ /
1 2
2
1
O con la función acumulada, haciendo uso de sus propiedades:
33
P(a
Definición. El valor esperado de V.A. X esta dado por:
E(x) = µ =
n
∑= x.f ( x) ;
si x es discreta
i 1
+∞ E(x) = µ = − ∞ x.f ( x ) dx ; si x es continua
∫
Propiedades de E(x) 1) E (k) = k ; si k es constante 2) E (ax + b) = a E (x) + b ; si a y b es constante 3) E [g(x)] = Σ g(x). f(x) ; si x discreta 4) E[(g(x)] =
∞ g( x )f ( x ) dx −∞
∫
; si x continua
VARIANZA DE UNA VARIABLE ALEATORIA
Definición. La varianza de x se define como:
V (x) = σ 2(x) = E [(x - µ)2] Nota: Si se desarrolla el binomio y se aplican propiedades de la esperanza, se obtiene una expresión equivalente, que suele ser mas sencilla para el calculo de la varianza: V(x) = E [ x2 - 2x µ + µ 2 ] (Desarrollando el Binomio) = E (x2) - 2E (x) µ + µ 2 (propiedades de E (x)) = E (x2) - 2 µ 2 + µ 2 (E (x) = µ ) V (x) = E (x2) - 2 µ 2 ; para x Discreta o Continua Propiedades de V(x) 1) V(k) = 0 ; si k es constante. 2) V(ax) = a2 V(x) 3) V (ax + b) = a2 V(x) 4) V (g(x) ) = E {[g(x) - µ g(x) ]2} = Σ [g(x) - µ g(x)]2 f (x) (Discreta) ∞ 5) V (g(x) ) = E {[g(x) - µ g(x) ]2} = ( g ( x ) − µ g ( x ) ) 2 f ( x ) dx (Continua) −∞
∫
Distribución de Probabilidad Conjunta para dos variables aleatorias 34
Si X y Y son dos variables aleatorias discretas, la distribución de probabilidad para sus ocurrencias simultáneas se representa mediante la función f(x, y), para cualquier par de Valores (x, y) dentro del rango de las variables aleatorias X y Y y se le llama Distribución de Probabilidad Conjunta de X y Y. Definición. La función f(x, y) es una Distribución de Probabilidad Conjunta o función de masa de probabilidad de las variables aleatorias X y Y, si:
f(x, y) ≥0 ∑ ∑ f(x, y) =1 3) P(X = x, Y = y) = f(x, y) 1) 2)
EJEMPLO Supóngase que se extraen dos bolígrafos, uno tras otro de una caja que contiene tres buenos y uno defectuoso, las extracciones son sin reemplazo. Sea X el # de bolígrafos defectuosos en la primera extracción y Y el # de bolígrafos defectuosos en la segunda extracción. Solución: Note que X y Y solo pueden tomar los valores 0 y 1 y los posibles pares de valores (x, y) son: (0 ,0), (0 ,1), (1 ,0), (1,1). Podemos calcular: P(X = 0, Y = 0) = f (0, 0) = (3/4) (2/3) =0.5 P(X = 0, Y = 1) = f (0, 1) = (3/4) (1/3) =0.25 P(X = 1, Y = 0) = f (1, 0) = (1/4) (1) =0.25 P(X = 1, Y = 1) = f (1,1) = 0 (imposible) Estos resultados se pueden mostrar en la siguiente tabla: Y 0 1
X
0
1
0.5 0.25
0.25 0
Total colum 0.75 0.25
Total fila 0.75 0.25 1
DEFINICIÓN La función f(x,y) es una función de densidad conjunta de las variables aleatorias continuas X y Y, si:
i ) f ( x , y )
ii)
≥0 ;
∞ ∞ f ( x, y) dx dy = 1 −∞ − ∞
∫ ∫
iii ) P[( x , y) ∈ A ] EJEMPLO
para toda (x, y)
=
∫∫ f (x, y)dxdy ; para cualquier región A del plano xy
A
35
Una vinatería opera en instalaciones para atención a quien llega en automóvil y a quien llega caminando. En un día seleccionado al azar, sean X y Y, respectivamente, las proporciones del tiempo que se utiliza en cada instalación y suponga que la función de densidad conjunta de estas variables aleatorias es: f(x, y) =
2/3 (x + 2y), 0 ≤ x ≤ 1, 0 ≤ y ≤ 1 0 , en otra parte
a) verificar la condición ii) de la definición b) encuentre P[(x, y) ε A], donde A = {(x, y)| 0
∫ ∫
=
2
1´ x 2 2 + = + ( x y ) dx dy ( xy ) | 0 dy ∫0 ∫0 3 3 ∫0 2 1 12
2 1
2 1 1
2
3 0 2
3
∫
( + 2 y ) dx =
= 2/3 (3/2) =1
1
´
( y + y 2 ) |10 = 2
b) P [(x, y) ∈ A] = P (0 < x < 1/2, 1/5 < y < 1/2) 1 / 2 1 / 2
= 2 ∫1 / 5 ∫ 0 (x + 2y ) dx dy 3
= =
∫ x
2
2 0 .5 ( 3 0 .2 2 2 0 .5 1
+ 2xy )|10 / 2 dy
( + y ) | / ∫ 3 . 8
1 2 0
02
= 2/3 (
y 8
+
y
dy
2
2
1 / 2
)| 1 / 5
= 2 / 3 [1/16 + 1/8 – 1/40 – 1/50] = 0.095 DISTRIBUCIONES MARGINALES DEFINICIÓN Las Distribuciones Marginales de X sola y Y sola están dadas por :
g(x) =
∑ f (x, y)
y
h(y) =
∑ f (x, y) (Discreta) x
y
36
2 1 3
( + 1) 2
g(x) =
∞ f ( x, y) dy ; h ( y) −∞
∫
=
∞ f ( x, y) dx (Continua) −∞
∫
Nota: para el caso discreto, los totales por columna (en la tabla de probabilidades conjuntas) son las distribuciones o probabilidades marginales para X y los totales por fila las de Y. EJEMPLO Para el ejemplo # 6 (de los bolígrafos) las distribuciones marginales son: Para X: (la cual representa la función de probabilidad de la variable X) X g(x)
0 1 0.75 0.25
Para Y: (también representa la función de probabilidad de la variable Y) y h(Y)
0 1 0.75 0.25
EJEMPLO 9 Para el ejemplo de la vinatería (caso continuo): las distribuciones marginales son: Para X:
∞ f (x, y )dy = −∞
∫
g( x ) =
2
=
3
1
∫ 2 / 3 (x + 2y ) dy = 2 / 3 (xy + y
2
0
) | 10
(x + 1); para 0 ≤ x ≤ 1.
La cual se podría expresar como la función de densidad de X, así: 2
g(x) =
3
( x + 1) ,
si 0≤ x ≤ 1
0 , para los demás valores.
Para Y :
h( y ) =
∞ f ( x, y )dx = −∞
∫
1
∫ 2 / 3 (x + 2y ) dx = 2 / 3 (x / 2 + 2xy ) | 2
0
1 0
= 2/3(0.5 + 2y), para 0 ≤ y ≤ 1 De igual forma se puede expresar como la función de densidad de la variable aleatoria Y: h(y) =
2/3(1/2 + 2y), si 0≤ y ≤ 1 0
, para los demás valores. 37
3.9 DISTRIBUCIONES CONDICIONALES DEFINICIÓN Sean X y Y dos variables aleatorias (discretas o continuas), La Di str ibución condicional
de la vari able aleatoria Y , dado que X = x es : f ( x , y) f(y | x) = ; g(x) > 0 g( x ) La Di str ibución condicional de la variable aleatori a X, dado que Y = y es : f ( x , y) f(x | y ) = ; h(y) > 0 h ( y)
Ejemplo 10 En el ejemplo de los bolígrafos, hallar la distribución condicional de Y, dado X = 1. Solución: Hallamos g(1) = 0.25 (2 da columna de al tabla)
⇒ f(y|1) =
f (1, y)
=
f (1, y)
g (1) 0 . 25 f (0 | 1) = 4 f (1, 0) = 4 (0.25) = 1
=
4 f (1, y)
f (1 | 1) = 4f (1, 1) = 4 (0) = 0 y
0
1
f ( y | 1)
1
0
Nota: P (Y = 1 | x = 1) = 0 (Se interpreta así: si se sabe que en la 1 era extracción el bolígrafo es defectuoso, la probabilidad que lo sea en la 2 da extracción es cero o imposible). INDEPENDENCIA ESTADÍSTICA DEFINICIÓN Sean X y Y dos V.A, discretas o continuas, con distribución de probabilidad conjunta f(x,y) y distribuciones marginales g(x) y h(y), respectivamente. Se dice que las V.A X y Y son “Es tadísticamente I ndependientes ” si y solo si: f(x,y) = g(x) h(y); para toda (x,y) dentro de sus rangos.
EJEMPLO Se puede demostrar que las V.A del ejemplo de los bolígrafos no son independientes, ya que: f(0, 0) = 0.5 y g(0) = 0.75, h(0) = 0.75 ⇒ f(0, 0) ≠ g(0) . h(0) 38
EJEMPLO La fracción x de atletas varones y la fracción y de atletas mujeres que compiten en una jornada deportiva se describen mediante la función de densidad conjunta:
8xy; 0 ≤ y ≤ x ≤1 0 ; otrocaso
f (x,y) =
, encuentre: σxy
Solución: Calculamos las marginales:
g( x ) h(y)
∞ x x f ( x, y)dy = 8xy dy = 4 x y 2 | 0 −∞ 0 ∞ 1 1 = f ( x , y) dx = 8xy dx = 4 x 2 y | y −∞ y
=
∫ ∫
∫ ∫
=
4 x 3 ; 0 ≤ x ≤1
=
4y
− 4 y3
; 0 ≤ y ≤1
Luego:
∞ ∞ xy f ( x , y) dx dy = − ∞ −∞
∫ ∫ = ∫ ∫ 8x
E (xy) =
1 x
2
0 0
1
∫
= 8x
2
y3
x
| 3 0
0
dx
18
∫ 3
=
0
∫
⇒ σxy =
4 9
0 y
x 5 dx = 1
∫ 0
8 18
4 x 4 dx =
1
x 6 |0 =
4
4
5
8 15
=
1
4 9
5
= ∫ 0 (4 y 2 − 4 y 4 ) =
.
ó
4
∞ y h ( y) dy −∞
∫
−
∫∫
8x 2 y 2 dx dy
y 2 dy dx
∞ xg(x) dx = µx = E (x) = −∞ µy = E (Y) =
1 1
4 3
y3 −
4 5
1
y 5 | 0 = 8/15
225
EJERCICIOS RESUELTOS 1) Se sabe que un grupo de 4 componentes contiene dos defectuosos, un inspector prueba los componente uno a uno. Hasta encontrar los 2 defectuosos, una vez encontrado el 2do defectuoso concluye las pruebas, si X es el número de pruebas necesarias hasta encontrar el segundo defectuoso: a) Encuentre la distribución de probabilidad b) Encuentre la función acumulada
39
c) Si el costo de prueba de un componente es de dos y el costo de reparación de un defectuoso es cuatro. Encuentre el costo total esperado Solución Sea x: número de pruebas necesarias hasta hallar el 2 do defectuoso S = { DD, BDD, DBD, BBDD, DBBD, BDBD} a) p (x = 2) = p (DD) =
2 1 . 4 3
=
p (x = 3) = 2p (BDD) = 2 ( p (x = 4) = 3p (BBDD) = 3 ( b)
2
1
X
6 .
2
3
4
f(x) 1/6 1/3 1/2 2
.
1
)=
1
4 3 2 3 2 1 2 1 . . .1 ) = 4 3 2 2
0; si x < 2 1/6; si 2 ≤ x < 3 1/2; si 3 ≤ x < 4 1 ; si x ≥ 4
F(x) =
c) C = 2x + 8
E (C) = 2E (x) + 8 = 2 [ 2 (1/6) + 3 (1/3) + 4 (1/2) ] + 8 = 44/3 = 14.67 2) Al examinar pozos de agua en un distrito con respecto a dos impurezas encontradas frecuentemente en el agua potable, se encontró que el 20% de los pozos no revelaban impurezas alguna, el 40% tenia impureza A, y el 50% impureza B (naturalmente, algunos tenían ambas impurezas). Si se escoge un pozo del distrito al azar, y si X es el número de impurezas encontradas en el pozo. Encuentre: a) F (x) b) P (1 ≤ x ≤ 2) c) E (x), d) V (x) Solución: Si el 20% no tiene impureza, entonces el 80% tiene impureza p(A∪B) = p (A) + p (B) - p (A∩B) 80 = 40 + 50 - p (A ∩B) p (A∩B) = 10% (ambas impurezas) S
B
0.3
A
0.1 0.2
x 0 1 2 f(x) 0.2 0.7 0.1
40
0.4
a) F (x) =
0, 0.2, 0.9, 1,
si x si 0 si 1 si x
< 0 ≤ x1 ≤ x<2 ≥2
b) P (1 ≤ x ≤ 2) = F (2) - F (0) = 1 - 0.2 = 0.8 c) E (x) = 0.(0.2) + 1 (0.7) + 2 (0.1) = 0.9 E (x2) = 02 (0.2) + 1 2 (0.7) + 22 (0.1) = 1.1 d) V (x) = E (x2) - µ2 V (x) = 1.1 - (0.9)2 = 0.29 4. Considere un sistema de agua que fluye a través de unas válvulas de A a B como lo muestra la figura. Las válvulas 1, 2 y 3 funcionan independientemente y cada una se abre correctamente como una probabilidad de 0.8. Si y es el número de vías abiertas desde A a B encontrar: a) la distribución de probabilidad, b) el valor esperado, c) función acumulada, d) varianza. 3
A
B
2 1 Solución: Los valores que puede tomar la variable son: Y = { 0, 1, 2 } Sean: Vi la válvula i funciona correctamente. p (V i) = 0.8 , p (Vi') = 0.2, entonces: P (y = 0) = p (V ' ' V '2 V'3) + p (V'' V2 V'3) + p ( V'' V'2 V3) (0.2)3 + (0.2)(0.8)(0.2) + (0.2)(0.2)(0.8) = 0.072 p (y = 1) = p (V ' V'2 V'3) +p (V' V 2 V’ 3) + p (V1 V’ 2 V3) + p (V'' V2 V3) 0.8 (0.2)2 + (0.8)2 (0.2) + (0.8) 2 (0.2) + (0.2) (0.8) 2 = 0.416 p (y = 2) = p (V ' V2 V3) = (0.8)3 = 0.512 a) La distribución de probabilidad es: y 0 1 2 f(x) 0.072 0.416 0.512 b) Valor esperado E (y) = 0 (0.072) + 1 (0.416) + 2 (0.512) E (y) = 1.44 ~ 1 (en promedio se espera que estén abiertas, aproximadamente, una de las vías) c) 0 si y < 0 0.072 si 0 ≤ y < 1 F (y) = 0.488 si 1 ≤ y < 2 1 si y ≥ 2 41
d) V (y) = E (y 2) - µ2 E (y2) = 02 (0.072) + 1 2 (0.416) + 2 2 (0.512) = 2.464, entonces: V (y) = 2.464 - (1.44)2 = 0.3904 5) En un juego de azar se le paga a una persona C$5 si al tirar al aire 3 monedas obtiene puras caras o puros soles, mientras que esta persona deberá pagar C$ 3 córdobas si obtiene una o dos caras: a) ¿cuál es la ganancia esperada del jugador? b) Calcule el valor esperado de la función: g (x) = 2x 2 + 3x - 6 Solución: a) S {CCC, CCS, CSC, SCC, SSC, SCS, CSS, SSS} La función de probabilidad es: X f(x)
5
-3
2/8
6/8
gana (C$5) Pierde (C$ -3)
Ganancia esperada será: E (x) = 5 *
2 8
+ (-3) *
6 8
= -1
Pierde en promedio C$ 1 b) E [ g (x) ] = E [ 2x 2 + 3x - 6 ] = 2 E (x 2) + 3 E (x) - 6 Calculemos E (x 2) = 52 *
2 8
+ (-3)2 *
6 8
= 13
Sustituyendo E (x) y E(x 2) , E [g(x)] = 2( (13) + 3 (-1) - 6 = 17 11. Supongamos que cada estudiante de la carrera de ingenieria en sistemas fue clasificado de acuerdo a los cursos de matematica (matematica 1, matematica 2 y matematica 3) y de acuerdo con el numero de veces que visitaron la biblioteca (nunca, una vez o mas de una vez). Las proporciones se muestran en la sigiente tabla: Visita a Biblioteca Cursos de Matematica nunca Una vez Mas de una vez Matematica 1 0.07 0.13 0.18 Matematica 2 0.06 0.12 0.16 Matematica 3 0.08 0.10 0.10
g(y) 0.38 0.34 0.28
Sean: X: Cursos de matematica = {mat 1 = 1, mat 2 = 2, mat 3 = 3} Y: Visita a biblioteca = {nunca = 0, una vez = 1, mas de una vez = 2} a) Determinar cada una de las probabilidades siguientes: P(X = 2), P(Y ≥ 1), P(X ≤ 2, Y ≥ 1), P(X > Y). b) Las distribuciones marginales. 42
c) d) e) f)
Vericar si son o no independientes. Valor esperado de g(x,y) = x +y. Encontrar la distribucion de probabilidad condicional: f(y | x = 2). Si un estudiante seleccionado al azar esta en matematica 2, ¿cual es la probabilidad que haya visitado una vez la biblioteca? Solucion: a) P(X = 2) = f(2,0) + f(2,1) + f(2,2) = 0.06 + 0.12 + 0.16 = 0.34. P(Y ≥ 1) = f(1,1) +f(2.1) + f(3,1) + f(1,2) +f(2,2) + f(3,2) = 0.13 + 0.12 + 0.10 + 0.18 + 0.16 + 0.10 = 0.79. P(X ≤ 2, Y ≥ 1) = f(1,1) +f(2.1) + f(1,2) +f(2,2) = 0.13+0.12+ 0.18+0.16 = 0.59. P(X > Y) = f(1,0) + f(2,0) +f(2,1) + f(3,0) + f(3,1) + f(3,2) = 0.07 + 0.06 +0.12 + 0.18 + 016 + 0.10 = 0.69. b)
Visita a Biblioteca (Y) Cursos de Matematica(X) 0 1 2 g(y) 1 0.07 0.13 0.18 0.38 2 0.06 0.12 0.16 0.34 3 0.08 0.10 0.10 0.28 f(x) 0.21 0.35 0.44 1
Las sumas por filas son las marginales para los cursos de matematica. Las sumas por columnas son las marginales para las visitas a bibioteca. x 1 2 3 f(x) 0.38 0.34 0.28
y 0 1 2 h(y) 0.21 0.35 0.44
c) Para verificar la independencia usamos: Si f(x,y) = g(x) h(y), para cada par de Valores, entonces X e Y son independientes. Veamos: f(1,0) = 0.07 ≠ g(1) h(0) = 0.38 (0.21) = 0.0798. Se concluye que X e Y son dependientes estadisticamente. d) Valor esperado de g(x,y) = x + y.
µg(x,y) = E [g (x, y)] =
∑x ∑y (x + y )f (x, y )
= 1f(1,0) + 2f(1,1) + 3f(1,2) + 2f(2,0) + 3f(2.1) + 4f(2,2) + 3f(3,0) + 4f(3,1) + 5f(3,2) = 1(0.07) + 2(0.13) + 3(0.18) + 2(0.06) +3(0.12) + 4(0.16) + 3(0.08) + 4(0.10) + 5(0.10) = 3.13. e) Encontraremos la probabilidad condicional: f(y | x = 2). f(y|x = 2) =
f ( 2, y ) f ( 2, y ) = , Y puede tomar los valores: 0, 1, 2. g( 2) 0 .34 43
Entonces, la distribución condicional es: f(y = 0 | x = 2) = f(2,0)/0.34 = 0.06/0.34 = 0.17647. f(y = 1 | x = 2) = f(2,1)/0.34 = 0.12/0.34 = 0.35294 f(y = 2 | x = 2) = f(2,2)/0.34 = 0.16/0.34 = 0.47059 Se puede expresar en la tabla: Y 0 1 2 f(y | x = 2) 0.17647 0.35294 0.47059 a) Si un estudiante seleccionado al azar esta en matematica 2, ¿cual es la probabilidad que haya visitado una vez la biblioteca? f(y = 1 | x = 2) = f(2,1)/0.34 = 0.12/0.34 = 0.35294.
DISTRIBUCIONES DE PROBABILIDAD DISCRETAS Existen Estudiaremos modelos probabilísticas o distribuciones de probabilidad de variables aleatorias discretas. DISTRIBUCIÓN BINOMIAL Si la distribución binomial se aplica al muestreo, el muestreo debe realizarse con reemplazo. Esta distribución tiene las siguientes propiedades: 1. El experimento consiste en n intentos repetidos. 2. Los resultados de cada uno de los intentos puede clasificarse como éxito o como fracaso. La probabilidad de éxito se denota por: p y la del fracaso por: q. Además estas probabilidades son complementarias; o sea: p + q =1. 3. Las probabilidades de éxito representadas por p, permanecen constantes para todos los intentos. 4. Los intentos repetidos son independientes. 5. La v.a. X representa el # de éxitos en los n ensayos. Definición Una v.a. X tiene una distribución Binomial, si y solo si, su distribución de probabilidad está dada por:
f (x, n, p) =
x 1−x nx p (1 p) , para X = 0,1,2 ,... ,n.
−
44
Teorema. La media y la varianza de la distribución binomial están dadas por :
µ = n p, σ2 = n p (1-p) Ejemplo 1 Un examen consta de cuatro preguntas de selección múltiple con tres alternativas donde solo una es la correcta, si X es el número de respuestas correctas, cuando el estudiante esta adivinando. Encontrar la función de probabilidades asociada a la variable. Solución El estudiante en cada pregunta tiene dos posibilidades: responder correctamente o incorrectamente. Como tiene que responder cuatro de manera independiente P(responda correctamente) = 1/3 = p P(responda incorrectamente) = 2/3 = q Utilizando la distribución binomial: n = 4, los valores que puede tomar la variable son: x = {0, 1, 2, 3, 4} Las probabilidades con que la variable toma sus distintos valores serán: P (x = 0, n = 4, p =1/3) = 4C0 ( 1/3 )0 ( 2/3 )4 = 16/81 P (x = 1, n = 4, p =1/3) = 4C1 ( 1/3 )1 ( 2/3 )3 = 32/81 P (x = 2, n = 4, p =1/3) = 4C2 (1/3 ) 2 ( 2/3 )2 = 24/81 p (x = 3, n = 4, p =1/3) = 4C3 ( 1/3 )3 ( 2/3 )1 = 8/81 P (x = 4, n = 4, p = 1/3) = 4C4 ( 1/3 )4 ( 2/3 )0 = 1/81 La función de probabilidad se puede expresar en la siguiente tabla: X
0
f(x) 16/81
1 32/81
2 24/81
3
4
8/81
1/81
Ejemplo 2 Un distribuidor de semillas ha determinado a partir de numerosos ensayos que el 5% de un grupo grande de semillas no germina. Si dicho distribuidor vende las semillas en paquetes de 20 y garantiza que el 90% germina. ¿Cuál es la probabilidad de que: a) b) c) d) e)
Exactamente 15 semillas germinen? A lo sumo 4 semillas no germinen? Más de 7 pero menos de 17 semillas germinen? Un paquete no cumpla la garantía? Germinen entre 2 y 17 semillas inclusive?
Solución: P(una semilla germine) = 0.95 = p
45
P(una semilla no germine) = 0.05 = q a) Aquí Aquí se preg pregun unta ta:: ¿Cuál ¿Cuál es la probabilidad que 15 de 20 semillas Germinen? Es lo mismo decir: ¿Cuál es la probabilidad que 5 de 20 semillas no Germinen? Porque: Si 15 de 20 germinan, 5 no lo hacen. ( Por complemento) complemento) Entonces como la probabilidad p = 0.95, no esta en la tabla se usa equivalencia: equivalencia: P ( x = 15, n = 20, p = 0.95, ) ≡ P ( x = 5 , n = 20, p = 0.05 ) = F ( 5 ) - F ( 4 ) (haci (hacienda enda uso uso de propie propiedad) dad) = 0.99 0.9997 97 - 0.99 0.9974 74 = 0.0023. b) Para esta pregunta se toma q como la probabilidad de éxito, entonces: P ( x ≤ 4, n = 20, q = 0.05) = F ( 4 ) (hacienda uso uso de propiedad) = 0.9974 c) Aquí tendremos que hacer uso de equivalencia para poder dar respuesta a la pregunta. P ( 7 < x < 17, n = 20, p = 0.95 ) ≡ P ( 3 < x < 13, n = 20, q = 0.05) = F ( 12 ) - F ( 3 ) [hac [hacie iend ndaa uso uso de de propiedad: P ( a < X ≤ b) = F (b) (b) - F (a) (a)]] = 1 - 0.98 0.9841 41 = 0.01 0.0159 59.. Observemos la lógica: En el intervalo de: 7 < x < 17, se afirma afirma que 8 de 20 20 semillas semillas germinan, en el intervalo intervalo equivalente: equivalente: 3 < x < 13, deberá aparecer que: 12 de 20 semillas no lo hagan. Lo cual es correcto. También: En el intervalo: 7 < x < 17, se afirma que 16 16 de 20 semillas germinan, germinan, en el intervalo equivalente: equivalente: 3 < x < 13, deberá aparecer que: 4 de 20 semillas no lo hagan . Lo cual también es correcto. De igual forma ocurre con todos todo s los valores que toma la variable X en la probabilidad del éxito con la equivalencia equivalencia en el fracaso. fracaso. d) Garantía: Garantía: 90% 90% germina germina 20 ( 0.9 ) = 18 10% no germina 20 ( 0.1 ) = 2 No se cumpliría la garantía si: más de 2 semillas no germinan; es lo mismo decir: decir: que menos de 18 germinen. Por lo tanto, tanto, podemos resolver con la probabilidad probabilidad que no germine:
46
P ( x > 2, n = 20, 20, q = 0.05 0.05 ) = 1 - P ( x ≤ 2 ) = 1 - F (2) = 1 - 0.92 0.9245 45 = 0.07 0.0755 55 e) P ( 2 ≤ x ≤ 17, 20, 0.95 ) ≡ P ( 3 ≤ x ≤ 18, 20, 0.05 ) = F ( 18 18 ) - F ( 2 ) = 1 - 0.92 0.9245 45 = 0.07 0.0755 55 Ejemplo 3 Una empresa vende cuatro cuatro artículos seleccionados al azar entre un lote grande del cual se sabe que tiene el 10% 10% de piezas defectuosas. defectuosas. Sea X es el número número de piezas defectuosas, de entre los cuatro que se vendieron. El comprador del artículo regresa las piezas defectuosas para su reparación y el costo de reparación es: C = 3x 2+x +2, calcule el costo de reparación esperado. Solucion: Solucion: Binomial con: n=4 E [ C ] = E [ 3x 2 + x + 2 ] p = 0.1 = 3 E (x 2) + E (x) + 2 [v (x) = E (x 2) - µ2 ] q = 0.9 = 3 [v ( x ) + µ2 ] + µ + 2 [E (x2) = v (x) + µ2] µ=n p = 3 [ n p q + ( n . p )2 ] + n p + 2 σ2 = n p q = 3 [ 4 ( 0.1 ) ( 0.9 ) + (1 * 0.1) 2 ] + 4 * 0.1 + 2 = 3.96
promedio del costo de reparación
DISTRIBUCIÓN BINOMIAL NEGATIVA En lugar lugar de encontrar la probabilidad de x éxitos en n ensayos, ensayos, se está interesado en la probabilidad de que: el k-ésimo éxito ocurra en el x-ésimo ensayo. Este modelo presenta las siguientes características: 1. Se realizan realizan ensayos ensayos indepe independie ndientes ntes hasta hasta obtene obtenerr k éxitos éxitos 2. La v.a. X cuenta cuenta el número número de ensayos ensayos necesa necesarios rios para consegui conseguirr los k éxitos. éxitos. Definición. Definición. Una v. a. X tiene una distribución distribución binomial negativa, negativa, si y solo si su Distribución Distribución de probabilidad esta dada por: x −1 k − 1
P(x)=
pk q x - k x = k, k + 1, k + 2 ......
Teorema E (x) =
k p
;
V (x) =
kq p2
47
Ejemplo 1 Si la probabilidad es de 0.75 0.75 que una persona crea crea un rumor acerca de cierto político. político. Determine la probabilidad probabilidad de que: que: va a) La 8 persona en oír el rumor sea la la quinta en creerlo va b) La 15 persona en oír el rumor sea la décima en creerlo Solucion: Solucion: a) P = 0.75 q = 0.25 x=8 k=5 b)
x = 15 k = 10
8 −1 5 −1
( 0 .7 5 ) 5 ( 0 .25 ) 3
( 1510 −−11 ) ( 0 .7 5 ) 10
= 0.1298
( 0 .25 ) 5
= 0.1101
Ejemplo 2 Un gran lote de bombas usadas contiene un 20% de éllas que no sirven y necesitan reparación. Se manda a un mecánico mecánico con con tres juegos de reparación. Selecciona bombas al azar y las prueba una tras otra. Si trabaja una bomba, prosigue con con la siguiente. Si no no trabaja, le instala uno de sus juegos de reparación. Supóngase Supóngase que tarda 10 minutos en probar si una bomba trabaja o no, y 30 minutos en probar y reparar una bomba que no trabaja. Cual es el valor esperado y desviación estándar del tiempo total que llevará terminar con sus tres juegos de reparación. Solución: Solución: Sea X: el número de bombas que prueba hasta que se encuentra la tercera defectuosa P(defectuosa) = 0.2. El éxito del mecánico es hallar las bombas defectuosas. El desea que la X bomba que prueba sea la tercera tercera defectuosa. Binomial Binomial negativa, K = 3. El tiempo total que tarda con los tres juegos de reparaciones es: T = 10 ( x - 3 ) + 3 ( 30 30 ) T = 10x 10x - 30 + 90 T = 10x + 60 E [ T ] = E [ 10x + 60 ] = 10 E (x) + 60 (E(x) = k/p, binomial negativa) 3 + 60 = 150 = 10 150 + 60 = 210 min. min. (En promedio, promedio, el tiempo tiempo total que 0 . 2 le llevara terminar con sus tres juegos de reparación es de 210 minutos)
3 ( 0 . 8) V ( T ) = V ( 10x + 60 ) = 10 V (x) = 100 2 ( ) 0 . 2 2
48
= 100 (60) = 6000
Así: el tiempo total para instalar los juegos de reparación es en promedio de 210 minutos con una desviación estándar de 6000 = 77.46 minutos.
DISTRIBUCIÓN HIPERGEOMÉTRICA Esta distribución no requiere independencia y se basa en el muestreo llevado a cabo sin reemplazo. La distribución hipergeométrica posee las siguientes propiedades: 1. Una muestra de tamaño n se selecciona sin reemplazo de un total de N resultados. 2. k resultados del total N pueden clasificarse como éxitos y N-k como fracasos. 3. La v.a. cuenta el número de éxitos obtenidos de los k posibles resultados considerados éxitos. Definición. Una v. a. tiene distribución hipergeométrica si y solo si su distribución de probabilidad está dada por:
( k x ) ( nN−−xK ) P(x)= ( nN )
; x = 0, 1....... n
Teorema.
La media y la varianza de la distribución hipergeométrica son :
E (x) =
n k N
,
V (x) =
n . k ( N − K ) ( N − n ) N 2 ( N − 1)
Aproximación de Hipergeométrica a Binomial Cuando N es muy grande resulta complicado resolver las combinaciones, en este caso es conveniente resolver los problemas de hipergeométrica a través de aproximación a la binomial haciendo:
P =
K N
Ejemplo 1 Entre 120 aspirantes para ocupar un empleo solo 80 están calificados para hacerlo. Si se selecciona a cinco de estos aspirantes para una entrevista determine la probabilidad de que: a) Solamente dos estén calificados para el trabajo
49
b) Más de uno este calificado para el trabajo c) Cual es el valor esperado de aspirantes calificado para el trabajo Solución: − 80 ) ( 802 ) ( 120 5−2 P(x=2)= = 0.164 120 (5 )
N = 120
a)
K = 80 n=5
b) P ( x > 1 ) = 1 - P ( x ≤ 1 ) =1-[P(0)+ P(1)]
=1-
( 800 ) ( 540 ) +( 180 ) ( 404 ) 120 (5 )
= 1 - 0.0418 = 0.958 c) E ( x ) =
5 *80
= 3.33 ∼ 3
120
Se esperan aproximadamente en promedio a 3 aspirantes calificados par el trabajo, de los cinco seleccionados. Ejemplo 2 Un ingeniero de control de calidad inspecciona una muestra tomada al azar de dos calculadoras portátil de cada lote de 18 unidades que llega y acepta el lote si ambas están en buenas condiciones, en caso contrario, se inspecciona todo el lote y el lote se carga al distribuidor. ¿ Cuales son las probabilidades de que este lote sea aceptado sin mayor inspección si contiene: a) Cuatro calculadoras en mal estado b) Ocho calculadoras en mal estado c) Doce calculadoras en mal estado. Solución: a) k = 4 N = 18 n=2 x=0
4 0
P(x=0)=
c) k = 12
= 0.5947
( ) 18 2
b) k = 8 P(x=0)=
14 2
8 0
10 2
( ) 18 2
= 0.2941
50
P(x=0)=
12 0
( ) 18 2
6 2
= 0.098
Ejemplo 3 Una compañía recibe un lote de 1000 unidades, para aceptarlo selecciona 10 unidades de manera aleatoria y se inspeccionan. Si ninguna se encuentra defectuosa el lote se acepta de otro modo se rechaza. Si el lote contiene un 5% de unidades defectuosas determine la probabilidad de rechazar el lote. Solución: N = 1000, x ≥ 1, k = 50, n = 10 P ( x ≥ 1 ) = 1 - P ( x < 1 ) = 1 - P ( 0 ) = 1 = 0.4027 (Probabilidad de Rechazar el lote)
( 500 ) ( 10950 1000 ( 10 )
) =
1 - 0.5973
Podemos resolver el ejercicio por aproximación a Binomial P=
50 1000
= 0.05
P ( x ≥ 1, n = 10, p = 0.05 ) = 1 - P ( x < 1 ) =1-F(0) = 1 - 0.5987 = 0.4013
DISTRIBUCIÓN DE POISSON Un experimento de Poisson tiene las siguientes características: 1. El número de resultados que ocurren en un intervalo de tiempo o región específicos es independiente del número que ocurre en cualquier otro intervalo disjunto de tiempo o región del espacio disjunto. 2. La probabilidad de que un resultado sencillo ocurra en un intervalo de tiempo muy corto o en una región pequeña es proporcional a la longitud del intervalo de tiempo o al tamaño de la región y no depende del #de resultados que ocurren fuera de este intervalo o región. 3. La v.a. representa el número eventos independientes que ocurren a una rapidez constante sobre el tiempo o el espacio. Definición. Una v.a. tiene una distribución de poisson, si y solo si la distribución de probabilidad está dada por:
P(x)=
e − λt
( λt ) x
; x = 0, 1, 2, ...... :
x! Donde λ: es el número promedio de resultados por unidad de tiempo o región. 51
Teorema. La media y la varianza de la distribución de Poisson están dadas por :
E ( x ) = λt,
v ( x ) = λt.
APROXIMACIÓN DE BINOMIAL A POISSON Cuando n 0. Entonces se puede aproximar de la distribución ∞ y P binomial a la de poisson, haciendo: λ = µ = n. p e−λ x e − ( n . p) ( n . p) x λ = binomial µ = n . p P(x)= x! x! poisson µ = λ Nota: Los problemas de poisson se pueden resolver haciendo uso de tabla, de igual forma que los de Binomial, se utilizan las propiedades de la distribución acumulada.
Ejemplo 1. Una pizarra telefónica recibe 360 llamadas en una hora, pero no puede recibir más de 7 llamadas en un minuto. Calcular la probabilidad de que: a) b) c) d) e)
Se produzcan 10 llamadas en 2 minutos La pizarra quede saturada en 1 minuto Se produzcan más de 2, pero de menos de 10 llamadas en un minuto Se produzcan más de 15 llamadas en 3 minutos La pizarra quede sobresaturada en 3 minutos.
Solución
λh = 360 (llamadas en una hora) λm = 6 (llamadas en un minuto, usando característica 2, proporcionalidad) ) e−6*2 (12 10 P ( x = 10, λ = 6, t = 2 ) = = 0.1048. 10! Resolveremos la pregunta haciendo uso de la tabla, en este caso λt = 12. P ( x = 10, λ = 6, t = 2 ) = F ( 10 ) - F ( 9 ) = 0.3472 - 0.2424 = 0.1048 b) La pizarra queda saturada, si recibe 7 llamadas en un minuto, entonces:
52
e −6*1 ( 6) 7 P (x = 7, λ = 6, t = 1) = = 0.1377. (Saturada en un minuto) 7! Con la tabla: λ t = 6 P (x = 7, λ = 6, t = 1) = F ( 7 ) - F ( 6 ) = 0.7440 - 0.6063 = 0.1377. (Saturada en un minuto) −6 ( x) 9 6 (Para satisfacción, es importante e c) P ( 2 < x < 10, λ = 6, t = 1) = x! x=3
∑
= 0.8541.
realizar esta suma)
Con la tabla: λ t = 6. = F( 9) - F( 2) = 0.9161 - 0.0620 = 0.8541 d) P ( x > 15, λ = 6, t =3 ) = 1 - P ( x ≤ 15, 18 ) x 15 −18 ( e 18 ) = 0.7133. =1x! x= 0 Con la tabla: λ t = 18.
∑
P ( x > 15, λ = 6, t =3 ) = 1 - 0.2867 = 0.7133. e) Esta ultima la haremos directamente con la tabla: λ t = 18. P ( x > 21, λ = 6, t = 3 ) = 1 - P ( x ≤ 21, 18 ) = 1 - 0.7991 = 0.2009 Ejemplo 2. Un fabricante de alimento utiliza un extrusor (máquina que produce alimentos) que produce una ganancia igual a $200 por hora cuando trabaja. Sin embargo, el extrusor se descompone en promedio dos veces cada diez horas de funcionamiento. Si Y representa el número de descomposturas durante el tiempo de funcionamiento, la ganancia generada por la máquina esta dada por R=200t-50y 2 en la cual t representa las horas de funcionamiento. El extrusor se detiene para mantenimiento de rutina a intervalos regulares, y trabaja como máquina nueva después de ese mantenimiento. Calcular el intervalo óptimo de mantenimiento t 0 para que sea máxima la ganancia esperada entre paros. Solución: E [R] = E [200t - 50 y 2] = 200t - 50 E (y2); = 200t - 50 [V (y) + µ2]; V (y) = E (y2) - µ2, despejando: E (y2) = V (y) - µ2 . 53
λ = 2 (para 10 horas) λ = 2/ 10 (para 1 hora) µ = λt = (1 /5) t (para t horas) v ( y ) = λt = (1 /5) t.
Sustituyendo en la expresión anterior:
= 200t - 50
1 t + 5
1
t 2 = 200t - 10t - 2t 2 = 190t - 2t2.
25 Derivando respecto a t0 e igualando a cero:
δ E (R) = 190 - 4t = 0 δ (t0 ) - 4t0 = - 190
t0 = 47.5 horas.
para este tiempo obtenemos la ganancia máxima esperada. Ejemplo 3. La probabilidad de que una persona muera por una infección respiratoria es de 0.002. Encuentre la probabilidad que mueran: a) Menos de 5 de las próximas 2000 personas b) Más de 3 de las próximas 1600 personas c) Entre 7 y 15 inclusive de las próximas 6000 personas. Solución: Este es un problema de una variable con distribución Binomial. Observemos que la tabla no resuelve porque el tamaño de n es muy grande. Podríamos hacerlo con la fórmula de la función de probabilidad, sin embargo sería muy tedioso estar realizando estas sumas. Entonces usaremos la aproximación a Poison. En las aproximaciones las unidades de t son iguales a 1, por lo tanto: λt = λ. a) n = 2000 P ( x < 5, λ = 4 ) = F ( 4 ) p = 0.002 = 0.6288 λ = n * p = 200 (0.002) = 4 b) n = 1600 P ( x > 3, 3.2 ) = 1 - P ( x ≤ 3 ) P = 0.002 =1-F(3) λ = 1600 (0.002) = 3.2 = 1 - 0.6025 = 0.3975 c) n = 6000 P ( 7 ≤ x ≤ 15, 12 ) = F ( 15 ) - F ( 6 ) P = 0.002 = 0.8444 - 0.0458 = 0.7986 λ = 6000 (0.002) = 12
54
DISTRIBUCIONES DE PROBABILIDAD CONTINUAS INTRODUCCIÓN En este capitulo estudiaremos la distribución normal, la cual es una de las mas importantes de variable continua. También estudiaremos la normal estándar, que es un caso particular de la anterior y de mucha utilidad en el cálculo de probabilidades. Además estudiaremos las distribuciones Ji cuadrado y t de studet. Al final veremos el teorema de Chevyshev. 5.3. DISTRIBUCIÓN NORMAL La distribución de probabilidad continua más importante en el campo de la estadística es la distribución normal, su gráfica, llamada curva normal, es una curva en forma de campana. Curva Normal
Definición. La función de densidad de la v.a. normal X con media µ y Varianza σ2, es: − 1 ( x − µ )2 1 P (x) = ; - ∞ < x < ∞ e 2 σ
2πσ
Propiedades. 1. La media se encuentra al centro del eje horizontal donde la curva tiene la máxima altura. 2. La curva es simétrica con respecto al eje vertical que pasa por la media µ. O sea: e 50% de los datos se encuentran a la izquierda de la media y el otro tanto a la derecha. 3. La curva se aproxima en forma asintótica al eje horizontal, a medida que avanza en uno u en otro sentido a partir de la media. 4. El área total bajo la curva y por encima del eje horizontal es igual a uno. 5.
µ – 3σ
µ – 2σ
µ – σ
µ
68.26% 95.46% 99.74% 55
µ + σ
µ + 2σ
µ + 3σ
Lo que expresa esta última propiedad es lo siguiente:
-
A una desviación estándar, alrededor de la media se concentra el 68.26% de los datos. A dos desviaciones estándar alrededor de la media se concentra el 95.46% de los datos. A tres desviaciones estándar alrededor de la media se concentra el 99.74% de los datos. De aquí podemos deducir que: si una desviación estándar es pequeña, para un conjunto de observaciones, estos datos se encontrarían localizadas cerca de la media y viceversa.
DISTRIBUCIÓN NORMAL ESTÁNDAR
Definición.
La distribución normal con media µ = 0 y σ 2 = 1, se llama:
Di str ibución normal estándar . Notas: - Las distribuciones normales con media: µ y varianza: σ2, se pueden denotar así: N (µ , σ2). - La normal estándar será: N (0, 1). - Si se tiene una distribución normal cualquiera, se puede estandarizar haciendo la transformación: x −µ Z= . Los valores de Z los redondearemos a dos decimales.
σ
Ejemplo. Dada la distribución normal: N(18, 16), estandarizar los valores, X = 13, 23 y 26 Solución: Para X = 13. Z = Para X = 23. Z = Para X = 26. Z =
13 − 18 4
23 − 18 4
26 − 18 4
= -1.25. = 1.25. = 2.00.
5.3.2. Calculo de probabilidades haciendo uso de la tabla N (0,1) (Área bajo la curva) Area a la izquierda de x. Se estandariza el valor de x y luego se busca en la tabla el valor de la función φ(z), donde: z es el valor estándar de x y la p(X < x) = φ(z). Area a la derecha de x. Se estandariza el valor de x y luego se busca en la tabla el valor de la función φ(z), donde: z es el valor estándar de x y la: p(X > x ) = 1- φ(z). Area comprendida entre dos valores x1 y x2 , donde x1< X < x2. Se standarizan los valores de x 1 y x2 y luego se busca en la tabla el valor de la funciones: φ(z1) y φ(z2), donde: z1 es el valor estándar de x1 y z2 es el valor estándar de x2 y la: p(x1< X < x2) = φ(z2) - φ(z1).
56
Ejemplos - Supóngase que el diámetro externo de cierto tipo de pieza (Balinera) se encuentre distribuido de manera normal con media de 3.5 cm. y varianza de 0.0004 cm 2, si el diámetro de estos piezas no debe ser menor a 3.47 cm., ni mayor a 3.53 cm.: a) ¿Cual es la probabilidad que el diámetro sea menor a 3.48 cm? b) ¿Cual es la probabilidad que el diámetro sea mayor a 3.51 cm? c) ¿Cual es el porcentaje de estas piezas que deben desecharse? d) ¿Bajo que valor se obtiene el 60% de las piezas con menor diámetro? Solución: a)
µ = 3.5, σ2 = 0.0004, σ = 0.02
P(x < 3.48) = φ (z), estandarizando x = 3.48. 3.48 − 3.5 = φ 0 .02 = φ (-1.00), se busca en la tabla = 0.1587 b) P (x > 3.5) = 1 - φ (z) 3.51 − 3.5 = 1 - φ 0 .02 = 1 - φ (0.50) = 1 – 0.6915 = 0.3085 c) P (3.47 < x < 3.53) = φ (z2) - φ (z1), estandarizando: x 2 = 3.53 y x 1 = 3.47. 3. 53 − 3. 5
= φ
0 . 02
3. 47 − 3. 5 − φ 0 . 02
= φ (1.5) - φ (-1.5)= 0.9332 - 0.0688 = 0.8664 x −µ a) Aquí deseamos conocer el valor de x, el cual se despeja de: z = , entonces:
σ
x = µ +z σ
En este caso se conoce φ(z) = 0.6000, entonces necesitamos conocer z. Se busca en la tabla: φ(z) = 0.6000, si no esta, buscamos el valor mas próximo a el y con este valor aproximamos el valor de z, el valor mas próximo a 0.6000 es 0.5987, entonces el valor aproximado de z = 0.25. Con esta aproximación obtenemos el valor aproximado de x. P (X < x) = φ(z) = 0.6000 ∼ 0.5987 ⇒ z = 0.25 X = µ + zσ X = 3.5 + (0.25) (0.02) = 3.505
57
- Una distribución normal tiene media de 61.6 determine desviación estándar si el 20% del área total situada bajo la curva se ubica a la derecha de 70. Solución: Despejamos σ , de z =
x −µ
σ
, entonces: σ =
x −μ z
Necesitamos conocer z, de igual forma que en la ultima pregunta del problema anterior conocemos: φ(z) = 0.8. Aproximaremos el valor de z. x −μ σ = P (x > 70) = 0.20 z P (x < 70) = 0.8000 0.8000 ∼ 0.7995 ⇒ z = 0.84
⇒
σ = 70 − 61 .6 = 10.71 0 . 84
- Un estudiante se traslada diariamente de su casa a la universidad, en promedio el viaje le toma 24 minutos con una desviación estándar de 3.8 minutos. Si los tiempos de traslado se distribuyen de manera normal: a) Cual es la probabilidad que un traslado le tome al menos media hora a) Si la universidad inicia clases a las 7:00 a.m y él sale de su casa a las 6:45 a.m ¿ Qué porcentaje de las veces llega tarde a sus clases?. b) Si deja la casa a las 6:35 a.m y en la Universidad sirven un café entre las 6:50 a.m y 7:00 a.m ¿ Cuál es la probabilidad que se pierda el café?. c) Encuentre el periodo arriba del cual se localiza el 15% de los traslados más lentos. d) Calcular la probabilidad de que 2 de los siguientes 3 traslados tomarán al menos media hora. Solución: µ = 24 min, σ = 3.8 min 30 − 24 = 1 - φ (1.58) = 1 - 0.9429 a) P (x > 30) = 1 - φ (z) = 1 - φ 3.8 = 0.0571 probabilidad que un traslado le tome al menos 1/2 hora b) Para obtener el % de las veces que llega tarde, se encuentra primero la probabilidad de las veces que llega tarde, luego esta se multiplica por 100 para tener el %. El llegaría tarde si el traslado dura más de 15 minutos. Entonces: P (x > 15) = 1 - φ (z) = 1 - φ
15 − 24 3. 8
= 1 - φ (-2.37) = 1 - 0.0089
= 0.9911. El 99.11% de las veces llega tarde a clases. c) El se perdería el café, si el traslado le toma más de 25 minutos, entonces: P (x > 25) = 1 - φ (z) 25 − 24 = 1 - φ (0.26) = 1 - 0.6026 = 0.3974. = 1 - φ 3.8 58
Probabilidad que se pierda el café d) El 15% de los traslados más lentos se ubicarían a la derecha de la curva, el periodo solicitado es el valor de x. x = µ + zσ = 24 + (1.04)(3.8) = 27.952 minutos.
P (X> x) = 0.15 P (X < x) = φ(z) = 0.8500 0.8500 ∼ 0.8508 → z = 1.04
e) Este es una pregunta que se responde con la distribución Binomial usando la Probabilidad del inciso (a) n=3
p (x = 2, n = 3, p = 0.0571) = 32 (0.0571) 2 (0.9429)
x=2 = 0.0092 p = 0.0571 q = 0.9429 - Supóngase que la cantidad de café por una máquina llenadora en frasco de 6 onzas sigue una distribución normal con varianza de 0.0025 onzas. Si solo el 3% de los frascos van a contener menos de 6 onzas de café ¿Cuál debe ser el contenido medio de éstos frascos. Solución: P (x < 6) = φ(z) = 0.03 0.0300 ∼ 0.0301 ⇒ z = -1.88 σ2 = 0.0025 σ = 0.05
µ = x - zσ µ = 6 - (-1.88)(0.05)
= 6.094 El contenido promedio debe ser de 6.094 onzas
5.3.3. APROXIMACIÓN DE BINOMIAL A NORMAL Cuando n es relativamente grande y p es cercano a 0.5, se pueden aproximar los problemas Binomiales a la Normal. n →∞ p → 0 .5
Una posible guía para determinar cuándo puede utilizarse aproximación normal es tener en cuenta el cálculo de n p y n q. Si ámbos productos, n p y n q, son mayores o iguales a 5, la aproximación será buena. Con el siguiente ejemplo mostraremos como aproximar un problema de distribucion binomial a normal. Recordemos que la distribucion Binomial es de variable discreta y la Normal de variable continua.
59
Ejemplo La probabilidad que una computadora posea defecto despues de haber sido ensamblada es 0.4. Si se sabe que han sido ensambladas 100 computadoras, ¿cuál es la prbabilidad de que: a) Exactamente 31 tengan defectos? b) A lo sumo 42 tengan defectos? c) Al menos 30 tengan defectos? d) Entre 33 y 46 tengan defectos? e) Más de 46 pero menos de 68 no tengan defectos? Solución : Este es un problema de distribucion binomial, La primer pregunta la contestaremos con la funcion de probabilidad binomial y tambien veremos como aproximar a la Normal, el resto de preguntas las contestaremos por aproximacion. Note que la probabilidad del éxito en las primeras cuatro preguntas es q. P(que tenga defecto) = 0.4 = q P(que no tenga defecto) = 0.6 = p a) p (X = 31, n = 100, q = 0.4) =
100C31
(0.4)31 (0.6)69 = 0.0151.
Aproximando a la normal debemos considerar lo siguiente: Cualquier valor continuo entre 30.5 y 31.5 se redondea al inmediato entero 31 y para estandarizar los valores se calculan la media y la desviacion estandar con los datos de la distribucion binomial, como mostramos a continuación , entonces: p (X = 31, n = 100, q = 0.4) ≡ P(30.5 < x < 31.5) 30 .5 − 40 31 .5 − 40 µ = n.q = 40 = φ − φ 4 . 899 4 . 899 σ2 = n.p.q = 24 = φ (-1.73) - φ (-1.94) σ = 4.899 = 0.0418 - 0.0262 = 0.0156 Como pueden apreciar la aproximacion es bastante buena. b) Aproximando a la normal debemos considerar lo siguiente: Cualquier valor continuo entre 42 y 42.5 se redondea al inmediato entero 42, entonces: p (x ≤ 42, n = 100, q = 0.4) ≡ p(x ≤ 42.5) = φ
42.5 − 40 = φ (0.51) = 0.6950 4 . 899
c) Aproximando a la normal debemos considerar lo siguiente: Cualquier valor continuo entre 29.5 y 30 se redondea al inmediato entero 30, entonces: p (x ≥ 30, n = 100, q = 0.4) ≡ p(x > 29.5) = 1 - p (x ≤ 29.5) (por complemento) 29.5 − 40 = 1 - φ (-2.14) = 1 - φ 4 .899 = 1 - 0.0162 = 0.9838 60
d) P (33 ≤ x ≤ 46, n = 100, q = 0.4) ≡ p(32.5 < x 46.5) = φ (z2) - φ (z1) 32. 5 − 40 46.5 − 40 = φ − φ 4 . 899 4 . 899 = φ (1.33) - φ (-1.53) = 0.9082 - 0.0630 = 0.8452 e) Para esta pregunta el éxito es que no tenga defectos: p = 0.6, entonces: µ = n p = 100 (0.6) = 60 y la desviacion estandar es la misma, σ = 4.899. Para realizar la aproximacion, observe que los valores que toma x son: 47 ≤ x ≤ 67, por lo tanto la equivalencia en la normal es: p (46 < x < 68, n = 100, p = 0.6) ≡ p(46.5 < x < 67.5) = φ (z2) - φ (z1) 67 . 5 − 60 = φ 4 . 899
46 . 5 − 60 − φ 4 . 899
= φ (1.53) - φ (-2.75) = 0.9370 - 0.0030 = 0.934 5.4 DISTRIBUCIÓN JI CUADRADO Definición. La variable aleatoria X tiene una distribución Ji-Cuadrado con v gr ados de libertad, si su función de densidad es: v −1 − x 1 x2 e 2 ∀x >0 f ( x) = v
v 2
2 2 Γ
Donde v es un entero positivo (grados de libertad) y Γ es la función Gamma. Teorema
La media y la varianza de la distribución Ji Cuadrado son :
µ= v
y σ2 = 2v
Propiedades Enunciaremos algunas propiedades de la distribución Ji-Cuadrado. 1) Si la variable X tiene una distribución normal estándar, entonces: X 2 tiene distribución Ji-Cuadrado con un grado de libertad (v = 1). 2) Si X1, X2, …, Xn son variables aleatorias independientes con distribuciones normales estándar, entonces:
61
Y =
n
∑ xi
2
i =1
Tiene distribución Ji-Cuadrado con n grados de libertad (v = n). 3) Si X1, X2, …, Xn son variables aleatorias independientes con distribuciones con distribuciones Ji-Cuadradas con v 1, v2, …, v n grados de libertad, entonces: Y =
n
∑= xi
i
2
1
Tiene distribución Ji-Cuadrada con: v 1 + v2 + … +vn grados de libertad. 4) Si s2 es la varianza de una muestra aleatoria de tamaño n de una Población normal que tiene la varianza σ2, entonces el estadístico. ( n − 1)s 2 2 x =
σ2
Es una variable aleatoria que tiene una distribución Ji-cuadrado con v = n – 1 grados de libertad. Notas: - El estadístico enunciado en la última propiedad se suele buscar en la tabla para la distribución ji-Cuadrado con v grados de libertad. - Este estadístico se denota así: X2(1-α), v. - Un valor X20.95 , 6 = 12.592 (Deja un área de 0.05 a su derecha). Debido a que la gráfica no es simétrica, debemos buscar también el valor de: X20.05 , 6 = 1.635 (Deja un área de 0.95 a su derecha). Como el 95% de una distribución Ji-Cuadrada esta entre X 20.025 , v y X20.975 , v, entonces debemos analizar lo siguiente: Un valor de X2 que cae a la izquierda de X 2 0.025, v no es probable que Ocurra a menos que el valor supuesto de la varianza ( σ2), sea muy grande. De igual manera, un valor de X 2 que cae a la derecha de X2 0.975, v no es probable que ocurra a menos que dicho valor supuesto sea muy pequeño. O sea: es posible tener un valor X 2 entre los valores de X20.025 , v y X20.095 , v cuando la varianza ( σ2) es la correcta. - P(X2 > X2(1-α), v) = α. - Cuando los grados de libertad exceden a 30, las probabilidades relacionadas con Ji cuadrada pueden aproximarse con la normal. Ejemplo Un fabricante de computadoras garantiza que estas durarán, en promedio, 3 años con una desviación estándar de un año. Si 6 de estás computadoras duraron: 1.9, 2.4, 3.0,
62
3.5, 3.8 y 4.2 años antes de ser reparadas la primera vez. ¿Debería el fabricante estar convencido aún de que sus computadoras tienen una desviación estándar de un año? Solución: Primero calcularemos s 2, podemos utilizar la fórmula siguiente.
n
n
n
∑i xi − (i∑ x ) 2
1
2
=1 = (6) (62.7 ) − (353.44 ) = 0 .75867 n(n −1) 6(5 ) Ahora utilizamos la fórmula del teorema anterior, para calcular x 2 2 (5 ) (0 .75867 ) 2 ( n − 1) s = = 3.7933 x = 2
s2 =
=1
σ
1
Buscamos en la tabla de Ji-Cuadrado el valor de 3.7933 con v = 5 y encontramos que el más próximo es para x20.50, 5 = 4.351. Los valores de X 2 = 3.7933 se encuentran entre 0.831 y 12.832 (X 20.975 , 5 = 0.831 y X 20.025 , 5 = 12.832), como σ2 = 1, entonces es correcto. Por lo que parece razonable que el fabricante no debe dudar de que sus computadoras tengan una desviación estándar de un año. 5.5. DISTRIBUCIÓN t o t de STUDENT La distribución t de student fue obtenida por W. S. Gosset (1876-1937), el era un químico que trabajaba para la cervecería Guinness En Dublín, Alemania, en 1908. Para muestras aleatorias tomadas de una población normal con una media µ y la varianza σ2, la media de la muestra aleatoria ( x ) tiene una distribución normal con la media µ y
σ2 ,
x −μ tiene la distribución normal estándar. La dificultad σ / n n principal que se presenta en la aplicación de este resultado es que en la práctica σ2 suele ser desconocida, lo que obliga a reemplazarla por un valor de la varianza de la muestra x−µ (s2). Mas adelante veremos la distribución de densidad de para muestras s / n aleatorias de poblaciones normales. La distribución t de Student se define así. la varianza
es decir,
Definición. Sean dos variables aleatorias independientes Y y Z , tales que: Y tenga una distribución normal estándar y Z tenga una distribución Ji-Cuadrado con v grados de libertad y supongamos que la variable X se define por:
63
X=
Y 1 / 2
Z v
,
Entonces, la distribución de X se llama: La distribución t de Student La función de densidad de esta variable, está dada por : − v +1 v + 1 2 Γ 2 2
F(x) =
x 1 + v v v π Γ 2
, Para: -α < x < α
Y se denomina: Distribución t de Student con v grados de libertad. Teorema. La media y la varianza de la distribución t de student con v grados de libertad están dadas por:
µ = 0 y σ2 =
n n+2
, para n > 2.
Teorema. Si X y Y S2 son la media y la varianza de una muestra aleatoria n tomadas de una población normal con la media µ y la varianza σ 2, entonces.
t
Notas:
=
x −µ
s / n tiene la distribución t, con v = n – 1 grados de libertad. - La distribución t de Student tiene mucha similitud con la normal, ambas son simétricas alrededor de su media, sus gráficas tienen forma de campana, pero la distribución t es más variable.
- Representaremos los valores críticos de esta distribución por: t 1-α , v , los cuales se encuentran en la tabla t Student, ubicando en la horizontal a t 1-α Y los grados de libertad en la columna, luego se interceptan, igual que se procedio con la normal. - La p(t > t1-α , v ) = α o la p(t < t1-α , v) = 1 - α. Esto significa que a la derecha del valor critico se encuentra un área igual a α y por debajo un área igual a 1 - α. - Dado que la distribución t es simétrica, se tiene que: t α = - t1-α -
Para n ≥ 30 la curva de la distribución t, se ajusta mucho a la Normal Estándar.
64
Ejemplo: Un bus de una cooperativa de transporte, que viaja de Managua al Norte, en 16 recorridos completos (ida y vuelta), tubo un consumo promedio de combustible (Diesel) de 16.4 galones; con una desviación estándar de 2.1 galones. Demuestre la afirmación de que el consumo promedio de combustible de este bus es de 12 galones por hora. Solución: n = 16
µ = 12.0
t
=
x −µ s / n
=
16. 4 − 12. 0 ( 2. 1)(4 )
= 8.3809
s = 2.1 En la tabla se busca con v = n – 1 = 15 grados de libertad, el valor de 8.3809 y el valor más próximo que encontramos es t 1-α , v = t0.995 , 15 = 2.947; de donde: 1 - α = 0.995, entonces: α = 0.005; por lo tanto: la P( t > 2.947) = 0.005; por lo que la probabilidad de que t sea mayor que 8.3809 debe ser despreciable (insignificante), entonces es acertado pensar que el consumo promedio de diesel de dicho bus es mayor que 12 galones.
5.6. TH DE CHEBYSHEV Se ha deducido que para una desviación estándar pequeña de un conjunto de valores, significa que éstos se encuentran concentrados cerca de la madia y viceversa. El matemático ruso P. L. Chevyshev (1821-1894) desarrollo un teorema que permite determinar la proporción mínima de las observaciones que se encuentran a una distancia de k desviaciones estándar de su media. Teorema de Chevyshev. Para un conjunto cualquiera de observaciones, la proporción mínima de estas que se encuentran a k desviaciones estándar de la media es al menos : 1 -
1 ; o sea: 2 k
1 k 2 Esta desigualdad es válida para variables discretas como para continuas. Además, si no conocemos la ley de probabilidad será posible encontrar un límite inferior para la probabilidad en este intervalo para la cual existan µ y σ , pero sólo nos indica: “cuando menos qué proporción'' deberá estar entre ciertos valores. P [ µ - k σ ≤ x ≤ µ + k σ ] ≥ 1 -
65
Ejemplos - Los registros de una línea aérea muestran que sus vuelos entre dos ciudades llegan en promedio 5.4 minutos tarde con desviación estándar de 1.4 minutos. ¿Cuándo menos qué porcentaje de sus vuelos entre dos ciudades llegan entre: a) 2.6 y 8.2 minutos tarde? b) 1.6 minutos antes y 12.4 minutos tarde? Solución: µ = 5.4 σ = 1.4 a) µ - k σ = 2.6
5.4 - 2.6 = k (1.4)
k=
5 .4 − 2.6 1 .4
=2
1 1 = 1 - = 0.75 4 k 2 Cuando menos 75% de los aviones de la línea aérea llegan entre 2.6 y 8.2 minutos tarde 1 1 b) P [ 1.6 ≤ x ≤ 12.4 ] ≥ 1 =1= 0.96 2 25 k µ + k σ = 12.4 Al menos el 96% de los aviones de la P [ 2.6 ≤ x ≤ 8.2 ] ≥ 1 -
1.4k = 12.4 - 5.4 12. 4 − 5 . 4 k= =5 1 .4 o bien k =
5 .4
línea aérea llegan entre 1.6 minutos antes y 12.4 minutos después
+ 1 .6
1 .4
=5
- Supóngase que en promedio 1 de 1,000 personas comente un error numérico al elaborar su declaración de impuestos. Encuentre un intervalo en el cual se tenga una probabilidad de por lo menos
8 9
del número de personas que incurren en errores en
esta actividad de entre las 10,000 declaraciones. Solución: P=
1
= 0.001
1,00 0
n = 10,000 1
−
1 k 2
= 8⇒ 1− 8 = 9
µ = λ = σ2
⇒ λ = n p = 10, 9
1 k 2
66
1 9
P [ µ ± k σ ] ≥
=
1 2
⇒ K=3
k 8 9
10 ± 3 10 ⇒ p [ -19.49 ≤ x ≤ 9.49 ] ≥
8 9
El número de personas que incurren en errores al elaborar su declaración de impuestos de un total de 10,000 es al menos de 9 con una probabilidad de al menos 8/9 (o bien 88.89%). - Un fabricante de neumáticos para automóvil reporta que de un embarque de 5,000 neumáticos enviados a un distribuidor local, 1,000 están ligeramente manchados. Si alguien compra al distribuidor 10 de estos neumáticos aleatoria mente. Interprete el Th de Cheybyshev para 2 desviaciones estándar. Solución:
µ (x) =
N = 5,000 n = 10 K = 1,000
µ=
10 (1,00 0 ) 5,00 0
=2
nk N
σ2 (x) =
nk ( N − k ) ( N − n ) N 2 ( N − 1)
σ2 (x) =
( 1,00 0 ) ( 4 ,00 0 ) ( 4 ,990 ) 10 ( 5 ,00 0 ) 2 ( 4 ,999 )
σ (x) = 1.26 Intervalo: µ ± 2 σ = 2 ± 2 (1.26); 1 − P [ -0.52 ≤ x ≤ 4.52 ] ≥ 3/4
1 4
=
3 4
ESTIMACION INTRODUCCIÓN La inferencia estadística o estadística inferencial se refiere a un conjunto de métodos mediante los cuales podemos hacer afirmaciones con respecto a una población completa a partir únicamente de la observación de una parte de ella (muestra). Dos formas básicas para realizar inferencia estadística son la Estimación y el Contraste de Hipótesis, también llamado "Prueba de hipótesis”.
El número de datos n (tamaño de muestra) es casi siempre elegido de antemano (a través del muestreo) en problemas de estimación y prueba de hipótesis.
67
Anteriormente se han calculado algunas medidas descriptivas, tales como: la media, la varianza, la proporción etc. Cuando calculamos estas medidas en una muestra, suelen identificarse como: estadísticos y cuando hablamos de los mismos en una población los identificamos como: parámetros. O sea: x , S2, p , etc. son estadísticos y µ, σ2, P, etc. son parámetros ESTIMACIÓN Definición Estimación es la aproximación a los parámetros poblacionales, en Función de estadísticos muestrales conocidos.
Existen dos tipos de estimaciones de parámetros: - La estimación puntual. - la estimación por intervalo de confianza.
Así, el problema principal en la teoría de la estimación consiste en determinar métodos para buscar valoras estimados de parámetros desconocidos de un modelo probabilístico, basados en muestras. Los problemas de estimación en la que se emplea la distribución Binomial pueden reducirse generalmente a los problemas de estimación para la proporción. Los problemas de estimación en la que se emplea la distribución Normal, distribución T de Studen, distribución Chi-cuadrada y distribución de Fischer, pueden reducirse generalmente a los problemas de estimación para la media y la varianza. ESTIMACIÓN PUNTUAL Definición Es el número que se obtiene mediante cálculos a partir de valores de la muestra que sirven como aproximación al parámetro que se desea estimar. Los estimadores puntuales para los parámetros poblacionales son los parámetros muéstrales correspondientes.
Ejemplo La edad promedio de los estudiantes de segundo año de cualquier carrera en la UNI, la estimamos de 19 años. Para confirmar o rechazar esto, debemos tomar una muestra representativa y calcular la edad promedio de la muestra para contrastarla con dicha estimación. En este caso se hace consideración a un solo numero (edad promedio de la muestra), que será una estimación puntual del valor del parámetro poblacional desconocido. En general: una estimación puntual es un número o punto que se da al parámetro poblacional tal como: θ = θ , µ = x , σ 2 = S2, P = p . En la estimación puntual no se puede afirmar, con cierta seguridad, que tan próximo estaríamos del verdadero valor del parámetro poblacional, aunque este justificado que son
68
buenos estimadores puntuales de los parámetros poblacionales los muéstrales correspondientes. Pero pueden utilizarse diversas propiedades estadísticas de los estimadores para decidir que estimador es él mas apropiado en una situación dada, cual nos expondrá el menor riesgo, cual nos brindará la mayor cantidad de información al más bajo costo, etc. Las propiedades especificas de los estimadores que analizaremos son: Insesgabilidad, Varianza mínima, Consistencia y Suficiencia. ESTIMADORES INSESGADOS omo es difícil que haya un estimador ideal que siempre de la respuesta correcta, es razonable pensar que un estimador deba hacerlo cuando menos en promedio. Dicho de otra forma, parecería esperado que el valor medio de un estimador sea igual al parámetro que se supone estima, si este fuese el caso se dice que el estimador es insesgado; de lo contrario es sesgado. Definición Una estadística
θ es un estimador insesgado del
parámetro
θ , si y solo si,
E( θ )= θ .
De acuerdo con esta definición y el teorema siguiente: Si x 1, x2,..., xn , constituyen una muestra aleatoria de una población infinita que tiene la media µ y la variancia σ2, entonces: E( x )= µ y la Var( x )= σ2 /n. se deduce que: la media muestral x es un estimador insesgado de la media poblacional µ . Veremos el siguiente ejemplo:
X : la proporción de n éxitos observados, es un estimador insesgado del parámetro P: proporción de éxitos en la población. Si la variable X tiene una distribución Binomial, demuestre que p =
(Queremos demostrar que E(X/n)= P). Demostración. Como E(x)=n P (media de una distribución Binomial), se deduce que: E(x/n)= Teorema:
1
n
. E(x)=
1
n
. n P = P. Es lo que queríamos demostrar.
Si s2 es la varianza de una muestra tomada al azar de una población infinita, entonces E(s2)= σ2.
Nota: Aunque s2 es un estimador insesgado de la varianza de una población infinita, no es un estimador insesgado de la varianza de una población finita y en ningún caso es s un estimador insesgado de σ .
69
6.4.1.2. ESTIMADOR INSESGADO DE VARIANZA MÍNIMA Si tenemos que elegir uno de varios estimadores insesgados, por lo general tomamos aquel cuya distribución muestral tenga la varianza más pequeña. Para verificar si un estimador insesgado tiene la varianza mínima, nos valemos del hecho de que si θ es un estimador insesgado de θ , puede demostrarse en condiciones muy generales que la varianza de θ debe satisfacer la desigualdad: Var( θ ) ≥
1 2
∂ ln f (x) ∂θ
n E
Donde: f(x): es el valor de la densidad de la población de x n: es el tamaño de la muestra aleatoria. Esta relación nos conduce al siguiente resultado. Teorema. Si θ es un estimador insesgado de θ y V ar (θ )
,
1
=
∂ ln f ( x ) ∂ θ 2
n E
Entonces θ es un estimador insesgado de varianza mínima de θ . ESTIMACIÓN POR INTERVALO A diferencia de la estimación puntual, el resultado de la estimación por intervalo de confianza es un intervalo que puede afirmarse, con cierta seguridad, que en este se encuentra el parámetro a estimar. La estimación por intervalo esta determinado por dos números que se obtienen a partir de cálculos de valores de la muestra y que se espera contenga el valor del parámetro que se desea. O sea: θ 1 < θ < θ 2. La estimación por intervalo se construye de forma tal, que la probabilidad que el intervalo contenga al parámetro pueda especificarse, a este valor se le llama: nivel de confianza ó coeficiente de confianza, tal probabilidad es: 1 - α, siendo α su complemento, un valor de probabilidad pequeña, conocida como margen de error o nivel de significación. Los niveles de confianza y significación pueden expresarse de forma análoga a través de porcentajes. La probabilidad de que el intervalo contenga al parámetro a estimar puede escribirse así:
70
P ( θ 1 < θ < θ 2) = 1 - α A dicho intervalo intervalo se le conoce conoce como: Intervalo de confianza del (1 - α) 100%, donde θ 1 y θ 2 son los limites de confianza inferior y superior respectivamente. ESTIMACIÓN POR INTERVALO DE CONFIANZA PARA LA MEDIA CON VARIANZA CONOCIDA. Sea una variable X con distribución normal ( µ , σ2) en una población población determin determinada ada y consideremos (x1,..., x n) una muestra simple simple de X tomada en dicha población población siendo la varianza conocida con media
. μ x = μ y varianza σ x = σ n 2
2
La probabilidad de que un un valor normal normal Z se encuentre dentro dentro de intervalo, intervalo, se puede escribir así: P (-Z 1- α /2 ≤ Z ≤ Z 1- α /2) = 1 - ∝ Donde el valor valor estándar estándar de z es: Z = P (-Z 1- α /2 ≤ P ( x - Z 1- α /2
x −μ
σ
σ n
x −μ
σ
, sustituyendo:
n
≤ Z 1- α /2) = 1 - ∝ , despejando µ , se obtiene:
n
≤ µ ≤ x + Z 1- α /2
A los valores: - Z 1- α /2 y Z 1- α /2 normal. El valor critico: - Z 1- α/2 = Z α /2.
σ
)=1- ∝ n se les llaman valores críticos y se buscan en la tabla
El intervalo se puede escribir de forma compacta así:
x ± Z 1- α /2
σ n
Teorema Si x y s2 son la media media y la la varianza de una muestra aleatoria de tamaño n seleccionada seleccionada
de una población población normal normal con la varianza σ2 conocida, entonces un intervalo con una confia confianza nza de (1 - α ) 1 0 0 % para la media , está dado por:
µ
x - Z 1- α/2
σ
≤ µ ≤ x + Z 1- α/2
σ
n n La precisión en la estimación por intervalo esta determinada por la dimensión del intervalo. Un intervalo intervalo de confianza confianza de gran longitud longitud no es de gran utilidad utilidad si tenemos en cuenta la objetividad o precisión.
71
Mientras menor sea el ancho del intervalo mayor será su precisión, evidentemente la precisión esta en relación inversa con el nivel de confianza al disminuir uno aumenta aumenta el otro, si permanecen fijas las restantes condiciones. condiciones. En esta situación se debe examinar entre las restantes condiciones si algún elemento puede influir de forma que ambos disminuyan, el otro elemento es la cantidad de información (tamaño de muestra) con que se cuenta. Se puede encontrar una ecuación que relacione los tres elementos. Sea X una variable aleatoria con distribución normal ( µ , σ2) y sea (X1,..., X n) una muestra simple aleatoria de esta variable, si se denota el ancho del intervalo por 2ε, donde ε : es el máximo error permisible, permisible, entonces se puede llegar a la siguiente identidad: Ancho de intervalo: intervalo: Ls - Li= 2ε = x + Z 1- α /2 2ε = 2 Z 1- α /2 De esto resulta que:
ε = Z 1- α/2
σ n
- x + Z 1- α /2
σ n
σ n
σ n
En esta relación se encuentran los los tres elementos. Para comprender la la relación entre ellos, deben analizarse por pareja, haciendo constante el tercer elemento. Para calcular el número de elementos que debe tener la muestra, podemos despejar n y se obtiene: n
= z1 −α / 2 ε
σ
2
Ejemplo 1 La cantidad de litros de lubricantes que se consumen en un mes en una cooperativa de transporte es una variable aleatoria con distribución normal ( µ , 81) se toma una muestra aleatoria de 4 meses y se obtienen: 1,200, 1,200, 1,250, 1,195, 1,190 1,190 litros de consumo. a) Determine una estimación estimación puntual puntual para el consumo promedio promedio de lubricantes por mes. Solución 1,200 + ... + 1,190 x =------------------=-------------------------------------- = 1,208.75 1,208.75 litros 4 µ = 1,208.75 litros. Se estima que el consumo promedio de lubricantes por mes en dicha cooperativa de transporte es de 1,208.75 1,208.75 litros. b) Calcule un intervalo intervalo de confianza confianza para para el consumo consumo medio de lubricantes lubricantes en un mes, con un nivel de confianza del 90 %. 72
Solución
x - Z 1- α /2
σ n
≤ µ ≤ x + Z 1- α /2
σ
n Para α = 0.1, Z 1- α /2 = Z 0.95 = 1.645, x = 1208.75, σ = 9, entonces: 1208 1208.75 .75 – 1.645 1.645(9) (9)/2 /2 ≤ µ ≤ 1208.75 + 1.645(9)/2 1,201.34 ≤ µ ≤ 1,216.15 El consumo promedio de lubricantes por mes en esta cooperativa de transporte esta comprendido entre: 1,201.34 y 1,216.15 litros con un nivel de confianza del 90 %. b) Si se supone supone que la longitud longitud del del intervalo intervalo es muy muy grande para el el trabajo trabajo que se debe realizar y se desea disminuir a 10 litros, calcule el tamaño que tendrá la muestra si se mantiene fijo el nivel de confianza. Solución 2ε = ancho = 10, ε = 5, entonces: n=
Z 1- α/2 σ 2 ---------------
= (1 (1.645*9 / 5) 5) 2 = 8.7675 ≈ 9
ε La muestra debería ser de 9 meses para que el intervalo tenga una longitud de 10 litros. ESTIMACIÓN POR INTERVALO DE CONFIANZA DE LA MEDIA CON VARIANZA DESCONOCIDA. Cuando se trabaja con una muestra de una población normal con varianza σ 2 desconocida y su tamaño es n<30, entonces se puede construir un intervalo de confianza del ( 1 - α) 100% para la media µ , con la variable aleatoria:
t=
x −μ , que tiene una distribución distribución t de student con n-1 grados de libertad, así: s / n P (-t (1- α /2), (n-1) ≤ t ≤ t (1- α /2), (n-1)) = 1 - ∝ x −μ ≤ t (1- α /2), (n-1)) = 1 - ∝ , despejando µ s / n s s ≤ µ ≤ x - t (1- α /2), (n-1)) )=1- ∝ n n
P (-t (1- α /2), (n-1) ≤ P ( x -t (1- α /2), (n-1) Teorema
Si x y s2 son la media y la varianza de una muestra aleatoria de tamaño n seleccionada de una población población normal normal con la varianza σ2 desconocida, entonces un intervalo con una confia confianza nza de (1 - α ) 1 0 0 % para la media , está dado por:
µ
x -t (1- α/2), (n-1)
s ≤ n
µ≤
x - t (1- α/2), (n-1))
73
s n
Nota : Si la varianza σ2 es desconocida y el tamaño de la muestra es n ≥30, entonces se utiliza el intervalo para cuando la σ2 es conocida y σ se estima con la desviación estándar de la muestra (S). La relación entre la precisión, el ancho del intervalo y el tamaño de la información se puede obtener de manera semejante, que con el anterior intervalo. Ejemplo Una muestra aleatoria de 18 alumnos graduados en la UNI dio un promedio 73.3 en todas las asignaturas de su plan de estudio con una desviación estándar de 7.8. Suponiendo que las notas se distribuyen de manera normal. Encuentre e interprete un intervalo de confianza del 98% para el número promedio de graduados en la universidad. Solucion Para este ejercicio no se conoce la varianza poblacional y el tamaño de la muestra es menor que 30, entonces usaremos la distribución t. Para α = 0.2, t (1- α /2), (n-1) = t 0.99, 17 = 2.567, n = 18, x = 73.3, s = 7.8, entonces: s s ≤ µ ≤ x - t (1- α /2), (n-1)) x -t (1- α /2), (n-1) n n 7 .8 7 .8 ≤ µ ≤ 73.3 + 2.567 73.3 – 2.567 18
18
72.211 ≤ µ ≤ 74.389 El promedio de los graduados en la UNI, varía de 72.211 a 74.389 con un nivel de confianza del 98%. 6.4.5 ESTIMACIÓN POR INTERVALO DE CONFIANZA PARA DIFERENCIAS DE MEDIAS. Si x 1 y x 2 son medias de dos muestras aleatorias independientes de tamaño n 1 y n2 seleccionadas de poblaciones normales que tienen medias µ 1 y µ 2 y varianzas 12 y
σ
σ
2 , 2
se puede demostrar que la variable: x 1 - x 2, es una variable aleatoria que tiene distribución normal con media: µ = µ 1 - µ 2 y varianza:
σ2 =
σ 12 n1
+
σ 22 n2
De lo anterior resulta que: z=
tiene una distribución normal estándar.
μ1−μ 2 σ 12 + σ 22
x1 − x 2
n1
−
n2
74
De lo anterior se deduce el siguiente teorema. Teorema Si x 1 y x 2 son las medias de muestras aleatorias independientes de tamaños n 1 y n2 seleccionadas de poblaciones normales con las varianzas un intervalo con una confianza de ( 1 - α ) 100% para
σ 12 + σ 22 ≤
( x 1 - x 2) - z (1- α /2)
n1
Ejemplo
n2
µ 1 - µ 2 ≤
σ 12 y σ 22
conocidas, entonces
µ 1 - µ 2 , está dado por:
( x 1 - x 2) + z (1- α /2)
σ 12 + σ 22 n1
n2
Se tomo una muestra al azar de 50 estudiantes de la carrera ingeniería en sistemas y dio como promedio una nota de 65 en la asignatura de estadística y 48 estudiantes de computación en la misma asignatura dieron un promedio de 62, construya un intervalo de confianza del 95% para la diferencia real entre los promedios de las dos carreras, sabiendo que las desviaciones estándar en dicha asignatura son respectivamente: 6 (industrial) y 7 (sistemas). Solución α = 0.05, z (1- α /2) = z0.975 = 1.96 n1 = 50, x 1 = 65, σ1= 6, n2 = 48, x 2 = 62, σ2 = 7 (65 - 62) – 1.96
36 50
+ 49 ≤ 48
µ 1 - µ 2 ≤ (65 - 62) + 1.96
36 50
+ 49
48
-0.414 ≤ µ 1 - µ 2 ≤ 5.586. En este intervalo la diferencia entre los promedios reales puede ser cero, por lo tanto se puede concluir que: Estadísticamente no hay diferencia significativa entre los promedios de ambas carreras en la asignatura de estadística, con un nivel de confianza del 95%. ESTIMACIÓN POR INTERVALO DE CONFIANZA PARA DIFERENCIAS DE MEDIAS CON VARIANZAS DESCONOCIDAS. También se obtiene un intervalo de confianza de (1 - α) 100% para µ 1 - µ 2 con las varianzas
σ 12 = σ 22
desconocidas y los tamaños de las muestras son menores que 30.
Teorema Si x 1 y x 2 son las medias de muestras aleatorias independientes de tamaños n1<30 y n 2<30 seleccionadas de poblaciones normales con las varianzas
σ 12 = σ 22 desconocidas, entonces un intervalo con una confianza de (1 - α ) 100% para
µ 1 - µ 2 , está dado por:
75
( x 1 - x 2) - t(1- α/2), (
1
1
n1 + n2 -1) Sp n1 + n 2
≤
µ 1 - µ 2
≤ ( x 1 - x 2) + t(1- α /2), ( Donde:
1
1
n1 + n2 -1) Sp n1 + n 2
( n 1 − 1 ) s12 + ( n 2 − 1) s22
2
sp =
n1 + n 2 − 1
σ σ
Si 12 = 22 son desconocidas y los tamaños de las muestras son mayores o iguales a 30, el intervalo de confianza para µ 1 - µ 2, será el mismo para cuando se conocen las varianzas poblacionales, estimando
σ 12 y σ 22 , por las varianzas muestrales respectivas.
Ejemplo Una empresa tiene dos máquinas troqueladoras de láminas de zinc ubicadas en los departamentos de Masaya y León, se desea comparar el tiempo promedio diario (en minutos) que estas máquinas no trabajan, con un intervalo de confianza del 99%, para ello se seleccionaron 15 días aleatoriamente por cada máquina y los resultados fueron: n1 = 15, x 1 = 45 minutos, S 1 = 2.5 minutos. n2 = 15, x 2 = 36 minutos, S 2 = 3 minutos. Se asume que las varianzas son iguales, pero desconocidas. Solución : α = 0.01, t (1- α /2),( n + n - 1) = t(0.995), (29) = 2.756 1
2
(15 −1) 6.25 + (15 −1) 9 = = 7.362, entonces : S p = 2.71 sp 15 +15 −1 2
(45 - 36) – 2.756(2.71)
1 15
+
1 15
≤ µ 1 - µ 2 ≤ (45 - 36) + 2.756(2.71)
1 15
+
1 15
6.273 ≤ µ 1 - µ 2 ≤ 11.727 La diferencia promedio diaria que estas máquinas troqueladoras no trabajan está entre 6.273 y 11.727 minutos, con una confianza del 99%. ESTIMACIÓN POR INTERVALO DE CONFIANZA PARA PROPORCIONES. En muchos casos es necesario obtener muestras de poblaciones binomiales, a través de estas podemos hacer estimaciones para el parámetro P: proporción de éxitos, valiéndonos del hecho que para cuando n es lo suficientemente grande la distribución binomial se puede aproximar a la normal. Teorema Si p : es la proporción de éxitos de una muestra seleccionada aleatoriamente de una población binomial, entonces un intervalo de confianza del ( 1 - α ) 100% para el parámetro Binomial P, está dado por:
76
p ( 1 − p) ≤ P ≤ p - Z (1- α /2) n x Donde: p = n
p - Z (1- α /2)
p ( 1 − p) n
Ejemplo Un fabricante de bloques para construcción asegura a una ferretería que le compra el producto en forma regular, que el porcentaje de bloques defectuosos no es mayor del 5 %. La ferretería decide comprobar la afirmación del fabricante seleccionando de su inventario 200 unidades de ese producto y los revisa en busca de defectos. ¿Deberá sospechar la compañía de la afirmación del fabricante, si se descubre un total de 19 bloques defectuosos en la muestra? Solucion Cuando el nivel de confianza no se especifica, se debe asumir que es del 95%. La sospecha estaría apoyada, si existe un intervalo de confiabilidad alta para el cual la proporción se encuentre completamente a la derecha del valor asegurado. Para α = 0.5, Z 1- α /2 = Z 0.975 =1.96 p = 19/200 (proporción de defectuosos), n = 200. (19 / 200 ) (181 / 200 ) (19 / 200 ) (181 / 200 ) ≤ P ≤ (19/200) + 1.96 (19/200) – 1.96 200
200
0.05436 ≤ P ≤ 0.1356, Pasando el intervalo a porcentajes, se tiene que: 5.43% ≤ P ≤ 13.56% La sospecha de la compañía esta apoyada con un nivel de confianza del 95 %. ESTIMACIÓN POR INTERVALO DE CONFIANZA PARA DIFERENCIA DE PROPORCIONES. Ahora veremos como comparar dos parámetros binomiales P 1 y P2, partiendo de dos muestras aleatorias independientes tomadas de dos poblaciones binomiales. Se puede deducir que: Si p 1 =
x1 n1
= p2 =
x2 , son las proporciones de éxitos de las dos n2
muestras aleatorias independientes, seleccionadas de dos poblaciones binomiales, entonces: p 1 - p 2 tiene aproximadamente una distribución normal con media: µ = P1 – P2
y varianza: σ 2 = p 1 q 1 + p 2 q 2 .
n1
También se deduce que la variable aleatoria:
77
n2
Z = p − p − p − p , tiene aproximadamente la distribución normal estándar. 1 2 1 2
p1 q1 + p 2 q 2 n1 n2
Teorema. Si p 1 y p 2: son las proporciones de éxitos de dos muestras independientes, seleccionadas aleatoriamente de dos poblaciones binomiales, entonces un Intervalo de confianza del (1 - α) 100% para P1 – P2 , está dado por: ( p 1 - p 2) - Z (1- α /2)
p 1 ( 1 − p 1 ) + p 2 (1 − p 2 ) ≤ P1 – P2 n1 n2 ≤( p 1 - p 2) - Z (1- α /2) p 1 ( 1 − p 1 ) + p 2 (1 − p 2 )
Donde: p 1 =
x1 n1
y p2 =
n1
x2 n2
n2
Ejemplo En un estudio realizado sobre la duración que tienen las llantas de dos marcas, se obtuvo lo siguiente: 34 de 200 de la marca A y 29 de la marca B, no duraron los 48,000 kms de garantía que ofrecen estas dos marcas. Obtenga un intervalo de confianza del 90%, para la diferencia real de la duración de estas dos marcas de llantas. Solución p 1 = 34/200, proporción de llantas para la marca A, que no duraron los 48,000 Km. p 2 = 29/200, proporción de llantas para la marca B, que no duraron los 48,000 Km. Para α = 0.1, Z (1- α /2) = Z0.95 = 1.645. [(34/200) – (29/200) - 1.645
(34 / 200 )(166 / 200 ) ( 29 / 200 )(17 1 / 200 )
≤[(34/200) – (29/200) - 1.645
+
200
200
≤ P1 – P2
(34 / 200 )(166 / 200 ) ( 29 / 200 )(171 / 200 ) 200
+
200
-0.035 ≤ P1 – P2 ≤ 0.085. En realidad no hay diferencia significativa en la duración de estos dos tipos de llantas, con una confianza del 90%.
78
ESTIMACIÓN POR INTERVALO DE CONFIANZA PARA LA VARIANZA. Teorema.
Si S2 es la varianza de una muestra aleatoria de tamaño n, Seleccionada de una población normal, entonces un intervalo del ( 1 - α ) 100% para el parámetro σ 2 , está dado por:
( n − 1) s 2 2
χ( −
≤σ ≤
1 α / 2 ) , ( n −1 )
2
( n − 1) s 2
χ
2 α / 2 , ( n −1 )
Para obtener un intervalo de confianza para la desviación estándar, basta extraer raíces cuadradas al intervalo anterior. Ejemplo Los pesos (en kilogramos) de 10 paquetes de semilla distribuidos por cierta compañía son: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2, 46.0. Encuentre e interprete un intervalo de confianza al 95% para la desviación estándar de dichos paquetes de semilla. Solucion n = 10, S 2 = 0.2862, α = 0.05,
χ 02.975 , 9 = 19.02 χ 02.025 , 9 = 2.7
9(0.2862) ≤ σ2 ≤ 9(0.2862) 19.02 2.70 2 0.1355 ≤ σ ≤ 0.9540, extrayendo raíz cuadrada, 0.3681 ≤ σ ≤ 0.9767 La variación lineal de los pesos de los paquetes de semilla, está entre 0.3681 y 0.9767 Kg. alrededor del promedio.
P R U E B A D E H I P ÓT E S I S
INTRODUCCIÓN Una hipótesis estadística es una afirmación con respecto a una distribución de probabilidad (por ejemplo, podríamos decir que un cierto fenómeno se comporta de forma que puede explicarse por una distribución Binomial). En particular, una hipótesis estadística puede ser una afirmación con respecto a un parámetro (si sabemos que la distribución es Binomial, entonces podríamos establecer la hipótesis de que la probabilidad de éxito es p = 0.5). HIPOTESIS: Es una afirmación o suposición y no un hecho establecido. Ejemplo: Un fabricante de ladrillos puede afirmar la hipótesis que sus ladrillos tienen una resistencia a la ruptura promedio de 750 libras. HIPOTESIS ESTADISTICA: Son afirmaciones sobre uno o mas parámetros de Una o más poblaciones. TIPOS DE HIPOTESIS: Existe la hipótesis nula y la hipótesis alternativa. 79
HIPOTESIS NULA: Esta hipótesis hace una afirmación diciendo que no haydiferencia entre el verdadero valor y su valor hipotético. Se denota como: H 0. La hipótesis nula es la que se somete a comprobación. HIPOTESIS ALTERNATIVA: Representa en alguna forma la negación de la Hipótesis nula. Se denota como: H 1. Ejemplo: Un fabricante de vidrio para ventanas, puede afirmar que la resistencia a la presión de los mismos es de 125 psi. Podríamos plantear en la hipótesis Nula así: H0: θ = 125 psi. La alternativa la podríamos expresarla de tres maneras distintas: H1: θ ≠ 125, A esta se le conoce como prueba Bilateral o de dos colas. H1: θ < 125, A esta se le conoce como prueba unilateral Izquierda. H1: θ > 125, A esta se le conoce como prueba unilateral derecha. TIPOS DE ERRORES: Cuando se toma una decisión con respecto a una Hipótesis Nula, corremos el riesgo de cometer el error De tipo 1 o el error de tipo 2. El rechazo de la hipótesis nula cuando en realidad Ho es cierta constituye un error de tipo 1. El aceptar la hipótesis nula cuando en realidad Ho es falsa constituye un error de tipo 2. Estos dos tipos de errores los mostraremos en la siguiente tabla: Rechazar H0 No rechazar H0 H0 verdadera Error tipo I Decisión correcta H0 falsa Decisión correcta Error tipo II En estas circunstancias no podemos cometer ambos errores en forma simultánea, pero el error del tipo 1 lo minimizaremos utilizando un nivel de confianza. 1 - ∝: se le conoce como nivel de confianza. ∝: Se conoce como nivel de significación o nivel de error y es la máxima Probabilidad de cometer el error de Tipo I, al tomar la decisión. Región crítica. Es la región de rechazo de la hipótesis nula en una prueba, es decir, es le conjunto de valores del estadístico que conduce a rechazar la hipótesis nula. Pasos para la comprobación de una hipótesis 1. Planteamiento de las hipótesis. 2. Selección del estadístico de prueba. 3. Determinación de la región crítica. 4. Decisión estadística. 5. Conclusión.
80
PRUEBA DE HIPÓTESIS RELATIVAS A LA MEDIA µ CON LA VARIANZA σ2 CONOCIDA Supongamos que se desea probar, sobre la base de una muestra aleatoria, seleccionada de una población normal con la varianza σ2 conocida, la hipótesis nula: H0: µ = µ0 , donde: µ 0 es el valor hipotético. Entonces el estadístico de prueba será: Z = x −μ0 σ
n
a) Contra la alternativa: H1: µ ≠ µ0, la región crítica es: Z < Z α /2 o Z > Z 1-α/2 Z α /2 y Z 1-α/2: valores críticos (frontera entre la región critica y la región de aceptación de la hipótesis nula). Nota: Z α /2 = - Z 1-α/2 b) Contra la alternativa: H1: µ < µ0, la región crítica es: Z < Z α Zα: valor crítico Nota: Z α = - Z 1- α c) Contra la alternativa: H1: µ > µ0, la región crítica es: Z > Z 1-α Z1-α: valor crítico. En cualquiera de los casos si se cumple la relación en las regiones críticas se rechaza la hipótesis nula, en caso contrario se acepta. Ejemplo Un comprador de bloques para la construcción de viviendas cree que la calidad de los mismos está disminuyendo. De experiencias anteriores se sabe que la resistencia promedio a la compresión es de 200 Kg-fuerza. Con una varianza de 10 (Kg-fuerza) 2. Una muestra de 100 bloques dio una resistencia promedio a la compresión de 198.6 Kgfuerza. Probar la hipótesis de la calidad afirmada por el comprador con un nivel de significación de 0.01. Solucion µ0 = 200, σ 2 = 10, σ = √10, n = 100, x = 198 .6 , α = 0.01. a) primer paso. Planteamiento de las hipótesis. H0: µ = 200 H1: µ < 200 b) segundo paso. Selección del estadístico de prueba. 198 .6 − 200 Z= = -4.427. 10
10 0
c) tercer paso. Determinación de la región crítica. Z α = Z 0.01 = -2.33. d) Cuarto paso. Decisión estadística. Se rechaza H0, si Z < Z α . -4.427 < -2.33 (verdadero). Se rechaza H 0. e) Quinto paso. Conclusión. 81
El comprador tiene la razón, la calidad de los bloques esta disminuyendo, la resistencia promedio a la compresión de los bloques que compra no es de 200 Kg-fuerza. PRUEBA DE HIPÓTESIS PARA LA MEDIA µ CON LA VARIANZA σ2 DESCONOCIDA Y EL TAMAÑO DE LA MUESTRA ES MENOR QUE 30. Supongamos ahora que se desea probar, sobre la base de una muestra aleatoria, seleccionada de una población normal con la varianza σ2 desconocida y el tamaño de la muestra menor que 30, la hipótesis nula: H0: µ = µ0 , donde: µ 0 es el valor hipotético. Entonces el estadístico de prueba será: x− 0 t= s / n Que es una variable aleatoria con distribución t de Student con n-1 grados de libertad. a) Contra la alternativa: H1: µ ≠ µ0, la región crítica es: t < t (α/2), (n-1) o t > t (1-α/2), (n-1) t (α/2), (n-1) y t (1-α/2), (n-1): valores críticos (frontera entre la región critica y la región de aceptación de la hipótesis nula). Nota: t (α/2), (n-1) = - t (1-α/2), (n-1)
μ
b) Contra la alternativa: H1: µ < µ0, la región crítica es: t < t α , (n-1) , tα , (n-1): valor crítico Nota: t α , (n-1) = - t (1- α), (n-1) c) Contra la alternativa: H1: µ > µ0, la región crítica es: t > t (1-α), (n-1) , t(1-α), (n-1): valor crítico. En cualquiera de los casos si se cumple la relación en las regiones críticas se rechaza la hipótesis nula, en caso contrario se acepta. Ejemplo Se afirma que la dureza de un determinado caucho es de 68 grados shore. Se probaron 15 especimenes y se obtuvo que la dureza promedio es igual a 64.9 grados Shore con una desviación estándar de 1.5 grados Shore. Hay evidencia suficiente para rechazar la afirmación anterior con un nivel de confianza del 98%. Solución µ0 = 68, n = 15, x = 64 .1 , S = 1.5, α = 0.02. a) primer paso. Planteamiento de las hipótesis. H0: µ = 68 H1: µ ≠ 68 b) segundo paso. Selección del estadístico de prueba. 64 .9 − 68 t= = -8.0042. 1 .5 15
c) tercer paso. Determinación de la región crítica. 82
t (α/2), (n-1) = t0.01,14 = -2.624 t (1-α/2), (n-1) = t0.99, 14 = 2.624 d) Cuarto paso. Decisión estadística. Se rechaza H0, si t < t (α/2), (n-1) o t > t (1-α/2), (n-1) -8.0042 < -2.624 o -8.0042 > 2.624 (la disyunción es verdadera). (V) (F) Se rechaza H0. e) Quinto paso. Conclusión. Se rechaza lo dicho. Se puede afirmar que la dureza promedio del caucho no es de 68 grados shore, con un nivel de significación del 2%. Nota: Si la varianza σ2 es desconocida y el tamaño de la muestra es lo suficientemente grande (n ≥30), tomada de una población normal que no necesariamente es normal, entonces se utiliza el estadístico de prueba para cuando la σ2 es conocida y la desviación estándar σ se estima con la desviación estándar de la muestra (S). Ejemplo El PH del agua que sale de una planta de filtración debe ser por especificación de 7. Se toman en forma independiente 36 muestras de agua de dicha planta y se obtuvo un promedio del PH de 6.76 con una desviación estándar de 0.8. ¿Habrá razón para dudar de que se mantenga la especificación del Ph del agua en la planta? Probarlo con α = 0.02. Solución Se desconoce la varianza poblacional y el tamaño de la muestra es mayor que 30, por lo tanto usaremos la normal para contrastar las hipótesis. Se estimará la desviación estándar poblacional por la muestral. µ0 = 7, n = 36, x = 6.76 , S = 0.8, σ ≈ 0.8, α = 0.02. a) primer paso. Planteamiento de las hipótesis. H0: µ = 7 H1: µ ≠ 7 b) segundo paso. Selección del estadístico de prueba. 6.76 − 7 Z= = -1.8. 0 .8 36
c) tercer paso. Determinación de la región crítica. Z (α/2) = Z0.01 ≈ -2.33 Z (1-α/2) = Z0.99, 14 ≈ 2.33 d) Cuarto paso. Decisión estadística. Se rechaza H0, si Z < Z α /2 o Z > Z 1-α/2 -1.8 < -2.33 o -1.8 > 2.33 (la disyunción es falsa) (F) (F) Se acepta H 0 e) Quinto paso. Conclusión. El PH del agua en esa planta, mantiene su especificación de 7, con una confianza del 98%. PRUEBA DE HIPÓTESIS PARA DIFERENCIAS ENTRE MEDIAS 2 2 CUANDO SE CONOCEN LAS VARIANZAS y . 1 2
σ σ
83
En muchas investigaciones interesa conocer la relación entre las medias de dos poblaciones. Si x 1 y x 2 son medias de dos muestras aleatorias independientes de tamaño n 1 y n2 seleccionadas de poblaciones normales que tienen medias µ 1 y µ 2 y varianzas
σ σ
conocidas 12 y 22 . Supongamos ahora que se desea probar, sobre la base de estas muestras, la hipótesis nula: H0: µ 1 - µ 2 = D0, donde D0: es la diferencia hipotética. Entonces el estadístico de prueba es: z =
x1− x 2
σ
2 1
− +
Do
σ 22
n1 n 2 a) Contra la alternativa: H1: µ 1 - µ 2 ≠ D0, la región crítica es: Z < Z α /2 o Z > Z 1-α/2, Z α /2 y Z 1-α/2: valores críticos b) Contra la alternativa: H1: µ 1 - µ 2 < D0, la región crítica es: Z < Z α , Zα: valor crítico c) Contra la alternativa: H1: µ 1 - µ 2 > D0, la región crítica es: Z > Z 1-α , Z1-α: valor crítico. En cualquiera de los casos si se cumple la relación en las regiones críticas se rechaza la hipótesis nula, en caso contrario se acepta.
Ejemplo Dos tipos diferentes de botellas de vidrio son adecuados para la utilización en una embotelladora de gaseosas. La resistencia a la presión interna es una característica de calidad importante. Se sabe que las desviaciones estándares son iguales a 3 lb. Se tomo una muestra aleatoria de 16 botellas del primer tipo y dio una resistencia promedio a la presión de 180.8 lb. Una muestra de igual tamaño del segundo tipo dio una resistencia promedio a la presión de 175.1 lb. La embotelladora no utilizara las botellas del tipo 1 a no ser que su resistencia promedio a la presión exceda a las del tipo 2 en por lo menos 5 lb, con una confianza del 99%. Solucion En este problema se conocen las varianzas poblacionales de las resistencias a la presión de ambos tipos de botellas, σ 1 = σ2 = 3 lb., σ12 = σ22 = 9 lb2, α= 0.01. n1 = 16, x 1 = 180.8 lb. n2 = 16, x 2 = 175.1 lb. a) primer paso. Planteamiento de las hipótesis. H0: µ 1 - µ 2 ≥ 5 H1: µ 1 - µ 2 < 5 b) segundo paso. Selección del estadístico de prueba.
84
z=
(180 .8 −17 5 .1) − 5 9 16
+
9
= 0.93.
16
c) tercer paso. Determinación de la región crítica. Z α = Z 0.01 = -2.33. d) Cuarto paso. Decisión estadística. Se rechaza H0, si Z < Z α . 0.93 < -2.33 (falso). Se acepta H 0. e) Quinto paso. Conclusión. Se puede concluir con una confianza del 98% que: la embotelladora usará las botellas del tipo 1, ya que su resistencia a la presión interna es mayor o igual a 5 libras. PRUEBA DE HIPÓTESIS PARA DIFERENCIAS ENTRE MEDIAS, CUANDO SE DESCONOCEN LAS VARIANZAS 12 y 22 .
σ σ
Es muy común comparar dos promedios de dos poblaciones en las cuales se desconocen sus varianzas. Supongamos que x 1 y x 2 son medias de dos muestras aleatorias independientes de tamaño n1 < 30 y n 2 < 30, seleccionadas de poblaciones normales que tienen medias µ 1 y µ 2 y varianzas desconocidas, pero iguales ( 12 = 22 ). Supongamos ahora que se desea probar, sobre la base de estas muestras, la hipótesis nula: H0: µ 1 - µ 2 = D0, donde D 0: es la diferencia hipotética. Entonces el estadístico de prueba es:
σ σ
t=
x1 − x 2 − D o , 1 1 sp n + n 1
2
sp =
donde:
2
(n1 − 1) s12 + ( n 2 − 1 ) s22
n1 + n 2 − 1
a) Contra la alternativa: H1: µ 1 - µ 2 ≠ D0, la región crítica es: t < t (α/2), (n1+n2 -2) o t > t (1-α/2), (n1+n2 -2) t α /2 y t 1-α/2: valores críticos b) Contra la alternativa: H1: µ 1 - µ 2 < D0, la región crítica es: t < t α , (n1+n2 -2), tα: valor crítico c) Contra la alternativa: H1: µ 1 - µ 2 > D0, la región crítica es: t > t 1-α (n1+n2 -2), t1-α: valor crítico.
85
En cualquiera de los casos si se cumple la relación en las regiones críticas se rechaza la hipótesis nula, en caso contrario se acepta. Ejemplo La estatura media de 25 estudiantes de la carrera de ingeniería civil es de 68.2 pulgadas con una desviación estándar de 2.3 pulgadas, mientras que 25 de ingeniería Agrícola promediaron 67.5 pulgadas de estatura con desviación estándar de 2.8 pulgadas. Se podría afirmar que los que estudian civil sean mas altos que los que estudian agrícola, probarlo con α = 0.05. Solución En este caso se desconocen las varianzas de las estaturas de los estudiantes de ambas carreras, entonces supondremos que son iguales, ( 12 = 22 ), además los tamaños de las muestras son menores que 30. α= 0.05. Usaremos t de student. n1 = 16, x 1 = 68.2 pulg, S 1 = 2.3. n2 = 16, x 2 = 67.5 pulg, S 2 = 2.8 a) primer paso. Planteamiento de las hipótesis. H0: µ 1 - µ 2 = 0 H1: µ 1 - µ 2 > 0 b) segundo paso. Selección del estadístico de prueba. 2 2 2 16 ( 2.3 ) + 16 ( 2.8 ) = 7.001, entonces S p = 2.646. sp =
σ σ
t=
30 ( 68.2 − 67 .5 ) − 0
2.646
1 25
+
1
= 0.935.
25
c) tercer paso. Determinación de la región crítica. t 1-α, 30 = t 0.95, 30 = 1.697. d) Cuarto paso. Decisión estadística. Se rechaza H0, si t > t0.95 ,30 0.935 > 1.697 (falso). Se acepta H0. e) Quinto paso. Conclusión. No hay razón para dudar que los que estudian Civil sean mas altos que los que estudian Agrícola, con una confianza del 95%. Nota: Si las varianzas poblacionales son desconocidas y los tamaños de las muestras son lo suficientemente grande (n ≥30), tomadas de dos poblaciones que son normales, entonces se utiliza el estadístico de prueba para cuando las varianzas son conocidas y las desviaciones estándar poblacionales se estiman con las desviaciones estándar de las muestras. Ejemplo Interesa comparar los caudales de un río en los meses de Agosto y Septiembre. En los Treinta y un días del mes de Agosto el caudal promedio fue de 8.85 pies 3 por segundo con una desviación estándar 2.5 pies 3 por segundo. En los treinta días del mes de Septiembre el caudal promedio fue de 7.95 pies 3 por segundo con una desviación estándar
86
1.8 pies3 por segundo. Hay evidencia suficiente para decir que en esos dos meses, el río tiene diferentes caudales, con un nivel de significación de 0.05. Solución En este caso se desconocen las varianzas poblacionales pero, los tamaños de las muestras son mayores o iguales a 30. Usaremos la normal y estimaremos las varianzas. n1 = 31, x 1 = 8.85, S1 = 2.5. n2 = 30, x 2 = 7.95, S2 = 1.8 a) primer paso. Planteamiento de las hipótesis. H0: µ 1 - µ 2 = 0 H1: µ 1 - µ 2 ≠ 0 b) segundo paso. Selección del estadístico de prueba. (8.85 − 7 .95 ) − 0 z= = 1.617. 2
2
2.5 + 1 .8 31
30
c) tercer paso. Determinación de la región crítica. Zα/2 = Z0.025 = -1.96, Z 1-α /2 = t 0.975 = 1.96. d) Cuarto paso. Decisión estadística. Se rechaza H0, si Z < Z α /2 o Z > Z 1-α/2 1.617 < -1.96 o 1.617 > 1.96. (Falso). Se acepta H 0. (F) (F) e) Quinto paso. Conclusión. Se puede afirmar con una confianza del 95% que no hay diferencia en los caudales de dicho río, en los meses de Agosto y Septiembre. PRUEBA DE HIPÓTESIS RELATIVAS A LA PROPORCION CON UNA SOLA MUESTRA. Con muestras pequeñas, tomadas de una población binomial se puede probar la hipótesis de que la proporción P: número de éxitos, sea igual a algún valor dado, (P 0). La variable adecuada para efectuar esta prueba es la binomial. Para probar la hipótesis: H 0: P = P0 H1: P < P0, con un nivel de error α. Se usa la distribución binomial para obtener el valor: P = p(X ≤ x, n, p = P0). Donde x: es el # de éxitos en la muestra. Se rechaza H0, si P ≤ α . Para probar la hipótesis: H 0: P = P0 H1: P > P0, con un nivel de error α. Se usa la distribución binomial para obtener el valor: P = p(X ≥ x, n, p = P0). Donde x: es el # de éxitos en la muestra. Se rechaza H0, si P ≤ α . Para probar la hipótesis: H 0: P = P0 H1: P ≠ P0, con un nivel de error α. Se usa la distribución binomial para obtener p(X ≤ x, n, p = P 0), luego se obtiene el valor: P = 2p(X ≤ x, n, p = P0). 87
Donde x: es el # de éxitos en la muestra. x x Se rechaza H0, si: > P0 y P ≤ α o < P0 y P ≤ α . n n Ejemplo Una empresa que vende e instala paneles solares, afirma que en una comarca de un municipio del departamento de chontales, el 10% de las casas poseen este tipo de energía alternativa. Que diría usted, si en una muestra de 16 casas tomada en dicha comarca solamente una tiene panel solar, utilice α = 0.05. Solucion H0 : P = 0.1 H1 : P ≠ 0.1 Hallemos el valor de P , P = 2P(X ≤ 1, n = 20, p = 0.1). Buscando en la tabla binomial la probabilidad: P(X ≤ 1, n = 16, p = 0.1) = F(1) = 0.5147. P = 2(0.8108) = 1.0294. x Si esto es cierto < P0 y P ≤ α, se rechaza la H 0. n 1 16
= 0.0625 < 0.1 y 1.6216 ≤ 0.05 (la conjunción es falsa)
(F) (F) Conclusión: Se acepta la hipótesis nula, por lo tanto la empresa que vende paneles solares tiene razón en dicha comarca, esto se afirma con un nivel de error de 0.05. Nota: Cuando el tamaño de la muestra es lo suficientemente grande el calculo de estas probabilidades se pueden obtener a través de aproximación a la normal. Veamos el siguiente ejemplo. Ejemplo Para el examen de admisión que se practica anualmente en la UNI, se afirma que no más del 5% de los bachilleres que lo realizan lo aprueban. En una muestra tomada al azar de 200 de estos alumnos 8 aprobaron, probar lo dicho con α = 0.05. Solucion H0 : P ≤ 0.05 H1 : P > 0.05 Para hallar el valor de P, con la binomial el planteamiento sería: P = p(X ≥ 8, n = 200, p = 0.05). Calcularemos esta probabilidad, aproximando a la normal: p(X ≥ 8, n = 200, p = 0.05) ≈ p(x > 7.5) = 1- φ(z), x −µ donde Z =
σ
Como el problema es binomial, obtenemos µ = np y σ2 = npq, entonces: µ = 200(.05) = 10 y σ2 = 200(0.05) (0 .95) = 9.5, σ = 3.0822.
88
Z=
x −µ
σ
= (7.5 – 10)/3.0822 = -0.81.
p(X ≥ 8, n = 200, p = 0.05) ≈ p(x > 7.5) = 1- φ(z)= 1 - φ(-0.81) = 1 - 0.209 = 0.791. Por lo tanto: P = 0.791 ≤ 0.05, es falso, por lo tanto se acepta H 0. Concluimos que es correcta la afirmación, con α = 0.05. PRUEBA PARA LA DIFERENCIA DE PROPORCIONES. La prueba para comparar dos proporciones poblacionales, la veremos para muestras grandes, donde el estadístico de prueba será la variable normal estándar: Z=
p1 − p2 − p1 − p2 p1 q1 + p2 q2 n1 n2
=
p1 − p2 − D0 p1 q1 + p2 q2 n1 n2
Es común, en este tipo de problemas, desconocer las proporciones poblacionales, en esta situación se consideran: P 1 = P2 y q1 = q2, sustituyendo en la expresión anterior: p − p − D0 , donde el valor de P se estima por: P = n1p1 + n2 p2 . Z= 1 2
n1 + n2
1 1 pq + n1 n2
Para: H0: P1 - P2 = D0, donde D0: es la diferencia hipotética. a) Contra la alternativa: H1: P1 - P2 ≠ D0, la región crítica es: Z < Z α /2 o Z > Z 1-α/2 , Z α/2 y Z 1-α/2: valores críticos b) Contra la alternativa: H1: P1 - P2 < D0, la región crítica es: Z < Z α , Zα: valor crítico c) Contra la alternativa: H1: P1 - P2 > D0, la región crítica es: Z > Z 1-α , Z1-α: valor crítico. Ejemplo En un estudio para medir la proporción de los habitantes de dos barrios de Managua que están en desacuerdo con la construcción de una antena para telefonía celular, se encontró que 48 de 200 del primero están en desacuerdos en la construcción, mientras que 38 de 160 del segundo barrio también están de acuerdo. Existe alguna diferencia significativa entre las proporciones de residentes de ambos barrios que están en desacuerdo con la construcción de dicha antena, probarlo con α = 0.05. Solucion p = 48/200 = 0.24. (En desacuerdo del primer barrio) 1
p2 = 38/160 = 0.2375. (En desacuerdo del segundo barrio) 89
a) primer paso. Planteamiento de las hipótesis. H0: P1 - P2 = 0 H1: P1 - P2 ≠ 0 b) segundo paso. Selección del estadístico de prueba. 200 (0 .24 ) + 0 .2375(160 ) n 1 p1 + n 2 p 2 Primero estimemos P y q: P = = = 0.239,
n1 + n2
Entonces: q = 0.761. ( 0 .24 − 0 .2375 ) − 0
z=
+ 200 160
0 .239(0 .761 )
1
1
200 +160
= 0.055.
c) tercer paso. Determinación de la región crítica. Zα/2 = Z0.025 = -1.96, Z 1-α /2 = t 0.975 = 1.96. d) Cuarto paso. Decisión estadística. Se rechaza H0, si Z < Z α /2 o Z > Z 1-α/2 0.055 < -1.96 o 0.055 > 1.96. (Falso). Se acepta H 0. (F) (F) e) Quinto paso. Conclusión. No hay diferencia significativa en la proporción de habitantes de los dos barrios que están en desacuerdo con la construcción de dicha antena, con una confianza del 95%. PRUEBA DE HIPÓTESIS RELATIVA A LA VARIANZA En esta sección estudiaremos el problema de hipótesis relacionadas a la varianza de una población. Estas pruebas son necesarias, por ejemplo: si desea controlar la variabilidad o uniformidad de un producto o de un trabajo. Para probar la hipótesis nula: H0: σ2 = σ20, en base a una muestra aleatoria tomada de una población normal con varianza: σ20, el estadístico de prueba adecuado es la variable aleatoria que tiene distribución Ji-cuadrada con n-1 grados de libertad: 2 2 (n −1) s x = . 2
σ 0
a) Contra la hipótesis alternativa: H 1: σ2 ≠ σ20, la región critica es:
χ 2 < χ 12−α / 2
o
χ 2 > χ α2 / 2
b) Contra la hipótesis alternativa: H 1: σ2 < σ20, la región critica es:
χ 2 < χ 12−α
c) Contra la hipótesis alternativa: H 1: σ2 > σ20, la región critica es: 2
χ >χ
2 α
Los valores críticos se buscan en la tabla Ji-cuadrada con: v = n-1 (grados de libertad).
90
Ejemplo Una compañía que produce arandelas afirma que la variación cuadrática del diámetro interno es de 0.0002 cm 2. Una muestra aleatoria de 10 de estas arandelas dio una desviación estándar de 0.02 cm. Si se supone que las medidas de estos diámetros se distribuyen normales, ¿habrá evidencia para refutar lo afirmado por la compañía? Solucion α = 0.05, n = 10, S = 0.02 cm., S 2 = 0.0004 cm 2 a) primer paso. Planteamiento de las hipótesis. H0: σ2 = 0.0002 cm 2 H1: σ2 ≠ 0.0002 cm 2 b) segundo paso. Selección del estadístico de prueba. (9) 0 .0004 x2 = = 18. 0 .0002 c) tercer paso. Determinación de la región crítica.
χ 12−α / 2 = χ 02.975 , 9 = 19.02 o χ α2 / 2 = χ 02.025 , 9 = 2.7 d) Cuarto paso. Decisión estadística. Se rechaza H0, si
χ 2 < χ 12−α / 2 o χ 2 > χ α2 / 2
18 < 19.02 o 18 > 2.7 (Verdadero). Se rechaza H 0. (v) (V) e) Quinto paso. Conclusión. Con un 95% de confianza se puede refutar lo que dice la compañía productora de arandelas. EJERCICIOS RESUELTOS 1. un ingeniero que trabaja para un fabricante de llantas investiga la duración de un compuesto nuevo de caucho. Para ello construye 16 llantas y las prueba en una carretera hasta que dura la vida útil de estas. Los datos obtenidos en Km. son: 60613, 59836, 59554, 60252, 59784, 60221, 60311, 50040, 60545, 60257, 60000, 59997, 69997, 60135, 60220, 60523. al ingeniero le gustaría saber si la vida útil promedio de la nueva llanta excede los 60000 km. Pruebe las hipótesis apropiadas a un nivel de significación del 5%. Solución Se desconoce la varianza y n < 30. .5625 , S = 3654.913, α = 0.05. n = 16, x = 60142 a) primer paso. Planteamiento de las hipótesis. H0: µ = 60 H1: µ > 60 b) segundo paso. Selección del estadístico de prueba. 60142.8125 − 6000 t= = 0.1563 3654 .913 16
c) tercer paso. Determinación de la región crítica. 91