MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
INTRODUCCIÓN ¿Por qué estudiar estadística? Existen cuando menos cuatro razones para estudiar estadística, al hacerlo seremos capaces de: 1. Aprender las reglas y métodos para tratar información estadística. 2. Evaluar las reglas y cuantificar la importancia de los resultados estadísticos que veamos publicados. 3. Conocer los aspectos del pensamiento estadístico como un componente esencial de una educación humanística. 4. Entender mejor el mundo real de nuestro entorno.
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 1
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
UNIDAD 1 1. DISTRIBUCIÓN DE FRECUENCIA Y SU CLASIFICACIÓN 1.1.Concepto de estadística y su clasificación. La estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis. En un sentido menos amplio el término estadística se usa para denotar los propios datos, o números derivados de ellos, tales como los promedios. Así se habla de estadística de empleo, estadística de muertes, etc. La estadística se divide en dos categorías generales, dependiendo del propósito del estudio • •
Estadística Descriptiva Estadística Inferencial
La estadística descriptiva comprende aquellos métodos usados para organizar y describir la información recabada. Estos métodos se usan para analizar la información y desplegarla en forma gráfica tal, que permita interpretaciones con significado, ayudando a describir el mundo en torno nuestro. Usamos estadística Descriptiva cuando recolectamos información: como la producción promedio de trigo por hectárea, en una cierta región agrícola, etc. Esperamos saber cómo son las cosas mediante la estadística descriptiva. Por ejemplo, las situaciones siguientes utilizan estadística descriptiva. 1. Un jugador de Boliche quiere conocer su promedio de anotaciones en los pasados 12 juegos. 2. Una mujer dedicada al hogar desea saber cuánto gasta en promedio en tortillas en un mes. 3. Un comerciante desea conocer que artículo se vende más en una semana, esto lo lograra calculando el promedio de venta en la semana. Por otro lado la Estadística Inferencial involucra teoría de probabilidad. La Estadística Inferencial comprende aquellos métodos y técnicas usadas para hacer generalizaciones, predicciones o estimaciones sobre poblaciones a partir de una muestra.
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 2
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
La habilidad para hacer generalizaciones sobre la población a partir de una muestra es un aspecto importante en estadística. Rara vez tenemos la información completa que necesitamos para llegar a la verdad absoluta sobre algún evento total. Las decisiones e inferencias se basan en información limitada e incompleta, los métodos de la estadística inferencial y el conocimiento obtenido al usarlos, nos permite utilizar información disponible limitada para entender y tratar con las incertidumbres de este mundo cambiante y azaroso. Usando métodos de probabilidad intentaremos medir el grado de incertidumbre asociado con una inferencia. Los siguientes ejemplos requieren estadística inferencial. Un jugador de boliche quiere estimar la oportunidad que tiene de ganar un torneo próximo con base en su promedio de la temporada actual y en los promedios de sus futuros contrincantes. 1. El ama de casa desea estimar si el precio de un artículo subirá de acuerdo a compras pasadas y épocas de temporada. 1.2 RECOPILACIÓN DE DATOS El aspecto fundamental de la estadística es la información que contiene; sin información que recabar, organizar, analizar e interpretar, no habría razón para usar a estudiar estadística; a la información usada en estadística se le llama datos. Para que sea útil dicha información en la toma de decisiones, debe organizarse y mostrarse apropiadamente. El tipo de datos indicará los métodos a usar en su análisis. Cabe distinguir entre el término “datos” y “dato”. Dato: es una porción de información. Datos: es un sinónimo de muestra Los datos pueden clasificarse en Cualitativos y Cuantitativos. • •
Datos Cualitativos representan categorías o atributos que pueden clasificarse según un criterio o cualidad. Datos Cuantitativos se refieren a información numérica, como cuánto o cuantos, y se miden en una escala numérica.
Los datos Cuantitativos pueden clasificarse como. DISCRETOS
CONTINUOS
(son obtenidos de un proceso de conteo)
(son obtenidos de un proceso de medición)
Niños, Cantidad de coches, el salario de un individuo, la presión sanguínea,
Peso en kg., estatura en metros, tiempo en minutos, distancia en km.,
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 3
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
etc.
tiempo en que tarda en llegar a la escuela, etc. Otra forma común de clasificación de los datos es el uso de cuatro niveles de medición: 1. Nominal
2. De intervalo
3. Ordinal
4. De razón
1. Nivel de medición nominal: son los datos consistentes exclusivamente en nombres, etiquetas o categorías que no pueden acomodarse según un esquema de orden. por ejemplo • De bajo a alto, en la descripción de un escalón. • si /no/indeciso: Respuesta de una encuesta. • Colores: los colores preferentes de blusas de las niñas de 12 años. 1. Nivel de medición ordinal: son datos que pueden acomodarse en algún orden, aunque no es posible determinar diferencias entre los valores de los datos o tales diferencias carecen de significado. • Las clasificaciones de un corso: Un profersor asigna calificaciones de A, B, C y D, las cuales pueden acomodarse en orden; sin embargo no es posible determinar diferencias en ellas. • Rangos ordenados. Calidad de vida de ciudades ( 1ro, 2do, 3ro, tec), determinan un orden, sin embargo las diferencias entre ellas no tienen significado alguno. 1. Nivel de medición de intervalo: se parece al nivel ordinal, pero con la propiedad adicional de que la diferencia entre dos valores de datos cualesquiera tiene un significado. Por ejemplo. • Las temperaturas corporales de 98.2°F y 98.6°F son ejemplos de datos de medición en este nivel. 1. El nivel de medición de Razón: se parece al nivel de intervalo, aunque tiene la propiedad adicional de que sí tiene un punto de partida o cero que indica que nada de la cantidad presente. Por ejemplo. • Pesos (en quilates) de anillos engastados con diamantes (0 efectivamente representa ausencia de peso y cuatro quilates es dos veces el peso de 2 quilates). • Precios: de los libros de texto ($0 efectivamente representa ningún costo y un libro de $90 es tres veces más costoso que uno de $30). Tabla 1.1 Niveles de medición de datos INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 4
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
Nivel
Resumen
Ejemplo
Explicación
Nominal
Sólo rangos de orden, los datos no pueden acomodarse en un esquema de orden.
Origen de estudiantes: 5 californianos 20 texanos 40 neoyorquinos
Solo rangos de orden o nombres
Ordinal
Rangos de orden que pueden acomodarse, pero no hay diferencias o carecen de significado
Automóviles de estudiantes: 5 compactos 20 medianos 40 grandes
Orden determinado por Compacto Mediano Grande
De intervalo
Las diferencias son significativas, pero no hay punto de partida natural y las razones no tienen significado.
Temperaturas del campus: 5°F 20°F
0°F no es “sin calor”, 40°F no es dos veces más caliente que 20°F
De razón
Hay un punto de partida natural y las razones tienen significado.
Distancias de viaje de estudiantes: 5km,20km,40km
40km es dos veces más lejos que 20 km
1.3Distribución de Frecuencias. Una frecuencia de una medida o de una categoría, es el número de veces que aparece en una colección de datos. El uso de frecuencias es más conveniente para datos cualitativos o discretos; el símbolo f se usa para denotar la frecuencia de una medida. Frecuencia de un Intervalo. Se refiere al número de valores que caen dentro del intervalo. Frecuencia relativa de un intervalo. Se refiere a la proporción de todos los valores dados que caen dentro del intervalo. Tabla de Frecuencias. Llamada también distribución de frecuencias, es un arreglo sistemático de los valores agrupados en intervalos de clase. Se usan para resumir datos de tal modo que la frecuencia de cada intervalo esté claramente mostrada y pueda calcularse fácilmente la frecuencia relativa de cada intervalo. Ilustremos los conceptos anteriores con los siguientes ejemplos.
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 5
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
1. La muestra de datos siguientes representa el número de tiros libres fallados por un equipo de basquetbol durante los últimos siete juegos. 7, 2, 8, 4, 2, 7, 2 El número 7 aparece con una frecuencia de f=2 El número 2 aparece con una frecuencia de f=3 El número 8 aparece con una frecuencia de f=1 El número 4 aparece con una frecuencia de f=1 2. Los datos sobre los tiros libres citados anteriormente pueden resumirse como lo muestra la tabla 1.2., donde x denota las medidas y f, la frecuencia de cada medida; la tabla 1.2 es un ejemplo de una tabla de frecuencias no agrupadas para datos discretos. x
f
2
3
4
1
7
2
8
1
Tabla 1.2 Tabla de frecuencias de datos sobre tiros libres
Una tabla de frecuencias no agrupadas, en contraste presenta las frecuencias de acuerdo con grupos o clases de medidas. Esto se logra siguiendo los tres pasos: 1. Uniformidad: cada clase deberá tener la misma amplitud. 2. Unicidad: dos clases no se traslapan. 3. Completes: cada uno de los datos debe pertenecer a alguna clase. Procedimiento de construcción de una distribución de frecuencias. • •
•
Decida el número de clases que desea tener. Debe ser de entre 5 y 20, y debe utilizarse números enteros o redondeados. Calcule la anchura de clase que es igual a valor mas alto-valor mas bajonúmero de clases redondee el resultado para obtener un número más adecuado (generalmente se redondea hacia arriba). Es probable que necesite cambiar el número de clases, pero la prioridad debe ser utilizar valores que sean fáciles de comprender. Punto de partida: comience por elegir un número para el límite inferior de la primera clase. Elija el valor del dato más bajo o un valor conveniente que sea un poco más pequeño.
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 6
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
•
•
•
Con el uso del límite más bajo de la primera clase y la anchura de la clase, proceda a listar los demás límites de clase inferior (sume la anchura de clase al punto de partida para obtener el segundo límite de clase inferior). Después sume la anchura de clase al segundo límite de clase inferior para obtener el tercero y así sucesivamente. Anote los límites inferiores de clase en una columna vertical y luego proceda a anotar los limites superiores de clase, que pueden identificarse con facilidad. Ponga una marca en la clase apropiad para cada dato. Utilice las marcas para obtener la frecuencia total de cada clase.
Ejemplo1: niveles de nicotina de fumadores. Utilice los 40 niveles de nicotina de los fumadores de la tabla 1.3 y siga el procedimiento anterior para crear la distribución de frecuencias que se muestra en la tabla 1.4. 1 35 13 0 12 3
0 11 2 23 4 16 7
13 17 1 3 47 28 7 9 16 19 4 8 25 24 0 5 Tabla 1.3
26 5 22 7 17 48
21 0 10 3 25 3 86
44 22 2 87
27 7 14 9 12 1 1
28 4 Niveles de nicotina
32
3
31 3 26 6 20 8
49 1 29 0 17 3
Solución. Paso 1. Comience por elegir el número de clases, tomemos cinco. Paso 2. Calcule la anchura de clase, anchura de clase=numero mas grande-número mas pequeñonúmero de clase=491-05=98.2≈99 Paso 3. Elija un punto de partida, tomemos el cero por ser el más pequeño de todos los datos. Paso 4. Sume a 0 la anchura de clase, 0+99, e inicie en el siguiente número, 100+99, y así sucesivamente. Paso 5. Liste los límites de clase inferiores de forma vertical, con esta lista se identificaran fácilmente los limites superiores correspondientes . Paso 6. Forme la tabla1.4 Nicotina
Frecuencias
Frecuencia Relativa
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 7
Frecuencia Acumulada
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
0-99
11
27.5%
11
100-199
12
30%
23
200-299
14
35%
37
300-399
1
2.5%
38
400-499
2
5%
40
100% Tabla 1.4 Distribuciones de frecuencias relativas de los niveles de nicotina en fumadores.
La frecuencia relativa se calcula, haciendo: Frecuencia relativa=Frecuencia de clasetotal de datos 1.3.1 Polígonos de frecuencias, Histogramas y ojivas. Polígonos de Frecuencia Una gráfica lineal o polígono de Frecuencia se construye usando una tabla de frecuencia agrupada con marcas de clase. La gráfica de líneas ofrece una alternativa útil respecto al histograma; la elección de cuál se usará es de tipo personal; una gráfica lineal crea la impresión de que las frecuencias cambian abruptamente; puede construirse una gráfica lineal o un polígono de frecuencias para los datos exhibidos, en una tabla de frecuencia agrupada identificando cada marca de clase y su correspondiente frecuencia (x,f) con un punto de la gráfica. Ejemplo 2: La tabla de frecuencia agrupada 1-5 reporta los ingresos anuales promedio, hasta los 100 más cercanos, de los trabajadores fabriles en 27 ciudades del este de México. Construye un polígono de frecuencia para estos datos. f
x
Ingreso Promedio
No. De Ciudades
Marcas de clase
12,500-14,300
1
13,400
14,400-16,200
5
15,300
16,300-18,000
3
17,200
18,200-20,000
7
19,100
20,100-21,900
6
21,000
22,000-23,800
1
22,900
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 8
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
23,900-25,700
3
24,800
25,800-27,600
1
26,700
Tabla 1.5 frecuencias agrupadas
Solución: Paso 1. Encontrar las marcas de clase, designadas por x. Paso 2. Construir la gráfica de x contra f. Como lo muestra la figura 1.1.
Figura 1.1. Polígono de frecuencias
La mayoría de las ciudades caen entre los extremos de la escala. Solo una ciudad tiene trabajadores fabriles con un ingreso promedio anual de aproximadamente 13,400 dólares. Los datos parecen tener su centro aproximadamente en 19,000 dólares. Ojivas Una gráfica lineal construida a partir de una tabla de Frecuencia acumulada o de una tabla de frecuencia relativa acumulada, se llama OJIVA. Las ojivas ofrecen un medio gráfico para interpolar o aproximar el número o porcentaje de observaciones menores o iguales que un valor específico. Ejemplo 2: Construyamos la frecuencia acumulada y los extremos del ejemplo 1.
HISTOGRAMAS Un histograma es un tipo de gráfica de barras para una distribución de frecuencia. Los histogramas pueden construirse para distribuciones de frecuencia agrupada y no agrupada. Consideremos primero histogramas para distribuciones de frecuencia no agrupadas. La idea de construir un histograma para frecuencias no agrupada de los datos, es representar cada frecuencia por una barra cuya área sea proporcional a ella. Típicamente el ancho de cada barra se escoge con un uno y así el área de la barra es igual a la frecuencia de la medida. Ejemplo 3: la tabla 1.6 contiene el número de niños en edad escolar en cada una de las 50 familias de una muestra. Construya un histograma para datos. INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 9
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
No. De niños en edad escolar
Frecuencia f
0
15
1
8
2
14
3
9
4
4 TABLA 1.6
Solución. El histograma re representa como lo muestra la figura 1.3 Figura 1.3
1.4Medidas de Tendencia Central para un conjunto de datos y datos no agrupados. Recuerde que el objetivo principal de esta unidad es lograr manejar las herramientas básicas para medir y describir diferentes características de un conjunto de datos. En este capítulo queremos complementar las interpretaciones visuales, hechas posibles por tablas y gráficas, con medidas numéricas de características poseídas por muchas colecciones de datos cuantitativos. El propósito de una medida de tendencia central es resumir un conjunto de datos de forma que podamos tener un panorama general. Definición: Medida de Tendencia Central: valor que se encuentra en el centro o a la mitad de un conjunto de datos. INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 10
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
Hay muchas formas distintas de determinar el centro; por lo tanto, tenemos diferentes definiciones de las medidas de tendencia central, incluyendo media, mediana, moda y mitad de rango (rango medio). 1. MEDIA: es el promedio (sumar los puntajes y dividirlos entre el total de datos) que denotaremos con x. En expresión matemática
queda: x=i=1nxin 2. MEDIANA: es el valor que se muestra en medio cuando los valores
originales de los datos se presentan en orden de magnitud creciente (o decreciente) y se denota con x. Para calcular la mediana, primero cuente cuantos datos son: • Si el número de datos es impar, la mediana es el número que se localiza exactamente a la mitad de la lista de datos (previamente ordenados). • Si el número de datos es par, la mediana se obtiene calculando la media de los dos números que están a la mitad. 1. MODA: Suele denotarse con M y es el valor o el dato que ocurre con mayor frecuencia. • Cuando dos valores con la misma frecuencia y está es la mas alta, ambos valores son modas, por lo que el conjunto de datos es llamado bimodal. • Cuando mas de dos valores ocurren con la misma frecuencia y está es la mas alta, todos los valores son modas por lo que el conjunto de datos es llamado multimodal. • Cuando ningún valor se repite, se dice que no hay moda. 1. MITAD DEL RANGO: Medida de tendencia central que constituye el valor que está a medio camino, entre el puntaje más alto y el más bajo, en el conjunto original de datos. Se calcula usando la formula. mitad del rango=valor maximo+valor minimo2
La tabla 1.7 muestra un resumen de las medidas de Tendencia Central. Tabla 1-7 Comparación de la media, mediana, moda y mitad del rango Medida de tenden cia central
Definición
¿Qué tan común es?
Existe ncia
¿Toma en cuenta cada valor?
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 11
¿Se ve afectada por valores extremos?
Ventajas y desventajas
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
Media
x=i=1nxin
“Prome dio más conocid o”
Siemp re existe
Sí
Sí
Se usa a lo largo de la asignatura; funciona bien con muchos métodos estadísticos
Median a
Valor en medio
De uso común
Siemp re existe
no
no
Suele ser una buena opción si hay algunos valores extremos.
Moda
Valor más frecuente
Se usa en ocasion es
Podría no existir, haber más de una
no
no
Apropiada para datos en el nivel nominal.
Mitad del rango
v max+v mini2
Poco usada
Siemp re existe
No
Sí
Muy sensible a los valores extremos.
1.3Medidas de dispersión para un conjunto de datos y datos agrupados. Medida de variabilidad. Es un solo número que representa el desarrollo o el valor de la dispersión en un conjunto de datos. La variabilidad es un concepto fundamental en estadística. Hay muchas medidas de variabilidad o medidas de dispersión para una colección de datos cuantitativos. Entre estas medidas están incluidos. Rango, desviación de la media, varianza y desviación estándar. •
RANGO: El rango de un conjunto de datos es la diferencia entre el valor máximo y el valor mínimo. rango=valor máximo-valor mínimo
•
DESVIACIÓN DE LA MEDIA: Es una medida de variación de todos los valores con respecto a la media. desviación de x=xi-x
Una desviación positiva para una medida, indica que la medida está por encima de la media, mientras que una desviación negativa nos señala que está por debajo de la
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 12
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
•
•
media, una desviación de cero para una medida indica que la medida es igual a la media. DESVIACIÓN ESTANDAR: Medida de variación de los valores con respecto a la media. Es un tipo de desviación promedio de los valores, con respecto a la media. Que se calcula utilizando la formula. s=x-x2n-1 VARIANZA: Usamos el término variación como una descripción general de la cantidad que varían los valores entre sí. Esta dada por la formula. s2=x-x2n-1
Mostremos con un ejemplo el cálculo y aplicación de todas las medidas de dispersión para un conjunto de datos. Ejemplo 5. A continuación se presentan los tiempos de espera (en minutos) de los clientes del Banco Santander (donde todos los clientes forman una sola fila). 6.5
6.6
6.7
6.8
7.1
7.3
7.4
7.7
7.7
7.7
Solución: 1. rango=7.7-6.5=1.2 2. desviación de la media para los datos son: 6.5-7.15=-0.656.8-7.15=-0.357.4-7.15=0.256.6-7.15=-0.557.1-7.15=0.057.7-7.15=0.556.7-7.15=-0.457.3-7.15=0.157.7-7.15=-0.657.77.15=0.55 3. varianza s2=x-x2n-1=-0.6592+-0.5529+…+-0.6529= 4. desviación estandar s=
Ejemplo 6. Precios del asado de cerdo y del queso en capitales del mundo. Los datos de la tabla 1.8 indican los precios, en dólares, por libra, de asado de cerdo y queso cheddar en 15 capitales del mundo. CAPITAL
ASADO DE CERDO
QUESO CHEDDDAR
Berna
6.61
4
Bonn
2.38
2.74
Brasilia
1.27
1.08
Buenos Aires
1.36
2.03
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 13
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
Camberra
2.06
2.60
Londres
1.56
1.81
Madrid
2.33
3.15
México
1.08
2.29
Ottawa
1.99
3.98
París
2.47
2.37
Pretoria
1.95
1.76
Roma
2.46
2.96
Estocolmo
5.35
2.54
Tokio
4.19
2.38
washington
3.29
2.69
Tabla 1.8 precios del asado de cerdo y el queso cheddar en 15 capitales del mundo. ¿Para cual alimento, el asado de cerdo o el queso cheddar, con menos variables y más estables los precios? Solución. Para responder la pregunta necesitamos calcular la variabilidad en cada producto, que se refiere a calcular la varianza, entonces realizando estos cálculos obtenemos. sac2=2.46 sq2=0.60
Lo que significa que la variación de los precios entre capitales del mundo, para el asado de cerdo es de 2.46 dólares, mientras que para el queso cheddar hay una variabilidad de 0.60 dólares. Lo que responde la pregunta, el queso cheddar es el que tiene menos variabilidad. Tendencia Central y Dispersión para datos contenidos en tablas de frecuencia agrupadas. Es posible calcular las medidas de tendencia central y dispersión para datos exhibidos en una tabla de frecuencia agrupada, pero sus valores INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 14
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
no son exactos sino únicamente aproximados; eso se debe al desconocimiento de las medidas en grupo, las cuales se han colocado en intervalos de clase. Se preguntara porque nos interesa calcular valores aproximados de ciertos estadísticos a partir de tablas de Frecuencias agrupadas; existe una gran cantidad de datos resumidos en tablas de frecuencia agrupadas construidas por otros y la única forma de calcular sus medidas de tendencia central es usar los datos agrupados. Media para datos agrupados: si sabemos encontrar la media para datos proporcionados en tablas de frecuencia agrupada usamos marcas de clase para representar las medidas para cada clase. Entonces la fórmula es: x=fxf
o x=i=1kxifin se utiliza para determinar la media muestral aproximada xa, puesto que los datos originales se desconocen y cada observación está representada por su marca de clase. Varianza para datos agrupados. Esta dada por la fórmula s2=ni=1kxi2fi-i=1kxifi2n(n-1)
Mostremos la media, la varianza y la desviación estándar para datos agrupados con el siguiente ejemplo. Ejemplo 8. En la parte de abajo se muestran las concentraciones de alcohol en la sangre de conductores que se vieron envueltos en accidentes fatales y que después fueron sentenciados a prisión. Cuando un estado lanza una campaña para “Reducir el número de conductores alcoholizados”, ¿es la intención de la compañía disminuir la desviación estándar? 0.27
0.17
0.17
0.16
0.13
0.24
0.29
0.14
0.16
0.12
0.16
0.21
0.17
0.18
0.24
UNIDAD 2 INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 15
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
2.1 Introducción a la probabilidad y valor esperado El propósito de esta unidad es desarrollar ideas básicas que se necesitaran para una adecuada comprensión de la estadística inferencial. Todos los días enfrentamos tomas de decisiones y planteamientos probabilísticos. Los planteamientos que contienen las palabras posibilidad, plausibilidad, oportunidad, parecido, esperado, posible, incierto y probabilidad, se refieren todos al mismo tema: la incertidumbre. A diario hacemos u oímos planteamientos como los siguientes: 1. ¿Cuál es la probabilidad de que tengamos un examen hoy? 2. Las oportunidades de que lo golpee un poste del alumbrado, son de 1 en 2 millones. 3. Las posibilidades de que hoy salga el sol 4. Si se arroja una moneda, hay una posibilidad de 50-50 para que salga cara. 5. Tengo confianza de que puedo aprobar este curso. La probabilidad nos ofrece el fundamento para desarrollar la ciencia de la estadística inferencial; mediante la teoría de la probabilidad, podemos deducir la posibilidad de que aparezcan ciertas muestras con propiedades específicas. Tal información nos permitirá obtener inferencias sobre una población.
Empecemos con experimentos y eventos. Definición: Un experimento es cualquier proceso planteado que da lugar a observaciones o a recolección de datos. Todos los experimentos tienen resultados y la mayor parte de ellos son inciertos y dependen del azar, los resultados de un experimento forman un conjunto llamado espacio muestral. Un espacio muestral de un experimento es la colección de todos los resultados posibles. El experimento más simple referente a incertidumbre es uno que tiene dos resultados y un espacio muestral único. Sin embargo, un experimento puede tener más de un espacio muestral, es decir, se puede usar más de un espacio muestral para describir los resultados de un experimento. En general, es deseable elegir un espacio muestral que proporcione la máxima información referente al experimento. INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 16
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
Ejemplo 1. Observar el sexo del siguiente bebe que nazca en el hospital de Acatlán es un experimento con dos resultados; un espacio muestral para este experimento consiste en el conjunto denotado por S=H, M, donde H representa a un hombre y M una mujer, y las llaves se usan para indicar colección o conjunto. Ejemplo 2. Si se observa el nacimiento de dos bebes nacidos en el hospital, entonces un espacio muestral para el experimento podría ser S=HH, HM,MM,MH. Ejercicios: muestre un espacio muestral para cada experimento. a) Lanzar una moneda de un peso y otra de dos pesos en ese orden, y observar cómo caen. b) Seleccionar a una estudiante de Lic. En informática y preguntarle su estatura, realizar este experimento con al menos 10 estudiantes.
EVENTO Para un cierto experimento, podemos estar interesados en determinar la probabilidad de que ocurra una colección de resultados, en lugar de la probabilidad de que se dé uno solo. Por ejemplo cuando se lanzan tres monedas a la vez, podemos estar interesados en los resultados que indiquen que al menos han salido dos “soles”, en esta colección de resultados escrito como SSA, SAS, ASS, SSS se llama evento. Definición: Un evento es cualquier sub colección (o subconjunto) de un espacio muestral S. Ejemplo 3. Suponga que el experimento es lanzar primero una moneda de un peso y luego una moneda de diez pesos. Un espacio muestral para esta experimento podría ser S=ss, sa,as,aa algunos eventos posibles son: E1=ss, E2=sa, E3=sa,aa Por mencionar algunos, ya que hay 16 eventos posibles. En particular tenemos el evento o conjunto llamado vacío y denotado por ϕ, el cual no posee ningún elemento. Definición de evento simple: un evento simple es un evento que contiene solo un resultado o consta de un solo dato. Por ejemplo, el evento E2=sa del ejemplo 3 es un evento simple, mientras que E3 no lo es. Recuerde que un evento es siempre una colección de resultados del universo de todos los resultados como el espacio muestral. Para INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 17
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
representar gráficamente espacios muéstrales y relacionarlos entre eventos se puede usar un DIAGRAMA DE VENN, el cual se representa por un rectángulo el cual denota el espacio muestral y los eventos se representaran con círculos dentro del rectángulo, como se indica en la figura 2.1 ESPACIO MUESTRAL EVENTO
Figura 2.1 Diagrama de Venn Los diagramas de Venn se usan a menudo para verificar relaciones entre conjuntos, lo que vuelve innecesario aplicar pruebas formales basadas en el álgebra de conjuntos. A manera de ilustración las regiones sombreadas de los cuatro diagramas de Venn de la figura 2.2 representas el evento A, el complemento del evento Ac , la unión de los elementos A y B expresada simbólicamente A∪B, la intersección de los eventos A y B expresada simbólicamente por A∩B.
Ac
A
Diagrama de Venn, con el evento A
A
Diagrama de Venn, complemento de A
B
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 18
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
Diagrama de Venn, unión de conjuntos
Diagrama de Venn, intersección
Figura 2.2 Expresiones de los Diagramas de Venn Eventos compuestos Como los eventos son compuestos, los operadores de unión ( ∪) pueden usarse para formar eventos compuestos. Si A y B son eventos, entonces A∪B y A∩B son ejemplos de eventos compuestos. • •
A∪B es el evento de que ocurran A ó B, o ambos. A∩B es el evento de que ocurran tanto A como B ocurran al mismo tiempo.
Eventos mutuamente excluyentes Si A y B son eventos que no tienen resultados en común, entonces se denominaron eventos mutuamente excluyentes. Esto es: sí E∩F=ϕ. Se puede ilustrar con un diagrama de Venn, como lo muestra la figura 2.3
A
B
Figura 2.3 Eventos Mutuamente Excluyentes Ejemplos: 1. A una fábrica de motores pequeños le preocupan tres tipos principales de defectos. Si A=es el evento en el que el eje es demasiado grande. B=el evento en el que las bobinas son inadecuadas. C=el evento en el que las conexiones eléctricas don insatisfactorias.
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 19
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
Exprese verbalmente qué eventos están representados siguientes regiones del diagrama de Venn de la figura 2.4.
por
las
a) Región 2 b) Región 1 y 2 juntas c) Regiones 3,5,6 y 8 juntas
A
B 5
2
7 4
1 3 8 6
C
Figura 2.4 Solución: a) Dado que la región está contenida en A y B pero no en C, representa el evento en que el eje es demasiado grande y las bobinas inadecuadas, pero las conexiones eléctricas satisfactorias. b) En vista de que esta región es común a B y C representa el evento en el que las bobinas son inadecuadas y las conexiones eléctricas insatisfactorias. c) Como esta es toda la región fuera de A representa el evento en el que el eje no es demasiado largo. 1. Sea A=José va al cine y B=José come una barra de dulce. Interprete los siguientes conjuntos. a) A∩B b) B∪A c) A∩(B∪Ac) INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 20
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
Solución: a) A∩B=representa el evento de que Jóse va al cine y come una barra de dulce. b) B∪A=representa el evento de que José come una barra de dulce o va al cine. c) A∩B∪Ac=representa el evento de que José come una barra de dulce.
TECNICAS DE CONTEO A veces puede resultar sumamente difícil o al menos tedioso, determinar el número de elementos en un espacio muestral finito mediante la enumeración directa. Para ilustrarlo supongamos que un consumidor que realiza pruebas de consumo, clasifica los refrescos por sabor (Naranja, Piña y Grosella), costo ( 8 y 15 pesos) y tamaño (Chico, mediano y grande). ¿De cuantas maneras diferentes podemos elegir un refresco? Evidentemente existen varias posibilidades. Un refresco puede ser de sabor Naranja, costar $8 y ser de tamaño mediano, otra elección será de sabor naranja que cueste $15 y ser de tamaño chico, etc. Para el manejo sistemático de este tipo de problemas es útil trazar un Diagrama, dentro de los que existen los llamados Diagrama de Árbol, como se muestra en la figura 2.3. Donde las tres alternativas, sabor Ei, costo Ci y tamaño Ti, estan denotadas por E1, E2 y E3, C1y C2 , T1, T2 y T3 respectivamente.
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 21
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
C1
T1 T2
Naranj a
T3 T1 C2
T2
T3 C1
T1 T2
T3 T1
Piña
T2 C2 T3 C1
T1
T2
Grosel la
T3 T1 C2
T2
T3
Figura 2.3. Diagrama de árbol para los refrescos de sabor. INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 22
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
Siguiendo un curso dado de izquierda a derecha por las ramas del árbol (que son las líneas que dan dirección), obtenemos una clasificación en particular a saber, además de lo cual salta a la vista que en total existen 18 posibilidades. Mediante la observación se podía haber obtenido el resultado de que hay tres ramas E, de cada rama E se bifurca (salen) dos ramas C y de cada rama C se bifurcan a su vez tres ramas T. Así, existen 3*2*3=18 combinaciones de ramas o rutas. Este resultado es un caso especial del siguiente teorema. TEOREMA 2.1. Si los conjuntos A1, A2, …, Ak contienen respectivamente, n1,n2, …, nk elementos, existen n1∙n2∙… ⋅nk maneras de elegir primero un elemento de A1, después un elemento de A2, y así sucesivamente hasta un elemento de Ak. Al teorema 2.1 se le conoce como el principio multiplicativo o Regla de multiplicación. Ejemplos. 1. ¿De cuantas maneras diferentes una sección sindical con 25 miembros puede elegir un presidente y un vicepresidente? Solución: Expresemos como eventos, cada una de las formas de elección, es decir, A1=elegir presidente, y existen 25 formas de elección, n1=25 A2=elegir vicepresidente, como ya se eligió una persona, solo quedan, 24 formas de elegir un vicepresidente, n2=24 Entonces, existen, n1∙n2=25∙24=600 maneras o formas en que puede tomarse la decisión. 2. En un estuche de instrumentos ópticos hay seis lentes cóncavas, cuatro lentes convexas y tres prismas. ¿de cuantas maneras se puede seleccionar una de las cóncavas, una de las convexas y una de las prismas? A1=6 lentes concavas, n1=6 A2=4 lentes convexas, n2=4 A3=3 prismas, n3=3 Entonces existen, 6∙4∙3=72 maneras de realizar la selección.
PERMUTACIONES INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 23
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
Un arreglo ordenado de n objetos se llama permutación. Hay seis permutaciones de un conjunto de tres letras, A, B y C, que son: ABC, ACB, BAC, BCA, CAB y CBA
Para determinar el número r de permutaciones de n objetos, utilizaremos la notación , nPr, junto con el siguiente teorema.
TEOREMA 2. El número de permutaciones de r objetos seleccionados de un conjunto de n objetos distintos es. nPr=nn-1n-2…(n-r+1) o en notación factorial que es la más utilizada y común. nPr=n!n-r!
Ejemplo. Suponga que 10 estudiantes están disponibles para tres tareas distintas en el campus ¿de cuantas formas pueden realizar dichas tareas? Solución: Necesitamos determinar cuántas formas hay de asignar las tres tareas entre 10 estudiantes, o el número de acomodos de 10 objetos tomados de tres en tres. Por el teorema 2 de permutación, el número de permutaciones de 10 objetos tomados de tres en tres será n=10 , r=3, nPr=10P3=10!10-3! =10∙9∙8∙7∙6∙5∙4∙3∙2∙17∙6∙5∙4∙3∙2∙=10∙9∙8=720
Nota: observe que las permutaciones trabajan un arreglo ordenado de objetos, lo que indica que el orden de colocación de los objetos si importa. Sin embargo hay muchos problemas en los que debemos determinar el número de maneras en las cuales pueden seleccionarse r objetos de un conjunto de n, pero sin tomar en cuenta el orden en que se realiza la selección. Es a esto a lo que le llamamos una combinación. COMBINACIÓN Una selección de r objetos de un conjunto de n objetos distintos, sin importar el orden en que los r objetos son seleccionados, se llama combinación, y el número de combinaciones de n objetos tomados de r en r se denota por nr o Crn que se llama coeficiente binomial y está dado por la formula, nr=Crn=n!n-r!(r)!
Ejemplos 1. ¿De cuantas maneras diferentes pueden seleccionarse 3 de 20 asistentes de laboratorio para colaborar en un experimento? INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 24
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
Solución: n=20 , r=3 Crn=n!n-r!(r)!=20!20-3!(3)!=1140. 2. ¿De cuantas maneras diferentes el director de un laboratorio de
investigación candidatos?
puede
seleccionar
a
dos
químicos
entre
7
Solución: n=7 , r=2, C29=n!n-r!(r)!=7!7-2!(2)!=21
3. ¿De cuantas maneras diferentes el director de un laboratorio de
investigación puede seleccionar a 2 químicos entre 7 candidatos y a 3 físicos entre 9 candidatos? Solución: Las formas de elegir a 2 químicos entre 7 candidatos es, 72=21 y las formas de elegir 3 físicos entre 9 candidatos es, 93=84 y luego utilizando la regla de multiplicación, la respuesta a la pregunta es: 21∙84=1764
1.3INTRODUCCIÓN A LA PROBABILIDAD La probabilidad es la base sobre la que se construyen los métodos importantes de la estadística inferencial. Como un sencillo ejemplo, suponga que usted hubiera ganado el premio mayor de la lotería nacional cinco veces seguidas. Habría acusaciones de que usted hizo trampa de alguna forma. Las personas saben que aun cuando existe la probabilidad de que alguien gane cinco veces consecutivas, por pura suerte, la posibilidad es tan increíblemente baja, que rechazarían la suerte como una explicación razonable. Ésta es precisamente la forma de pensar de los estadísticos: las personas rechazan las explicaciones basadas en probabilidades muy bajas. Los estadísticos usan la regla del suceso o evento inferencial. Regla del evento infrecuente para estadística inferencial Si, bajo un supuesto dado (como un juego de lotería justo), la probabilidad de un suceso particular observado (como ganar tres veces INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 25
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
seguidas) es extremadamente pequeña, concluimos que el supuesto probablemente es incorrecto. La probabilidad de un evento es un número entre cero y uno, inclusive, que se asocia al evento; si E es un evento, entonces PE denota la probabilidad de E. Si la probabilidad es cero, entonces el evento no ocurre, si es 1, el evento ocurre; mientras más cercano a 1 sea PE, más posibilidad hay de que ocurra, y mientras más cercano a cero sea PE, menos probable es que suceda, como lo muestre la figura 2.3.1 Aumento de Probabilidad
0
0.5
1 E no ocurrirá
E puede o no ocurrir
E si
ocurrirá Figura 2.3.1
Hay diferentes formas para definir la probabilidad de un evento, como lo que ya mencionamos, presentaremos una lista de algunas notaciones básicas. NOTACIÓN DE PROBABILIDAD • • •
P denota una probabilidad A, B C y E denotan evetos o sucesos especificos PA denota la probabilidad de que ocurra el evento A.
Tenemos varias reglas para calcular una probabilidad, según el o los eventos ocurridos. Regla 1: aproximación de la probabilidad por frecuencias relativas. Realice (u observe) un procedimiento un gran número de veces y cuente las ocasiones que el evento A ocurre en realidad. Con base en estos resultados reales, PA se estima de la siguiente forma. PA=número de veces que ocurre Anúmero de veces que se repitío el ensayo
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 26
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
Regla 2. Métodos clásicos de la probabilidad (requiere resultados igualmente probables) Suponga que un procedimiento dado tiene n sucesos simples distintos, cada uno de los cuales tiene la misma probabilidad de ocurrir. Sí el evento A puede ocurrir en S de estas n formas, entonces PA=número de formas en que puede ocurrir Anúmero de eventos simples diferentes=Sn
Regla 3. Probabilidades subjetivas P(A), la probabilidad del evento A, se obtiene simplemente suponiendo o
estimando su valor con base en el conocimiento de las circunstancias relevantes. Ejemplos: ilustremos con un ejemplo cada una de las reglas de probabilidad. a) Métodos de las frecuencias relativas (Regla 1). Cuando se trata de determinar: P(tachuela cae con la punta hacia arriba),
debemos repetir muchas veces el procedimiento de lanzar la tachuela y después calcular el cociente del número de veces que la tachuela cae con la punta hacia arriba entre el número de lanzamientos. b) Método clásico (Regla 2). Cuando se trata de determinar, P(2) con un dado balanceado, cada una de las seis caras tiene la misma probabilidad de ocurrir. P2=número de formas en que 2 puede ocurrirnumero total de sucesos simples=16 c) Probabilidad subjetiva (Regla 3). Cuando se trata de estimar
la probabilidad de que mañana llueva. Los meteorólogos usan su conocimiento experto de las condiciones del tiempo para desarrollar un estimado de la probabilidad. Ejemplo. Para evaluar el desarrollo de la coordinación física en infantes en edad preescolar, una profesora selecciona aleatoriamente a cinco criaturas de una clase de ocho niños y cinco niñas de una guardería. ¿Cuál es la probabilidad de obtener cinco niñas? ¿Cuál es la probabilidad de obtener cinco niños? ¿cuatro niños y una niña?
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 27
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
Solución: ya que el muestreo esta dado sin reemplazo el orden de la selección no es importante, por tanto todos los niños deben ser contados por medio de combinaciones. n=número de niños r=elegir número de niños de n Crn=135=13!8!5!=1287
Elegir cinco niñas C55=55=5!0!5!=1 Psean escogidas cinco niñas=11287=0.0008
Si Pelegir cinco niños=561287=0.0435 Donde 85=8!3!5!=56 Elegir cuatro niños y una niña 84∙51=8!4!4!=350 Pelegir cuatro niños y una niña=3501287=0.2720.
Al calcular probabilidades con la regla 1, obtenemos un estimado en lugar de un valor exacto. Con forme el número total de observaciones se incrementa, los estimados correspondientes tienden a acercarse a la probabilidad real. Tal propiedad se enuncia en forma de Teorema, al que se conoce comúnmente como la ley de los grandes números. LEY DE LOS GRANDES NÚMEROS Conforme un procedimiento se repite una y otra vez, la probabilidad de frecuencias relativas de un evento, tiende a aproximarse a la probabilidad real. Ejemplo: Calcule la probabilidad de que un adulto que se selecciona aleatoriamente haya volado en una línea aérea comercial. Solución: el espacio muestral consta de dos eventos simples: la persona ya voló en una línea comercial o no lo ha hecho. Usando la regla 1 de 855 adultos que se seleccionaron al azar, 710 indicaron que ya volaron en líneas aéreas comerciales. Obteniendo Phaber volado en una línea aérea comercial=710855=0.830
PROPIEDADES DE LA PROBABILIDAD INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 28
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
La probabilidad satisface las siguientes propiedades: 1. PAi≥0 2. PAi≤1 3. i=1nPAi=1
Ejemplo: supóngase que se lanza un dado una vez y la probabilidad de cualquier cara de quedar hacia arriba es 16; si A es el evento de sacar un número par y B el de sacar un número impar, encuentre: a) b) c) d)
P(A) P(B) P(A∪B) P(A∩B)
Solución: como tiene la misma probabilidad de ocurrir, el espacio muestral es M=1, 2, 3, 4, 5, 6 y los eventos A=2, 4, 6, B=1, 3, 5, así a) b) c) d)
PA=P2+P4+P6=16+16+16=36=12 PB=P1+P3+P5=16+16+16=36=12 PA∪B=PA+PB=12+12=1 PA∩B=0, ya que A∩B=ϕ son eventos mutuamente excluyentes (esto
se explicara en la sección 2.4). 1.3EVENTOS MUTUAMENTE EXCLUYENTE Y NO EXCLUYENTES Notación de la regla de la suma i.
PA∪B=PA oB=PA+P(B) siempre y cuando A y B sean eventos
mutuamente excluyentes. ii. PA∪B=PA oB=PA+PB-P(A∩B) siempre y cuando A y B sean cualesquiera eventos en M. P(B) P(A)
P(A)
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 29
P(B)
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
Diagrama de Venn que muestra A y B no
Diagrama de Venn que muestra A y B mutuamente excluyentes.
Excluyentes.
iii. Generalización de i. Sí A1,A2, …,An son mutuamente excluyentes en un espacio muestral M, entonces P( A1∪A2∪ … ∪An)=P(A1)+P(A2)+…+P(An) iv. Probabilidad de complemente. Sí A es cualquier evento en M, entonces PAc=1-P(A)
Ejemplos: 1. Una caja contiene 6 billetes de $500, 1 de $100 y 3 de $50.
Determine la probabilidad de que, al extraer al azar uno de estos billetes, este sea de $50 o de $100. Solución: como los eventos son independientes, la probabilidad total es la suma de las probabilidades individuales, por lo tanto. Pbillete de $50 o billete de $100=Pbillete de $50+Pbillete de $100=No. de billetes de $50total de billetes+No. de billetes de $100total de billetes =310+110=410=0.40=40%
Solución alternativa: Pbillete de $50 o billete de $100=1-Pbilletes de $500=1-No. de billetes de $500total de billetes=1-610=410=40%
2. De un grupo de 45 estudiantes universitarios, 28 estudian inglés y
16 estudian francés, además de que 12 no estudian idiomas. Prepare un diagrama de Venn que ilustre esta situación, y determine la probabilidad de que, al entrevistar al azar a un alumno del grupo, este estudie inglés y francés. Solución: Datos para formar el diagrama de Venn A=28 estudian inglés B=16 estudian frances C=12 no estudian idiomas No. de estudiantes de ambos idiomas=estudian inglés+estudian francés+no estudian idiomas-total de estudiantes=28+16+1245=56-45=11 INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 30
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
No. de estudiantes sólo inglés=No. de estudiantes inglesestudiantes de ambos idiomas=28-11=17 No. de estudiantes sólo francés=No. estudiantes de Francésestudiantes de ambos idiomas=16-11=5 PA∩B=1145=0.244=24.4%
PROBABILIDAD CONDICIONAL Si se lanzan dos dados, uno rojo y otro azul, y si sabemos que el dado azul muestra un número divisible por 3, ¿cuál es la probabilidad de que la suma de puntos de ambos dados sea mayor que 8? La condición de que el número mostrado por el primer dado sea divisible por 3, cambia el espacio muestral que estamos considerando. Para dos eventos cualesquiera A y B usaremos el símbolo P(A∕B) para designar la probabilidad de que ocurra un evento A , siempre que haya ocurrido el evento B. Esto recibe el nombre de PROBABILIDAD CONDICIONAL, porque se conoce la condición de que el evento B ha ocurrido. Definición: para dos eventos, cualesquiera A y B tales que P(B)≠0, PAB=P(A∩B)P(B) y cumple con las tres propiedades de probabilidad. Definición: A y B son eventos independientes si y solo si PAB=PAPB. Teorema. Si A y B son eventos independientes y P(A)≠0 y entonces PAB=PA y PAB=PB.
P(B)≠0,
Ejemplos: 1. La siguiente tabla presenta la distribución del número de días lluviosos o secos, y nublados o soleados de una región. Amanecer Lluvioso Seco Total de días Nublado
44
95
139
Soleado
29
197
226
Total
73
297
365
Determine las probabilidades que se indican a) La probabilidad de que llueva un día cualquiera INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 31
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
b) La probabilidad de que un día cualquiera esté soleado al amanecer y seco durante el día. c) Si se selecciona al azar un amanecer nublado, ¿Cuál es la probabilidad de que llueva? d) Si se selecciona al azar un día lluvioso, ¿Cuál es la probabilidad de que el amanecer hubiera estado nublado? Solución. a) Pllueva un día cualquiera=Sn=No. de días lluviososTotal de días=73365=0.2 b) Pamanecer soleado y seco durante el día=P(amanezca soleado dado que estuvo seco el día)dias soleados=197226 c) Pdíalluviosoamanecenublado=No de amaneceres nublado y días lluviosostotal amaneceres nublados=44139 d) Pamanecer nubladodíalluvioso=No de días lluviosos con amanecer nubladototal de días lluviosos=4473 1. La siguiente tabla presenta la clasificación por color y
número de puertas de los automóviles estacionados en la patio de un centro comercial. Calcule las probabilidades condicionales que resulten. concepto
2 puertas
4 puertas
Total
Color blanco
35
52
87
Otros colores
148
174
322
Total
183
226
409
Las probabilidades condicionales son las probabilidades de que ocurra un evento A, si se sabe que ya ocurrió otro relacionado B, es decir, P(AB). Claro que también se puede calcular PBA, como se indica a continuación:
En este caso, A es el evento número de puertas; B es el evento Color, y la probabilidad es P(A/B).
En este caso, A es el evento número de puertas; B es el evento Color; y la probabilidad es P(B/A). INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 32
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
TEOREMA DE BAYES Un que en páginas anteriores hemos resuelto algunos ejemplos de probabilidad condicional por medio de los diagramas de Venn, los árboles de probabilidad y las tablas de contingencia, Thomas Bayes (matemático Inglés; 1702-1761) desarrollo una fórmula que puede simplificar el cálculo de las probabilidades condicionales. La fórmula de Bayes, en su forma mas sencilla, permite calcular la probabilidad de que ocurra el evento B, si se sabe que ya ocurrio el evento A, esto es P(B/A). Para ello se requiere conocer la probabilidad simple de que ocurra el evento A, si se sabe que ya ocurrió el evento B, es decir, P(B) y la probabilidad de que ocurra el evento A, se sabe que ya ocurrió el evento B, o sea, P(A/B). Lo anterior puede expresarse mediante la siguiente formula. PB/A=P(A/B)P(B)P(A)
Además de la regla de Bayes, se tiene el Teorema de Bayes, que no es más que la generalización de que sucedan Bi particiones de B y A es el subconjunto de B, entonces. TEOREMA DE BAYES: si los eventos B1, B2,…,Bn forman una partición de B, y A es un subconjunto de B, entonces PBi/A=P(A/Bi)P(Bi)PB1PA/B1+…+P(Bn)P(A/Bn)
Ejemplos: 1. El 55.26% de los autos de un estacionamiento son de cuatro puertas. Los autos blancos son el 21.17% del total, y los autos de 4 puertas escogidos de entre los blancos son el 59.77%. determine el porcentaje de autos blancos escogidos de entre los de cuatro puertas Solución. Definamos los eventos correspondientes, y las probabilidades conocidas. A=autos con cuatro puertas, PA=0.5526 B=autos blancos, PB=0.2127 AB=autos de cuatro puertas que son blancos, PAB=0.5977
Así, PBA=Pautosblancosconcuatro puertas=0.5977*0.21270.5526=0.2301 INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 33
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
2. Tres máquinas “traga monedas” se arreglan de modo que, generalmente, paguen al jugador una de cada 10 veces y que el jugador pierda nueve de cada 10 veces. Sin embargo una de las maquinas está descompuesta y pagara al jugador tres de cada diez veces, pero no se sabe cuál es la máquina descompuesta. Si usted elige una máquina, juega una vez y gana, ¿Cuál es la probabilidad de que haya seleccionado la máquina descompuesta?
Solución. Identifiquemos los eventos B=3 maquinas, entonces tenemos las particiones: B1=máquina 1, con PB1=13 B2=máquina 2, con PB2=13 B3=máquina 3, con PB3=13 A=pagar al jugador, PA=110 ABi=maquina i que paga dado que esta descompuesta, PABi=310 Pelegir la maquina descompuesta si gano a la primera=PB2∕A=P(B2)P(A∕B2)PB1PAB1+PB2PAB2+P(B3)P(A∕B3)= 1331013110+13310+13110=35=60%.
ESPERANZA MATEMÁTICA O VALOR ESPERADO Con frecuencia es conveniente calcular el promedio de los resultados de un proceso o experimento ponderado por las probabilidades de que suceda cada uno de los resultados posibles. A este promedio se le conoce como esperanza matemática y permite entre otras cosas, comparar dos o más alternativas; por ejemplo, ¿Qué es mejor: una probabilidad de 0.001 de ganar un contrato de $3000000 o una probabilidad de 0.002 de ganar un contrato de $2000000? La fórmula para calcular la esperanza matemática o valor esperado es: EM=i=1nxiPi, donde EM denota esperanza matemática, xi, son los datos y Pi, las ponderaciones o probabilidades, otra notación de esperanza matemática es Ex, que denota el valor esperado de x.
Ejemplos
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 34
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
1. Una caja contiene 6 billetes de $500, tres de $50 y uno de
$100. Determine la esperanza matemática al extraer al azar un billete. Solución. Total de billetes son 10. P500=610, P50=310, P100=110 EM=500610+100310+100110=325010=325.
,
entonces,
2. En un sorteo se ofrecían seis premios, uno de $1000, dos de $500 y tres de $300. Suponiendo que se distribuyan los mil boletos del sorteo, y sin considerar gastos de administración u otros. ¿Cuánto debe costar cada boleto para cubrir el costo de los premios? Solución: el valor esperado del costo de cada boleta es: Ex=total de premiosNo boletos=11000+2500+33001000=$2.90
de
Lo que sugiere que cada boleto debe costar $2.90 solo para cubrir gastos de premiación.
UNIDAD III TIPOS DE DISTRIBUCIÓN, VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS En esta unidad combinamos los métodos de estadística descriptiva que se presentan en la unidad I y los de probabilidad que se estudiaron en la INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 35
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
unidad II. La figura 3.1 presenta un resumen esquemático de los objetivos. Unidad III I II
Figura 3.1 combinación de métodos descriptivos y probabilidades para formar un modelo teórico de comportamiento.
Existen dos tipos de distribuciones Discretas y Continuas, que se clasifican en: DISCRETAS
CONTINUAS
Binomial
Normal
Poisson
Logaritmico-Normal
Hipergeometrica
Aproximación de la Binomial a la Normal
FUNCIÓN DE DISTRIBUCIÓN BINOMIAL Las distribuciones binomiales forman una clase importante de distribuciones discretas en estadística; se usan para describir una amplia variedad de procesos de muchas formas, y resultan de la repetición de experimentos binomiales. La distribución binomial, requiere que los experimentos sean binomiales y para verificarlo debe constar de las siguientes propiedades. 1. El experimento consiste de n intentos idénticos.
2. Cada intento da lugar a exactamente dos resultados, llamados éxito o fracaso. 3. Los n intentos son independientes. 4. La probabilidad P de un éxito permanece constante de un intervalo a otro. La distribución de probabilidad para el número de éxitos se denomina distribución binomial. Una fórmula general para calcular Px, la probabilidad de obtener x éxitos en un experimento binomial teniendo n intentos con probabilidad INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 36
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
P, se conoce como Fórmula de probabilidad binomial, y se calcula, con la
siguiente formula. Px=nxPx1-Pn-x
Ejemplo3.1. Un estudio reciente mostro que el 60% de los estudiantes universitarios fuman, ¿Cuál es la probabilidad de que al elegir a cinco estudiantes, tres de ellos fumen? Solución: Paso 1. Un intento consiste en determinar si un estudiante universitario fuma, un éxito x es encontrar que un estudiante fume. Paso2. Px=0.6 Paso 3. Tamaño de la muestra es de n=5 Paso 4. Se desea saber que tres fumen, lo que indica que x=3. Paso 5. Realizar el cálculo, Px=nxPx1-Pn-x P3=530.631-0.65-3=0.3456.
Mucha gente confunde los experimentos binomiales con las distribuciones binomiales, pero hay una diferencia, esto es, un experimento binomial consiste en n intentos dando lugar a exactamente un resultado de los n+1 posibles para la variable binomial aleatoria asociada. Por otro lado, una distribución binomial describe las probabilidades asociadas con los n+1 valores de la variable aleatoria x que denota el número de éxitos que puede obtenerse. Para una distribución binomial aleatoria, la media μ es el valor esperado E(x) para el número de éxitos x, μ=Ex=xiP(xi), pero manejaremos la fórmula μ=nP. Ejemplo 3.2. La probabilidad de que un paciente se recupere de una cirugía de pulmón es 0.95, si 25 personas se someten a esta cirugía, encuentre el número de la media de recuperaciones e interprete el resultado. Solución. Usando la formula μ=nP tenemos, μ=nP=250.95=23.75 Lo que significa, si se realiza una cirugía de pulmón en cada uno de los hospitales a 25 pacientes y se registra la cantidad de los que se INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 37
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
recuperación, el promedio de recuperación en todos los hospitales estudiados será cercano a 23.75. Varianza de una distribución binomial La varianza se calcula por medio de la fórmula σ2=nP1-P
La desviación estándar es la raíz cuadrada de la varianza, es decir, σ=nP1-P
Ejemplo 3.3. Un estudiante presenta un examen de opción múltiple con 50 preguntas cada una de ellas con 5 elecciones posibles, si responde cada pregunta adivinando, encuentre la media y la desviación estándar de la distribución del número de preguntas contestadas correctamente, así como la media y la desviación estándar para la distribución del número de preguntas en que falla el estudiante. Solución: P=15, n=50, μ=np=50*0.20=10, lo que indica que el estudiante solo responderá correctamente adivinando solo 10 de las 50 preguntas. El número de respuestas incorrectas será, μ=n1-P=50*0.8=40 La σ=500.20.8=2.83. Interpretemos μ en una gráfica para diferentes valores de P , como lo muestra la figura 3.2 x
0
1
2
3
4
5
P(x)
0.328
0.410
0.205
0.051
0.06
0
Figura 3.2, Expresa la localización de la media. FUNCIÓN DE DISTRIBUCIÓN DE POISSON El cálculo de probabilidades binomiales puede ser tedioso, especialmente si el número de intentos es grande. Cuando el número de intentos es grande n≥100 y μ≤10, las probabilidades binomiales pueden aproximarse mediante una forma particular de la función de probabilidad de Poisson. La distribución de probabilidad de Poisson se define por la formula Px=λxe-λx!
Donde el parámetro λ>0, e≈2.71828 y x=1,2,3,…. INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 38
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
Podemos sustituir a λ por la expresión λ=nP , que es la media de una variable aleatoria de Poisson, entonces tenemos la formula equivalente: Px=nPxe-nPx!
Ejemplo 3.4 si la probabilidad de que la empresa Aurrera de Acatlán quiebre es de 0.0001, ¿Cuál es la probabilidad de que 10 de las 30,000 sucursales quiebre? Solución: utilizaremos distribución binomial y Poisson para que el estudiante vea la ventaja de utilizar Poisson. Con Binomial, P10=30000100.0001100.99929900=0.00081 Es extremadamente tedioso realizar los cálculos sin la ayuda de una computadora o de hacerlo con mucho cuidado. Sin embargo si utilizamos distribución de Poisson tenemos: P10=310e-310!=0.00081
Que da la misma respuesta, indicando que la probabilidad de que quiebren 10 de las 30000 sucursales es del 0.081%, casi nula. Propiedades de una variable aleatoria de Poisson x con un parámetro λ>0 μx=λ σx2=λ
DISTRIBUCIÓN HIPERGEOMÉTRICA Consideraremos experimentos que obedezcan tres de las cuatro propiedades de un experimento binomial; se debilitará la propiedad de independencia entre los intentos, es decir, los intentos, individuales se considerarán dependientes, el experimento resultante se llamará experimento hipergeometrico. Los experimentos hipergeometricos se usan comúnmente cuando el muestreo se hace sin reemplazo. Formula de probabilidad hipergeometrica. Px=n1xn2n-xn1+n2n, para x=0,1,2,… y n≤n1+n2.
Ejemplo3.5. Se embarcan abanicos eléctricos en lotes de diez; antes de aceptar un lote, un inspector elige tres de esos abanicos y los inspecciona, si ninguno de los abanicos aprobados está defectuoso, el INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 39
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
lote se acepta; si uno o más salen con defectos, revisan todo el lote. Suponga que hay dos abanicos deficientes, ¿Cuál es la probabilidad de que se muestre un 100% de inspección? Solución: Sea x=número de abanicos defectuosos Px=0=2083103=0.467, si x≥1
Se necesitara un 100% de inspección sí x≥1. Px≥1=1-Px=0, dicha probabilidad es de 1-0.467=0.533. entonces hay una probabilidad del 53.3% de que se realice un 100% de inspección. La media y la varianza para la distribución hipergeometrica son: μ=nn2n1+n2 σx2=nn1n2n1+n2-nn1+n22n1+n2-1
DISTRIBUCION NORMAL Una de las clases más importantes de distribuciones continuas es la distribución normal; desde su descubrimiento hace ya más de 350 años, se ha desenvuelto como una herramienta indispensable en cualquier rama de la ciencia, la industria y el comercio. Muchos eventos reales y naturales tienen una distribución de frecuencias cuya forma es muy parecida a la distribución normal. La distribución de frecuencias del contenido de nitrógeno de la hojas de un árbol tiende a ser normal. Las medidas físicas suelen distribuirse normalmente; las pulsaciones del corazón, los niveles de colesterol en la sangre, las estaturas de los hombres adultos, son todos ejemplos de distribuciones de datos que tienden a seguir la distribución normal. Gráfica de una Distribución Normal Una distribución normal tiene la forma de una montaña o la apariencia de una campana, como lo ilustra la figura. 3.1. La ecuación de una curva con forma de campana está dada por: y=12πσe-x-μ22σ2
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 40
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
y
x
µ
Figura 3.1
Los parámetros μ y σ especifican por completo la posición y la forma respectivamente, de una distribución normal; un valor pequeño de σ significa que la curva normal es una campana delgada picuda; mientras que un valor grande de σ significa que la curva normal es ancha, aplanada, como lo muestran las figuras 3.2 y 3.3. y
y
µ
Figura 3.2. σ pequeña.
x µ
Figura 3.3 σ grande
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 41
x
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
Propiedades de la distribución normal 1. Una distribución normal tiene forma de montaña o de campana. 2. El área bajo una curva normal y sobre el eje x es siempre igual a 1. 3. La media se localiza en el centro de la distribución y la curva normal es simétrica con respecto a la línea perpendicular al eje horizontal en el valor de la media. 4. La media, la moda y la mediana coinciden. 5. Una curva para una distribución normal se extiende indefinidamente a la izquierda y a la derecha de la media y tiende hacia el eje horizontal. 6. Una curva para una distribución normal nunca toca el eje horizontal. 7. La forma y la posición de una distribución normal depende de los parámetros μ y σ, en consecuencia hay un número infinito de distribuciones normales. Definición: Distribución normal estándar: distribución normal de probabilidad con una media de cero y una desviación estándar de 1, en tonto el área total debajo de su curva de densidad es igual a 1. Notación: a) Pa≤z≤b, denota la probabilikdad de que la puntuación z este entre a y b. b) Pz≥a, denota la probabilidad de que la puntuación z sea mayor que a c) Pz≤b, denota la probabilidad de que la puntuación z sea menor que b. d) Cabe resaltar que para calcular Pa≤z≤b es equivalente a
obtener, Pa≤z≤b=Pz≤b-P(z≤a).
Para calcular dichas probabilidades, utilizaremos la tabla 1 del apéndice A. Puntuación z: Distancia a lo largo de la escala horizontal de la distribución normal estándar; remítase a la columna del extremo izquierdo y al renglón superior de la tabla 1 del apéndice A. INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 42
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
Área o Probabilidad: región bajo la curva; remítase a los valores de la tabla 1, apéndice A. El siguiente ejemplo requiere que calculemos la probabilidad que se asocia con un valor menor que 1.58. Comience con la puntuación z de 1.58, localizando 1.5 en la columna izquierda, después, calcule el valor de 0.08 en el renglón superior , para así obtener la probabilidad buscado en la intersección de esta fila y columna, como lo ilustra la tabla 3.1. z
.
.
.
. . . 1.5
.
.
.
0.08
0.9429
Tabla 3.1. Calcular la distribución de probabilidad normal. Ejemplo 3.6 Utilice la tabla 1 del apéndice A, para calcular las siguientes probabilidades. 1. Pz≤2.5 2. Pz≤-1.2 3. Pz≤0.5
Solución. Se deja al alumno. Existe lo que llamamos regla empírica La regla empírica se aplica a cualquier distribución normal. La figura 3.4. ilustra la regla empírica a) Aproximadamente el 68% de las medidas distan menos de
una desviación estándar de la media, es decir caen en el intervalo μ±σ. b) Casi un 95% de las medidas distan menos de dos desviaciones estándar de la media, caen en el intervalo μ±2σ. c) Alrededor del 99.7% de las medidas distan menos de tres desviaciones estándar de la media, esto es, pertenecen al intervalo μ±3σ.
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 43
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
μ-3σ
μ-2σ
μ-σ
μ
μ+σ
μ+2σ
μ+3σ
68 % 95% 99.7% Figura 3.4
Valor estandarizado z. Cuando μ≠1 y σ≠0 Cualquier variable aleatoria normal x se puede transformar en una variable aleatoria normal estandarizada (o tipificada) z sustituyendo el valor esperado μ y dividiendo entre la desviación estándar σ. z=x-μσ
Para un valor dado de x, el valor correspondiente de z, llamado en ocasiones valor estandarizado z , es el número de desviaciones estándar que x dista de μ. Si μ=100y σ=20 , un valor de x igual a 130 se encuentra a 1.5 desviaciones estándar por encima de la media μ y el valor z correponddiente es: z=130-10020=1.5
Ejemplo 3.7. Los ingresos anuales de los profesores de una universidad siguen aproximadamente una distribución normal con media de $18600 y una desviación estándar de $2700. Encuentre la probabilidad de que un profesor seleccionado al azar tenga a) Un ingreso anual inferior a $15000 b) Un ingreso anual mayor que $21,000 Solución: tenemos μ=$18000,
σ=$2700,
con z=15000-180002700=-
1.33 a) Pz=ingreso anual<$15000=Pz<-1.33=0.0918
b)Pz>21000=Pz>0.89=1-Pz<0.89=0.1867 INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 44
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
Aproximación Normal de la distribución binomial Una de las muchas aplicaciones de la curva normal es su uso como aproximación a otras distribuciones de probabilidad, particularmente a la binomial. La fórmula a utilizar para realizar la aproximación es: Supongamos que la variable aleatoria binomial x tiene una distribución normal y utiliza la media binomial μ=nP y la desviación estándar σ=np(1p). Esta aproximación solo debe utilizarse cuando μ=np≥5 y n(1-P)≥5. Ejemplo 3.8. Una compañía de seguros su ha fijado la meta de que el 10% de los clientes posibles tome un seguro. Suponga que hay independencia entre los prospectos, de modo que se pueden aplicar las probabilidades binomiales. ¿Cuál es la probabilidad de que de 600 clientes posibles, 30 o menos de ellos contraten un seguro? Solución: n=600, P=0.10 Como no tenemos tablas para n=600, utilizamos una aproximación normal con μ=nP=600*0.10=60 y σ=np(1-p)=6*(0.90)=7.348
Así, Px≤30=Pz≤30-607.348=Pz≤4.08 que es prácticamente cero. Si un agente vendió sólo 30 pólizas en los últimos 600 clientes potenciales, deberíamos concluir que el agente no cumplió con la meta. Observación. La aproximación normal de la distribución binomial puede ser muy mala si nP≤5 o n(1-P)<5. Si P, la probabilidad de un éxito, es pequeña y n, el tamaño de la muestra, es modesto, la verdadera distribución binomial está seriamente sesgada hacia la derecha. En tal caso, la curva normal simétrica constituye una mala aproximación. Si x es próximo a 1, de modo que n1-P<5, la verdadera distribución binomial esta sesgada hacia la izquierda y nuevamente la aproximación normal es bastante buena. En la zona central, n o n1-P entre 5 y 10, una modificación llamada corrección por continuidad mejora en gran medad la calidad de la aproximación. La razón por la que se hace la corrección por continuidad es que estamos utilizando la curva normal continua para aproximar una distribución binomial discreta. La idea general de la corrección por INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 45
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
continuidad es sumar o restar 0.5 del valor binomial antes de utilizar las probabilidades normales, es decir z=x±0.5-μσ. Ejemplo 3.9. Una fábrica de medicamentos realiza pruebas clínicas con 100 nuevos fármacos potenciales. Cerca del 20% de las sustancias que alcanzan esta etapa reciben finalmente la aprobación para su venta. ¿Cuál es la probabilidad de que se aprueben al menos 15 de los 100 medicamentes? Solución: la μ=1000.2=20>5, σ=100(0.2)(0.8)=4<5, entonces , pero como σ<5, hay que realizar una corrección por continuidad y consiste en tomar el evento con x≥14.5. P(z≥15)
z=15±0.5-204=-1.375
Así, Pz≥15=Pz≥14.5=Pz≥-1.375=0.92 Nota. Cuando Pz≥x restar 0.5 y cuando Pz≤x sumar 0.5.
UNIDAD IV MUESTREO El uso del término población es estadística es herencia de la época en la que la estadística se aplicaba sobre todo a fenómenos sociológicos y económicos. Hoy se aplica a conjuntos o series de objetos, reales o conceptuales, y en particular a conjuntos de números, medidas u INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 46
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
observaciones. Por ejemplo, si nos interesa determinar el número promedio de televisores por hogar en México, la totalidad de estas cifras, una por cada hogar, constituirá la población de este estudio. De igual manera, la población de la cual inspectores extraen una muestra, a fin de determinar alguna característica de calidad de un producto manufacturado, puede ser la de las correspondientes medidas de todas las unidades en un lote dado. Para garantizar que una muestra es representativa de la población de la cual se obtuvo, así como para establecer un marco para la aplicación de la teoría de la probabilidad a problemas de muestreo, limitaremos nuestra exposición a muestras aleatorias. Por lo que respecta al muestreo de poblaciones finitas, éstas se definen de la siguiente manera. DEFINICIÓN 1: Muestra aleatoria finita. Un conjunto de observaciones x1,x2,. . ., xn constituye una muestra aleatoria de tamaño n de una población finita de tamaño N si se elige de tal forma que cada subconjunto de n de los N elementos de la población tenga la misma probabilidad de ser seleccionado. 1.1.1 Tipos de muestreo aleatorio, sistematizado, estratificado y conglomerado. MUESTREO ALEATORIO ESTRATIFICADO En el muestreo aleatorio estratificado los elementos de la población primero se dividen en grupos, a los que se les lama estratos, de manera que cada elemento pertenezca a uno y sólo un estrato. La base para la formación de los estratos, que puede ser departamento, edad tipo de industria, etc., está a discreción de la persona que diseña la muestra. Sin embargo, se obtienen mejores resultados cuando los elementos que forman un estrato son lo más parecido posible. La figura 4.1 es un diagrama de una población dividida en H estratos. Población
Estrato 1
Estrato 2
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 47
Estrato H
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
Figura 4.1 Diagrama de un muestreo aleatorio estratificado.
Una vez formados los estratos, se toma una muestra aleatoria simple de cada estrato. Existen fórmulas para combinar los resultados de las muestras de los varios estratos en una estimación del parámetro poblacional de interés. El valor del muestreo aleatorio estratificado depende de qué tan homogéneos sean los elementos dentro de cada estrato. Si los elementos de un estrato son homogéneos, el estrato tendrá una varianza pequeña. Por tanto, con muestras relativamente pequeñas de los estratos se obtienen buenas estimaciones de las características de los estratos. Si los estratos son homogéneos, el muestreo aleatorio estratificado, proporciona resultados tan precisos como los de un muestreo aleatorio simple, pero con una muestra de tamaño total menor. MUESTREO POR CONGLOMERADOS En el muestreo por conglomerados los elementos de la muestra primera se dividen en grupos separados, llamados conglomerados. Cada elemento de la población pertenece a una y sólo un conglomerado como lo muestra la figura 4.2. Se toma una muestra aleatoria de los conglomerados. La muestra está formada por todos los elementos dentro de cada uno de los conglomerados que forman la muestra. El muestreo por conglomerados tiende a proporcionar mejores resultados cuando los elementos dentro de los conglomerados no son semejantes. Lo ideal es que cada conglomerado sea una representación, a pequeña escala, de la población. Si todos los conglomerados son semejantes en este aspecto, tomando en la muestra un número pequeño de conglomerados se obtendrá una buena estimación de los parámetros poblacionales. Población
Conglomerado 1
Conglomerado 2
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 48
Conglomerado K
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
Figura 4.2 Diagrama del muestreo por conglomerado.
Una de las principales aplicaciones del muestreo por conglomerados es el muestreo por áreas, en el que los conglomerados son las manzanas de una ciudad u otras áreas bien definidas. El muestreo por conglomerado requiere, por lo general, tamaños de muestra mayores que los requeridos en el muestreo aleatorio simple o en el muestreo aleatorio estratificado. Sin embargo, es posible reducir costos debido a que cuando se envía a un entrevistador a uno de los conglomerados de la muestra (por ejemplo, a una manzana de una ciudad), es posible obtener muchas observaciones en poco tiempo. Por tanto, se obtiene una muestra de tamaño grande a un costo significativamente menor. MUESTREO SISTEMATIZADO. Para ciertos muestreos, en especial en aquellos con poblaciones grandes, se necesita mucho tiempo para tomar una muestra aleatoria simple (hallando primero los números aleatorios y después contando y recorriendo todo una lista de la población hasta encontrar los elementos correspondientes). Una alternativa al muestreo aleatorio simple es el muestreo sistemático. Por ejemplo, si se quiere una muestra de tamaño 50 de una población que tiene 5000 elementos, se muestrea una de cada 5000/50=100 elementos de la población. En este caso, un muestreo sistemático consiste en seleccionar en forma aleatoria una de los primeros elementos de la lista de la población. Los otros elementos que tengan la posición 100 en la lista de la población, a partir de este elemento se cuentan otros 100 y así se continua. Por lo general, de esta manera es más fácil de identificar la muestra de 50 que si se usara el muestreo aleatorio simple. Como el primer elemento que se selecciona es elegido en forma aleatoria, se supone que una muestra sistemática tiene las propiedades de una muestra aleatoria simple. Esta suposición es aplicable, en especial, cuando la lista de los elementos de la población en un orden aleatorio de los elementos. •
Muestreo aleatorio estratificado: Método probabilístico en el que primero se divide la población en estratos y después se toma una muestra aleatoria simple de cada estrato.
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 49
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
•
•
Muestreo por conglomerado: Método probabilístico en el que primero se divide la población en conglomerados y después se toma una muestra aleatoria de los conglomerados. Muestreo sistemático: Método probabilístico en el que primero se selecciona uno de los primeros k elementos de una población y después se selecciona cada k-ésimo elemento de la población.
4.2 Concepto de distribución de muestreo de la media La distribución muestral de x es la distribución de probabilidad de todos los valores de la media muestral x. En este subtema se describen las propiedades de la distribución muestral de x. Como ocurre con otras distribuciones de probabilidad estudiadas, la distribución muestral de x tiene una valor esperado, una desviación estándar y una forma característica. Para empezar se considerará la media de todos los valores de x, a la que se conoce como valor esperado de x. Valor esperado de x. Ex=μ 4.1
Donde Ex=valor esperado de x μ=media poblacional
Esto enseña que usando el muestreo aleatorio simple, el valor esperado o medio de la distribución muestral de x es igual a la media de la población. Por ejemplo si el sueldo anual medio de los administradores de un hospital es de μ=$51,800. Por lo tanto, de acuerdo con la ecuación 4.1 la media de todas las medias muéstrales en el estudio del sueldo es también $5,800. Cuando el valor esperado de un estimador puntual es igual al parámetro poblacional, se dice que el estimador puntual es insesgado. Por lo tanto, la ecuación 4.1 muestra que x es un estimador insesgado de la media poblacional μ. 1. 1.2 1.2.1 Distribución muestral de la media con varianza conocida y desconocida INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 50
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
Desviación estándar de x Ahora se definirá la desviación estándar de la distribución muestral de x. Se empleará la notación siguiente. σx=desviación estandar de x σ=desviación estandar de la población n=tamaño de la muestra N=tamaño de la pobalción
Es posible demostrar que usando el muestreo aleatorio simple, la desviación estándar de x depende de si la población es finita o infinita. Las dos fórmulas para la desviación estándar son las siguientes. Población finita
Población infinita
σx=N-nN-1σn
σx=σn
4.2
Nota. El uso de la fórmula 4.2 para población infinita, es válida para poblaciones finitas siempre y cuando el tamaño de la muestra sea menor o igual a 5% del tamaño de la población; es decir, nN≤0.05. Ejemplo. Suponga que una población consiste en los números 8. 10 y 12. Si una muestra de medida 2 es seleccionada con reemplazamiento muestre que μx=μ y también que σx=σn. Solución: μ=8+10+123=303=10 σ2=x-μ2N=83 σ2n=8/32=43
La figura 4.2.1 muestra los datos. Todas la muestras posibles
Población de medidas x
Todas la muestras posibles
Población de medidas x
8,8
8
10,12
11
8,10
9
12,8
10
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 51
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
8,12
10
12,10
11
10,8
9
12,12
12
10,10
10 Figura 4.2.1
μx=8+9+…+11+129=10 σx=σ2n=8/32=43
Lo que responde a la pregunta solicitada. Media poblacional: σ desconocida. Cuando se calcula un intervalo de confianza para la media poblacional, suele no contarse con una buena estimación de la desviación estándar poblacional. En tales casos se usa la misma muestra para estimar μ y σ. Esta situación es el caso que se conoce como σ desconocida. Cuando se usa s para estimar σ, el margen de error y la estimación por intervalo de la media poblacional se basan en una distribución de probabilidad conocida como distribución t. Aunque la elaboración matemática de la distribución t parte de la suposición de que la población de la distribución t se aplica en muchas situaciones en que la población se desvía significativamente de una población normal. La distribución t es una familia de distribuciones de probabilidad similares: cada distribución t depende de un parámetro conocido como grado de libertad. La distribución t para un grado de libertad es única, como lo es la distribución t para dos grados de libertad, para tres grados de libertad, etc. A medida que él número de grados de libertad aumenta, la diferencia entre la distribución t y la distribución normal estándar se va reduciendo. En la figura 4.2.2 se muestran las distribuciones t para 10 y 20 grados de libertad y su relación con la distribución de probabilidad normal estándar. Observe que una distribución tpara más grados de libertad exhibe menos variabilidad y un mayor parecido con la distribución normal estándar, también que la media de toda distribución t es cero.
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 52
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
Distribución normal estándar Distribución t (20 grados de libertad) Distribución t (10 grados de libertad)
Figura 4.2.2 comparación de la distribución normal estándar con las distribuciones t para 10 y 20 grados de libertad. Z, t
0
Definición: Estimación de la media σ desconocida. x±tα2sn 4.2.0
Donde s es la desviación estándar muestral, 1-α es el coeficiente de confianza y tα2 es el valor de t que proporciona un área de α2 en la cola superior de la distribución t para n-1 grados de libertad. Mostremos con un ejemplo el uso de esta fórmula. Suponga que se desea realizar un estudio para estimar la media del adeudo en las tarjetas de crédito en la población de familias de Puebla. En la tabla 4.2.1 se presentan los saldos en las tarjetas de crédito de una muestra de n=70 familias. En esta ocasión no se cuenta con una estimación previa de la desviación estándar poblacional σ. De manera que los datos muéstrales deberán usarse para estimar tanto la media poblacional como la desviación estándar poblacional. Tabla 4.2.1 SALDOS EN LAS TARJETAS DE CRÉDITO DE UNA MUESTRA DE 70 FAMILIAS 9430
14661
7159
9071
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 53
9641
11032
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
7535
12195
8137
3603
11448
6525
4078
10544
9467
16804
8279
5239
5604
13659
12595
13479
5649
6195
5179
7061
7917
14044
11298
12584
4416
6245
11346
6817
4353
15415
10676
13021
12806
6845
3467
15917
1627
9719
4972
10493
6191
12591
10112
22000
11356
615
12851
9743
6567
10746
7117
13627
5337
10324
13627
12744
9465
12557
8372
18719
5742
19263
6232
7445
Con los datos de la tabla 4.2.1 se calcula x=$9312 y s=$4007. Ahora se usa la tabla 2 del apéndice A para obtener el valor de t0.025 correspondiente a 95% de confianza y n-1=69 grados de libertad. El valor de t que se necesita está en el renglón correspondiente a 69 grados de libertad y en la columna correspondiente a 0.025 en la cola superior. El valor que se encuentra es t0.025=1.995. Entonces utilizando la fórmula de estimación, tenemos x±tα2sn =9312±1.995400770=9312±955
Donde la estimación puntual de la media es de $9312, el margen de error es $955 y el intervalo de confianza de 955 va de $8357 a $10267, en consecuencia, 95% de confianza de la media de los saldos en las tarjetas de crédito de la población de todas las familias están en el intervalo mencionado. Recomendación práctica. Si la población tiene una distribución normal, el intervalo de confianza suministrado en la expresión 4.2.0 será aproximado. En este caso la calidad de la aproximación depende tanto de la distribución de la población como del tamaño de la muestra. INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 54
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
En la mayoría de las aplicaciones un tamaño de muestra n≥30 es suficiente al usar la expresión 4.2.0, para obtener una estimación por intervalo de la media poblacional. Sin embargo, si la distribución de la población es muy sesgada o si hay observaciones atípicas, la mayoría de los especialistas en estadística recomiendan un tamaño de muestra de 50 o más. Si la población no tiene una distribución normal pero es más o menos simétrica, ya con un tamaño de muestra de 15 puede esperarse una buena aproximación al intervalo de confianza. Con muestras más pequeñas la expresión 4.2.0 sólo debe usarse si el analista cree, o está dispuesto a suponer, que la distribución de la población es por lo menos aproximadamente normal. Mostremos un ejemplo con una muestra pequeña. Industrias Cheer esta considerando un nuevo programa asistido por computadora con el fin de capacitar a los empleados de mantenimiento para realizar la reparación de las máquinas. Con objeto de evaluar este programa, el director de manufactura solicita una estimación de la media poblacional del tiempo requerido para que los empleados de mantenimiento completen la capacitación asistida por computadora. Tabla 4.2.2 Duración de la capacitación, en días, en la muestra de 20 empleados de Cheer 59
54
42
44
50
42
48
55
54
60
55
44
62
62
57
45
46
43
56
Considere una muestra de 20 empleados que siguen el programa de capacitación. En la tabla 4.2.2 se muestran los datos del tiempo, en días, que necesitó cada una de los empleados para el programa de capacitación. En la figura 4.2 aparece un histograma de los datos. De acuerdo al histograma ¿qué se puede decir de la distribución de los datos? Primero, de acuerdo con los datos muéstrales de sesgo o de observaciones atípicas. Por lo que se concluye que una estimación por intervalos basada en la distribución t parece ser aceptable para esta muestra de 20 empleados. INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 55
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
x=xin=103020=51.5 días s=xi-x2n-1=88920-1=6.84 días
Para dar un intervalo de confianza del apéndice A y 19 grados de
95%, se usa la tabla 2 del libertad y se obtiene
51.5±2.0936.8420=51.53.2
La estimación puntual de la media poblacional es 51.5 días. El margen de error es de 3.2 días y el intervalo de confianza de 95% va de 48.3 días a 54.7 días. Usar un histograma de los datos muéstrales para tener información acerca de la distribución de la población no es siempre concluyente, pero en muchos casos es la única información disponible. El histograma, junto con la opinión del analista, suele usarse para decidir si es adecuado usar la expresión 4.2.0 para obtener una estimación por intervalo. 1.2.2 Distribución muestral de la diferencia entre dos medias con
varianza conocida y desconocida.
1.2.3 Distribución muestral de la proporción. Una distribución de este tipo indica cuán probable es un conjunto particular de proporciones muéstrales, dados el tamaño de la muestra y la proporción de la población. Cuando el tamaño de la muestra es de 0 o menos, las probabilidades para los diferentes resultados posibles se pueden obtener directamente de una tala de probabilidad binomiales simplemente convirtiendo el número de éxitos a porcentajes. Por ejemplo 3 ocurrencias en 10 observaciones sería el 30%, en tanto que 5 ocurrencias en 20 observaciones sería el 25%. Para tamaños muéstrales mayores la aproximación normal a la binomial producirá valores bastantes aceptables. La media (proporción promedio o porcentaje) de la distribución de muestra siempre es igual a la proporción de la población. Es decir, la proporción muestral p es el estimador puntual de la proporción poblacional. La fórmula para calcular la proporción muestral es p=p INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 56
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
en donde: p=proporcion de la población p=media de la distribución de muestreo de proporciones
Cuando la población es muy grande o infinita, la desviación estándar de la distribución de muestreo se calcula utilizando la fórmula σp=p1-pn
La proporción muestral p es una variable aleatoria y su distribución de probabilidad se conoce como distribución muestral de p. Ejemplo. Un detallista compra vasos de cristal en grandes cantidades directamente de la fábrica. Tales vasos son envueltos uno por uno. Algunas veces, el detallista inspecciona las remesas para determinar la proporción de vasos rotos o defectuosos. Si un gran cargamento contiene el 10% de vasos rotos o defectuosos, ¿Cuál es la probabilidad de que el detallista obtenga una muestra aleatoria de 100 vasos que representan el 17% o más de defectuosos? Solución: El primer paso es calcular la desviación estándar σp=p1-pn=(0.10)(0.9)100=0.310=0.3
Ahora esto se puede utilizar para determinar la variación relativa: 17%-10%3%=2.33
El área más allá de 2.33 es 0.0099 (que se obtuvo de la tabla para una distribución normal z=2.33). La probabilidad de obtener más de 17% de defectuosos de una muestra de 100 es de 0.9%.
1.3Teorema del limites Central La capacidad para utilizar muestras y obtener inferencias con respecto a parámetros de población depende del conocimiento de la distribución de muestreo. Se ha comentado como se determina la media y la desviación INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 57
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
estándar pero, aún se requiere cierta información adicional: la forma de la distribución de muestreo. Anteriormente se explicó que existe una tendencia a que las distribuciones de medias y proporciones sean normales. En el caso de los calores medios muéstrales se puede demostrar matemáticamente que si una población está distribuida de modo normal. La distribución de los valores medios de la población que se obtienen de esa población también lo estarán respecto a cualquier tamaño de la muestra. Además, aún so la población no es normal, la distribución de los valores medios de la muestra serán aproximadamente normales si el tamaño de la muestra es grande. Esta es una suerte, ya que indica que no es necesario saber cuál es la distribución de la población para estar en condiciones de obtener inferencias con respecto a la población a partir de datos muéstrales. La única restricción es que el tamaño de la muestra sea grande. Una regla que generalmente se utiliza establece que las muestras deben incluir 30 0 más observaciones. Estos resultados se conocen como el Teorema del Límite Central, y quizá constituyan el concepto más importante de inferencia estadística. EL TEOREMA DEL LIMITE CENTRAL 1. Si la población muestreada está distribuida de manera normal, la distribución de los valores medios de la muestra estará normalmente distribuidos respecto a todos los tamaños muéstrales. 2. Si la población no es normal, la distribución de los valores medios de la muestra será aproximadamente normal respecto a un tamaño muestral grande. Nota: el Teorema del Límite Central se aplica solamente a valores medios de la muestra. Sin embargo, se puede destacar que, excepto para valores muy pequeños o muy grandes de p. El teorema del Límite Central se indica gráficamente en la figura 4.3.1 Veamos la aplicación del Teorema del Límite Central con un ejemplo. Ejemplo. Una población muy grande tiene una media de 20 y una desviación estándar de 1.4 si se toma una muestra de 49 observaciones, conteste las siguientes preguntas. a) ¿Cuál es la media de la distribución de muestreo? INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 58
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
b) ¿Cuál es la desviación estándar de la distribución de muestreo? c) ¿Qué porcentaje de posibles valores medios de la muestra diferirán de la media de la población por más de 0.2? Solución. Como n>30, es posible suponer que la distribución normal.
de muestreo es
a) La media de la distribución de muestreo siempre es igual a la media de la población. Por tanto μx=20
b) La desviación estándar de la distribución de muestreo es σx=σn=1.449=0.2
c) El porcentaje de valores medios de la muestra que diferirán por más de 0.2 de la media de la población (ver figura 4.3.2) es 20+0.2-200.2=+σx proporción :0.1587 20-0.2-200.2=-σx proporción: 0.1587
Total:0.3174
1.2Tipo de estimaciones y características. En específico, usaremos datos muéstrales para hacer estimados de parámetros de población. Por ejemplo, el problema de este tema se refiere a los resultados de una encuesta de que aplicó a 829 adultos de Puebla, el 51% de los cuales se manifestaron en contra del uso de las cámaras para expedir multas de tránsito. Con base en el estadístico muestral de 51%, estimaremos el porcentaje de adultos en la población de Puebla que se oponen a la legislación de la cámara vigilante.
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 59
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
Las dos aplicaciones principales de la estadística inferencial implican el uso de los datos para: 1. Estimar el valor de un parámetro de la población.
2. Probar alguna aseveración (o hipótesis) acerca de una población. Los principales tipos de estimaciones para muestras son: a) Media b) Desviación estándar c) Proporción Resuelta interesante que cada uno de estos estadísticos muéstrales son los estimadores puntuales de sus correspondientes parámetros poblacionales. Sin embargo, antes de usar un estadístico muestral como estimador puntual, se verifica si el estimador puntual tiene ciertas propiedades que corresponden a un buen estimador puntual. Las propiedades que deben tener los buenos estimadores puntuales: insesgadez, eficiencia y consistencia. Como hay distintos estadísticos muéstrales que se estimadores puntuales de sus correspondientes poblacionales, utilizaremos la notación general siguiente.
usan como parámetros
θ=el paramétro poblacional de interés θ=el estadístico o estimador puntual de θ
En esta notación θ es la letra griega theta y la notación θ se lee “theta sombrero”. En general, θrepresenta cualquier parámetro poblacional como, por ejemplo, la media poblacional, la desviación estándar poblacional, la proporción poblacional, etc.; θ representa el correspondiente estadístico muestral, por ejemplo, la media muestral, la desviación estándar muestral y la proporción muestral. Mostremos la comparación en la tabla 4.4.1, expresando ahí mismo el cálculo para cada uno de los estimadores y sus características.
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 60
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
Parámetro poblacional
Estimador
Formula Caracterís equival ticas. ente
μ=media
x=media muestral
x=xin
Son más sencillos de determina r
σ=desviación estandar
s=desviación estandar muestral
s=R4
Son más sencillos de determina r
p=proporción
p=proporción muestral
p=xn
Son más sencillos de determina r
1.2Determinación del tamaño de la muestra de una población. El tamaño de una muestra es importante para obtener una buena aproximación a los intervalos de confianza (que se analizaran en la siguiente sección) en los casos en que la población no tiene una distribución normal, ahora enfocaremos la atención a otro aspecto relacionado con el tamaño de la muestra. Se describe cómo elegir un tamaño de muestra suficientemente grande para obtener un margen de error deseado. Para explicar esto, se vuelve al caso en que se tenía una σ conocida. El intervalo de estimación está dado por x±zα2σn la cantidad zα2σn es el margen de error. De manera que, como se ve, zα2, la desviación estándar poblacional σ, y el tamaño de la muestra n se combinan para determinar el margen de error. Una vez que se selecciona el coeficiente de confianza 1-α, se determina , zα2. Por tanto, si se tiene el INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 61
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
valor de σ, es posible encontrar el tamaño de muestra n necesario para proporcionar cualquier margen de error deseado. A continuación se presenta la deducción de la fórmula que se usa para calcular el tamaño n de muestra deseado. Sea E=el margen de error deseado E=zα2σn
Despejando n se tiene.
TAMAÑO DE LA MUESTRA PARA UNA ESTIMACIÓN POR INTERVALO DE LA MEDIA POBLACIONAL n=zα22E2 4.5
Este tamaño de muestra proporciona el margen de error deseado al nivel de confianza elegido. En la ecuación 4.5 E es el margen de error que el usuario está dispuesto a aceptar, y el valor zα2 es consecuencia directa del nivel de confianza que se va usar para calcular la estimación por intervalo. A reserva de la decisión del usuario, 95% de confianza es el valor más usado z0.025=1.96 Por último, para usar la ecuación 4.5 es necesario contar con el valor de la deviación estándar poblacional σ. Sin embargo, aun cuando este valor no se conozca, puede usarse la ecuación 4.5 siempre que se tanga un valor preliminar o un valor planeado de σ. En la práctica, se suele usar alguno de los procedimientos siguientes para obtener este valor planeado de σ. 1. Usar como valor planeado de σuna estimación de la desviación
estándar poblacional calculada a partir de datos de estudios anteriores. 2. Emplear un estudio piloto seleccionando una muestra preliminar. La desviación estándar muestral obtenida de la muestra preliminar puede usarse como valor planeado de σ. 3. Use su juicio para el valor de σ. Por ejemplo, se puede empezar por estimar el mayor y el menor valor en los datos de la población. Esta diferencia entre el mayor y el menor valor proporciona una estimación del rango de los datos. Por último, este valor dividido INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 62
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
entre 4 suele considerarse como una aproximación burda a la desviación estándar y tomarse como un valor planeado aceptable de σ. Ejemplo. En un estudio previo para investigar el costo de la renta de automóviles en México se encontró que el costo medio de la renta de un auto mediano era aproximadamente $55 por día. Suponga que la organización que realizo dicho estudio quiere realizar un nuevo estudio para estimar la media poblacional de las rentas por día de automóviles medianos en México. Antes de iniciar, especificó que la media poblacional de las rentas por día debe estimarse con un margen de error de $2 y que se desea un nivel de 95% de confianza. Solución. El margen de error especificado es de E=2, el nivel de 95% de confianza indica que z0.025=1.96. , por tanto solo falta un valor planeado de la desviación estándar poblacional σpara calcular el tamaño de muestra deseado. El analista determino que la desviación estándar poblacional del costo de la renta diaria era de $9.65. usando %9.65 como valor planeado de σ, se tiene n=zα2E2=1.9629.65222=89.43
De esta manera el tamaño de la muestra para obtener un margen de error de $2 debe ser de por lo menos 89.43 rentas de automóviles medianos. En casos como éste, en que el valor de n no es un número entero, se redondea al siguiente valor entero, así que el tamaño de muestra que se aconseja es 90 rentas de automóviles medianos. Tamaño de la muestra para una estimación por intervalo de la proporción poblacional. n=zα22p*1-p*E2
En la practica el valor planeado p* se determina mediante algunos de los métodos siguientes: 1. Utilizar la proporción población de una muestra previa de las mismas unidades o de unidades similares. 2. Utilizar un estudio piloto y elegir una muestra preliminar. La proporción muestral de esta muestra se usa como valor planeado de p*. 3. Proponer una “mejor aproximación” para el valor de p*. INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 63
MANUAL DE ASIGNATURA DE PROBABILIDAD Y ESTADISTICA DESCRIPTIVA
4. Si no aplica ninguna de las alternativas anteriores, emplear como valor planeado p*=0.50.
Suponga que una empresa desea llevara a cabo un estudio con mujeres golfistas que están satisfechas con la disponibilidad de horarios de salida. ¿De qué tamaño deberá ser la muestra si se desea que en la estimación de la proporción poblacional el margen de error sea de 0.025 a 95% de confianza?. Como E=0.025 y zα2=1.96, se necesita un valor planeado p*para responder esta pregunta sobre el tamaño de la muestra. Utilizando como valor planeado p*, el resultado del estudio que se conocía, que es de p=0.44, entonces tenemos que el tamaño de la muestra deseado es de: n=zα22p*1-p*E2=1.9620.441-0.44*0.0252=1514.5
Golfistas para tener el margen de error requerido. 1.2Intervalos de confianza para la media, con el uso de la distribución.
INSTITUTO TECNOLOGICO SUPERIOR DE ACATLAN DE OSORIO PUEBLA ELABORO: LIC. LEWKONOE ARIAS SALAZAR Página 64