UNIVERSIDAD SAN IGNACIO DE LOYOLA CURSO: METODOS CUANTITATIVOS DISTRIBUCIONES MUESTRALES Definiciones. Población: Se denomina población a la totalidad de personas, objetos o unidades elementales que tienen una o más características medibles que se se puedan evaluar de acuerdo a su naturaleza de su característica cualitativa o cuantitativa. Unidad elemental: viene a ser cada uno de los elementos que conforman la población. Muestra: La Muestra: La muestra es un subconjunto de la población . La muestra puede ser de dos tipos: • Muestra probabilística o aleatoria: muestra donde cada persona, objeto o unidad elemental ha tenido la misma oportunidad de ser elegido. Elección de las personas u objetos al azar. Cuando la muestra es aleatoria se considera como una muestra representativa de la población. • Muestra no probabilística: muestra donde cada persona u objeto ha sido elegido bajo cierto criterio de preferencia o por requisitos de algún interés en especial en algunos de los elementos de la población. La elección de las personas u objetos no cumplen con la misma oportunidad de ser elegidos, por lo tanto no se puede considerar que la muestra sea representativa de la población. Parámetro: Es una característica de la población. Esta característica tiene que ser obtenida de toda la población y se suele considerar como una constante. Los parámetros pueden ser de variables cuantitativas o variables cualitativas: Parámetros para variables cuantitativas: N
•
Media Poblacional
: µ =
∑ x
i
i=1
N es el tamaño de la población
N N
•
Varianza Poblacional: σ 2 =
∑ ( x − µ )
2
i
i =1
N
•
Desviación Estándar Poblacional: σ
•
Mediana Poblacional: Me
Parámetros para variables cualitativas: • Proporción Poblacional: π
•
Varianza de proporción poblacional:
•
muestra Moda Poblacional
: Mo
1
π (1 − π )
n
donde n es el tamaño de la
UNIVERSIDAD SAN IGNACIO DE LOYOLA Realmente para el caso de la mediana poblacional (Me), se puede obtener sólo con variables cuantitativas o cualitativas jerárquicas, en cambio con la moda poblacional (Mo) se puede obtener con cualquier tipo de variable. Valor Estadístico o Estadígrafo. Es una medida que resume una característica de la muestra, es decir es una función de las observaciones muestrales y que no depende de parámetro alguno. Se caracteriza porque puede tomar valores de muestra a muestra debido a que las observaciones captadas en muestras diferentes no son necesariamente iguales. Valores estadísticos o estadígrafos para variables cuantitativas: n
∑ x
i
•
Media muestral
: x =
i =1
n es el tamaño de la muestra
n n
• • •
Varianza muestral: S = 2
∑ ( x − x )
n
2
i
i =1
n −1 Desviación Estándar Muestral: S Mediana muestral: me
ó S =
n ∑ xi 2 x − i =1
∑
2
i
2
n
i =1
n −1
Valores estadísticos o estadígrafos para variables cualitativas:
•
Proporción muestral:
•
Varianza de proporción muestral:
•
Moda muestral: mo
p (1 − p ) n
donde n es el tamaño de la muestra
Realmente, para el caso de la mediana poblacional (me), se puede obtener sólo con variables cuantitativas o cualitativas jerárquicas, en cambio con la moda poblacional (mo) se puede obtener con cualquier tipo de variable. Distribución Muestral Viene a ser la distribución probabilística de un Estadígrafo. Entre las distribuciones muestrales, las más conocidas son las siguientes las siguientes:
• • •
La distribución de probabilidad del promedio muestral x La distribución de probabilidad de la proporción p La distribución de probabilidad de la varianza S 2
En este tema se ve las distribuciones muestrales de x y de
p
, bajo el criterio de que el
tamaño de muestra n, usualmente n ≥ 30 , (Teorema del Límite central) es suficientemente grande como para utilizar una aproximación a la distribución normal
2
UNIVERSIDAD SAN IGNACIO DE LOYOLA para el cálculo de las probabilidades de x y
. Igualmente se considerará que el
tamaño de la población N es mucho más grande que el tamaño de la muestra n, siendo similar a que una muestra obtenida con observaciones sin reemplazo es igual que obtener una muestra con reemplazo. Distribución Muestral de
x
El propósito es encontrar la probabilidad de x de acuerdo al valor que se está interesado bajo las condiciones de los parámetros. La forma de proceder es parecida a la distribución normal estándar: x − Z = ~ Z (0,1) σ
n donde
σ
n
se conoce como la desviación estándar promedio. También se define como
σ x .
Ejemplo: Pregunta. Un auditor toma una muestra aleatoria de tamaño 100 (n = 100) de un gran conjunto de cuentas por cobrar. El auditor sabe que las cuentas por cobrar constituyen una población con desviación estándar poblacional igual a $145 y media poblacional $25. ¿Cuál es la probabilidad de que una muestra de cuentas por cobrar tenga una media muestral sea más de $51? Respuesta. Considerando que la variable en estudio es X= Valor de una cuenta por cobrar , tiene una muestra suficientemente grande para utilizar la distribución normal se procede de la siguiente manera: La información a partir del enunciado es: Tamaño de muestra: n = 100 Desviación Estándar poblacional: σ = $ 145 Promedio o media poblacional: µ = $ 25
La pregunta a resolver es: P ( x > 51) = ?
x − µ 51 − 25 P ( x > 51) = P > = P ( Z > 1.79 ) = 1 − P (Z ≤ 1.79 ) = 1 − 0.9633 = 0.0367 σ 145 100 n La probabilidad de obtener una muestra de cuentas por cobrar con un valor promedio mayor a $51 es igual a 0.0367, lo cual el poco probable obtener una muestra con esas características. 3
UNIVERSIDAD SAN IGNACIO DE LOYOLA
Ejercicios.
1. Una población que tiene un promedio de 50 y una desviación estándar de 10. Si se toma una muestra aleatoria de tamaño 64. ¿Cuál es la probabilidad de que el promedio muestral sea: a. b. c. d.
mayor que 52 menor que 51 entre 48.5 y 52.4 menor que 48.5 ó mayor que 52.4
2. Suponga que una empresa que produce bolsas de azúcar de acuerdo a un proceso con una media o promedio poblacional de 950 gr. y una varianza de 1600 gr 2. Si se eligen al azar una muestra de 36 bolsas, a. Hallar la probabilidad que el promedio muestral sea mayor a 965 g. b. ¿A partir de que valor, el peso promedio muestral se puede considerar en el 10% de las bolsas con más peso? 3. El contenido de nicotina de un solo cigarrillo de la marca A es una variable con media µ = 0.9mg . y desviación estándar 0.12mg Si un individuo fuma 100 cigarrillos por semana: a. Halle la probabilidad del contenido promedio de nicotina consumido del individuo, al fumar los 100 cigarrillos en una semana, sea menor a 0.88 mg. b. ¿Cuál es la probabilidad de que el contenido promedio de nicotina consumido por el individuo durante la semana haya sido menos de 0.95mg . si se sabe que esta persona siempre consume en promedio más de 0.9mg . de nicotina? 4. El jefe del departamento de ventas sabe que en el almacén principal, el promedio de compra por cliente es de 112000 dólares con una desviación estándar de 5500 dólares. a. ¿Cuál es la probabilidad de que un cliente tenga una compra menor a 110000 dólares o mayor a 115000 dólares? b. Si se eligen al azar a 36 clientes, ¿cuál es la probabilidad que el promedio muestral sea mayor que 105000? c. ¿A partir de que monto se puede considerar a un cliente en el 10% de los clientes que menos compran?
4
UNIVERSIDAD SAN IGNACIO DE LOYOLA Distribución Muestral de
Considere el caso donde no se trabaja con variables cuantitativas sino nominales, como por ejemplo si la unidad encuestada es casada o no. En el caso de ser una persona casada la respuesta es 1, y en caso de no ser casada, la respuesta es 0. Si obtenemos una muestra de tamaño n, el promedio de casados sería algo parecido a lo siguiente: p =
1 + 0 + 0 + 1 + ... + 1 n
=
número de casados tamaño de la muestra
El valor de p vendría a ser una proporción de personas casadas en la muestra. Por lo tanto el procedimiento a seguir es parecido al caso anterior, utilizando la distribución normal.
Cuando n es grande (por lo general, n ≥ 30, Teorema de Límite Central), la variable aleatoria p se aproxima a una distribución normal. Entonces las probabilidades se definen como: p − π Z = ~ Z (0,1) π (1 − π )
n donde
π (1 − π )
n
es la desviación estándar de la proporción. También se define como
σ p Ejemplo En un cierto distrito de una ciudad hay 8000 personas adultas, donde usualmente el 20% compran una revista A. Si se elige una muestra aleatoria de 100 personas, hallar la probabilidad de que la proporción muestral de personas que compran la revista A, sea mayor del 17%.
p − π 0.17 − 0.20 P ( p > 0.17) = P Z > = P Z > π (1 − π ) 0.20(1 − 0.20) 100 n − 0.03 = P ( Z > −0.75) = P ( p > 0.17) = P Z > 0.20(1 − 0.20) 100 = 1 − P ( Z ≤ −0.75) = 1 − 0.2266 = 0.7734 La probabilidad de que la proporción muestral de las compras de las revistas sea mayor a 17% es 0.7734, lo que indicaría que es muy probable se logre que más del 17% de las personas compre las revistas.
5
UNIVERSIDAD SAN IGNACIO DE LOYOLA Ejercicio: 1. Por información anterior, el 10% de las piezas de un gran embarque de artículos para maquinaria es deficiente. Si seleccionan muestras aleatorias de 400 piezas, ¿Cuál es la probabilidad de que las muestras tendrán
a. entre 9% y 10% de piezas deficientes? b. menos de 8% de piezas deficientes? c. ¿Si sólo se selecciona un tamaño de muestra de 100, cuáles habrían sido sus respuestas en (a) y (b)? d. ¿Si el tamaño de muestra es de 30, cuáles habrían sido sus respuestas? 2. El 46% de los sindicatos de un país están en contra de comerciar con China Continental. a. ¿Cuál es la probabilidad de que una encuesta a 100 sindicatos muestre que más del 52% tengan la misma posición? b. ¿Entre qué valores está el 90% central (simétricamente alrededor de su parámetro) de la proporción muestral de los 100 sindicatos que están en contra de comerciar con China? c. ¿Cuál es la probabilidad de que una muestra tenga menos del 55% de los sindicatos en contra de los sindicatos, dado que se sabe que más del 40% de la muestra están en contra? 3. Si se toma una muestra aleatoria de 80 artículos producidos por una máquina, sabiendo que el 15% resultan defectuosos. Responder: a. ¿Cuál es la probabilidad de que el 20% o más artículos de la muestra sean defectuosos? b. ¿Cuál es la proporción muestral máxima que determina al 15.5% de las muestras con menor proporción de artículos defectuosos? 3. Históricamente, el 45% de los huéspedes que van al restaurante de un hotel piden de plato principal langosta. Si se selecciona una muestra aleatoria de 200 huéspedes que han ido al restaurante del hotel: a. ¿Cuál es la probabilidad de que la muestra proporcional esté entre el 40% y 48% de los huéspedes que piden langosta? b. ¿A partir de qué valor se puede considerar al 5% superior de las proporciones muestrales?
6
UNIVERSIDAD SAN IGNACIO DE LOYOLA Problemas .
1. Se espera que el diámetro de las pelotas de ping-pong manufacturadas en una gran fábrica tengan una distribución normal con media 1.30 pulgadas y una desviación estándar de 0.04 pulgadas. ¿Cuál es la probabilidad de que una pelota de ping-pong seleccionada aleatoriamente tenga un diámetro de: a. Entre 1.28 y 1.30 pulgadas? b. Entre 1.31 y 1.33 pulgadas? c. Entre qué valores (simétricamente distribuidos alrededor de la media) caerá el 60% de la pelotas de ping-pong (en términos de diámetro) d. Si seleccionan muchas muestras de 16 pelotas de ping-pong y se obtienen promedios muestrales, responda: (1)
¿Cuál es la probabilidad de que los promedios muestrales estén entre 1.28 y 1.30 pulgadas?
(2)
¿Cuál es la probabilidad de que los promedios muestrales estén entre 1.31 y 1.33 pulgadas?
(3)
Entre qué valores del promedio muestral (simétricamente distribuidos alrededor de la media) caerá el 60% de la pelotas de ping-pong (en términos de diámetro)
e. Compare las respuestas de (a) con (d.1) y (b) con (d.2). ¿Qué ha sucedido? f. Explique la diferencia de los resultados de (c) y (d.5). 2. Las llamadas telefónicas de larga distancia se distribuyen normalmente con media 8 y desviación estándar 2 minutos. Si seleccionan muestras aleatorias de 25 llamadas a. ¿Cuál es la probabilidad de que el promedio de las muestras esté entre 7.8 y 8.2 minutos? b. ¿Cuál es la probabilidad de que la media muestral sea menor a 7.5 ó mayor a 8 minutos? c. Si se seleccionan muestras de 100 llamadas. ¿Cuál es la probabilidad de que las medias muestrales estén entre 7.8 y 8.2 minutos? d. Explique la diferencia de los resultados de (a) y (c).
7
UNIVERSIDAD SAN IGNACIO DE LOYOLA 3. Se ha determinado que el 65% de los estudiantes universitarios de la Universidad de una ciudad prefieren los cuadernos de marca “Profesional”. ¿Cuál es la probabilidad de que una muestra de 100 universitarios de dicha ciudad se encuentre: c. como máximo el 68% sean usuarios de ese tipo de cuaderno? d. entre un 65.5% y 66.5%. e. ¿Cuál es la probabilidad de que más de 68 estudiantes de la muestra prefieran los cuadernos de marca “Profesional”? 4. Históricamente el 10% de un gran envío de paquetes proveniente de un aeropuerto LL viene con el embalaje deteriorado. Si se seleccionan muestras aleatorias de 400 paquetes. a. ¿Cuál es la probabilidad de que las muestras tengan entre el el 9% y 10% de paquetes con el embalaje deteriorado? b. ¿Cuál es la probabilidad de que las muestras tengan menos del 8% del embalaje deteriorado. c. ¿Cuál es el valor mínimo de la proporción muestral para determinar al 20% de las proporciones muestrales de mayor valor?
5. Basándose en datos anteriores, el 30% de la compras con tarjetas de crédito en una gran tienda departamental son por cantidades superiores a $100. Si se seleccionan muestras aleatorias de 100 compras con tarjeta de crédito a. ¿cuál es la probabilidad de que la muestra proporcional esté entre el 20% y 30% de las compras con más de $100? b. ¿a partir de qué valor se puede considerar al 5% superior de las proporciones muestrales?
8