Distribuciones de Muestreo Johanna Amaya
Septiembre 26, 2011
Conceptos Básicos Supongamos que estamos interesados en determinar el número promedio de vehículos por hogar en la ciudad de Barranquilla.
Poblacion Conjunto de personas u objetos de interés en una Investigación Ejemplo:
Muestra Es una porción representativa de elementos de una población, elegida para su examen o medición directa. Generalmente es costoso el análisis de todos los datos, así que se hace necesario realizar las mediciones de interés sólo en una porción representativa de la población e inferir de ella resultados que corresponden a la población entera. Ejemplo:
Conceptos Básicos Supongamos que estamos interesados en determinar el número promedio de vehículos por hogar en la ciudad de Barranquilla.
Poblacion Conjunto de personas u objetos de interés en una Investigación Ejemplo:
Muestra Es una porción representativa de elementos de una población, elegida para su examen o medición directa. Generalmente es costoso el análisis de todos los datos, así que se hace necesario realizar las mediciones de interés sólo en una porción representativa de la población e inferir de ella resultados que corresponden a la población entera. Ejemplo:
Conceptos Básicos
Parámetro Medida usada para describir alguna característica de una población.
Ejemplos de estos son la media, varianza, proporción calculados respectivament respectivamentee por: N
X
N
xi
X
(xi )2
x = ; = ; p= N N N también se trabajarán diferencia de medias 1 2 , cociente de varianzas ; diferencia de proporciones p1 p2 Los parámetros no se conocen se estiman a partir de muestras. i=1
2 1 2 2
2
i=1
Conceptos Básicos
Estadísticos Son medidas usada para describir alguna característica de una muestra, representan una estimación de los parámetros. Ejemplos de estos
son la media, varianza, proporción calculados respectivamente por: n
X
n
xi
X
(xi x)2
x x= ; s = ; p = n n1 n De igual forma existen estimaciones para la diferencia de medias x1 x2 ; s cociente de varianzas s y diferencia de proporciones p1 p2 i=1
2 1 2 1
2
i=1
b b b
Conceptos Básicos Muestreo Proceso de selección de muestras, se utiliza cuando no es posible contar o medir todos los elementos de la población objeto de estudio.
Muestra aleatoria Una muestra es aleatoria cuando cada una de las posibles muestras de tamaño n de la población tiene la misma probabilidad de ser seleccionada. Una muestra aleatoria de tamaño n está conformada por un conjunto de variables aleatorias X 1 ; X 2 ;:::;X n donde X i representa el valor obtenido en la i esima extracción, estas X i tienen la misma distribución de probabilidad de la población y se cumple que E (X i ) = ; V (X i ) = 2 con y 2 media y varianza de la población respectivamente.
Conceptos Básicos Tipos de Muestreo 1
Muestreo no aleatorio o de juicio : Se emplea el conocimiento y la
opinión personal para identi…car aquellos elementos de la población que deben incluirse en la muestra. 2
Muestreo aleatorio o de probabilidad: En el cual todos los
elementos de la población tienen la oportunidad de ser escogidos para la muestra. a. Muestreo aleatorio simple: es un método de selección de muestras que permite que cada muestra posible pueda ser elegida con la misma probabilidad. b. Muestreo sistemático: los elementos que se muestrearán se seleccionan de la población en un intervalo uniforme que se mide con respecto al tiempo, al orden o al espacio.
Conceptos Básicos
Tipos de Muestreo Muestreo aleatorio o de probabilidad: 1
c. Muestreo estrati…cado: la población se divide en grupos homogéneos, o estratos, y después se toma una muestra aleatoria simple de cada estrato. Aquí la variabilidad dentro de cada grupo es pequeña y entre los grupos es grande. d. Muestreo de racimo: la población se divide en grupos o racimos de elementos, y luego se selecciona una muestra aleatoria de estos racimos. La variabilidad dentro de cada grupo es grande y entre los grupos es pequeña; es como si cada racimo fuese un pequeña representación de la población en si mima.
Ejemplo: Que tipo de muestreo usariamos en nuestro ejemplo?
Conceptos Básicos
Muestra aleatoria 1
2
Cuando el muestreo es sin reemplazo cada una de las N muestras n tiene una probabilidad de 1= N de ser seleccionada, donde N y n n representan el número de elementos de la poblacion y de la muestra respectivamente.
Cuando el muestreo es con reemplazo se cumple que las X i i = 1;:::;n son independientes y como tienen la misma distribución de la población, se dice que las X i están idénticamente distribuidas (IID)
Conceptos Básicos Estimador y Estadística Un estimador es una regla que establece cómo calcular una estimación basada en las mediciones contenidas en una muestra. 1 X = n
n
X
X i
i=1
Una estadística es cualquier función de las variables aleatorias que se observan en una muestra. X Z = p
n
Los términos estadística y estimador son utilizados indistintamente, es más común referirse a un estimador cuando se emplea una estadística para estimar un parámetro desconocido. En ambos casos n representa el tamaño de la muestra.
Conceptos Básicos
Error Muestral Es la diferencia entre el parámetro de la población y el estadístico de la muestra utilizado para estimar el parámetro. Es la desviación estándar de un estimador.
Distribución muestral Es una lista de todos los valores posibles de un estadístico y la probabilidad asociada a cada valor. Esto es, es la distribución de probabilidad de un estadístico. Se considerarán la distribución muestral de medias y la de proporciones.
Distribución muestral de medias
Distribución muestral de medias
Distribución muestral de medias Es la distribución de probabilidad de todas las medias posibles de muestras de un tamaño dado, n, de una población.
Casos Caso I:Si se toma una muestra aleatoria de tamaño n de una población normal de media y varianza 2 conocida , la variable
aleatoria X (media muestral) tiene una distribución normal de media 2 X = y varianza X = n ; de aquí que la variable aleatoria: 2
Z =
X p
n
tiene una distribución normal estándar. Caso II: Lo anterior también es posible asegurarlo cuando la población no es normal pero n 30 en virtud del Teorema del límite central.
Distribución muestral de medias Casos Continuación Caso III: Si s2 representa la varianza de una muestra aleatoria de tamaño n tomada de una población normal de media y varianza 2 desconocida , la variable aleatoria:
T =
X p s
n
tiene una distribución t con n 1 grados de libertad. Caso IV: Si la población no es normal pero n 30 , se puede considerar que s2 representa una buena estimación para 2 y se tiene que la variable aleatoria: X Z = s p
n
tiene una distribución normal estándar.
Distribución muestral de medias
Usos de la distribución 1
Calcular probabilidades asociadas a X:
2
Realizar inferencias con respecto a la media poblacional .
Distribución muestral de medias Ejercicio Una empresa de material eléctrico fabrica bombillas de luz que tienen una duración que se distribuye normalmente con media de 800h y desviación estándar de 40 h : Encuentre la probabilidad que una muestra aleatoria de 16 bombillas tenga una vida promedio mayor de 775h :
Ejercicio Un ingeniero químico a…rma que el rendimiento promedio de cierto proceso en lotes es 500g = mm de materia prima. Para veri…car dicha a…rmación muestrea 25 lotes cada mes. Si el valor t calculado cae entre t0;05 y t0;05 queda satisfecho con su a…rmación ¿Qué conclusión debería obtener de una muestra que tiene una media de 518g = mm y una desviación estándar de 40 g = mm? Suponga que la distribución del rendimiento es aproximadamente normal.
Distribución muestral de medias
Ejercicio El precio medio de ventas de una casa nueva en una ciudad es de $115;000 con una desviación estandar de $25;000. Se toma una muestra aleatoria de 100 casas nuevas de esta ciudad: ¿Cuál es la probabilidad de que la media muestral de los precios de venta sea menor de $110;000? ¿Cuál es la probabilidad de que la media muestral se encuentre a menos de $500 de la media poblacional?
Distribución de muestreo de la varianza Varianza muestral Si s2 representa la varianza de una muestra aleatoria de tamaño n tomada de una población normal de varianza 2 ; la variable aleatoria: 2 (n 1)S 2 = 2
tiene una distribución chi cuadrado con n 1 grados de libertad.
Usos de la distribución 1 2
Calcular probabilidades asociadas a S 2 o S: Realizar inferencias con respecto a la varianza o desviación estándar poblacionales 2 y respectivamente.
Distribución de muestreo de la varianza Ejercicio Una empresa de material eléctrico fabrica bombillas de luz que tienen una duración que se distribuye normalmente con una desviación estándar de 40 h : Encuentre la probabilidad que en una muestra aleatoria de tamaño 16 la desviación estándar sea superior a 42 h
Ejercicio Un distribuidor de pinturas desea determinar si la máquina de llenado de las latas de pintura compradas a un fabricante en renombre en todo el país está trabajando satisfactoriamente. Se llenan 50 latas cuyo contenido debe ser 1gal. Para ese tamaño de latas las especi…caciones establecen que la desviación estándar es de 0;02 gal : Si en la muestra se encontró que la desviación estándar fue de 0;025 gal. ¿Piensa que el dueño de la tienda tiene derecho a quejarse con el fabricante?¿ Porqué?.
Distribución de muestreo de la proporción Proporción muestral Si p representa la proporción de éxito de una población binomial, entonces P (proporción muestral) tiene una distribución normal de media P = p y varianza 2 = pq siempre que np 5 y nq 5 de aquí que la n P variable aleatoria: P p Z =
b
b
b
bq
pq n
tiene una distribución normal estándar.
Usos de la distribución
b
1
Calcular probabilidades asociadas a P
2
Realizar inferencias con respecto a p.
Distribución de muestreo de la proporción
Ejercicio El jefe de control de calidad de una planta de producción de tornillos considera que el 4 % de la producción diaria se encuentra defectuosa. Se seleccionó al azar 100 tornillos de la producción de un día. 1
Determine la probabilidad que la proporción de tornillos defectuosos en la muestra sea superior al 5 %
2
Si desea que la probabilidad pedida en la parte a sea de 0;1 ¿Qué tamaño de muestra necesita?
Distribución de muestreo de la proporción Ejercicio 1
Se toma una muestra de 250 casas de una población de edi…cios antiguos para estimar la proporción de casas de este tipo. Supongamos que el 30 % de todos los edi…cios son antiguos. Hallar la probabilidad de que la proporción de edi…cios antiguos esté entre 0;25 y 0;35.
2
Se ha estimado que el 43 % de los licenciados en economía consideran que es muy importante que se imparta un curso de ética en economía. De una población de 800 estudiantes se tomó una muestra de 80 y se realizo un estudio para determinar si se aprobara el curso. Si para aprobar la peticion de los licenciados se requiere que por lo menos el 50 % este de acuerdo, considera usted que se aprobará?
Distribución de muestreo para la diferencia de medias Casos Caso I: Se toman muestras aleatorias independientes de tamaños n1 y
n2 de dos poblaciones normales de medias 1 y 2 y varianzas 12 y 22 conocidas la variable aleatoria X 1 X 2 (diferencia de medias muestrales) se distribuye de forma normal con media X X = 1 2 2 y varianza X = X 1
2
2 1
n1
+
Z =
2 2
n2
1
2
de aquí que la variable aleatoria:
q X 1 X 2
12 n1
tiene una distribución normal estándar.
(1 2 )
+
22 n2
Distribución de muestreo para la diferencia de medias Casos Caso II: Se toman muestras aleatorias independientes de tamaños n1 y
n2 de dos poblaciones no normales de medias 1 y 2 y varianzas 12 y 22 conocidas la variable aleatoria X 1 X 2 (diferencia de medias muestrales) se distribuye de forma normal siempre que n1 30 y n2 30 , su media y varianza están dadas respectivamente por 2
X X = 1 2 y X X = 1
2
1
Z =
2
12 n1
+
22 n2
q X 1 X 2
12 n1
tiene una distribución normal estándar .
, de aquí que la variable aleatoria:
(1 2 )
+
22 n2
Distribución de muestreo para la diferencia de medias Casos Caso III: Si s21 y s22 representan las varianzas de muestras aleatorias independientes de tamaños n1 y n2 de dos poblaciones normales
medias 1 y 2 y varianzas 12 y 22 desconocidas pero iguales la variable aleatoria: X 1 X 2 (1 2 ) T = s p2 n1 + n1
r 1
2
tiene una distribución t con n1 + n2 2 grados de libertad. s p2 representa una varianza común, dada por la expresión: 2 2 (n 1)s + (n 1)s 1 2 1 2 s p2 = n1 + n2 2
de
Distribución de muestreo para la diferencia de medias Casos Caso IV: Si s21 y s22 representan las varianzas de muestras aleatorias independientes de tamaños n1 y n2 de dos poblaciones normales
de
medias 1 y 2 y varianzas 12 y 22 desconocidas y diferentes la variable aleatoria: X 1 X 2 (1 2 ) T = s s + n n
q 2 1
2 2
1
2
Tiene una distribución t con v grados de libertad, v se calcula mediante la expresión:
v=
2 1
s n1
+
2 2
s n2
2
s2
2
s2
1
n1
n1 1
2
2
+
n2
n2 1
Distribución de muestreo para la diferencia de medias Casos Caso V: Se toman muestras aleatorias dependientes de tamaños n de
dos poblaciones de medias 1 y 2 la variable aleatoria: T =
X 1 X 2
(1 2 )
sd p
n
Tiene una distribución t con n 1 grados de libertad siempre que las diferencias D entre valores correspondientes estén normalmente distribuidas, sd representa la desviación estándar de las diferencias entre valores correspondientes. Se acostumbra expresar: T =
D d sd p
n
Con D = X 1 X 2 y d = 1 2
Distribución de muestreo para la diferencia de medias
Usos de la distribución 1
Calcular probabilidades asociadas a X 1 X 2 :
2
Realizar inferencias con respecto a 1 2 .
Distribución de muestreo para la diferencia de medias Ejercicio Dos aleaciones A y B se utilizan en la fabricación de cierto producto de acero. Se necesita diseñar un experimento para comparar las dos aleaciones en términos de la capacidad de la carga máxima en toneladas, es decir, el máximo que pueden soportar sin romperse. Se sabe que las desviaciones estándar de la capacidad de carga de las dos aleaciones son iguales a 5 toneladas. Se realiza un experimento en el que se prueban 30 especímenes de cada aleación y los resultados son: xA = 49;5; xB = 45;5 Los fabricantes de la aleación A están convencidos de que esta evidencia demuestra de forma concluyente que A > B y que apoya sólidamente su aleación. Los fabricantes de la aleación B a…rman que el experimento fácilmente podría haber dado xB xA = 4 incluso si las dos medias poblacionales fueran iguales. En otras palabras ¡Los resultados no son concluyentes!
Distribución de muestreo para la diferencia de medias
Ejercicio 1
Calcule P (X A X B > 4) considerando que A = B :
2
Determine si los fabricantes de la aleación B están equivocados.
3
¿Considera que estos datos apoyan fuertemente la aleación A?
Distribución de muestreo para la diferencia de medias
Ejercicio El gerente de una re…nería piensa modi…car el proceso para producir gasolina a través de petróleo crudo. El gerente hará la modi…cación sólo si la gasolina promedio que se obtiene por este nuevo proceso (Expresada como un porcentaje del crudo ) aumenta su valor con respecto al proceso en uso. Con base en un experimento de laboratorio y mediante el empleo de dos muestras de tamaño 12 para el proceso en uso y una 13 para el proceso nuevo, la cantidad de gasolina promedio del proceso en uso fue de 24;6 con una desviación estándar de 2;3 y para el proceso propuesto fue de 28;2 con una desviación estándar de 2;7. ¿Debe adoptarse el nuevo proceso?. Suponga que las poblaciones se distribuyen normalmente con varianzas son iguales.
Distribución de muestreo para la diferencia de medias Ejercicio Se a…rma que una nueva dieta reducirá el peso de una persona en un lapso de 2 semanas. Los pesos de 7 mujeres que siguieron esta dieta se registraron antes y despues de un período de 2 semanas. Determine si la dieta es efectiva. Suponga que las diferencias de los pesos se distribuyen de forma aproximadamente normal. Mujer 1 2 3 4 5 6 7
Peso antes 58;5 60;3 61;7 69;0 64;0 62;6 56;7
Peso después 60;2 58;5 60;5 70;2 62;6 59;9 57;3
Distribución de muestreo para el cociente entre varianzas Cociente entre varianzas Si s21 y s22 representan las varianzas de muestras aleatorias independientes de tamaños n1 y n2 de dos poblaciones normales de varianzas 12 y 22 respectivamente, entonces la variable aleatoria: 22 S 12 F = 2 2 1 S 2 tiene una distribución F con v1 = n1 1 grados de libertad en el numerador y v2 = n2 1 grados de libertad en el denominador.
Usos de la distribución 1
Calcular probabilidades asociadas a S 12 y S 22 o S 1 y S 2 :
2
Realizar inferencias con respecto a 12 =22 :
Distribución de muestreo para el cociente entre varianzas
Ejercicio Si S 12 y S 22 representan las varianzas de muestras aleatorias independientes de tamaños n1 = 25 y n2 = 31 tomadas de poblaciones normales de varianzas 12 = 10 y 22 = 15; respectivamente, encuentre:
2 1
2 2
P S =S > 1;26
Ejercicio Para el ejercicio de la re…neria, determine si la suposición de varianzas iguales fue válida.
Distribución de muestreo para la diferencia de proporciones Diferencia de proporciones Se toman muestras aleatorias de tamaños n1 y n2 de poblaciones binomiales con proporción de éxitos p1 y p2 la variable aleatoria P1 P2 (diferencia de proporciones muestrales) tiene una distribución normal siempre que n1 p1 5; n1 q1 5; n2 p2 5; n2 q2 5 , su media y varianza son respectivamente:
b b
P P = p1 p2 ;
b b 1
2
de aquí que la variable aleatoria:
2
P P
b b 1
b b q P1 P2
Z =
p1 q1 n1
tiene una distribución normal estándar.
2
p1 q 1 p2 q 2 = + n1 n2
( p1 p2 )
+
p2 q2 n2
Distribución de muestreo para la diferencia de proporciones
Usos de la distribución
b b
1
Calcular probabilidades asociadas a P1 P2 :
2
Establecer inferencias con repecto a p1 p2 :