Estadística Aplicada
Producto Académico N° 01
Producto Académico N° 01 A. MUESTREO 1. Describa claramente cuáles son las clases de muestreo. MUESTREO PROBABILISTICO: Es requisito que todos y c/u de los elementos de la población tengan la misma probabilidad de ser seleccionados (azar)
Aleatorio simple (Muestreo Simple al Azar) Cada sujeto tiene una probabilidad igual de ser seleccionado para el estudio. Muestreo Aleatorio Sistemático. Se toman todos los individuos de la lista y se selecciona c/3, c/7, o cualquier otro número. Para comenzar se utiliza un número al azar. Muestreo Estratificado. Cuando la muestra incluye subgrupos representativos (estratos) de los elementos de estudio con características específicas: urbano, rural, nivel de instrucción, año académico, carrera, sexo, grupo étnico, edad, paridad etc Muestreo por Racimos (Cluster o Conglomerado) Conglomerados: son unidades geográficas (distritos, pueblos, organizaciones, clínicas)
MUESTREO NO PROBABILISTICO: No se conoce la probabilidad que tienen los diferentes elementos de la población de estudio de ser seleccionados.
Muestreo por conveniencia Es la muestra que esta disponible en el tiempo o periodo de investigación. Muestreo por Cuotas. Todos los elementos conocidos de la población tienen que aparecer en la muestra Accidental o Bola de Nieve: Se aprovecha o utiliza personas disponibles en un momento dado que se corresponda con el propósito del estudio.
2. Identifique el tipo de muestreo, corresponde las siguientes situaciones. a) Puesto de revisión de sobriedad. El autor fue un observador en un puesto de revisión de sobriedad de la policía, donde se detenía y entrevistaba a cada quinto conductor. (El autor fue testigo del arresto de un ex alumno). R: Muestreo sistemático b) Educación y deportes. Un investigador de la empresa de equipo deportivo Spaulding estudia la relación entre el nivel académico y la participación en cualquier deporte. El investigador hace una encuesta a 40 golfistas, 40 tenistas y 40 nadadores, todos elegidos al azar. R: Muestreo estratificado c) Ergonomía. Un estudiante de ingeniería mide la fuerza de los dedos necesaria para presionar botones al probar a miembros de familias. R: Muestreo por conveniencia
1|Página
Estadística Aplicada
Producto Académico N° 01
d) Hacer trampa. Un investigador del Internal Revenue Service estudia las trampas en las declaraciones de impuestos, al encuestar a todos los meseros y las meseras de 20 restaurantes seleccionados al azar. R: Muestreo por conglomerados e) Recaudación de fondos. Los recaudadores de fondos de la Universidad de Newport prueban una nueva campaña de telemarketing, obteniendo una lista de todos los alumnos y eligiendo cada centésimo nombre de dicha lista.
B. DISTRIBUCIONES MUESTRALES 1. La producción diaria de una fábrica es una variable aleatoria discreta con media 120 artículos, y desviación estándar de 10 artículos. Calcule la probabilidad que en cualquier día la producción esté entre 95 y 145 artículos. 𝜇 = 120 𝜎 = 10 95 − 120 𝑋 − 𝜇 145 − 120 𝑃(95 < 𝑋 < 145) = 𝑃 ( < < ) = 𝑃(−2.5 < 𝑍 < 2.5 ) = 0.9876 10 𝜎 10 La probabilidad que en cualquier día la producción esté entre 95 y 145 artículos es 0.9876
1. Una caja contiene 9 baterías de las cuales 4 están en buen estado y las restantes defectuosas. Se toma una muestra eligiendo al azar tres baterías. Calcule la probabilidad que en la muestra se obtengan: a) Ninguna batería en buen estado. b) Al menos una batería en buen estado. c) No más de dos baterías en buen estado. d) Calcule la media y la varianza.
Este es un experimento de muestreo sin reemplazo, por lo tanto es un experimento hipergeométrico con N=9 K=4 n=3
(total de elementos del conjunto) (total de elementos considerados ‘éxitos’) (tamaño de la muestra) 2|Página
Producto Académico N° 01
Estadística Aplicada
X: cantidad de baterías en buen estado en la muestra (Variable aleatoria discreta) Entonces la distribución de probabilidad de X es: f(x) = a) P(X=0) = f(0) =
4 9 4 x 3 x , x 0,1,2,3 9 3 4 9 4 0 3 0 9 3
=0.119 b) P(X1) = 1 – P(X<1) = 1 – f(0) = 1 - 0.119 = 0.881 c) P(X2) = P(X=0) + P(X=1) + P(X=2) = f(0) + f(1) + f(2) d) 𝐸[𝑋] =
𝑛𝑑 𝑁
=
𝑉𝑎𝑟[𝑋] = (
3∗4 9
= 0.9523
= 1.33
𝑁 − 𝑛 𝑛𝑑 𝑑 6 12 5 ) ( ) (1 − ) = ∗ ∗ = 1.25 𝑁−1 𝑁 𝑁 8 9 4
C. INTERVALOS DE CONFIANZA PARA UN PARÁMETRO 1.
Los contenidos de 5 latas de café instantáneo de un productor han dado los siguientes pesos netos en gramos: 280; 290; 285; 275; 284. a) Encuentre un intervalo de confianza del95% para la media de todos los contenidos de latas de café del productor. 𝑋̅ =
280 + 290 + 285 + 275 + 284 = 282.8 5 𝜎 = 5.036
3|Página
Producto Académico N° 01
Estadística Aplicada
Limites = 282.8 ± Z
𝜎 √𝑛
=
Z = 1.96 Limites = 282.8 ± 1.96
5.036 √5
= 282.8 ± 4.414
278.386 < 𝜇 < 287.214 b) ¿Con qué grado de confianza se estima que el contenido promedio de café tenga los límites de confianza 277,432 y 288,168?. Suponga una distribución normal. 277,432 − 282.8 𝑋 − 𝜇 288,168 − 282.8 𝑃(277,432 < 𝑋 < 288,168) = 𝑃 ( < < ) 5.036 𝜎 5.036 = 𝑃(−1.0659 < 𝑍 < 1.0659 ) = 0.7135 Con un 71.35% de confianza. 2.
Una máquina produce piezas de metal que tienen forma cilíndrica. Se toma una muestra de tales piezas y se encuentra que los diámetros son 1,01; 0,97; 1,03; 1,04; 0,99; 0,98; 0,99; 1,01 y 1,03 centímetros. Utilice estos datos para calcular tres tipos de intervalos y hacer interpretaciones que ilustren las diferencias entre ellos en el contexto del sistema. Para todos los cálculos suponga una distribución aproximadamente normal. La media muestral y la desviación estándar para los datos dados son x¯ = 1.0056 y s = 0.0246. a) Calcule un intervalo de confianza del 99% sobre la media del diámetro.
Z=3.355, para un 99% Limites = 1.0056 ± 3.355
0.0246 √9
=
Limites = 1.0056 ± 0.027511 0.978089 < 𝜇 < 1.033111 b) Calcule un intervalo de predicción del 99% sobre el diámetro medido de una sola pieza de metal tomada de la máquina. Limites = 1.0056 ± 3.355
0.0246
√1 Limites = 1.0056 ± 0.082533 4|Página
Estadística Aplicada
Producto Académico N° 01
1.088133 < 𝜇 < 0.923067 c) Calcule los límites de tolerancia del 99% que contengan 95% de las piezas de metal producidas por esta máquina. Z=1.96 para 95% Limites = 1.0056 ± 1.96
0.0246 √9
Limites = 1.0056 ± 0.0160 1.104205 < 𝜇 < 0.9896
D. INTERVALOS DE CONFIANZA PARA DOS PARÁMETROS 1. Se llevan a cabo pruebas de resistencia a la tensión sobre dos diferentes clases de largueros de aluminio utilizados en la fabricación de aviones comerciales pequeños. De la experiencia pasada con el proceso de fabricación de largueros y del procedimiento de prueba, se supone que las desviaciones estándar de las resistencias a la tensión son conocidas. Los datos obtenidos aparecen en la siguiente tabla:
a) En base a esta información entregada previamente, encuentre un intervalo de confianza para la diferencia entre los promedios poblacionales de la resistencia a la tensión con un nivel de confianza del 90%.
Unidad 3
INFERENCIA ESTADISTICA
EJEMPLOS
5|Página
Estadística Aplicada
Producto Académico N° 01
Se lleva a cabo pruebas de resistencia a la tensión sobre diferentes clases de largueros de aluminio utilizados en la fabricación de alas de aeroplanos comerciales. De la experiencia pasada con el proceso de fabricación de largueros y del procedimiento de prueba, se supone que las desviaciones estándar de las resistencias a la tensión son conocidas, Los datos obtenidos son: Clase de larguero Tamaño de la muestra Media muestral Desviación Estándar 1 2
Si y denotan los promedios verdaderos de las resistencias a la tensión para las dos clases de largueros. Encuentre un intervalo de confianza del 90% para la diferencia entre las medias reales y pruebe la hipótesis de que las dos clases de largueros tienen la misma resistencia a la tensión.
Solución El interés es la diferencia en la resistencia a la tensión promedio entre
:
Un intervalo de confianza del 90% para la diferencia en la resistencia a la tensión promedio es:
b) ¿De acuerdo al resultado obtenido en a) qué puede concluir respecto a la diferencia entre los promedios poblacionales con relación a la resistencia? c)
Nótese que el intervalo de confianza no incluye el cero, lo que implica que la resistencia promedio del alumino de clase 1( ) es mayor que la del aluminio de clase 2 ( ). De hecho, puede afirmarse que se tiene una confianza del 90% de que la resistencia promedio a la tensión del aluminio de clase 1 es mayor que la del aluminio clase 2 por una cantidad que oscila entre 12.22 y
d)
13.98 kg/mm Si se utiliza el estadístico presentado en (1), se encuentra:
6|Página
Estadística Aplicada
Producto Académico N° 01
Rechazándose tambien la hipótesis nula, por lo tanto se concluye que la resistencia promedio del alumino de clase 1(
) difiere del aluminio de clase 2 (
).
Si se utiliza el valor p para una prueba de hipótesis bilateral, este valor resulta igual a 2P(Z > Zc) = 2P( Z > 24.432)=0. Por lo tanto, se rechaza H de significancia.
puesto que este valor es menor que cualquier nivel
2. Una compañía de taxis trata de decidir si comprar neumáticos de la marca A o de la B para su flotilla de taxis. Para estimar la diferencia entre los promedios de desgaste a través de kilómetros recorridos, de las dos marcas, se lleva a cabo un experimento utilizando 12 de cada marca. Los neumáticos se utilizan hasta que se desgastan, dando como resultado promedio para la marca A 36,300 kilómetros, con una desviación estándar de 5000 kilómetros y para la marca B 38,100 kilómetros con una desviación estándar de 6100 kilómetros. Calcule un intervalo de confianza de 95% para la diferencia promedio de las dos marcas, si se sabe que las poblaciones se distribuyen de forma aproximadamente normal para la marca A y para la marca B. Asuma que las dos varianzas poblacionales son distintas.
7|Página
Estadística Aplicada
Producto Académico N° 01
8|Página