Estadística Aplicada
Producto Académico N° 01
Producto Académico N° 01
A. MUESTREO 1. Describa claramente cuáles son las clases de muestreo.
Existen dos tipos de muestreo: muestreo: muestreo aleatorio aleatorio y el muestreo no aleatorio. aleatorio. El muestreo aleatorio es aquel que tiene una probabilidad de respuesta que varía sin ninguna función aparente, es decir, no cumple un patrón de respuesta. Al estar supeditada a no tener un lazo entre la población y lo que se desee analizar, este tipo de muestreos es perfecto para el análisis científico de investigaciones. Las respuestas poseen el parámetro de EQUI-PROBABILIDAD de ocurrir y estas probabilidades están determinadas por la función pseudoaleatoria, es decir, existe una misma probabilidad de ocurrencia para las muestras en la data. El muestreo no aleatorio es aquel cuyas variables tienen el diferentes potenciales probabilístico de suceder y están sujetas a condiciones propias del muestreo, es por ello que cumplen un patrón de probabilidad y en una investigación pueden falsear la data que se desee adquirir. 2. Identifique el tipo de muestreo, corresponde las siguientes situaciones. a) Educación y deportes. Un investigador de la empresa de equipo deportivo Spaulding estudia la relación entre el nivel académico y la participación en cualquier deporte. El investigador hace una encuesta a 40 golfistas, 40 tenistas y 40 nadadores, todos elegidos al azar.
Aquí podemos observar que el muestreo es aleatorio y no aleatorio por considerar dos tipos de variables: una que es la principal (razón nivel académico-deporte) y otra que es secundaria (tipo de deporte). Ninguna de las muestras tendrán la misma probabilidad de ocurrencia ya que está determinada por una población que tiene o puede tener diferentes tipos de comportamiento académico frente al deporte que ejerzan (muestra aleatoria) pero resulta que la población ha sido forzadamente elegida con propensión a los deportistas y no al público en general, lo que significa que dentro de la población existe una ligera equidad de probabilidad de respuesta (no aleatorio). b) Hacer trampa. Un investigador del InternalRevenueService estudia las trampas en las declaraciones de impuestos, al encuestar a todos los meseros y las meseras de 20 restaurantes seleccionados al azar.
Por la cantidad y la forma como se seleccionan s eleccionan la población a ser muestreada este tipo de muestreo es considerado aleatorio del tipo racimo.
1|Página
Estadística Aplicada
Producto Académico N° 01
c) Recaudación de fondos. Los recaudadores de fondos de la Universidad de Newportprueban una nueva campaña de telemarketing, obteniendo una lista de todos los alumnos y eligiendo cada centésimo nombre de dicha lista.
Esta es una distribución puramente no aleatoria ya que existe un patrón de elección (cada 100 estudiantes) y asumiendo que la lista sea en orden alfabetico observaríamos que la población tiene distintas probabilidades de ser elegida. d) Prueba de la equinácea . Un estudio sobre la eficacia de la equinácea incluyó
infecciones del tracto respiratorio superior. Un grupo de infecciones fue tratado con equinácea, y otro grupo fue tratado con placebos. Los grupos de tratamiento con equinácea y de placebo se determinaron mediante un proceso de asignación aleatoria (según datos de “Efficacy and Safety of Echinacea in Treating Upper Respirator y Tract Infections in Children”, de Taylor et al., Journal of the American Medical Association, vol. 290, núm. 21).
Este tipo de muestreo es considerado aleatorio pero por el modelo de selección se considera muestreo estratificado. B. DISTRIBUCIONES MUESTRALES 1. Shorty’sMuffler anuncia que puede instalar un silenciador nuevo en 30 minutos o menos. No obstante, hace poco el departamento de estándares laborales de las oficinas centrales realizó un estudio y descubrió que 20% de los silenciadores no se instalaba en 30 minutos o menos. La sucursal Maumee instaló 50 silenciadores el mes pasado. Si el informe de la empresa es correcto: a) ¿Cuántas instalaciones de la sucursal Maufee se esperaría que tardaran más de 30 minutos?
Según el departamento de estándares laborales, si solo el 20% de los silenciadores no se instalaba en 30 minutos o menos, el 80% si lo hacía. De ello se deduce que 50*20% = 10 silenciadores tardaran más de 30 min. b) ¿Cuál es la probabilidad de que ocho o menos instalaciones tarden más de 30 minutos?
10 = 20% (aparente) de silenciadores que se tardan menos de 30 min, es decir, 40 silenciadores se tardan MAS de 30 min exactamente. Esos 40 vienen a ser nuestro 100%, por ello si nos indican sobre 8 o menos de 8 aumenta la probabilidad sobre los 40. 8 o menos representa el 500% a más de que los silenciadores se tarden más de 30 min. En la realidad simplemente seria la certeza de que 8 o menos se instalan a más de 30 min. c) ¿Cuál es la probabilidad de que exactamente 8 de las 50 instalaciones tarden más de 30minutos?
Seria 500% de certeza de que exactamente 8 de las 50 instalaciones tarden mas de 30 min.
2|Página
Estadística Aplicada
Producto Académico N° 01
2. Un ingeniero industrial afirma que el rendimiento medio de la población de cierto proceso en lotes es 750 gramos por milímetro de materia prima. Para verificar esta afirmación toma una muestra de 47 lotes cada mes. Si el valor de t calculado cae entre – t0,05 y t0,05, queda satisfecho con su afirmación. ¿Qué conclusión extraería de una muestra que tiene una media de 525 gramos por milímetro y una desviación estándar de 45 gramos? Suponga que la distribución de rendimientos es aproximadamente normal.
Si la desviación estándar es 45 gramos, podemos hallar el valor por milímetros de materia prima. Empleando la distribución Student
= /−√ − − = /√ = . = −.
Este valor esta por debajo de valor 1.684, es decir que la producción es menor a lo que se espera. El rendimiento es pésimo. 3. La dirección de transportes de Huancayo viene realizando un estudio de los tiempos requeridos por una de las líneas de bus para alcanzar uno de sus destinos; se sabe que, forman una distribución normal con una desviación estándar σ =1 .25 minutos. Si se elige al azar una muestra de 21 tiempos, encuentre la probabilidad de que la varianza muestra sea mayor que 2.23.
Para que la varianza muestral sea 2.23, la probabilidad debe ser hallada como el área conociendo la desviación estándar σ =1.25 minutos. Como el numero de muestras es
21, entonces R= 20 N=21 varianza= 2.23 σ =1.25 minutos
r= 20 El valor en la tabla seria: 28.54 Para alfa = 0.1 =>
− = .
Area obtenida es 0.1 qu es la probabilidad (10%)
C. INTERVALOS DE CONFIANZA PARA UN PARÁMETRO 3|Página
Estadística Aplicada
Producto Académico N° 01
1. Una empresa de investigación llevo a cabo una encuesta para determinar la cantidad media que los fumadores gastan en cigarrillos durante una semana. La empresa encontró que la distribución de cantidades gastadas por semana tendía a seguir la distribución normal, con una desviación estándar de $5. Una muestra de 49 fumadores revelo que . a) ¿Cuál es el estimador puntual de la media de la población? Explique lo que indica.
= $20
Indica la aproximación del valor real de la media a la muestra poblacional. Este valor para este problema es muy alto ya q la varianza es 25% de la media. b) ¿Con el nivel de confianza de 95%, determine el intervalo de confianza para μ. Explique lo que significa.
̅ == 2095% = 0.95 ̅ ± ∗/021∗5/ 20±2. √ √ 49 20±2. 0 21∗5/7 20± 1.4436 n= 49
α =0.05 entonces Zc=±2.021
2. Los contenidos de 5 latas de café instantáneo de un productor han dado los siguientes pesos netos en gramos: 280; 290; 285; 275; 284. a) Encuentre un intervalo de confianza del95% para la media de todos los contenidos de latas de café del productor.
X: 282.8 S: 5.63 n: 5 r=n-1=4
= / ∗ /√ .=. = . . < < . X-E<
< X+E
con 4 grados de libertad
Con un nivel de confianza del 95% se sabe que el promedio del contenido de los contenedores esta entre 277,51 y 288,09 b) ¿Con qué grado de confianza se estima que el contenido promedio de café tenga los límites de confianza 277,432 y 288,168?. Suponga una distribución normal.
Como está dentro del intervalo hallado anteriormente, tiene un 99% de confianza. 3. Una máquina produce piezas de metal que tienen forma cilíndrica. Se toma una muestra de tales piezas y se encuentra que los diámetros son 1,01; 0,97; 1,03; 1,04; 0,99; 0,98;
4|Página
Estadística Aplicada
Producto Académico N° 01
0,99; 1,01 y 1,03 centímetros. Utilice estos datos para calcular tres tipos de intervalos y hacer interpretaciones que ilustren las diferencias entre ellos en el contexto del sistema. Para todos los cálculos suponga una distribución aproximadamente normal. La media muestral y la desviación estándar para los datos dados son x¯ = 1.0056 y s = 0.0246. a) Calcule un intervalo de confianza del 99% sobre la media del diámetro.
Cantidad muestral: n=9 y v= 8
= . = ±/ /√ / = . = .+.∗ ./√ = . = .+.∗ ./√ = .
Cuando existe normalidad pero no se conoce podemos hallarla usando:
De aquí reemplazamos:
b) Calcule un intervalo de predicción del 99% sobre el diámetro medido de una sola pieza de metal tomada de la máquina.
c) Calcule los límites de tolerancia del 99% que contengan 95% de las piezas de metal producidas por esta máquina.
=
1,08379502
D. INTERVALOS DE CONFIANZA PARA DOS PARÁMETROS 1. Se llevan a cabo pruebas de resistencia a la tensión sobre dos diferentes clases de largueros de aluminio utilizados en la fabricación de aviones comerciales pequeños. De la experiencia pasada con el proceso de fabricación de largueros y del procedimiento de prueba, se supone que las desviaciones estándar de las resistencias a la tensión son conocidas. Los datos obtenidos aparecen en la siguiente tabla:
a) En base a esta información entregada previamente, encuentre un intervalo de confianza para la diferencia entre los promedios poblacionales de la resistencia a la tensión con un nivel de confianza del 90%.
5|Página
Estadística Aplicada
Producto Académico N° 01
− − + ≤ − ≤ − + + Limite superior
12.22
Limite inferior
13.98
b) ¿De acuerdo al resultado obtenido en a) qué puede concluir respecto a la diferencia entre los promedios poblacionales con relación a la resistencia?
La diferencia de los limites tanto superior como inferior indican que existe una tendencia Zc=1.64 es decir, el largero de aluminio de clase 1 es muy diferente al largero de aluminio de clase 2 2. Una compañía de taxis trata de decidir si comprar neumáticos de la marca A o de la B para su flotilla de taxis. Para estimar la diferencia entre los promedios de desgaste a través de kilómetros recorridos, de las dos marcas, se lleva a cabo un experimento utilizando 12 de cada marca. Los neumáticos se utilizan hasta que se desgastan, dando como resultado promedio para la marca A 36,300 kilómetros, con una desviación estándar de 5000 kilómetros y para la marca B 38,100 kilómetros con una desviación estándar de 6100 kilómetros. Calcule un intervalo de confianza de 95% para la diferencia promedio de las dos marcas, si se sabe que las poblaciones se distribuyen de forma aproximadamente normal para la marca A y para la marca B. Asuma que las dos varianzas poblacionales son distintas. Es deseable que la diferencia de medias sea positiva por lo que restamos los medios mayores menos la media menor. En este caso será la media del motor B menos la media del motor A. En las tablas de la Normal encontramos que el valor de la variable que deja por debajo una probabilidad de 0,475 es
= ±. − − + ≤ − ≤ − + + −. ≤ − ≤ .
Aparentemente no es posible afirmar que el neumático A tiene mayor duración que el neumático B.
6|Página