UNIVERSIDAD NACIONAL FEDERICO VILLAREAL
ESTADISTICA APLICADA A LOS NEGOCIOS Y A LA ECONOMIA.
INTEGRANTES:
ROCIO RAMIREZ REA REATEGUI TEGUI
ROBERT TRUJILLO TARAZONA
TRABAJO RESUELTO CAPITULO 6
Tema: DISTRIBUCIONES MUESTRALES
TRABAJO RESUELTO CAPITULO 6
Tema: DISTRIBUCIONES MUESTRALES
PLAN DEL CAPITULO DISTRIBUCIONES MUESTRALES
Para Medias Muéstrales
Para proporciones muéstrales
Procedimientos de muestreo
Error de muestreo
Error de muestreo
Errores y sesgo
La media de las Medias muéstrales
El error estándar
Métodos de muestreo
El error estándar
Aplicaciones para una distribución normal.
El teorema del Limite central
Factor de corrección
Aplicaciones para una Distribución normal
Muestreo aleatorio simple
Teorema del Limite Central
Muestreo sistemático
Factor de corrección Por finitud
Muestreo estratificado
Muestreo por
6.1 6. 1 Di Dist strrib ibuc ucio ione nes s Mu Mués éstr tra ale les s Es una lista de todos los valores posibles para un estadístico y la probabilidad relacionada con cada ca da va valo lorr. El estudio de determinadas características de una población se efectúa a través de diversas muestras que pueden extraerse de ella.
El muestreo puede hacerse con o sin reposición, y la población de partida puede ser infinita o finita. Una población finita en la que se efectúa muestreo con reposición puede considerarse infinita teóricamente. También, a efectos prácticos, una población muy grande pue pu ede cons nsiide dera rars rse e co com mo infini nitta. En tod odo o nue uest strro es esttud udiio vamos a limitarnos a una población de partida infinita o a mues mu estr treo eo co con n re repo posi sici ción ón.. Consideremos todas las posibles muestras de tamaño n en una población. Para cada muestra podemos calcular un estadístico (media ia,, de des sviación típica, prop opo orción,...) que variará de una a otra. Así obtenemos una distribución del est stad adííst stic ico o qu que e se ll llam ama a di dis str trib ibuc ució ión n mue ues str tra al. Las dos medidas fundamentales de esta distribución son la media y la desviación típica, también denominada error típico. Hay que hacer notar que si el tamaño de la muestra es lo suf ufic icie ient ntem emen ente te gr gran ande de la las s di dis str trib ibuc ucio ione nes s mué uést stra rale les s son normales y en esto se basarán todos los resultados que alcancemos.
Generalmente
las poblaciones son demasiado grandes como para ser estudiadas en su totalidad. Es necesario seleccionar una muestra representativa de un tamaño mas manejable. Esta muestra se utiliza luego para sacar conclusiones sobre la población.
Er ror de Muestreo.- Es la diferencia entre el parámetro poblacional y el estadístico de la muestra utilizado para estimar el parametro.
6.2 ¿Qué es el Muestreo? El muestreo es la disciplina que trata con el conjunto de técnicas para tomar u obtener una muestra. Es el proceso que nos permite la extracción de una muestra a partir de una población. Hay dos tipo básicos de muestreo: Muestreo Probabilístico Muestreo No Probabilístico.
Importancia
del marco del muestreo
¿Qué es el Muestreo Probabilístico?
6.3 Distribución de la media muestral
Ejercicio Nº 01 En un estudio de las 500 firmas que aparecen en la revista Fortune sobre los negocios mas grandes de la nación, se puede tomar una muestra de n=50. De esta muestra se puede calcular la tasa de rendimiento promedio x para estas 50 firmas. Esta media muestral servirá entonces como un estimado de , la tasa promedio de rendimiento de la población para todas las 500 firmas. De esta lista de 500 firmas, seria posible obtener muchas muestras diferentes de tamaño 50. Específicamente se podría obtener 500C50 muestras diferentes de tamaño n=50. Debido a que 500C50 es un numero mas bien grande, se asume en aras de la simplicidad de la discusión, que se tiene una población de N=4 ingresos para cuatro estudiantes universitarios. Estos ingresos son de US$ 100, US$200 US$300 y US$400. El ingreso promedio puede calcularse como = US$250, sin embargo, para hacer las cosas aun mas simples, se puede pensar que calcular la media de cuatro observaciones requiere mucho esfuerzo. Como alternativa, se decide seleccionar una muestra de n=2 observaciones para estimar el ³desconocido´. Se podría entonces seleccionar aleatoriamente una muestra de o posibles muestras. Estas seis muestras 4C2 = distintas y sus medias se muestran en la siguiente tabla.
TABLA 1.1 Todas las muestras posibles de tamaño
n=2 de
una población de N= 4 ingresos
Muestra
Elementos muestrales X
Medias muestraes x
1 2 3 4 5
100,200 100,300 100,400 200,300 200,400 300,400
150 200 250 250 300 350
Salvo las muestras tercera y cuarta, cada muestra tiene una media diferente. Asumiendo que cada muestra tiene la misma probabilidad de ser seleccionada, la probabilidad de Seleccionar una muestra que dé una x igual a la media poblacional de 250 es solo 2/6 = 33.3% Cuatro de las seis muestras resultarán con algún error en el proceso de Estimación. Este error de muestreo es la diferencia entre y la media muestral que se utiliza para estimarlo ( x ± ) .
Con una población de sólo N=4, se puede enumerar cada media muestral posible que aparece en la tabla 1.1 junto con su respectiva probabilidad. Tal listado se le denomina una distribución muestral y aparece en la tabla 1.2 y como histograma en la figura 1.3
TABLA 1.2 Distribución muestral para muestras de tamaño n=2 en una población de N = 4 ingresos.
Medias muestral x
Numero de muestras que dan x
Probabilidad de P ( x )
150
1
1/6
200
1
1/6
250
2
1/3
300
1
1/6
350
1
1/6 1
TABLA 1.3 Distribución muestral para muestras de tamaño n=2 en una población de N = 4 ingresos.
P( X ) 2/6
1/6
X 150
200
250
300
350
Distribución muestral .- Es una lista de todos los valores posibles para un estadístico y la probabilidad relacionada con cada valor.
A.- La media de las medias muestrales.
La distribución muestral de las medias muestrales es simplemente una lista de todas las medias muestrales posibles. Estas medias muestrales, al igual que cualquier lista de números, tienen una media denominada ³la media de las medias muestrales´ o la gran media. Se calcula de la forma usual: Las observaciones individuales (medias muestrales) se suman y el resultado se divide por el numero de observaciones (muestras). Formula: XXXXXXXXXXXXXXXXXXXXXX
Se utiliza X ( que se lee como x doble barra) como símbolo de la gran media. K = es el numero de muestras en la distribución muestral. Debido que hay 6 muestras en la presente distribución muestral, se tiene que:
§ X
=
150 +
200 +
250 + 6
300 +
350
=
250
Se nota que la media de la distribución muestral X es qigual a la media de la poblacion original = 250. Esto no es coincidencia. La media de la distribucion muestral siempre será igual a la media poblacion ( X´ = ) No debe confundirse n, el numero de observaciones enuna sola muestra, con K el numero de muestras en la distribución muestral.
Ejercicio Nº 02
Una población de las producciones semanales de una fábrica en miles de toneladas es 200, 250, 150, 200 y 300. Realice una distribución maestral y calcule la media de las medias y el error estándar para las muestras de tamaño n=2.
A continuación vamos a utilizar el Minitab-14, en la cual se ingresas los valores numéricos a desarrollar. Abrimos la tabla estadística y ubicamos la variable C1. Como indica en el siguiente recuadro:
Estadísticas descriptivas: C1
Media del Error Variable N N* Media estándar Desv. Est. Varianza Coef. var. C1 5 0 220,0 25,5 57,0 3250,0 25,91
Mínimo 150,0
Al ponerme muestras de tamaño n=2 , hago la siguiente operación lógica para obtener cuantos muestras de tamaño 2 voy a tener 5C2 =10 posibles combinaciones, una vez hecho este calculo se procede al calculo del error estándar :
A continuación en el Minitab-14 se muestra los elementos de la muestra que consta en un numero de 10. asimismo me indica la media de la muestra. Nr muestra
Elementos de la muestra
Media de la muestra
1
200
250
225
2
200
150
175
3
200
200
200
4
200
300
250
5
250
150
200
Error estándar de la muestra
= 31,2217873 6
250
300
275
7
150
200
175
8
150
300
225
9
300
150
225
10
300
250
275 220
Promedio muestral
Ejercicio Nº 04
Las muestras de n=40 se toman de una población grande con una medida de 100 y una desviación estándar de 25. Calcule e interprete el error estándar.
Desarrollo: Se va utilizar (B) La Varianza y el error estándar de las medias muéstrales, según formulas:
Procedimiento: En general se tiene: Cuando las muestras se toman de una población pequeña y sin reemplazo, se puede usar la formula siguiente para encontrar x Por ser una población finita. Donde: N: tamaño de la población n: tamaño de la muestra
= 100 = 40
W
x
W: es la desviación estándar = 25
¨ 100 40 ¸ ¹ ! ©© ¹ ª 1001 º
W
x
! 3.9528
Ejercicio Nº 10
Las latas de gaseosas vendidas en Minute Mart, tienen un promedio de 16.1 onzas, con una desviación estándar de 1.2 onzas. Si se toma una muestra de n=200, Cual es la probabilidad de que la media sea: a).- ¿Menor que 16.27 ? b).- ¿Por lo menos 15.93? c).- ¿Entre 15.9 y 16.3?
Desarrollo (a) Se usa t para 1 muestra con un alfa del 95%: T de una muestra Prueba de mu = 16,27 vs. > 16,27
Media del Error 95%
Límite
N Media Desv.Est. estándar inferior T P 200 16,1000 1,2000 0,0849 15,9598 -2,00 0,977
Desarrollo (b) Se usa igual que el anterior t para una muestra T de una muestra alfa de 95%
Prueba de mu = 15,93 vs. < 15,93
Media del Límite Error superior N Media Desv.Est. estándar 95% T P 200 16,1000 1,2000 0,0849 16,2402 2,00 0,977
Desarrollo (c)
En este caso se trata de una t pareada ya que se encuentra en un intervalo, además se asume : que las varianzas son homogéneas y que se distribuye normalmente Media del Error N Media Desv.Est. estándar Diferencia 200 16,1000 1,2000 0.231 Prueba t de diferencia media = 16,1 (vs. no = 16,1): Valor T = 0,00 Valor P = 0,9819
Ejercicio Nº 12
El consumo diario de agua en Dry Hole, Texas, promedia los 18.9 galones por hogar, con una desviación estándar de 3.6 galones. El comisionado de la ciudad desea estimar esta media no conocida con una muestra de 100 hogares. ¿ Que tan probable es que el error de muestreo exceda los 0.5 galones?.
Desarrollo: T de una muestra
Prueba de mu = 19,28 vs. no = 19,28 Media del Error N Media Desv.Est. estándar IC* de 95% T 100 18,900 3,600 0,360 (18,186; 19,614) -1,06 P =0,1646 x
Ic*=intevalo de confianza
Ejercicio Nº 14
El 30% de todos los empleados tienen capacitación avanzada. Si en una muestra de 500 empleados menos del 27% estaba preparado de forma adecuada, todos los nuevos contratos necesitaran registrarse en un programa de capacitación. ¿Cuál es la probabilidad de que se inicie el programa?.
Desarrollo-Ejercicio 14 Se utiliza esta formula: P=0.3 Hp= =0.27 Ha= > 0.27
Z= =-1.51->este valor se busca en la tabla de Z y se obtiene: =0.0668
Ejercicio Nº 16
La proporción de todos los clientes de Pizza Hut que comen en el sitio es del 75%. En una muestra de 100 clientes. ¿Cuál es la probabilidad de que menos del 20% lleven su comida a casa?.
Desarrollo-Ejercicio 16
Se utiliza esta formula: P=0.75
Hp= =0.2 Ha= > 0.2
=-0.0727 se busca en tabla* :
=0.1251 x
Tabla de los valores de Z
Ejercicio Nº 24
Los clientes de Madinson Hair Garden, una sala de belleza en Madinson, Connecticut, son un promedio de 40.7 personas por día, con una desviación estándar de 12.9. Si se toma una muestra de 100 días. ¿Cuál es la probabilidad de que el numero promedio de clientes exceda de 43 ?
Desarrollo-Ejercicio 24
Se una prueba para la media en la cual 43 es la media hipotética así que:
Prueba de mu = 43 vs. < 43 Media del Límite Error superior
N
Media
Desv. Est. estándar
100 40,70 19,90 P valor:0,0375
1,99
95%
T
44,00 -1,16
Ejercicio Nº 26
Según la revista Business Week, el promedio de los años de experiencia de los pilotos de aerolíneas es de 25.2. Se asume una desviación estándar de 12 años. Este año usted debe tomar 36 vuelos comerciales. Usted espera que la experiencia promedio de los pilotos de los vuelos que usted tome sea superior a 30. ¿Qué tan probable es que X mayor 30?
Desarrollo-Ejercicio 26 T de una muestra Prueba de mu = 30 vs. < 30 Media del
Límite Error superior N Media Desv.Est. estándar 95% T P 36 25,20 12,00 2,00 28,58 -2,40 0,082 Se muestra q hay un 8,2% de probabilidad que se supere las 30 horas de vuelo.
Ejercicio Nº 28
En promedio, el nivel de producción en una planta de manufactura local es de 47.3 unidades por día, con una desviación estándar de 12.7. El gerente de planta tomará una muestra de 100 días. Si la media maestral excede de 49, promete dar a todo los empleados una bonificación de Navidad. ¿Qué tan probable es que los empleados disfruten de una feliz navidad?
Desarrollo-Ejercicio 28
hará una prueba de t para la media: T de una muestra
Prueba de mu = 49 vs. > 49
Se
Media del Error 95% Límite
N
Media
100 47,30
Siendo
Desv. Est.
12,70
estándar
1,27
inferior
T
P
45,19 -1,34 0,0908
mi p valor 0.0908 se puede ave rmar que habrá una probabilidad del 9,08% que los trabajadores tengan una buena navidad
Ejercicio Nº 32
Un proceso de manufactura produce unidades que miden en promedio 10pulgadas de largo con una desviación estándar de 3.2pulgadas. Si sólo pueden utilizarse las unidades que estén entre 9.5 y 10.5pulgadas, ¿Cuántas pueden descartarse de una muestra de 100?
Desarrollo-Ejercicio 32
Se
Media del Error N Media Desv.Est. estándar Diferencia 100 10,000 3,200 0,320
hará uso de una t pareada para una proporción asumiendo que las varianzas son homogéneas :
IC de 95% para la diferencia media:: (9,365; 10,635) Prueba t de diferencia media = 10 (vs. no = 10): Valor T = 0,00 Valor P =0,8728 Para saber cuales no: 100x 0,8728= 87,28
Ejercicio Nº 34
La desviación estándar en cuanto a la cantidad de tiempo que se gasta en entrenar aun trabajador para realizar un trabajo es de 40 minutos. Se toma una muestra aleatoria de 64 trabajadores. 1. ¿Cuál es la probabilidad de que la media muestral exceda la media poblacional en más de 5 minutos? 2. ¿Cuál es la probabilidad de que la media muestral sea al menos mayor que la media poblacional en 8 minutos?
Desarrollo-Ejercicio 34
RPTA.
Se
1
hace una prueba de medias: Potencia y tamaño de la muestra
Prueba Z de 1 muestra
Probando la media = nula (vs. > nula) Calculando la potencia para la media = nulo + diferencia Alfa = 0,05 Desviación estándar asumida = 40
Tamaño de la Diferencia muestra Potencia 5 64 0.1587
RPTA.
2
Al igual que el caso anterior se hará una prueba de hipotesis para la media
Prueba t de 1 muestra
Probando la media = nula (no vs. = nula) Calculando la potencia para la media = nulo + diferencia Alfa = 0,05 Desviación estándar asumida = 40
Tamaño de la Diferencia muestra 8 64
Potencia 0,0548
Ejercicio Nº 36
El promedio del fondo de pensiones en TIAA, para una población de profesores, es de US$ 40,715, con una desviación estándar de US$ 19,015. Halle la probabilidad de que una muestra de 75 profesores produzca un error de muestreo menor que US$1,000
Desarrollo Ejercicio 36
Se hará una prueba de medias : T de una muestra Prueba de mu = 39715 vs. > 39715
Media del Error 95% Límite N Media Desv. Est. estándar 75 40715 19015 2196
inferior T 37058 0,46
P 0,35.4
La probabilidad de producir un error de muestreo es de 35.4%
Ejercicio Nº 38
Un proceso industrial genera el 8% de unidades defectuosas. Usted compra 100 unidades. ¿Cual es la probabilidad de que menos del 10% sean defectuosas?
Desarrollo Ejercicio 38
Se utiliza esta formula:
P=0.08 Hp= =0.1 Ha= < 0.1 Z=
=0.7704
!
p T
o
T
=-0.67
o
(1 T o ) n
z c
Ejercicio Nº 40
Un productor de cámara de video pública que el 28% de las cámaras de video vendidas en el mercado son de su marca. De las 150 ventas recientes, exactamente 40 fueron producidas por esta compañía. ¿Qué piensa de lo que dice la compañía? Desarrollo Ejercicio 40
Se hará prueba de proporción Prueba e IC para una proporción Prueba de p = 0,28 vs. p < 0,28
Muestra X 1
Límite Valor P N Muestra p superior 95% exacto 40 150 0,266667 0,332563 0,397
Se ve que solo hay un 39.7l as ventas de video cámara del productor superen los 28%, la compañía se equivoca
Ejercicio Nº 42
El fabricante de un nuevo computador le comprueba que usted experimentará con su nuevo modelo sólo un 9% de reducción de tiempo en reparaciones y mantenimiento. Una revisión de su equipo actual revela que en las últimas 90 horas, 12 horas fueron de inactividad. ¿ El nuevo computador es más confiable que el modelo actual?
Desarrollo Ejercicio 42
Se hará uso de una diferencia de medias suponiendo que sus varianzas son homogéneas Diferencia = p (1) - p (2) Estimado de la diferencia: 0,0444444 IC de 95% para la diferencia: (-0,0471472; 0,136036) Prueba para la diferencia = 0 vs. no = 0: Z = 0,95 Valor P = 0.0764
El p valor dice que hay un 7.64% de probabilidad de que el nuevo sistema este en inactividad por 12 horas
Ejercicio Nº 44 Una corporación va a hacer una nueva emisión de acciones. La ley exige que a los accionistas actuales se les debe dar la primera opción de compra de toda nueva emisión. La gerencia considera que el 45% de los accionistas actuales desearán comprar. Se selecciona una muestra aleatoria de 130 accionistas, 63 de los cuales expresan su deseo de comprar. a).-¿Cuál es el error estándar de la proporción muestral? b).-¿Cual es la media de la distribución de las proporciones muéstrales? c).-¿Cuál es la probabilidad de obtener los resultados descritos en el problema si = 0.45?
Respuesta a). Se hará uso de las siguiente formula:
=
= 0,0438
Respuesta b).
La media de distribución de las proporciones muéstrales, en otras palabras la media poblacional seria la que se considera, es decir 0.45