Probabilidad y estadística MEC MEC 1023 Unidad IV Técnicas de muestreo
•
conjunto de datos de una población mediante . •
Para poder usar una muestra en una , es, que el azar intervenga en la selección de .
•
conjunto de datos de una población mediante . •
Para poder usar una muestra en una , es, que el azar intervenga en la selección de .
Muestra 1 Muestra 2
Población
Muestra n Estadístico
•
Establecer contacto con toda la tiempo.
azones para muestreo
población es demasiado alto. •
•
s mpos e ver car físicamente a toda la población Si son pruebas destructivas
•
•
muestreo
Muestra aleatoria es ra ca a
•
Muestra por cluster
•
Muestra aleatoria
•
probabilidad de ser seleccionada, entonces se . se realiza sin devolución.
•
simple de cada una de varias subpoblaciones
•
colección de elementos, de los racimos o . límites naturales geográficos o de otra clase, y .
Ejercicio •
Se tiene un par de dados, los cuales se lanzan y to o e un verso e resu ta os es e s gu ente
dado 2
1
2
dado 1 3 4
2 3 4 5 6
3 4 5 6 7
4 5 6 7 8
5 6 7 8 9
6 7 8 9 10
5
6
7 8 9 10 11
8 9 10 11 12
Distribución muestral de la media •
posibles, resulta Dado 1 1.5 2 2.5 3 3.5
. 2 2.5 3 3.5 4
2.5 3 3.5 4 4.5
. 3 3.5 4 4.5 5
3.5 4 4.5 5 5.5
. 4 4.5 5 5.5 6
Datos de la distribución de medias
n= Mediana= Media= Pos 1er Q= Pos 3er Q= 1er Q= 3er Q=
36 . 3.5 3.5 9.25 27.75 2.5 4.5
Distribución muestral de la media
La gráfica anterior muestra un histograma con forma de str uc n norma .
•
dispersión) calculada de una muestra. •
El estadístico tiene variación dependiendo de a muestra y se cons era una var a e aleatoria.
4.2 Estimación puntual •
. , . . 302. La distancia entre una estimación y el estimación.
4.2 Estimación puntual
α /2
1 − α
α /2
x
μ zα / 2 σ x
zα / 2 σ x
Margen de error
4.2 Estimación puntual •
variabilidad del estimador. Para estimar la media poblacional μ de una oblación cuantitativa el estimador untual es no sesgado con error estándar estimado como
4.2 Estimación puntual •
confianza de 95% cuando n ≥ 30 es estimado
4.3. Introducción a las distribuciones muestrales •
•
. distribuciones de probabilidad asociadas al . En a repet c n e muestreo nos se a an que valores del estadístico puede ocurrir y la recuenc a con a que esto suce e.
Distribución de muestreo para un estadístico •
. . . probabilidad para los posibles valores del seleccionadas repetidamente muestras .
Teorema de límite central para una •
•
. aleatoria de tamaño n que se toma de una oblación con media varianza finita σ2 entonces la forma límite de la distribución de
‐ ∞
estándard
•
. . . estudio del Internal Revenue Service, los promedio en preparar, copiar y archivar en un . distribución de tiempos se rige por una , es de 80 minutos.
•
muestra aleatoria de 40 contribuyentes. . muestra sea mayor que 320 minutos? . muestra este entre 320 y 350 minutos? muestra sea superior a 350 minutos?
•
engranes de acero SAE 8620 con una dureza Rockwell C. La desviación estándar es σ=1.45
–
muestra aleatoria de 40 de estos engranes mayor a 59? –
superficial promedio entre 56 y 60? –
¿ a pro a a e una ureza super c a promedio menor a 54?
2
•
Teorema,Walpole [9]. Si s2 es la varianza de una muestra aleatoria de tamaño n tomada de una población normal que tiene la varianza σ2, entonces el estadístico:
tiene una distribución grados de libertad.
2
con ν = n − 1
Distribución χ2 •
2
propiedades, Bowerman [1]: .. •
2) La curva solo tiene valores positivos.
•
3) Depende de los grados de libertad ν.
Distribución χ2 •
. , página 237. Para una distribución χ2 . –
χ 0.0252 cuando ν=15;
–
0.01 2 0.05 Cuando
ν=24;
–
χ
–
χ 0.995
–
χ 0.992 Cuando ν=3;
uan o ν= ;
,
Usar comando prueba.chi(valorα, grados de libertad ν)
Ejemplo •
, , . Encuentre la probabilidad de que una muestra , población normal con varianza σ2=6, tenga 2
mayor a 9.1;
–
–
.
.
.
Usar comando distr.chi(valor χ2, grados de libertad)
Distribución t (Student) •
propiedades, Bowerman [1]: x = μ. 2 La curva es s m tr ca con respecto a a me a μ = 0. 3) La desviación estándar siempre es σ > 1, y depende de los grados de libertad ν.
Distribución t 4) Si los grados de libertad ν→∞ (enden a infinito) la s r uc n se aprox ma a y a e m s se aprox ma a a curva normal.
Distribución t dividiendo entre
Distribución t
Distribución t 2
y por el teorema del límite central
Distribución t
Distribución t •
. , , página 238. Para una distribución t encuentre. –
t0.025 cuando ν=14;
–
‐t0.01 cuando ν=10;
–
t0.05 cuando ν=7.
Ejemplo •
, , . Una compañía manufacturera asegura que las duran un promedio de 30 horas. Para baterías mensualmente. Si el valor calculado – . , . satisfecha con la afirmación.
Ejemplo •
muestra que tiene una media muestral de . = horas? Suponga que la distribución de las normal.
Distribución F a s r uc n se e ne como a re ac n e dos variables aleatorias χ2 independientes (U , grados de libertad, esto se puede escribir
Distribución F •
independientes que tienen una distribución χ2 , 1 2 respectivamente
Distribución F •
propiedades, Bowerman [1]: 1) La curva es sesgada a la derecha. 2) La curva solo tiene valores positivos. 3 De ende de los rados de libertad ν
ν
Distribución F •
. . α 1, para f α con ν1 y ν2 grados de libertad, se
2
Distribución F •
2 2 . . de variables aleatorias independientes de tamaños n n ue se sacan de oblaciones normales con varianzas, respectivamente entonces
ene una ν2 = n2 − 1.
s r uc n
con ν1 = n1 − y
Distribución F •
. , , página 238. Para una distribución F encuentre: –
–
–
–
–
0.05
1
2
f 0.05 con ν1=15 y ν2=7; 0.01
1=
2=
;
f 0.95 con ν1=19 y ν2=24; 0.99 con
ν1=
y ν2=
.
•
muestral de la media y la prueba de hipótesis .
Prueba de hipótesis con alternativa unilateral o prueba de 1 cola Zona de rec azo
Valor crítico
ona e aceptación
z
.
=1.65
Prueba de hipótesis con alternativa unilateral o prueba de 1 cola
Prueba de hipótesis con alternativa bilateral o prueba de 2 colas
prueba de hipótesis. 1.‐ Se hace el planteamiento de una hipótesis nula. 2.‐ Establecer una hipótesis alterna. 3.‐ Agrupar los datos disponibles y realizar un análisis .
‐
identificar una región crítica en base a la hipótesis alterna establecida. 5.‐ Evaluar los datos obtenidos con el estadístico de prueba apropiado y obtener un valor P. 6.‐ Comparar parámetro evaluado vs la región crítica de ace tación.
.‐ a la comparación y el valor P. 8.‐ Determinar el intervalo de confianza correspon ente. 9.‐ Probar la normalidad de los datos.
•
hipótesis para la media con σ conocida o .
•
hipótesis para la media con σ desconocida o .
•
E em lo, Lind 3 . Una encuesta nacional reciente determinó que los estudiantes de secundaria veían en promedio 6.8 películas en DVD al mes. universitarios reveló que la cantidad media de películas en DVD que vieron el mes pasado fue de . , con una esv ac n es n ar po ac ona e 0.5. Con un nivel de significancia de 0.05 ¿Puede concluir ue los estudiantes universitarios ven menos películas en DVD que los estudiantes de secundaria?
z0.05=‐1.65
,
‐ .
z0.05=‐1.65
5) Comparar z vs valor crítico ‐7.2<‐1.65 6) Conclusión: Los estudiantes universitarios ven menos películas en DVD que los estudiantes de secundaria. 7) Valor P P(z=‐7.2)=3.01x10‐13
•
, . distrito de las montañas Rocallosas de Rath , ., universitarios, afirma que los representantes de ventas a la semana a profesores. Varios bajo.
•
de ventas revela que la cantidad medias de 42. La desviación estándar de la muestra es de . . 0.05, ¿puede concluir que la cantidad media más de 40?
•
. inoxidable debe tener partículas con un = . de 87 partículas tiene un diámetro de 15.2 , . . ¿el diámetro medio de las partículas difiere de
•
. útil de partes fabricadas con una cierta , cargados ciclicamente hasta la falla. El , desviación estándar fue 120. ¿La media de
•
. de cierto tipo de fibra debe ser al menos 200 . = psi. Si una muestra de 8 fibras tienen los , , , , 197.4, 196, 199, 195.5. , 0.05, si la fibra es inaceptable?
•
. control de calidad para una línea de espesante) son probados para su pureza. El sea más grande de 85%. Una muestra entrega los siguientes resultados (en
•
determinar si se acepta el embarque. 93.2
87
92.1 90.1 87.3 93.6
•
. automóvil dice que tiene un rendimiento en autopista. Si las millas por galón obtenidas , 24, 20, 25, 27, 25, 28, 30, 26, 33. ¿Se debe
•
. para el espesor de la pared una botella de 2 de pulgada. Un ingeniero de control de calidad policarbonato provenientes de un lote grande en cada uno.
•
. , . , . , . 3.969, 3.995 y 4.091. Probar si el diámetro es 4 milésimas.
,
•
. es diseñada para proveer la resistencia a la concreto. La especificación para una resistencia a la compresión media supere . producida y probada.
•
de la muestra es 1356 kPa con una desviación . la especificación? Usar α=0.10
̃ •
muestral de la proporción y la inferencia .
•
52% de los conductores estadounidenses que viajan por autopista de cuota es de género masculino. Una muestra de 300 automóviles que viajaron el día de ayer por la autopista de New Jersey reve que a 170 os mane a an hombres. Con un nivel de significancia de . .
•
de New Jersey manejaba una proporción mayor de hombres que lo indicado por las estadísticas nacionales?
2) Datos:
3) identificar región crítica por la hipótesis alterna H1 : p > 0.52, la región crítica es de una cola en este caso es una proporción con una muestra, nq0 = 300(0.48) = 144 > 5, np0 = 300(0.52) = 156 > 5, se usa la distribución z, que para un α = 0.01, tiene el valor z0.01 = 2.3263
z=1.6179
4) Evaluación de datos:
.
.
6) Conclusión: proporción, circulando por la autopista de New
P (z = 1.6179) = 1‐0.9472=0.0528
•
. en cierto pueblo, 274 dicen que se oponen a . ¿Puede concluir que más de la mitad de los construcción del nuevo centro comercial?
•
. en cierta ciudad, 110 tienen acceso a internet . del 70%?
•
. esta calificada para una tarea particular si se partes defectuosas. En una muestra aleatoria , . en esta información, la máquina califica?
•
•
•
. su producto tiene una resistencia a la compresión con una desviación estándar de 10 k cm2 o menor a ésta. Una muestra de 10 mediciones arrojó una media y una desviación estándar de 312 kg/cm2 y 13.96 kg/cm2, respectivamente. ¿Hay suficiente evidencia para rechazar la afirmación del fabricante? Usar α= 0.05 .
.
2)Datos.
•
alterna H1 : σ > 10, la región crítica es de una , = . cual χ2 α,ν = χ2 0.05,9 = 16.919
χ2 0.05,9 = 16.919
4)Evaluar datos.
2
, 17. 539 > 16.919
2
7) Valor P P(χ2 = 17. 539, ν = 9)= 0.041
•
nueva planta asumiendo que el costo tener una media de 1200 dólares. Para ver si , plantas similares del corporativo, los , , , , , 1240, 1310, 1170, 1230, 1285.
•
dólares. para la nueva planta es realista? α =0.05
•
, , , ., , Samuel, A. (2008). Estadística aplicada a los . ‐ Interamericana. México. , . , . (2002). Probabilidad y Estadística aplicadas a ‐ . .
•
, , , ., Beaver, Barbara M. (2009). Introducción a la . . . Cengage Learning. México. , . . and Scientists. 3rd edition. McGraw‐Hill. New , . . .