Estadística Inferencial I Ingeniería Industrial Unidad I: Distribuciones Fundamentales para el Muestreo
Breve introducción a la inferencia estadística •
Los medidas de tendencia central, en particular la media sólo cambia en la notación. Las medidas de dispersión (varianza y desviación estándar), cambian.
•
s -> desviación estándar muestral.
•
s -> desviación estándar poblacional.
•
s 2-> varianza muestral.
•
s 2-> varianza poblacional.
Media poblacional (m) •
Si x1, x2, . . . xN representan la totalidad de las N observaciones de una población, entonces la media poblacional es:
Media muestral •
Si x1, x2, . . . xn representan la totalidad de las n observaciones de una muestra, entonces la media muestral es:
Varianza poblacional •
Si x1, x2, . . . xN representan la totalidad de las N observaciones de una población, entonces la varianza poblacional es:
Varianza muestral •
Si x1, x2, . . . xn representan la totalidad de las n observaciones de una muestra, entonces la media muestral es:
Desviación estándard estándard poblacional
Desviación estándard muestral
Ejercicio •
En la tabla mostrada a continuación se presentan los salarios que disfrutan los jugadores jugadores de Los Los Angeles Lakers Lakers de de la NBA, NBA, calcular las medidas de tendencia central y dispersión necesarias, además de hacer un histograma, una ojiva y un diagrama de caja.
Ejercicio No.
Nombre
Posición
Edad
Estatura Estatura
Peso
Colegio
Salario
5
Steve Blake
PG
32
6-3
172
Maryland
$4,000,000
24
Kobe Bryant
SG
34
6-6
205
6
Earl Clark
SF
25
6-10
225
Louisville
$1,240,000
21
Chris Duhon
PG
30
6-1
190
Duke
$3,500,000
3
Devin Ebanks
SF
23
6-9
215
West Virginia
$1,054,389
16
Pau Gasol
PF
32
7-0
250
27
Jordan Hill
C
25
6-10
235
12
Dwight Howard
C
27
6-11
265
4
Antawn Jamison
PF
36
6-9
235
North Carolina
$854,389
20
Jodie Meeks
SG
25
6-4
208
Kentucky
$1,500,000
1
Darius Morris
PG
22
6-4
190
Michigan
$962,195
10
Steve Nash
PG
38
6-3
178
Santa Clara
$8,900,000
50
Robert Sacre
C
23
7-0
260
Gonzaga
$473,604
15
Metta World Peace
SF
33
6-7
260
St. John's
$7,258,960
$27,849,149
$19,000,000 Arizona
$3,563,600 $19,536,360
Conceptos básicos •
Ejercicio. Se tiene un par de dados, los cuales se lanzan y todo el universo de resultados es el siguiente dado 2 1 2 3 4 5 6
1 2 3 4 5 6 7
2 3 4 5 6 7 8
dado 1 3 4 4 5 5 6 6 7 7 8 8 9 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
Distribución muestral muestral de la media •
Calculando la media para todos los resultados posibles, resulta
Dado 2
1 1,5 2 2,5 3 3,5
1,5 2 2,5 3 3,5 4
Dado 1 2 2,5 2,5 3 3 3,5 3,5 4 4 4,5 4,5 5
3 3,5 4 4,5 5 5,5
3,5 4 4,5 5 5,5 6
Datos Datos de la distribución de medias
n= Moda= Mediana= Media= Pos Pos 1er Q= Pos 3er Q= 1er Q= 3er Q=
36 3,5 3,5 3,5 9,25 27,75 2,5 4,5
Distribución muestral muestral de la media
La gráfica anterior muestra un histograma con forma de distribución normal.
Diagrama de caja del ejercicio ejercicio
Distribuciones de muestreo muestreo Muestra 1 Muestra 2
Población
Muestra n Estadístico
Estadístico •
•
Es una medida (de tendencia central o dispersión) calculada de una muestra. El estadístico tiene variación dependiendo de la muestra y se considera una variable aleatoria.
Distribuciones de muestreo muestreo •
•
Son distribuciones de probabilidad asociadas al estadístico analizado. En la repetición del muestreo nos señalan que valores del estadístico puede ocurrir y la frecuencia con la que esto sucede.
Distribución de muestreo para un estadístico •
Mendenhall et. al. (2009). Es la distribución distribución de probabilidad para los posibles valores del estadístico que resultan cuando son seleccionadas repetidamente muestras aleatorias de tamaño n de la población.
Teorema de límite central para una media •
Walpole [9].Se tiene la media de una muestra aleatoria de tamaño n que se toma de una población con media μ y varianza varianza finita σ2
entonces la forma límite de la distribución de
•
Cuando n-> ∞, es la distribución normal estándard
Ejemplo •
Lind et. al. Página 299. De acuerdo con un estudio del Internal Revenue Service, los contribuyentes tardan 330 minutos en promedio en preparar, copiar y archivar en un medio electrónico la forma fiscal 1040. Esta distribución de tiempos se rige por una distribución normal, y la desviación estándar es de 80 minutos.
Ejemplo •
Un organismo de control selecciona una muestra aleatoria de 40 consumidores. 1. ¿Cuá ¿Cuáll es es la la pr probab obabil ilid idad ad de de que que la la med media ia de la muestra sea mayor que 320 minutos? 2. ¿Cuá ¿Cuáll es la prob probab abil ilid idad ad de de que que la la med media ia de la la muestra este entre 320 y 350 minutos? 3. ¿Cuá ¿Cuáll es es la la pr probab obabil ilid idad ad de de que que la la med media ia de la muestra muestra sea superior a 350 minutos?
Ejercicio •
Un horno de tratamientos térmicos entrega engranes de acero SAE 8620 con una dureza superficial promedio de 58 en la escala Rockwell C. La desviación estándar es s=15
Ejemplo –
–
–
¿Cuál es la probabilidad de que una muestra aleatoria de 40 de estos engranes tenga una dureza superficial promedio mayor a 60? ¿La probabilidad de tener una dureza superficial promedio entre 57 y 61? ¿La probabilidad de una dureza superficial promedio menor a 56 ?
A partir de las expresiones
− − − − − − <
2
2
<
<
= 1
2
<
2
=1
Se puede calcular el tamaño de la muestra considerando el error (e) usando la siguiente fórmula:
2
=
2
Teorema límite central diferencia de medias •
Walpole [9]. Si se sacan al azar muestras independientes de tamaños n 1 y n2 de dos poblaciones discretas o continuas, con medias μ1 y μ2 y varianzas σ21y σ22 respectivamente, entonces la distribución muestral de la diferencia de medias está distribuida aproximadamente en forma normal con media y varianzas:
Teorema límite central 2 medias medias
•
Es aproximadamente la distribución normal estándar
Ejemplo •
[Walpole, ejercicio 6-14]. La calificación promedio para estudiantes de primer año en una prueba de aptitudes, en cierta universidad, es 540, con una desviación estándar de 50. ¿Cuál es la probabilidad de que dos grupos de estudiantes seleccionados aleatoriamente, consistentes en 32 y 50 estudiantes, respectivamente, difiera en sus calificaciones calificaciones promedio por
Ejercicio a) más de de 20 20 pu puntos b) Una cant cantida idad d en entr tre e 5 y 10 punto puntos? s? Datos:
Distribución c2 •
Teorema,Walpole [9]. Si s2 es la varianza de una muestra aleatoria de tamaño n tomada de una población normal que tiene la varianza σ2, entonces el estadístico:
2
tiene una distribución c con n = n − 1 grados de libertad.
Distribución c2 •
La distribución c2 posee las siguientes propiedades, Bowerman [1]:
•
1) La curva es sesgada a la derecha..
•
2) La curva solo tiene valores positivos.
•
3) Depende de los grados de libertad n.
Distribución c2 •
Ejemplo. Walpole, ejercicio propuesto 1, página 237. Para una distribución c2 encuentre. –
c 0.0252 cuando n=15;
–
c 0.012 Cuando n=7;
–
c 0.052 Cuando n=24;
–
c 0.9952 Cuando n=9;
–
c 0.992 Cuando n=3;
En Excel
Usar comando prueba.chi(valora, grados de libertad n)
Ejemplo •
Walpole, ejercicio propuesto 5, página 237. Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una población normal con varianza s2=6, tenga una varianza s2 –
mayor a 9.1;
–
Entre 3.462 y 10.745.
Encontrando la probabilidad a
Usar comando distr.chi(valor distr.chi(valor
2,
grados de libertad)
Distribución t (Student) •
La distribución t posee las siguientes propiedades, Bowerman [1]:
1) La curva es simétrica y en forma de campana x = μ..
2) La curva es simétrica con respecto a la media μ = 0. 3) La desviación estándar siempre es σ > 1, y depende de los grados de libertad n.
Distribución t
Distribución t
Distribución t Desarrollando
Distribución t
Distribución t Resulta en
Distribución t •
Ejemplo. Walpole, ejercicio propuesto 8, página 238. Para una distribución t encuentre. –
t0.025 cuando n=14;
–
-t0.01 cuando n=10;
–
t0.05 cuando n=7.
Ejemplo •
Walpole, ejercicio propuesto 12, página 238. Una compañía manufacturera asegura que las baterías utilizadas en sus juegos electrónicos duran un promedio de 30 horas. Para conservar este promedio se prueban 16 baterías mensualmente. Si el valor calculado de t cae entre –t0.025 y t0.025, la compañía esta satisfecha con la afirmación.
Ejemplo •
¿Qué conclusión sacaría la empresa con una muestra que tiene una media muestral de 27.5 horas y una desviación estándar s=5 horas? Suponga que la distribución de las duraciones de la batería es aproximadamente normal.
Distribución F •
La distribución F se define como la relación de dos variables aleatorias c2 independientes (U y V), cada una dividida por su número de grados de libertad, esto se puede escribir
Distribución F •
donde U y V son variables aleatorias independientes que tienen una distribución c2 con n1 y n2 grados de libertad, respectivamente
Distribución F •
La distribución F posee las siguientes propiedades, Bowerman [1]:
1) La curva es sesgada a la derecha. 2) La curva solo tiene valores positivos. 3) Depende de los grados de libertad n1 y n2
Distribución F •
Teorema. Walpole[9]. Si se escribe f a (n1 , n2 ) para f a con n1 y n2 grados de libertad, se obtiene:
Distribución F •
Teorema. Walpole[9]. Si s21 y s22 son las varianzas de variables aleatorias independientes de tamaños n1 y n2 que se sacan de poblaciones normales con varianzas, respectivamente entonces
tiene una distribución F con n1 = n1 − 1 y n = n − 1.
Distribución F •
Ejemplo. Walpole, ejercicio propuesto 15, página 238. Para una distribución F encuentre: –
f 0.05 con n1=7 y n2=5;
–
f 0.05 con n1=15 y n2=7;
–
f 0.01 con n1=24 y n2=19;
–
f 0.95 con n1=19 y n2=24;
–
f 0.99 con n1=28 y n2=12.
Bibliografía y referencias •
•
Anderson, David R.; R .; Sweeney, Sweeney, Dennis J.; Williams, Thomas A. (2012). Estadística para negocios y economía. 11a.edición. Cengage Learning Latinoamerica. México. Bowerman, Bruce L., O’Connell, Richard T., Murphree, Emily S. (2009). Business Statistics in Practice. 5th. Edition. McGraw-Hill Irwin. New York, U.S.A.
Bibliografía y referencias •
•
Bowerman, Bruce L., O’Connell, Richard T., Koehler, Anne B. (2006). Pronósticos, Series de Tiempo y regresión. 4a. Edición. Thomson Learning. México. Gutiérrez Pulido, Pulido, Humberto; De D e la Vara Vara Salazar, Román. (2008). Análisis y Diseño Diseño de Experimentos.2ª. edición McGrawHill/Interamericana. México.
Bibliografía y referencias •
•
Lind, Douglas, Marchal, William G., Wathen, Samuel, A. (2008). Estadística aplicada a los negociosy la economía. 15ª edición. McGrawHill Interamericana. México. Mendenhall, William, Robert J. Beaver, Barbara M. Beaver Be aver.. (2006). (2006). Introducción Introducci ón a la probabilidad y estadística. 13ª. Edición. Cengage Learning. México.
Bibliografía y referencias •
Walpole, Roland E.; Raymond H. Myers, Sharon L. Myers, Keying Ye Ye (2012). (2012). Probabilidad y Estadística. 9ª. Edición. Pearson Educación de México. México