Instituto Profesional Diego Portales AUTÓNOMO
Asignatura
ESTADÍSTICA APLICADA Autor: RODRIGO ALÍ VALLEJOS
1
Instituto Profesional Diego Portales AUTÓNOMO
AUTOR RODRIGO ALÍ:
Ingeniero Matemático, Universidad de Concepción.
Se desempeña como docente en el Instituto Diego Portales de Concepción, desde 2000 a la fecha. Se desempeña como docente en la Universidad Católica de la Santísima Concepción desde 2001 a la fecha. Se desempeña como docente en la Universidad del Bío-Bío desde 2003 a la fecha. Se desempeñó 3 años como coordinador e instructor de cursos en el Laboratorio de computación de la Facultad de Ciencias físicas y Matemáticas de la Universidad de Concepción
INVITACIÓN AL MÓDULO 2
Instituto Profesional Diego Portales AUTÓNOMO
Estimado alumno Los conocimientos de teoría estadística son la base del soporte tecnológico y la base sobre la cuál se puede hacer un uso racional, sistemático y ético de la sorprendente tecnología que se incorpora cotidianamente a nuestro quehacer laboral. Por tanto, no es solo la necesidad de calcular, medir o de disponer de herramientas mecánicas directas por lo cuál hay que estudiar disciplina, sino que nos debe mover el manifiesto interés por desarrollar nuestra capacidad de desición, aumentar nuestra capacidad de analizar, discriminar, abstraer y sintetizar información, optimizando así nuestra rapidez y eficacia para enfrentar el conjunto de situaciones problemáticas que afectan diariamente al conjunto de nuestra actividad.
Este módulo de Estadística ha sido creado siguiendo de muy cerca el programa de la asignatura, en su elaboración se han priorizado objetivos y contenidos fundamentales, para acceder al dominio de herramientas de decisión y de lenguaje estadístico, que permitan una utilización transversal en el currículum general de tu carrera así como también una posible proyección posterior, hacia niveles de instrucción superiores en tu respectiva área.
Para facilitar el seguimiento de presente texto, se ha considerado una instrucción programada, simple reinterpretar por el alumno, que generalmente dispone de un tiempo limitado de estudio personal; se sugiere enfrentar perseverantemente todas las actividades de autoevaluación, propuestas al final de cada unidad temática, para ir accediendo a capítulos progresivos en forma directa, considerando también las instancias de consultoría establecidas por el Programa a Distancia a cargo de tus profesores tutores.
Esperando para ti todo el éxito posible, te invito a iniciar la tarea del aprendizaje sistemático, que te conducirá a la obtención de tus objetivos personales y profesionales.
¡¡Mucha suerte y hasta pronto!!
3
Instituto Profesional Diego Portales AUTÓNOMO
ASIGNATURA ESTADÍSTICA OBJETIVO GENERAL Al término del curso, el alumno será capaz de:
Aplicar elementos de estadística inferencial relacionados con distribuciones maestrales, desarrollándolos en problemas de gestión empresarial. Propender al desarrollo del sentido de autonomía personal y por lo tanto la responsabilidad de su propio aprendizaje.
OBJETIVOS ESPECÍFICOS
Unidad Temática N° 1: Emplear la distribución normal, sus aplicaciones más importantes y su importancia en la construcción de otras distribuciones. Unidad Temática N° 2: Construir parámetros en forma puntual y por intervalos verificando sus propiedades y aplicar los conceptos de estimación de cada uno de los muestreos estudiados. Unidad Temática N° 3: Elaborar una prueba de hipótesis para medias y proporciones, aplicables a problemas del área. Unidad Temática N° 4: Aplicar el análisis de varianza para medir la bondad del ajuste en modelos de regresión lineal.
4
Instituto Profesional Diego Portales AUTÓNOMO
ASIGNATURA ESTADÍSTICA PRIMERA UNIDAD DISTRIBUCIONES CONTINUAS
CONTENIDO DE LA UNIDAD TEMÁTICA
1.1
Distribución normal. Generalidades y aplicaciones.
1.2
Distribución Chi – Cuadrado. T – Student y F. 1.2.1 Construcción. Características. Uso de tablas. Aplicaciones.
DISTRIBUCIÓN NORMAL 5
Instituto Profesional Diego Portales AUTÓNOMO
Es la distribución continua de de probabilidad más importante en el campo de la estadística. Su gráfica recibe el nombre de curva normal, su forma es la de una campana.
Esta curva permite describir muchos fenómenos que ocurren en la naturaleza, la industria y la investigación.
Una variable aleatoria (v.a) continua
que tiene distribución en forma de campana se llama
variable aleatoria normal.
Concepto: La función de la variable aleatoria
f (X )
X ~ N( ,
1
e
2 2
1 X 2
, con media
2
x
)
Propiedades de la distribución normal 6
y varianza
2
, está dada por:
Instituto Profesional Diego Portales AUTÓNOMO
1) El máximo valor de la curva se encuentra en x= 2) La curva es simétrica respecto a la recta x= 3) La curva es asintótica al eje X 4) El área bajo la curva y sobre el eje X es uno. 5) Si X es una variable aleatoria normal, entonces E(X)=
y Var(X)=
2
Áreas bajo la curva
b
P( a
X
b)
f ( X )dx a
Sin embargo, resolver esta integral con la función de densidad de la variable aleatoria normal no es tan simple. Por tal motivo, se recurre a un proceso denominado estandarización basándose en una variable aleatoria z que tiene =0 y
2
=1 y que se denomina distribución normal estándar.
Concepto: Si z es una v.a. normal con =0 y
2
=1, tiene función de densidad: 7
Instituto Profesional Diego Portales AUTÓNOMO
f (Z )
1 2
e
1 2 Z 2
-
x
Z ~ N (0,1)
El proceso de estandarización se realiza de la siguiente forma:
Si X ~ N ( ,
2
), entonces Z
X
~ N (0,1)
Ejemplos 1) P(z>1,84)
P(z>1,84)=1-P(z
1,84)
= 1-0,9671 = 0,0329
2) P(-1,97
Instituto Profesional Diego Portales AUTÓNOMO
P(-1,97
=
=
P(z<0,86)- P(z<-197)
0,8051-0,0244
0,7807
3) P(z>z0)=0,7486
P(z>z0)=0,7486 1-P(z
z0)=0,7486
1-0,7486 = P(z
z0)
P(z
z0) = 0,2514
z0=-067
4) Sea X una v.a normal =40 y =6, detemine: 9
Instituto Profesional Diego Portales AUTÓNOMO
a) P(X x) = 0,45
P z
z
x 40 6
40 6
0.13
0.45
x
39,22
b) P( X>x )= 0,14
1 P z P z
x 40 6 x 40 6
0,14 0,86
x 40 6
1,08
x
46,48
EJERCICIOS 10
Instituto Profesional Diego Portales AUTÓNOMO
I) Usando la tabla determine:
a) P(z<0,83)
Resp: 0,7967
b) P(z<-1,27)
Resp: 0,1020
c) P(z>0,83)
Resp: 0,2033
d) P(z>-1,27)
Resp: 0,898
e) P(0,47
Resp: 0,1791
f) P( -1,39
Resp: 0,8354
g) P(z>z1)=0,06
Resp: z1=1,55
h) P(-0,93
Resp: z1=1,28
II) Dada la v.a. X distribuida normalmente con media 18 y desviación estándar 2,5 , encuentre: a) P(x<15)
Resp: 0,1151
b) P(x
Resp: x1=16,1
c) P(x
Resp: x1=20,28
d) P(17
Resp: 0,4009
Problemas de aplicación 11
Instituto Profesional Diego Portales AUTÓNOMO
1) Cierto tipo de batería dura un promedio de tres años, con una desviación estándar de 0,5 años. Suponiendo que las duraciones de las baterías son normalmente distribuidas, encuentre la probabilidad de que una determinada batería dure menos de 2,3 años.
Solución:
X ~ N (3, (0,5) 2 )
X
Duración de la batería
X ~ N (3, (0,5) 2 )
X
Duración de la batería
P( x
2,3)
P z
2,3 3 0,5
P( z 1,4) 0,0808
La probabilidad de que una determinada batería dure menos de 2,3 años es de un 8,08%.
12
Instituto Profesional Diego Portales AUTÓNOMO
2) Una compañía fabrica focos cuya duración es normalmente distribuida con una media de 800 horas y una desviación estándar de 40 horas. Encuentre la probabilidad de que un foco dura entre 778 y 834 horas de uso.
Solución
X ~ N (800, (40) 2 )
P (778
x
834)
X
P
778 800 40
P ( 0,55 P( z
Duración de los focos
z
z
834 800 40
0,85)
0,85) P( 0,55)
0,8023 - 0,2912 0,511
La probabilidad de que un foco dure entre 778 y 834 horas de uso es de un 51,11%.
13
Instituto Profesional Diego Portales AUTÓNOMO
3) Una cierta máquina produce resistencias aléctricas que tienen un valor medio de 40 ohms y una desviación estándar de 2 ohms. Suponiendo que los valores de las resistencias siguen una distribución normal y que pueden medirse con cualquier grado de precisión. ¿Que porcentaje de las resistencias tendrá un valor que exceda los 43 ohms ?
Solución:
X ~ N (40, (2) 2 )
P( x
43)
X
valor de las resistencias eléctricas
1 P z
43 40 2
1 P ( z 1,5) 1 0,9332 0,0668
El 6,68% de las resistencias tendrá un valor que exceda a 43 ohms.
14
Instituto Profesional Diego Portales AUTÓNOMO
4) En una empresa las edades de los trabajadores se distribuye normalmente con media 50 años y desviación estándar 5 años. a) ¿Qué porcentaje de los trabajadores tiene entre 50 y 52,5 años ? b) ¿Cuál es la probabilidad de qque un trabajador cualquiera no sea mayor de 45 años? c) ¿Cuál es la probabilidad que un trabajador tenga entre 41 y 58 años? d) El 20% de los trabajadores están bajo cierta edad ¿Cuál es esa edad? Solución: X ~ N (50 , (5) 2 )
a) P(50
x
52,5)
X
edad de los trabajado res
P
50 50 5
z
P (0
z
P( z
0,5) P( z
52,5 50 5
0,5) 0)
0,6915 0,5 0,1915
El 19,15% de los trabajadores tiene entre 50 y 52,5 años.
b) P( x
45)
P z
45 50 5
P( z
1)
0,1587 La probabilidad de que un trabajador cualquiera no sea mayor de 45 años es de un 15,87 %
15
Instituto Profesional Diego Portales AUTÓNOMO
c) P (41
x
58)
P
41 50 5
P ( 1,8
58 50 5
z
z 1,6)
P ( z 1,6) P ( z
1,8)
0,9093
La probabilidad que un trabajador tenga entre 41 y 58 años es de un 90,93 %
d) P( X
P z
x)
0,20
x 50 5
0,20
x 50 5
-0,85
x
45,75
El 20% de los trabajadores tiene una edad menor o igual a 45,75 años.
16
Instituto Profesional Diego Portales AUTÓNOMO
EJERCICIOS AUTO EVALUACIÓN Nº 1
1) Las piezas de pan de centeno distribuidas a las tiendas locales por una cierta pastelería tienen una longitud promedio de 30 cm y una desviación estándar de 2 cm. Suponiendo que las longitudes están normalmente distribuidas. ¿Qué porcentaje de las piezas son :
a) De más de 31,7 cm de longitud ? b) Entre 29,3 y 33,5 cm de longitud ? c) De una longitud menor que 25,5 cm ?
2) Una máquina despachadora de refrescos está ajustada para servir un promedio de 200 mililítros por vaso. Si la cantidad de refresco está normalmente distribuida con una desviación estándar de 15 mililítros.
a) ¿Qué fracción de los vasos contendrá más de 224 mililítros? b) ¿Cuál es la probabilidad de que un vaso contenga entre 191 y 206 mililítros?
3) El diámetro interno ya terminado de un anillo de pistón está normalmente distribuido con una media de 10 cm y una desviación estándar de 0,03 cm.
a) ¿Qué proporción de los anillos tendrá un diámetro interno que exceda de 10,075 cm ? b) ¿Cuál es la probabilidad de que un anillo de pistón tenga un diámetro interno entre 9,97 y 10,03 cm ? c) ¿Para que valor el diámetro interno de un anillo de pistón representará el 15% ?
4) La resistencia a la tensión de cierto componente metálico está normalmente distribuida con una media de 10.000 Kg/cm2 y una desviación estándar de 0,03 cm.
17
Instituto Profesional Diego Portales AUTÓNOMO
a) ¿Cuál es la proporción de estos componentes que execeden de 10.150 Kg/cm2 ? b) Si las especificaciones requieren que todos los componentes tengan una resistencia a la tensión entre 9.800 y 10.200 Kg/cm2 inclusive, ¿ qué porcentaje de piezas se esperaría que se desechara?
5) La vida promedio de cierto tipo de motor pequeño es de 10 años con una desviación estándar de 2 años. El fabricante repone sin cargo todos los motores que fallen dentro del período de garantía. Si está a reponer sólo el 3% de los motores que fallan, ¿qué tan larga deberá ser la garantía que otorgue? Suponga que la vida de los motores tienen distribución normal.
6) Suponga que un consultor está investigando cuánto tiempo necesitarán los obreros de la fábrica para montar cierta pieza en una planta de automóviles Volvo, y determinó que la información ( tiempo en segundos ) estaba normalmente distribuida con una media de 75 segundos y una desviación estándar de 6 segundos.
a) ¿Cuál es la probabilidad de que un obrero seleccionado aleatoriamente pueda montar la pieza en más de 81 segundos ? b) ¿Cuál es la probabilidad de que un obrero seleccionado aleatoriamente pueda montar la pieza entre 69 y 81 segundos ? c) ¿Cuál es la probabilidad de que un obrero seleccionado aleatoriamente pueda montar la pieza en menos de 62 segundos ? d) ¿Cuál es la probabilidad de que un obrero seleccionado aleatoriamente pueda montar la pieza entre 62 y 69 segundos ? e) ¿Cuántos segundos deben pasar antes de que el 50% de los obreros monten la pieza? 7) El espesor de un lote de 10.000 arandelas de bronce de un cierto tipo fabricadas par una gran compañía tiene una distribución normal con media 0,0191 pulgadas y desviación estándar de 0,000425 pulgadas. Compruebe que se puede esperar que el 99,04% de estas arandelas tengan un espesor entre 0,0180 y 0,202 pulgadas.
18
Instituto Profesional Diego Portales AUTÓNOMO
8) El tiempo de reacción para un cierto tipo de experimento psicológico está distribuido normalmente con media 20 segundos y desviación estándar 4 segundos.
a) ¿Cuál es la probabilidad de que una persona tenga un tiempo de reacción entre 14 y 30 segundos ? b) ¿Cuál es la probabilidad de que una persona tenga un tiempo de reacción entre 25y 30 segundos ? c) ¿Qué porcentaje de personas tienen un tiempo de reacción de más de 14 segundos? d) ¿Cuál es el tiempo de reacción de modo que sólo el 1% de todas las personas reaccionen con mayor rapidez?
9) Un procesador de alimentos envasa café en pequeños tarros, los pesos de los tarros están normalmente distribuidos con una desviación estándar de 0,3 onzas. Si el 5% de los tarros pesa más de de 12,492 onzas. ¿Cuál es el promedio de los tarros?
19
Instituto Profesional Diego Portales AUTÓNOMO
SOLUCIONES EJERCICIOS AUTO EVALUACIÓN Nº1
1) a) El 19,77% de las piezas tiene una longitud de más de 31,7 cm. b) El 59,67% de las piezas tiene una longitud menos que 25,5 cm.
2) a) El 5,48% de los vasos contendrá más de 224 mililítros b) El 5,18% de los vasos tendrá entre 191 y 209 mililítros
3) a) El 0,62% de los anillos tendrá un diámetro superior a 10,075 cm. b) El 68,26% de los anillos tendrá un diámetro entre 9,97 y 10,03 cm. c) El 15% de los anillos tendrá un diámetro de 9,9688 cm.
4) a) El 6,68% de los componentes exceden de 10.150 Kg/cm2 de resistencia a la tensión. b) El 4,56% de las piezas se despacharán
5) Deben tener una garantía de a lo más 6,24 años.
6) a) Existe un 65,87% de probabilidad de que un obrero pueda montar una pieza en menos de
75
seg o en ,más de 81 seg. b) Existe un 68,26% de probabilidad de que un obrero pueda montar una pieza entre 69 y 81 seg. c) Existe un 1,5% de probabilidad de que un obrero pueda montar una pieza en menos de
62
seg. d) Existe un 14,37% de probabilidad de que un obrero pueda montar una pieza entre 62y 69 seg. e) Deben pasar 75 segundos antes de que el 50% de los obreros monten la pieza.
20
Instituto Profesional Diego Portales AUTÓNOMO
7) Se cumple que el 99,04% de las arandelas tiene un espesor entre 0,0180 y 0,202 pulgadas.
8) a) El 92,7% de las personas tiene un tiempo de reacción entre 14 y 30 segundos. b) El 9,94% de las personas tiene un tiempo de reacción entre 25 y 30 segundos. c) El 93,32% de las personas tiene un tiempo de reacción de más de 14 segundos. d) El tiempo de reacción es de 10,38 segundos.
9) El promedio de los tarros es de 12,3 onzas.
21
Instituto Profesional Diego Portales AUTÓNOMO
DISTRIBUCIÓN T-STUDENT
Definición Sean X1,X2,……Xn variables aleatorias identicamente distribuidas con distribución normal con media
y varianza
2
. Entonces la variable:
T
(x
) n s
tiene distribución t-student con v=n-1 grados de libertad donde n es el tamaño de la muestra, x es la media de la muestra y s es la varianza muestral. La gráfica de esta distribución es similar a la distribución normal y está dada por:
Al igual que la distribución normal los valores de área de esta distribución se encuentran tabulados. La distribución de probabilidad T se publicó por primera vez en 1908 en un artículo de W.S. Gosset. En esa época , Gosset era empleado de una cervecería irlandesa que desaprobaba la publicación de investigaciones de sus empleados. Para evadir esta prohibición, publicó su trabajo en secreto bajo el nombre de Student. En consecuencia, la distribución T normalmente se llama distribución t de Student, o simplemente distribución t. La distribución T es similar a la distribución de Z, pues ambas son simétricas alrededor de la media igual a cero. Ambas distribuciones tienen forma de campana, pero la distribución t es más variable, debido al hecho que la distribución t depende de las cantidades de x y s2. 22
Instituto Profesional Diego Portales AUTÓNOMO
Ejemplos
1) El valor de t con v=14 grados de libertad que deja un área de 0.0975 a la derecha es:
t 0.975
t 0.025
2.145
2) Encuentre P(-t0.025
1-0.05-0.025=0.925
3) Encuentre el valor de k tal que P(k
Solución:
Notemos que 1.761 corresponde a t0.05 cuando v=14. Por tanto, -t0.05=-1761. Como k en el enunciado de de la probabilidad original está a la izquieda de –t0.05 = -1761, luego k=-2.977.
4) Un ingeniero químico afirma que el rendimiento medio de la población de cierto proceso en lotes es 500 gramos por milímetro de materia prima. Para verificar esta afirmación muestrea 25 lotes cada mes. Si el valor t calculado cae entre –t0.05 y t0.05, queda satisfecho con su afirmación. ¿ que conclusión extraería de una muestra que tiene una media x =518
23
Instituto Profesional Diego Portales AUTÓNOMO
gramos por milímetro y una desviación estándar s=40 gramos?. Suponga que la distribución de rendimientos es aproximadamente normal.
Solución:
De la tabla t-student encontramos que t0.05=1.711 para 24 grados de libertad. Por tanto, el fabricante que satisfecho con esta afirmación si para la muestra de tamaño 25 el valor de t queda entre -1.711 y 1.711. Si =500 entonces:
t
(x
) n s
(518
500 ) 25 40
2.25
Como t=2.25 no está entre -1711 y 1.711 el fabricante debe revisar su proceso productivo.
24
Instituto Profesional Diego Portales AUTÓNOMO
EJERCICIOS AUTO EVALUATIVOS Nº 2
1) Mediante uso de tabla encuentre:
a) P(T
2.365) con v 7
b) P(T 1.318) con v 24 c) P(-1.356 T
2.179) con v 12
2) Dada una muestra aleatoria de tamaño 24 de una distribución normal, encuentre k tal que:
a) P(-2.069 T b) P(k
T
c) P(-k T
k)
0.965
2.807)
0.095
k)
0.9
3) Un fabricante de instrumentos de precisión para medidas terrestre afirma que sus mediciones fallan en promedio a lo más 0.5 mm. En una muestra aleatoria de 8 de estos instrumentos las fallas de medición fueron de : 0.6 , 0.7 , 0.7, 0.3, 0.4, 0.5, 0.4 y 0.2 mm. Estaría de acuerdo con la afirmación del fabricante?
4) Un fabricante de cigarrillos asegura que el contenido promedio de nicotina, en una de sus marcas, es de 0.6 mg por cigarrillo. Una organización independiente mide el contenido de nicotina de 16 cigarros de esta marca y encuentra que el promedio y la desviación estándar muestral es de 0.75 y 0.175 mg, respectivamente, de nicotina. Si se supone que la cantidad de nicotina de estos cigarros es una variable aleatoria normal ¿ que tan probable es el resultado muestral dado por el fabricante ?
25
Instituto Profesional Diego Portales AUTÓNOMO
SOLUCIONES EJERCICIOS AUTO EVALUATIVOS Nº 2
1) a) P= 0.975 b) P= 0.10 c) P= 0.875
2) a) k=2.5 b) k=1.319 c) k=1.714
3) La varianza de una muestra está dada por: s
así entonces s2=0.034 Calculemos P(
P(
0.5)
xi
2
2
n( x 2 )
n 1
s=0.183 ; además x =0.475
0.5)
P
(x
) n
(x
s
0.5) n s
P T7
(0.475 0.5) 8 0.183
P(T7
0.38)
P(T7
0.38)
P(T7
0.38)
0.3
Luego el fabricante debe revisar la presición de sus instrumentos
26
Instituto Profesional Diego Portales AUTÓNOMO
4) Calculemos: P( >0.6)
P(
0.6)
P
(x
P T15 P(T15
) n s
( x 0.6) n s
(0.75 0.6) 16 0.175 3.428)
0.0025
Luego la probabilidad que el contenido promedio de nicotina se mayor que 0.6 milígramos es muy baja por tanto el fabricante podría tener razón sobre los contenidos promedio de nicotina de sus cigarros.
27
Instituto Profesional Diego Portales AUTÓNOMO
Distribución ji-cuadrado
Definición Si S2 es la varianza de una muestra aleatoria de tamaño n que se toma de una población normal que tiene varianza
2
, entonces la variable:
2
(n 1) S 2 2
tiene distribución ji-cuadrado con v=n-1 grados de libertad. En que n es el tamaño de la muestra S2 es la varianza muestral y
s
2
2
xi
2
es la varianza de la población.
n( x 2 )
n 1
La gráfica de esta distribución está dada por:
Al igual que las otras distribuciones sus valores de probabilidad se encuentran tabulados.
28
Instituto Profesional Diego Portales AUTÓNOMO
Ejemplo: Un fabricante de baterías para auto garantiza que sus baterías durarán, en promedio tres años con una desviación estándar de un año. Si cinco de estas baterías tienen duraciones de 1.9, 2.4, 3.0 , 3.5 y 4.2 años, ¿el fabricante aún está convencido de que sus baterías tienen una desviación estándar de un año? Suponga que la duración de la batería tiene distribución normal.
Solución:
Encontremos primero la varianza de la muestra:
s
xi
2
2
n( x 2 )
0.815
n 1
por otro lado
2
(n 1) S 2
(4)( 0.815 ) 1
2
P( s
2
1)
P
(n 1) s 2
(4)(0.815) 1
P
2 4
3.26
3.26
0.5
Luego el fabricante podría no tener razón en su afirmación.
29
Instituto Profesional Diego Portales AUTÓNOMO
EJERCICIOS AUTO EVALUATIVOS Nº 3
1) Para
2
encuentre:
a)
2 0.005
cuando v 15
b)
2 0.05
cuando v
7
c)
2 0.01
cuando v
24
2 0
2) Encuentre a) P(
2
b) P(
2 1-
c) P(37.652
2 0
) 2 0
si : 0.99 con v 5
)
0.025 con v 19 2
2 0
)
0.045 con v 25
3) Un fabricante de baterías para auto garantiza que sus baterías duraran en promedio, tres años con una desviación estandar de 1 año .Si 5 de estas baterías tienen duraciones de 1.9, 2.4, 3.0, 3.5 y 4.2 años. Cual es la probabilidad de que la variabilidad de las baterías sea de más de 3 años ? 4) Considere una medición física proporcionada por un instrumento de precisión, en donde el interés recae en la variabilidad de la lectura .suponga que, con base en la experiencia, la medición es una variable aleatoria normalmente distribuida con media 10 y desviación estándar 0.1 unidades. Si se toma una muestra aleatoria procedente de un proceso de manofactura de los instrumentos de tamaño 25, ¿ cuál es la probabilidad de que el valor de la varianza muestral sea mayor de 0.014 unidades cuadradas ?
30
Instituto Profesional Diego Portales AUTÓNOMO
SOLUCIÓN EJERCICIOS AUTO EVALUATIVOS Nº 3
1)
a) 27.488 b) 18.475 c) 36.415
2)
a) 13.277 b) 32.852 c) 46.928
3) y 4) tarea
31
Instituto Profesional Diego Portales AUTÓNOMO
ASIGNATURA ESTADÍSTICA SEGUNDA UNIDAD TÉCNICAS DE MUESTREO Y ESTIMACIÓN PUNTUAL
CONTENIDO DE LA UNIDAD TEMÁTICA
2.1
Muestreo aleatorio simple.
2.2
Muestreo aleatorio sistemático.
2.3
Muestreo aleatorio estratificado.
2.4
Muestreo por conglomerados.
2.5
Distribución muestral de la Media.
2.6
Teorema central del límite.
2.7
Estimación puntual y por intervalos.
2.8
Error Estándar de la media.
2.9
Tamaño de muestra.
2.10 Muestreo por etapas.
32
Instituto Profesional Diego Portales AUTÓNOMO
Descripción de Técnicas de muestreo sobre una población La teoría del muestreo tiene por objetivo, el estudio de las relaciones existentes entre la distribución de un carácter en dicha población y las distribuciones de dicho carácter en todas sus muestras. Las ventajas de estudiar una población a partir de sus muestras son principalmente: Coste reducido: Si los datos que buscamos los podemos obtener a partir de una pequeña parte del total de la población, los gastos de recogida y tratamiento de los datos serán menores. Por ejemplo, cuando se realizan encuestas previas a un referéndum, es más barato preguntar a 4.000 personas su intención de voto, que a 30.000.000; Mayor rapidez: Estamos acostumbrados a ver cómo con los resultados del escrutinio de las primeras mesas electorales, se obtiene una aproximación bastante buena del resultado final de unas elecciones, muchas horas antes de que el recuento final de votos haya finalizado; Más posibilidades: Para hacer cierto tipo de estudios, por ejemplo el de duración de cierto tipo de bombillas, no es posible en la práctica destruirlas todas para conocer su vida media, ya que no quedaría nada que vender. Es mejor destruir sólo una pequeña parte de ellas y sacar conclusiones sobre las demás. De este modo se ve que al hacer estadística inferencial debemos enfrentarnos con dos problemas: Elección de la muestra (muestreo), que es a lo que nos dedicaremos en este capítulo. Extrapolación de las conclusiones obtenidas sobre la muestra, al resto de la población (inferencia).
33
Instituto Profesional Diego Portales AUTÓNOMO
Muestreo aleatorio Consideremos una población finita, de la que deseamos extraer una muestra. Cuando el proceso de extracción es tal que garantiza a cada uno de los elementos de la población la misma oportunidad de ser incluidos en dicha muestra, denominamos al proceso de selección muestreo aleatorio. El muestreo aleatorio se puede plantear bajo dos puntos de vista: Sin reposición de los elementos; Con reposición.
1) Muestreo aleatorio sin reposición Consideremos una población E formada por N elementos. Si observamos un elemento particular, e E , en un muestreo aleatorio sin reposición se da la siguiente circunstancia: 1 La probabilidad de que e sea elegido en primer lugar es N ; N Si no ha sido elegido en primer lugar (lo que ocurre con una probabilidad de N 1 , la 1
probabilidad de que sea elegido en el segundo intento es de N 1 . en el (i+1)-ésimo intento, la población consta de N-i elementos, con lo cual si e no ha sido 1
seleccionado previamente, la probabilidad de que lo sea en este momento es de N
34
i.
Instituto Profesional Diego Portales AUTÓNOMO
Si consideramos una muestra de n N elementos, donde el orden en la elección de los mismos tiene importancia, la probabilidad de elección de una muestra M=(e1,e2,,,en) cualquiera es P[ M ]
P[(e1 , e2 ,.....,en )] P[e1 ] P[e2 ]
P[en / e1 ,e2 ,......,en 1 ]
1 1 N N 1 ( N n)! N!
N
1 (n 1)
lo que corresponde en el sentido de la definición de probabilidad de Laplace a un caso posible entre las VN,n posibles n-uplas de N elementos de la población. Si el orden no interviene, la probabilidad de que una muestra M={e1,e2,…en} E sea elegida es la suma de las probabilidades de elegir una cualquiera de sus n-uplas, tantas veces como permutaciones en el orden de sus elementos sea posible, es decir
P[ M ]
P[(e1 , e2 ,.....,en )] n! P[(e1 , e2 ,.....,en )] n! ( N n)! N!
2) Muestreo aleatorio con reposición Sobre una población E de tamaño N podemos realizar extracciones de n elementos, pero de modo que cada vez el elemento extraído es repuesto al total de la población. De esta forma un elemento puede ser extraído varias veces. Si el orden en la extracción de la muestra interviene, la probabilidad de una cualquiera de ellas, formada por n elementos es: 1 1 N N
1 N
35
1 Nn
Instituto Profesional Diego Portales AUTÓNOMO
Si el orden no interviene, la probabilidad de una muestra cualquiera, será la suma de la anterior, repitiéndola tantas veces como manera de combinar sus elementos sea posible. Es decir, sea n1 el número de veces que se repite cierto elemento e1 en la muestra; sea n2 el número de veces que se repite cierto elemento e2; sea nk el número de veces que se repite cierto elemento ek, de modo que n=n1+n2+…..nk.
El muestreo aleatorio con reposición es también denominado muestreo aleatorio simple, que como hemos mencionado se caracteriza por que: cada elemento de la población tiene la misma probabilidad de ser elegido, y las observaciones se realizan con reemplazamiento. De este modo, cada observación es realizada sobre la misma población (no disminuye con las extracciones sucesivas).
36
Instituto Profesional Diego Portales AUTÓNOMO
Tablas de números aleatorios: Lotería Nacional Un ejemplo de una tabla de números aleatorios consiste en la lista de los números de Lotería Nacional premiados a lo largo de su historia, pues se caracterizan por que cada dígito tiene la misma probabilidad de ser elegido, y su elección es independiente de las demás extracciones. Un modo de hacerlo es el siguiente. Supongamos que tenemos una lista de números aleatorios de k=5 cifras (00000-99.999), una población de N=600individuos, y deseamos extraer una muestra de n=6 de ellos. En este caso ordenamos a toda la población (usando cualquier criterio) de modo que a cada uno de sus elementos le corresponda un número del 1 al 600. En segundo lugar nos dirigimos a la tabla de números aleatorios, y comenzando en cualquier punto extraemos un número t, y tomamos como primer elemento de la muestra al elemento de la población:
1
t N 10 k
1
t 600 100 .000
El proceso se repite tomando los siguientes números de la tabla de números aleatorios, hasta obtener la muestra de 10 individuos. Las cantidades
u
t 10 k
pueden ser consideradas como observaciones de una v.a. U, que sigue una distribución uniforme en el intervalo [0,1]
37
Instituto Profesional Diego Portales AUTÓNOMO
Método de Montecarlo El método de Montecarlo es una técnica para obtener muestras aleatorias simples de una v.a. X, de la que conocemos su ley de probabilidad (a partir de su función de distribución F). Con este método, el modo de elegir aleatoriamente un valor de X siguiendo usando su ley de probabilidad es: 1. Usando una tabla de números aleatorios se toma un valor u de una v.a. U~U(0,1). 2. Si X es continua tomar como observación de X, la cantidad x=F-1(u). En el caso en que X sea discreta se toma x como el percentil 100* de X, es decir el valor más pequeño que verifica que F(x)
.
Este proceso se debe repetir n veces para obtener una muestra de tamaño n.
Ejemplo Si queremos extraer n=10 muestras de una distribución N(0,1) podemos recurrir a una tabla de números aleatorios de k=5 cifras, en las que observamos las cantidades (por ejemplo)
t ~ 76.293 , 31.776, 50.803, 71.153, 33.717 , 17.979, 52.125, 41.330, 95.141
A partir de ellas podemos obtener una muestra de X~N(0,1) usando una tabla de la distribución normal: Números aleatorios Muestra U(0,1) Muestra N(0,1) ti 10 5
xi = F-1(ui)
ti
ui
76.293
0'76
0'71
31.776
0'32(=1-0'68)
-0'47
50.803
0'51
0'03
71.153
0'71
0'55
20.271
0'20(=1-0'80)
-0'84
33.717
0'34(=1-0'66)
-0'41
38
Instituto Profesional Diego Portales AUTÓNOMO
17.979
0'18(=1-0'82)
-0'92
52.125
0'52
0'05
41.330
0'41(=1-0'59)
-0'23
95.141
0'95
1'65
Obsérvese que como era de esperar, las observaciones xi tienden a agruparse alrededor de la esperanza matemática deXi~N( =0, la muestra sea necesariamente x
2
=1). Por otra parte, esto no implica que el valor medio de
0 . Sin embargo como sabemos por el teorema de Fischer que
10
X
Xi ~ N
x
0,
i 1
2 x
1 10
su dispersión con respecto al valor central es pequeña, lo que implica que probablemente el valor medio
estará muy próximo a 0, como se puede calcular:
x
1 (0,71 ...... 1,65) 10
0,012
Obsérvese que si el problema fuese el inverso, donde únicamente conociésemos las observaciones xi y que el mecanismo que generó esos datos hubiese sido una distribución normal de parámetros desconocidos, con x obtenida hubiésemos tenido una buena aproximación del ``parámetro desconocido''
. Sobre esta cuestión volveremos más adelante al abordar el
problema de la estimación puntual de parámetros.
39
Instituto Profesional Diego Portales AUTÓNOMO
MUESTREO ESTRATIFICADO
Muestreo aleatorio estratificado Un muestreo aleatorio estratificado es aquel en el que se divide la población de N individuos, en k subpoblaciones o estratos, atendiendo a criterios que puedan ser importantes en el estudio, de tamaños respectivos N1, ..., Nk, y realizando en cada una de estas subpoblaciones muestreos aleatorios simples de tamaño ni. A continuación nos planteamos el problema de cuantos elementos de muestra se han de elegir de cada uno de los estratos. Para ello tenemos fundamentalmente dos técnicas: la asignación proporcional y la asignación óptima Ejemplo Supongamos que realizamos un estudio sobre la población de estudiantes de una Universidad, en el que a través de una muestra de 10 de ellos queremos obtener información sobre el uso de barras de labios. En primera aproximación lo que procede es hacer un muestreo aleatorio simple, pero en su lugar podemos reflexionar sobre el hecho de que el comportamiento de la población con respecto a este carácter no es homogéneo, y atendiendo a él, podemos dividir a la población en dos estratos: Estudiantes masculinos (60% del total); Estudiantes femeninos (40% restante). de modo que se repartan proporcionalmente ambos grupos el número total de muestras, en función de sus respectivos tamaños (6 varones y 4 mujeres). Esto es lo que se denomina asignación proporcional.
40
Instituto Profesional Diego Portales AUTÓNOMO
Si observamos con más atención, nos encontramos (salvo sorpresas de probabilidad reducida) que el comportamiento de los varones con respecto al carácter que se estudia es muy homogéneo y diferenciado del grupo de las mujeres. Por otra parte, con toda seguridad la precisión sobre el carácter que estudiamos, será muy alta en el grupo de los varones aunque en la muestra haya muy pocos (pequeña varianza), mientras que en el grupo de las mujeres habrá mayor dispersión. Cuando las varianzas poblacionales son pequenãs, con pocos elementos de una muestra se obtiene una información más precisa del total de la población que cuando la varianza es grande. Por tanto, si nuestros medios sólo nos permiten tomar una muestra de 10 alumnos, será más conveniente dividir la muestra en dos estratos, y tomar mediante muestreo aleatorio simple cierto número de individuos de cada estrato, de modo que se elegirán más individuos en los grupos de mayor variabilidad. Así probablemente obtendríamos mejores resultados estudiando una muestra de: 1 varón. 9 hembras. Esto es lo que se denomina asignación óptima
Asignación proporcional Sea n el número de individuos de la población total que forman parte de alguna muestra: n=n1,n2,…,nk Cuando la asignación es proporcional el tamaño de la muestra de cada estrato es proporcional al tamaño del estrato correspondiente con respecto a la población total:
ni
n
41
Ni N
Instituto Profesional Diego Portales AUTÓNOMO
Asignación óptima Cuando se realiza un muestreo estratificado, los tamaños muestrales en cada uno de los estratos, ni, los elige quien hace el muestreo, y para ello puede basarse en alguno de los siguientes criterios: Elegir los ni de tal modo que se minimice la varianza del estimador, para un coste especificado, o bien, habiendo fijado la varianza que podemos admitir para el estimador, minimizar el coste en la obtención de las muestras. Así en un estrato dado, se tiende a tomar una muestra más grande cuando: El estrato es más grande; El estrato posee mayor variabilidad interna (varianza); El muestreo es más barato en ese estrato. Para ajustar el tamaño de los estratos cuando conocemos la dispersión interna de cada uno de los mismos, tenemos el siguiente resultado:
Muestreo sistemático Cuando los elementos de la población están ordenados en fichas o en una lista, una manera de muestrear consiste en Sea k=N/n ; Elegir aleatoriamente un número m, entre 1 y k; Tomar como muestra los elementos de la lista: em , em k , em
42
2k
,..., em
( n 1) k
Instituto Profesional Diego Portales AUTÓNOMO
Esto es lo que se denomina muestreo sistemático. Cuando el criterio de ordenación de los elementos en la lista es tal que los elementos más parecidos tienden a estar más cercanos, el muestreo sistemático suele ser más preciso que el aleatorio simple, ya que recorre la población de un modo más uniforme. Por otro lado, es a menudo más fácil no cometer errores con un muestreo sistemático que con este último.
Observación El método tal como se ha definido anteriormente es sesgado si N/n no es entero, ya que los últimos elementos de la lista nunca pueden ser escogidos. Un modo de evitar este problema consiste en considerar la lista como si fuese circular (el elemento N+1 coincide con el primero) y: Sea k el entero más cercano a N/n; Se selecciona un número al azar m, entre 1 y N; Se toma como muestra los elementos de la lista que consisten en ir saltando de k elementos en k, a partir de m, teniendo en cuenta que la lista es circular. Se puede comprobar que con este método todos los elementos de la lista tienen la misma probabilidad de selección.
Muestreo por conglomerados Si intentamos hacer un estudio sobre los habitantes de una ciudad, el muestreo aleatorio simple puede resultar muy costoso, ya que estudiar una muestra de tamaño n implica enviar a los encuestadores a npuntos distintos de la misma, de modo que en cada uno de ellos sólo se realiza una entrevista. En esta situación es más económico realizar el denominado muestreo por conglomerados, que consiste en elegir aleatoriamente ciertos barrios dentro de la ciudad, para después elegir calles y edificios. Una vez elegido el edificio, se entrevista a todos los vecinos.
43
Instituto Profesional Diego Portales AUTÓNOMO
Teorema central del límite Si X es la media de una muestra aleatoria de tamaño n tomada de una población con media varianza
Z
2
X
y
, entonces la variable:
n
tiene distribuci ón normal estándar ( N(0,1)) siempre que n
, (n
30 )
Ejemplo Una empresa eléctrica fabrica focos que tienen una duración que se distribuye aproximadamente en forma normal, con media 800 horas y desviación estándar 40 horas. Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de 775 horas.
Solución Como la distribución de los focos es aproximadamente normal, que n=16 sea menor que treinta no es relevante para el problema. Luego
Z
X
n
(775 800 ) 16 40
por lo tanto P( X
775 )
P( Z
2.5)
0.0062
La probabilidad de que un foco dure menos de 775 horas es 0.0062.
44
2.5
Instituto Profesional Diego Portales AUTÓNOMO
Teorema ( distribución de la media muestral) Sea x1,x2,…..x2 una muestra aleatoria de una variable aleatoria X que se distribuye normal con media
y varianza
2
entonces:
2
X ~N
,
n
Z
(X
) n n
~ N (0,1)
Ejemplo Si una muestra aleatoria de tamaño 20 de una población normal con media 64,3 y varianza 225. Encuentre la probabilidad de que la media muestral sea mayor que 68.
Solución
P( x
68) 1 P( x 1 P z 1 P( z
68) (68 64,3) 20 15 1.10) 1 0.8643 0.1357
Luego la probabilidad de la media muestral sea mayor que 68 es 0.1357.
45
Instituto Profesional Diego Portales AUTÓNOMO
EJERCICIOS AUTO EVALUATIVOS Nº 4
1) La vida media de una máquina para hacer pasta es de siete años, con una desviación estándar de un año. Suponga que las vidas de estas máquinas siguen aproximadamente una distribución normal, encuentre:
a) La probabilidad de que la vida media de una muestra aleatoria de nueve de estas máquinas caiga entre 6.4 y 7.2 b) El valor de x a la derecha del cual caería el 15% de las medias calculadas de muestras aleatorias de tamaño 9.
2) El tiempo que el cajero de un banco con servicio en el automóvil atiende a un cliente es una variable aleatoria con media 3.2 minutos y una desviación estándar de 1.6 minutos. Si se observa una muestra aleatoria de de 64 clientes encuentre la probabilidad de que su tiempo medio con el cajero sea:
a) a lo más 2.7 minutos b) más de 3.5 minutos c) entre 3.2 y 3.4 minutos.
46
Instituto Profesional Diego Portales AUTÓNOMO
SOLUCIONES EJERCICIOS AUTO EVALUATIVOS Nº 4
1) a) 0.6898 b) 7.35
2) a) 0.0062 b) 0.0668 c) 0.3413
47
Instituto Profesional Diego Portales AUTÓNOMO
Inferencia estadística
La teoría de inferencia estadística consiste en aquellos métodos con los cuales se pueden realizar inferencias o generalizaciones acerca de una población.
La inferencia estadística se divide en dos áreas: a) Estimación de parámetros b) Pruebas de hipótesis
ESTIMACION DE PARAMETROS Los parámetros a estudiar son parámetros poblacionales como la media y la varianza.
Si
es un parámetro desconocido, entonces
ˆ
será su estimador.
2 y s es un estimador de
Así , x es un estimador de
2
si ellos cumplen con la propiedad de
insesgamiento.
Definición Se dice que un estadístico
De esta forma :
ˆ
es un estimador insesgado del parámetro
a) E ( x ) b) E( s 2 )
2
2 Nota : La letra E simboliza Esperanza o Valor Esperado para x y s .
48
ˆ si y sólo si E ( )
.
Instituto Profesional Diego Portales AUTÓNOMO
ESTIMACION POR INTERVALOS
Una estimación por intervalo de un parámetro poblacional ˆ
1
ˆ
2
, donde
ˆ
1
y
distribución muestral de
ˆ
ˆ
2
dependen del valor de
ˆ
ˆ
es un intervalo de la forma
para una muestra particular y también de la
. ˆ
Basado en la distribución muetral de
ˆ ˆ se puede determinar si el intervalo ( 1 , 2 ) con una
probabilidad dada contiene realmente el parámetro que se supone va estimar. Esto es : P ( ˆ1
ˆ ) 1 2
donde 0
1.
ˆ ˆ El intervalo ( 1 , 2 ) calculado de una muestra particular se llama intervalo de confianza del
(1
)100 % , la fracción (1
nivel de confianza y los puntos
) se denomina coeficiente de confianza, grado de confianza, o ˆ
1
y
ˆ
2
se llaman límites de confianza.
Por ejemplo:
a) Si b) Si
0.05, entonces se tiene un intervalo de confianza del 95 %. 0.01, entonces el intervalo de confianza es del 99 %.
49
Instituto Profesional Diego Portales AUTÓNOMO
A) Intervalo de confianza para la media ( ) de una población normal
A1) Se conoce su varianza
2
X ~N Sabemos que si X es una variable aleatoria de una poblacion normal, entonces: luego la variable : Z
P( Z1
Z
P( Z
Z2 )
P( Z
Z1 )
Luego : Z 2 Z1
Z2 )
(x
) n
~ N(0,1)
1 1
2 2 Z
1
2
por construcción
1
2
Z
pero Z1
Z2
2
Luego : Z1
Así, P(Z 1
Z 1
Z
2
Z2 ) 1
50
,
n
Instituto Profesional Diego Portales AUTÓNOMO
De esta forma, reemplazando en esta expresión, los valores de Z, Z1 y Z2 obtenidos anteriormente se tiene:
P
(x
Z 1
P
) n
1 1
(x
Z 1
Z
2
)
2
Z
1 1
2
2
n P
Z 1
P
x Z
1
2
Z 1
Z 1
P x
x
n
2
n
2
n
x
Z
1
1
x
n
2
Z 1
2
1
n
2
1
n
Definición Si x es la media de una muestra aleatoria de tamaño n de una población normal con varianza pobalcional poblacional
2
conocida, entonces un intervalo de confianza del (1- )100% para la media
está dado por:
x
Z 1
2
n
,x
Z 1
2
n
Ejemplo : Si una muestra aleatoria de tamaño 20 de una población normal con varianza 225 tiene una media muestral de 64.3. Construya un intervalo de confianza del 95% para
51
.
Instituto Profesional Diego Portales AUTÓNOMO
Solución
(1 )100% n 20 2
x
95%
225 64.3
0.05
15
reemplazando, estos valores en el intervalo se tiene:
64.3 Z
15 0.05 1 2
64.3 (1.96)
,64.3 Z
20 15 20
15 0.05 1 2
,64.3 (1.96)
20 15
57.7,70.9
20
así con una confianza del 95% el verdadero valor de la media poblacional
se encuentra en el
intervalo : (57.7,70.9).
ESTIMACION DEL ERROR
Teorema Si se usa x como estimación de
, se puede tener una confianza del (1- )100% de que el error
no excederá de : e
Z 1
2
n
En el ejemplo anterior: Z 1
Z 0.975 2
1.96
e
(1.96 )
15 20
6.57
52
Instituto Profesional Diego Portales AUTÓNOMO
así con una confianza de 95% , el error de estimar unidades, es decir :
x
6.57
a través de x no será mayor que 6.57
.
TAMAÑO MUESTRAL ADECUADO
Teorema Con una confianza del (1- )100% , el tamaño muestral adecuado (n) para que la diferencia entre
xy
no sea mayor que una cantidad específica e está dado por : 2
Z 1
n
2
e
Ejemplo: ¿ Que tan grande se require que sea la muestra del ejemplo (1) para que el error de estimar
a
través de x no sea mayor que 0.05 ? utilice una confianza del 95%. Sol e
0.05 ; (1 - )
0.95
0.05 así Z 1-
15 por lo tanto n
1.96 (15 ) 0.05
α 2
Z 0.975
1.96
2
345 .744
Luego con una confianza del 95% el tamaño muestral adecuado para que error de estimar
de
x no sea mayor que 0.05 es de n=346 unidades aproximadamente.
Observación Todo lo anterior también es aplicable a poblaciones no normales con varianza conocida cuando n>30.
53
Instituto Profesional Diego Portales AUTÓNOMO
EJERCICIOS AUTO EVALUATIVOS Nº 5
1) Las medidas de los diámetros de los rodamientos tiene una desviación estándar de de 0.042 cm. Se selecciona una muestra aleatoria de 200 rodamientos producidas por una máquina en una semana, los diámetros dieron una media de 0.824 cm. Hallar un intervalo de confianza del 95% y 99% para el verdadero diámetro promedio de los rodamientos.
2) Suponga que la duración de un componente tiene distribución normal con media
y
varianza 9. Se prueban 20 componentes y se anotan sus tipos de fallas x1,x2,x3…..x20. Suponga además que la media de la muestra es de 100.9 horas. Obtener un intervalo de confianza del 99% para la verdadera duración promedio
de todos los componentes.
3) Se administra un test estándar a una numerosa clase de estudiantes. La puntuación media de una muestra de 100 estudiantes es de 75 puntos. Suponga que la varianza admitida de las puntuaciones para este test es de 2500 puntos. Hallar: a) Intervalo de confianza del 98% para la verdadera puntuación media
de los
estudiantes. b) Límite superior del intervalo de confianza del 95% para c) Límite inferior del intervalo de confianza del 90% para
4) Al medir el tiempo de reacción de una persona, un psicólogo estima que la desviación estándar es de 0.05 segundos. ¿ De que tamaño ha de tomarse una muestra de medidas para tener una confianza del 95% y 99% de que el error de estimar mayor que 0.01 segundos ?
54
a través de x no sea
Instituto Profesional Diego Portales AUTÓNOMO
SOLUCIÓN EJERCICIOS AUTO EVALUATIVOS Nº 5
1) 95%
(0.8182 , 08298)
99%
(0.816 , 0.8316)
2) (99.17 , 102.63)
3) a) (63.35 , 86.65) b) (84.8) c) 66.775
4) 95%
n=96.04
97
99%
55
n=116.4
167
Instituto Profesional Diego Portales AUTÓNOMO
A2) Si no se conoce su varianza Sabemos que si x1,x2,……..xn una muestra aleatoria de una variable aleatoria X~N( , 2) con desconocida entonces el estadístico: T
(x
) n s
tiene distribuci ón t - student con v
n 1 grados de libertad .
donde n es el tamaño de la muestra y s es la desviación estándar de la muestra .
La función de densidad t-student gráficamente es similar a la función de densidad normal.
Su función de distribución acumulada como ya sabemos se encuentra tabulada. El parámetro que caracteriza a la t-student se conoce como grados de libertad.
56
2
Instituto Profesional Diego Portales AUTÓNOMO
P(t1
P
T
t2 ) 1 x
t
s
2
t
1 2
n s
P x t
n
2
s
x t 2
1
n
Definición Si x es la media de una muestra aleatoria de tamaño n de una población normal con varianza conocida, entonces un intervalo de confianza del (1- )100% para s
x t 2
n
está dado por:
s
, x t
n
2
Ejemplo Un fabricante de pintura quiere determinar el tiempo de secado promedio para una nueva pintura para pared interior. Si para una prueba de 12 áreas de igual tamaño se obtiene un tiempo medio de secado de 66.3 minutos y una desviación estándar de 8.4 minutos. Construya un intervalo de confianza del 95% para
el verdadero tiempo de secado promedio de las paredes si el tiempo
de secado tiene distribución normal. Solución n 12 x s
n - 1 11
66.3 por otro lado :1 8.4
0.95
0.05
2
así el intervalo de confianza está dado por :
66.3 - (2.201)
8.4 12
, 66.3 (2.201)
8.4 12
61;71.6
57
0.025
t 2
,n 1
t 0.025,11
2.201
Instituto Profesional Diego Portales AUTÓNOMO
Así un intervalo de confianza del 95% para el verdadero tiempo de secado promedio de las paredes se encuentra en el intervalo (61; 71.6) minutos.
Teorema Si se usa x como estimación de
, se puede tener una confianza del (1- )100% de que el error
no excederá de : e
s
t 2
n
Ejemplo: En el ejemplo anterior: t
2.201 , s
8.4 ,
n
12 por lo tanto : e
(2.201 )
2
De esta forma, para la muestra de tamaño 12 x difiere de
x
8.4 12
5.34
en 5.34 minutos, es decir:
5.34 minutos.
TAMAÑO MUESTRAL ADECUADO
Teorema Con una confianza del (1- )100% , el tamaño muestral adecuado (n) para que la diferencia entre
xy
no sea mayor que una cantidad específica e está dado por :
t s n
2
2
e
58
Instituto Profesional Diego Portales AUTÓNOMO
Ejemplo:
En el ejemplo del fabricante de pintura, determine el tamaño de muestra adecuado para que el a través de x no sea mayor que 0.25 minutos.
error de estimar
n
2.201(8.4) 0.25
2
5469
Es decir para que el error no sea mayor que 0.25 se debe tomar una muestra de 5469 áreas.
59
Instituto Profesional Diego Portales AUTÓNOMO
EJERCICIOS AUTO EVALUATIVOS Nº 6
1) Se van a realizar durante un mes pruebas de mercado de un nuevo instrumento, en determinadas tiendas de de una ciudad. Los resultados para una muestra de 16 tiendas señalaron ventas promedio de $ 12.000 con una desviación estándar de $ 180. Encuentre un intervalo de confianza del 99% para las ventas promedio reales de este nuevo instrumento. Suponga distribución normal.
2) Suponga que se hacen 20 mediciones sobre la resistencia de cierto tipo de alambre. La media de la muestra es 10.48 ohms y la desviación estándar 1.36 ohms. Obtener un intervalo de confianza de un 99% para la resistencia promedio real si ellas se distribuyen normalmente.
3) Una muestra aleatoria de 100 propietarios de automóviles indica que, en el estado XX, un automóvil recorre un promedio de 23.500 Km por año con una desviación estándar de 3.900 Km. Determine un intervalo de confianza del 98% para la cantidad promedio de Km que un automóvil recorre anualmente en el estado XX. Suponga distribución normal.
4) Una muestra aleatoria de 8 cigarros de una marca determinada tiene un contenido promedio de nicotina de 2.6 milígramos y una desviación estándar de 0.9 milígramos. a) Determine un intervalo de confianza del 95% para el contenido promedio de real de nicotina en esta marca de cigarros en particular, si se sabe que la distribución de los contenidos de nicotina son normales. b) Determine el tamaño muestral adecuado para que el error de estimar de x no sea mayor que 0.05 con una confianza del 99%
60
a través
Instituto Profesional Diego Portales AUTÓNOMO
SOLUCIÓN EJERCICIOS AUTO EVALUATIVOS Nº 6
1) (11867,385 ; 12132,615)
2) (9.61 ; 11.35)
3) (22578,04 ; 24421,96)
4) a) (1,847 ; 3.353)
b) n= 40 cigarros aproximadamente.
61
Instituto Profesional Diego Portales AUTÓNOMO
B) Intervalo de confianza para la varianza (
2
) de una población normal
Sabemos que si x1,x2,…….xn es una muestra aleatoria de X~N( , 2) con entonces el estadístico: X2
(n 1) s 2 2
tiene distribuci ón chicuadrado con v
Donde s2 es la varianza de la muestra.
62
(n 1) grados de libertad.
2
desconocida,
Instituto Profesional Diego Portales AUTÓNOMO
P X2 1
X2 2
P
1
2
(n 1) s 2
P X2 1
X2
X2
2 2
2
1 X2
1
(n 1) s
2
1
X2 1
2
P
1
2
(n 1) s 2 X2
2
2
(n 1) s 2 X2 1
2
1
2
Definición Si s2 es la varianza de una muestra aleatoria de tamaño n de una población normal, un intervalo 2
de confianza del (1- )100% para
está dado por:
( n 1) s 2 (n 1) s 2 ; X2 X2 2
donde X2
/2
y X21-
/2
1
2
son los valores de X2 con (n-1) grados de libertad, con áreas de /2 y
1- /2 respectivamente, a la derecha.
Ejemplo: 1) Determine un intervalo de confianza del 95% para la varianza de una muestra de 10 paquetes de semilla, si la varianza de la muestra es 0.286.
63
Instituto Profesional Diego Portales AUTÓNOMO
Solución:
1
100%
n s
10
2
95%
(n 1)
0.05
2
0.025
1
2
0.975
9
0.286
X2
19.023 ; X 2 1-
2
2.700 2
2
luego el intervalo de confianza para la varianza 9(0.286 ) 9(0.286 , 19 .023 2.700
queda dado por:
(0.135 ,0.953 )
así, con una confianza del 95% el verdadero valor de la varianza poblacional
2
se encuentra
en el intervalo (0.135,0.953).
2) Se obtiene una muestra aleatoria de 20 estudiantes con una media x 2 varianza s
72 puntos y una
16 en un exámen de Estadística. Suponga que las calificaciones tienen
distribución normal. Determine un intervalo de confianza del 98% para la varianza poblacional.
Solución (1
)100%
n
20
X
2
98%
0.02
2
0.01
1
2
0.99
(n 1) 19
36.191 ; X 2
2
1-
7.633 2
de esta manera el intervalo de confianza del 95% para la varianza 19 (16 ) 19 (16 ) ; 36 .191 7.633
2
está dado por:
(8.39;39 .82 )
luego con una confianza del 95% el verdadero valor de la varianza estudiantes se encuentra en el intervalo (8.39;39.82).
64
2
de las notas de los
Instituto Profesional Diego Portales AUTÓNOMO
EJERCICIOS AUTO EVALUATIVOS Nº 7
1) Un fabricante de baterías para automóvil asegura que sus baterías duran en promedio, 3 años con una desviacíon estándar de un año. Si 5 de estas baterías tienen una desviación estándar de 0.9028 años. Determine un intervalo de confianza del 95% para la varianza real. ¿ Es válida la afirmación del fabricante ? Suponga que la población de las duraciones de las baterías se distribuye aproximadamente normal.
2) Suponga que se hacen 20 mediciones sobre la resistencia de cierto tipo de alambre. La media de la muestra es de 10,48 ohms y la desviación estándar 1.36 ohms. Obtener un intervalo de confianza de un 95% para la varianza real si las resistencias se distribuyen normalmente.
3) Una muestra aleatoria de 25 cigarros de una cierta marca tiene un contenido promedio de nicotina de 1.3 milígramos y una desviación estándar de 0.17 milígramos. Encuentre un intervalo de confianza del 90% y 98% para la varianza real de esta derteminada marca de cigarros si se supone que las mediciones se distribuyen normalmente.
4) Una muestra aleatoria de 100 propietarios de automóviles indica que, en el estado XX, un automóvil recorre un promedio de 23.500 Km al año con una desviación estándar de 3.900 Km. Determine un intervalo de confianza del 99% para la varianza real de Km recorridos al año por los automóviles del estado XX.
65
Instituto Profesional Diego Portales AUTÓNOMO
SOLUCIÓN EJERCICIOS AUTO EVALUATIVOS Nº 7
1) (0.29; 6.79) La afirmación del fabricante es válida porque la varianza poblacional está dentro del intervalo que se determinó con una confianza del 95%.
2) (1.069; 3.949)
3) 90%
(0.019; 0.05)
98%
(0.016 ; 0.064)
4) ( 10741065.69 ; 22374294,2)
66
Instituto Profesional Diego Portales AUTÓNOMO
INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE DOS POBLACIONES
A) Intervalo de confianza para la diferencia de medias ( poblacionales
2 1
y
2 2
1
-
) con varianzas
2
conocidas
Si tenemos dos poblaciones normales con medias
1
y
2
y varianzas
1
2
y
2
2
, respectivamente,
el estadístico usado para la construcción de este intervalo está dado por:
z
( x1
x 2 ) (u1
u2 )
2 1
2 2
n1
n2
~ N (0,1) ( z tiene distribuci ón normal estándar)
Definición Si x1 y x 2 son las medias de muestras aleatorias independientes de tamaños n1 y n2 , respectivamente de poblaciones con varianzas conocidas de confianza del (1- )100% para (
( x1
x2 ) z
1
2
1- 2)
1
2
y
2
2
, respectivamente, un intervalo
está dado por:
2 1
2 2
n1
n2
; ( x1
67
x2 )
z 1
2
2 1
2 2
n1
n2
Instituto Profesional Diego Portales AUTÓNOMO
Ejemplo: Se lleva a cabo un experimento en que se comparan dos tipos de motores A y B. Se mide el rendimiento en millas por galón de gasolina. Se realizan 50 experimentos con el motor tipo A y 75 con el motor tipo B. La gasolina que se utiliza y las demás condiciones se mantienen constantes. El rendimiento promedio de gasolina para el motor A es de 36 millas por galón y el promedio para el motor B es 42 millas por galón. Encuentre un intervalo de confianza del 96 % para (
B- A),
donde
B
y
A son
el rendimiento de gasolina medio poblacional para los motores
B y A. Suponga que las deviaciones estándar poblacionales son seis y ocho para los motores A y B.
Solución
(1- )100%=96% z1-
/2
(1- )=0.96
= 0.04
/2 = 0.02
( 1- /2) = 0.98 . Por lo tanto:
= z0.98 = 2.05.
Por otro lado:
xB
xA
42 - 36
6,
2 B
8,
2 A
6 , además n A
50, n B
De esta forma un intervalo de confianza de 96% para (
6 - 2.05
64 75
36 64 ; 6 2.05 50 75
36 50
B- A)
75
está dado por:
3.43; 8.57
Podemos concluir que el rendimiento del motor B es mayor que el rendimiento del motor A.
68
Instituto Profesional Diego Portales AUTÓNOMO
B) Intervalo de confianza para la diferencia de medias ( poblacionales
2 1
y
2 2
1
-
2
) con varianzas
desconocidas pero iguales
Si tenemos dos poblaciones normales con medias
1
y
y varianzas poblacionales
2
1
2
y
2
2
,
desconocidas pero iguales, el estadístico usado para la construcción de este intervalo está dado por:
T
( x1
x2 ) ( 1 n1
sp
1
1 n2
2
)
tiene distribución t
student con v
n1
n2 - 2 grados de libertad
donde:
s 2p
(n1 1) s12 (n2 1)s22 en que s12 y s 22 son las varianzas muestrales. n1 n2 2
Definición Si x1 y x 2 son las medias de muestras aleatorias independientes de tamaños n1 y n2 , respectivamente, de poblaciones aproximadamente normales desconocidas, un intervalo de de confianza del (1- )100% para (
( x1
x2 ) t s p 2
donde t
/2
1 n1
1 ; ( x1 n2
x2 ) t s p 2
1 n1
con varianzas iguales pero 1- 2)
está dado por:
1 n2
es el valor de t que deja un área de /2 a derecha con v=n1+n2-2 grados de libertad.
69
Instituto Profesional Diego Portales AUTÓNOMO
Ejemplo: Se eligieron dos estaciones de muestreo independientes para un estudio sobre la descarga de ácido de una mína de uranio. Los registros de ambas estaciones se encuentran dados en la siguiente tabla:
Estación 1
Estación 2
n1= 12
n2= 10
x1 =3.11
x 2 =2.04
s1=0.771
s2=0.448
Encuentre un intervalode confianza del 90% para la diferencia entre las medias poblacionales de ambas estaciones. Suponga que las varianzas poblacionales son iguales pero desconocidas.
Solución
(1- )100%=90%
(1- )=0.90
= 0.1
/2 = 0.05. Por lo tanto: t /2=t0.05=1.725
Por otro lado:
x1
x2
3.11 - 2.04
1.07 , s12
0.771 , s 22
0.448 , además n1
12 , n2
10
De esta forma:
s 2p
(n1 1) s12 (n2 1)s22 n1 n2 2
(11)(0.7712 ) (9)(0.4482 ) 12 10 2
70
0.417
Instituto Profesional Diego Portales AUTÓNOMO
De esta forma un intervalo de confianza de 90% para ( 1- 2) está dado por:
1.07 - (1.725)(0.646)
1 1 1 1 ; 1.07 (1.725)(0.646) 12 10 12 10
0.593; 1.547
De esta forma podemos concluir que las decarga de uranio en la en la estación 1 es mayor que en la estación 2.
71
Instituto Profesional Diego Portales AUTÓNOMO
EJERCICIOS AUTO EVALUATIVOS Nº 8
1) Una muestra aleatoria de tamaño n1=25 que se toma de una población normal con una desviación estándar
1=5
tiene una media x1
80 . Una segunda muestra aleatoria de
tamaño n2=36, que se toma de una población normal diferente con una desviación estándar
2=3,
tiene una media x2
75 .Encuentre un intervalo de confianza del 95% para
1- 2.
2) Los estudiantes pueden elegir entre un curso de física sin laboratorio de tres semestreshora y un curso con laboratorio de 4 semestres-hora. El examen escrito final es el mismo para cada sección. Si 12 estudiantes de la sección con laboratorio tienen una calificación promedio en el exámen de 84 con una deviación estándar de 4, y 18 estudiantes de la sección sin laboratorio tienen una calificación promedio de 77 con una deviación estándar de 6, encuentre un intervalo de confianza del 99% para la diferencia entre las calificaciones promedio de los dos cursos. Suponga que las poblaciones se distribuyen de forma aproximadamente normal con varianzas iguales.
3) Los siguientes datos, registrados en días, representan el tiempo de recuperación para pacientes que se tratan al azar con uno de dos medicamentos para infecciones graves de la vegiga:
Medicamento 1
Medicamento 2
n1= 14
n2= 16
x1 =17
x 2 =19
s12 =0.771
s 22 =0.448
72
Instituto Profesional Diego Portales AUTÓNOMO
Encuentre un intervalo de confianza del 99% para la diferencia
1- 2
del tiempo promedio de
recuperación de los medicamentos. ¿Son iguales los tiempos de recuperación? Suponga poblaciones normales con varianzas poblacionales desconocidas pero iguales.
4) Una compañía de taxis trata de decidir si comprar neumáticos marca A o de la marca B para su flotilla de taxis. Para estimar la diferencia de las dos marcas, se lleva a cabo un experimento utilizando 12 de cada marca. Los neumáticos se utilizan hasta que se gastan. Los resultados son:
Marca A
Marca B
n1= 12
n2= 12
x1 =36,300 kilómetros
x 2 =38,100 kilómetros
s1 =5000 kilómetro
s 2 =6100 kilómetros
Calcule un intervalo de confianza del 95% para
1- 2
, suponga que las poblaciones se
distribuyen de forma aproximadamente normal. Suponga varianzas iguales pero desconocidas. ¿ Existe diferencia entre las dos marcas de neumáticos ?
73
Instituto Profesional Diego Portales AUTÓNOMO
SOLUCIONES EJERCICIOS AUTO EVALUATIVOS Nº 8
1)
1- 2
[2.9 , 7.1]
2)
1- 2
[1.5 , 12.5]
3)
2- 1
[0.7 , 3.3] . El tiempo de recuperación del medicamento 2 es mayor que el tiempo
de recuperación del medicamento 1
4)
1- 2
[-6522 , 2922] . El cero pertenece este intervalo luego
cero, es decir:
1- 2
=0
1
=
2
1- 2
puede ser igual a
, luego no existen diferencias entre los dos marcas
neumáticos.
74
Instituto Profesional Diego Portales AUTÓNOMO
ASIGNATURA ESTADÍSTICA TERCERA UNIDAD PRUEBAS DE HIPÓTESIS
CONTENIDO DE LA UNIDAD TEMÁTICA
3.1
Pruebas de hipótesis para diferencia de media con variancias conocidas.
3.2
Pruebas de hipótesis para diferencia de media con variancias desconocidas pero iguales.
3.3
Pruebas de hipótesis para la varianza de una población normal.
75
Instituto Profesional Diego Portales AUTÓNOMO
PRUEBAS DE HIPOTESIS Son procedimientos de decisión basados en datos que puedan producir una conclusión acerca de algún sistema científico. Una hipótesis estadística es una afirmación o conjetura acerca de una o más poblaciones. No es posible saber con absoluta certeza la verdad o falsedad de una hipótesis estadística, pues para ello habría que trabajar con toda la población. En la práctica se toma una muestra aleatoria de la población de interés y se utilizan los datos que contiene tal muestra para proporcionar evidencias que confirmen o no la hipótesis. Si la evidencia de la muestra es inconsistente con la hipótesis planteada, entonces ésta se rechaza y si la evidencia apoya a la hipótesis planteada, entonces se acepta ésta. La aceptación de una hipótesis implica tan sólo que los datos no proporcionan evidencia suficiente para refutarla. Por otro lado, el rechazo implica que la evidencia de la muestra la refuta. La estructura de una prueba de hipótesis consiste en la formulación de una hipótesis nula , es decir, cualquier hipótesis que se desee probar se denota por H 0 . El rechazo de H 0 , genera la aceptación de una hipótesis alternativa , que se denota por H1 . Una hipótesis nula referente a un parámetro poblacional siempre debe establecerse de manera que especifique un valor exacto del parámetro, mientras que la hipótesis alternativa admite la posibilidad de varios valores. Por ejemplo: H : 20 H0 : 20 H : 20 1) 0 2) 3) 0 H1 : 20 H1 : 20 H1 : 20 En la hipótesis alternativa se plantea usualmente la que se cree verdadero y en la hipótesis nula lo que se desea rechazar. Para tomar una desición acerca de un parámetro es necesario una prueba estadística para cuantificar esta decisión. Esto se logra al establecer primero la distribución muestral que sigue la muestra estadística ( es decir, la media ) y después calcular la prueba estadística apropiada. Esta prueba estadística mide que tan cerca de la hipótesis nula se encuentra el valor de la muestra. La prueba estadística suela seguir una distribución estadística conocida ( normal, t-student, ji cuadrado). La distribución apropiada de la prueba estadística se divide en dos regiones: a) región de rechazo ( región crítica) 76
Instituto Profesional Diego Portales AUTÓNOMO
b) región de no rechazo Si la prueba estadística cae en la región de no rechazo no se puede rechazar la hipótesis nula y si cae en la región de rechazo, se rechaza la hipótesis nula. Pare decidir con relación a la hipótesis nula, primero se tiene que determinar el valor crítico para la distribución estadística de interés. El valor crítico separa la región de rechazo de la región de no rechazo. región de no rechazo
región de rechazo valor crítico
Errores al realizar una prueba de hipótesis Al utilizar una muestra para obtener conclusiones sobre una población existe el riesgo de llegar a una conclusión incorrrecta. Pueden ocurrir dos errores diferentes: 1) Error tipo I consiste en rechazar H O cuando ésta es verdadera 2) Error tipo II consiste en aceptar H 0 cuando ésta es falsa
Al probar cualquier hipótesis estadística, existen cuatro posibles situaciones que determinan si la desición es correcta o equivocada.
Se acepta H0 Se rechaza H0
H0 es verdadera Desición correcta Error tipo I
H0 es falsa Error tipo II Desición correcta
La probabilidad de cometer error tipo I, es decir, rechazar H0 cuando es verdadera, se denomina nivel de significación y se denota por . P( error tipo I)= La probabilidad de no cometer error tipo I, es decir, aceptar H0 cuando es verdadera, se denota por 1 . P( error tipo I)c = 1 La probabilidad de cometer error tipo II, es decir, aceptar H0 cuando es falsa, se representa por . P(error tipo II)= La probabilidad de cometer error tipo II, es decir, rechazar H0 cuando es falsa, se denomina potencia de la prueba y se denota por 1 . P(error tipo I)c= 1
77
Instituto Profesional Diego Portales AUTÓNOMO
El ideal al rechazar una prueba de hipótesis es determinar los procedimientos o reglas que conduzcan a maximizar la potencia de una prueba, para fijo. se suele especificar antes de tomar una muestra, es frecuente que
0.05 o
0.01
Esquema para realizar una prueba de hipótesis acerca de un parámetro 1) Plantear la hipótesis nula y la hipótesis alternativa.
a)
H0 :
1
H1 :
1
b)
H0 :
1
H1 :
1
c)
H0 :
1
H1 :
1
2) Seleccionar el test estadístico o estadístico de prueba. 3) Fijar
(0.05; 0.01; 0.10)
4) Construir la regla de decisión o región crítica con el valor elegido
.
5) Extraer una muestra aleatoria de tamaño n y calcular el valor del test estadístico. 6) Si el valor calculado del test estadístico cae en la región crítica rechazar H0 , en caso contrario no rechazar H0 y concluir que la muestra aleatoria no proporciona evidencia para rechazarla.
Pruebas de una y de dos colas Una prueba de hipótesis será de una cola en los siguientes casos: a)
b)
c)
d)
H0 :
1
H1 :
1
H0 :
1
H1 :
1
H0 :
1
H1 :
1
H0 :
1
H1 :
1
78
Instituto Profesional Diego Portales AUTÓNOMO
Una prueba de hipótesis será de dos colas si :
H0 :
1
H1 :
1
(
1
1
)
Pruebas de hipótesis 1) Para la media
si la varianza (
2
) es conocida 2
Recuerde que si X ~ N
,
2
, entonces X ~ N
,
n
. Luego el estadístico usado para
contrastar estas hipótesis está dado por: z
(x
) n
~ N(0,1)
a) Prueba de hipótesis de una cola
i) H 0 : u H1 : u
u1 (u
u1 )
u1
En este caso La región crítica o región de rechazo de H0 está dada por: RC
z/z
z1
Gráficamente:
79
Instituto Profesional Diego Portales AUTÓNOMO
ii) H 0 : u H1 : u
u1 (u
u1 )
u1
En este caso la región crítica o región de rechazo de H0 está dada por: RC
z/z
z
Gráficamente:
b) Prueba de hipótesis de dos colas
H0 : u
u1
H1 : u
u1
En este caso la región crítica o región de rechazo de H0 está dada por: RC
z/z
z 1
ó z
z 1
2
Gráficamente:
80
2
Instituto Profesional Diego Portales AUTÓNOMO
Ejemplos 1) Considere la hipótesis nula de que el peso promedio de los estudiantes de un cierto instituto es de 68 kilos contra la hipótesis alternativa de que es diferente de 68 kilos. Suponga que los pesos se distribuyen normalmente con una desviación estándar de 3.6 kilos. Se elige una muestra aleatoria de 36 estudiantes y se obtiene un peso promedio de 67.5 kilos. Utilice un nivel de significancia =0.05. Solución:
H0 : u
68
H1 : u
68
0.05
z 1
n
36
z0.975
1.96
2
x
67 .5
3.6
z
(67 .5 68 ) 36 3.6
0.83
Así la región crítica o región de rechazo de H0 queda dada por:
RC
z/z
1.96 ó z 1.96
Por lo tanto z RC . Luego con base en la muestra no es posible decidir si el peso promedio de los estudiantes del instituto es distinto de 68 kilos.
2) Una muestra aleatoria de 100 muertos registrados en Chile durante el año pasado mostró una vida promedio de 71.8 años. Suponiendo una desviación estándar poblacional de 8.9 años. ¿ Parecería esto indicar que la vida promedio hoy en día es mayor que 70 años ? Utilice un nivel de significancia
=0.05.
81
Instituto Profesional Diego Portales AUTÓNOMO
Solución:
n
H0 : u
70
H1 : u
70
0.05
z1
100
x
z0.95
1.64
71 .8
8.9
z
(71 .8 70 ) 100 8.9
2.022
Así la región crítica o región de rechazo de H0 queda dada por: RC
z/z
1.64
Por lo tanto z RC . Luego con base en la muestra podemos decir que la vida promedio hoy en día supera los 70 años.
3) Un fabricante de equipo deportivo ha desarrollado un nuevo sedal sintético para pesca que se considera tiene una resistencia a la ruptura de 8 kilógramos con una desviación estándar de 0.5 kilógramos. Pruébese la hipótesis de que =8 Kg ,en contraposición a la alternativa de que
8 Kg , si se toma una muestra aleatoria de 50 sedales y se encuentra
que tiene una resistencia promedio a la ruptura de 7.8 Kg. Utilice un nivel de significancia =0.01. Solución:
H0 : u
8
H1 : u
8
0.01
z 1
n
50
x
z0.995
2.57
2
7.8
0.5
z
(7.8 8) 50 0.5
82
2.83
Instituto Profesional Diego Portales AUTÓNOMO
Así la región crítica o región de rechazo de H0 queda dada por: RC
Por lo tanto z 8 Kg.
z/z
2.57 ó z
2.57
RC . Luego se rechaza H0 , por lo tanto la resistencia a la ruptura es distinta de
83
Instituto Profesional Diego Portales AUTÓNOMO
EJERCICIOS AUTO EVALUATIVOS Nº 9
1) Una empresa eléctrica fabrica focos que tienen una duración que está distribuída en forma aproximadamente normal con media 800 horas y una desviación estándar de 40 horas. Pruebe la hipótesis de que
= 800 horas en contraposición de la alternativa de que
800 horas. Si una muestra aleatoria de 30 focos tiene una duración promedio de 788 horas. Utilice un nivel de significancia de 0,04. 2) Un fabricante de cigarros afirma que el contenido promedio de nicotina no excede de de 3,5 milígramos , con una desviación estándar de 1,4 milígramos. Para una muestra aleatoria de 8 cigarros se tiene un contenido promedio de nicotina de 4,2 milígramos ¿Está de acuerdo con la afirmación del fabricante? Use un nivel de significancia =0,05.
84
Instituto Profesional Diego Portales AUTÓNOMO
SOLUCIÓN EJERCICIOS AUTO EVALUATIVOS Nº 9
1) Se acepta H0 , es decir, los focos tienen una duración promedio de 800 horas.
2) Se acepta H0, es decir, es correcta la afirmación del fabricante.
85
Instituto Profesional Diego Portales AUTÓNOMO
2) Para la media ( μ ) con varianza poblacional ( Recordemos que si
2
2
) desconocida
es desconocida se usa s 2 y por lo tanto el adecuado para
contrastar estas hipótesis está dado por:
t
(x μ ) n se distribuye t-student con v=n-1 grados de libertad, donde s es la s
desviación estándar de la muestra.
a) Pruebas de hipótesis de una cola
i)
H0 : μ H1 : μ
μ1 μ1
(μ
μ1 )
La región crítica o región de rechazo de H0 está dada por:
RC
t /t
t(
,n 1)
Gráficamente:
86
Instituto Profesional Diego Portales AUTÓNOMO
ii)
H0 :
1
H1 :
1
(
1
)
La región crítica o región de rechazo de H0 está dada por: RC
t /t
t(
, n 1)
Gráficamente:
b) Pruebas de hipótesis de dos colas
H0 : u
u1
H1 : u
u1
En este caso la región crítica o región de rechazo de H0 está dada por:
RC
t /t
t
ó t 2
t 2
87
Instituto Profesional Diego Portales AUTÓNOMO
Gráficamente:
Ejemplos:
1) Una compañía de electricidad ha publicado cifras acerca
de la cantidad anual de
kilowatts-hora consumida por varios aparatos para el hogar. Se afirma que la aspiradora consume un promedio de 46 kilowatts-hora al año. Si una muestra aleatoria de 12 hogares incluidos en un estudio planeado indica que las aspiradoras consumen un promedio de 42 kilowatts-hora al año con una desviación estándar de 11.9 kilowatts-hora. ¿ Sugiere esto, con un nivel de significación =0.05 , que las aspiradoras consumen, en promedio, menos de 46 kilowatts-hora al año ? Suponga que la población de kilowatts-hora es normal.
Solución:
H0 : u
46
H1 : u
46
0.05
n
12
-t
x
, n -1
42
t0.05,11
s
1.796
11 .9
t
(42 46 ) 12 11 .9
88
1.16
Instituto Profesional Diego Portales AUTÓNOMO
Así la región crítica o región de rechazo de H0 queda dada por: RC
t /t
1.796
Por lo tanto t RC . Luego con base en la muestra no podemos decir que el consumo de kilowatts-hora al año de las aspiradoras sea menor que 46.
2) El gerente de producción de una empresa cuyo proceso consiste en llenar cajas de cereal desea saber si efectivamente en cada caja se está depositando, en promedio, los 368 gramos que se supone es lo que la empresa asegura a sus vendedores. Para ello, se selecciona una muestra aleatoria de 25 de estas cajas obteniendose una media de 364.1 gramos y una desviación estándar de 17.3 gramos. Considere que la distribución de los pesos de las cajas de cereales es normal y trabaje con un nivel de significancia =0.05. ¿ Qué decide el gerente ? Solución:
H0 : u
368
H1 : u
368
0.05
t 2
n
25
x
,n 1
t0.025, 24
364 .1
2.064
s
17 .3
t
(364 .1 368 ) 25 17 .3
1.13
Así la región crítica o región de rechazo de H0 queda dada por:
RC
t /t
2.064 ó t
2.064
Por lo tanto t RC . Luego con base en la muestra el gerente de producción puede estar seguro que, en promedio, cada caja contiene 368gramos de cereal.
89
Instituto Profesional Diego Portales AUTÓNOMO
3) Suponga que en el mismo ejemplo anterior, del proceso de llenado de las cajas de cereal, que la empresa es visitada por un representante de la oficina de protección al consumidor y que le interesa averiguar si las cajas, en promedio, están faltas de peso, es decir, si el peso promedio es inferior a 368 gramos. Considere un nivel de significación =0.01.
Solución:
n
H0 : u
368
H1 : u
368
0.01
t
25
x
, n -1
t0.01, 24
364 .1
2.492
s
17 .3
t
(364 .1 368 ) 25 17 .3
1.13
Así la región crítica o región de rechazo de H0 queda dada por:
RC
t /t
2.492
Por lo tanto t RC . Luego con base en la muestra el representante de la oficina de protección al consumidor puede estar seguro que, en promedio, el peso de cada caja de cereal no es inferior a 268 gramos.
90
Instituto Profesional Diego Portales AUTÓNOMO
EJERCICIOS AUTO EVALUATIVOS Nº 10
1) Una muestra aleatoria de 36 refrescos de una máquina despachadora automática tiene un contenido promedio de 21.9 decílitros con una desviación estándar de 1.42 decílitros. Pruebe la hipótesis de
=22.2 decílitros en contraposición a la hipótesis alternativa,
<22.2 decílitros, con un nivel de significancia =0.05. 2) Se afirma que automóvil recorre un promedio anual de más de 20.000 kilómetros. Para probar esta afirmación, se le solicita a una muestra aleatoria de 100 propietarios de automóvil que lleven un registro de los kilómetros que recorren.
¿Estaría usted de
acuerdo con esta afirmación si en la muestra aleatoria resulta un promedio de 23.500 kilómetros y una desviación estándar de 3.900 kilómetros ? Use un nivel se significancia =0.01. 3) En un informe de una investigación de J.M.N. se afirma que los ratones con una vida promedio de 32 meses llegarán hasta casi 40 cuando 40% de las calorías en su alimentación se reemplacen con vitaminas y proteínas. ¿ Hay alguna razón para creer que la vida promedio será inferior a 40 meses si 64 ratones que se han sujetado a esta dieta tienen una vida promedio de 38 meses con una desviación estándar de 5.8 meses ? Utilice un nivel de significancia =0.025 4) Una empresa eléctrica afirma que un compactador de basura se usa un promedio de 125 horas al año. Si una muestra aleatoria de 49 hogares equipados con compactadores de basura indica un uso promedio anual de 126.9 horas con una desviación estándar de 8.4 horas ¿ Sugiere esto con un nivel de significancia de 0.05, que estos aparatos se usan en promedio más de 125 horas ?
91
Instituto Profesional Diego Portales AUTÓNOMO
SOLUCIÓN EJERCICIOS AUTO EVALUATIVOS Nº 10
1) Se acepta H0 , es decir, =22,2 decílitros.
2) Se rechaza H0 , es decir , un automóvil recorre un promedio anual superior a 20000 Km.
3) Se rechaza H0 , es decir la vida promedio no es inferior a 40 meses
4) Se acepta H0 , es decir , un compactador de basura dura, en promedio , sobre 125 horas al año.
92
Instituto Profesional Diego Portales AUTÓNOMO
3) Prueba de hipótesis para la varianza de una población normal Para contrastar estas hipótesis se usa el estadístico ji-cuadrado dado por: (n 1) s 2
2
2
a) Pruebas de hipótesis de una cola i)
H0 :
2
2 1
H1 :
2
2 1
(
2
2 1
)
En este caso la región crítica o región de rechazo de H0 está dada por:
RC
2
/
2
2 ,n 1
Gráficamente:
93
Instituto Profesional Diego Portales AUTÓNOMO
ii)
i)
H0 :
2
2 1
H1 :
2
2 1
(
2
2 1
)
En este caso la región crítica o región de rechazo de H0 está dada por:
2
RC
2
/
2 1
,n 1
Gráficamente:
c) Pruebas de hipótesis de dos colas
H0 :
2
2 1
H1 :
2
2 1
En este caso la región crítica o región de rechazo de H0 está dada por: RC
2
/
2
2 (1
ó 2
, n 1)
94
2
2 ( , n 1) 2
Instituto Profesional Diego Portales AUTÓNOMO
Gráficamente:
Ejemplos
1) Un fabricante de baterías para automóvil asegura que la duración de sus baterías tiene distribución aproximadamente normal con desviación estándar de 0.9 años. Si una muestra aleatoria de 10 baterías tiene una desviación estándar de 1.2 años ¿ Piensa usted que
>0.9 años ? Utilice un nivel de significancia =0.05
Solución:
H0 :
2
0,81
H1 :
2
0,81 2
0.05 n
10
,n 1
s2
1.44
2 0.05,9
19,919 2
9 1,44 0.81
16
95
Instituto Profesional Diego Portales AUTÓNOMO
Así la región crítica o región de rechazo de H0 queda dada por:
RC
2
/
2
19 ,919
Por lo tanto 2 RC. Luego con base en la muestra no hay evidencia suficiente para afirmar que la varianza de la duración de las baterías sea mayor que 0.81 años.
2) Se sabe que el contenido de nicotina de una marca de cigarros tiene distribución aproximadamente normal con una varianza de 1.3 milígramos. Pruebe la hipótesis de que 2
=1,3 en contraposición a la alternativa de que
2
1.3 , si una muestra aleatoria de 8
cigarros tiene una desviación estándar de 1,8 milígramos. Use un nivel de significación =0.05.
Solución:
H0 :
2
1,3
H1 :
2
1,3
0.05
2 1
2
,n 1
2 2
n
8
s2
,n 1
3.24
2 0.975, 7 2 0.025, 7
2
1,690 16,013
7 3,24 0.13
17.45
Así la región crítica o región de rechazo de H0 queda dada por: RC
2
/
2
1,690 ó
2
16 ,013
Por lo tanto 2 RC. Luego con base en la muestra no hay evidencia suficiente para afirmar que la varianza del contenido de nicotina en los cigarros se igual a 1,3 milígramos.
96
Instituto Profesional Diego Portales AUTÓNOMO
3) Experiencias pasadas indican que el tiempo para que los alumnos del último año realicen un examen estandarizado es una v.a normal con desviación estándar de 6 minutos. Pruebe la hipótesis de que <6 , si una muestra aleatoria de 20 estudiantes tiene una desviación estándar de 4.51 minutos al realizar este examen. Utilice un nivel de significancia =0.01. Solución:
n
H0 :
2
36
H1 :
2
36
0.01
2 1
20
s2
,n 1
2 0.99,19
7,633
19 20,3401 10,74 36
2
20,3401
Así la región crítica o región de rechazo de H0 queda dada por:
RC
2
/
2
7,633
Por lo tanto 2 RC. Luego con base en la muestra es posible afirmar que la varianza del tiempo en que los estudiantes contestan el examen es igual a 36 minutos.
97
Instituto Profesional Diego Portales AUTÓNOMO
EJERCICIOS AUTO EVALUATIVOS Nº 11
1) Se sabe que la capacidad de los recipientes de un determinado lubricante tiene distribución normal con varianza de 0,03 litros2. Pruebe la hipótesis de que contraposición a la alternativa de que
2
2
=0,03 en
0,03 para la muestra aleatoria de 10 recipientes
que tienen una desviación estándar de 0,25. Use un nivel de significación de 0,01.
2) Se sabe que el contenido de nicotina de una marca de cigarros tiene una distribución aproximadamente normal con una varianza de 1,3 milígramos. Pruebe la hipótesis de que 2
=1.3 en contraposición a la alternativa de que
2
>1,3 , si una muestra aleatoria de 8 de
estos tiene una desviación estándar de 1,8. Use un nivel de significancia =0,05.
98
Instituto Profesional Diego Portales AUTÓNOMO
SOLUCIÓN EJERCICIOS AUTO EVALUATIVOS Nº 11
1) Se acepta H0 , es decir ,
2) Se rechaza H0 , es decir,
2
=0,03
2
>1,3
99
Instituto Profesional Diego Portales AUTÓNOMO
ASIGNATURA ESTADÍSTICA CUARTA UNIDAD ANÁLISIS DE VARIANZA
CONTENIDO DE LA UNIDAD TEMÁTICA
4.1 Comparación de medias de dos tratamientos.
100
Instituto Profesional Diego Portales AUTÓNOMO
COMPARACION DE MEDIAS DE DOS POBLACIONES
1) Comparación de medias de dos poblaciones con varianzas poblacionales conocidas
El estadístico usado para probar estas hipótesis está dado por:
( x1
z
x2 )
~ N (0,1) ( z tiene distribución normal estándar)
2 1
2 2
n1
n2
a) Prueba de hipótesis de una cola
i)
H0 :
1
H1 :
1
2 2
En este caso la región crítica o región de rechazo de H0 está dada por: RC
ii)
H0 :
1
H1 :
1
z/z
z
2 2
En este caso la región crítica o región de rechazo de H0 está dada por: RC
z/z
z
101
2
1
y
2
2
Instituto Profesional Diego Portales AUTÓNOMO
b) Prueba de hipótesis de dos colas
H0 :
1
2
H1 :
1
2
En este caso la región crítica o región de rechazo de H0 está dada por: RC
z/z
z
ó z
z
2
2
2) Comparación de medias de dos poblaciones con varianzas poblacionales desconocidas pero iguales
El estadístico usado para probar estas hipótesis está dado por:
( x1
T
sp
x2 ) tiene distribución t 1 1 n1 n2
student con v
n1
n2 - 2 grados de libertad
donde:
s
2 p
(n1 1) s12 (n2 1)s22 en que s12 y s 22 son las varianzas muestrales. n1 n2 2
102
2
1
y
2
2
Instituto Profesional Diego Portales AUTÓNOMO
a) Prueba de hipótesis de una cola
i)
H0 :
1
H1 :
1
2 2
En este caso la región crítica o región de rechazo de H0 está dada por: RC
ii)
H0 :
1
H1 :
1
t /t
t
2 2
En este caso la región crítica o región de rechazo de H0 está dada por: RC
t /t
t
b) Prueba de hipótesis de dos colas
H0 :
1
2
H1 :
1
2
En este caso la región crítica o región de rechazo de H0 está dada por: RC
t /t
t
ó t t 2
2
103
Instituto Profesional Diego Portales AUTÓNOMO
Ejemplo: Se eligieron dos estaciones de muestreo independientes para un estudio sobre la descarga de ácido de una mina de uranio. Los registros de ambas estaciones se encuentran dados en la siguiente tabla:
Estación 1
Estación 2
n1= 12
n2= 10
x1 =3.11
x 2 =2.04
s1=0.771
s2=0.448
¿ Son iguales las medias de ambas estaciones ? Utilice un nivel de significancia de 0,1.Suponga que las varianzas poblacionales son iguales pero desconocidas.
Solución
H0 :
1
2
H1 :
1
2
= 0.1
/2 = 0.05. Por lo tanto: t /2=t0.05=1.725
RC
t /t
1.725 ó t
1.725
Por otro lado:
x1
x2
3.11 - 2.04
1.07 , s12
0.771 , s 22
0.448 , además n1
104
12 , n2
10
Instituto Profesional Diego Portales AUTÓNOMO
De esta forma:
s 2p
(n1 1) s12 (n2 1)s22 n1 n2 2
(11)(0.7712 ) (9)(0.4482 ) 12 10 2
0.417
así:
t
( x1 sp
Por lo tanto t son iguales.
x2 ) 1 1 n1 n2
1,07 6,011 0,417 0.428
RC . Luego se rechaza H0 , de esta forma las medias de ambas estaciones no
105
Instituto Profesional Diego Portales AUTÓNOMO
EJERCICIOS AUTO EVALUATIVOS Nº 12
Problema 1 Cinco muestras de una sustancia ferrosa se usan para determinar si hay una diferencia entre un análisis químico de laboratorio y un análisis de fluorescencia de rayos X del contenido de hierro. Cada muestra se divide en 2 submuestras y se aplican los dos tipos de análisis. A continuación se presentan los datos codificados que muestran los análisis de contenido de hierro. 1
2
3
4
5
Análisis Rayos X Químico
2.0 2.2
2.0 1.9
2.3 2.5
2.1 2.3
2.4 2.4
Suponga que las poblaciones son normales, Pruebe con un nivel de significancia de 0.05 si los dos métodos de análisis dan en promedio el mismo resultado.
Problema 2 Los siguientes datos representan los tiempos de duración de las películas que producen dos compañías cinematográficas. Tiempo (minutos)
Compañía I II
103 97
94 82
110 123
87 92
98 175
88
118
¿Son iguales los tiempos de duración de las películas que producen las 2 compañías? Utilice un nivel de significancia de 0,05.
106
Instituto Profesional Diego Portales AUTÓNOMO
SOLUCIÓN EJERCICIOS AUTO EVALUATIVOS Nº 12
1) Los dos tratamientos no dan en promedio el mismo resultado es decir se rechaza H0. 2) Los tiempos promedio de duración de ambas películas no son iguales es decir se rechaza H0.
107
Instituto Profesional Diego Portales AUTÓNOMO
ANEXOS Tablas de distribución de probabilidades: (normal, t –student, y ji-cuadrado) Tabla Áreas bajo la curva normal z -3.4 -3.3 -3.2 -3.1 -3.0
.00 0.0003 0.0005 0.0007 0.0010 0.0013
.01 0.0003 0.0005 0.0007 0.0009 0.0013
.02 0.0003 0.0005 0.0006 0.0009 0.0013
.03 0.0003 0.0004 0.0006 0.0009 0.0012
.04 0.0003 0.0004 0.0006 0.0008 0.0012
.05 0.0003 0.0004 0.0006 0.0008 0.0011
.06 0.0003 0.0004 0.0006 0.0008 0.0011
.07 0.0003 0.0004 0.0005 0.0008 0.0011
.08 0.0003 0.0004 0.0005 0.0007 0.0010
.09 0.0002 0.0003 0.0005 0.0007 0.0010
-2.9 -2.8 -2.7 -2.6 -2.5
0.0019 0.0026 0.0035 0.0047 0.0062
0.0018 0.0025 0.0034 0.0045 0.0060
0.0017 0.0024 0.0033 0.0044 0.0059
0.0017 0.0023 0.0032 0.0043 0.0057
0.0016 0.0023 0.0031 0.0041 0.0055
0.0016 0.0022 0.0030 0.0040 0.0054
0.0015 0.0021 0.0029 0.0039 0.0052
0.0015 0.0021 0.0028 0.0038 0.0051
0.0014 0.0020 0.0027 0.0037 0.0049
0.0014 0.0019 0.0026 0.0036 0.0048
-2.4 -2.3 -2.2 -2.1 -2.0
0.0082 0.0107 0.0139 0.0179 0.0228
0.0080 0.0104 0.0136 0.0174 0.0222
0.0078 0.0102 0.0132 0.0170 0.0217
0.0075 0.0099 0.0129 0.0166 0.0212
0.0073 0.0096 0.0125 0.0162 0.0207
0.0071 0.0094 0.0122 0.0158 0.0202
0.0069 0.0091 0.0119 0.0154 0.0197
0.0068 0.0089 0.0116 0.0150 0.0192
0.0066 0.0087 0.0113 0.0146 0.0188
0.0064 0.0084 0.0110 0.0143 0.0183
-1.9 -1.8 -1.7 -1.6 -1.5
0.0287 0.0359 0.0446 0.0548 0.0668
0.0281 0.0352 0.0436 0.0537 0.0655
0.0274 0.0344 0.0427 0.0526 0.0643
0.0268 0.0336 0.0418 0.0516 0.0630
0.0262 0.0329 0.0409 0.0505 0.0518
0.0256 0.0322 0.0401 0.0495 0.0606
0.0250 0.0314 0.0392 0.0485 0.0594
0.0244 0.0307 0.0384 0.0475 0.0582
0.0239 0.0301 0.0375 0.0465 0.0571
0.0233 0.0294 0.0367 0.0455 0.0559
-1.4 -1.3 -1.2 -1.1 -1.0
0.0808 0.0968 0.1151 0.1357 0.1587
0.0793 0.0951 0.1131 0.1335 0.1562
0.0778 0.0934 0.1112 0.1314 0.1539
0.0764 0.0918 0.1093 0.1292 0.1515
0.0749 0.0901 0.1075 0.1271 0.1492
0.0735 0.0885 0.1056 0.1251 0.1469
0.0722 0.0869 0.1038 0.1230 0.1446
0.0708 0.0853 0.1020 0.1210 0.1423
0.0694 0.0838 0.1003 0.1190 0.1401
0.0681 0.0823 0.0985 0.1170 0.1379
-0.9 -0.8 -0.7 -0.6 -0.5
0.1841 0.2119 0.2420 0.2743 0.3085
0.1814 0.2090 0.2389 0.2709 0.3050
0.1788 0.2061 0.2358 0.2676 0.3015
0.1762 0.2033 0.2327 0.2643 0.2981
0.1736 0.2005 0.2296 0.2611 0.2946
0.1711 0.1977 0.2266 0.2578 0.2912
0.1685 0.1949 0.2236 0.2546 0.2877
0.1660 0.1922 0.2206 0.2514 0.2843
0.1635 0.1894 0.2177 0.2483 0.2810
0.1611 0.1867 0.2148 0.2451 0.2776
-0.4 -0.3 -0.2 -0.1 -0.0
0.3446 0.3821 0.4207 0.4602 0.5000
0.3409 0.3783 0.4168 0.4562 0.4960
0.3372 0.3745 0.4129 0.4522 0.4920
0.3336 0.3707 0.4090 0.4483 0.4880
0.3300 0.3669 0.4052 0.4443 0.4840
0.3264 0.3632 0.4013 0.4404 0.4801
0.3228 0.3594 0.3974 0.4364 0.4761
0.3192 0.3557 0.3936 0.4325 0.4721
0.3156 0.3520 0.3897 0.4286 0.4681
0.3121 0.3483 0.3859 0.4247 0.4641
108
Instituto Profesional Diego Portales AUTÓNOMO
Tabla, áreas bajo la curva normal
109
Instituto Profesional Diego Portales AUTÓNOMO
Tabla t- student
110
Instituto Profesional Diego Portales AUTÓNOMO
Tabla t- student
111
Instituto Profesional Diego Portales AUTÓNOMO
Tablas ji-cuadrado
112
Instituto Profesional Diego Portales AUTÓNOMO
Tablas ji-cuadrado
113
Instituto Profesional Diego Portales AUTÓNOMO
BIBLIOGRAFÍA
Chao, L 81993 (1993) “Estadísticas para las Ciencias Administrativas” México, Editorial Mc. Graw Hill, 3º Edición (146 p).
Mason y Lind (1995) “Estadística para Administración y Economía” España, Editorial Alfaomega (911 p.)
Canavos, G (1990) “Probalidad y Estadística. Aplicaciones y Métodos”. México, Editorial Mc. Graw Hill, 1º Edición (651 p.) Walpole, “Probabilidad y Estadística para Ingenieros” México (1999) 6ª Edición
Uso de Internet para temas específicos.
114