INTERVALOS DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES 1. CON VARIANZAS CONOCIDAS Sean X 1 y X 2 las medias de dos muestras aleatorias independientes de tamaños n1 y n2 seleccionadas respectivamente de dos poblaciones con medias 1 y 2 desconocidas. Suponemos que las varianzas 12 y 2 2 son conocidas. Este hecho se justifica por datos históricos, o por estudios estadísticos similares, o por su estimación puntual insesgada dadas respectivamente por S12 y S12 calculada de las muestras siempre que sea grande. Si las dos poblaciones son Normales: entonces X 1 y X 2 tienen distribuciones respectivas normal N ( 1 ,
12 n1
) y normal N ( 1 ,
22 n2
) (para n1 2 y n2 2 ).
En consecuencia por la propiedad reproductiva de la normal, la estadística X 1 X 2 tiene distribución normal N ( 1 2 ,
12 n1
22 n2
).
Si las dos poblaciones no son normales,
pero n1 y n2 son tamaños de muestras
suficientemente grandes ( n1 30 y n2 30 ), entonces por el teorema del límite central, la estadística X 1 X 2 es aproximadamente normal N ( 1 2 ,
12
22
n1
n2
).
Por lo tanto, en cualquier de los dos casos, la variable aleatoria estándar Z definida por:
Z
X 1 X 2 ( 1 2 )
x x 1
Donde x1 x2
2
21 2 2
n1
n2
Tienen distribución exactamente o aproximadamente normal. N (0;1) . La variable Z resultante, es la estadística del pivote que se aplica para determinar el intervalo de confianza de 1 2 en este caso, ya que esta depende sólo de valores de las muestras y del parámetro único 1 2 ya que las varianzas 12 y 2 2 son conocidas de algún modo dado el nivel de confianza 1 , en la distribución de Z se ubica el valor Z
1
que:
P[ z Z z ] 1
sustituyendo
Z
X 1 X 2 ( 1 2 )
x x 1
de manera
2
y
operando
2
adecuadamente, resulta. 1 Lic. Araujo Cajamarca, Raul
P[( X1 X 2 ) ( Z
1
)( x1 x2 ) 1 2 ( X1 X 2 ) ( Z
1
2
)( x1 x2 )] 1
2
Intervalos de estimación de 1 2
1
2
2 Z
(1 ) 2
0
X1 X 2
a Intervalo de
Z
1 2
(1 ) 2
Z X1 X 2
b
Si se desconocen las varianzas, entonces se hace 12 S12 2 2 S2 2 siempre que cada muestra sea d3e tamaño grande. Ejemplo 01 Un consumidor de cierto producto quiere aplicar la técnica de estimación estadística para decidir si comprar la marca A o la marca B del producto. Para esto va a estimar la diferencia entre los tiempos de vida promedio de las dos marcas del producto. Si dos muestras aleatorias independientes de 10 unidades de cada marca llevados a un laboratorio han dado las medias de vida útil respectiva de 1230 horas y 1190 horas; ¿es acertada la decisión del consumidor si decide adquirir la marca a? Aplique el nivel de confianza del 95% y suponga que las dos poblaciones tienen distribución normal con desviaciones estándar respectivamente de 120 y 160 horas. Solución: Paso 01: La estimación Puntual de 1 2 es la diferencia de las medias Muestrales:
X1 X 2 1230 1190 40 Paso 02: El error típico de la diferencia de dos medias Muestrales es:
2 Lic. Araujo Cajamarca, Raul
x x Sx x 1
2
x x 1
1
2
12
2
n1
22
n2
1202 1602 42.4264 10 10
Paso 03: Dado el nivel de confianza 1 =0.95 1 0.95
0.05 Paso 04: Calculando Z
1
Z
1
2
0.05 2
Z 0.975 1.96
Paso 05:
Los limites inferiores y superiores respectivamente de 1 2 son: ( X1 X 2 ) (Z
1
)( x1 x2 ) 1 2 ( X1 X 2 ) ( Z
2
1
)( x1 x2 ) Remplazando valores
2
tenemos:
(40) (1.96)(42.4264) 1 2 (40) (1.96)(42.4264) 43.155744 1 2 123.155744 Y dado que:
1 2 0 43.156;123,156 , se concluye que 1 2 y que no hay
diferencias significativas entre las medias de las vidas útiles de las marcas A y B del producto. Por tanto, el gerente de compras puede adquirir cualquiera de las dos marcas. Ejemplo 02 El salario diario promedio para una muestra de n1 30 empleados de una empresa manufacturera grande es X1 28000$ con una desviación estándar de S1 1400$ , en otra empresa grande, una muestra aleatoria de n2 40 empleados tiene un salario promedio diario de X 2 27000$ , con desviación estándar muestral de S 1000$ . El intervalo de confianza del 99% para estimar las diferencias entre los niveles diarios de salarios en las dos empresas es: Paso 01 Clasificación de datos:
3 Lic. Araujo Cajamarca, Raul
Empresas A
B
n1 30
n2 40
X1 28000$ S1 1400$
X 2 27000$ S2 1000$
Paso 02: La estimación Puntual de 1 2 es la diferencia de las medias Muestrales:
X1 X 2 28000 27000 1000 Paso 03: El error típico de la diferencia de dos medias Muestrales es:
x x Sx x 1
2
S x1 x2
1
2
S12 S2 2 14002 10002 300.56 n1 n2 30 40
Paso 04: Dado el nivel de confianza 1 =0.99 1 0.99
0.01 Paso 05: Calculando Z
1
Z
1
2
0.01 2
Z0.995 2.58
Paso 06:
Los limites inferiores y superiores respectivamente de 1 2 son: ( X1 X 2 ) (Z
1
)( x1 x2 ) 1 2 ( X1 X 2 ) ( Z
2
1
)( x1 x2 ) Remplazando valores
2
tenemos:
(1000) (2.58)(300.56) 1 2 (1000) (2.58)(300.56) 224.5552 1 2 1775.4448 Por ello se puede afirmar que el salario diario promedio de la primera empresa es mayor que el correspondiente a la segunda, en una cantidad que va de 225 a 1775 con una confianza del 99%. 4 Lic. Araujo Cajamarca, Raul
2. CON VARIANZAS DESCONOCIDAS y S12 y S 2 2 las varianzas de dos muestras aleatorias
Sean X 1 y X 2 las medias
independientes de tamaños n1 y n2 respectivamente seleccionadas de dos poblaciones normales con varianzas 12 y 2 2 desconocidas. 2.1. Con varianzas desconocidas supuestas iguales 12 2 2 2 Poblaciones normales, en este caso, la obtención de la estadística de pivote es como sigue: La varianza común o promedio:
(n1 1) S12 (n2 1) S2 2 Es un estimador insesgado de la varianza 2 . Sc n1 n2 2 2
S x1 x2
Sc 2 Sc 2 Es el error típico de X 1 X 2 , Dado el nivel de confianza 1 (o en n1 n2 t (n1 n2 2) se halla el valor t
porcentaje), en la distribución T
(1 ; n1 n2 2) 2
tal que
P[t T t ] 1 . Intervalos de estimación de 1 2
1
2
2
t
0
(1 ; n1 n2 2) 2
X1 X 2
a Intervalo de
P[( X1 X 2 ) (t
(1 ;n1 n2 2) 2
t
T
(1 ; n1 n2 2) 2
1 2
b
)(S x1 x2 ) 1 2 ( X1 X 2 ) (t
(1 ; n1 n2 2) 2
)(S x1 x2 )] 1
Siendo el intervalo a determinar:
( X1 X 2 ) (t
(1 ;n1 n2 2) 2
)(S x1 x2 ) 1 2 ( X1 X 2 ) (t
(1 ; n1 n2 2) 2
)(S x1 x2 )
5 Lic. Araujo Cajamarca, Raul
, es posible aproximar los valores de mediante la distribución normal estándar
Ejemplo 01 El agente de una cadena de restaurantes va a decidir adquirir entre dos variedades de arroz A y B. para tomar la decisión estadística comparando la calidad, se escogieron dos muestras aleatorias independientes de 10 bolsas de arroz de un kilo cada uno de las dos variedades de arroz y se observaron los siguientes porcentajes de granos quebrados por kilo: 1 2 3 4 5 6 7 8 9 10 Variedad: A 6 5 6 7 4 7 6 4 3 6 Variedad: B 7 6 7 9 5 8 7 6 10 8
Obtenga el intervalo de confianza del 95% de la diferencia de los promedios de porcentajes de gramos quebrados por kilos de arroz de las dos variedades. ¿Es válido concluir que no hay diferencias significativas entre las dos medias poblacionales? Suponga que las poblaciones de los porcentajes de gramos quebrados por kilo de A y B se distribuyen normalmente con la misma varianza. Paso 01 Clasificación de datos:
i
x1
x1 x
( x1 x )2
i
x1
x1 x
( x1 x )2
1 2 3 4 5 6 7 8 9 10
6 5 6 7 4 7 6 4 3 6 54
0.6 -0.4 0.6 1.6 -1.4 1.6 0.6 -1.4 -2.4 0.6
0.36 0.16 0.36 2.56 1.96 2.56 0.36 1.96 5.76 0.36 16.4
1 2 3 4 5 6 7 8 9 10
7 6 7 9 5 8 7 6 10 8 73
-0.3 -1.3 -0.3 1.7 -2.3 0.7 -0.3 -1.3 2.7 0.7
0.09 1.69 0.09 2.89 5.29 0.49 0.09 1.69 7.29 0.49 20.1
10
S12
( x1 x )2 i 1
n1 1
10
16.40 1.82 9
S2 2
(x x ) i 1
1
n1 1
2
20.10 2.23 9 6
Lic. Araujo Cajamarca, Raul
Empresas A
B
n1 10
n2 10
X1 5.40 S1 1.3499
X 2 7.30 S2 1.4944
Paso 02: La estimación Puntual de 1 2 es la diferencia de las medias Muestrales:
X1 X 2 5.40 7.30 1.90 Paso 03: El error típico de la diferencia de dos medias Muestrales es:
Sc 2
(n1 1) S12 (n2 1) S2 2 (10 1)1.82 (10 1)2.23 9(1.82) 9(2.23) 2.03 n1 n2 2 10 10 2 18
S x1 x2
Sc 2 Sc 2 2.03 2.03 0.64 n1 n2 10 10
Paso 04: Dado el nivel de confianza 1 =0.95 1 0.95
0.05 Paso 05: Calculando t
(1 , n1 n2 2) 2
t
(1
0.05 ;1010 2) 2
t(0.975;18) 2.101
Paso 06:
Los limites inferiores y superiores respectivamente de 1 2 son:
( X1 X 2 ) (t
(1 ;n1 n2 2) 2
)(S x1 x2 ) 1 2 ( X1 X 2 ) (t
(1 ; n1 n2 2) 2
)(S x1 x2 ) Remplazando
valores tenemos:
(5.40 7.30) (2.101)(0.64) 1 2 (5.40 7.30) (2.101)(0.64) 3.2379 1 2 0.5621
7 Lic. Araujo Cajamarca, Raul
Dado que 1 2 0 no pertenece al intervalo de confianza, no se debe aceptar que 1 2 además el intervalo es negativo, entonces 1 2 . Ejemplo 02 La vida útil promedio de una muestra aleatoria de n1 10 focos es X1 4600 horas con
S1 250 horas. Para otra marca de focos, la vida útil promedio y la desviación estándar para una muestra de n2 8 focos son X 2 4000 horas y S2 200 horas. Se asume que la vida útil de los focos de ambas marcas tiene una distribución normal. El intervalo de confianza del 90% para estimar la diferencia entre las vidas útiles promedio de las dos marcas de focos es. Solución: Paso 01 Clasificación de datos:
Empresas A
B
n1 10
n2 8
X1 4600 S1 250
X 2 4000 S2 200
Paso 02: La estimación Puntual de 1 2 es la diferencia de las medias Muestrales:
X1 X 2 4600 4000 600 Paso 03: Asumimos que 12 2 2 La varianza muestral común es:
(n1 1) S12 (n2 1) S2 2 (10 1)2502 (8 1)2002 9(2502 ) 7(2002 ) Sc 52656.25 n1 n2 2 10 8 2 16 2
El error típico de la diferencia de dos medias Muestrales es:
S x1 x2
Sc 2 Sc 2 52625.25 52625.25 108.8149 n1 n2 10 8 8
Lic. Araujo Cajamarca, Raul
Paso 04: Dado el nivel de confianza 1 =0.90 1 0.90
0.10 Paso 05: Calculando t
(1 , n1 n2 2) 2
t
(1
0.10 ;10 8 2) 2
t(0.95;16) 1.746
Paso 06:
Los limites inferiores y superiores respectivamente de 1 2 son:
( X1 X 2 ) (t
(1 ;n1 n2 2) 2
)(S x1 x2 ) 1 2 ( X1 X 2 ) (t
(1 ; n1 n2 2) 2
)(S x1 x2 ) Remplazando
valores tenemos:
(4600 4000) (1.746)(108.8149) 1 2 (4600 4000) (1.746)(108.8149) 410.0092 1 2 790.2924 Así puede afirmarse con una confianza del 90%, que la primera marca de focos tiene una vida útil promedio mayor que la segunda, en una cantidad entre 40 y 790 horas. 2.2. Con varianzas desconocidas supuestas distintas
Si las varianzas de las dos poblaciones normales independientes son desconocidas pero supuestas diferentes, entonces: Si X 1 y X 2 son las medias que resultan de dos muestras independientes de tamaño n1 y n2 escogidas respectivamente de dos poblaciones normales con varianza 12
y
22
desconocidas supuestas distintas entonces, el intervalo de confianza ( 1 ) 100% de 1 2 es:
P[( X1 X 2 ) (t
(1 ;r ) 2
( X1 X 2 ) (t
)(S x1 x2 ) 1 2 ( X 1 X 2 ) (t( r ) )(S x1 x2 )] 1
(1 ;r ) 2
)( S x1 x2 ) 1 2 ( X1 X 2 ) (t
(1 ; r ) 2
)( S x1 x2 )
9 Lic. Araujo Cajamarca, Raul
2
S12 S 2 2 n n 2 Donde r 1 2 2 S12 S22 n 1 n2 n1 1 n2 1
S x1 x2
S12 S2 2 n1 n2
r Entero Ejemplo 01 Se lleva a cabo un estudio para comparar los montos de los préstamos personales realizadas por dos entidades financieras A y B. con este fin se tomaron 9 y 8 préstamos al azar de cada banco resultando los siguientes montos en miles de soles: 1 2 3 4 5 6 7 8 9 Variedad: A 12 28 10 25 24 19 22 33 17 Variedad: B 16 20 16 20 16 17 15 21 -
Aplicando un intervalo de estimación del 95% para la verdadera diferencia de los montos promedios, ¿Es válido inferir que en promedio el monto de los préstamos del banco A es mayor a los del banco B? datos históricos indican que la distribución de estos préstamos en cada banco, es normal con varianzas diferentes. Solución: Paso 01 Clasificación de datos:
i
xi
xi x
( xi x )2
i
xi
xi x
( xi x )2
1 2 3 4 5 6 7 8 9
12 28 10 25 24 19 22 33 17 190
-9.11 6.89 -11.11 3.89 2.89 -2.11 0.89 11.89 -4.11
82.99 47.47 123.43 15.13 8.35 4.45 0.79 141.37 16.89 440.87
1 2 3 4 5 6 7 8
16 20 16 20 16 17 15 21
-1.63 2.37 -1.63 2.37 -1.63 -0.63 -2.63 3.37
2.66 5.62 2.66 5.62 2.66 0.4 6.92 11.36
141
37.9
10 Lic. Araujo Cajamarca, Raul
Empresas A
B
n1 9
n2 8
X1 21.11
X 2 17.625
S12 55.1088
S2 2 5.4143
Paso 02: La estimación Puntual de 1 2 es la diferencia de las medias Muestrales:
X1 X 2 21.11 17.625 3.485 Paso 03: Las varianzas son 12 2 2 Calculamos r : 2
2 S12 S2 2 55.1088 5.4143 n n2 (6.80) 2 8 9 r 12 9.7304 2 2 2 4.7521 S12 S2 2 55.1088 5.4143 n 9 8 1 n2 8 7 n1 1 n2 1
r 9.7304 10 El error típico de la diferencia de dos medias Muestrales es:
S x1 x2
S12 S2 2 55.1088 5.4143 2.6077 n1 n2 9 8
Paso 04: Dado el nivel de confianza 1 =0.95 1 0.95
0.05 Paso 05: Calculando t
(1 , r ) 2
t
(1
0.05 ;101) 2
t(0.975;9) 2.228
Paso 06:
11 Lic. Araujo Cajamarca, Raul
Los limites inferiores y superiores respectivamente de 1 2 son:
( X1 X 2 ) (t
(1 ;r ) 2
)( S x1 x2 ) 1 2 ( X1 X 2 ) (t
(1 ; r ) 2
)( S x1 x2 )
Remplazando valores tenemos:
(21.11 17.625) (2.228)(2.6077) 1 2 (21.1111 17.625) (2.228)(2.6077) 2.3250 1 2 9.2950 Dado que 1 2 0 2.3250;9.2950 podemos concluir que: 1 2 , por tanto, los montos promedios de los préstamos son iguales.
12 Lic. Araujo Cajamarca, Raul