Intervalos de Confianza Para La Diferencia Entre Dos Medias Poblacionales

INTERVALOS DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES 1. CON VARIANZAS CONOCIDAS Sean X 1 y X 2 las medias de dos muestras aleatorias independientes de tamaños n1 y n2 seleccionadas respectivamente de dos poblaciones con medias 1 y  2 desconocidas. Suponemos que las varianzas  12 y  2 2 son conocidas. Este hecho se justifica por datos históricos, o por estudios estadísticos similares, o por su estimación puntual insesgada dadas respectivamente por S12 y S12 calculada de las muestras siempre que sea grande. Si las dos poblaciones son Normales: entonces X 1 y X 2 tienen distribuciones respectivas normal N ( 1 ,

 12 n1

) y normal N ( 1 ,

 22 n2

) (para n1  2 y n2  2 ).

En consecuencia por la propiedad reproductiva de la normal, la estadística X 1  X 2 tiene distribución normal N ( 1  2 ,

 12 n1



 22 n2

).

Si las dos poblaciones no son normales,

pero n1 y n2 son tamaños de muestras

suficientemente grandes ( n1  30 y n2  30 ), entonces por el teorema del límite central, la estadística X 1  X 2 es aproximadamente normal N ( 1  2 ,

 12

 22



n1

n2

).

Por lo tanto, en cualquier de los dos casos, la variable aleatoria estándar Z definida por:

Z

X 1  X 2  ( 1  2 )

 x x 1

Donde  x1  x2 

2

 21  2 2 

n1

n2

Tienen distribución exactamente o aproximadamente normal. N (0;1) . La variable Z resultante, es la estadística del pivote que se aplica para determinar el intervalo de confianza de 1  2 en este caso, ya que esta depende sólo de valores de las muestras y del parámetro único 1  2 ya que las varianzas  12 y  2 2 son conocidas de algún modo dado el nivel de confianza 1   , en la distribución de Z se ubica el valor Z

1

que:

P[ z  Z  z ]  1  

sustituyendo

Z

X 1  X 2  ( 1  2 )

 x x 1



de manera

2

y

operando

2

adecuadamente, resulta. 1 Lic. Araujo Cajamarca, Raul

P[( X1  X 2 )  ( Z

1



)( x1  x2 )  1  2  ( X1  X 2 )  ( Z

1

2



)( x1  x2 )]  1  

2

Intervalos de estimación de 1  2

1



 2

2 Z



(1 ) 2

0

X1  X 2

a Intervalo de

Z

1  2



(1 ) 2

Z X1  X 2

b

Si se desconocen las varianzas, entonces se hace  12  S12  2 2  S2 2 siempre que cada muestra sea d3e tamaño grande. Ejemplo 01 Un consumidor de cierto producto quiere aplicar la técnica de estimación estadística para decidir si comprar la marca A o la marca B del producto. Para esto va a estimar la diferencia entre los tiempos de vida promedio de las dos marcas del producto. Si dos muestras aleatorias independientes de 10 unidades de cada marca llevados a un laboratorio han dado las medias de vida útil respectiva de 1230 horas y 1190 horas; ¿es acertada la decisión del consumidor si decide adquirir la marca a? Aplique el nivel de confianza del 95% y suponga que las dos poblaciones tienen distribución normal con desviaciones estándar respectivamente de 120 y 160 horas. Solución: Paso 01: La estimación Puntual de 1  2 es la diferencia de las medias Muestrales:

X1  X 2  1230  1190  40 Paso 02: El error típico de la diferencia de dos medias Muestrales es:

2 Lic. Araujo Cajamarca, Raul

 x x  Sx  x 1

2

 x x  1

1

2

 12

2

n1



 22



n2

1202 1602   42.4264 10 10

Paso 03: Dado el nivel de confianza 1   =0.95    1  0.95

  0.05 Paso 04: Calculando Z

1



Z

1

2

0.05 2

 Z 0.975  1.96

Paso 05:

 Los limites inferiores y superiores respectivamente de 1  2 son: ( X1  X 2 )  (Z

1



)( x1  x2 )  1  2  ( X1  X 2 )  ( Z

2

1



)( x1  x2 ) Remplazando valores

2

tenemos:

(40)  (1.96)(42.4264)  1  2  (40)  (1.96)(42.4264) 43.155744  1  2  123.155744 Y dado que:

1  2  0   43.156;123,156 , se concluye que 1  2 y que no hay

diferencias significativas entre las medias de las vidas útiles de las marcas A y B del producto. Por tanto, el gerente de compras puede adquirir cualquiera de las dos marcas. Ejemplo 02 El salario diario promedio para una muestra de n1  30 empleados de una empresa manufacturera grande es X1  28000$ con una desviación estándar de S1  1400$ , en otra empresa grande, una muestra aleatoria de n2  40 empleados tiene un salario promedio diario de X 2  27000$ , con desviación estándar muestral de S  1000$ . El intervalo de confianza del 99% para estimar las diferencias entre los niveles diarios de salarios en las dos empresas es: Paso 01 Clasificación de datos:


Empresas A

B

n1  30

n2  40

X1  28000$ S1  1400$

X 2  27000$ S2  1000$

Paso 02: La estimación Puntual de 1  2 es la diferencia de las medias Muestrales:

X1  X 2  28000  27000  1000 Paso 03: El error típico de la diferencia de dos medias Muestrales es:

 x x  Sx  x 1

2

S x1  x2 

1

2

S12 S2 2 14002 10002     300.56 n1 n2 30 40


  0.01 Paso 05: Calculando Z

1



Z

1

2

0.01 2

 Z0.995  2.58

Paso 06:

 Los limites inferiores y superiores respectivamente de 1  2 son: ( X1  X 2 )  (Z

1



)( x1  x2 )  1  2  ( X1  X 2 )  ( Z

2

1



)( x1  x2 ) Remplazando valores

2

tenemos:

(1000)  (2.58)(300.56)  1  2  (1000)  (2.58)(300.56) 224.5552  1  2  1775.4448 Por ello se puede afirmar que el salario diario promedio de la primera empresa es mayor que el correspondiente a la segunda, en una cantidad que va de 225 a 1775 con una confianza del 99%. 4 Lic. Araujo Cajamarca, Raul

2. CON VARIANZAS DESCONOCIDAS y S12 y S 2 2 las varianzas de dos muestras aleatorias

Sean X 1 y X 2 las medias

independientes de tamaños n1 y n2 respectivamente seleccionadas de dos poblaciones normales con varianzas  12 y  2 2 desconocidas. 2.1. Con varianzas desconocidas supuestas iguales 12   2 2   2 Poblaciones normales, en este caso, la obtención de la estadística de pivote es como sigue: La varianza común o promedio:

(n1  1) S12  (n2  1) S2 2 Es un estimador insesgado de la varianza  2 . Sc  n1  n2  2 2

S x1  x2 

Sc 2 Sc 2  Es el error típico de X 1  X 2 , Dado el nivel de confianza 1   (o en n1 n2 t (n1  n2  2) se halla el valor t

porcentaje), en la distribución T



(1 ; n1  n2  2) 2

tal que

P[t  T  t ]  1   . Intervalos de estimación de 1  2

1



 2

2

t

0



(1 ; n1  n2  2) 2

X1  X 2

a Intervalo de

P[( X1  X 2 )  (t



(1 ;n1  n2  2) 2

t

T



(1 ; n1  n2  2) 2

1  2

b

)(S x1  x2 )  1  2  ( X1  X 2 )  (t



(1 ; n1  n2  2) 2

)(S x1  x2 )]  1  

Siendo el intervalo a determinar:

( X1  X 2 )  (t



(1 ;n1  n2  2) 2

)(S x1  x2 )  1  2  ( X1  X 2 )  (t



(1 ; n1  n2 2) 2

)(S x1  x2 )


, es posible aproximar los valores de mediante la distribución normal estándar

Ejemplo 01 El agente de una cadena de restaurantes va a decidir adquirir entre dos variedades de arroz A y B. para tomar la decisión estadística comparando la calidad, se escogieron dos muestras aleatorias independientes de 10 bolsas de arroz de un kilo cada uno de las dos variedades de arroz y se observaron los siguientes porcentajes de granos quebrados por kilo: 1 2 3 4 5 6 7 8 9 10 Variedad: A 6 5 6 7 4 7 6 4 3 6 Variedad: B 7 6 7 9 5 8 7 6 10 8

Obtenga el intervalo de confianza del 95% de la diferencia de los promedios de porcentajes de gramos quebrados por kilos de arroz de las dos variedades. ¿Es válido concluir que no hay diferencias significativas entre las dos medias poblacionales? Suponga que las poblaciones de los porcentajes de gramos quebrados por kilo de A y B se distribuyen normalmente con la misma varianza. Paso 01 Clasificación de datos:

i

x1

x1  x

( x1  x )2

i

x1

x1  x

( x1  x )2

1 2 3 4 5 6 7 8 9 10

6 5 6 7 4 7 6 4 3 6 54

0.6 -0.4 0.6 1.6 -1.4 1.6 0.6 -1.4 -2.4 0.6

0.36 0.16 0.36 2.56 1.96 2.56 0.36 1.96 5.76 0.36 16.4

1 2 3 4 5 6 7 8 9 10

7 6 7 9 5 8 7 6 10 8 73

-0.3 -1.3 -0.3 1.7 -2.3 0.7 -0.3 -1.3 2.7 0.7

0.09 1.69 0.09 2.89 5.29 0.49 0.09 1.69 7.29 0.49 20.1

10

S12 

 ( x1  x )2 i 1

n1  1

10

16.40   1.82 9

S2 2 

 (x  x ) i 1

1

n1  1

2



20.10  2.23 9 6

Lic. Araujo Cajamarca, Raul

Empresas A

B

n1  10

n2  10

X1  5.40 S1  1.3499

X 2  7.30 S2  1.4944


X1  X 2  5.40  7.30  1.90 Paso 03: El error típico de la diferencia de dos medias Muestrales es:

Sc 2 

(n1  1) S12  (n2  1) S2 2 (10  1)1.82  (10  1)2.23 9(1.82)  9(2.23)    2.03 n1  n2  2 10  10  2 18

S x1  x2

Sc 2 Sc 2 2.03 2.03      0.64 n1 n2 10 10


  0.05 Paso 05: Calculando t



(1 , n1  n2  2) 2

t

(1

0.05 ;1010 2) 2

 t(0.975;18)  2.101

Paso 06:

 Los limites inferiores y superiores respectivamente de 1  2 son:

( X1  X 2 )  (t



(1 ;n1  n2  2) 2

)(S x1  x2 )  1  2  ( X1  X 2 )  (t



(1 ; n1  n2 2) 2

)(S x1  x2 ) Remplazando

valores tenemos:

(5.40  7.30)  (2.101)(0.64)  1  2  (5.40  7.30)  (2.101)(0.64) 3.2379  1  2  0.5621


Dado que 1  2  0 no pertenece al intervalo de confianza, no se debe aceptar que 1  2 además el intervalo es negativo, entonces 1  2 . Ejemplo 02 La vida útil promedio de una muestra aleatoria de n1  10 focos es X1  4600 horas con

S1  250 horas. Para otra marca de focos, la vida útil promedio y la desviación estándar para una muestra de n2  8 focos son X 2  4000 horas y S2  200 horas. Se asume que la vida útil de los focos de ambas marcas tiene una distribución normal. El intervalo de confianza del 90% para estimar la diferencia entre las vidas útiles promedio de las dos marcas de focos es. Solución: Paso 01 Clasificación de datos:

Empresas A

B

n1  10

n2  8

X1  4600 S1  250

X 2  4000 S2  200


X1  X 2  4600  4000  600 Paso 03: Asumimos que  12   2 2 La varianza muestral común es:

(n1  1) S12  (n2  1) S2 2 (10  1)2502  (8  1)2002 9(2502 )  7(2002 ) Sc     52656.25 n1  n2  2 10  8  2 16 2

El error típico de la diferencia de dos medias Muestrales es:

S x1  x2 

Sc 2 Sc 2 52625.25 52625.25     108.8149 n1 n2 10 8 8

Lic. Araujo Cajamarca, Raul





(1 , n1  n2  2) 2

t

(1

0.10 ;10 8 2) 2

 t(0.95;16)  1.746

Paso 06:


( X1  X 2 )  (t



(1 ;n1  n2  2) 2

)(S x1  x2 )  1  2  ( X1  X 2 )  (t



(1 ; n1  n2 2) 2

)(S x1  x2 ) Remplazando

valores tenemos:

(4600  4000)  (1.746)(108.8149)  1  2  (4600  4000)  (1.746)(108.8149) 410.0092  1  2  790.2924 Así puede afirmarse con una confianza del 90%, que la primera marca de focos tiene una vida útil promedio mayor que la segunda, en una cantidad entre 40 y 790 horas. 2.2. Con varianzas desconocidas supuestas distintas

Si las varianzas de las dos poblaciones normales independientes son desconocidas pero supuestas diferentes, entonces: Si X 1 y X 2 son las medias que resultan de dos muestras independientes de tamaño n1 y n2 escogidas respectivamente de dos poblaciones normales con varianza  12

y

 22

desconocidas supuestas distintas entonces, el intervalo de confianza ( 1   ) 100% de 1  2 es:

P[( X1  X 2 )  (t



(1 ;r ) 2

( X1  X 2 )  (t



)(S x1  x2 )  1  2  ( X 1  X 2 )  (t( r ) )(S x1  x2 )]  1  

(1 ;r ) 2

)( S x1  x2 )  1  2  ( X1  X 2 )  (t



(1 ; r ) 2

)( S x1  x2 )


2

 S12 S 2 2  n  n  2  Donde r   1 2 2  S12   S22  n     1    n2  n1  1 n2  1

S x1  x2

S12 S2 2   n1 n2

r  Entero Ejemplo 01 Se lleva a cabo un estudio para comparar los montos de los préstamos personales realizadas por dos entidades financieras A y B. con este fin se tomaron 9 y 8 préstamos al azar de cada banco resultando los siguientes montos en miles de soles: 1 2 3 4 5 6 7 8 9 Variedad: A 12 28 10 25 24 19 22 33 17 Variedad: B 16 20 16 20 16 17 15 21 -

Aplicando un intervalo de estimación del 95% para la verdadera diferencia de los montos promedios, ¿Es válido inferir que en promedio el monto de los préstamos del banco A es mayor a los del banco B? datos históricos indican que la distribución de estos préstamos en cada banco, es normal con varianzas diferentes. Solución: Paso 01 Clasificación de datos:

i

xi

xi  x

( xi  x )2

i

xi

xi  x

( xi  x )2

1 2 3 4 5 6 7 8 9

12 28 10 25 24 19 22 33 17 190

-9.11 6.89 -11.11 3.89 2.89 -2.11 0.89 11.89 -4.11

82.99 47.47 123.43 15.13 8.35 4.45 0.79 141.37 16.89 440.87

1 2 3 4 5 6 7 8

16 20 16 20 16 17 15 21

-1.63 2.37 -1.63 2.37 -1.63 -0.63 -2.63 3.37

2.66 5.62 2.66 5.62 2.66 0.4 6.92 11.36

141

37.9


Empresas A

B

n1  9

n2  8

X1  21.11

X 2  17.625

S12  55.1088

S2 2  5.4143


X1  X 2  21.11  17.625  3.485 Paso 03: Las varianzas son  12   2 2 Calculamos r : 2

2  S12 S2 2   55.1088 5.4143    n n2  (6.80) 2 8   9 r   12    9.7304 2 2 2 4.7521  S12   S2 2   55.1088   5.4143  n     9   8   1    n2   8 7 n1  1 n2  1

r  9.7304  10 El error típico de la diferencia de dos medias Muestrales es:

S x1  x2 

S12 S2 2 55.1088 5.4143     2.6077 n1 n2 9 8





(1 , r ) 2

t

(1

0.05 ;101) 2

 t(0.975;9)  2.228

Paso 06:



( X1  X 2 )  (t



(1 ;r ) 2

)( S x1  x2 )  1  2  ( X1  X 2 )  (t



(1 ; r ) 2

)( S x1  x2 )

Remplazando valores tenemos:

(21.11 17.625)  (2.228)(2.6077)  1  2  (21.1111 17.625)  (2.228)(2.6077) 2.3250  1  2  9.2950 Dado que 1  2  0   2.3250;9.2950 podemos concluir que: 1  2 , por tanto, los montos promedios de los préstamos son iguales.


Intervalos de Confianza Para La Diferencia Entre Dos Medias Poblacionales

Recommend Documents