Intervalos de Confianza: dos poblaciones Prof.: Jaime Pérez-Kallens L. 1.- Intervalo de Confianza para diferencia de medias de poblaciones 2 2 independientes con varianzas conocidas 1 y 2 respectivamente.
Estimador y estadístico: x1 N ( 1 ; 12 ) x 2 N (
2 2 2
;
2
)
x1 x2 N ( 1 2 ;
1
n1
2
2
n2
)
El estadístico para este caso es:
z
( x1 x 2 ) ( 1 2 ) 2
1
2
n1
tiende a !na distri"!ci#n normal est$ndar
2
n2
%nter&alo de confianza con !n ni&el de confianza de 1-
2
P (( x1 x2 ) z
1 2
n1
2
2
n2
2
1 2 ( x1 x2 ) z
1 2
n1
2
2
n2
) 1
Ejemplo: Se llevan a cabo pruebas de resistencia a la tensión sobre dos diferentes clas clases es de larg largue uero ros s de alum alumin inio io utili utiliza zado dos s en la fabr fabric icac ació ión n de avio avione nes s comerciales peue!os. peue!os. "e la e#periencia pasada pasada con el proceso de fabricación fabricación de largueros y del procedimiento de prueba$ se supone ue la desviación est%ndar de las resistencias a la tensión son conocidas. &os datos obtenidos aparecen en la siguiente tabla: 'lase de lar!ero
1 2
ama*o de la m!estra 1 12
+edia m!estral de la resistencia a la tensi#n ( K,mm 2) /0 034
es&iaci#n est$ndar de la po"laci#n ( K,mm2) 1 14
a) En base a esta información entregada previamente$ previamente$ encuentre un intervalo de conf confia ianz nza a para para la dife difere renc ncia ia entr entre e los los prom promed edio ios s pobl poblac acio iona nale les s de la resistencia a la tensión con un nivel de confianza del '(.
1
(/0 033) 134
1222;165/
1. 2
1.
14 2 12
kg , mm 2
b) *"e acuerdo al resultado obtenido en a) u+ puede concluir respecto a la diferencia entre los promedios poblacionales con relación a la resistencia, E#iste diferencia entre la resistencia promedio a la tensión del larguero - y larguero $ ya ue dentro del intervalo de confianza no se incluye el cero.
./Intervalo de Confianza para diferencia de medias de poblaciones normales e independientes$ con varianzas desconocida y suponiendo igualdad entre ellas 2
1
22
P (( x1 x2 ) t
S 2 p
2
n1 n2 2
S p
1
n1
1
n2
1
2 ( x1 x2 ) t
2
n1 n2 2
S p
1
n1
1
n2
) 1
( n1 1) s12 ( n 2 1) s 22 n1 n 2 2
E7emplo:
0n artículo publicado dio a conocer los resultados de un an%lisis del porcentaje de calcio en cemento est%ndar y en cemento contaminado con plomo. &os niveles bajos de calcio indican ue el mecanismo de 1idratación del cemento ueda bloueado y esto permite ue el agua ataue varias partes de una estructura de cemento. 2l tomar diez muestras de cemento est%ndar$ se encontró ue el porcentaje promedio de calcio es de '( con una desviación est%ndar de 34 los resultados obtenidos con -3 muestras de cemento contaminado con plomo fueron de 56 en promedio con una desviación est%ndar de 7. Supóngase ue el porcentaje de calcio est% distribuido de manera normal. Encu+ntrese un intervalo de confianza del '3 para la diferencia entre medias de los dos tipos de cementos. Supóngase ue las dos poblaciones normales tienen la misma varianza.
1. Solución:
El estimador combinado de la varianza es:
2
2l calcular la raíz cuadrada a este valor nos ueda ue sp 8 7.71
( x1 x 2 ) 9 s p
n1
El resultado es
1
n2
8 '(/56)9 $(;' 7$7-
1 1.
1 14
.02;02
Interpretación:
ltima cifra ue no 1ay diferencias.
?./Intervalo de Confianza para diferencia de medias de poblaciones normales e independientes$ con varianzas desconocida y suponiendo diferencia entre ellas 2
1
22
Estimador y estadístico: 2 x1 N ( 1 ; 1 )
2
x1 x2 N ( 1 2 ;
x 2 N ( 2 ; 22 )
1
n1
2
2
n2
)
@ero las varianzas son desconocidas. Ello lleva a estimarlas y 1a generar un nuevo estimador para la varianza de diferencia de medias. Consecutivamente se origina el siguiente estadístico: ( x1 x 2 ) ( 1 2 )
A8
s12 n1
s 22
ue se distribuye como una t/
n2
Student con g.l. grados de libertad ue se obtiene de la siguiente e#presión:
gl
s12 s 22 n1 n2 2
2
2
s 1 s 1 n1 n1 1 n2 n2 1 2 1
2 2
2
6
Intervalo de confianza: @ ( x1 x 2 ) / t 2
s12 g .l .
n1
s 22 n2
1 2
( x1 x 2 ) B t 2
s12 g .l .
n1
s 22 n2
) 8 1
@roblema: 0na compa!ía de ta#is trata de decidir si comprar neum%ticos de la marca 2 o de la para su flotilla de ta#is. @ara estimar la diferencia entre los promedios de desgaste a trav+s de Dms. recorridos$ de las dos marcas$ se lleva a cabo un e#perimento utilizando - de cada marca. &os neum%ticos se utilizan 1asta ue se desgastan$ dando como resultado promedio para la marca 2 ?;.?(( ilómetros$ con una desviación est%ndar de 3((( ilómetros y para la marca ?5.-(( ilómetros con una desviación est%ndar de ;-(( ilómetros. Calcule un intervalo de confianza de '3 para la diferencia promedio de las dos marcas$ si se sabe ue las poblaciones se distribuyen de forma apro#imadamente normal para la marca 2 y para la marca . 2suma ue las dos varianzas poblacionales son distintas. Fesp: G
44114/; 2/4114/ H
4.- INTERVALO E CON!IAN"A #ARA LA $O%&ERVACIONE& #AREAA&)
D
Este es un procedimiento de estimación para la diferencia de dos medias cuando las muestras son dependientes y las varianzas de las dos poblaciones no necesariamente son iguales. &as muestras pareadas involucran un procedimiento en el cual varios pares de observaciones se euiparan de la manera m%s pró#ima posible$ en t+rminos de características relevantes. &os dos grupos de observaciones son diferentes sólo en un aspecto o tratamiento. Aoda diferencia subsiguiente en los dos grupos se atribuye a dic1o tratamiento. &as ventajas de las muestras pareadas son: -) @ueden utilizar muestras peue!as. )
Se encuentran varianzas m%s peue!as.
?)
Jenos grados de libertad se pierden en el an%lisis.
7) Fesulta un error de muestreo m%s peue!o la variación entre observaciones reduce debido a ue corresponden de la forma m%s pró#ima posible).
3
Ktro m+todo para utilizar muestras pareadas a diferencia de la situación ue se describió cuando las muestras son independientes$ las condiciones de las dos poblaciones no se signan de forma aleatoria a las unidades e#perimentales. J%s bien$ cada unidad e#perimental 1omog+nea recibe ambas condiciones poblacionales4 como resultado$ cada unidad e#perimental tiene un par de observaciones$ una para cada población. @or ejemplo$ si realizamos una prueba de una nueva dieta con -3 individuos$ el peso antes y despu+s de llevar a cabo la dieta forman la información de nuestras dos muestras. Estas dos poblaciones son antes y despu+s y la unidad e#perimental es el individuo. Kbviamente las observaciones en un par tienen algo en com>n. @ara determinar si la dieta es efectiva consideramos las diferencias d -$ d$ LLdn en las observaciones pareadas. Estas diferencias son los valores de una muestra aleatoria "-$ "$ . . . . . "n de una poblaci'n de diferencias ()e s)pondre*os D
1 2 y varianza
2
D
distrib)idas nor*al*ente con media . Estimamos 2 2 s D mediante d $ la varianza de las diferencias ue constituyen nuestra muestra. El estimador puntual de
D
ser%
d
Se puede establecer un intervalo de confianza de - /
/ tM
)-((
para
D
tM @ / tM N A N tM)
"onde : El estadístico
d D A 8 s se distribuye como una t de Student con n / - grados d n de libertad
d
d i
(d i
S d
d )
2
n 1
n
Intervalo de confianza
P ( d t
s d 2
n 1
n
D d t
s d 2
n 1
n
) 1
4
Ejemplo: Se asume ue se tienen puntajes respecto al tiempo empleado en cierta labor de -( empleados antes y despu+s de 1ab+rseles impartido capacitación laboral adicional. Establezca un intervalo de confianza del '( para la media de la diferencia en los puntajes antes y despu+s de la capacitación. &os puntajes aparecen en la tabla: Solución atos Empleado
@untaje antes de &a capacitación del empleado
@untaje despu+s de &a capacitación del empleado
d i
d i2
'.( 6.? ;.6 3.? 5.6 ;.? 6.' 6.? 5.( 5.( 6.7
'. 5. 5.3 7.' 5.' 3.5 5. 6.5 '.3 5.3 6.'
/(. /(.' /-.5 (.7 /(. (.3 /(.? /(.3 /-.3 /(.3 /3.(
(.(7 (.5?.7 (.-; (.(7 (.3 (.(' (.3 .3 (.3 6.?5
? 7 3 ; 6 5 ' -(
Encontrar la estimación puntual y la desviación est%ndar muestral de d.
d 8
4
1. 8 / (.3 estimación puntual de
n
d
2 i
s d 2
nd 2
i 1
n 1
8
06 1( 4) 2 5
D
)
06
"eterminar los valores de la variable aleatoria t de acuerdo al nivel de confianza preestablecido
@ /-.5??
t
-.5?? ) 8 (.'(
Encontrar los límites inferiores y superiores dentro de los cuales se encuentra el par%metro .06 &ímite superior de confianza
D
: /(.3 B -.5??)
1 8 /(.(6?
.06 &ímite inferior de confianza
D
: /(.3 B -.5??)
1 8 /(.'6
Conclusión: "ebido a ue se restan los puntajes posteriores al entrenamiento de los puntajes anteriores al entrenamiento$ produciendo valores negativos$ se puede estar '( seguro de ue la media de los puntajes posteriores al entrenamiento est% entre / (.(6? y / (.'64 ello denotaría ue 1ay una rebaja en los puntajes relativos a los tiempos empleados en cierta labor$ indicando a su vez una mayor eficiencia.
5.- INTERVALO DE CONFIANZA PARA EL COCIENTE DE VARIANZAS DE DOS DISTRIBUCIONES NORMALES
El objetivo es averiguar si 1ay diferencias entre las dos varianzas poblacionales. Supóngase ue se tienen dos poblaciones normales e independientes con 2 2 varianzas desconocidas 1 2 $ respectivamente. "e este par de poblaciones$ se tiene disponible dos muestras aleatorias de tama!os n1 y n2 $ 2
2
respectivamente4 sean s1 y s 2 las dos varianzas muestrales. Se desea encontrar un intervalo de confianza del -((- / ) por ciento para el cociente 2 2 de las varianzas$ 1 , 2 . @ara 1allar el intervalo de confianza$ recu+rdese ue la distribución de muestreo de
0
( n1 1) s12 2
1
F
n1 1
( n 2 1) s 22
2
2
2
s1
(
)(
2
s 2
2
2
)
1
2
n2 1
es !na 8 de 8is9er con n1 1 (en el n!merador) n2 li"ertad. Esta distri"!ci#n aparece en la fi!ra
1 (denominador)
rados de
, 2
, 2
1
f 1
f
2
2
L!eo la constr!cci#n del inter&alo de confianza del cociente se 9ar$:
e modo !e la &arianza m!estral maor !ede en el n!merador del estadístico 8. ;sí
F
2
2
2
2
2
s1 2
1
2
s2 1
2
s1
2
Fs2
2
Por consi!iente el inter&alo de confianza es::
2 1 s12 s12 2 1 P 2 2 f n 1;n 2 s 2 2 f 1 n 1n 1 s 2 2 2
1
2
1
2
f
1 1 n1 1 n21 1 2 n 1 n1 1 f 2 2
n1 : corresponde al tama*o de la m!estra asociada a la &arianza m!estral mas rande.
E+e*plo:
/
0na empresa 1a estado e#perimentando con dos disposiciones físicas distintas de su línea de ensamble. Se 1a determinado ue ambas disposiciones producen apro#imadamente el mismo n>mero de unidades terminadas al día. 2 fin de obtener una disposición ue permita un mayor control del proceso$ usted sugiere ue se adopte de manera permanente la disposición ue e#1iba la varianza m%s peue!a en el n>mero de terminadas producidas al día. "os muestra aleatorias independientes producen los resultados ue se muestran en la tabla de m%s abajo. Establezca un intervalo de confianza del '3 para el cociente de las varianzas poblacionales
2 1
2 2
. En base al resultado obtenido$
*cu%l de los dos disposiciones recomendaría 0d. ,
Línea de ensam"le 2 n = 24 1
s 22 1362
s12 601
Estimaci#n p!nt!al 2
1
601 1362 (estimador p!nt!al insesado de
-
2
2
)
>i&el de confianza 54
Encontrar los límites inferiores s!periores dentro de los c!ales se enc!entra el cociente de los par$metros
2
1
Límite s!perior de confianza de
2 2
:
601 1 ( )( ) 1362 2620
1125
2
1
Límite inferior de confianza de
2
2
: 601 1 1362 23./
1.5.0
5
'oncl!si#n: 2
1
Se tiene una confianza del '3 ue
2
2
este contenida entre -$('(6 y
-$-'. @uesto ue - no est% contenido en el intervalo entonces se puede confiar ue la varianza de la línea - es distinta a la varianza correspondiente para la línea .
,.- INTERVALO E CON!IAN"A #ARA I!ERENCIA& E #RO#ORCIONE&. Oamos a considerar ue tenemos dos poblaciones de modo ue en cada una de ellas estudiamos una variable aleatoria dicotómica ernoulli) de par%metros respectivos p- y p. "e cada población se e#traen muestras de tama!o n- y n$ respectivamente:
Entonces
( p@ 1 p@ 2 ) ( p1 p 2 ) p1 q1
?=
n1
p 2 q 2
tiende a !na normal est$ndar
n2
onde: n2
n1
x1i p@ 1
i 1
n1
x p@ 2
i 1
2i
1 p@ 1 q@1 1 p@ 2 q@ 2
n2
1
@or el mismo razonamiento ue en el caso de una población llegamos a ue una apro#imación para un intervalo de confianza al nivel 1 para la diferencia de proporciones de dos poblaciones es:
P ( p@ 1 p@ 2 z
p@ 1 q@1 2
n1
p@ 2 q@ 2 n2
p1 p 2 p@ 1 p@ 2 z
p@ 1 q@1 2
n1
p@ 2 q@ 2 n2
) 1
Ejemplo Se est% considerando cambiar el procedimiento de manufactura de partes. Se toman muestras del procedimiento actual así como del nuevo para determinar si este >ltimo resulta mejor. Si 63 de -.((( artículos del procedimiento actual presentaron defectos y lo mismo sucedió con 5( de .3(( partes del nuevo$ determine un intervalo de confianza del '( para la verdadera diferencia de proporciones de partes defectuosas. @1 p
04 1...
/01
p@ 2
p@ 1 p@ 2 36
/ 24
/23
..04 A .524 1...
..62 A .5/ 24..
/4
($(7? 9 -$;73P($(('(7 G ($(5 4 ($(36' H Con un nivel de confianza del '( la diferencia entre las proporciones de artículos defectuosos est% contenida entre ($(5 y ($(36'. Ello lleva a concluir ue el nuevo procedimiento sería mejor ue el actual.
11