ESTADISTICA INFERENCIAL TAREA 4.1 Ji-cuadrada y Análisis de Varianza 1. Un gerente de una fábrica está preocupado porque su producto en el mercado de se distribuye en forma dispareja en el país. En una encuesta en la que se dividió al país en cuatro regiones geográficas, se tomó un muestreo aleatorio de 100 consumidores en cada región, con los siguientes resultados ! "un#$s%
RE&I'N C$s#a (rien#e
Sierra C$*"ra N$ c$*"ra
!0 #0
"" !"
&alá"a)$ s
!" ""
"0 ""
a% $alcule el valor χ% de la muestra. f e =
( ∑ fila ) ( ∑ columna )
∑ total
&ierra $ompra +o compra )otal
$ompra +o compra
( fo−fe )2 fe
$osta
'riente
!0
""
#0 100
!" 100
(alápagos )otal !" "0 1*0
"" 100
"" 10"
%1" !0"
-E$UE+$/& E&E-//& &i & ie r r a $osta 'riente (alápagos !#,*1 !#,*1 !#,*1 !#,*1 "2,0*
"2,0*
"2,0*
"2,0*
=¿ 6,40
❑2=∑ ¿
fo
❑2
fe !0 #0 ""
!#,*1 "2,0* !#,*1
1,0% 0,*0 1,!0
!" !" "" "0 ""
"2,0* "2,0* "!,22 "","# "#,30
1,%2 1,%2 0,01 0,"# 0,0# #,!0
+% Estable4ca las 5ipótesis nula y alternativa. H o : 6as ventas del producto son independientes de las 4onas de venta H 1 :
6as ventas del producto no son independientes de las 4onas de venta
c% ara α 7 0.0", pruebe si la distribución del producto es la misma en las cuatro regiones
)rad$s de li+er#ad, *-1%n-1%-1%4-1%! ❑2crít =7,815
7,81
0
6,40
$omo
❑2cal <7,815 +o se rec5a4a 8o $onclusión 6a distribución del producto es la misma en las cuatro regiones
. ara el nivel de significancia de 0.10, 9se puede concluir que las siguientes !00 observaciones siguen una distribución de oisson con una media igual a 2: ! "un#$s% / de recla*$s "$r 0$ra / de 0$ras
0 %0
1 ";
% *3
2 3"
! ;3
" o más #%
Establecer 5ipótesis 8o 6os reclamos por 5ora tienen una distribución de poisson 81 6os reclamos por 5ora no tienen una distribución de poisson Establecer nivel de significación λ =3 x
− λ
λ e P ( x )= x !
recuencias esperadas robabilidad de oisson 0 −3 3 e = 0,049 P ( x = 0 )= 0ǃ
1
−3
P ( x = 1 )=
3 e
P ( x = 2 )=
3 e
1ǃ 2
=0,149
−3
2ǃ
=0,224
3 −3 3 e ( ) =0,224 P x = 3 =
3ǃ
4 −3 3 e ( ) = 0,168 P x = 4 =
4ǃ
P ( x ≥ 5 ) =1− P ( x < 5 ) P ( x ≥ 5 ) =1−[ P ( x =0 ) + P ( x =1 ) + P ( x =2 )+ P ( x =3 )+ P ( x = 4 ) ] P ( x ≥ 5 ) =1−( 0,049 + 0,149 + 0,224 + 0,224 + 0,168 )
P ( x ≥ 5 ) =0,186 < reclamos por 5ora 0 1 % 2 ! " o más
(rados de libertad7m=>=17#=1=17!
❑2crít =7,779
robabilida d de recuenci oisson a esperada 0,0!* 1*,# 0,1!* "*,# 0,%%! 3*,# 0,%%! 3*,# 0,1#3 #;,% 0,13# ;!,!
eterminar el estadístico de contraste
[
( fo−fe )2 fe
]
=¿ 4,95
❑2cal=∑ ¿ < reclamos por 5ora
< de 5oras 0 1 % 2 !
%0 "; *3 3" ;3 #%
" o más
recuencia esperada 1*,# "*,# 3*,# 3*,# #;,% ;!,!
❑2 0,01 0,11 0,;* 0,%! 1,;! %,0; !,*"
Establecer regla de decisión
0
&i
❑2cal >7,779
4,95 7,779
-ec5a4ar 5ipótesis nula
$onclusión $omo !,*"?;,;;* no se rec5a4a la 5ipótesis nula, es decir, es decir que las observaciones siguen la distribución de oisson.
!. Un jugador profesional de futbol, estuvo frente al arco de equipo contrario cinco veces en cada uno de 100 juegos. Este jugador asegura que tiene una probabilidad de 0.! de 5acer un gol cada ve4 que se encuentra frente al arco del equipo contrario. ruebe esta afirmación al nivel de significancia de 0.0", verificando si los datos tienen una distribución binomial @p 7 0.!A.@+ota combine clases si el nBmero esperado de observaciones es menor que "A ! "un#$s%
/ de eces 2ren#e al arc$ "$r 3ue)$
/ de 3ue)$s
0 1 % 2 !
1% 23 %; 1; "
" Establecer 5ipótesis 8o la población es binomial 81 la población no es binomial Establecer el nivel de significación α =0,05 (rados de libertad >=m=17#=0=17"
❑2crít =11,070 eterminar el estadístico de contraste n =5 p=0,4
P ( x )= [ nCr ] [ p
x
] [ ( 1− p )n− x]
P ( x = 0 )=[ 5 C 0 ] [ 0,4
P ( x =1 )=[ 5 C 1 ] [ 0,4 P ( x = 2 )=[ 5 C 2 ] [ 0,4
5
1
2
P ( x = 3 )=[ 5 C 3 ] [ 0,4
3
P ( x = 4 )=[ 5 C 4 ] [ 0,4 P ( x = 5 )=[ 5 C 5 ] [ 0,4
] ( 1− 0,4 ) − =0,078
0
] ( 1− 0,4 ) − =0,259 5
1
] ( 1− 0,4 ) − = 0,346 5
2
] ( 1−0,4 ) − =0,23 5
4
5
0
3
] ( 1−0,4 ) − = 0,077 5
4
] ( 1−0,4 ) − =0,010 5 5
Probabilid Frecuenc ad ia binomial esperada 0,0;3 ;,3 0,%"* %",* 0,2!# 2!,# 0,%2 %2 0,0;; ;,; 0,01 1
[
( fo−fe )2 fe
]
=¿ 11,99
❑2cal=∑ ¿
1
# de veces frente al arco
# de juegos 0 1 % 2 !
recuencia esperada 1% 23 %; 1; #
;,3 %",* 2!,# %2 3,;
❑2 %,%# ",#" 1,#; 1,"; 0,3! 11,**
-egla de decisión
0
&i
11,070 11,99
❑2cal > 11,070 &e rec5a4a 8o
$onclusión $omo 11,**C11,0;0 se rec5a4a 8o, se concluye que la capacidad de 5acer un gol no es de 0,!.
4. 6os datos corresponden a una distribución de frecuencias observadas. Use una distribución normal con una media de " y desviación igual 1." 4 "un#$s% a% encuentre la probabilidad de falla en cada clase. +% a partir del a% calcule la frecuencia esperada para cada categoría. c% calcule el estadístico ji=cuadrada. d% para un nivel de significancia de 0.10, 9parece que esta distribución de frecuencias está bien descrita por la distribución normal sugerida:
Val$r $+serad$ de ? %.# la aria+le Frecuencia # $+serada
%.#=2.;*
2.3=!.**
"=#.1*
#.%=;.2*
D ;.!
20
!1
"%
1%
*
@FA
@FA
a% intervalo
fo
0 %,# 2,3 " #,% ;,!
%,# 2,;* !,** #,1* ;,2*
# =2,2222 =1,#0 20 =1,# =0,31 !1 =0,3 =0,01 "% 0 0,;* 1% 0,3 1,"* * 1,# o más
0,!!"% 0,%331 0 0,%331 0,!!"%
0,!!"% 0,%*1 0,00! 0,%3"% 0,!!!1
interval o 0,0"!3 0,1"!% 0,%3!1 0,%3"% 0,1"# 0,0"!3
+% @FA interval o fe 0,0"!3 3,%% 0,1"!% %2,12 0,%3!1 !%,#1" 0,%3"% !%,;3 0,1"# %2,! 0,0"!3 3,%%
c%
[
( fo−fe )2 fe
]
=¿ 10,32
❑2cal =∑ ¿
fo
fe # 3,%% 20 %2,12 !1 !%,#1" "% !%,;3 1% %2,! * 3,%% &umatoria
❑2cal 0,#0 %,0! 0,0# 1,** ","" 0,0; 10,2%
d% 5lan#ea*ien#$ de 0i"6#esis 8o6os datos siguen una distribución normal con una media de " y desviación estándar de 1," 81 6os datos no siguen una distribución normal con una media de " y desviación estándar de 1," +ivel de significancia α =0,10
Estadístico de prueba
[
( fo−fe )2 fe
]
=¿ 10,32
❑2cal =∑ ¿
-egla de decisión &i
❑2cal >❑2crít &e rec5a4a 8o
ecisión gl7>=m=17#=0=17"
0
9,23
10,32
❑2crit =9,236 $omo 10,2%C*,%2 se rec5a4a 8o, por lo tanto los datos no siguen una distribución normal.
7. Una empresa entrega cal4ado deportivo a muc5os almacenes en la ciudad. urante los Bltimos 10 días, un almacGn del centro de la ciudad 5a promediado * productos rec5a4ados, con una desviación estándar de % rec5a4os por día. 'tro almacGn del norte de la ciudad, promedió 3." productos rec5a4ados, con una desviación estándar de 1." rec5a4os durante el mismo periodo. $on un nivel de significancia de 0.0", 9podría concluir que 5ay más variación en el nBmero de productos rec5a4ados por día en el centro de la ciudad: ! "un#$s% atos n = 10 $entro de ciudad ´ 1= 9 X
S 1=2 +orte de la ciudad ´ 2= 8,5 X
S 2=1,5 α =0,05
lanteo de 5ipótesis 2
8o
2
σ 1 ≤σ 2
Henor variación en el nBmero de productos rec5a4ados por día en el
centro de la ciudad 2
81
σ 1 > σ 2
2
Hayor variación en el nBmero de productos rec5a4ados por día en el
centro de la ciudad +ivel de significancia (rados de libertad numerador n1=1710=17* (rados de libertad denominador n%=1710=17*
F crít = 3,18 Estadístico de prueba 2 S1 (2 )2 =1,77 F = 2 = 2 S2 ( 1,5 ) -egla de decisión &i calCcrit &e rec5a4a 8o $onclusión $omo 1,;;?2,13 +o se rec5a4a 8o, entonces se concluye que no 5ay mayor variación en el nBmero de productos rec5a4ados por día en el centro de la ciudad.
8. Una empresa que produce terminados para vivienda, prueba un nuevo producto en el mercado, del cual se 5an colocado en tres lugares distintos de eI5ibición dentro de una ciudad. / continuación se reporta la cantidad de cajas de ! m % que se vendieron en cada lugar de eI5ibición de la ciudad. 4 "un#$s%
9+icaci6n de la e:0i+ici6n En el n$r#e de la ciudad En el cen#r$ de la ciudad En el sur de la ciudad
Can#idad de ca3as de 4 * endidas 13
1!
1*
1;
1%
13
10
1#
%#
%3
20
2%
/ un nivel de significancia de 0.0", 95ay alguna diferencia entre los promedios del nBmero de cajas promedio que se vendieron en los tres lugares:
a% ormule las 5ipótesis nula y alternativa. 8o J17J%7J27J! K El promedio del nBmero de cajas promedio que se vendieron en los tres lugares son iguales
81 +o todos los promedios del nBmero de cajas promedio que se vendieron en los tres lugares son iguales +% 9$uál es la regla de decisión: (rados de libertad del numerador 2=17!=17% (rados de libertad del denominador n=>71%=27* Fcrít = 4,26
c% $alcule los valores de && total, &&) y &&E. +orte de la $entro de la ciudad ciudad &ur de la ciudad F FM% F FM% F FM% 13 2%! 1% 1!! %# #;# 1! 1*# 13 2%! %3 ;3! 1* 2#1 10 100 20 *00 1; %3* 1# %"# 2% 10%! #3 11;0 "# 3%! 11# 223! ! ! ! %!0 "2;3
+L 1 % 2 ! )c nc F FM%
SS total
SS total
= ∑ X − %
= "2;3 −
T SST = ∑ n
%
c
c
( ∑ X )
%
n
%!0 1%
%
= ";3
( ∑ X ) − n
#3 "# 11# SST = ! + ! + ! %
SSE
%
%
%
%!0 − 1% = "0! %
= SS − SST total
SSE =578 −504=74
d% Elabore una tabla /+'N/. uente de Nariación )ratamiento Error )otal
&uma de cuadrados "0! ;! ";3
(rados de libertad
$uadrado medio % * 11
Nalor %"% 20,#" 3,%%
e% 9$uál es su decisión respecto de la 5ipótesis nula: $omo 20,#"C!,*# &e rec5a4a 8o, por lo tanto se determina que no todos los promedios del nBmero de cajas promedio que se vendieron en los tres lugares son iguales.