UNIVERSIDAD NACIONAL DE CAJAMARCA SEDE – JAÉN FACULTAD DE INGENIERIA ESCUELA ACADÉMICO PROFESIONAL DE INGENIERIA CIVIL
RESOLUCIÓN DE ESTADÍSTICA GENERAL 1. El salario medio por semana en miles miles de pesetas de de 160 obreros obreros se distribuye distribuye de la siguiente forma. forma. Intervalos 4 - 8 8 - 12 12- 16 16- 20 20- 24 24- 28 28- 32 32- 36 TOTAL
fi 3 12 40 47 32 13 9 4 160
Se pide: a. Calcular la media aritmética. b. Realizar una redistribución en la que los intervalos tengan una una amplitud de 8, y con los nuevos intervalos, calcular la media aritmética. Comparar los resultados obtenidos con los del apartado a.
Solución a. Calcular la media aritmética. Intervalos 4 - 8 8 - 12 12- 16 16- 20 20- 24 24- 28 28- 32 32- 36 TOTAL
∗
3 12 40 47 32 13 9 4 160
6 10 14 18 22 26 30 34 -
18 120 560 846 704 338 270 136
Entonces la media aritmética para este caso, que son datos agrupados seria:
∑ 5600 84 8466 16070 7044 33 3388 27 2700 13 1366 2160992 18.7 ̅ = ∗ 18 120120 56
∴
El promedio por semana en miles de pesetas de 160 obreros es de 18.7. b. Realizar una redistribución en la que los intervalos tengan una amplitud de 8, y con los nuevos intervalos, calcular la media aritmética. Comparar los resultados obtenidos con los del apartado a.
Intervalos 4 - 12 12 - 20 20- 28 28 – 28 – 36 TOTAL
∗
15 87 45 13 160
8 16 24 32 -
120 1392 1080 416 -
La media aritmética:
x ∑=nx ∗ f 120 1392 1392160 1080 1080 416416 3160008 18.8 ∴
El promedio por semana en miles de pesetas de 160 obreros es de 18.8.
Entonces al comparar, observamos que hay una variación de 0.1, algo que no es muy notable para cambiar de una manera drástica los resultados.
2. Dada la siguiente tabla estadística: Número de horas de estudio Número de alumnos
1 5
2 15
3 20
4 8
5 2
a. Hallar las medidas de tendencia central. Solución Calculando la media o promedio.
50 ̅ ∑= 1 2 3504 5 1505 0.3 ∴
Como son datos sin agrupar procederemos a usar la siguiente formula:
El promedio de horas que un estudiante emplea a estudiar es 0.3.
-
Calculando la mediana. Como son datos sin agrupar y “n” es impar, se ordena y se localiza en dato de en medio.
1 – 2 – 3 – 4 – 5 ME
-
Calculando la moda. Como ya sabemos son datos sin agrupar, entonces dirigimos nuestra atención a la tabla principal del problema, observando cuál es la mayor cantidad de personas que estudia cierto determinado número de horas.
∴
La moda es de tres horas, es decir que la mayor cantidad de personas (que viene hacer veinte) estudia 3 horas.
3. La distribución de las acciones de una determinada sociedad viene dada de la siguiente forma: Número de acciones 0-20 20-28 28-32 32-48
Número de accionistas 10 32 50 8
Se pide calcular los estadísticos descriptivos conocidos. Interprete
Solución N° de acciones 0-20 20-28 28-32 32-48 TOTAL -
N° de accionistas 10 32 50 8 100
10 24 30 40 -
× 100 768 1500 320 -
10 42 92 100 -
̅ ∑= × 1007681001500 320 2100688 26.88
Media o promedio aritmético.
∴ -
El promedio de acciones de determinada sociedad es de 26.88.
Mediana. Como son para datos agrupados; entonces:
−
[ ]× → 50 100 28 ⁄502 32× 28 [505032]×4 28 18504 29.44 ∴ ; Como
La mitad de la muestra tiene acciones desde 0 a 29.44.
-
Moda.
Como es para datos agrupados; entonces:
[ ]× 50 32 18 2850 32 ×12 28 [ 50 8 18 42]×12 28 [1860]×12 28 185 31.6 ∴ , ⁄4 −× 1,2 3 × 25 × 50 × 75 20[253210]×8 20 1532×8 23.75 ∴
La mayoría de los accionistas tienen un número de acciones de 31.6.
-
Cuartiles.
Se usa la siguiente fórmula para encontrar los
:
Entonces, se procede a calcular los “ ” para cuando
Ya encontrando estos datos procedemos:
Para
:
El 25% de los accionistas tienes acciones comprendidas entre 0 a 23.73.
Para
:
8 28 [5042 ]×4 28 50 50×4 28.64 ∴ 33 28 [7542 ]×4 28 50 50×4 30.64 ∴ ,, …, ⁄10 − × 1,2,3,…,9. × × 10 × 20 × 30 × 40 50
El 50% de los accionistas tienes acciones comprendidas entre 0 a 28.64.
Para
:
El 75% de los accionistas tienes acciones comprendidas entre 0 a 30.64.
-
Deciles.
Se usa la siguiente fórmula para encontrar los
:
Entonces, se procede a calcular los “ ” para cuando
× 60 × 70 × 80 × 90
Ya encontrando estos datos procedemos:
0 [10100]×20 20 ∴ 20 [203210 ]×8 22.5 ∴ 20 [303210]×8 25 ∴ 20 [403210 ]×8 27.5 ∴
Para
:
El 10% de los accionistas tienes acciones comprendidas entre 0 a 20.
Para
:
El 20% de los accionistas tienes acciones comprendidas entre 0 a 22.5.
Para
:
El 30% de los accionistas tienes acciones comprendidas entre 0 a 25.
Para
:
El 40% de los accionistas tienes acciones comprendidas entre 0 a 27.5.
28 [505042]×4 28.64 ∴ 28 [605042]×4 29.44 ∴ 28 [705042]×4 30.24 ∴ 28 [805042]×4 31.04 ∴ 28 [0942 50 ]×4 31.84 ∴
Para
:
El 50% de los accionistas tienes acciones comprendidas entre 0 a 28.64.
Para
:
El 60% de los accionistas tienes acciones comprendidas entre 0 a 29.44.
Para
:
El 70% de los accionistas tienes acciones comprendidas entre 0 a 30.24.
Para
:
El 80% de los accionistas tienes acciones comprendidas entre 0 a 31.04.
Para
:
El 90% de los accionistas tienes acciones comprendidas entre 0 a 31.84.
DATO: Los percentiles se calculan similarmente con la formula, solamente que cambia en “
-
Desviación estándar. Como n=100; entonces
∑= ̿ ×
≥ 30
se procede a calcular por la siguiente fórmula:
Entonces al reemplazar valores tendremos:
2849.344 265.4208100486.72 1377.0752 4978.10056 √ 49.7856 7.056 ∴
INTERPRETACIÓN: La desviación estándar de 7.056 con respecto a la media.
”.
-
Coeficiente de variación. Se aplicará la siguiente fórmula:
̅ × 100 726..05688 × 100 26.25%
Entonces procedemos a reemplazar valores:
INTERPRETACIÓN: la media tiene baja representatividad. -
Asimetría. a) Asimetría por cuartiles (As).
28.756423.75 30.64 28.30.664 4 23. 8 9 2. 8 9 24. 6.89 6.89 0.419
INTERPRETACIÓN: Asimétrica a la izquierda.
b) Asimetría por deciles (As).
31.84 28.31.684 4 2028.6420 3.211. 88.464 11.5.8444 0.459
INTERPRETACIÓN: asimétrica a la izquierda.
c) Primer coeficiente de Pearson (As).
̅ 6 4. 7 2 26.87.8031. 56 7.056 669
INTERPRETACIÓN: asimetría a la izquierda.
d) Segundo coeficiente de Pearson (As).
3̅ 326.87.805629.44 32.7.05656 1.088
INTERPRETACIÓN: asimetría a la izquierda. e) Tercer momento (As).
̅ ∑ ∙ ∗ 1518. 5 664 18067. 2 2662 48096.92672 764.411904 100 ∙7.056 29275.7.504564 100∙ 56 0.833 INTERPRETACIÓN: asimetría de la izquierda
-
Kurtosis.
̅ ∑ ∙ ∗ 3 9 27168 237042. 0 133 811876.123 2201.506284100 4737. 3 ∙7.056 5 7 1001055857. ∙7.056 3 1.259621883 INTERPRETACIÓN: leprocurtica.
4. En una zona de Jaén, la superficie de las viviendas sigue la siguiente distribución:
Superficie ( 50-60 60-70 70-80 80-100 100-120
Frecuencia relativa (%) 20 25 15 25 15
Calcular: a) b) c) d)
La superficie media por vivienda. Los tipos de vivienda que dividen la distribución en cuatro partes iguales. El tipo de vivienda más frecuente. La superficie de vivienda que no es superada por el 36% de las viviendas.
Solución
Superficie ( 50 -60 60 -70 70 -80 80 -100 100-120 TOTAL
ℎ )
% 20 25 15 25 15 -
55 65 75 90 110 -
a) La superficie media por vivienda.
% 20 45 60 85 100 -
0.20 n 0.25 n 0.15 n 0.25 n 0.15 n n
∑ ̅ = ∗ 11 16.25 11.25 22.5 16.5 77.5 77.5 77.5 La superficie promedio por vivienda es de
0.20 0.45 0.60 0.85 1n
n n n n
b) Los tipos de vivienda que dividen la distribución en cuatro partes iguales.
Para esto se usaran cuartiles, entonces encontramos “ ”, para j=1, 2,3 y 4.
× 0.25 × 0.50
Entonces:
60 [0.250.20.5 20]×10 60 0.0.0255 ×10 62 ∴ 62 70 [0.500.10.5 45]×10 70 0.0.0155 ×10 73.33 ∴ 73.33 80 [0.750.20.5 60]×20 80 0.0.1255 ×20 92 ∴ 92 120 ∴ 120
Para
:
El 25% de viviendas tienen una superficie de 50 0
Para
:
El 50% de viviendas tienen una superficie de 50 0
Para
.
.
:
El 75% de viviendas tienen una superficie de 50 0
Para
:
El 100% de viviendas tienen una superficie de 50 0
.
× 0.75 × 1
c)
El tipo de vivienda más frecuente.
Esto significa calcular la moda , notamos que es bimodal para los intervalos de 60-70 y 80-100 ello se aplicará la siguiente fórmula:
[ ]× + × 60 [0.0.0155]×10 63.33 ∴ + × 80 [0.0.1200]×20 90 ∴ × 0.36, ⁄100 =∗ 60 [0.360.20.5 20 ]∗10 66.4 ∴
.
Para
La mayoría de las viviendas tienen una superficie de
63.33
La mayoría de las viviendas tienen una superficie de
90
.
.
d) La superficie de vivienda que no es superada por el 36% de las viviendas. Lo calculamos los percentiles:
entonces:
La superficie que no supera el 36% de viviendas es de 66.4
.
5. El tiempo de espera de 322 pacientes, para ser atendidos en cierto ambulatorio médico, es el que se muestra en la siguiente tabla: Tiempo de espera (en minutos) 0-5 5-10 10-15 15-20 20-25 25-30 30-35 35-40 40-45 45-50
Número de pacientes 3 35 98 63 55 44 12 6 5 1
a) Calcula los deciles y los cuartiles 2 y 7. b) Si consideremos a los pacientes que esperan media hora o más. ¿Qué porcentaje representan del total? c) ¿cuántos pacientes esperan entre 7 y 23 minutos? ¿qué porcentaje representa el total?
Solución:
El tiempo de espera de 332 pacientes, para ser atendidos en un cierto ambulatorio médico, es el que se muestra en la siguiente tabla:
Número de pacientes (fi)
Fi
Xi
Xi.fi
(Xi- )2
(Xi- )2.fi
[0 - 5>
3
3
2.5
7.5
252.4921
757.4763
[5 - 10>
35
38
7.5
262.5
118.5921
1214.2235
[10 - 15>
98
136
12.5
1225
34.6921
3399.8258
[15 - 20>
63
199
17.5
1102.5
0.7921
49.9023
[20 - 25>
55
254
22.5
1237.5
16.8921
929.0655
[25 - 30>
44
298
27.5
1210
82.9921
3651.6524
[30 - 35>
12
310
32.5
390
199.0921
2389.1052
[35 - 40>
6
316
37.5
225
365.1921
2191.1526
[40 – 45>
5
321
42.5
212.5
581.2921
2906.4605
[45 - 50]
1
322
47.5
47.5
847.3921
847.3921
TOTAL
322
-
5920
Primero encontramos el promedio:
Tiempo de espera (en minutos)
=5920/322 =18.39
El promedio es 18.39.
a.
Para determinar los cuartiles utilizamos la siguiente formula:
4 −
Donde:
− :
: Cuartil j, j=1; 2; 3 : Límite inferior de la clase del cuartil. : numero de datos de la muestra : Frecuencia absoluta acumulada anterior a la clase de cuartil. : Frecuencia absoluta simple de la clase del cuartil. Amplitud de la clase del cuartil.
Entonces para el cuartil 1 tenemos lo siguiente:
10[80.59838]5 Q =
= 80.5
= 12.17
Interpretación: El 25% de los pacientes esperan 12.17 minutos
Entonces para el cuartil 2 tenemos lo siguiente:
15 [16163136]5 Q =
= 161
= 16.98
Interpretación: El 50% de los pacientes esperan 16.98 minutos.
Entonces para el cuartil 3 tenemos lo siguiente:
20 [241.555199]5 Q =
= 241.5
= 23.86
Interpretación: El 75% de los pacientes esperan 23.86 minutos Ahora para los deciles 2 y 7 usamos la siguiente formula:
10 −
Entonces para el decil 2 tenemos lo siguiente:
10[64.49838]5 D =
= 64.4
= 11.35
Entonces para el decil 7 tenemos lo siguiente:
20[225.455199]5 D =
= 225.4
= 22.4
b.
Los pacientes que esperan media hora o más y el porcentaje que representan:
Entonces para esto solo sumamos la cantidad de personas que esperan desde 30 minutos a más: 12+6+5+1=24
100
= 7.45 %
Interpretación: El número de personas que esperan 30 minutos a más son 24, que representan el 7.45 % del total.
c.
¿Cuántos pacientes esperan entre 7 y 23 minutos? ¿Qué porcentaje representan del total? Para poder saber la cantidad de pacientes que esperan entre 7 y 23 minutos usamos lo siguiente:
Pacientes que esperan de 7 a 10 minutos:
− −
5 353 21 − − 5 551 11
Pacientes que esperan más de 24 minutos
Ahora sumamos la cantidad de pacientes que esperan entre 7 y 10 minutos, más los que esperan entre 10 y 15 minutos, más los que esperan entre 15 y 20 minutos, más los que esperan entre 20 y 25 minutos y a éstos le restamos la cantidad de pacientes que esperan entre 24 y 25 minutos. ES DECIR:
21 9863 55 11 226 Ahora para saber el porcentaje que representan:
226322 100% 70.186%
Interpretación: Los pacientes que esperan entre 7 y 23 minutos son 226, lo cual representan el 70.19% del total de pacientes.
6. Los salarios por hora de los obreros de dos empresas A y B, son los que se dan en la siguiente tabla:
175050,50,50,171050⟩50⟩550⟩ 1550,2550
Salarios
Empresa A 10 32 57 54
Empresa B 7 20 37 78
Determinar: a. El salario medio de las dos empresas. b. El salario más frecuente de las dos empresas. c. ¿cuál es el salario que no es superado por el 50% en las dos empresas? d. ¿cuál de las dos empresas tiene mayor homogeneidad salarial? ¿por qué?
Solución:
a.
Para encontrar el salario de cada una de las empresas: Para la empresa “A”
Salarios 550 – 750 750 – 1050 1050 – 1550 1550 – 2550
Empresa A fi 10 32 57 54
Fi
Xi
Xi.fi
10 42 99 153
650 900 1300 2050
6500 28800 74100 110700
TOTAL
153
.
Para la empresa “B” Salarios Empresa B fi 550 – 750 7 750 – 1050 20 1050 – 1550 37 1550 – 2550 78 TOTAL 142
b.
4900
220100
Fi
Xi
Xi.fi
7 27 64 142 -
650 900 1300 2050 4900
4550 18000 4800 159900 187250
Los salarios más frecuentes de las dos empresas son:
.
De la empresa “A”: 1300 De la empresa “B”: 2050 Interpretación: Los salarios más frecuentes de las empresas “A” y “B” son s/ 1300 y 2050 respectivamente.
c.
El salario que no es superado por el 50 % en las dos empresas. Para esto usamos el percentil 50:
100 −
Para la empresa “A”
1050 [76.55442 ]300 1241.67 =
= 76.5
Interpretación: El salario que no es superado por la empresa “A” es de s/ 1241.67
Para la empresa “B”
1050 [56.83727 ]300 1291.62 =
= 56.8
Interpretación: El salario que no es superado por la empresa “B” es de s/ 1291.6 2.
d.
¿Cuál de las dos empresas tiene mayor homogeneidad salarial? ¿por qué? La empresa que tiene mayor homogeneidad salarial es la empresa “A”. Porque tiene un mayor equilibrio en sus salarios, lo que no sucede lo mismo con la empresa “B”.
7. Un experto de estándares de trabajo observa el tiempo que se requiere para preparar una muestra de 10 cartas de negocios en una oficina y obtiene los siguientes resultados: 42, 5, 5, 9, 7, 5, 12, 13, 12 y 10 minutos. Se pide: a. b.
Determinar la media, la mediana y la moda de esos 10 tiempos. ¿cuál de las tres medidas de posición central calculadas te parece más representativa en este caso?
Solución: a) La media para datos sin agrupar se usa la siguiente formula
.
=
+++++++++ 12
Por lo tanto la media aritmética del tiempo que se requiere para preparar una muestra de 10 cartas de negocio en una oficina es 12 La mediana para datos sin agrupar 5+5+5+7+9+10+12+12+12+13+42 M.E =
+ 9.5
Por lo tanto la media del tiempo que se requiere para preparar una muestra de 10 cartas de negocio en una oficina es 9.5 La moda: Es la variable que tiene mayor frecuencia, como observamos en los datos la variable con mayor frecuencia es el 5 Por lo tanto la moda del tiempo que se requiere para preparar una muestra de 10 cartas de negocio en una oficina es 5. b) ¿Cuál de las 3 medidas de posición central calculadas te parece más representativa en este caso? La media aritmética porque tiene un valor aproximado y coherente a los demás datos.
8. Los siguientes datos corresponden al número de días de trabajo perdidos por enfermedad durante el cuarto trimestre del año por los 35 empleados de una empresa: 2 0 0 5 2
1 2 0 3 6
0 7 4 0 2
1 5 1 6 3
1 0 2 0 0
3 1 4 4 1
Estudiar la forma (asimetría y kurtosis) de la variable.
Solución: Ordenando los datos para estudiar la forma de asimétrica
0 3 0 0 1 y la concentración
# de días de trabajo perdido
fi
Fi
xi.fi
0 1 2 3 4 5 6 7 Total
11 7 5 4 3 2 2 1 35
11 18 23 27 30 32 34 35 -
O 7 10 12 12 10 12 7 70
Estudiando la forma asimétrica
Asimetría por cuartiles
−−− −
Para el empleo de esta fórmula se debe de hallar primero los cuartiles correspondientes usando loa siguiente formula:
Qj Li−F − Para el primer cuartil: Jn/4 =
= 8.75
Q1 0 .− 1 Q1 0.7954 Para el segundo cuartil:
1 .− 1
Jn/4 = Q2 =
= 17.5
Q2 = 1.9285
Para el tercer cuartil: Jn/4 = 35(3)/4=26.25
Q3 3 .− 1 Q3 3 0.8125 . −. −. −. −−− − .−. .−. . .. 0.2521
= 3.8125
Remplazando datos:
Interpretación: asimetría por la derecha
Asimetría por deciles
−−− − dj Li −F −
Primeramente hallamos los deciles indicados
Para el 1er decil:
=
=3.5
d1 0 .− 1 0.3181 Para el 5to decil:
=
= 17.5
d5 1 .− 1 1 0.9285 1.9285 Para el 9no decil:
=
= 31.5
d9 5 .− 1 5.75 .−.−. .−.−. .−. . 0.4088
Reemplazando datos:
Interpretación: asimetría por la derecha Estudiando la concentración kurtosis:
As ∑−. 3 # de días de trabajo perdido
0 1 2 3 4 5 6 7 Total
fi
Fi
11 7 5 4 3 2 2 1 35
xi M.A ∑xi M.A
xi.fi
11 18 23 27 30 32 34 35 -
0 7 10 12 12 10 12 7 70
176 7 0 4 48 162 512 625 1531
44 7 0 4 12 18 32 25 142
M.A ∑ 2 ∑−. ∑−. 4.0571
Desviación estándar
=
S = 2.0142
Reemplazando los datos en la fórmula de kurtosis
As ∑−. 3 . 3 0.2464
-3 =
-2.7536
Interpretación: concentración es platicurtica.
9. Un informe de 40 páginas presenta la siguiente distribución de errores mecanografiado. Errores por página N° de páginas
0 3
Estudiar la forma y la kurtosis de la variable.
Solución:
1 8
2 9
3 10
4 7
5 2
6 1
Errores de página xi 0 1 2 3 4 5 6 total
N° de páginas fi 3 8 9 10 7 2 1 40
xi
xi M.A
0 8 18 30 28 10 6
18.75 18 2.25 2.5 15.75 12.5 12.25 82
xi M.A
(fi)
117.1875 40.5 o.5625 0.5625 40.5 117.1875 150.0625 466.56
Estudiando por el método de kurtosis
M.A ∑ 2.5 ∑−. 2.05 S 1.4317 As ∑−. 3 . . 3 .. 3 As 2.77 3 0.23
Reemplazando
Interpretación: la concentración es platicurtica
10. En una empresa trabajan 20 000 productores, cuyos salarios, según categorías, son: Salarios (miles de soles) 10 - 20 20 - 40 40 - 50 50 - 100 100- 200 a. b. c. d.
fi 12 000 6 000 1 000 800 200
¿Qué parte de la nómina recibe el 60% de los productores peor pagados? ¿Qué parte de la nómina recibe el 5% de los productores mejores pagados? ¿Qué porcentaje de productores reciben el 81.8% de los salarios? ¿Qué porcentaje de productores reciben el 50% de los salarios?
Solución: Salarios (miles de soles 10-20 20-40 40-50 50-100 100-200
a)
12000 6000 1000 800 200 20000
12000 18000 19000 19800 20000
100 12000 0− ∗ 10 12000 ∗10 20
100 − ∗ 1000 19800 100 2006 ∗100 100 − ∗ 12000 . 20 163604360 ∗20 6000 . 20 5.06000 ∗20 46 100 − ∗ 0 10 10000 ∗10 12000 18.34
b)
c)
d)
11. Una compañía de seguros ofrece determinadas coberturas, previa suscripción de la correspondiente póliza cuya prima anual está estipulada según la edad del beneficiario. En cierta ciudad, el número de pólizas suscritas para cada tramo de edad es el que se da a continuación: Edad (años) Número de pólizas a. b. c.
Solución:
15,25⟩ 25,35⟩ 35,45⟩ 45,55⟩ 55,65
34
211
332
422
194
Calcula la diferencia entre los percentiles 7 y 93 de la distribución de las edades de los beneficiarios de las pólizas. Calcula la dispersión con respecto a la media de las edades. Calcula el coeficiente de asimetría de Pearson.
100 − ∗ − ∗ ∗ 83.51 1 34 ∗10 25 83.5211 27.34 − ∗ ∗ 110.49 55 110.41949 999 ∗10 9.20 27.34 9.20 a) Aplicando la fórmula de percentil en 7 y 93 ,
;
=
=
Diferencia
=18.14
∑− ∑(∗) 2 5 ∑ 130868. 1193 10.47 + ∗
b) Utilizando la fórmula de dispersión para datos agrupados hallamos la media
pero antes de ello
=53030/1193= 44.45
c) Primero hallamos la moda
−+ ∗10 12.62 15 − − ..−. =34-0=34 =34-211=-177
La fórmula de Pearson
=
=3.04
12. Los datos que se muestran a continuación representan el costo de energía eléctrica durante el mes de julio dl 2011, para una muestra aleatoria de 50 departamentos con dos habitaciones en una ciudad grande. Costo de energía eléctrica en dólares: 96 157 141 96 108 a. b. c. d.
171 185 149 163 119
202 90 206 206 150
178 116 175 175 154
147 172 123 130 114
102 111 128 143 135
153 148 144 187 191
197 213 168 166 137
127 130 109 139 129
82 165 167 149 158
Determine una tabla de frecuencias. Q1, Q2, Q3. Calcule el percentil correspondiente a: 191, 70 y 175. Realice un diagrama de caja.
Solución a) Determinando tabla de frecuencias: 1.-Max = 213
Min = 82
2.- Amplitud: Max – Min = 213-82 =131 3.-Numero de intervalo (K), Usando la FORMULA DE STURGES K
1 3.32Ln(n) =
K
1 3.32Ln(50) k 6.640580414
4.-Ancho de la Clase o Intervalo. (
)
Rango
k
131
21.83
6
I i
f i
F I
hi
H i
82-103.83 103.83-125.66 125.66-147.49 147.49-169.32 169.32-191.15 191.15-213 total
5 7 12 13 7 6 50
5 12 24 37 44 50 -
0.1 0.14 0.24 0.26 0.14 0.12 1
0.1 0.24 0.48 0.74 0.88 1 -
b) Calcule los cuartiles: ( Q j ) =
Q1
=??
.
50
jn 4
4
jn 4 F i Q j Li f i
1
xA
12.5
12.5 12 x 21.83 Q 126.5695833 12
Q1 125.66
Q2
=??
1
.
2 x50
jn 4
4
25
25 24 x 21.83 Q 149.1692308 13
Q2 147.49
Q3
=??
2
.
3 x50
jn 4
4
37.5
37.5 37 x 21.83 Q 170.8792857 7
Q3 169.32
3
jn 100 F i 1 c) Calculando los percentiles: ( P j ) = P j Li xA f i P 91
??
.
91x50
jn 100
100
95.5
45.5 44 x 21.83 P j 196.6075 6
P91 191.15
??
70 x50
jn
P 70
P70
35 24 147.49 x 21.83 P 164.2823077 13
P 75
P75
37.5 37 169.32 x 21.83 P 170.8792857 7
.
100
100
35
70
??
.
75x50
jn 100
100
37.5
75
d) Diagrama de Caja:
13. Los siguientes son los números de los minutos durante los cuales una persona debió esperar el autobús hacia su trabajo en 15 días laborales: 10 – 1 – 13 – 9 – 5 – 2 – 10 – 3 – 8 – 6 – 17 – 2 – 10 – 15. Determine: a. b. c.
La media. La mediana. Trace un diagrama de caja.
Solución: a.- Determine la media: n
X
i
i 1
Usando los datos sin agrupar: X b.- Determinando la mediana:
n
2
n
F i
2
X
= 15
2
111
15
7.4
7.5
1 – 2 – 2 – 3 – 5 – 6 – 8 – 9 – 10 – 10 – 13 – 15 – 17 1 – 2 – 2 – 3 – 5 – 6
–
8
–
9 – 10 – 10 – 13 – 15 – 17
14. De esta distribución de edades, calcula:
50,,5⟩10⟩ 110,5,125⟩0 Edad
a. b. c.
fi 11 18 13 8
Media, moda y varianza. Entre que valores se encuentra las 30 edades centrales. Los cuartiles.
Solución EDAD
fi
F i
X i
X i fi
2 ( X i X )
0-5 5-10 10-15 15-20 total
11 18 13 8 50
11 29 42 50 -
2.5 7.5 12.5 17.5 40.0
27.5 135 163,5 140 465
12939.0625 11826.5625 10764.0625 9751.5625
( X i
X
i 1
n
X
la moda: M o
M o
465 4
X 116.25
di Li A di d 2
18 11 5 5 M 7.92 18 11 (18 13) o
La mayoría de las edades son de 7.92 años.
Varianza: es igual a la desviación estándar al cuadrado: V
Hallamos la desviación estándar para datos agrupados
X)
2
f i
142329.6875 212878.1250 139932.8125 78012.5 573153.125
n
X i f i
2
S
a.
n
( X i X )
V
, n 30
n 1
573153.125
S
50
(Xi X )
fi
i 1
S
S
n
2
(107.0656925)2
V
S
y
i 1
n
2
f i
, n 30
107.0656925
11463.0625
b.- Se encuentra entre los valores de 0 hasta 15 c.- Hallando los cuartiles:
jn 4 F i Q j Li f i
1
( Q j ) =
Q1
=??
.
jn
4
50 4
xA 12.5
12.5 11 x5 Q 5.42 18
Q1 5
Q2
1
=??
.
2 x50
jn 4
4
25
25 11 x5 Q2 8.9 18
Q2 5 Q3
=??
.
3 x50
jn 4
4
37.5
37.5 29 x5 Q 13.27 13
Q3 10
3
15. Se mide la estatura de 67 estudiantes elegidos al azar y resulta la siguiente distribución de frecuencias: Estaturas N° de estudiantes
4
155,160⟩ 160,165⟩ 165,170⟩ 170,175 26
24
13
Calcule todos los descriptivos estudiados. Interprete.
Solución estatura 155-160 160-165 165-170 170-175 total
Nº de estudiante 4 26 24 13 67
X i
F i
hi
H i
X i f i
157.5 162.5 167.5 172.5 660
4 30 54 67 -
0.06 0.39 0.36 0.19 1
0.06 0.45 0.81 1 -
630 4225 4020 2242.5 11117.5
Calcule todos los datos descriptivos:
( X i
X ) 2 f i
284.2596 305.8874 59.1576 561.1437 1210.4483
La media: X
1117.5
67
165.93
El promedio de estatura es de 165.93
n 2 F i Me Li f i
1
La mediana:
xA
67
n
.
2
2
33.5
33.5 30 x5 165.73 24
Me 165
i
El 50% de los estudiantes tienen una estatura de 165.73
di Li A di d 2
La moda: M o
M o
26 4 160 5 164.58 26 4 (26 24)
La mayoría de los estudiantes tienen una estatura promedio de 164.58
jn 4 F i Q j Li f i
xA
1
Cuartiles:
Q1
=??
.
67
jn 4
4
16.75
16.75 4 x5 Q 162.45 26
Q1 160 Q2
=??
1
jn
.
4
2 x 67 4
33.5
33.5 30 x5 Q 165.73 24
Q2 165
Q3
=??
2
.
3x 67
jn 4
4
50.25
50.25 30 x5 Q 169.22 24
Q3 165
3
n
( X i X )
La varianza (V): V
S
2
, n 30
n
1210.4483 67 V
f i
i 1
Desviación estándar (S): S
S
2
4.25
S 4.25
2
V
18.0625
Coeficiente de variación: CV
S
100
CV
4.25
100
CV
2.56%
165.93
X
La X es altamente representativa.
16. La tabla siguiente representa la distribución de las calificaciones finales obtenidas de 150 estudiantes de un curso:
02,2⟩,4⟩ 46,6⟩,8⟩ 8,10
Calificaciones
N° de estudiantes 10 50 55 25 10
Determinar: a. b. c.
Halle la media y la desviación típica de la variable. Calcule la mediana y el primer cuartil. Calcule los percentiles 33 y 66.
Solución:
notas
Nº DE ESTUDIANT ES 10 50 55 25 10 150
0-2 2-4 4-6 6-8 8-10 total
La media:
X
1117.5
67
X i
F i
hi
H i
X i f i
1 3 5 7 9 25
10 60 115 135 150 -
0.06 0.33 0.36 0.16 0.06 1
0.06 0.39 0.75 0.91 1 -
10 150 275 175 90 700
165.93
n
( X i X ) La desviación estándar: S
S
2
f i
i 1
, n 30
n 603.335
S
2.006
150
n 2 F i Me Li f i
1
Mediana:
xA
75 60 x 2 4.55 55
Me 4
.
150
n
2
2
75
( X i
X ) 2 f i
134.689 139.445 5.9895 135.7225 187.489 603.335
jn 4 F i Q j Li f i
1
Primer cuartil:
Q1 = ??
.
150
jn 4
xA
4
37.5
37.5 10 x2 Q 3.1 50
Q1 2
1
jn 100 F i P j Li f i
1
Calculando los percentiles 33 y 66:
??
jn
33x150
49.5
P 33
P33
49.5 10 2 x 2 P 3.58 50
P 66
P66
.
100
100
33
??
.
66x150
jn 100
100
99
99 60 4 x 2 P 5.42 55 66
xA