1.- Estadística Descriptiva – Ejercicios Resueltos – Clasificación de variables Gráficos estadísticos Medidas de ubicación Medidas de variabilidad poblacional y muestral Aplicación de datos no agrupados y agrupados
1. Estadística Descriptiva – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
1.- La distribución de los 20.000 empleados de la empresa Alfa, según antigüedad (X) y sueldo mensual (Y) se muestra en la siguiente tabla de proporciones (frecuencias relativas) conjuntas: X (en años) menos de 4 4–8 más de 8
Y ( en miles de $) 90 – 130 130 – 170 0,08 0,04 0,12 0,10 0,12 0,18
50 – 90 0,12 0,08 0,00
170 – 250 0,00 0,05 0,11
1.1) Clasifique las variables del problema según tamaña del recorrido y nivel de medición 1.2) Grafique la distribución de los empleados según sueldo mensual 1.3) ¿En qué grupo son más homogéneos los sueldos de la empresa, en el de los empleados más nuevos o en el de los más antiguos? Justifique su respuesta. 1.4) Si para las fiestas patrias la empresa otorgo un aguinaldo de $25.000 a los empleados cuyo sueldo era inferior a los $120.000, mientras que para aquellos cuyo sueldo era superior a esa cifra el aguinaldo fue de $15.500, ¿Cuántos de los empleados que tienen más de 8 años de antigüedad en la empresa recibieron un aguinaldo de $15.500? 1.1) Solución: Variable 𝑥 𝑦
Según Tamaño del recorrido Discreta Continua
Según Nivel de Medición Ordinal De Razón
1.2) Solución: k = 40 𝑦 (en miles de $) 50 - 90 90 - 130 130 - 170 170 - 250
Página 2
𝐶𝑖
ℎ𝑖
𝑛𝑖
𝑛𝑖 / 𝐶𝑖
𝑘 ∙ 𝑛𝑖 /𝐶𝑖
40 40 40 80
0.2 0.32 0.32 0.16 1
4000 6400 6400 3200 n = 20.000
100 160 160 40
4000 6400 6400 1600
Alejandro González Tapia – Ingeniería Civil en Minas
1. Estadística Descriptiva – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
1.3) Solución: Sean:
𝑍 = “Sueldo empleados más nuevos (menos de de 4 años)” 𝑊 = “Sueldo empleados más antiguos (más de 8 años)”
Obs: La desviación estándar que es calculada corresponde a la poblacional, ya que se trabaja con la totalidad de datos. 𝑆(𝑍) = 29,8173 𝑍̅ = 96,6666
𝐶𝑉(𝑍) =
𝑆 (𝑍) 29,8173 ∙ 100 = ∙ 100 = 30,8455% 96,6666 𝑍̅
𝑆(𝑊 ) = 37,6170 ̅ = 154,3902 𝑊
𝐶𝑉(𝑊 ) =
𝑆(𝑊) 37,6170 ∙ 100 = ∙ 100 = 24,3649% ̅ 154,3902 𝑊
Respuesta: Debido a que 𝐶𝑉 (𝑍) > 𝐶𝑉(𝑊), la distribución de los sueldos de los empleados más antiguos es más homogénea que la distribución de los sueldos de los empleados menos antiguos. 1.4) Solución: 𝑦 50 - 90 90 – 130 130 – 170 170 – 250
𝑛𝑖 0 2400 3600 2200 n = 8200
𝑁𝑖 0 2400 6000 8200
Utilizando la fórmula de percentil: 𝑝∙n 100
Pk = 𝑥′𝑖−1 + 𝐶i (
− Ni−1 ni
)
Obs: Recordar que el percentil toma los números menores o igual al número indicado, por lo tanto, en esta ocasión son considerados los números contenidos que son menores o iguales a $120.000. ( 120 = 90 + 40 ∙
𝑝 ∙ 8200 100
− 0)
2400
𝑝 = 21,95% = 0,2195 Luego, como el ejercicio le solicita la cantidad de empleados con más de 8 años de antigüedad en la empresa que recibieron un aguinaldo de $15.500, o sea , los empleados que tienen un sueldo superior a los $120.000, por ende, tendremos que utilizar propiedades de complemento para poder obtener lo que nos piden. 𝑃(𝑌 > 120) = 1 – 𝑃(𝑌 < 120) = 0,7805 Finalmente, se multiplica la probabilidad por la población considerada (n): 𝑛 ∙ 𝑃 (𝑌 > 120) = 0,7805 ∙ 8.200 = 6400 Respuesta: El 78,05% de los empleados con más de 8 años de antigüedad ganan más de $120.000, o sea, reciben un aguinaldo de $15.500, lo que corresponde a 6400 empleados.
Alejandro González Tapia – Ingeniería Civil en Minas
Página 3
1. Estadística Descriptiva – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
2.- Una empresa que se dedica a la fabricación de mallas de acero para hormigón armado, ha tomado una muestra de las mallas que compró una constructora en un mes determinado, registrando por cada unidad el peso de la mañana (en kg.), X, el tipo de malla, Y, (con borde: C, sin borde: S) y el diámetro de las barras (en mm.), Z. Los resultados obtenidos fueron los siguientes:
Z menos de 5 (5,0 – 7,0] más de 7
Y C S C S C S
(15 – 28] 10 8 2 2 0 0
X (41 – 54] 4 2 3 5 4 5
(28 – 4] 6 4 8 6 4 2
(54 – 67] 2 0 11 11 20 15
más de 67 0 0 4 0 7 5
2.1) Clasifique las variables según escala de medición y tamaño de recorrido. 2.2) Encuentre la medida de posición más adecuada para el peso de la malla. 2.3) ¿Qué porcentaje de las mallas con bordes tienen un diámetro de barras superiores a 5,5 mm.? 2.4) ¿Cuál es la variabilidad del peso de las mallas sin bordes que tienen diámetro de barras menores a 5,0 mm.? 2.1) Solución: Variable X Y Z
Según escala de Medición Ordinal Nominal Ordinal
Según Tamaño de Recorrido Discreta Binaria o Discreta Discreta
2.2) Solución: Notemos que el peso de la malla (X), corresponde a una variable ordinal y asimétrica, por lo que la medida de posición central más adecuada es la Mediana (Me = 54 Kg.) 2.3) Solución: Lo primero será hacer una tabla con los datos que vamos a ocupar, para poder trabajar de una manera más clara. Luego utilizando la fórmula de percentil, tenemos: 𝑝∙𝑛 100
Z
𝑛𝐶
𝑁𝐶
Menos de 5
22
22
(5,0 - 7,0]
28
50
Más de 7
35
85
n = 85
𝑃𝑘 = 𝑥′𝑖−1 + 𝐶𝑖 (
− 𝑁𝑖−1 𝑛𝑖
)
𝑝∙85
− 22 5,5 = 5,0 + 2,0 ( 100 ) 28 𝑝 = 34,12% = 𝑃(𝑍 ≤ 5,5)
Luego por propiedad de complemento obtenemos el porcentaje que es requerido: 𝑃(𝑍 > 5,5) = 100% − 𝑝 = 65,88%
Página 4
Alejandro González Tapia – Ingeniería Civil en Minas
1. Estadística Descriptiva – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
Respuesta: El porcentaje de las mallas con bordes que tienen un diámetro de barras superiores a 5,5 mm es 65,88% 2.4) Solución: Para empezar distribuimos los datos que utilizaremos, los que serás nuestra herramienta para poder determinar el Coeficiente de Variación, que corresponde a un indicador de variabilidad. 𝑥 (15 - 28] (28 - 41] (41 - 54] (54 - 67] más de 67
𝑥𝑖 21,5 34,5 47,5 60,5
𝑛𝑆 8 4 2 0 0 n = 14
𝑆𝑥 = 9,8270 𝑋̅ = 28,9286
𝐶𝑉(𝑥 ) =
𝑠𝑥 9,8270 ∙ 100 = ∙ 100 = 33,9698% 𝑥̅ 28,9286
Respuesta: La variabilidad del peso de las mallas sin bordes que tienen diámetros de barras menores de 5,0 mm es del 33,97% 3. Los siguientes datos corresponden a las cantidades máximas de emisión diarias de óxido de azufre (en toneladas) registrada según planta de emisión, en cierta zona industrial. Cantidad de óxido (ton.) 5 – 10 10 – 15 15 – 20 20 – 25 25 – 30
Planta A 50 30 60 20 40
Planta B 40 30 0 10 20
Planta C 20 40 70 15 5
3.1) Indique la unidad de información y clasifique las variables según escala de medición y tamaño de recorrido 3.2) Entre las plantas B y C, ¿Cuál presenta mayor variabilidad relativa su promedio de óxido de azufre emitido? 3.3) ¿Qué porcentaje de las emisiones producidas por la planta C, supera las 28 toneladas? 3.1) Solución: Unidad de información: La planta de emisión Variable Planta de Emisión Cantidad de Oxido
Según Escala de medición Nominal De Razón
Alejandro González Tapia – Ingeniería Civil en Minas
Según Tamaño de recorrido Discreta Continua
Página 5
1. Estadística Descriptiva – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
𝑥 = “Cantidades máximas de emisión diarias de óxido de azufre (en ton.)”
3.2) Solución: Sea: 𝑥 5 – 10 10 – 15 15 – 20 20 – 25 25 – 30
𝑥𝑖 7,5 12,5 17,5 22,5 27,5
Planta B 40 30 0 10 20
Planta C 20 40 70 15 5
𝑆𝐵 = 7,8102 𝐵̅ = 14,5
𝐶𝑉(𝐶 ) =
7,8102 ∙ 100 = 53,8634% 14,5
𝑆𝐶 = 4,7404 𝐶̅ = 15,6666
𝐶𝑉(𝐶 ) =
4,7404 ∙ 100 = 30,258% 15,6666
Respuesta: Comparando ambas plantas, podemos llegar a la conclusión que la planta que presenta mayor variabilidad relativa en su promedio de óxido de azufre emitido corresponde a la Planta B. 3.3) Solución: Exponemos la información de la Planta C 𝑥 5 – 10 10 – 15 15 – 20 20 – 25 25 – 30
𝑥𝑖 7,5 12,5 17,5 22,5 27,5
𝑛𝐶 20 40 70 15 5
𝑁𝐶 20 60 130 145 150
Luego, por formula de Percentil, tenemos: 𝑝∙150
28 = 25 + 5 (
100
− 145 5
)
𝑝 = 98,67%
Luego por propiedad de complemento, obtenemos que el porcentaje que nos piden es 1,33% Respuesta: El porcentaje de las emisiones producidas por la Planta C que supera las 28 toneladas corresponden al 1,33%. 4.- En una Empresa constructora se ha registrado información respecto: ingreso mensual (Y), especialidad (X) y permanencia (Z) en la empresa (en que A = antiguo; N = recién ingresado), de sus trabajadores, obteniendo lo siguiente:
Especialidad Albañil Carpintero Electricista Pintor
Página 6
Z A N A N A N A N
Ingreso mensual, en miles de pesos 100 - 150 150 - 200 200 - 300 más de 300 6 9 5 0 9 11 1 0 1 6 7 9 1 2 3 3 3 5 8 1 1 5 4 0 2 20 2 0 1 10 5 0
Alejandro González Tapia – Ingeniería Civil en Minas
1. Estadística Descriptiva – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
4.1) Clasifique las variables involucradas según nivel de medición. Calcule la medida de posición más adecuada en cada caso. Indique unidad de información. 4.2) Construya un gráfico que permita mostrar la distribución de los trabajadores según especialidad 4.3) Construya un gráfico que permita comparar los ingresos de los pintores según permanencia en la empresa. 4.4) Si entre carpinteros y electricistas tienen un sueldo promedio de $225.000 ¿Cuál es el sueldo promedio de los trabajadores en la Empresa? 4.5) Si la empresa decide mejorar los sueldos de los trabajadores con ingresos inferiores a $180.000 ¿Qué porcentaje de los trabajadores se beneficiará con esta medida? 4.6) Si a los albañiles se les otorga una bonificación de $20.000. Compare la dispersión de los ingresos de los albañiles después de la bonificación con la de los ingresos de los pintores. 4.1) Solución: Variable Especialidad Permanencia Ingreso Mensual
Según Nivel de Medición Nominal Nominal Ordinal
Medida de posición más adecuada Mo: Albañil Mo: Antiguo Me = $183.832,5
Unidad de información: El Trabajador 4.2) Solución: Especialidad Albañil Carpintero Electricista Pintor
𝑛𝑖 41 32 27 40 n = 140
Gráfico de barras separadas
Gráfico Circular o de Torta
Alejandro González Tapia – Ingeniería Civil en Minas
Página 7
1. Estadística Descriptiva – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
4.3) Solución: Ingreso Pintores 100 – 150 150 – 200 200 – 300 Más de 300
𝑛𝑖 Antiguo 2 20 2 0
𝑛𝑖 Recien llegado 1 10 5 0
ℎ𝑖 Antiguo 2 20 1 01
ℎ𝑖 Recien llegado 1 10 2,5 0
Total 3 30 3,5 0
Para comparar los ingresos de los pintores según permanencia en la empresa utilizaremos un Histograma rectificado.
4.4) Solución: 𝑦
𝑦𝑖
100 - 150 150 - 200 200 - 300 Más de 300
125 175 250
𝑛𝑖
𝑛𝑖
(Albañil)
(Pintor)
15 20 6 0 41
3 30 7 0 40
En este ejercicio nos otorgan los sueldos promedios entre carpinteros y electricistas, el que es $225.000, por lo tanto, trabajaremos con los datos entregados para poder encontrar el sueldo promedio del total de los empleados de la Empresa, para esto utilizaremos la fórmula de promedio o media para datos tabulados, la que es:
𝑥̅ =
∑ 𝑛𝑖 𝑥𝑖 𝑛
Empleando la formula en los albañiles y pintores, respectivamente. 𝑦̅𝑎𝑙𝑏𝑎ñ𝑖𝑙 =
Página 8
125 ∙ 15 + 175 ∙ 20 + 250 ∙ 6 6875 = = 167,6829 (𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 $) 41 41
Alejandro González Tapia – Ingeniería Civil en Minas
1. Estadística Descriptiva – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
125 ∙ 3 + 175 ∙ 30 + 250 ∙ 7 7375 = = 184,375 (𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 $) 40 40
𝑦̅𝑃𝑖𝑛𝑡𝑜𝑟 =
Finalmente, para obtener el promedio de los sueldos, se multiplica el promedio por la cantidad de personas, y por último, se divide por el total (n), de la siguiente manera: 6875 41
𝑌̅ =
∙ 41 +
7375 40
∙ 40 + 225 ∙ 59
140
= 196,607 (𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 $)
Respuesta: El sueldo promedio de los trabajadores de la Empresa es $196.607 4.5) Solución: 𝑌 100 – 150 150 – 200 200 – 300 Más de 300
Utilizando formula de percentil, tenemos que: 𝑛𝑖 24 68 35 13 n = 140
𝑝∙140
Ni 24 92 127 140
− 24 180 = 150 + 50 ( 100 ) 68 𝑝 = 46,286%
Respuesta: El porcentaje de los trabajadores que se beneficiarán con la medida será el 46,286% 4.6) Solución: P = “Pintores”; A = “Albañiles”; A* = “Albañiles con bonificación” 𝑆𝑃 = 32,9239 𝑃̅ = 184,375
𝐶𝑉 (𝑃 ) = 0,1786 ∙ 100 = 17,86%
Por propiedad: 𝑆𝐴∗ = 𝑆𝐴 ; ̅̅̅ 𝐴∗ = 𝐴̅ + 20 𝑆𝐴 = 41,0398 𝑆𝐴∗ = 41,0398 𝐴̅ = 167,6829 ̅̅̅ 𝐴∗ = 187,6829
𝐶𝑉(𝐴∗ ) = 0,2186 ∙ 100 = 21,86%
Respuesta: La distribución del sueldo de los pintores tiene menos dispersión (menos variabilidad, es más homogénea) que la de los albañiles bonificados, o de otra forma, La distribución del sueldo de los albañiles bonificados tiene mayor dispersión (mayor variabilidad, más heterogénea) que la de los pintores. 5.- Una empresa constructora de parques y plazas, ha ganado una propuesta para construir áreas verdes en plazas de una determinada región. Las superficies sembradas, en metros cuadrados, en 80 plazas y la mezcla de semilla de pasto utilizadas, se resumen en la siguiente tabla: Mezcla Manquehue Estadio Ray-grass Long Grass-Trevol Total
Superficie sembrada 200 - 1180 1180 - 3140 3140 - 5100 5100 - 6080 más de 6080 7 4 6 2 0 3 6 8 4 3 0 7 9 5 4 2 5 4 1 0 12 22 27 12 7
Alejandro González Tapia – Ingeniería Civil en Minas
Página 9
1. Estadística Descriptiva – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
5.1) Clasificación las variables involucradas según nivel de medición y tamaño de recorrido. 5.2) Calcule las medidas marginales de posición más adecuadas para cada variable e indique las correspondientes medidas de dispersión. 5.3) Construya un gráfico que muestre la distribución de las plazas sembradas según mezcla de semilla utilizada. 5.4) Compare la dispersión de las superficies sembradas con mezclas de Manquehue con la dispersión de las superficies sembradas con mezcla Long Grass-Trevol. 5.1) Solución: Variable Mezcla Superficie Sembrada 5.2) Solución: Variable Mezcla Superficie Sembrada
Mezcla Manquehue Estadio Ray- grass Long grass Trevol
Según Nivel de Medición Nominal Ordinal
Según Tamaño de Recorrido Discreta Discreta
Medida Marginal de Posición Moda Mediana
Medida de Dispersión No existe Recorrido intercuartílico
Sup. Sembrada 𝑥𝑖−1 − 𝑥𝑖 200 – 1180 1180 – 3140 3140 – 5100 5100 – 6080 Más de 6080
𝑛𝑖 19 24 25 12 Tabla (i)
𝑛𝑖
𝑁𝑖
12 22 27 12 7 n = 80
12 34 61 73 80
Como ya sabemos que la moda corresponde a él valor con mayor frecuencia en una distribución de datos, por lo que sólo basta reconocer cual es el que más se repite, sin necesidad de realizar algún cálculo para determinarlo. En cambio, para poder determinar la Mediana de la Superficie Sembrada, es necesario aplicar la fórmula de Mediana para datos tabulados: 𝑛
𝑀𝑒 = 𝑥′𝑖−1 + 𝐶𝑖 [2
− 𝑁𝑖−1 𝑛𝑖
]
Lo primero será identificar el intervalo en el cual trabajaremos, para ello debemos encontrar donde se encuentra la mitad, para ello dividimos el tamaño muestral en dos, lo que da un resultado de 40, el que se encuentra en el intervalo: [3140 – 5100[, por lo que este intervalo utilizaremos para poder conseguir los datos necesarios para obtener la mediana. Reemplazando: 80
𝑀𝑒 = 3140 + 1960 ∙ [ 2
− 34 ] = 3.575,56 𝑚 2 27
Respuesta: La Moda es semilla de pasto Ray- grass, y la Mediana es igual a 3.575,56 m2
Página 10
Alejandro González Tapia – Ingeniería Civil en Minas
1. Estadística Descriptiva – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
5.3) Solución: Graficaremos los datos de la Tabla (i) para poder representar la distribución de las plazas sembradas según mezcla de semilla utilizada
5.4) Solución: 𝑥 = Sup. Sembrada 200 – 1180 1180 – 3140 3140 – 5100 5100 – 6080 Más de 6080 𝑆𝑀 = 1747,9860 ̅ = 2598,4210 𝑀 𝑆𝐿𝑔𝑇 = 1462,6087 ̅̅̅̅̅ 𝐿𝑔𝑇 = 2854,1666
𝑥𝑖 690 2160 4120 5590
Manquehue Long grass Trevol 7 2 4 5 6 4 2 1 0 0
𝐶𝑉(𝑀) =
1747,9860 ∙ 100 = 67,27% 2598,4210
𝐶𝑉(𝐿𝑔𝑇) =
1462,6087 ∙ 100 = 51,24% 2854,1666
Respuesta: Como 𝐶𝑉(𝑀) > 𝐶𝑉(𝐿𝑔𝑇) , la dispersión de las superficies sembradas con mezcla de Manquehue es más heterogénea que la de las superficies sembradas con mezcla de Long grass Trevol. 6.- La empresa de telecomunicaciones “E-Box” dispone de la siguiente información correspondiente a ingresos (en miles de pesos) y antigüedad, de todos sus empleados (en años), separados por género. Los datos se resumen en el siguiente cuadro: I: Ingreso Miles de $ 200 a 300 300 a 400 400 a 500 500 a 600 Total
Menos de 2 H M 6 10 2 4 0 2 0 0 8 16
H 7 7 3 0 17
A: Antigüedad (años) 2a4 4a6 M H 3 4 5 2 0 5 0 4 8 15
Alejandro González Tapia – Ingeniería Civil en Minas
6a8 M 1 1 3 0 5
H 1 1 2 3 7
Total M 0 2 1 1 4
32 24 16 8 80
Página 11
1. Estadística Descriptiva – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
6.1) Construya un gráfico que permita comparar la distribución porcentual de los hombres y de las mujeres según antigüedad. 6.2) Como la empresa ha tenido utilidades significativas, quiere compartir sus excedentes con los empleados para lo cual entrega las siguientes propuestas: - Propuesta A: Un reajuste del 10% de sus ingresos más un bono de 25 mil pesos por empleado. - Propuesta B: Un reajuste del 8% de sus ingresos más un bono de 32 mil pesos por empleado. 6.2.1) ¿Cuál de estas dos propuestas generará una distribución de los ingresos más homogénea? 6.2.2) Suponga que cada empleado elige libremente cualquiera de las dos opciones, tomando en consideración aquella que le reporta mayor ingreso. ¿Qué porcentaje de los empleados elegirán la propuesta A? 6.3) Todo empleado que se encuentre sobre el segundo quintil de la variable antigüedad serán beneficiados con 5 días adicionales de vacaciones. Calcule la antigüedad mínima que debe tener un trabajador para optar a este beneficio. 6.4) Para los hombres con una antigüedad de al menos dos años, con un sueldo de por lo menos $400.000 ¿Cuál es la antigüedad media en la empresa? 6.1) Solución: Menos de 2 2a4 4a6 6a8 Total
M 8 17 15 7 33
%ℎ𝑀 17,02 36,17 31,91 14,90
H 16 8 5 4 47
%ℎ𝐻 48,49 24,24 15,15 12,12
Distribución de la antigüedad por sexo 60
Porcentaje
50
40 30
% de Hombre % de Mujeres
20 10 0 Menos de 2
2a4
4a6
6a8
Antigüedad
Página 12
Alejandro González Tapia – Ingeniería Civil en Minas
1. Estadística Descriptiva – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
6.2.1) Solución:
𝑥 = 𝐼𝑛𝑔𝑟𝑒𝑠𝑜 𝑀𝑖𝑙𝑒𝑠 𝑑𝑒 $ 200 a 300 300 a 400 400 a 500 500 a 600
𝑆𝑥 = 100 𝑥̅ = 350
𝑥𝑖
𝑛𝑖
250 350 450 550
32 24 16 8 n = 80
Definimos las variables a utilizar:
𝑤 = "Propuesta A" = 1,1 𝑥 + 25 𝑡 = "Propuesta B" = 1,1 𝑥 + 32
Luego, por propiedades obtenemos los resultados correspondientes.
𝑆𝑡 = 1,1 𝑆𝑥 = 110 ̅𝑡 = 1,1 𝑥̅ + 32 = 417 𝐶𝑉(𝑡) = 26,37%
𝑆𝑤 = 1,1 𝑆𝑥 = 110 𝑤 ̅ = 1,1 𝑥̅ + 25 = 410 𝐶𝑉(𝑤) = 26,82%
Respuesta: Al comparar ambos coeficientes de variabilidad obtenidos, concluimos que la propuesta B entrega una distribución levemente más homogénea que la propuesta A. 6.2.2) Solución: Tenemos que: 𝑤 = "Propuesta A" = 1,1 𝑥 + 25 𝑡 = "Propuesta B" = 1,1 𝑥 + 32 Luego, si 𝑤 = 𝑡, ambas opciones entregan el mismo ingreso, por lo tanto, tenemos la siguiente igualdad:
1,1 𝑥 + 25 = 1,08 𝑥 + 32
→
𝑥 = 350
En seguida buscamos un 𝑝, por medio de la formula de percentil, tal que: 80∙ 𝑝
350 = 300 +
100 ∙ ( 100 − 32) 24
→ 𝑝 = 55%
Respuesta: El porcentaje de los empleados que elegirán la propuesta A corresponde a 55%, que equivale a 36 empleados. 6.3) Solución: Sabemos por definición que el segundo Quintil, es lo mismo que decir el percentil cuarenta, por lo que utilizaremos la fórmula de percentil, donde tenemos:
𝑃40 = 2 +
2∙(
80∙40 100
25
− 24)
= 2,64 𝑎ñ𝑜𝑠
Respuesta: La antigüedad mínima que debe tener un trabajador para poder optar al beneficio de los cinco días adicionales de vacaciones es 2,64 años.
Alejandro González Tapia – Ingeniería Civil en Minas
Página 13
1. Estadística Descriptiva – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
7.- El número de llamadas telefónicas de larga distancia nacional, registradas por una empresa distribuidora durante una hora de un día determinado, se resumen en la siguiente tabla. Los registros se realizaron en horarios normales y se consideraron llamadas de, lo más, 3 minutos de duración Carrier 188
171
123
Región
[5 - 6] 3 7 3 4 5 2 3 7 6 40
II IV X II IV X II IV X Total
Valor de la llamada (u.m) (6 - 8] (8 - 10] (10 - 20] 8 10 4 9 10 4 7 5 5 3 9 6 5 8 3 4 7 7 4 7 8 4 4 5 7 4 3 51 64 45
Total 25 30 20 22 21 20 22 20 20 200
7.1) Clasifique las variables involucradas según nivel de medición y tamaño de recorrido e indique la medida marginal de tendencia central más adecuada para el valor de la llamada y para el carrier en la IV región. 7.2) ¿Qué porcentaje de llamadas son tales que superan al valor promedio de las llamadas realizadas a través del carrier 171? 7.3) Al mes siguiente de haber efectuado este estudio, el valor de la llamada de larga distancia del carrier 123, aumentó en un 2% más 1 u.m. por cada 3 minutos de duración. ¿En qué porcentaje disminuye (aumenta) la variabilidad del valor de la llamada al mes siguiente? 7.1) Solución: Variable Carrier Región Valor de llamada
Según Nivel de Medición Nominal Nominal De Razón
Según Tamaño de Recorrido Discreta Discreta Continua
La medida marginal de tendencia central más adecuada para el valor de la llamada es Mediana, debido a que la variable es Asimétrica. 𝑦 = Valor de la llamada [5 – 6] (6 – 8] (8 – 10] (10 – 20]
𝑦𝑖 5,5 7 9 15
50∙200
𝑀𝑒 = 8 + 2 ∙ (
Página 14
100
− 91
64
𝑛𝑖 40 51 64 45 n = 200
) = 8,28 𝑢. 𝑚.
𝑁𝑖 40 91 155 200
Carrier Región IV 188 171 123
𝑛𝑖 30 21 20
𝑀𝑜 = 𝐶𝑎𝑟𝑟𝑖𝑒𝑟 188
Alejandro González Tapia – Ingeniería Civil en Minas
1. Estadística Descriptiva – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
7.2) Solución: 𝑡 = Valor de la llamada del Carrier 171 [5 – 6] (6 – 8] (8 – 10] (10 – 20]
𝑡𝑖
𝑛𝑖
5,5 7 9 15
11 12 24 16 n = 63
𝑡̅ = 9,53 𝑢. 𝑚.
Utilizando formula de percentil en la tabla de la pregunta a), tenemos: 𝑝∙200
− 91 9,53 = 8 + 2 ∙ ( 100 ) 64
𝑝 = 69,98% = 𝑃(𝑦 > 𝑡̅)
Por propiedad de complemento: 𝑃 (𝑦 > 𝑡̅) = 100 − 𝑃 (𝑦 ≤ 𝑡̅) = 30,02% Respuesta: El porcentaje de llamadas que superan al valor promedio de las llamadas realizadas a través del carrier 171 es igual al 30,02% 7.3) Solución: 𝑥 = Valor de la llamada del Carrier 123 [5 – 6] (6 – 8] (8 – 10] (10 – 20]
𝑥𝑖
𝑛𝑖
5,5 7 9 15
16 15 15 16 n = 62
𝑆𝑥 = 3,6596 𝑥̅ = 9,1612 𝐶𝑉 (𝑥 ) = 0,3994
Sea: 𝑢 = “Valor de la llamada del Carrier 123 después del aumento del 2% más 1 u.m.”
𝑢 = 1,02 𝑥 + 1 Luego, para ahorrar cálculos utilizaremos propiedades:
𝑢̅ = 1,02 𝑥̅ + 1 → 𝑆𝑢 = 1,02 𝑆𝑥 →
𝑢̅ = 10,3444 𝑆𝑢 = 3,7327
→
𝐶𝑉(𝑢) = 0,3608
Después, determinaremos el porcentaje con que disminuye o aumenta la variabilidad del valor de la llamada del Carrier 123 después del aumento del 2% más una u.m.
% = (0,3994 − 0,3608) ∙ 100 = 3,86% Respuesta: Luego del aumento del valor de la llamada del Carrier 123 correspondiente al 2% más una unidad monetaria, el porcentaje con que DISMINUYÓ la variabilidad del valor de la llamada corresponde al 3,86%.
Alejandro González Tapia – Ingeniería Civil en Minas
Página 15
1. Estadística Descriptiva – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
8.- Una gran empresa está constituida por tres sucursales: S 1, S2 y S3. El Gerente General de esta empresa solicita un estudio acerca de: el número de artículos defectuosos producidos diariamente y cantidad diaria de materia prima elaborada, en cada una de estas sucursales. Para cumplir lo solicitado por la gerencia general, se registró información en las tres sucursales simultáneamente durante 90 días. La información resumida se presenta en la tabla siguiente: SUCURSAL N° ARTICULOS CANTIDAD DE MATERIA PRIMA ELABORADA (ton) DEFECTUOSOS 5 – 15 15 - 25 25 - 35 35 - 45 menos de 10 18 6 5 0 S1 10 – 50 10 7 10 0 más de 50 5 7 22 0 menos de 10 0 13 4 3 S2 10 – 50 0 17 11 5 más de 50 0 8 19 10 menos de 10 0 12 4 0 S3 10 – 50 0 20 20 0 más de 50 0 5 29 0 8.1) Construya un gráfico que le permita comparar las cantidades diarias de materia prima elaborada en las sucursales S1 y S3. ¿Qué puedes concluir? 8.2) La Gerencia de Producción de esta empresa, debe estar atenta a que no haya mucha variabilidad en la cantidad diaria de materia prima elaborada (ya que si es mucha puede haber problemas de almacenamiento y si es poca podría no satisfacer la demanda). Esta Gerencia declara “estado de alerta” siempre que el coeficiente de variación de la cantidad de materia prima elaborada sea superior a un 30%. Basándose en la información presentada, declararía Ud. “estado de alerta” en la sucursal S1. 8.3) En que % de los días, la cantidad de materia prima elaborada por S 2 supera al percentil 75 de la cantidad de materia prima elaborada por S 1? 8.1) Solución: 70 60
hi%
50 40 30
S1
20
S2
10 0 0
10
20
30
40
Cantidad de Materia Prima Elaborada (ton)
Página 16
Alejandro González Tapia – Ingeniería Civil en Minas
1. Estadística Descriptiva – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
𝑆1 𝑛𝑖 33 20 37 0
𝑥 = CMPE (ton) 5 – 15 15 – 25 25 – 35 35 – 45
𝑆3 𝑛𝑖 0 37 53 0
𝑆3 ℎ𝑖 % 0 41,1 58,9 0
𝑆1 ℎ𝑖 % 36,7 22,2 41,9 0
Respuesta: A la conclusión que llegamos es que ambas distribuciones son asimétricas, ya que al contraponerlas estas no coinciden. 8.2) Solución: 𝑥 = CMPE (ton) 5 – 15 15 – 25 25 – 35 35 – 45
𝑆𝑥 = 8,81 𝑥̅ = 20,44
𝑆1 𝑛𝑖 33 20 37 0
𝑥𝑖 10 20 30 40
𝐶𝑉(𝑥 ) =
8,81 ∙ 100 = 43,10% 20,44
Respuesta: Según los datos obtenidos concluimos que la Gerencia debería declarar “estado de alerta”, ya que el coeficiente de variación de la cantidad de materia prima elaborada es igual a 43,1%, lo que es superior al 30%. 8.3) Solución: 𝑥 = CMPE (ton) 5 – 15 15 – 25 25 – 35 35 – 45
𝑆1 𝑛𝑖 33 20 37 0
𝑆1 𝑁𝑖 33 53 90 0
𝑥 = CMPE (ton) 5 – 15 15 – 25 25 – 35 35 – 45
𝑆2 𝑛𝑖 0 38 34 18
𝑆2 𝑁𝑖 0 38 72 90
Lo primero es calcular 𝑃75 de S1, lo que se hace por medio de la fórmula de percentil: 90∙75
𝑃75 = 25 +
10 ∙ ( 100 − 53)
= 28,92 37 Luego, ese resultado es igualado a la fórmula de percentil aplicada a la sucursal S 2, lo que queda de la siguiente manera: 90∙𝑝
28,92 = 25 +
10 ∙ ( 100 − 38) 34
𝑝 = 57%
Finalmente, por propiedad de complemento obtenemos que el resultado es el 43%. Respuesta: En el 43% de los días, la cantidad de materia prima elaborada por S 2 supera al percentil 75 de la cantidad de materia prima elaborada por S 1.
Alejandro González Tapia – Ingeniería Civil en Minas
Página 17
1. Estadística Descriptiva – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
9.- El responsable en control industrial de la empresa “CLR”, somete a un control de fiabilidad 110 baterías idénticas de celulares y anota su duración (tiempo hasta que se descarga), en horas. La información obtenida se presenta a continuación: 𝒙 ∶ Duración (en horas) 200 – 300 300 – 400 400 – 500 500 – 600 600 – 700
N° de baterías 4 25 60 19 2
̅ − 𝟏. 𝟓 𝑺(𝒙) 9.1) Si se quiere garantizar a las baterías que tengan una duración de a lo más: 𝒙 ¿Qué porcentaje de las baterías serán garantizadas? 9.2) La empresa “ADA”, de la competencia tiene en el mercado baterías de similares condiciones, al tomar una muestra de baterías de igual tamaño se obtuvo que la duración media de 400 hrs y una varianza de 6400 (hrs)2. Para competir con la empresa “CLR”, la empresa “ADA” decide utilizar una tecnología que permite aumentar la duración de cada batería en 70 hrs. Después de aplicada la nueva tecnología, ¿En cuál de estas empresas resulta más homogénea la duración de las baterías? 9.1) Solución: Lo primero es determinar el valor de "𝑥̅ − 1.5 𝑆(𝑥)", lo que se desprende de la tabla que adjunta el ejercicio.
𝑥̅ = 440,9091 → 𝑥̅ − 1.5 𝑆(𝑥 ) = 440,9091 − 1.5 ∙ 78,4546 = 323,2272 𝑆(𝑥) = 78,4546 Luego este valor es reemplazado en la fórmula de percentil, de la siguiente manera: ( 323,2272 = 300 + 100 ∙
110∙𝑝 100
− 4)
→ 𝑝 = 8,9152 25 Respuesta: El porcentaje de las baterías que serán garantizadas es del 8,9153% 9.2) Con los datos que fueron expuestos en el enunciado, hemos creado una tabla para poder tener una mejor visión de la información dada: Empresa CLR ADA (después de la modificación)
n 110 80
𝑥̅ 440,9091 470
𝑆(𝑥) 78,4546 80
CV 0,1779 0,1702
Respuesta: Las baterías de la empresa ADA después de la modificación tienen duración más homogénea que las baterías de la empresa CLR. (*)
10.- La siguiente tabla corresponde a la distribución de una muestra de cubos de cemento, clasificados según: porcentaje de silicato dicálcico en el cemento (X), porcentaje de aluminioferrito tetracálcico (Z) (ambos en relación con el peso total de la mezcla a partir de la cual se preparó el cemento) y el calor desprendido en el fraguado (Y), en calorías por gramos de cemento.
Página 18
Alejandro González Tapia – Ingeniería Civil en Minas
1. Estadística Descriptiva – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
𝒙: Porcentaje silicato dicálcico 5 – 20 20 – 35 35 – 50 50 – 60 Total
Y: Calor desprendido (cal/gr) 70 – 85 85 – 100 100 – 115 Z < 15% Z ≥ 15% Z < 15% Z ≥ 15% Z < 15% Z ≥ 15% 0 0 0 0 5 4 0 3 3 4 6 1 1 4 4 1 0 0 3 3 1 1 0 0 4 10 8 6 11 5
10.1) Utilizando las distribuciones del calor desprendido en el fraguado, de las muestras con aluminioferrito tetracálcico inferior al 15% y de las que tienen a lo menos un 15%. 10.1.1) Explique cual distribución es más homogénea. 10.1.2) Compare gráficamente las dos distribuciones de los cubos de cemento en estudio, según calor desprendido en el fraguado. Interprete dicho gráfico. 10.2) Suponiendo que existe asociación, lineal entre el calor desprendido en el fraguado y el porcentaje de silicato dicálcico, evalúe con la medida adecuada si ésta es fuerte o débil y en qué sentido lo es. 10.3) En estas muestras de cemento, también se midió el porcentaje de silicato tricálcico (W) encontrando que su vinculación con el calor desprendido tiene la siguiente relación: 𝐘𝐢 = 𝟓𝟓, 𝟖 + 𝟎, 𝟖 𝐖𝐢 . Determine el porcentaje de los cubos de cemento que en la muestra tienen un porcentaje de silicato tricálcico superior a su promedio más una desviación estándar (aproxime los cálculos al cuarto decimal) 10.1.1) Solución: 𝑌𝑖 77,5 92,5 107,5 TOTAL
𝑁°/ 𝑍 < 15 𝑁° / 𝑍 ≥ 15 4 10 8 6 11 5 23 21
𝐶. 𝑉. (𝑌⁄𝑍 < 15) =
11,4726 = 0,1182 97,0652
𝐶. 𝑉. (𝑌⁄𝑍 ≥ 15) =
12,4642 = 0,1402 88,9286
Respuesta: Como C.V. (Y/ Z < 15) < C.V. (Y/ Z ≥ 15), la distribución del calor desprendido en el fraguado de las muestras son alumioderrito tetracálcico inferior al 15% es más homogénea.
𝑌𝑖 62,5 77,5 92,5 107,5 122,5
Z < 15 0 17,39 34,78 47,83 0,00
Z ≥ 15 0 47,62 28,57 23,81 0,00
Porcentajes Muestrales
10.1.2) Solución:
Calor desprendido (cal/gr)
Alejandro González Tapia – Ingeniería Civil en Minas
Página 19
1. Estadística Descriptiva – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
Respuesta: Ambas distribuciones son asimétricas (contrapuestas) teniendo menor desprendimiento de calor las con mayor porcentaje de aluminioferrito tetracálcico. 10.2) Solución: La medida más adecuada es el Coeficiente de correlación: r = - 0,7405, y los datos utilizados fueron los siguientes:
𝑥 12,5 27,5 42,5 55 TOTAL
77,5 0 3 5 6 14
𝑦 92,5 0 7 5 2 14
107,5 9 7 0 0 16
TOTAL 9 17 10 8 44
Respuesta: La asociación lineal que tienen entre el calor desprendido en el fraguado y el porcentaje de silicato dicálcico es inversa moderada, lo que se averiguo por medio del Coeficiente de correlación de Pearson. 10.3) Solución: Utilizando la información que nos brinda el ejercicio podemos definir la siguiente expresión: 𝑌𝑖 𝑌𝑖 = 55,8 + 0,8 𝑊𝑖 → 𝑊𝑖 = − 69,75 0,8 Luego de esto por medio de propiedades determinamos la media y desviación estándar 𝑀(𝑊 ) =
93,1818 − 69,75 = 46,7273 % 0,8
𝑆 (𝑊 ) =
12,51 = 15,6375 % 0,8
Reemplazando: 𝑊𝑖 = 𝑀(𝑊 ) + 𝑆 (𝑊 ) = 62,3648 → 𝑌𝑖 = 55,8 + 0,8 ∙ 62,3648 = 105,6918 (𝑐𝑎𝑙/𝑔𝑟) Finalmente, por fórmula de percentil, tenemos: 15 𝑝 ∙ 44 105,6918 = 100 + ( − 28) → 𝑝 = 77,4347% 16 100 Respuesta: El porcentaje de los cubos de cemento que en la muestra tienen un porcentaje de silicato tricálcico superior a su promedio más una desviación estándar es igual al 22,5653%
Página 20
Alejandro González Tapia – Ingeniería Civil en Minas