Solucionario Taller de Estadística Descriptiva y Probabilidades (Repaso para la Práctica Calificada N°2) Pregunta 1: De acuerdo al enunciado complete sobre que concepto o definición se trata: a. Es una medida relativa útil para comparar las dispersiones de dos o más grupos grupos de datos con variables de diferente unidad: ________ b. Son los tres valores que dividen en 4 partes iguales, cuando los datos son previamente ordenados: __________ c. La cola más larga de la distribución está a la izquierda, esto significa que la mayoría de los datos están concentrados a la derecha. El sesgo es originado por la presencia de valores extremos bajos: ___________
Solución: a. Coeficiente de variación b. Cuartiles c. Asimetría negativa.
Pregunta 2: En una fábrica que produce plásticos, se tienen 2 máquinas nuevas recientemente adquiridas desde Alemania. Estas producen miles de envases para contener productos de limpieza, envases para perfumes, etc. Se han hecho 10 pruebas a ambas maquinas sobre una una misma producción, con la finalidad de saber cuál de ellos tiene una mayor eficiencia en tiempo de producción en minutos.
41 42 43 45 45 43 45 50 44 56 54 45 52 46 43 46 44 49 46 43 a. ¿Qué medida estadística me permite permite saber a partir de qué valor del tiempo tiempo está el 55% de las pruebas menores para cada máquina? Mencione únicamente la medida estadística y justifique. b. ¿Cuál de las 2 máquinas tiene mediciones más homogéneas?
Solución a: La medida estadística que me permite saber el valor del tiempo donde está el 50% de las pruebas menores para cada máquina es el Percentil 55. Esto se halla primero ordenando de menor a mayor los datos no agrupados y se calcula el valor del percentil 55 y este será el valor solicitado.
Solución b: Para hallar cuál de las maquinas tiene pruebas más homogéneas se calcula el coeficiente de variación:
Para Zeus: Paso1:
Paso2:
∑ = = ++⋯+ = . ̅ ∑ = 1 + ⋯+44 . + 56 . = 41 . + 42 . 101 = 19.82 → = 4.45
̅ .100% = = . .100% = 9.80%
.
Para Athena: Paso1:
Paso2:
∑ = = ++⋯+ = . ̅ ∑ = 1 + ⋯+46 . + 43 . = 54 . + 45 . 101 = 13.96 → = 3.74
= . 1 00% ̅ = . .100% = 7.99%
.
Resumen
Zeus
Athena
Promedio
45.4
46.8
Desviación Estándar
4.45
3.74
Coeficiente Variación
9.80%
7.99%
Conclusión: La máquina más eficiente es Zeus ya que tiene un tiempo menor de producción, con respecto a la maquina Athena.
Zeus: 9.80% Existe una dispersión o variación en promedio de 9.81% con respecto al valor central que es 45.4 min. Este valor nos indica que el peso de los niños del departamento de Apurímac es homogéneo (poca dispersión). Athena: 7.90% Existe una dispersión o variación en promedio de 7.98% con respecto al valor central que es 46.8 min. Este valor nos indica que el peso de los niños del departamento de Huancavelica es homogéneo (poca dispersión). Conclusión: Como se aprecia la variabilidad del tiempo de producción para ambas maquinas es homogéneos, pero la maquina Athena produce r esultados más homogéneos.
Pregunta 3: La empresa Market Share es reconocida por su excelente reputación, clima laboral, cultura organizacional y los grandes beneficios que otorga a sus colaboradores. El Gerente General por víspera del aniversario de la empresa decide otorgar un bono de reconocimiento siempre y cuando se cumplas algunas condiciones, para ello pide una tabla de frecuencias organizada a su asistente, donde se pueda evidenciar los minutos adicionales que en los últimos 3 meses los empleado se han quedado trabajando, una vez finalizada la jornada laboral, de manera voluntaria para cumplir las metas.
X (minutos adicionales)
fi (empleado)
[50 – 70>
30
[70 – 90>
50
[90 – 110>
65
[110 – 130>
30
[130 – 150>
25
a. Si el 55% de los empleados tiene un tiempo de permanencia adicional y voluntaria menor a aproximadamente a 99.231 minutos, entonces el gerente general otorgará un bono de compras de mil soles a todos los empleados, de lo contrario, todos se quedarán sin bono este año. ¿Los empleados recibirán dicho bono? Justifique. b. Halle el cuartil 3, decil 1 e interprete.
Solución a: El enunciado trata sobre hallar el valor del Percentil 55:
Paso 1: Calcular la frecuencia absoluta acumulada Fi Paso 2: Ubicar la posición percentil, según factor: r = 55
=
100 55200 100 = 110
Este valor se encuentra en 80 y 145, elegimos el mayor, entonces se encuentra en el 3er intervalo.
Paso 3: Reemplazar en la fórmula:
= + . 100 − = 90+20.(11080 65 ) = 99.23
Se observa que El 55% de los empleados tienen un tiempo de permanencia menor a 99.23 minutos adicionales. Si tocará bono para todos.
Solución b: Hallemos el decil 1:
Paso 1: Calcular la frecuencia absoluta acumulada Fi Paso 2: Ubicar la posición decil, según factor: r = 1
10 = 1200 10 = 20
Este valor se encuentra en 0 y 30; elegimos el mayor, entonces se encuentra en el primer intervalo.
Paso 3: Reemplazar en la fórmula
= + . 10 − = 50+20. (200 30 ) = 63.33
Interpretación: El 10% de los empleado tienen un tiempo de permanencia adicional menor a 63.33 minutos.
Hallemos el cuartil 3:
Paso 1: Calcular la frecuencia absoluta acumulada Fi Paso 2: Ubicar la posición cuartil, según factor: r=3
: 4 = 32004 = 150
Este valor se encuentra en 145 y 175; elegimos el mayor, entonces se encuentra en el cuarto intervalo.
Paso 3: Reemplazar en la fórmula
= + . 4 − = 110+20. (150145 30 ) = 113.33
Interpretación: El 75% de los obreros tienen un tiempo de permanencia adicional menor a 113.33 minutos
Pregunta 4: Un ingeniero estadístico solicita un informe estadístico detallado sobre el grado de deformación horizontal o tipo de asimetría que puede tener un conjunto de datos que ha sido recopilado y posteriormente organizado por su asistente. El asistente ha llegado a la conclusión en el informe que los datos tienen un comportamiento simétrico. Se llegó a la conclusión también, que el grado de dispersión relativa porcentual no supera el 10%, por ende cataloga a los datos como homogéneos. Posteriormente el estadístico valida la información brindada por su asistente mediante un software estadístico, por lo que el asistente le brinda la siguiente tabla de frecuencias del peso de 62 alumnos.
[40; 42>
12
12
[42; 44>
10
22
[44; 46 >
14
36
[ 46; 48>
8
44
[48; 50>
7
51
[50; 52>
6
57
[52; 54>
5
62
Total
62
a. ¿El asistente tiene razón al decir que el grado de dispersión relativa por porcentual no supera el 10%? Considere una media de 45.8387. b. ¿El asistente tiene razón al decir que los datos tienen un comportamiento simétrico? Justifique.
Solución a:
= ̅ .100% = 45.= 3.87387730
El grado de dispersión relativa porcentual hace referencia al coeficiente de variación.
Hallemos:
Media (promedio) Desviación Estándar
(dato)
= ̅ .100% = .. .100% = 8.23%
El grado de dispersión relativa porcentual o también conocido como el coeficiente de variación es de 8.23% el cual es bajo y quiere decir que los datos tiene baja dispersión respecto a la media y se puede catalogar como homogéneos. Tiene razón el asistente.
Solución b: Para saber el comportamiento asimétrico o simétrico de lo s datos usamos la siguiente expresión:
As
3( X
Mediana) S x
̅ = 45.= 3.87387730
Sabemos: Media (promedio) Desviación Estándar Hallemos la mediana:
Paso 1: Hallar Frecuencia Absoluta Acumulada (Fi)
= = 31
Paso 2: ubicar la posición de la mediana
(se encuentra entre 22 y 36) elegimos
el mayor (La mediana se encuentra en el 3er intervalo de la tabla de frecuencias)
Paso 3:
−
= + ∙( ) = 44+2∙− = 45,28
Reemplazando:
As Coeficiente de asimetría:
3( X
Mediana) S x
=
..−. = 0.444
> 0, la distribución (forma de los datos) sobre el peso de los niños de Conclusión: Dado que: 10 años en el pueblo sudamericano tiene una deformación horizontal asimétrica y positiva, es decir, existe un sesgo o un asimetría en la cola derecha. Los datos se concentran más a la izquierda. Para que sea simétrico el coeficiente de asimétrica debe ser cero ( = 0). En consecuencia, el Asistente no tiene razón.