UNIVERSIDAD NACIONAL DE INGENIERIA Facultad de Ingeniería Geológica, Minera y Metalúrgica
CURSO: ESTADÍSTICA PRIMERA GUÍA DE TRABAJ0 Periodo Académico 2018 - II
Germán Elías Pomachagua Pérez
UNIDAD I PARTE 1 CONCEPTOS BÁSICOS POBLACIÓN.- Conjunto de elementos que conforman el universo a ser investigado, claramente definidos en el espacio y en el tiempo. Pueden ser personas, hogares, distritos, empresas, estudiantes universitarios, negocios, etc.
MUESTRA.- Es un subconjunto o una parte del universo o población, que ha sido seleccionado con el fin de estudiar una o más características de sus elementos, y obtener información acerca de la población de la cual proviene.
UNIDAD DE ANÁLISIS .- Es el elemento o unidad base de la población o de la muestra, del cual se obtendrá datos referidos a las características o variables vari ables que son de interés para explicar un determinado fenómeno que se desea estudiar.
UNIDAD REPORTANTE.- Es aquella persona que nos brinda la información que se solicita de los elementos que conforman la población o muestra.
PARÁMETRO.- Es una medida de resumen que se obtiene como resultado de operar los datos de toda la población, referida a una o más características. Se expresa por ejemplo como un total, un promedio, una proporción, una razón, etc.
ESTADÍGRAFO.- Es una medida de resumen o valor calculado en base a los datos que se obtienen de los elementos de una muestra, y, por lo tanto, es una estimación o aproximación del valor del parámetro.
VARIABLE.- Es una característica del elemento o unidad de análisis, cuyo valor o categoría, puede variar según el elemento que se observa. Se representa simbólicamente mediante las letras mayúsculas del alfabeto (X, Y, Z).
Germán Elías Pomachagua Pérez
2
PROBLEMAS PROPUESTOS 1.
Clasifique cada una de las siguientes variables: nominal (N), ordinal (O), discreta (D), continua (C).
i)
La comida favorita de una persona.
ii)
Edad del jefe de hogar (en años cumplidos).
iii)
Nivel socioeconómico del elector.
iv)
Suma de puntos obtenidos en el lanzamiento de un par de dados.
v)
Número de hijos de los trabajadores de una empresa.
vi)
Grado de satisfacción del servicio de los contribuyentes de SUNAT.
vii) Saldo en el depósito de ahorro de los clientes de una institución bancaria. 2.
La gerencia de marketing de una empresa de galletas desea estimar el promedio de cajas de galletas que se venden por por bodega durante un mes, en el Cercado de Lima. En base al resultado, la empresa debe decidir si implementara o no una campaña publicitaria por medios radiales. Se seleccionó una muestra aleatoria de 150 bodegas y se recolectó i nformación aplicando una encuesta. Responda las siguientes preguntas: a. ¿Qué clase de Estadística (Descriptiva o Inferencial) está utilizando el investigador académico? ¿Por qué? b. ¿Cuál es la población de estudio? c. ¿Cuál es la muestra seleccionada? d. ¿Cuál sería el marco muestral para el estudio? e. ¿Cuál es la unidad de análisis o elemental? f.
Determine y clasifique la variable de interés en el estudio.
Variable
Tipo de variable
- Número de cajas de galletas galletas que se venden en cada cada bodega bodega - Número de cajas de galletas que se venden de una determinada determinada marca. -
Monto mensual por la venta de galletas
-
Marca de la galleta
-
Lugar donde se encuentra la bodega (distrito)
-
Categoría de la bodega (Grande, mediana. Pequeña)
g. Defina cuáles, a su criterio, serían los parámetros de interés en el estudio.
Germán Elías Pomachagua Pérez
3
h. Defina cuáles, a su criterio, serían los estadísticos de interés en el estudio. 3.
La prueba de producto es una forma de investigación comercial, que tiene como objetivo conocer las bondades del producto en base a la opinión de una muestra de consumidores. APU S.A es una empresa de investigación de mercados que realizara una prueba de producto sobre un detergente para ropa “Blanquito”. “Blanquito”. Para la investigación, seleccionará una muestra de 500 hogares de los 47 distritos de Lima y Callao y se entrevistará al ama de casa. Entre las preguntas consideradas, las principales son: ¿Ha usado alguna vez el detergente de ropa “Blanquito”?, “Blanquito”?, ¿Cuántas veces en el último mes usó el detergente “Blanquito”?, “Blanquito”?, ¿Cuánto gastó usted en la última compra de detergente?, ¿Qué tan satisfecho se encuentra usted con este producto? a. Relacione usted los términos de la izquierda con los de la derecha, colocando las letras correspondientes en la columna del centro.
a) Variable
500 hogares de los 47 distritos.
b) Población
S/. 500 de gasto en detergente. (Lo que indicó la ama de casa del primer hogar entrevistado).
c) Unidad de análisis
Recopilación de información de toda la población.
d) Muestra
Todos los hogares de Lima y Callao.
e) Dato
Número de veces que la ama de casa usó el detergente “Blanquito” en el último mes
f) Censo
Una ama de casa.
g) Unidad reportante
Un hogar de Lima Metropolitana.
b. De acuerdo al enunciado, seleccione usted una variable cualita tiva y una variable cuantitativa y defina para cada una de ellas su parámetro de interés y su estadígrafo.
Variable 1 (cualitativa):
Parámetro.-
Estadígrafo
Variable 2 (cuantitativa):
Parámetro
Estadígrafo.-
Germán Elías Pomachagua Pérez
4
PARTE 2 PAQUETE ESTADÍSTICO DE MINITAB Minitab es un paquete estadístico que abarca todos los aspectos necesarios para el aprendizaje y la aplicación de la Estadística en general. El programa incorpora opciones vinculadas a las principales técnicas de análisis estadístico (análisis descriptivo, contrastes de hipótesis, análisis de varianza, regresión lineal y no lineal, análisis de series de tiempo, control de calidad, pruebas no paramétricas, análisis multivariado, etc.), además de proporcionar un potente entorno gráfico y de ofrecer total compatibilidad con los editores de texto, hojas de cálculo y bases de datos más usuales.
TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS Una tabla de frecuencias (también conocida como distribución de frecuencias) es una tabla en la que se organizan los datos en categorías o clases, es decir, en grupos de valores que describen una característica de los datos y muestran el número de observaciones del conjunto de datos que pertenecen a cada una de las clases. Cuadro Nº1 Arequipa: Distribución de personas según medios de comunicación utilizados - Mayo 2015 Medios de Comunicación utilizados
fi
hi
hi%
Internet
15
0.30
30%
Periódicos
24%
12
0.24
Radio
8
0.16
16%
Revistas
5
0.10
10%
Televisión No respondi respondió ó Total
5
0.10
10%
5
0.10
10%
50
1
100%
Fuente: Encuesta realizada por IKKF Marketing - Mayo 2015
GRÀFICOS ESTADÍSTICOS Los gráficos estadísticos presentan los datos en forma de dibujo de tal modo que se pueda percibir f ácilmente los hechos esenciales y compararlos con otros. o tros. Gráfico Nº 1 Escuela de Ne gocios: Distribuciónde estudiantes según número de cursos desaprobados - Semest re anterior 10 10
s
9 8
d
7
s
ut
ia
6
d
e
5
e
r
4
ú
3
n
te
e o m N
7 6
6
5 4
2
2 1
0
1
2
3
4
5
6
Número de cursos desaprobados Fuente: Archivo de notas de la Escuela de N egocios
TABLAS DE DOBLE ENTRADA Tablas de doble entrada: También llamadas tablas de contingencias, son aquellas tablas de datos referentes a dos variables, formada, en las cabeceras de las filas, por las categorías o valores de una variable y en las de las columnas por los de la otra, y en las casillas de la tabla, por las frecuencias o
Germán Elías Pomachagua Pérez
número de elementos que reúnen a la vez las dos categorías o valores de las dos variables que se cruzan en cada casilla.
.
PROBLEMAS PROPUESTOS Caso 1: Industrial Tools Industrial Tools es una empresa peruana dedicada a la producción de herramientas utilizadas en la industria metal-mecánica. El gerente de Recursos Humanos le ha entregado a usted un archivo de datos que corresponden al personal que labora en las áreas de administ ración y operaciones de dicha empresa, con el propósito que sean procesados y se obtenga algunos resultados que serán de interés para la empresa. Los datos se presentan en el archivo H er r ami enta ntas.MT s.M T W . La descripción de las variables se muestra a continuación: C1: Género: 1: Masculino, 2: Femenino. C2: Area: Es el área de trabajo 1: Administración, 2: Operaciones. C3: Sueldo : Es el sueldo mensual en soles, del trabajador al momento de registrar los datos. C4: Edad: Es la edad del trabajador en años cumplidos. C5: Estado Civil: Es el estado civil del trabajador 1: Soltero, 2: Casado, 3: Divorciado, 4: Viudo. C6: Condición laboral : 1: Contratado, 2: Estable. C7: Tiempo de servicios : Es la permanencia del trabajador tr abajador en la empresa, en años. C8: AFP: Es la AFP a la que está inscrito el trabajador en el momento de la l a investigación: 1: Horizonte, 2: Integra, 3: Prima, 4: Pro-Futuro 1.
En el contexto del caso presentado, identifique y defina lo si guiente:
Población: Muestra: Unidad de análisis Indique cuales son las variables cualitativas:
Indique cuales son las variables cuantitativas:
Germán Elías Pomachagua Pérez
6
2.
Inicie una sesión del programa MINITAB y a manera de entrenamiento, registre los siguientes datos para cada una de las variables de interés: Inicio > Programas > Minitab.
3.
Abra el archivo H er r ami enta Texto, transforme ntas.MT s.M T W . Utilizando Data>Recodificar>A Texto, (decodifique) los datos numéricos de la columna 1 a sus nombres (en texto) o categoría y almacénelos en la misma columna.
4.
Haga lo mismo que el ítem 3 con los datos de las columnas 2, 5, 6, y 8. Guarde los nuevos datos en su respectiva columna.
5.
Con Datos>Recodificar>A Con Datos>Recodificar>A Texto, utilice Texto, utilice la columna 9 (llámela: Nivel (llámela: Nivel de sueldo) sueldo) para guardar los datos de la columna 3 clasificados en 3 niveles de sueldo como sigue:
6.
Bajo
: sueldos menores que 2800 soles.
Moderado
: sueldos de 2800 o más, pero inferiores a 4200 soles.
Alto
: sueldos de 4200 soles a más.
Utilizando Estadísticas>Tablas>Cuenta Estadísticas>Tablas>Cuenta Individual de Variables…, construya la tabla de distribución de frecuencias para la variable Estado Civil, (realice el conteo de los datos de la columna 5 y luego complete la siguiente tabla):
Tabla N° 1 Distribución del personal según estado civil Industrial Tools – Áreas Administración y Operaciones Estado civil Soltero
Conteo (f j)
Porcentaje (h j%)
Casado Divorciado Viudo Total Fuente: guía de trabajo 1 2017-1 7.
Interprete en términos del problema las frecuencias f 2 y h2. Muestre el gráfico de barras para este caso f2: ___________________________________________________________________________ h2: _____________________________________:_____________________________________
Germán Elías Pomachagua Pérez
7
8. Con los datos de la Variable Estado Civil construya un gráfico de barras y un gráfico circular. (Gráfica>Gráfica de barras) y ( Gráfica>Gráfica circular ). ). 9. Utilice los datos de la variable Estados Civil para construir un gráfico circular desagregado por género (Gráfica>Gráfica Circular>Gráficas múltiples). 10. Igual que el ítem 9, con la variable AFP variable AFP para para construir un gráfico de barras desagregado por Area por Area.. 11. De manera similar construya la tabla de distribución de frecuencias para la variable AFP a la que esté inscrita el trabajador y para la variable Nivel variable Nivel de Sueldo.
Tabla N° 2 Distribución del personal según afiliación a la AFP Industrial Tools – Áreas Administración y Operaciones AFP
Conteo (f j)
Tabla N° 3 Distribución del personal según el Nivel de Sueldo Industrial Tools – Áreas Administración y Operaciones AFP
Porcentaje (h j%)
HORIZONTE INTEGRA PRIMA PROFUTURO Total Fuente: guía de trabajo 1 2017-1
Conteo (f j)
Porcentaje (h j%)
BAJO MODERADO ALTO Total 100.00 Fuente: guía de trabajo 1 2017-1
12. En base a los resultados mostrados en las tablas de distribución de frecuencias 1, 2 y 3, responda lo siguiente: a) ¿Cuántos y que porcentaje de trabajadores son casados? _______ de ________; ________; es decir el _________%. _________%. b)
¿A cuál AFP están afiliados la mayoría de trabajadores de estas áreas?, ¿qué porcentaje representan? _____________________ ________________________________ ______________________ _______________ ____
c) ¿Cuántos y qué porcentaje de trabajadores tienen un Nivel un Nivel de Sueldo moderado Sueldo moderado o alto? _______ de ________; ________; es decir el _________%. _________%. d) ¿Cuántos y que porcentaje de trabajadores tienen sueldos moderados o bajos? _______ de ________; ________; es decir el _________%. _________%.
13. Recodifique convenientemente los datos de la columna años de servicio ( Datos ( Datos> > Recodificar > A Texto), Texto), y luego responda: ¿Cuántos y que porcentaje de trabajadores tienen 10 o más años de servicio? ____ de ___________; ___________; es decir el ___________%. ___________%.
Germán Elías Pomachagua Pérez
8
14. Construya la tabla de distribución de frecuencias para l a variable Sueldo mensual , considerando el número de intervalos de clases obtenido con el procedimiento de Sturges. Interpret e las frecuencias f 3, h3, F4 y H4, y muestre el histograma respectivo.
Punto medio Xi
Intervalos
Total
fi
hi%
Fi
Hi%
223
f 3: ________________________________________________________________ h3: ________________________________________________________________ F4: ________________________________________________________________ H4: _______________________________________________________________ 15. Construya la tabla de distribución de frecuencias para la variable Sueldo mensual , considerando 5 intervalos de clase de igual longitud. 16. Empleando E stad stadí stica sticas>T s>Ta ablas> T abulaci bulació ón Cr C r uzad uzada y Chi Chi C uadr uadr ada…, haga la tabulación cruzada de los datos de las variables Area Area (filas) y Género Género (columnas), y luego complete el siguiente cuadro:
Tabla Nº 4 Distribución del personal por área de trabajo según género Industrial Tools – Áreas Administración y Operaciones
Á
Hombres
Mujeres
Total
Administración Operaciones Total
Fuente: guía de trabajo 1 2017-1
Germán Elías Pomachagua Pérez
9
17. Empleando el mismo comando del punto anterior, haga la tabulación cruzada de los datos de las Estado civil y género y género,, luego complete el siguiente cuadro:
Tabla Nº 5 Distribución del personal por estado civil según género Industrial Tools – Áreas Administración y Operaciones Estado civil
Hombres
Mujeres
Total
Soltero Casado Divorciado Viudo Total
18. Teniendo en cuenta los resultados de las tablas 4 y 5, responda lo siguiente: a) ¿Cuántos y que porcentaje de trabajadores están e n el área de administración y son mujeres? ________ de __________; es decir el ________%. ________%. b) ¿Cuántos y que porcentaje de trabajadores del área de administración son mujeres? ________ de __________; es decir el ________%. ________%. c) De los trabajadores varones, ¿Cuántos y que porcentaje de ell os son casados o divorciados? _______ de __________; __________; es decir el ________%. ________%. 19. Usando convenientemente tabulaciones cruzadas, responda lo siguiente: a) De los trabajadores del área de operaciones, ¿cuántos y que porcentaje de ellos ell os tienen sueldos moderados? ________ de __________; __________; es decir el _______%. _______%. b) De los trabajadores del área de Administración, ¿cuántos y que porcentaje de ellos tienen sueldos moderados? ________ de ________; es decir el _________%. _________%. c) De los trabajadores solteros, ¿cuántos y que porcentaje de ellos tienen 10 o más años de servicio? _____ de _________; _________; es decir el ________ %. 20. Utilizando tabulaciones cruzadas complete las frecuencias simples de las siguientes tablas cruzadas: Empleando Estadísticas>Tablas>Tabulation Empleando Estadísticas>Tablas>Tabulation Cruzada y Chi Cuadrada / Filas: Nivel de Sueldo / Columnas: Género Area
Germán Elías Pomachagua Pérez
10
Tabla Nº 6 Distribución del personal según género, nivel de sueldo y área de trabajo Industrial Tools – Áreas Administración y Operaciones Nivel de sueldo
Hombres Administración
Operaciones
Total
Nivel sueldo
de
Alto
Alto
Moderado
Moderado
Bajo
Bajo
Total
Total
Germán Elías Pomachagua Pérez
Mujeres Administración
Operaciones
Total
11
UNIDAD II PARTE 1 MEDIDAS ESTADISTICAS Cuando se trata de describir datos, con frecuencia conviene resumirlas con un solo número. Las medidas estadísticas se obtienen como resultado de operar los datos referidos a un grupo de observaciones, y permiten resumir información proveniente de una muestra o de una población. p oblación. Estas medidas aplicadas a las características de las unidades o elementos de una muestra se denominan estadísticos o estadígrafos, mientras que, aplicadas a elementos de una población se denomina pa par ámetr os o valores valores estad estadíí sticos sti cos de la poblaci población ón. -
Medidas de Tendencia Central: Media Aritmética, Mediana y Moda
-
Medidas de Posición: Cuartiles, Percentiles
-
Medidas estadísticas de variabilidad: Rango, Rango intercuartil, Varianza, Desviación Estándar, Coeficiente de Variación)
-
Medidas de forma: Coeficiente de asimetría
ESTADIGRAFO
DATOS ORIGINALES
∑ = ̅
MEDIA ARITMETICA
X n1 si n impar 2 M e X n X n 1 2 2 si n es par 2
MEDIANA
DATOS AGRUPADOS m
x
x f i
X f
i
i 1
i
x
n
i
i 1
n
n F i 1 2 Me Li C i fi fi Mo
MODA
m
Valor de la variable más frecuente
Li
C i
d d
1
1
d 1
f i
f i
1
d 2
d 2 f i f i 1
PERCENTILES
Si Si
k (n 1) 100 10 0 k (n 1) 100 100
Z P K X K ( n 1)
E .d Z
k n F i 1 100 P k Linf C i 100 f i P K X E d ( X E 1 X E )
Germán Elías Pomachagua Pérez
k 1,2,....... 99
12
N
( x
VARIANZA POBLACIONAL
VARIANZA MUESTRAL
2
n
( x S 2
i
2 f ( X ) i i
) 2
i
i 1
2
N n xi n i1 x 2
x ) 2
i 1
n 1
i
COEFICIENTE DE ASIMETRIA
f ( X X ) i
S 2
n 1
Datos agrupados sin intervalos
f S 2
´
i 1
i
N 2
i
i 1
n 1
( ( ) ̅ ×100 3 3 −
COEFICIENTE DE VARIACION
n
i 1
2
n
i 1
2
( xi x )
n 1
n x f i i n xi2 f i i 1
n
x f n x
2
2 i
i 1
2
i
n 1
2
n
i 1
n 1
Si los datos caen fuera del intervalo: P 25 1.5 RIQ RIQ , P 75 1.5 RIQ RIQ es un outlier
P 25 3 RIQ RIQ , P 75 3 RIQ RIQ es un outlier extremo
PROBLEMAS PROPUESTOS 1.
Caso 1.- Empresa Data Servis La empresa “Data-Servis” realizo un estudio para la Municipalidad Metropolitana de Lima, con la finalidad de conocer algunas características de los vehículos que utilizan l as empresas de transporte público y aplicar el programa “chatarreo”. El estudio se llevó a cabo en Lima Metropolitana y las medidas de resumen obtenidas se presentan a continuación:
Tipo de vehículo Bus Combi Microbus
Antigüedad del vehículo Media Mediana Moda 20,86 21 25 22,52 23 26 21,37 21 24
Precio del vehículo Coef. variación Coef. asimetría 7,26 -1,34 15,21 1,56 13,64 -0,04
Conteste usted las siguientes interrogantes, justificando plenamente su respuesta. a) ¿Se puede afirmar que la mitad de los vehículos tipo Bus, tiene una antigüedad mayor que la de
los vehículos tipo Combi?
Germán Elías Pomachagua Pérez
13
b) ¿Se puede afirmar que la antigüedad anti güedad promedio de los vehículos tipo Combi, es menor que la de
los vehículos tipo Microbus?
c) ¿Se puede afirmar que la mayoría de los vehículos de transporte público tipo Combi en Lima
Metropolitana tiene una antigüedad de 23 años?
d) ¿En qué tipo de vehículo de transporte público los precios son más heterogéneos? .
e) ¿Es la distribución de los precios de los vehículos tipo Bus, más asimétrica (más sesgada) que
la de los vehículos tipo Combi?
f) Interprete los percentiles P15 = 27 y P85 = 56 de la variable antigüedad de los vehículos de
transporte público. P15 = 27: P85 = 56:
g) En base al siguiente diagrama, justifique como verdadera o falsa, las afirmaciones siguientes:
Germán Elías Pomachagua Pérez
14
Gráfica de caja de Antiguedad 30
25 d a d e u g 20 i t n A
15
10 Dodge
Mercedes Benz
Scania
Marca
- La antigüedad promedio en los vehículos Mercedes Benz, es menor que en los vehículos Scania.
- La distribución de la antigüedad de los vehículos de la marca Scania, es más homogénea que en la de la marca Mercedes Benz.
- La distribución de la antigüedad de los vehículos de la marca Scania parece tener asimetría o sesgo negativo, mientras que en la marca Dodge, la distribución es asimétrica negativa.
- La antigüedad del 25% superior de los vehículos marca Mercedes Benz, parece tener una variabilidad menor que la antigüedad del 25% superior de los vehículos marca Scania.
2.
Caso: Los Practicantes En la Escuela de Negocios Globales los estudiantes tienen la oportunidad de realizar prácticas pre profesionales, profesionales, brindando brindando soporte soporte a los proyectos proyectos de investigación investigación que realizan los docentes docentes investigadores. La Coordinación Académica ha recabado datos asociados a un conjunto de variables relacionadas a los mencionados practicantes y ha creado el archivo Practicantes.MTW , cuya estructura se detalla a continuación:
Germán Elías Pomachagua Pérez
15
C2
Línea_Inv
Línea de investigación del proyecto asignado
C3
Carrera
Carrera a la que pertenece el practicante.
C4
Rendimiento
Evaluación del desempeño del practicante.
C5
H_Dedicación
Horas de dedicación durante la duración del proyecto
C6
PPA
Promedio ponderado acumulado del practicante
C7
Informes
Cantidad de informes presentados durante el proyecto
a. ¿En cuál(es) línea(s) de investigación el porcentaje de practicantes con rendimiento bueno supera el 25%? Muestre los valores.
b. Reclasifique el rendimiento de los alumnos, de modo que aquellos con alto rendimiento (Bueno y Excelente) sean agrupados en la categoría A, mientras que los restantes en la categoría B. Luego, guarde los datos resultantes en la columna 8 (Categoría).
c. Luego de realizada la recodificación, elabore un gráfico de barras conglomeradas conglomeradas porcentuales, porcentuales, de modo que la suma de dichos porcentajes sea 100% para cada línea de investigación. (Use: opciones de gráfica)
d. Para los practicantes de Negocios Globales; de entre los que fueron asignados a la línea de investigación 2, ¿Cuántos ______ y que porcentaje de ellos están en la cate goría B ______?
e. A partir de los datos correspondientes al PPA, obtenga un histograma, utilizando el criterio de Sturges, así Sturges, así como los valores mínimo, máximo, el rango y la amplitud correspondientes. Utilizar un decimal para para la amplitud del intervalo (Tamaño del intervalo de clase). Mínimo
Máximo
Rango (R)
Intervalos (k)
Amplitud (C)
e.1) Basado en el histograma complete el siguiente cuadro, registrando la información que corresponde a los intervalos 3, 4 y 5
3
Intervalos
Punto medio
Fi
Hi%
4 5
Germán Elías Pomachagua Pérez
16
e.2) Interprete el valor de F6 – F2 correspondiente a los practicantes de la carrera de Administración y Gerencia.
_______________ ____________________ Hay:
practicantes de la carrera de Administración y Gerencia, con PPA entre
f. En relación a las horas de dedicación y al número de informes responda a las siguientes preguntas:
f.1) En la base de datos se agrega a 20 practicantes de la carrera de Contabilidad, quienes presentaron, en promedio, 380 horas de dedicación durante la ejecución del proyecto, ¿cuál será el nuevo promedio de las horas de dedicación de todos los practicantes en conjunto? _______________________ __________________________________ ______________________ ______________________ ______________________ _______________ ____
f.2) Hay un 20% de practicantes que dedicaron más tiempo a los proyectos en los que fueron asignados. Hallar el tiempo mínimo de un practicante de este grupo, _____________________ ________________________________ ______________________ ______________________ ______________________ ______________________ _____________ f.3) Para los practicantes de la carrera de Negocios Globales, Globales, se desea conocer cuál es la nota mínima PPA, que debe tener un estudiante para ser considerado dentro del décimo superior de practicantes con mayores PPA. ______________________ _________________________________ _______________________ _______________________ ______________________ ______________ ___
f.4) ¿Es la variación relativa (coef. de variación) del tiempo que dedican al proyecto los practicantes de Negocios Globales asignados a la línea de investigación 4, menor que la de los practicantes de Administración y Gerencia asignados a la misma línea de investigación?. Línea de Investigación 4: Tiempo de dedicación
C.V.
Negocios Globales Administración y Gerencia
Rpta.
______________________________________________________________ _________________ __________________________ __________________ ________________ ________________ __________________ __________________ __________________ _________________ ______________ ______
3.
Caso: Vivand y Wona Una empresa de estudios de mercado ha realizado un estudio para averiguar el gasto mensual en cerveza (en soles), que realizan los consumidores en dos supermercados de Lima Metropolitana, Vivand y Wona. Para el estudio se han considerado tamaños de muestra de 500 y 700 consumidores, respectivamente. Los resultados obtenidos se presentan a continuación:
Germán Elías Pomachagua Pérez
17
a. ¿En cuál de los supermercados el gasto promedio del consumo de cerveza es mayor? Supermercado Vivand: Supermercado Wona:
∑ ∗
b. ¿Cuál es el gasto mínimo del 25% de los consumidores del supermercado Wona.? Justifique su respuesta con medidas estadísticas.
______________________ ___________________________________ _______________________ ______________________ ______________________ ______________________ ______________ __ c. ¿En qué supermercado la cantidad de dinero gastado por los consumidores consumidores es más homogéneo? Justifique su respuesta con medidas estadísticas. Supermercado Vivand:
Media =
.
Media =
..
Supermercado Wona: S=
Rpta. : _____________________________________________________________________ _________________ __________________________ _________________ ________________ _________________ __________________ __________________ __________________ __________________ __________________ ________________ _______
d. ¿En qué supermercado el gasto de dinero invertido en cerveza es menos asimétrico? Justifique su respuesta con medidas estadísticas. (Supermercado Vivand Mo = 46.67).
-
Supermercado Vivand:
-
Supermercado Wona:
Rpta. : _____________________________________________________________________
Germán Elías Pomachagua Pérez
18
_________________ __________________________ _________________ ________________ _________________ __________________ __________________ __________________ __________________ __________________ ________________ _______
e. ¿En qué supermercado se tiene el mayor rango de variación del 100% de los datos? datos? Justifique su respuesta con la medida estadística correspondiente. Supermercado Vivand:
Supermercado Wona: Rpta. : _____________________________________________________________________ _________________ __________________________ _________________ ________________ _________________ __________________ __________________ __________________ __________________ __________________ ________________ _______
f. ¿En qué supermercado se tiene el mayor rango de variación del 50% central de los datos? Justifique su respuesta con la medida estadística correspondiente. Supermercado Vivand:
Supermercado Wona: Rpta. : _____________________________________________________________________ _________________ __________________________ _________________ ________________ _________________ __________________ __________________ __________________ __________________ __________________ ________________ _______
4.
Caso: Parque Automotor de servicio de transporte público en Lima Metropolitana Una entidad de gobierno está interesada en conocer la antigüedad del parque automotor del servicio de transporte público en Lima Metropolitana con la finalidad de lanzar el proyecto de Chatarreo; en la actualidad se han inscrito 8 empresas para acogerse a tal proyecto. Se ha elegido aleatoriamente 3 empresas inscritas para la verificación de la información presentada. Las variables que se han evaluado son:
Marca: Es la marca del vehículo. Antiguedad: Es la antigüedad del vehículo (en años). Tipo: Es el tipo de vehículo (microbús, combi, bus). Nro.Asient: Número de asientos por cada unidad automotriz Tipo de combustible: Es el tipo de combustible utilizado por el vehículo (petróleo, gasolina). Los datos se encuentran en el archivo de Minitab Chatarreo.MTW a. Utilice el comando Stat>Basic Statistics>Display Descriptive Statistics Statistics para procesar la información de la variable antigüedad del vehículo, a continuación, complete las siguientes tablas de indicadores:
ℎí Germán Elías Pomachagua Pérez
Promedio
Mediana
Moda
19
ℎí
Promedio
Mediana
Moda
Buses Combis Microbuses ¿Es la antigüedad promedio de los buses menor que la antigüedad mediana de las combis?
b. Utilice el comando anterior para procesar la información de la variable antigüedad, desagregada por tipo de combustible utilizado por el vehículo. Stat>Basic Statistics>Display Descriptive Statistics>Variables: Antigüedad / By variables (optional): Tipo de combustible Marca Vehículos gasolineros
Promedio
Vehículos petroleros Mediana
Marca
Dodge
Dodge
Mercedes Benz
Mercedes Benz
Scania
Scania
Promedio
Mediana
c. ¿En qué marca o marcas de vehículos se tiene que más del 50% de unidades tienen una antigüedad mayor a su promedio?____________ promedio?_____________________ __________________ _________ d. ¿Cuál es el promedio del número de asientos en los buses que utilizan petróleo? Tipo de combustible = petróleo
ℎí
Promedio
Bus Combi Microbuses
e. ¿Es verdad que la antigüedad promedio de las combis que utilizan gasolina, es igual a la de los microbuses que utilizan petróleo?.
f. Suponga que el costo mensual de mantenimiento de un bus es, en promedio, 150 soles; de una combi es, en promedio, 90 soles; y de un microbús es, en promedio, 120 soles. Calc ule el costo promedio mensual de mantenimiento de un vehículo. Detalle el procedimiento.
ℎí
Costo promedio
Nº de vehículos
Costo total
Buses
Germán Elías Pomachagua Pérez
20
Combis Microbuses El costo promedio mensual de mantenimiento de un vehículo es: _______________ _______________ g. Procese la información de la variable número de asientos para determinar los siguientes indicadores:
1 Tipo de vehículo
Mediana
Q1
Q3
Mediana
Q3
Buses Combis Microbuses h. De las tablas del inciso anterior, interprete: El valor de Q1 en la primera tabla: _______________________ __________________________________ ______________________ _____________ __
_______________________ ___________________________________ ______________________ ______________________ ______________________ ______________________ _______________ ___ El valor de Q3 en la segunda tabla: ______________________ _____________________________ _______ ______________ _________________________ ______________________ _____________________ __________
_______________________ ___________________________________ ______________________ ______________________ ______________________ ______________________ _______________ ___ _______________________ ___________________________________ ______________________ ______________________ ______________________ ______________________ _______________ ___ i.
Utilice la calculadora de Minitab para Minitab para calcular e interpretar el valor del percentil 20 con los datos de la variable antigüedad (columna 2).
_______________________ ___________________________________ _______________________ ______________________ _______________________ _______________________ _____________ __ j.
Utilice el menú: Datos menú: Datos > Split Worksheet (Dividir hoja de trabajo), trabajo) , para calcular el número mínimo de asientos que tiene el 10% de los vehículos de la marca Mercedes Benz.
_________________________ _____________________________________ ______________________ ______________________ ______________________ ______________________ ______________ k. Empleando previamente el comando Data>Split comando Data>Split Worksheet ; utilice la calculadora del Minitab para determinar el valor del percentil 90 del número de asientos, desagregado por tipo de combustible.
______________________ ___________________________________ ______________________ ______________________ ______________________ ______________________ _______________ __ ______________________ _________________________________ ______________________ ______________________ ______________________ ___________________ ________
Germán Elías Pomachagua Pérez
21
l.
¿Es verdad que la antigüedad máxima del 85% de los buses de la marca Scania, es mayor que la antigüedad mínima del 15% de las combis de la marca Dodge?. _____________________ ________________________________ ______________________ ______________________ ______________________ _____________________ __________ _____________________ ________________________________ ______________________ ______________________ ______________________ _____________________ __________
______________________ ___________________________________ __________________________ _________________________ ______________________ ______________________ ____________ m. ¿En cuál de las marcas se observa menor dispersión relativa (mayor homogeneidad) en la distribución de la antigüedad? Variable Antigüedad
ℎí
Coeficiente de variación
Dodge
Mercedes Benz Scania Rpta.: ______________________________________________________________________ n. ¿En qué tipo de vehículos la distribución del número de asientos es más asimétrica?
Tipo de Vehículo
Coeficiente de Asimetría
Buses Combis Microbuses Rpta.: ______________________________________________________________________ o. Con el comando Graph>Boxplot>Simple, construya un diagrama de cajas para la variable antigüedad del vehículo. p. Al construir un diagrama de cajas para los datos de la variable antigüedad desagregado por marca del vehículo, responda las siguientes preguntas: i.
¿Observa usted valores atípicos (outliers)? ______________________ _________________________________ ______________________ ______________________ ______________________ _________________ ______
ii.
¿En qué marca de vehículo se observa mayor asimetría con r especto a la antigüedad? _____________________ ________________________________ ______________________ ______________________ _______________________ __________________ ______
iii.
Si consideramos en cada caso el cuarto superior de datos ¿en cuál de las marcas se observa mayor homogeneidad? _____________________ ________________________________ _______________________ _______________________ ______________________ _________________ ______
Germán Elías Pomachagua Pérez
22
5.
Caso: Empresa “T_Apoyo” La empresa de investigación de mercados “T_Apoyo” quiere evaluar algunas características de usuarios de telefonía en la ciudad de Lima. Por esta razón se tomó información de una muestra de 300 usuarios de la ciudad de Lima. Las variables que se consideraron en el estudio son las siguientes: C1: Género (Femenino, Masculino) C2: Edad (años) C3: Distrito de residencia (Jesús María, Miraflores, San Isidro, San Miguel, Santiago de Surco) C4: Empresa a la que pertenece el usuario (Claro, Nextell, Telefónica) C5: Gasto mensual en telefonía móvil (en soles) C6: Quejas sobre el servicio Los datos recogidos se muestran en el archivo Telefonia.MTW , disponible en el aula virtual. Considerando esta información responda las siguientes preguntas, mostrando el resultado numérico que justifique su respuesta.
a. Si los gastos se clasifican en 3 categorías de acuerdo al siguiente esquema: Bajos: usuarios con gastos inferiores a 50 soles Moderados: usuarios con gastos de 50 o más y menos de 100 soles Altos: usuarios con gastos de 100 soles a más
De entre los clientes de género masculino, ¿Cuántos y que porcentaje de ellos tienen gastos moderados o bajos? Stat
Categorías de Gasto
Femenino
Masculino
Total
Alto Moderado Bajo Total
b. De entre los clientes que tienen menos de 25 años de edad, ¿Cuántos y que porcentaje de ellos usan teléfonos de la empresa Claro? Los clientes que tienen menos de 25 años de edad y usan teléfonos de la empresa Claro son______ de _______ y representa el _____________%
Germán Elías Pomachagua Pérez
23
Claro
Empresa
Nextell
Telefónica
Total
Mayor o igual a 25 años Menor a 25 años Total
c. ¿Se puede afirmar que el gasto promedio mensual de los usuarios de celular de la marca Telefónica es inferior al gasto promedio mensual de los usuarios de celulares de la marca Claro?
Empresa
Promedio
Claro Nextell Telefónica
d. Considerando a los residentes del distrito de San Isidro, ¿es correcto afirmar que los hombres tienen un gasto promedio mayor al de las mujeres? Distrito de residencia = San Isidro
Empresa
Promedio
Femenino Masculino
e. ¿Será la moda una medida de resumen representativa de las edades tanto en hombres como en mujeres? ¿Por qué?
Genero
Moda
Femenino Masculino
f. Una de las conclusiones del estudio es que se puede afirmar que: “con “ con respecto a los gastos mensuales, el promedio es menor que la mediana”. mediana” . Indique ¿para qué distrito de la ciudad de Lima se cumple esta afirmación? Señale los valores correspondientes.
Germán Elías Pomachagua Pérez
24
Statistic
Distrito de residencia
Promedio
Mediana
Jesús María Miraflores San Isidro San Miguel Santiago de Surco
g. Si comparamos los gastos de los hombres con el de las mujeres, ¿es correcto afirmar que el gasto de los hombres es más homogéneo que el de las mujeres?
Genero
Coeficiente de Variación
Femenino Masculino
h. Calcule los valores del gasto entre los cuales se encuentran el 80% central de los usuarios, e indique las medidas estadísticas y sus respectivos valores que utilizó para el cálculo..
i. ¿En qué distrito los gastos mensuales son menos asimétricos? Distrito de residencia
Coeficiente de Asimetría
Jesús María Miraflores San Isidro San Miguel Santiago de Surco
j. ¿Cuál es la edad mínima del 25% superior de usuar ios considerados los de mayor edad? Grupo de Edad
Mayor igual a 25 años Menor a 25 años
Germán Elías Pomachagua Pérez
25
6.
Construya una tabla de distribución de frecuencias con 7 intervalos para la variable gasto mensual en telefonía móvil. Intervalos
Punto medio Xi
Total
-----
fi
hi%
Con la información obtenida en la pregunta anterior (es decir en base a los resultados de la tabla) responda lo siguiente: a) ¿Cuál es el promedio y la desviación estándar del gasto mensual en telefonía móvil? Li 25 63 101 139 177 215 253
b)
Ls 63 101 139 177 215 253 291
Xi 44 82 120 158 196 234 272
f i 66 122 91 17 3 0 1 300
Xi*f i
Xi2*f i
Considerando la empresa de telefonía a la que pertenece el usuario y construyendo un gráfico de cajas ¿en cuál de las empresas de telefonía el gasto promedio de sus usuarios no es una medida de resumen representativa de los gastos? Indique porqué.
c)
Supongamos que que la Telefónica reduce su tarifa en un 5%. En base a esta información responda las siguientes preguntas: i. ¿Cuál sería el nuevo gasto promedio mensual en tel efonía móvil? ii. ¿Cuál sería el nuevo valor de la varianza del gasto mensual en telefonía móvil luego de la reducción de la tarifa?
Germán Elías Pomachagua Pérez
26
iii. ¿Cree usted que la homogeneidad del gasto mensual en telefonía móvil ha disminuido, después que telefónica redujo su tarifa en 5%?. 5%? .
Germán Elías Pomachagua Pérez
27
PROBLEMAS ADICIONALES 1. La nota promedio general en un examen fue 12.6. Los aprobados obtuvieron un promedio de 14.4 y los desaprobados, en promedio, obtuvieron 8.4. Determine el porcentaje de desaprobados.
2. En la empresa industrial REX. industrial REX. S.A. S.A. el personal de planta tiene un salario promedio mensual de 1800 soles con una varianza de 90000 soles 2. En una negociación laboral con el sindicato se acordó un incremento de un 20% en los salarios más una bonificación adicional de 80 soles por concepto de movilidad. Calcule el salario promedio, la varianza y el coeficiente de variabilidad luego de aplicadas las modificaciones.
3. En una empresa de servicios generales, el salario promedio de sus trabajadores es 2360 soles, el salario promedio del personal masculino es de 2500 soles y el salario promedio del personal femenino es de 2100 soles. ¿Qué porcentaje del personal de esta empresa es masculino y que porcentaje es femenino?
4. En cierta región del país, el ingreso promedio mensual por trabajador es 650 soles. El sector asalariado que representa el 30% de la fuerza laboral de la región recibe 2/5 del ingreso total. Calcule el ingreso promedio mensual del sector no asalariado.
5. En una empresa los pagos diarios a proveedores se pueden representar mediante una distribución simétrica y simétrica y se sabe que el monto pagado con mayor frecuencia es 500 soles y uno de los cuartiles es 650. También se sabe que lo mínimo que se paga en un día es 200 soles y la desviación estándar es 100 soles. Se pide: a) Indique el valor de los cuartiles inferior, central y superior b) Se sabe que últimamente los pagos diarios se han i ncrementado en un 10% más 25 soles. ¿Cuál es el coeficiente de variación de los pagos diarios con el incremento?
6. En una empresa, 400 trabajadores forman el Grupo 1 y lo conforman: Operarios (Subgrupo 1A) y técnicos (Subgrupo 1B). la cantidad de trabajadores del grupo 1 es el 80% del total de trabajadores de la empresa, y tienen un sueldo mensual promedio de 2730.5 soles. El otro 20% de trabajadores de la empresa lo conforman los ejecutivos y trabajadores administrativos (grupo 2), y tienen un sueldo mensual promedio de 6500 soles.
Germán Elías Pomachagua Pérez
28
a) Si se conoce que el sueldo mensual promedio de los operarios es 2270 soles y el sueldo mensual promedio promedio de los técnicos técnicos es 3498 3498 soles; soles; halle el número número de operario operarioss y técnicos técnicos que tiene la empresa. empresa. b) Si la dirección de la empresa establece una bonificación de 50 soles para los operarios, una bonificación del 8% del sueldo mensual para para los técnicos, y una una bonificación de 200 soles para los trabajadores del grupo 2; halle el sueldo promedio para todos los trabajadores de la empresa.
7. En una empresa de servicios generales, el salario promedio de sus trabajadores es 3360 soles, el salario promedio del personal masculino es de 3500 soles y el salario promedio del personal femenino es de 3100 soles. a) ¿Qué porcentaje del personal de esta empresa es masculino y que porcentaje es femenino?
b) Para el próximo mes la empresa acordó aumentar 10% del salario al personal masculino y 7.5% más una bonificación de 80 soles al salario del personal femenino, ¿de qué monto debe disponer la empresa a fin de mes para hacer efectivo el pago a los 200 trabajadores de la empresa?
8. Desde hace dos años las compañías gastan en protección de la información. Estos gastos incluyen los costos de personal, hardware, software, servicios externos y seguridad física. Se eligieron dos empresas transnacionales y se registraron sus gastos mensuales, en miles de dólares, correspondientes a la protección de la información de los últimos 6 meses. Luego de procesar los datos se obtuvieron los siguientes resultados parciales. 6
Empresa 1: Empresa 2:
x
i
16.8
6
x
2 i
i 1
i 1
6
6
x
i
13.2
i 1
x
2 i
58.99 36.88
Me = 3.0 Me = 2.5
i 1
a) ¿Cuál de las dos empresas ha tenidos gastos mensuales más homogéneos en los últimos seis meses?; ¿Cuál de ellas ha tenido gastos más asimétricos? b) Si como resultado de la inseguridad actual, el directorio de la empresa 2 acordó aumentar sus gastos en protección en un 5% más 800 dólares, ¿cuál será el coeficiente de variación de los gastos en protección para esta empresa el próximo mes?
9. De una distribución se conoce la siguiente información: tamaño (n = 20); media ( x = 400); mediana (Me = 450); menor valor (X (1) = 100) y rango rango (R = 900). 900). Al introducir los datos en la computadora se ha cometido un error tipográfico sustituyendo el valor (único) X = 1000, por el de X = 10000. ¿Cómo afectará este error en el cálculo de la media, mediana y rango? Calcula los nuevos valores.
Germán Elías Pomachagua Pérez
29
10. Responda como verdadero (V) o falso (F) cada uno de los siguientes enunciados: a) En todo conjunto de datos, la varianza siempre es mayor que su desviación desviación estándar. (
)
b) En una distribución sesgada a la derecha, la mediana es menor que la media.
)
(
c) La nota promedio de los 40 alumnos que rindieron un examen de Cálculo II fue 11.75. Los 25 aprobados obtuvieron una nota promedio de 14, luego la nota promedio de los desaprobados fue 08.
(
)
11. Nueve 11. Nueve expertos clasificaron una galleta con trozos de chocolate en una escala de 1 a 50. Sus calificaciones fueron: 34, 35, 41, 28, 26, 29, 32, 38 y 40. a) ¿Cuál es la amplitud de las calificaciones? 26
28
29
32
34 35
38
40
41
Rango =
b) ¿Cuál es la media aritmética? c) ¿Cuál es su desviación estándar?
S=
d) Un segundo grupo de expertos calificó el mismo producto. La amplitud total fue 8, la media 33.9 y la desviación estándar 1.9. Compare la dispersión en estas calificaciones con las del primer grupo.
12. Gonzalo Muñoz, encargado de compras de un gran centro comercial ha obtenido muestras de lámparas eléctricas de dos empresas proveedoras. Probó ambas muestras con respecto tiempo de vida útil de la lámpara, y obtuvo los siguientes res ultados:
Empresa Duración (horas)
00 − 900 − − 1300 − 7
1100
Punto medio A
B
900
800
8
8
1100
1000
18
22
1300
1200
26
22
1500
1400 14 00
8
8
a) ¿Con cuál de las dos empresas proveedoras se quedaría Gonzalo si su decisión la toma basándose en el promedio y la homogeneidad homogeneidad de la duración del producto? b) Si la empresa B ha desarrollado un nuevo filamento que permite aumentar el tiempo de duración en un 35%. ¿Cómo afectaría al tiempo promedio y la variación r elativa?
Germán Elías Pomachagua Pérez
30
13. Los 200 operarios de la fábrica “ALFA” fueron divididos en 2 grupos para participar en un curso de capacitación; los operarios del grupo 1 fueron capacitados con la técnica A y los operarios del grupo 2 con la técnica B. El objetivo de la capacitación fue disminuir el tiempo que emplean los operarios para realizar una actividad considerada de gran importancia en el proceso de p roducción. Terminada la capacitación, se le pidió a cada operario de cada grupo que procediese a realizar la actividad y se registró el tiempo correspondiente. En el archivo Alfa (Minitab) encontrará usted los datos de las siguientes variables: Género del operario, Técnica capacitación (técnica con la que el operario fue capacitado), tiempo actividad (tiempo que demoró el operario en minutos en realizar la actividad). a) Identifique la población, la muestra, la unidad de análisis, las variables e identifique el tipo de cada una de ellas.
b) Haciendo uso de Minitab complete los siguientes espacios: Grupo
Media
Mediana
Q1
Q3
Desviación Estándar
Coeficiente de Variación
Coeficiente de Asimetría de Pearson
1 2
c) De acuerdo con los resultados de la tabla anterior, diga si los siguientes enunciados son verdaderos o falsos, justificando su respuesta y el valor de los estadígrafos c.1 Una cuarta parte de los los operarios del grupo 1 demoraron como máximo 30 minutos. V(
) F(
)
c.2 Los tiempos de los operarios del grupo 1 son más homogéneos que los del grupo grupo 2. V(
) F(
)
c.3 La distribución del tiempo correspondiente correspondiente a los operarios del grupo 1 es menos asimétrica que la de los del grupo 2.
V(
) F(
)
c.4 La mitad de los operarios del grupo 1 emplearon entre 20 y 30 minutos en realizar la actividad.
V(
) F(
)
d) Responda usted las siguientes preguntas d.1 ¿Entre que valores se encuentra el 70% central de datos (tiempo actividad)?
Germán Elías Pomachagua Pérez
31
d.2 Realizando un diagrama de cajas del tiempo que demoraron los operarios en realizar la actividad, clasificando según género ¿Considera usted que la media muest ral sería un valor representativo en ambos casos (hombres y mujeres)? ¿por qué?
d.3 ¿Menos del 50% de los trabajadores del grupo 1 registraron un tiempo para realizar la actividad menor a la media muestral? Sustente su respuesta indicando el valor de los estadígrafos según corresponda.
Germán Elías Pomachagua Pérez
32