Tarea 6 Regresión Lineal Wilson Escalona Escalona Estadística IACC 22 de mayo de 2017
INSTRUCCIONES: Lea atentamente cada enunciado y responda. La tarea debe ser respondida en Word y adjuntando el archivo Excel cuando corresponda, identificando adecuadamente la pregunta. Le han solicitado elaborar un estudio de desempeño laboral en la empresa Luz Ltda. con el fin de observar la incidencia y determinar si es relevante que un empleado realice actividades personales en su horario de trabajo. Es por esto que se tomó como referencia el tiempo en horas que un empleado navega en Internet en su puesto durante la semana hábil y verificar si existe relación entre el consumo de Internet y las siguientes variables: edad, antigüedad laboral, sueldo mensual que percibe y su escolaridad, además de si el sexo del funcionario incide en este comportamiento de actividades no laborales en su lugar de trabajo. De acuerdo a los datos entregados: a) Realice un gráfico de dispersión e indique el tipo de relación entre las variables edad del trabajador y horas conectadas a Internet.
Relación entre la edad del trabajador y horas conectadas a Internet 25
Horas
20 15
y = -0.3659x + 27.685 Series1 R² = 0.7959
10
Linear (Series1)
5 0 0
10
20
30
40
50
60
70
Edad
b) Con respecto a las mismas variables de la letra a, construya un modelo de regresión e interprete el valor de la pendiente. Horas internet = −0,3659 ∗ Edad + 27,685 b < 0, por lo que la relación entre las variables es indirecta, esto significa que si una variable aumenta la otra disminuye o si una disminuye la otra aumenta. c) Estime el número de horas que un trabajador está conectado a Internet, si tiene 62 años de edad. Horas internet = −0,3659 ∗ Edad + 27,685 Horas internet = −0,3659 ∗ 62 + 27,685 Horas internet = 5 horas app
d) Si un trabajador está conectado 18 hrs. a Internet, ¿qué edad se puede estimar que tiene el trabajador? 18 = −0,3659 ∗ Edad + 27,685 Edad = 26,5 años e) Desde la gerencia se requiere establecer un modelo de regresión para las variables: sueldo mensual y antigüedad de los trabajadores, para realizar estimaciones respecto a esas variables. Entonces: e.1) Construya el modelo lineal y exponencial.
Modelo Lineal 1600.0
Sueeldo Mensual
1400.0
y = 77.404x + 118.07 R² = 0.7726
1200.0 1000.0 800.0
Series1
600.0
Linear (Series1)
400.0 200.0 0.0 0
2
4
6
8
10
12
14
Antigüedad de trabajadores
Modelo Exponencial 1600.0 y = 296.76e0.1094x R² = 0.8098
Sueeldo Mensual
1400.0 1200.0 1000.0
800.0
Series1
600.0
Expon. (Series1)
400.0 200.0 0.0 0
2
4
6
8
10
Antigüedad de trabajadores
12
14
e.2) Estime qué modelo se ajusta mejor a los datos. Justifique su respuesta. De acuerdo a los modelos planteados, el modelo exponencial es más confiable, porque se ajusta mejor a los datos, ya que su coeficiente de determinación es mayor (0,8098 o 80,98%), por lo que las estimaciones serán más confiables. e.3) Utilizando el modelo más adecuado, determine el sueldo mensual de un trabajador, si lleva 15 años en la empresa. 𝑦 = 296,760,1094𝑥 𝑦 = 296,760,1094∗15 𝑦 = 296,761,641 𝑟 = 1,641 = 10.000 ($) 𝑠𝑒 𝑎ñ𝑎𝑑𝑒𝑛 1641 $ 𝑎𝑙 𝑠𝑢𝑒𝑙𝑑𝑜 𝑚𝑒𝑛𝑠𝑢𝑎𝑙 𝑟 = 1,641 = 1.000 ($) 𝑝𝑒𝑠𝑜𝑠, 𝑠𝑒 𝑙𝑒 𝑎ñ𝑎𝑑𝑒𝑛 𝑎𝑙 𝑠𝑢𝑒𝑙𝑑𝑜 𝑚𝑒𝑛𝑠𝑢𝑎𝑙 $1,641 𝑝𝑒𝑠𝑜𝑠 𝑦 = 11408,20 e.4) Utilizando el mismo modelo anterior estime la antigüedad de un trabajador, con un sueldo mensual de $750.000. 𝑦 = 296,76 𝑒0,1094 ∗ 𝑥 750.000 = 296,760,1094∗𝑥 𝑥 = 21,7208
Bibliografía IACC (2016). Regresión lineal. Estadística. Semana 6