Considera la siguiente situación: Eres responsable de los recursos humanos de tu empresa y te interesa determinar la probabilidad de que un trabajador llegue más tarde del tiempo de tolerancia preestablecido. ¿Cómo utilizarías los métodos de inferencia revisados?
Buenas tardes profesor y compañeros: En el supuesto que mi empresa, sea una empresa de tamaño medio-grande es decir con mas de 50 empleados, en un supuesto de tener 100 empleados eso quiere decir que tendría si trabajan 6 días a la semana tendría 600 mediciones por semana y un total de 2400 mediciones al mes, por lo que siguiendo un principio de economía extraeré una muestra de 30 sujetos elegidos al azar esto me permitirá tener un volumen de datos más fácil de manejar y será menos costoso hacer el análisis. Según Garriga, A., Lubin, P., Merino, J., Padilla, M., Recio, P., y Suárez, J. (2009) cuando se trata de un muestreo aleatorio simple, como es el caso, y la l a distribución de X en la población no es normal con la media y la desviación típica , entonces la distribución muestral de la media tiende a
la normal (,
) a medida que n crece , siendo la aproximación buena para n30 √
por lo que hemos tomado esa referencia 30, para establecer nuestra muestra; además cabe destacar, que esta relación entre la distribución de la población y la forma de distribución de muestreo según Lenin R. y Rubín D., (2010) hace que el teorema del límite central, sea uno de los más importantes de toda la inferencia estadística, pues asegura que la distribución de muestreo de la media se aproxima a la normal al incrementarse el tamaño de la muestra. Con mis datos puedo encontrar mi la probabilidad de que un empleado llegue tarde aplicando la siguiente relación: [P(x>hora)=1-P(z
forma de la distribución de frecuencia de esa población más que lo que podamos obtener de la muestra. Para poder aplicar la relación anteriormente explicada tendré que calcular a partir
∑) y la desviación estándar poblacional (= ∑(− )2)
de mis datos la media (=
esto se hará a través de todos los datos de la población es decir los 100 empleados, normalmente en las empresas de tamaño medio-grande este registro se hace de forma electrónica y automatizada por lo que existe un registro informático accesible. A continuación, usaría los datos de la muestra aleatoria para obtener la media
̅ ∑). Posteriormente calculare la variable estandarizada Z
de esta muestra ( = (z=
̅− ) de los dos grupos de datos y seguidamente obtener el valor de la
distribución normal para el valor de Z obtenido. Con estos datos podría completar la formula [P(x>8,10)=1-P(z
Fuentes: Garriga, A., Lubin, P., Merino, J., Padilla, M., Recio, P., y Suárez, J. (2009). Introducción al análisis de datos. España: UNED. Lenin R. y Rubín D., (2010). Estadística para administración y economía. (7ª edición). México: Editorial Pearson. Triola, M. (2009). Estadística. México: Pearson.