Instituto Tecnológico de Minatitlán Carrera Ingeniería Industrial Modalidad a Distancia
Estadística Inferencial I UNIDAD 2.
TEORÍA DE ESTIMACIÓN.
ESTADISTICA INFERENCIAL I UNIDAD 2: TEORÍA DE ESTIMACIÓN. 2.1 Introducció Introducciónn 2.2 Características de un estimador 2.3 Estimación puntual 2.4 Estimación por intervalos 2.4.1 Intervalo de confianza para la media 2.4.2 Intervalo de confianza para la diferencia de medias 2.4.3 Intervalos de confianza para la proporción 2.4.4 Intervalos de confianza para la diferencia de proporciones 2.4.5 Intervalos de confianza para la varianza 2.4.6 Intervalos de confianza para la relación de varianzas 2.5 Determinación del tamaño de muestra 2.5.1 Basado en la media de la Población 2.5.2 Basado en la proporción de la Población 2.5.3 Basado en la diferencia entre las medias de la Población
Competencia específica a desarrollar
Aplicará los fundamentos de la teoría de estimación en problemas que requieran el cálculo del tamaño de la muestra, con los diferentes intervalos de confianza de la media, proporción y varianza, que se relacionen con la logística.
Actividades de Aprendizaje
Proporcionar al estudiante dos situaciones hipotéticas de procesos y/o poblaciones finitas para que en grupo de 2 alumnos, obtengan de dichos procesos, un conjunto de datos para su análisis. Obtener los valores de t, ², F y Z de las diferentes distribuciones distribuciones muéstrales. Obtener los valores de probabilidad en tablas para los diferentes valores de los estadísticos t, ², F y Z Calcular dado un conjunto de datos los intervalos de confianza, según proceda, para la media, diferencia de medias, varianza, proporción, diferencia de proporciones varianza y relación de varianzas.
1 de 11
Instituto Tecnológico de Minatitlán Carrera Ingeniería Industrial Modalidad a Distancia
Estadística Inferencial I UNIDAD 2.
TEORÍA DE ESTIMACIÓN.
Interpretar el significado de los intervalos de confianza para: la media, diferencia de medias, la proporción, diferencia de proporciones, varianza y relación de varianzas. Dado un conjunto de datos diferenciar la importancia de utilizar estimadores puntuales y estimadores por intervalos. Determinar el tamaño de la muestra.
11.- FUENTES DE INFORMACIÓN
DeVore, J. (2005). Probabilidad y Estadística para Ingeniería y Ciencias. México: Thomson. Hines, W. y Montgomery, D. (2003). Probabilidad y Estadística para Ingeniería y Administración. México: CECSA Montgomery, D. C. y Runger, G. C. (1998). Probabilidad y Estadística aplicadas a la Ingeniería. México: McGraw Hill. Ross, S. M. (2001). Probabilidad y Estadística para Ingenieros. México: McGraw Hill. Salvatore, D., Reagle, D. (2004). Estadística y econometría. España: Mc Graw-Hill. Spiegel, M. R. (1992). Manual de Fórmulas y Tablas Matemáticas. México: McGraw Hill. Spiegel, M. R. (1988). Probabilidad y Estadística. México: McGraw Hill. Walpole, R. E., Myers, R. H., Myers, S. L. (1999). Probabilidad y Estadística para Ingenieros. México: Pearson Prentice Hall.
2.1 INTRODUCCIÓN La inferencia estadística es primordialmente de naturaleza inductiva y llega a generalizar respecto de las características de una población valiéndose de observaciones empíricas de la muestra. Al utilizar estadísticas muestrales para estudiar un parámetro de la población es muy normal que ambos sean diferentes y la igualdad entre ambos sea mera coincidencia. La diferencia entre la estadística muestral y el correspondiente parámetro de la población se suele llamar error de estimación . Solo conoceríamos dicho error si se conociera el parámetro poblacional que por lo general se desconoce. La única forma de
2 de 11
Instituto Tecnológico de Minatitlán Carrera Ingeniería Industrial Modalidad a Distancia
Estadística Inferencial I UNIDAD 2.
TEORÍA DE ESTIMACIÓN.
tener alguna certeza al respecto es hacer todas las observaciones posibles del total de la población; en la mayoría de las aplicaciones prácticas es imposible o impracticable. El objetivo principal de la estadística inferencial es la estimación, esto es que mediante el estudio de una muestra de una población se quiere generalizar las conclusiones al total de la misma. Los estadísticos varían mucho dentro de sus distribuciones muestrales, y mientras menor sea el error estándar de un estadístico, más cercanos estarán sus valores unos de otros. La razón de ser de la inferencia estadística es la falta de conocimientos sobre las características de la población. Las inferencias estadísticas se hacen por posibilidades o probabilidades Por ejemplo de la media de una muestra se hacen inferencias sobre la media de la población. Exactamente no sabemos cuál es la diferencia entre ambas. Lo que sí sabemos es que es pequeña la probabilidad de que esta diferencia sea mayor que, por ejemplo 3 o 2 errores estándares. Una estimación es un valor específico observado de un estadístico (estimador). Podemos hacer dos tipos de estimaciones concernientes a una población: una estimación de intervalo y una estimación puntual. Una estimación puntual es un único valor estadístico y se usa para estimar un parámetro de población desconocido. El estadístico usado se denomina estimador. Una estimación por intervalo es un rango, generalmente de ancho finito, que se espera que contenga el parámetro poblacional desconocido.
2.2 CARACTERÍSTICAS DE UN ESTIMADOR ESTIMADOR Un estimador es un estadístico (esto es, una función de los datos muestrales) usado para estimar un parámetro desconocido de la población. En pocas palabras, es una fórmula que 3 de 11
Instituto Tecnológico de Minatitlán Carrera Ingeniería Industrial Modalidad a Distancia
Estadística Inferencial I UNIDAD 2.
TEORÍA DE ESTIMACIÓN.
depende de los valores obtenidos de una muestra, para realizar estimaciones. La media de la muestra ( ) puede ser un estimador de la media de la población , y la proporción de la muestra p se puede utilizar como un estimador de la proporción de la población P. A menudo una estimación puntual (que es un solo valor o número que se utiliza para estimar un parámetro de población desconocido) es insuficiente debido a que solo se tienen dos opciones: es correcta o está equivocada. Se estaría haciendo una estimación puntal si por ejemplo, un jefe de departamento de una universidad afirmara: “Nuestros datos actuales indican que en la materia de matemáticas tendremos 350 estudiantes el siguiente semestre".
Propiedades. Antes de utilizar un estadístico muestral como estimador puntual, se verifica si el estimador puntual tiene ciertas propiedades que corresponden a un buen estimador puntual. Como hay distintos estadísticos muéstrales que se usan como estimadores puntuales de sus correspondientes parámetros poblacionales, se usará la notación general siguiente: θ =
Es el parámetro poblacional de interés. = Es el estadístico muestral o estimador puntual de θ . En esta notación θ es la letra griega theta y la notación se lee “theta sombrero”. En general θ representa cualquier parámetro poblacional como, por ejemplo, la media poblacional, la desviación estándar poblacional, etc.; representa el correspondiente estadístico muestral, por ejemplo la media muestral, la desviación estándar muestral y la proporción muestral. Formalmente, si
θ es
un parámetro poblacional, se dice que
es un estimador puntual de
θ
si , donde x 1,x 2,...,x n son las variables aleatorias que integran una muestra aleatoria de tamaño n de la población en cuestión. Por ejemplo, un estimador de la media poblacional, μ, puede ser la media muestral, según la siguiente fórmula:
,
4 de 11
Instituto Tecnológico de Minatitlán Carrera Ingeniería Industrial Modalidad a Distancia
Estadística Inferencial I UNIDAD 2.
TEORÍA DE ESTIMACIÓN.
donde (x 1, x 2, ..., x n ) sería el conjunto de de datos de la muestra. El estimador es una variable aleatoria que asigna a cada posible valor de la muestra un valor numérico. Como tal, tiene sentido calcular su esperanza, su varianza y otras características propias de las variables aleatorias.
Propiedades de un Buen Estimador Insesgado.- Se dice que un estimador puntual
es un estimador insesgado de
θ
si
θ ,
para todo valor posible de θ . En otras palabras, un estimador insesgado es aquel para el cual la media de la distribución muestral es el parámetro estimado. Si se usa la media muestral para estimar la media poblacional μ, se sabe que la tanto la media es un estimador insesgado.
Eficiente o con varianza mínima.- Suponga que 1 y
, por lo
2 son
dos estimadores insesgados de θ . Entonces, aun cuando la distribución de cada estimador esté centrada en el valor verdadero de θ , las dispersiones de las distribuciones alrededor del valor verdadero pueden ser diferentes. Entre todos los estimadores de θ que son insesgados, seleccione al que tenga varianza mínima. El resultante recibe el nombre de estimador insesgado con varianza mínima (MVUE, minimum variance unbiased estimator) de . En otras palabras, la eficiencia se refiere al tamaño de error estándar de la estadística. Si comparamos dos estadísticos de una muestra del mismo tamaño y tratamos de decidir cuál de ellos es un estimador más eficiente, escogeríamos el estadístico que tuviera el menor error estándar, o la menor desviación estándar de la distribución de muestreo.
5 de 11
Instituto Tecnológico de Minatitlán Carrera Ingeniería Industrial Modalidad a Distancia
Estadística Inferencial I UNIDAD 2.
TEORÍA DE ESTIMACIÓN.
Tiene sentido pensar que un estimador con un error estándar menor tendrá una mayor oportunidad de producir una estimación más cercana al parámetro de población que se está considerando.
Como se puede observar las dos distribuciones tienen un mismo valor en el parámetro sólo que la distribución muestral de medias tiene una menor varianza, por lo que la media se convierte en un estimador eficiente e insesgado.
Coherencia.- Una estadística es un estimador coherente de un parámetro de población, si al aumentar el tamaño de la muestra se tiene casi la certeza de que el valor de la estadística se aproxima bastante al valor del parámetro de la población. Si un estimador es coherente se vuelve más confiable si tenemos tamaños de muestras más grandes.
Suficiencia.- Un estimador es suficiente si utiliza una cantidad de la información contenida de la muestra que ningún otro estimador podría extraer información adicional de la muestra sobre el parámetro de la población que se está estimando. Es decir se pretende que al extraer la muestra el estadístico calculado contenga toda la información de esa muestra. Por ejemplo, cuando se calcula la media de la muestra, se necesitan todos los datos. Cuando se calcula la mediana de una muestra sólo se utiliza a un dato o a dos. Esto es solo el dato o los datos del centro son los que van a representar la muestra. Con esto se deduce que si utilizamos a todos los datos de la muestra como es en el caso de la media, la varianza, desviación estándar, etc.; se tendrá un estimador suficiente.
6 de 11
Instituto Tecnológico de Minatitlán Carrera Ingeniería Industrial Modalidad a Distancia
Estadística Inferencial I UNIDAD 2.
TEORÍA DE ESTIMACIÓN.
2.3 ESTIMACIÓN PUNTUAL La inferencia estadística está casi siempre concentrada en obtener algún tipo de conclusión acerca de uno o más parámetros (características poblacionales). Para hacerlo, se requiere que un investigador obtenga datos muestrales de cada una de las poblaciones en estudio. Entonces, las conclusiones pueden estar basadas en los valores calculados de varias cantidades muestrales. Por ejemplo, representamos con (parámetro) el verdadero promedio de resistencia a la ruptura de conexiones de alambres utilizados para unir obleas de semiconductores. Podría tomarse una muestra aleatoria de 10 conexiones para determinar la resistencia a la ruptura de cada una, y la media muestral de la resistencia a la ruptura se podía emplear para sacar una conclusión acerca del valor de . De forma similar, si 2 es la varianza de la distribución de resistencia a la ruptura, el valor de la varianza muestral s2 se podría utilizar para inferir algo acerca de 2. Cuando se analizan conceptos generales y métodos de inferencia es conveniente tener un símbolo genérico para el parámetro de interés. Se utilizará la letra griega para este propósito. El objetivo de la estimación puntual es seleccionar sólo un número, basados en datos de la muestra, que represente el valor más razonable de . Una muestra aleatoria de 3 baterías para calculadora podría presentar duraciones observadas en horas de x 1=5.0, x2=6.4 y x3=5.9. El valor calculado de la duración media muestral es = 5.77, y es razonable considerar 5.77 como el valor más adecuado de . Una estimación puntual de un parámetro es un sólo número que se puede considerar como el valor más razonable de . La estimación puntual se obtiene al seleccionar una estadística apropiada y calcular su valor a partir de datos de la muestra dada. La estadística seleccionada se llama estimador puntual de . El símbolo (theta sombrero) suele utilizarse para representar el estimador de y la estimación puntual resultante de una muestra dada. Entonces se lee como "el estimador puntual de es la media muestral ". El enunciado "la estimación puntual de es 5.77" se puede escribir en forma abreviada
.
7 de 11
Instituto Tecnológico de Minatitlán Carrera Ingeniería Industrial Modalidad a Distancia
Estadística Inferencial I UNIDAD 2.
TEORÍA DE ESTIMACIÓN.
Ejemplo: En el futuro habrá cada vez más interés en desarrollar aleaciones de Mg de bajo costo, para varios procesos de fundición. En consecuencia, es importante contar con métodos prácticos para determinar varias propiedades mecánicas de esas aleaciones. Examine la siguiente muestra de mediciones del módulo de elasticidad obtenidos de un proceso de fundición a presión: 44.2, 43.9, 44.7, 44.2, 44.0, 43.8, 44.6, 43.1 Suponga que esas observaciones son el resultado de una muestra aleatoria. Se desea estimar la varianza poblacional 2. Un estimador natural es la varianza muestral:
En el mejor de los casos, se encontrará un estimador para el cual = siempre. Sin embargo, es una función de las X i muestrales, por lo que en sí misma una variable aleatoria. =
+ error de estimación
entonces el estimador preciso sería uno que produzca sólo pequeñas diferencias de estimación, de modo que los valores estimados se acerquen al valor verdadero.
Parámetros y estimadores. Parámetro, es un valor constante que describe las características propias de una población estadística. Una población estadística, es un conjunto de mediciones sobre todos los elementos del universo resultando en lo que se conoce como poblaciones multivariadas. Marco muestral. Es un listado de todas las unidades de muestreo disponible para su selección en una etapa del muestreo. Estadístico. Es cualquier función de las observaciones de la muestra. Desde otro punto de vista son valores que describen las características de una muestra, estos valores son variables pues dependen de las fluctuaciones de la muestra y que cuando
8 de 11
Instituto Tecnológico de Minatitlán Carrera Ingeniería Industrial Modalidad a Distancia
Estadística Inferencial I UNIDAD 2.
TEORÍA DE ESTIMACIÓN.
cumplen con las características de un buen estimados se emplean como estimadores de los parámetros poblacionales. Entre los más conocidos se tienen:
Parámetros
Estimadores
Media poblacional
Media muestral
Varianza poblacional
Varianza muestral
Desviación estándar poblacional
Desviación estándar muestral
Proporción poblacional
Proporción muestral
P =
X N
p =
x n
Ejemplos: 1. Calcule la media de los siguientes números: 10, 11, 12, 12, 13 Solución: 1. Sumar las cantidades < 10 + 11 + 12 + 12 + 13 = 58> 2. Dividir la suma por la cantidad de elementos < 58/5> 3. El resultado es la media <11.6> Por lo tanto, la media de los 5 números es 11.6. Note que la media resulta un número que está entre el rango de elementos; en este caso, 11.6 está entre 10, 11, 12 y 13.
9 de 11
Instituto Tecnológico de Minatitlán Carrera Ingeniería Industrial Modalidad a Distancia
Estadística Inferencial I UNIDAD 2.
TEORÍA DE ESTIMACIÓN.
2. Calcular la media muestral de un conjunto de datos. Los datos representan la muestra de la edad de los miembros de un grupo de niños: 4, 1, 11, 13, 2, 7. 1. Calcular el promedio o media aritmética:
. En este caso, n = 6 porque hay seis datos:
i = número de datos para sacar desviación estándar
Sustituyendo n por 6
Este es el promedio.
3. El número de días necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de iguales características han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 días. Calcular la media, varianza y desviación típica.
SOLUCIÓN:
La media: suma de todos los valores de una variable dividida entre el número total de datos de los que se dispone:
10 de 11
Instituto Tecnológico de Minatitlán Carrera Ingeniería Industrial Modalidad a Distancia
Estadística Inferencial I UNIDAD 2.
TEORÍA DE ESTIMACIÓN.
La varianza S2: Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución.
2
S =
La desviación típica o desviación estándar S: es la raíz cuadrada de la varianza.
S = √ 427,61 = 20.67
11 de 11