ESTADÍ EST ADÍSTI STICA CA APL APLICA ICADA DA Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P .P.. 68255 6 82551253 125305 05 ST
ESTIMACIÓN
Contenido Estimación puntual y por intervalos Estimación de la media y de la proporción de una población Estimación del tamaño de muestra Factor de corrección para una población finita
Estimador de intervalo Intervalo donde probablemente se localiza un parámetro de población, basado en información de la muestra.
Ejemplo: De acuerdo con los datos de la muestra, la media de la población está en el intervalo entre 0.9 y 2.0 libras.
Estimador puntual Valor único calculado a partir de una muestra para calcular un parámetro poblacional
µ
σ
2
P σ2
Ejemplo: Si la media de una muestra de 100 días con respecto al valor del dólar es de 2.920, éste constituye el mejor estimador del valor del dólar de la media de la población.
Intervalos de confianza para la media El análisis de estimadores puntuales y los intervalos de confianza comienza con el cálculo de μ :
Se conoce σ
NO se conoce σ, por tanto se sustituye con s por la σ
Un estimador puntual sólo dice parte de la historia. Aunque se espera que el estimador puntual se aproxime al parámetro poblacional, sería conveniente medir cuán próximo se encuentra en realidad. Un intervalo de confianza sirve para este propósito.
Desviación estándar de la población no se conoce σ Distribución t =
−
Acá s es un estimador de σ. La distribución “t” es mas plana y se extiende mas que la distribución normal estándar, esto se debe a que la desviación estándar de la distribución t es mayor que la distribución normal estándar.
Intervalo de confianza para la media poblacional con una σ
desconocida ±
Ejemplo
Gattos, operadora de la planta deshidratadora de gas chupanagua está considerando en aumentar la calidad de su gas, para incrementar así el tamaño de los clientes que quieran comprar su gas, con ello aumentar la rentabilidad de la compañía. Gattos estima el tamaño promedio de clientes en la actualidad, los cuales adquieren su gas a diferentes precios. Selecciona una muestra de 36 clientes los cuales adquieren el ft 3 de gas cuya media es de $14,37 con una desviación estándar de $4,02. Construya una estimación por intervalo con el 95% de confianza
Intervalo de confianza para la media poblacional con una σ
desconocida ±
14,37 ± 2,030 (4,02 / 36 ) = 14,37 ± 1,36 El nivel de confianza de 95% se encuentra entre 13,00 y 15,73. Estos puntos extremos reciben el nombre de límites de confianza y abarca de 13,00 a 15,73 y el valor ± 1,36 se conoce como margen de error .
Para hallar el valor de t se debe ubicar en la tabla el nivel de confianza y los grados de libertad gl el cual se escribe como n-1, en este caso 36-1=35, en ese ejercicio el valor de t es de 2,030.
Gattos puede estar seguro (95% de confianza) que el costo promedio de un ft3 de gas para un cliente oscila entre $13 y $15,73.
Desviación estándar de la población conocida σ
Para el intervalo de confianza de 90%: ± 1,645
Para el intervalo de confianza de 95%: ± 1,96
Para el intervalo de confianza de 99%: ± 2,575
Intervalo de confianza para la media poblacional con una σ
conocida ±
Ejemplo En el ejemplo anterior, se conoce la desviación estándar de la población como $3,50, construya una estimación por intervalo con el 90% de confianza
Intervalo de confianza para la media poblacional con una σ
conocida ±
Intervalo de confianza para la media poblacional con una σ conocida
14,37 ± 1,645
,
= 14,37 ± 0,9595
Estos puntos extremos reciben el nombre de límites de confianza y abarca de 13,41 a 15,32 y el valor ± 0,9595 se conoce como margen de error . Gattos puede decir con una confianza del 90% que el costo promedio de un ft3 de gas para un cliente está entre $13,41 y $15,32.
El nivel de confianza, puede definirse como si se seleccionaran 100 muestras de 36 clientes de la población, se calcula la media muestral de cada una de ellas y se crea un intervalo de confianza basado en cada media muestral, se esperaría una media poblacional de aproximadamente 95 de los 100 intervalos.
Intervalos de confianza para la proporción La interpretación de un intervalo de confianza resulta de mucha utilidad en la toma de decisiones y desempeña un papel importante.
Ejemplo La corporación kenloss ha estado recibiendo reclamos por parte de diferentes compañías petroleras que utilizan el chiller que comercializa desde hace cinco años. Para resolver este problema, la compañía quiere conocer primero los porcentajes de chiller vendidos que tienen problemas. Durante los últimos seis meses ha estado vigente un programa de descuentos, de manera que la empresa decide usar los nombres de la lista de descuentos como la población de la que se obtendrá la muestra. Se escoge una muestra aleatoria de 1800 nombres a partir de esta lista y se les envía por correo un breve cuestionario a las compañías junto con un vale de descuento por valor de $500. Contestaron un total de 1675 encuestados, lo que representan un buen puntaje, 93%. La compañía piensa que obtuvo una muestra representativa. El 12% de los encuestados dijo haber experimentado problemas. La estimación por intervalo se calcula con un nivel de confianza del 99%
Intervalo de confianza de la proporción de una población = 0,12±2,575
,(−,)
= 0,12 ± 0,02
Los puntos extremos del intervalo de confianza son 0,10 – 0,14. Por tanto, se concluye que Kenloss puede establecer con el 99% de confianza que el porcentaje de compradores que ha tenido problemas con el chiller está entre el 10 y 14%. La dirección de la compañía no considera satisfactorio este nivel de calidad e inicia un programa de mejora de la calidad.
Error de muestreo Diferencia entre el estadístico de una muestra y el parámetro de la población correspondiente.
Ejemplo 1 Un Candidato para ser presidente de ECOPETROL cree contar con el 70 % de opinión favorable. En un Sondeo de opinión obtuvo que 75 % de los miembros de la Junta Directiva están por dicho candidato. Se puede afirmar que se supera la creencia original? Si el Error Muestral es del 8 %, el verdadero valor promedio de favorabilidad esta entre el 67 % y el 83 %, es decir, la favorabilidad en el sondeo podría ser incluso inferior a la primera medición. El sondeo solo mostraría superación de la creencia original, para una estimación puntual del 75 %, si el error muestral fuera inferior al 5 % (digamos, por ejemplo, 4 %). En este caso el intervalo de confianza para la favorabilidad promedio en el sondeo, estaría entre el 71% y el 79 %, intervalo que esta por encima del 70 % (creencia original). Si la creencia original se estableció también por un procedimiento de muestreo y lo que obtuvo fue un Intervalo de Confianza de 68 % al 72 %. El nuevo sondeo, para ser favorable, debería tener un error muestral más pequeño (2 %). Así, el nuevo intervalo del 73 % al 77 % al no interceptar al anterior apoyaría la conclusión de que la favorabilidad actual es mayor que la original?.
Factor de corrección de una población finita Qué sucede si la población de la que se ha tomado muestra no es muy grande?. Es necesario realizar algunos ajustes en la forma de calcular el error estándar de las medias muestrales y el error estándar de las proporciones muestrales. Una población con un límite superior es finita.
Ejemplo
Existen 21376 estudiantes matriculados en la Universidad Nacional de Colombia
Tenemos 978 ingenieros de Petróleos
DAimlerChrysler ensambló 910 jeeps wrangler en la planta. Una población finita puede ser muy pequeña como también puede ser muy grande
Para determinar el intervalo de confianza para la media, se ajusta el error estándar de la media. Si está determinado el intervalo de confianza para la proporción, necesita ajustar el error estándar de la proporción.
Este ajuste recibe el nombre de factor de corrección de una población finita =
1
Si la muestra es un porcentaje significativo de la población, el estimador es más preciso. El factor de corrección se utiliza mucho cuando la población es pequeña.
Ejemplo: N = 1000 y n = 100 La razón es de (1000-100)/(1000-1), o 900/999. Factor = 0,9492 Al multiplicar este factor por el error estándar, se reduce el error estándar aproximadamente 5% (1-0,9492 = 0,0508). Esta reducción en la magnitud del error estándar da como resultado un intervalo menor de valores al calcular la media poblacional o la proporción poblacional.
La regla consiste en que n/N < 0,05
se ignora el factor de corrección También, si se tiene el tamaño de la población se debe usar, que con esto el margen de error mejora, por tanto cuando se conoce el tamaño de la población se vuelve obligatorio corregir.
Intervalo de confianza para la media a partir de una población finita Sin conocer σ ±
1
Conociendo σ ±
1
Intervalo de confianza para la proporción partir de una población finita
±
(1 )
1
Ejemplo Hay 250 familias en una ciudad. Una muestra aleatoria de 40 de estas familias revela que la contribución anual media a la iglesia fue de $450.000.= y la desviación estándar de $75.000.= La media poblacional puede ser de $425.000.= o $445.000? 1. 2.
Cuál es la media de la población?. Cuál es el mejor estimador de la media poblacional? Analice la razón por la que se debe emplear el factor de corrección y es esta una población finita?
3.
Construya un intervalo de confianza de 90% para la media de la población. Cuáles son los puntos extremos del intervalo de confianza?
4.
Interprete el intervalo de confianza.
La población es finita porque conocemos el total que son 250 familias 1.
El mejor estimador de la media poblacional es su media muestral que para este caso es $450.000.=
2.
La muestra corresponde al 16% de la población 40/250, como la muestra constituye más del 5% de la población debe utilizarse el FCP para ajustar el error estándar en el momento de determinar el intervalo de confianza.
3.
La fórmula para determinar el intervalo de confianza para una media de la población es el siguiente: ±
1
450.000 ± 1.685
75.000 40
250 40 250 1
450.000 ± 19.981,64197 0.91835 450.000 ± 18.350,2146
Los puntos extremos del intervalo de confianza son $431.650 y 468.350 4.
Es probable que la media poblacional sea de más de $431.650 e inferior a $468.350, en otras palabras la media poblacional puede ser mayor de $445.000.= Si, pero no es probable que sea de $425.000.= Porque el valor de $445.000 se encuentra dentro del intervalo de confianza y $425.000
Elección del tamaño adecuado de una muestra Una pregunta frecuente la hora de realizar muestreo es cuántos elementos debe haber en una muestra. Si una muestra es demasiado grande, se gasta mucho dinero en recabar datos. Asimismo si la muestra es muy pequeña, las conclusiones resultarán inciertas. El tamaño adecuado de una muestra depende de tres factores: 1.
El nivel de confianza deseado
2.
El margen de error que tolerará el investigador
3.
La variabilidad de la población que se estudia
Los niveles de confianza más usados son 95% y 99%, aunque es posible cualquier valor entre 0% y 100%. Mientras más alto el nivel de confianza, mayor será el tamaño de la muestra correspondiente.
El error admisible es la magnitud hacia derecha o izquierda para determinar los puntos extremos del intervalo de confianza y es la magnitud del error que tolerarán quienes conducen el estudio. También es la mitad de la amplitud del correspondiente intervalo de confianza. Un error admisible más pequeño requerirá una muestra mayor. Un error admisible grande permitirá una muestra menor. Si la población se encuentra muy dispersa, se requiere de una muestra muy grande . Por otra parte si la población se encuentra concentrada el tamaño de muestra que se requiere es menor.
La interacción entre estos tres factores y el tamaño de la muestra se expresa con la siguiente fórmula =
n: Tamaño de la muestra z: Es el valor normal estándar correspondiente al nivel de confianza deseado σ: Desviación estándar de la población (variabilidad de los datos)
E: Error máximo admisible
En caso de una proporción, también se deben especificar los 3 elementos descritos anteriormente y la fórmula queda = (1 )
Si se cuenta con un estimador disponible de p a partir de un estudio piloto u otra fuente, se puede utilizar, sino se utiliza 0.50. El resultado de este cálculo no siempre es un número entero, sin embargo por tratarse de unidades muestrales debe llevarse al siguiente valor.
Ejemplo Un estudiante de Ingeniería de petróleos desea determinar la cantidad media que ganan al mes los miembros de los consejos ciudadanos de las grandes ciudades. El error al calcular la media debe ser inferior de $1000, con un nivel de confianza de 95%. El estudiante encontró un informe del Departamento del Trabajo en el que la desviación estándar es de $10000. Cuál es el tamaño de la muestra que se requiere?
=
=
1.96 ∗ 10000
1000 = 384,16
Llevando el valor a la siguiente unidad muestral encontramos que el tamaño de la muestra puede ser 385, si el estudiante desea incrementar el nivel de confianza, por ejemplo a 99% se requiere una muestra mas grande. =
2,575 ∗ 1000
100 = 663,06
Se recomienda una muestra de 664, la diferencia del n es de 279, por ello el
Ejemplo En el estudio anterior también se calcula la proporción de ciudades que cuentan con recolectores de basura privados. El estudiante desea que el margen de error se encuentre a 0,10 de la proporción de la población; el nivel de confianza deseado es de 90% y no se encuentra disponible ningún estimador para la proporción de la población. Cuál es el tamaño de la muestra que se requiere?