INTITUTO TECNOLOGICO SUPERIOR DE COTZACOALCOS.
INDICE
UNIDAD. 4 ESTIMACION DE PARAMETROS.
Pág. INTRODUCCION. ………………………………………………………………….
UNIDAD 4. ESTIMACION DE PARAMETROS.
………………………………
2
3
4.1 INTERVALOS DE COONFIANZA PARA LA MEDIA MED IA ………………………... 3
4.2 INTERVALOS DE COONFIANZA PARA LA VARIANZA. ……………………………………………………………………
8
4.3 INTERVALOS DE COONFIANZA DE
PROPORCIONES. ……………………. ………………………………………. ………………………………………. 12
4.4 INTERVALOS DE COONFIANZA PARA LAS DIFERENCIAS. …………………………….…………………………………… 18
4.5 APLICACIÓN EN LA EXPLOTACION DE
HIDROCARBUROS. ……………………………………………………………… .. 27
CONCLUSIONES. …………………………………………………………………..
28
BIBLIOGRAFIA. …………………………………………………………………… 29
INTRODUCCIÓN 1
Pág. INTRODUCCION. ………………………………………………………………….
UNIDAD 4. ESTIMACION DE PARAMETROS.
………………………………
2
3
4.1 INTERVALOS DE COONFIANZA PARA LA MEDIA MED IA ………………………... 3
4.2 INTERVALOS DE COONFIANZA PARA LA VARIANZA. ……………………………………………………………………
8
4.3 INTERVALOS DE COONFIANZA DE
PROPORCIONES. ……………………. ………………………………………. ………………………………………. 12
4.4 INTERVALOS DE COONFIANZA PARA LAS DIFERENCIAS. …………………………….…………………………………… 18
4.5 APLICACIÓN EN LA EXPLOTACION DE
HIDROCARBUROS. ……………………………………………………………… .. 27
CONCLUSIONES. …………………………………………………………………..
28
BIBLIOGRAFIA. …………………………………………………………………… 29
INTRODUCCIÓN 1
En el momento de tomar decisiones el conocimiento de los parámetros de población es de vital importancia, tal conocimiento generalmente se puede tener al estimar el valor de dichos parámetros, sin embargo, la estimación es mejor cuando se da un margen de confianza y uno de error, siendo importante la correcta estimación de dichos parámetros a través de la construcción de intervalos de confianza que puedan sustentar la toma de decisiones de manera eficiente. Existen dos tipos de estimaciones para parámetros; Puntuales y por Intervalo. Una estimación puntual es un único valor estadístico y se usa para estimar un parámetro. El estadístico usado se denomina estimador. Una estimación estimación por intervalo n por intervalo es un rango, generalmente de ancho finito, que se espera que contenga el parámetro.
UNIDAD 4. ESTIMACION DE PARAMETROS. 2
4.1 INTERVALOS DE COONFIANZA PARA LA MEDIA.
Un intervalo de confianza se calcula siempre seleccionando primero un nivel de confianza, que es una medida del grado de confiabilidad en el intervalo. En el contexto de estimar un parámetro poblacional, un intervalo de confianza es un rango de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parámetro, con una probabilidad determinada. Como sabemos la media es interesante como medida de centralización cuando la distribución de la misma es mas o menos normal, incluso podemos hacer estimaciones aunque las muestras sean pequeñas, con solo verificarse que la distribución de la variable es normal, ya que la distribución del estimador es conocida de forma exacta como distribución t-student. En cualquier caso si las muestras son grande, aunque la distribución de los datos no sea normal, la media como en el caso de las proporciones de distribuye de manera aproximadamente normal. Supongamos una v. a. x con distribución N(µ ; ) en donde la media µ es desconocida y la varianza
, la suponemos por ahora conocida. Con el fin de estimar µ (colesterol
medio, nivel medio de glucosa, altura media de los varones mayores de edad, etc.) se va a tomar una muestra aleatoria x1 , x2 ,..., xn que proporciona una media que será una estimación puntual de µ. Aceptaremos sin demostrarlo que:
3
con probabilidad del 95%, y así tenemos el intervalo buscado. Esta expresión debe interpretarse adecuadamente. Ella indica que el 95% de las muestras de tamaño n tendrán una media que, al sustituirla en la expresión, da lugar a un intervalo que contiene en su interior a µ, en tanto que otro 5% no sucederá esto. Nótese que se ha dicho que "el intervalo contiene en su interior a µ, y no que "µ cae en el interior del intervalo"; la primera afirmación es cierta pues los extremos del intervalo son v. a. por depender de
que
también lo es; la segunda afirmación es falsa pues µ es un parámetro (valor fijo aunque desconocido), no una v.a., no pudiendo variar. Así pues debe decirse que hay una probabilidad del 95% de que el intervalo contenga al parámetro.
Intervalo de confianza para la media μ de una población normal con desviación típica conocida σ Si partimos de una población que sigue una distribución Z ~ N(0,1) bastará con
encontrar el punto crítico zα/2 para tener un intervalo que contenga la media poblacional con probabilidad c. p(-zα/2 < Z < zα/2) = c Si en el caso general tomamos:
bastará con hacer unas sencillas operaciones para llegar a que el intervalo de confianza
para la media μ de una población normal con desviación típica conocida σ es:
4
Intervalo de confianza para la media μ de una población con desviación típica conocida σ En el caso de poblaciones que no son normales, o que simplemente no sabemos si lo son o no, necesitamos que el tamaño de la muestra sea suficientemente grande (n > 30) para poder aplicar el Teorema central del límite para obtener que el intervalo de confianza para
la media μ de una población con desviación típica conocida σ es:
Ejemplo 1. Se encuentra que la concentración promedio de zinc de una muestra de 36 cereales es de 2.6 gramos por miligramo. Encuentre los intervalos de confianza de 95% y 99% para la concentración media de zinc en el cereal. Suponga que la desviación estándar de la población es 0.3. SOLUCION La estimación puntual de µ es = 2.6 (El valor de la media de la muestra). El valor de para un nivel de confianza del 95% es 1.96, por lo tanto;
5
Para un nivel de confianza de 99% el valor de z es de 2.575 por lo que el intervalo será más amplio:
Ejemplo 2. Las ventas diarias, en euros, en un determinado comercio siguen una distribución N(950,200). Calcula la probabilidad de que las ventas diarias en ese comercio: A) superen los 1200 euros. B) Estén entre 700 y 1000 euros
Ejemplo 3. Determinar el tamaño de muestra requerido para obtener la estatura media de la población, con una precisión de 1 cm, si la varianza poblacional es
= 25. 6
Tomando n=97 individuos, según la fórmula (4.4) la media de ellos estará en el intervalo x 1al 95% de confianza. El redondeo se hace siempre por exceso pasa asegurar la precisión.
Ejemplo 4 Determinar el tamaño de la muestra para obtener la estatura media de una población con una precisión de 0,3 . Ahora n=43, según la expresión (4.7),y, entonces la media está en
0,3
Ejemplo 5: Con datos del Ejemplo 1 como muestra piloto, determinar n con precisión d=4cm
Ahora n´=10 y
. Como 6 < 10 = n´, ello indica que con la
muestra piloto nos basta para la precisión deseada.
4.2 INTERVALOS DE COONFIANZA PARA LA VARIANZA 7
Si tenemos una muestra de tamaño n tomada de una población normal, podemos obtener un intervalo de confianza del nivel dado (90%, 95%, 99%, etc) para la varianza sabiendo que el valor de chi cuadrada es para este caso:
El cual es una variable aleatoria que tiene una distribución Chi cuadrada con n -1 grados de libertad. Por lo tanto, podemos emplear esta definición para estimar un intervalo de confianza ya que lo que necesitamos es que
Donde es el valor de Chi cuadrada para los grados de libertad y nivel de confianza (1 - α) especificado. 1. Teorema del Límite Central: Afirma que la media muestral tiene una distribución Normal aunque la población original no la tenga, siempre y cuando la muestra sea muy grande (de manera práctica N>30) Si no se conoce la varianza s2 de la población, una posibilidad es utilizar la varianza muestral S2 en las ecuaciones obtenidas para estimar intervalos en el caso de varianza conocida. 8
Este procedimiento funciona para muestras grandes (N>30), por ello los intervalos de confianza anteriores se les suele llamar intervalos de confianza para muestras grandes. Si las muestras son pequeñas el enfoque anterior no funciona y para lograr un procedimiento válido se supondrá que la población tiene una distribución Normal.
Ejemplo 1. Para determinar un estimado de intervalo de la varianza poblacional de las cantidades de llenado, recuerde que la muestra es de 20 envases que presenta una varianza de
=
0.0025. Con una tamaño de muestra de 20 , los grados de libertad son de 19. se determina que
reemplazando los valores en la ecuación
tenemos que:
O sea que el intervalo se encuentra dentro de los limites
Ejemplo 2.
9
La varianza de la resistencia a la rotura de 30 cables probados fue de 32.000 . Halle un intervalo de confianza del 90%, para la varianza de la resistencia de todos los cables de esta marca. SOLUCION
Los valores de
pertenecen a una distribución de chi-cuadrado con 29
grados de libertad. Como puede observarse en la figura el área que hay por debajo de Z a/2 es 0,05 por lo tanto lo tanto
= 17,71 y el área que hay por debajo de
es 0,95 por
=42,56.
Reemplazando la ecuación obtenemos
Por razones de utilidad se halla el intervalo de confianza para la desviación estándar, sacando la raíz cuadrada de los limites, por lo tanto:
El promedio de variación o dispersión de la rotura de cables de dicha marca, esta entre 150 y 233 Lb con una confiabilidad del 90%.
Ejemplo 3. 10
a) la varianza poblacional
b) la desviación estándar poblacional usando un intervalo de confianza del 95% en ambos casos.
Solución
Según los datos: n = 13;
s = 6;
1 – α = 0.95
Qué distribución usamos para el IC de la varianza? La distribución Chi cuadrado.
El intervalo de confianza correspondiente viene dado por:
Ejemplo 4.
Los siguientes son datos de conductividad térmica de cierto tipo de hierro (en BTU/hr-ft-°F):
41.60 41.48 42.34 41.95 41.86
42.18 41.72 42.26 41.81 42.04
Una estimación puntual para la media, es
= 41.924. Hallar un intervalo de confianza del 95 %
y uno del 99% para la media.
Se supone que la población tiene una distribución Normal con s=0.3
11
4.3INTERVALOS DE COONFIANZA DE PROPORCIONES Un estimador puntual de la proporción P en un experimento binomial está dado por la estadística P=X/N, donde X representa el número de éxitos en N pruebas. Por tanto, la proporción de la muestra p=x/n se utilizará como estimador puntual del parámetro P. Si no se espera que la proporción P desconocida esté demasiado cerca de 0 ó de 1, se puede establecer un intervalo de confianza para P al considerar la distribución muestral de proporciones. Considerando el valor z para la distribución de proporciones
Si intentamos despejar el valor de P nos encontramos con que
Pero ¿cómo podemos encontrar P si también está del lado derecho de la ecuación? Lo que haremos es aproximar la proporción de la población por la de la muestra, es decir sustituir P por la proporción de la muestra p siempre y cuando el tamaño de muestra no sea pequeño.
12
Cuando n es pequeña y la proporción desconocida P se considera cercana a 0 ó a 1, el procedimiento del intervalo de confianza que se establece aquí no es confiable ya que realmente se debería emplear la distribución binomial, por tanto, no se debe utilizar. Para estar seguros, se debe requerir que np y n(1-p) sea mayor o igual a 5. El error de estimación será la diferencia absoluta entre p y P, y podemos tener el nivel de confianza de que esta diferencia no excederá el valor de
Ejemplo 1. En un estudio de 300 accidentes de automóvil en una ciudad específica, 60 tuvieron consecuencias fatales. Con base en esta muestra, construya un intervalo del 95% de confianza para aproximar la proporción de todos los accidentes automovilísticos que en esa ciudad tienen consecuencias fatales.
SOLUCION:
13
Ejemplo 2.
Tomada al azar una muestran de 500 personas en cierta comunidad autónoma, se encontró que 220 leían algún periódico habitualmente. Calcula, con un nivel de confianza del 95% el intervalo en el que se encontrara la verdadera proporción de lectores de periódico.
SOLUCION
Debemos aplicar la formula
Proporción muestral de lectores
Intervalo de confianza para P (proporción de población que leerá periódicos. 14
Ejemplo 3.
Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas amplias para evaluar la función eléctrica de su producto. Todos los reproductores de discos compactos deben pasar todas las pruebas antes de venderse. Una muestra aleatoria de 500 reproductores tiene como resultado 15 que fallan en una o más pruebas. Encuentre un intervalo de confianza de 90% para la proporción de los reproductores de discos compactos de la población que no pasan todas las pruebas. Solución: n=500 p = 15/500 = 0.03 z(0.90) = 1.645
0.0237
Ejemplo 4.
En una muestra de 400 pilas tipo B fabricadas por la Everlast Company, se encontraron 20 defectuosas. Si la proporción p de pilas defectuosas en esa muestra se usa para estimar P, que vendrá a ser la proporción verdadera de todas las pilas defectuosas tipo B fabricadas por la Everlast Company, encuentre el máximo error de estimación tal que se pueda tener un 95% de confianza en que P dista menos de
de p.
Solución: p=x/n = 20/400=0.05 z(0.95)=1.96
Si p=0.05 se usa para estimar P, podemos tener un 95% de confianza en que P dista menos de 0.021 de p. En otras palabras, si p=0.05 se usa para erstimar P, el error máximo de estimación será aproximadamente 0.021 con un nivel de confianza del 95%. Para calcular el intervalo de confianza se tendría:
16
Esto da por resultado dos valores, (0.029, 0.071). Con un nivel de confianza del 95% se sabe que la proporción de pulas defectuosas de esta compañía está entre 0.029 y 0.071. Si se requiere un menor error con un mismo nivel de confianza “
sólo se necesita aumentar el tamaño de la muestra . ”
Ejemplo 5.
En un estudio de 300 accidentes de automóvil en una ciudad específica, 60 tuvieron consecuencias fatales. Con base en esta muestra, construya un intervalo del 90% de confianza para aproximar la proporción de todos los accidentes automovilísticos que en esa ciudad tienen consecuencias fatales. Solución: P= 60/300 = 0.20 Z(0.90) = 1.645
0.162
17
4.4 INTERVALOS DE COONFIANZA PARA LAS DIFERENCIAS En esta sección se verá el caso en donde se tienen dos poblaciones con medias y varianzas desconocidas, y se desea encontrar un intervalo de confianza para la diferencia de dos medias m1-m2. Si los tamaños de muestras n1 y n2 son mayores que 30, entonces, puede emplearse el intervalo de confianza de la distribución normal. Sin embargo, cuando se toman muestras pequeñas se supone que las poblaciones de interés están distribuidas de manera normal, y los intervalos de confianza se basan en la distribución t. Si, ̅1 y ̅ son las medias y las varianzas de dos muestras aleatorias de tamaño n1 y n2, respectivamente, tomadas de dos poblaciones normales e independientes con varianzas desconocidas pero iguales, entonces un intervalo de confianza del 100(1-a) por ciento para la diferencia entre medias es:
En donde:
18
Caso de varianza desconocida y común
Supondremos la existencia de dos poblaciones sobre las que una variable determinada sigue una distribución Normal con idéntica varianza en las dos. Sobre la población 1, la variable sigue una distribución N(µ1, σ) y, sobre la población 2, sigue una distrib ución N(µ2, σ). Igualmente supondremos que disponemos de dos muestras aleatorias independientes, una para cada población, de tamaños muestrales n1 y n2 respectivamente. El objetivo es construir un intervalo de confianza, con nivel de confianza (1 − α) · 100 %, para la diferencia de medias µ1 − µ2 El método se basa en la construcción de una nueva variable D, definida como la diferencia de las medias muestrales para cada población
Esta variable, bajo la hipótesis de independencia de las muestras, sigue una distribución Normal de esperanza µ1 − µ2 y de varianza 19
La estimación conjunta, a partir de las dos muestras, de la varianza común viene dada por la expresión
y, utilizando la propiedad de que la variable
sigue una distribución χ 2 con n1 + n2 − 2 grados de libertad, podemos construir un estadístico pivote que siga una distribución t de Student y que nos proporciona la fórmula siguiente para el intervalo de confianza para la diferencia de medias:
donde t α/2 es el valor de una distribución t de Student con n1 + n 2 − 2 grados de libertad
que deja a su derecha una probabilidad de α/2. I ntervalo de confianza para la diferencia de dos proporciones con datos independientes
20
Los límites para el intervalo de una diferencia de proporciones correspondientes a dos muestras independientes son:
donde el símbolo z α/2 es el mismo valor crítico que antes, prob( Z > z α/2) = α/2, y
corresponde a un intervalo de confianza 1 − α %. Este intervalo puede utilizarse de manera alternativa al contraste de hipótesis para
decidir (con nivel de significación α %) si hay igualdad de los dos grupos. Se decidirá por la igualdad de los grupos si el valor 0 queda incluido en cualquier posición en el intervalo. Aunque se haga el contraste de dos proporciones, en primer lugar, es aconsejable obtener el intervalo de confianza de la diferencia de medias, si éste ha resultado significativo, puesto que ayudará a interpretar si existe significación aplicada además de la estadística. Si se dispone de alguna información previa y sólo quiere calcularse alguno de los dos intervalos unilaterales, bastará sustituir z α/2 por z α y descartar el límite superior o inferior del intervalo según el caso. Por ejemplo, el intervalo unilateral derecho corresponde a:
21
Caso de varianzas desconocidas y diferentes
Cuando tenemos razones para suponer que la varianza no es común, no podemos utilizar el estadístico anterior. Hemos de destacar que, en esta situación, no existe un método exacto que permita obtener el intervalo de confianza deseado. Lo más que tenemos son aproximaciones a la solución. Un intervalo aproximado con nivel de confianza (1 − α) · 100 % es
, donde Ŝ 1 y Ŝ 2 son las varianzas muestrales corregidas para cada población y donde t α/2 es el valor de una distribución t de Student con g grados de libertad, donde
Si los grados de libertad resultantes son decimales, puede optarse por hacer una interpolación entre los dos valores enteros más cercanos o bien por tomar el valor más desfavorable, aquel que suponga un radio mayor para el intervalo de confianza y que coincide con el redondeo a la baja de los grados de libertad. Es, por tanto, muy importante, antes de proceder a la obtención del intervalo de confianza para la diferencia de medias, verificar si la suposición de homogeneidad de 22
varianzas es razonable o no. Una manera de verificarlo consiste en la construcción del intervalo para el cociente de varianzas, tal como se explica más adelante, y comprobar si en dicho intervalo está incluido el valor 1. La inclusión de la unidad dentro del intervalo resultante, la debemos interpretar en el sentido de que la muestra no proporciona evidencia suficiente para afirmar que las varianzas son diferentes y, por tanto, no es incorrecta la utilización del intervalo para varianza común. De manera análoga, el intervalo de confianza para la diferencia de medias nos puede servir para verificar la suposición de que las medias son iguales o diferentes; en este caso, si el valor 0 está incluido en el intervalo, la conclusión es que la muestra no proporciona evidencia suficiente para afirmar que las medias son diferentes.
Es el estimador combinado de la deviación estándar común de la población con n1 + n2 -2 grados de libertad. Ejemplo 1. Un artículo publicado dio a conocer los resultados de un análisis del peso de calcio en cemento estándar y en cemento contaminado con plomo. Los niveles bajos de calcio indican que el mecanismo de hidratación del cemento queda bloqueado y esto permite que el agua ataque varias partes de una estructura de cemento. Al tomar diez muestras de cemento estándar, se encontró que el peso promedio de calcio es de 90 con una desviación estándar de 5; los resultados obtenidos con 15 muestras de cemento contaminado con plomo fueron de 87 en promedio con una desviación estándar de 4. Supóngase que el porcentaje de peso de calcio está distribuido de manera normal. Encuéntrese un intervalo de 23
confianza del 95% para la diferencia entre medias de los dos tipos de cementos. Por otra parte, supóngase que las dos poblaciones normales tienen la misma desviación estándar. SOLUCION
El estimador combinado de la desviación estándar es:
Al calcularle raíz cuadrada a este valor nos queda que =4.41
Nótese que el intervalo de confianza del 95% incluye al cero; por consiguiente, para este nivel confianza, no puede concluirse la existencia de una diferencia e ntre las medias.
Ejemplo 2.
Se realizó un experimento para comparar el tiempo promedio requerido por el cuerpo humano para absorber dos medicamentos, A y B. Suponga que el tiempo necesario para que cada medicamento alcance un nivel específico en el torrente sanguíneo se distribuye normalmente. Se eligieron al azar a doce personas para ensayar cada fármaco registrándose el tiempo en minutos que tardó en alcanzar un nivel específico en la sangre. Calcule un intervalo de confianza del 95% para la diferencia del tiempo promedio. Suponga varianzas iguales.
SOLUCION
24
Con un nivel confianza del 95% se sabe que el tiempo promedio para alcanzar un nivel específico es mayor para el medicamento B.
Ejemplo 3. El envenenamiento por DDT causa temblores y convulsiones. En un estudio se ha administrado una dosis de DDT a 4 ratones y se ha medido posteriormente en cada uno el periodo absolutamente refractario, es decir, el tiempo que tardan sus nervios en recuperarse tras un estimulo. Las 4 medidas en milisegundos son: 1,7 1,6 1,8 1,9 (a) Estima el periodo absolutamente refractario medio µ para toda la población de
ratones de la misma cepa sujeta al mismo tratamiento con DDT.
25
(b) Calcula una estimación de la desviación típica del periodo absolutamente refractario
en la población de ratones. (c)
Calcula un intervalo de confianza para µ con nivel de confianza 90%. (Se supone
normalidad). (d) Calcula otro intervalo, pero ahora con un nivel del 95%. Solución:
(a) La estimación de µ es la media muestral:
¯ x = 1,7 + 1,6 + 1,8 + 1,9 4 = 1,75. (b) Una estimación de la varianza poblacional es la cuasi-varianza muestral:
s2 = (1,7−1,75)2 + (1,6−1,75)2 + (1,8−1,75)2 + (1,9−1,75)2/3 Por lo tanto s2 ≈ 0,017 y s = √0,017 ≈ 0,13. (c) Como t3,0,05 = 2,353, un I.C. con nivel de confianza 1−α = 0,90 es IC0,90(µ) =
[1,75∓2,353×0,065] = [1,597, 1,903].
Podemos afirmar que 1,597 < µ < 1,903 con un nivel de confianza del 90%. (d) Como t3,0,025 = 3,182, un I.C. con nivel de confianza 1−α = 0,95 es IC0,95(µ) =
[1,75∓3,182×0,065] = [1,543, 1,957].
Podemos afirmar que 1,543 < µ < 1,957 con un nivel de confianza del 95%.
26
4 .5 Aplicación en la explotación de hidrocarburos. El cálculo de reservas de hidrocarburos ha sido desde un principio uno de los principales problemas que ha tenido el ingeniero de yacimiento, esto se debe al inmenso número de variables aleatorias que posee cada sistema yacimiento como por ejemplo: porosidad, saturación, permeabilidad, presión, temperatura, entre otros. La labor entonces del ingeniero en petróleo es obtener mediante la implementación métodos numéricos avanzados, un valor aproximado de la cantidad de petróleo extraíble en determinado volumen de control. La estadística ha jugado gran importancia en todas las áreas de la ingeniería, esto se debe primordialmente a las toma de decisiones que realiza el ingeniero, decisiones que son influenciadas por una cierta cantidad de datos y variables proporcionadas por esta ciencia aplicada.
27
CONCLUSIONES.
Los conceptos antes mencionados han sido analizados e investigados de tal manera de hacer más fácil su comprensión y entendimientos ya que la estadística es la ciencia que trata de entender, organizar y tomar decisiones que estén de acuerdo con los análisis efectuados. La estadística juega un papel muy importante en nuestras vidas, ya que actualmente ésta se ha convertido en un método muy efectivo para describir con mucha precisión los valores de datos económicos, políticos, sociales, psicológicos, biológicos y físicos, además, sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico ha evolucionado mucho, ya no consiste sólo en reunir y tabular los datos, sino sobre todo en el proceso de interpretación de esa información, ahora tiene un papel mucho más importante del que tenia en años pasados. Es de vital importancia para nuestra vida profesional venidera, que manejemos estos conceptos con facilidad, así mismo el que los usemos de la manera apropiada, siempre en pro de buscar soluciones a los problemas que se nos puedan presentar.
28