ESTIMACION DE PARAMETROS POR INTERVALOS DE CONFIANZA
ESTADISTICA NO PARAMETRICA
LIC. RITA GUZMAN LOPEZ
ESTIMACION DE PARAMETROS POR INTERVALOS DE CONFIANZA En vez de estimar el parámetro θ a partir de un valor del θˆ (estimación puntual) ahora se trata de encontrar para una probabilidad prefijado (1-α) (nivel de confianza)) un intervalo [L ( [ 1,L2] llamado intervalo de confianza, que q contiene el parámetro θ, en base a una m.a.s, la misma que esta definida como: P(L1 ≤
ɵ ≤ L2)=1-α Parámetro
Estimador puntual
L1
θ
L2
El intervalo [L1,L2] es un intervalo aleatorio ya que sus extremos son variables aleatorias. ESTADISTICA NO PARAMETRICA
LIC. RITA GUZMAN LOPEZ
1
Nivel de Confianza Gráficamente : L1
θ
L2
Podemos considerar el nivel de confianza (1-α) que hemos prefijado para la expresión anterior como la probabilidad que existe (antes de tomar la muestra) de que el intervalo a construir a partir la muestra incluya el verdadero valor del parámetro a estimar. Refleja “la confianza” en la “construcción del intervalo” y de que este, tras concretar la muestra, contendrá el verdadero valor del parámetro, de ahí que en términos numéricos dicho nivel toma niveles altos (0.90, 0.95, 0.99).
p g , El complementario del “nivel de confianza”,, es “α”,, denominado nivel de significancia, supone la probabilidad de cometer el error de concluir que el intervalo no contiene el verdadero valor del parámetro cuando realmente si esta contenido. De ahí dado que se trata de un error posible a cometer, su cuantificación en términos de probabilidad sea muy pequeña (0.10, 0.05, 0.025).
ESTADISTICA NO PARAMETRICA
LIC. RITA GUZMAN LOPEZ
INTERVALO DE CONFIANZA PARA LA MEDIA CON VARIANZA CONOCIDA, MUESTRA GRANDE Sea X una población distribuida con media μ desconocida y varianza σ2 conocida. Debemos hallar un intervalo de confianza para μ, es decir, encontrar 2 estadísticos θ1 y θ2 tal que:
P(θ1 ≤ μ ≤ θ 2 ) = 1 − α
Con (1-α) conocido y establecido por el investigador
ESTADISTICA NO PARAMETRICA
LIC. RITA GUZMAN LOPEZ
2
Entonces : 1)Establecemos el nivel de confianza (1-α) 2)S X1, …,X 2)Sea Xn una m.a. de d tamaño t ñ “n” “ ” de d X, X y X la l media di muestral. t l 3)Sabemos que X es adecuada para estimar μ, por lo tanto podemos usar la distribución muestral de X para establecer un intervalo de confianza para μ. 4)Para “n” 4)P “ ” suficientemente fi i t t grande d (n≥30) ( ≥30) por ell teorema t central t l del d l limite li it se tiene que:
X ≈ N ( μ,
σ2 n
)
ESTADISTICA NO PARAMETRICA
LIC. RITA GUZMAN LOPEZ
Si X es una población normal, entonces X es normal para todo “n”. Además se obtiene:
Z=
( X − μ) n
σ
≈ N (0,1)
Se observa que si bien la v.a. depende del parámetro “μ” su distribución no. Por lo tanto bajo un nivel de confianza elegido puede determinarse:
P ( − z0 ≤ Z ≤ z0 ) = 1 − α
ESTADISTICA NO PARAMETRICA
, …….. (*)
LIC. RITA GUZMAN LOPEZ
3
Por la simetría de la curva normal se tiene:
P(− z0 ≤ Z ≤ z0 ) = 2 P[ Z ≤ z0 ] − 1 = 1 − α Es decir:
2 P[ Z ≤ z0 ] = 1 + 1 − α P[ Z ≤ z0 ] =
2 −α 2
P[ Z ≤ z0 ] = f ( z0 ) =
2 −α α = 1− 2 2
Usando tabla de la distribución normal, se encuentra el valor de “z0”. ESTADISTICA NO PARAMETRICA
LIC. RITA GUZMAN LOPEZ
5) Luego se sustituye “z0” (ya conocido) y el estadístico “Z” construido para la distribución de la media muestral, donde X es un estimador de µ Z=
en la siguiente expresión:
( X − μ) n
σ
P (− z0 ≤ Z ≤ z0 ) = 1 − α
P(− z0 ≤ Z ≤ z0 ) = P(− z 0 ≤ P(−
≈ N (0,1)
( X − μ) n
σ
≤ z0 ) = 1 − α
z0σ zσ ≤ X − μ ≤ 0 ) = 1−α n n
P(− X −
z0σ zσ ≤ −μ ≤ − X + 0 ) = 1 − α n n
P( X −
z0σ zσ ≤ μ ≤ X + 0 ) = 1−α n n
ESTADISTICA NO PARAMETRICA
LIC. RITA GUZMAN LOPEZ
4
P(− X −
zσ z0σ ≤ −μ ≤ − X + 0 ) = 1 − α n n
P( X −
z0σ zσ ≤ μ ≤ X + 0 ) = 1−α n n
De donde se obtiene el intervalo
[X −
z0σ zσ ,X + 0 ] n n
del 100(1-α)% de confianza para el parámetro μ.
ESTADISTICA NO PARAMETRICA
LIC. RITA GUZMAN LOPEZ
Para un valor particular de la muestra x1, …,xn sustituyendo el valor de de X en el intervalo aleatorio, se obtiene el siguiente intervalo de 100(1-α)% de confianza para µ :
x
x−
ESTADISTICA NO PARAMETRICA
z0σ zσ ≤μ≤x+ 0 n n
LIC. RITA GUZMAN LOPEZ
5
Teorema que resume y formaliza el resultado anterior:
x
Si es la media de una muestra de tamaño n (n≥30) tomada de una población distribuida con media μ (desconocida) y varianza σ2 conocida, entonces :
μ ∈ IC [ x −
z0σ zσ ,x + 0 ] n n
Con un nivel de confianza de 100(1-α)% para la media μ. Donde z0 es tal que:
P(Z ≤ z0)=1-α/2
f ( z0 ) = 1 −
α 2
Nota: Si la v.a. X (población) se distribuye normalmente con media μ y varianza σ2 (conocida), entonces, el teorema anterior se cumple también para n≤30. ESTADISTICA NO PARAMETRICA
LIC. RITA GUZMAN LOPEZ
Este teorema es aplicable al siguiente caso: Si se desconoce σ y n≥30, se puede usar la desviación estándar muestral “S” para aproximar σ. En el intervalo de confianza será:
μ ∈ IC [ x −
z0 S zS ,x + 0 ] n n
Con un nivel de confianza del 100(1 100(1-α)%. α)%.
ESTADISTICA NO PARAMETRICA
LIC. RITA GUZMAN LOPEZ
6
3)Cuando el muestreo es sin reemplazo en poblaciones finitas de N elementos se usa el factor de corrección :
( N − n) ( N − 1) i. Entonces, para una población finita de N elementos y un muestreo sin reposición, además siendo la desviación estándar poblacional σ conocida y n ≥ 30, el intervalo que contiene el parámetro ”µ” es:
⎡ σ ( z0 ) N − n σ ( z0 ) N − n ⎤ μ ∈ IC ⎢ X − ,X + ⎥ N −1 N −1 ⎦ n n ⎣ con un nivel de confianza del 100(1-α)% para μ. ESTADISTICA NO PARAMETRICA
ii.
LIC. RITA GUZMAN LOPEZ
Para una población finita de N elementos y un muestreo sin reposición, si la desviación estándar poblacional “σ” es desconocida por lo indicado en el punto (1) n≥30, el intervalo de confianza es:
⎡
μ ∈ IC ⎢ X − ⎣
S ( z0 ) n
S ( z0 ) N −n ,X + N −1 n
N −n⎤ ⎥ N −1 ⎦
con un nivel de confianza del 100(1-α)% para μ.
ESTADISTICA NO PARAMETRICA
LIC. RITA GUZMAN LOPEZ
7
Observaciones: 1) Cuanto mayor sea el nivel de confianza prefijado la amplitud del intervalo de estimación será también mayor y por tanto la estimación será menos precisa. 2) El tamaño de la muestra aparece en el denominador de σ(z0), entonces muestras más grandes darán intervalos de confianza mas cortos, por lo tanto información más precisa.
Muestra grande reduce el intervalo
⎡
μ ∈ IC ⎢ X − ⎣
σ ( z0 ) n
σ ( z0 ) N −n ,X + N −1 n
ESTADISTICA NO PARAMETRICA
N −n⎤ ⎥ N −1 ⎦
LIC. RITA GUZMAN LOPEZ
Ejemplo: Construir un intervalo del 95% de confianza para la media de una población con σ=10, siendo el tamaño de la muestra n=64 y el resultado de la media muestral X = 48.5 Solución: Del enunciado (1-α)=0.95 Sabemos: P ( Z ≤ z0 ) = f ( z0 ) = 1 − α , reemplazando: 2
P( Z ≤ z0 ) = f ( z0 ) = 1 −
0.05 = 0.975 2
De tabla de la distribución normal se obtiene:
z0 = 1.96 ESTADISTICA NO PARAMETRICA
LIC. RITA GUZMAN LOPEZ
8
Dado que conocemos σ =10 y n=64, entonces:
μ ∈ IC [ x −
z0σ zσ ,x + 0 ] n n
Calculando los limites:
L1 = 48.5 − L2 = 48.5 +
(1.96)(10) = 46.05 8
(1.96)(10) = 50.95 8
Luego [46.05 ,50.95] es el intervalo encontrado. Por lo tanto concluimos que el valor real del parámetro μ se encuentra dentro del intervalo de confianza [46.05 ,50.95] con un nivel de confianza del 95%. ESTADISTICA NO PARAMETRICA
LIC. RITA GUZMAN LOPEZ
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACION NORMAL CON VARIANZA POBLACIONAL DESCONOCIDA, PARA MUESTRA PEQUEÑA (n<30)
Sea X v.a v a con distribución aproximadamente normal con media μ y varianza σ2 (desconocida). Sabemos que cuando σ2 es desconocida se usa el estimador puntual s2. Entonces: 1. Establecemos el nivel de significación para el análisis. 2. Consideramos una m.a. X1,X2,…,Xn de tamaño n (n<30), y sus respectivas media muestral X y desviación típica muestral “S”.
ESTADISTICA NO PARAMETRICA
LIC. RITA GUZMAN LOPEZ
9
3. Sabemos que X es adecuada para estimar μ, pero como σ2 es desconocida usaremos la distribución muestral de la variable aleatoria
T =
(X − μ) s
n
≈ t ( n −1 ) g .l .
4 T v.a. 4. v a que depende de μ pero su distribución no, no entonces establecido el nivel de confianza (1-α), podemos determinar dos valores t1 y t2 tal que:
P[t1 ≤ T ≤ t 2 ] = 1 − α 5. Utilizando la simetría de la distribución “t”, tenemos: t1=-t2=t0 :
P[−t0 ≤ T ≤ t0 ] = 1 − α P [T ≤ t 0 ] = f ( t 0 ) = 1 −
P[−t0 ≤ T ≤ t0 ] = 2 P[T ≤ t0 ] − 1 = 1 − α
α
... t 0 = t
1−
2
α 2
, ( n −1) g .l .
donde: “t0” es el valor encontrado en tabla de distribución t-student. ESTADISTICA NO PARAMETRICA
6.
LIC. RITA GUZMAN LOPEZ
Sustituyendo T:
(X − μ) n ≤ t0 ] = 1 − α s ts ts P[ X − 0 ≤ μ ≤ X + 0 ] = 1 − α n n2
P[ −t 0 ≤ T =
P[−
t0 s ts ≤ X − μ ≤ 0 ] = 1−α n n2
t0 = t
Donde:
1−
α 2
,( n −1) g .l .
Entonces obtenemos que:
μ ∈ IC [ X −
t0 s t s ;X + 0 ] n n
Con un (1-α)100% de confianza para μ. Observación: Cuando el muestreo es sin reemplazo en poblaciones finitas, se debe utilizar el factor de corrección, corrección entonces el intervalo con un (1-α)100% (1 α)100% de confianza para la media poblacional es:
μ ∈ IC [ X − ESTADISTICA NO PARAMETRICA
t0 s n
ts N −n ;X + 0 N −1 n
N −n ] N −1
LIC. RITA GUZMAN LOPEZ
10
ERROR DE ESTIMACIÓN Y MÁXIMO ERROR DE ESTIMACIÓN El intervalo de confianza para μ con coeficiente de confianza (1-α)100% proporciona una estimación de la exactitud del estimador puntual X . Sabemos que, que la X es un valor estimado no es exactamente igual a μ, es decir hay un error de estimación dado por e = X − μ puede tener una confianza de(1-α)100% de que tal diferencia será menor que z 0 σ n Error
μ
z0σ n
x−
X
x+
ESTADISTICA NO PARAMETRICA
LIC. RITA GUZMAN LOPEZ
Entonces, denominaremos Sabemos:
− z0 ≤
e= X −μ
X −μ
σ
error de estimación.
≤ z0 Máximo error de estimación (e0)
n − z0
σ n
≤ X − μ ≤ z0
z0σ n
σ
X − μ ≤ z0
n
σ n
Error de estimación (e)
Con esta notación, un intervalo de confianza para la media resulta:
P( X − e0 ≤ μ ≤ X + e0 ) Donde: e 0 problema.
= z0
σ n
ESTADISTICA NO PARAMETRICA
ó
e0 = t0
s n
según las condiciones del
LIC. RITA GUZMAN LOPEZ
11
TAMAÑO DE MUESTRA PARA ESTIMAR LA MEDIA DE LA POBLACIÓN (µ) Para determinar el tamaño de una muestra para estimar simple, es necesario partir de dos supuestos:
µ, empleando el muestreo aleatorio
1° El nivel de confianza (1-α) al que queremos trabajar; y 2° Cual es el error máximo (e) que estamos dispuestos a admitir en nuestra estimación. Determinamos dicho tamaño a partir del:
e ≤ z0
e ≤ e0
zσ n = ( 0 )2 e
ESTADISTICA NO PARAMETRICA
σ n
⎛zσ ⎞ n≤⎜ 0 ⎟ ⎝ e ⎠
zσ n≤ 0 e
2
En la situación probable que σ sea desconocido, puede estimarse mediante la desviación estándar muestral S, utilizando una muestra piloto de cualquier tamaño razonable (n≥30) o en todo caso considerando algún estudio similar realizado anteriormente. LIC. RITA GUZMAN LOPEZ
Observación: Cuando la población es finita de tamaño “N” y el tamaño de la muestra constituye más del 5% del tamaño de la población, se debe usar el factor de corrección de población finita para modificar las desviaciones estándar de las formulas:
e ≤ z0
σ n
N −n N −1
z02σ 2 N n= z0σ 2 + e 2 ( N − 1)
S ú las Según l condiciones di i d dell problema bl se usara σ ó s
ESTADISTICA NO PARAMETRICA
LIC. RITA GUZMAN LOPEZ
12
Aplicación 1: En un laboratorio 100 estudiantes de ingeniería miden separadamente p el calor específico p del aluminio obteniéndose un promedio de 0.2210 calorías y una de desviación estándar de 0.0240. a) Construir un intervalo de confianza del 95% para el verdadero calor específico del aluminio. b) ¿Qué puede decirse con una probabilidad de 0.95 acerca del posible tamaño del error de estimación si el promedio muestral es usado para estimar el verdadero calor específico del aluminio.
ESTADISTICA NO PARAMETRICA
LIC. RITA GUZMAN LOPEZ
Solución: n=100, X = 0.2210 , s=0.0240, 1-α=0.95
a) P [ x − z 0 z0
s s ≤ μ ≤ x − z0 ] n n
Donde: z0=z1-α/2 valor de tabla zo.975=1.96
s ( 0 . 0240 ) = 1 . 96 = 0 . 0047 n 100
Reemplazando: P [ 0 . 2210 − 0 . 0047 ≤ μ ≤ 0 . 2210 + 0 . 0047 ] = 0 . 95
μ ∈ I .C .[ 0 . 2163 ;0 . 2257 ] Se tiene con un 95% de confianza que el intervalo aleatorio [0.2163;0.2257] incluye a μ (el verdadero calor específico del aluminio). ESTADISTICA NO PARAMETRICA
LIC. RITA GUZMAN LOPEZ
13
b)
X − μ ≤ e0
X − μ ≤ z0
s = 0 . 0047 n
e ≤ 0.0047 Con una probabilidad de 0.95 de confianza podemos decir: 1) El error de estimación no excederá a 0.0047 ó 2) El máximo error de estimación será 0.0047 ó 3) El error de estimación será menor o igual a 0.0047.
ESTADISTICA NO PARAMETRICA
LIC. RITA GUZMAN LOPEZ
Aplicación 2: Un ingeniero mecánico cree haber perfeccionado un programa de adiestramiento que puede reducir considerablemente el tiempo de montaje de ciertos mecanismos empleados por los trabajadores. Para comprobar esta creencia, escoge 10 trabajadores al azar y realiza estudios de tiempo antes y después del adiestramiento, obteniendo como resultado las siguientes reducciones de tiempo en minuto:
TABAJADOR REDUCCION DE TIEMPO
1
2
3
4
5
6
7
8
9
10
3
5
-1
0
7
4
8
3
-1
2
Halle un intervalo de confianza del 95% para la medida de la reducción del tiempo de montaje, si la reducción del tiempo sigue una distribución normal.
ESTADISTICA NO PARAMETRICA
LIC. RITA GUZMAN LOPEZ
14
Solución:
10
(1-α)=0.95
x = s
2
∑x i =1
i
=
n
30 =3 10
∑ (x − x) =
2
=
i
n −1 s = 3. 127
Calculamos:
88 = 9.778 9
t 0 = t 0 .975 ;( 9 ) g . l = 2 . 262
( 2 . 262 )( 3 . 127 ) t0 s = = 2 . 237 n 10 L 1 = 3 − 2 . 237
= 0 . 763
L 2 = 3 + 2 . 237
= 5 . 237
Por lo tanto, el I.C. , al 95% , para μ es: ESTADISTICA NO PARAMETRICA
[0.763;5.237] LIC. RITA GUZMAN LOPEZ
INTERVALO DE CONFIANZA PARA LA VARIANZA POBLACIONAL I. Caso de población normal y muestra pequeña (n<30). Sea X una v.a. distribuidas normalmente con media μ y varianza σ2 desconocido. Consideremos una m.a. X1,X2,…,Xn , de tamaño n de X. Sea X media muestral y S2 la varianza muestral. Sabemos que la v.a.
(n − 1)S 2
σ2
≈ χ(2n−1) g .l
entonces consideramos dos
cuantiles de esta distribución que nos dejen una probabilidad (1-α) en la zona central de la distribución, luego se puede encontrar L1 y L2 tal que:
P[χ 2 < L1 ] =
α⎫
2 ⎪⎪ 2 ⎬ ⇒ P[L1 ≤ χ ≤ L2 ] = 1− α α P[χ 2 > L2 ] = ⎪⎪ 2⎭ L1 ESTADISTICA NO PARAMETRICA
L2
LIC. RITA GUZMAN LOPEZ
15
Entonces:
P [ χ α2 2
P[ χ α2 2
P[
, ( n −1 ) g . l .
,( n −1) g .l .
1
χα
P[
1−
( n − 1) s 2
≤
σ
1
χ
2
≤
α
1− ,( n −1) g .l . 2
, ( n −1 ) g . l .
1− ,( n −1) g .l . 2
2
( n − 1) s
, ( n −1 ) g . l .
2
≤ χ2 α
σ2
≥
2 2
≤ χ2 ≤ χ2α
2
≥
σ2 ( n − 1) s
2
] = 1−α
] = 1−α
1
χ
≤
2 1−
α 2
, ( n −1 ) g . l .
1
χα 2
2
] = 1−α
] = 1−α
,( n −1) g .l .
ESTADISTICA NO PARAMETRICA
LIC. RITA GUZMAN LOPEZ
Entonces:
P[
( n − 1) s 2
χ2α
≤σ2 ≤
1− ,( n −1) g .l . 2
Luego:
L1 =
( n − 1) s 2
χ2α
1− ,( n −1) g .l . 2
( n − 1) s 2
χ α2 2
] = 1−α
,( n −1) g .l .
y
L2 =
( n − 1) s 2
χ α2 2
,( n −1) g .l .
El intervalo aleatorio [L1,L2] debe contener σ2 con (1-α)100% de confianza.
ESTADISTICA NO PARAMETRICA
LIC. RITA GUZMAN LOPEZ
16
II. Caso de Población normal o no y muestra grande (n≥30). Si n es grande : la distribución muestral de S se aproxima a la normal N(σ;σ2/2n), entonces :
Z =
S −σ
≈ N ( 0 ;1 )
σ
2n Si n es grande : la distribución muestral de “S” se aproxima a la normal N(σ;σ2/2n), entonces :
P[− z0 ≤ Z ≤ z0 ] = 1 − α P[ − z0 ≤
S −σ
σ
≤ z0 ] = 1 − α
Recordar: Z0=z(1-α/2)
2n ESTADISTICA NO PARAMETRICA
P[ − z0 ≤
LIC. RITA GUZMAN LOPEZ
2n S
σ
P[ 2n − z0 ≤
− 2n ≤ z 0 ] = 1 − α
2n S
σ
≤ z0 + 2n ] = 1 − α
P[
σ 1 1 ≥ ≥ ] = 1−α 2n − z 0 2n S z0 + 2n
P[
1 1 σ ≤ ≤ ] = 1−α z 0 + 2n 2n S 2n − z 0
P[
2n S ≤σ ≤ z0 + 2n
ESTADISTICA NO PARAMETRICA
2n S ] = 1−α 2n − z0 LIC. RITA GUZMAN LOPEZ
17
P[
P[
Entonces :
S z 1+ 0 2n S2
z ⎞ ⎛ ⎜1 + 0 ⎟ 2n ⎠ ⎝
L1 =
2
≤σ ≤
S z 1− 0 2n
≤σ 2 ≤
S2 z ⎞ ⎛ ⎜1 − 0 ⎟ 2n ⎠ ⎝
S2 z ⎞ ⎛ ⎜1 + 0 ⎟ 2n ⎠ ⎝
] = 1−α
] = 1−α
L2 =
y
2
2
S2 z ⎞ ⎛ ⎜1 − 0 ⎟ 2n ⎠ ⎝
2
El intervalo aleatorio [L1,L1] contiene σ2 con (1-α)100% de confianza. ESTADISTICA NO PARAMETRICA
LIC. RITA GUZMAN LOPEZ
Aplicación: Los siguientes números son las notas de 15 estudiantes del curso de Estadística No Parametrica. 13, 08, 10, 12, 15,07, 16, 09, 14, 11, 08, 11, 17, 13, 11 Suponiendo que la población de notas esta normalmente distribuida, distribuida construir el intervalo de confianza del 95% para σ2 y σ.
Solución: Para un nivel de confianza (1-α)=0.95 α=0.05 2 Haciendo cálculos encontramos: S =9.09524 Valores de tabla:
χ2α
1− ,( n −1) g .l . 2
= χ 02.975,(14) g .l . = 26.1
ESTADISTICA NO PARAMETRICA
y
χ α2 2
, ( n −1 ) g . l .
= χ 02.025 , (14 ) = 5 . 63
LIC. RITA GUZMAN LOPEZ
18
Reemplazando en:
L1 =
L2 =
( n − 1) s 2
χ
2 0.975,(14 ) g .l .
( n − 1) s 2
χ
2 0.025,(14 ) g .l .
=
(14)(9.09524) = 4.879 26.1
=
(14)(9.0952) = 22.617 5.63
El intervalo aleatorio [4.879 ; 22.617] contiene σ2 con 95% de confianza. En forma similar, el intervalo de confianza para σ:
L1 =
L2 =
( n − 1) s 2
χ
2 0 . 975 , ( 14 ) g . l .
( n − 1) s 2
χ 02. 025 , ( 14 ) g . l .
=
(14 )( 9 . 09524 ) = 26 . 1
4 . 879 = 2 . 209
=
(14 )( 9 . 0952 ) = 5 . 63
22 . 617 = 4 . 756
El intervalo aleatorio [2.209 ; 4.756] contiene σ con 95% de confianza. ESTADISTICA NO PARAMETRICA
LIC. RITA GUZMAN LOPEZ
19