‘’AÑO DEL BUEN SERVICIO AL CIUDADANO”
UNIVERSIDAD NACIONAL DE TRUJILLO FACULTAD DE INGENIERÍA ESCUELA ACADÉMICO PROFESIONAL DE INGENIERÍA DE MINAS
INVESTIGACIÓN FORMATIVA
ASIGNATURA: ESTADÍSTICA Y PROBABILIDAD DOCENTE: RUBIO JACOBO, LUIS ALBERTO INTEGRANTES:
ALAYO RODRIGUEZ JIMMY LÁZARO SALINAS JHORDAN VÁSQUEZ HONORIO, WILLIAM H.
TRUJILLO, 21 DE DICIEMBRE DEL 2017
UNIVERSIDAD NACIONAL DE TRUJILLO
Indice 1.
Estimación puntual e interválica para ẍ, ρ y
.................................... 3
Estimación puntual ..................................................................................... 3 Estimación interválica o por intervalo de confianza ................................... 6 Estimación puntual e interválica para ẍ (media) ........................................ 7 Estimación puntual para la media ........................................................... 7 Estimación interválica para la media ...................................................... 7 Estimación puntual e interválica para ρ (proporciones)
............................. 9
Estimación puntual para una proporción................................................. 9 Estimación interválica para una proporción .......................................... 10 Estimación puntual e interválica para
(varianza) ................................ 11
Estimación puntual para la varianza ..................................................... 11 Estimación intervállica para la varianza ............................................... 13
ESTADÍSTICA Y PROBABILIDADES
2
UNIVERSIDAD NACIONAL DE TRUJILLO
1. Estimación puntual e interválica para ẍ, ρ y
Estimación puntual
Cuando queremos realizar un estudio de una población cualquiera de la que desconocemos sus parámetros, por ejemplo, su media poblacional o la probabilidad de éxito si la población sigue una distribución binomial, debemos tomar una muestra aleatoria de dicha población a través de la cual calcular una aproximación a dichos parámetros que desconocemos y queremos estimar. Bien, pues esa aproximación se llama estimación Una estimación puntual del valor de un parámetro poblacional desconocido (como puede ser la media µ, o la desviación estándar σ ). Una estimación puntual de un parámetro θ es un numero único que puede ser considerado como un valor sensible de θ. Se obtiene una estimación puntual seccionando un estadístico apropiado y calculando su valor con los datos muéstrales dados. El estadístico seleccionado se llama estimador puntual de θ. En el ejemplo de la vida útil de batería, el estimador utilizado para obtener la estimación puntual de µ fue
y la estimación puntual de µ fue 5.77. Si las tres vidas útiles hubieran
sido x1=5.6, x 2=4.5 y x 3= 6.1, el uso del estimador
habría dado por resultado la
estimación = (5.6 + 4.5 + 6.1)/3= 5.40. El símbolo (“teta testada”) se utiliza comúnmente para denotar tanto la estimación de θ como la estimación puntual que resulta
̂
de una muestra dada.*Por tanto, =
se lee como “el estimador puntual de µ es la media.
Propiedades que debe cumplir el estimador
E stimadores insesgados: Supóngase que se tiene dos instrumentos de medición: uno ha sido calibrado con precisión, pero el otro sistemáticamente da lecturas más pequeñas que el valor verdadero que se está midiendo. Cuando cada uno de los instrumentos se utili za repetidamente en el mismo objeto, debido al error de medición, las mediciones observadas no serán idénticas. Sin embargo, las mediciones producidas por el primer instrumento se distribuirán en tono al valor verdadero de tal modo que en promedio este instrumento mide lo que se propone medir, por lo que se propone medir, por lo que ese instrumento se como instrumento insesgo. El segundo instrumento proporciona observaciones que tiene un componente de error o sesgo sistemático. ¿Cuáles son las propiedades que una “buena” función de decisión debería tener para poder
Θ
influir en nuestra elección de un estimador en vez de otro? Sea un estimador cuyo valor
Θ
es una estimación puntual de algún parámetro de la población desconocido θ. Sin duda
ESTADÍSTICA Y PROBABILIDADES
3
UNIVERSIDAD NACIONAL DE TRUJILLO
Θ
desearíamos que la distribución muestral de tuviera una media igual al parámetro estimado. Al estimador que tuviera esta propiedad se l e llamaría estimador insesgado. Se dice que un estadístico ˆ Θ es un estimador insesgado del parámetro θ si:
Θ Θ
μ = E ( ) = θ Ejemplo: Demuestre que S2 es un estimador insesgado del parámetro σ 2
Consistencia Un estimador es consistente si aproxima el valor del parámetro cuanto mayor es n (tamaño de la muestra). Algunos estimadores consistentes son:
Ejemplo En una población de 500 puntuaciones cuya Media (m) han hecho tres muestreos aleatorios (número de muestras= 100) con los siguientes resultados:
ESTADÍSTICA Y PROBABILIDADES
4
UNIVERSIDAD NACIONAL DE TRUJILLO
vemos que el muestreo en que n=100 la Media de las Medias muéstrales toma el mismo valor que la Media de la población.
E ficiencia Diremos que un estimador es más eficiente que otro si la Varianza de la distribución muestral del estimador es menor a la del otro estimador. Cuanto menor es la eficiencia, menor es la confianza de que el estadístico obtenido en la muestra aproxime al parámetro poblacional. Ejemplo La Varianza de la distribución muestral de la Media en un muestreo aleatorio (número de muestras: 1000, n=25) ha resultado igual a 0.4. La Varianza de la distribución de Medianas ha resultado, en el mismo muestreo, igual a 1.12, (este resultado muestra que la Media es un estimador más eficiente que la Mediana).
ESTADÍSTICA Y PROBABILIDADES
5
UNIVERSIDAD NACIONAL DE TRUJILLO
Estimación interválica o por intervalo de confianza
Un intervalo de confianza es un rango de valores, derivado de los estadísticos de la muestra, que posiblemente incluya el valor de un parámetro de población desconocido. Debido a su naturaleza aleatoria, es poco probable que dos muestras de una población en particular produzcan intervalos de confianza idénticos. Sin embargo, si usted repitiera muchas veces su muestra, un determinado porcentaje de los intervalos de confianza resultantes incluiría el parámetro de población desconocido.
En este caso, la línea negra horizontal representa el valor fijo de la media desconocida de la población, µ. Los intervalos de confianza azules verticales que se sobreponen a la línea horizontal contienen el valor de la media de la población. El intervalo de confianza rojo que está completamente por debajo de la línea horizontal no l o contiene. Un intervalo de confianza de 95% indica que 19 de 20 muestras (95%) de la misma población producirán intervalos de confianza que contendrán el parámetro de población. Utilice el intervalo de confianza para evaluar la estimación del parámetro de población. Por ejemplo, un fabricante desea saber si la longitud media de los lápices que produce es diferente de la longitud objetivo. El fabricante toma una muestra aleatoria de lápices y determina que la longitud media de la muestra es 52 milímetros y el intervalo de confianza de 95% es (50,54). Por lo tanto, usted puede estar 95% seguro de que la longitud media de todos los lápices se encuentra entre 50 y 54 milímetros. El intervalo de confianza se determina calculando una estimación de punto y luego determinando su margen de error.
ESTADÍSTICA Y PROBABILIDADES
6
UNIVERSIDAD NACIONAL DE TRUJILLO
Estimación puntual e interválica para ẍ (media) Estimación puntual para la media
La distribución muestral de está centrada en μ y en la mayoría de las aplicaciones la varianza es más pequeña que la de cualesquiera otros estimadores de μ. Por lo tanto, se utilizará la media muestral
̅ ⁄
μ.
como una estimación puntual para la media de la población
Recuerde que = , por lo que una muestra grande producirá un valor de procedente de una distribución muestral con varianza pequeña. Por consiguiente, es probable que sea una estimación muy precisa de μ cuando n es grande. Consideremos ahora la estimación por intervalos de μ. Si seleccionamos nuestra muestra a partir de una población normal o, a falta de ésta, si n es suficientemente grande, podemos establecer un intervalo de confianza para μ considerando la distribución muestral de .
= . ∑ ̂
EJEMPLO: Las puntuaciones en una muestra aleatoria de 10 personas a un test psicométrico fueron respectivamente: 25, 24, 22, 20, 25, 18, 17, 24, 16, 21. Hallar la estimación puntual de la Media
̂
= . 212 ∑ ̂ 10 21.2
Estimación interválica para la media
Si desconocemos la distribución de la población, podemos hallar un intervalo de confianza para la media, basándonos en un resultado que conocemos como Desigualdad de TChebychev. Sea X una v.a. cualquiera con media y varianza
. Se cumple que:
Usando el anterior resultado, aplicándolo a la variable aleatoria X y tomando
, obtendríamos que el intervalo para un nivel
ESTADÍSTICA Y PROBABILIDADES
sería:
7
UNIVERSIDAD NACIONAL DE TRUJILLO
Para analizar los resultados que presentamos a continuación, supongamos una población que se distribuye normal de media y varianza poblacional . También servirán cuando la población no es normal pero el tamaño muestral es grande.
I ntervalo de confianza para la media con conocida. X
n
Ya sabemos que es decir,
( z)
N ( 0 , 1)
1
z
. Sea
el percentil de la distribución normal;
2
P z
P X
Haciendo operaciones
X
z
n
z
n
1
X
z
1 n
Por tanto, el intervalo de confianza para será:
X z
n
X
,
I ntervalo de confianza para la media con X
En este caso tenemos que
n
s
1
t
z
n
desconocida.
t Por el mismo razonamiento anterior, si llamamos
P t
x 1
al percentil de la
2 , el intervalo de confianza al nivel distribución t de Student tal que de significación (o equivalentemente, al nivel de confianza 1- ) será:
ESTADÍSTICA Y PROBABILIDADES
8
UNIVERSIDAD NACIONAL DE TRUJILLO
X t
s
1
n
, X
s
t
n
1
Ejemplo: Extraemos una m.a.s. de 61 estudiantes universitar ios. Responden a una prueba de inteligencia espacial, en la que alcanzan una media de 80 y una varianza de 100. ¿Entre qué límites se hallará la verdadera inteligencia espacial media de los estudiantes, a un nivel de confianza del 99%?
1
0 ' 99
0 ' 01 1
0 ' 995
2
La varianza poblacional es desconocida y la población no es normal, pero el tamaño muestral es mayor que 30, por tanto, el intervalo correspondiente será:
X t
s
n
1
, X
80
y
s
80
10
Buscamos en las tablas la distribución t de Student Sabemos que X
s
t
n
t
1
2' 66
.
. Sustituyendo en el intervalo de confianza tenemos:
2' 66
10
, 80
2 ' 66
60
10 60
por tanto, 76 ' 57 , 83 ' 43 con un nivel de confianza del 99%. Estimación puntual e interválica para ρ (proporciones)
Estimación puntual para una proporción
/
El estadístico , en donde X representa el número de éxitos en n ensayos, provee un estimador puntual de la proporción p en un experimento binomial. Por lo tanto, la proporción de la muestra se utilizará como el estimador puntual del parámetro p. Si no se espera que la proporción p desconocida esté demasiado cerca de 0 o de 1, se puede establecer un intervalo de confi anza para p considerando la distribución muestral
̂ /
de . Si en cada ensayo binomial asignamos el valor 0 a un fracaso y el valor 1 a un éxito, el número de éxitos, x, se puede interpretar como la suma de n valores que consta sólo de ceros y unos, y es sólo la media muestral de esos n valores. En consecuencia, por el
̂
teorema del límite central, para n suficiente mente grande está distribuida de forma casi normal con media
ESTADÍSTICA Y PROBABILIDADES
9
UNIVERSIDAD NACIONAL DE TRUJILLO
Y varianza
Por lo tanto, podemos afirmar que
Y Zα/2 es el valor por arriba del cual encontramos una área de α/2 debajo de la curva normal estándar. Al sustituir para Z escribimos
Cuando n es grande se intrduce un error muy pequeño sustituyendo el estimado puntual para la p debajo del signo de radical. Entonces podemos escribir
̂ /
EJEMPLO Las puntuaciones en una muestra aleatoria de 10 personas a un test psicométrico fueron respectivamente: 25, 24, 22, 20, 25, 18, 17, 24, 16, 21. Hallar la estimación puntual de una proporción que tienen mayor de 22.
̂ 4⁄10 0.4
Estimación interválica para una proporción
Como el mejor estimador de la proporción es la proporción muestral p
X
en n donde X es una distribución binomial de parámetros n y p, que al ser n muy grande, ˆ
se puede aproximar por una normal. Se verifica que p N p,
p(1 p)
ˆ
p p ˆ
pq
n
O sea:
N (01) con lo que
n
ESTADÍSTICA Y PROBABILIDADES
10
UNIVERSIDAD NACIONAL DE TRUJILLO
p p P z / 2 z / 2 1 de donde se obtiene el intervalo pq n pq pq 1 pero al ser p y q desconocidos se P p z / 2 p p z / 2 n n ˆ
ˆ
ˆ
emplea la expresión anterior pero tomando como valor de p su estimación. Es dec ir,
pq
que el intervalo quedaría: P p z / 2
ˆ
ˆ
ˆ
p p z ˆ
n
pq
1 n
ˆ
/ 2
ˆ
Ejemplo: Uno de los líderes de un colectivo laboral desea plantear una cuestión a todos los miembros del grupo. Si más de la mitad respondieran NO entonces preferiría no plantearla para no minar su prestigio. Para salir de dudas, elige aleatoriamente a 100 trabajadores a los que hace la pregunta y sólo 30 responden NO. ¿Entre qué límites se hallará la verdadera proporción al nivel del 95%? Como el tamaño muestral es grande, podemos aplicar el teorema central del límite. Tenemos
1 0'95 1
0'975
2
z 1
1'96
2
Sustituyendo los valores en el intervalo correspondiente:
0 ' 3 1' 96
0 ' 3 0' 7 100
, 0 ' 3 1' 96
0' 3 0' 7 100
0 ' 2102
, 0 ' 3898
Por tanto, la verdadera proporción está en el intervalo 0' 2102 , 0 ' 3898 con un nivel de confianza del 95%.
Estimación puntual e interválica para
(varianza)
Estimación puntual para la varianza
Si extraemos una muestra de tamaño n de una población normal con varianza σ 2 y calculamos la varianza muestral s2, obtenemos un valor del estadístico S2. Esta varianza muestral calculada se utiliza como una estimación puntual de σ 2. En consecuencia, al estadístico S2 se le denomina estimador de σ 2.
= . .̅ ∑
1
ESTADÍSTICA Y PROBABILIDADES
11
UNIVERSIDAD NACIONAL DE TRUJILLO
Se puede establecer una estimación por intervalos de σ2 utilizando el estadístico.
1
Cuando las muestras se toman de una población normal el estadístico X 2 tiene una distribución chi cuadrada con n – 1 grados de libertad. Podemos escribir
< < − )1 (−/
donde
/ −/ y
,
son valores de la distribución chi cuadrada con
1 – /2 /2 − < < − 1 −/
libertad, que dejan áreas de para escribimos
y
– 1
grados de
, respectivamente, a la derecha. Al sustituir
,
1 1 1 1 [ / < < −/ ]1 1001 – %
Si dividimos cada término de la desigualdad entre , y después invertimos cada término (lo que cambia el sentido de las desigualdades), obtenemos
Para una muestra aleatoria de tamaño n, tomada de una población normal, se calcula la varianza muestral y se obtiene el siguiente intervalo de confianza del para .
EJEMPLO: Las puntuaciones en una muestra aleatoria de 10 personas a un test psicométrico fueron respectivamente: 25, 24, 22, 20, 25, 18, 17, 24, 16, 21. Hallar la estimación puntual de la varianza
.)− . ̅ 596−∗ . (∑ − = −
ESTADÍSTICA Y PROBABILIDADES
12
UNIVERSIDAD NACIONAL DE TRUJILLO
Estimación intervállica para la varianza
Si tenemos una población X
N
( , ) con
n 1 s
2
desconocida, entonces
2
n 1
2
2
n 1
El intervalo de confianza para la varianza poblacional al nivel de confianza podemos obtener como sigue:
1 lo
2 (n 1)s 21 2 1 P 1 1 2 n
n
n
1
2
Despejando
2
2
tenemos:
2 (n 1) s 2 (n 1) sn1 2 n1 1 P 2 2 n1 n1 1 2 2
Es decir,
2
2 2 ( 1 ) ( 1 ) n s n s 1 1 2 , 2 1 1 n
n
1
n
n
2
2
Ejemplo: De acuerdo con las tablas de altura, los varones tienen una altura superior a las mujeres en la población española. Según las últimas tablas en el servicio militar, los varones entre 18 y 20 años presentan una varianza de 0'0529. de las mujeres no tenemos información, por ello tomamos una muestra de 101 mujeres entre 18 y 20 años y obtenemos
s
n 1
0'18 ¿Entre qué valores se encontrará la verdadera varianza a un
nivel de 0'95 de confianza? 1 0'95 1
0'975
2
2 100 0 ' 02 5
74'22
Sustituyendo en el intervalo tendremos:
100 0'182 100 0'182 129'56 , 74'22 0'025,0'0436
ESTADÍSTICA Y PROBABILIDADES
13
UNIVERSIDAD NACIONAL DE TRUJILLO
ESTADÍSTICA Y PROBABILIDADES
14