TEORÍA DE LA ESTIMACIÓN ESTADÍSTICA
Estimación estadística Estimación estadística es el conjunto de técnicas que permiten dar un valor aproximado de un parámetro de una población a partir de los datos proporcionados por una muestra. Por ejemplo, una estimación de la media de una determinada característica de una población de tamaño N podría ser la media de esa misma característica para una muestra de tamaño n. Estimación puntual Es aque aquell lla a esti estima maci ción ón que que se real realiz iza a medi median ante te un solo solo valo valorr de los los parámetros de una distribución. a estimación puntual consiste en utilizar el valor de un estadístico para in!erir el parámetro de una población. usamos la media muestral " para estimar la media de una población usamo usamos s la propo proporci rción ón de una muest muestra ra #p para para estima estimarr la propo proporc rción ión poblacional p
Propiedades de los buenos estimadores puntuales $ntes de utilizar utilizar un estadístico estadístico muestral muestral como estimador estimador puntual, puntual, se veri!ica veri!ica si el estimador puntual tiene ciertas propiedades que corresponden a un buen estimador puntual. Entre estas propiedades tenemos las si%uientes& Insesgadez: 'i el valo valorr esta estadí díst stic ico o mues muestr tral al es i%ua i%uall al pará paráme metr tro o poblacional que se estudia, se dice que el estudio muestral es un estimador inses%ado del parámetro poblacional. Por lo tanto, el valor esperado, o media, de todos los posibles valores de un estadístico muestral inses%ado es i%ual al parámetro poblacional que se estudia. 4
Eficiencia: 'e dice que el estimador puntual con menor error estándar tiene ma(or e!iciencia relativa que los otros. )uando se muestrean poblaciones normales, el error estándar de la media muestral es menor que el error estándar de la mediana muestral. Por lo tanto, la media muestral es más e!iciente que la mediana muestral. Consistencia: un estimador puntual es consistente si el valor del estimador puntual tiende a estar más cerca del parámetro poblacional a medida que el tamaño de la muestra aumenta. En otra palabras, una muestra %rande tiende a proporcionar mejor estimación puntual que una pequeña. Estimación por intervalos )onsiste en la obtención de un intervalo dentro del cual estará el valor del parámetro estimado con una cierta probabilidad. El intervalo se constru(e a partir de una muestra, entonces, para cada muestra se tendrá un intervalo distinto. lamaremos a al error que se permite al dar el intervalo ( el nivel de con!ianza será *+. n intervalo tiene un nivel de con!ianza *+ cuando el *--/*+01 de los intervalos que se constru(en para el parámetro lo contienen. Intervalos de confianza para la estimación de la media 2e una población de media
μ
desviación típica
σ
se pueden tomar
muestras de n elementos. )ada una de estas muestras tiene a su vez una media
( x´ ) . 'e puede demostrar que la media de todas las medias muestrales coincide con la media poblacional
μ x´ = μ
Pero además, si el tamaño de las muestras es lo su!icientemente %rande, la distribución de medias muestrales es, prácticamente, una distribución normal /o
5
%aussiana0 con media 3 ( una desviación típica dada por la si%uiente expresión& σ x´ =
σ
√ n En una distribución 4 5 N /-, *0 puede calcularse !ácilmente un intervalo
dentro del cual cai%an un determinado porcentaje de las observaciones, esto es, z 1 y z2
es sencillo 6allar
tales que P7z* 8 z 8 z9: ; * + <, donde /* + <0*-- es el
porcentaje deseado /véase el uso de las tablas en una distribución normal0. 'e desea obtener una expresión tal que
[
P μ 1 ≤ μ ≤ μ2
] =1 −
∝
.
En esta distribución normal de medias se puede calcular el intervalo de con!ianza donde se encontrará la media poblacional si sólo se conoce una media
( x´ ) , con una con!ianza determinada. =abitualmente se manejan
muestral
valores de con!ianza del >? ( del >> por ciento. $ este valor se le llamará α
/debido a que
−
1
∝
es el error que se cometerá, un término opuesto0.
Intervalos de confianza para la estimación de la proporción )uando interesa construir un intervalo de con!ianza para una proporción o un porcentaje poblacional /por ejemplo, el porcentaje de personas con 6ipertensión, !umadoras, etc.0 'i el tamaño muestral n es %rande, el @eorema )entral del ímite nos ase%ura que&
(
ρ N p ,
p ( 1− p ) n
)
A bien& z =
p − p
√ p (1 − p)
√ n N ( 0,1)
6
2onde p es el porcentaje de personas con la característica de interés en la población /o sea, es el parámetro de interés0 ( p es su estimador muestral. ue%o, procediendo en !orma análo%a al caso de la media, podemos construir un intervalo de >?1 de con!ianza para la proporción poblacional p. En este caso, interesa construir un intervalo de con!ianza para una proporción o un porcentaje poblacional /por ejemplo, el porcentaje de personas con 6ipertensión, !umadoras, etc.0 p× ( 1− p ) /¿ n ≤ p ≤ p + 1.96 × √ p× ( 1 − p )/ n p−1.96 × √ ¿
Riesgo y tamaño de la muestra en la estimación de la media y la proporción
$ la 6ora de determinar el tamaño que debe alcanzar una muestra 6a( que tomar en cuenta varios !actores& el tipo de muestreo, el parámetro a estimar, el error muestral admisible, la varianza poblacional ( el nivel de con!ianza. Por ello antes de presentar al%unos casos sencillos de cálculo del tamaño muestral delimitemos estos !actores. Parámetro& 'on las medidas o datos que se obtienen sobre la población. Error Buestral& Es la di!erencia entre un estadístico ( su parámetro correspondiente. Es una medida de la variabilidad de las estimaciones de muestras repetidas en torno al valor de la población, nos da una noción clara de 6asta dónde ( con qué probabilidad una estimación basada en una muestra se aleja del valor que se 6ubiera obtenido por medio de un censo completo. 'iempre se comete un error, pero la naturaleza de la investi%ación nos indicará 6asta qué medida podemos cometerlo /los resultados se someten a error muestral e intervalos de con!ianza que varían muestra a muestra0. Caría se%Dn se calcule al principio o al !inal. n estadístico será más preciso en cuanto ( tanto su error es más pequeño. Podríamos decir que es la desviación de la distribución muestral de un estadístico ( su !iabilidad.
7
Nivel de )on!ianza& Probabilidad de que la estimación e!ectuada se ajuste a la realidad. )ualquier in!ormación que queremos reco%er está distribuida se%Dn una le( de probabilidad /auss o 'tudent0, así llamamos nivel de con!ianza a la probabilidad de que el intervalo construido en torno a un estadístico capte el verdadero valor del parámetro. Carianza Poblacional& )uando una población es más 6omo%énea la varianza es menor ( el nDmero de entrevistas necesarias para construir un modelo reducido del universo, o de la población, será más pequeño. eneralmente es un valor desconocido ( 6a( que estimarlo a partir de datos de estudios previos. Para ello es necesario partir de dos supuestos& en primer lu%ar el nivel de con!ianza al que queremos trabajarF en se%undo lu%ar, cual es el error máximo que estamos dispuestos a admitir en nuestra estimación. $sí pues los pasos a se%uir son& Abtener el tamaño muestral ima%inando que& 2onde& z α / 2
& z correspondiente al nivel de con!ianza ele%ido
p & varianza poblacional e& error máximo 9.+ )omprobar si se cumple 'i esta condición se cumple el proceso termina aquí, ( ese es el tamaño adecuado que debemos muestrear. 'i no se cumple, pasamos a una tercera !ase& Para calcular el tamaño de muestra para la estimación de proporciones poblacionales 6emos de tener en cuenta los mismos !actores que en el caso de la media. a !órmula que nos permitirá determinar el tamaño muestral es la si%uiente& 2onde& & z correspondiente al nivel de con!ianza ele%ido P& proporción de una cate%oría de la variable e& error máximo N& tamaño de la población Intervalo de confianza para la varianza de una población normal 8
'i
'#9
es la varianza muestral de una muestra aleatoria de n
observaciones tomadas de una distribución normal con varianza desconocida 2
#9, entonces un intervalo de con!ianza del /*+ < 0*--1 para
σ
es,
2
≤ σ
/n+*0. '#9 x#9.n+*,
2onde& x#9.n+*,
α
α
/n+*0. '#9
G9
G9 ( x#9.n+*,*
e in!erior que corresponden al porcentaje
x#9.n+*,*
α
G9
α
G9 son los puntos críticos superior
α
G9 de la distribución )6i+)uadrado
con v ; n+* %rados de libertad, respectivamente. Error n error en estadística es la di!erencia entre el valor de un estimador ( el del parámetro correspondiente. Existen varias causas para producir estos errores. 'e%Dn la causa son clasi!icados en errores de muestreo ( de no muestreo. os errores de muestreo& 'on resultado de la elección casual de unidades de muestreo. Este tipo de error ocurre porque solo se observa una parte de la población. os errores de no muestreo& Puede ocurrir en cualquier encuesta, sea un censo o una muestra.
9