Intervalo de confianza
Las líneas verticales representan 50 construcciones diferentes de intervalos de confianza para la estimación del valor μ. En estadística estadística,, se llama intervalo de confianza a un par de números entre los cuales se estima que estará cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos números determinan un intervalo intervalo,, que se calcula a partir de datos de una muestra muestra,, y el valor desconocido es un parámetro poblacional. poblacional. La probabilidad de éxito en la estimación se representa con 1 - α y se denomina nivel de confianza. confianza. En estas circunstancias, α es el llamado error aleatorio o nivel de significación, significación, esto es, una medida de las posibilidades de fallar en la estimación mediante tal intervalo. intervalo .
1
El nivel de confianza y la amplitud del intervalo varían conjuntamente, de forma que un intervalo más amplio tendrá más posibilidades de acierto (mayor nivel de confianza), mientras que para un intervalo más pequeño, que ofrece una estimación más precisa, aumentan sus posibilidades de error. Para la construcción de un determinado intervalo de confianza es necesario conocer la distribución teórica que sigue el parámetro a estimar, θ . Es habitual que el parámetro presente una distribución normal. normal. También pueden construirse intervalos de confianza con la desigualdad de Chebyshev. Chebyshev . En definitiva, un intervalo de confianza al 1 - α por ciento para la estimación de un parámetro poblacional θ que sigue una determinada distribución de probabilidad, probabilidad, es una expresión del tipo [θ 1, θ 2] tal que P[ θ 1 ≤ θ ≤ θ 2] = 1 - α, donde P es la función de distribución de probabilidad de θ . Intervalo de confianza para la media de una población De una población de media tomar muestras de
y desviación típica
se pueden
elementos. elementos. Cada una de estas muestras muestras tiene a su vez una media ( ). Se
puede demostrar que la media de todas las medias muestrales coincide con la media poblacional: poblacional:
2
3
Pero además, si el tamaño de las muestras es lo suficientemente grande, grande , la distribución de medias muestrales es, prácticamente, una distribución normal (o gaussiana gaussiana)) con media μ y una
desviación típica dada por la siguiente expresión:
sigue:
. Esto se representa como
. Si estandarizamos, se sigue que:
En una distribución Z ~ N(0, 1) puede calcularse fácilmente un intervalo dentro del cual caigan un determinado porcentaje de las observaciones, esto es, es sencillo hallar z1 y z2 tales que P[z1 ≤ z ≤ z2] = 1 - α, donde (1 - α)·100 es el porcentaje deseado (véase el uso de las tablas en una distribución normal ). Se desea obtener una expresión tal que En esta distribución normal de medias se puede calcular el intervalo de confianza donde se encontrará la media poblacional si sólo se conoce una media muestral ( ), con una confianza determinada. Habitualmente se manejan valores de confianza del 95 y del 99 por ciento. A este valor se le llamará
(debido a que
es el error que se cometerá, un término
opuesto). Para ello se necesita calcular el punto estandarizada
—o, mejor dicho, su versión
o valor crítico— junto con su "opuesto en la distribución"
. Estos
puntos delimitan la probabilidad para el intervalo, como se muestra en la siguiente imagen:
Dicho punto es el número tal que:
Y en la versión estandarizada se cumple que:
Así:
Haciendo operaciones es posible despejar
para obtener el intervalo:
De lo cual se obtendrá el intervalo de confianza:
Obsérvese que el intervalo de confianza viene dado por la media muestral
del valor crítico Si no se conoce
por el error estándar
± el producto
. 4
y n es grande (habitualmente se toma n ≥ 30):
, donde s es la desviación típica de una muestra. Aproximaciones para el valor para
para los niveles de confianza estándar son 1,96
y 2,576 para
5
.
[editar]Intervalo de confianza para una proporción El intervalo de confianza para estimar una proporción p, conocida una proporción muestral pn de una muestra de tamaño n, a un nivel de confianza del (1-α)·100% es:
I- Concepto de Intervalo
•Estudios de
de Confianza.
cohortes •Estudios de
En el contexto de estimar un parámetro poblacional, un intervalo de confianza es un rango de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parámetro, con una probabilidad determinada.
cohortes II •Casos y controles •Casos y controles II •Casos y controles III •Intervalos
de confianza
La probabilidad de que el •Variables confundente verdadero valor del parámetro se encuentre
s
en el intervalo construido •Análisis estratificado se denomina nivel de confianza, y se denota 1. La probabilidad de equivocarnos se
OTROS TEMAS
llama nivel de
•Introductor
significancia y se
ios
simboliza
•Instrument
.
Generalmente se
ales
construyen intervalos con introductori confianza 1-
=95% (o
os
significancia
=5%).
•Paradigmas
Menos frecuentes son los epidemiológi intervalos con o
=10%
cos •Indicadores
=1%.
de riesgo EPI Para construir un intervalo de confianza, se puede comprobar que la distribución Normal Estándar cumple 1: P(-1.96 < z < 1.96) = 0.95
•Investigació n y EPI •Epidemiolo gía descriptiva •Epidemiolo
gía analítica (lo anterior se puede
•Estudios
comprobar con una tabla experimenta de probabilidades o un programa computacional que calcule probabilidades normales). Luego, si una variable X tiene distribución N( , ), entonces el 95% de las veces se cumple:
Despejando
en la
ecuación se tiene:
El resultado es un intervalo que incluye al
el 95% de las veces.
Es decir, es un intervalo de confianza al 95% para
les
la media
cuando la
variable X es normal y es conocido. II- Intervalo de confianza para un promedio: Generalmente, cuando se quiere construir un intervalo de confianza para la media poblacional poblacional
, la varianza es
desconocida, por lo que el intervalo para
construido al final
de II es muy poco práctico. Si en el intervalo se reemplaza la desviación estándar poblacional por la desviación estándar muestral s, el intervalo de confianza toma la forma:
La cual es una buena aproximación para el intervalo de confianza de 95% para
con
desconocido. Esta aproximación es mejor en la medida que el tamaño muestral sea grande. Cuando el tamaño muestral es pequeño, el intervalo de confianza requiere utilizar la distribución t de Student (con n-1 grados de libertad, siendo n el tamaño de la muestra), en vez de la distribución
normal (por ejemplo, para un intervalo de 95% de confianza, los límites del intervalo ya no serán construidos usando el valor 1,96).
Ejemplo: Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de depresión (mayor puntaje significa mayor depresión). 2 5 6 8 8 9 9 1011 111113131414141414 141515161616161616 161617171718181819 191919191919192020
Para construir un intervalo de confianza para el puntaje promedio poblacional, asumamos que los datos tienen distribución normal, con varianza poblacional desconocida. Como es desconocido, lo estimamos por s =18,7. Luego, un intervalo de confianza aproximado es:
Luego, el intervalo de confianza para
es
(13,2 , 15,8). Es decir, el puntaje promedio poblacional se encuentra entre 13,2 y 15,8 con una confianza 95%. III. Intervalo de Confianza para una Proporción. En este caso, interesa construir un intervalo de confianza para una proporción o un porcentaje poblacional (por ejemplo, el porcentaje de personas con hipertensión, fumadoras, etc.) Si el tamaño muestral n es grande, el Teorema Central del Límite nos asegura que:
O bien:
Donde p es el porcentaje de personas co n la característica de interés en la población (o sea, es el parámetro de interés) y p es su estimador muestral. Luego, procediendo en forma análoga al caso de la media, podemos construir un intervalo de 95% de confianza para la proporción poblacional p.
Ejemplo: En un estudio de prevalencia de factores de riesgo en una cohorte de 412 mujeres mayores de 15 años en la Región Metropolitana, se encontró que el 17.6% eran hipertensas. Un intervalo de 95% de confianza para la proporción de mujeres hipertensas en la Región Metropolitana está dado por:
Luego, la proporción de hipertensas varía entre (0,139 , 0,212) con una confianza de 95%. IV. Uso de Intervalos de Confianza para verificar Hipótesis. Los intervalos de confianza permiten verificar hipótesis planteadas respecto a parámetros poblacionales. Por ejemplo, supongamos que se plantea la hipótesis de que el promedio de peso de nacimiento de cierta población es igual a la media nacional de 3250 gramos. Al tomar una muestra de 30 recién nacidos de la población en estudio, se obtuvo: = 2930 s= 450 n= 30 Al construir un intervalo de 95% de confianza para la media poblacional, se obtiene:
Luego, el peso de nacimiento varía entre 2769 y 3091 gramos, con una confianza de 95%. Como el intervalo no incluye el valor
=3250
gramos planteado en la hipótesis, entonces esta es rechazada con confianza 95% (o un valor p menor a 0,5).