Distribución t de Student La distribución t (de Student) Student) es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño. Aparece de manera natural al realizar la prueba t de Student para la dete determ rmin inac ació ión n de las las dife difere renc ncias ias entr entre e dos dos medi medias as mués muéstr tral ales es y para para la construcción del intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando se desconoce la desviación típica de una población y ésta debe ser estimada a partir de los datos de una muestra.
Caracterización La distribución t de Student es la distribución de probabilidad del cociente
Donde • • •
Z tiene Z tiene una distribución normal de media nula y varianza 1 V tiene V tiene una distribución ji-cuadrado con grados de libertad Z y Z y V son V son independientes
Si μ Si μ es es una constante no nula, el cociente es una variable aleatoria que sigue la distribución t de Student no no central con parámetro parámetro de no-centralidad .
Intervalos de confianza derivados de la distribución t de Student El procedimiento para el cálculo del intervalo de confianza basado en la t de Student consiste en estimar la desviación típica de los datos S y calcular el error estándar de la media para la media =
, siendo entonces el intervalo de confianza .
Es este resultado el que se utiliza en el test de Student: puesto que la diferencia de las medias de muestras de dos distribuciones normales se distribuye también normalmente, la distribución t puede usarse para examinar si esa diferencia puede razonablemente suponerse igual a cero. Para efectos prácticos el valor esperado y la varianza son: E(t(n))= 0 y Var (t(n-1)) = n/(n-2) para n > 3
Distribución t de Student No Estandarizada La distribución t puede generalizarse a 3 parámetros, introduciendo un parámetro ocasional y otro de escala . El resultado es una distribución t de Student No Estandarizada cuya densidad está definida por:2
Equivalentemente, puede escribirse en términos de varianza en vez de a la desviación estándar):
(correspondiente a la
Otras propiedades de esta versión de la distribución t son:2
Prueba t de Student En estadística, una prueba t de Student, prueba t-Student, o Test-T es cualquier prueba en la que el estadístico utilizado tiene una distribución t de Student si la hipótesis nula es cierta. Se aplica cuando la población estudiada sigue una distribución normal pero el tamaño muestral es demasiado pequeño como para que el estadístico en el que está basada la inferencia esté normalmente distribuido, utilizándose una estimación de la desviación típica en lugar del valor real.
Usos Entre los usos mas frecuentes de las pruebas t se encuentran: •
•
El test de locación de muestra única por el cual se comprueba si la media de una población distribuida normalmente tiene un valor especificado en una hipótesis nula. El test de locación para dos muestras, por el cual se comprueba si las medias de dos poblaciones distribuidas en forma normal son iguales. Todos estos test son usualmente llamados test t de Student , a pesar de que estrictamente hablando, tal nombre sólo debería ser utilizado si las varianzas de las dos poblaciones estudiadas pueden ser asumidas como iguales; la forma de los ensayos que se utilizan cuando esta asunción se deja de lado suelen ser llamados a veces como Prueba t de Welch. Estas pruebas suelen ser comúnmente nombradas como pruebas t desapareadas o de muestras independientes, debido a que tienen su aplicación mas típica cuando las unidades estadísticas que definen a ambas muestras que están siendo comparadas no se superponen.
•
•
El test de hipótesis nula por el cual se demuestra que la diferencia entre dos respuestas medidas en las mismas unidades estadísticas es cero. Por ejemplo, supóngase que se mide el tamaño del tumor de un paciente con cáncer. Si el tratamiento resulta efectivo, lo esperable seria que el tumor de muchos pacientes disminuyera de tamaño luego de seguir el tratamiento. Esto con frecuencia es referido como prueba t de mediciones apareadas o repetidas. El test para comprobar si la pendiente de una regresión lineal difiere estadísticamente de cero.
Pruebas t para dos muestras apareadas y desapareadas Las pruebas-t de dos muestras para probar la diferencia en las medias pueden ser desapareadas o en parejas. Las pruebas t pareadas son una forma de bloqueo estadístico, y poseen un mayor poder estadístico que las pruebas no apareadas cuando las unidades apareadas son similares con respecto a los "factores de ruido" que son independientes de la pertenencia a los dos grupos que se comparan. En un contexto diferente, las pruebas-t apareadas pueden utilizarse para reducir los efectos de los factores de confusión en un estudio observacional.
Desapareada Las pruebas t desapareadas o de muestras independientes, se utilizan cuando se obtienen dos grupos de muestras aleatorias, independientes e idénticamente distribuidas a partir de las dos poblaciones a ser comparadas. Por ejemplo, supóngase que estamos evaluando el efecto de un tratamiento médico, y reclutamos a 100 sujetos para el estudio. Luego elegimos aleatoriamente 50 sujetos para el grupo en tratamiento y 50 sujetos para el grupo de control. En este caso, obtenemos dos muestras independientes y podríamos utilizar la forma desapareada de la prueba t . La elección aleatoria no es esencial en este caso, si contactamos a 100 personas por teléfono y obtenemos la edad y género de cada una, y luego se utiliza una prueba t bimuestral para ver en que
forma la media de edades difiere por género, esto también sería una prueba t de muestras independientes, a pesar de que los datos son observacionales.
Apareada Las pruebas t de muestras dependientes o apareadas, consisten típicamente en una muestra de pares de valores con similares unidades estadísticas, o un grupo de unidades que han sido evaluadas en dos ocasiones diferentes (una prueba t de mediciones repetitivas). Un ejemplo típico de prueba t para mediciones repetitivas sería por ejemplo que los sujetos sean evaluados antes y después de un tratamiento.
Una prueba 't basada en la coincidencia de pares muestrales se obtiene de una muestra desapareada que luego es utilizada para formar una muestra apareada, utilizando para ello variables adicionales que fueron medidas conjuntamente con la variable de interés. La valoración de la coincidencia se lleva a cabo mediante la identificación de pares de valores que consisten en una observación de cada una de las dos muestras, donde las observaciones del par son similares en términos de otras variables medidas. Este enfoque se utiliza a menudo en los estudios observacionales para reducir o eliminar los efectos de los factores de confusión.
Cálculos Las expresiones explícitas que pueden ser utilizadas para obtener varias pruebas t se dan a continuación. En cada caso, se muestra la fórmula para una prueba estadística que o bien siga exactamente o aproxime a una distribución t de Student bajo la hipótesis nula. Además, se dan los apropiados grados de libertad en cada caso. Cada una de estas estadísticas se pueden utilizar para llevar a cabo ya sea un prueba de una cola o prueba de dos colas.
Una vez que se ha determinado un valor t , es posible encontrar un valor P asociado utilizando para ello una tabla de valores de distribución t de Student. Si el valor P calculado es menor al límite elegido por significancia estadística (usualmente a niveles de significancia 0,10; 0,05 o 0,01), entonces la hipótesis nula se rechaza en favor de la hipótesis alternativa.
Prueba t para muestra única En esta prueba se evalúa la hipótesis nula de que la media de la población estudiada es igual a un valor especificado μ 0, se hace uso del estadístico:
donde es la media muestral, s es la desviación estándar muestral y n es el tamaño de la muestra. Los grados de libertad utilizados en esta prueba se corresponden al valor n − 1.
Pendiente de una regresión lineal Supóngase que se está ajustando el modelo:
donde x i, i = 1, ..., n son conocidos, α y β son desconocidos, y ε i es el error aleatorio en los residuales que se encuentra normalmente distribuido, con un valor esperado 0 y una varianza desconocida σ 2, e Y i , i = 1, ..., n son las observaciones. Se desea probar la hipótesis nula de que la pendiente β es igual a algún valor especificado β0 (a menudo toma el valor 0, en cuyo caso la hipótesis es que x e y no están relacionados). sea
Luego
tiene una distribución t con n − 2 grados de libertad si la hipótesis nula es verdadera. El error estándar de la pendiente:
puede ser reescrito en términos de los residuales:
Luego
se encuentra dado por:
Prueba t para dos muestras independientes Iguales tamaños muéstrales, iguales varianzas Esta prueba se utiliza solamente cuando: •
•
los dos tamaños muéstrales (esto es, el número, n, de participantes en cada grupo) son iguales; se puede asumir que las dos distribuciones poseen la misma varianza.
Las violaciones a estos presupuestos se discuten mas abajo. El estadístico t a probar si las medias son diferentes se puede calcular como sigue:
Donde
Aquí es la desviación estándar combinada, 1 = grupo uno, 2 = grupo 2. El denominador de t es el error estándar de la diferencia entre las dos medias. Por prueba de significancia, los grados de libertad de esta prueba se obtienen como 2n − 2 donde n es el número de participantes en cada grupo.
Diferentes tamaños muéstrales, iguales varianzas Esta prueba se puede utilizar únicamente si se puede asumir que las dos distribuciones poseen la misma varianza. (Cuando este presupuesto se viola, mirar mas abajo). El estadístico t si las medias son diferentes puede ser calculado como sigue:
Donde
Nótese que las fórmulas de arriba, son generalizaciones del caso que se da cuando ambas muestras poseen igual tamaño (sustituyendo n por n1 y n2). es un estimador de la desviación estándar común de ambas muestras: esto se define así para que su cuadrado sea un estimador sin sesgo de la varianza comun sea o no la media iguales. En esta fórmula, n = número de participantes, 1 = grupo uno, 2 = grupo dos. n − 1 es el número de grados de libertad para cada grupo, y el tamaño muestral total menos dos (esto es, n1 + n2 − 2) es el número de grados de libertad utilizados para la prueba de significancia.
Diferentes tamaños muéstrales, diferentes varianzas Esta prueba es también conocida como prueba t de Welch y es utilizada únicamente cuando se puede asumir que las dos varianzas poblacionales son diferentes (los tamaños muestrales pueden o no ser iguales) y por lo tanto deben ser estimadas por separado. El estadístico t a probar cuando las medias poblacionales son distintas puede ser calculado como sigue:
donde
Aquí s2 es el estimador sin sesgo de la varianza de las dos muestras, n = número de participantes, 1 = grupo uno, 2 = grupo dos. Nótese que en este caso, no es la varianza combinada. Para su utilización en pruebas de significancia, la distribución de este estadístico es aproximadamente igual a una distribución t ordinaria con los grados de libertad calculados según:
Esta ecuación es llamada la ecuación Welch–Satterthwaite. Nótese que la verdadera distribución de este estadístico de hecho depende (ligeramente) de dos varianzas desconocidas.
Prueba t dependiente para muestras apareadas Esta prueba se utiliza cuando las muestras son dependientes; esto es, cuando se trata de una única muestra que ha sido evaluada dos veces (muestras repetidas) o cuando las dos muestras han sido emparejadas o apareadas. Este es un ejemplo de un test de diferencia apareada.
Para esta ecuación, la diferencia entre todos los pares tiene que ser calculada. Los pares se han formado ya sea con resultados de una persona antes y después de la evaluación o entre pares de personas emparejadas en grupos de significancia (por ejemplo, tomados de la misma familia o grupo de edad: véase la tabla). La media ( X D) y la desviación estándar (sD) de tales diferencias se han utilizado en la ecuación. La constante μ 0 es diferente de cero si se desea probar si la media de las diferencias es significativamente diferente de μ 0. Los grados de libertad utilizados son n − 1. Ejemplo de pares emparejados Par
Nombre
Edad
Test
1
Juan
35
250
1
Joana
36
340
2
Jaimito
22
460
2
Jesica
21
200
Ejemplo de muestras repetidas Número Nombre
Test Test 1 2
1
Miguel
35% 67%
2
Melanie
50% 46%
3
Melisa
90% 86%
4
Michell
78% 91%
Varianzas desiguales Si se decide continuar con el enfoque para varianzas desiguales (discutido anteriormente), los resultados son
y
El resultado de la prueba estadística es aproximadamente 1,959. El valor P para la prueba de dos colas da un valor aproximado de 0,091 y el valor P para la prueba de una cola es aproximadamente 0,045.
Varianzas iguales Si se sigue el enfoque para varianzas iguales (discutido anteriormente), los resultados son
y
Ya que el tamaño de las muestras es igual (ambas tienen 6 elementos), el resultado de la prueba estadística es nuevamente un valor que se aproxima a 1.959. Debido a que los grados de libertad son diferentes de la prueba para varianzas desiguales, los valores P difieren ligeramente de los obtenidos un poco mas arriba. Aquí el valor P para la prueba de dos colas es aproximadamente 0,078, y el valor P para una cola es aproximadamente 0,039. Así, si hubiera una buena razón para creer que las varianzas poblacionales son iguales, los resultados serían algo más sugerentes de una diferencia en los pesos medios de las dos poblaciones de tornillos.
Pruebas multivariadas Una generalización del estadístico t de Student llamada estadístico t cuadrado de Hotelling, permite la comprobación de hipótesis en múltiples (y a menudo correlacionadas) mediciones de la misma muestra. Por ejemplo, un investigador puede presentar un número de sujetos a un test de múltiples escalas de personalidad (p.ej el de cinco grandes razgos de personalidad). Debido a que las medidas de este tipo suelen estar muy correlacionadas, no es aconsejable llevar a cabo varias pruebas univariadas, ya que esto supondría descuidar la covarianza entre las medidas e inflar la probabilidad de rechazar falsamente al menos una hipótesis (error de tipo I). En este caso una única prueba múltiple es preferible para llevar a cabo las pruebas de hipótesis. El estadístico t de Hosteling sigue una distribución T 2, sin embargo en la práctica, esta distribución se utiliza muy raramente, y en cambio se suele convertir en una distribución de tipo F . Prueba T 2 monomuestral Para una prueba multivariable de unica muestra, la hipótesis es que el vector medio ( ) es igual a un vector ( ) dado. La prueba estadística se define como:
Donde n es el tamaño muestral, matriz de covarianza muestral
es el vector de columnas medio y .
una
Prueba T 2 bimuestral Para un test multivariable de dos muestras, la hipótesis es que los vectores medios ( , ) de las dos muestras son iguales. La prueba estadística se define como:
Grado de libertad Grados de libertad es un estimador del número de categorías independientes en una prueba particular o experimento estadístico. Se encuentran mediante la fórmula , donde =número de sujetos en la muestra (también pueden ser representados por , donde =número de grupos, cuando se realizan operaciones con grupos y no con sujetos individuales) y es el número de sujetos o grupos estadísticamente dependientes.
Cuando se trata de eliminar los estadisticos con un conjunto de datos, los residuos -expresados en forma de vector- se encuentran habitualmente en un espacio de menor dimensión que aquél en el que se encontraban los datos originales. Los grados de libertad del error los determina, precisamente, el valor de esta menor dimensión. Un ejemplo aclara el concepto. Supongamos que son variables aleatorias, cada una de ellas con media
, y que
es la "media muestral". Entonces las cantidades
son los residuos, que pueden ser considerados estimaciones de los errores . La suma de los residuos (a diferencia de la suma de los errores, que no es conocida) es necesariamente 0,
ya que existen variables con valores superiores e inferiores a la media muestral. Esto también significa que los residuos están restringidos a encontrarse en un espacio de dimensión (en este ejemplo, en el caso general a ) ya que, si se conoce el valor de de estos residuos, la determinación del valor del residuo restante es inmediata. Así, se dice que "el error tiene grados de libertad" (el error tiene grados de libertad para el caso general).
Pruebas de hipótesis para proporciones Las pruebas de proporciones son adecuadas cuando los datos que se están analizando constan de cuentas o frecuencias de elementos de dos o más clases. El objetivo de estas pruebas es evaluar las afirmaciones con respecto a una proporción (o Porcentaje) de población. Las pruebas se basan en la premisa de que una proporción muestral (es decir, x ocurrencias en n observaciones, o x/n) será igual a la proporción verdadera de la población si se toman márgenes o tolerancias para la variabilidad muestral. Las pruebas suelen enfocarse en la diferencia entre un número esperado de ocurrencias,
suponiendo que una afirmación es verdadera, y el número observado realmente. La diferencia se compara con la variabilidad prescrita mediante una distribución de muestreo que tiene como base el supuesto de que realmente verdadera.
es
En muchos aspectos, las pruebas de proporciones se parecen a las pruebas de medias, excepto que, en el caso de las primeras, los datos muestrales se consideran como cuentas en lugar de como mediciones. Por ejemplo, las pruebas para medias y proporciones se pueden utilizar para evaluar afirmaciones con respecto a: 1) Un parámetro de población único (prueba de una muestra) 2) La igualdad de parámetros de dos poblaciones (prueba de dos muestras), y 3) La igualdad de parámetros de más de dos poblaciones (prueba de k muestras). Además, para tamaños grandes de muestras, la distribución de muestreo adecuada para pruebas de proporciones de una y dos muestras es aproximadamente normal, justo como sucede en el caso de pruebas de medias de una y dos muestras.