DISTRIBUCIÓN F La estadística F se define como la razón de dos variables aleatorias chi cuadrada independiente s, dividida cada una entre su número de grados de libertad. Lo que da paso a la siguiente definición:
= ⁄⁄
Donde y son variables aleatorias independiente que tienen distribuciones ji cuadradas con y grados de libertad, respectivamente.
Sean U y V dos variables aleatorias independientes que tienen distribuciones ji cuadradas con y grados de libertad, respectivamente. Entonces la distribución de la variable
= ⁄⁄ 2 ⁄ ∗ ⁄− ; 0<<∞ +⁄ ℎ = 22 (1 (1 ) { 0.
aleatoria
esta dada por:
La que se conoce como distribución F con
y
grados de libertad.
La distribución F tiene gran aplicación en la comparación de varianzas muestrales, es una distribución de probabilidad continua y las aplicaciones de esta distribución se encuentran en problemas que involucran dos o más muestras.
== == Media
La media existe si
es mayor o igua que 3:
Varianza
La varianza existe si
es mayor o igual que 5:
∝, ∝
Teorema 1 Al escribir
para
con
grados de libertad obtenemos:
−, = ∝, Teorema 2
⁄ = ⁄ =
Si y son varianzas de muestras aleatorias independientes de tamaño tomadas de poblaciones con varianzas y , respectivamente, entonces:
Tiene una distribución F con
= 1 = 1 y
grados de libertad.
El jefe de un laboratorio se encuentra con una técnica de medición fuera del control estadístico. Para investigar las causas decide investigar si el factor humano tiene incidencia, y toma una muestra de suero cualquiera y la divide en 20 alícuotas. Luego elige 10 de ellas al azar y se las entrega al laboratorista 1 para que haga las determinaciones; las restantes las encomienda al laboratorista 2 para que las mida. Los resultados obtenidos son: es la varianza obtenida por el laborista, 1 y para el otro. Decidir si hay diferencia en dispersión entre ambos
=, ≠ =
1 = = 2,0,48 =3
=,
Como se trata de un ensayo de dos colas, para un nivel del 95% de confianza, se busca en las tablas para: Grados de libertad:
= =1=101=9
==0,0,092575 0,975;9,9= 4,03 Limite inferior: Límite superior
Para calcular el valor no t abulado α = 0,025 se aprovecha una propiedad que tiene la función F usando la inversa:
,; , = , = , = ,
;
Como el valor hallado F=3 cae dentro de la zona de aceptación, no hay evidencia significativa como para decir que el factor humano tiene incidencia en la dispersión de las mediciones.
Ejercicios: Las tablas nos dan, para v1 = 10 y v2 = 6, el percentil 90 =2,94; el percentil 95 = 4,06. Calcular los valores de la distribución F de 6 y 10 grados de libertad que dejan a su izquierda una masa de probabilidad de 0.1 y 0.05 respectivamente. SOLUCION:
Una compañía fabrica propulsores para uso en motores de turbina. Al ingeniero de manufactura le gustaría seleccionar el proceso que tenga la menor variabilidad en la rugosidad de la superficie. Para ello toma una muestra de partes del primer proceso, la cual tiene una desviación estándar micropulgadas, y una muestra aleatoria de partes del segundo
,
=
==
=,
proceso, la cual tiene una desviación estándar micropulgadas. Se desea encontrar un intervalo de confianza del 90% para el cociente de las dos varianzas . Suponga que los dos procesos son independientes y que la rugosidad de la superficie está distribuida de manera normal.
⁄
Calculo de los grados de libertad:
= 1=121=11 = 1=161=15 = = 0,3685,14,7 =, = = 2,514, 7 5,1 =,
No es posible afirmar que las desviaciones estándar de la rugosidad de la superficie de los dos procesos sean diferentes con un nivel de confianza del 9.
PRUEBA DE KOLMOGOROV-SMIRNOV La prueba de bondad de ajuste de Kolmogorov-Smirnov es una alternativa para probar que una muestra “proviene” de una distribución continua (normal). Esta ´rueba se basa en la función distribución acumulada de una distribución teórica con la función distribución acumulada de la muestra . Son pruebas no paramétricas para diferencias entre dos distribuciones totales o acumulativas. La prueba uni-muestral se refiere a la concordancia entre una distribución acumulativa observada de valores de una muestra y una función de distri bución continua especificada, es decir se trata de una prueba de bondad de ajuste. La prueba bi-muestral se refiere a la concordancia entre dos distribuciones acumulativas observadas; se contrasta la hipótesis de si dos muestras independientes provienen de distribuciones continuas idénticas, y es sensible a las diferencias de población en lo que se refiere a la localización, dispersión o disimetría.
::== ∈ ,,…, =||
Los pasos a seguir en la prueba de bondad de ajuste de K-S son los siguientes: a) Plantear hipótesis: para todo por lo menos pera un X. b) Calcular todos los valores de la muestra c) Determinar la desviación máxima, que está dada por el supremo de los valores absolutos de las diferencias entre los valores de la función acumulada teórica y de la muestra: d) Escoger un nivel de significación α (5%, 1% o semejante) e) No rechazar si el valor calculado D es menor o igual que el valor de la tabla a utilizar y se rechaza si el valor calculado de D es mayor que el de la tabla. Las suposiciones en la prueba de bondad de ajuste de K-S son: 1) Muestras aleatorias. 2) La población debe ser continua en la variable observada. 3) La prueba no es válida si se tiene que estimar uno o más parámetros usando los datos de la muestra.
Ejercicio Las puntuaciones obtenidas por una muestra de sujetos en una prueba de habilidad han sido las siguientes: 48,1; 47,8; 45.1; 46,3; 45,4; 47,2; 46,6; y 46. Sabiendo que la media en dicha prueba es 40 y su desviación típica es 3, ¿podemos afirmar que la distribución de las puntuaciones sigue una normal, con un α = 0,01? Solución: 1. Hipótesis: H0: F (X) = Fs (X) de una N(µ, σ) H1: F (X) ≠ Fs (X) de una N(µ, σ)
2. Muestra: 8 observaciones indep. 3. Tipificamos las puntuaciones para poder trabajar con una N (0,1).