2.2.1 DE UNI UNIFORMI FORMIDA DAD D (CHI CUADRADA, CUADRAD A, KOLMOGOROV KOLMOGOROV - SMIMOV) UNIFORMIDAD
Semejanza o igualdad que presentan las características de los distintos elementos de un conju co njunto. nto. PRUEBA DE CH I CUADRADA
La prueba chi-cuadrada también conocida como la prueba de Pearson o la prueba de frecuencias es una prueba de bondad de ajuste que establece si difiere o no la frecuencia observada de una distribución teórica. El inglés Karl Pearson desarrolló a principios del siglo XX esta prueba, prueba, y hasta la fecha fecha tiene muchas muchas aplicacio a plicacio nes en el campo estadí e stadístico. stico. La prueba prueba chi-cuadrada chi-cuadrada es una una de las las pruebas más útiles y ampliamente utilizadas utilizadas en la la estadística. estadística. La distribución Chi Chi -Cuadrada es en teoría teoría una una distribución matemática que se aplica ampliamente en el trabajo estadístico. El término Chicuadrada proviene p roviene del d el uso de la la letra griega grie ga χ el cual se pronuncia pronuncia ji o chi y es el que define a esta distribución. La hipótesis nula y alternativa son las siguientes:
Esta prueba es utilizada para determinar qué tan significativa es la diferencia entre las frecuencias observadas y esperadas de uno o más categorías (subintervalos). La diferencia entre las frecuencias esperadas y observadas, son consideradas como el error muestral. muestral. Las frecuencias frecuencias observadas obse rvadas son calculadas a partir pa rtir de un conteo de los números números que coinciden coinci den en un subi subinterv ntervalo alo determinado, determi nado, y las las frecuencias frecuencias esperadas están en función función a una una distribución de probabilidad probab ilidad teórica.
Procedimiento:
1. Generar la muestra de números aleatorios de tamaño N. 2. Subdividir Subdividi r el intervalo [0,1] en n subintervalos. subintervalos. 3. Para cada subintervalo subintervalo contar la frecuencia frecuencia observada obse rvada F0 y calcular la frecuencia esperada FE de núm números eros aleatorios, la cual se obtiene dividiendo di vidiendo N/n. N/n. 4. Calcular el estadístico de prueba.
5. Comparar el valor calculado X0 2 contra el valor tabulado de la distribución X 2 , con (n-1) grados de libertad y una significancia ?. Si X0 2 es menor que X 2 (n-1),? entonces no se puede rechazar la uniformidad de los números aleatorios. EJEMPLO 4. Realizar
la prueba de bondad de ajuste Ji-cuadrada a la siguiente muestra de tamaño 30 de números aleatorios uniformes 0.15
0.31
0.81
0.48
0.01
0.60
0.26
0.34
0.70
0.31
0.07
0.06
0.33
0.49
0.77
0.04
0.43
0.92
0.25
0.83
0.68
0.97
0.11
0.00
0.18
0.11
0.03
0.59
0.25
0.55
INTERVALO
FE
FO
(FE-FO) 2 /FE
0.00 - 0.20
6
10
2.67
0.21 - 0.40
6
7
0.17
0.41 - 0.60
6
6
0.00
0.61 - 0.80
6
3
1.50
0.81 - 1.00
6
4
0.67 X20=5.01
Sea alfa = 5%. Tenemos (5-1) grados de libertad, es decir V =4. El valor en tablas de la distribución Ji cuadrada es: X24.5% = 9.49 Como X0 2 es menor que X 2 4.5% es decir; 5.01 es menor que 9.49. Entonces no se puede rechazar la uniformidad de los números aleatorios.
Para una secuencia de 100 números, y 5 subintervalos tenemos que: N=100, n=5, la FEi = N/n = 100/5 = 20 para cualquier i. y la frecuencia observada es la cantidad de números que coinciden en cada subintervalo.
La hipótesis de que todas las frecuencias son iguales en cada subintervalo se basa en dividir el intervalo (0, 1) en n subintervalos para luego realizar las comparaciones encada subintervalo entre la frecuencia esperada contra la frecuencia observada. Si son parecidas entonces se dice que la muestra proviene de una distribución uniforme. El estadístico que se 02 utiliza es el cual hace uso de la letra griega ji (CHI), el cual es obtenido de la siguiente expresión:
Dónde: N
= Tamaño de la muestra, n=cantidad de subintervalos, FO i = frecuencia observada en el subintervalo i, FE i = frecuencia esperada en el subintervalo i. Una vez obtenido el estadístico de la muestra 02 se compara con el estadístico 2 teórico de la población ,−1 para rechazar o no la hipótesis que la secuencia de números proviene de una distribución uniforme.
Donde:
2 ,−1 , es el estadístico
teórico chi-cuadrada que proviene de la tabla Chi Cuadrada mostrada en el apéndice A, con un nivel de significancia α y n -1 grados de libertad.
Ejemplo Se desea realizar la prueba de chi-cuadrada a una secuencia de 100 números pseudoaleatorios (Tabla 2.3) Solución Paso 1.- Determinar N, y n. Se cuenta con 100 números por lo que N=100, y se determina arbitrariamente 5 subintervalos (n=5). Paso 2.- Se calcula la frecuencia esperada y observada. FE = 100/5 = 20, por lo que la FE 1= FE2= FE 3= FE4=FE5=20. Se contabiliza las frecuencias observadas en cada uno de los 5 subintervalos, y se obtiene:
Paso 3.- Calcular el estadístico muestral:
Paso 4.- Buscar el estadístico teórico de la tabla de chi-cuadrada en el apéndice A, tomando como alfa=5%=0.05 y 5-1 grados de libertad se obtiene:
Paso 5.- Comparar los estadísticos para decidir si se rechaza o no la hipótesis.
PRUEBA DE KOLMOGOROV-SMIRNOV
La prueba de Kolmogorov-Smirnov también conocida como la prueba K-S, trata de determinar sí dos conjuntos de datos difieren significati vamente. La prueba K-S tiene la ventaja de no asumir acerca de la distribución de los datos, aunque esto tiene un costo no documentado. La prueba K-S se realiza basado en la hipótesis de que la distribución acumulada de una variable aleatoria x es F(x). Para llevar a cabo esta hipótesis, se requiere de una muestra de tamaño n obtenida de una distribución continua F(x), para luego determinar la distribución acumulada de la muestra referida como F n(x), posteriormente se compara con la distribución acumulada hipotética F 0(x). Si F n(x) difiere de F 0(x), entonces es evidencia de que F n(x) no es igual a F n(x). La prueba K-S compara la función de distribución (probabilidad acumulada) teórica con la observada, y calcula un valor de discrepancia, representado habitualmente como d, que corresponde a la discrepancia máxima en valor absoluto entre la distribución observada y la distribución teórica, proporcionando asimismo un valor de probabilidad P, que corresponde, si estamos verificando un ajuste a la distribución normal, a la probabilidad de obtener una distribución que discrepe tanto como la observada si verdaderamente se hubiera obtenido una muestra aleatoria, de tamaño n, de una distribución normal. Si esa probabilidad es grande no habrá por tanto razones estadísticas para suponer que nuestros datos no proceden de una distribución, mientras que si es muy pequeña, no será aceptable suponer ese modelo probabilístico para los datos. El procedimiento para realizar la prueba K-S es el siguiente: 1. Generar n números pseudoaletaorios uniformes 2. Ordenar dichos números en orden ascendente. 3. Calcular la distribución acumulada de los números generados con la siguiente expresión: () =
Donde i es la posición que ocupa el número Xi en el vector obtenido en el paso 2 4. Calcular el estadístico Kolmogorov-Smirnov del modo siguiente (ver figura 3.5)
= á | () | 5. Si D n < d α,n entonces no se puede rechazar la hipótesis de que los números generados provienen de una distribución uniforme.
La distribución de Dn ha sido tabulada (ver tabla 3.5) como una función de n y α para cuando ( ) = 0 () .
FUENTES BIBIOGRAFICAS
https://www.academia.edu/7207310/Librodesimulacion
LIMUSA NORIEGA EDITORES