UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE CIENCIAS ESCUELA PROFESIONAL DE QUÍMICA QUÍM ICA
Ensayos de Hipótesis y ANO ANOV VA Ing. Ulises Quiroz Aguinaga Aguinaga
[email protected]
Métodos Estadísticos para Quím Química ica Analítica
1. Comparación de resultados Apareados Se utiliza para comparar dos conjuntos de resultados cada uno, cuyos datos en función de algún criterio objetivo, se pueden reunir de dos en dos formando parejas: (x1, y1), (x2, y2), …,(xn, yn). Se halla la diferencia, d i = xi – yi, para cada pareja (con su signo) y se calcula la media aritmética xd de las diferencias y su desviación estándar sd. 2
Métodos Estadísticos para Quím Química ica Analítica
1. Comparación de resultados Apareados Ho : md = 0 El estadístico to:
t o
x d n sd
Los grados de libertad: (n-1) Si |t |t o |< t c se acepta H o.
3
Métodos Estadísticos para Química Analítica
1. Comparación de resultados Apareados Ejemplo El desgaste de un motor se puede evaluar a partir del análisis del aceite lubricante, que se va enriqueciendo de ciertos metales. En un ensayo de comparación de motores, se tomaron muestras de aceite de lubricante a distintos tiempos de funcionamiento. Se desea saber si uno de los motores se desgasta mas rápidamente que el otro, o si por el contrario el desgaste es el mismo. 4
Métodos Estadísticos para Química Analítica
1. Comparación de resultados Apareados
5
Horas
Sn, motor 1
Sn, motor 2
100
0,218
0,244
200
0,312
0,299
300
0,365
0,353
500
0,373
0,379
750
0,379
0,388
1000
0,383
0,394
Métodos Estadísticos para Química Analítica
2.Ensayos de comparación de Varias Varianzas Al comparar tres o mas varianzas deseamos saber, bajo cierta probabilidad, si todas son iguales, o al menos una de ellas es distinta. Podemos aplicarlo para:
6
Establecer si la varianza de un método de análisis se mantiene constante, o si varía al aumentar la concentración del analito.
Ejercicios de comparación interlaboratorios, en los que se compara la precisión obtenida por varios laboratorios que aplican el mismo método a porciones de una misma muestra.
Métodos Estadísticos para Química Analítica
2.Ensayos de comparación de Varias Varianzas Las pruebas más comúnmente usadas para comparar varias varianzas son: Test de Cochran, Test de Bartlett y el Test de Levene. En todos los casos, queremos probar la hipótesis:
H 0 :
2 1
...
2 i
...
H 1 : Al memos una
7
2 k
2 i
es diferente
Métodos Estadísticos para Química Analítica
2.Ensayos de comparación de Varias Varianzas
Ejemplo La siguiente tabla muestra los resultados de la determinación del grado acético por medio de una volumetría ácido-base, empleando hidróxido de sodio como Valorante. Cada serie es una determinación replicado llevada a cabo por un grupo de estudiantes sobre la misma muestra de vinagre.
8
Métodos Estadísticos para Química Analítica
2.Ensayos de comparación de Varias Varianzas Tabla N°1: Determinación del grado acético de un vinagre por medio de una valoración ácido-base n
Grupo 1
Grupo 2
Grupo 3
Grupo 4
Grupo 5
1
6.028
5.974
5.886
6.132
5.916
2
6.028
6.004
5.970
6.12
6.123
3
5.998
6.005
5.880
6.131
6.034
4
6.089
5.852
5.910
6.072
6.004
5
6.059
5.944
5.910
6.071
6.152
Media xi
6.0404
5.9558
5.9112
6.1052
6.0458
Varianza s2 1.20 x 10-03 4.00 x 10-03 1.27 x 10-03 9.69x10 -03 8.99 x 10-03
9
Métodos Estadísticos para Química Analítica
2.Ensayos de comparación de Varias Varianzas
Caso 1: Prueba de Cochran La hipótesis nula es que la varianzas dentro de cada uno de los k grupos de datos son los mismos. Esta prueba detecta si una varianza es mayor que el resto. La estadística es: 2
C
smax k
2
si
i 1
La región crítica en el nivel de significación está dada por C ,k , , donde ν=n-1
10
α
Métodos Estadísticos para Química Analítica
2.Ensayos de comparación de Varias Varianzas
11
Métodos Estadísticos para Química Analítica
2.Ensayos de comparación de Varias Varianzas
Caso 2: Prueba de Barlett La Prueba de Barlett es adecuada para detectar grupos de varianza similar dentro de cada uno de los k grupos de datos, pero que difiere de un grupo a otro. La estadística se define mediante las siguientes ecuaciones: Se calcula el estadístico X 2 o: X 2 o
12
1 C
( N h) ln s 2
h
j 1
(n j 1) ln s j2
Métodos Estadísticos para Química Analítica
2.Ensayos de comparación de Varias Varianzas
Caso 2: Prueba de Barlett Donde: N: número total de datos h: número de series C es un factor corrector:
1 1 1 N k j 1 n j 1 C 3(k 1) h
Ho se acepta si X 2 o < X2c para (k-1) grados de libertad para un nivel de significación deseado c. Las pruebas de Cochran y de Bartlett son muy sensibles a la hipótesis de la normalidad. La prueba de Levene, particularmente cuando se basa en las medianas de cada grupo, es más robusto a la falta de normalidad de los datos. 13
Métodos Estadísticos para Química Analítica
2.Ensayos de comparación de Varias Varianzas
Caso 3: Prueba de Levene Se halla el residuo de los datos respecto a su mediana: wij = | xij – xm,j |
Luego la media de estos residuos:
n j
wij w j
Finalmente se calcula el estadístico W:
i 1
n j
( N k )
k
n (w
w) 2
j 1
W
(k 1)
k
N
(w
ij
j 1 i 1
Ho se rechaza si W > F para t 1 = (h-1) y t 2 = (N-k) para c.
14
j
j
w j ) 2
Métodos Estadísticos para Química Analítica
2.Ensayos de comparación de Varias Varianzas 2.1.Condiciones Previas para aplicar ANOVA 1. Independencia, los datos no deben estar correlacionados entre si. 2. Normalidad , la distribución interna de cada serie debe ser normal. 3. Homog eneidad , las varianzas de las series deben ser iguales, para eso debe realizarse ensayos gráficos, de Barlett o de Levene.
15
Métodos Estadísticos para Química Analítica
2.Ensayos de comparación de Varias Varianzas 2.1.Condiciones Previas para aplicar ANOVA
16
Métodos Estadísticos para Química Analítica
2.Ensayos de comparación de Varias Varianzas 2.1.1. Ensayos de Homogeneidad Consiste en obtener el diagrama de cajas de los residuos, es decir, de las desviaciones de los datos de cada serie respecto a su media. Ensayar los datos de la determinación de sulfatos en aguas por electroforesis capilar. Serie 1 Dato Residuo
17
Serie 2 Dato Residuo
Serie 3 Dato Residuo
23
-1,57
51
0,43
95
-4,71
25
0,43
54
3,43
106
6,29
26
1,43
47
-3,57
98
-1,71
24
-0,57
48
-2,57
104
4,29
23
-1,57
53
2,43
102
2,29
26
1,43
49
-1,57
97
-2,71
Métodos Estadísticos para Química Analítica
2.Ensayos de comparación de Varias Varianzas 2.1.1. Ensayos de Homogeneidad Boxplot of RESI1, RESI2, RESI3 7.5
5.0
2.5 a t a D
0.0
-2.5
-5.0 RESI1 18
RESI2
RESI3
Métodos Estadísticos para Química Analítica
2.Ensayos de comparación de Varias Varianzas 2.1.1. Ensayos de Homogeneidad Test for Equal Vari ances for Sulfato Bartlett's Test Test Statistic P-Value
Serie1
6.96 0.031
Levene's Test Test Statistic P-Value e i r Serie2 e S
Serie3
0
2
4
6
8
10
95% Bonferroni Confidence Intervals for StDevs 19
12
2.97 0.077
Métodos Estadísticos para Química Analítica
2.Ensayos de comparación de Varias Varianzas 2.1.1. Ensayos de Homogeneidad
20
Para conseguir la homogeneidad se pueden probar diferentes transformaciones: a) Extraer la raíz cuadrada de los datos, la que se considera una transformación suave. b) Obtener el logaritmo o la inversa, que son transformaciones mas duras. Tener en cuenta que la transformación implica una perdida de la normalidad de datos normales.
Métodos Estadísticos para Química Analítica
2.Ensayos de comparación de Varias Varianzas 2.1.1. Ensayos de Homogeneidad Test for Equal Variances for Sulfatoraiz Bartlett's Test Test Statistic P-Value
raiz1
1.39 0.500
Levene's Test Test Statistic P-Value
z i a r
raiz2
raiz3
0.1
0.2
0.3
0.4
0.5
95% Bonferroni Confidence Intervals for StDevs 21
0.6
0.77 0.477
Métodos Estadísticos para Química Analítica
2.Ensayos de comparación de Varias Varianzas 2.2. ANOVA de una Entrada Es una herramienta estadística que permite comparar simultáneamente varias medias muestrales a partir de la comparación de las varianzas.
22
Ho : u1 = u2 = u3 = u4 = … H1 : Al menos una de ellas es diferente a las demás.
Métodos Estadísticos para Química Analítica
2.Ensayos de comparación de Varias Varianzas 2.2. ANOVA de una Entrada ANOVA hace comparaciones entre la varianza residual de cada serie y la varianza entre las medias de las series, si esta última es significativamente mayor que la varianza residual, el resultado es positivo y se rechaza la hipótesis nula, Ho.
23
Métodos Estadísticos para Química Analítica
2.Ensayos de comparación de Varias Varianzas 2.2. ANOVA de una Entrada Se ordena los datos:
Serie 1
24
Serie 2
Serie j
Serie h
x11 x12 x1j x21 x22 x2j … … … xi1 xi2 xij … … … Hasta n1 Hasta n2 Hasta n j réplicas réplicas réplicas
x1h x2h … xih … Hasta nh réplicas
Métodos Estadísticos para Química Analítica
2.Ensayos de comparación de Varias Varianzas 2.2. ANOVA de una Entrada Preparación de Datos para un ANOVA
25
Serie
No de Datos
Media + Desviación estándar
Varianza
1 2
n1 n2
x1 + s1 x2 + s2
s12 s22
…
…
…
…
j
n j
xi + si
s j2
…
…
…
…
h
nh
xh + sh
sh2
Métodos Estadísticos para Química Analítica
2.Ensayos de comparación de Varias Varianzas 2.2. ANOVA de una Entrada Se descompone la varianza total de los datos en dos: la varianza residual y la varianza entre las medias de las series. La varianza total, s 2T es: s 2 T
1
h
n j
( x N 1
ij
j 1 i 1
26
x) 2
SC T N 1
Métodos Estadísticos para Química Analítica
2.Ensayos de comparación de Varias Varianzas 2.2. ANOVA de una Entrada Donde x es la gran media, que puede hallarse como media ponderada de las medias, pero también como media de todos los datos x ij: h
n
j
x
27
j 1
N
h
n j
x
ij
j 1
i 1
N
Métodos Estadísticos para Química Analítica
2.Ensayos de comparación de Varias Varianzas 2.2. ANOVA de una Entrada SCT es la “suma de cuadrados total”. Dividiéndolo entre los números de grados de libertad, (N-1), se tiene la varianza total. Se puede operar:
xij x xij x j x j x Elevando al cuadrado:
x
ij
28
x xij x j x j x 2 xij x j x j x 2
2
2
Métodos Estadísticos para Química Analítica
2.Ensayos de comparación de Varias Varianzas 2.2. ANOVA de una Entrada Al sumar a lo largo de las series para obtener SC T, el último término se anula debido a que la suma de las diferencias respecto a una media es cero:
SC T
h
n j
( x
ij
j 1 i 1
29
h
x j ) n j ( x j x) 2
j 1
2
Métodos Estadísticos para Química Analítica
2.Ensayos de comparación de Varias Varianzas 2.2. ANOVA de una Entrada En forma abreviada esta ecuación se escribe como: SCT = SCres + SCs Donde:
SC res
h
n j
j 1 i 1
30
( xij x j ) 2
SC s
h
j 1
n j ( x j x)
2
Métodos Estadísticos para Química Analítica
2.Ensayos de comparación de Varias Varianzas 2.2. ANOVA de una Entrada Las sumas de cuadrados residual y entre series se dividen por sus respectivos grados de libertad para calcular el cuadrado medio residual, CM res y el cuadrado medio entre series, CMs: CM res
SC res N h
CM s
SC s h 1
Los cuadrados medios CMres y CMs son las varianzas residual s 2res y entre series s2s, respectivamente. 31
Métodos Estadísticos para Química Analítica
2.Ensayos de comparación de Varias Varianzas 2.2. ANOVA de una Entrada Se comparan ambas varianzas haciendo un ensayo F entre ambas varianzas. Se halla Fo: CM s SC s /( h 1) F 0 CM res SC res /( N h) El ensayo es de un lado debido a que queremos comparar si la varianza entre series es significativamente mayor a la varianza residual, y los grados de libertad t1 = (h-1) y t2 = (N-h). Si Fo < Fc se acepta Ho, no hay diferencias significativas en las medias de las series a una significancia dada c. 32