MÉTODO MANN-WHITNEY-WILCOXO M ANN-WHITNEY-WILCOXON N
CURSO: Estadística Estadística Aplicada a la Administración Administración
TEMA: Aplicación del método MANN-WHITNEY-WILCOXON DOCENTE: Lic. Castañeda Guzmán Walter CICLO: V ALUMNA: Caballero Jiménez Ana Lucía Lucía
UNIVERSIDAD
PRUEBA DE MANN-WHITNEY-WILCO MANN-WHITNEY-WILCOXON XON
NACIONAL DE TUMBES
Quiero dedicarle este trabajo A Dios que me ha dado la vida y fortaleza para terminar este trabajo monográfico, A mis Padres por estar ahí cuando más los necesito; en especial a mi madre por su ayuda y constante cooperación.
2
UNIVERSIDAD
PRUEBA DE MANN-WHITNEY-WILCOXON
NACIONAL DE TUMBES
El presente trabajo ha sido realizado con mucho esfuerzo, entusiasmo y dedicación, el cual analizaremos como se usa el método de estadística no paramétrica llamado método Mann-Whitney-Wilcoxon, esperando así cumpla con sus expectativas y las de nuestros lectores.
3
UNIVERSIDAD
PRUEBA DE MANN-WHITNEY-WILCOXON
NACIONAL DE TUMBES
A la hora de analizar los datos recogidos para una investigación, la elección de un método de análisis adecuado es crucial para evitar llegar a conclusiones erróneas. La selección de la técnica de análisis más apropiada ha de hacerse tomando en cuenta distintos aspectos relativos al diseño del estudio y a la naturaleza de los datos que se quieren cuantificar. Los métodos no paramétricos suelen requerir suposiciones menos restrictivas acerca del nivel de medición de los datos y menos suposiciones acerca de la forma de las distribuciones de probabilidad generadas por los datos muéstrales. En este presente trabajo se mostrará la aplicación de uno de los métodos no paramétricos importantes que es la prueba de MannWhitney-Wilcoxon, el cual se analizarán sus conceptos y sus aplicaciones en el ámbito de investigación. Descubramos juntos la importancia de este hermoso tema.
4
UNIVERSIDAD
PRUEBA DE MANN-WHITNEY-WILCOXON
NACIONAL DE TUMBES
Analizar el método MANN-WHITNEY-WILCOXON para determinar si hay diferencia entre dos poblaciones.
Identificar el método MANN-WHITNEY-WILCOXON para muestras pequeñas.
Identificar el método MANN-WHITNEY-WILCOXON para muestras grandes.
5
UNIVERSIDAD
PRUEBA DE MANN-WHITNEY-WILCOXON
NACIONAL DE TUMBES
ÍNDICE OBJETIVOS.............................................................................................................................................. 5 MÉTODO MANN-WHITNEY-WILCOXON ................................................................................................ 9 CASOS DE MUESTRAS PEQUEÑAS........................................................................................................ 10 CASO DE MUESTRAS GRANDES ........................................................................................................... 16 CONCLUSIONES .................................................................................................................................... 24
6
UNIVERSIDAD
PRUEBA DE MANN-WHITNEY-WILCOXON
NACIONAL DE TUMBES
Una de las consideraciones para determinar si lo apropiado es un método paramétrico o un método no paramétrico es la escala de medición empleada para generar los datos. Todos los datos son generados por una de las cuatro escalas de medición: nominal, ordinal, de intervalo o de razón. Por tanto, todos los análisis estadísticos se realizan con datos ya sea no minales, ordinales, de intervalo o de razón.
CUATRO ESCALAS DE MEDICIÓN: 1. Escala nominal: Una escala de medición es nominal si los datos son etiquetas o cat egorías que se usan para definir un atributo de un elemento. Los datos nominales pueden ser numéricos o no numéricos. Ejemplos. El mercado en el que cotiza una acción (NYSE, NASDAQ o AMEX) es un dato nominal no numérico. El número de seguro social de una persona es un dato nominal numérico. 2. Escala ordinal : Una escala de medición es ordinal si los datos pueden usarse para jerarquizar u ordenar las observaciones. Los datos ordinales pueden ser numéricos o no numéricos. Ejemplos. Las medidas pequeñas, medianas y grandes para dar el tamaño de un objeto son datos ordinales no numéricos. El lugar de los individuos en una clase 1, 2, 3,…son datos ordinales numéricos. 3. Escala de intervalo : Una escala de medición es de intervalo si los datos tienen las propiedades de los datos ordinales y los intervalos entre observaciones se expresan en términos de una unidad de medición fija. Los datos de intervalo tienen que ser numéricos. Ejemplos. Las mediciones de temperatura son datos de intervalo. Suponga que la temperatura en un lugar es de 21°C y en otro es de 4°C. Estos lugares se pueden jerarquizar de acuerdo con lo calurosos que son: el primero es más caliente que el segundo.
7
UNIVERSIDAD
PRUEBA DE MANN-WHITNEY-WILCOXON
NACIONAL DE TUMBES
La unidad fija de medición, 1C, permite decir cuán más caliente es el primer lugar: 17°C. 4. Escala de razón: Una escala de medición es de razón si los datos tienen las propiedad es de los datos de intervalo y el cociente (o razón) entre dos medidas tiene sentido. Los datos de razón tienen que ser numéricos. Ejemplos. Variables como la distancia, la altura, el peso y el tiempo se miden con una escala de razón. Las mediciones de temperatura no son datos de razón debido a que no existe un punto cero definido intrínsecamente. Por ejemplo, el punto de congelación del agua en la escala Fahrenheit es 32 grados y en la escala Celsius es 0 grados. Los cocientes entre datos de temperatura no tienen sentido. Por ejemplo, no tiene sentido decir que cuando la temperatura ambiente es de 20 grados hace el doble de calor que cuando es de 10 grados. La mayor parte de los métodos estadísticos conocidos como métodos paramétricos requieren el uso de datos de las escalas de intervalo o de razón. Con estos niveles de medición, tienen sentido las operaciones aritméticas y medias, varianzas, desviaciones estándar, etc., pueden calcularse, interpretarse y usarse en el análisis. Con datos nominales y ordinales no es apropiado calcular medias, varianzas ni desviaciones estándar; por tanto, no pueden emplearse los métodos paramétricos. La única manera de analizar esos datos para obtener conclusiones estadísticas es emplear los métodos no paramétricos. En general, para que un método estadístico se clasifique como método no paramétrico, debe satisfacer, por lo menos, una de las condiciones siguientes: 1. Ser un método que pueda ser usado con datos nominales. 2. Ser un método que pueda ser usado con datos ordinales. 3. Ser un método que pueda ser usado con datos de intervalo o de razón cuando no sea posible hacer suposiciones acerca de la forma de la distribución de la población.
8
UNIVERSIDAD
PRUEBA DE MANN-WHITNEY-WILCOXON
NACIONAL DE TUMBES
Esta prueba fue creada conjuntamente por Mann, Whitney y Wilcoxon. Algunas veces se le llama prueba de Mann-Whitney y otras veces prueba de la suma de rangos de Wilcoxon. Se usa para determinar si hay diferencia entre dos poblaciones. Esta prueba, a diferencia de la prueba de los rangos con signo, no se basa en un a muestra por pares. Aquí se usan dos muestras independientes, una de cada población. La prueba no paramétrica de MWW no requiere que los datos sean de intervalo ni tampoco que las poblaciones estén distribuidas normalmente. El único requisito es que la escala de medición de los datos sea por lo menos ordinal. Después, en lugar de probar las diferencias entre las medias de las dos poblaciones, la prueba d e MWW determina si las dos poblaciones son idénticas. Las hipótesis en la prueba de MWW son las siguientes:
H 0:
Las dos poblaciones son idénticas
H a:
Las dos poblaciones no son idénticas
9
UNIVERSIDAD
PRUEBA DE MANN-WHITNEY-WILCOXON
NACIONAL DE TUMBES
10
UNIVERSIDAD
PRUEBA DE MANN-WHITNEY-WILCOXON
NACIONAL DE TUMBES
La prueba de MWW para el caso de muestras pequeñas se usa siempre que los tamaños de las muestras de ambas poblaciones sean menores o iguales a 10.
Caso N° 01: Un experimentador utiliza dos métodos para enseñar a leer a un grupo de 10 niños de 6 años, quienes ingresan por primera vez a la escuela. El experimentador quiere demostrar que el procedimiento ideado por él es más efectivo que el tradicional; para ello, mide el desempeño en la lectura en función de la fluidez, comprensión, análisis y síntesis. El plan experimental preliminar consiste en elegir al azar tanto una muestra de 10 niños como el método por utilizar.
MÉTODO APLICADO Tradicional
CALIFICACIONES 80
85
25
70
90
95
100
93
110
45
Inventado por el investigador
Pasos para efectuar la prueba: 1- Se establecen las hipótesis:
Hipótesis nula (Ho): Las calificaciones de ejecución de lectura, según el método planteado d e enseñanza del investigador son más bajas e iguales que las observadas en el método tradicional.
Hipótesis alterna (Ha): Las calificaciones de ejecución de lectura, según el método de enseñanza del experimentador son más altas y diferentes que las observadas en el método tradicional.
11
PRUEBA DE MANN-WHITNEY-WILCOXON
UNIVERSIDAD NACIONAL DE TUMBES
2-Se fija el nivel de significancia: El nivel de significancia para este problema es del 95 %.
3- Se ordenan los valores de las dos muestras conjuntamente y se les asigna un rango a cada valor, corrigiendo las ligaduras existentes en los datos: Nota: ligaduras se refiere a los valores que se repiten en los datos correspondientes.
Ordenamos los valores de las dos muestras conjuntamente:
MÉTODO APLICADO
CALIFICACIONES
Tradicional
80
85
25
70
90
95
100
93
110
45
Inventado por el investigador
RANGO DE ORDEN
Ordenamos de menor a mayor :
25
45
70
80
85
90
93
95
100
110
1
2
3
4
5
6
7
8
9
10
No existen ligaduras entre los valores, por lo tanto procedemos al siguiente paso: 4-Asignamos un rango a cada valor: MÉTODO APLICADO
CALIFICACIONES
Tradicional
80
85
25
70
90
= 5
Rangos
4
5
1
3
6
∑ 19
95
100
93
11 0
45
= 5
8
9
7
10
2
∑ 36
Inventado por el investigador
Rangos
12
PRUEBA DE MANN-WHITNEY-WILCOXON
UNIVERSIDAD NACIONAL DE TUMBES
5- Se define el estadístico de contraste:
( , ) Donde:
U1
n1.n2
U2
n1.n2
n1 ( n1
1)
2 n2 (n2
2
R1
1)
R2
Dónde: U1 y U2 = valores estadísticos de U Mann-Whitney. n1 = tamaño de la muestra del grupo 1. n2 = tamaño de la muestra del grupo 2. R1 = sumatoria de los rangos del grupo 1. R2 = sumatoria de los rangos del grupo 2.
U1
5 X 5
U 1
21
U2
5 X 5
U 2
4
5(5 1) 2
5(5 1) 2
19
36
(21,4)
Min: 4
13
PRUEBA DE MANN-WHITNEY-WILCOXON
UNIVERSIDAD NACIONAL DE TUMBES
6- En el caso en que los tamaños de ambas muestras sean: < 10 o ≤ a 10, < 10 o ≤ a 10, se utiliza la siguiente tabla:
7-Calculamos el valor de
T L que
se lee directamente en la tabla:
= 5 y = 5 α= 95 % T L =
1-0.95= 0.05
18
8- Calculamos el valor de Tu
n1 (n1
n2
1) TL
T u
que se calcula mediante la siguiente ecuación:
14
PRUEBA DE MANN-WHITNEY-WILCOXON
UNIVERSIDAD NACIONAL DE TUMBES
T u
5(5 5 1) 18
T u
37
9-La hipótesis nula de que las poblaciones son idénticas debe rechazarse sólo si R es estrictamente menor que
T L
o estrictamente mayor que T u .
En consecuencia, la regla de decisión de esta prueba de MWW indica que la hipótesis nula de que las poblaciones son idénticas puede rechazarse si la suma de los rangos de la primera muestra es menor que 18 o mayor que 37. La regla de rechazo puede expresarse como: Rechazar H0 si <
T L
o >
T u
En nuestro problema: = 19 Los valores son los siguientes: 19 > 18 y
19 < 37, por lo tanto no se rechaza la Ho y se concluyelas calificaciones más bajas
mediante el método diseñado por el experimentador señalan menos efectividad. 10- Decisión: Con los resultados obtenidos llegamos a la conclusión de que las calificaciones de ejecución de lectura, según el método planteado de enseñanza del investigador son más bajas e iguales que l as observadas en el método tradicional.
15
UNIVERSIDAD
PRUEBA DE MANN-WHITNEY-WILCOXON
NACIONAL DE TUMBES
16
UNIVERSIDAD
PRUEBA DE MANN-WHITNEY-WILCOXON
NACIONAL DE TUMBES
Cuando los tamaños de las dos muestras son mayores o iguales a 10, para realizar la prueba de MWW se puede usar la aproximación normal de la distribución de T o R.
Formulas:
( , ) Donde:
U1
n1 .n2
U2
n1.n2
1)
n1 ( n1
2 n2 (n2
2
R1
1)
R2
Aproximación a la normal:
U
n .n N 1 2 , 2
n2 1) 12
n1 .n2 (n1
n1.n2 2 n1.n2 ( n1 n2 1) U
Z
12
17
UNIVERSIDAD
PRUEBA DE MANN-WHITNEY-WILCOXON
NACIONAL DE TUMBES
1-Un consejero universitario cree que la hipnosis es más eficaz que el tratamiento usual dado a los estudiantes que tienen una alta ansiedad durante los exámenes. Para probar esto él divide al azar a los alumnos con alta ansiedad en dos grupos: Uno de ellos recibe el tratamiento usual y el otro de la hipnosis, al concluir los tratamientos, cada estudiante recibe un cuestionario para medir la ansiedad que le provoca los exámenes. Los puntajes altos del cuestionario indican una mayor ansiedad. Los siguientes son los resultados:
MÉTODO
Nivel de ansiedad
APLICADO Hipnosis
20
21
33
40
24
43
48
31
22
44
Usual
42
35
50
51
57
26
37
30
51
62
30
Pasos para efectuar la prueba: 1- Se establecen las hipótesis:
Hipótesis nula (Ho): El nivel de ansiedad de los estudiantes después de la hipnosis es igual al nivel de ansiedad de los estudiantes que recibieron el tratamiento usual.
Hipótesis alterna (Ha): El nivel de ansiedad de los estudiantes después de la hipnosis no es igual al nivel de ansiedad de los estudiantes que recibieron el tratamiento usual.
2-Se fija el nivel de significancia: El nivel de significancia para este problema es del 95 %.
18
PRUEBA DE MANN-WHITNEY-WILCOXON
UNIVERSIDAD NACIONAL DE TUMBES
3- Se ordenan los valores de las dos muestras conjuntamente y se les asigna un rango a cada valor, corrigiendo las ligaduras existentes en los datos:
Nota: ligaduras se refiere a los valores que se repiten en los datos correspondientes.
Ordenamos los valores de las dos muestras conjuntamente:
MÉTODO
Nivel de ansiedad
APLICADO Hipnosis
20
21
33
40
24
43
48
31
22
44
Usual
42
35
50
51
57
26
37
30
51
62
RANGO DE ORDEN
RANGO DE ORDEN
30
Ordenamos de menor a mayor :
20
21
22
24
26
30
30
30
31
33
1
2
3
4
5
6
7
8
9
10
35
37
40
42
43
44
48
51
51
57
62
11
12
13
14
15
16
17
18
19
20
21
Existen ligaduras entre los valores, por lo tanto procedemos a realizar lo siguiente: Sacamos la media de los valores que se repiten: 1-Primero sacamos el número 30, el cual se repite tres veces.
19
PRUEBA DE MANN-WHITNEY-WILCOXON
UNIVERSIDAD NACIONAL DE TUMBES
X
X
X
678 3 21 3 7
2-Segundo sacamos el número 51, el cual se repite dos veces. X
X
18 19 2 37
2 X 18.5 4-Asignamos un rango a cada valor:
Hipnosis
20
21
33
40
24
43
48
31
22
44
30
= 11
∑
Rangos
1
2
10
13
4
15
17
9
3
16
7
97
= 10
42
Usual
35
50
51
57
26
37
30
51
62
∑
Rangos
14
11
7
18.5
20
5
12
7
18.5
25
5- Se define el estadístico de contraste: ( , ) Donde:
U1
n1 .n2
n1 ( n1
2
1)
R1
20
134
PRUEBA DE MANN-WHITNEY-WILCOXON
UNIVERSIDAD NACIONAL DE TUMBES
U2
n1.n2
n2 (n2
1)
2
R2
Dónde: U1 y U2 = valores estadísticos de U Mann-Whitney. n1 = tamaño de la muestra del grupo 1. n2 = tamaño de la muestra del grupo 2. R1 = sumatoria de los rangos del grupo 1. R2 = sumatoria de los rangos del grupo 2.
11(11 1)
U1
11X 10
U 1
79
U1
11X 10
U 1
31
2
10(10 1) 2
97
134
(79,31)
Min: 31 6- En el caso en que los tamaños de ambas muestras sean: > 10 y > 10, podemos aproximarla a la U de Mann-Withney y a una normal.
U
U
11 x10 11x10(11 10 1) N , 2 12 N 55,14.20
21
PRUEBA DE MANN-WHITNEY-WILCOXON
UNIVERSIDAD NACIONAL DE TUMBES
Luego: 31
Z
Z
55
14.20 1.69
N (0,1)
7- Ahora el problema es un contraste Z y el valor crítico será el valor de la N (0,1) de acuerdo con el nivel de significación establecido: Si Z < Z α
se acepta la Ho
Si Z > Z α
se rechaza la Ho
Z= -1.69 Entones tenemos lo siguiente: Z α= 1.96 con un nivel de confianza del 95 % Z = -1.69 -1.69 < 1.96
Se acepta la hipótesis nula
22
UNIVERSIDAD
PRUEBA DE MANN-WHITNEY-WILCOXON
NACIONAL DE TUMBES
7- Se redactan las conclusiones: Como no hay evidencias suficientes para rechazar la hipótesis nula no podemos decir que la hipótesis de tratamientos e hipnosis usual sean distintas. Por lo tanto aceptamos la hipótesis nula y afirmamos que el nivel de ansiedad de los estudiantes después de la hipnosis es igual al nivel de ansiedad de los estudiantes que recibieron el tratamiento usual.
23
UNIVERSIDAD
PRUEBA DE MANN-WHITNEY-WILCOXON
NACIONAL DE TUMBES
En estadística la prueba U de Whitney también llamada deMann-Whitney-Wilcoxon prueba de suma de rangos Wilcoxon o prueba de Wilcoxon-Mann-Whitney es una prueba no paramétrica con la cual se identifican diferencias entre dos poblaciones basadas en el análisis de dos muestras independientes, cuyos datos han sido medidos al menos en una escala de nivel ordinal.
24
UNIVERSIDAD
PRUEBA DE MANN-WHITNEY-WILCOXON
NACIONAL DE TUMBES
.
25