LAS MEDIDAS DE DISPERSIÓN O MEDIDAS DE VARIABILIDAD DESVIACIÓN MEDIA – DESVIACIÓN TÍPICA O ESTÁNDAR – VARIANZA. Las Medidas de Dispersión nos resumen la información de la “muestra” o serie de datos, dándonos así información acerca de la magnitud del alejamiento de la distribución de datos en relación a un valor central o de concentración de los datos.
UTILIDAD DE LAS MEDIDAS DE DISPERSION
Las estadísticas básicas nos permiten tener una visión del comportamiento de una serie de sucesos o eventos a los que denominamos "variables", así tenemos varias herramientas estadísticas como lo son la Media, la Mediana y la Moda. Pero estas Medidas no son suficientes, necesitamos conocer la variabilidad de los datos, es decir, cuán parecidos son los datos reales en comparación a las Medidas de Tendencia Central, para esto contamos con esta nueva herramienta: las Medidas de Dispersión, que no son otra cosa que indicadores de variabilidad y cuya importancia reside en la necesidad de tomar decisiones, basadas en estadísticas básicas. Por ejemplo, si tenemos una producción de camisas y sabemos que semanalmente se producen un promedio de 500 camisas, podríamos decir que todos los días se producen 100 camisas, pero nada nos garantiza eso porque podrían producirse en sólo dos días 250 camisas y el promedio semanal nos daría idéntico, así si adicionalmente tenemos una Desviación Estándar de 5 camisas, tendremos entonces una mejor comprensión del proceso, pues este último número nos indica que semanalmente se producen entre 495 y 505 camisas, es decir, que diariamente sí se deben producir aproximadamente 100 camisas. DATOS NO AGRUPADOS
fi : frecuencia absoluta
Media aritmética
n
Desviación media o desviación absoluta (Dm) equivale a la división de la sumatoria del valor absoluto de las distancias existentes entre cada dato y su media aritmética y el número total de datos. Si tenemos un conjunto de n observaciones, x1,..., xn, entonces, para datos no agrupados X ± Dm
Ejemplo Desviación media para datos no agrupados Tres alumnas son sometidas a una competencia para probar sus conocimientos en 10 materias diferentes, cada una sustentada con 10 preguntas. La idea del concurso es encontrar a la alumna más idónea para representar al colegio en un torneo a nivel nacional. El número de preguntas buenas por materia se muestra a continuación:
Materia
Marina
Josefa
Prudencia
1
2
7
5
2
9
2
6
3
10
2
5
4
2
6
5
5
3
6
5
6
1
3
5
7
9
6
4
8
9
7
5
9
1
6
6
10
4
5
4
SOLUCIÓN Lo primero que analizaremos es la media de los puntajes para cada uno de las alumnas, con el fin de determinar la alumna con mayor promedio de preguntas buenas. X
5
5
5
Las medias para los resultados de las alumnas coinciden: las tres alumnas responden en promedio 5 preguntas correctas por prueba. ¿Cuál sería entonces el indicador diferenciador entre las alumnas? ¿Cuál alumna seria la más idónea?
Complementemos el análisis anterior calculando la desviación media para Marina:
Marina muestra una desviación media de 3.4 indicando que los datos se alejan en promedio de la media en 3.4 preguntas buenas. Josefa disminuye su variación 1.6, siendo Prudencia el que menos variación presenta con 0.5 preguntas tanto por arriba como por debajo de la media aritmética. Se recomienda al colegio elegir como ganador en este caso a Prudencia, presenta resultados más constantes que las otras dos alumnas, Prudencia en promedio acierta 5 preguntas buenas con una variación muy bajo, rondando entre 4 y 6. Varianza es la Medida de Dispersión de los valores alrededor de la Media. se representa normalmente por el símbolo 2 (sigma) Característica de una muestra o población que cuantifica su dispersión o variabilidad. La Varianza tiene unidades al cuadrado de la variable. Su raíz cuadrada positiva es la Desviación Típica. Equivale a la dispersión respecto de la Media en una serie de datos continuos. A veces se usa la S2 como símbolo. Interpretación de la Varianza: Esta medida carece de interpretación. Ejemplo de la Varianza: No tiene ejemplos didácticos, la Varianza es más para fines teóricos que prácticos.
n–1 Ejemplo Varianza para datos no agrupados, calculemos la varianza para Marina:
(2 – 5)2 + (9 – 5)2 + (10 – 5)2 + (2 – 5)2 + (3 – 5)2 + (1 – 5)2 + (9 – 5)2 + 10 (9 – 5)2 + (1– 5)2 + (4 – 5)2 9 + 16 + 25 + 9 + 4 + 16 + 16 + 16 + 16 + 1 = = = 10 10 124 =
= 13,77 ≈ 14 9
Ejemplo Varianza para datos no agrupados, calculemos la varianza para Josefa:
(7 – 5)2 + (2 – 5)2 + (2 – 5)2 + (6 – 5)2 + (6 – 5)2 + (3 – 5)2 + (6 – 5)2 + 10 (7 – 5)2 + (6– 5)2 + (5 – 5)2 = 10
4+9+9+1+1+4+1+4+1+0 = 10
=
34 =
= 3,77 ≈ 4 9
Ejemplo Varianza para datos no agrupados, calculemos la varianza para Prudencia:
(5 – 5)2 + (6 – 5)2 + (5 – 5)2 + (5 – 5)2 + (5 – 5)2 + (5 – 5)2 + (4 – 5)2 + 10 (5 – 5)2 + (6– 5)2 + (4 – 5)2 = 10 5 =
= 0,55 ≈ 1 9
0+1+0+0+0+1+1+0+1+1 = 10
=
Desviación Típica o estándar es la Medida de Dispersión más importante y de mayor utilidad práctica, se representa normalmente por el símbolo (sigma) y es la que mejor nos da una idea de la variación de los datos respecto a algunas de las medidas de tendencia central o posición. A veces se usa la S como símbolo. Es una medida de dispersión que es igual a la raíz cuadrada de la varianza. En otras palabras, es el número que nos dice cuán alejado están los datos del valor de centrado o posición previamente obtenido. Una desviación estándar grande indica que los puntos están lejos de la media, y una desviación pequeña indica que los datos están agrupados cerca de la media. Ejemplo Desviación Típica o estándar para datos no agrupados, calculemos la Desviación Típica o estándar para Marina:
√2 = √13,77 = 3,71 ≈ 4 Ejemplo Desviación Típica o estándar para datos no agrupados, calculemos la Desviación Típica o estándar para Josefa:
√2 = √3,77 = 1,94 ≈ 2 Ejemplo Desviación Típica o estándar para datos no agrupados, calculemos la Desviación Típica o estándar para Prudencia:
√2 = √0,55 = 0,74 ≈ 1
DATOS AGRUPADOS Media aritmética
fi : frecuencia absoluta Mi : marca de clase
n
Desviación media para datos agrupados
.fi
fi : frecuencia absoluta
Varianza para datos agrupados
fi : frecuencia absoluta n
Mi : marca de clase
Desviación estándar para datos agrupados
√2 Una compañía de computadoras recibió un pedido urgente de computadoras domésticas para todas las ciudades del país que deberá entregar en un periodo de 6 semanas. De acuerdo con el contrato firmado con los distribuidores, la entrega diaria es para el primer día 22, para los siguientes días: 65, 77, 79, 83, 65, 50, 75, 65, 73, 60, 33, 66, 65, 30, 63, 79, 41, 55, 65, 57, 62, 45, 49, 65 , 75, 59, 55, 54, 51, 28, 39, 61, 25, 50, 48, 68, 55, 87, 35, 45, 53, 24