Medidas de dispersión
Las medidas de dispersión nos informan sobre cuánto se alejan del centro c entro los valores de la distribución.
Las medidas de dispersión son: Rango o recorrido
El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística.
Rango intercuartil
Es la diferencia entre sus cuartiles tercero y primero. Esto es
Varianza
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística.
̅ ̅ ̅ ∑
La varianza se representa por.
Varianza para datos no agrupados
La siguiente formula es equivalente
∑ Varianza para datos agrupados
̅ ̅ ̅
DATOS DISCRETOS
∑
∑
∑
∑
Datos continuos (con intervalos)
Ejercicios de varianza Calcular la varianza de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
xi 3 8 9 18
ni 1 3 3 1 8
xi*ni 3 24 27 18 72
xi * xi 9 64 81 324 478
ni(xi *xi) 9 192 243 324 768
∑ Calcular la varianza de la distribución de la tabla:
[10, 20)
15
1
15
225
[20, 30)
25
8
200
5000
[30,40)
35
10
350
12 250
[40, 50)
45
9
405
18 225
[50, 60
55
8
440
24 200
[60,70)
65
4
260
16 900
[70, 80)
75
2
150
11 250
42
1 820
88 050
∑ . =
=218.94
Propiedades de la varianza
1) La varianza será siempre un valor positivo o cero , en el caso de que las puntuaciones sean iguales. 2)Si a todos los valores de la variable se les suma un número la varianza no varía. 3) Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por el cuadrado de dicho número. 4) Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la varianza total.
Si todas las muestras tienen el mismo tamaño:
Si las muestras tienen distinto tamaño:
Observaciones sobre la varianza 1) La varianza, al igual que la media, es un índice muy sensible a las puntuaciones extremas. 2) En los casos que no se puede hallar la muestra tampoco será posible hallar la varianza. 3) La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones están elevadas al cuadrado Desviación típica o desviación estándar
La desviación típica es la raíz cuadrada de la varianza. Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación. La desviación tica se representa por s: Desviación típica para datos no agrupados
∑ La siguiente formula es equivalente
∑ Varianza para datos agrupados
̅ ̅ ̅ DATOS DISCRETOS
∑ ∑ Datos continuos (con intervalos)
∑
∑
Ejercicios de desviación típica
Calcular la desviación típica de la distribución: 9, 3, 8, 8, 9, 8, 9, 18
xi 3 8 9 18
ni 1 3 3 1 8
xi*ni 3 24 27 18 72
xi * xi 9 64 81 324 478
∑
√ . .
Calcular la varianza de la distribución de la tabla:
[10, 20)
15
1
15
225
ni(xi *xi) 9 192 243 324 768
[20, 30)
25
8
200
5000
[30,40)
35
10
350
12 250
[40, 50)
45
9
405
18 225
[50, 60
55
8
440
24 200
[60,70)
65
4
260
16 900
[70, 80)
75
2
150
11 250
42
1 820
88 050
∑ . =
=218.94
√ . ..
Propiedades de la desviación típica 1) La desviación típica será siempre un valor positivo o cero , en el caso de que las puntuaciones sean iguales. 2)Si a todos los valores de la variable se les suma un número la desviación típica no varía. 3) Si todos los valores de la variable se multiplican por un número la desviación típica queda multiplicada por dicho número. 4) Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones típicas se puede calcular la desviación típica total. Si todas las muestras tienen el mismo tamaño:
Si las muestras tienen distinto tamaño:
Observaciones sobre la desviación típica 1 La desviación típica, al igual que la media y la varianza, es un índice muy sensible a las puntuaciones extremas. 2 En los casos c asos que no se puede hallar la media tampoco será posible hallar la desviación típica. 3 Cuanta más pequeña sea la desviación típica mayor será la concentración de datos alrededor de la media. COEFICIENTE DE VARIACION El coeficiente de variación, es una medida de dispersión relativa que se define como la desviación estándar dividido por la media aritmética y se denota por C.V
.
o en %
Interpretación C.V <10 datos muy homogéneos (poca dispersión) 1024 datos muy heterogéneos (dispersión mayor se alejan bastante alrededor de la media)
Ejemplo 1: En dos cursos los promedios que sacaron sus alumnos fueron 6.1 y 4.3 y las desviaciones estándares respectivas fueron 0.6 y 0.45 ¿en qué curso hay mayor dispersión? Solución
. . .. . . .. .
EL curso A tiene una dispersión menor que el de B, pese a presentar mayor dispersión
Ejemplo 2 Sea la tabla que representa la distribución del consumo mensual de agua en soles de 42 familias. a) Cuál es el grado de variación de estos datos?
mi 15 25 35 45 55 65 75
10 – 20 20 – 30 30 – 40 40 – 50 50 – 60 60 – 70 70 – 80
ni 1 8 10 9 8 4 2 42
mi*ni 15 200 350 405 440 260 150 1820
ni* 225 5000 12250 18225 24200 16900 11250 88050
∑ . ∑ . . √ . .. . .. . =
=
b) cual es el coeficiente de variación
Ejemplo 3
a) Cuál es el grado de variación de estos datos?
41.8-49.9 49.9-58.0 58.0-66.1 66.1-74.2 74.2-82.3 82.3-90.4 90.4-98.5
mi 45.85 53.95 62.05 70.15 78.25 86.35 94.45
ni 5 7 8 5 14 16 5 50
ni*mi 229.25 377.65 496.40 350.75 1095.50 518.10 472.25 3539.90
∑ . . ∑ . . . √ . .. =
=
b) cual es el coeficiente de variación
ni* 10511.1 20374.2 30801.6 24605.1 85722.9 44737.9 44604.0 261356.9
. .. .
c) Compare los resultados de los ejercicios y diga cuál es más homogénea? La medida que nos permite comparar dos distribuciones con diferentes unidades de medida es el coeficiente de variación, entonces:
. .. . . .. .
La distribución mas homogénea es CV2 Ejemplo 4
En el mes de enero el sueldo promedio de los trabajadores del sector industrial era $200. Para el mes de julio se considera un aumento del 30% al sueldo del mes de Enero más un adicional de $50. Si el coeficiente de variación en Enero era de 0.25 ¿se puede decir que la distribución de sueldos en julio es más homogénea? homogénea? Solución Sea X: Sueldos de enero, La media de enero es:
Y: Sueldos de julio
̅
Coeficiente de variación de enero es: C.V.=0.25 La desviación estándar de enero es
̅ . .
La relación entre las dos variables es : Nota:
Propiedad (escala de razón o cociente) La escala de razón es una escala de intervalo con cuyos valores además podemos comprobar cuantas veces un valor de la escala es igual a otro valor de la escala. Esto es, si x1 y x2 son dos valores en la escala de razón se verifica la relación
Por lo tanto 200(30/100)=60 entonces 200+60=260 260/200=1.3 Entonces la media de los sueldos de julio es:
.̅ .
La varianza de los los sueldos de julio es
La desviación estándar :
. . √ .
El coeficiente de variación en julio es: CV=
Comparando los coeficientes coeficientes de variación de enero y julio se puede decir que la distribución de los sueldos de julio es más homogénea Ejemplo 5 El costo inicial de producción, X ; de una muestra de 80 objetos de cierto tipo, tiene una desviación estándar de $30.La media media del costo de producción es de $250 para el 60% de la muestra y de $200 para el resto. El costo final de producción Y es dado por la relación
. Si el precio de venta de cada objeto de la muestra es proporcional al cuadrado del costo final de producción. ¿Cuánto se recaudaría por la venta por la venta total? Solución Antes de desarrollar el ejercicio damos las siguientes propiedades de varianza
̅ ̅ ∑ ̅ ̅ . . .̅ . . . ∑ 1.- Dadas, la media y y la varianza
de n datos de la variable X, la suma total de los
cuadrados de los valores es igual a n ( n (
) para datos no tabulados se tiene t iene por ejemplo
)
2.-si cada uno de n los valores n valores
es
De Y
+5, se tiene,
También
La recaudación total es=
EJERCICIOS PROPUESTOS
es transformad transformado o en
entonces la varianza de los
1.-Las calificaciones en estadística de un grupo del curso intensivo del 2010 son: 10, 07, 12, 05, 07, 10, 11, 02, 10, 10, 10, 07, 11, 11, 10, 10, 12, 07, 10, 10, 05, 05, 05, 10, 10, 10, 07, 02, 02, 11. Se pide: a) Cuál es el rango de datos b) Cuál es su varianza v arianza c) Cuál es la desviación estándar estándar d) Son homogéneos los datos 2.-Las calificaciones definidas definidas en estadística de un grupo de 10 amigos son: 17, 12, 14, 17, 10, 11,12, 15, 18 y 14 puntos calcular a) La varianza de los datos b) Variación entre los extremos del 50% central de los datos 3.-El número de transacciones transacciones fiscales semanales que realizan las empresas de mayor prestigio de la región occidental del país se muestran en la tabla de abajo. Se pide calcular e interpretar.
2 – 4 4 – 6 6 – 8 8 – 10 10 – 12
a)
ni 3 4 5 3 1
Cuál es la variación porcentual de los datos
b) Cuál es la varianza y desviación desviación estándar estándar 4.-Se tiene las edades de 5 estudiantes universitarios de primer semestre 18, 23, 27, 25 y 34 calcular el rango 5.- En una industria el jornal diario de sus obreros tiene una media de $10 y una desviación estándar de $2. Si se hace un incremento de 20% en cada jornal y una bonificación bonificación adicional de $3, ¿en qué porcentaje cambio la variabilidad de los jornales?