MEDIDAS DE UBICACIÓN Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de individuos. Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor . Las medidas de posición son:
Cuartiles Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales.
Q 1 , Q 2 y Q 3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. Q 2 coincide con la mediana
Cálculo de los cuartiles 1 Ordenamos los datos de menor a mayor. 2 Buscamos el lugar que ocupa cada cuartil mediante la expresión.
Cálculo de los cuartiles para datos agrupados En primer lugar buscamos la clase donde se encuentra, en la ta bla de las frecuencias acumuladas.
L i es el límite inferior de la clase donde se encuentra la mediana. N es la suma de las frecuencias absolutas.
F i -1 es la frecuencia acumulada anterior a la clase mediana. a i es la amplitud de la clase.
Ejemplo En la siguiente distribución de frecuencias calcular los cuartiles
Tiempo
f i
Fi
(min)
[0-15)
2
2
[15-30)
4
6
[30-60)
4
10
[60-90)
8
18
[90-120)
2
20
20
.Buscamos el cuartil
Q1
= ( 1*20)/4
= 5
Luego remplazamos los valores en la formula
Q1
=
15 + [(5-2)/4] * 15 = 26.25
Seguimos con el cuartil numero 2
Q 2 = (2*20)/4 = 10
Q 2 = 30 + [(10-6)/4] *30 = 60
Q 3 = (3*20)/4 = 15
Q 3 = 60+ [(15-10)/8] *30 = 78.75
Deciles Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.
D 5 coincide con la mediana. El cálculos de los deciles es similar al de los cuartiles, en este caso al buscar la clase no los dividiremos entre cuatro si no entre 10 asi,
Cálculo de los deciles En primer lugar buscamos la clase donde se encuentra , en la tabla de las frecuencias acumuladas.
L i es el límite inferior de la clase donde se encuentra la mediana. N es la suma de las frecuencias absolutas.
F i -1 es la frecuencia acumulada anterior a la clase mediana. a i es la amplitud de la clase.
Ejemplo Usaremos la misma tabla de distribución de f recuencia Calcular los deciles 1, 6 y 9
Tiempo
f i
Fi
(min)
[0-15)
2
2
[15-30)
4
6
[30-60)
4
10
[60-90)
8
18
[90-120)
2
20
20
D 1 = (1*20)/10 = 2
Remplazamos la formula
D 1 = 0+[(2-0)/2]*15 = 15
D 6 = (6*20)/10) = 12
Remplazamos D 6 = 60 + [(12-10)/8]* 30 = 67.5
D 9 = (9*20)/10 = 18 Remplazamos D 9 = 60 + [(18-10)/8] *30 = 90
Percentiles Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
P 5 0 coincide con la mediana. Cálculo de los percentiles En primer lugar buscamos la clase donde se encuentra acumuladas.
, en la tabla de las frecuencias
L i es el límite inferior de la clase donde se encuentra la mediana. N es la suma de las frecuencias absolutas.
F i -1 es la frecuencia acumulada anterior a la clase mediana. a i es la amplitud de la clase.
Ejemplo Usaremos la misma tabla de frecuencias de los ejemplos anteriores.
Tiempo
f i
(min)
[0-15)
2
2
[15-30)
4
6
[30-60)
4
10
[60-90)
8
18
[90-120)
2
20
20
Calcular en la tabla de distribución de frecuencias los percentiles 23 , 45 y 85
P 2 3 = (23*20)/100= 4.6
Remplazamos los valores en la formula
P ´ 2 3 = 15 + [( 4.6 -2)/4]*15 = 24.75
P 4 5 = (45*20)/100 = 9
Remplazamos P 4 5 = 30 + [(9-6)/4]*30= 52.5
P 8 5 = (85*20)/100 = 17
Remplazamos P 8 5 = 60 + [(17-10)/8]*30=86.25
DIAGRAMA DE CAJAS
El diagrama de caja es un gráfico utilizado para representar una variable cuantitativa (variable numérica). El gráfico es una herramienta que permite visualizar, a través de los cuartiles, cómo es la distribución, su grado de asimetría, los valores extremos, la posición de la mediana, etc. Se compone de: Un rectángulo ( caja) delimitado por el primer y tercer cuartil (Q1 y Q3). Dentro de la caja una línea indica dónde se encuentra la mediana (segundo cuartil Q2) Dos brazos, uno que empieza en el primer cuartil y acaba en el mínimo, y otro que empieza en el tercer cuartil y acaba en el máximo. Los datos atípicos (o valores extremos) que son los valores distintos que no cumplen ciertos requisitos de heterogeneidad de los datos.
Los diagramas de caja son muy útiles para comparar una variable en diferentes grupos. Construcción del diagrama de caja Para construir el diagrama de caja, debemos seguir los siguientes pasos: 1. Ordenar los datos. 2. Calcular los tres cuartiles (Q1, Q2 y Q3). Después, dibujamos el rectángulo (caja) delimitado por el primer y tercer cuartil, dibujando entre los dos cuartiles una línea para indicar donde está la mediana (segundo cuartil). 3. Calcular el rango intercuartílico, que es el tercer cuartil menos el primero.
4. Se calculan los límites admisibles inferior y superior ( LI y LS) para identificar los valores extremos.
Los límites marcarán los datos atípicos de la variable. Todos aquellos puntos que sean menores que LI ( x < LI ) o mayores que LS ( x > LS) son valores extremos. Es decir, son todos aquellos valores que no están en el intervalo [ LI,LS]. 5. El mínimo es el menor valor del conjunto que sea mayor o igual que LI . El máximo es el mayor valor del conjunto que es menor o igual que LS. Dibujamos los dos brazos . El primero va desde el primer cuartil hasta el mínimo. El segundo, desde el tercer cuartil hasta el máximo. 6. Se dibujan los valores extremos, representados por puntos o círculos pequeños.
Ejemplo En un bosque plantaron veinte ( N =20) árboles y, al cabo de unos años, se mide la altura para ver su evolución. Un muy buen método para ver cómo han crecido y comprobar si existen valores extremos es el diagrama de caja. Mediante esta representación gráfica podemos ver si hay árboles que han crecido más o menos de lo habitual.
1. Se ordenan los datos 2. Se calculan los tres cuartiles.
A partir del conjunto ordenado calculamos los cuartiles:
Los tres cuartiles son Q1=4,20, Q2=5,50 y Q3=6,42. 3. Se calculan los límites admisibles inferior y superior ( LI y LS) para determinar los valores extremos. El rango intercuartílico es:
A partir del rango calculamos los límites:
Los valores extremos serán todos los árboles que midan menos de 0,96m o más de 9,59m. Tenemos dos árboles, uno de 0,94m y otro de 10,14m que serán valores extremos. Estos valores los representamos con puntos en el diagrama de caja. 4. El mínimo es el menor elemento del conjunto que sea mayor o igual al límite inferior. El máximo es el mayor elemento que sea menor o igual al límite superior. En este caso, el mínimo es 2,98 y el máximo 7,13.
5. Se dibujan los brazos del diagrama de caja. El brazo inferior irá desde el primer cuartil hasta el mínimo (desde el 4,20 a 2,98). El brazo superior abarcará desde el tercer cuartil hasta el máximo (desde el 6,42 hasta el 7,13). 6. Los dos puntos extremos se representan mediante un punto o círculo. El diagrama de caja del conjunto de la altura de estos veinte árboles es:
Esta representación proporciona una visión rápida de la distribución, apreciándose una asimetría al no estar Q 2 en el centro, en este caso porque hay árboles más altos que la mediana cuya altura está más separada de la mediana que los que tienen una altura inferior a ella, que están más agrupados. También se puede apreciar la existencia de valores extremos.