MEDIDAS DE FORMAS ASIMETRÍA (SESGO) Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (media aritmética). La asimetría presenta tres estados diferentes, cada uno de los cuales define de forma concisa como están distribuidos los datos respecto al eje de asimetría. La asimetría positiva cuando la mayoría de los datos se encuentran por encima del valor de la media aritmética, es decir, que los valores se tienden a reunir más en la parte izquierda que en la derecha de la media. Y que la asimetría es mayor a cero (Sg>0)
La simétrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la media aritmética, es decir, este valor es difícil de conseguir por lo que se tiende a tomar los valores que son cercanos ya sean positivos o negativos de (± 0.5), cuando su mediana, su moda y su media aritmética coinciden. Y que la asimetría es igual a cero (Sg=0).
La asimetría negativa cuando la mayor cantidad de datos se aglomeran en los valores menores que la media aritmética, es decir, que los valores se tienden a reunir más en la parte derecha que en la izquierda de la media. Y que la asimetría es menor a cero (Sg<0)
Existen varias medidas de la asimetría de una distribución de frecuencias.
1. Coeficiente de Asimetría de Pearson:
= ̅ − 2. Pero si existen dos o más modas se utilizara otra fórmula:
= 3̅ − 3. Y por otro lado es el coeficiente de asimetría de Fisher: a. Para datos sin agrupar se emplea la siguiente fórmula:
b. Para datos agrupados en tablas de frecuencias se emplea la siguiente fórmula:
c. Para datos agrupados en intervalos se emplea la siguiente fórmula:
4. Calculando la Medida de Bowley se obtiene
Dónde: Ap=g1= representa el coeficiente de asimetría = media de la muestra = moda =Q2= mediana S=σ= desviación estándar =valores de cada uno de la muestra = frecuencia (absoluta o relativa) n= número total de la muestra xm= marca de la clase
̅
CURTOSIS (APUNTAMIENTO) Esta medida determina el grado de concentración que presentan los valores en la región central de la distribución. Y se forma de campana. Por medio de medidas de Fisher: 1. Para datos sin agrupar se emplea la siguiente fó rmula:
2. Para datos agrupados en tablas de frecuencias se emplea la siguiente fórmula:
3. Para datos agrupados en intervalos se emplea la siguiente fórmula:
4. Otra forma de calcular la curtosis:
3− 1 ) = 12 (90 − 10
Dónde: α=g2= representa el coeficiente de curtosis Existen tres tipos de grado de concentración:
Distribución
mesocúrtica: presenta
un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal), es decir, que la distribución al igual que en la asimetría es bastante difícil de encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen aceptar los valores cercanos (± 0.5 aprox.). Y que la curtosis es igual a 0.263 (K=0.263). Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores centrales de la variable. Y que la curtosis es mayor a 0.263 (K>0.263).
Distribución platicúrtica: presenta un reducido grado de
concentración alrededor de los valores centrales de la variable. Y que la curtosis es menor a 0.263 (K<0.263).
Cuando la distribución de los datos cuenta con un coeficiente de asimetría (Sg = ±0.5) y un coeficiente de Curtosis de (K = ±0.5), se le deno mina Curva Normal. Este criterio es de suma importancia ya que para la mayoría de los procedimientos de la estadística de inferencia se requiere que los datos se distribuyan normalmente. La principal ventaja de la distribución normal radica en el supuesto que el 95% de los valores se encuentra dentro de una distancia de dos desviaciones estándar de la media aritmética; es decir, si tomamos la media y le sumamos dos veces la desviación estándar y después le restamos a la media y dos veces la desviaciones, el 95% de los casos se encontraría dentro del rango que compongan estos valores.
EJEMPLO 1:
Asimetria y Curtosis
EL COEFICIENTE DE FISHER
EJEMPLO 2:
Asimetría Los siguientes datos: 6, 9, 9, 12, 12, 12, 15 y 17
Solución: Calculando la media aritmética se obtiene:
Para calcular los cuartiles se ordena los datos de menor a mayor 6
9
Calculando el cuartil uno se obtiene:
Calculando el cuartil dos se obtiene:
9
12 12 12 15 17
Calculando el cuartil tres se obtiene:
Calculando la desviación estándar muestral se obtiene:
Calculando el Coeficiente de Pearson se obtiene:
Calculando la Medida de Bowley se obtiene
Calculando la desviación estándar poblacional se obtiene:
Calculando la Medida de Fisher se obtiene Datos 6
-166,375
9
-15,625
9
-15,625
12
0,125
12
0,125
12
0,125
15
42,875
17
166,375
Total
12
EJEMPLO 3
Curtosis Los siguientes datos: 6, 9, 9, 12, 12, 12, 15 y 17
Solución: Calculando la media aritmética se obtiene Calculando la desviación estándar poblacional se obtiene:
Calculando la Medida de Fisher se obtiene: Datos 6
915,0625
9
39,0625
9
39,0625
12
0,0625
12
0,0625
12
0,0625
15
150,0625
17
915,0625
Total
2058,5
Para calcular los cuartiles y percentiles se ordena los da tos de menor a mayor: 6
9
Calculando el cuartil uno se obtiene:
9
12 12 12 15 17
Calculando el cuartil tres se obtiene:
Calculando el percentil 90 se tiene:
Calculando el percentil 10 se tiene:
Calculando el coeficiente percentil de curtosis se obtiene:
Como K= 2,23 y
la distribución es platicúrtica