¿Qué es Simetría? La simetría es cuando su mediana, su moda y su media aritmética coinciden. ¿Qué es Asimetría? Es la medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmética). La asimetría presenta tres estados diferentes [Fig.5-1], cada uno de los cuales define de forma concisa como están distribuidos los datos respecto al eje de asimetría. Se dice que la asimetría es positiva cuando la mayoría de los datos se encuentran por encima del valor de la media aritmética, la curva es Simétrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la media y se conoce como asimetría negativa cuando la mayor cantidad de datos se aglomeran en los valores menores que la media.
El Coeficiente de asimetría, se representa mediante la ecuación matemática,
Donde (g1) representa el coeficiente de asimetría de Fisher, (Xi) cada uno de los valores, valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta ecuación se interpretan:
(g1 = 0): Se acepta que la distribución es Simétrica, es decir, existe aproximadamente la misma cantidad de valores a los dos lados de la media. Este valor es difícil de conseguir por lo que se tiende a tomar los valores que son cercanos ya sean positivos o negativos (± 0.5). (g1 > 0): La curva es asimétricamente positiva por lo que los valores se tienden a reunir más en la parte izquierda que en la derecha de la media. (g1 < 0): La curva es asimétricamente negativa por lo que los valores se tienden a reunir más en la parte derecha de la media.
Primer coeficiente de sesgo de Pearson:
= media aritmética; Mo= Moda; S x= Desviación típica.
En este coeficiente de asimetría si: a) A=0, la distribución es simétrica. b) A>0, las distribución es asimétrica a la derecha, positiva. c) A<0, la distribución es asimétrica a la izquierda, negativa. Para evitar el empleo de la moda Pearson comprobó empíricamente que:
Lo que dio lugar al segundo coeficiente de sesgo de Pearson:
Curtosis o Medidas de Apuntamiento La palabra curto viene del latín “curtus”, que significa corto o menguado. Se utiliza la palabra Curtosis para denominar a las medidas de forma que miden el apuntamiento o el achatamiento de las distribuciones campaniformes que son unimodales y ligeramente asimétricas. Estas medidas estudian la concentración de los diversos valores de la variable en la zona de la media. Cuanto mayor sea la concentración en la zona central, mayor será su apuntamiento, y por el contrario, si la concentración en esta zona central es baja, se dirá que la curva es curta o achatada. Para poder discernir si una curva es achatada o alargada se toma como distribución referencia la Distribución normal, que viene dada por la expresión:
μ y σ son
los valores de la media y la varianza.
Las distribuciones campaniformes adoptan las siguientes denominaciones se gun su grado de apuntamiento o Curtosis: Mesocúrtica: Tiene el mismo apuntamiento que la distribución Normal. Leptocúrtica: Mas apuntada que la Normal. Platicúrtica: Más achatada que la Normal. Interpretación: >0 Leptocúrtica
=0 Mesocúrtica
<0 Platicúrtica
¿Qué es momento de una Variable? Los momentos de una distribución son medidas obtenidas a partir de todos sus datos y de sus frecuencias absolutas. Estas medidas caracterizan de tal forma a las distribuciones que si los momentos de dos distribuciones son iguales, diremos que las distribuciones son iguales. Podemos decir que dos distribuciones son más semejantes cuanto mayor sea el número de sus momentos que coinciden. Se define el momento de orden h respecto al origen de una variable estadística como:
Es inmediato observar que, para h=1, a1 es la media de la distribución. Los primeros momentos con respecto al origen son:
Se c =
se llama momento con respecto de la media o momento central:
Los primeros momentos respecto a la media son
Coeficiente momento Sesgo: k
a3
m3 S
3
f x i
i
x
3
i1
Coeficiente
ns
3
Sesgo
momento de sesgo =0
No
hay
distribución
sesgo.
La es
insesgada >0
La distribución tiene sesgo positivo o a la derecha.
<0
La distribución tiene sesgo negativo o a la izquierda.
Coeficiente momento de Curtosis. El Coeficiente de Curtosis analiza el grado de concentración que presentan los valores alrededor de la zona central de la distribución. El Coeficiente de Curtosis viene definido por la siguiente fórmula:
Datos No Agrupados: n
a4
m4 S
4
x
i
x
4
i 1
ns
3
Datos Agrupados k
Coeficiente momento de
a4
curtosis
=3
La distribución es Mesocúrtica.
>3
La distribución es Leptocúrtica.
<3
La distribución es Platicúrtica.
Los resultados pueden ser los siguientes:
f x
Curtosis
g2 = 0 (distribución Mesocúrtica). g2 > 0 (distribución Leptocúrtica). g2 < 0 (distribución Platicúrtica).
m4 S
4
i
i
x
i 1
ns
4
4
Aplicación: Vamos a calcular el Coeficiente de Curtosis de la serie de datos referidos a la estatura de un grupo de alumnos (lección 2ª): Variable (Valor) x
Frecuencias absolutas Simple Acumulada x
x
Frecuencias relativas Simple Acumulada x
x
1,20
1
1
3,3%
3,3%
1,21 1,22
4 4
5 9
13,3% 13,3%
16,6% 30,0%
1,23
2
11
6,6%
36,6%
1,24 1,25 1,26 1,27 1,28 1,29 1,30
1 2 3 3 4 3 3
12 14 17 20 24 27 30
3,3% 6,6% 10,0% 10,0% 13,3% 10,0% 10,0%
40,0% 46,6% 56,6% 66,6% 80,0% 90,0% 100,0%
Recordemos que la media de esta muestra es 1,253 S((xi - xm)^4)*ni x
S((xi - xm)^2)*ni x
0,00004967
0,03046667
Luego: (1/30) * 0,00004967 ------------------------------------------------- - =1,39 g2 = 3 ((1/30) * (0,03046667))^2 Por lo tanto, el Coeficiente de Curtosis de esta muestra -1,39, lo que quiere decir que se trata de una distribución Platicúrtica, es decir, con una reducida concentración alrededor de los valores centrales de la distribución.