ESTADÍSTICA I
Gilma Sabina Lizama
ASIMETRIA Y CURTOSIS Las medidas de forma de una distribución se pueden clasificar en dos grandes grupos o bloques: medidas de asimetría y medidas de curtosis. ASIMETRÍA: Es una expresión de la forma de la distribución, para saber si los valores de la variable se concentran en una determinada zona del recorrido de la variable. Cuando al trazar una vertical, en el diagrama de barras o histograma, de una variable, según sea esta discreta o continua, por el valor de la media, esta vertical se transforma en eje de simetría, decimos que la distribución es simétrica cuando a ambos lados de la media aritmética haya el mismo número de valores de la variable, equidistantes de dicha media dos a dos, y tales que cada par de valores equidistantes tiene la misma frecuencia absoluta. En caso contrario, dicha distribución será asimétrica o diremos que presenta asimetría. Cuando tenemos una tabla de frecuencias, y las graficamos en un histograma por ejemplo, la asimetría se refiere a si la curva que forman los valores v alores de la serie presenta la misma forma a izquierda y derecha de un valor central (la media). Para medir el nivel de asimetría se utiliza el llamado Coeficiente Coeficiente de Asimetría. Los resultados pueden ser los siguientes: g1= 0 (distribución simétrica; simétrica; existe la misma concentración concentración de valores a la derecha y a la izquierda de la media) g1 > 0 (distribución asimétrica asimétrica positiva; existe mayor concentración de valores a la derecha de la media que a su izquierda) iz quierda) g1 < 0 (distribución asimétrica asimétrica negativa; existe mayor concentración de valores a la izquierda de la media que a su derecha) 1
ESTADÍSTICA I
Gilma Sabina Lizama
SIMÉTRICA
ASIMÉTRICA A DERECHA
SIMÉTRICA
ASIMÉTRICA A IZQUIERDA
ASIMÉTRICA A DERECHA
Distribución simétrica
ASIMÉTRICA A IZQUIERDA
Distribución con sesgo positivo
Distribución con sesgo negativo
Para calcular la asimetría, una posibilidad, es utilizar el llamado coeficiente de FISHER que representaremos como g 1 y responderá a la siguiente expresión matemática:1
1 g1
1
n
3
*
i
S
3
El coeficiente de asimetría de Fisher es el más utilizado 2
ESTADÍSTICA I
Gilma Sabina Lizama
Según sea el valor de g ,1 diremos que la distribución es asimétrica a derechas o positiva, a izquierdas o negativa, o simétrica, o sea: Si g
1
>0
la
distribución será asimétrica positiva o a derechas
(desplazada hacia la derecha).
Si g
1
< 0
la
distribución será asimétrica negativa o a izquierdas
(desplazada hacia la izquierda).
Si g1= 0
la
distribución será simétrica.
g1<0
g1=0
g1>0
3
ESTADÍSTICA I
Gilma Sabina Lizama
Existen otras posibilidades de calcular la asimetría, otra de las cuales es por medio del coeficiente de asimetría de PEARSON (Ap), el cual responde a la siguiente expresión.
A p
Mo S
Aunque en la práctica este coeficiente sería más fácil de calcular que el anterior, casi no lo utilizaremos ya que solo es cierto cuando la distribución tiene las siguientes condiciones: Unimodal (una sola moda) Campaniforme (distribución simétrica o ligeramente asimetrica). Además del anterior existe otra forma de calcular la asimietría, usando la siguiente expresión:
CA
(3 Media Mediana) EstándarDesviación
Ejemplo: De la base de datos que poseen en excel, se calcularon las medidas de tendencia central y dispersión para la variable edad de los alumnos, las cuales fueron: X 22 , Md 21 , Mo 20 , S 3.28 Con estos datos, al calcular el coeficiente de asimetría de Pearson tenemos:
22 20 3.28
0.6097
Al calcularlo con la expresión
CA
(3 Media Mediana) EstándarDesviación
Tenemos: CA
(322 21) 3.28
0.9146 4
ESTADÍSTICA I
Gilma Sabina Lizama
Apartir de estos resultados, diríamos que el conjunto de datos correspondiente a las edades de los alumnos de Estadística I posee un sesgo positivo; es decir, asimetría hacia la derecha. Utilizando la fórmula de excel, el coeficiente asimetría resulta ser 1.702703525 Ejemplo: Calcular el coeficiente de asimetría para la serie de datos correspondiente a las remesas familiares que ingresaron a El Salvador durante el año 2008. Remesas (millones de $)
( X i X ) 3
Enero
275.5
-64626 .0302
Febrero
298.3
-5204 .6998
Marzo
338.4
11,805.6279
Abril
338.5
11,961.8539
Mayo
353.4
53,881.6584
Junio
334.4
6,612.9131
Julio
332.1
4,467.6670
Agosto
305.7
-979.14 66
Septiembre
304.7
-1,305.7513
Octubre
304.3
-1,454.4196
Noviembre
264.8
-131,328.9068
Diciembre
337.5
10,460.3532
Meses
Total X
315.63 ; Md 318.9 S
-105,708.8808 27.65
En este caso no hay moda, por lo tanto no se puede aplicar la fórmula del coeficiente de asimetría de Pearson.
CA
(3315 .63 318.9) 27.65
0.3548
5
ESTADÍSTICA I
Gilma Sabina Lizama
Utilizando la Fórmula de Fisher:
1 g1
n
*
X i S3
X
3
= -0.4167
La serie de datos correspondiente a los ingresos en concepto de remesas familiares que ingresaron a El Salvador durante el año 2008, posee un sesgo negativo; es decir, asimetría hacia la izquierda. Calculado utilizando las fórmulas de excel resulta ser: -0.54585394
6
ESTADÍSTICA I
Gilma Sabina Lizama
CURTOSIS: Es una medida del apuntamiento (o achatamiento) en la distribución de los datos, que indicará si la distribución es muy apuntada (concentración de los datos en torno a la media) o poco apuntada (dispersión de los datos en torno a la media). El Coeficiente de Curtosis analiza el grado de concentración que presentan los valores alrededor de la zona central de la distribución. Se definen 3 tipos de distribuciones según su grado de curtosis: Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal). Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores centrales de la variable. Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable. Para calcularlo utilizaremos la expresión:
1 g2
n
*
X i S
4
X
4
3
Los resultados pueden ser los siguientes: Si g2> 0 la distribución será leptocúrtica o apuntada Si g2= 0 la distribución será mesocúrtica o normal Si g2< 0 la distribución será platicúrtica o menos apuntada que lo normal. 7
ESTADÍSTICA I
Gilma Sabina Lizama
Distribución Leptocúrtica
Distribcuón Mesocúrtica
Distribución Platicúrtica
Ejemplo: Calcular el coeficiente de curtosis para la serie de datos correspondiente a las remesas familiares que ingresaron a El Salvador durante el año 2008. Remesas (millones de $)
( X i X ) 4
Enero
275.5
2593442.59181
Febrero
298.3
90197.4481752
Marzo
338.4
268814.148034
Abril
338.5
273567.598762
Mayo
353.4
2035110.23901
Junio
334.4
124124.379506
Julio
332.1
73582.4758688
Agosto
305.7
9722.92630401
Septiembre
304.7
14271.862332
Octubre
304.3
16478.5744872
Noviembre
264.8
6675448.33198
Diciembre
337.5
228767 .92455
Meses
Total X
315.63
12403528.5008 S
27.65 8
ESTADÍSTICA I
1 g2
Como
n
*
X i S
g2
Gilma Sabina Lizama
4
X
4
3
1 *12403528.5008 12 = 3 (27.65) 4
1.23
0 , decimos que la distribución es platicúrtica o menos apuntada que
lo normal.
9