SOF T WA RE E ST A D ÍST I CO SPS SPSS S
T em ema a N° 22:
M edi das de r esu me men n
Medidas de Tendencia central.
Medidas de tendencia no central
Medidas de Dispersión
Medidas de forma
Comunícate con nosotros. 481614 // PAC Presencial:
[email protected]//
[email protected] // PAC Virtual:
[email protected]
Capacidad del Tema
1. Reconoce Reconoce y utiliza las medidas medidas de tendencia tendencia central, central, no central, de dispersión y de forma en SPSS. SPSS.
Conocimientos Previos
Define e ingresa datos en SPSS y genera obtiene estadísticos básicos.
Conflicto Cognitivo
El Estudiante reconoce la importancia de saber determinar las medidas de resumen que se pueden obtener en SPSS mediante la formulación de la siguiente pregunta: ¿Qué tipo de medidas de resúmen podemos obtener de los datos obtenidos de una población o muestra?
Los Estudiantes mediante una lluvia de ideas van determianndo las diferentes medidas de resúmen que se pueden obtener de un conjunto de datos.
Comunícate con nosotros. 481614 // PAC Presencial:
[email protected]//
[email protected] // PAC Virtual:
[email protected]
22.1. INTRODUCCIÓN La Estadística Descriptiva es el primer paso en la investigación de poblaciones o conjunto de datos procedentes del recuento o de experimentos. Nos proporciona herramientas que nos permiten resumir la información obtenida y pasar así de un gran volumen de datos a otro más reducido. La Estadística Descriptiva cubre un amplio conjunto de técnicas y métodos. En este capítulo contemplamos sólo algunos conceptos, los más elementales. Las principales medidas que se estudian en la Estadística Descriptiva son:
• Medidas de Posición • Medidas de Dispersión • Medidas de Asimetría y Curtosis • Medidas de Concentración
22.2. MEDIDAS DE POSICION Medidas de posición central Las medidas de posición central más comunes son: la media, la mediana, y la moda. La media, a su vez, puede ser definida como media aritmética, geométrica y
armónica. Cada una de ellas presenta sus ventajas e
inconvenientes y su elección depende tanto de la naturaleza de la estadística como del propósito para el que se utiliza.
a) La media aritmética. Es la suma de todos los valores de la variable dividida por el número total de los datos.
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
Ejemplo:
Las ventajas de utilizar la media aritmética son:
− En el cálculo intervienen todos los valores de la variable − Es única − Es calculable − Es el centro de gravedad de la distribución. Sin embargo está muy afectada por los valores extremos que presenten los datos, lo que puede originar que a veces las conclusiones no sean muy atinadas.
b) La media geométrica. Es la raíz N-ésima del producto de los valores de la variable elevados por sus respectivas frecuencias.
La propiedad fundamental de esta media es que el logaritmo de la media geométrica es igual a la media aritmética de los logaritmos de los valores de la variable. La principal ventaja que ofrece esta media respecto a la media aritmética es su menor sensibilidad respecto a los valores extremos de la variable. La desventaja es que no está determinada si alguno de los valores de la variable es negativo. También tiene un significado menos intuitivo que la media aritmética.
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
Su utilización más frecuente es promediar porcentajes, y también se aconseja su uso cuando se presupone que la variable analizada se ha formado a partir de variaciones acumulativas.
c) La media armónica. La media armónica es la media aritmética de los inversos de los valores de la variable.
En ciertos casos la media armónica es más representativa que la media aritmética. Tiene como inconvenientes que está muy influenciada por los valores pequeños y no está determinada cuando algún valor de la variable es igual a cero.
d) La mediana. La mediana se encuentra en el lugar posición central de conjunto ordenado de datos, si el número de datos es impar. Cuando el número de valores es par se toma la media aritmética de los dos valores centrales. La propiedad fundamental de la mediana es que la suma de todas las desviaciones en valor absoluto de la variable respecto de la mediana es mínima. La mediana adquiere mayor importancia cuando las variables son ordinales, o susceptibles de ser ordenadas, en cuyo caso la mediana es la medida de tendencia central más representativa.
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
El Cálculo de la mediana para datos agrupados La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas. N/2
es la semisuma de las frecuencias absolutas.
Li-1
es el límite inferior de la clase donde se encuentra la mediana.
Ni-1
es la frecuencia acumulada anterior a la clase mediana.
ni
la frecuencia del intervalo.
Ci
es la amplitud de la clase.
Ejemplo:
f i 5 18 42 27 8 100
[60, 63) [63, 66) [66, 69) [69, 72) [72, 75)
Fi 5 23 65 <= Aquí se 92 encuentra 100 la mediana
Li
=
[66, 69) =66
N/2
=
100 / 2 =50
Ni-1
=
23
ni
=
42
Ci
=
3
Mediana
=
66
50−2 42 × 3
=67,93
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
d) La moda. Es el valor de la variable que más veces se repite. Si existen dos o más valores empatados en el número de repeticiones, solo se muestra el más pequeño de ellos.
El Cálculo de la moda para datos agrupados Para distribuciones agrupadas en intervalos se utiliza la siguiente fórmula.
Li-1
es el límite inferior de la clase donde se encuentra la moda.
n i + 1 la frecuencia del intervalo posterior.
n i - 1 la frecuencia del intervalo anterior.
Ejemplo:
Ci
f i 5 18 42 27 8 100
[60, 63) [63, 66) [66, 69) [69, 72) [72, 75)
Li
Fi 5 23 65 <= Aquí se 92 encuentra 100 la moda
=
[66, 69) =66
n
i-1
=
18
n
i+1
=
27
Ci
=
3
Mediana
=
66
es la amplitud de la clase.
27 × 3 18+27
= 67,8
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
Medidas de posición no central Son medidas de posición no central los cuartiles, deciles y percentiles. Las medidas de posición no centrales dividen la distribución en partes iguales. Los cuartiles son tres valores y dividen la distribución en cuatro partes iguales. Los deciles son nueve y dividen la distribución en diez partes. Los percentiles son 99 y dividen la distribución en cien partes. Para distribuciones agrupadas en intervalos utilizamos la siguiente fórmula:
Ejemplo 1: A continuación se realiza un ejercicio sencillo relacionado con las medidas de posición no centrales. El enunciado dice que se presentan los tiempos (en minutos) logrados por 20 estudiantes, en una prueba de 200 metros planos. Nos piden hallar los valores correspondientes al cuartil 1, 2 y 3. A parte de ello nos piden responder para la serie de datos dada ¿tiene sentido buscar percentiles?¿Cómo procedemos a obtener los cuartiles en SPSS?
Teniendo en cuenta la lista de valores:
2
2,6
1,9
2
1,3
1,2
2,4
1,6
1,7
2,8
2,2
2,3
1,8
2,3
2,6
2,8
1,9
1,7
1,5
2,5
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
Distribuimos los valores de manera ordenada en una columna. En este ejemplo se debe tener en cuenta que como el número de datos es par, es necesario entonces utilizar dos valores intermedios para así promediarlos.
1,2 1,3 1,5 1,6 1,7 1,7 1,8 1,9 1,9 2 2 2,2 2,3 2,3 2,4 2,5 2,6 2,6 2,8 2,8
(1,7+1,7 2 ) = 1,7
( 2 +2 2 ) = 2
(2,4 +2 2,5) = 2,45
Dividimos en otras cuatro partes. En esas fracciones es donde se establecen las medianas que corresponderán a los cuartiles 1, 2 y 3. El análisis de los cuartiles indica los valores que contienen el 25%, 50% y 75% de la información. El análisis de estos cuartiles indica: El primer 25% de los datos reportan valores inferiores a 1.7 minutos, la mitad logró valores por debajo o iguales a los 2 minutos, y el 75% logró tiempos hasta 2.4 minutos aproximadamente.
¿Tiene sentido buscar percentiles? No, porque tenemos una muestra inferior
en número a
100, por lo que no
habría datos suficientes para cubrir esta información.
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
¿Cómo obtenemos los cuartiles en SPSS? Seguimos los pasos:
1. Analizar Estadísticos Descriptivos Frecuencias
2. En Estadísticos, activamos Cuartiles.
3.- Luego observamos el Visor de Resultados Estadísticos numero N
Válidos
20
Perdido
0
s Percentile 25
1,7000
s
50
2,0000
75
2,4500
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
2.3. MEDIDAS DE DISPERSION Medidas de dispersión absoluta Las medidas de dispersión o de variabilidad miden la representatividad de las medidas de tendencia central, obteniéndose como desviación de los valores de la distribución respecto a estas medidas. Las medidas de dispersión o de variabilidad son: el recorrido, el recorrido intercuartílico, la desviación absoluta media respecto a la media aritmética, la desviación absoluta media respecto a la mediana, la varianza y la desviación típica o estándar. Tomaremos en cuenta las siguientes medidas:
La Varianza
La Desviación típica o estándar
Las propiedades de la desviación típica son:
Es siempre mayor o igual que cero
Es una medida de dispersión óptima
Está acotada superior e inferiormente
No está afectada por cambios de origen
Si que está afectada por cambios de escala (queda multiplicada por el factor de escala)
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
Ejemplo Calcular la varianza y desviación típica de las siguientes cantidades medidas en metros de un conjunto de personas. Las alturas hasta la cabeza son: 1.76
1.72
1.52
1.68
1,65
Así que la altura media es 1,67 metros. En el imagen inferior lo especificamos mediante una línea roja.
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
Ahora calculemos la diferencia de cada altura con la media:
0,11 0,05
0,01 -0,02
-0,15
0,112 + 0,052
+ (-0,15)2 + 0,012 + (-0,02)2 4
0,0376
=
4
=
0,0094
Elementos - 1
La varianza es 0,0094 Y la desviación estándar es la raíz de la varianza: Desviación estándar es =√0,0094 = 0,09695 La desviación estándar es útil, pues vemos que las alturas están a distancia menos de la desviación estándar (0,09695 m) de la media: 0,11 0,05
=0,09695
=0,09695
0,01 -0,02
-0,15
Así que usando la desviación estándar tenemos una manera "estándar" de saber qué es normal, o extra grande o extra pequeño.
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
¿Cómo obtenemos la Desviación Típica y Varianza en SPSS? Seguimos los pasos:
1. Analizar Estadísticos Descriptivos Frecuencias
2. En Estadísticos, activamos Desviación típica y Varianza.
3.- En el Visor de Resultados se obtiene lo siguiente: Estadísticos tamano N
Válidos
5
Perdido
0
s Desv. típ.
,09695
Varianza
,009
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
2.4. MEDIDAS DE FORMA Medidas de Distibución - Asimetría y Curtosis Las medidas de distribución nos permiten determinar la característica de cómo los valores se muestran: agrupados o separados. Sus principales medidas son la Asimetría y la Curtosis.
A. ASIMETRÍA Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmética). La asimetría presenta las siguientes formas: Asimetría positiva, cuando la distribución de los datos tiende a la izquierda de la media aritmética. Simétrica, cuando se distribuyen aproximadamente la misma cantidad de los datos a ambos lados de la media aritmética. Asimetría negativa, cuando la distribución de los datos tiende a la derecha de la media aritmética.
Asimetría positiva
Eje de simetría (media)
Simétrica
Eje de simetría (media)
Asimetría negativa
Eje de simetría (media)
La medida del Coeficiente de asimetría, se puede obtener mediante dos formas de ecuaciones:
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
Coeficiente de Fisher:
Donde Xi ni
=
cada uno de los valores.
=
la media de la muestra.
=
la frecuencia de cada valor
Coeficiente de Karl Pearson
Donde =
media aritmética.
Md
=
Mediana.
s
=
desviación típica o estándar.
Los resultados de esta ecuación se interpretan: Si la distribución es simétrica, ambos índices son iguales a 0; si es asimétrica a la derecha, ambos son positivos; y si es asimétrica a la izquierda, ambos índices son negativos.
B. CURTOSIS La curtosis mide el grado de agudeza o achatamiento de una distribución con relación a la región central de la distribución. La curtosis presenta las siguientes formas: Leptocúrtica, cuando existe una gran concentración. Mesocúrtica, cuando existe una concentración normal. Platicúrtica, cuando existe una baja concentración.
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
Leptocúrtica
Mesocúrtica
Platicúrtica
La medida del Coeficiente de asimetría, se obtiene mediante la siguiente ecuación:
Donde Xi = = ni =
cada uno de los valores. la media de la muestra. la frecuencia de cada valor.
Los resultados de esta fórmula se interpretan: Si este obtenido coeficiente es nulo, la distribución recibe el nombre de
mesocúrtica; Si el coeficiente es positivo, la distribución se llama leptocúrtica( más puntiaguda que la anterior); si el coeficiente es negativo, la distribución se llama platicúrtica (más achatada que la primera). Cuando la distribución de los datos cuenta con un coeficiente de asimetría (g1 = ±0.5) y un coeficiente de Curtosis de (g2 = ±0.5), se le denomina Curva Normal. Este criterio es de suma importancia ya que para la mayoría de los procedimientos de la estadística de inferencia se requiere que los datos se distribuyan normalmente.
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
¿Cómo obtenemos la Desviación Típica y Varianza en SPSS? Seguimos los pasos:
1. Analizar Estadísticos Descriptivos Frecuencias
2. En Estadísticos, activamos Desviación típica y Varianza.
Actividad
:
Investigar sobre las medidas de concentración.
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
AutoEvaluación: 1. Teniendo en cuenta el tema, se puede clasificar las medidas de posición
en : a) ___________________________ b)________________________
2. Teniendo en cuenta lo descrito en el tema describe la desventaja de utilizar: a) Media Aritmética : _______________________________________ _____________________________________________________________ b) Media Geométrica : _________________________________________ _____________________________________________________________ c) Media Armónica : _________________________________________ _____________________________________________________________
3. ¿Qué entendemos por?: a) Cuartil : _______________________________________ _____________________________________________________________ b) Decil : _________________________________________ _____________________________________________________________ c) Percentil : _________________________________________ _____________________________________________________________
1) Describe en pocas palabras las medidas de distribución: a) Medida de asimetría: _______________________________________ _____________________________________________________________ _____________________________________________________________ _____________________________________________________________ _____________________________________________________________ b) Medida de Curtosis : _________________________________________ _____________________________________________________________ _____________________________________________________________ _____________________________________________________________ _____________________________________________________________
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
Práctica del Tema 1. Del ejemplo 1 de este tema, con respecto al tiempo obtenido por cada uno de los participantes:
2
2,6
1,9
2
1,3
1,2
2,4
1,6
1,7
2,8
2,2
2,3
1,8
2,3
2,6
2,8
1,9
1,7
1,5
2,5
a) Determina la desviación estándar e interpreta su resultado obtenido. b) Determina su asimetría y curtosis que le corresponde. 2. De los siguientes datos:
a) Determine los cuartiles de las notas solo del sexo masculino. Interpreta el resultado.
Referencias de interés sobre el Tema
Desviación Estándar como interpretar su significado http://www.youtube.com/watch?v=m4kimPxXzvE. SPSS varianza y desviación estándar muestral datos no agrupados http://www.youtube.com/watch?v=qEFQjEmi9cg Medidas de tendencia central http://www.youtube.com/watch?v=-26QN9QRicg
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]