1. MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN PARA DATOS DATOS SIMPLES. Entre las medidas de tendencia central tenemos:
Media. Media geométrica. Media armónica. Mediana. Moda.
Se debe tener en cuenta que existen variables cualitativas y variables cuantitativas, por lo que las medidas de posición o medidas de tendencia se usan de acuerdo al tipo de variable que se está observando.
1.1
Medidas de tendencia central
Media: ( x ) Es el promedio aritmético de todos los valores que componen el conjunto de datos. fórmula.
Se calcula mediante la siguiente sigu iente
No olvidando que la ( x ) está afectada por los valores extremos .si el valor muy grande o muy pequeño con respecto al resto de valores.
1.1.2 DATOS NO TABULADOS Ó SIN AGRUPAR
Para una muestra y para una población se tiene respectivamente: Muestra Población
x
xi xi
n
xi
N
Ejemplo 1: En un equipo de fútbol, una muestra de estaturas de sus integrantes son las siguientes: 1.70,1.79,1.73,1.67,1.60,1.65,1.79,1.84,1.67,1.82, 1.74. Calcule la media.
x
xi xi n
19 11
1.73
Si es representativa representativa (Homogeneidad Datos)
Ejemplo 2: Dado los Siguientes Datos siguientes: 2, 3, 5, 100 Calcule la media.
x
xi n
110 4
27.5
No es Representativo (No homogeneidad de Datos)
1.1.3 DATOS TABULADOS Ó AGRUPADOS
Se considera dos casos para datos agrupados en tablas sin intervalos y otros en tablas por intervalos al cual se puede aplicar la siguiente Formula
Para una muestra y para una población se tiene respectiva mente: Muestra Población
x
xi f i
n
x f i
i
N
Ejemplo 1: En un salón de clase se pregunto el número de mascotas que tenían en Casa cuales repuestas fueron las siguientes:
Variables # de X Mascotas fi 0 3
0
1
8
8
2
5
10
3 4
4
12
5
20
Total
25
50
S i e s
Xi . fi
Ejemplo 2:
0 = no tienen mascotas 1 = Tienen una mascota 2 = Tienen dos mascotas 3 = Tienen tres mascotas 4 = Tienen cuatro mascotas Calcule la media.
x
xi. fi n
50 25
2
Formula de la Marca de clase Clases ó Intervalos
0.4 - 2.7 2.7 - 5.0 5.0 - 7.3 7.3 - 9.6 9.6 - 11.9 11.9 - 14.2 14.2 - 16.5 TOTAL
Marca de Clase Xi
Frecuencia fi
1.55 3.85 6.15 8.45 10.75 13.05 15.35 -------
5 8 14 11 7 3 2 50
Xi . fi
X
Li Ls
2
0.4 2.7 1.55 2
Formula de la Media ( x )
7.75 30.8 86.1 92.95 75.25 39.5 30.7
x f 363.05 7.261
x
i
i
n
50
x f = i
i
363.05
MEDIANA: ( x~ Ó me) Es la medida de Tendencia Central que divide un conjunto ordenado en forma creciente o decreciente en dos grupos iguales de modo que la mitad (50%)de las observaciones tendrá valores que son menores que la mediana y la otra mitad (50%) alcanzara valores mayores que esta .
DATOS NO TABULADOS Ó SIN AGRUPAR: n 1 , Si es una muestra. Me
2
Me
N 1 2
, Si es una Población.
Si es impar :la mediana es la observación que esta en el lugar (n+1)/2 ,esto es :
Me X n 1 (
2
)
Si es par :la mediana es el promedio de las observaciones n/2 y n/2+1 , esto es:
X n X n 1 Me
(
Nota: Se aplica a datos Cuantitativos.
2
)
(
2
)
2
Ejemplo 1: Encuentre la mediana para los siguientes Datos impares. 9, 12, 5, 16, 8, 3,11 1. Ordenamos los Datos: 3, 5, 8, 9, 11, 12, 16
2. Una vez ordenado los datos , como el numero de datos es impar (7) se busca el que tiene | (
n 1
la posición
2
(
)
ó sea
7 1 ) 2
este número es el 4 ,buscamos el
Número que ocupa la cuarta posición en los datos ordenados encontramos el valor de la mediana Me = 9
Ejemplo 2: Encuentre la mediana para los siguientes Datos inpares. 1.74 , 1.79 , 1.79 , 1.67 , 1.67 , 1.70 , 1.73 , 1.82 , 1.84 , 1.60 , 1.65 1. Primero Ordenamos los datos de mayor a menor se obtiene:
1.60 , 1.65 , 1.67 , 1.67 , 1.70 , 1.73 , 1.74 , 1.79 , 1.79 , 1.82 , 1.84; 2. Una vez ordenado los datos , como el numero de datos es impar (11) se busca el que (
tiene la posición
(
n 1 2
)
ó sea
111 ) 2
este número es el 6 ,
Buscando el número que ocupa la sexta posición en los datos ordenados encontramos el valor de la mediana Me = 1.73.
Ejemplo 3: Encuentre la mediana para los siguientes Datos Pares. El riesgo de manifestar deficiencia de hierro en algún momento es alto , en particular durante el embarazo .el problema con esta detección de deficiencia es que algunos métodos para cuantificar el hierro se ven afectados por el estado de embarazo , considere los siguientes datos en relación con la concentración de receptor de trasferencia para una muestra de mujeres con pruebas de laboratorio de anemia explicita por deficiencia de hierro (“Serum Transferrin receptor for the Detection of Iron Deficiency in Pregnancy ” , Amen .J.of Clinical Nutrition, 1991: 10771081):
15.2 9.3 7.6 11.9 10.4 9.7 20.4 9.4 11.5 16.2 9.4 8.3
Determine la mediana (Me): 1. Primero Ordenamos los datos de mayor a menor se obtiene:
7.6 , 8.3 , 9.3 , 9.4 , 9.4 , 9.7 ,10.4 , 11.5 ,11.9, 15.2 ,16.2, 20.4 2. Una vez ordenado los datos , como el numero de datos es par (12) utilizamos la siguiente Fórmula:
3. En este caso n = 12 , por consiguiente la mediana se localiza entre los valores centrales X 6 y X7 Es decir entre los valores 9.7 y 10.4 . Por lo tanto , el valor mediano es :
X n X n 1 Me
(
2
)
Me 10.05
(
2
)
2
X 6 X 7 9.7 10.4 2 2
El valor de la mediana Me = 10.05 Nota: Estas formulas son muy objetivas y de fácil aplicación , pero no siempre se utilizan ;generalmente se apela a una distribución de frecuencias , cuando es grande la cantidad de datos disponibles .
EJEMPLOS DE DATOS TABULADOS - AGRUPADOS:
Se considera dos casos para datos agrupados en tablas sin intervalos y otros en tablas por intervalos al cual se puede aplicar la siguiente Formula
Me LI (
(
n 2
) Fi 1
fi
) * Tic
Ó
Me LI (
(
n ) Fi 1 2
Fi ( Fi 1)
) * Tic
Ejemplo 2: Encuentre la mediana para los siguientes Datos Se obtuvo una distribución de frecuencias de 100 alumnos de la UNP, según su estatura, se pide determinar el valor mediano de las estaturas. Li - Ls 150 - 155 155 - 160 160 - 165
Marca de clase X 152.5 157.5 162.5
Fi 4 5 12
21
165 - 170
167.5
33
54
170 175 180 185
172.5 177.5 182.5 187.5
17 16 9 4
71 87 96 100
-
100
-
-
175 180 185 190
Total
Fi 4 9
1°) Calculamos la Posición de Orden
FI- 1 Fi Fi+1
(
n 2
)
2°) Por las frecuencias Acumuladas se identifica la clase que contiene a la mediana, esto es, la clase para el cual se cumple.
Fi – 1 ≤ (n/2) ≤ Fi Ó 21 ≤ (50) ≤ 54
Remplazamos los datos en la formula obtendremos:
Me LI (
(
n ) Fi 1 2
fi
) * Tic 165 (
54 21 ) * 5 170 33
Interpretación: Este valor mediano significa, que el 50% de los alumnos tienen una estatura menor o igual que 170 Cm. , en tanto que el otro 50% tienen una estatura mayor que 170 Cm.
MODA (Mo): Es el valor que se representa con mayor frecuencia en un conjunto de datos Mo = Observación con mayor frecuencia
DATOS NO TABULADOS Ó SIN AGRUPAR: Ejemplo 01: Muestra : 2 ; 2 ; 4 ; 5 ; 5 ; 6 ; 6 ; 7 ; 9 ; 1 ; 8 ; 8 ; 8 ; 3
Distribución monomodal (Tiene una Mo)
Mo =8
Población : 3 ; 3 ;4 ;1 ;5 ; 6 ;7 ;3 ;8 ;7; 9 ;2 ;7 Mo =3
Distribución bimodal (Tiene dos Mo)
Mo =7
Muestra: 1; 2; 3; 6; 7:9; 8
Distribución Amodal o Uniforme
Mo =No hay moda
Nota: La moda es una medida de tendencia Central muy inestable porque cambia de valor al pasar de una muestra a otra.
DATOS TABULADOS Ó AGRUPADOS: Tablas con intervalos: para poder desarrollar utilizaremos la formula de Cruzber Donde:
Mo LI (
d 1 d 1 d 2
d 1 =fi – fi-1 ) * Tic d 2 =fi – fi+1
Li =Limite inferior de la clase modal Fi = Frecuencia absoluta de la clase modal. Fi-1 = Frecuencia absoluta de la clase inmediatamente anterior a la clase modal . Fi+1 = Frecuencia absoluta de la clase inmediatamente Posterior a la clase modal Tic= amplitud .
Determinar Para la siguiente distribución : Li - Ls 150 - 155 155 - 160 160 - 165
Marca de clase X 152.5 157.5 162.5
165 - 170
167.5
12 33
170 175 180 185
172.5 177.5 182.5 187.5
17 16 9 4
-
100
-
175 180 185 190
Total
fi 4 5 Fi-1 Fi Fi+1
1° Tomamos el punto central a si como dice la teoría Tomamos de referencia la mayor frecuencia como punto central o F i 2° Luego recién aplicamos la formula d 1 =33 – 12 = 21 d 2 =33 – 17 = 16 Tic = 5
Mo 165 (
21 ) * 5 167.8378378 21 16
LA MEDIA GEOMÉTRICA(DATOS NO TABULADOS O NO AGRUPADOS) Es una cantidad arbitraria de números (por decir n números) es la raíz n-ésima del producto de todos los números, es recomendada para datos de progresión geométrica, para promediar razones, interés compuesto y números índices
X G
n
x1 * x2 ... * xn
MEDIA GEOMETRICA (DATOS TABULADOS O AGRUPADOS) Primero debemos de aplicar logaritmo de base 10 con la siguiente Formula :
log10 Luego la media Geométrica :
1 n
k
ni * Log 10 * yi i 1
X G anti log(1,8545 ) Pero para desarrollar el antilog10 (log10) Se aplica cierta propiedad matemática la cual es : EJEMPLO 01 Marca de Clase Frecuencia
92 4
93 11
94 21
95 10
96 4
Ordenamos los Datos Yi 92 93 94 95 96 Total
ni 4 11 21 10 4 50
Log10 Yi 1.96378787 1.9689829 1.9731278 1.9777236 1.9822712 -------
ni log10 Yi 7.8551513 21.653312 41.435684 19.777236 7.929084 98.650464
Primero calculamos Log con base 10 (Yi). Segundo los resultados los multiplicamos por n i.
Primero aplicamos la formula Log base 10:
log 10
G
98.650464 1.97300938 50
Para después aplicar la formula de la media Geométrica:
X G anti log(1.97300938 ) 1.97300038
10
93.9731533
MEDIA GEOMÉTRICA AHORA PARA DATOS CON INTERVALOS
Donde: MG es media geométrica, yi es marca de clase, fi la frecuencia de clase correspondiente, n el número total de datos utilizados.
LA MEDIA ARMONICA Se define como la inversa de la media aritmética de los inversos de un conjunto de datos
X A
n n n1 n 2 ... k x1 x2 xk
n n
1
x i 1
i
Calcula la
media armónica para este conjunto de datos.
5 , 9 , 12 , 7 , 15 , 3
X A
6 1 1 1 1 1 1 5 9 12 7 15 3
6.4
Nota:
La media armónica siempre es menor o igual que la media aritmética, ya que para cualesquiera números reales positivos Considera todos los valores de la distribución y en ciertos casos, es más representativa que la media aritmética. La influencia de los valores pequeños y el hecho que no se puede determinar en las distribuciones con algunos valores iguales a cero; por eso no es aconsejable su empleo en distribuciones donde existan valores muy pequeños. Se suele utilizar para promediar velocidades, tiempos, rendimientos, etc.
Media Armónica de datos agrupados. La media armónica para datos tabulados (media armónica ponderada) se define por:
yH Mh
1 1 n
k
i1
ni yi
n n ni i1 yi
(23)
donde k = número de clases, y i = marca de clase, n i = frecuencia de clase con i=1, 2,…, k
Ejemplo Con los datos de la siguiente tabla de frecuencias, correspondiente a una distribución continua, calcular la media armónica Li - L S 2.1 - 6.0 6.1 - 10.0 10.1 - 14.0 14.1 - 18.0 18.1 - 22.0 ∑
yH
f i 3 7 12 16 20 40
X i 4 8 12 16 20 -
f i /Xi 0.750 0.875 1.000 0.500 0.500 3.625
n 40 11.03 n f i 3.625 i 1 x i
Ventajas y desventajas de la Media Armónica. Ventajas. 1. Se usa preferentemente para calcular la velocidad media. 2. De gran utilidad cuando la variable está dada en forma de tasa, costo medio de bienes comprados con una cantidad fija.
Desventajas 1. La media armónica se basa en todas las observaciones por lo que está afectado por los valores extremos. 2. La media armónica no esta definido, si alguno de los valores es cero.
Propiedades de la Media Armónica.
1. La media Armónica se basa en todas las observaciones, por lo que está afectado por todos los valores de la variable. Da a los valores extremadamente grandes un peso menor que el que las dá la media geométrica, mientras que a los valores pequeños les da un peso mucho mayor que el que las dá la media aritmética como la media geométrica.
2. La suma algebraica de las desviaciones de los recíprocos de las observaciones del recíproco de la media armónica es nula. Es decir,
1 1 0 x H i 1 x i n
3. Para términos positivos, la media armónica es menor o igual que la media geométrica. O sea,
xH xG
4. De la propiedad 3 y la propiedad 4 (de la media geométrica), se tiene: xH xG x Siempre que se trate del mismo conjunto de datos.
Aplicaciones de la media armónica. La media armónica se aplica en los casos siguientes: 1. Cuando se tiene términos para cuyos recíprocos se quiere calcular su media.
2. Cuando se presenta una relación inversa entre las variables implícitas, como por ejemplo, entre la productividad y el tiempo. Es decir,
e p t
de donde p e
1 t
donde e = espacio ; p = productividad ; t = tiempo La velocidad y el tiempo también están en relación inversa: e
v t
, v e
1 t
donde e = espacio ; v = velocidad ; t = tiempo
Ejemplo Suponga que ha gastado usted, un sol por 3 docenas de naranjas en una tiende, otro sol por 4 docenas de naranja en una segunda tienda y otro sol más por 5 docenas en una tercera tienda. Determine el precio promedio por una docena de naranjas.
Solución. Obtendremos primero el precio pagado por docena de naranja. En la primera ud. ha gastado 1 sol por 3 docenas de naranjas o sea 1/3 de sol por docena. En la segunda gastó 1 sol por 4 docenas, es decir ¼ de sol por cada docena. En la tercera tienda gastó 1 sol por 5 docenas, o sea 1/5 de sol por cada docena. En otras palabras queremos calcular la media de los recíprocos de los números 3, 4 y 5. Entonces, la media armónica es el promedio correcto. Luego n = 3, x1 = 1/3, x2 = 1/4, x3 = 1/5, es decir
x H
3 3
1 x i1 i
3 3 3 0.25 1 1 1 3 4 5 12 1/ 3 1/ 4 1/ 5
Por tanto, el precio promedio por docena es 0.25 soles.
Comprobación. Se compró 12 docenas de naranjas por 3 soles. Veamos si pagando en promedio 0.25 por docena, en doce docenas se gasta 3 soles. 0.25 x 12 = 3 soles Veamos que ocurre si usamos la media aritmética:
1 1 1 20 15 12 47 3 4 5 60 x 0.261 3 3 180 En este caso el promedio por docena es 0.261 Pagando 0.261 soles por docena, tendríamos 0.261 x 12 = 3.132 soles Es decir, se obtiene 0.132 soles más de lo que en realidad se gastó por las 12 docenas. Por tanto, la media aritmética en este caso es incorrecta.
MEDIA ACOTADA (Truncated Mean): Determinado porcentaje de los valores más altos y bajos de un conjunto dado de datos son eliminados (tomando números enteros), para los valores restantes se calcula la media.
Ejemplo 01: Para la siguiente serie de datos calcule la media acotada al 20%: 68.7, 34.3, 97.9, 73.4, 8.4, 42.5, 87.9, 31.1, 33.2 ,97.7 ,72.3, 54.2, 80.6 ,71.6 ,82.2, Como tenemos 11 datos, el 20% de 11 es 2.2, por lo cual eliminamos 2 datos el más bajo y el más alto, ordenado los datos obtenemos:
8.4, 31.1, 33.2, 34.3, 42.5, 54.2, 68.7, 71.6 ,72.3 ,73.4 ,80.6 ,82.2 ,87.9 ,97.7 ,97.9,
los valores a eliminar son: 8.4 y 97.9; calculando la media de los datos restantes ~,.20 63.82 x obtenemos