1 Tema: Medidas de tendencia central, localización y dispersión Saber: 1. Defi Defini nirr los con conce cept ptos os de de medi medidas das de: de: -Tendencia central: media, mediana y moda Localización: cuartíles, dec íles y percentiles -Dispersión: rano, !arianza, des!iación est"ndar y des!iación media #. $%plicar $%plicar el proceso proceso del c"lculo c"lculo de las medidas medidas de tenden tendencia cia central, central, localizació localización n y dispersión dispersión para para datos datos arupados y no arupados y su interpretación. &. $%plicar $%plicar el c"lculo c"lculo de las las medidas medidas de tendencia tendencia central, central, localización localización y dispers dispersión ión con con soft'are. soft'are. (acer: 1. Determinar Determinar las medida medidas s de tendencia tendencia central, central, localizac localización ión y dispersión. dispersión. #. )nterpretar )nterpretar las medidas medidas de tende tendencia ncia centra central, l, localizaci localización ón y dispersión. dispersión. &. *btene *btenerr las medida medidas s de tendenc tendencia ia central, central, localiza localizació ción n y dispersió dispersión n de datos datos relacio relacionad nados os con su perfil perfil profesional, en soft'are
4.1 Medidas de tendencia central para datos no agrupados +ecor +ecorda dando ndo ue los datos datos se pueden pueden arupa aruparr en clases clases inter inter!al !alos os de datos datos llamados datos arupados, mientras ue los no arupados no consideran clases. Darts contos continuos y discretos respecti!amente. respecti!amente. Las medidas de tendencia centrales representan el !alor m"s representati!o de toda la población. Las medidas de tendencia central m"s utilizadas son: media, la mediana y la moda. 4.1.1 Media: $s el !alor promedio promedio o simplemente promedio. promedio. Se calcula de esta manera:
/l e%istir !alores e%tremos o aberrantes outliers, la media no ser" una medida representati!a del centro de la distribución. distribución. Ejemplo: 0alcula Ejemplo: 0alcula la media de las siuientes dos muestras
ara la muestra 1:
Muestra 1
2
4
6
2
4
6
Muestra 2
3
6
7
8
7
15
#
ara la muestra #:
4.1.2. Mediana La mediana es el !alor ue se encuentra e%actamente a la mitad de un con2unto de datos ordenado. Se puede llear a tener dos casos: 0antidad de datos par o impar. ➢ Si el n3mero de datos es impar, la mediana es el !alor de en medio ➢ Si el n3mero de datos es par, la mediana es el promedio de los dos datos. / la mediana no la afectan !alores e%tremos o aberrantes porue solo considera la posición del !alor central. Ejemplo: $ncuentre la mediana para las siuientes muestras Muestra 1
4
5
16 1#
17
Muestra #
4
5
16
8
1&
18 11
#7
Para la muestra 1: *rdenamos la muestra de manera ascendente de izuierda a derec9a: 4
5
16 1#
17
18
La cantidad de n3meros es par, por tanto
Para la muestra 2: *rdenamos en forma ascendente 8
4
5
16
11 1&
#7
Los datos son impar y la posición del centro es 16 color ro2o, por tanto, la media es 16
4.1.3. Moda La moda es el !alor ue se repite con mayor frecuencia. Si e%isten dos se les denomina bimodal. Si 9ay m"s de dos, se denomina multimodal. Muestra 1
#
- 1#
&
-8
-&
7
#
-7
- -7 -7
Muestra #
4
-#
5
5
8
-5
-5
-4
7
7
-8
1
8
-8
&
Notamos que el valor que tiene mayor frecuencia es −5 con tres repeticiones, y se considera unimodal. por tanto ara la muestra #:
Al observar el diagrama, encontramos que son cuatro valores −9, -7, 5, 7 y 9 los que tienen dos repeticiones. or consiguiente,
4.2. Medidas de localización para datos no agrupados +ecordamos ue la mediana di!ide en dos partes iuales al con2unto de datos. ero cuando se di!ide en cuatro partes se conoce como 0uartiles, en diez deciles y en cien perciles. Ejemplo 1: Se presentan #6 obser!aciones en orden del tiempo de falla, en 9oras, de un material aislante el;ctrico: #6
##4
#7#
&66
<#
8#6
41<
51#
118<
1#5<
1&5#
144
171#
#7#6
#47<
&15#
&7#4
&816
*rdenamos de forma ascendente #6 ##4 #7# &66 <# 8#6 41<
51#
118< 1#5< 1&5# 144 171# #7#6 #47< &15# &7#4
&816
$l con2unto son #6 datos, por tanto, $l primer cuartil debe contar con el #7= de las obser!aciones por deba2o de ;l y el 87= por encima de ;l. $l seundo cuartil debe tener al menos el 76= de las obser!aciones por deba2o y encima de ;l mediana. #6 ##4 #7# &66 <# 8#6 41< 51#
118< 1#5< 1&5# 144
171# #7#6 #47< &15# &7#4
&816
#
Ejemplo 2: Se tiene los siuientes datos 16
11
11
1#
1#
1&
1&
1&
1
17
18
14
#6
$l con2unto son #6 datos, por tanto, $l primer cuartil debe contar con el #7= de las obser!aciones por deba2o de ;l y el 87= por encima de ;l. $l seundo cuartil debe tener al menos el 76= de las obser!aciones por deba2o y encima de ;l mediana. 16
11
11
1#
1#
1&
1&
1&
1
17
18
14
#6
4.3. Medidas de dispersión para datos no agrupados $s importante analizar cu"n cercanos o le2anos est"n los datos respecto, al !alor medio por e2emplo o cualuier otro ue se necesite. ara determinar esto se recurre a las llamadas medidas de dispersión o de !ariabilidad, las medidas m"s importantes son: el rano, la !arianza y la des!iación est"ndar. De esta manera, si dos rupos de datos tienen el mismo centro, este centro es m"s descripti!o para el rupo ue presenta menor !ariabilidad. 4.3.1. Rango $l rano depende de dos !alores. Se calcula: Los !alores aberrantes influyen en el !alor del rano. Ejemplo: 0alcula los ranos de las muestras siuientes: Muestra 1
#
# -1
Muestra #
7
<
6 -#
&
< -# #
la principal des!enta2a:
&
#
1 -1
&
ara la muestra 1: ara la muestra #: 4.3.2. Varianza La !arianza es la medida de dispersión m"s importante. Muestra cu"n ale2ados o cu"n cercanos est"n los datos respecto a la media. Si un dato est" muy cerca de la media, al ele!ar esa distancia al cuadrado se 9ar" m"s peue>a. Si el dato est" muy le2os de la media, la distancia al cuadrado entre ese dato y la media se 9ar" mayor. De esta manera 9ace m"s e!idente si una distribución tiene una dispersión alta o ba2a. Varianza Po#lacional
es!iación est"ndar
Varia#les 2
σ : !arianza poblacional. x i !alor i del con2unto de
7
Muestral
datos.
μ N
es la media poblacional.
x
es la media muestral
?3mero de datos
n
es el tama>o de la
muestra
4.3.2. es!iación est"ndar La des!iación est"ndar es la medida de dispersión m"s utilizada, e%presa el ale2amiento de los datos con respecto a la media en las mismas unidades ue los datos oriinales. La des!iación est"ndar es la raíz cuadrada de la !arianza. Ejemplo: 0alcula la !arianza y la des!iación est"ndar de la muestra siuiente: Muestra
7 7
6
-1 -#
&
$olución: rimero se calcula la media: Despu;s, calculamos la !arianza muestral
La des!iación est"ndar es la raíz cuadrada de la !arianza: Ejemplo: Se entre!istó a #6 2ó!enes para conocer u; cantidad en litros de refresco de cola beben al día. Los resultados son ;stos. Describe la distribución de los datos, analizando tanto las medidas de tendencia central como las de dispersión. 6.&&
1.<7
6.5
1.
1.&
6
1.<7
6.&&
1.<7
6.<<
6.55
6.<<
1.<7
6.&&
6.&&
1.
6.55
6.<<
6.<<
6
%a media:
La cantidad media de refresco de cola ue bebe una persona es 6.487 litros. %a mediana: *rdenamos de manera ascendente. 6
6
6.&&
1.
6.&&
6.&&
1.
6.&&
6.<<
1.
6.<<
6.<<
1.<7
6.<<
6.55
1.<7
6.55
6.55
1.<7
1.<7
< Se tienen #6 datos par por lo ue se toma los datos en la posición 16 y 11 se calcula el promedio y el resultado es la mediana: las personas 76= beben menos o m"s de 6.4#76 litros.
. La mitad de
%a moda: $%isten & modas: 6.&&, 6.<< y 1.<7 repitiendo !eces cada uno de ellos # 6
6
6.&&
6.&&
&
&
6.55
6.55
6.&&
6.&&
6.<<
6.<<
6.<<
6.<<
6.55
1.
1.
1.
1.<7
La cantidad típica la ue m"s se repite de refresco consumida es 6.&& litros.
Rango: La diferencia entre la persona ue m"s consume refresco y la ue menos es de 1.<7 litros.
Varianza muestral:
, la media es
es!iación est"ndar muestral:
. La dispersi!n del consumo
de refresco con respecto a la cantidad media es de "#−$.559% litros. &s decir, ¯ x =0.8745 la cantidad de consumo se encuentra entre dado la media ❑ 0.8745 + 0.5592 =1.4337
y
0.8745 − 0.5592 = 0.3153
litros.
1.<7
8
4.4. Medidas de tendencia central para datos agrupados $l t;rmino datos arupados se refiere a cuando tenemos los datos di!ididos por clases y contamos 3nicamente con la frecuencia de cada una de ellas, es decir, tenemos una tabla de frecuencias. 4.4.1. %a media apro&imada La media apro%imada se obtiene al sumar todos los productos de la frecuencia por la
marca de clase y di!idir entre el total de datos, es decir, donde es la media apro%imada. f i es la frecuencia absoluta de la clase i. marca de clase i. n es el n3mero i de obser!aciones.
x i es la
4.4.2. %a mediana apro&imada ➢ La marca de clase ue est; en la posición n @ 1, si el n3mero de datos n es impar.
➢ * bien, el promedio de las marcas de clase ubicadas en los luares n 2
+1
n 2
y
, si el n3mero de datos n es par.
4.4.3 %a moda apro&imada $s la marca de clase con la frecuencia m"s alta. Si e%isten dos modas se llama bimodal y si e%isten m"s de dos multimodal. 4.4.4. Medidas de dispersión para datos agrupados. Tambi;n es importante determinar la dispersión en una distribución de frecuencias. ara ello se re!isar"n la !arianza y la des!iación est"ndar apro%imadas. 4.4.4.1 Varianza apro&imada des!iación estandar ara calcular la !arianza apro%imada para datos arupados. Varianza
es!iación est"ndar
Varia#les
s
2
es la !arianza
a❑
apro%imada.
f i
es l a
frecuencia absoluta de la clase i.
x i
de cl ase i.
es la marca
x a
es la
media apro%imada es n el n3mero de obser!aciones
4 Ejemplo: Se entre!istó a #6 2ó!enes para conocer u; cantidad en litros de refresco de cola beben al día. Describe la distribución de los datos, analizando tanto las medidas de tendencia central como las de dispersión considerando datos arupados. La tabla de frecuencias es la ue se muestra en la tabla
'lase
%(mites in)eriores
%(mites superiores
Marca de clase
)a
)r
1
6
6.&&
6.1<7
<
&6
#
6.&&
6.<<
6.57
#6
&
6.<<
6.55
6.4#7
&
17
6.55
1.
1.177
&
17
7
1.
1.<7
1.47
#6
Total
2*
1**.**
$olución ara la media apro%imada:
este resultado indica ue una persona bebe, en promedio, 6.8#7 litros. ara la mediana apro%imada, dado ue el n3mero de muestras es de n A #6, entonces la mediana se encuentra entre 16 y 11, esto es Buscamos entonces en la columna de frecuencia absoluta acumulada en donde se encuentra el 16.7 %(mites in)eriores
'lase
%(mites superiores
Marca de clase
)a
)aa
1
6
6.&&
6.1<7
<
<
#
6.&&
6.<<
6.57
16
&
6.<<
6.55
6.4#7
&
1&
6.55
1.
1.177
&
1<
7
1.
1.<7
1.47
#6
Total
$ntonces menos o m"s de 6.<< litros.
2*
lo ue indica ue 76= de las personas beben
%a moda, es la marca de clase con mayor frecuencia, de la tabla obser!amos ue la clase con mayor acumulado es la clase 1 el cual tiene una marca de clase de 6.1<7 litros. La cantidad de refresco mayormente consumida es de 6.1<7 litros.
%a !arianza apro&imada+ de la fórmula
5 De la tabla de frecuencias 'lase
Marca de clase
)a
1
6.1<7
<
#
6.57
&
6.4#7
&
1.177
&
7
1.47
Total
2*
+ealizamos primero la sumatoria uedando
/9ora sustituimos en la fórmula de la !arianza uedando.
%a des!iación est"ndar apro&imada sólo se calcula la raíz cuadrada de la !arianza:
'o que signi(ca que la dispersi!n respecto al consumo promedio de refrescos de cola es de "#− $.5)%$ litros. &n otras palabras, una persona toma en promedio $.7*%5 litros de refresco, pero podr+a tomar entre $.5)%$ y ).%57$ litros.