CAPÍTULO 5 ESTADÍGRAFOS ESTADÍGRAFOS DE POSICIÓN, DISPERSIÓN, COMPARACIÓN Y FORMA 1. INTRODUCCIÓN Las distri distribuc bucion iones es de frecuen frecuencia cias s o probab probabili ilidad dades, es, se pueden pueden resumi resumirr mediante mediante estadí estadígra grafos fos de posici posición, ón, dispersión, comparación y forma. Un esquema de los principales estadígrafos que resumen las distribuciones de frecuencias se muestra en la figura 5.1.1. Figura 5.1.1. Estadígrafos de posición, dispersión, comparación y forma
Nominales
Posición
Moda
Ordinales
Posición
Moda Mediana
Atributos
Media aritmética Mediana Posición
Estadígrafos
Moda Media geomérica Media armónica Rango
Tipo I Variables
Dispersión
Desiación est!ndar
Tipo II
Amplitud cuart"lica
Tipo III
Amplitud cent"lica Comparación
Coe#iciente de ariación Variable tipi#icada Coe#iciente de asimetr"a
Forma
Coe#iciente de curtosis
Fuente: Elaboración propia continuación se describir!n y desarrollar!n las formas de c!lculo para cada estadígrafo.
2. ESTADÍGRAFOS DE POSICIÓN "#
2.1. Introdu!"n La información que contiene cualquiera de las distintas formas de distribución de frecuencias o probabilidades sobre los $alores de una $ariable, es posible reducirla o condensarla utili%ando estadígrafos o indicadores de posición central. E&emplo 1: 'ara describir la edad indicadora, en forma resumida, de los alumnos que (acen el pre)uni$ersitario, se dice que tienen en promedio 1* a+os. E&emplo #: 'ara describir la temperatura en oc(abamba se dice que el promedio es de #- o, es decir un clima templado. Los principales indicadores de tendencia central son:
• • • • •
• • •
edia aritm/tica oda ediana
• •
edia armónica edia geom/trica
Las distribuciones de frecuencia de atributos, si son de atributo nominal, pueden e0presarse en forma forma resumi resumida da usan usando do la frecu frecuen enci cia a o la moda moda,, en cambi cambio o si son son de tipo tipo ordi ordina nal, l, la información queda resumida mediante la moda o mediana. Las distribuciones de frecuencia de $ariable, $ariable, cualquiera cualquiera fuese el tipo 2, 22 o 2223, pueden resumir resumir la información información usando cualquiera cualquiera de los 5 indicadores antes mencionados.
2.2. M#d!$ $r!t%&t!$ 2.2.1. D#'!n!!"n
• •
Es un $alor determinado en alg4n punto del recorrido de la $ariable. Este punto resulta ser el centro de gra$edad de la distribución. En general se define como el $alor que resulta de di$idir los $alores registrados de la $ariable entre el n4mero de ellos. Este $alor llamado media aritm/tica se simboli%a por: n
$ & M' $ %& µ
=
∑$
i
=
i =)
n
$) + $ (
+ + $n n
2.2.2. D#t#r%!n$!"n d# ($ %#d!$ $r!t%&t!$ #n d!)tr!*u!on#) d# 'r#u#n!$ $+ T!o I- La media en distribuciones tipo 2 se determina aplicando la definición general. Es llamada tambi/n: media aritm/tica de distribución no ordenada o no ponderada.
*+ T!o II- En el c!lculo de la media aritm/tica en distribuciones tipo 22, se aplica la e0presión anterior a+adiendo pesos o ponderaciones: n
$=
∑ $i ni i =)
n
donde ni son las ponderaciones ni frecuencia absoluta3. • • Una manera f!cil de determinarla es efectuando operaciones en la tabla de distribución de frecuencias de la siguiente manera: • • 6e multiplica la primera columna 0 i3 por la segunda columna n i3. Este producto se anota en la tercera columna. "7
2.1. Introdu!"n La información que contiene cualquiera de las distintas formas de distribución de frecuencias o probabilidades sobre los $alores de una $ariable, es posible reducirla o condensarla utili%ando estadígrafos o indicadores de posición central. E&emplo 1: 'ara describir la edad indicadora, en forma resumida, de los alumnos que (acen el pre)uni$ersitario, se dice que tienen en promedio 1* a+os. E&emplo #: 'ara describir la temperatura en oc(abamba se dice que el promedio es de #- o, es decir un clima templado. Los principales indicadores de tendencia central son:
• • • • •
• • •
edia aritm/tica oda ediana
• •
edia armónica edia geom/trica
Las distribuciones de frecuencia de atributos, si son de atributo nominal, pueden e0presarse en forma forma resumi resumida da usan usando do la frecu frecuen enci cia a o la moda moda,, en cambi cambio o si son son de tipo tipo ordi ordina nal, l, la información queda resumida mediante la moda o mediana. Las distribuciones de frecuencia de $ariable, $ariable, cualquiera cualquiera fuese el tipo 2, 22 o 2223, pueden resumir resumir la información información usando cualquiera cualquiera de los 5 indicadores antes mencionados.
2.2. M#d!$ $r!t%&t!$ 2.2.1. D#'!n!!"n
• •
Es un $alor determinado en alg4n punto del recorrido de la $ariable. Este punto resulta ser el centro de gra$edad de la distribución. En general se define como el $alor que resulta de di$idir los $alores registrados de la $ariable entre el n4mero de ellos. Este $alor llamado media aritm/tica se simboli%a por: n
$ & M' $ %& µ
=
∑$
i
=
i =)
n
$) + $ (
+ + $n n
2.2.2. D#t#r%!n$!"n d# ($ %#d!$ $r!t%&t!$ #n d!)tr!*u!on#) d# 'r#u#n!$ $+ T!o I- La media en distribuciones tipo 2 se determina aplicando la definición general. Es llamada tambi/n: media aritm/tica de distribución no ordenada o no ponderada.
*+ T!o II- En el c!lculo de la media aritm/tica en distribuciones tipo 22, se aplica la e0presión anterior a+adiendo pesos o ponderaciones: n
$=
∑ $i ni i =)
n
donde ni son las ponderaciones ni frecuencia absoluta3. • • Una manera f!cil de determinarla es efectuando operaciones en la tabla de distribución de frecuencias de la siguiente manera: • • 6e multiplica la primera columna 0 i3 por la segunda columna n i3. Este producto se anota en la tercera columna. "7
La suma de dic(o producto se di$ide entre el tama+o de población o uni$erso $er tabla 5.1.13. 8abla 5.1.1 !lculo de la media aritm/tica en distribuciones tipo 22
!
n!
! / n!
01 0#
n1 n# : nn n
01 9 n1 0# 9 n# : 0n 9 nn ∑ 0i 9 ni
-
0n
$
=∑
tal que:
Fuente: Elaboración propia
$i ni n
+ T!o III- La e0presión de c!lculo de la media aritm/tica en una distribución de frecuencias tipo 22 se aplica tambi/n al caso de (allar dic(o estadígrafo en una distribución tipo 222, si acaso esta distribución se la con$ierte a tipo 22. La transformación mencionada se efect4a de la forma en la que se obser$a en la tabla 5.1.#. 8abla 5.1.# 8ransformación de la tabla 8ipo 222 a tipo 22 tipo 222
transformada a
L!01 0 L!
tipo 22
n!
Lo ) L1 L1 ) L#
n1 n# : ! 6L! 7 L!01+82 01 nn 0# ∑ ni n
-
Ln)1 ) Ln
n! n1 n# : nn ∑ ni n
-
0n
• • •
Fuente: Elaboración propia
ic(a transformación se produce reempla%ando los inter$alos de clase por sus $alores medios o marcas de clase semisuma de los límites de cada inter$alo3.
•
2.2. E)#r$n$ %$t#%3t!$ 2ndica el $alor promedio que se desea obtener en una distribución de probabilidades.
$+ Fun!"n Fun!"n d# u$nt4$- 6i la distribución probabilística es una función de cuantía, la esperan%a matem!tica se obtiene mediante la siguiente e0presión:
-'$% =
n
∑$
i
P, $ i + para
$
= *&)& (& & n
i =)
• •
*+ Fun!"n d# d#n)!d$d- 6i la e0presión matem!tica es de función de densidad, la esperan%a matem!tica se obtiene de la siguiente manera: •
-'$% =
∞
∫ $ −∞
•
2.. Mod$ •
2..1. D#'!n!!"n "-
i
# , $ i + d$ para
−∞ ≤ $ ≤ ∞
• •
• • • •
La moda es el $alor de la $ariable que responde a la frecuencia m!s alta. 6e dice tambi/n que es el $alor de la $ariable m!s frecuente. Este estadígrafo de tendencia central se usa para resumir la información en el caso de distribuciones de atributo nominal, ordinal y en el caso de las $ariables discretas o continuas.
2..2. D#t#r%!n$!"n d# ($ %od$ #n d!)tr!*u!on#) d# 'r#u#n!$ $+ T!o I- En las distribuciones tipo 2, no e0iste posibilidad de (allar la moda, por que dic(a
distribución se dice que es de tipo unitaria. • • *+ T!o II- En las distribuciones tipo 22, la moda se determina aplicando la definición. • • + T!o III- La moda en distribuciones tipo 222 se (alla de dos maneras: • 13 6e transforma la distribución tipo 222 en tipo 22, cambiando la columna de inter$alos con una de marcas de clase y se aplica la definición de la moda. #3 6e aplica una fórmula empírica o3: • • 6i la distribución tipo 222 es de inter$alo no constante: • n i +) a i +) Mo = .i −) + ,a + n i +) n i −) i + a i +) a i −) • donde: ai mplitud del inter$alo de clase modal. Li)1 Frontera inferior de la clase modal. El índice ;i; corresponde al orden de la frecuencia m!s alta y Li)1 ) Li al inter$alo modal. •
6i la distribución tipo 222 es de inter$alo constante, la moda se determina aplicando la siguiente fórmula empírica: •
Mo • • • • • • •
= .i −) +
n i +) n i +) + n i −)
,a i +
2... Mod$ #)#r$d$ La moda en una distribución de probabilidad, corresponde a aplicar las condiciones de un m!0imo.
$+ Fun!"n d# u$nt4$- 6i f03 es una distribución de cuantía, la moda se determina aplicando la definición.
• •
*+ Fun!"n d# d#n)!d$d- 6i f03 es una distribución de densidad, se puede determinar la moda mediante tres procedimientos:
• •
•
a3
13 plicando el m/todo para (allar un m!0imo absoluto en un inter$alo. onsiste de los siguientes pasos:
•
≤ $ ≤ b Un punto crítico es aquel que se obtiene igualando a cero o a no e0iste la primera deri$ada de una # / , $ + = * función: a
"5
• •
b3 c3
alcule f03 en estos $alores críticos y en los puntos e0tremos 0 a y 0 b. 6eleccione el $alor mayor de f03 obtenido en el paso #. Este es el m!0imo absoluto, que puede ser
# / / , $ + < *
confirmado mediante el criterio de la segunda deri$ada: . • • #3 plicando la fórmula empírica para inter$alos constates o no constantes.
• • •
P i0) a i0) Mo 1 .i −) 0 2 ai P i0) P i−) 0 a i0) a i −)
Mo 1
P i0) 2 a i 0 .i −) P i0) 0 P i −)
73 8ransformando la distribución tipo 222 en una tipo 22 mediante las marcas de clase y aplicando la definición de la moda. • • Not$- En una distribución de frecuencias o probabilidades, cuando e0isten dos o m!s $alores que corresponden a la frecuencia m!s alta, se dice que la distribución es bimodal o multimodal. El $alor de una distribución de frecuencias que corresponde a la frecuencia m!s ba&a, se denomina antimoda. •
2.9. M#d!$n$ •
2.9.1. D#'!n!!"n • •
• • • •
• •
Es un $alor de la $ariable que permite distribuir en dos partes igualmente proporcionales a la distribución de frecuencias. e otra manera se dice que la mediana es un $alor que supera a no m!s de 5=> de los $alores obser$ados. La mediana es un estadígrafo de ubicación y permite determinar si un $alor cualquiera de la $ariable forma parte del primer o del segundo grupo.
2.9.2. C3(u(o d# ($ %#d!$n$ #n d!)tr!*u!on#) d# 'r#u#n!$ El procedimiento para su c!lculo es diferente seg4n el tipo de distribución para el que se desea (allar.
• • $+ T!o I- 6e distinguen # casos: • • 13 6i el n4mero de t/rminos de la distribución es impar • 6e ordenan los datos de la distribución en forma ascendente o descendente. El $alor de la mediana corresponde al t/rmino central, es decir: •
Me = $ n +) (
•
#3 6i el n4mero de t/rminos de la distribución es par • •
6e ordenan los datos de la distribución en forma ascendente o descendente. El $alor de la mediana es el promedio de los $alores centrales pre$iamente ordenados, es decir: •
Me • ""
=
$n
+ $n
(
(
(
+)
*+ T!o II- El $alor de la mediana en una distribución tipo 22, se determina tomando en cuenta el siguiente procedimiento: • •
6e determinan los $alores de la frecuencia absoluta acumulada ?i3. 6e calcula la mitad del uni$erso n@#3 y se lo ubica entre dos $alores de la frecuencia absoluta acumulada, tal que en símbolos corresponde a la siguiente e0presión:
N i −) ≤ •
n (
≤ Ni
6i ?i A n@#, el $alor 0i correspondiente, es la mediana.
Me 1
$ i 0 $ i0) (
6i ?i n@#, la mediana es: • + T!o III- En este tipo de distribución, la mediana se calcula utili%ando una fórmula empírica: •
n Me
donde:
= .i −) +
(
− N i −) ni
,a i +
ai nc(o del inter$alo de clase m ediana Li)1 Límite inferior de la clase mediana. •
2.9.. M#d!$n$ #)#r$d$ La mediana esperada es el $alor de la $ariable aleatoria que di$ide a una distribución de probabilidades en dos partes igualmente proporcionales.
$+ Fun!"n d# u$nt4$- El procedimiento para (allar la mediana esperada en una función de cuantía es el siguiente: •
6e determina los $alores de probabilidad acumulada.
•
6e ubica el $alor =.5 entre dos $alores consecuti$os de probabilidad acumulada: que si: • •
Pac ,$ i + > *34
entonces
Me = $i
Pac ,$ i + = *34
entonces
Me =
Pac ,$ i−) + ≤ *34 ≤ Pac ,$ i +
, tal
$ i + $ i+) (
*+ Fun!"n d# d#n)!d$d- La mediana esperada de una función de densidad puede ser calculada por tres m/todos: 13 ediante la siguiente integral: ∞
Me
∫
−∞
# ,$+ d$ =
∫
# ,$+ d$ =
Me
) (
−∞ ≤ $ ≤ ∞
#3 ediante la siguiente fórmula empírica para distribuciones tipo 222:
Me = .i −) +
*34 − Pac ,$ i−) + P,$ i +
,a i +
• •
73 ediante la transformación de la distribución tipo 222 en tipo 22, seguido del procedimiento para el c!lculo de la mediana para esa distribución. "B
2.5. M#d!$ $r%"n!$ 2.5.1. D#'!n!!"n Es un $alor de la $ariable que se determina como el $alor recíproco medio de los $alores recíprocos de la $ariable. 6e la usa generalmente cuando se quiere determinar la tasa media de uso de un producto.
2.5.2. D#t#r%!n$!"n d# ($ %#d!$ $r%"n!$ $+ T!o I- 'ara una distribución tipo 2, la e0presión de c!lculo es la siguiente: 51
n n
∑ $) i1)
i
*+ T!o II : III- En una distribución de frecuencia tipo 22 o 222, la media armónica se calcula de la siguiente manera: 51
n n
∑ $) 2 ,n + i
i1)
i
2.;. M#d!$ <#o%&tr!$ 2.;.1. D#'!n!!"n La media geom/trica es la raí% en/sima del producto de los $alores considerados de una $ariable representada por: n
6 1 $) 2 $ ( 2 3 3 3 2 $ n 1 n
n
∏$
i
i =)
Ceneralmente es una me&or medida que la media aritm/tica cuando los datos est!n en porcenta&es o unidades relati$as.
2.;.2. D#t#r%!n$!"n d# ($ %#d!$ <#o%&tr!$ $+ T!o I- La definición anterior se utili%a en caso de obtener la media geom/trica en la distribución tipo 2. *+ T!o II o III- En distribuciones tipo 22 y 222, la media geom/trica se obtiene aplicando la siguiente definición: n
n
n) )
n( (
6 1 $ 2 $ 23332 $
n 7 7
1n
∏$
ni i
i =)
2.=. S#(#!"n d#( #)t$d4
uando la distribución es sim/trica o le$emente asim/trica, cualquiera de los estadígrafos es adecuado, prefiri/ndose siempre la media aritm/tica. uando la distribución es muy asim/trica, la media no debe usarse como representati$a, porque se $e afectada por $alores e0tremos de la $ariable. Es me&or usar la mediana, ya que no se $e afectada por $alores e0tremos. 6i la distribución es bimodal o multimodal, la moda no debe usarse como representati$a. Ceneralmente la moda se usa para distribuciones de atributo nominal u ordinal. 6i los datos est!n en porcenta&es, y /stos se incrementan en forma multiplicati$a, la me&or medida de posición es "*
•
la media geom/trica. 6i se quiere (allar la media de la tasa de uso de un bien, es me&or usar la media armónica. • • 6i se comparan las tres medias que se (an $isto en el capítulo: aritm/tica, geom/trica y armónica, dan $alores de acuerdo a su magnitud del siguiente modo: • • • •
• • • • •
armónica , 5+ < geométrica ,6 + < aritmética , $ +
La media aritm/tica da muc(o relie$e a los elementos grandes de una serie estadística, por el contrario, las medias geom/trica y armónica destacan la influencia de los $alores peque+os y reducen la influencia de los $alores grandes. Un !rbol de decisión para seleccionar el estadígrafo de posición adecuado es el mostrado en la figura 5.#.1.
. ESTADÍGRAFOS DE DISPERSIÓN .1. Introdu!"n
• •
• •
Los estadígrafos de tendencia central permiten resumir la información definiendo la posición de la distribución de frecuencias, tanto para $ariables como para atributos. 6in embargo esta es una caracteri%ación parcial de dic(as distribuciones. La caracteri%ación se completa, cuando adem!s de conocer la posición tambi/n se conoce su dispersión. Los estadígrafos que permiten conocer en forma resumida la dispersión de una distribución se denominan indicadores de dispersión. dem!s de ello permiten e$aluar la confiabilidad de un estadígrafo de posición.
• • 4n siendo la media aritm/tica el promedio m!s utili%ado en la pr!ctica, muc(as $eces puede dar lugar a falsas interpretaciones. Esto ocurrir! cuando no tenga suficiente grado de representati$idad, es decir, cuando los $alores de la $ariable est/n poco concentrados, o lo que es lo mismo, muy dispersos a su alrededor. Entonces, poco podr! decir la media sobre la población en estudio. Es necesario acompa+ar la media aritm/tica con una medida del grado de dispersión de los $alores de la $ariable a su alrededor, de forma que, cuanto mayor sea esta medida, menor ser! el grado de representati$idad de la media y $ice$ersa. • •
"D
FIGURA 5.2.1. >R?OL DE DECISIÓN PARA LA SELECCIÓN DEL ESTADÍGRAFO DE POSICIÓN ADECUADO • • •
si
• • •
Moda
Nominal Atributo
No :a; estad"gra#o
no
•
si
•
Moda
Ordinal
• • •
Mediana
no
8Clasi#icación del atributo<
89ólo :a; una moda<
• • •
Media geométrica
• •
si
8Caracter"stica de la •población< •
Variable
Media armónica
•
si
• •
no
si
• • • •
8Datos son "ndices<
Mediana
no 8Datos son tasas de uso<
no
•
8.a arian=a es grande<
• • • • •
• • • • • •
Fuente: Elaboración 'ropia
Media aritmética
• • • • • •
• • • • • •
Fuente: Elaboración 'ropia
Los principales son:
El recorrido. La $arian%a y la des$iación est!ndar. La amplitud y des$iación cuartílica. La amplitud centílica.
'or e&emplo una caracteri%ación completa de la temperatura de oc(abamba es: La temperatura media es de ## , con una dispersión dada por la des$iación est!ndar de 1# . 6i la dispersión es muy grande, entonces la temperatura media no ser! un $alor representati$o. •
ependiendo qu/ medida de tendencia central se elige, deber! ir acompa+ada con el estadígrafo de dispersión adecuado. continuación se entregan estas relaciones:
Media Aritm é tica→ Desviaci ó n est á ndar Mediana → Desviaci ó n cuart í lica o cent í lica 'ara comprender me&or qu/ es lo que in$olucra que e0ista una $ariación en los datos de una serie estadística, se describen aquí algunos aspectos importantes: 1. u!nto m!s dispersos est/n los datos, m!s aumentar! el rango, la des$iación est!ndar o la amplitud cuartílica, y
• • • • • •
Los principales son:
El recorrido. La $arian%a y la des$iación est!ndar. La amplitud y des$iación cuartílica. La amplitud centílica.
'or e&emplo una caracteri%ación completa de la temperatura de oc(abamba es: La temperatura media es de ## , con una dispersión dada por la des$iación est!ndar de 1# . 6i la dispersión es muy grande, entonces la temperatura media no ser! un $alor representati$o. •
ependiendo qu/ medida de tendencia central se elige, deber! ir acompa+ada con el estadígrafo de dispersión adecuado. continuación se entregan estas relaciones:
Media Aritm é tica→ Desviaci ó n est á ndar Mediana → Desviaci ó n cuart í lica o cent í lica 'ara comprender me&or qu/ es lo que in$olucra que e0ista una $ariación en los datos de una serie estadística, se describen aquí algunos aspectos importantes: 1. u!nto m!s dispersos est/n los datos, m!s aumentar! el rango, la des$iación est!ndar o la amplitud cuartílica, y $ice$ersa. #. 6i las obser$aciones son todas iguales de manera que no (ay $ariación en los datos3 todos los estadígrafos de dispersión ser!n igual a cero. 7. Las medidas de dispersión nunca son negati$as.
.2. R#orr!do o r$n
R $i
= VM $i − Vm $i
Esta medida de dispersión simple es de c!lculo f!cil, de uso com4n y significación concreta, para e0presar la $ariabilidad obser$ada en la distribución. 6u uso es limitado cuando deben efectuarse comparaciones debido a las unidades diferentes en que se e0presan las $ariables. 6u des$enta&a es que solo toma en cuenta los $alores e0tremos de la $ariable y no así todos ellos. Es efica% y brinda un ayuda r!pida para calcular la concentración en distribuciones uniformes. 'or e&emplo, si una $ariable se distribuye uniformemente entre los límites 5 y 1#, presentar! mayor concentración que otra que se distribuya tambi/n uniformemente entre los límites 1 a #=.
.. @$r!$n$ ..1. D#'!n!!"n La $arian%a de una distribución de frecuencia se determina por el promedio del cuadrado de las des$iaciones de la $ariable. n
∑ ,$ − $ +
(
i
( 9 1 σ 1 V '$ % 1 M '= i % 1 (
(
i1)
n
..2. D#t#r%!n$!"n #n d!)tr!*u!on#) d# 'r#u#n!$ $+ T!o I- La anterior fórmula se aplica para el c!lculo de la $arian%a en las distribuciones tipo 2. El c!lculo de la B#
$arian%a se facilita si se desarrolla con$enientemente la e0presión anterior:
9
$ =∑
(
( i
n
$ − ∑ i n
(
*+ T!o II : III- 6i las distribuciones son de tipo 22 y 222, la $arian%a se define de la siguiente manera: n
∑ ,$ − $+ 2 n (
i
(
( ( 9 1 σ 1 V '$ % 1 M '= i % 1
i
(
9
i1)
$ n =∑ ( i
n
n
$ n − ∑ i i n
(
i
.9. D#)!$!"n #)t3nd$r .9.1. D#'!n!!"n Es la raí% cuadrada positi$a de la $arian%a.
.9.2. @$r!$n$ #)#r$d$ En toda distribución de probabilidad, a fin de caracteri%arla, adem!s de (allar la esperan%a matem!tica, es necesario determinar o anali%ar la $arian%a esperada.
$+ Fun!"n d# u$nt4$- 6i se tiene una función de cuantía, la $arian%a esperada se define de la siguiente manera:
V'$% =
n
n
∑ ,$ − $+ P,$ + = ∑ $ (
i
i
i =)
i =)
( i
n P,$ i + − ∑ $ i P,$ i + i=)
(
siendo: 0 =, 1, #, 7, ... n.
*+ Fun!"n d# d#n)!d$d- 6i se tiene una función de densidad, la $arian%a esperada se define de la siguiente manera: ∞
∞
∞ ( ( V '$ % 1 ∫ ,$ − $ + #,$+ d$ 1 ∫ $ #,$+ d$ − ∫ $ #,$+ d$ −∞ −∞ −∞
(
siendo: )∞ 0 ∞
.5. A%(!tud u$rt4(!$ .5.1. D#'!n!!"n Los cuartiles son los $alores de la $ariable que di$iden a la distribución en - partes proporcionalmente iguales, como lo muestra la figura 5.7.1. Figura 5.7.1. isposición de los cuartiles en una distribución
A3C3 (4@
(4@ >)
(4@ >( 1 Me
(4@ >?
Fuente: Elaboración propia ?ota: El segundo cuartil es igual a la mediana. .. es la amplitud cuartílica.
.5.2. D#t#r%!n$!"n #n d!)tr!*u!on#) d# 'r#u#n!$ B7
$+ T!o I : II- El procedimiento para distribuciones tipo 2 y 22, se puede deducir f!cilmente de la metodología seguida para el c!lculo de la mediana. *+ T!o III- 6e (alla por medio de la siguiente ecuación:
A> = >? − >) donde el r ) /simo cuartil, se determina mediante:
rn >r
= .i −) +
B
− Ni −) ,a i +
ni
Esta ecuación es una general de la que se (a deducido la ecuación para el c!lculo de la mediana.
.5.. D#)!$!"n u$rt4(!$ La des$iación cuartílica es la mitad de la amplitud cuartílica:
D3>3 =
A3>3 (
.;. A%(!tud #nt4(!$ .;.1. D#'!n!!"n Los centiles son los $alores de la $ariable que di$iden a la distribución en 1== partes iguales, como se muestra en la figura 5.7.#. Figura 5.7.# isposición de los centiles en una distribución
A3C3 )*@ C)*
B*@
B*@ >( 1 C4* 1 Me
)*@ C*
Fuente: Elaboración propia ?ota: El cuartil # es igual al centil 5= y a la mediana. El cuartil 7 es igual al centil B5 y el cuartil 1 al centil #5. .n. es la amplitud centílica. ?ota: 'or medio de los centiles, el in$estigador puede no sólo calcular los límites del *=> central de la distribución, sino de cualquier porcenta&e que sea adecuado para sus conclusiones.
.;.2. D#t#r%!n$!"n #n d!)tr!*u!on#) d# 'r#u#n!$ $+ T!o I : II- En la pr!ctica, debido a que para calcular centiles se deben di$idir los datos en 1== partes, no se reali%a el c!lculo para distribuciones tipo 2 y 22, que contienen pocos $alores diferentes de la $ariable. 6in embargo, el procedimiento es similar que para el c!lculo de la mediana.
*+ T!o III- 6e (alla por medio de la siguiente e0presión:
ACn3 = C* − C)* B-
donde el r ) /simo centil se calcula mediante:
rn Cr
= .i−)
+ )**
− Ni −) ni
,a i +
•
.=. D!$
En su forma m!s simple, un diagrama de ca&a y bigotes proporciona una representación gr!fica de los datos, mediante el resumen de cinco $alores: $alor mínimo, cuartil 1, mediana, cuartil 7 y $alor m!0imo de la $ariable.
• • continuación en la figura 5.7.7 se muestra un diagrama de ca&a y bigotes • • 6e puede obser$ar que la ca&a contiene el 5=> central de los datos de la distribución, con los límites e0presados por el cuartil 1 y el cuartil 7. La mediana di$ide a la distribución en dos partes proporcionalmente iguales. 'or otro lado, las líneas que $an desde la ca&a (asta el $alor mayor y menor de la $ariable, son los bigotes. • • Figura 5.7.7. iagrama de ca&a y bigotes • • Valor menor >) Me >? Valor ma;or • • • • • • • • Fuente: Elaboración propia • • El gr!fico indica que la distribución est! le$emente sesgada a la i%quierda, ya que el bigote i%quierdo es de mayor magnitud al derec(o. 'or otro lado la mediana est! le$emente cerca del lado derec(o de la ca&a, lo que confirma el sesgo. • • 9. ESTADÍGRAFOS DE COMPARACIÓN •
9.1. Introdu!"n • •
• • • •
En muc(os casos de distribuciones de frecuencias de una $ariable, /stas no son comparables utili%ando la medias y la $arian%as respecti$as, por las distintas unidades en que est!n e0presadas las $ariables. Entonces es necesario construir indicadores que no est/n influidos por dic(as unidades. En este caso se construyen ra%ones tales como el coeficiente de $ariación y la $ariable tipificada o estandari%ada como instrumentos que permiten comparar entre distribuciones de frecuencias de una $ariable.
9.2. Co#'!!#nt# d# $r!$!"n El coeficiente de $ariación permite e0presar la dispersión de la distribución de frecuencias por unidad de media aritm/tica. Este coeficiente se obtiene di$idiendo la des$iación est!ndar entre la media aritm/tica. 6e simboli%a por el coeficiente G y su e0presión es:
CV = • • •
s $
En general este coeficiente se usa cuando los $alores de las medias aritm/ticas y las $arian%as B5
entre dos distribuciones no son iguales. 'ermite determinar la dispersión relati$a porcentual o el grado de (omogeneidad de una distribución. El mayor $alor del coeficiente de $ariación e0presa una mayor dispersión en la distribución. 6i se e0presa en porcenta&e sus $alores $an desde = al 1==. • • • • •
9.. @$r!$*(# t!!'!$d$ o #)t$nd$r!$d$ Es el resultado de transformar una $ariable en otra utili%ando un cambio de $ariable de manera que su media aritm/tica sea igual a cero y su $arian%a igual a uno. La $ariable tipificada %3 resulta de di$idir la des$iación de un $alor de la $ariable respecto de su media aritm/tica entre la des$iación est!ndar.
•
=i
=
$i
• • • • • • • •
−$ s
La $ariable tipificada se usa para determinar la posición relati$a entre los $alores correspondientes a distribuciones de frecuencias diferentes. La $ariable tipificada o estandari%ada es un cambio de $ariable fundamental en la inferencia estadística, porque constituye la base del muestreo a tra$/s del teorema central del límite.
5. ESTADÍGRAFOS DE FORMA O CONCENTRACIÓN 5.1. Introdu!"n
• •
Las medidas de forma o concentración permiten conocer qu/ forma tiene la cur$a que representa la serie de datos de una distribución de frecuencias. En concreto, podemos estudiar las siguientes características de la cur$a:
• •
$+
A)!%#tr4$: mide si la cur$a tiene una forma sim/trica, es decir, si respecto al centro de la misma centro de
simetría3 los segmentos de cur$a que quedan a derec(a e i%quierda son similares. • •
*+
Curto)!)- mide si los $alores de la distribución est!n m!s o menos concentrados alrededor de los $alores medios de la muestra. • 5.2. A)!%#tr4$ •
5.2.1. D#'!n!!"n • • La asimetría de una distribución puede ser determinada mediante las siguientes reglas: • 6i una distribución de frecuencias es sim/trica, se dice que no tiene sesgo o su sesgo es nulo. • • 6e dice que una distribución presenta sesgo positi$o cuando la media es mayor que la mediana o moda, debido a obser$aciones grandes. • 6e dice que una distribución presenta sesgo negati$o cuando la media es la menor de los tres promedios, por obser$aciones peque+as. • • Un diagrama que muestra los diferentes grados de simetría es el representado en la figura 5.5.1. • • Figura 5.5.1. 8ipos de asimetría de una distribución -e de simetr"a µ • x • • -e de simetr"a -e de simetr"a B"
simétrica Negatia
µ Asimétrica Positia
x
µ Cura simétrica
x
• • • • • • • •
Fuente: Elaboración propia
•
5.2.2. D#t#r%!n$!"n • •
La medición de la asimetría se reali%a mediante el coeficiente de 'earson:
C3A3 =
?,$ − Me+ s
•
• •
− ? ≤ C3A3 ≤ ?
• un $alor positi$o indicar! que la distribución tiene sesgo positi$o. • donde: un $alor negati$o indicar! que la distribución tiene sesgo negati$o. un $alor de cero, indicar! que la distribución es sim/trica. • • uanto m!s ale&ado est/ el $alor del cero, m!s asimetría tendr! la distribución. •
5.. Curto)!) •
5..1. D#'!n!!"n • • • • • • • •
La curtosis mide el grado de agude%a de una distribución. nali%a el grado de concentración que presentan los $alores alrededor de la %ona central de la distribución. 6e definen 7 tipos de distribuciones seg4n su grado de curtosis:
D!)tr!*u!"n %#)ort!$- presenta un grado de concentración medio alrededor de los $alores centrales de la $ariable el mismo que presenta una distribución normal3. D!)tr!*u!"n (#tort!$ : presenta un ele$ado grado de concentración alrededor de los $alores centrales de la $ariable. D!)tr!*u!"n ($t!rt!$- presenta un reducido grado de concentración alrededor de los $alores centrales de la $ariable. • • Un diagrama muestra de manera ob&eti$a los distintos grados de curtosis $er la figura 5.5.#3 • • Figura 5.5.#. Crados de curtosis de una distribución • • • • • -e de simetr"a -e de simetr"a -e de simetr"a • • • µ x x µ x µ • .eptocrtica Platicrtica Mesocrtica • ,Delgado+ ,Aplanado+ ,Intermedio+ • • • BB
•
Fuente: Elaboración propia
•
5..2. D#t#r%!n$!"n • • •
El oeficiente de urtosis $iene definido por la siguiente fórmula:
)
g(
=
• • • • • • • •
n
∑ ,$ − $+ n n B
i
i
i =)
) n ,$ $+( n i − n ∑ i i =)
(
−?
donde los resultados pueden ser los siguientes: g# = distribución mesoc4rtica3. g# A = distribución leptoc4rtica3. g# = distribución platic4rtica3.
;. >R?OL DE DECISIÓN PARA ESTADÍGRAFOS • • continuación se presenta un !rbol que resume toda la información $ertida en el capítulo, que ayudar! al in$estigador a decidir los estadígrafos adecuados para el resumen de las distribuciones en las que est! traba&ando $er figura 5.".1 de elaboración propia3.
•
B*
• para estad"gra#os Figura 43G3)3 Hrbol
Atributo
Posición
Nominal
No
Dispersión
Moda
9i
Ordinal
Tipo I
A> = >? − >)
Mediana
∑$
i
n
Me = $ n +)
$n
+ $n
(
(
Me =
n
∑ i1)
PocosPocos
Tipo II
∏$
s $
C3A3 =
?,$ − Me+ s
i
i =)
$i ni ∑ i )
Moda
=
n
∑ $ i ( ni ∑ $ i n i ( − n n
91
$ 0 $ i0) Me 1 i (
n 51 n ni i1) $ i
A> = >? − >)
6 1n
∏$
)
s CV = $
n
∑
Caracter"stica de la población
CV =
n
6 1n
) $i
Me = $ i
8Valores< 8ariables<
C3A3 =
Constantes
8Interalos<
Tipo III 8Tipo de e$perimento<
Variables -nteros
Discreta
?,$ − Me+ g = ( ) s
n i0) Mo 1 . i−) 0 a i0) ,a i + n i0) 0 n i−) a i0) a i −) n Moda
∑ $ P ,$ + i
i
$ 0 $ i0) Me 1 i (
Me = $ i
)
- '$ % 1 ∞
Decimales Continua
∫
V'$% =
n
∑ $ P,$ + − [ $ ] ( i
i
i =)
A> = >? − >) ∞
∫
−∞
#,$+d$
Me
=
) (
∫ $
(
#,$+ d$ − [ $ ]
−∞
Moda
C3A3 =
?,$ − Me+ g = ( ) s
(
−?
(
−?
(
−?
A> = >? − >)
?,$ − Me+ g = ( ) s
n
C3A3 =
s $
C3A3 =
?,$ − Me+ s
C3A3 =
?,$ − Me+ s
CV =
n
s $
(
i
ni
n
∑ ,$ − $+ n B
i =)
i
n
,$ i − $+ n ∑ i =)
(
CV =
i
,$ i − $+ n ∑ i =)
s CV = $ (
B
i =)
•
=.1. Atr!*uto no%!n$( 6e aplicó una encuesta para anali%ar la satisfacción de los pacientes a una muestra de #1= personas que se dieron de alta en un (ospital urbano, durante el mes de &unio, la cual generó la siguiente lista de 7*- que&as mostrada en la tabla 5.B.1.
• •
n
=. EEMPLOS DE C>LCULO DE ESTADÍGRAFOS
• •
i
,$ i − $+ ( ni
∑ ,$ − $+ n n )
V '$ % 1
$ i #,$ i+ d$
s CV = $
A> = >? − >)
∞
Aleatorio
n
i
i =)
i1)
8Tipo de alores<
B
i =)
n ∑ i=)
ni i
ni0) ,a i+ ni0) 0 n i−) n − Ni −) Me = .i −) + ( ,a i + ni
- '$ % 1
n
∑ ,$ − $+ n n
Mo 1 .i−) +
Muc:osMuc:os
Variable
A> = >? − >)
n
$1 Muc:osPocos
+)
(
n
51
∑ $i( ∑ $ i ( − n n
91
i =)
(
Cuantitatia
Curtosis
n
$1
Determin"stico
Asimetr"a
Moda
8-$iste erarEu"a<
Cualitatia
Comparación
• 8abla 5.B.1 Ha%ón de que&a de pacientes de un (ospital
• •
• Ha%ón de que&a onflictos con otros pacientes@$isitantes
• •
•
Falta de respuesta al timbre
•
•
Hespuestas inadecuadas a preguntas
•
•
Hetraso en las pruebas
•
(
i
ni
=. EEMPLOS DE C>LCULO DE ESTADÍGRAFOS •
=.1. Atr!*uto no%!n$( • •
6e aplicó una encuesta para anali%ar la satisfacción de los pacientes a una muestra de #1= personas que se dieron de alta en un (ospital urbano, durante el mes de &unio, la cual generó la siguiente lista de 7*- que&as mostrada en la tabla 5.B.1.
• • 8abla 5.B.1 Ha%ón de que&a de pacientes de un (ospital
• • •
• Ha%ón de que&a onflictos con otros pacientes@$isitantes
• •
•
Falta de respuesta al timbre
•
•
Hespuestas inadecuadas a preguntas
•
•
Hetraso en las pruebas
•
•
Huido
•
•
al ser$icio alimenticio
•
•
escortesía del personal
•
•
Itras
• •
8otal
•
• • • • •
Fuente: Le$in y Hubin. Estadística para dministradores, 1DD"
'ara atributo nominal el 4nico estadígrafo que se puede determinar es la moda.
Mo = Mal servicio alimenticio
• • •
2nterpretación: Lo m!s frecuente es que los pacientes se que&en del mal ser$icio alimenticio del (ospital.
•
=.2. Atr!*uto ord!n$( • •
La calificación que dieron los empleados de una empresa sobre el ser$icio de internet que (an contratado recientemente se resume en la tabla 5.B.#.
• •
• 8abla 5.B.# alificación de un ser$icio de internet
• • • • •
'/simo alo Hegular
alificación
• ni • 1 • • 7=
• ?i • 1 • 5 • 75
• •
Jueno uy bueno
• •
5= "=
• •
•
E0celente
•
5
•
•
15 =
•
8otal
*5 15 15 = •
• • • • • • • •
Fuente: Elaboración propia
'ara atributo ordinal se pueden (allar la moda y la mediana.
Mo = Muy bueno 2nterpretación: Lo m!s usual es que os traba&adores califiquen el ser$icio de internet como muy bueno.
• •
'ara la mediana se ubica
n 2
=75
entre dos $alores de frecuencia acumulada. Est! entre
75 y *5. Luego: • • •
Me= Bueno El 5=> de los traba&adores calificaron el ser$icio de internet como p/simo a bueno, y el otro 5=> como bueno a e0celente.
•
=.. T!o I • •
El n4mero de productos defectuosos de $arios lotes de producción de una empresa sigue la siguiente distribución Ger tabla 5.B.73.
• •
• 8abla 5.B.7 'roductos defectuosos de una f!brica
• •
0i
• 0
•
•
( x − x´ )
( x i− x´ )
2
i
•
1=
• 1
•
-D
•
#-=1
•
1#
• 1
•
#5
•
"#5
•
15
• #
•
-
•
1"
•
1"
• #
•
1
•
1
•
#=
• -
•
D
•
*1
•
#1
• -
•
1"
•
#5"
#5
•
• "
•
"-
•
-=D"
1"*
•
B-B"
• # •
8otal 11D
•
• • • •
Fuente: Elaboración propia
'ara la distribución tipo 2 de $ariables, pr!cticamente se pueden determinar todos los estadígrafos, menos la moda.
• •
´=
x
=
119 7
√
2191
•
s
•
CV =
• •
=17
7 4.90 17
( )=
−
119
2
7
4.90
( 100 )=28.82
2nterpretación: El n4mero promedio de productos defectuosos producidos en la f!brica es de 1B con una dispersión de 5. La dispersión relati$a es de #*.*#>.
• •
Me= x 7+1 = x 4 =16 2
•
Q1= x 7+ 1 = x 2=12
Q3= x 3 (7+1 ) = x 6=21
4
• • •
4
AQ =9
DQ =4.5
2nterpretación: El n4mero mediano de defectuosos de la f!brica es de 1" con una dispersión de -.
•
(= ) − =− ( ) 7476
•
CA=
( −16 )
3 17
4.9
=0.61
g2
7
168
2
3
1.15
7
• • •
2nterpretación: La distribución es asim/trica con sesgo positi$o, platic4rtica.
=.9. T!o II • • • •
Ger e&emplo para tipo 222, ya que esta distribución debe primero transformarse a una tipo 22.
=.5. T!o III • •
Una muestra de las cantidades quincenales in$ertidas en el plan de participación de utilidades de una compa+ía por parte de los empleados, se organi%ó en una distribución de frecuencias para su estudio $er tabla ".B.-3.
•
istribución de frecuencias de in$ersión en un plan de participación de utilidades
•
L!01 0 L!
n!
N!
7= K 75 75 K -= -= K -5 -5 K 5= 5= K 55 55 K "= "= K "5 "5 K B=
7 B 11 ## -= #D -
7 1= #1 -7 *7 1=B 11" 1#=
• • •
Fuente: Elaboración propia
Hesolución
6e muestra la tabla 5.B.5 con todos los c!lculos pertinentes para (allar los estadígrafos:
•
8abla 5.B.5 !lculo de estadígrafos de la distribución de in$ersión en un plan de participación de utilidades
•
•
•
•
•
• 7
• 1
• #
• 1
• B
• *
• 5
• 7
• • •
• • •
•
•
• • •
•
•
•
•
• • • •
•
• 7
• 7
• 7
• *
• 1
• 1
• #
• 1
• 1
• "
• • •
•
• • •
• • •
• •
•
Fuente: Elaboración propia continuación los c!lculos:
Mo =50 +
24
+
24 22
( 5 )=52.61
2nterpretación: Lo m!s frecuente es que un traba&ador (aya in$ertido 5#."1 M.
x´ = s=
6185 120
√
=51.54
325500 120
( )
−
6185 120
2
=7.48
CV =
7.48 51.54
( 100 ) =14.51
2nterpretación: Los traba&adores in$irtieron en promedio 51.5- M con una dispersión de B.-* M. La dispersión relati$a porcentual es del 1-.51>.
Me=50 +
60− 43 40
( 5 ) =52.13 Q3=55 +
Q1= 45+ 90
−83
24
AC =9.41 C 10= 40 +
12−10 11
30 −21 22
( 5 ) =47.05
( 5 ) =56.46
DC = 4.71
( 5 )=40.91
C 90=60 +
ACn=19.65
108
−107 ( ) 5 =60.56 9
DCn= 9.82
2nterpretación: • • • • • • •
uartil 1: El #5> de los empleados in$ierten menos de -B.=5 dólares en el plan, mientras que el B5> restante aportan m!s de ese $alor. ediana: El 5=> de los empleados in$ierten menos de 5#.17 dólares en el plan, mientras que el 5=> restante aportan m!s de ese $alor. uartil 7: El B5> de los empleados in$ierten menos de 5".-" dólares en el plan, mientras que el #5> restante aportan m!s de ese $alor. mplitud cuartílica: El 5=> central de los traba&adores aportan al plan entre -B.=- y 5".-" dólares. entil 1=: El 1=> de los empleados in$ierten menos de -=.D1 dólares en el plan, mientras que el D=> restante aportan m!s de ese $alor. entil D=: El D=> de los empleados in$ierten menos de "=.5" dólares en el plan, mientras que el 1=> restante aportan m!s de ese $alor. mplitud centílica: El *=> central de los traba&adores aportan al plan entre -=.D1 y "=.5" dólares. •
El aporte mediano de los traba&adores es de 5#.17 M con una dispersión de -.B1 M si se usa la des$iación cuartílica3 o D.*# M si se usa la des$iación centílica3.
• 51.54 −52.13
¿ 3¿
CA=¿ 2nterpretación: La distribución de in$ersiones es asim/trica con sesgo negati$o 1165409.113
g2 =
120
(
6714.79167 120
)
2
−3 =0.10
2nterpretación: La distribución de in$ersiones es leptoc4rtica.
=.;. Fun!"n d# u$nt4$ # , $ + 6ea la siguiente función de cuantía:
=
) )G
, ($ + )+
$
= *& )& (& ?
.
• •
La tabla 5.B." resume los c!lculos para determinar los estadígrafos. 8abla 5.B."
!lculo de los estadígrafos de la función • • •
•
•
•
•
' 0i3 =, =" #5 =, 1* B5 =, 71 #5 =, -7 B5
# , $ + =
) )G
,( $ + )+
0i ' 0i3
•
$
= *& )& (& ?
0i# '0i3
• •
• = • =, 1* B5 • =, "# 5 • 1, 71 #5 • #, 1# 5
1
• •
= =,1* B5
• •
•
1,#5
•
7,D7 B5
•
•
5,7B 5
•
Fuente: Elaboración propia
E [ x ]=2.125 [ x ] =√ 5.375− 2.125 CV =43.62
2
=0.93
Me =2
Mo =3
=.=. Fun!"n d# d#n)!d$d
# ,$ + 1 6ea la siguiente función de densidad:
) )(
,($ 0 ) +
para * I $ I ? .
? ) ( V '$ % 1 ∫ $ d$ − ∫ $ ,($ 0) + d$ * * )( ( ? ) ($ ? $ ( ? ) $ B $ ? 1 0 ? − )( ? 0 ( )( ( * * ( ) J) ) 1 0 − )J 0 1 ) 2 , + − (*(4 1 (?KG − (*(4 1 ?4) 1 *3G* )( ( )( ( )( ( 4KG 4KG 4KG ?
E N0O 1.*B5 G N0O =."=D 6 N0O =.B* G N0O -1.">
) ,($ 0 ) + )(
media3 $arian%a3 des$iación est!ndar3 coeficiente de $ariación3
'ac 0i3 =,= "# 5 =,# 5 =,5 "# 5
1 1,* B5
6e obser$a que la esperan%a matem!tica no es una medida confiable para resumir la información de la distribución, ya que su dispersión es grande. •
'ara (allar la mediana, se calcula la integral: Me
)
∫ )(
,($ + )+ d$ =
*
) )(
Me
,$
(
+ $+
= *
) )(
,Me( + Me+ =
) (
Me ( + Me − G = * • •
6e resuel$e la ecuación resultante:
Me = (
Me = −?
onclusión: La mediana esperada de la distribución es #. 'ara (allar la moda se aplica el procedimiento para determinar un m!0imo absoluto: 6e deri$a e iguala acero para determinar los puntos críticos de primer orden: "
! ( x )=
2 12
=0
?o e0iste ning4n punto crítico. Entonces se e$al4an las ordenadas de los límites, y la moda ser! el $alor de la $ariable que tiene mayor ordenada: x
=0
! ( x )=
1 12
x
=3
! ( x )=
7 12
La moda es de 7.
. PROPIEDADES DE LA MEDIA ARITMTICA Y LA @ARIANA .1. Pro!#d$d#) d# ($ %#d!$ $r!t%&t!$ La media aritm/tica go%a de las siguientes propiedades:
= 1r$ Pro!#d$d. La media aritm/tica de una constante, es la constante misma: M'7 % 7 2d$ Pro!#d$d. La media aritm/tica de la $ariable m!s una constante es igual a media aritm/tica de la $ariable m!s la constante:
M ' $ + 7 % = $ + 7
r$ Pro!#d$d. La media aritm/tica de la $ariable multiplicada por una constante es igual a la media aritm/tica de la $ariable, multiplicada por dic(a constante:
M ' $ 7 % = $ 7
9t$ Pro!#d$d. La des$iación de los $alores de la $ariable respecto de la media aritm/tica en promedio es igual a cero. esde el punto de $ista geom/trico, esta propiedad indica que la media aritm/tica es el centro de gra$edad de la distribución. 6i se denomina P%Q a las des$iaciones de la $ariable respecto de su media aritm/tica, la propiedad se e0presa en símbolos de la siguiente manera: 6i
= = $ i − $
entonces:
M '= % = M ' $ i
− $% = *
5t$ Pro!#d$d. 6i en una distribución de frecuencias de una $ariable, se considera importante distinguir dos o m!s grupos de tama+os n1 , n# ,..., nR tal que n n 1 S n# S...S nR , con medias aritm/ticas de la distribución se obtiene de la siguiente manera:
$ 1 , $ # ,..., $ R la media general
7
$
$) n) + $ ( n (
=
n) + n (
+ $ 7 n 7
+ n 7
=
∑$
i
ni
i =)
n
.2. Pro!#d$d#) d# ($ $r!$n$ Las propiedades de la $arian%a son las siguientes:
1r$ Pro!#d$d. La $arian%a de una constante es cero: V '7 % = * 2d$ Pro!#d$d. La $arian%a de la $ariable m!s una constante es igual a la $arian%a de la $ariable:
V ' $ + 7 % = V ' $ %
r$
Pro!#d$d. La $arian%a de una $ariable por una constante es la $arian%a de la $ariable por la constante al
cuadrado:
V ' 7 $ % = 7 ( V ' $ %
9t$ Pro!#d$d. uando una distribución de frecuencias requiere ser connotada por la importancia de sus grupos, se dice que la $arian%a total debe ser e0plicada por la $ariación entre grupos inter$arian%a3 y la $ariación dentro los grupos intra$arian%a3, tal que:
9(
= 9 b( + 9c(
7
( b
9
=
∑ ,$
− $ +( n :
:i
i =)
n
onde: 6iendo:
2nter$arian%a S 2ntra$arian%a3
i
Garian%a de las medias3
0(i La media de cada grupo. n(i El tama+o de cada grupo. R El n4mero de grupos que contiene la población. 7
( c
9 = 6iendo:
∑ 9(: n : i
i =)
i
n
edia de las $arian%as3
6(i# Garian%a de cada grupo.
La utilidad que tiene la cuarta propiedad es muy grande. En general, se puede decir que si: •
9 b(
> 9(c , (ay mayor $ariabilidad entre grupos que dentro de cada grupo. 'or lo tanto los grupos son distintos
entre sí, y constituyen estratos diferenciados de la población. •
9c(
> 9 b( , (ay mayor $ariación dentro de cada grupo que entre grupos. 'or lo tanto los grupos son similares y
pueden ser unidos en un solo grupo, que constituye la población. Esta propiedad constituye el fundamento del n!lisis de Garian%a ?IG3, que es muy utili%ada en el an!lisis estadístico de e0perimentos.
.. EB#%(o) d# ro!#d$d#) d# ($ %#d!$ : ($ $r!$n$ EB#%(o 1- 6ea la distribución del dinero que gastan diariamente los estudiantes de la carrera de ingeniería industrial $er tabla 5.*.13.
!
n!
!/n!
!2/n!
7 D 1B #"
11 D 1# * -=
77 *1 #=#=* 5#"
DD B#D 7-"* 5-=* DB=-
Fuente: Elaboración propia •
6e (allan los $alores 0i9ni columna 73 para determinar la media aritm/tica.
$ •
=
4(G B*
= )?3)4 Ls3
6e obtienen los $alores 0i#9ni columna -3 para determinar la $arian%a.
9(
=
K*B B*
− ,)?3)4+ ( = G3GKK4 Ls3(
9 = G3GKK4 Ls (
= J3?4 Ls3
onclusión: Los estudiantes gastan diariamente en promedio 17.15 Js. con una dispersión de *.75 Js. •
La distribución se caracteri%a por: µ 17.15 Js. 6 *.75 Js.
que fi&a su posición y que fi&a la dispersión
omo la des$iación es muy grande respecto a la media, la media no es representati$a de la distribución. 6e sabe que el entro de Estudiantes de esa carrera (a ofrecido: a3 Itorgar una sub$ención de #.5 Js. a cada estudiante. b3 Ifrecer el #=> de su disponibilidad efecti$a. Tu!l de las dos políticas económicas recomienda a sus compa+eros y por qu/ •
Empleando $alores de la media y la $arian%a relati$as a la $ariable m!s una constante y a la $ariable por una constante, se efect4a un an!lisis de las dos medidas de sub$ención.
a3 umentar a todos #.5= Js. 6e sabe que:
N0 S RO = S R 17.15 S #.5 15."5 Js. G N0 S RO G N0O "D."BB5 Js#. G N0O 57.7->
b3 umentar el #=> de los líquidos mane&ables.
6e sabe que:
R 1.# 1 S =.# NR 9 0O 1.# 9 17.153 15.B* Js. G NR 9 0O R# 9 G N0O 1.#3# 9 "D."BB53 1==.7- Js#. G N0O "7.-*> 'ara comparar los resultados de las dos distribuciones es con$eniente usar una medida de comparación, es decir el coeficiente de $ariación, que mide la dispersión relati$a porcentual con respecto a la media.
•
Hespuesta: E0aminado el $alor de las medias con$iene el aumento del #=> aunque sea peque+a la diferencia. Ibser$ando el $alor de la $arian%a se determina que con$iene aumentar a todos #.5 por la gran diferencia que e0iste entre dic(os $alores. La $arian%a en la primera medida, indica que el aumento beneficia a todos sin $ariar la diferencia de ingresos. En la segunda medida para un aumento mas o menos seme&ante, la $arian%a indica que las diferencias se (acen m!s profundas pobres se (acen m!s pobres y los ricos se (acen m!s ricos3. En consecuencia por un sentido de solidaridad y e$itar mayores desigualdades, con$iene que el entro de Estudiantes aplique la primera medida. Itra forma de determinar la me&or política es obser$ar los coeficientes de $ariación. El menor coeficiente de $ariación es el que siempre con$iene.
EB#%(o 2- 6i la distribución anterior del ingreso diario de los estudiantes de 2ngeniería 2ndustrial est! formada por dos grupos igualmente importantes por su composición y de un tama+o igual a #=, se desea a$eriguar si estos dos grupos son diferentes o no en cuanto a su ingreso. • • 'rimero, se deber!n caracteri%ar cada uno de dic(os grupos. 1er Crupo:
(
9) 1
J(J (*
1!
n1!
1! / n1!
1!2 / n1!
7 D
11 D #=
77 *1 11-
DD B#D *#*
))B − (*
x1 5.B Js.
6e caracteri%a así:
(
1 B)3B − ,43K+ 1 B)3B − ?(3B 1 J3) Ls ( (
61# *.D1 Js#.
#do Crupo:
(
9( 1
6e caracteri%a así: •
JJKG (*
2!
n2!
2! / n2!
2!2 / n2!
1B #"
1# * #=
#=#=* -1#
7-"* 5-=* **B"
B)( − (*
x2 #=." Js.
(
1 BB?3J − ,(*3G+ 1 BB?3J − B(B3?G 1 )3BB Ls ( (
6## 1D.-- Js#.
on los $alores anteriores se calcula la inter$arian%a y la intra$arian%a.
a3 2nter$arian%a $er tabla 5.*.#3: 8abla 5.*.#
!lculo de la inter$arian%a
H!
nH!
H! / nH!
H!2 / nH!
5.B #=."
#= #= -=
11-1# 5#"
"-D.* *-*B.# D17B.=
Fuente: Elaboración propia (
9 b 1
)?K B*
4(G − B*
(
1 4434*(4 Ls (
b3 2ntra$arian%a $er tabla 5.*.73: 8abla 5.*.7 !lculo de la intra$arian%a
SH!2
nH!
SH!2 / nH!
*.D1 1D.--
#= #= -=
1B*.# #**.* 5"B.=
Fuente: Elaboración propia (
9c 1 'or lo tanto:
4GK B*
1 )B3)K4 Ls (
6# 6b# S 6c# "D."BB5 Js#.
El ba&o $alor de la intra$arian%a 6 c# 1-.1B5 Js#., indica que la $ariación distribuible de dinero dentro de cada grupo es (omog/nea. El alto $alor de la inter$arian%a 6 b# 55.5=#5 Js#., e0presa que la $ariabilidad de dinero en efecti$o entre los grupos es fuerte. En consecuencia la alta $ariabilidad total del dinero en efecti$o en la distribución depende de la $ariabilidad entre los grupos. En consecuencia los dos grupos tienen características diferentes en cuanto a su disponibilidad diaria de dinero. En consecuencia la media de los dos grupos diferenciados es m!s representati$a que la media del grupo total. •
EERCICIOS DE CLASE •
D!)tr!*u!on#) d# 'r#u#n!$ •
• 1. En una empresa constructora, el departamento de obras est! constituido por -= traba&adores, que cumplen las siguientes funciones: 2 2ngeniero, V Vefe de obras, apata%, I Ibrero, yudante3. La información elaborada permitir! conocer la estructura de ocupación de dic(a empresa. •
• Irganice y presente los datos en una distribución de frecuencias. escriba la distribución por sus elementos esenciales. b3 etermine la moda y la mediana. • 6e midió la resistencia a la compresión de 5* muestras de una aleación de aluminio en desarrollo como • #. material para aerona$es. • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • a3 Irganice y presente los datos en un tipo de distribución de frecuencias adecuada. • b3 , *.B>, 7.D>, ".*> y 1D.5> respecti$amente.
a3
•
a3 Tu!l es la media aritm/tica de la tasa anual de crecimiento b3 Tu!l es la media geom/trica de la tasa anual de crecimiento • c3 Tu!l de las dos medias debería utili%arse para determinar la tasa anual de crecimiento • • • ". 6e recopiló información acerca de las $entas anuales de 5= peque+as tiendas de tornillos: • • Ge
• •
• m • 11 • 17
• • • • •
• 1• 15 • 1" • 8o • • •
•
•
a3 Encuentre la mediana, la media y la moda de las $entas y e0plique su significado. b3 6e pretende crear un nue$o impuesto y e0isten dos alternati$as 1ra: 5 > de las $entas, #da: D miles de M al a+o3. Encuentre el nue$o $alor de la media con estas disminuciones y recomiende la me&or alternati$a para los propietarios.
• B. os empresas presentaron muestras de alambre de cobre para su prueba. Las pie%as de muestra de cada empresa se probaron en cuanto a la resistencia a la tensión y los resultados se organi%aron en una distribución de frecuencias. espu/s se e$aluaron la media de cada distribución. • • Estadísti • • co o o m m p p a a +í + a í a o J m e a t % • edia • 5 • "
•
aritm/tic a 8ama+o de la muestra
•
= = 1 = =
•
= = * =
• Tu!l es la media aritm/tica si se considera a las dos compa+ías &untas • *. La media aritm/tica de los salarios pagados a los empleados de una empresa ascendió a B== M. La media aritm/tica de los (ombres y mu&eres fue respecti$amente de *== M y "7= M. etermine la cantidad de (ombres y mu&eres empleados en dic(a empresa si en total e0isten 17= empleados. • •
•
D!)tr!*u!on#) d# ro*$*!(!d$d •
Fun!"n d# Cu$nt4$ • •
# ,$+ e − $ $ *&)& (&?& B& 4 , que determina la probabilidad de la D. 6ea la siguiente función de cuantía: demanda diaria de un artículo que se $ende a # Mus. la unidad.
=
=
Fun!"n d# d#n)!d$d
•
# ,$+ = e
−
$ (
* ≤ $ ≤ B , que relaciona la probabilidad del
1=. 6ea la función de densidad: precio unitario de un artículo en Mus.3.
Otr$) %#d!d$) d# d!)#r)!"n •
• 11. cada persona que se presenta como candidato para un traba&o de ensamble en Femco, se le aplica una prueba de aptitudes mec!nicas. Una parte de la prueba consiste en ensamblar un armario con base en instrucciones numeradas. En la siguiente distribución de frecuencias se tiene una muestra de los tiempos que necesitaron -# personas para ensamblar el armario. • • • 8 ?u • 1 • • B • 1 • 1
• • * • 1• D • 5 • #
• 1 •
•
• • • • • •
-# a3 central de la distribución. e3 Healice un diagrama de ca&a y bigotes e interprete su significado. • 1#. En muc(os procesos de manufactura (ay un t/rmino llamadoQtraba&o en procesoQ abre$iado Y2', por sus siglas en ingl/s de ZorR)in)process3 En una planta manufacturera de libros esto representa el tiempo que se necesita para doblar, unir, coser, proteger con guardas, y encuadernar las (o&as que salen de la prensa. Los siguientes datos representan muestras de #= libros en dos plantas de producción y el tiempo de procesamiento definido como el tiempo en días contado desde que el libro llega a las prensas (asta que se empaca en ca&as3 para estas acti$idades. • • 'lanta • • • • • • • • • • • • • • • • • • • • • • • 'lanta J • • • • • • • • • • • • • • • • • • • • • • • 'ara cada una de las plantas, calcule: • La media aritm/tica. • a3 La mediana. • b3 'rimer y tercer cuartil. • c3 El rango intercuartílico. • d3 La des$iación est!ndar. • e3 El coeficiente de $ariación. • f3 El coeficiente de asimetría. • g3 El coeficiente de curtosis. • (3 TE0isten diferencias entre las dos plantas • i3 •
Pro!#d$d#) d# ($ %#d!$ : ($ $r!$n$ • •
#. El gerente de una empresa que fabrica papel desea anali%ar los sueldos que paga a sus traba&adores. 'ara ello, los di$idió en tres grupos. Los datos en M para cada grupo se muestran a continuación:
• •
• •
•
• •
• •
•
•
• •
•
• •
• •
•
•
• •
• • •
•
•
•
•
• •
•
•
•
•
• •
•
•
•
•
•
•
•
•
•
•
• •
• •
•
•
• •
•
• •
•
•
• • a3
• • •
umento del sueldo en 1== Js. umento del 7"."1> de su sueldo. •
EERCICIOS PROPUESTOS
•
1.
• • Los sueldos en Mus de 5 empleados de la lcaldía de oc(abamba son: • •
1B"
#==
1B=
1D"
#1=
#15
•
• • •
7.
; • •
ada una serie de $alores de ]: 7, #, *, 1, compruebe que siendo
;
= ($ + 4 , la media de la serie ^ es:
= ($ + 4 y su $arian%a: 9( ; = B 9( $ .
-.
Las edades de los 11 &ugadores de un equipo de f4tbol 3 son: • 1D, 75, #-, 7=, #", #B, #D, #1, #", #-, 77 • • y las de los otros 11 &ugadores de otro equipo J3: • • #D, #D, 7#, #", 71, #5, #7, #5, 7=, #=, #• • •
In
K 1#= • • • • • • • •
• •
• a3 Tu!l es el primer cuartil b3 Tu!l es el tercer cuartil c3 Tu!l es la amplitud cuartílica 2nterpr/tela d3 Tu!l es la des$iación cuartílica 2nterpr/tela e3 etermine la amplitud centílica. 2nterprete su $alor. f3 Healice un diagrama de ca&a y bigotes. g3 etermine el coeficiente de asimetría y d/ una interpretación. (3 etermine el coeficiente de curtosis e interprete el resultado. • • ". En la U'J, todos los estudiantes que quieren ingresar deben $encer la prueba ' prueba de aptitud acad/mica3. El punta&e mínimo para aprobar el test es de 1=5=.
1 ) 5X 7#> 1D ) #5X 1=>
11 ) 17X 1*>
5 ) 11X #*>
• •
• • •
• a3 de los traba&adores. b3 onsidere dos grupos de traba&adores el primer grupo formado por 7= traba&adores y el segundo por #=3 y determine si es la intra o la inter$arian%a la que influye m!s en la $ariabilidad total de la distribución.
*. En una fundición se muestreó un gran n4mero de (ornos con los siguientes resultados de temperaturas:
•
E)t$ d4)t! o JKC M#d !$ $r!t %&t!
•
•
•