UNA MEJOR FORMA DE ORGANIZAR DATOS: LA DISTRIBUCIÓN DE FRECUENCIAS Para entender la diferencia entre la distribución de frecuencias y el arreglo de los datos, tomaremos un ejemplo aislado de las existencias promedio en días de 20 tiendas Oxxo. En la Tabla tomamos datos concernientes a las existencias promedio, para despu! despu!s s constr construir uir la Tabla abla 2 como como una una distri distribuc bución ión de frecue frecuenci ncias. as. Para Para obtener la segunda tabla tendremos "ue di#idir los datos en grupos de #alores pareados y parecidos $clases%, despu!s registramos el n&mero de puntos de datos "ue caen en cada grupo.
Tabla 1. Arreglo de datos de existencias promedio en días de 20 tiendas Oxxo. 2.0
'.(
'.( '.)
'.)
(.0
(.
(. (.
(.2
(.'
(.*
(.*
(.)
(.+
(.+
.
.
.
.
Tabla 2. Distribución de frecuencias de las existencias promedio (en días) de 20 tiendas Oxxo.
-lase
recuencia
2.0 / 2.
2. / '.
0
'.2 / '.*
2
'.) / (.'
)
(.( / (.+
.0 / .
(
Total
20
CARACTERÍSTICAS DE LA DISTRIBUCIÓN DE FRECUENCIAS (RELATIVAS Y ABSOLUTAS 1"uí emos considerado la frecuencia con "ue aparecen los #alores en cada clase como el n&mero total de puntos de datos "ue caen en cada clase3 tambi!n podemos expresar la frecuencia de cada #alor como una fracción o un porcentaje del n&mero total de obser#aciones. 4a frecuencia de un in#entario promedio en la Tabla 2, por ejemplo, en el inter#alo de clase de (.( a (.+ #emos "ue su frecuencia es , pero, en la Tabla ' ser5 0.2. Para obtener este #alor di#idiremos la fracción de esa clase entre el n&mero total de obser#aciones del conjunto de datos, "ue son 20. 4a respuesta se puede expresar en fracción $ 620 %, en decimal $ 0.2 % o en porcentaje $ 27 %, ya "ue, en un distribución de frecuencias relati#as se presentan las frecuencias en t!rminos de fracción o porcentaje. Relativas
recuencias Absolutas o !imples Obser#a "ue en la Tabla ', la suma de todas las frecuencias relati#as ser5 igual a .00 ó 007.
Tabla ! Distribución de frecuencias relativas del inventario promedio en días de 20 tiendas Oxxo.
-lase
recuencia 1bsoluta o 8imple
2.0 / 2.
2. / '.
0
'.2 / '.*
2
'.) / (.'
)
recuencia 9elati#a
recuencia 9elati#a
recuencia 9elati#a
$ :ecimal %
$racción o ;uebrados %
$ Porcentajes %
(.( / (.+
.0 / .
(
Total
20
En el cuadro anterior manejamos los tres tipos de frecuencia relati#a, sin embargo, en ejercicios reales sólo debe usarse una de las tres, seg&n sea el caso "ue estemos manejando. 4a "ue sí se maneja siempre es la frecuencia simple o absoluta. 1ora construiremos la Tabla (.
a, religión, sexo, etc. En la Tabla ( se muestra cómo constituir una distribución de frecuencias simples o absolutas y distribuciones de frecuencias relati#as usando atributos cualitati#os.
Tabla ". Ocupación de "00 egresados de la #niversidad de $uadala%ara -lase Ocupacional
:istribución de frecuencia simple
1ctor
?an"uero
)
Empresario
22
;uímico
*
@!dico
0
1gente de seguros
@&sico
2
1bogado
(
Angeniero
+
Otros
*
Total
00
:istribución de frecuencias relati#as
En esta tabla tenemos una #la$% ab&%'a $Otros%, ya "ue cubre todas las obser#aciones $Ocupaciones% "ue no entran en las categorías mencionadas. Btili>aremos algo parecido siempre "ue nuestra lista no incluya específicamente todas las posibilidades. 4a clase CotrosD se conoce como #la$% )% %*'%+, ab&%',, cuando permite "ue el extremo inferior o superior no est! limitado. -omo podemos #er, la <ima clase de la Tabla es de extremos abiertos. Tambi!n se pueden manejar este tipo de situaciones, lo malo es "ue no tienen rango.
N,a$ &+-,'a%$ -a'a %l +a%/, )% la E$a)0$a: 9ango. Es el principio y fin de una serie de n&meros. 9ango de clases. Es el principio y el fin de todas y cada una de las clases. Anter#alo de clase. -omprende desde el principio de una clase asta el principio de la clase siguiente.
Tabla 5.
&dades de los 'abitantes de la olonia ndependencia -lase $ Edad % $%
recuencia $2%
recuencia relati#a $'% $ $ 2 % 6 )+,+2%
acimiento / *
),)*'
) /
+,2(
/ 2'
2,00
2( / '
,+(+
'2 / '+
+,)'
(0 / (*
),('+
() /
),2*
/ '
*,('0
( / *
*,2)'
*2 ó m5s
,+2
Total
)+,+2
N,a: A0 %$ +3 &+-,'a% +a%/a' %l '%),)%, )% #&4'a$ -a'a -,)%' ,b%%' %l 1556 , %l 1.557 -%', a)%+8$ , ,)a$ la$ #&4'a$ $% )%b% )% '%),)%a' (9%' '%),)%, % l&b',$ )% A'&+a.
CONSTRUCCIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS 1ora "ue ya emos aprendido a di#idir una muestra en clases, podemos tomar los datos sin procesar y construir una distribución de frecuencias. Tomaremos los modelos de telares para alfombras y seguiremos los siguientes tres pasos para ello $bas5ndonos en la Tabla ' de la 4ectura '%. % :ecide el tipo y n&mero de clases para di#idir los datos de acuerdo a medidas cuantitati#as del n&mero de metros y no los atributos cualitati#os, como pueden ser el color, estampado, etc. En seguida necesitamos decidir cu5ntas clases distintas usaremos y los alcances "ue cada una de ellas debe cubrir. El alcance total debe di#idirse entre clases iguales, esto es, el anco del inter#alo de clase, tomado desde el principio de una clase asta el principio de la clase siguiente necesita ser el mismo para todas las clases. Por ejemplo, si escogemos un anco de 0. metros para cada clase de nuestra distribución, las clases ser5n las "ue se muestran en la construcción de la tabla .
Tabla ;. *roducción diaria de una muestra de +0 telares para alfombra con intervalo de clase de 0., mts.
-lase
recuencia
. / .
2
. / .0
. / .
)
. / *.0
( '0
8i las clases fueran desiguales y el anco de los inter#alos #ariara de una clase a otra, entonces tendríamos una distribución muco m5s difícil de interpretar
"ue una en la "ue los inter#alos fueran iguales. FAmagina lo difícil "ue sería interpretar la tabla *G
Tabla < -lase
1nco del inter#alo
recuencias
. / .
.
2
. / .)
.'
)
.+ / .
.'
+
.2 / .
.(
*
. / *.0
.(
( '0
N,a &+-,'a%: El n&mero de clases depende del n&mero de puntos de datos y del alcance de los datos recolectados3 cuantos m5s se tengan o cuanto m5s sea su alcance, m5s clases se necesitan para di#idir esos datos, claro "ue si solamente tenemos 0 puntos de datos no tendría sentido plantearse 0 clases. C,+,
'%=la =%%'al7 % %$a)0$a $% &l&>a ; #la$%$ #,+, +0&+, 3 1? #,+, +8*&+,.
:ebido a "ue necesitamos acer &%'9al,$ )% #la$% )% &=al a+a@, , el n&mero de clases determinan el anco de cada clase. Para calcular el anco del inter#alo de clase, nos basamos en la siguiente ecuación=
1nco de los inter#alos de clase
Halor unitario siguiente despu!s de el #alor m5s grande de los datos
Halor m5s pe"ueIo de los datos
( 2.1
&mero total de inter#alo.
(2.1 E$a ,a $&=&4a % %$ la 4'+la N, 1 )%l #a-0l, 2. D% a0 % a)%la% a$0 $% +a%/a'8 la$ 4'+la$7 )8),l%$ ,')% 3 )&$#&-l&a7 4)a+%al%$ % %l +a%/, )% la %$a)0$a.
En nuestro ejemplo de telares debemos utili>ar el siguiente #alor m5s alto de las mismas unidades, ya "ue estamos midiendo el inter#alo entre el primer #alor de una clase y el primer #alor de la siguiente, a"uí el <imo #alor es .+, de modo "ue el siguiente #alor m5s alto de las mismas unidades ser5 *.0, como sabemos "ue debemos utili>ar clases como mínimo, entonces el anco de cada inter#alo de clase ser5= 8ustituimos y obtenemos= *.0 / .2 J .) J 0.' mts. cada inter#alo de clase.
-on esto completamos el paso o. = para clasificar los datos en metros producidos escogeremos clases para cubrir el alcance .2 a .+, como resultado de ello utili>amos 0.' metros como el anco de nuestros inter#alos de clase. Para ello construiremos la Tabla ) a continuación. 2% -lasifica los puntos de datos en cada clase y cuenta el n&mero de puntos "ue ay en cada clase, cada punto de dato entra en al menos una clase y ning&n punto de dato entra en m5s de una clase. En consecuencia nuestras clases son completamente inclusi#as y mutuamente excluyentes3 obser#a "ue el inferior de la primera clase corresponde al punto de dato menor de la muestra, y "ue el límite superior de la <ima clase corresponde al punto mayor de dato.
Tabla . onstrucción de la tabla de frecuencias de la producción diaria de una muestra de +0 telares par alfombra con intervalo de clase de 0.+ metros
-lase
recuencia
recuencia 9elati#a
recuencia relati#a
:ecimales
Porcentajes
N,a: R%#,')8),l%$ % $,la+%% a 3 $,l, a )% la$ '%$ 4,'+a$ )% 4'%#%#&a '%la&9a )%b%'%+,$ )% +a%/a'7 % %$% #a$, %$ la )%#&+al7 -%', a+b& -,)'0a+,$ +a%/a' la )% -,'#%a/%7 -%', $,l, a. E$ +3 -',babl% % $& +a%/a+,$ -,'#%a/% $% -a$% a , ),$ )#&+a$ , l% a=a 4ala -a'a ll%=a' al ,al. E %$% #a$, , a3 +#, -',bl%+a 3a % la %$a)0$a %$ &-, )% +a%+8a$ +8$ 4l%*&bl%$. S% +a%/a'8 %'',' -%'+&$&bl% , )% '%),)%, )% a$a !7 +8$ a)%la% '%,+a'%+,$ %$% -, 3 , %$ #,+, %l 8l=%b'a 3 %l #8l#l, % %$ a +a%+8a +#, +8$ '0=&)a. A0 #,#l&+,$ %l -a$, +%', 2. '% Alustra los pasos en un diagrama.
Estos tres pasos nos permiten organi>ar los datos en forma tanto tabular como gr5fica. Obser#a "ue en la ig. 2. las frecuencias de las clases tienen un anco de 0.' metros y siguen una progresión regular3 el n&mero de puntos de dato empie>a con dos para la primera clase, aumentando a la siguiente y así sucesi#amente. Tendremos "ue cuanto m5s alto sea el inter#alo de clase, m5s sua#e ser5 la progresión.