AGRUPACIO AGRUP ACION N DE DATO DATOS S ORDENAMIENTO DE DATOS EN ARREGLOS DE DATOS DE DISTRIBUCIONES DE FRECUENCIA
Una ordenación de datos es una de las formas más sencillas de presentarlos or!ani"a los #alores en orden ascendente o descendente$ %a ordenación de datos ofrece #arias #enta&as con respecto a los datos sin procesar '$( Podemos identificar los #alores de ma)or ma )or a menor rápidamente$ *$( Es fácil di#idir los datos en secciones$ +$( Podemos #er si al!unos #alores aparecen más de una #e" en el arre!lo ,$( Podemos o-ser#ar la distancia entre #alores sucesi#os de los datos$ A pesar pesar de las #enta&as. en al!unas al!unas ocasiones un un ordenamiento de datos no no resulta /til$ 0EDIA ARIT0ETICA CA%CU%ADA CA% CU%ADA APARTIR APARTIR DE D E DAT D ATOS OS AGRUPADOS Cuando los datos se presentan mediante una distri-ución de frecuencia. todos los #alores caen dentro de unos inter#alos de clase dados 1 se consideran coincidentes con las marcas de clases o puntos medios de cada inter#alo$ 0EDIANA Es una colección de datos ordenados de ma!nitud es decir el #alor medio o la mediana aritm2tica de los dos #alores medios$ E&emplo Sean los n/meros 3.4.4.4.5.6.6.6.6 en este e&emplo su mediana es 5 Para datos a!rupados la mediana se o-tiene mediante la interpolación ) su fórmula es
%'7 %imite real inferior de la clase mediana 8es decir. la clase 1 contiene la mediana9 N7 N/mero total de datos 8frecuencia total9 8:; 〖f9₁〗7 Suma de frecuencias de todas las clases por de-a&o de la clase media$ < mediana 7 =recuencia de la clase mediana c 7 Tama>o del inter#alo de la clase mediana Geom2tricamente. la mediana es el #alor de ? 8a-scisa9 1ue corresponde ala #ertical 1 di#ide un @isto!rama en dos partes de i!ual área$ Este #alor de se denota a #eces por Ẋ 0ODA %a moda es una serie de n/meros. es a1uel #alor 1ue se presenta con ma)or frecuencia es decir es el #alor más com/n$ %a moda puede no e?istir. incluso si e?iste no puede ser /nica$ E&emplos El sistema *.*.3.5.B.B.B.'.'.''.'*.'6 tiene de moda B El sistema +.3.6.'.'*.'3.'4 no tiene moda El sistema *.+.,.,.,.3.3.5.5.5.B tiene dos modas. ,.5. ) se llama -imodal$ Una distri-ución 1 tiene una sola moda se llama unimodal$ En el caso de datos a!rupados en el 1ue se @a construido una cur#a de frecuencias para a&ustar los datos. la moda será el #alor 8o #alores9 de
correspondientes al má?imo 8o má?imos9 de la cur#a$ Este #alor de se representa a #eces por Ẋ
Agrupamiento de datos cuantitativos
Cuando e?isten !ran cantidad de datos cuantitati#os 8discretos ) continuos9 1ue se encuentran mu) dispersos. las distri-uciones de frecuencias sin a!rupar no son la me&or opción para reali"ar una or!ani"ación de datos. por lo cual se @ace necesario reali"ar una distri-ución en inter#alos o clases. 1ue @a!an posi-le un resumen de los datos de la #aria-le en estudio. para de esta manera concentrar los datos ) as acumular el n/mero de o-ser#aciones o frecuencias contenidas para cada clase facilitando su presentación. además de permitir un análisis de aspectos resaltantes 1ue seran mu) difcil de o-ser#ar con datos indi#iduales$ Es preciso aclarar 1ue dic@as clases. de-en ser mutuamente e?clu)entes ) colecti#amente e?@austi#as. lo primero si!nifica 1ue las clases no de-en estar solapadas. es decir. un #alor no puede pertenecer a dos clases de manera simultánea lo se!undo e?presa 1ue todos los datos de-en estar incluidos en los inter#alos definidos$ Ca-e se>alar 1ue. las distri-uciones de frecuencias en inter#alos tienen como principal des#enta&a. la perdida de indi#idualidad de los datos. de-ido a 1ue se sa-e 1ue en determinada clase está contenida cierta cantidad de datos. sin em-ar!o no se conoce con e?actitud los #alores 1ue toma. por lo tanto se pierde el ni#el de detalle ) accesi-ilidad$ Esta des#enta&a es atri-ui-le cuando los datos )a se encuentran or!ani"ados en inter#alos. de lo contrario. es posi-le retornar a los datos ori!inales$ Por otro lado es importante tomar en consideración 1ue. al a!rupar los datos cuantitati#os en inter#alos. se de-e ele!ir un n/mero ra"ona-le de clases. por1ue cuando se esco!e un n/mero mu) !rande el o-&eti#o de simplificación no se o-tiene. además de 1ue se puede correr el ries!o de tener muc@as clases con mu) pocos datos en el caso contrario. 8se selecciona un n/mero
mu) pe1ue>o de inter#alos9. se resume tanto los datos al punto de perder información de utilidad$ =inalmente @a) 1ue recordar 1ue tanto el n/mero de clases como las amplitudes de las mismas dependen de la naturale"a de los datos. el n/mero de datos disponi-les para la a!rupación ) el inter2s del in#esti!ador$ En Estadstica se estudian fenómenos aleatorios. 1ue son a1uellos cu)o resultado no es pre#isi-le aun1ue se repitan en id2nticas condiciones$ Colecti#o o Po-lación es el con&unto todos los indi#iduos a los 1ue #a diri!ido el estudio estadstico$ 0uestra es el su-con&unto de datos ele!idos del colecti#o 1ue realmente se anali"an$ Faria-le estadstica es cada una de las caractersticas 1ue se miden de cada uno de los indi#iduos 1ue forman la muestra$ %as #aria-les estadsticas pueden ser cualitati#as ) cuantitati#as$ Se dice 1ue una #aria-le estadstica es cualitati#a cuando los #alores 1ue puede tomar son atri-utos$ Faria-les cuantitati#as son a1uellas 1ue pueden tomar #alores num2ricos$ %as #aria-les cualitati#as pueden ser Nominales o cate!óricas los #alores no admiten ordenación. por e&emplo. el color. o la marca de -e-ida preferida. o el partido poltico ele!ido. o el lu!ar de procedencia. etc$ Ordinales los #alores de este tipo de #aria-les admiten ordenación. aun1ue sean cualitati#as. por e&emplo. el estado de salud de pacientes de un @ospital 0u) !ra#e. Gra#e. %e#e$ Tam-i2n son ordinales las #aria-les 1ue miden el !rado de satisfacción conse!uido por al!/n ser#icio 0u) mal. 0al. Re!ular. ien. 0u) -ien$ %as #aria-les cuantitati#as pueden ser Discretas a1uellas 1ue solo pueden tomar #alores aislados. ) dados dos consecuti#os no puede @a-er #alores intermedios. frecuentemente #an asociadas a procesos de conteo NH de ramas de un ár-ol. NH de puestas en nidos. NH de miem-ros por familia. etc$ Continuas a1uellas #aria-les num2ricas 1ue. si se pose)esen instrumentos con infinita precisión. su #alor podra ser e?presado con infinitas cifras decimales. dados dos #alores. por pró?imos 1ue est2n. siempre sera posi-le encontrar #alores intermedios entre am-os$ %a ma)ora de las #aria-les 1ue implican una medición son de este tipo la temperatura de la atmósfera. la #elocidad del #uelo de un a#e. la altura 1ue alcan"a un ár-ol. son e&emplos de #aria-les cuantitati#as Continuas$
A #eces. cuando las #aria-les son num2ricas. es necesario conocer su escala de medida Decimos 1ue una #aria-le num2rica está medida en escala por inter#alos cuando no @a) un cero a-soluto ori!en de las medidas. por e&emplo la @ora de lle!ada de un tren a una estación. si se toma como cero las *, @oras del da anterior ) @a lle!ado un tren a las @ ' min$ ) otro a las @ * min$. sa-emos 1ue el se!undo lle!ó ' minutos despu2s 1ue el primero. pero no podemos decir 1ue el se!undo @a)a tardado el do-le 1ue el primero en lle!ar. pues no se @a adoptado un cero a-soluto com/n a todos los recorridos$ Un e&emplo clásico de este tipo de #aria-le es la temperatura si el aire @o) está a 'HC ) a)er esta-a a *HC. no podemos decir 1ue la temperatura @o) sea el do-le de la de a)er. pues el cero en la escala de medida se @a tomado de modo ar-itrario. para compro-arlo. -asta con e?presar am-as temperaturas en !rados =a@ren@eit$ Una #aria-le estadstica está medida en escala por ratios cuando e?iste un cero a-soluto. entonces podemos considerar diferencias entre las medidas ) tam-i2n proporciones$ %a ma)ora de los fenómenos fsicos 1ue consideremos están medidos en este tipo de escala. por e&emplo. la temperatura a-soluta. en !rados el#in es una #aria-le medida en escala por ratios. tam-i2n el peso. la lon!itud. o la masa lo son$ Estadstica descripti#a Es la parte de la estadstica 1ue proporciona t2cnicas para e?traer ) mostrar la información 1ue su-)ace en con&untos de mu) numerosos datos$ Cuando se acomete un estudio cientfico. es @a-itual medir !ran cantidad de parámetros so-re cada uno de los indi#iduos ele!idos. la estadstica descripti#a uni#ariante permite estudiar los datos correspondientes a cada caracterstica sin considerar la influencia de las demás$ Ta-las de frecuencias Como resultado del estudio estadstico se posee una serie de estadillos o cuestionarios. uno por cada indi#iduo considerado en el 1ue se reco!en todas las medidas reali"adas a cada indi#iduo$ %a ta-la si!uiente es un e&emplo de uno de estos estadillos . en 2l se @an anotado seis caractersticas de ár-oles de un #i#ero despu2s de un a>o de @a-er sido plantadas. la ta-la reco!e las medidas correspondientes a los die" primeros$
Jr-ol nH
Replantado Grado afección
' * + , 3 4 5 6 B ' Códi!os
N S N N N S N N S S S Si N No
de NH de ramas primarias ' * ' + , * ' * No
0G NA 0 G 0 NA % % 0G 0 NA Afectado % %e#e 0 0edio G Gra#e 0G 0u) Gra#e
Diámetro 8cm9
Altura 8cm9
+.B ,.+ +.B *.3 +.B ,.* ,.3 3.+ *.3 *.B
'4., *+.5 '4.3 ',4.+ '*+. '6,., '3+. '64. '4B.6 '46.6
el primer paso para sinteti"ar la información es ta-ular los datos$ Consideraremos distintos tipos de a!rupaciones de datos Ta-las de frecuencias de datos en a!rupamiento discreto Reali"amos este tipo de a!rupamiento cuando el n/mero de posi-les respuestas a la #aria-le en estudio es reducido$ %as #aria-les cualitati#as se prestan mu) -ien a este sistema de a!rupamiento Para construir una ta-la de frecuencias de a!rupamiento discreto se anotan en una columna cada uno de los distintos #alores 1ue tome la #aria-le ) en la columna si!uiente su frecuencia o n/mero de #eces 1ue se repite$ %a ta-la de frecuencia de la #aria-le Replantado es Replantad frecuencia o S , N 4 Total '
%a ta-la de frecuencia de la #aria-le 7 Grado de afección es Grado de afección ?i NA % 0 G 0G Total
frecuencia frecuencia relati#a ni fi * $* * $* + $+ ' $' * $* ' '$
%a frecuencia relati#a es la frecuencia a-soluta di#idida entre el n/mero de o-ser#aciones. indica la proporción de datos 1ue muestran un determinado #alor de la #aria-le$ Se puede e?presar tam-i2n en K$ %a ta-la de frecuencia de la #aria-le 7N/mero de ramas primarias es$ NH ramas frecuencia primarias
frecuencia relati#a
=recuencia acumulada
?i ' * + , Total
fi $* $+ $+ $' $' '$
Ni * 3 6 B '
ni * + + ' ' '
=recuencia acumulada relati#a =i $* $3 $6 $B '$
%a frecuencia acumulada es el n/mero de datos 1ue presentan un #alor menor o i!ual 1ue uno dado de la #aria-le$ %a frecuencia acumulada relati#a es la proporción de datos menores o i!uales a uno dado$ Ta-las de frecuencias de datos a!rupados en clases Cuando tenemos una #aria-le continua. o cuando. siendo discreta. el n/mero de #alores diferentes es mu) !rande. se a!rupan los datos en clases o inter#alos$ El n/mero de inter#alos o clases I a considerar es una cuestión importante ) no @a) un criterio fi&o para esta-lecerlo$ %a fórmula de Stur!es es una de las 1ue se pueden utili"ar para determinarlo. se!/n ella. I es el e?ponente de la primera
potencia de dos cu)o resultado supera al n/mero de datos. con un mnimo de , clases$ Para el e&emplo 1ue estamos comentando. con ' datos. como *,L'. se toma I7,$ Para determinar la amplitud de cada clase se di#ide el ran!o o diferencia entre el ma)or ) el menor de los #alores o-ser#ados entre el n/mero de clases I$ Para la #aria-le diámetro. la amplitud es a
5.3
R =
−
2.5
=
I
2.8 =
4
=
0.7
4
Si el cociente no es e?acto se puede redondear por e?ceso. aun1ue eso @ará 1ue la /ltima clase termine en un #alor superior al má?imo o-ser#ado$ Para e#itar dudas. se consideran todos los inter#alos cerrados por la derec@a ) a-iertos por la i"1uierda. sal#o el primero 1ue se considera cerrado por am-os e?tremos$ Cada clase o inter#alo se identifica con una cifra llamada marca de clase. 1ue es la media entre am-os e?tremos$ %a ta-la de frecuencias de la #aria-le diámetro es Clases
M*$3 +$* 8+$* +$B 8+$B ,$4 8,$4 3$+
0arcas de clase
frecuencia
frecuencia relati#a
?i *$63 +$33 ,$*3 ,$B3
ni + + + '
fi $+ $+ $+ $'
frecuencia frecuencia acumulada acumulada relati#a Ni =i + $+ 4 $4 B $B ' '$
Bibliografía Espinoa! B" #$ %& F&br&ro %& '()*+" Prezi" Ob,&ni%o %& -,,ps.//pr&i"0o1/2312)4)bi'15/1&,o%os6%&6agr3pa0ion676 pr&s&n,a0ion6%&6%a,os/ Nan07," #8 %& S&p,i&1br& %& '()(+" Estadística" Ob,&ni%o %& -,,p.//nan07,6 &s,a%is,i0a"blogspo,"0o1/'()(/(4/agr3pa0ion6%&6%a,os"-,1l