CONGREGACIÓN DE LOS HERMANOS DE LAS ESCUELAS CRISTIANAS DISTRITO DE MEDELLÍN INSTITUTO LA SALLE LA EXIGENCIA DA EXCELENCIA Código
Fecha
Material de Estudio No. 1
Docente: Angélica María López
Asignatura: Estadística
07 - 04 11
Curso:
9°03 – 9°04
Caracterización de Variables Variables Cuantitativas Para caracterizar variables cuantitativas se consideran dos casos teniendo en cuenta la forma en que están presentados los datos: datos agrupados y datos no agrupados.
Datos agrupados: agrupados: Se carac caracte teri riza zan n a part partir ir de la cons constr trucc ucció ión n de un diagra diagrama ma de tallo tallo y hojas, hojas, una tabla tabla de frecue frecuenci ncias, as, los histog histogram ramas as y polígonos correspondientes.
Datos Datos no agrupa agrupados dos:: Se cara caract cter eriz izan an a part partir ir de las las medi medida das s de tendencia central, las medidas de posición, las medidas de dispersión y el diagrama de caja y bigotes.
Caracterización de datos agrupados Tabla de frecuencias Una tabla de frecuencias es un arreglo tabular de las frecuencias con que ocurre cada característica característica en que se han dividido dividido los datos. datos. La construcción de una tabla de frecuencias frecuencias para datos cuantitati cuantitativos vos presenta como su punto de mayor importancia la determinación del número de intervalos (clases) que la conformaran. Este número depende de la cantidad y de la naturaleza de los datos a resumir y del propósito que se busca con el resumen. A continuación se presentan ciertas pautas para la construcción de una tabla de frecuencias. 1. El número número de interv intervalo alos s debe escoger escogerse se de acuerdo acuerdo con el número número de datos. Para ello se emplea la siguiente aproximación:
Donde n corresponde al número de datos que se van a agrupar. 2. Una vez escogid escogido o el número de interval intervalos, os, se determ determina ina la longitud longitud o tamaño que deben tener los intervalos, de tal manera que todos los interv intervalo alos s tengan tengan el mismo mismo tamaño tamaño.. Para Para ello ello se utiliz utiliza a el siguie siguiente nte criterio:
3. Constr Construcc ucción ión de la tabla: tabla: Se construy construye e el primer primer interval intervalo o a partir partir del dato menor, así:
En el primer intervalo siempre debe estar contenido el dato menor y en el último el dato mayor. Al elaborar la tabla de frecuencias se debe incluir:
f la cual es la frecuencia del intervalo y corresponde al número de datos que están en ese rango. f r es la frecue frecuenci ncia a relati relativa va o propo proporci rción ón y corres correspon ponde de a la frecue frecuenci ncia a comparada con el total. F es la frec frecue uenc ncia ia acum acumul ulad ada a y corr corres espo pond nde e a la suma sumato tori ria a de las las frecuencias de los intervalos anteriores incluyendo su frecuencia. Fr es la frec frecuen uenci cia a acumu acumula lada da rela relati tiva va y corr corres espo pond nde e a la frec frecue uenc ncia ia acumulada comparada con el total. Mi es la marca de clase y corresponde al punto medio de cada uno de los intervalos. Se calcula mediante la siguiente expresión:
Ejemplo: Elab Elabor orar arem emos os la tabl tabla a de frec frecue uenc ncia ias s para para los los dato datos s que que se encuentran en siguiente tabla. Tabla 1 33. 1 34. 5 35. 6 36. 3 35. 1
35. 3 34. 7 35. 0 35. 4 36. 2
34. 2 33. 4 34. 7 34. 6 35. 2
33. 6 32. 5 34. 1 35. 1 36. 8
33. 6 35. 4 34. 6 33. 8 37. 1
33. 1 34. 6 35. 9 34. 7 33. 6
37. 6 37. 3 34. 6 35. 5 32. 8
33. 6 34. 1 34. 7 35. 7 36. 8
34. 7 33. 6 32. 6
36. 8 35. 1 33. 6
35. 0 34. 9 33. 8
37. 9 36. 4 34. 2
34. 0 34. 1 34. 6
32. 9 33. 5 34. 7
32. 1 34. 5 35. 8
Desarrollo: 1. El número número de intervalo intervalos s a utilizar utilizar es 8. Puesto Puesto que: que:
2. Tamaño Tamaño del interv intervalo alo::
3. Constr Construcc ucción ión de de la tabl tabla: a:
Interval o 32.1 – 32.8 32.9 – 33.6 33.7 – 34.4 34.5 – 35.2 35.3 – 36.0 36.1 – 36.8 36.9 – 37.6 37.7 – 38.4 Total
f 5 1 1 9 2 0 8 6 3 2 6 4
f r 0,0 8 0,1 7 0,1 4 0,3 1 0,1 3 0,0 9 0,0 5 0,0 3 1,0 0
F 5 1 6 2 5 4 5 5 3 5 9 6 2 6 4
Algunas conclusiones a partir de la tabla son:
Fr
Mi
0,0 8 0,2 5 0,3 9 0,7 0 0,8 3 0,9 2 0,9 7 1,0 0
32.4 5 33.2 5 34.0 5 34.8 5 35.6 5 36.4 5 37.2 5 38.0 5
34. 3 32. 7 37. 8
El 8% de las camisas fue fabricado con un material que contenía entre el 32.1 32.1% % y el 32.8 32.8% % de algo algodó dón n y un porc porcent entaj aje e igua iguall fue fue fabr fabric icad ado o con con un material que contenía entre el 36.9% y el 38.4% de algodón. El 84% de las camisas fue fabricado con un material que contenía entre el 32.9% y el 36.8% de algodón.
Diagramas para datos cuantitativos agrupados Diagrama de tallo y hojas Un diagrama de tallo y hojas es una u na representación gráfica en la cual, los datos se clasifican de acuerdo con la expresión decimal de cada uno de ellos. Este diagrama es usado cuando hay una cantidad no muy pequeña de datos y dan una idea de la localización de los datos y de la forma de la distribución. Para construir un diagrama de este estilo se debe dividir cada dato en tallo y hoja. hoja. El tallo corresponde a la primera, o primeras cifras del dato, y en la mayoría de los casos la hoja h oja corresponde a la última cifra del dato.
Ejemplo: La siguiente tabla representa el porcentaje de algodón en un material utilizado para la fabricación de camisas para caballeros. Tabla 1. Datos del porcentaje de algodón 33. 1 34. 5 35. 6 36. 3 35. 1 34. 7 33. 6 32. 6
35. 3 34. 7 35. 0 35. 4 36. 2 36. 8 35. 1 33. 6
34. 2 33. 4 34. 7 34. 6 35. 2 35. 0 34. 9 33. 8
33. 6 32. 5 34. 1 35. 1 36. 8 37. 9 36. 4 34. 2
33. 6 35. 4 34. 6 33. 8 37. 1 34. 0 34. 1 34. 6
33. 1 34. 6 35. 9 34. 7 33. 6 32. 9 33. 5 34. 7
37. 6 37. 3 34. 6 35. 5 32. 8 32. 1 34. 5 35. 8
33. 6 34. 1 34. 7 35. 7 36. 8 34. 3 32. 7 37. 8
El diagrama de tallos y hojas para los anteriores datos aparece a continuación.
Diagrama de tallo y hojas para porcentaje de algodón. n = 64. Unidad de la hoja = 0.10 (el número 1 después del punto significa que se usa una sola cifra decimal).
Tall o
Hojas
32 33 34
156789 114566666688 011122355666667777 779 00111234456789 234888 13689
35 36 37
Del diagrama se puede concluir que: En 6 camisas se usó un porcentaje de algodón entre el 32.0 y 33.0; 12 camisas fueron fueron elaborad elaboradas as con con un porcen porcentaj taje e de algodó algodón n entre entre el 33.0 33.0 y 33.9; 33.9; 21 camisas fueron elaboradas con un porcentaje de algodón entre el 33.9 y el 35.0; 14 camisas fueron elaboradas con un porcentaje de algodón entre el 34.9 y el 36.0; 6 camisas fueron elaboradas con un porcentaje de algodón entre el 36.0 y el 37.0 y 5 camisas fueron elaboradas con un porcentaje de algodón entre el 37.0 y el 38.0. Luego la mayoría de las camisas tienen un porcentaje de algodón entre el 33.9 y el 35.0.
Histogramas Un histograma es una representación gráfica de una variable en forma de barras. barras. Se utilizan para variables variables continuas continuas o para variables variables discretas, discretas, con un gran número de datos, y que se han agrupado en clases. En el eje abscisas se construyen unos rectángulos que tienen por base la amplitud del intervalo, y por altura, la frecuencia absoluta de cada intervalo. La super superfi fici cie e de cada cada barr barra a es prop propor orci cion onal al a la frec frecue uenc ncia ia de los los valo valore res s representados. Así el histograma correspondiente a los datos de la tabla 1 seria:
Polígono de Frecuencias A partir del diagrama de clases (M i) es posible construir el diagrama de líneas o polígono de frecuencias; en el eje horizontal se ubican las marcas de clase y en el eje vertical las frecuencias. Las marcas de clase coinciden con el punto medio de cada rectángulo de un hist histog ogra rama ma y se unen unen medi median ante te segm segmen ento tos s para para form formar ar el polí polígo gono no de frecuencias.
El polígono de frecuencias acumuladas se llama ojiva. Para el caso de la tabla 1 la ojiva se muestra a continuación.