Misioneros de la Divina Redención
Colegio El Carpinelo “Formando Integralmente para la Vida con los Valores del Evangelio”
SISTEMAS DE DATOS Grado: 7°
Asignatura: Estadística.
Guía N° 3
Profesor: Luis Hdo. Cuesta Perea
AGRUPACIÓN DE DATOS, HISTOGRAMAS, POLÍGONOS Y CURVAS DE FRECUENCIAS Agrupación de Datos Ya sabemos que las variables estadísticas pueden ser de dos clases: cualitativas o cuantitativas. A su vez, una variable cuantitativa puede ser discreta o continua: • Discreta: cuando sólo toma valores aislados, generalmente enteros. Por ejemplo, el número de hijos de una familia o las edades de los alumnos de un grupo de 7° grado. • Continua: cuando puede tomar cualquier valor dentro de un cierto intervalo. Por ejemplo, el peso de un grupo de personas, la estatura de los alumnos de un grupo, la cantidad de colesterol en la sangre por grupo de edades. También se consideran continuas las variables que pueden tener muchos valores distintos, aunque sean todos enteros como, por ejemplo, los salarios de un grupo de personas. En las variables continuas, donde el número de datos seguramente es muy grande, estos se agrupan en intervalos o clases. La siguiente experiencia nos ayudará a comprender en qué consiste este proceso:
EXPERIENCIA El médico de un colegio anotó la estatura, en centímetros, de los 40 alumnos del grupo 7°A. Estos fueron los resultados: 160, 167, 163, 148, 151, 166, 157, 153, 151, 150, 162, 166, 171, 167, 165, 147, 152, 162, 155, 158, 157, 155, 160, 154, 153, 159, 159, 158, 163, 161.
158, 166, 155, 164, 152, 150, 158, 164, 156, 160,
Como el número de datos es grande, los agrupa en intervalos o clases de la siguiente manera: -
-
Cada intervalo o clase tiene un extremo inferior y un extremo superior. El extremo inferior de la primera clase es, en general, el menor dato de la muestra y el extremo superior de la última clase es el mayor valor de la muestra. A veces conviene tomar como extremo inferior un número menor que el de la muestra redondeado a un múltiplo de 5 o de 10 y como extremo superior un número mayor que el de la muestra redondeado igualmente a un múltiplo de 5 o de 10. Por ejemplo, si el menor valor de una muestra es 1,43m, puede tomarse como extremo inferior 1,4 y si el mayor valor es 1,74 m, puede tomarse como extremo superior 1,8. Es recomendable que todas las clases o intervalos tengan la misma amplitud. Los puntos medios de cada clase se llaman marcas de clase. 1
-
No existe una regla única para fijar el número k de intervalos o clases en que se va a agrupar la muestra, pero generalmente varía entre 5 y 15, dependiendo del tamaño de la muestra. Una buena guía para tomar la decisión acerca del valor de k es la propuesta de Herbert A. Sturges (1926), quien diseñó la siguiente tabla: Números de Elementos de la Muestra Números de Intervalos n k De 6 a 11 4 De 12 a 22 5 De 23 a 45 6 De 45 a 90 7 De 91 a 181 8 De 182 a 362 9 De 363 a 724 10 De 725 a 1.448 11 De 1.449 a 2.896 12
-
Para determinar la amplitud de los intervalos o clases procedemos así: Hallamos la diferencia entre el mayor valor y el menor valor de la muestra. Esta diferencia se denomina RANGO o RECORRIDO de la muestra y lo representamos por R. Por lo tanto: R = xmax - xmin
Dividimos R entre k para hallar la amplitud A de cada intervalo; es decir: R A= K Como en este caso, el dato mayor es 171 y el menor es 148, entonces el rango la muestra es: R=171 - 148 = 23
El número de intervalos de acuerdo con la tabla de Sturges es k=6 y la amplitud cada intervalo será: 23 A= = 3,8333... 6 Como los datos de la muestra son números enteros, entonces aproximamos este número al entero mayor más próximo; es decir, a 4. Esto hace que debamos ampliar nuestro rango de 23 a 6x4=24; es decir, 1 unidad más que el rango de datos. Esta unidad podemos agregarla por debajo (adicionando el dato 147) o por encima (adicionando el dato 172) Si escogemos esta última alternativa, entonces los 6 intervalos o clases que podemos conformar son los siguientes: [148-152), (152-156), (156-160), (160-164), (164-168), (168-172) Para hallar la marca de clase de un intervalo se suman los extremos y se divide por 2. Por ejemplo, la marca de clase del segundo intervalo es: 152 + 156 = 154 2 2
A continuación, elaboramos la tabla de frecuencias absolutas para esta distribución de datos: Talla (cm) [148-152) [152-156) [156-160) [160-164) [164-168) (168-172)
Marca de Clase 150 154 158 162 166 170
Recuento
Frecuencia Absoluta 6 8 9 8 8 1 40
Por ejemplo, en el intervalo (152-156) hemos agrupado todas las tallas desde 152 cm (incluido este valor) hasta las tallas por debajo de los 156 cm, ya que 156 cm se contabiliza en el tercer intervalo.
• • • • • •
APRENDAMOS Cuando el número de datos de una muestra es grande, mayor que 20, conviene agruparlos en intervalos o clases. El número de intervalos es variable; sin embargo la tabla de Sturges es una buena guía para determinar el número de estos intervalos. Todos los intervalos deben tener la misma amplitud. El RANGO de la distribución es la diferencia entre el mayor valor y el menor valor de la muestra. Rango R Para saber la amplitud A de cada intervalo calculamos: A = = N º de int ervalo K El resultado de A nos indicará si es necesario ampliar el rango original, agregando algunos datos por debajo o por encima de los que ya tenemos.
Histogramas, Polígonos de Frecuencias y Curvas de Frecuencias
PRIMERA EXPERIENCIA Vamos a representar gráficamente la situación que nos muestra la tabla de la experiencia anterior con relación a la estatura de los 40 estudiantes de 7° grado. Veamos: TALLAS FRECUENCIA (en cm) ABSOLUTA [ 148-152) 6 [152-156) 8 [156-160) 9 [160-164) 8 [164-168) 8 [168-172) 1 Este tipo de gráfico se llama histograma de frecuencias absolutas.
3
APRENDAMOS Para construir un histograma representamos sobre el eje horizontal los extremos de los intervalos o clases. A continuación, construimos unos rectángulos cuya base es la amplitud del intervalo y cuya altura es la frecuencia absoluta.
SEGUNDA EXPERIENCIA Cuando los datos se encuentren agrupados en intervalos, el polígono de frecuencia se obtiene al unir los puntos medios de los lados superiores de cada rectángulo (Figura 1).
Con el fin de que el área encerrada bajo el polígono de frecuencias sea igual a la suma de las áreas de los rectángulos, unimos la marca de clase del primer rectángulo con el punto medio de su lado vertical izquierdo, prolongando hasta el eje horizontal. De la misma forma procedemos con el último rectángulo (Figura 2).
•
TERCERA EXPERIENCIA ¿Cuántos estudiantes de 7°A tienen una estatura inferior a 160 cm? Si miramos la tabla de frecuencias absolutas podemos contestar que 6+8+9 = 23.
•
¿Cuántos estudiantes de 7°A tienen una estatura inferior a 168 cm? Si de nuevo miramos la tabla de frecuencias absolutas encontraremos que son 6+8+9+8+8=39.
•
Acabamos de obtener una nueva frecuencia que se llama frecuencia absoluta acumulada.
4
APRENDAMOS La Frecuencia Absoluta Acumulada de un valor x¡ es la suma de las frecuencias absolutas de los valores menores o iguales a xi. La frecuencia absoluta acumulada se representa por F¡. •
La tabla de frecuencias y de frecuencias acumuladas, y los histogramas y polígonos de frecuencias absolutas y de frecuencias absolutas acumuladas son las siguientes: ESTATURAS (en cm) 1148-152) 1152-156) 1156-160) [160-164) [164-168) (168-172)
fi
Fi
6 8 9 8 8 1
6 14 23 31 39 40
•
El histograma y su polígono de frecuencias sugieren el dibujo de una curva suave como representación idealizada de la distribución de la muestra. Si disminuyéramos la amplitud de cada intervalo, obtendríamos un polígono de frecuencias menos irregular cada vez y podríamos dibujar una curva suave y continua. Por ejemplo, las curvas de frecuencias absolutas y de frecuencias absolutas acumuladas de nuestro problema de las estaturas de los estudiantes de 7°A las siguientes:
•
Este tipo de curvas reciben el nombre de CURVAS DE FRECUENCIA. Las curvas de frecuencias acumuladas se llaman OJIVAS.
¡ATENCIÓN! 5
Ciertos tipos de poblaciones suficientemente estudiadas exhiben formas más o menos estables y conocidas. Por ejemplo, el peso de las personas y de los animales, la vida útil de las cosas y el coeficiente de inteligencia de las personas presentan curvas de forma SIMÉTRICA, como la figura (a). Otras, como los salarios, tienen una distribución asimétrica ya que un porcentaje alto de los trabajadores reciben bajos salarios; por lo cual, éstos tienden a agruparse en el extremo izquierdo de la distribución. Estas curvas se llaman ASIMÉTRICAS A LA DERECHA como la figura (b) o ASIMÉTRICAS A LA IZQUIERDA como la figura (c).
PREGUNTAS: ¿Qué clase de curva es la curva de frecuencias absolutas correspondiente a las estaturas de los 40 alumnos del grado 7º?
EJERCICIO En los ejercicios 1 a 15 marca la letra correspondiente a la ÚNICA respuesta correcta. 1. Al lanzar un dado 100 veces, se obtuvieron los siguientes resultados: xi fi
1 16
2 14
3 24
4 20
5 16
6 10
La frecuencia absoluta correspondiente al dato 3 fue: a) 24 b) 0,24 c) 24% d) 54 2. En el ejercicio anterior, el porcentaje correspondiente al dato 6 es: a) 5% b) 5 c) 0,1 d) 10% Los ejercicios 3, 4 y 5 se resuelven con base en el siguiente enunciado: "El Instituto Tecnológico tiene 1.200 estudiantes matriculados. Para evaluar la gestión del Rector se escoge al azar el 10% de los estudiantes. Los criterios de evaluación son Excelente, Buena Regular y Mala" 3. La población y la muestra de esta encuesta son respectivamente: a) 12.000 y 1.200 b) 1.200 y 120 c) 1.200 y 12
d) 12.000 y 120
4. La variable estadística de esta encuesta es: a) Cualitativa y discreta b) Cualitativa y continua c) Cuantitativa y discreta d) Cuantitativa y continua 5. El rector fue calificado por sus alumnos, obteniendo el siguiente porcentaje: Excelente 60% Buena 20% Regular 15% Mala 6
¿Cuántos encuestados dijeron que la gestión fue Mala? a) 6 b) 5 c) 12 d) 10 6. En las siguientes tablas aparecen los intervalos con las frecuencias absolutas acumuladas. Intervalo [10-10) [10-20) [120-30) [130-40) Frecuencia Absoluta Acumulada 1 3 6 10 La frecuencia absoluta del intervalo [20-30) es: a) 6 b) 3 c) 0,6 d) 4 7. Con la tabla del ejercicio anterior, el tanto por ciento correspondiente al intervalo [10-20) es: a) 0,3 b) 30% c) 20% d) 2 8. Las calificaciones obtenidas por los matemáticas fueron: Exelente 50 Sobresaliente 110 Bueno 150 Insuficiente 100 Deficiente 90 a) a) b) c)
500 alumnos de la básica secundaria en
El gráfico de sectores circulares: No se corresponde con los resultados porque los porcentajes no son correctos. No se corresponde con los resultados porque el reparto de los sectores no es correcto. Se corresponde con los resultados No se puede afirmar nada.
9. Al pesar los 600 alumnos de un colegio se obtuvieron los siguientes resultados: Peso (kg) [45-50) [50-55) [55-60) [60-65) [65-70) No. de Alumnos 24 68 170 184 120
[70-75) 24
[75-80) 10
El número de alumnos que pesa menos de 70 kg es: a) 120 b) 566 c) 154 d) 94% 10. Con los datos del problema anterior, ¿qué porcentaje de alumnos pesa entre 65 y 70 kg? a) 0,2 b) 20% c) 60% d) 94% 11. Un enfermo tiene una infección. Se toma la temperatura cada 3 horas, obteniéndose la siguiente gráfica en un día: De las siguientes afirmaciones es correcta: a) La temperatura máxima la alcanza a las 9 horas b) Al finalizar el día, el enfermo está sin fiebre c) El enfermo ha desmejorado en las últimas horas d) No se puede afirmar nada. 12. ¿Cuál de las siguientes tablas corresponde al diagrama circular? 7
13. La suma de todos los porcentajes en cualquier tabla es: a) 1 b) 100 c) 1% d) El número total de observaciones 14. La suma de todas las frecuencias absolutas en cualquier tabla es: a) 1 b) 100 c) 1% d) El número total de observaciones 15. Se llama OJIVA a: a) Un diagrama de sectores circulares c) Una curva de frecuencias absolutas
b) Una tabla de frecuencias absolutas d) Una curva de frecuencias acumuladas
16. Una de las preguntas de un cuestionario está diseñada para ser contestada de la siguiente forma: Si su vivienda: Es propia sin deuda contesta ……………..1 Es propia hipotecada contesta ……………2 La está pagando contesta …………………3 Es arrendada contesta …………………….4 Es prestada contesta ………………………5 Recogida la información se obtienen los siguientes resultados: 43344413433324342335 34423244135443431332 a) Construye una tabla de frecuencias, el diagrama de barras y el gráfico de sectores b) ¿Cuántas personas encuestadas tenían vivienda? c) Una persona posee vivienda si marca una de las alternativas 1,2 o 3. ¿Qué porcentaje de personas posee vivienda? 17. El COEFICIENTE DE INTELIGENCIA (Cl) de un grupo de estudiantes de 8° grado es el siguiente: 116 106 104 110 116 123 100 115 108 91 107 87 111 106 102 111 104 96 101 117 111 110 103 119 107 88 114 110 103 107 119 116 105 96 102 107 121 106 118 106 102 117 120 114 105 108 99 104 113 101 113 109 97 111 112 125 91 107 108 97 115 89 103 95 107 110 100 105 99 103 108 100 106 102 93 114 105 99 111 106 a) Agrupa este conjunto de datos en 8 intervalos b) Construye la tabla de distribución de frecuencias c) Construye el histograma, el polígono de frecuencias absolutas, el polígono de frecuencias absolutas acumuladas, la curva de frecuencias absolutas y la ojiva correspondiente. d) ¿A partir de que CI tiene el 50% de los estudiantes el más alto coeficiente de inteligencia? e) ¿Es la curva de frecuencias absolutas, simétrica o asimétrica? 18. Estas fueron las calificaciones definitivas obtenidas por un grupo de estudiantes universitarios en el curso de Matemáticas I. 8
2,0 3,4 1,3 3,0 2,0 3,8 3,1
3,5 3,3 3,0 3,4 2,8 3,1 4,2
3,0 3,2 3,3 3,7 3,1 3,3 3,5
2,5 1,7 4,5 3,4 3,0 4,3 3,6
2,4 2,3 3,1 2,3 1,0 3,0 3,2
1,6 3,4 3,2 3,1 2,5 3,9 2,6
3,6 2,6 3,7 1,8 4,3 3,9 2,6
3,2 3,4 2,4 3,6 1,4 3,0 3,2
3.7 3,2 3,3 2,5 3,7 2,2 1,5
3.7 3,1 2,8 3,4 3,3 3,0 2,8
a) Si el curso se aprueba con nota mayor o igual a 3,0, ¿qué porcentaje de estudiantes perdió el curso? b) ¿Cuál fue la calificación más frecuente? c) ¿Qué porcentaje de estudiantes obtuvo calificación entre 2,5 y 3,5? d) Construye el histograma, el polígono de frecuencias absoluta y relativas, la curva de frecuencias absolutas y relativas. e) ¿Es la curva de frecuencias absolutas simétrica o asimétrica? 19. Los jugadores de dos equipos de baloncesto se clasifican por su estatura, según siguiente tabla: ESTATURA No. de Jugadores Equipo A No. de Jugadores Equipo B [1.70-1,80) 3 2 [1,80-1,90) 4 5 [1,90-2,00) 5 6 [2,00-2,10) 9 5 Para cada equipo: Representa el histograma de frecuencias absolutas y el de frecuencias absolutas acumuladas. Dibuja el polígono de frecuencias absolutas y el de frecuencias absolutas acumuladas. Dibuja la curva de frecuencias absolutas de cada equipo, ¿son simétricas o asimétricas?
DIVIÉRTETE MIENTRAS PIENSAS Se emplean 14 días en hacer una obra de 15 m de largo, 8 m de ancho y 4,75 m de alto a razón de 6 horas de trabajo cada día. Si se emplean 8 días en hacer otra obra del mismo ancho y de doble largo, trabajando 3 7 horas diarias, y siendo la dificultad de esta obra los de la anterior, ¿cuál es la altura de la obra?. 4
9