.I. IDENTIFICACIÓN NOMBRE DEL MÓDULO: UNIDAD DE COMPETENCIA:
ESTADÍSTICA al finalizar el módulo los lo s participante partici pantess será s eránn capaces de:
Organizar, presentar, analizar e interpretar información cuantitativa proveniente del ámbito industrial, comercial, económico o social y elaborar informes estadísticos descriptivos, demostrando capacidades para operar con métodos estadísticos básicos con ayuda de calculadora científica.
DURACIÓN:
72 horas pedagógicas
II. DESCRIPCIÓN POR ÁREA DE FORMACIÓN Y PRERREQUISITO ÁREA DE FORMACIÓN: FORMACIÓN: General Diferenciada UBICACIÓN UBICACIÓN EN LA MALLA: MALL A: semestre según carrera PRERREQUISITO: según carrera III. UNIDADES DE APRENDIZAJE 1a Unidad: Presentación d e Datos Datos 2 a Unidad: Unidad: Estadísticos Estadísticos Básicos 3 a Unidad: Unidad: Informes Estadísticos
1ª UNIDAD: Presentación de Datos DURACIÓN: 20 horas pedagógicas Aprendizajes Esperados: 1. Identifican y dan ejemplos ejemplos de fenómenos determinísticos determinísticos y no determinísticos. 2. Identifican el ámbito de acción de la Estadística, sus aplicaciones y método. 3. Identifican y caracterizan los distintos tipos de variable y escalas de medición: nominal, nominal, ordinal, discreta y continua. 4. Construyen tablas de frecuencia y gráficos para variables cualitativas cualitativas y los interpretan. 5. Construyen tablas de frecuencia y gráficos para variable numérica numérica discreta y los interpretan. 6. Construyen tablas de frecuencia y gráficos para variable numérica numérica continua y los interpretan. 7. Organizan datos en tablas de contingencia de 2 x 2 y construyen información a partir de ellas. 8. Organizan datos cuantitativos provenientes del ámbito social, económico, comercial o financiero, en tablas, grafican e interpretan la información según contexto.
2 a Unidad: Unidad: Estadísticos Estadísticos Básicos
DURACIÓN: 28 horas pedagógicas Aprendizajes Esperados: Explican el concepto de estadígrafo y su utilidad en la caracterización de series de datos. -Calculan e interpretan media aritmética con datos datos no agrupados y datos agrupados, con uso de la función estadística de la calculadora. calculadora. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.
Explican el concepto de estadígrafo y su utilidad en la caracterización de series de datos. Calculan e interpretan media aritmética con datos no agrupados agrupados y datos agrupados, con uso de la función estadística de la calculadora. Calculan e interpretan la mediana de una serie de datos con datos no agrupados y datos agrupados, con uso de calculadora. Calculan e interpretan la moda en una serie de datos. Resuelven problemas aplicando las diferentes medidas de tendencia central. Calculan e interpretan los cuartiles. Grafican cuartiles mediante gráfico de caja. Calculan e interpretan deciles y percentiles Calculan los estadígrafos de dispersión: varianza, desviación estándar y coeficiente de variación, con uso de la función estadística de la calculadora. Analizan datos cuantitativos provenientes del ámbito social, económico, comercial, financiero u otros, calculando estadígrafos de posición y dispersión.
Unidad: Estadísticos Estadísticos Básicos 3 a Unidad: DURACIÓN: 24 horas pedagógicas Aprendizajes Esperados: 1. 2. 3. 4. 5. 6. 7. 8.
Identifican estructura y contenidos de un informe estadístico descriptivo. Generan datos cuantitativos provenientes del ámbito industrial, comercial, económico o social, mediante la identificación y definición previa de variables de interés. Realizan organización de datos recopilados en tablas. Realizan graficación según naturaleza de los datos y objetivos de estudio. Calculan estadígrafos de posición y de dispersión. Analizan e interpretan la información recabada. Formulan conclusiones en el marco de los casos investigados. Elaboran informe estadístico.
IV. ORIENTACIONES METODOLÓGICAS Iniciar el proceso de enseñanza-aprendizaje a partir de los conocimientos previos de los estudiantes. Diagnóstico. -Centrar la docencia en el aprendizaje de los estudiantes, más que en la enseñanza. El estudiante debe ser activo. -Situar y vincular permanentemente los aprendizajes, contenidos y actividades con el contexto social y laboral de los estudiantes y la carrera que estudian. -Utilizar la resolución de problemas como uno de los ejes fundamentales de la enseñanza-aprendizaje. -Promover en los estudiantes la reflexión sobre sus conocimientos y las posibles implicaciones de sus actos. -Promover aprendizajes de conocimientos, habilidades y actitudes, integradas y relevantes en el contexto de la carrera. -Privilegiar la docencia orientada hacia la interpretación de datos e información del mundo real y cotidiano y hacia la aplicación de esta a distintos contextos. -Uso de calculadora científica.
V. EVALUACIÓN Unidad 1 Unidad 2 Unidad 3 Examen de Modulo
al menos 1 al menos 1 al menos 1 Examen escrito
VI. BIBLIOGRAFÍA -Berenson M., Levine D.; Krehbiel, T: “Estadísticas para la administración”. Prentice Hill. 2000. -Spiegel, Murray, “Estadística”; Editorial: Mc Graw Hill, 3a edición, 2003.
Links: http://www.bioestadistica.freeservers.com/temas.html •
http://ftp.medprev.uma.es/libro/html.htm http://www.cortland.edu/flteach/stats/stat-sp.html http://www.uaq.mx/matematicas/estadisticas/xstad02.html http://www.fisterra.com/mbe/investiga/index.asp http://descartes.cnice.mec.es/materiales_didacticos/estadistica_1_ciclo/indice.htm http://www.sectormatematica.cl/educmedia.htm VII. CLASE A CLASE
Clase 1: APRENDIZAJES ESPERADOS 1. 2. 3. 4.
Identifican y dan ejemplos de fenómenos determinísticos y no determinísticos Identifican el ámbito de acción de la Estadística, sus aplicaciones y métodos. Identifican los conceptos básicos de la estadística y los ejemplifican: población, muestra y variable. Identifican y caracterizan los distintos tipos de variables y escalas de medición: nominal, ordinal, discreta y continua
CONTENIDOS 1. 2. 3. 4.
Fenómenos determinísticos y no determinísticos. La estadística, sus aplicaciones y método Población, muestra y variable Tipos de variable
Fenómenos Determinísticos y no determinísticos: En la vida cotidiana nos solemos encontrar con una serie de situaciones cuyas consecuencias conocemos y de antemano podemos predecir, por ejemplo al finalizar el mes de Septiembre, comienza el mes de Octubre, al sumar siete más cinco, el resultado es doce, los fenómenos como los descritos reciben el nombre de Fenómenos Determinísticos. Sin embargo hay otros fenómenos con distintos resultados posibles, de los que no se pueden efectuar afirmaciones certeras hasta que hayan ocurrido, por ejemplo lanzar un dado y observar su cara superior, conocer los r esultados de la polla gol del próximo domingo, estos fenómenos cuyos resultados no pueden asegurarse hasta el momento de su ocurrencia reciben el nombre de fenómenos no determinísticos o aleatorios, no podemos saber cual de los resultados ocurrirá la próxima vez que se observe este fenómeno, aunque conozcamos todos los resultados posibles. Para cada una de las afirmaciones siguientes, indique si reflejan un fenómeno determinístico o no determinístico: 1. 2. 3. 4. 5. 6.
Las diagonales de un cuadrado son perpendiculares entre sí Al lanzar un dado se obtendrá un seis en la cara superior La próxima cosecha será mejor que la de este año Cuatro más siete es igual a once El próximo mes el valor de dólar subirá $15 La suma de los ángulos interiores de un triángulo es 180°
La estadística, sus aplicaciones y método Estamos en una etapa histórica, en que el uso y creación de información, a partir de información inicial, es fundamental, tanto en el ámbito de las disciplinas de modelos matemáticos como en otras, al parecer desvinculadas de estas instancias. En la línea de lo primero, distinguimos, la Estadística Descriptiva, que como su nombre lo indica, ordena información, llegando a describir la ocurrencia de fenómenos o eventos, mediante gráficos o tablas, además involucra la obtención inicial de la información deseada, sin pretender explicaciones de orden causal. A estas medidas que resumen al gran conjunto de datos, se les llama Estadísticas o Estadígrafos. En la línea de lo segundo, existirá un conjunto de procedimientos que permitirán obtener nueva información, es la Estadística Inferencial, la que en su desarrollo teórico, permanentemente utiliza el concepto de Probabilidad, idea esta, que también llega a desarrollar su propia teoría, la Estadística de Probabilidades La Estadística proporciona un conjunto de métodos aplicables en todas las áreas científicas donde se acumulan, se analizan y se interpretan datos: Salud y medicina, Biología, Economía, Administración, Contabilidad, Ingeniería etc. y en la Investigación Científica.
El Método Estadístico El método científico de investigación se basa en dos tipos de razonamiento: el deductivo y el inductivo. El método deductivo procede de lo general a lo particular y utiliza especialmente el razonamiento matemático: se establecen hipótesis generales que caracterizan un problema y se deducen ciertas propiedades particulares por razonamientos lógicos. El método inductivo realiza el proceso inverso: a partir de observaciones particulares de c iertos fenómenos se intenta deducir unas reglas generales aplicables a todos ellos.
La investigación estadística se desarrolla utilizando el ciclo deductivo- inductivo en las siguientes etapas: 1. 2. 3. 4. 5.
Planteamiento del problema Recolección de la información Organización y clasificación de los datos recogidos Análisis e interpretación de los resultados Conclusiones
Conceptos: Población, muestra y variable
Población es el conjunto completo de posibles mediciones o registros de algún rasgo cuantitativo correspondiente al conjunto completo de unidades que son objeto de investigación La población constituye el universo. Ejemplos. 1. Las edades de los estudiantes del AIEP 2. Los diámetros de la producción diaria de tuercas 3. Las placas de los automóviles que circulan en el país 4. Los enfermos de SIDA tratados con uno de tres tratamientos diferentes La muestra es un subconjunto o parte del Universo o Población que se selecciona para estudiarla. Al proceso de obtener una muestra se le denomina muestreo. Ejemplo: Si se desea estimar el gasto promedio anual de los estudiantes del AIEP de todo Chile, se extraería una muestra formada por cierto número de estudiantes, en seguida se determinaría el gasto anual correspondiente a cada uno de ellos y después se obtendría el promedio de estos gastos.
Variable es cualquier característica que difiere de un elemento a otro, dentro de una población. Ejemplos: 1. 2. 3. 4.
Horas extras realizadas por los trabajadores de una empresa Número de hijos de una muestra de familias Nivel educacional y religión de los chilenos Temperatura y humedad diaria en Santiago
Ejercicios: 1.
Se realiza una votación preliminar para determinar las preferencias de los electores en una elección presidencial. Con este fin se entrevistan a 1.500 electores registrados y entre ellos 860 están a favor del candidato A. Responder: a) ¿Qué constituye la muestra? b) ¿Qué constituye la población?
2.
Respuesta: Está constituida por las respuestas de los 1.500 electores registrados Respuesta: Está constituida por las respuestas de todos los electores registrados
Se realiza un estudio de opinión, para determinar el consumo de una cierta marca A de pasta dentífrica con respecto a otra. Con este fin se entrevistan a 2.000 personas y entre ellas 1.500 prefieren la marca A. Responder. a) ¿Qué constituye a la muestra?’ b) ¿Qué constituye a la población?
Tipos de variables Las variables se clasifican en: cualitativas y cuantitativas
Variable Cualitativa: Se denomina así, cuando la variable está asociada a una característica cualitativa. Es decir, son variables cuyos valores son cualidades que presenta la población.
Ejemplo Variable: “Profesión”, puede adoptar las modalidades: Técnico en Contabilidad General, Auditor, Técnico en Prevención de Riesgos etc. Las variables cualitativas se clasifican en: nominales y ordinales
Variable Cualitativa Nominal: Son aquellas que clasifican los elementos de una muestra o población en categorías mutuamente excluyentes. Ejemplos: 1. 2.
Clasificar un grupo de individuos por sexo Clasificar un grupo de personas por su estado civil
Variable Cualitativa Ordinal: Son aquellas que clasifican a los elementos de una muestra o población en categorías posibles de ordenar. Ejemplos: 1. a) b) c) d)
Clasificar un grupo de personas por su hábito de fumar: No fumadores Fumadores leves Fumadores moderados Fumadores severos
2. a) b) c) d)
Clasificar un grupo de individuos por su grado de instrucción: Analfabeto Educación Básica Educación Media Educación Superior
Variables cuantitativas: Son aquellas que se expresan mediante cantidades numéricas Las variables cuantitativas se clasifican en: discretas y continuas:
Variable Discreta: Es aquella que puede tomar solo valores en el conjunto de los Números Enteros Ejemplos. 1. Número de hijos por familia 2. Número de habitantes por comuna 3. Número de automóviles que pasan por una avenida en una hora.
Variable Continua: Es aquella que puede tomar cualquier valor comprendido en los Números Reales Ejemplos. 1. Peso 2. Estatura 3. Ingresos Ejercicios. Clasifique las siguientes características en variables nominales ordinales, continuas y discretas 1. Tiempo de servicio que llevan los trabajadores en una cierta empresa Respuesta: Cuantitativa continua 2. Número de cheques girados en un mes Respuesta. Cuantitativa discreta 3. Lugar de nacimiento de las personas que viven en Concepción Respuesta: Cualitativa Nominal 4. Nivel educacional de un grupo de personas Respuesta. Cualitativa Ordinal
Caso: Crecimiento y desarrollo de recién nacidos en el primer año de vida* Para conocer y caracterizar el crecimiento y desarrollo de los niños atendidos por el sistema público de salud, se efectuó un estudio con 123 recién nacidos en hospitales públicos de la región Metropolitana y se siguió su evolución clínica durante el primer año de vida. Los datos fueron recogidos de las historias clínicas individuales de los niños. Se analizaron al nacer, sexo (masculino, femenino), peso (en gramos), talla (en cm.), circunferencia cefálica (en cm.), valoración del peso (Sobrepeso, Peso normal, Bajo peso) y número de hermanos. *Caso adaptado de un estudio real realizado en Santiago de Chile. A partir de esta información: 1. Identifique la población objeto de estudio. 2. Identifique la muestra estudiada y su tamaño. 3. Identifique las variables consideradas en el estudio y clasifíquelas.
Clase 2: APRENDIZAJES ESPERADOS
CONTENIDOS
Construyen tablas de frecuencias y gráficos para variables cualitativas y los interpretan
Tablas de frecuencia y gráficos para variables cualitativas y su interpretación
Si los datos que se dispone son numerosos, es indispensable clasificarlos en un cuadro o tabla resumen de las observaciones originales, a las cuales llamaremos Tabla de distribución de frecuencias. En el caso de variables cualitativas, la tabla de distribución de frecuencias adoptará la siguiente forma: Variable Característica A Característica B . . . Característica Z
Frecuencia absoluta
Frecuencia relativa
n A
h A
n B
h B
. . n Z
. . h Z
Totales
n
1
Frecuencia absoluta: Se denomina frecuencia absoluta al número de veces que se repite un valor en el c onjunto de observaciones Frecuencia relativa: Se denomina frecuencia relativa, al cuociente de la frecuencia absoluta y el número tota de observaciones n. Ejemplo. Se realizó una encuesta a 419 personas, en relación a la adquisición de un cierto bien. Los siguientes datos reflejan las respuestas de las personas encuestadas a la pregunta ¿compraría usted un computador? Respuestas Sí No No responden Total
Frecuencia absoluta 293 80 46 419
a) ¿Qué tanto por ciento de las personas no responden? b) ¿Qué tanto por ciento de las personas compraría un computador? Para responder las preguntas anteriores, c alculemos las frecuencias relativas Respuestas Sí No No responden Total
Frecuencia absoluta 293 80 46 n = 419
Frecuencia relativa 0,6993 0,1909 0,1098
a. b.
El porcentaje de personas que no responden : 0,1098 x 100 = 10,98% El porcentaje de personas que respondieron si : 0,6993 x 100 = 69,93%
Representación gráfica. Uno de los gráficos más utilizados para representar variables cualitativas es el gráfico sectorial o circular. Para construir este gráfico, se utiliza una circunferencia, cuyo círculo se divide en sectores tales que sus medidas angulares centrales y, por lo tanto la superficie del sector circular sean proporcionales a las magnitudes de los valores de la variable que representan. Al total le corresponde el círculo completo, es decir los 360° de la circunferencia y por proporciones, se encuentra el número de grados que le corresponde a cada parte. Confeccionar gráfico sectorial o circular, con respecto ala siguiente tabla de distribución de frecuencias Respuestas Sí No No responden Total
Número de grados:
Frecuencia absoluta 293 80 46 n = 419
Frecuencia relativa 0,6993 0,1909 0,1098 1.0
ángulo 251,74 68,74 39,52
ni ⋅ 360 n
Respuestas Sí No No responden
Otro gráfico muy utilizado es el gráfico de barras
Gráfico de barras: Es aquel en el cual el fenómeno que se estudia queda representado por una serie de rectángulos, barras o paralelepípedos, los cuales pueden dibujarse horizontalmente o verticalmente, Este gráfico se utiliza para representar variables de tipo cualitativo o cuantitativo discreto. Confeccionar gráfico de barras, con respecto a la siguiente tabla de distribución de frecuencias: Respuestas Sí No No responden Total
Frecuencia absoluta 293 80 46 n = 419
300 250 200 150 100 50 0 Sí
No
No responden
Ejercicio: Para evaluar el conocimiento del concepto de Responsabilidad Social en la opinión pública chilena, se realizó una encuesta telefónica entre el 23 de junio y el 18 de julio de 2006. Se entrevistó a una muestra de 454 personas, hombres y mujeres, entre 15 y 70 años, de los GSE Alto, medio y bajo, residentes en las ciudades de Santiago, Antofagasta, Viña del Mar, Valparaíso, Concepción y Talcahuano. Los resultados se muestran en la tabla siguiente, en número de casos:
¿Ha escuchado usted hablar de la responsabilidad social? Respuesta Sí No Ns/Nr Total
Nº casos 154 273 27
%
a .Complete la columna de frecuencia porcentual . Aproxime correctamente a un decimal. b. Construya un gráfico sectorial que muestre los resultados. c. Con respecto a la tabla de distribución: i) ¿Qué tanto por ciento ha escuchado hablar de responsabilidad social? ii) ¿Qué tanto por ciento no supo o no respondió? a)
¿Ha escuchado usted hablar de la responsabilidad social? Respuesta Nº casos % Sí 154 33,9 No 273 60,1 Ns/Nr 27 5,9 Total 454 100
b)
Gráfico Sectorial
Sí No Ns/Nr
c) Responsabilidad Social 300 250 200 150
Nº casos
100 50 0 Sí
d) i) 33,9 % ii) 5,9 %
No
Ns/Nr
Clase 3: APRENDIZAJES ESPERADOS -Construyen tablas de frecuencia para variable numérica discreta y los interpretan.
CONTENIDOS -Tablas de frecuencia para variable discreta y su interpretación.
Tablas de dist ribución de frecuencias para variable discreta: Sean x1 , x 2 , x3 .............. x m los m diferentes valores de la variable
Definición: Frecuencia absoluta: Se denomina frecuencia absoluta al número de veces que se repite un valor de la variable en el conjunto de observaciones
Propiedad: n
∑n =n i
i =1
Definición: Frecuencia relativa: Se denomina frecuencia relativa al cuociente de la frecuencia absoluta y el número tota de observaciones n. Propiedad: n
∑ h =1,0 i
i =1
Definición: Frecuencia absoluta acumulada: Se llama Frecuencia Absoluta Acumulada, a la suma acumulativa término a término de las frecuencias absolutas.
Propiedad: El último término de las Frecuencias Absolutas acumuladas es n
Definición: Frecuencia relativa acumulada: Se llama Frecuencia Relativa Acumulada, a la s uma acumulativa término a término de las frecuencias relativas.
Propiedad: El último término de las Frecuencias Relativas Acumuladas es 1.
En el caso de variables numéricas discretas, la tabla de distribución de frecuencias adoptará la siguiente forma: Valores de la variable
Frecuencia absoluta
Frecuencia relativa
Frecuencia absoluta acumulada
Frecuencia relativa acumulada
xi
ni
hi
N i
H i
x1
n1
h1
N 1
H 1
x 2
n2
h2
N 2
H 2
x3
n3
h3
N 3
H 3
. . . x m
. . . nm
. . . hm
. . .
. . .
N m = n
H m = 1
Totales
n
1
Ejemplo: En un packing se examinó un lote de 30 c ajas de duraznos para exportación. El número de duraznos en mal estado en cada c aja es el siguiente: 0 2 1 3 3
3 4 1 5 2
1 2 3 4 1
1 3 2 4 0
1 3 4 5 2
0 3 4 1 3
Construir tabla de distribución de frecuencias. Los distintos valores de la variable se ordenan de menor a mayor en la primera columna xi La frecuencia de cada valor xi se registra en la columna ni . Para la tercera columna, hi , se calcula la frecuencia relativa correspondiente a cada valor x. En la columna hi % se convierte la frecuencia relativa a %. La columna N i corresponde a la frecuencia absoluta acumulada. La columna H i corresponde a la frecuencia porcentual acumulada.
xi
ni
hi
hi %
N i
H i
0 1 2 3 4 5 Totales
3 7 5 8 5 2 30
0,10 0,2323 0,1667 0,2667 0,1667 0,0667 1
10 23,33 16,67 26,67 16,67 6,67 100
3 10 15 23 28 30
10 33,33 50 76,67 93,34 100
Con respecto a la tabla de distribución de frecuencias:
i) ¿Qué tanto por ciento de las cajas tiene más de tres duraznos en mal estado?
16,67 + 6,67 = 23,34% ii) ¿Cuantas cajas tienen 2 o 3 duraznos en mal estado?
5 + 8 =13 Cajas iii) ¿Qué tanto por ciento de las cajas tiene a lo más 1 durazno en mal estado?
10 + 23,33 = 33,33% Ejercicio: Se dispone de la siguiente información sobre el número de personas activas en 25 familias:
0 1 2 4 1 a. b. c.
2 3 2 4 5
2 2 0 1 3
4 5 1 2 3
4 1 0 2 5
¿Qué tipo de variable es? Construir Tabla de Distribución de Frecuencias En relación con la tabla de distribución: i) ¿Qué tanto por ciento de las familias tienen 2 personas activas? Ii) ¿Que tanto por ciento de las familias tienen entre 2 y 3 personas activas?
a. Variable Discreta b.
c.
i) 68%
xi
ni
hi %
N i
H i
0 1 2 3 4 5
3 5 7 3 4 3 25
12 20 28 12 16 12 100
3 8 15 18 22 25
12 32 60 72 88 100
ii) 40%
Clase 4: APRENDIZAJES ESPERADOS
CONTENIDOS
-Construyen gráficos para variable numérica discreta y los interpretan.
-Gráficos para variable discreta y su interpretación.
Representación gráfica: los gráficos más adecuados, para representar una variable numérica discreta son. 1. Diagrama de tallo y hojas Un procedimiento semi- gráfico (tabular y gráfico) de presentar la información para datos cuantitativos, especialmente útil cuando el número de observaciones es pequeño (menor a 50), es el diagrama de tallos y hojas. Construcción. 1. 2.
Redondear los datos a una, dos o tres cifras significativas, expresándolas en unidades convenientes Disponerlos en una tabla con dos columnas separadas por un línea como sigue:
a. Para datos con un solo dígito, el tallo queda constituido por los distintos valores de la variable, ordenados de menor a mayor, de arriba hacia abajo. Las hojas quedan representadas por tantos ceros como s ea su frecuencia. Por ejemplo: si el 7 se repite 4 veces, se escribe: Tallo 7
Hoja 0000
a) Para datos con dos dígitos, escribir a la izquierda de la línea los dígitos de las decenas, que forman el tallo, y a la derecha las unidades que serán hojas. Por ejemplo: 72 se escribe Tallo 7
Hoja 2
b) Para datos con tres dígitos el tallo estará formado por los dígitos de las centenas y decenas, que se escribirán a la izquierda, separados de las unidades que serán las hojas. Por ejemplo, 754 se escribirá: Tallo 75
Hoja 4
c)
Cada tallo define una clase, y se escribe sólo una vez. El número de hojas representa la frecuencia de dicha clase, que se ubica en una tercera columna del diagrama.
Ejemplo: Los siguientes datos representan los ingresos semanales (en dólares) de un grupo de trabajadores. 114, 125, 114, 124, 143, 152, 133, 113, 178, 127, 135, 161, 126, 134, 147, 132 Tallo 11 12 13 14 15 16 17
Hojas 443 5476 3542 37 2 1 8
Frecuencia 3 4 4 2 1 1 1
Gráfico de segmentos. Se utiliza para representar los diferentes tipos de distribuciones de frecuencias de datos discretos Para representar gráficamente las distribuciones de frecuencias absolutas (o relativas), se ubican en el eje horizontal, los valores de las variables y se levantan sobre cada uno de ellos, un segmento vertical de longitud igual a la frecuencia absoluta (o relativa) correspondiente a cada valor x. Ejemplo: Dada la siguiente tabla de distribución, construir gráfico de segmentos, utilizando frecuencias absolutas xi
ni
hi
1 2 3 4 5 6 Totales
3 7 5 8 5 2 30
0,10 0,2323 0,1667 0,2667 0,1667 0,0667 1
9
8
7
6
5
4
3
2
1
0 1
2
3
4
5
6
Ejercicio. Los siguientes datos corresponden al número de cheques mensuales girados por un grupo de personas en una sucursal bancaria 10 25
25 12
21 31
10 34
12 21
34 12
Representar los datos anteriores en un Diagrama de Tallo y Hoja y un gráfico de segmentos
Diagrama de Tallo y hoja Ordenando la información anterior en forma creciente tenemos: 10 10 10 12 12 12 12 21 21 25 25 25 31 31 34 34 Tallo 1 2 3
Hoja 0002222 11555 1144
Nº de casos 7 5 4 Total: 16
Tallo: decenas Hoja: unidades
Gráfico de Segmento ni
4 3 2 1 x1
10 12 21 25 31 34
25 31
12 10
Clase 5: APRENDIZAJES ESPERADOS - Construyen tablas de frecuencia para variable numérica continua y las interpretan
CONTENIDOS - Tablas de frecuencia para variable continua y su interpretación.
Si la variable que estamos midiendo es de tipo continuo (puede tomar cualquier intervalo determinado por los números reales), no tiene sentido el tabularla para cada una de las observaciones dado que es muy improbable que variable bajo estudio tome el mismo valor durante el experimento. Dicho de otro modo cuando en una distribución de frecuencias haya muchos valores distintos de la variable conviene agruparlos en intervalos o clases. Para realizar la agrupación se debe considerar: a.
La diferencia entre el mayor y menor valor que toma la variable
Definición: Se llama Recorrido al campo de variación de la variable Se anota Recorrido = x máximo - x mínimo, este concepto se aplica al recorrido de la variable en la serie de datos o al interior de cada intervalo de agrupación en este caso se llama amplitud b.
El número y tamaño de los intervalos, dependen de la cantidad de datos de la muestra y de su recorrido. El número de intervalos debe cumplir con dos condiciones: resumir la información y conservar el detalle de la muestra. c. Proceder a contar en el listado numérico de nuestra información la cantidad de observaciones que quedan comprendidos entre los intervalos, dependiendo del tipo de intervalo que se escoja. Puede ser cerrado- cerrado,
cerrado- abierto
Se tiene la siguiente información de los ingresos mensuales (miles de pesos) de un grupo de 40 trabajadores, obtenidos en una encuesta realizada en una empresa. 354 352 363 358
378 355 355 363
350 361 357 366
366 365 361 367
380 360 362 356
375 359 355 364
363 360 367 370
375 368 364 376
350 362 365 372
362 362 358 360
Podemos ordenar la información con relación a múltiples criterios, por ejemplo podemos estar interesados en ordenar la Información en ocho grupos o intervalos o nos puede interesar que la diferencia entre el ingreso mayor y el menor de cada intervalo sea de 4.000 pesos etc. Cualquiera sea la ordenación debemos considerar el Recorrido o Rango, para los datos considerados, nuestro rango es de Rango = 380 – 350 = 30, por lo tanto podemos definir el rango o recorrido como: Rango = x máximo - x mínimo
Un criterio más universal para determinar el número óptimo de intervalos está dado por la expresión: Número óptimo de Intervalos = [1 + 3,3 log n ] , n es el número de observaciones o tamaño de la muestra. Para aplicar este criterio, se considera solo la parte entera del valor obtenido En relación al ejercicio propuesto: Número óptimo de intervalos: [1 + 3,3 log 40] = [6,28] = 6
Amplitud o tamaño de cada intervalo: A =
En relación al ejercicio propuesto: A =
Rango N ° int ervalos
30 =5 6
En el caso de variables numéricas continuas la tabla de distribución de frecuencias adoptará la siguiente forma: Intervalo de clase
Marca de clase (marca de intervalo)
Frecuencia absoluta
Frecuencia relativa
Frecuencia absoluta acumulada
Frecuencia relativa acumulada
x / i −1 − xi
xi
ni
hi
N i
H i
/ 0
− x / 1
x1
n1
h1
N 1
H 1
/ 1
− x / 2
x 2
n2
h2
N 2
H 2
/ 2
− x / 3
x3
n3
h3
N 3
H 3
. . . x m
. . . nm
. . . hm
. . .
. . .
N m = n
H m = 1
/
x x x
/
x
m −1
− x / m
Completar tabla de distribución de frecuencias relacionada con los ingresos mensuales (miles de pesos) de un grupo de 40 trabajadores, obtenidos en una encuesta realizada en una empresa. Intervalo de clase
Marca de clase (marca de intervalo)
Frecuencia absoluta
Frecuencia relativa
Frecuencia absoluta acumulada
Frecuencia relativa acumulada
xi
ni
hi
N i
H i
352,5 357,5 362,5 367,5 372,5 377,5
4 8 14 7 2 5
0,1 0,2 0,35 0,175 0,05 0,125 1,0
4 12 26 33 35 40
0,1 0,3 0,65 0,825 0,875 1
/
x / i −1 − xi
350 – 355 355 - 360 360 – 365 365 – 370 370 – 375 375 - 380
n = 40
En el intervalo de clase estamos utilizando como criterio intervalo cerrado – abierto. Si observamos nuestro primer intervalo, 350 – 355, en nuestro ejemplo, se llama intervalo de clase. Los números extremos 350 – 355 se llaman límite inferior de la clase (350) y límite superior de la clase (355), 352,5 es la marca de la clase. Así podemos definir: Se llama Marca de Clase al valor de la variable que representa la clase xi =
xi′−1 + xi′
2
Las definiciones de frecuencia absoluta, frecuencia relativa, frecuencia absoluta acumulada, frecuencia relativa acumulada y sus propiedades, coinciden con las utilizadas en el caso de variable discreta. En relación con nuestro ejemplo: i) ¿Qué tanto por ciento de los trabajadores tienen ingresos de $360.000 o más? Respuesta 35% + 17,5%+ 5% +12,5% = 70% ii) ¿Que tanto por ciento de los trabajadores tienen ingresos entre $355.000 y $364.999? Respuesta: 20%+35% = 55 %
Ejercicio: Los siguientes datos indican el número de minutos que ocuparon sus asientos 20 clientes de una cafetería
20 29
35 24 1. 2.
28 31
36 32
26 29
35 38
31 23
30 33
33 40
34 27
Construir tabla de distribución de frecuencias, utilizando intervalo cerrado – abierto. Calcular el número de intervalos utilizando la expresión [1 + 3,3 log n ] i) ¿Qué tanto por ciento de clientes ocuparon sus asientos 32 minutos o más? ii) ¿Qué tanto por ciento de los clientes ocuparon sus asientos entre 28 y menos de 36 minutos?
1. Intervalo de clase
/
x
i −1
− xi /
20 – 24 24 – 28 28 – 32 32 – 36 36 - 40
2. i) 45%
ii) 60%
Marca de clase (marca de intervalo)
Frecuencia absoluta
Frecuencia relativa
Frecuencia absoluta acumulada
Frecuencia relativa acumulada
xi
ni
hi
N i
H i
22 26 30 34 38
2 3 6 6 3 n = 20
0,10 0,15 0,30 0,30 0,15 1,0
2 5 11 17 20
0,10 0,25 0,55 0,85 1,00
Clase 6: APRENDIZAJES ESPERADOS
CONTENIDOS
- Construyen gráficos para variable numérica continua y los interpretan.
- Gráficos para variable continua y su interpretación.
Otra forma de operar con la información, es tener presente una forma de representación gráfica. Para datos de variable continua los más frecuentes son: Histogramas, Poligonales, y Ojivas
Histograma Consiste en un conjunto de rectángulos con: bases en el eje x, centros en las marcas de clases y longitudes iguales a los tamaños de los intervalos de clases. Si los intervalos de clases tienen todos la misma amplitud, las alturas de los rectángulos son proporcionales a las frecuencias de clase, y entonces es costumbre tomar las alturas iguales a las frecuencias de clase. Ejemplo: Dada la siguiente tabla de distribución, graficar histograma: Intervalo de clase
/
x
i −1
Marca de clase (marca de intervalo)
Frecuencia absoluta
Frecuencia relativa
xi
ni
hi
22 26 30 34 38
2 3 6 6 3 n = 20
0,10 0,15 0,30 0,30 0,15 1,0
− xi /
20 – 24 24 – 28 28 – 32 32 – 36 36 - 40
6
6
6 5
20 – 24
4 3
3
3
24 – 28 28 – 32
2
2
32 – 36
1
36 - 40
0 1
Poligonal o Polígono de Frecuencias: Es un gráfico de trazos de la frecuencia de clase con relación a la marca de clase. Puede obtenerse conectando los puntos medios de las partes superiores de los rectángulos del histograma.
Ejemplo: Dada la siguiente tabla de distribución, graficar Polígono de Frecuencias: Intervalo de clase
/
x
i −1
/
− xi
20 – 24 24 – 28 28 – 32 32 – 36 36 - 40
Marca de clase (marca de intervalo)
Frecuencia absoluta
Frecuencia relativa
xi
ni
hi
22 26 30 34 38
2 3 6 6 3 n = 20
0,10 0,15 0,30 0,30 0,15 1,0
7 6 5 4 3 2 1 0 20 – 24
24 – 28
28 – 32
32 – 36
36 - 40
¿Que pasaría si construyéramos un gráfico, en que x sea una variable cualesquiera e y una forma de frecuencia acumulada? Por ejemplo, la Frecuencia Acumulada, un gráfico de estas características siempre presenta la forma de una S, algo estilizada, un gráfico de este tipo se denomina OJIVA.
Dada la siguiente tabla de distribución, graficar OJIVA Intervalo de clase
/
x / i −1 − xi
20 – 24 24 – 28 28 – 32 32 – 36 36 - 40
Marca de clase (marca de intervalo)
Frecuencia absoluta
Frecuencia Absoluta acumulada
xi
ni
N i
22 26 30 34 38
2 3 6 6 3 n = 20
2 5 11 17 20
Ojiva 25 a t u l o a 20 s b d a 15 a l a u i c m10 n u e c u a 5 c e r F 0 20
25
30 Marcas de Intervalos
35
40
El siguiente gráfico, muestra los ingresos mensuales (miles de pesos) de los trabajadores de una institución bancaria. Ingresos Mensuales 45
50
s a n 40 o s r e 30 p e d 20 o r e 10 m ú N 0
200- 250 250 - 300 20
300 - 350
10
350- 400 5
2
400- 450
1
Ingresos
Responda: i) ¿Qué tanto por ciento de los trabajadores gana $299.999 o menos? 12,2+54,9 = 67,1% ii) ¿Qué tanto por ciento de los trabajadores gana entre $200.000 y $349.999? 12,2+54,9+24,4 = 91,5% iii) ¿Cuantos trabajadores ganan a lo más $249.999? 10 trabajadores
Clase 7: APRENDIZAJES ESPERADOS - Organizan datos en tablas de contingencia de 2 x 2 y construyen información a partir de ellas.
CONTENIDOS --Tablas de contingencia de 2 x 2.
Una tabla de contingencia permite describir y analizar, el comportamiento de una variable en relación con otra variable. En el caso de tablas de contingencia de 2x2, veamos los siguientes casos: Ejemplo: Se desea estudiar la relación que existe entre encontrar trabajo y el conocimiento de un determinado idioma. Con tal objeto se realizó una encuesta, la distribución de los resultados se presenta en la siguiente tabla de contingencia de 2x2 Idioma
Si
No
Total
Encontrar trabajo Si No Total
11 4 15
7 10 17
18 14 32
Con respecto a la tabla: i) De los que encontraron trabajo ¿Que tanto por ciento tenía conocimiento de un determinado idioma? 11 x100 = 73,33% 15 ii) Del total de la muestra. ¿Cuantas personas encontraron trabajo y no tenían conocimiento de un idioma? 7 x100 = 21,9% 32 iii) De los que no encontraron trabajo. ¿Que tanto por ciento tenía conocimiento de un idioma? 4 x100 = 26,67% 15 Una gelatería registra la forma de pago en una muestra aleatoria de clientes, según grupo de edad, pudiendo construirse la siguiente tabla de frecuencias, en número de casos: Edad Medio de pago Efectivo Tarjeta de Crédito Total
18 a 29
30 a 70
Total
50 33 83
172 139 311
222 172 394
Responda: i) ii) iii)
De los que cancelan en efectivo. ¿Qué tanto por ciento tiene 3 años o más? Del total de la muestra. ¿Qué tanto por ciento cancela con tarjeta de crédito? De los que cancelan con tarjeta de crédito.¿Que tanto por ciento tiene entre 18 y 29 años
Clase 8: APRENDIZAJES ESPERADOS
CONTENIDOS
Organizan datos cuantitativos Organización, presentación e provenientes del ámbito social, económico, interpretación de datos. comercial o financiero, en tablas, grafican e interpretan la información según contexto.
Consideremos los siguientes ejemplos. Ejemplo: Una encuesta indagó la opinión de una muestra de personas mayores de 18 años acerca de la veracidad de la
información entregada por la TV. El resultado, según sexo, generó los siguientes datos, en %. ¿Cree usted que es veraz la información entregada por la TV? Sí, siempre es veraz. Solo a veces es veraz. No, no es veraz.
TOTAL
% casos hombres mujeres 9,2
(%)
11,5 48,1
TOTAL (%) 20,5 52,3 27,2 100
a. Complete la tabla de contingencia con los % faltantes. b. Identifique las variables en estudio c. Identifique el tipo de cada variable:
Respuesta: a. ¿Cree usted que es veraz la información entregada por la TV? Sí, siempre es veraz. Solo a veces es veraz. No, no es veraz. TOTAL (%)
% casos hombres mujeres 11,3 9,2 29,1 23,2 11,5 15,7 48,1 51,9
TOTAL (%) 20,5 52,3 27,2 100
b. Las variables en estudio son: Grado de creencia en la veracidad de la información entregada por la TV y Sexo (o género). c. Identifique el tipo de cada variable: La variable Grado de creencia en la veracidad de la información entregada por la TV es cualitativa ordinal. La variable Sexo es cualitativa dicotómica.
Problema: Para realizar un estudio, se segmenta la muestra según Sector de Residencia y Nivel de Escolaridad,
encontrando los datos de la tabla:
SECTOR DE NIVEL DE ESCOLARIDAD RESIDENCIA Sin educ. Básica Media Superior
TOTAL
Urbano
21
124
96
38
279
Rural
32
66
23
5
126
TOTAL
53
190
119
43
405
Calcule los siguientes porcentajes a. De los que no tienen estudios, qué % vive en zonas rurales
b. De los que viven en sectores urbanos, ¿qué % tiene estudios? c. De los que tienen estudios, ¿qué % no vive en zonas rurales? d. De la muestra, ¿qué % tiene estudios básicos y vive en sectores urbanos? e. De los que viven en sectores rurales, ¿qué % tiene estudios medio o superiores? f. ¿Qué % de la muestra vive en sectores rurales? g. ¿Qué % de la muestra tiene estudios medios o básicos? h. De los que tienen estudios medios o superiores, ¿qué % no vive en sectores rurales? Respuestas: a.
e.
32 x100 = 60,38% 53
b.
259 x100 = 92,83% c. 279
28 126 x100 = 22,22% f. x100 = 31,11% 126 405
258 x100 = 92,47% 279
g.
309 x100 = 76,3% 405
d.
66 x100 =16,3 405
h.
.
162 x100 = 58,06% 279
Un supermercado registra la forma de pago en una muestra aleatoria de clientes, según grupo de edad, pudiendo construirse la siguiente tabla de frecuencias, en número de casos: EDAD Medio de Pago Efectivo Cheque Tarjeta de Crédito Tarjeta de débito TOTAL
18 a 29
30 a 49
50 a 70
26 24 12 21 83
59 12 34 15 120
95 6 87 3 191
TOTAL 180 42 133 39 394
De acuerdo a esta tabla. De los que pagan con tarjeta de crédito, ¿qué tanto por ciento tiene 50 años o más?
Clase 9 y 10: APRENDIZAJES ESPERADOS
CONTENIDOS
Organizan datos cuantitativos Organización, presentación e provenientes del ámbito social, económico, interpretación de datos. comercial o financiero, en tablas, grafican e interpretan la información según contexto.
Resolver los siguientes problemas Una encuesta de opinión realizada en Internet solicitó a los encuestados voluntarios que pusieran una nota al Transantiago en sus primeros días de funcionamiento, en una escala de 1 a 7, donde 1 es muy malo y 7 muy bueno, siendo aprobatoria la nota 4 hacia arriba y reprobatoria de 3 hacia abajo. Las notas se debían expresar en números enteros, sin decimales. El resultado de los primeros 1.563 votos se muestra en la tabla siguiente: ¿Qué nota le pone al Plan Transantiago en sus primeros días de funcionamiento? Nota % de casos 1 39,5 2 15,7 3 13,0 4 8,5 5 10,5 6 5,9 7 6,9 TOTAL 100% Fuente: encuesta de opinión on-line de emol.com. N°de votos: 1563. Marzo 2007.
a. Grafique adecuadamente. b. De acuerdo a la tabla: i) ¿Qué % de la muestra reprueba al Transantiago en los primeros días de funcionamiento? ii) ¿Cuántos sujetos de la muestra aprueban el Plan? iii) ¿Qué % de la muestra le puso nota mayor que 4 al Plan Transantiago en los primeros días? iv) ¿Cuántos sujetos de la muestra reprueban el Plan con nota inferior? a 45 40 35 e j 30 a t n 25 e 20 c r o 15 P 10 5 0 1
2
3
4
Nota
b.
5
6
7
i). 68,2%
ii. 497 personas
iii) 23,3% iv) 1.066 personas
El gráfico adjunto muestra la distribución de frecuencias del número de empleadores, que han tenido en el curso
del último año, una muestra de adultos de 20 a 40 años de edad seleccionados al azar. ¿VERDADERO O FALSO? Nº de casos 16 14 12 10 8 6 4 2 0
Nº
0 1 2 3 Nº de empleadores
4
Sobre la base del gráfico se afirma que:
a. El 52,0% de los encuestados ha tenido uno o dos empleadores durante el último año. b. De los que han tenido más de un empleador, el 20% ha tenido solo uno. c. La mayoría de los encuestados ha tenido más de dos empleadores durante el último año. d. De los que han tenido entre 2 y 3 empleadores, el 53,3% ha tenido 2. e. El estudio abarcó una muestra de 50 adultos de 20 a 40 años de edad. a. Falso b. Falso c. Falso d. Verdadero e. Verdadero El gráfico de la figura representa la distribución de los 143 clientes morosos de Almacenes ACME, según el número de cuotas que adeudan.
Se pide: a. Construir una tabla de frecuencias. b. Determinar: i) % de morosos con a lo más 3 cuotas morosas ii) % de clientes morosos que tienen a lo menos 2 cuotas morosas.
Clase 11: APRENDIZAJES ESPERADOS Explican el concepto de estadígrafo y su utilidad en la caracterización de series de datos. Calculan e interpretan media aritmética con datos no agrupados y datos agrupados, con uso de la función estadística de la calculadora.
CONTENIDOS Concepto de estadígrafo y su valor en la caracterización de series de datos. -Cálculo de la media aritmética con datos no agrupados y datos agrupados, con uso de calculadora.
Las tablas o cuadros estadísticos, los distintos tipos de gráficos, las razones, las proporciones, porcentajes y tasas, constituyen diversos modos de resumir o reducir un conjunto de datos a unas pocas cifras, que aisladamente, o dispuestas en forma tabular, sirven para transmitir las características principales de la información representada en los datos y contienen elementos descriptivos que hacen innecesario el examen de todos los datos. Las cifras descriptivas que se obtienen como función de una muestra ( x1 , x 2 ,........ x n ) , que representan un subconjunto de la población, se denominan Estadígrafos o Estadístico. Entre los estadígrafos, tenemos los de posición, dispersión, concentración y de forma. Los Estadígrafos de posición, son aquellos que describen la posición que ocupa la distribución de frecuencias respecto a un valor de variable. Se distinguen dos tipos: los estadígrafos de tendencia central y los de localización. Los estadígrafos de tendencia central, debe su nombre al hecho que sus valores tienden a ocupar posiciones centrales o intermedios entre el menor y mayor valor del conjunto de datos, a partir de la cual se calculan estos estadígrafos; es decir entregan de alguna forma información sobre el centro de la distribución, los más importantes y usados son: la media aritmética y la mediana. Los estadígrafos de localización, de los valores más frecuentes o de valores extremos, los más utilizados son : la moda, cuartiles, deciles, percentiles. Los estadígrafos de dispersión, indican cuán dispersos están los datos. Los más utilizados son aquellos que indican la concentración de los valores del conjunto de datos alrededor del promedio, el más importante es la varianza, desviación típica y coeficiente de variación o de dispersión. Las características de concentración, indican el grado de concentración o de desigualdad de una distribución. Las característica de forma, indican la forma de la curva (o polígono) de distribución y en especial su simetría o asimetría y forma más o menos aplastada o en punta. Definición: Sea X una variable numérica y sean x1 , x 2 , x3 ......... x n n observaciones de la variable X, se define la media aritmética o promedio o media como: n
∑ x X =
i =1
n
n
∑ x
i
si la distribución no tiene frecuencia o X =
i
i =1
n
⋅ ni si la distribución tiene frecuencias.
Una desventaja de la media aritmética, es que es altamente influenciable por valores extremos, por lo que la media es recomendable cuando la variable tiene una distribución de valores homogéneos.
Problemas Resueltos. Una persona que trabaja en forma independiente gana un mes $100.000, otro mes $300.000 y otro $200.000. ¿Cuanto gana en promedio mensual? Interprete el resultado: Solución. X =
100.000 + 300.000 + 200.000 3
X = $200.000
Interpretación: La persona debe esperar ganar cada mes $200.000 por supuesto que abra meses que ganará más y otros menos. Durante 30 días se ha observado el número de pasajeros que viajan de Santiago a Concepción. La información es la siguiente: y i
ni
30 31 32 33 34 35 36 37 38 39 40 Total
4 2 2 1 1 3 2 2 6 4 3
y i ⋅ ni
120 62 64 33 34 105 72 74 228 156 120 n = 30 1.068
Determine la media aritmética e interprétela 11
∑ y X =
i
i =1
30
⋅ ni =
1.068 = 35,6 30
Pasajeros diarios
Esto significa que como promedio el número de personas que viajan de Santiago a Concepción diariamente es 36, esto debe interpretarse como que el número de pasajeros que viajan a diario de Santiago a Concepción, se debe esperar que sea 36. Resolver el problema anterior con la función estadística de la calculadora,
La siguiente tabla muestra las horas de trabajo transcurridas hasta que un trabajador sufre un accidente de
trabajo, investigación realizada a una muestra de 27 accidentes de trabajo. Tiempo (horas)
Nº de casos
0–2 2–4 4–6 6–8 8 – 10
6 11 5 2 3
Total
27
Tiempo (horas)
xi
Nº de casos
xi ⋅ ni
0–2 2–4 4–6 6–8 8 – 10
1 3 5 7 9
6 11 5 2 3
6 33 25 14 27
27
105
Total
X =
Calcule el tiempo medio hasta la ocurrencia de un accidente en la muestra.
105 = 3,9 Horas 27
Resolver el problema anterior con la función estadística de la calculadora, Problema Propuesto: La siguiente información corresponde al consumo mensual en combustible destinado a calefacción, expresado en miles de pesos, en una muestra aleatoria de hogares de un barrio de Santiago en los meses de invierno: Consumo ($miles)
Nº de casos
4–6 6–8 8– 10 10 – 12 12 –14
17 26 14 9 11
Calcule el consumo medio e interprete el resultado con ayuda de su calculadora científica
Clase 12: APRENDIZAJES ESPERADOS
CONTENIDOS
-Calculan e interpretan la mediana de -Cálculo e interpretación de la una serie de datos con datos no Mediana con datos agrupados y agrupados y datos agrupados, con no agrupados. uso de calculadora. - Calculan e interpretan la moda en una serie de datos
-Calculan e interpretan la moda
Definición. Sea X una variable con nivel de medición por lo menos ordinal y sea x1 , x 2 , x3 ........... x n n observaciones de la variable X, se define la Mediana como un valor tal que supera a no más del 50% de las observaciones y es superado por no más del 50% de las observaciones, cuando estas han sido ordenadas según magnitud. Se anota Med. Suponga que tenemos una información numérica. Podría ser que la información fuera poco homogénea, en este caso la media o promedio no sería recomendada. O podemos estar interesados en encontrar un valor que divida la muestra en dos partes iguales. Este punto de división constituye la mediana Cálculo de la Mediana para datos no agrupados en tablas de frecuencias.
⎡ X n +1 ⎢ 2 ⎢ X X ⎢ n + n +1 2 ⎢ 2 2 ⎣
si
n es impar
si n es par
Calcule la mediana para el siguiente conjunto de números: 3, 4, 4, 5, 6, 8, 8,8. 10 número impar de datos La información debe estar ordenada en forma creciente o en forma decreciente X 9+1
Valor de la variable que ocupa el 5° lugar de derecha a izquierda y de izquierda a derecha, por lo tanto
2
la Mediana es el 6 Calcule la mediana para el siguiente conjunto de números: 5, 5, 7, 9, 11, 12, 15, 18 número par de datos Al igual que en el caso anterior, la información debe estar ordenada en forma creciente o decreciente X n = X 8 2
Valor de la variable que ocupa el cuarto lugar, más el valor de la variable que ocupa el quinto
2
lugar, dividido por 2, el resultado es igual tanto de derecha a izquierda, como de izquierda a derecha.
Me =
9 + 11 =10 2
Cálculo de la Mediana para datos agrupados en tablas de frecuencias. Para datos agrupados, la Mediana obtenida por interpolación viene dada por:
⎛ n ⎞ ⎜ − N K −1 ⎟ ⎟ Me = Li + C ⎜ 2 ⎜ n K ⎟ ⎜ ⎟ ⎝ ⎠ Límite inferior de la clase Mediana Li = C =
Amplitud del intervalo de la clase Mediana anterior a la del intervalo mediano N K −1 = Frecuencia acumulada anterior nk = frecuencia de la clase mediana
La siguiente tabla muestra las horas h oras de trabajo transcurridas hasta que un trabajador sufre un accidente de
trabajo, investigación realizada a una muestra de 27 accidentes de trabajo. Tiempo (horas)
xi
Nº de casos
N i
0–2 2–4 4–6 6–8 8 – 10
1 3 5 7 9
6 11 5 2 3
6 17 22 24 27
Total
27
Para determinar el intervalo mediano, debemos considerar la l a siguiente condición: N K >
N K >
27 27 ∧ N K −1 ≤ 2 2
N K > 13,5 ∧ N K −1 ≤ 13,5
Por lo tanto el intervalo mediano es aquel que está comprendido entre 2 – 4
⎛ 27 ⎞ −6⎟ ⎜ 2 ⎟ Me = 2 + 2 ⎜ ⎜ 11 ⎟ ⎜ ⎟ ⎝ ⎠ Me = 3,36
n
2
∧ N K −1 ≤
n
2
Interpretación: El 50% de los accidentes de trabajo, transcurren antes de 3,36 horas de trabajo y el 50% restante de los accidentes de trabajo, sobre 3,36 horas de trabajo.
Problema propuesto: La siguiente información corresponde al consumo mensual en combustible destinado a calefacción, expresado en miles de $, en una muestra aleatoria de hogares de un barrio de Santiago en los meses de invierno: Consumo ($miles)
Nº de casos
4–6 6–8 8– 10 10 – 12 12 –14
17 26 14 9 11
Calcule el consumo mediano e interprete el resultado resultado
La moda de un conjunto de observaciones es el valor numérico que ocurre con mayor frecuencia, es decir, el más frecuente. La moda puede no existir, incluso no ser única en caso de existir. Puede haber una distribución unimodal, bimodal o no existir Moda. Definición: Se llama Moda al valor de la variable que presenta la mayor frecuencia Cálculo de la Moda para valores no agrupados. La Serie de números 3, 4, 4, 5, 6, 8, 8, 8 y 10 tiene Moda 8, ya que es el valor que mas mas se repite o sea tiene mayor frecuencia. La serie de números 5, 5, 7, 9, 11, 12, 12, 15 y 18 tiene Moda 5 y Moda 12. La distribución es bimodal} Cálculo de la Moda para valores agrupados. Para datos agrupados, la moda que se obtiene por interpolación, viene dada en la curva de frecuencias y será el valor (o valores) de X correspondiente al máximo (o máximos) de la curva. La moda puede deducirse de una distribución de frecuencias o de un histograma a partir de la fórmula.
⎛
⎞ ⎟⎟ + n n k −1 ⎠ ⎝ k +1
Mo = Li + C ⎜⎜
nk +1
Li =
Límite inferior de la clase Modal C = Amplitud de los intervalos o del intervalo modal nk +1 = frecuencia siguiente a la del intervalo modal nk −1 = frecuencia anterior a la del intervalo modal La siguiente tabla muestra las horas h oras de trabajo transcurridas hasta que un trabajador sufre un accidente de
trabajo, investigación realizada a una muestra de 27 accidentes de trabajo.
Tiempo (horas)
xi
Nº de casos
0–2 2–4 4–6 6–8 8 – 10
1 3 5 7 9
6 11 5 2 3
Total
27
Determine la moda e interprétela La mayor frecuencia, se encuentra en el intervalo 2 -4, por lo tanto
⎛ 5 ⎞ ⎟ ⎝ 5 + 6 ⎠
Mo = 2 + 2⎜
Mo = 2,9 horas Interpretación: Lo más frecuente es que transcurran 2,9 horas de trabajo hasta que un trabajador sufra un accidente de trabajo. Problema propuesto: La siguiente información corresponde al consumo mensual en combustible destinado a calefacción, expresado en miles de $, en una muestra aleatoria de hogares de un barrio de Santiago en los meses de invierno: Consumo ($miles)
Nº de casos
4–6 6–8 8– 10 10 – 12 12 –14
17 26 14 9 11
Calcule el consumo modal e interprete el resultado resultado
Clase 13: APRENDIZAJES ESPERADOS Refuerzan aprendizajes esperados, de las clases 1 a 12, preparación Evaluación Nacional
CONTENIDOS Reforzamiento Evaluación Nacional Estandarizada de los aprendizajes esperados de las clases 1 a 12.
Resuelva en forma grupal o individual, los siguientes problemas. En preparación de su Primera Evaluación Nacional: 1. Se realiza una encuesta a una muestra de personas, en relación a la marca de electrodoméstico preferido, generándose la siguiente información: Marca Daewoo Fensa Mademsa Panasonic General Electric Total
Nº casos 13 10 15 12 5 55
%
Nº casos 13 10 15 12 5 55
%
a. Calcule la columna de %. Respuesta: Marca Daewoo Fensa Mademsa Panasonic General Electric Total
23,64 18,18 27,27 21,81 9,09 100
b. Construya gráfico de barras. Electrodomésticos prefe ridos 30 25 s 20 e j a t n 15 e c r o 10 P
Serie1
5 0 Daew oo
Fensa
Mademsa
Panasonic
General Electric
Marcas
c. ¿Qué tanto por ciento de los encuestados prefieren Mademsa o General Electric? 20 x100 = 36,36% 55
2. En un packing se examinó un lote de 30 cajas de duraznos para exportación. El número de duraznos en mal estado en cada caja es el siguiente: 0 2 1 3 3
3 4 1 5 2
1 2 3 4 1
1 3 2 4 0
1 3 4 5 2
0 3 4 1 3
a. Construir tabla de distribución de frecuencias. xi
ni
hi %
N i
H i
0 1 2 3 4 5 Totales
3 7 5 8 5 2 30
10 23,33 16,67 26,67 16,67 6,67 100
3 10 15 23 28 30
10 33,33 50 76,67 93,34 100
b. i) ¿Qué tanto por ciento de las cajas tiene más de tres duraznos en mal estado? Respuesta: 23,34% ii) ¿Cuantas cajas tienen entre 2 y 3 duraznos en mal estado? Respuesta: 13 cajas iii) ¿Qué tanto por ciento de las cajas tiene a lo más 1 durazno en mal estado? Respuesta: 33,33 %
3. La tabla de distribución de frecuencias adjunta, muestra los ingresos mensuales (miles de pesos) de los trabajadores de una institución bancaria. Ingresos ( miles de pesos)
Nº de trabajadores
' ' x i −1 − x i
ni
200 – 250 250 – 300 300 – 350 350 – 400 400 - 450
12 37 22 8 5
a. Graficar mediante Histograma
Ingresos Mensuales
40 200 – 250
30
250 – 300 300 – 350
20
350 – 400 10
400 - 450
0
Ingresos
Ingresos ( miles de pesos) x i −1 − x i '
'
200 – 250 250 – 300 300 – 350 350 – 400 400 - 450 b.
Nº de Frecuencia trabajadores relativa ni
hi
12 37 22 8 5 84
14,29 44,05 26,19 9,52 5,95 100
i) ¿Qué tanto por ciento de los trabajadores gana $300.000 o más? Respuesta: 41,66% ii) ¿Qué tanto por ciento de los trabajadores gana entre $250.000 y $349 .999? Respuesta: 70,24% iii) ¿Cuantos trabajadores ganan a lo más $299.999? Respuesta: 58,34%
4. Un supermercado registra la forma de pago en una muestra aleatoria de clientes, según grupo de edad, pudiendo construirse la siguiente tabla de frecuencias, en número de casos: EDAD (años) Medio de Pago Efectivo Cheque Tarjeta de Crédito Tarjeta de débito TOTAL
18 a 29
30 a 49
50 a 70
26 24 12 21 83
59 12 34 15 120
95 6 87 3 191
TOTAL 180 42 133 39 394
De acuerdo a la tabla. a.
De los que pagan con cheque, ¿qué tanto por ciento tiene 50 años o más? Respuesta: 14,29%
b. Del total de la muestra ¿qué tanto por ciento cancela en efectivo? Respuesta: 45,69% c. De los que cancelan con tarjeta de débito. ¿Qué tanto por ciento tiene más de 29 años? Respuesta: 46,15% d. De los que cancelan con tarjeta de crédito ¿Que tanto por ciento tiene menos de 50 años? Respuesta: 34,59% e. Del total de la muestra ¿Qué tanto por ciento cancela con cheque? Respuesta: 10,66% 5. El gráfico adjunto muestra la distribución de frecuencias del número de empleadores, que han tenido en el curso del último año, una muestra de adultos de 20 a 40 años de edad seleccionados al azar. Nº de casos 16 14 12 10 8 6 4 2 0
Nº
0
1 2 3 4 Nº de empleadores
Calcule los siguientes porcentajes, e indique su valor en la línea destinada para la respuesta. a. El……..% de los encuestados que no ha tenido empleador durante el último año. Respuesta: 12% b. El ……% de los encuestados ha tenido uno o dos empleadores durante el último año Respuesta: 52% c. De los que han tenido entre 2 y 3 empleadores , el ….…% ha tenido dos Respuesta: 53,3% d. El ……………………. % ha tenido un solo empleador durante el último año Respuesta: 20%
6. En los siguientes casos calcule la media aritmética, la mediana y la moda. En los casos que alguna de estas medidas no sea posible de calcular, explique por qué. a. N° de personas ocupantes por automóvil en un control policial fronterizo: Pi = 4 – 4 – 1 – 2 – 4 – 5 – 3 – 3 – 4 – 3 Respuestas: Media aritmética: 3,3 Mediana: 3,5 Moda: 4 b. T = tiempo de espera de un bus del Transantiago en horas peek en una muestra de usuarios. (Minutos) Ti = 25 – 35 – 12 – 40 – 25 – 32 – 18 – 10 – 15 – 25 – 30 – 5 Respuestas: Media Aritmética: 22,67 minutos Mediana: 25 minutos Moda: 25 minutos c. P = Peso de una muestra de 10 recién nacidos en un hospital público (Kg.): Pi = 3,250 – 4,360 – 2,310 – 3,400 – 1,850 – 2,880– 4,260 – 4,500 – 3,640 – 3,140 Respuestas: Media Aritmética: 3,359 kilo Mediana: 3,325 kilos Moda: La moda no existe 7. Distribución de clientes de un banco según edad y sucursal se muestra en la siguiente tabla:
EDAD (años) SUCURSAL Providencia Santiago Centro Las Condes Ñuñoa Santiago Oriente La Reina a. b.
20 - 24 13 8 9 25 7 8
24 - 30 25 33 16 32 15 24
30 - 36 56 45 25 54 33 15
Calcule la edad media de los clientes de la sucursal La Reina. Calcule la edad mediana de los clientes de la sucursal Las Condes.
Respuestas: a. 35,41 años
b. 36,84 años
36 - 40 68 52 31 29 15 35
40 - 50 36 26 22 20 7 15
50 - 65 24 14 10 7 11 5
8. Se ha investigado en una muestra aleatoria de trabajadores, su edad y el número de empleos dependientes que ha tenido en los últimos 2 años, llegándose a la siguiente tabla:
Edad y número de empleos. Nº de casos. EDAD (años)
0
1
2
3
20 – 30 30 – 40 40 – 50 50 – 60 60 – 70
0 3 6 8 5
3 11 9 2 3
8 9 4 3 1
7 5 4 1 2
18 28 23 14 11
22
28
25
19
94
Total
Nº de EMPLEOS Total
a. Calcule el Nº medio de empleos y la edad media en la muestra. b. Calcule el número medio de empleos entre los trabajadores menores de 30 años. c. Calcule la edad media de los trabajadores que no han tenido empleo en los dos últimos años.
Respuestas: a. 1,44 empleos y 42,02 años b. 2,22 empleos c. 51,8 años Clase 14:
APRENDIZAJES ESPERADOS Desarrollan evaluación sumativa
CONTENIDOS Evaluación Nacional Estandarizada de los aprendizajes esperados de las clases 1 a 12
Clase 15: APRENDIZAJES ESPERADOS -Calculan e interpretan los cuartiles.
- Grafican cuartiles mediante gráfico de caja
CONTENIDOS Cálculo e interpretación de los cuartiles. Gráfico y caja y bigotes
Podemos dividir el recorrido de una variable, para esto se tienen, otros estadísticos que constituyen Medidas de Posición, pero no de tendencia Central, son los puntos llamados Fractiles, esto es fraccionan el recorrido de la muestra. En primer lugar estudiaremos los cuartiles. Definición: Son puntos o medidas que dividen a la muestra ordenada en cuatro grupos de igual tamaño. Denotemos por Qi el cuartil i- ésimo con i = 1,2,3 Es decir cuatro partes del total con tres puntos de división del total del recorrido. Considere el siguiente problema, para calcular cuartiles: La siguiente tabla muestra las horas de trabajo transcurridas hasta que un trabajador sufre un accidente de
trabajo, investigación realizada a una muestra de 27 accidentes de trabajo. Tiempo (horas)
xi
Nº de casos
N i
0–2 2–4 4–6 6–8 8 – 10
1 3 5 7 9
6 11 5 2 3
6 17 22 24 27
Total
27
Calcular cuartil1, cuartil 2 y cuartil 3 Cálculo del primer cuartil Si los datos están agrupados en clases, entonces Q1 se determina de la siguiente manera: 1. Se construye la tabla de distribución de frecuencias acumuladas 2. Se identifica la clase que contiene a Q1 , determinando la menor de las frecuencias absolutas acumuladas N K que supera a N K ≤
n
4
n
4
n
4
. En estas condiciones se tiene.
< N k
= 6,75 , por lo tanto de acuerdo a la relación anterior, el primer cuartil, se ubica en el segundo intervalo
Utilizando la expresión.
⎛ n ⎞ ⎜ − N K −1 ⎟ ⎟ , tenemos Q1 = Li + C ⎜ 4 ⎜ nk ⎟ ⎜ ⎟ ⎝ ⎠ ⎛ 6,75 − 6 ⎞ ⎟ ⎝ 11 ⎠
Q1 = 2 + 2⎜
Q1 = 2,14 horas
Interpretación: El 25% de los accidentes ocurren antes que el trabajador cumpla 2,14 horas de trabajo y el 75% restante de los accidentes ocurren sobre las 2,14 horas de trabajo. Cálculo del segundo Cuartil El segundo cuartil coincide con la mediana, es decir Q2 = Me Cálculo del tercer cuartil: Si los datos están agrupados en clases, Q3 se determina de la siguiente manera: 1. Se construye la tabla de distribución de frecuencias acumuladas 2. Se identifica la clase que contiene a Q3 , determinando la menor de las frecuencias absolutas acumuladas N K que supera a N K ≤
3n . En estas condiciones se tiene. 4
3n < N k 4
3n = 20,25 por lo tanto de acuerdo a la relación anterior, el tercer cuartil, se ubica en el tercer intervalo 4
Utilizando la expresión.
⎛ 3n ⎞ ⎜ − N K −1 ⎟ ⎟ , tenemos Q3 = Li + C ⎜ 4 n k ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ ⎛ 20,25 − 17 ⎞ ⎟ 5 ⎝ ⎠
Q3 = 4 + 2⎜
Q3 = 5,3 horas
Interpretación: El 75% de los accidentes ocurren antes que el trabajador cumpla 5,3 horas de trabajo y el 25% restante de los accidentes ocurren sobre las 5,3 horas de trabajo. Problema propuesto: La siguiente información corresponde al consumo mensual en combustible destinado a calefacción, expresado en miles de $, en una muestra aleatoria de hogares de un barrio de Santiago en los meses de invierno: Consumo ($miles)
Nº de casos
4–6 6–8 8– 10 10 – 12 12 –14
17 26 14 9 11
Calcule cada uno de los cuartiles e interprete su significado, en relación a la tabla de distribución
El diagrama de caja es una representación semigráfica de una de una distribución constante para mostrar sus características principales. Resultan bastantes útiles cuando el tamaño de la muestra no es muy grande y los histogramas no muestran bien su forma. Construcción de un Diagrama de Caja. 1. Se ordenan los datos de la muestra, identificando el valor mínimo y el máximo, luego se obtiene el recorrido y los tres cuartiles. 2. Se dibuja un rectángulo cuyos extremos son Q1 y Q3 , e indicar la posición de la mediana, mediante un segmento de recta vertical. Así, dentro de la caja queda representado el 50% central de la información contenida en los datos.
Problema: La tabla de distribución de frecuencias adjunta indica el número de años de experiencia de una muestra de expertos en el área de Administración y Finanzas
cajas
Experiencia (años) 0 - 3 años 3 - 6 años 6 - 9 años 9 – 12 años 12 – 15 años
Gráfico de caja Xmín = 0 años; Xmáx = 15 años Q1 = 3 + 3(21 – 12)/37 = 3,7 años Me = 3 + 3(42 – 12)/37 = 5,4 años Q3 = 6 + 3(63 – 49)/22 = 7,9 años
Nº de casos 12 37 22 8 5
Con la información anterior construya un gráfico de
Años de experiencia en el área de Administración Considere el siguiente gráfico de caja:
Deuda morosa de 5.400 clientes de la empresa Aguas Andina residentes en la comuna de Conchalí (Miles de
$)
Se pide: construir 5 afirmaciones respecto del caso.
Respuesta: a. El 25% de los deudores de Aguas Andinas, deben entre 10 y 20 mil pesos. b. De los deudores de Aguas Andinas, el 50% adeuda, cuando más, $35.000. c. El 75% de los deudores de Aguas Andinas, deben más de 20 mil pesos. d. El 25% de los deudores, deben a lo menos $40 mil a Aguas Andinas. e. El 50% de los deudores de Aguas Andinas, deben entre 20 y 40 mil pesos.
Resolver: De acuerdo con los datos de un censo, las proporciones de adultos en USA, clasificados en cinco categorías de edad, son las siguientes: Edad (años) 18 – 24 25 – 34 35 – 44 45 – 64 65 - 100
Proporción 0,18 0,23 0,16 0,27 0,16
Con estos datos trace un gráfico de caja
Clase 16:
APRENDIZAJES ESPERADOS
CONTENIDOS
Calculan e interpretan deciles
Cálculo e interpretación de deciles
Definición: Los Deciles son puntos o medidas que dividen la muestra ordenada en 10 partes de igual tamaño. Denotadas por la letra Di , i = 1,2,3,4................9 .Es decir 10 partes del total con 9 puntos de división del total del recorrido. Los deciles se determinan en forma similar a los cuartiles Para datos tabulados se siguen los siguientes pasos: 1. Se construye la tabla de frecuencias absolutas acumuladas i⋅n
i = 1,2,3,..............9 10 3. Se identifica la clase que contiene a Di , identificando la frecuencia absoluta acumulada, de acuerdo con la siguiente relación:
2. Se determina
N K −1 ≤
i⋅n
< N K
10 4. Aplicar la siguiente relación, para el cálculo de los deciles.
⎛ Di ⋅ n ⎞ − N K −1 ⎟ ⎜ ⎟ i = 1,2,3................9 Di = Li + C ⎜ 10 ⎜ ⎟ n k ⎜ ⎟ ⎝ ⎠ Consideremos el siguiente problema para el cálculo de Deciles La siguiente tabla muestra las horas de trabajo transcurridas hasta que un trabajador sufre un accidente de
trabajo, investigación realizada a una muestra de 27 accidentes de trabajo. Tiempo (horas)
xi
Nº de casos
N i
0–2 2–4 4–6 6–8 8 – 10
1 3 5 7 9
6 11 5 2 3
6 17 22 24 27
Total
27
Con la información anterior calcule el tercer decil y el séptimo decil
Cálculo del tercer Decil: Para ubicar el tercer decil, en la tabla de distribución, utilizamos la relación: N K −1 ≤ N K −1 ≤
i⋅n
10
< N K
3 ⋅ 27 < N K 10
N K −1 ≤ 8,1 < N K
Por lo tanto el tercer decil, se ubica en el segundo intervalo:
⎛ 8,1 − 6 ⎞ ⎟ ⎝ 11 ⎠
D3 = 2 + 2⎜
D3 = 2,38 horas
Interpretación: Interpretación: El 30% de los accidentes ocurren antes que el trabajador cumpla 2,38 horas de trabajo y el 70% restante de los accidentes ocurren sobre las 2,38 horas de trabajo. Calcule Ud. a continuación el séptimo decil e interprételo. Problema propuesto: La siguiente información corresponde al consumo mensual en combustible destinado a calefacción, expresado en miles de $, en una muestra aleatoria de hogares de un barrio de Santiago en los meses de invierno: Consumo ($miles)
Nº de casos
4–6 6–8 8– 10 10 – 12 12 –14
17 26 14 9 11
Calcule el cuarto y el octavo decil e interprete su significado, en relación a la tabla de distribución
Clase 17:
APRENDIZAJES ESPERADOS
CONTENIDOS
Calculan e interpretan Percentiles
Cálculo e interpretación de percentiles
Definición: Los Percentiles son puntos o medidas que dividen la muestra ordenada en 100 partes de igual tamaño. Denotadas por la letra Pi , i = 1,2,3,4................99 Los Percentiles se determinan en forma similar a los cuartiles y deciles Para datos tabulados se siguen los siguientes pasos: 5. Se construye la tabla de frecuencias absolutas acumuladas i⋅n
i = 1,2,3,..............99 100 7. Se identifica la clase que contiene a Pi , identificando la frecuencia absoluta acumulada, de acuerdo con la siguiente relación:
6. Se determina
N K −1 ≤
i⋅n
< N K
100 8. Aplicar la siguiente relación, para el cálculo de los Percentiles
⎛ Pi ⋅ n ⎞ − N K −1 ⎟ ⎜ ⎟ i = 1,2,3................99 Pi = Li + C ⎜ 100 ⎜ ⎟ n k ⎜ ⎟ ⎝ ⎠ Consideremos el siguiente problema para el cálculo de Percentiles La siguiente tabla muestra las horas de trabajo transcurridas hasta que un trabajador sufre un accidente de
trabajo, investigación realizada a una muestra de 27 accidentes de trabajo. Tiempo (horas)
xi
Nº de casos
N i
0–2 2–4 4–6 6–8 8 – 10
1 3 5 7 9
6 11 5 2 3
6 17 22 24 27
Total
27
Con la información anterior calcule el percentil 10 y el 95 Cálculo del Percentil 10 Para ubicar el decil 10, en la tabla de distribución, utilizamos la relación: N K −1 ≤
i⋅n
100
< N K
N K −1 ≤
10 ⋅ 27 < N K 100
N K −1 ≤ 2,7 < N K
Por lo tanto el decil10, se ubica en el primer intervalo: ⎛ 2,7 − 0 ⎞ P10 = 0 + 2⎜ ⎟ ⎝ 6 ⎠ P10 = 0,9 horas
Interpretación: Interpretación: El 100% de los accidentes ocurren antes que el trabajador cumpla 0,9 horas de trabajo y el 90% restante de los accidentes ocurren sobre las 0,9 horas de trabajo. Calcule Ud. a continuación el percentil 95 e interprételo. Problema propuesto:
La siguiente información corresponde al consumo mensual en combustible destinado a calefacción, expresado en miles de $, en una muestra aleatoria de hogares de un barrio de Santiago en los meses de invierno: Consumo ($miles)
Nº de casos
4–6 6–8 8– 10 10 – 12 12 –14
17 26 14 9 11
Calcule el percentil 20 y el percentil 85 e interprete su significado, en relación a la tabla de distribución
Clase 18: APRENDIZAJES ESPERADOS Resuelven problemas aplicando : Cuartiles, Deciles y Percentiles
CONTENIDOS Cuartiles Deciles Percentiles
Resolver los siguientes problemas, relacionados con fractiles, trabaje en grupo, con ayuda del docente La siguiente información corresponde al consumo mensual en combustible destinado a calefacción, expresado en miles de $, en una muestra aleatoria de hogares de un barrio de Santiago, durante los meses de invierno: Consumo ($miles)
Nº de casos
4–6 6–8 8– 10 10 – 12 12 –14
17 26 14 9 11
a. ¿Qué consumo deja bajo sí al 25% de los consumos más bajos? Respuesta: $6.173 b. ¿Qué consumo deja sobre sí al 15% de los consumos más altos? Respuesta: $11.878 La siguiente distribución corresponde a la recaudación de impuestos de 40 contribuyentes. (Recaudación de impuestos en miles de pesos). x i −1 − x i 50- 70 70- 90 90 - 110 110 - 130 130 150 '
a.
'
xi 60 80 100 120 140
ni 2 15 8 12 3
¿Cuál es la recaudación correspondiente a cuartil 1? Interprétela. Respuesta: $80.667 Interpretación: El 25% de los contribuyentes cancela a lo menos $80.667 y el 75% restante cancela más de $80.667
b.
¿Cuál es la recaudación correspondiente al Percentil 65? Interprétela. Respuesta: $111.667 Interpretación: El 65% de los contribuyentes cancela a lo más $111.667 y el 35% restante cancela más de $111.667
c.
¿Bajo qué recaudación están el 20% de las recaudaciones menores? Respuesta: Bajo $78.000
d.
¿Sobre qué recaudación está el 20% de las recaudaciones mayores? Respuesta: Sobre $121.667
e.
¿Qué orden de percentil representa la recaudación $ 108.000? Respuesta: Percentil 83
Clase 19: APRENDIZAJES ESPERADOS Calculan los estadígrafos de dispersión: Varianza, Desviación estándar , con uso de la función estadística de la calculadora
CONTENIDOS Cálculo de Varianza y Desviación Estándar con ayuda de calculadora
Uno de los objetivos centrales, es ser capaces de dar algunas características generales de una distribución. Por si solas las Medidas de Posición no permiten caracterizar de cómo es una distribución, para esto, presentamos las medidas de Dispersión, estas indican como se distribuyen las observaciones, generalmente con respecto a la media. Por ejemplo: El ingreso per cápita de de un país no da cuenta de cómo se distribuye el ingreso per cápita La variabilidad de las edades de los alumnos de la jornada diurna es menor que la variabilidad de las edades de los alumnos de la jornada vespertina La dispersión se relaciona con la mayor o menor concentración de datos en torno a un valor central generalmente el promedio o media. Definición: Se llaman medidas de dispersión: a. Varianza de un conjunto de datos se define como. n
∑ ( x V ( x) ) =
i =1
si los datos no están en tablas de distribución
n n
∑ ( x V ( x ) ) =
− x )
2
i
− x ) ⋅ ni 2
i
i =1
si los datos están en tablas de distribución
n
b. Desviación Típica o Desviación Estándar de un conjunto de n números, x1 , x 2 , x 3 ,.......... x n , se define : n
∑ ( x s ( x) =
2
i
i =1
si los datos no están en tablas de distribución
n n
∑ ( x s ( x) =
− x )
− x ) ⋅ ni 2
i
i =1
n
si los datos están en tablas de distribución
Las unidades de desviación típica son lineales, la Varianza es bidimensional, y queda expresada por unidades cuadráticas Resolvamos el siguiente problema La siguiente tabla muestra las horas de trabajo transcurridas hasta que un trabajador sufre un accidente de
trabajo, investigación realizada a una muestra de 27 accidentes de trabajo. Tiempo (horas)
Nº de casos
0–2 2–4 4–6 6–8 8 – 10
6 11 5 2 3
Total
27
Calcule
a. La Varianza del número de horas b. La desviación estándar del número de horas Calculemos la media aritmética.
X =
1 ⋅ 6 + 3 ⋅ 11 + 5 ⋅ 5 + 7 ⋅ 2 + 9 ⋅ 3 ⋅ = 3,89 27
A continuación calculemos la Varianza:
a. V ( x ) =
(1 − 3,89)2 ⋅ 6 + (3 − 3,89) 2 ⋅ 11 + (5 − 3,89) 2 ⋅ 5 + (7 − 3,89)2 ⋅ 2 + (9 − 3,89) 2 ⋅ 3 27
V ( x) = 6,02 horas
2
Realice el mismo cálculo directamente con la calculadora científica
b. Desviación estándar del número de horas: s ( x ) =
6,02
s ( x) = 2,45
Resolver los siguientes problemas. 1. Se dispone de la siguiente información sobre el consumo de un producto envasado en latas. Se encuestó a un grupo de 20 familias y se interrogó: ¿cuántas unidades de este producto, mensualmente consume su grupo familiar? 0 1 2 1
2 3 2 5
2 2 0 3
4 5 1 3
4 1 0 5
Calcule los siguientes estadígrafos: Media Aritmética, Varianza y Desviación Típica Respuesta: Media aritmética: 2,3 unidades Varianza: 2,61 unidades 2 Desviación típica: 1,62 unidades 2. Se clasifican los ingresos mensuales de los trabajadores, de una empresa (en miles de pesos), obteniéndose los siguientes resultados, Ingresos 500- 600 600 -700 700- 800 800- 900
frecuencia 5 12 8 2
Calcule Varianza y Desviación Típica o Estándar Respuesta: Varianza: 7.105,62 pesos 2 Desviación Típica: 84,295 pesos Clase 20: APRENDIZAJES ESPERADOS
CONTENIDOS
Calculan los estadígrafos de Cálculo de Coeficiente de dispersión: Coeficiente de Variación, Variación , con ayuda de con la ayuda estadística de la calculadora calculadora.
∗ Suponiendo un ingreso en dólares, comparado, con un ingreso en pesos, la variabilidad o dispersión se
dificulta de comprender, por sus expresiones de unidades de medida.
∗ La estatura de los adolescentes de 16 años en nuestro país, en promedio se estima en 168 centímetros, con
una desviación típica de 4 centímetros, en un segundo país, para este mismo grupo, se estima que la estatura promedio aproximadamente es de 55 pulgadas, con una desviación típica de 2,1 pulgadas.
En términos absolutos decimos que la dispersión es de 4 centímetros y 2,1 pulgadas, expresión que no indica con claridad la dispersión, por las unidades de medidas. Para establecer en forma de comparación, podemos pensar en términos relativos, una comparación, para este efecto, establezcamos una razón entre la desviación típica y la media. 4 2,1 = 0,023, V 2 = = 0,038 , lo que está indicando que la estatura es menos variable en el primer 168 55 grupo, lo que también hace pensar que habría mayor concentración con respecto a la media o dicho de otra V 1 =
forma existe mayor homogeneidad en las estaturas del primer grupo, o que las estaturas son más parecidas entre ellas, es decir, expresiones de nuestro lenguaje que expresan la misma idea. Definición: Se define el Coeficiente de Variación como la razón entre la Desviación Típica y la Media expresada S ( x) ⋅ 100 porcentualmente, esto es la razón adimensional CV = X
Problema La siguiente tabla muestra las horas de trabajo transcurridas hasta que un trabajador sufre un accidente de
trabajo, investigación realizada a una muestra de 27 accidentes de trabajo. Tiempo (horas)
Nº de casos
0–2 2–4 4–6 6–8 8 – 10
6 11 5 2 3
Total
27
Para la tabla de distribución anterior, habíamos calculado la media aritmética y la desviación típica X = 3,89
S ( x) = 2,45
Con los datos anteriores, calculemos el coeficiente de variación CV ( x ) =
s ( x)
CV ( x ) =
2,45 x100 = 62,98% 3,89
X
x100
Esto significa que existe una dispersión de un 62,98% en relación a la media Resuelva los siguientes problemas: Se conoce la información respecto de los ingresos de los trabajadores de dos secciones de una empresa, A y B. El ingreso promedio de los trabajadores de la sección A es de $950.000 con una desviación típica de $98.000. Los trabajadores de la sección B tienen un ingreso promedio de $1.2000.000 con una desviación típica de $180.000 ¿En cual de las dos secciones existe una dispersión relativa mayor? Justifique su respuesta. Respuesta:
Dispersión relativa mayor en la sección B
CV A =
98.000 x 100 = 10.32% 950.000
CV B =
180.000 x100 = 15% 1.200.000
A continuación se presenta la información tabulada sobre las ventas de pasajes (en dólares) en dos agencias. Estrato 1
[ xi −1 −
xi ] xi
ni
400- 500 500 -600
6 15
Estrato 2
[ xi −1 −
xi ]
xi
ni
1.000 – 1.300 1.300 – 1.600 1.600 – 1.900
25 12 8
¿En qué estrato la dispersión de las ventas es menor? Respuesta: La dispersión es menor en el estrato 1.
CV 1 =
48,39 x100 = 9,29 521,14
CV 2 =
230,54 x 100 = 17,25% 1.336,67
Clase 21: APRENDIZAJES ESPERADOS Resuelven problemas aplicando estadígrafos de dispersión
CONTENIDOS Varianza Desviación típica Coeficiente de Variación
Resolver los siguientes problemas, trabajando en forma grupal, con asesoría de su profesor En una empresa del rubro textil, donde laboran 350 empleados, se ha estudiado el ingreso mensual (miles de
pesos) obteniéndose los siguientes datos separados por sexo: Ingreso ( miles de pesos) 120 – 140 140 – 160 160 – 180 180 - 200
Hombres 40 85 85 40
Mujeres 40 10 10 40
¿En cuál grupo de empleados, el ingreso presenta una confiabilidad más completa en torno al Ingreso Medio? Respuesta: X h = 160( m$)
S h = 18,868( m$)
X M = 160( m$)
S M = 27,2( m$)
En el grupo de los varones, el ingreso es más homogéneo.
Una empresa fabrica ampolletas de dos tipos A y B. Con base en muestras de la producción se sabe que las distribuciones de la duración en horas de esas ampolletas son tales que tienen las siguientes medias y varianzas.
Tipo A B
Media 800 horas 650 horas
Varianza 7.800 54.000
Comparar ambas distribuciones en cuanto a su variabilidad relativa Respuesta: La ampolleta tipo A tiene menor variabilidad relativa que la ampolleta tipo B
En una empresa el ingreso mínimo es de 50 dólares, si se conoce además que: 20 empleados ganan por lo menos 90 dólares, pero menos de 100, 68 empleados ganan por lo menos 80 dólares, 106 empleados ganan por lo menos 70 dólares, 135 empleados ganan por lo menos 60 dólares y el restante 10% de los empleados gana menos de 60 dólares. Calcule la varianza y el coeficiente de variación de los ingresos e interpretarlos.
Clase 22: APRENDIZAJES ESPERADOS Resuelven problemas aplicando estadígrafos de dispersión
CONTENIDOS Varianza Desviación típica Coeficiente de Variación
Taller de Estadística Resolver los siguientes problemas Debido a la crisis del petróleo, una compañía realizó un estudio en las comunas A y B, respecto al consumo mensual de bencina de 97 octano (en litros) en un grupo, de automovilistas cuyos datos se muestran en la siguiente tabla: Consumo Clientes
140-150 25
Consumo Clientes
125-135 5
Comuna A 150-160 160-170 35 12 Comuna B 135-145 145-155 7 8
170-180 10
180-190 8
155-165 50
165-175 30
a.Debido a la alta competencia y para mantener a sus clientes la empresa diseña la siguiente promoción: los clientes cuyo consumo mensual se encuentra sobre el tercer cuartil, recibirán un ticket para un lavado completo de su vehículo, pero el 60% más alto de éstos recibirá, además, un cambio de aceite. Para los consumidores de la comuna A, determine el consumo mínimo para tener opción a ambos obsequios.
25 * 60 10 = 15 P85 = 170 + [76.5 − 72] = 174.5 100 10 El consumo mínimo para tener opción a ambos obsequios seria de 174.5 litros Respuesta: X =
b. ¿Es valido afirmar que el coeficiente de dispersión de la comuna A es mayor que el coeficiente de dispersión de la comuna B? Respuesta: CV A =
12,45 x 100 = 7,86% 158,44
CV B =
10,51 x100 = 6,60% 159,3
Por lo tanto la afirmación es válida
Un experto en agroindustria ha presentado sus antecedentes con el objeto de obtener un empleo en varias empresas. Pasado los procesos de selección de éstas queda aceptado en tres empresas y dispone de una semana para decidir en cuál de ellas se quedará. El factor en base al cual tomará la decisión es el nivel de rentas que obtienen profesionales equivalentes al suyo y además que presenten un comportamiento más estable. Para esto consulta los sueldos a un grupo de profesionales cada empresa obteniendo la siguiente información EMPRESA A 90 100 B 94 97 C 98 93
110 112 115
105 96 102
SUELDOS DE LOS PROFESIONALES (miles de pesos) 98 97 98 103 94 102 101 106 98 106 113 92 95 96 106 95 97 99 82 103 101 100 96 105 04 101 102
99 110 105
97 96 90
102 96 105
¿En cuál de estas empresas decide quedarse? Justifique su decisión y respáldelo con las medidas adecuadas. Respuesta: Empresa A n=16 B n=16 C n=16
X = 100 X = 100 X = 100
Me=99,5 Me=96,5 Me=101
S=4,65 S=0,7 S=6, 86
En todas las empresas el sueldo promedio es el mismo, sin embargo, la empresa B tiene sueldos más estables, puesto que presenta el menor Coeficiente de Variación. Clase 23: APRENDIZAJES ESPERADOS
CONTENIDOS
Reforzamiento Evaluación Refuerzan aprendizajes esperados, de Nacional Estandarizada de los las clases 15 a 22, preparación aprendizajes esperados de las Evaluación Nacional clases 15 a 22
Resolver los siguientes problemas, en forma grupal o individual los siguientes problemas. En preparación de su Segunda Evaluación Nacional:
Las preguntas 1 – 2 y 3 están relacionadas con la siguiente información: La distribución de ingresos en un país A (en miles de pesos) viene dada por:
[ xi′−1 − xi′[ Ingresos Anuales 200 – 300 300 – 400 400 – 500 500 – 600 600 – 700 700 – 800 800 – 900
ni
Población Remunerada 65 25 130 90 24 10 8
1. ¿Cuál es el ingreso correspondiente al primer cuartil? Interprételo Respuesta: $392.000 Interpretación: El 25% de la población tiene ingresos menores a $392.000 y el 75% restante tiene ingresos superiores a $392.000 2. ¿Bajo qué ingreso están el 38% de los ingresos menores? Respuesta: El 38% de los ingresos menores están bajo $433.662 3. ¿Qué orden de percentil representa un ingreso de $590.000? Respuesta: Percentil 86 4. El siguiente gráfico de caja, está relacionado con la deuda de 2.500 clientes de metro gas en una cierta comuna en miles de pesos
Completar las siguientes afirmaciones: a. De los deudores de metro gas, el ….% adeuda, entre 10 y 20 mil pesos b. El ….% de los deudores de metro gas deben entre 20 y 40 mil pesos c. El…. % de los deudores de metro gas, deben más de 20 mil pesos
Respuesta: 25% Respuesta: 50% Respuesta: 75%
5. Los siguientes datos corresponden a las utilidades semanales (en miles de pesos) de empresas relacionadas con el área textil:
[ X i′−1 − X i′[
ni
N i
300-350 350-400 400-450 450-500 500-550 550-600
8 15 30 25 10 2
8 23 53 78 88 90
Con la información anterior construya gráfico de Cajas Gráfico de caja: X min . = 300 mil pesos
X max . = 600 mil pesos
Q1 = 350 + 50 ⋅
22,5 − 8 = 398,33 15
Me = 400 + 50 ⋅
45 − 23 = 436,67 30
Q3 = 450 + 50 ⋅
300
67,5 − 53 = 479 25
398,33
436,67 479
Utilidades semanales en industrias textiles (M$)
600
Las preguntas 6, 7 y 8, están referidas a la siguiente información: La tabla de distribución de frecuencias adjunta, muestra los ingresos mensuales (miles de pesos) de los trabajadores de una institución bancaria. Ingresos ( miles de pesos)
Nº de trabajadores
' ' x i −1 − x i
200 – 250 250 – 300 300 – 350 350 – 400 400 - 450
ni
20 25 40 12 4
6. La Varianza de los ingresos mensuales Respuesta. De acuerdo a los resultados entregados por calculadora científica: Varianza: 52,875366032 = 2.795,804333 pesos 2 7. La desviación típica de los ingresos mensuales Respuesta: Desviación típica. 52,87536603 pesos 8. El coeficiente de variación de los ingresos mensuales Respuesta: CV ( x) = 17,47% Las preguntas 9, 10 y 11, están referidas a la siguiente información: Considere las medias y desviaciones típicas correspondientes a los caudales de un río chileno ( en m 3 / seg ) para dos meses de verano y dos meses de invierno. Media aritmética Desviación típica Coeficiente de Variación
Verano 1 21,0 6,0 28,57
Verano 2 25,9 7,6 29,34
Invierno 1 50,2 11,3 22,51
Invierno 2 56,6 10,3 18,20
Utilizando como criterio de comparación el coeficiente de variación: 9. Compare la variabilidad del caudal del río para los dos meses de verano considerados Respuesta: La variabilidad del caudal del río del verano 2 es levemente mayor que la variabilidad del caudal del río del verano 1
10. Compare la variabilidad del caudal del río para los dos meses de invierno considerados Respuesta: La variabilidad del caudal del río del invierno 1 es mayor que la variabilidad del caudal del río del invierno 2 11 ¿Podemos afirmar que la variabilidad del caudal del río para los meses de verano es menor que en los meses de invierno? Justifique con los cálculos respectivos Respuesta: De acuerdo a los datos del coeficiente de variación de la tabla, se observa que la variabilidad del caudal del río para los meses de verano es mayor que en los meses de invierno
12. Establezca, con base estadística, en cuál de las siguientes empresas el ingreso está repartido en forma más homogénea: EMPRESA A Número de personas Ingreso percibido (en euros) 15 800 20 1.400 30 1.500 20 1.800 15 7.800
EMPRESA B Número de personas Ingreso percibido ( en euros) 10 800 30 1.400 35 1.500 24 1.800 1 7.800
Respuesta: El ingreso está repartido en forma más homogénea en la empresa B Clase 24: APRENDIZAJES ESPERADOS
CONTENIDOS
Evaluación Nacional Segunda Evaluación Nacional Estandarizada de los aprendizajes esperados, de las clases aprendizajes esperados de las 15 a 22 clases 15 a 22
Clase 25: APRENDIZAJES ESPERADOS
CONTENIDOS
-Identifican estructura y contenidos de Estructura y contenido de un un informe estadístico descriptivo. informe estadístico descriptivo.
El INFORME ESTADÍSTICO El informe estadístico es una herramienta a través del cual un investigador comunica a la comunidad los resultados de una investigación. Debido a la importancia de este instrumento, para su construcción, la comunidad científica se ajusta a un formato más o menos estándar, cuya estructura general es la siguiente: 1. TÍTULO 2. RESUMEN 3. INTRODUCCIÓN 4. OBJETIVOS 5. MÉTODO 6. RESULTADOS 7. CONCLUSIÓN A continuación se desarrolla uno a uno estos puntos, con ejemplos y links hacia informes de investigación en diversos campos del saber. 1. TÍTULO El título de una investigación debe dar una idea clara de su contenido. Su lenguaje debe ser descriptivo, directo y preciso, evitando la ambigüedad, los juicios de valor y la generalización. Aunque no hay reglas rígidas al respecto, se recomienda una extensión de no más de 20-25 palabras. EJEMPLO: Deficiente: “La televisión y los niños” Mejor: “Los hábitos televisivos de los niños en edad escolar” Mejor aún: “Aspectos cuantitativos del hábito de ver televisión de los escolares de 6 a 10 años en las regiones urbanas” 2. RESUMEN El resumen de una investigación expresa abreviadamente, en forma precisa y exacta, todo el contexto de una investigación, sus propósitos, objetivos, métodos, resultados y conclusiones. La función que cumple el resumen es orientar al lector acerca de todo el contenido de la investigación. De este modo, a través de la lectura de los aspectos claves de esta, el lector puede decidir si leer todo el informe o no. La extensión recomendada del resumen de una investigación es de unas 250 palabras, lo que equivale, más o menos, a unas 20 líneas. Como el resumen sintetiza toda la investigación, se redacta al final de todo el proceso investigativo. EJEMPLO: Caracterización del crecimiento de la lombriz roja ( Eisenia spp.) bajo condiciones de clima cálido Resumen: Evaluaciones previas sobre una población de lombrices demostraron que ésta se adapta favorablemente a temperaturas cálidas, observándose tasas de crecimiento y de reproducción superiores a las señaladas en la literatura. Con el objetivo de conocer mejor el comportamiento de la lombriz roja (Eisenia spp.) en condiciones cálidas se caracterizó el crecimiento de ésta en el Jardín Vivero Universitario de LUZ, ubicado en la ciudad de Maracaibo, estado Zulia, en una zona
de vida de bosque seco tropical. La población se obtuvo en el estado Mérida, iniciándose su estudio desde el momento de la eclosión de las cápsulas y durante 168 días, durante este período se les suministró estiércol de bovino como substrato; se realizaron evaluaciones semanales de biomasa, longitud y diámetro de 40 individuos, registrándose, además, el ciclo de vida de las lombrices. Se encontró que estas poseen las siguientes características en promedio: color rojo oscuro; tamaño: 11 ± 0,92 cm.; diámetro: 5 ± 0,44 mm; duración del ciclo de vida: 58 ± 9,9 días. Las ecuaciones de regresión que mejor ajustaron las curvas de crecimiento fueron Biomasa = 1,717 X1,249, Longitud = 0,425 X1.52 y Diámetro = 0,205 X0,621; donde X es tiempo en días de vida de las lombrices. Se advierte en este resumen de investigación, lo siguiente: • • • • • •
Está redactado en un lenguaje descriptivo, directo y preciso. Es breve, conteniendo 200 palabras en 15 renglones. Resume el objetivo y método empleado. Resume los resultados más relevantes de la investigación. Menciona las conclusiones del estudio. Solo con leerlo, es posible ubicar el contenido toda la investigación.
Ver esta investigación completa en: http://www.geocities.com/ecologialuz/Caracterizacion.htm 3. INTRODUCCIÓN Corresponde a la presentación de la naturaleza y alcance del problema de investigación y del propósito que se persigue. Se plantea y fundamenta el problema a investigar. La importancia de la Introducción en un informe de investigación es que contextualiza, sitúa al lector, lo ubica en el contexto de lo que se va a investigar. En la función orientadora de la Introducción, esta sección aporta información de lo que se sabe acerca del tema investigado, de la teoría que lo sustenta y de datos relevantes que han aportados distintos autores e investigaciones. A este conjunto de aspectos, en el ámbito académico y de la investigación suele denominarse “estado del arte”. En resumen, una introducción debe expresar con claridad, al menos lo siguiente: • Fundamento: por qué se investiga el tema, por qué es importante de investigar ese tema, qué espera aportar la investigación acerca del tema. • Propósito: para qué se investiga, qué se hará con los resultados de la investigación. • Objetivos: qué se investigará dentro del tema propuesto. • Antecedentes: qué es y qué se sabe actualmente del tema a investigar (estado del arte). EJEMPLO: Ver informe de investigación: “Gasto de hogares durante la hospitalización de menores con diagnóstico de leucemia, en dos hospitales en México. Ver en: http://bvs.insp.mx/rsp/articulos/articulo.php?id=000451 4. OBJETIVOS Los objetivos responden a la pregunta: ¿Qué se va a investigar? Es, por lo tanto, el enunciado de los aspectos concretos a investigar dentro del tema ya planteado en el título. De ahí su importancia. Una investigación, por simple que sea, debe plantear un objetivo general, seguido de dos o más objetivos específicos. Estos últimos corresponden a los aspectos específicos a investigar dentro del tema. Entre el objetivo general y los específicos debe existir una estrecha relación, ya que estos últimos se derivan del primero.
EJEMPLO: Tema: Los hábitos televisivos de los estudiantes de 6 a 10 años en las regiones urbanas Objetivo general: Describir los hábitos televisivos de los estudiantes de 6 a 10 años en la región Metropolitana Objetivos específicos: 1. Determinar qué tipo de programas de TV ven los estudiantes 6 a 10 años en la región Metropolitana. 2. Cuantificar el tiempo que pasan frente al televisor los estudiantes de educación básica. 3. Investigar los horarios en que los niños ven TV los estudiantes de educación básica. 4. Investigar los mecanismos que usan los padres para controlar los hábitos de los hijos de ver TV. 5. MÉTODO El método corresponde a la descripción, en tiempo pasado, de cómo se realizó la investigación. Relata, entre otros, quienes fueron los sujetos investigados, cómo se seleccionaron, cómo se entrevistaron o se les a plicó el cuestionario, cómo se recopilaron los datos y cómo se manipularon. En general, el método responde a la pregunta: ¿cómo se realizó la investigación? EJEMPLO: Ver informe de investigación: “El número deseado de hijos en Costa Rica: 1993-1999”. Ver en: http://ccp.ucr.ac.cr/revista/volumenes/1/1-2/1-2-2/ Ver informe de investigación: PEREIRA C, Guillermo, HERRERA S, Jaime, MACHUCA H, Angela et al . Efecto del pH sobre el crecimiento in vitro de hongos ectomicorrícicos recolectados de plantaciones de Pinus radiata. Bosque (Valdivia). [online]. 2007, vol.28, no.3 [citado 23 Enero 2009], p.215-219. Disponible en la World Wide Web: http://www.scielo.cl/scielo.php?script=sci_arttext&pid=S071792002007000300005&lng=es&nrm=iso . ISSN 0717-9200.
6. RESULTADOS Es la presentación clara y sintética de los datos recolectados. Los resultados se muestran mediante: tablas, gráficos, dibujos, esquemas, etc, con títulos claros y breves, acompañados en cada caso por una descripción analítica. Junto con la presentación de datos, en esta sección se presentan los estadígrafos de las variables en estudio, tales como media, mediana, desviación estándar, etc. En esta parte es muy importante el uso de un lenguaje descriptivo preciso, entendible, que ayude al lector a comprender el contenido de tablas y gráficos. EJEMPLO 1: Detalle del informe del trabajo: “CHILE Y LOS ADULTOS MAYORES: IMPACTO EN LA SOCIEDAD DEL 2000”, INE, 1999.
Del gráfico 1 se desprende que se ha producido una rápida disminución del porcentaje de menores de 15, aumentando la minoría creciente, val e decir, la población de edades mas avanzadas. En el caso de Chile, en el año 2010 existirán 50 adultos mayores por cada cien menores de 15 años, y en el 2034 estos montos se igualarán; es decir, desde esa fecha, los jóvenes comenzarán a ser reemplazados por los viejos. EJEMPLO 2: Ver informe de investigación: “Fecundidad adolescente en la gran área metropolitana de Costa Rica”. Ver en: http://ccp.ucr.ac.cr/revista/volumenes/1/1-1/1-1-4/index.htm 7. CONCLUSIÓN Es el sumario o resumen de los resultados obtenidos, presentando los aportes de la investigación. Se trata de enunciados o afirmaciones concretas y específicas, que relacionan el problema y objetivos planteados con los resultados obtenidos. Las conclusiones deben apuntar, por tanto, a los objetivos específicos y al objetivo general. EJEMPLO Evaluación perceptual de la disfonía: correlación con los parámetros acústicos y fiabilidad Conclusiones: 1. La disfonía que acompaña al edema de Reinke presenta señales sin una estructura periódica aparente (tipo 3) en el 7,5% de los casos. La valoración perceptual o psicoacústica de la voz, sistematizada de forma práctica por el método GRBAS, debe ser incluida siempre en el estudio de la disfonía ya que en ciertas voces va a ser el único medio fiable de evaluación. 2. La severidad global de una voz patológica se determina por un tono grave acompañado de turbulencias aéreas en forma de ruido audible. 3. La presencia de subarmónicos no siempre acompaña a la voz áspera o diplofónica. 4. Los parámetros relacionados con el comportamiento vocal (A y S) se correlacionan con la distribución de energía armónica en el espectro. 5. El sistema GRBAS tiene una buena reproductibilidad intra e interobservador. Ver informe completo en: http://acta.otorrinolaringol.esp.medynet.com/textocompleto/actaotorrino35/C01-1180.PDF Ver también informe de investigación: “Prevalencia de plomo en sangre, en niños escolares de Santiago de Chile”. Ver en: http://www.cepis.org.pe/bvsana/e/plomo/chile.pdf.
Sitios WEB: Biblioteca científica - SciELO Chile: biblioteca electrónica que incluye una colección seleccionada de revistas científicas chilenas. http://www.scielo.cl/ Biblioteca Digital SID: Incluye los informes de avance o finales de los proyectos de investigación de la SecytUNCuyo, o avalados por la Secretaría de Investigación de alguna unidad académica. http://bdigital.uncu.edu.ar/ Clase 26: APRENDIZAJES ESPERADOS Generan datos cuantitativos del ámbito industrial, comercial, económico o social, mediante la identificación previa de variable de interés
CONTENIDOS Generación de datos
Realizan organización de datos Organización de datos recopilados en tablas Tabulación y graficación Realizan graficación según naturaleza de la información Recolectar datos: Implica elaborar un plan detallado de procedimientos que nos conduzcan a reunir datos con un propósito específico. Este plan incluye determinar: ¿Cuales son las fuentes de donde vamos a obtener los datos? Es decir, los datos van a ser proporcionados por personas, se producirán de observaciones o se encuentran en documentos, archivos, bases de datos etc. Por ejemplo: la información se obtendrá de supermercados ¿En donde se localizan tales fuentes? Regularmente en la muestra seleccionada, pero es importante definir con precisión Por ejemplo: en la ciudad de Santiago, Concepción, Rancagua etc. ¿A través de qué medio o método vamos a recolectar datos? Esta fase implica elegir uno o varios medios y definir los procedimientos que utilizaremos en la recolección de los datos. El método o métodos deben ser confiables, válidos y objetivos. Por ejemplo: Para la recolección de datos, se utilizarán entrevistas, utilizando un cuestionario ¿Una vez recolectados los datos, de que forma vamos a prepararlos para que puedan analizarse y respondamos al planteamiento del problema? Ejemplo: Los datos serán ordenados en tablas de distribución de frecuencias.
Recordemos que una distribución de frecuencias es un conjunto de puntuaciones ordenadas en sus respectivas categorías, a veces las categorías de las distribuciones de frecuencias son tantas que es necesario resumirlas, utilizando intervalos. Las distribuciones de frecuencias pueden completarse agregando los porcentajes de casos en cada categoría y los porcentajes acumulados. Las distribuciones de frecuencias, especialmente cuando utilizamos los porcentajes, pueden presentarse en forma de histogramas, gráficas circulares o de otro tipo
Clase 27: APRENDIZAJES ESPERADOS
CONTENIDOS
Calculan estadígrafos de posición y Cálculo de estadígrafos dispersión Análisis e interpretación de datos Analizan e interpretan la información recabada.
Una vez que los datos han sido ordenados en tablas de distribución de frecuencias y graficados, se procede a su análisis Calcule los estadígrafos de posición y dispersión, estudiados anteriormente, recuerde que las medidas de posición y de variabilidad se interpretan en conjunto, no aisladamente. Analice e interprete la información, con ayuda de gráficos, estadígrafos de posición y dispersión Clase 28: APRENDIZAJES ESPERADOS
CONTENIDOS
Formulan conclusiones en el marco de Formulación de conclusiones los casos investigados
Parte de este paso final se utiliza en el resumen que antecede al informe, pero aquí el estudiante explica el como y el por qué de las conclusiones. Si hay un buen número de pruebas o procedimientos en el trabajo quizá sea conveniente combinar: Resultados, Análisis y Conclusiones. Esto permitiría una mejor continuidad en la lectura.
Clase 29: APRENDIZAJES ESPERADOS Elaboran Informe Estadístico
CONTENIDOS Elaboración de informe estadístico
Elaboración del informe estadístico, de acuerdo a lo señalado en la clase 25.
Clase 30: APRENDIZAJES ESPERADOS Presentación y discusión ante el grupo curso de los informes estadísticos elaborados por los estudiantes
CONTENIDOS Exposición ante el grupo curso de los informes elaborados.
En esta clase, cada uno de los estudiantes expone en forma resumida, su informe estadístico, ante el grupo curso, compartiendo sus experiencias, en la realización de este informe. El profesor entrega a cada estudiante, la nota final de su informe estadístico. Clase 31 y 32:
Refuerzan aprendizajes esperados preparación Examen Nacional
Reforzamiento Examen Nacional
La siguiente tabla de frecuencias nos muestra un resumen de los gustos de una muestra de personas en relación a sus programas de TV preferidos: Programa A B C D E Total
Nº casos 15 12 20 10 3
1. Complete la columna de frecuencia relativa, frecuencia absoluta acumulada y frecuencia relativa acumulada Nº Frecuen Frecuen Frecuen casos cia cia cia relativa absoluta relativa % acumula acumula da da 15 25 15 25 12 20 27 45 20 33,33 47 78,33 10 16,67 57 95 3 5 60 100 60 100
Marca
A B C D E Total
2. ¿Qué tanto por ciento de los encuestados prefieren el programa B o D? Respuesta: 36,67% Se tomó una muestra en relación al número de hijos en 30 familias, la información es la siguiente: 0 2 1 3 3
3 4 2 5 1
1 3 3 4 1
1 3 2 4 0
1 3 2 5 2
0 3 4 2 1
3. Construir tabla de distribución de frecuencias. Respuesta: xi
ni
hi %
N i
H i
0 1 2 3 4 5 Totales
3 7 6 8 4 2 30
10 23,33 20 26,67 13,33 6,67 100
3 10 16 24 28 30
10 33,33 53,33 80 93,33 100
4. i) ¿Qué tanto por ciento de las familias encuestadas no tienen hijos? Respuesta: 10% ii) ¿Cuantas familias tienen más de dos hijos? Respuesta: 14 familias o
La tabla de distribución de frecuencias adjunta, muestra las utilidades anuales (miles de dólares) de empresas del área metalúrgica Ingresos ( miles de pesos) ' ' x i −1 − x i
Nº de trabajadores ni
100 – 150 150 – 200 200 – 250 250 – 300 300 - 350
15 40 25 10 3
5. Graficar mediante Histograma
40 35 30
100 – 150
25
150 – 200
20
200 – 250
15 10
250 – 300 300 - 350
5 0 1
La siguiente tabla de distribución adjunta muestra los ingresos(en miles de pesos) de 93 trabajadores, del área de hotelería Ingresos ( miles de pesos) ' ' x i −1 − x i
100 – 150 150 – 200 200 – 250 250 – 300 300 - 350
Nº de trabajadores ni
15 40 25 10 3
6. i) ¿Qué tanto por ciento de las empresas metalúrgicas tienen utilidades de 200.000 dólares o más? Respuesta: 40,86 % ii) ¿Cuantas empresas metalúrgicas tienen utilidades de a lo menos 150.000 dólares? Respuesta: 83,87 %
Un supermercado registra la forma de pago en una muestra aleatoria de clientes, según grupo de edad, pudiendo construirse la siguiente tabla de frecuencias, en número de casos: EDAD (años) Medio de Pago Efectivo Cheque Tarjeta de Crédito Tarjeta de débito TOTAL
18 a 29
30 a 49
50 a 70
26 24 12 21 83
59 12 34 15 120
95 6 87 3 191
TOTAL 180 42 133 39 394
De acuerdo a la tabla. 7. i) Del total de la muestra ¿qué tanto por ciento cancela con tarjeta de débito? Respuesta: 9,9% ii) De los que cancelan con tarjeta de crédito. ¿Qué tanto por ciento tiene más de 49 años? Respuesta: 65,41%
8. En el siguiente caso calcule la media aritmética, la mediana y la moda. En los casos que alguna de estas medidas no sea posible de calcular, explique por qué. Tiempo (en minutos) que emplea un grupo de personas en echar bencina a sus autos: Ti = 4 – 4 – 1 – 2 – 4 – 5 – 3 – 3 – 4 – 3 – 5 – 2- 4 - 5 Media Aritmética: 3,5 minutos Mediana: 4 minutos Moda: 4 minutos 9. La distribución de ingresos en un país A (en miles de pesos) viene dada por:
[ xi′−1 − xi′[ Ingresos Anuales 200 – 300 300 – 400 400 – 500 500 – 600 600 – 700 700 – 800 800 – 900
ni
Población Remunerada 60 30 150 95 23 10 8
N i
60 90 240 335 358 368 376
¿Bajo qué ingreso están el 42% de los ingresos menores? Respuesta: El 42% de los ingresos menores están bajo $445.280