SEPARATA DE ESTADÍSTICA I ASPECTOS BÁSICOS DE LA ESTADÍSTICA Y PRESENTACIÓN DE DATOS EN CUADROS Y GRÁFICOS ESTADÍSTICOS
AUTOR: MSc. CARLOS DANIEL GONZALES HIDALGO
1
1. Estadística 1.1. IMPORTANCIA En las últimas décadas la estadística ha alcanzado un alto grado de desarrollo, hasta el punto de incursionar en la totalidad de las ciencias; inclusive, en la lingüística se aplican técnicas estadísticas para esclarecer la paternidad de un escrito o los caracteres más relevantes de un idioma. La estadística es una ciencia auxiliar para todas las ramas del saber; su utilidad se entiende mejor si tenemos en cuenta que los quehaceres y decisiones diarias embargan cierto grado de incertidumbre... y la Estadística Estadísti ca ayuda en la incertidumbre, trabaja con ella y nos orienta para tomar las decisiones con un determinado grado de confianza. Los críticos de la estadística afirman que a través de ella es posible probar cualquier cosa, lo cual es un concepto profano que se deriva de la ignorancia en este campo y de lo polifacético de los métodos estadísticos. Sin embargo muchos "investigadores" tendenciosos han cometido abusos con la estadística, elaborando "investigaciones" de intención, teniendo previamente los resultados que les interesan mostrar a personas ingenuas y desconocedoras de los hechos. Otros, por ignorancia o negligencia, abusan de la estadística utilizando modelos inapropiados o razonamientos ilógicos y erróneos que conducen al rotundo fracaso de sus investigaciones. Lincoln L. Chao hace referencia a uno de los más estruendosos fracasos, debido a
los abusos en la toma de una muestra: Se trata del error cometido por la Literary Digest que, en sus pronósticos para las elecciones presidenciales en EE.UU. para 1936, afirmó que Franklin D. Roosvelt obtendría 161 votos electorales y Alfred Landon, 370. La realidad mostró a Roosvelt con 523 votos y a Landon con 8 solamente. El error se debió a que la muestra fue tomada telefónicamente a partir de la lista de suscriptores de la Digest y, en 1936, las personas que se daban el lujo de tener teléfonos y suscripciones a revistas no configuraban una muestra representativa de los votantes de EE.UU. y, por ende, no podía hacerse un pronóstico confiable con tan sesgada información.
1.2 DEFINICIÓN 2
1. Estadística 1.1. IMPORTANCIA En las últimas décadas la estadística ha alcanzado un alto grado de desarrollo, hasta el punto de incursionar en la totalidad de las ciencias; inclusive, en la lingüística se aplican técnicas estadísticas para esclarecer la paternidad de un escrito o los caracteres más relevantes de un idioma. La estadística es una ciencia auxiliar para todas las ramas del saber; su utilidad se entiende mejor si tenemos en cuenta que los quehaceres y decisiones diarias embargan cierto grado de incertidumbre... y la Estadística Estadísti ca ayuda en la incertidumbre, trabaja con ella y nos orienta para tomar las decisiones con un determinado grado de confianza. Los críticos de la estadística afirman que a través de ella es posible probar cualquier cosa, lo cual es un concepto profano que se deriva de la ignorancia en este campo y de lo polifacético de los métodos estadísticos. Sin embargo muchos "investigadores" tendenciosos han cometido abusos con la estadística, elaborando "investigaciones" de intención, teniendo previamente los resultados que les interesan mostrar a personas ingenuas y desconocedoras de los hechos. Otros, por ignorancia o negligencia, abusan de la estadística utilizando modelos inapropiados o razonamientos ilógicos y erróneos que conducen al rotundo fracaso de sus investigaciones. Lincoln L. Chao hace referencia a uno de los más estruendosos fracasos, debido a
los abusos en la toma de una muestra: Se trata del error cometido por la Literary Digest que, en sus pronósticos para las elecciones presidenciales en EE.UU. para 1936, afirmó que Franklin D. Roosvelt obtendría 161 votos electorales y Alfred Landon, 370. La realidad mostró a Roosvelt con 523 votos y a Landon con 8 solamente. El error se debió a que la muestra fue tomada telefónicamente a partir de la lista de suscriptores de la Digest y, en 1936, las personas que se daban el lujo de tener teléfonos y suscripciones a revistas no configuraban una muestra representativa de los votantes de EE.UU. y, por ende, no podía hacerse un pronóstico confiable con tan sesgada información.
1.2 DEFINICIÓN 2
Definir la estadística es una tarea difícil porque tendríamos que definir cada una de las técnicas que se emplean en los diferentes campos en los que interviene. Sin embargo, diremos, en forma general, que la estadística es un conjunto de técnicas que, partiendo de la observación de fenómenos, permiten al investigador obtener conclusiones útiles sobre ellos.
1.3
DIVISIÓN
La estadística se divide en dos grandes ramas de estudio que son: La estadística descriptiva, la cual se encarga de la recolección, clasificación y descripción de datos muéstrales o poblacionales, para su interpretación y análisis, que es de la que nos ocuparemos en este curso; y la estad estadíí stica sti ca mat mate emáti áti ca o inf infe er encial encial, que desarrolla modelos teóricos que se ajusten a una determinada realidad con cierto grado de confianza. Estas dos ramas no son independientes; independient es; por el contrario, son complementarias y entre ambas dan la suficiente ilustración sobre una posible realidad futura, con el fin de que quien tenga poder de decisión, tome las medidas necesarias para transformar ese futuro o para mantener las condiciones existentes.
ESTADÍSTICA
ESTADÍSTICA DESCRIPTIVA
ESTADÍSTICA INFERENCIAL
Conjunto de métodos para organizar, resumir resumir y presentar los datos de manera informativa.
Conjunto de métodos utilizados para conocer el comportamiento de una población basándose en una muestra.
2. Etapas del Método Estadístico 3
El método estadístico, parte de la observación de un fenómeno, y como no puede siempre mantener las mismas condiciones predeterminadas o a voluntad del investigador, deja que actúen libremente, pero se registran las diferentes observaciones y se analizan sus variaciones. Para el planeamiento de una investigación, por norma general, se siguen las siguientes etapas: 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 2.10 2.11
2.1
Planteamiento del problema. Fijación de los objetivos. Formulación de la hipótesis. Definición de la unidad de observación y de la unidad de medida. Determinación de la población y de la muestra. La recolección. Crítica, clasificación y ordenación. Tabulación. Presentación. Análisis. Publicación.
PLANTEAMIENTO DEL PROBLEMA
Al abordar una investigación se debe tener bien definido qué se va a investigar y por qué se pretende estudiar algo. Es decir, se debe establecer una delimitación clara, concreta e inteligible sobre el o los fenómenos que se pretenden estudiar, para lo cual se deben tener en cuenta, entre otras cosas, la revisión bibliográfica del tema, para ver su accesibilidad y consultar los resultados obtenidos por investigaciones similares, someter nuestras proposiciones básicas a un análisis lógico; es decir, se debe hacer una ubicación histórica y teórica del problema.
2.2
FIJACIÓN DE LOS OBJETIVOS
Luego de tener claro lo que se pretende investigar, Debemos presupuestar hasta dónde queremos llegar; en otras palabras, debemos fijar cuáles son nuestras metas y objetivos. Estos deben plantearse de tal forma que no haya lugar a confusiones o ambigüedades y debe, además, establecerse diferenciación entre lo de corto, mediano y largo plazo, así como entre los objetivos generales y los específicos.
4
2.3
FORMULACIÓN DE LAS HIPÓTESIS
Una hipótesis es ante todo, una explicación provisional de los hechos objeto de estudio, y su formulación depende del conocimiento que el investigador posea sobre la población investigada. Una hipótesis estadística debe ser susceptible de docimar, esto es, debe poderse probar para su aceptación o rechazo.
2.4 DEFINICIÓN DE LA UNIDAD DE OBSERVACIÓN Y DE LA UNIDAD DE MEDIDA La Unidad de Observación, entendida como cada uno de los elementos constituyentes de la población estudiada, debe definirse previamente, resaltando todas sus características; pues, al fin de cuentas, es a ellas a las que se les hará la medición. La unidad de observación puede estar constituida por uno o varios individuos u objetos y denominarse respectivamente simple o compleja. El criterio sobre la unidad de medición debe ser previamente definido y unificado por todo el equipo de investigación. Si se trata de medidas de longitud, volumen, peso, etc., debe establecerse bajo qué unidad se tomarán las observaciones ya sea en metros, pulgadas, libras, kilogramos, etc. Asociado a la unidad de medida, deben establecerse los criterios sobre las condiciones en las cuales se ha de efectuar la toma de la información.
2.5 DETERMINACIÓN DE LA POBLACIÓN Y DE LA MUESTRA Estadísticamente, la población se define como un conjunto de individuos o de objetos que poseen una o varias características comunes. No se refiere esta definición únicamente a los seres vivientes; una población puede estar constituida por los habitantes de un país o por los peces de un estanque, así como por los establecimientos comerciales de un barrio o las unidades de vivienda de una ciudad. Existen desde el punto de vista de su manejabilidad poblaciones finitas e infinitas. Aquí el término infinito no está siendo tomado con el rigor semántico de la palabra; por ejemplo, los peces dentro de un estanque son un conjunto finito; sin embargo, en términos estadísticos, puede ser considerado como infinito. Muestra es un subconjunto de la población a la cual se le efectúa la medición con el
fin de estudiar las propiedades del conjunto del cual es obtenida. En la práctica, estudiar todos y cada uno de los elementos que conforman la población no es aconsejable, ya sea por la poca disponibilidad de recursos, por la homogeneidad 5
de sus elementos, porque a veces es necesario destruir lo que se está midiendo, por ser demasiado grande el número de sus componentes o no se pueden controlar; por eso se recurre al análisis de los elementos de una muestra con el fin de hacer inferencias respecto al total de la población. Existen diversos métodos para calcular el tamaño de la muestra y también para tomar los elementos que la conforman, pero no es el objetivo de este curso estudiarlos. Diremos solamente que la muestra debe ser representativa de la población y sus elementos escogidos al azar para asegurar la objetividad de la investigación.
2.6
LA RECOLECCIÓN
Una de las etapas más importantes de la investigación es la recolección de la información, la cual ha de partir, a menos que se tenga experiencia con muestras análogas, de una o varias muestras piloto en las cuales se pondrán a prueba los cuestionarios y se obtendrá una aproximación de la variabilidad de la población, con el fin de calcular el tamaño exacto de la muestra que conduzca a una estimación de los parámetros con la precisión establecida. El establecimiento de las fuentes y cauces de información, así como la cantidad y complejidad de las preguntas, de acuerdo con los objetivos de la investigación son decisiones que se han de tomar teniendo en cuenta la disponibilidad de los recursos financieros, humanos y de tiempo y las limitaciones que se tengan en la zona geográfica, el grado de desarrollo, la ausencia de técnica, etc. Es, entonces, descubrir dónde está la información y cómo y a qué "costo" se puede conseguir; es determinar si la encuesta se debe aplicar por teléfono, por correo, o si se necesitan agentes directos que recojan la información; establecer su número óptimo y preparar su entrenamiento adecuado.
2.7
CRITICA, CLASIFICACIÓN Y ORDENACIÓN
Después de haber reunido toda la información pertinente, se necesita la depuración de los datos recogidos. Para hacer la crítica de una información, es fundamental el conocimiento de la población por parte de quien depura para poder detectar falsedades en las respuestas, incomprensión a las preguntas, respuestas al margen, amén de todas las posibles causas de nulidad de una pregunta o nulidad de todo un cuestionario. Separado el material de "desecho" con la información depurada se procede a establecer las clasificaciones respectivas y con la ayuda de hojas de trabajo, en las
6
que se establecen los cruces necesarios entre las preguntas, se ordenan las respuestas y se preparan los modelos de tabulación de las diferentes variables que intervienen en la investigación. El avance tecnológico y la popularización de los computadores hacen que estas tareas, manualmente dispendiosas, puedan ser realizadas en corto tiempo.
2.8
LA TABULACIÓN
Una tabla es un resumen de información respecto a una o más variables, que ofrece claridad al lector sobre lo que se pretende describir; para su fácil interpretación una tabla debe tener por lo menos: Un título adecuado el cual debe ser claro y conciso. La Tabla propiamente dicha con los correspondientes subtítulos internos y la cuantificación de los diferentes ítems de las variables, y las notas de pie de cuadro que hagan claridad sobre situaciones especiales de la tabla, u otorguen los créditos a la fuente de la información.
2.9
LA PRESENTACIÓN
Una información estadística adquiere más claridad cuando se presenta en la forma adecuada. Los cuadros, tablas y gráficos facilitan el análisis, pero se debe tener cuidado con las variables que se van a presentar y la forma de hacerlo. No es aconsejable saturar un informe con tablas y gráficos redundantes que, antes que claridad, crean confusión. Además la elección de determinada tabla o gráfico para mostrar los resultados, debe hacerse no sólo en función de las variables que relaciona, sino del lector a quien va dirigido el informe.
2.10 EL ANÁLISIS La técnica estadística ofrece métodos y procedimientos objetivos que convierten las especulaciones de primera mano en aseveraciones cuya confiabilidad puede ser evaluada y ofrecer una premisa medible en la toma de una decisión. Es el análisis donde se cristaliza la investigación. Esta es la fase de la determinación de los parámetros y estadísticos muéstrales para las estimaciones e inferencias respecto a la población, el ajuste de modelos y las pruebas de las hipótesis planteadas, con el fin de establecer y redactar las conclusiones definitivas.
2.11 PUBLICACIÓN 7
Toda conclusión es digna de ser comunicada a un auditorio. Es más, hay otros estudiosos del mismo problema a quienes se les puede aportar información, conocimientos y otros puntos de vista acerca de él.
CUESTIONARIO 1. ¿Por qué se considera importante la estadística? 2. Enuncie las ramas en las que se divide la estadística y establezca su campo de acción. 3. Enumere las etapas del método estadístico. 4. ¿Por qué es importante la revisión bibliográfica en el desarrollo de una investigación estadística? 5. ¿La estadística es una ciencia o una técnica? 6. Defina: Población, Muestra, Censo y Muestreo. 7. ¿Por qué usualmente se recurre al análisis a través de muestras y no de poblaciones? 8. ¿Para qué se utiliza un muestreo piloto? 9. ¿Con qué fin se critica una información? 10. ¿Cuál es la diferencia entre una técnica y un instrumentos de recolección de datos?
8
3. Clasificación de Variables Antes de considerar aspectos relacionados con la recopilación, descripción reducción y análisis de datos estadísticos, es necesario distinguir y conocer los diversos tipos de variables que se pueden encontrar en los diversos estudios e investigaciones. Entre los muchos criterios de clasificación, podemos mencionar tres tipos:
3.1 SEGÚN LA NATURALEZA DE LA VARIABLE 3.1.1 Variables Cualitativas Son aquellas que expresan una cualidad, característica o atributo, tienen carácter cualitativo, sus datos se expresan mediante una palabra, es no numérico. Las variables cualitativas pueden ser: nominal u ordinal. a) Variable Cualitativa Nominal: Son aquellas que establecen la distinción de los elementos en las categorías sin implicar orden entre ellas. E jemplo 3.1:
Estado Civil o conyugal (soltero, casado, viudo, divorciado, separado, conviviente) Idioma de los habitantes de la tierra (castellano, ingles, francés, italiano, chino mandarín, etc.) Religión que profesa (católico, evangélico, musulmán, etc.)
b) Variable Cualitativa Ordinal: Son aquellas que agrupan a los objetos, individuos, en categorías ordenadas, para establecer relaciones comparativas. E jemplo 3.2:
Nivel de pobreza ( no pobre, pobre, muy pobre, extremadamente pobre) Categoría de docente universitario ( principal, asociado, auxiliar)
3.1.2 Variables Cuantitativas Son aquellas que expresan el valor de la variable por una cantidad, es de carácter numérico. El dato o valor puede resultar de la operación de contar o medir. Las variables cuantitativas pueden ser: discreta y continua.
9
a) Variable cualitativa discreta: Cuando el valor de la variable resulta de la operación de contar, su valor está representado sólo por números naturales (enteros positivos) E jemplo 3.3:
Número de accidentes de buses en la panamericana norte Número de hogares por vivienda en el distrito de San Juan de Lurigancho
b) Variable cualitativa continúa: Cuando el valor de la variable puede tomar cualquier valor dentro de un rango dado, por tanto se expresa por cualquier número real. E jemplo 3.4:
Producción de azúcar de la fábrica Casagrande en el año 2011 Hectáreas de cultivo de arroz en la Región San Martin
3.2 SEGÚN LA RELACIÓN ENTRE VARIABLES 3.2.1 Variables Independientes: (VI) Son las variables explicativas o predictivas, cuya asociación, relación o influencia en la variable dependiente se pretende descubrir en la investigación. Las variables independientes son los que traducen o explican las causas o razones de las variaciones en la variable dependiente. 3.2.2 Variables Dependientes: (VD) Son aquellas que se explican por otras variables, son los efectos o resultados respecto a los cuales hay que buscar un motivo, causas o razón de ser. Es la variable que traduce la consecuencia del efecto de una o varias razones o causas, de otras variables.
Simplificando, en la relación de variables, las causas o antecedentes serían las variables independientes y el efecto o consecuente es la variable dependiente.
E jemplos 3.5:
El volumen de ventas (VD) se explica por la inversión en publicidad (VI) El gasto familiar (VD) depende del ingreso familiar (VI) Ventas de casas (VD) depende de la tasa de interés (VI)
3.2.3 Variables Intervinientes o Interferentes Son aquellas que coparticipan con la variable independiente condicionando el
10
comportamiento de la variable dependiente. E jemplos 3.6:
El escaso fomento de la educación alimentaria en la población, genera mayor desnutrición infantil en las familias con bajo nivel de instrucción. Educación alimentaria (VI) Desnutrición infantil (VD) Nivel de instrucción (V. Interviniente) El bajo nivel de instrucción, es uno los factores que posibilita el poco interés de los padres, en el control de crecimiento y desarrollo de los niños de familias de estrato socio económico bajo. Nivel de instrucción (VI) Crecimiento y desarrollo (VD) Estrato socio económico (V. Interviniente)
3.3 SEGÚN LA ESCALA DE MEDICIÓN DE LAS VARIABLES Las variables no sólo de clasifican, sino también es necesario medirlas. La medición se hace con el fin de diferenciar por comparación, un elemento de otro, en las características de la variable. Este se hace a través de niveles o escalas, entre las cuales tenemos:
3.3.1 Escala Nominal Es el nivel más simple de medición donde las variables en escala nominal son de naturaleza cualitativa solamente permiten establecer categorías sin orden. En este nivel las categorías sólo se nombran o se enumeran, pero no se comparan. E jemplo 3.7:
Lugar de nacimiento (Lambayeque, Lima, Ica, Cuzco, etc.) Deporte que practica ( Futbol, Básquet, Vóley, Natación) Colegio de Procedencia (Estatal, Particular) Las variables que sólo tienen dos categorías se llaman variables dicotómicas.
3.3.2 Escala Ordinal Es el segundo nivel de medición donde las variables establecen categorías jerarquizadas, pero no grados de distancia iguales entre ellas; las categorías expresan una posición de orden. E jemplo 3.8:
11
Orden de mérito académico en un colegio (primero, segundo, tercero, etc.) Nivel de calificación a alguna autoridad pública ( Muy bueno, bueno, regular, malo y muy malo) Grado de instrucción (Sin instrucción, inicial, primaria, secundaria, superior no universitaria, superior universitaria, post grado)
3.3.3 Escala de Intervalo Es el tercer nivel de medición, entre cuyos diversos valores que toma la variable existen a la vez, clasificación, orden, y grados de distancia iguales entre las diferentes categorías, es decir, los intervalos son considerados como equivalentes y con un origen convencional, la unidad de medida no necesariamente empieza de cero; sólo sirve como punto o valor de comparación. E jemplo 3.9:
La temperatura Las puntuaciones obtenidas en un test psicológico Coeficiente de inteligencia
3.3.4 Escala de Razón o Proporción Es el nivel más alto de medición y donde la variable supone o comprende a la vez todos los casos anteriores: clasificación, orden, distancia y origen único natural. Tiene un cero absoluto, el cero representa la ausencia de la característica estudiada. E jemplo 3.10:
La edad en años Las distancias Producto bruto interno
E jemplo 3.11: entre la escala de razón y de intervalo
Escala de Razón Antonio tiene una estatura de 1.85 m y Felipe de 1.62 m, entonces Antonio es 114% tan alto como Felipe (1.85/1.62 = 1.14), o simplemente Antonio es 14% más alto que Felipe. Escala de Intervalo Sin embargo el Coeficiente de Inteligencia) no tiene la cualidad de proporción. Enzo tiene un CI de 130 y Diego de 100, no se puede decir que Enzo es 30% más inteligente que Diego.
CUESTIONARIO 12
Tipificar cada variable (si es cualitativa especificar si es nominal u ordinal; de la misma manera si es cuantitativa especificar si es discreta o continua) y además describir la escala de medición.
VARI ABLE
TIPO
Sexo Edad Nº de hijos por familia Nº de emergencias por día Estado de conservación de una vivienda (bueno, regular, malo) Frecuencia Cardiaca Puntajes de ansiedad Estado nutricional de un niño
4. Distribución de Frecuencias 13
E SCALA
Después de recoger toda la información correspondiente a la investigación, es decir, al agotar todo el trabajo de campo, nuestro escritorio se llena de un cúmulo de datos y cifras desordenadas los cuales, al ser tomados como observaciones individuales, dicen muy poco sobre la población estudiada; es, entonces, tarea del investigador “hacer hablar las cifras”, comenzando por la clasificación y ordenación, consignando la información en tablas inteligibles que denominamos distribuciones de frecuencias.
4.1 DISTRIBUCIÓN DE FRECUENCIAS SIMPLE Para una mayor sencillez, en la exposición del tema, nos valemos del siguiente E jemplo 4.1:
Supongamos que en la fábrica de confecciones “Malca”, ha estallado un conflicto laboral y sus cincuenta operarias solicitan un aumento en el salario semanal de lo contrario amenazan en paralizar la fábrica. El propietario recoge la información respecto a la variable salario semanal de sus 50 operarias y la relaciona en la tabla No 1.
TABLA Nº 01 SALARIO SEMANAL DE 50 OPERARIAS EN LA FABRICA DE CONFECCIONES “MALCA” S/. x Semana S/. x Semana S/. x Semana S/. x Semana S/. x Semana
52 54 55 54 53 56 54 58 51 54
54 51 54 55 54 56 52 54 53 55
55 55 52 55 53 57 54 55 53 55
56 53 57 54 53 50 55 52 53 54
TABLA Nº 02 DISTRIBUCIÓN DE FRECUENCIAS DEL SALARIO DE 50 OPERARIAS
14
52 57 56 51 58 55 53 54 53 56
S/. x Semana
50 51 52 53 54 55 56 57 58
CONTEO I III IIII IIII IIII IIII IIII II IIII IIII IIII III II
REPETICION
SUMA
1 3 5 9 12 10 5 3 2 50
Como se puede observar, hay una gran diferencia entre los datos brutos de la Tabla Nº 01 y el ordenamiento y agrupación de la Tabla Nº 02. Con el fin de obtener una mejor tabla interpretativa, introduciremos la siguiente simbología:
n:
E l tamaño de la muestra, es el número de observaciones.
Xi:
La variable; es cada uno de los diferentes valores que se han observado.
La variable xi, toma los x1, x2... xm valores.
f i:
La frecuencia absoluta o simplemente frecuencia, es el número de veces
que se repite la variable X i; así f 1, es el número de veces que se repite la observación x1, f 2 el número de veces que se repite la observación x2 etc.
Fi:
La frecuencia acumulada, se obtiene acumulando la frecuencia
absoluta.
hi:
F recuencia relativa; es el resultado de dividir c/u de las frecuencias
Hi:
absolutas por el tamaño de la muestra. F recuencia relativa acumulada; se obtiene dividiendo la frecuencia acumulada entre el tamaño de la muestra.
Distribución teórica de frecuencias de n observaciones 15
Variable
Frecuencia Absoluta
Frecuencia Acumulada
Frecuencia Relativa
Xi
f i
Fi
hi
Frec. Relativa Acumulada Hi
X1
f 1
F1
h1
H1
X2
f 2
F2
h2
H2
X3
f 3
F4
h3
H3
.
.
.
.
.
Xm
f m
Fm
hm
Hm
Total
n
1.00
Veamos el ejemplo que venimos trabajando:
TABLA Nº 03 Distribución de Frecuencias del Salario Semanal de 50 Obreras Salario S/. semanal
Xi
Frecuencia Absoluta
Frecuencia Acumulativa
f i
Fi
Frecuencia Relativa
hi
Frec. Relativa Acumulada Hi 0.02 0.08 0.18 0.36 0.60 0.80 0.90 0.96 1.00
50 1 1 0.02 51 3 4 0.06 52 5 9 0.10 53 9 18 0.18 54 12 30 0.24 55 10 40 0.20 56 5 45 0.10 57 3 48 0.06 58 2 20 0.04 50 1.00 Total Analizando las columnas porcentualmente hi y Hi se obtienen, entre otras las siguientes conclusiones:
Sólo el 4% de las obreras gana el máximo salario semanal de la fábrica, el cual corresponde a S/. 58.
16
El salario semanal mínimo S/. 50 lo gana únicamente una obrera, lo que constituye el 2% del personal asalariado. El 62% de las operarias tiene un salario semanal entre S/. 53 y S/. 55. El 60% de las obreras tiene un salario semanal de S/. 54 o menos. El 64% tiene un ingreso semanal de S/. 54 o más.
CUESTIONARIO Y EJERCICIOS PROPUESTOS 1. ¿Qué es frecuencia absoluta? 2. Cómo se obtiene: 2.1 ¿La frecuencia acumulada? 2.2 ¿La frecuencia relativa? 2.3 ¿La frecuencia relativa acumulada 3. En una distribución de frecuencias ¿se pueden establecer conclusiones porcentuales, utilizando solamente la frecuencia relativa? ¿Por qué? 4. La siguiente tabla relaciona las ausencias al trabajo de 50 obreras, durante el mes de octubre, en la fábrica de confecciones "CALIDAD TOTAL". 1 3 1 4 2
0 2 1 0 4
2 4 0 2 2
1 2 1 3 1
3 0 0 2 3
1 3 0 0 1
4 1 1 0 2
3 2 2 2 1
2 0 1 5 0
5 2 3 2 2
4.1 Construir una distribución de frecuencias simples 4.2 Hacer 3 conclusiones 5. Años de Experiencia de las 50 operarias de la fábrica de confecciones “B&G” 4 5
6 5
5 8
6 8
4 8
6 6
17
5 9
5 6
6 5
5 7
7 6 4
9 7 6
3 7 8
2 7 5
7 8 6
4 3 6
5 6 7
7 6 5
7 7 7
3 6 4
Ordenar la información y responder: 5.1 ¿Qué porcentaje de las obreras tiene experiencia inferior o igual a 6 años? 5.2. ¿Qué porcentaje tiene experiencia entre 5 y 7 años? 6. Palabras por minuto escritas por un grupo de mecanógrafas 77 78 80 84 78 77 79 78 81 80
80 75 78 79 81 83 84 85 80 79
78 79 75 77 77 81 79 83 84 77
79 79 85 85 77 76 81 80 80 77
85 79 77 78 81 80 80 84 85 77
84 79 76 77 81 81 83 79 80 83
76 81 84 85 77 79 84 85 79 79
79 84 84 81 83 79 77 78 80 81
80 79 78 77 81 82 79 79 77 85
78 77 85 84 81 84 80 79 76 80
Construir una distribución de frecuencias y resaltar 3 conclusiones 7. La siguiente tabla muestra, las respuestas obtenidas en un cuestionario aplicado a las o breras de la fábrica “Malca”, respecto a la edad, estado civil, número de hijos, experiencia, años de estudio, ingresos semanales, así como una calificación del desempeño otorgada por el supervisor.
Obrera
Edad
1 2 3 4 5 6
24 24 27 25 24 28
Estado Civil soltera soltera casada casada viuda soltera
Nº hijos 2 2 3 3 1 0
Experiencia 4 5 7 6 5 7
18
Años estudio 5 5 4 4 3 8
Ingresos S./ 52 54 55 54 53 56
Calificación 1 1 4 3 2 4
7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
29 35 30 27 28 25 27 30 27 36 26 29 26 28 28 31 22 25 25 40 39 38 35 33 33 32 32 31 30 23 30 26 28 27 26 38 38 31 39 36 35 29 28 29
conviviente soltera casada casada soltera conviviente soltera soltera soltera soltera soltera viuda soltera soltera soltera soltera soltera conviviente viuda soltera casada soltera viuda casada soltera soltera soltera soltera casada soltera conviviente soltera soltera casada conviviente soltera soltera viuda soltera casada soltera soltera casada soltera
1 0 3 3 1 2 0 0 0 0 1 2 2 0 0 1 2 1 3 0 4 3 3 3 1 2 0 1 2 2 2 2 2 2 3 1 0 2 1 2 1 2 2 1
5 9 3 6 7 3 6 7 6 8 4 6 5 7 7 7 4 7 5 8 6 6 5 7 8 5 9 6 5 2 6 4 5 6 4 8 7 3 8 6 5 6 6 7
3 9 3 3 6 3 7 7 5 8 3 4 4 9 8 6 3 6 3 9 5 5 4 4 6 4 8 5 3 3 5 3 4 4 3 9 8 3 9 5 5 4 5 6
54 58 51 54 54 51 54 55 54 56 52 54 53 55 55 55 52 55 53 57 54 55 53 55 56 53 57 54 53 50 55 52 53 54 52 57 56 51 58 55 53 54 53 56
3 5 1 2 3 1 2 3 3 4 2 2 2 3 3 3 1 3 2 5 3 3 2 3 4 2 4 3 3 1 3 1 1 2 1 4 4 1 4 2 1 1 1 3
Hacer las respectivas distribuciones de frecuencias, para cada una de las variables
4.2 DISTRIBUCIÓN DE FRECUENCIAS POR INTERVALOS Usualmente los valores de los datos no permiten un agrupamiento de ellos en una tabla de frecuencias simple, debido a que se encuentran distribuidos a través de todo el recorrido y el número de veces que se repite cada observación no es significativo en todos los casos, y en la mayoría de ellos su frecuencia es baja. Una tabla de frecuencias construida en estas condiciones, no presenta ninguna utilidad.
19
Ilustraremos el caso a través de un ejemplo: E jemplo 4.2:
Supongamos que la fábrica de baldosas “De las casas”, con el objeto de ofrecer una garantía de su producto, desea hacer un estudio técnico de su producción, para lo cual extrae una muestra de 100 baldosas, cada una de las cuales se somete a una prueba de resistencia, destructiva cuyos datos expresados en Kg/Cm2, se relacionan a continuación:
TABLA Nº 04 Resistencia en Kg/Cm2 de 100 Baldosas de La Fabrica “De Las Casas”
478 339 666 313 415 210 425 419 425 420 391 487 540
458 694 239 644 291 480 459 655 436 422 469 610 504
683 478 398 495 621 223 418 487 634 282 460 470 542
780 498 720 122 253 433 351 135 450 439 308 469 369
736 310 648 521 763 444 361 370 223 449 477 392
448 537 533 368 746 437 183 345 479 321 463 517
591 592 586 531 323 360 383 282 161 452 367 359
555 549 321 472 575 559 259 578 337 444 251 527
La clasificación en una distribución de frecuencias simple daría como resultante un ordenamiento de por lo menos 80 ítems; la mayoría de ellos con frecuencia unitaria. Se hace necesario el agrupamiento en intervalos o clases que haga más compacta, manejable y presentable la información.
El número de clases y la amplitud de los intervalos los fija el investigador de acuerdo con el conocimiento que posea de la población, la necesidad de hacer comparación con otras investigaciones y la presentación de la información. Sin embargo, se recomienda que la información no sea demasiado compacta, lo cual le restaría precisión, ni demasiado dispersa, ya que no se tendría claridad.
20
En términos generales, es usual que el número de intervalos no sea inferior a 5 ni superior a 15. Sturges propone que el número de clases o intervalos sea determinado por la expresión m = 1 + 3.33 log(n)
4.3 REGLAS EMPÍRICAS PARA LA CONSTRUCCIÓN DE INTERVALOS Cuando no se tiene experiencia en el manejo de la información es aconsejable seguir los pasos que se dan a continuación:
a) Determinar el Rango (R): Se obtiene restando el valor máximo y el valor mínimo. R = Valor Max. – Valor Min.
b) Determinar el Número de Intervalos (m): El criterio a seguir para determinar el número de intervalos generalmente del mismo tamaño es que el mismo sea suficientemente pequeño para lograr la simplificación deseada, pero lo suficientemente grande para minimizar los posibles errores de clasificación. Naturalmente no es conveniente utilizar muchos intervalos de pequeña amplitud ya que en un caso extremo, equivaldría a trabajar con los datos originales. Por otra parte, un número muy reducido de intervalos, significa cierta concentración y la pérdida de información consiguientemente, como ocurría en otro caso, si se considerase un solo intervalo. Se recomienda: b1) Considerar el número de intervalos entre 5 y 20 5 ≤ m ≤ 20
b2) Utilizar la regla de Sturges para determinar el número de intervalos: m = 1 + 3.322 log n Donde: n es el número de observaciones
c) Determinar la Amplitud Intervalica (C) También se le conoce como ancho del intervalo y se obtiene dividiendo el rango entre el número de intervalos.
21
C=
d) Determinar las Marcas de Clase Las marcas de clase o punto medio de cada intervalo se hallan mediante la semisuma del límite inferior y del límite superior. =
+
Nota 1 La amplitud o longitud de los intervalos no siempre son iguales; pueden utilizarse desiguales, pero siempre relacionados con una amplitud de intervalo como unidad. En general, según la amplitud hay tres tipos de intervalos: a) Intervalos de igual amplitud b) Intervalos de diferente amplitud c) Intervalos abierto (a) Peso (Kg) 20.1 - 30 30.1 - 40 40.1 - 50 50.1 - 60 60.1 - 70 70.1 - 80
(b) Edades (años) 3 - 5 6 - 14 15 - 24 25 - 39 40 - 59 60 - 99
(c) Ingresos (S/.) Menos de 500 501 - 1000 1001 - 2000 2001 - 3000 3001 - 4000 4001 y mas
Nota 2 El número de intervalos (m) es arbitrario, sin embargo es recomendable tener presente los siguientes criterios: Naturaleza de la variable El número de valores observados El recorrido de la variable La sensibilidad de la variable ( unidad de medida) Los objetos del estudio que se usa la información
Nota 3
22
El número y amplitud de los intervalos de clase de una tabla tienen que estar en relación con la naturaleza y el contexto de estudio. Sin embargo, independientemente de este hecho, algunos mecánicamente prefieren determinar el número de intervalos mediante la fórmula propuesta por Sturger.
Nota 4 Para facilitar los cálculos, se recomienda que la amplitud de los intervalos se redondee al número sencillo más cercano e inmediatamente superior. Esto significa que el cociente R/m sea exacto. En muchos casos será necesario ampliar ligeramente el recorrido, de modo que: Ci =
−
Sea un valor exacto y con el menor número de decimales. Nunca se reduce la amplitud del recorrido.
Nota 5 Los extremos de un intervalo deben estar perfectamente definidos, de modo que no exista duda o ambigüedad en el momento de la tabulación. Un valor de X i sólo puede pertenecer a un intervalo y sólo a uno. En nuestro caso, denominaremos el intervalo como (Li - LS] que significa que es “abierto por la izquierda” y “cerrado por la derecha”. En términos sencillos significa que en cada intervalo están incluidos los valores que son ligeramente superiores al extremo inferior, hasta exactamente el extremo superior. Matemáticamente Li < Xi ≤ LS
Nota 6 La construcción de tablas de frecuencia, especialmente con intervalos, supone una ligera pérdida de información por la concentración de los datos originales. No se registra directamente el dato original Xi sino que se ubica dentro de un intervalo. Cuando el número de intervalos es menor, la perdida de información será mayor. Sin embargo, no es aconsejable usar un elevado número de intervalos, puesto que significaría trabajar casi con los datos originales. Retomemos el ejercicio del ejemplo 4.2: a) Construir una distribución de frecuencias absolutas utilizando la regla de Sturges.
23
b) Construir una distribución de frecuencias ampliadas para las diferentes frecuencias dadas. c) Interpretar f 2, F2, h2, y H2% Solución: Siguiendo los pasos establecidos: Hallando el rango (R) R = Valor Max – Valor Min R = 780 – 122 R = 658
Hallando el número de intervalos (m) m = 1 + 3.322 log n m = 1 + 3.322 log 100 m = 1 + 3.322 (2) m = 7.644 No es lógico tener 7.6 intervalos, por lo tanto se procede a aproximar el número de intervalos a un número natural cercano. Aproximemos, m = 8 Hallando la amplitud intervalica (C) C=
=
6
= 82.25 ≅ 83
Determinando los limites de clase y sus respectivas marcas de clase. Resistencia en Kg/Cm2 ( LI (i) – LS (i) ]
122 205 288 371 454 537 620 703
-
Marcas de clase Y i
205 288 371 454 537 620 703 786
163.5 246.5 329.5 412.5 495.5 578.5 661.5 744.5
a) Determinando la distribución de frecuencias absolutas
TABLA Nº 05
24
Distribución de frecuencias de la Resistencia de 100 Baldosas de la fábrica “De las Casas” Resistencia en Kg/Cm2 ( LI (i) – LS (i) ]
Marcas de clase Y i
Nº de Baldosas f i
122 - 205 205 - 288 288 - 371 371 - 454 454 - 537 537 - 620 620 - 703 703 - 786 Total
163.5 246.5 329.5 412.5 495.5 578.5 661.5 744.5 -
4 9 18 21 24 11 8 5 100
b) A continuación le mostramos la distribución de frecuencias ampliadas para las diferentes frecuencias dadas:
TABLA Nº 06 Distribución de frecuencias de la Resistencia de 100 Baldosas de la fábrica “De las Casas”
Kg/Cm2 ( LI (i) – LS (i) ]
Marcas de clase Y i
122 - 205 205 - 288 288 - 371 371 - 454 454 - 537 537 - 620 620 - 703 703 - 786 Total
163.5 246.5 329.5 412.5 495.5 578.5 661.5 744.5 -
Resistencia en
Nº de Baldosas f i 4 9 18 21 24 11 8 5 100
Fi
hi
Hi
hi %
Hi %
4 13 31 52 76 87 95 100 -
0.04 0.09 0.18 0.21 0.24 0.11 0.08 0.05 1.00
0.04 0.13 0.31 0.52 0.76 0.87 0.95 1.00 -
4 9 18 21 24 11 8 5 100
4 13 31 52 76 87 95 100 -
c) Interpretando: f 2
: 9 baldosas tienen una resistencia mayor a 205 Kg/Cm2 y menor
25
o igual a 288 Kg/Cm2 F2
: 13 baldosas tienen una resistencia mayor a 122 Kg/Cm2 y menor o igual a 288 Kg/Cm2
h2%
: El 9% de baldosas tienen una resistencia mayor a 205 Kg/Cm2 y menor o igual a 208 Kg/Cm2
H2%
: El 13% de baldosas tienen una resistencia mayor a 122 Kg/Cm2 y menor o igual a 288 Kg/Cm2
CUESTIONARIO Y EJERCICIOS PROPUESTOS 1. ¿Por qué se recurre al agrupamiento en distribuciones de frecuencias por intervalos? 2. ¿Cómo se determina el número de intervalos y la amplitud de ellos? 3. ¿Qué es una marca de clase? 26
4. La siguiente tabla muestra el consumo de agua, en m3de 184 familias en un barrio residencial de la ciudad de Trujillo durante el mes de octubre: 4 16 6 23 10 23 10 12 17 21 14 12 14 5 14 15 24
8 16 23 12 31 2 21 23 13 27 16 5 20 20 20 25 15
8 29 11 23 11 26 9 8 21 21 19 13 14 28 10 2 24
13 17 23 17 26 17 30 26 13 9 17 17 6 17 25 9 11
15 23 10 22 22 15 13 8 16 26 17 7 9 21 12 24 22
20 3 21 18 5 21 18 28 26 24 24 12 13 4 32 25 10
10 17 21 27 5 14 34 8 18 8 5 14 22 33 15 12 21
19 25 6 27 18 29 17 16 9 10 20 1 10 12 25 15 14
9 10 22 17 16 18 4 29 18 16 14 16 6 25 16 22
18 18 18 13 13 20 29 18 13 33 16 25 21 9 22 17
17 29 13 13 30 9 16 2 12 21 12 20 20 17 13 7
Construir una distribución de frecuencias por intervalos. 4.1 Asumiendo el número de intervalos m = 8 4.2 Asumiendo el número de intervalos m = 9 4.3 Comparar las dos distribuciones y las conclusiones que de ellas se deriven.
5. Representación Gráfica A pesar de la gran ayuda que prestan las tablas y cuadros con información organizada, no todos los públicos alcanzan a comprenderla o no disponen del tiempo suficiente 27
para analizarla. Es por ello que la mayoría de los investigadores acostumbran a reforzar la descripción a través de dibujos, generalmente con formas geométricas, que ayudan a visualizar el comportamiento de las variables tratadas.
5.1 DEFICIÓN DE GRÁFICOS ESTADÍSTICOS Un gráfico o diagrama es una representación pictórica (figuras geométricas, de superficie o volumen) con el objeto de ilustrar los cambios o dimensión de una variable, para comparar visualmente dos o más variables similares o relacionadas. Todo gráfico es superior al texto escrito porque transmite de manera casi instantánea, hechos, cantidades y comportamientos de variables. Un gráfico bien representado vale más que mil palabras; el grafico es el idioma universal. Por su naturaleza, un gráfico no toma en cuenta los detalles y no tiene la misma precisión de una tabla estadística. Los gráficos estadísticos son representaciones de relaciones cuantitativas que existen realmente en el mundo, en ningún caso es una ficción que surge de la imaginación del artista, el gráfico es la expresión artística de datos reales y observados.
5.2 CONSTRUCCIÓN DE GRÁFICOS En Estadística se emplean una diversidad de gráficos, cuya forma dependerá de la naturaleza de los datos y del objeto de la presentación. Antes de elegir el tipo de gráfico, conviene imaginarse de antemano el gráfico a construir, que en general debe tener rasgos simples y de fácil comprensión. Los gráficos de una sola variable sirven para fines comparativos de cantidades absolutas, tasas, proporciones, etc. Pueden tener la forma de barras, superficies, puntos o líneas. Los gráficos de dos variables, se construyen en el plano rectangular o de coordenadas cartesianas, donde hay dos ejes, X e Y. En el eje Y (ordenada) se colocan los valores de la variable dependiente y en X (abscisa) la variable independiente, siendo y= f(x).
5.3 PRINCIPALES COMPONENTES DE UN GRÁFICO 1) Título, como en los cuadros, es una descripción del contenido del gráfico; debe indicar claramente la naturaleza del fenómeno representado. 2) El cuerpo, está dado por el propio dibujo del gráfico, están representados los datos indicados en el titulo; su elección debe considerar el o los tipo de variables a
28
relacionar, el público a quien va dirigido y el diseño artístico del gráfico.
3) Escalas y/o leyendas, son indicaciones donde se precisa la correspondencia entre los elementos del gráfico y la naturaleza de las medidas representadas. 4) Fuente, indica el lugar de los datos estadísticos que están representados en el gráfico.
5.4 PRINCIPALES TIPOS DE GRÁFICOS Existe una gran cantidad de gráficos para la representación de datos estadísticos, ya que de ellos depende el diseño artístico de quien los elabora, así como de su imaginación al combinar varios tipos de ellos, como forma de presentar una información. Entre los gráficos más comunes tenemos:
5.4.1 Gráfico de Líneas: Usado básicamente para mostrar el comportamiento de una variable cuantitativa a través del tiempo. El gráfico de líneas consiste en segmentos rectilíneos unidos entre sí, los cuales resaltan las variaciones de la variable por unidad de tiempo. Para su construcción ha de procederse de la siguiente manera: en el eje de las ordenadas se marcan los puntos de acuerdo con la escala que se esté utilizando. En el caso de una escala aritmética, distancias iguales en el eje, representan distancias iguales en la variable. Perú: Incidencia de la Pobreza en el Área Urbana 2004 - 2009 40 35 e 30 j a t 25 n20 e c r 15 o P10 5 0
37.1
36.8 31.2
25.7
23.5 21.1
2004
2005
2006
2007
2008
2009
Años Fuente: INEI - Encuesta Nacional de Hogares (ENAHO): 2004 – 2009.
El eje de la variable X se divide en unidades de tiempo iguales, teniendo presente el número de ítems que ha de presentarse, así como la longitud del eje. Es de anotar la conveniencia de mostrar la interrupción y acercamiento del eje a su origen cuando esto haya ocurrido.
29
5.4.2 Gráfico de Líneas Compuesto: Cuando se tienen varias variables a representar, con el fin de establecer comparaciones entre ellas (siempre que su unidad de medida sea la misma); se utiliza plasmarlos en un sólo gráfico, el cual es el resultado de representar varias variables en un mismo plano Perú: Incidencia de la Pobreza Según Área de Residencia 80 70 60 e j a t 50 n40 e c r 30 o P 20 10 0
69.8
70.9
69.3
64.6
59.8
60.3
Área Urbana Área Rural
37.1
2004
36.8
2005
31.2
2006
25.7
2007
23.5
2008
21.1
2009
Años Fuente: INEI - Encuesta Nacional de Hogares (ENAHO): 2004 – 2009.
5.4.3 Gráfico de Barras: El gráfico de barras, como su nombre lo indica, está constituido por barras rectangulares de igual ancho, conservando la misma distancia de separación entre sí. Se utiliza básicamente para mostrar y comparar frecuencias de variables cualitativas o comportamientos en el tiempo, cuando el número de ítems es reducido. Perú: Poblacion Censada según su Estado Civil, 2007 40 e 30 j a t n e 20 c r o P10
39.5
30.3
22.3
3.9
3.6
0.4
0
Estado Civil Fuente: INEI - Censo de Población y Vivienda 2007.
Éstos gráficos suelen ser de barras verticales, aunque se pueden utilizar de forma horizontal.
30
5.4.4 Gráfico de Barras Compuestas: El grafico de barras compuestas cuenta con dos a más variables.
Perú: Población Censada en Edad de Trabajar, Según Nivel de Educación Alcanzado, 1993 y 2007 (Población de 14 y mas años de edad) 36.4
40 e 30 j a t m20 e c r o P 10
39.3
1993 2007
31.6 23.2
15.5
14.6
12
9.3
7.2
10.4
0.3 0.1
0 Sin nivel
Inicial
Primaria
Secundaria
Superior No Superior Univeristaria Univeristaria
Nivel de Educación Alcanzado
Fuente: INEI - Censo de Población y Vivienda, 1993 y 2007.
5.4.5. Gráfico de Sectores Circulares: Usualmente llamado gráfico de pastel, debido a su forma característica de una circunferencia dividida en cascos, por medio de radios que dan la sensación de un pastel tajado de porciones. Se usa para representar variables cualitativas en porcentajes o cifras absolutas cuando el número de ítems no es superior a 5 y se quiere resaltar uno de ellos. Lambayeque: Hogares en Viviendas Particulales Según Combustible que Más Utilizan para Cocinar, 2007 Gas
Leña
Carbón
Kerosene
Otro
1% 4% 10% 24% 61%
. Fuente: INEI - Censo de Población y Vivienda 2007.
5.4.6. Histograma de Frecuencias: Este gráfico se utiliza para describir datos cuando la variable es cuantitativa continua. Su construcción se hace levantando sobre
31
el eje de la variable rectángulos que tangan por base la amplitud del intervalo de clase y una altura proporcional a su frecuencia absoluta o relativa porcentual. Histograma Frecuencias de la Resistencia de 100 Baldosas de la F ábrica “De las Casas”
Fuente: Área de Producción de la Fabrica “De las Casas”
5.4.7. Polígono de Frecuencias: Para la construcción de un polígono de frecuencias, se marcan los puntos medios de cada uno los intervalos en la parte superior de cada barra del histograma de frecuencias, los cuales se unen con segmentos de recta. Resistencia de 100 Baldosas de la Fábrica “De las Casas”
Fuente: Área de Producción de la Fabrica “De las Casas”
5.4.8. Histogramas de Frecuencias Acumuladas: El histograma de frecuencias acumuladas también es obtenido a partir de una distribución de frecuencias, tomando 32
en el eje horizontal las clases de la variable, y en el eje vertical las frecuencias acumuladas correspondientes a cada intervalo. Frecuencia Acumulada de la Resistencia de 100 Baldosas de la Fábrica “De las Casas”
Fuente: Área de Producción de la Fabrica “De las Casas”
Frecuencia Acumulada de la Resistencia de 100 Baldosas de la Fábrica “De las Casas”
Fuente: Área de Producción de la Fabrica “De las Casas”
5.4.9. Pictogramas: Con el nombre de Pictogramas suelen denominarse un conjunto de gráficos de aspecto más o menos atractivo que sirven para trasmitir de forma 33
sencilla la información. Perú: Población Censada con Seguro de Salud Por Departamentos, 2007 Apurímac
Madre de Dios
Junín
55.2%
36.4%
29.9%
Fuente: INEI - Censo de Población y Vivienda, 2007.
CUESTIONARIO Y EJERCICIOS PROPUESTOS 1. ¿Cuál es el objetivo de un gráfico? 2. Describa los componentes de una gráfica. 3. ¿Cuáles son las principales causas de distorsión de la información de un gráfico? 4. ¿Cuál debe de ser la proporción entre los ejes del plano cartesiano para la construcción de un gráfico? 5. Para el ejercicio 02 del capítulo 3, numeral 3.2 construir: 5.1 Un histograma de frecuencias 5.2 Un polígono de frecuencias. 5.3 Un histograma de frecuencias acumuladas
34
5.4 Un polígono de frecuencias acumuladas 6. Construir un gráfico de líneas para esta información. Perú: Evolución de la Población Censada, por Región Natural, 1940 - 2007 (Porcentaje) Región Natural Costa Sierra Selva
1940
1961
1972
1981
1993
2007
28.3 65.0 6.7
39.0 52.3 8.7
46.1 44.0 9.9
49.8 39.7 10.6
52.4 34.8 12.8
54.6 32.0 13.4
. Construir la tabla de distribución de frecuencias y hacer su grafica adecuada
7
a) A,B,B,B,C,A,A,A,A,C,B,C,A,B,B,A,A,A,C,C,A,A,B,A,C,C,C,A,B,C,A ; donde la variable es el nivel socio económico con sus valores bajo (A), medio (B) y alto (C) b) Para la variable números de hijos por familia los resultados siguientes son de 30 viviendas unifamiliares del asentamiento Humano, EL EDEN, Los resultados son los siguientes: 1, 1 , 2 , 3 , 4 , 2 ,2 ,2 , 1 , 1 , 1 , 2 , 3 , 4 , 4 ,2 , 1 ,2 ,3 , 2 , 3 , 1 , 2 , 3 , 2 , 4 , 3, 2 , 2 , 1
35