Autores: Ing. Algemiro Julio Muñoz Vilela Mg. Ángel Hugo Campos Díaz
ESTADISTICA DESCRIPTIVA
PRÓLOGO En el campo de las ciencias económicas, sociales, educativas y en la ingeniería, entre otros, la estadística descriptiva es una herramienta de suma importancia en todas las especialidades profesionales de las diferentes universidades del país . Debido al gran desarrollo competitivo de las instituciones las cuales demandan cada vez mayor cantidad de profesionales que desarrollen actitudes en el campo de la investigación , asi como también su aplicación mediante técnicas y instrumentos de medición estadística. El presente texto que se presenta se hace con el fin de dar bases sólidas para que los estudiantes de las diferentes especialidades sean estos de la carrera profesional de ingeniera, administración, o de otras áreas lo puedan utilizar como medio de ayuda en la resolución de sus problemas Estadisticos así como también a la interpretación o análisis que se deba de hacer en alguna toma de decisiones. En la presente edición se ha considerado el desarrollo algunos ejercicios Estadisticos así como la interpretación de cada medida de resúmenes presentados, con la intención de proporcionar al lector el más simple entendimiento que debe tener al usar las técnicas del análisis Estadístico al momento de un proceso de investigación. En esta edición el lector encontrará problemas propuestos.
problemas desarrollados y
Los autores
INDICE 2
ESTADISTICA DESCRIPTIVA
CAPITULO 1 1.- ESTADISTICA 1.1 Definición 1.1.1Conceptos 1.1.2Estadistica como ciencia 1.1.3 Para qué sirve la estadística 1.2 Clasificación de la Estadística 1.2.1 Estadistica Descriptiva 1.2.2 Estadística Inferencial 1.3 Algunas definiciones Estadísticas 1.3.1 Población 1.3.2 Muestra 1.3.3 Parámetro 1.3.4 Estadístico 1.4 Variables y sus tipos 1.4.1 Por su generalidad y abstracción - Variables Teoricas - Variables Intermedias - Variables Empiricas 1.42 Por su relación causal - Variable Independiente - Variable Dependiente - Variable Interviniente 1.4.3 Por su naturaleza - Variable Cualitativa - Variable Cuantitativa
CAPITULO 2 2.- MEDICION DE VARIABLES
3
ESTADISTICA DESCRIPTIVA
2.1 ESCALAS DE MEDICIÓN 2.1.1 Escala Nominal 2.2.2 Escala Ordinal 2.2.3 Escala de Intervalo 2.2.4 Escala de Razón 2.2 INSTRUMENTOS DE RECOLECCIÓN DE DATOS CUANTITATIVOS 2.2.1 la investigación documental. 2.2.2 la investigación de campo 2.2.3 la observación 2.3.4 la experimentación 2.3.5 la entrevista 2.3.6 la encuesta 2.3.7 el cuestionario 2.3 FUENTES DE INFORMACIÓN 2.3.1 Primarias 2.3.2 Secundarias 2.4 REDONDEO DE DATOS, NOTACIÓN CIENTÍFICA Y CIFRAS SIGNIFICATIVAS 2.4.1 Redondeo 2.4.2 Notación científica 2.4.3 Cifras significativas 2.5 ORDEN DE DATOS 2.5.1 Método del Listado en Orden 2.5.2 Método de tallos y hojas
CAPITULO 3 3.- DISTRIBUCION DE FRECUENCIAS
4
ESTADISTICA DESCRIPTIVA
3.1 tabla de distribucion de frecuencias 3.1.1 partes de una tabla estadística 3.1.2estructura de una tabla de distribucion de frecuencias 3.1.3 tipos de frecuencia en una tabla estadística 3.1.4 cálculo del número número de de intervalos intervalos 3.1.5 cálculo del rango (r) 3.1.6 cálculo de la amplitud o ancho de clase (w) CAPITULO 4 4.- DESARROLLO DE LAS MEDIDAS DE RESUMEN 4.1 Medidas de tendencia central 4.1.1 Media 4.1.2 Mediana 4.1.3 Moda 4.1.4 Media Geométrica 4.1.5 Media Armónica 4.2 Medidas de posición 4.2.1 Percentiles 4.2.2 Deciles 4.2.3 Cuartiles 4.3 Medidas de Dispersión 4.3.1.Rango 4.3.2 Recorrido Intercuartilico 4.3.3 Desviación Media 4.3.4 Varianza 4.3.5 Desviación Estándar 4.3.6 Coeficiente de Variación 5.- Medidas de Forma 5.31 Asimetría 5.3.2 Curtosis 6.-BIBLIOGRAFIA
ESTADISTICA
5
ESTADISTICA DESCRIPTIVA
Con algunas definiciones se pretende que el estudiante aprenda conceptos descriptivos e inferenciales, conociendo sus aplicaciones en el mundo real, en diferentes campos hasta el de ingeniería. Para formarnos una idea de lo que es la Estadística relacionémoslo con las siguientes interrogantes: Es Ciencia? Porque busca sistemáticamente a través de Experimentaciones y conocimiento la Realidad del problema en estudio. Es la Tecnología del Método Científico? ¿Qué es la investigación científica? Es la búsqueda sistematizada y objetiva de nuevos conocimientos. Investigar es un proceso de buscar, indagar o pesquisar. El método científico, comprende la realización de la investigación en forma sistematizada y objetiva, organizada y coherente haciendo uso de técnicas y procedimientos como: -
La Observación del Problema. La formulación de Hipótesis. La Experimentación. Las Leyes y Teorías. Conclusiones. Documentaciones.
Es una Herramienta? Es una herramienta útil para el aprendizaje del mundo que nos rodea, porque con ella se Recoge, Clasifica, Presenta, Analiza e interpretan las informaciones procedentes de una investigación, para de esta manera obtener resultados y hacer inferencias validas científicas (proyecciones a futuro). La Estadística sirve para: Para promediar y calcular una serie de datos. Para hacer relaciones de una variable con la otra. Para hacer representaciones de la información en cuadros estadísticos y en Graficos. Para determinar la validez y fiabilidad de la información obtenida haciendo predicciones a través de la probabilidad.
6
ESTADISTICA DESCRIPTIVA
¿Quienes lo Usan? Ante las necesidades cambiantes que se dan en la Sociedad, es necesario contar con herramientas altamente confiables que nos permitan tomar decisiones acertadas y eficaces para poder resolver los problemas prioritarios que podrían enmarcarse de acuerdo al criterio 80/20 (el 80% de todos los problemas se deben al 20% de las causas.) .De ahí que sea fundamental que todos los futuros profesionales que pretendan dirigir correctamente los destinos de la humanidad, aprendan y se sirvan de los métodos estadísticos para minimizar la probabilidad de error en la toma de decisiones en esta era llamada del conocimiento, que actualmente cuentan con todas ayudas de última generación que a través de excelentes software permiten agilizar todo el trabajo estadístico. Actualmente existen muchos paquetes estadísticos que agilizan todo el trabajo y entre los más importantes tenemos: SPSS: SPSS: Gestión de datos, análisis estadístico, gráficos y presentación de resultados. STAGRAPHICS: STAGRAPHICS: Paquete de análisis interactivo y sistema grafico SAS: SAS: Planificación, análisis estadístico, gráficos y presentación de resultados. EXCEL: EXCEL: análisis estadístico, gráficos y presentación de resultados. STATISTICA: STATISTICA: Planificación, presentación de resultados
análisis
estadístico,
gráficos
y
MINITAB: MINITAB: Planificación, análisis estadístico, gráficos y presentación de resultados ARIMA: ARIMA: Diseño de experimentos EVIEWS: EVIEWS: Análisis econométrico y estadístico, gráficos y presentación de resultados Es usada en: Las comunicaciones, la industria, la Agricultura, la salud, por los Órganos Gubernamentales, los Organismos Oficiales, los Diarios y revistas, los Administradores, los Ingenieros, los Deportes, los Médicos,
7
ESTADISTICA DESCRIPTIVA
el Marketing, en el Control de Calidad Calidad y diferentes áreas profesionales. DEFINICIONES.La estadística es la ciencia que nos facilita la solución de problemas, en los cuales necesitamos conocer características sobre el comportamiento de algún suceso o evento. Nos permite inferir el comportamiento de sucesos iguales o similares sin necesidad que estos ocurran. Nos da la posibilidad de poder tomar decisiones acertadas y a tiempo, asi como realizar proyecciones del comportamiento del suceso, en un escenario de incertidumbre. Por lo general solo se realizan cálculos y análisis con los datos obtenidos de una muestra y no con toda la población. En término generales la estadística se puede utilizar para mejorar el rendimiento en el trabajo y en muchos aspectos de la vida diaria ya que es una guía universal para lo desconocido DEFINICIÓN: La Estadística es la ciencia que se encarga de recolectar, organizar, resumir, analizar, interpretar y representar grandes cantidades de datos con respecto a una característica materia de estudio o investigación, para transformarlos en información información que nos facilite la solución de problemas obteniendo conclusiones y de esta manera poder tomar decisiones. ¿Qué es la Recolección de Datos? Es el registro de características(medición, observación, conteo) a una unidad elemental (o de análisis). ¿Qué es la Organización de Datos? Es el ordenamiento para una mejor comprensión y facilitar sus análisis. (tablas, gráficos y figuras). Los datos sin organizar se llaman datos brutos, y son de poca utilidad ¿Qué es el Análisis de Datos?
8
ESTADISTICA DESCRIPTIVA
Es el cálculo de MEDIDAS REPRESENTATIVAS (o de resumen) tales como promedios, medidas de variabilidad y medidas de la forma de la distribución. También se analizan datos cuando se establecen relaciones relaciones entre ellos (regresión y correlación). ¿Qué es la Interpretación de Datos? Es darle un sentido práctico o útil a los resultados obtenidos en el análisis.
La estadística responde a nuevas demandas sociales para realizar investigaciones exhaustivas sobre temas sociales surgiendo 2 problemas básicos a la hora del trabajo de Campo:
Como el tiempo que tardaríamos entrevistar a toda la Población.
El costo económico y de personal de estas entrevistas.
Con las Técnicas de Muestreo se consigue hacer buenas Investigaciones sobre una pequeña parte de esa población, obteniendo resultados válidos para todo ella.
El control de Calidad permite medir las características de la calidad de un producto, compararlas con ciertos requisitos y tomar decisiones correctivas si hay diferencias entre el funcionamiento real y el esperado.
Con estudios estadísticos aplicados a las diversas áreas podemos estimar los Rendimientos obtenidos en una determinada producción.
Clasificación de la Estadística: Estadística Descriptiva.Se denomina así al conjunto de métodos estadísticos que se relacionan con la recolección, el resumen, resumen, descripción y visualización visualización adecuada de los datos originados a partir de los fenómenos en estudio. Emplea la construcción de TABLAS y representaciones GRAFICAS que permiten simplificar la complejidad de los datos que intervienen en la Distribución.
9
ESTADISTICA DESCRIPTIVA
Hace uso del método deductivo en el análisis que consiste en que conocida la población se puede aplicar las Generalidades a la Muestra. Estadística Inferencial.Se encarga de analizar la información presentada por la estadística descriptiva mediante técnicas que nos ayuden a interpretar y conocer con un determinado grado de confianza a la población lo que nos permitirá tomar decisiones . Hace uso del método Inductivo, plantea y resuelve el problema de establecer previsiones y conclusiones generales sobre una Población a partir de los resultados obtenidos en una muestra. Algunas definiciones Estadísticas Importantes: POBLACION: Se define población al conjunto de todos los individuos Elementos, Elementos, objetos, eventos que cumplen ciertas propiedades en común, sobre el que se realizan las observaciones y/o mediciones. En los estudios con poblaciones de personas, la unidad de Observación son los individuos. Según el número de elementos puede ser: POBLACION INFINITA, es cuando tiene un número infinito de elementos es decir es extremadamente grande. POBLACION FINITA, es cuando tiene un número determinado de elementos, es decir es posible contarlos e numerarlos. En relación al tamaño de la población, esta puede ser: MUESTRA: Es una parte o un subconjunto de la Población, que tiene la característica fundamental de ser representativa de la Población. CENSO: CENSO: es el procedimiento durante el cual se realiza la Encuesta para recopilar información de toda POBLACION. MUESTREO: MUESTREO : es el procedimiento en el que se realiza la Encuesta para recopilar información de unas MUESTRAS. PARAMETRO: PARAMETRO: función definida sobre los valores numéricos que resumen todos los datos de características medibles de una población.se simboliza con letras griegas µ y σ
10
ESTADISTICA DESCRIPTIVA
ESTADISTICO: ESTADISTICO: función definida sobre los valores numéricos que resumen todos los datos de características medibles de una Muestra. Se simboliza con letras del alfabeto X y S. ELEMENTOS: ELEMENTOS: entidades de las cuales recogemos los datos. DATO (OBSERVACION): (OBSERVACION): Es el resultado o medida que se obtiene al realizar la medición de la característica de la variable en estudio. Pueden ser cuantitativos o cualitativos. TAMAÑO DE LA MUESTRA: MUESTRA: Es la cantidad de ELEMENTOS de una muestra, y por lo general debe ser representativa de la Población. UNIDAD DE ANALISIS: ANALISIS: Es el objeto del cual se desea obtener información, muchas veces llamado también Elementos. Puede ser algo con existencia real, como un automóvil, una casa un caldero, o algo más abstracto como la Temperatura, presión o un intervalo de tiempo. VARIABLE: VARIABLE: es una característica o propiedad de interés de cada ELEMENTO, se puede medir o clasificar y cambia o varia con el tiempo. Son características que varían de individuo a individuo, de objeto a objeto, mientras que las que permanecen inalterables se llaman constantes. Generalmente las variables se designan con las letras mayúsculas del abecedario X. Y .Z. Ejemplo: La U.N.J.F.S.C., lleva a cabo un estudio para determinar la situación ocupacional de sus Egresados en la Carrera de Ingeniería Química. En este estudio se quiere identificar si son constantes o variables con las siguientes propiedades: a) Sexo ( V ) b) Ingresos Mensual ( V ) c) Profesión ( C) d) Años de Experiencia ( V ) e) Nivel jerárquico ocupacional. ( V ) Clasificación de las Variables ¿En qué consiste la clasificación de las Variables?
11
ESTADISTICA DESCRIPTIVA
Los datos deben manejarse en una investigación científica para describir los objetos de interés, son en general de naturaleza diversa. La consideración de estas diferencias es esencial para decidir el método de análisis estadístico adecuado.
Por su generalidad o nivel de Abstracción
a) Teóricas Teóricas son aquellas que necesitan definirse operacionalmente, porque sus cualidades o características no son fácilmente observables ni medibles. b) Intermedias Intermedias son aquellas que permiten especificar a las variables teóricas, con el fin de hacerlas observables y medibles. c) Empíricas Empíricas son aquellas que no necesitan definirse operacionalmente, porque sus valores se identifican en forma inmediata y son fácilmente medibles.
Por su relación causal
a) Independientes (X) (X) Son aquellas que no dependen de ninguna variable dentro de un contexto determinado. b) Dependientes (Y) Son (Y) Son aquellas que dependen de otra u otras variables dentro de un contexto determinado. c) Interviniente (Z): (Z): son aquellas que van a especificar las condiciones o requisitos para que las variables X e Y tomen sus correspondientes valores. Ejemplo: El escaso fomento de la educación alimentaria en la población, genera mayor desnutrición infantil en las familias con bajo nivel de instrucción. En este ejemplo las variables son: Educación alimentaria independiente Desnutrición dependiente
infantil
= =
X Y
12
Variable Variable
ESTADISTICA DESCRIPTIVA
Nivel de instrucción interviniente
=
Z
Variable
Por su Naturaleza:
a) Variables Cualitativas Son características o atributos que se refieren a cualidades y/o categorías que no se pueden medir ni describir numéricamente (por ejemplo afinidad religiosa, nacionalidad, color de piel, color de ojos, sexo, etc.) -
Variable Nominal: es una variable que nos permite distinguir entre clases, es decir, permite nombrar y diferenciar, además se pueden utilizar frecuencias, porcentajes, graficos y moda. Ejemplo: Estado Civil, Marca de las calculadoras , etc.
-
Variable Ordinal: En ella existe una relación de orden en el recorrido de la variables, es decir nombra, ordena, diferencia y jerarquiza, de aquí se pueden calcular frecuencias, porcentajes, graficos sectoriales y la moda. Ejemplo: Grado en las fuerzas armadas, cargos, etc
b) Variables Cuantitativas Tienen valor numérico y pueden ser medibles y contables (por ejemplo edad, precio de un producto, ingresos anuales, etc.) y se pueden clasificar en Discretas y Continuas. Variables Discretas: Discretas: solo pueden tomar valores enteros (1, 2, 3, 4, etc) Existe una unidad mínima que no puede subdividirse. Ejemplos: Paginas de un libro, número de hijos, de hermanos, cantidad de autos, etc.
Variables Continuas: Continuas: en los valores de estas variables casi siempre existen números entre 2 de ellos y pueden tomar cualquier valor real dentro de un intervalo. Ejemplo: La Temperatura, la longitud, la
13
ESTADISTICA DESCRIPTIVA
ACTIVIDADES DE APRENDIZAJE Contenido: una variable.
Población, muestra, elemento, variable, medición de
I. IDENTIFIQUE IDENTIFIQUE EN LOS SIGUIENTES SIGUIENTES CASOS CASOS UNA POBLACIÓN POBLACIÓN O UNA MUESTRA: 1- 12 % de ingresantes ingresantes (muestra)
de una universidad universidad en el año 2011. 2011.
2- Número de estudiantes egresados de una universidad en el año 2006. (población) 3- Niños menores de 5 años de una comunidad como resultado del censo de 2010.(poblacion) 2010. (poblacion) 4- Número de discapacitados que ingresaron a la universidad en el año 2005. (poblacion) 5- Se toma el 10 % de viviendas construidas en el último quinquenio. (muestra) 6- Se estudió los antecedentes de 15 choferes de 30 a 50 años de edad. (muestra) 7- Pacientes atendidos atendidos en traumatología en en el Hospital Rebagliati en el año 2012.(poblacion) 2012. (poblacion) 8- Sembríos seleccionados en un fundo con más de cinco hectáreas.(muestra) hectáreas.(muestra)
14
ESTADISTICA DESCRIPTIVA
9- Vacunos en la Selva al 30 de junio de 2005. (población) 10- Diez por ciento de niños seleccionados para un coro infantil. (muestra)
INSTRUMENTO DE RECOLECCION DE INFORMACION
Tema
Diseño Metodológico
Planteamiento del Problema
Objetivos
Marco Teórico
Hipótesis
Universo y Muestra
Recolección de Información
ESCALAS DE MEDICIÓN Son de gran importancia en un proceso de Investigación. Medir: significa “asignar números, símbolos o valores a las propiedades de objetos, personas, estados o eventos de acuerdo con reglas específicas para representar la calidad o cantidad de un atributo. En investigación hay cuatro niveles básicos de medición: a) Escala Nominal; Nominal; divide los datos en categorías, los números que se asignan a objetos o fenómenos son clasificaciones, se emplean para calcular recuentos de frecuencias , porcentajes y modas. b) Escala Ordinal; Ordinal; tiene como propósito dar orden (prioridades) a los datos de forma ascendente ascendente o descendente. Se emplean para calcular la Mediana, la Media y la Desviación Típica.
15
ESTADISTICA DESCRIPTIVA
c) Escala de Intervalos; Intervalos; son escalas que agrupan las mediciones por intervalos o rangos, donde los puntos de escala son iguales. Se emplean para calcular la media aritmética, las desviaciones estándares estándares y el coeficiente de correlación. correlación. d) Escala de Razón; Razón; es una escala similar a las escalas de intervalos, sin embargo, tienen un cero absoluto u origen. Se utilizan con variables como ingresos, volumen de producción, rentabilidad, etc. Un instrumento de medición adecuado es aquel que registra datos observables que representan verdaderamente los conceptos o las variables que el investigador tiene en mente. Requisitos que debe cumplir un instrumento de medición: Toda Medición o Instrumento de medición tiene los siguientes requisitos esenciales: -
Confiabilidad: Confiabilidad: se refiere al grado en que su aplicación repetida al mismo sujeto o objeto produce resultados iguales, consistentes y coherentes.
-
Validez: Validez: se refiere al grado en que un instrumento realmente mide aquello para lo cual esta destinado. Indica el grado con que pueden referirse conclusiones a partir de los resultados obtenidos.
Factores que afectan la confiabilidad y la validez de los instrumentos de medición -
La improvisación, consiste en creer que un instrumento
de medición medición es un un cuestionario que resulta de elaborar varias preguntas sin mucha dedicación ni revisión. -
La utilización de instrumentos desarrollados en el extranjero que no han sido validados en el respectivo contexto.
La validez y la confiabilidad no se asumen se prueban.
ACTVIDADES DE APRENDIZAJE
16
ESTADISTICA DESCRIPTIVA
I.- IDENTIFIQUE EL TIPO DE VARIABLE EN CADA UNO DE LOS SIGUIENTES CASOS: 1-
Nivel socioeconómico
variable cualitativa
2-
Estatura
variable cuantitat
3-
Regiones geográficas del Perú
variable cualitativa
4-
Porcentaje de natalidad
5-
Grado de ausentismo escolar
variable cualitativa
6-
Temperatura en grados centígrados
variable cuantitat
7-
Tasa de mortalidad infantil
variable cuantitat
8-
Ingreso per capita
9-
Porcentaje de pobreza en el Perú variable cuantitat
variable cuantitat
variable cuantitat
10- Facultades de una universidad
variable cualitat
II- DETERMINE LA ESCALA ESCALA DE MEDICIÓN SIGUIENTES CASOS:
EN CADA CADA UNO DE LOS
1234567-
Sueldo de los catedráticos
(< 5 000 y > 5 000) Escala de razón Tasa de mortalidad infantil. Escala de razón Rendimiento escolar (bajo, medio, alto) Escala ordinal Edad en años cumplidos Escala de razón Temperatura en grados Escala intervalo Ingreso familiar (alto, medio, bajo) Escala ordinal Categoría educacional (empleado, obrero, independiente) independiente) Escala ordinal
17
ESTADISTICA DESCRIPTIVA
OBTENCION y RECOLECCION DE INFORMACIÓN ¿Por qué necesitamos recolectar datos? Proporcionan la evidencia evidencia imprescindible en un estudio de investigación. Permiten medir el desempeño en el proceso de producción de un bien o servicio. Ayudan a la formulación de cursos alternativos de acción en un proceso de toma de decisiones. Satisfacen nuestra curiosidad innata La Recolección de datos consiste en obtener información sobre los atributos, cualidades, conceptos (variables) relacionados con los participantes, eventos, sucesos, casos, comunidades, objetos que participan en el proceso de Investigación.
Pasos a seguir para la recolección de datos 1.- Identificar las fuentes primarias o secundarias: Personas, archivos, expedientes, observaciones
18
ESTADISTICA DESCRIPTIVA
2.- lugar de localización de las fuentes: generalmente proviene pr oviene de la muestra. 3.- medio o métodos de recolección de los datos: Observación, Encuestas, Entrevistas, Equipos. 4.- Medio o métodos de procesamiento para dar respuesta al problema. ¿Qué tipos de datos existen? Constante , si el registro de la característica toma un sólo valor en todas las unidades elementales. Son muchos datos, pero iguales. Las constantes no son interés en Estadística, puesto que ella se ocupa del estudio de la variabilidad de los datos. Ejemplos •
•
Sexo de las pacientes en el Servicio de Ginecología Título profesional de los miembros del Colegio de Ingenieros del Perú.
Variable, si el registro de la característica toma diversos valores en las unidades elementales. Una misma característica puede generar constantes ó variables, depende del marco muestral. Ejemplo Edad, sexo y Profesión de los Egresados de la U.N.J.F.S.C Elementos a considerar en un plan de recolección de información: a) las Variables: conceptos Variables: conceptos o atributos a medir. b) las definiciones operacionales: operacionales: la forma como hemos operacionalizado las variables nos permitirán identificar el método para medirlas. c) La Muestra: número Muestra: número de unidades de análisis a medir, la cual debe ser una parte representativa de la población. d) los recursos disponibles: disponibles: tiempo, apoyo institucional, económicos, humanos, etc.
19
ESTADISTICA DESCRIPTIVA
INSTRUMENTOS DE RECOLECCIÓN DE DATOS CUANTITATIVOS Cuestionario
Encuesta
Observación
Entrevista
La Experimentación
20
ESTADISTICA DESCRIPTIVA
Existe una gran variedad de técnicas para realizar la investigación, que se deberán seleccionar de acuerdo a las necesidades del problema, asi como a diferentes factores como son el tiempo, costo, tipo de actividades a realizar, recursos humanos, etc. Las técnicas de recopilación de datos las podemos realizar con: LA INVESTIGACIÓN DOCUMENTAL. Consiste en el estudio de documentos escritos sobre un objeto determinado, es decir son todos aquellos documentos registrados en diferentes dispositivos físicos a los que podemos tener acceso en forma directa o indirecta para su consulta y se puede clasificar en :
1.- Documental bibliográfica 2.- Documental audiografica 3.- Documental hemerografica 4.- Documental videografica 5.- Documental escrita 6.- Documental iconográfica LA INVESTIGACION DE CAMPO Consiste en obtener información directa mediante diferentes actividades por contacto directo con el hecho que se quiere investigar asi como las personas relacionadas y se puede realizar: a) por observación directa. b) Por interrogación LA OBSERVACIÓN Es el procedimiento empírico básico, el cual consiste en realizar la percepción intencionada de una actividad determinada mediante la experimentación la cual consiste en la obtención de datos cuantitativos de forma directa, por medio de la medición del fenómeno u objeto de estudio que se esté observando, para luego describir y analizar
21
ESTADISTICA DESCRIPTIVA
situaciones sobre la realidad estudiada. Para realizar la observación se utilizan diversos instrumentos auxiliares los cuales son : 1.- la ficha de campo 2.- La entrevista 3.- La encuesta 4.-Estudio de actividades realizadas con anterioridad, biografías, etc Por lo general se observan características y condiciones comportamientos, características ambientales entre otros.
o
LA EXPERIMENTACIÓN Consiste en un procedimiento utilizado en la Investigación Científica para obtener información que permita conocer el comportamiento de algún proceso LA ENTREVISTA Es una de las técnicas más comunes que consiste en recoger información verbal a las interrogantes planteadas sobre el problema, y es considerada como el proceso directo de comunicación interpersonal establecida entre el investigador (entrevistador) y el objeto de estudio a través de individuos o grupos (entrevistado); con el fin de obtener testimonios reales. a) Entrevistas formales b) Entrevistas informales El investigador usa un listado de preguntas o temas a tratar, pero sigue teniendo la posibilidad posibilidad de improvisar improvisar o profundizar un tema. LA ENCUESTA La encuesta la podremos definir como “una investigación realizada sobre una muestra de sujetos representativa de un colectivo más amplio ( Población) , utilizando procedimientos estandarizados de recopilación de información como la interrogación con la intención de obtener mediciones cuantitativas de una gran variedad de características objetivas y subjetivas de la población, con el fin de
22
ESTADISTICA DESCRIPTIVA
identificar las magnitudes del problema. Los datos se recolectan mediante el uso del cuestionario a) Un cuestionario b) Una cedula de entrevista
Mediante la encuesta se obtienen datos de interés sociológico interrogando a los miembros de un colectivo o de una población EL CUESTIONARIO: Es un eficaz auxiliar en la observación científica que contiene aspectos del fenómeno esenciales, las cuales son preguntas diseñadas y formuladas por escrito para generar los datos necesarios para alcanzar los objetivos del proyecto de investigación y son contestadas por los encuestados. -
Cuestionario por correo
-
Cuestionario administrado por el entrevistado
-
Cuestionario administrado por el entrevistador
Se trata posiblemente del instrumento más utilizado para recabar información de la la unidad de análisis, objeto de estudio y/o centro del problema de investigación, nos permite obtener los datos para llenar los cuadros Estadisticos establecidos. Su preparación se efectua durante el planeamiento de la Encuesta, después de que estén definidos aquellos aspectos que son fundamentales para conseguir información objetiva y fácil de precisar. CRITERIOS BÁSICOS PARA EL DISEÑO DE UN CUESTIONARIO Antes de iniciar la elaboración del cuestionario, es necesario tener claros los objetivos y las hipótesis o preguntas de investigación que impulsan a diseñar el cuestionario. Para preparar un instrumento para recabar datos, deben examinarse los siguientes aspectos básicos.
23
ESTADISTICA DESCRIPTIVA
-
Naturaleza de la información que se busca
-
Naturaleza de la población o muestra.
-
Medio o medios de aplicación del instrumento
LA CEDULA. Tiene carácter de anónimo, donde el encuestador es quien llena la cedula de entrevista, además de que es posible aclarar la información sobre las preguntas y es utilizada cuando una persona tiene un bajo nivel cultural. Bibliográfica Hemerografica I n v e s t i g a c i ó n
Escrita Documental
Audiografica Videografica Iconográfica Dispositivo Magnético Ficha de campo Observación directa
Actividades anteriores
Campo Entrevista
Por interrogación
Entrevista
FUENTES DE INFORMACION
24
Formal Informal Cuestionario Cedula de Entrevista
ESTADISTICA DESCRIPTIVA
En un estudio o investigación estadística son básicos los datos. Atendiendo a su procedencia o generación, las llamadas fuentes de información se clasifican en:
Fuentes de Información Primaria:
Información que reúne o genera el investigador para alcanzar los objetivos del proyecto, análisis o estudio de un fenómeno
Fuentes de Información Secundaria
Recabada por empresas o agentes ajenos a la propia investigación. Suele ser información elaborada en otras investigaciones o recopilada y difundida por organismos oficiales. Investigación Documental Procedimiento para obtener datos mediante la consulta de información ya escrita y concentrada en documentos que se localicen en libros o revistas en bibliotecas, hemerotecas, o en centros virtuales. REDONDEO DE DATOS, NOTACIÓN CIENTÍFICA Y CIFRAS SIGNIFICATIVAS Redondeo el redondeo de datos es un procedimiento que consiste en escribir un número que representa a una cantidad con menos cifras de las que tiene realmente para tener una idea rápida de la cantidad. Notación Científica Es una manera de escribir en forma breve cifras muy grandes o pequeñas. La forma general es: a*10, en donde “a” es un número entre 1 y 9, “n” es un número
entero.
Ejemplo: El número 25000 se escribe 2.5 * 10 4, o el número 0.00025 se escribe como 2.5 * 10-4 .
25
ESTADISTICA DESCRIPTIVA
CIFRAS SIGNIFICATIVAS A los dígitos exactos que se utilizan para escribir una cifra, a parte de los ceros para localizar el punto decimal, se les llama cifras significativas. Ejemplos: a) 3.22 tiene 3 cifras significativas 3.22 se encuentra realmente entre 3.215 y 3.225 b) 0.0032 = 3.2*10 -3 tiene 2 cifras significativas 0.0032 se encuentra entre 0.00315 y 0.00325 c) 0.00320 = 3.20*10 -3 tiene 3 cifras significativas 0.00320 se encuentra entre las cifras 0.003195 y 0.003205
ORDEN DE DATOS La ordenación de datos es el proceso mediante el cual los datos están acomodados de tal manera que se establece un orden (ascendente o descendente) entre ellos.
Hay 2 métodos comunes:
Método de Listado en Orden.Proceso de ordenación y agrupamiento de un conjunto de datos en orden ascendente Ejemplo:
26
ESTADISTICA DESCRIPTIVA
Considera que la variable de estudio es el peso de 25 estudiantes. Los pesos se encuentran en la siguiente tabla:
Peso de 25 estudiantes ( en Kg) 40
43
48
51
49
56
44
42
55
52
52
62
44
50
59
63
50
56
55
45
57
66
63
51
58
El proceso consiste en ordenarlos de menor a mayor
Peso de los 25 estudiantes ( kg
Peso de los 25 estudiantes ( kg
40
43
48
51
49
40
42
43
44
44
56
44
42
55
52
45
48
49
50
50
52
62
44
50
59
51
51
52
52
55
63
50
56
55
45
55
56
56
57
58
57
66
63
51
58
59
62
63
63
66
Método de Tallos y Hojas Si los números de los datos están formados por 2 dígitos, se hace una columna con el primer digito (decenas) y a la derecha de cada uno de ellos se escribe, en la fila, solo el segundo dígito (unidades) de cada uno de los datos27 que tengan el mismo primer digito.
ESTADISTICA DESCRIPTIVA
Del ejemplo anterior tenemos: Datos sin ordenar 0 3 8 9 4 2 4 5 4 5
1 6 5 2 2 0 9 0 6 5 7 1 8
6
2 3 6 3
Datos Ordenados 4
0 2 3 4 4 5 8 9
5
0 0 1 1 2 2 5 5 6 6 7 8 9
6
2 3 3 6
28
ESTADISTICA DESCRIPTIVA
CAPITULO 2 2.1DISTRIBUCION 2.1DISTRIBUCION DE FRECUENCIAS 2.1 TABLA DE DISTRIBUCION DE FRECUENCIAS Constituye un cuadro de resumen de la Información, en el cual se realiza la tabulación de los datos en forma de un conteo matemático, obtenidos en un proceso de investigación, o de un objeto de Estudio. Ofrece un resumen tabular más compacto de un conjunto de datos que muestra la frecuencia ( o la cantidad) de artículos en cada una de las clases que no se superponen. Al resumir grandes cantidades de datos, es útil distribuirlos en clases o categorías y determinar el número de individuos que pertenecen a cada clase, llamado FRECUENCIA DE CLASE. Una disposición Tabular de los datos por clases junto con las correspondientes frecuencias de clase, se llama DISTRIBUCION DE FRECUENCIAS 2.1.1 PARTES DE UNA TABLA ESTADISTICA Toda tabla para su mejor identificación y visualización de la información debe tener las siguientes partes: a) Título Expresa en forma resumida la información que contiene y se coloca en la parte superior de la tabla. Debe ser breve completo y concreto, y debe contener contener lo siguiente: siguiente: -
Institución o área geográfica, del fenómeno que se está tratando.
-
El año en el cual se realiza el estudio.
b) Encabezado
29
ESTADISTICA DESCRIPTIVA
Está formado por la primera fila de la parte superior y nos indica las características ( las variables) del fenómeno fenómeno estudiado. estudiado. c) Columna Matriz Es la primera columna de la izquierda y contiene también variables del fenómeno en estudio. También se le denomina título de las filas. d) Cuerpo Es el contenido mismo de la información de la Tabla, los valores numéricos resumidos de la cantidad de datos se presenta en celdas o casillas de intersección ordenada por los títulos de las columnas y filas. e) Fuente Indica el lugar o la fuente de información de donde se procedió a la recolección de los datos presentados en la tabla, se coloca siempre en la parte inferior de la tabla. 2.1.2 ESTRUCTURA DE UNA TABLA DE DISTRIBUCION DE FRECUENCIAS CUADRO N° UNJFSC Alumnos matriculados según Facultad Agosto – 2013 Encabezado
Columna Matriz
X
f i
F i
X1
f1
f1=F1
h1=f1/N
h1=H1=F1/N
X2
f2
f1+f2=F2
h2=f2/N
h2=H2=F2/N
:
:
:
:
:
:
Xk
Fk
N
hi
H i
:
C U E R P O :
hk=fk/N
30
: :
titulo
ESTADISTICA DESCRIPTIVA
Fuente:
Registros Académicos de la UNJFSC
2.1.3 TIPOS DE FRECUENCIA EN UNA TABLA ESTADISTICA Definimos: a) Frecuencia absoluta simple (fi) : : Número de veces que se observa o repite un determinado valor en la muestra seleccionada. ∑fi = N
b) Frecuencia absoluta acumulada (Fi) : Es el número de veces fi en la muestra “N” “N” con un valor valor menor o igual al de la variable. La ultima frecuencia acumulada deberá ser igual a “N”
F1 = f1
F2 = f1 + f2
F3 = f1 + f2 + f3 F4= f1 + f2 + f3 +f4 de la misma forma para los demás valores c) Frecuencia relativa ( hi): hi) : Es el cociente entre la frecuencia absoluta y el tamaño de la muestra (N). es decir, siendo el fi para todo el conjunto i. si multiplicamos la frecuencia relativa por 100 obtendremos el porcentaje que presenta esta característica respecto al total de “N” hi = f i /N
d) Frecuencia relativa acumulada ( Hi) : Es el cociente entre la frecuencia absoluta acumulada y el número total de datos “N” H ii = F i /N
31
ESTADISTICA DESCRIPTIVA
Ejemplo de tablas Estadísticas
2.1.4 CALCULO DEL RANGO (R) Para calcular el rango de una tabla de frecuencias seleccionamos el DATO MAXIMO y el DATO MINIMO del cual hacemos una diferencia (resta) para ver la variabilidad que entre ellos existe.
2.1.5 CALCULO DEL NUMERO NUMERO DE INTERVALOS Para calcular el número de clases de una tabla de frecuencias podemos usar las siguientes expresiones:
Siendo la más utilizada la Regla de sturges
32
ESTADISTICA DESCRIPTIVA
2.1.6 CALCULO DE LA AMPLITUD O ANCHO DE CLASE (W) Para determinar la Amplitud dividimos el Rango obtenido sobre sobr e el número de intervalos. Debemos tener en cuenta que cuando los datos de la investigación se trabajan con enteros la amplitud también se aproximara a un valor entero, y si los datos fueran decimales la amplitud se aproximara a la cantidad de decimales que tengan los datos
Ejemplo: 1.- Considere los siguientes datos aleatorios. 15
7
5
10
18
20
19
14
17
10
13
20
10
11
16
7
19
12
1
4
3
16
15
13
8
5
20
7
2
6
3
9
10
13
19
SOLUCIÓN: CALCULO DEL NÚMERO DE INTERVALOS (k)
CALCULO DEL RANGO (R)
33
ESTADISTICA DESCRIPTIVA
CALCULO DE LA AMPLITUD O ANCHO DE CLASE (W)
Para un mejor resultado y mejor sencillez tomamos como k = 5.
W=4y
k = número de intervalos
Li = Límite inferior
Ls = Limite Superior
W = Ancho de Clases
Clase
Li
Marca clase -
Tabul.
Frec
Frec. Acum.
Frec. Relat.
Frec. Acum. Relat.
Ls
Xi
F
Fi
Fi
hi
Hi
1.0 - 5.0
3.0
Lllll
5
5
5/35
5/35
5.0 - 9.0
7.0
lllll ll
7
12
7/35
12/35
9.0 - 13.0
11.0
lllll ll
7
19
7/35
19/35
13.0 - 17.0
15.0
lllll lll
8
27
8/35
27/35
17.0 - 21.0
19.0
lllll lll
8
35
8/35
35/35
N=35 Ejercicio para practicar. 1.- Los valores de pH de pH , que se obtuvieron en 40 muestras de una solución salina son los siguientes: 7.32 7.35 7.39 7.35
7.34 7.32 7.29 7.34
7.40 7.33 7.32 7.33
7.28 7.36 7.34 7.36
7.29 7.32 7.30 7.33
7.35 7.34 7.34 7.35
7.33 7.31 7.32 7.31
7.34 7.35 7.30 7.26
7.28 7.36 7.33 7.39
7.31 7.26 7.33 7.35
a) Preparar una tabla de frecuencias agrupando en intervalos de igual amplitud.
34
ESTADISTICA DESCRIPTIVA
2.- Ejemplo para Variables Cualitativas Considere el gusto de las personas por las bebidas de Néctares de varios sabores. Dichos sabores están en la siguiente tabla: Piña
Naranja
Fresa
Manzana
Durazno
Fresa
Piña
Naranja
Durazno
Naranja
Naranja
Durazno
Fresa
Durazno
Manzana
Naranja
Fresa
Manzana
Piña
Fresa
Durazno
Naranja
Piña
Durazno
Naranja
Categoría
Tabul.
Frec
Frec. Relat.
Frec. Relat.
Frec. Rel %.
Xi
F
fi
Hi
Hi
hi%
Durazno
Llllll
6
6/25
0.24
24
Fresa
lllll
5
5/25
0.2
20
Manzana
Lll
3
3/25
0.12
12
Naranja
lllll ll
7
7/25
0.28
28
Piña
Llll
4
4/25
0.16
16
N= 25 Ejercicio para practicar. 1.- Considere Considere que la variable de estudio es el color de camisas de 25 estudiantes de la U.N.J.F.S.C; dichos colores son: Rojo Amarillo Rojo Amarillo Amarillo
Azul Blanco Blanco Azul Azul Blanco
Blanco Negro Celeste Blanco Celeste
Azul Celeste Blanco Rojo Negro
35
Rojo Blanco Blanco Amarillo Verde
ESTADISTICA DESCRIPTIVA
a) Preparar una tabla de frecuencias 3.- Al averiguar el grado de instrucción en una muestra de 120 pacientes que sufren de tuberculosis pulmonar que fueron atendidos durante el mes de Enero de 1992 en el Hospital Loayza, se obtuvieron los siguientes resultados: Analfabetos 38, primaria 63, secundaria 16, superior 3. Se pide: a) Ordenar la información proporcionada en un cuadro de frecuencias. b) Interpretar algunos valores de las frecuencias relativas. Solución: Solución: a)
Observamos que la variable Grado de Instrucción es una variable que por su medición pertenece a la escala ordinal. Pro lo tanto aquí no existen intervalos numéricos. Luego organizados los datos tendremos el siguiente cuadro:
Grado de
Número de
Frecuencia
Frecuencia
Instrucción
Pacientes (fi)
Relativa (hi)
Relativa % (hi%)
Analfabeto
38
0.317
31.7
Primaria
63
0.525
52.5
Secundaria
16
0.133
13.3
Superior
03
0.025
02.5
TOTAL
120
1.000
100.00
36
ESTADISTICA DESCRIPTIVA
Nota: Nota: Las frecuencias relativas fueron calculadas utilizando la fórmula: hi
f i
N
Para este caso: hi
h2
38
120
63
120
0.525
0.133
0.025
16
h3
h4
120
03 120
0.317
El hi (%) se ha obtenido multiplicando por 100 cada frecuencia relativa simple. b) Interpretación h1= 31.7% : El 31.7% de los pacientes atendidos con tuberculosis pulmonar, son analfabetos. H2= 52.5%. El 52.5% de los pacientes atendidos con tuberculosis pulmonar, tienen instrucción primaria.
37
ESTADISTICA DESCRIPTIVA
1)
Un investigador social desea determinar en la comunidad “X”, el
número de horas semanales que dedican los niños menores de 6 años de edad, a ver televisión. Una muestra de 25 niños, arrojó los siguientes resultados (en número de horas semanales). 10
19
25
19
26
16
19
27
27
25
23
22
17
12
20
15
21
23
26
14
18
25
23
24
21
Se pide: a) Ordenar la información en una tabla de distribución de frecuencias. b) Interpretar algunos valores de las frecuencias halladas. Solución: Solución: a)
Para ordenar la información, utilizaremos la Regla de Sturges. Cálculo del Rango: Rango: R = Xmax – Xmin R = 27 – 10 = 17 Calculo del Número de Clases: Clases : K = 1 + 3.3 Log. N. K = 1 + 3.3 Log. 25
K = 1 + 4.62 = 5.62
Necesariamente
=6
38
se de redondear al entero. entero. K
ESTADISTICA DESCRIPTIVA
Amplitud del intervalo: intervalo: W
R
K
W
17
6
2.83
3
Redondearemos al entero porque la información hora semanales está en números enteros. Formación de intervalos y frecuencias: frecuencias : i
Ii
f i
Fi
hi
Hi
hi (%)
Hi (%)
1
10-12
2
2
0.08
0.08
08
08
2
13-15
2
4
0.08
0.16
08
16
3
16-18
3
7
0.12
0.28
12
28
4
19-21
6
13
0.24
0.52
24
52
5
22-24
5
18
0.20
0.72
20
72
6
25-27
7
25
0.28
1.00
28
100
f i =
hi =
hi =
25
1.00
100
f 6 = 7 : 7 de los 25 niños, ven televisión entre 25 y 27 horas/semanales, o sea, el 28% de los niños está la mayor cantidad de tiempo viendo televisión. f 2= 2
: 2 niños, que equivale al 8%, ven televisión entre 10 y
12 horas/semanales.
39
ESTADISTICA DESCRIPTIVA
H4= 52%
: El 52% de los niños de esa Comunidad, ve televisión
entre 10 y 21 horas/semanales. 2.2 GRAFICOS ESTADISTICOS la información contenida en las tablas de frecuencias resulta más accesible y fácil de interpretar si se representan por medio de gráficos estadísticos. Estos son representaciones visuales que emplean símbolos, barras, polígonos y sectores, de los datos contenidos en tablas de frecuencias. que expresan el comportamiento de una variable en estudio, así como también la comparación visual del comportamiento de 2 o más variables similares o relacionadas. Un gráfico estadístico está compuesto por las siguientes partes: Numeración de Numeración de los Graficos Título: Título: Aquí se señala la población en estudio y la Variable Diagrama: Diagrama: dado por el propio dibujo el cual representa el comportamiento de los datos. Escalas y/0 leyendas: leyendas : son indicadores donde se precisa la correspondencia entre los elementos del gráfico y la naturaleza de las medidas representadas. Fuente: Fuente: aquí se señala de donde se obtuvo la información que permitió obtener el grafico
Podemos usar el programa de Excel para hacerlos
40
ESTADISTICA DESCRIPTIVA
Entre los gráficos más utilizados podemos destacar: 2.2.1 GRAFICOS DE BARRAS Expresa el comportamiento de una variable cualitativa, se representa por un conjunto de rectángulos separados convenientemente, por un ancho apropiado y tiene como altura a su respectiva frecuencia.
GRAFICO N° UNJFSC Alumnos matriculados según Facultad Agosto – 2013
D I A G R A M A
Adm. Adm.
Educa Educac. c.
CC.SS CC.SS
Titulo
Gráficos de barras simples
In en en..
Fuente: Registros Académicos de la UNJFSC
2.2.2 GRAFICOS DE BARRAS COMPUESTAS. Es utilizado para expresar comparación entre 2 variables cualitativas, proviniene de una tabla de doble entrada.
41
ESTADISTICA DESCRIPTIVA
Leyenda
2.2.3 GRAFICO DE BASTONES Expresa el comportamiento de una variable cuantitativa discreta. Consiste en dibujar un rectángulo por cada uno de los valores de la variable ( xi ), de modo que las bases sean todas iguales, y la altura de cada rectángulo puede ser la frecuencia absoluta f i o la frecuencia relativa
hi
2.2.4 HISTOGRAMA DE FRECUENCIAS Son análogos a los diagramas de barras o columnas pero para variables cuantitativas continuas
42
ESTADISTICA DESCRIPTIVA
Consisten en rectángulos cuyas bases son cada uno de los intervalos y la altura es la frecuencia absoluta correspondiente a dicho intervalo.
2.2.5 POLIGONO DE FRECUENCIAS Es una línea poligonal que une los vértices superiores de las barras de un diagrama de barras, o los puntos medios de las bases superiores de los rectángulos de un histograma.
2.2.6 OJIVAS Es la representación gráfica del polígono de las frecuencias acumuladas mediante un gráfico de línea. En ella se permite ver cuantas
43
ESTADISTICA DESCRIPTIVA
observaciones se encuentran por encima o por debajo de ciertos valores, en lugar de exhibir los números asignados a cada intervalo.
105 90 75 60 45 30 15 5
10
15
20
25
30
DIAGRAMA DE SECTORES Consiste en dividir un circulo en tantos sectores como valores de la variable. La Amplitud de cada sector debe ser proporcional a la frecuencia del valor correspondiente.
PICTOGRAMAS Los pictogramas son gráficos similares a los gráficos de barras, pero empleando un dibujo en una determinada escala para expresar la unidad de medida de los datos. Generalmente este dibujo debe
44
ESTADISTICA DESCRIPTIVA
cortarse para representar los datos. Se usan para lograr el interés masivo del público.
GRAFICO DE LINEAS En este tipo de gráfico se representan los valores de los datos en dos ejes cartesianos ortogonales entre sí. Se pueden usar para representar una serie o más series de tiempo.
EJERCICIOS: 1.- Las temperaturas recogidas en un determinada ciudad durante el mes de Enero se muestran en la siguiente tabla:
45
ESTADISTICA DESCRIPTIVA
Temperatura °C N° de días
19
20
21
22
23
24
7
9
6
4
3
2
a) ¿Cuántos días hizo por encima de 21ºC? ¿Cuántos por debajo de 23ºC?¿Cuántos días hizo la temperatura máxima? b) Hacer el gráfico respectivo
SOLUCION a) Temperatura por encima de 21°C fueron : días
4+3+2 = 9
b) Temperatura por debajo de 23°C fueron : 26 dias
7+9+6+4 =
c) Grafico
10 8 6 4 2 19
20
21
22
23
24
2.- De una población de estudiantes del Instituto de Educación Superior ” VENCEDORES VENCEDORES” se selecc iona iona una muestra muestra aleatoria de 20 estudiantes y se anota sus pesos en el distrito de Huacho el 15 de Agosto del 2013 y se ha obtenido los siguientes resultados, en Kg:
46
ESTADISTICA DESCRIPTIVA
PESOS EN KG.
FRECUENCIAS fi
Fi
hi
Hi
hi%
Hi%
46-54
6
6
0,3
0,3
30
30
54-62
10
16
0.5
0,8
50
80
62-70
2
18
0.1
0,9
10
90
70-78
2
20
0,1
1,0
10
100
TOTAL
20
1,0
100
Se pide: a)
Interpretar las siguientes frecuencias: f2,h3%,F4, H2%
b)
Hacer un histograma de frecuencias
SOLUCIÓN: a)
Interpretación:
f2= 10 estudiantes de la I.E Superior “VENCEDORES”, comprendido entre 54 y 62 kg
tienen un peso
h3% = el 10% de los estudiantes de la I.E Superior tienen un peso comprendido entre 62 y 70 kg
“VENCEDORES”
F4 = 20 estudiantes de la I.E Superior “VENCEDORES” ; tienen un peso comprendido entre 46 y 78 kg H2% = 80% del total de estudiantes de la I.E Superior “VENCEDORES”, tienen un peso comprendido entre 46 a 61 kg b)
Graficos fi
47
ESTADISTICA DESCRIPTIVA
10 8 6 4 2 46
54
62
70
78 Peso en Kg
3.- Construya Construya una tabla de frecuencia del siguiente gráfico, sobre las edades de 16 personas que trabajan en la empresa hotelera “las Gardenias” , e interprete algunas frecuencias
SOLUCIÓN: FRECUENCIAS EDADES 20 - 24
Fi
Fi 6
hi 6
Hi
0,375
48
0,375
hi% 37.5
Hi% 37.5
ESTADISTICA DESCRIPTIVA
24 - 28
5
11
0.3125
0,6875
31.25
68.75
28 - 32
3
14
0.1875
0,875
18.75
87.5
32 - 36
2
16
0,125
1,0
12.5
100
TOTAL
16
1,0
100
f1= 6 personas que trabajan en la Empresa Hotelera Las Gardenias tiene edades comprendidas entre 20 a 24 años H3%= el 87.5% del total de personas que trabajan en la Empresa Hotelera Las Gardenias tienen edades comprendidas entre 20 y 32 años. 4.- Del siguiente grafico realizar: Número de artículos producidos en la Empresa QUIMPAC (en miles)
6
5
a) Construya una Tabla de Frecuencias
4
b) Hacer un gráfico de barras completo y un gráfico circular
3
2
Lu
Ma
Mi
Ju
Vi
Día
Cuadro N° ….. “Empresa QUIMPAC”
N° de artículos producidos Agosto 2013
49
ESTADISTICA DESCRIPTIVA
Días de la semana
FRECUENCIAS ni
N i
hi
H i
hi %
H i %
Lunes
3
3
0,15
0.15
15
15
Martes
5
8
0.25
0.40
25
40
Miércoles
4
12
0.20
0.60
20
60
Jueves
2
14
0.10 0. 10
0.70 0 .70
10
70
Viernes
6
20
0.30
1.00
30
100
TOTAL
20
FUENTE: Almacén de la Empresa QUIMPAC GRAFICO N°..
50
ESTADISTICA DESCRIPTIVA
5.- En una caja hay 10 bolitas marcadas con los números del 1 al 4 En la siguiente tabla se muestra la distribución de frecuencias de cada uno de los números. Realizar su grafico iv
¿Cómo se resuelve?
51
ESTADISTICA DESCRIPTIVA
SOLUCIÓN: Bolitas numeradas
FRECUENCIAS ni
N i
hi
H i
hi %
H i %
1
3
3
0,30
0.30
30
30
2
1
4
0.10
0.40
10
40
3
1
5
0.10
0.50
10
50
4
5
10
0.50
1.00
50
100
TOTAL
10
6.- Supongamos que la distribución de las edades de 80 alumnos de la Facultad de Ciencias de la U.N.J.F.S.C. es dado por: I i
[ 5 - 18> [18 - 21> [21 - 24> [24 - 27> [27 - 30] TOTAL
f i
5
F i
hi
H i
0,5875 0,925
80
----
52
0,0375 1
ESTADISTICA DESCRIPTIVA
Se pide: a) Completar la tabla de frecuencias b) Interpretar las siguientes frecuencias: f2, F4, h2%, H4%. c) Hallar el número de alumnos que presenten edades comprendidas entre 18 y 26 años SOLUCIÓN: a) Completamos la Tabla: I i
[ 5 - 18> [18 - 21> [21 - 24> [24 - 27> [27 - 30] TOTAL
f i
5 47 22 3 3 80
F i
5 52 74 77 80 ----
hi
0,0625 0,5875 0,275 0,0375 0,0375 1
H i
0,0625 0,650 0,925 0,9625 1
b) Interpretación: f2= 47 Alumnos de la Facultas de Ciencias de la U.N.J.F.S.C, tienen edades comprendidas entre 18 y 21años F4= 77 Alumnos de la Facultad de Ciencias de la U.N.J.F.S.C presentan edades comprendidas entre 5 a 27 años de edad h2% = el 58.75% de los alumnos de la Facultad de Ciencias de la U.N.J.F.S.C; tienen edades comprendidas entre 18 a 21 años H4% = el 96.250% del total de los alumnos de la Facultad de Ciencias de la U.N.J.F.S.C, tienen edades comprendidas entre 5 a 27 años de edad. c) El número de alumnos que presentan edades comprendidas entre 18 y 26 años es : 47 + 22 + 3 = 72 alumnos.
7.- La figura muestra el consumo de gas de una familia en todos los meses del año pasado. De acuerdo al gráfico responde lo siguiente:
53
ESTADISTICA DESCRIPTIVA
I) la mayor variación mensual en el consumo, se produjo cuales meses? II) en mayo no hubo consumo? III) el mayor consumo se produjo en?
SOLUCIÓN: I.- La mayor variación mensual en el consumo se produjo durante los meses de FEBRERO A MARZO. II.- En MAYO, si hubo un consumo y fue constante desde ABRIL A JUNIO III.- El mayor consumo se produjo durante JULIO A AGOSTO EJERCICIOS PROPUESTOS 1.- Las calificaciones obtenidas por los 32 alumnos de una clase de 3º de ESO en una prueba de Matemáticas vienen dadas por la siguiente tabla:
a) b) c) d) e)
Nota
4
6
8
10 12 14 16 18 20
Alumnos
1
2
4
5
4
6
5
Elabora la tabla de frecuencias completa. ¿Qué porcentaje de alumnos aprueba la materia? ¿Qué porcentaje obtiene más de 8 puntos? Dibuja un diagrama de frecuencias relativas. Dibuja un polígono de frecuencia acumuladas.
54
4
1
ESTADISTICA DESCRIPTIVA
2.- El gráfico circular de la figura muestra las preferencias de 30 alumnos en actividades deportivas. ¿Cuál(es) de las siguientes afirmaciones es (son) correcta(s) ? -
La frecuencia relativa del grupo de fútbol es de 40%. La frecuencia relativa del grupo de básquetbol es de 30%. La mitad del grupo no prefirió fútbol ni tenis.
Construye la tabla de frecuencias correspondiente
3.- La distribución del gasto en alimentación de una familia viene dada por los siguientes porcentajes: carne, 26 %; pescado, 14 %; pastas y cereales, 14 %; patatas y hortalizas, 8 %; frutas, 9 %, y otros 29 %. Construye un diagrama de sectores. 4.- Los valores de pH , que se obtuvieron en 40 muestras de una solución salina son los siguientes: 7.32 7.35 7.39 7.35
7.34 7.32 7.29 7.34
7.40 7.33 7.32 7.33
7.28 7.36 7.34 7.36
7.29 7.32 7.30 7.33
7.35 7.34 7.34 7.35
7.33 7.31 7.32 7.31
7.34 7.35 7.30 7.26
7.28 7.36 7.33 7.39
7.31 7.26 7.33 7.35
a) Preparar una tabla de frecuencias agrupando en intervalos de igual amplitud. b)
Construir todos los gráficos necesarios para el caso.
5.- Los resultados de un test de inteligencia hecho a 30 personas se han registrado en la siguiente tabla de frecuencias por intervalos. Construye un histograma con las frecuencias porcentuales de los datos propuestos:
55
ESTADISTICA DESCRIPTIVA
Li - Ls
Xi
f i
64
- 73
4
74
- 83
5
84
- 93
6
94
- 103
6
104 - 113
5
114 - 123
4
Fi
hi
Hi
hi%
Hi%
N= 6.- A partir de la siguiente gráfica estadística de gustos deportivos: 6 5 4 3 2 1 0 at let is mo
c ic lis mo
balonc es t o
nat ac ión
a) Calcular la tabla de frecuencias. b) ¿A qué porcentaje de las personas no le gusta el ciclismo? 7.- Los datos siguientes representan la temperatura del fluido de descarga de una planta para el tratamiento de aguas negras durante varios días consecutivos. 43 44
47 49
51 46
48 51
52 49
50 45
46 44
49 50
45 48
52 50
46 49
a) Calcular la distribución de frecuencias de los datos. b) Hacer los gráficos correspondientes
56
51 50
55 51
ESTADISTICA DESCRIPTIVA
8.- Dadas las siguientes notas de Estadística correspondientes a 30 alumnos: 10 9 15
13 7 13
12 8 2
10 14 12
15 13 19
16 10 8
14 14 12
13 9 20
12 10 14
9 11 15
a) Calcula la distribución de frecuencias, determina el porcentaje de suspendidos y el porcentaje de alumnos con nota entre 10 y 15 ambos inclusive. b) ¿Qué nota mínima hay que sacar para superar al 90% de los alumnos? 9.- Consideremos una muestra de 200 familias en las que contamos el número de hijos. Supongamos que se han observado 50 familias sin hijos, 80 familias con 1 hijo, 40 familias con 2 hijos, 20 familias familias con 3 hijos y 10 familias con 4 hijos. Construir una distribucion de frecuencias, asi como también sus Graficos. 10.- Con la finalidad de conocer el comportamiento de algunas variables químicas del suelo y las correspondientes del sedimento provocado por el proceso de erosión hídrica, se analizaron las pérdidas de suelo por escurrimiento de 20 muestras de suelo. Los valores de 3 pérdida de agua (cm ) de cada muestra son: 52;
47;
51;
28;
64;
31;
22;
53;
29;
23,
24;
56;
34,
21;
55;
32;
24;
65;
29;
35
11.-Construir una distribucion de frecuencias, asi como también sus Graficos. Las calificaciones obtenidas por 90 alumnos del Curso de Estadística Aplicada a la Ingeniería han sido las siguientes: 3
4
6
8
7
5
3
2
5
9
7
2
9
7
8
10
8
4
1
0
3
3
1
6
0
2
3
9
2
6
1
6
5
10
5
8
4
2
4
4
2
7
1
1
4
8
7
0
3
3
8
2
4
6
57
ESTADISTICA DESCRIPTIVA
1
3
6
5
1
4
2
4
5
5
7
5
8
6
2
1
4
2
7
6
5
3
4
2
6
3
2
5
9
4
3
0
1
2
4
1
a) Se pide construir la tabla de frecuencias b) Representar el histograma de frecuencias relativas y el diagrama de sectores
MEDIDAS DE RESUMEN
58
ESTADISTICA DESCRIPTIVA
Hasta el momento se ha estudiado los cuadros y gráficos como formas para ordenar, describir y reducir un conjunto de datos, sin embargo el análisis es aun incompleto, por lo que se hace necesario que los datos de la tabla se resuman aún mas, para facilitar el análisis e interpretación de la información, utilizando ciertos indicadores llamados MEDIDAS DE RESUMEN O ESTADIGRAFOS, el cual permite hallar un solo valor numérico, el mismo que representa a toda la población. Estas medidas o estadígrafos importantes son: De Tendencia Central Central ( media aritmética, armónica, geométrica, mediana, moda, etc) De Posición los deciles, cuartiles y percentiles De dispersión Rango, desviación media, típica ,etc
CAPITULO 3 3.1 DESARROLLO DE LOS DISTINTOS APARTADOS 3.1 MEDIDAS DE TENDENCIA CENTRAL Estadígrafos que resumen la información en un solo valor numérico e indican el centro de un conjunto de datos. -
Distribución por datos no agrupados es cuando se especifican
todos y cada uno de los valores de la variable.
59
ESTADISTICA DESCRIPTIVA
-
Distribución por datos agrupados los valores de la variable se
miden en intervalos.
3.1.1 MEDIA ARITMETICA Es el valor resultante que se obtiene al dividir la sumatoria de un conjunto de datos sobre el nº total de datos. Solo es aplicable para el tratamiento de datos cuantitativos Media aritmética para datos no agrupados
Media aritmética para datos agrupados Para poder calcular la media, se supondrá que dentro de cada categoría, las observaciones se distribuyen uniformemente dentro alrededor del punto medio de la clase la clase,,
Ejemplo de Media Aritmética de datos No Agrupados 1.- Supóngase que se determinó que a 22°C una pipeta de 5,00 ml, después de pesar por 6 ocasiones, su volumen vertido, generó los siguientes pesos aparentes de agua en gramos: 4,996 4,993 4,994 4,997 4,998 4,992
60
ESTADISTICA DESCRIPTIVA
Ejemplo de Media Aritmética de datos Agrupados 2.- La distribución siguiente corresponde a las lecturas con un contador Geiger del número de partículas emitidas por una sustancia radiactiva en 100 intervalos sucesivos de 40 segundos. N° partículas 5 - 10 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40
Fi 1 10 37 36 13 2 1 N=
Determinar la Media Aritmética SOLUCIÓN: N° partículas 5 - 10 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40
Xi fi 7.5 1 12.5 10 17.5 37 22.5 36 27.5 13 32.5 2 37.5 1 100
Xifi 7.5 125 647.5 810 357.5 65 37.5 2050
La media aritmética es:
Interpretación: El número promedio de partículas es 20.5
3.1.2 MEDIANA.
Es el estadígrafo que representa el punto medio de los datos, en el cual cae el 50% de las observaciones, es decir que separa a la serie de datos ordenados (en forma creciente o decreciente), en 2 partes de igual número de datos. Mediana para datos no agrupados: se debe ordenar los datos, y tener en cuenta si la cantidad de datos son pares o impares. Ejemplo:
61
ESTADISTICA DESCRIPTIVA
Supóngase que se determinó que a 22°C una pipeta de 5,00 ml, después de pesar por 6 ocasiones, su volumen vertido, generó los siguientes pesos aparentes de agua en gramos: Calcular la Mediana:
Si fuera impar 4,992 4,993 4,994 4,996 4,997 Me= 4.994
Ahora si fuera par 4,992 4,993 4,994 4,996 4,997 4,998 Me = X3 + X4 = 4.994 + 4.996 = 4.995 2 2
Mediana para datos agrupados Del ejemplo anterior sobre la distribución correspondiente a las lecturas con un contador Geiger del número de partículas emitidas por una sustancia radiactiva en 100 intervalos sucesivos de 40 segundos. Se pide determinar la mediana.
K 1 2 3 4 5 6 7
N° partículas 5 10 15 20 25 30 35
-
Fi
Fi
10 1 15 10 20 37 25 36 30 13 35 2 40 1 N= 100
62
1 11 48 84 97 99 100
ESTADISTICA DESCRIPTIVA
3.1.3 MODO O MODA Es un estadígrafo que nos indica el valor o cualidad que se presenta con Mayor frecuencia dentro de una variable. Se halla de acuerdo a: Moda para datos no agrupados.Supóngase que se determinó que a 22°C una pipeta de 5,00 ml, después de pesar por 6 ocasiones, su volumen vertido, generó los siguientes pesos aparentes de agua en gramos: 4,992 4,993 4,994 4,994 4,997 4,998 Calcular la moda. SOLUCION:
Mo = 4,994
( valor que es más frecuente)
Moda para datos agrupados Del ejercicio anterior para datos agrupados tenemos: K 1 2 3 4 5 6 7
N° partículas 5 10 15 20 25 30 35
-
10 15 20 25 30 35 40
Fi
Fi
1 10 37 36 13 2 1
63
1 11 48 84 97 99 100
ESTADISTICA DESCRIPTIVA
La moda se halla mediante las siguientes fórmulas:
3.1.4 MEDIA GEOMETRICA Es un estadístico que permite promediar proporciones, índices y tasas de crecimiento, que varían con el tiempo. Se obtiene ob tiene de acuerdo a: Media Geométrica para datos no agrupados Es la raíz de índice “n” del producto continuado de los “n” datos, es
decir:
Xn = Valor de los datos n = número de datos. EJEMPLO Supóngase que se determinó que a 22°C una pipeta de 5,00 ml, después de pesar por 5 ocasiones, su volumen vertido, generó los siguientes pesos aparentes de agua en gramos 4,992 4,993 4,994 4,996 4,997 SOLUCIÓN
Media Geométrica para datos agrupados: Ejemplo
64
ESTADISTICA DESCRIPTIVA
La distribución siguiente corresponde a las lecturas con un contador Geiger del número de partículas emitidas por una sustancia radiactiva en 100 intervalos sucesivos de 40 segundos: SOLUCIÓN K 1 2 3 4 5 6 7
N° partículas
Xi
5 10 15 20 25 30 35
7.5 12.5 17.5 22.5 27.5 32.5 37.5
-
10 15 20 25 30 35 40
fi 1 10 37 36 13 2 1 n= 100
log Xi
fi*logXi
0.875 1.097 1.243 1.352 1.439 1.512 1.574
0.875 10.97 45.991 48.672 18.707 3.024 1.574 129.813
3.1.5 MEDIA ARMONICA Media armónica para datos no agrupados: agrupados : La media armónica se denominada H, de una cantidad finita de números es igual al recíproco, al recíproco, o o inverso, de la media la media aritmética de los recíprocos de dichos números. Así, dados los números a1 ,a2 , .an, la media armónica será igual a:
Ejemplo:
65
ESTADISTICA DESCRIPTIVA
Supóngase que se determinó que a 22°C una pipeta de 5,00 ml, después de pesar por 5 ocasiones, su volumen vertido, generó los siguientes pesos aparentes de agua en gramos 4,992 4,993 4,994 4,996 4,997
Media armónica para datos agrupados: agrupados :
Se aplica para obtener promedios de un conjunto de valores expresados en forma de tasas de unidades de otro tipo.
Ejemplo: La distribución siguiente corresponde a las lecturas con un contador Geiger del número de partículas emitidas por una sustancia radiactiva en 100 intervalos sucesivos de 40 segundos K 1 2 3 4 5 6 7
N° partículas
Xi
5 10 15 20 25 30 35
7.5 12.5 17.5 22.5 27.5 32.5 37.5
-
10 15 20 25 30 35 40
Fi
log Xi
1 10 37 36 13 2 1
66
fi*logXi
ESTADISTICA DESCRIPTIVA
N= 100 2.- en el diario el Peruano , el 18 de Agosto del 2013 , se publicó una tabla estadística que hacia referencia a los sueldos mínimos de los peruanos en el 2012 y es como se detalla a continuación: Nivel de los Salarios: Año Anual, BRUTO ANUAL. Remuneración En soles 6600 8600 10600 12600 14600 16600 18600 20600
-
N° de Trabajad en %
8600 10600 12600 14600 16600 18600 20600 22600
12.9 37.5 25.7 11.4 5.4 2.8 2.5 0.9
Fuente: INEI - el Peruano
a) ¿Qué variables es la que se está presentando en la tabla? b) ¿Qué tipo de variable es? c) Construya la tabla de frecuencia, teniendo en cuenta que en el 2012, había 7,6 millones de personas trabajando. d) calcule las marcas de clase e) Represente el cuadro en un histograma de frecuencias. f) Qué número de trabajadores tiene una Remuneración superior a 16600. g) Calcule la media mediana y la moda
aritmética,
la
SOLUCION.Remuneración en Soles
Xi
N° Trabaj (fi)
Fi
hi
%hi
Xihi
6,600
- 8600
7600
980400
980400
0.129
12.9
980.4
8600
- 10600
9600
2850000
3830400
0.375
37.5
3600
10600 - 12600
11600
1953200
0.257
0.257
25.7
2981.2
12600 - 14600
13600
866400
0.114
0.114
11.4
1550.4
14600 - 16600
15600
410400
0.054
0.054
5.4
842.4
16600 - 18600
17600
212800
0.028
0.028
2.8
492.8
67
ESTADISTICA DESCRIPTIVA
18600 - 20600
19600
190000
0.025
0.025
2.5
490
20600 - 22600
21600
68400
0.009
0.009
0.9
194.4
n=7´600,000 a) b) c) d)
La variable que se esta presentando es : LOS SUELDOS Es un tipo de Variable Cuantitativo Construcción de la Tabla de frecuencias: Marcas de clase ( Xi) : están representadas en la tabla. Cálculos de las frecuencias absolutas simples hi= fi/n
fi=hi*n
f 1= 12.9*7´600,000 = 98,040 f 2= 37.5*7´600,000 = 2850000 f 3= 25.7*7´600,000 = 1953200 f 4= 11.4*7´600,000 = 866400 f 5= 5.4 *7´600,000 = 410400 f 6= 2.8 *7´600,000 = 212800 f 7= 2.5 *7´600,000 = 190000 f 8= 0.9 *7´600 *7´600 000 = 68400 68400
e)
Gráfico de histograma de frecuencias
68
ESTADISTICA DESCRIPTIVA
f) El número de trabajadores que tiene una remuneración superior a 16600 es: 68400 +212800 + 190000 = 471200 g)
La media aritmética será: X= ∑ Xihi = 11131.6
3.2 MEDIDAS DE POSICIÓN Se define como la posición x.. a un valor de la variable por debajo del cual se encuentra una frecuencia acumulada β
69
ESTADISTICA DESCRIPTIVA
Estadígrafos que dividen un conjunto de datos ordenados en grupos con el mismo número de observaciones, etc Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor. Casos particulares son los percentiles, cuartiles, deciles 3.2.1. CUARTILES son los 3 valores que dividen a un conjunto de datos ordenados en 4 partes iguales. Q1, Q2 y Q3 determinan los valores correspondientes correspondientes al 25%, al 50% y al 75% de los datos. Q2 coincide con la mediana. -
Ordenamos los datos de menor a mayor. Buscamos el lugar que ocupa cada cuartil, mediante la expresión: Donde
Determinar los cuartiles para el n° de hijos de los trabajadores de la Empresa Alicorp, cuyos datos son: 3; 5; 3; 6; 7; 9; 4 3, 3, 4, 5,6, 7, 9 Q1
Q2
Q3
1, 2 , 3, 4 , 5, 6 , 7, 9 2.5
4.5
Q1
Q2
Número impar
Numero par
6.5 Q3
Calculo de los CUARTILES para datos agrupados En primer lugar buscamos la clase donde se encuentra
70
ESTADISTICA DESCRIPTIVA
i = 1, 2, 3 Según se trate de hallar el primer, segundo o tercer cuartil 3.2.2 DECILES. son los 9 valores que dividen la serie de datos en diez partes iguales. Los deciles dan los valores correspondientes al 10, 20, 30 ,,,,,,90% de las observaciones. D5 coincide con la mediana. Determinar los deciles para el n° de hijos de los trabajadores de la Empresa Alicorp, cuyos datos son: 2; 5; 3; 6; 7;4; 9
2, X1
3, X1
3, X2
3, X2
4, X3
4, X3
4, X4
5, X4
6, X5
6, X5
7, X6
7, X6
8, X7
N
9 X7
9 X8
Número impar
Numero par
Calculo de los DECILES para datos agrupados : Se busca la clase:
71
ESTADISTICA DESCRIPTIVA
i = 1,2,3,…9
Según se trate de hallar el primer, segundo o noveno decil 3.2.3 PERCENTILES. son los 99 valores que dividen la serie de datos en 100 partes iguales. dan los valores correspondientes al 1,2,3,4,…..y al 99% de las
observaciones. P50 coincide con la mediana
2, X1
3,
4,
X2
X3
4, X4
6, X5
7, X6
8, X7
9 Numero par X8 X8
Calculo de PERCENTILES para datos agrupados Se busca la clase
i =1,2,3,4…..99
,…99 i = 1,2,3 ,…99
Según se trate de hallar el primer, segundo o noventainueveavo percentil
EJERCICIO RESUELTO Dada la siguiente distribución estadística Li - Ls
0 - 5 3
5 - 10 5
10 – 15 7
72
15 – 20 8
20 - 25 2
25 - 30 6
ESTADISTICA DESCRIPTIVA
Calcular: La media y la moda Cuartil 1 y cuartil 3 SOLUCIÓN K 1 2 3 4 5 6
N° partículas
Xi
0 5 10 15 20 25
2.5 3 7.5 5 12.5 7 17.5 8 22.5 2 27.5 6 n=31
-
5 10 15 20 25 30
Fi
Fi 3 8 15 23 25 31
La moda es:
La mediana es:
Los cuartiles serán:
3.3 MEDIDAS DE DISPERSION Este tipo de medida muestra la variabilidad de una distribución de observaciones. Las medidas de tendencia central tienen como objetivo el resumir o sintetizar los datos con un solo valor representativo, mientras que las
73
ESTADISTICA DESCRIPTIVA
medidas de dispersión nos dicen o nos dan una idea hasta que punto las medidas centrales son representativas como síntesis de la información. Las medidas de dispersión, cuantifican la separación, indicando el mayor o menor alejamiento de los valores de la distribución respecto al valor central, es decir si estos valores se encuentran + o concentrados o + o - dispersos. A mayor dispersión menor representatividad. 3.3.1 RANGO: a) para datos no agrupados Es la amplitud de los valores de la muestra, es decir la diferencia entre el valor mayor yel menor de la variable. R = Xmax - Xmin Ejemplo : contenido de residuos sólidos en ppm, analizados en una muestra: 2.8 , 2.9 , 3.0 , 3.0 , 3.3 R = 3.3 – 2-8 = 0.5
b) para datos agrupados es la diferencia entre el limite superior de la ultima clase y el limite inferior de la 1era clase, es decir: R = Lsup – L inf
Ejemplo: a continuación se presentan las notas de estadística de los alumnos de la escuela de ingeniería:
74
ESTADISTICA DESCRIPTIVA
Notas
fi
Fi
R = 20 – 0 = 20
0 – 4
5
5
4 – 8
10
15
8 – 12
20
35
12 – 16
10
45
16 - 20
5
50
el rango es un estadígrafo de cálculo fácil, pero de uso limitado ya que no considera a todas las observaciones, si no solo a los datos mínimos y máximos. Por lo tanto, esta fuertemente influenciado por los datos extremos. nota:
n= 50 3.3.2 RECORRIDO SEMI INTERCUARTÍLICO Para datos no agrupados Es agrupados Es la diferencia entre el tercer cuartil y el primer cuartil. RI = Q3 – Q1 Notas
Xi
fi
Fi
0 – 4
2
5
5
4 – 8
6
10
15
8 – 12
10
20
35
12 – 16
14
10
45
16 - 20
18
5
50
RI = 13 – 7 = 6
n= 50 3.3.3 DESVIACION MEDIA ( D M) a).- Para datos no agrupados agrupados Es un promedio de la suma de las desviaciones en valor absoluto de cada observación con respecto a la media aritmética. Se expresan de la siguiente manera: Calcular la DM del contenido de residuos sólidos en ppm analizados en una muestra: 2.8 , 2.9 , 3.0 , 3.0 , 3.3 75
ESTADISTICA DESCRIPTIVA
b).- Para datos Agrupados Es el promedio promedio de la suma de las desviaciones desviaciones en valor absoluto de la diferencia entre cada valor de la variable (marca de clase) y la media aritmética multiplicado por su frecuencia respectiva y dividido por el número de datos.
Notas
Xi
Fi
Fi
Xifi
|Xi-X|
|Xi-X|fi
0 – 4
2
5
5
10
8
40
4 – 8
6
10
15
60
4
40
8 – 12
10
20
35
200
0
0
12 – 16
14
10
45
140
4
40
16 - 20
18
5
50
90
8
40
n= 50
3.3.4 VARIANZA Es el promedio de la suma de los cuadrados de las desviaciones de la variable respecto a la media aritmética.
a) Para datos no agrupados
76
ESTADISTICA DESCRIPTIVA
Siempre es positiva (por estar al cuadrado). Como la varianza es siempre positiva, a mayor varianza mayor será la dispersión 2
Calcular la S del contenido de residuos sólidos en ppm analizados en una muestra: 2.8 , 2.9 , 3.0 , 3.0 , 3.3
b) Para datos agrupados. Se calcula como la sumatoria de los cuadrados de las desviaciones de la variable respecto a su media aritmética multiplicada por su frecuencia respectiva. Notas
Xi
fi
Fi
2
Xifi
(Xi-X)
2
(Xi-X) fi
0 – 4
2
5
5
10
64
320
4 – 8
6
10
15
60
16
160
8 – 12
10
20
35
200
0
0
12 – 16
14
10
45
140
16
160
16 - 20
18
5
50
90
64
320
n= 50
960
3.3.5 DESVIACION ESTANDAR O TIPICA La deviación típica es la raíz cuadrada de la varianza.
77
ESTADISTICA DESCRIPTIVA
a) Para datos no agrupados
Calcular la S del contenido de residuos sólidos en ppm analizados en una muestra: 2.8 , 2.9 , 3.0 , 3.0 , 3.3
b) Para datos agrupados. Es la raíz cuadrada del promedio de la suma de las desviaciones de cada marca de clase de la variable con respecto a su media aritmética multiplicada por su frecuencia respectiva.
3.3.6 COEFICIENTE DE VARIABILIDAD Es el cociente de la desviación estándar y la media aritmética, expresado en porcentaje, es decir:
Nota: el coeficiente de variabilidad, es un indicador de la dispersión relativa de los datos, y la unidad de medida esta expresada en porcentaje. Es muy útil cuando se compara dos o mas distribuciones. Las unidades de medida pueden ser pesos en Kg o en edad en años, etc.
78
ESTADISTICA DESCRIPTIVA
Para datos no agrupados Calcular el CV del CV del contenido de residuos sólidos en ppm analizados en una muestra: 2.8 , 2.9 , 3.0 , 3.0 , 3.3 Siendo la media = 3 y la desviación = 0.19 Luego el coeficiente de variabilidad será:
Para datos agrupados Notas
Xi
fi
Fi
Xifi
2
(Xi-X)
2
(Xi-X) fi
0 – 4
2
5
5
10
64
320
4 – 8
6
10
15
60
16
160
8 – 12
10
20
35
200
0
0
12 – 16
14
10
45
140
16
160
16 - 20
18
5
50
90
64
320
n= 50
960
4.- Los salarios por hora de los obreros de dos empresas A y B, son los que se dan en la siguiente tabla: Salarios
Emp.
Emp.
A
B
Determinar: (a) El salario medio de cada una de las empresas 79 (b) El salario más frecuente de cada una de las empresas
ESTADISTICA DESCRIPTIVA
[550,750)
10
7
[750,1050)
32
20
[1050,1550)
57
37
[1550,2550)
54
78
SOLUCIÓN Salarios
Xi
Empresa A (fi)
Xifi
(Xi – X)2fi
[550,750)
650
10
6500
6218269
[750,1050)
900
32
28800
9281500
[1050,1550)
1300
57
74100
1094336
[1550,2550)
2050
54
110700
20188379
n = 153
220100
a) El salario medio de la Empresa A es:
b) El salario más frecuente de la Empresa A es:
c) Coeficiente de variación
80
36782484
ESTADISTICA DESCRIPTIVA
Salarios
Xi
Empresa A (fi)
Xifi
(Xi – X)2fi
[550,750)
650
7
4550
7050350
[750,1050)
900
20
18000
11357958
[1050,1550)
1300
37
48100
4625958
[1550,2550)
2050
78
159900
12256989
n= 142
230550
a) El salario medio de la empresa B es:
b) El salario mas frecuente de la empresa B es:
c) Coeficiente de variación
La Empresa B tiene mayor homogeneidad salarial. EJERCICIOS DE APRENDIZAJE
81
35291255
ESTADISTICA DESCRIPTIVA
Para los ejercicios propuestos determinar: La media, mediana, moda, media geométrica y media armónica. 1.- a continuación se da 25 mediciones del punto ebullición de un compuesto de silicio ( en grados Celsius ) 166 141 136 153 170 162 155 146 183 157 148 132 160 150 145 134 145 147 148 158 164 165 168 170 172 SOLUCION Calculo del Rango
Calculo del Número de Intervalos
Calculo de la Amplitud
K
1
132 - 139
136.5
3
3
0.12
0.12
0.021
2.135
6.405
409.5
2
139 - 146
145.5
3
6
0.12
0.24
0.021
2.162
6.486
436.5
3
146
153
154.5
6
12
0.24
0.48
0.039
2.188
13.128
927
4
153 - 160
163.5
4
16
0.16
0.64
0.025
2.213
8.852
654
5
160 - 167
172.5
5
21
0.20
0.84
0.029
2.236
11.18
862.5
6
167 - 173
181.5
4
25
0.16
1
0.022
2.258
9.032
726
–
0.157
Media aritmética :
82
55.
ESTADISTICA DESCRIPTIVA
Mediana
Moda
MEDIDAS DE FORMA ASIMETRIA
83
ESTADISTICA DESCRIPTIVA
Se refiere a si la curva que forman los valores de la serie presenta la misma forma a la izquierda y derecha de un valor central ( promedio aritmético) Miden el grado de deformación horizontal de la distribución de frecuencias y se definen como:
COEFICIENTE DE ASIMETRIA Para medir el nivel de asimetría utilizamos el COEFICIENTE DE ASIMETRIA, que viene dado dado por:
Coeficiente de Asimetría De Pearson
Coeficiente de Asimetría De Fisher los resultados obtenidos pueden ser los siguientes: As = 0 la distribución es simétrica; existe la misma concentración de valores a la derecha y a la izquierda de la media As > 0 la distribución es asimétrica positiva; existe mayor concentración de valores a la derecha de la media que a su derecha. As < 0 la distribución es asimétrica negativa; existe mayor concentración de valores a la izquierda de la media que a su derecha. COEFICIENTE DE KURTOSIS (k)
84
ESTADISTICA DESCRIPTIVA
Mide el grado de deformación vertical que presentan los valores de la distribución de frecuencias alrededor de la zona central de la distribución y se define como:
Los resultados del coeficiente de Curtosis se interpretan:
k = 0; la distribución es Mesocúrtica: Al igual que en la asimetría es bastante difícil encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen aceptar los valores cercanos (± 0.5 aprox.). k > 0; la distribución es Leptocúrtica k < 0; la distribución es Platicúrtica Cuando la distribución de los datos cuenta con : un coeficiente de asimetría (As = ±0.5) y un coeficiente de Curtosis de (k = ±0.5),Se le denomina Curva Normal. Este criterio es de suma importancia ya que para la mayoría de los procedimientos de la estadística de inferencia se requiere que los datos se distribuyan normalmente
Ejemplo 1.- Se ha aplicado un test a los e mpleados de la “Empresa Los Sauces” obteniéndose la siguiente tabla:
Li- Ls
38-44
44-50
50-56
56-62
85
62-68
68-74
74-80
ESTADISTICA DESCRIPTIVA
Fi
7
8
15
25
18
9
6
Dibujar la Ojiva de frecuencias acumuladas, asi como la asimetría y Curtosis SOLUCIÓN Li – Ls 38-44 44-50 50-56 56-62 62-68 68-74 74-80
Xi 41 47 53 59 65 71 77
Fi 7 8 15 25 18 9 6
3 4 Xifi (X-X)2fi (X-X) fi (X-X) fi 287 2302.5 -41758.9 757354.0 376 1178.3 -14300.6 173557.9 795 564.8 -3466.0 21268.4 1475 0.5 -0.1 0.00864 1170 618.9 3628.9 21278.5 639 1266.7 15027.8 178284.6 462 1914.7 34202.7 610985.3 88 5204 7846.4 -6666.10 1762728.6
As=-0.09 k= -0.54
ACTIVIDAD DE APRENDIZAJE Nº 04 1.- Los siguientes datos representan una muestra de 8 instituciones educativas de la UGEL. Z, según su número de trabajadores (entre docentes, administrativos y personal de servicio). 30; 72; 40; 35; 26;
86
ESTADISTICA DESCRIPTIVA
50; 64 y 18 se pide: Calcular e interpretar media aritmética, mediana y moda. N=8 (muestra) Datos del # de trabajadores: trabaj adores: 30, 72, 40, 35, 26, 50, 64,18. Media Aritmética:
Mediana (ordenar) 18, 26, 30 ,35 ,40 ,50 ,64 ,72 Me= 35+40
Me=37.5 =38 trabaj
Moda: (Amodal) no hay moda 2.- En un supermercado trabajan 35 mujeres con un salario promedio de S/500.00 y 15 hombres que en promedio ganan un 30% más que las mujeres ¿Cuál es el salario promedio de los empleados de dicho supermercado? Solucion: M=35 mujeres H= 15 hombres
87
ESTADISTICA DESCRIPTIVA
3.- Teniendo en cuenta las tablas de distribución de frecuencias 1 y 2 de esta guía, calcular e interpretar media aritmética, mediana y moda. Además para cada caso, presentar e interpretar la relación entre las medidas calculadas, utilizando la curva de Gauss. TABLA Nº 01 Nº Asignaturas Desaprobados
Nº Estudiantes
Xi
f i
0
Fi
Xi f i
4
4
0
1
8
12
8
2
7
19
14
3
5
24
15
4
6
30
24
Total
N=30
61
(+) Mo
( curva asimétrica positiva)
Media Aritmética
88
ESTADISTICA DESCRIPTIVA
Interpretación: El promedio por asignaturas desaprobadas por los los estudiantes estudiantes es de 2. Mediana
Me= 2 asignaturas Interpretación: El 50 % de los estudiantes de la institución educativa X tiene como máximo 2 asignaturas desaprobadas, muestra que el otro 50% supera dichas asignaturas desaprobadas. Moda Mo (mayor frecuencia) Mo = 1 asignatura. Interpretación: Las asignaturas desaprobadas por los estudiantes mas frecuentes es de 1.
TABLA Nº 02 Peso en Kg
Nº
89
ESTADISTICA DESCRIPTIVA
estudiantes
Fi
Xi
Xif i
f i [40-48>
6
6
44
264
[48-56>
10
16
52
520
[56-64>
16
32
60
960
[64-72>
11
43
68
748
[72-80>
5
48
76
380
[80-88>
4
52
84
336
[88-96]
1
53
92
92
N=53
3300
(+)
Mo
Mediana
90
ESTADISTICA DESCRIPTIVA
Moda
4.- Como gerente de ventas de IBM, usted desea calcular las medidas de tendencia central para los niveles de utilidad de dicha firma durante los últimos nueve meses, ya que las siguientes utilidades están dadas en miles de dólares. X i: 21.6; 22.3; -3.4; 21.6; 18.9; -12.8; 23.1; 22.3. Se pide: Calcular la media, mediana y moda e interpretar. Media: X= 21.6 + 22.3 + (-3.4) (-3.4) + 21.6 + 18.9 + (-12.8) + 23.1 + 22.3 9 X= 14.6 dólares. Interpretación: El promedio de las utilidades durante los 9 meses es de 14.6 dólares. Mediana
91
ESTADISTICA DESCRIPTIVA
(ordenar) -12.8 ; -3.4 ; 17.9; 18.9; 21.6; 21.6; 22.3; 22.3; 23.1 (impar) Me=21.6 dólares Interpretación: El 50% de las utilidades es como máximo 21.6 dólares, el otro 50% supera dichas cantidad. Moda: es Bimodal (2 moda) Mo=21.6 ; Mo=22.3
92
ESTADISTICA DESCRIPTIVA
ACTIVIDAD DE APRENDIZAJE Nº 05 1.- Los datos siguientes representan una muestra de 7 docentes de la institución Educativa X, según sus años de servicios: 10; 4;
6; 12;
8 ; 15 y 5
Se pide calcular e interpretar cuarteles de 1 y 3, deciles 5 y 8, percentil 15. Muestra: 7 docentes antes de servicio. 4 ; 5 ; 6 ; 8 ; 10 ; 12 ; 15,….
Calcular:
▼
▼
▼
▼
▼
x1
x2
x3
x4
x5
▼
x6
▼
N= 7
x7
Q1 ; Q3 ; D5 ; D8 ; P15
SOLUCION
Ubicación del lugar :
Interpretación: El 25 % de los docentes tienen como máximo 5 años de servicio, mientras que el 15% superan esa cantidad y tienen mas de 5 años de servicio Ubicación del lugar:
93
ESTADISTICA DESCRIPTIVA
Interpretación: El 75 % de los docentes tienen como máximo 12años de servicio mientras que el 25 % supera esa cantidad , y tienen mas de 12 años de servicio. Ubicación del lugar:
Interpretación: El 50% 50% de los docentes tienen como máximo 8 años de servicio, mientras que el 50 % supera supera esa cantidad y tienen mas de 8 años de servicio. Ubicación del lugar :
Interpretación: El 80 % de los docentes tienen como máximo …..Años de servicio, mientras que el…… supera esa cantidad y tienen mas de…. Años de
servicio.
De la siguiente tabla, calcular e interpretar cuartel 3,decil 6 y percentil 50
94
ESTADISTICA DESCRIPTIVA
TABLA Nº 01 Nº Asignaturas desaprobadas X1
Nº de estudiantes f 1
F1
0
4
4
1
8
12
2
7
19
3
5
24
4
6
30
total
N=30
Cuartil 3 Q3 ¬> 3 x 30 = 90 = 22,5 4 4 Q3 = 3 ASIGNATURAS DESAPROBADAS. Decil 6 D6 = 6 x 30 = 18 ¬> D6 = 2 asignaturas desaprobadas. 10 Percentil 60 P60 = 60 x 30 = 18 ¬> P60 = 2 asignaturas desaprobadas. 100 De la siguiente tabla , calcular e interpretar cuartiles 2 y 3 deciles 4 y 9, percentiles 40 y 75.
95
ESTADISTICA DESCRIPTIVA
TABLA Nº 03
Calificación L.I - L.S
Nº estad. (f i)
Fi
0 - 3
1
1
3 - 6
4
5
6- 9
9
14
9 - 12
3
17
12 - 15
18
34
15 - 18
12
46
18 - 21
4
50 N = 50
96
ESTADISTICA DESCRIPTIVA
D4 => 4 x 50 = 20 10
D4= 12 +(20-17) 3
D4= 12.53
17
D9 => 9 x 50 = 45 10
D9= 15 +(45-34) 3
D9= 17.15
12
P40 => 40 x 50 = 20 100
P40= 12 +(20-17) 3
P40= 12.53
17
P75 => 75 x 50 = 37.5 100
P75= 15 +(37.5-34) 3
P75= 15,875
12
97
ESTADISTICA DESCRIPTIVA
BIBLIOGRAFIA
HINES William W./MONGOMERY, DOUGLAS C. PROBABILIDAD Y ESTADISTICA PARA INGENIEROS Y ADMINISTRACION 1era edición. DOUGLAS A. LIND WILLIAM G. MARCHAL, SAMUEL A. WATHEN , Estadística Aplicada a los negocios y a la Economía 12ª edición, 2005 MURRAY R. SPIEGEL, LARRY J. STEPHENS, Estadistica Schaum, 4ta Edicion 2009 ÁVILA ACOSTA, Estadística Aplicada a las las Ciencias, Edición 2006. 2006. MONTGOMERY Y RUNGER , Probabilidad y Estadistica , Aplicación ala ingeniería 2da edición 2004. CÓRDOVA ZAMORA, MANUEL; Estadistica Descriptiva e Inferencial, Editorial Moshera 5ta edición 2003 ROBERT JOHNSON, PATRICIA HUBY, Estadística Elemental, lo esencial , Editorial THOMSON 2da Edición 1998 CELESTINO GARCIA ORE, Estadística Descriptiva y Probabilidades 2da Edicion,1999 MOYA C. RUFINO, Estadística Descriptiva editorial San Marcos 2da Edición, 1998 DEVORE, JAY L. Probabilidad y Estadística para Ingeniería y Ciencias. 4ta Edición Internacional Thomson Publishing 1998.
98