Pági na 1 d e 92
UNIVERSIDAD NACIONAL JOSÉ FAUSTINO SÁNCHEZ CARRIÓN Facultad de Ingeniería Industrial, Sistemas e Informática
MOISES E. ARMAS 2012-II
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 2 d e 92
PRESENTACIÓN
La presente publicación, tiene por objeto hacer llegar un material de lectura complementaria del desarrollo del curso de Estadística y Probabilidades, impartida a los alumnos de la escuela académico profesional de ingeniería informática, para el presente semestre. Este documento contiene una serie de ejemplos y problemas planteados, del temario de lo que semana a semana se irá desarrollando durante el presente semestre; para ello los alumnos, una vez desarrollada la clase, podrán dedicarse a revisar los ejemplos guías, o simplemente tratar de resolver los ejercicios propuestos. Es importante que este proceso se vaya desarrollando conforme a los avances de los temarios, ya que por lo general, se observa que los alumnos prácticamente posponen su revisión y estudio, recién hasta instantes previos a la evaluación, situación no agradable, puesto que si no se ha podido aprender durante un proceso, será difícil hacerlo en breves instantes, salvo que los alumnos cuenten con una capacidad excepcional de aprendizaje e inteligencia. La estadística es una ciencia, parte de la matemática aplicada, que se encarga de procesar los datos capturados mediante una serie de técnicas, producto de observaciones desarrolladas en diferentes campos del conocimiento humano; para procesarlos se utilizan una serie de herramientas de análisis, partiendo primero de su ordenamiento, agrupamiento, tabulación y presentación presentación gráfica; teniendo esto, pueden desarrollarse interpretaciones interpretaciones preliminares del fenómeno observado; si se desea profundizar aún más, se utilizará los diferentes indicadores que permitirán poder extraer conclusiones generales de lo que se está observando; con estas conclusiones podrán adoptarse las mejores decisiones. Siendo parte de la matemática, como requisito básico es necesario tener conocimiento del álgebra elemental, los que se aprenden en la formación secundaria, un poco de aritmética y también un poco del cálculo diferencial e integral, que los alumnos al llevar este curso, prácticamente están demostrando que cumplieron con los prerrequisitos que la materia los exige. El posterior aprendizaje del curso, dependerá del interés y voluntad del alumno, por querer seguir adelante; así como no se puede aprender a nadar solo viendo como los otros nadan, tampoco el curso se puede aprender mirando o escuchando; es preciso que los alumnos, por lo menos, en esta primera pr imera etapa, se compenetren con la resolución de la mayor cantidad de ejercicios propuestos; un posterior dominio del curso, significará investigar y leer las diferentes publicaciones al respecto, existentes en nuestro medio. Hoy en día la ciencia de la estadística, abarca todo el conocimiento del saber humano; no es posible concebir una investigación, si no se hace estadística y no se entiende los términos utilizados, los tediosos cálculos desarrollados para obtener la información adecuada, pueden ser simplificadas utilizando las diferentes herramientas de cálculo, como las calculadoras simples o el uso de diversos software estadísticos; pero para ello es preciso conocer la terminología que solo en el desarrollo del curso se irá aprendiendo; el software proporciona los resultados, sin márgenes de error y para interpretarlo, debe contarse con los lo s conocimientos teóricos. El desarrollo de las clases, y el complemento con esta presente, entrega, se estará contribuyendo a lograr esta meta.
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 2 d e 92
PRESENTACIÓN
La presente publicación, tiene por objeto hacer llegar un material de lectura complementaria del desarrollo del curso de Estadística y Probabilidades, impartida a los alumnos de la escuela académico profesional de ingeniería informática, para el presente semestre. Este documento contiene una serie de ejemplos y problemas planteados, del temario de lo que semana a semana se irá desarrollando durante el presente semestre; para ello los alumnos, una vez desarrollada la clase, podrán dedicarse a revisar los ejemplos guías, o simplemente tratar de resolver los ejercicios propuestos. Es importante que este proceso se vaya desarrollando conforme a los avances de los temarios, ya que por lo general, se observa que los alumnos prácticamente posponen su revisión y estudio, recién hasta instantes previos a la evaluación, situación no agradable, puesto que si no se ha podido aprender durante un proceso, será difícil hacerlo en breves instantes, salvo que los alumnos cuenten con una capacidad excepcional de aprendizaje e inteligencia. La estadística es una ciencia, parte de la matemática aplicada, que se encarga de procesar los datos capturados mediante una serie de técnicas, producto de observaciones desarrolladas en diferentes campos del conocimiento humano; para procesarlos se utilizan una serie de herramientas de análisis, partiendo primero de su ordenamiento, agrupamiento, tabulación y presentación presentación gráfica; teniendo esto, pueden desarrollarse interpretaciones interpretaciones preliminares del fenómeno observado; si se desea profundizar aún más, se utilizará los diferentes indicadores que permitirán poder extraer conclusiones generales de lo que se está observando; con estas conclusiones podrán adoptarse las mejores decisiones. Siendo parte de la matemática, como requisito básico es necesario tener conocimiento del álgebra elemental, los que se aprenden en la formación secundaria, un poco de aritmética y también un poco del cálculo diferencial e integral, que los alumnos al llevar este curso, prácticamente están demostrando que cumplieron con los prerrequisitos que la materia los exige. El posterior aprendizaje del curso, dependerá del interés y voluntad del alumno, por querer seguir adelante; así como no se puede aprender a nadar solo viendo como los otros nadan, tampoco el curso se puede aprender mirando o escuchando; es preciso que los alumnos, por lo menos, en esta primera pr imera etapa, se compenetren con la resolución de la mayor cantidad de ejercicios propuestos; un posterior dominio del curso, significará investigar y leer las diferentes publicaciones al respecto, existentes en nuestro medio. Hoy en día la ciencia de la estadística, abarca todo el conocimiento del saber humano; no es posible concebir una investigación, si no se hace estadística y no se entiende los términos utilizados, los tediosos cálculos desarrollados para obtener la información adecuada, pueden ser simplificadas utilizando las diferentes herramientas de cálculo, como las calculadoras simples o el uso de diversos software estadísticos; pero para ello es preciso conocer la terminología que solo en el desarrollo del curso se irá aprendiendo; el software proporciona los resultados, sin márgenes de error y para interpretarlo, debe contarse con los lo s conocimientos teóricos. El desarrollo de las clases, y el complemento con esta presente, entrega, se estará contribuyendo a lograr esta meta.
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 3 d e 92
INDICE
Presentación Silabo del curso Temario del trabajo de investigación Primera Semana: Conceptos básicos de la estadística Iniciación del proceso de la estadística Población y muestra Selección de muestras Tipo de datos Escala de medida de los datos Segunda semana Distribuciones Distribuc iones de frecuencia Distribución Distribuc ión simétrica Distribución Distribuc ión asimétrica positivo Distribución Distribuc ión asimétrica negativo Tercera semana: Medidas semana: Medidas de tendencia central Diagrama de caja Cuarta semana: Medidas semana: Medidas de variación Curtosis Relación entre el promedio, la mediana y la media Quinta y sexta semana: Cálculo semana: Cálculo de probabilidades Experimentos Eventos Noción de probabilidad Eventos complementarios Ley de la suma de probabilidades Probabilidad condicional Multiplicación Multiplicac ión de probabilidades Eventos independientes Séptima semana: Distribuciones semana: Distribuciones de probabilidades empíricas Novena semana: Distribución semana: Distribución de probabilidad binomial Décima semana: Distribución de probabilidad de Poisson Décimo primera semana Distribución Distribuc ión de probabilidad normal Características Característi cas de una distribución distribuci ón normal Distribución Distribuc ión de probabilidad normal estandarizada Décimo segunda semana: Distribución Distribuci ón de medias muestrales Décimo tercera semana: Proporciones semana: Proporciones poblacionales Décimo cuarta y quinta semana: Distribución semana: Distribución de medias muestrales Muestras pequeñas Diferencia de medias muestrales Distribuciones Distribuc iones chi cuadrado y F Anexo 1
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Pág 2 4 8 13 13 15 16 16 17 29 30 31 35 38 38 43 43 43 47 47 47 47 48 48 48 48 48 54 59 64 70 70 71 72 78 81 84 84 86 89 92
Prof. Moisés E. Armas
Pági na 4 d e 92
UNIVERSIDAD NACIONAL JOSÉ FAUSTINO SÁNCHEZ CARRIÓN
Facultad de Ingeniería Industrial, Sistemas e Informática Escuela Académico Profesional de Informática SÍLABO ASIGNATURA: ESTADÍSTICA Y PROBABILIDADES I.
II.
DATOS GENERALES 1.1. Código de la Asignatura 1.2. Escuela Académico Profesional 1.3. Departamento Académico 1.4. Ciclo 1.5. Créditos 1.6. Plan de Estudios 1.7. Condición: Obligatorio o Electivo 1.8. Horas Semanales
: 33-04-254 : INFORMÁTICA : INGENIERÍA INDUSTRIAL : IV : 04 : 04 : OBLIGATORIO : T
1.9. Pre-requisito 1.10. Semestre Académico 1.11. Docente Colegiatura Correo Electrónico
: COMPLEMENTO DE MATEMATICA : 2012-II : ARMAS INGA, Moisés Emilio : CIP 19771 :
[email protected]
3
P
2
L
0
SUMILLA (Por Objetivos)
Recopilación y procesamiento de datos. Distribuciones de Frecuencias.- Medidas de Tendencia Central y de Dispersión.- Cálculo de Probabilidades.- Distribuciones de probabilidad empíricas. Distribuciones de probabilidad: Binomial – Poisson – Normal – t_student – Chicuadrado - F. III.
METODOLOGIA DE ENSEÑANZA 3.1 Objetivos Al finalizar el dictado del curso, el alumno será capaz de plantear y resolver diferentes problemas relacionados con la recopilación y procesamiento de datos, explicando su comportamiento, dentro de los diferentes modelos de probabilidad. 3.2 Estrategias Metodológicas Se emplea el método expositivo y participativo de los alumnos; para ello se les proporcionará oportunamente los materiales didácticos para ser analizados y discutidos en grupos; de igual manera, los alumnos deberán desarrollar un trabajo de investigación de campo, entre grupos de a lo más de cuatro alumnos, la participación de los alumnos en las exposiciones y trabajos preliminares de campo serán tomados en cuenta para la respectiva evaluación. 3.3. Medios y Materiales de enseñanza
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 5 d e 92
Pizarra acrílica, Tablas estadísticas, Laptop, Software Estadístico, Proyector multimedia y Bibliografía complementaria IV.
CONTENIDO TEMÁTICO Y CRONOGRAMA PRIMERA SEMANA: Nociones básicas de Estadística. Métodos de recopilación de datos. Tipos de datos. Variables. Población y muestra. Ordenamiento de datos. Representaciones gráficas de datos. Uso del SPSS. Objetivo: El alumno aprenderá a recolectar y diferenciar datos de acuerdo a su naturaleza para ser procesado mediante procedimientos técnicos apropiados. SEGUNDA SEMANA: Distribuciones de frecuencias. Histogramas y Polígonos de frecuencia. Frecuencia acumulada. Ojivas. Objetivo: El alumno aprenderá a construir histogramas y ojivas de los datos cuantitativos y procesarlos para obtener informaciones. Actividad: Conformación de grupos de investigación, de a lo más de cuatro alumnos, para desarrollar trabajos de investigación relacionados con las materias de los cursos enseñados, los cuales les serán indicados en clase. TERCERA SEMANA: Medidas de Tendencia Central: Media aritmética, media ponderada, mediana y moda para datos dispersos y agrupados. Cuartiles. Deciles. Percentiles. Objetivo: El alumno aprenderá a identificar y utilizar las medidas representativas de las muestras y las poblaciones. CUARTA SEMANA: Medidas de Variabilidad: Dispersión de datos, amplitud, desviación media; desviación cuartílica Varianza y desviación estándar; coeficiente de dispersión. Objetivo: El alumno aprenderá a calcular y utilizar adecuadamente una medida de variabilidad de los datos. Primera práctica calificada: TEMA. Todo lo tratado hasta la tercera semana de clases.
UNIDAD TEMÁTICA II . TEORÍA DE PROBABILIDADES QUINTA SEMANA: Experimento estadístico. Espacios muestrales y eventos. Permutaciones y combinaciones. Enfoques de la probabilidad. Objetivo: El alumno aprenderá a construir espacios muestrales y hacer estimaciones en base a cálculo de probabilidades. SEXTA SEMANA: Axiomas de probabilidad. Suma y multiplicación de probabilidades. Probabilidad condicional. Objetivo: El alumno será capaz de resolver diversos cálculos de probabilidades basados en observaciones reales y en conceptos teóricos. SÉPTIMA SEMANA: Distribuciones de probabilidades de variables aleatorias discretas ( vad) y variables aleatorias continuas (vac ). Valor esperado y varianza, reglas generales. Objetivo: El alumno será capaz de formular modelos de distribuciones de probabilidad de vad y vac de acuerdo a situaciones observadas. Segunda práctica calificada: TEMA. Lo tratado entre la cuarta y sexta semana.
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 6 d e 92
OCTAVA SEMANA: PRIMER EXAMEN PARCIAL NOVENA SEMANA: Distribuciones de probabilidad teóricas: Bernoulli. Binomial, Poisson. Valor esperado y varianza. Objetivo: El alumno será capaz de formular y resolver modelos de distribuciones teóricas de probabilidad de variables aleatorias discretas teóricas. DÉCIMA SEMANA: Aproximación de la Binomial a la Poisson. La Distribución Normal. Propiedades de la distribución normal. Objetivo: El alumno será capaz de aproximar una Binomal a la Poisson; así mismo, será capaz de comprender que situaciones observadas pueden ser aproximadas a una distribución normal.. UNIDAD TEMÁTICA III . DISTRIBUCIÓN NORMAL DECIMO PRIMERA SEMANA: Distribución Normal Estándar; cálculos con tablas de distribución normal estandarizada. Teorema del Límite Central. Aproximación de la Binomial a la Normal. Objetivo: El alumno será capaz de resolver problemas de probabilidades aplicando las distribuciones normales. DECIMO SEGUNDA SEMANA: Muestreo Estadístico. Distribuciones de las Medias Muestrales. Error estándar.
Objetivo: El alumno será capaz de resolver problemas con distribuciones normales, con sus respectivas muestras.. Tercera práctica calificada . TEMA, Lo tratado entre la novena y décimo primera semana.
DÉCIMO TERCERA SEMANA Distribuciones de medias Poblacionales para muestras pequeñas. Distribución t :
Objetivo: El alumno aprenderá a procesar datos con muestras pequeñas. DECIMO CUARTA SEMANA: Proporciones Poblacionales. Distribución de Proporciones Poblacionales. Diferencia de medias poblacionales.
Objetivo: El alumno aprenderá a procesar proporciones muestrales de poblaciones con distribuciones normales. DÉCIMO QUINTA SEMANA: Distribución Chi Cuadrado y Distribución F. Objetivo: El alumno aprenderá a procesar otros tipos de distribuciones de muestreo. Cuarta Práctica calificada: Presentación y exposición de los trabajos de investigación desarrollado por los alumnos.
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 7 d e 92
DÉCIMO SEXTA SEMANA: SEGUNDO EXAMEN PARCIAL V.
METODOLOGÍA DE EVALUACIÓN (de acuerdo al Capítulo X del Reglamento Académico). Criterios a evaluar: Cumplimiento de los exámenes y prácticas programadas, pulcritud y responsabilidad en los trabajos encomendados. Condiciones de Evaluación:
VI.
En caso que los alumnos no cumplan con las respectivas evaluaciones programadas serán calificadas con la nota Cero. Se tomará un examen sustitutorio a quienes tengan un promedio general acumulado no menor de 07; la nota promocional NP no excederá a la nota 12 ( doce). Normas de Evaluación : Se tomarán dos exámenes parciales EP1 y EP2, siendo el primero cancelatorio. El examen sustitutorio reemplaza a la nota más baja de cualquiera de éstos dos exámenes parciales. Se tomarán cuatro prácticas calificadas, P1, P2, P3, P4, cuyo promedio, PP, constituye parte final de la nota de práctica del curso. La cuarta práctica calificada P4, consistirá en la presentación y exposición del trabajo de investigación, por el grupo conformante. Los alumnos, que tengan nota promocional acumulada mayor o igual a 07, podrán dar un examen sustitutorio; en este caso la nota promocional no será mayor de doce. La nota promocional NP se determinará de la siguiente manera: NP = 0,35*EP1 + 0,35*EP2 + 0,30*PP, donde NP deberá ser mayor o igual de 10,5 para aprobar el curso.
BIBLIOGRAFÍA BÁSICA Y COMPLEMENTARIA
Armas M. E. [2012]; Guía de Prácticas de Estadística y Probabilidades , UNJFSC. Devore, Jay L. [1998]; Probabilidad y Estadística para Ingeniería y Ciencias , Ed. Thomson, México. Hines William, Montgomery Douglas , [2002]; Probabilidad y Estadística para Ingenieros; Ed.CECSA, México. Martínez Bencardino Ciro; [2005]; Estadística y Muestreo; Ecoe Ediciones Ltda. Colombia. Meyer, Paul; Probabilidad y Aplicaciones Estadísticas. Morris de Groot; Probabilidad y Aplicaciones Estadísticas. Nieves Hurtado, A., y Domínguez Sánchez, Federico G ., [2010]; Probabilidad y Estadística para Ingeniería, Un enfoque moderno; Ed. Mac Graw Hill, México. Navidi William, [2006]; Estadística para Científicos e Ingenieros; Mc Graw Hill, México. Sheldon Ross M, [2000]; Probabilidad y Estadística para Ingenieros; Mc Graw Hill, México. Walpole Ronald E., Myers Raymond H., y Myers Sharon L ., [2007]; Probabilidad y Estadística, Octava Ed., Prentice Hall, México. Weimer, Richard; [2006]; Estadística, Ed. CECSA, México. Huacho, setiembre de 2012 Moisés Emilio Armas Inga.
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 8 d e 92
Trabajo de Investigación del curso de ESTADÍSTICA Y PROBABILIDADES ciclo 2012-II Los alumnos del curso de Estadística y Probabilidades deberán desarrollar un trabajo de investigación relacionado con la temática del curso, en grupos conformados a lo más de cuatro alumnos. La problemática del problema se plantea a continuación: En estos últimos años, sobre todo en nuestra patria, la tendencia por el uso de los teléfonos móviles (celulares) ha tenido un crecimiento exponencial, existiendo prácticamente un celular por persona; sin embargo, también se ha observado que estos celulares prácticamente se renuevan en promedio cada tres años, reemplazándole por nuevos equipos de última generación, como los Iphone, los Smartphone, etc.; entonces se trata de hacer una investigación en este campo, para poder conocer el comportamiento y actitud de las personas a la adaptación e importancia de este nuevo equipo en la vida cotidiana de cada una de los usuarios; en este sentido, puntualmente se trata de averiguar:
¿Quiénes son los usuarios de los celulares? Número de celulares con los que cuenta. Empresa a la que pertenece la línea. ¿A qué grupos de edades pertenecen? ¿Qué género? ¿Estado civil? ¿Grado de instrucción? Sistema de pago: Pre pago o post pago. Promedio de gastos mensuales en estos equipos. ¿Cada cuánto tiempo renuevan su equipo? ¿Cuál es la tendencia hacia las nuevas tecnologías? Iphone, Tablets, Smartphone, etc. Lugar donde residen: Zona residencial, pueblo joven, zona rural, etc.
Para procesar estos datos, los alumnos previamente seleccionarán muestras aleatorias, mediante las técnicas enseñadas, motivo por el cual, podrán utilizar, una entrevista, una encuesta, o cualquier otro medio, explicado también en clase, de preferencia en los lugares donde residen. Una vez recopilado los datos, el grupo conformante podrá abocarse al desarrollo de cualquiera de los temarios: A) Análisis de los datos capturados mediante una tabla de distribuciones de frecuencia, los cuales implicarán hacer cálculos y análisis de sus medidas de tendencia central y medidas de variación. B) Construcción de modelos de distribuciones de probabilidad, discretas o continuas, según como se van relacionado la información registrada. C) Aplicaciones de la distribución normal y distribución t, a los datos registrados.
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 9 d e 92
A fin de orientarles un diseño de un formulario de encuestas, en el caso de querer desarrollar una encuesta, en el Anexo 1, se muestra un modelo de ello, el cual deberá ser tomado como un punto de referencia para sus investigaciones. El trabajo desarrollado por el grupo deberá ser plasmado en un documento monográfico, escrito en el formato APA, el cual deberá ser presentado en documento físico y documento digital, teniendo en cuenta la siguiente estructura básica: ASPECTOS GENERALES Carátula del trabajo. Título del trabajo de investigación, relacionando lo que ha desarrollado, escogido de cualquiera de los temarios: A, B o C.. Curso, ciclo, año. Alumnos conformantes. Lugar o zona de estudio. Nombre del docente. Fecha de presentación. Dedicatoria, agradecimientos, si así lo prefieren Índice Resumen El resumen es un extracto del trabajo escrito a lo más en 15 líneas, en un solo párrafo ó 200 palabras. Abstract Es un resumen escrito en inglés. Introducción En este punto, todo lo que se escribe en el trabajo, en breves palabras se presenta una información genérica de la naturaleza del estudio, indicando el problema a resolver y el contenido del trabajo, de modo que al leerlos, el lector, tenga una idea de lo que se va tratar. Capítulo I. MARCO CONCEPTUAL En este capítulo se exponen las bases conceptuales, de los temas que se van a tratar, exponiéndole con un enfoque crítico; así por ejemplo, si se va tratar de explicar el comportamiento de las ventas de PC en un determinado centro comercial, deberá explicarse qué es una distribución normal, y cuáles son sus características, etc. Capítulo II. METODOLOGÍA DEL TRABAJO En este punto se explica todo el proceso desarrollado para recopilar los datos:
¿Cómo se hizo para obtener los datos?
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 10 d e 92
¿Cómo se seleccionó la muestra? ¿Cómo y cuándo se seleccionó el lugar? ¿Qué problemas existieron para obtener estos datos?, ¿Qué tipo de investigación se desarrolló? ¿Qué tipo de variables se consideraron?, etc.
Capítulo III. PROCESAMIENTO Y ANÁLISIS DE LOS DATOS CAPTURADOS Los datos capturados según el temario seleccionado, deberán ser procesados, explicados, y analizados, con ejemplos reales obtenidos mediante las técnicas utilizadas; presentar tablas y gráficos. Capítulo IV. ANÁLISIS CRÍTICO DE LOS DATOS PROCESADOS Explicar de una manera general, qué experiencias y conclusiones podrían obtenerse, con los datos recopilados y procesados; es decir, a manera de ejemplo, ¿qué podría decir del grupo de personas estudiadas?, ¿qué piensan?, ¿qué perspectivas tienen?, etc. CONCLUSIONES Se presenta una serie de conclusiones, relacionados con todo lo encontrado al momento de desarrollar el trabajo; considerando los problemas que pudieron haberse generado, el conocimiento generado, los conocimientos que podría ampliarse, etc. ANEXOS En todos los trabajos hay una serie de tablas, cuadros, operaciones aritméticas, encuestas, etc., que se desarrollan, que por su naturaleza extensiva y rutinaria, y por elegancia se les incluye al final del trabajo como anexos: Anexo 1 Título …….., Anexo 2 Título …...
BIBLIOGRAFÍA Considerar por orden alfabético la bibliografía consultada, según el siguiente orden: Apellidos del autor, iniciales de sus nombres, año de publicación, título en cursiva, lugar de publicación y editorial.
¡OJO! 1. Los avances y coordinaciones de los trabajos preliminares, serán tomados en cuenta para la evaluación final. 2. Los trabajos desarrollados, serán debidamente sustentados por el grupo participante; la no sustentación de algunos de los miembros del grupo, invalida su presentación, no considerándose como presentado al ausente. Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 11 d e 92
3. El trabajo final será presentado y sustentado por el grupo, en la semana quinceava de iniciado el ciclo, en la hora correspondiente a la hora de práctica; por ningún motivo existirá prórroga. 4. El desarrollo de este trabajo, está en concordancia a lo estipulado en el sílabo. Huacho, setiembre de 2012
NOTA: De acuerdo a lo establecido en el estilo de presentación de trabajos de investigación, según el formato APA, básicamente éste deberá tenerse las siguientes características : Se pueden utilizar las letras Arial, Times New Roman o Courier de tamaño 12. Al inicio de cada párrafo deben hacerse sangría de 5 espacios. Los títulos de los capítulos deberán estar centrados al inicio de la página. Después del Capítulo se escribe el Título centrado y en mayúsculas y letra de tamaño 14 en negrita; luego escribir los sub niveles a tres espacios del Título. Los títulos deben estar escritos por lo menos en una línea. Los capítulos se numeran en números romanos, como Capítulo I. y los subniveles 1.1 1.2 …. Y si se desea más sub niveles de éstos: 1.1.1 Capítulo II. 2.1 2.2 2.2 …..
1.1.2
1.2.1
1.2.2
1.2.3 ……..;
Los sub niveles se escriben a partir del margen izquierdo, con letra de tamaño 12 en negrita, el cual debe terminar en dos puntos, como el siguiente: 1.2. Estudio de la estadística:, esta modalidad seguirá hasta el cuarto nivel, ejemplo: 1.2.1.1. Usos de la estadística en la ingeniería: los textos se escriben dejando tres espacios antes del subtítulo. La compaginación se hace a partir del capítulo uno, escrito en números arábigos y en la parte inferior centrada de la hoja, en papel bond A4. Las páginas preliminares, desde la portada hasta antes del inicio del Capítulo I, se escriben en números romanos, también en orden consecutivo, en minúscula y centrado al pié de la página. Las referencias bibliográficas se enlistan al final del trabajo; en ella se escribe en orden alfabético el autor o los autores, comenzando por Apellido, iniciales de sus nombres, año de publicación, entre paréntesis, título de la obra en cursiva, número de edición, ciudad de publicación y editorial. Si esta referencia ocupa más de una línea, la segunda comenzará después de cinco espacios de la primera. Ejemplo: Becerra, M. E. (2010). Incidencia del consumo de madres gestantes, en el cerebro de los nonatos, Lima, Ed. Los Arboles. Los cuadros o tablas, deben llevar una numeración correlativa de acuerdo al capítulo donde se está tratando el tema, escritos en el mismo tamaño de la letra y resaltada en negrita. El título debe reflejar las características del cuadro o tabla que se desea presentar, y debe tener el mismo acho que la tabla. Debajo de la tabla debe presentarse una nota o referencia que indique la procedencia de los datos, escrito en letra de tamaño 10 y en itálica. Los textos de los títulos de las tablas, deben tener el mismo ancho de la tabla. Ejemplo de presentación de una tabla o cuadro. Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 12 d e 92
Tabla 1.1 Ingresos m ensuales, en Nuevos Soles, de una mu estra de trabajadores de las empresas privadas, de la provincia de Barranca corresp ond iente a mar zo de 2011.
Nivel de ingresos Número mensuales trabajadores 600 – 1000[ 45 1000 – 1400[ 89 1400 – 1800[ 149 1800 – 2200[ 172 2200 – 2600[ 68 2600 – 3000[ 31 3000 – 3400[ 14 3400 – 3800[ 7
de
Fuente: Datos ob tenidos m ediante una encuesta desarrollada, por los inv estigadores en el mes d e marzo de 2011.
Los gráficos también deben tener la misma numeración correlativa, igual al colocado a las tablas, y debe indicar las características de la información que se quiere mostrar. Esta numeración se escribe debajo del gráfico en itálica y de tamaño 10, solo el nombre del gráfico, como: Figura 1.1. luego el texto en forma normal y del mismo tamaño, y del mismo ancho del cuadro de la figura; este gráfico debe tener también su fuente o referencia. Ejemplo. 40 40
35 32
35 30
35
39
37 31 26
25
25
BRASILERO
20
ALEMAN
15
ITALIANO
10 5 0 MAÑANA
TARDE
NOCHE
Figura 1.1 Registro de llenado de botellas en miles de unidades/ hora de acuerdo a la procedencia de los equipos, según turnos de trabajo. Fuente: Tabla 1.1
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 13 d e 92
PRIMERA SEMANA CONCEPTOS BÁSICOS DE LA ESTADÍSTICA INICIACIÓN DEL PROCESO DEL ESTUDIO EN LA ESTADÍSTICA La estadística es una ciencia, que tiene por objeto recopilar datos, procesarlos mediante determinadas técnicas y producir una información que permita apoyar la toma de decisiones; hoy en día cualquier disciplina profesional no puede prescindir de esta ciencia; la estadística es la base de la investigación, y sin investigación no hay desarrollo, y sin desarrollo no hay avance, y si no hay avance, la sociedad estará a la saga, lo cual, nadie lo deseará estando en sus sanas intenciones; siempre el objetivo es seguir adelante, ser cada vez mejores y más competitivos, porque las condiciones de la sociedad, así los exigen. Hablando en términos de investigación, nuestra querida y amada patria adolece de investigación; nos caracterizamos por importar y copiar modelos diferentes a lo nuestro; ello constituye una limitante para nuestro desarrollo, y si el Estado Peruano no emprende programas de investigación, o las empresas por sí mismas no se preocupan por mejorar su estado actual, mediante la investigación, siempre estaremos de furgón de cola, siguiendo y copiando lo que hacen otros, sin capacidad de desarrollar lo nuestro e imponer nuestros patrones, como sí los hacen los otros países. Los estudios de la estadística comienzan recopilando datos, que pueden hacerse desarrollando diferentes procedimientos; luego estos datos son clasificados, tabulados y procesados para producir una información; con esta información pueden tomarse las mejores decisiones, siempre y cuando los datos han sido debidamente recopilados y procesados; para recopilarlos y procesarlos, no se requieren complicados procedimientos matemáticos, basta una buena voluntad de querer hacer las cosas bien, y con los conocimientos mínimos del álgebra y la aritmética, aprendidos en la educación secundaria, complementada y reforzada en los cursos de complemento de matemática o el cálculo diferencial e integral de nivel básico, en el currículo de todas las carreras universitarias, son los requisitos mínimos que debería reunir toda persona interesada en iniciarse en este fascinante mundo de la ciencia estadística. De esta manera para irse dando cuenta de la importancia del desarrollo de esta ciencia, se presentará la necesidad de desarrollar un caso estudio, de un grupo de emprendedores, deseos de constituir una empresa, en cualquier lugar del país; sea éste el siguiente caso: EJEMPLO DE CASO ESTUDIO PARA INICIARSE EN LA ESTADÍSTICA Considere que los ex alumnos de ingeniería, egresados de la UNJFSC, desean constituir una empresa de servicios informáticos dentro de la localidad de la provincia de Barranca; esta empresa estará dirigida a la capacitación y producción en la más amplia gama de servicios que comprenden la venta de equipos informáticos, así como la producción y desarrollo de software, para la solución de las diferentes necesidades de los pobladores de esta zona. Para emprender esta tarea, los interesados planean hacer un estudio de mercado, los cuales les proporcionarán cierta información que les permitirán seguir más adelante con los planes previstos; uno de estos aspectos cruciales de la investigación, será el de conocer la capacidad económica de la población, a fin de poder apreciar si estarán en condiciones de aceptar los precios de los Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 14 d e 92
productos que se ofertarán; aparte de ello, existen otros factores complementarios que también desearán conocer; lamentablemente, en esta provincia no existe la información que los interesados desearían conocer de manera directa, por lo tanto deberán desarrollar una serie de acciones que les permita obtener la información requerida. Los emprendedores requieren conocer básicamente el nivel de ingresos mensuales de la población; pero esta población es muy grande, por lo tanto entrevistar a toda la población será muy complicado y costoso; en su lugar deberá extraer pequeñas muestras que representen a la población; la selección de estas muestras, deberá hacerse siguiendo técnicas de selección de muestras, llamado muestreo; una vez seleccionado el tamaño de la muestra, deberá obtener los datos, también siguiendo una serie de procedimientos, los cuales podrían ser de los siguientes modos: Entrevistando a la persona ; para ello el entrevistador deberá prepararse previamente a fin de
concertar una cita con el personaje, y mediante una serie de preguntas pre formuladas, podrá extraer la mayor cantidad de datos requeridos. La particularidad de esta entrevista, es que el entrevistado puede explayarse en las respuestas, por lo tanto, el entrevistador deberá tener la habilidad necesaria como para que la entrevista no se salgue de los parámetros establecidos y poder obtener la mayor cantidad de datos necesarios para su proyecto. Desarrollando una encuesta ; en este caso, se diseña un formulario de preguntas encasilladas, donde el entrevistado solo podrá contestar de acuerdo a las respuestas proporcionadas; no hay opción para otro tipo de respuestas. El inconveniente de este sistema sería si las preguntas estuviesen mal formuladas, los cuales podrían inducir a proporcionar respuestas erróneas. Observando ; en este caso, se hace un seguimiento al elemento del cual se requiere obtener la información; tratándose de obtener ingresos mensuales de la muestra, sería inadecuado utilizar este procedimiento, ya que por más que se haga la observación, sería difícil saber lo que realmente percibe en forma mensual el trabajador, si no se tiene la oportunidad de contactarse con él. Acudiendo a la fuente del origen de sus ingresos ; en este caso, se puede acudir a la planilla de pagos, a la boleta de remuneraciones, las declaraciones juradas, u otras fuentes o publicaciones que permitan proporcionar la información requerida. Experimentando ; es un procedimiento aplicable solo en otros casos, sobre todo cuando se desarrolla experimentos o diseño de nuevos prototipos. Como puede apreciarse, existe una serie de procedimientos que permiten proporcionar los primeros datos; posteriormente estos serán procesados, también utilizando una serie de técnicas, los cuales podrán permitir proporcionar una información de acuerdo a las necesidades requeridas, extrayendo las conclusiones que permitan adoptar las decisiones más convenientes. Sea cual sea los procedimientos desarrollados para seleccionar la muestra, el solo hecho de estar interesado en conocer los ingresos mensuales de la población barranquina, este trabajo podrá proporcionar complementariamente otros tipos de informaciones, como los siguientes: La persona seleccionada es: ¿ hombre o mujer ?, en este caso se trata de conocer su: Género. El estado civil de la persona es: ¿ Soltero, casado, viudo, divorciado, etc .? Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 15 d e 92
¿Qué grado de instrucción tiene?, en este caso se trata de saber si su grado de instrucción es: ¿Primaria, secundaria, superior?
¿A qué se dedica esta persona o qué grupo ocupacional tiene?; en este caso, se trata de saber si es: ¿Obrero, campesino, profesional, comerciante, jubilado, estudiante, etc.? ¿Qué edad tiene la persona?; en este caso, se trata de conocer el grupo de edad de la persona, los cuales podrían conducir a decir que son: jóvenes, adultos, ancianos, etc. ¿Cuánto percibe mensualmente por su trabajo? ¿Lugar donde habita? ¿ Residencial, Campo, Pueblo joven, Asentamiento humano, etc.? ¿Años de experiencia laboral?, etc., etc. Como puede apreciarse, no solo es suficiente con conocer los ingresos mensuales de la población en estudio; también es importante conocer qué otras características tienen las personas, como sexo, edad, ocupación, experiencia, grado de instrucción, lugar de residencia, experiencia laboral, procedencia, número personas que dependen de él, estado civil, etc., datos que más adelante permitirán proporcionar una información más amplia acerca de la población estudiada, con los cuales se podrán adoptar las decisiones y acciones más convenientes, a fin de que los interesados o la empresa pueda lograr ingresar adecuadamente al mercado.
POBLACIÓN Y MUESTRA Una población es un conjunto de elementos que por lo menos tienen una característica en
común; por ejemplo, si se está hablando de la población barranquina, ésta tiene una característica en común, que ser la de Barranca, de otro modo no sería barranquina. Por lo general el número de elementos de una población, pueden ser infinitas o finitas; se dice infinita cuando su número es muy grande o no pueden contarse, y finita cuando su puede ser susceptible de ser contado; en este caso, al número de elementos de la población se les denota por N. Los valores que representan a la población se denominan p arám etr os , y éstos son: la
media µ, la varianza σ 2, la desviación estándar σ y la proporción poblacional p.
M u e s t r a p o b l a c i o n a l; como la población es grande o muy grande, no es conveniente trabajar
con todos sus elementos porque hacer el estudio de todos ellos demandaría excesivos gastos, así como demandaría más tiempo para desarrollar la investigación, o también, no se puede experimentar con toda la población, en los casos de que se tuviera la necesidad de probar algunos productos nuevos; en su lugar, la estadística trabaja, solo con muestras poblacionales pequeñas, que es suficiente como para conocer las características poblacionales, siempre y cuando éstas fueron bien seleccionadas; cuando se dice que las muestras son, pequeñas, por lo general se dice que sus tamaños son menores de 30; en algunos casos, cuando se estudia proporciones poblacionales, los tamaños de las muestras superan esta cantidad, situaciones que se justifican por condiciones y características de los estudios a desarrollar; los elementos muestrales, para que realmente representen a la población, deben ser seleccionados siguiendo rigurosos procedimientos técnicos, llamadas técnicas de muestreo. El tamaño de la muestra se lo representa por n, y sus valores representativos se denominan es tad ís tic o s , los cuales son: la media , la varianza s2, la desviación estándar s, y la proporción muestral p s. Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 16 d e 92
SELECCIÓN DE MUESTRAS Básicamente se cuentan con las siguientes técnicas para seleccionar muestras que representen a la población: muestreo aleatorio simple, muestreo sistemático, muestreo estratificado y muestreo por conglomerados. En el m u e s t r e o a l e at o r i o s i m p l e, a cada elemento de la población se le asigna un número único, y al azar se selecciona uno de ésos números, el que le corresponderá al elemento muestral; en el mu estreo sis temático , se asigna a cada elemento de la población un número único y consecutivo, luego se los divide en determinado número de grupos, de acuerdo al número de elementos muestrales deseados; del primer grupo se selecciona un elemento muestral, y éste número es base para seleccionar los elementos muestrales de los subsiguientes grupos. El siguiente ejemplo ilustrará el caso: supóngase que se cuenta con una población de 1000 personas, de los cuales se seleccionará una muestra de 10 personas; utilizando el muestreo sistemático deberá desarrollarse los siguientes pasos: 1. Asignar un número del 1 al 1000, a cada persona. 2. Dividir el grupo en 10 partes iguales, llamados grupo 1, grupo 2, grupo 3, y así sucesivamente hasta completar los 10 grupos. 3. Del grupo 1, numerado del 1 al 100, seleccionar mediante la técnica anterior, un número cualquiera comprendido en esta escala; así por ejemplo si el número seleccionado es el 64, significa que la persona que tiene ése número, será el elemento muestral de ése grupo. 4. Para el siguiente grupo, sume el número seleccionado en el caso anterior, 64 a la cantidad del segundo grupo, en este caso 100, lo cual dará 164; este significa, que el segundo elemento muestral será el que tiene asignado el 164; para el tercer caso a éste número súmele 100 y tendrá el tercer elemento muestral, y así sucesivamente. El muestreo estratificado tiene por objeto seleccionar a la muestra de acuerdo a las
características comunes de la población; así por ejemplo, si la población está clasificado de acuerdo a su estado civil, se los clasificará en Solteros, Casados, Viudos y Divorciados, y de cada uno de estos estratos se seleccionará la muestra, siguiendo las técnicas anteriores; un conglomerado en la agrupación de todos los elementos, sin distinción de nada; así por ejemplo, la población del distrito de Huacho, es un conglomerado, ya que lo integran personas de todas las condiciones sociales y económicas, entonces cuando se trata de hacer el m u e s t r e o p o r c o n g l o m e r a d o s, a la población se los divide en pequeños sub conglomerados, de éstos se seleccionan al azar los conglomerados, y de éstos se seleccionan las muestras siguiendo los procedimientos descritos.
TIPO DE DATOS Los datos que se pueden obtener por los métodos descritos anteriormente pueden tener diferentes naturalezas; los hay básicamente de tipo Cualitativo y Cuantitativo . Los datos de tipo Cualitativo solamente expresan una relación de cualidad del sujeto, como por ejemplo Género: puede ser masculino o femenino; Estado Civil ; puede ser Soltero, Casado, Viudo, Divorciado, Conviviente, y así; en cambio los de tipo Cuantitativo expresan una relación de cantidad, expresados en órdenes numéricos; en ambos casos, los datos deben ser definidos y conocidos de acuerdo a su respectiva naturaleza. Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 17 d e 92
ESCALA DE MEDIDA DE LOS DATOS Los datos clasificados en forma cualitativa o en forma cuantitativa, pueden ser medidos de la siguiente manera: A. Datos Cualitativos: 1. NOMINAL: Al dato se le identifica por una sola denominación, que puede ser un número o un código Ejemplos: El número del DNI de una persona El número de celular de una persona. El número de cuenta del cliente de un banco. Respecto a la salud de una persona, éste puede ser mala, regular o buena. Respecto al estado civil de una persona: C, V, D, S. 2. ORDINAL: Los datos ocupan un determinado orden dentro de una categoría. Ejemplos: La numeración de las viviendas. Las notas cualitativas: Malo, Regular, Bueno, Muy bueno, Excelente. Estado de salud de un paciente: Malo, Regular, Bueno, Muy bueno B. Datos Cuantitativos: Los datos se expresan en términos numéricos; se tienen los de intervalo y los de razón. 1. INTERVALO: Sus atributos son de ORDEN y DISTANCIA; no tienen origen real; ejemplo la temperatura; la hora. 2. RAZÓN: Sus atributos son de ORDEN, DISTANCIA y ORIGEN; en este caso el origen es el cero que indica ausencia de valor; ejemplo el peso. Los datos numéricos también pueden ser discretas o continuas. 1. DISCRETAS: Los datos pueden ser contados solo en números enteros. 2. CONTINUAS: Los datos pueden ser medidos, lo cual significa que pueden expresarse en términos de números enteros o fraccionarios. Ejemplo 1.1 A continuación se va crear un gráfico de barras y otro circular, haciendo uso del software estadístico SPSS, versión 15.0, de un grupo de pacientes que supuestamente acuden a un hospital para hacerse chequear. En éste lugar, el paciente es clasificado de acuerdo a su estado de salud en las siguientes escalas: 1 Significa, Paciente en muy grave estado de salud. 2 Significa, Paciente en grave estado de salud. 3 Significa, Paciente en mal estado de salud. 4 Significa, Paciente en regular estado de salud 5 Significa, Paciente en buen estado de salud. De acuerdo a las características de estos datos, las variables son de tipo cualitativo, expresadas en escala de medida ordinal, ya que los pacientes son clasificados de acuerdo a su estado de salud, desde muy grave hasta en buen estado de salud. Manejo del software estadístico SPSS: Abra su editor, y observará que éste tiene la forma de una hoja de cálculo, donde las columnas significan los diferentes tipos de variables que utilizarán, y las filas las características de Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 18 d e 92
cada uno de los elementos de información que deberá introducir, por cada uno de ellos. Si cada columna representa una variable, entonces quiere decir, que cada uno de estas deberá ser identificada; si es variable cualitativa, si es cuantitativa, etc.; entonces al abrir el editor del SPSS, deberá desarrollar los siguientes pasos: 1. Al pié del editor aparece Vista de variables y Vista de datos ; en primer lugar pulse la opción Vista de variables para definir las características de los datos que habrá de introducir. 2. Deberá definir las características de los datos que introducirá; siga las indicaciones que a continuación se muestra: N o m b r e : Salud T i p o : Numérico A n c h o : 8 Decimales: 0 Etiqueta: EstadoSalud Valores: Al pulsar esta ventana, aparece la ventana de Etiqueta de valores ; en esta se definen las variables a introducir, de acuerdo a un código numérico, tal como se lo ha definido en la sección anterior, desarrolle secuencialmente los siguientes pasos: Valor: 1 Etiqueta: Grave estado de salud Añ ad ir ; continúe este procedimiento, para 2, 3, hasta 5, y al finalizar pulse Aceptar ; luego vaya a Vista de datos , de la segunda opción del editor del SPSS. 3. En la opción de Vista de datos , en la columna creada de Salud, introduzca números comprendidos entre 1 y 5, teniendo en cuenta que el 1 significa Muy grave estado de salud, el 2 Grave estado de salud, y así sucesivamente, tantos datos como desee ingresar. 4. Para ver el contenido de sus datos introducidos, ir al menú principal y pulse: Analizar Estad ístic os des crip tivo s F r ecuencias , en donde aparecerá la ventana de Frecuencias, en cuya primera ventana se observa resaltada en azul EstadoSalud[Salud], pulse el botón derecho para introducirlo en la ventana de Variable ; si desea que muestre los estadísticos principales o les presente gráficos, puede pulsar las siguientes opciones: Es tad íst ic os , para obtener información respecto a los Cuartiles, Percentiles, y Medidas de tendencia central, si pulsa el botón Gr áfi c o s , puede obtener Gráfico de barras, Gráfico de sectores, Histogramas: de igual manera, si desea que se le muestre la tabla de frecuencias, haga check en el botón Mostrar ; aparecerá el histograma siguiente, al pie de tablas de frecuencias , y finalmente pulse Aceptar la tabla de distribuciones de frecuencia: Estadísticos Condición de los pacientes N Válidos Perdidos Mediana Moda Percentiles 10 25 50 75
95 0 3.00 2 1.00 2.00 3.00 4.00
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 19 d e 92
Condición
Válidos
Muy Grave Grave Malo Regular Bueno Total
Frecuencia 12 32 26 17 8 95
Porcentaje 12.6 33.7 27.4 17.9 8.4 100.0
Porcentaje válido 12.6 33.7 27.4 17.9 8.4 100.0
Porcentaje acumulado 12.6 46.3 73.7 91.6 100.0
__
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 20 d e 92
5. También se puede obtener otro tipo de gráficos, siguiendo otras opciones del menú principal, como por ejemplo: Gr áfi c o s Cuadr o de diálog os ant igu os al pulsar esta última opción puede obtenerse gráficos de Barras, Areas, Sectores, etc. El siguiente gráfico, corresponde a la misma representación del estado de salud de los pacientes, expresada en sectores circulares: Condicion Muy Grave Grave Malo 8.42%
Regular 12.63%
Bueno
17.89%
33.68%
27.37%
Gráfico circular mostrando el estado de salud de los pacientes de un hospital
__
6. Finalmente, los formatos de presentación de los gráficos, así como sus leyendas, pueden ser mejoradas, pulsando solamente el botón derecho del ratón, para ello previamente deberá estarse dentro del gráfico. Al pulsar este botón aparece el Edi to r de g ráfic os , situación que presenta una serie de opciones, con el cual se podrá desarrollar las mejoras en el gráfico, tal como se puede apreciar con lo mostrado. Ejemplo 1.2 Constr ucc ión de diagram a de hojas con el SPSS . Considere que la edad en años de un grupo de personas está conformado por los siguientes valores: 10 12 13 20 25 28 40 51 63 70 81 05 16 20 24 28 32 33 46 25 16 18 2 2 26 36 41 40 30 20 21 19 16 15 22 24 33 40 50 56 63 64 46 45 42 51 63 54 20, respectivamente por cada uno de las personas. Abra el editor del SPSS e introduzca estos datos definiendo en Vista de variables a Edad, como variable numérica de ancho 4 y cero decimales; en Vista de datos, introduzca en la respectiva columna de Edad, todos los datos, en cada celda. Estadístico s descrip tivos Explorar En Vaya al menú principal y siga la secuencia: Analizar esta opción aparece la variable Edad el cual debe ser transportado hacia la ventana de Dependientes pulsando su respectivo botón. Para poder apreciar, en este caso el diagrama de Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 21 d e 92
Gr áfi c o s y en seguida pulse hojas, debajo de donde dice Mostrar , haga chec en el botón nuevamente el otro botón de Gr áfi c o s , el que le permitirá mostrar la ventanita de Exp lo rar gráfic os . Dentro de esta ventana existen una serie de opciones de gráfico, como el de Diagramas de caja y Descriptivos ; como solo estamos interesados en estos momentos por el diagrama de hojas, haga Tallo y h ojas clic en el l botón , luego pulse el botón Continuar y Aceptar .
Aparece esta ventana de resultados: Edad Stem-and-Leaf Plot Frequency 1.00 9.00 14.00 5.00 8.00 5.00 4.00 1.00 1.00
Stem & 0 1 2 3 4 5 6 7 8
Stem width: Each leaf:
. . . . . . . . .
Leaf 5 023566689 00001224455688 02336 00012566 01146 3334 0 1
10 1 case(s)
En este gráfico podrá observar que por cada decenio, se muestra la hoja del tronco; por ejemplo en el primer decenio, solamente hay una persona cuya edad es de 5 años; de igual manera, en los decenios 7 y 8 solamente hay una persona por cada uno de ellos; uno de 70 años y otro de 81 años. También se muestra el resumen de datos con las siguientes características: Resumen del procesamiento de los casos Casos
Edad
Válidos N Porcentaje 48 100.0%
Perdidos N Porcentaje 0 .0%
Total N Porcentaje 48 100.0%
Finalmente guarde este archivo con el nombre Edad2012.sav, ya que más adelante será requerido para mostrar otros casos. Ejemplo 1.3 A continuación se presenta los resultados de una muestra de ingenieros informáticos, desarrollada en la provincia de Barranca, durante el mes de abril del presente año, entre hombres y mujeres, que actualmente estaban laborando en las entidades privadas o públicas, y cuyos sueldos mensuales en S/ por cada uno de ellos fue el siguiente: Ingenieros informáticos mujeres: 2500 1764 2600 1000 1500 3020 3500 1850 1956 3500 2900 3000 2010; ingenieros informáticos varones: 3200 3500 1820 1000 2500 2750 2400 3010 2100 2800 2300 1500 1700 2500 1200 2200 a) Construya una tabla que permita mostrar esta información de manera adecuada. b) Explique los tipos de variables utilizadas. c) Explique la escala de medida empleada en las variables. Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 22 d e 92
Solución. a) Tabla 1.1 Ingresos mensuales en Nuevos S oles de una muestra de ing enieros info rm ático s, seg ún g é nero , que t rabajab an en la pr ovi nc ia de Barranc a, en el m es de abril d e 2012.
Escala de sueld os 1000 – 1499 1500 – 1999 2000 – 2499 2500 – 2999 2999 – 3500 Total
Femenino 1 4 1 3 4 13
Varón 2 3 4 4 3 16
Total 3 7 5 7 7 29
Fuente: Encuesta des arrollada en la provinc ia de Barranca en abril de 2012 Elaboración: El equipo inv estigador.
b) Tipos de variables: Cualitativo: Género (F,V); Cuantitativo: Ingresos mensuales (Sueldos) c) Escalas de medidas: Nominal: F, V; Ordinal: Escala de sueldos; Razón: Sueldos.
EJERCICIOS 1.1.
Señale (F) o verdadero (V) para cada una de las siguientes proposiciones:
( ) La estadística tiene dos ramas: Descriptiva y analítica. ( ( ( (
) La estadística descriptiva extrae conclusiones generales de las muestras estudiadas. ) Si un parámetro poblacional no es posible calcularlo, no se podrá hacer la investigación. ) Un formulario de preguntas, debe responder los objetivos específicos. ) Una variable, es una característica de una unidad de análisis, el que puede tomar diferentes valores. ( ) La escala de medida nominal, permite clasificar las unidades de análisis, en dos o más categorías, sin que importe el orden de estas. ( ) El grupo sanguíneo de una persona, es una escala ordinal. ( ) Para conocer la calidad de servicio de un restaurante debe usarse solo una entrevista. ( ) El tiempo de respuesta a una petición del usuario, de un sistema operativo, es una variable de intervalo. ( ) El género de una persona es una escala de medida ordinal. ( ) Con los datos cualitativos se pueden hacer representaciones gráficas que denotan escalas de medida de razón. 1.2. Indique la alternativa correcta, para cada una de las preguntas: Una investigación, sirve para: a) Definir los hechos como son. b) Descubrir nuevos conocimientos. c) Confirmar los conocimientos establecidos. d) Aportar los conocimientos habidos. Los datos para la investigación no pueden obtenerse: a) Haciendo solo una entrevista. Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 23 d e 92
b) c) d) e)
Haciendo solo una encuesta. Solo observando. Solo revisando solo publicaciones. Suponiendo que esos hechos ya existieron.
La estadística descriptiva permite: a) b) c) d)
Definir datos cualitativos y cuantitativos. Deducir los resultados de la muestra. Deducir los resultados de la población. Describir los hechos tal como ocurren.
Los datos cualitativos pueden medirse: a) En una escala de medida razón. b) En una escala de medida nominal. c) En una escala de medida de intervalo. d) En cualquier escala de medida. 1.3. En la provincia de Huaral, el mes pasado, se llevó a cabo un estudio mediante una muestra de 350 personas en edad laboral, con la finalidad de conocer su nivel de ingresos mensuales, cuyas principales variables de estudio fueron: Sexo, edad, estado civil, grado de instrucción, tipo de actividad desarrollada, ingresos mensuales, antecedentes de enfermedades, nivel socioeconómico y número de personas bajo su dependencia. Los resultados principales que se obtuvieron fueron: 23% de los entrevistados fueron mujeres; el 21% del total ganaban menos de S/ 800 mensuales y solo el 5% ganaban más de S/ 4 000; el 14% tenían estudios universitarios en tanto que solo el 8% tenían estudios primarios; el 15% de las mujeres reportaban estar separadas; 72 personas reportaban que alguna vez habían tenido alguna enfermedad que les obligó a acudir a un centro de salud; identificar : Unidad de análisis: …………………………………………………………………………….. Población objeto de estudio:…………………………………………………………………... ……………………………………………………………………………………………………. Muestra:………………………………………………………………………………………….. Tipos de variables utilizadas en el estudio:………………………………………………….. ……………………………………………………………………………………………………. ……………………………………………………………………………………………………. Escalas de medición de cada una de las variables: ……………………………………….. ……………………………………………………………………………………………………. ……………………………………………………………………………………………………. Estadísticos usados: ………………………………………………………………………….. ……………………………………………………………………………………………………. …………………………………………………………………………………………………….
Sintetice esta información mediante la presentación de tablas e indique los tipos de variables utilizadas. 1.4. Clasifique el tipo de variable y su respectiva escala de los siguientes: a) Número de repeticiones en un curso, en la Universidad. Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 24 d e 92
b) c) d) e) f) g) h) i) j)
Temperatura de la sala de cómputo. Resultado a un concurso de plaza vacante en una empresa (Aprobado, desaprobado) Tiempo de respuesta de un programa, a solicitud del usuario. Número CPU en mal estado. Estado nutricional de los alumnos de ingeniería informática. Lugar de graduación de los ingenieros de sistemas. Gastos en educación. Porcentaje de accidentados que llegan a la sala de emergencia de un hospital. Porcentaje de ingenieros industriales con grado maestro egresados de una universidad del interior del país. 1.5. Explique los procedimientos existentes para recopilar datos en un proceso de investigación. 1.6. ¿En qué se diferencia la estadística descriptiva de la estadística inferencial?; mediante ejemplos explique esta diferencia. 1.7. A continuación se tiene el estado nutricional de los alumnos de ingeniería informática de una universidad. 1. EN ++ 8. N 15. O 22. N 29. EN + 36. EN + 43. EN ++ 2. O 9. EN + 16. EN + 23. EN + 30. O 37. O 44. N 3. EN + 10. EN ++ 17. O 24. EN ++ 31. N 38. EN ++ 45. EN + 4. O 11. N 18. EN ++ 25. EN + 32. O 39. N 46. O 5. EN ++ 12. N 19. O 26. EN + 33. N 40. O 47. EN ++ 6. N 13. EN ++ 20. EN + 27. O 34. EN ++ 41. N 48. EN + 7. O 14. N 21. N 28. O 35. O 42. EN + 49. O Donde: N= normal EN + = Desnutrido en 1er grado. O = obeso EN ++ = Desnutrido en 2do grado. a) Construya la respectiva tabla. b) Mediante un gráfico, explique porcentualmente, el estado nutricional de los alumnos. c) Analice los resultados. 1.8. Un estudio realizado sobre el número de veces que una muestra de un grupo de profesionales peruanos hacen viajes de vacaciones a los principales destinos turísticos del mundo, en el año 2011, mostró los siguientes resultados: Tabla 1.2 Destinos turístico s del mun do visitado s por pro fesionales peruanos, haciendo us o de sus de su s v acac ion es en el añ o 2011.
Lugares visitados Tipo de profesionales Ingeniería Medicina Derecho Economista Total
USA 23 41 15
ASIA
Europa 31
12 8 17
89
12 10 55
Sud América
Total
% Total
6 9 16 47
247
Nota………………………………………….
a) Complete las celdas vacías de esta tabla. Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 25 d e 92
b) ¿Qué tipos de variables se presentan en esta tabla y cuáles son sus características? c) ¿Qué tipo de escala de variables se están utilizando? d) Reformule la tabla, indicando sus características. e) Grafique dicha tabla. f) Analice los resultados de la tabla, planteando sus respectivas conclusiones. 1.9. Un estudio realizado a 400 clientes que adquirieron equipos de cómputo en un centro comercial de la ciudad de Lima, el año 2011, clasificados según el grado de satisfacción, y el costo de los equipos, mostró los siguientes resultados: Tabla 1.3 Clasificación de clientes que adquirieron equipo s de cómputo en un cent ro co m erc ial d e Lim a en el año 2011.
Grado de satisfacción Satisfecho Insatisfecho
Total
Costo de los equipos Costoso N % 223 177
Económico N %
Total 255
Nota ……
a) Complete todas las referencias que debería contener esta tabla. b) Complete sus celdas vacías. c) ¿Qué tipo de variables se están utilizando? d) ¿Qué escala de medida de variables se están usando? e) Presente y analice el comportamiento gráfico de estas variables. 1.10. En un grupo de alumnos universitarios , se desarrolla una encuesta para saber si sus cn ic a de M es a Red on da docentes, en sus clases utilizan la Té ; los resultados se muestran a continuación: Tabla 1.4 (Complete la leyenda para esta información) Categoría Frecuencias Observada Relativa Porcentual Siempre 12 Casi siempre 10 A veces 23 Casi nunca 31 Nunca 20 TOTAL Fuente. ………….
Complete los casilleros vacíos de esta tabla y determine: a) Tipo de variable(s) utilizada(s). b) Número de variable(s) utilizada(s). c) Escala de medida de las variables. d) Representación gráfica de los resultados de esta tabla. Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 26 d e 92
e) Interpretación de los resultados obtenidos. 1.11. A continuación se presenta los resultados de una muestra de un grupo de empleados, seleccionados al azar, quienes trabajan dentro de un centro comercial, en el cual se ofrecen y venden equipos y servicios de cómputo; la tabla muestra por cada empleado, el nivel de estrés y el nivel de servicio, en el comportamiento observado, dentro de las horas de atención al público. Tabla 1.5 ( Coloque la leyenda para esta tabla )
Empleado 1 2 3
Estrés 1 2 2
4 1 5 2 6 1 7 2 8 1 9 1 10 1 11 2 12 1 13 2 14 2 15 2 16 1 17 2 18 1 19 2 20 2 21 1 22 2 23 1 24 1 Donde: Estrés: 1 = Alta 2 = Normal
Afán de Servicio 2 1 1 2 1 2 1 1 2 2 1 1 2 1 2 1 1 2 1 1 2 1 2 1 Afán de Servicio:
1 = Si. 2 = No
Explique el comportamiento de estas observaciones, mediante la construcción de una tabla indicando las características de ésta; así mismo refuércelo mediante una presentación gráfica. Confronte los resultados manuales, con lo proporcionado por el SPSS. 1.12. ¿En qué se diferencia un diagrama de tallos, frente a un diagrama de cajas? 1.13. ¿Puede una escala de medida ordinal representar datos expresados en la escala de intervalo? 1.14. ¿Los datos que se presentan en un diagrama de barras, pueden también ser representados en un histograma? 1.15. La siguiente tabla proporciona información monetaria en millones de dólares USA, sobre aporte al fisco por la minería desarrollada en el Perú, entre los años 2005 al 2010. Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 27 d e 92
Tabla 1.6 ( Coloque la leyenda para esta tabla )
Imp/año A la renta Regalías Derechos Óbolo Impuestos Exportaciones Imp/Exp (5) Utilidad neta Util/Exp (%)
2005 657 207 21 -885 9790 9,04 3530 36,06
2006 1764 116 37 -1917 14735 12,01 5913 40,13
2007 2008 2009 2010 2781 2309 1003 1985 160 174 113 214 41 53 50 66 166 127 139 176 3148 2663 1305 2441 17238 18657 16382 21723 18,26 14,27 7,97 11,24 6708 5002 5068 5880 38,91 38,91 30,94 27,07
Acumulado 10499 984 268 608 12359 98525 12,54 32101 32,5
% 10,66 1,00 0,27 0,62 12,54
Mediante una representación gráfica, analice y discuta las características del comportamiento de estos aportes entre el quinquenio 2005 – 2010. 1.16. Se presenta la siguiente tabla: Tabla 1.7 Consu mo h um ano de azúcar entre los siglos XIX y XX
Año
1815 1910 1980 2000
Consumo anual per cápita en kilos 6,8 40,8 54,0 61,0
Fuente: Sacha Barrio Healey (2005). “La gran revolución de las grasas”.
a) b) c) d) e) f) 1.17.
Explique lo que trata de mostrar esta tabla. ¿En qué escala de medida se expresa Consumo anual per cápita? ¿En qué escala de medida se expresa Año? Represente gráficamente el comportamiento de estas observaciones. ¿Qué tendencia tiene el consumo de azúcar en las personas a través de los años? Use el SPSS para mostrar sus resultados. El siguiente es el proyecto de Presupuesto de la República para el 2012:
Tabla 1.8 ( Complete la leyenda para esta información)
Presupuesto PIA-2012
Gasto corriente Gasto de capital Servicio de la deuda TOTAL %
NACIONAL
41 128 916 834 14 659 876 691 9 230 505 336 65 019 298 861 68,06
REGIONAL
11 272 491 969 3 467 279 343 3 105 954 14 742 877 266 15,43
LOCAL
8 302 300 732 7 211 415 392 258 742 895 15 772 459 019 16,51
TOTAL
%
60 703 709 535 25 338 571 426 9 492 354 185 95 534 635 146 100,00
63,54 26,52 9,94 100,00
Analice y discuta la presentación de estos datos. Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 28 d e 92
1.18. La siguiente tabla bivariada proporciona datos relacionados de la procedencia local de diferentes ingenieros de una localidad: Tabla 1.9 Procedencia region al de un a muestra de p rofesion ales de ingeniería registrado En la ciu dad de Li m a en el añ o 2011
Trujillo Piura Chimbote Lima Arequipa Cusco Puno
Industrial 2 5 7 3 4 6 1
Informático 5 4 6 2 5 4 3
Sistemas 7 6 4 6 7 2 3
Nota Encuesta de pob lación desarrollado en el mes de junio d e 2011. Elaboración: …………………..
Una forma de representar gráficamente esta tabla, para futuras explicaciones e interpretaciones es el siguiente: 8 7 6 5 Industrial
4
Informatico
3
Sistemas
2 1 0
Figura 1.1 Gráfico de barras q ue m uestra la dist ribución de ingenieros por especialidad, prov enientes de siete prin cipales ciud ades del país, de una m uestra tom ada en la ciud ad de Lim a el añ o 2011, cuy a fuen te es l a tabla p receden te.
1.19.
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 29 d e 92
SEGUNDA SEMANA DISTRIBUCIONES DE FRECUENCIA Cuando se construye un histograma de frecuencias, y se busca una curva de tendencia, éstas pueden aproximarse a una serie de figuras geométricas conocidas, como un triángulo, un rectángulo, un trapecio, un círculo, etc.; los cuales adoptan su nombre respectivo; si es un triángulo se dice distribución triangular, y así. En Estadística mucho se trabaja con una distribución acampanada llamada distribución normal; ésta tiene la forma de una campana invertida hacia abajo, y se dice que es una distribución simétrica, porque los datos se distribuyen equitativamente alrededor de su centro o promedio; sin embargo, también hay casos en que los datos no se presentan bajo estas condiciones, o sea tienen tendencia concentrarse hacia un lado; en este caso se dice que los datos son asimétricos, lo cual quiere decir que la curva de campana se deformó; si la deformación se da hacia el lado derecho, se dice que la distribución es asimétrico positivo, y si la deformación se da por el lado izquierdo, se dice que la distribución es asimétrico negativo; las siguientes figuras muestran estos casos:
Asimétrico positivo
Simétrico
Asimétrico negativo
Fig. 2.1 Curvas de distribuciones de tendencia
En una distribución asimétrico positivo, los datos están concentrados más a la izquierda, lo cual quiere decir que la gran mayoría de ellos son menores que el promedio o la media; en cambio, en una distribución asimétrico negativo, la gran mayoría de los datos, se concentran más hacia la derecha, lo cual quiere decir, que éstos son mayores que el promedio o la media. A modo de ejemplo, podría decirse que si en un salón de clases, la mayoría de los alumnos estuvieran desaprobados, la distribución de éstos sería asimétrico positivo, y si la mayoría de los alumnos estuviesen aprobados, entonces se diría que la distribución es asimétrico negativo; cuando se encuentra similar proporción de alumnos aprobados o desaprobados, se diría que la distribución es simétrica. En los siguientes párrafos se aprenderá a construir curvas de tendencia de los casos tratados, para ello se hará uso de los paquetes estadísticos existentes en nuestro medio; de otra manera, también puede hacerse manualmente, solo que en este caso, el trabajo será tedioso y aburrido; la hacer uso de los paquetes estadísticos, deberá tenerse en cuenta los conceptos básicos utilizados en esta ciencia; definir bien las características de las variables y conocer la escala de medida utilizada.
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 30 d e 92
DISTRIBUCIÓN SIMETRICA Ejemplo 2.1 Considere el caso de que el curso de ESTADISTICA Y PROBABILIDADES, los 58 alumnos obtuvieron en su primera práctica calificada, las siguientes notas: 12 10 13 11 14 10 09 08 07 11 09 12 13 12 12 10 12 07 12 10 09 06 05 10 12 11 12 10 11 13 12 11 10 09 08 10 07 11 15 16 12 10 11 12 10 11 12 11 10 12 12 07 11 12 10 12 09 04 Estos datos pueden ser fácilmente procesados con el software estadístico SPSS; para ello con la versión 15.0, desarrolle los siguientes pasos: 1. Abra su editor SPSS, y en Vista de variables ; defina la variable con las siguientes características: N o m b r e: Estadística Tipo : Numérico Ancho :8 Decimales :2 Etiqueta : NotaEstadistica Ahora ya tiene definido el tipo de variable que utilizará para introducir sus datos. 2. Pulse la opción Vista de datos , y en cada celda de la columna definida como Es tad íst ic a , escriba consecutivamente los números proporcionados en el ejemplo, hasta culminarlo. 3. Grabe su archivo; para ello en el menú principal: Archivo Gu ardar escriba NotaCurso, el cual se grabará con la extensión NotaCurso.sav 4. Ahora se obtendrán los datos ya procesados; para ello en el menú principal busque la opción Transformar Recodificar en distintas variables , aparecerá una nueva ventana de Recodificar en distintas variables con la palabra NotaEstadistica resaltada en color azul; pulse el botón derecho para ingresarlo a la ventanita de Var de entrada → Var de resultado ; luego al pie de N o m b r e escriba NotaEstadistica y en Etiqueta escriba NotaFinal , luego pulse sucesivamente los botones Cambiar y Valores antiguo s ; enseguida aparecerá una nueva ventana Recodificar en distintas var iables valo res antiguos y v alores n uevos ; en esta ventana se ingresará los valores proporcionados de acuerdo a un número de clases, previamente se deberá definir el número de clases, así como su respectivo ancho: como se tienen 58 valores, el número de clases que le corresponde es de siete, con ancho de clase = = 1,8; con esta información se hace clic en el botón Rango , y se escribe el valor de la primera clase: 4.0, hasta 5.8, luego en la ventana del lado derecho donde dice Valor nuevo , al costado de valor , se escribe la marca de clase, en este caso 4.9, enseguida se pulsa el botón A ñad ir ; repita nuevamente el proceso desde rango introduciendo ahora el valor de la segunda clase de: 5.9 hasta 7.7, luego en Valor escribir su marca de clase 6.8, luego añadir y así sucesivamente hasta completar la última clase que es de 15.4 hasta 17.2 con marca de clase 16.3; finalizado esto se pulsa el botón Continuar , opción que permite volver a la ventana anterior; en esta ventana pulsar el botón Aceptar y aparecerá el editor de datos del SPSS, con una nueva columna de datos definida con NotaEstadistica , en el cual se muestran todos los datos reclasificados según las clases definidas. Con estos datos ya reclasificados pueden obtenerse sus respectivos gráficos u obtener otras informaciones, como se podrá ver más adelante. Cuad ro de 5. Para determinar su histograma se va a la ventana principal y pulsar Gráfic o diálogos antiguos Histogram a ; en esta última aparece la ventana de histograma dos Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 31 d e 92
nombres de Variables y Etiqueta : NotaEstadistica ; con este nombre resaltado en azul se pulsa la opción Variable , para ser introducido en su ventana, y luego se pulsa el botón Aceptar para observar el histograma como el mostrado a continuación: Histograma y curva de tendencia de nota final de Estadística y Probabilidades Normal 25
20
15 a i c n e u c e r F
10
5
Media =10.21 Desviación típica =2.185 N =58
0 5.00
7.50
10.00
12.50
15.00
NotaFinal
6. Para obtener su curva de tendencia, estando el puntero dentro del gráfico del histograma, se pulsa el botón derecho del ratón donde aparecerá el Edi to r de gr áfic os , en el cual se muestran una serie de opciones como para mejorar la presentación del gráfico, tal como el color de fondo, las etiquetas, el enmallado, leyendas, etc., tal como puede apreciar en el gráfico presente.
DISTRIBUCIÓN ASIMÉTRICO POSITIVO Ejemplo 2.2 Considere que los alumnos del curso de Estadística y Probabilidades, el pasado ciclo, desarrollaron una encuesta en la provincia de Huaura, a fin de conocer los ingresos mensuales de los trabajadores de este lugar; para ello diseñaron una encuesta, y aleatoriamente seleccionaron una muestra de un grupo de trabajadores, a quienes se les pidió que por favor, dijeran cuán era lo que percibían mensualmente por su trabajo; los datos obtenidos por cada trabajador se muestran, en Nuevos Soles, se muestran a continuación: 800 950 1200 3500 4200 1000 780 950 1000 1300 1400 1010 1200 2050 2100 1800 1700 1900 1100 1200 1300 1250 1520 2500 3100 1200 1500 1400 1600 1800 1900 2600 3400 2800 3100 4300 2050 1780 1920 1700 1430 1300 1600 1000 970 1020 1800 1080 1100 950 790 4100 3200 1754 1350 2345 2600 1470 1500 1300 1200 1800 y 1100, respectivamente. Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 32 d e 92
Observando el número de datos se obtiene 63, sueldos mensuales de los trabajadores de la provincia de Huaura; por lo tanto para construir su histograma de frecuencias, se deberá determinar el número de clases; esto es K = 1 + 3,3 log(N) = 7 clases; el ancho de clase será: (Mayor valor – menor valor)/ 7 = 502,8 ≈ 503. La tabla que muestre estos datos de acuerdo a su distribución de frecuencias, será: Tabla 2.1 Distribuc ión de ingresos m ensuales de una mu estra de trabajadores d e la prov incia de Huaura, en el año de …..
N° clase I 1 2 3 4 5 6 7
Ancho clase S/
de Marca de clase
780 - 1283 1284 – 1787 1788 – 2291 2292 – 2795 2796 – 3299 3300 – 3803 3804 – 4307
xi 1031.5 1535.5 2039.5 2543.5 3047.5 3551.5 4055.5
Número Proporción Número observado de observada de acumulado trabajadores trabajadores de Trabajadores f i hi Fi
Proporción acumulada de trabajadores Hi
Fuente: ……………….
El alumno deberá llenar esta tabla manualmente, con el cual, posteriormente deberá determinar su curva de tendencia. Uso del SPPS para procesar estos datos. 1. Abra su editor y cree un archivo con el nombre de SueldoHuaura. 2. Defina la variable ST como numérica, ancho 8, cero decimales, y en etiqueta, defínalo como SueldoTRA. 3. Introduzca los 63 datos, haciendo clic en vista de datos tal como se lo ha proporcionado, en la columna correspondiente de ST. 4. Vaya al menú principal Transformar Recodificar en distint as variables y en la ventana de Recodificación de v ariables Var salida arrastre Sueldo[ST] hacia la ventana Var. entrada , luego en la sección de Variable de resultado , asigne a N o m b r e SueldoTrabajador y en Etiqueta escriba Sueldo2012, luego pulse botón cambiar y aparecerá ST SueldoTrabajador, ahora nuevamente pulse el botón Valores antiguos y nuevos …..donde ingresará a la ventana de Recodificación de distintas variables en Variables antiguas y nuevo s . En esta ventana deberá introducir la información respectiva a cada clase; para ello donde dice Rango , escriba el primer valor de la clase, en este caso 780, y en Hasta : 1283, y donde dice Valor nuevo , escriba el número de la marca de clase, de este rango: 1031.5, luego pulse el botón A ñad ir y aparecerá 780 thru 1283 1031.5; repita este proceso de nuevo para seguir introduciendo las otras clases; finalmente cuando ha terminado de introducir estas nuevas definiciones, pulse el botón Continuar y Aceptar . Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 33 d e 92
5. Vaya al menú principal para ver su histograma: Gráficos Cuadro de diálogos antiguos Histograma; en este caso, en la ventana, aquí lleve Sueldo2012[SueldoTrabajador] a la ventana de Variable y pulse aceptar; aparecerá el siguiente histograma, con las características siguientes: RECODE ST (780 thru 1283=1031.5) (1284 thru 1787=1535.5) (1788 thru 2291=2039.5) (2292 thru 2795=2543.5) (2796 thru 3299=3047.5) (3300 thru 3803=3551.5) (3804 thru 4307=4055.5) INTO SueldoTrabajador . VARIABLE LABELS SueldoTrabajador 'Sueldo2012'. EXECUTE . GRAPH /HISTOGRAM=SueldoTrabajador . 25
20
15 a i c n e u c e r F
10
5
Media =1783.50 Desviación típica =848. 55 N =63 0 0.00
1000.00
2000.00
3000.00
4000.00
5000.00
Sueldo2012
__
6. Como podrá ver en este histograma, los ingresos de la muestra de los trabajadores de la provincia de Huaura, tiene una tendencia asimétrico positivo, siendo que la mayoría de las personas están ganando menos del promedio S/ 1783. 7. Si desea información complementaria, vaya Analizar Estadístic os d escr ipti vo s Descriptivos , y le proporcionará la siguiente tabla: Estadísticos descriptivos N Sueldo2012 N válido (según lista)
63 63
Mínimo 1031.50
Máximo 4055.50
Media 1783.5000
Desv. típ. 848.55003
8. Si desea otras informaciones estadísticas, nuevamente vaya a Analiza r Est adíst ico s descriptivos Frecuencias , y en esta ventana traslade Sueldo2012[SueldoTrabajador] a la Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 34 d e 92
ventana de Variables ; ahora tiene la opción de seleccionar los botones Est ad íst ic os o Gr áfi c o s ; si pulsa el segundo botón, podrá escoger entre gráficos de: barras, sectores o histogramas; si escoge sectores , puede representar los datos en porcentaje o en valores absolutos; una vez hecho esto, pulse el botó Continua r, y si desea sus medidas estadísticas, pulse el botón Es tad íst ic os , con los cuales podrá obtener sus principales medidas estadísticas como: Cuartiles, Percentiles, Medidas de tendencia central , medidas de dispersión , y sus medidas de distribución; finalmente pulse el botón Aceptar , y obtendrá informaciones como se les muestra, claro está, habiendo escogido la opción respectiva. Sueldo2012
Válidos
1031.50 1535.50 2039.50 2543.50 3047.50 3551.50 4055.50 Total
Frecuencia 22 18 10 4 4 2 3 63
Porcentaje 34.9 28.6 15.9 6.3 6.3 3.2 4.8 100.0
Porcentaje válido 34.9 28.6 15.9 6.3 6.3 3.2 4.8 100.0
Distribución de sueldos porcentuales de los trabajadores de
Porcentaje acumulado 34.9 63.5 79.4 85.7 92.1 95.2 100.0
la provincia de Huaura el año 2012
4.8
1031.50 3.2
1535.50 2039.50
6.3
2543.50 3047.50 3551.50 6.3
4055.50 34.9
15.9
28.6
__
Guía de Prácticas de Estadística y Probabilidades
Gráfico de sectores
Ciclo 2012-II
__
Prof. Moisés E. Armas
Pági na 35 d e 92
DISTRIBUCIÓN ASIMÉTRICO NEGATIVO Ejemplo 2.3 Considere que en una evaluación sobre el nivel de colesterol en la sangre de un grupo de pacientes, que acudieron a un hospital, arrojaron los siguientes resultados:185 178 218 283 186 243 263 237 254 200 199 187 230 218 233 240 254 265 272 187 203 252 234 254 254 267 245 248 255 265 243 236 246 254 265 261 252 255 235 248 270 278 243 265 259 248 240 233 227 231 230 222 217 249 256 261 275 200 220 228 245 231 244 255 258 219 223 225 177 y 189 mg/dl. Haciendo en forma manual y luego con la ayuda del SPSS, construya su tabla de distribución de frecuencias, encuentre y explique las características de las observaciones encontradas, si el nivel de colesterol de una persona en la sangre, en condiciones normales, debe ser a lo más de 200 mg/dl.
EJERCICIOS 2.1. Proporcione el concepto de los siguientes términos: a) Frecuencia absoluta y frecuencia relativa. b) Ojiva. c) Curva de tendencia. d) Distribución asimétrica positiva y negativa. e) Histograma de frecuencias relativas. f) Diagrama de troncos y diagrama de hojas. 2.2. ¿Cuál es el criterio de clasificar un conjunto de datos de tipo cuantitativo? 2.3. Tome una muestra aleatoria de 52 alumnos del cuarto año de secundaria, que estudian dentro de la ciudad donde habita y averigüe su talla metros; luego clasifique estos datos y con ello desarrolle: a) Una representación gráfica que usted conozca (diagrama de barras, diagramas circulares, diagramas de troncos, diagrama de hojas, etc.) b) Su tabla de distribución de frecuencias. c) Su histograma de frecuencias relativas y su curva de tendencia. d) ¿Qué proporción de alumnos medirán entre 1,48 y 1,53 metros? e) Si el 5% de los alumnos miden más de 1,55 metros, ¿cuántos de ellos estarán comprendidos dentro de esta escala? 2.4. Una muestra de un grupo de trabajadores ambulantes que vendían en el mercado de “La Parada” de la ciudad de Huacho, registrado un día domingo, del mes de mayo del presente año, mostró que diariamente cada uno de los entrevistados decían obtener como ingresos totales, en Nuevos Soles, los siguientes montos: 125 150 87 45 201 78 83 112 140 132 231 209 110 100 200 65 42 45 56 89 123 156 182 176 171 200 154 125 108 154 87 65 90 99 123 111 165 87 132 204 250 162 170 100 100 80 55 68 73 114 115 80 125 152 178 232 162 185 110 105 82 80 90. a) Explique el tipo de variable utilizada, así como la escala de medida. b) Utilice el SPSS para procesar estos datos. Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 36 d e 92
c) Construya una tabla de distribución de frecuencias explicando sus principales características. d) Interprete el significado de f 2, h3, F4, H6. e) Presente un gráfico de tipo cualitativo indicando sus principales características. f) Explique las características de su curva de tendencia. g) De la tabla obtenida, determine, el porcentaje de ambulantes cuyos ingresos diarios sean superiores a S/ 125. h) ¿Cuántos ambulantes pasan penurias económicas, si se sabe que para estar en estas condiciones, debe obtenerse un ingreso diario, menor de S/ 60? i) ¿Qué porcentaje de ambulantes tendrán ingresos diarios comprendidos entre los S/ 103 y S/ 139? j) ¿Si el ingreso mínimo diario, para estar considerado dentro de los “regulares” es de S/86, cuántos ambulantes estarán considerados dentro de esta categoría? k) Si la municipalidad decide aplicar un impuesto por ganancia extra a los ambulantes que tienen ingresos diarios superiores a S/ 167, ¿Qué porcentaje de ambulantes se verán afectados con esta sobre tasa? 2.5. Debido a los avances de la ciencia y la tecnología, las personas que adquieren sus equipos de cómputo tienden a renovarlos a lo más dentro de cinco años, después de haberlos comprado; la siguiente tabla de distribución de frecuencias, presenta de una manera incompleta, las características de este proceso: Tabla 2.1 Tiempo de renov ación de una muestra de equipos d e PC, de las
N°
1 2 3
Tiempo de renovación de las PC en años
xi
Cantidad de PC renovadas 12
4 5 6 7
familias usuarias de …..
Proporción de PC renovadas
Cantidades acumuladas de PC renovadas
Proporción acumulada de PC renovadas 0,096
38 0,320 0,784 14 120
a) Complete las celdas vacías de esta tabla. b) Explique las características de las variables utilizadas. c) Construya su histograma de frecuencias relativas. d) ¿De qué manera puede construirse sus diagramas de árbol y de hojas? e) Explique el significado de su curva de tendencia del comportamiento de renovación de las PC. f) Construya su curva de frecuencias acumuladas. g) ¿Cuántas PC son renovadas después de los tres años? h) ¿Qué porcentaje de PC se renuevan después de los cuatro años? i) ¿Qué porcentaje de PC se renuevan entre los dos y tres años y medio? j) Si solamente el 3% de las PC se renuevan antes del año, ¿cuántas PC cumplen con estas características? Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 37 d e 92
2.6. Con la finalidad de conocer el comportamiento de las estaturas en metros de la población de la provincia de Huaral, se toma una muestra de un grupo de ellos, comprendidas entre los 15 y 50 años de edad, y se les toma sus respectivas tallas, encontrándose los siguientes resultados : 1,73, 1,65, 1,48, 1,51, 1,78, 1,67, 1,65, 1,58, 1,59, 1,61, 1,76, 1,65, 1,45, 1,62, 1,59, 1,47, 1,56, 1,67, 1,79, 1,85, 1,73, 1,70, 1,71, 1,59, 1,62, 1,65, 1,49, 1,45, 1,47, 1,48, 1,45, 1,80, 1,68, 1,64, 1,56, 1,69, 1,65, 1,52, 1,56, 1,63, 1,49, 1,50, 1,52, 1,67, 1,66, 1,69, 1,74, 1,77, 1,63, 1,61, 1,59, 1,60, 1,47, 1,51, 1,54, 1,73, 1,73, 1,70, 1,80, 1,89 metros respectivamente: a) Presente una tabla explicativa de estos datos. b) Construya un diagrama de árbol, y otro de hojas. c) Construya una tabla de distribución de frecuencias. d) Interprete el significado de f 2, h3, F4, H6. e) Construya su curva de tendencias, explicando sus principales características. f) ¿Qué porcentaje de personas tienen estaturas mayores de 1,75 m.? g) ¿Cuántas personas miden entre 1,62 y 1,76 m.? h) Se estima que solo el 5% de las personas son menores de 1,47 m; ¿cuántas estarán consideradas dentro de esta estatura? i) ¿Qué proporción de personas medirán entre 1,51 y 1,73 m.?
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 38 d e 92
TERCERA SEMANA MEDIDAS DE TENDENCIA CENTRAL
DIAGRAMA DE CAJA Un diagrama de caja se utiliza para poder apreciar gráficamente el comportamiento de la distribución de los datos; se representa mediante un rectángulo, donde sus extremos denotan el pecentil 25 y el percentil 75. El percentil 50, va dentro del rectángulo; cuanto más cerca está al percentil 25, o cuanto más cerca está al percentil 75, indicará que la distribución de los datos son asimétricos; en cambio cuando éste percentil está en el centro del rectángulo, indica que los datos se distribuyen simétricamente. Los extremos inferior y superior fuera de la caja, indican los valores mínimos y máximos de los datos obtenidos. Ejemplo 3.1 Presentación de u n Diagrama de caja . Abra su archivo grabado con el nombre Edad2012.sav, luego vaya al menú principal: Analizar Estadístico s descript ivos Explorar al aparecer el Exp lorad or de Gr áfico s en la opción Diagramas de caja , haga clic en Niveles de los factores juntos, luego pulsar Continuar y Aceptar ; aparecerá la figura siguiente: 100
80
60
40
20
0
__
Edad
Ejemplo 3.2 Continuando con los datos de la tabla del Ejemplo 2.2, haciendo uso del SPSS, abra su archivo grabado con el nombre de SueldoHuaura2012.sav , de donde obtendrá sus principales medidas estadísticos como: Media, Mediana, Moda, y los Percentiles 10, 20, 25, 40, 50, 70 y 90; Frecuencias , y al pulsar ésta última, lleve para ello haga: An alizar Estadísticos descrip tivos Sueldo2012[SueldoTrabajador] a la ventana de Variables , y luego pulse el botón Frecuencias , donde podrá obtener las siguientes medidas estadísticas: Valores percentiles: Cuartiles y Percentiles; en Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 39 d e 92
Dispersión: Desviación típica, Varianza y Amplitud; en Tendencia central : Media, Mediana y Moda; Distribución, su índice de Asimetría y su índice de curtosis, como lo mostrado a continuación:
en
Estadísticos Sueldo2012 N
Válidos Perdidos
Media Mediana Moda Desv. típ. Varianza Asimetría Error típ. de asimetría Curtosis Error típ. de curtosis Rango Mínimo Máximo Suma Percentiles
10 20 25 40 50 70 75 90
63 0 1783.5000 1535.5000 1031.50 848.55003 720037.16 1 1.271 .302 .899 .595 3024.00 1031.50 4055.50 112360.50 1031.5000 1031.5000 1031.5000 1535.5000 1535.5000 2039.5000 2039.5000 3047.5000
Su diagrama de caja.
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 40 d e 92
5000.00
52
5 36
4000.00
3000.00
2000.00
1000.00
Sueldo2012
:
Diagrama de caja, mostrando la distribución de los sueldos de los trabajadores de la provincia de Huaura, el año 2012
__
EJERCICIOS 3.1. En la facultad de ingeniería de la universidad, compuesta por alumnos de informática, sistemas e industriales, se toma una muestra de 200 alumnos, del cual se obtiene que en el grupo de alumnos de industriales, su promedio de notas durante el ciclo 2011-I fue de 12,4, en tanto que en el grupo de sistemas fue de 13,1; también se supo que el promedio general del grupo total de alumnos fue de 12,47 y la nota promedio del grupo de los alumnos de industriales y de sistemas fue de 12,831; determine la cantidad de alumnos por grupo, así como el promedio de nota de los alumnos de informática. 3.2. Se hace una encuesta a un grupo de ingenieros industriales con la finalidad de conocer su tiempo de experiencia profesional en años en los sectores donde se desempeñaban; los resultados de esta encuesta mostraron los siguientes resultados: 4,3 5,6 2,5 1,8 5,6 3,5 2,7 2,9 2,1 3,2 2,7 6,3 y 2,6, años, respectivamente. Determine: a) Tiempo promedio de experiencia laboral. b) Tiempo medio de experiencia laboral. c) ¿Qué tiempo de experiencia laboral es el más común en este grupo de ingenieros? d) ¿Qué puede concluir respecto al promedio y la media, de experiencia laboral? e) ¿De qué manera se distribuyen estos datos? f) Si al tiempo de experiencia laboral de estos profesionales, se les incrementa en dos años, ¿de qué manera se verán afectadas, sus medidas de tendencia central? 3.3. En un estudio relacionado con las notas promocionales del curso de ESTADISTICA Y PROBABILIDADES de los alumnos de ingeniería de sistemas, durante el ciclo pasado, mostró los siguientes resultados: 08,5 10,4 12,3 15,1 07,7 09,9 10,2 13,2 08,6 09,4 10,2 11,5 12,2 04,4 05,2 11,2 10,3 09,3 08,2 09,9 10,1 07,6 08,2 05,3 06,6 12,4 11,3 11,2 10,6 09,9 09,8 08,2 05,8 08,3 09,2 08,3 09,2 10,5 12,1 13,2 16,3 14,2 10,3 10,1 Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 41 d e 92
09,5 07,9 09,6 07,7 10,3 08,4 08,8 13,2 11,2 10,6 12,1 10,5 09,2 09,4 08,8 09,6 10,7 13,3 10,5 11,0 10,0 10,1 09,7 09,3 09,2 08,1 06,6 07,2 08,4 13,2 11,2 14,6 15,4 13,8 12,7 10,6. De acuerdo a ello, haga lo siguiente: a) Construya la tabla de distribución de frecuencias y analice su curva de tendencia. b) Construya su diagrama de cajas. c) Construya su diagrama de hojas. d) Si la nota aprobatoria del curso es mayor igual a 10,5, haciendo uso de su tabla de distribución de frecuencias, diga, ¿Qué porcentaje de alumnos aprobaron el curso? e) ¿Qué porcentaje de alumnos están desaprobados? f) ¿Qué porcentaje de alumnos tienen notas mayores de 13,0? g) Determine sus medidas de tendencia central, ¿cuál de ellos es el mayor? h) ¿Por qué el promedio de notas no podría ser considerado como un buen indicador para hacer los análisis? i) ¿Qué significaría que la curva de tendencia de estas notas siguiera una distribución simétrica? j) Determine y explique las características de sus cuartiles. k) Explique el significado de los deciles 3 y 7. l) Explique el significado de los percentiles: 23, 37, 48, 62, 73. m) Determine las principales medidas de variabilidad. n) Si un alumno de ingeniería informática, tiene nota 10,6, donde el promedio general es de 10,4 con una desviación estándar de 2,4, ¿cuál de los alumnos está mejor?, ¿el de sistemas o el de informática, sabiendo que este último tiene en el mismo curso, 10,8? o) Construya y explique las características de su diagrama de caja. 3.4. Considere que en una reunión están reunidos un grupo de personas, cuyas edades en años son: 32, 45, 65, 34, 26, 18, 20, 27, 31, 29, 44 y 59, respectivamente: a) Determine las medidas representativas de la edad de estas personas. b) Determine los cuartiles de las edades de estas personas. 3.5. ¿Qué sucederá con el promedio y la media, si a un conjunto de observaciones se: a) Le suma una constante cualquiera. b) se le multiplica por una constante cualquiera. c) Se le multiplica por una constante cualquiera y a éste nuevo valor, se le suma otra constante. 3.6. Explique la diferencia existente entre la media aritmética y la media ponderada. 3.7. ¿Qué relación tiene la media, la mediana y la moda en una distribución de frecuencias asimétrica? 3.8. En un laboratorio farmacéutico existen 120 trabajadores conformados por obreros y empleados, quienes perciben mensualmente, en promedio, S/ 2 780 y S/ 3 440 mensuales; si el promedio general del grupo es de S/ 3 000 mensuales, determine el número de obreros y empleados. R: 80 y 40. 3.9. Haciendo uso de la ojiva de frecuencias, deduzca la fórmula de la mediana. 3.10. Una gran empresa cuenta con una plana de 40 profesionales varones que ganan en promedio mensualmente S/ 3 400 y 22 profesionales mujeres que en promedio ganan 15% menos que los varones; determine el ingreso promedio del conjunto de todos los profesionales que trabajan en esta empresa. Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 42 d e 92
3.11. Según reportes observados en el Peaje de Huacho, un determinado par de días pasaron por caja 5 760 vehículos, entre ligeros y pesados, los vehículos ligeros pagaron en promedio S/ 5,50 por peaje, en tanto los pesados S/ 16,50; determine el número de vehículos por cada grupo que circularon por ese lugar, en el tiempo observado, si el promedio general pagado por vehículo ascendió a S/ 10,39; además diga el monto recaudado. 3.12. En una empresa los obreros ganan un salario mensual, que en promedio bordean los S/ 1 500, en tanto que los empleados ganan un sueldo mensual que en promedio están en los S/ 2 000. ¿Qué relación de obreros a empleados debería existir, si se deseara que el promedio general de las remuneraciones mensuales de estos trabajadores fuese de S/ 1 600 mensuales? R. 4:1 3.13. De la siguiente tabla de frecuencias: Clase Frecuencia 3,57 – 4,56 2 4,57 – 5,56 K 5,57 – 6,56 86 6,57 – 7,56 8k 7,57 – 8,56 45 8,57 – 9,56 3k 9,57 – 10,56 5 Calcule el valor de k si el promedio de estas observaciones es de 7,065; además determine: a) Histograma de frecuencias relativas y su respectiva curva de tendencia b) Mediana y moda. R: k = 8; b) 7,12 6,90 c) Construya y analice su diagrama de caja. 3.13. Una tabla de distribución de frecuencias compuesto de 150 observaciones, está dividido en cuatro clases cuyos extremos son 100 y 800; si la frecuencia relativa de la primera clase es 0,20, el número de observaciones de la segunda clase es 45, y la frecuencia acumulada de la tercera clase es 90, construya su tabla de distribución de frecuencias y determine: a) Sus medidas representativas. b) Los percentiles 24 y 42. c) Si a todos los elementos de esta tabla, se le añade una constante, ¿de qué manera variarán sus medidas representativas?
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 43 d e 92
CUARTA SEMANA MEDIDAS DE VARIACIÓN
CURTOSIS La curtosis determina la forma en que se presenta una curva de campana; cuando ésta es delgada, se dice que es leptocúrtica, cuando es achatada, se dice que es platicúrtica, y cuando no es ninguna de estas, se dice que es mesocúrtica. Este índice se mide con: K = - 0,5; así si K 0, la curva se va aproximando a un distribución normal; si K 0,5, la curva es leptocúrtica, y si k -0,5, la curva es platicúrtica.
RELACIÓN ENTRE EL PROMEDIO, LA MEDIANA Y LA MODA En una distribución simétrica el promedio, la mediana y la moda son iguales. Se puede tener una idea de qué manera se va comportando una distribución de frecuencias, calculando su índice de asimetría As: así, As = ; sí As es positivo, la distribución es asimétrico positivo, y cuanto más grande sea este valor, la cola derecha de la curva de campana se irá deformando más; si As es negativo, la distribución es asimétrico negativo, y cuanto más pequeño sea este índice, mayor será la deformación de la cola izquierda de la campana. Ejemplo 4.1 La siguiente tabla, muestra una distribución de frecuencias incompletas, relativa sobre los pesos de un grupo de niños de un centro educativo escolar de nivel primario, los que varían entre los 5 kg y los 52 kg: Nivel de pesos en kg de los niños 5 – 12 > 12 – 19 > 19 – 26 > 26 – 33 > 33 – 40 > 40 – 47 > 47 – 54 >
xi
Número de niños f i 3 8 4k 25 7k 9 2
a) Complete la columna de nivel de pesos en kg de los niños, y luego halle el valor de k
si el promedio de los pesos totales de estos niños fue de 30,20 kg. b) Explique cuantitativamente las características de su curva de tendencia. c) Construya y analice su diagrama de caja. Solución:
a)
K se determina: Promedio = = = 30,20; siendo x la marca de clase, luego determinándole por cada clase y reemplazando dentro de la sumatoria se
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 44 d e 92
obtiene la expresión indicada y despejando se obtiene k = 3. Con este valor puede construirse la tabla de distribución de frecuencias, base para hallar sus medidas de tendencia central; así como construir la curva de tendencia. b) Características de su curva de tendencia de manera cuantitativa: Se construye su gráfico y se determina su índice de asimetría; para ello deberá determinarse previamente su desviación estándar: s = 9,49 kg; la moda es = 31,35 kg y su índice de asimetría = -0,121; este valor indica que la distribución de los pesos de los niños tiene distribución asimétrica negativa, estando el mayor número de pesos concentrados hacia la derecha de su promedio; como este índice está cerca a cero, la curva tiende hacia una curva de campana o curva simétrica. c) Con el diagrama de caja se puede confirmar la asimetría de la distribución de los datos: P75 = 37,00 kilos; P 25= 24,25 kilos; P 50= 30,76 kilos, graficando estos valores en una escala dentro de la caja, se puede observar que la mediana está más próximo al P 75, a 37,00 – 30,76 = 6,24 kg; en cambio está más lejos que el P 25, a 30,76 – 24,25 = 6,54 kg, con lo cual se confirma la asimetría negativa; sin embargo es preciso observar que estas dos diferencias no son tan significativas, entendiéndose que esta distribución tiende a una simétrica. Maximo valo r P75
Mediana
P25
Minimo Valor
Ejemplo 4.2 La siguiente tabla proporciona información respecto a las estaturas de los alumnos de un centro educativo de nivel primario, registrado en la provincia de Huaura, durante el mes de junio del presente año: Tabla : ………
Clase
Amplitud en metros
1 2 3 4 5 6 7
1,31 – 1,35 1,35 – 139 1,39 – 1,43 1,43 – 1,47 1,47 – 1,51 1,51 – 1,55 1,55 – 1,59
N° N° alumnos Proporción Proporción alumnos acumulados de acumulada alumnos alumnos 7 7 0,1186 0,1186 13 20 0,2203 0,3389 18 38 0,3051 0,6440 8 46 0,1356 0,7796 7 53 0,1186 0,8982 5 58 0,0847 0,9829 1 59 0,0169 1,0000
Fuente: ………….. Elaboración: ……………
Analice las características proporcionadas en esta tabla. Solución: Al construir su curva de tendencia, podemos apreciar, que esta sigue una tendencia
asimétrica positiva; a grosso modo, se puede apreciar que gran parte de estos alumnos son de Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 45 d e 92
tallas bajas, si se considera que la talla normal de estos estudiantes debe ser mayor de 1,43 metros; sin embargo para darle una apreciación cuantitativa se harán los siguientes análisis: a) Promedio de estatura de los alumnos: 1,42 mt. Estatura media de los alumnos: 1,41 mt. Estatura con mayor frecuencia: 1,40.
b) c) d) e) f)
g)
En un distribución asimétrica positiva, el promedio es mayor que la media y la moda; por lo tanto queda confirmado la suposición inicial de que la tendencia de las estaturas de estos alumnos sigue la distribución supuesta. Analizando estos resultados, puede concluirse que el 50% de los alumnos miden menos de 1,41 mt., siendo el promedio 1,42 mt., de igual manera se puede manifestar que la mayoría de los alumnos miden 1,40 mt, menos del promedio, etc. Si nos interesara saber qué proporción de alumnos miden menos de 1,43 mt. de la tabla mostrada puede apreciarse que estos son del 64,40% El P25 = 1,37 mt., explica que menos del 25% de los alumnos miden esta estatura. El P75 = 1,46 mt., explica que menos del 75% de los alumnos miden esta estatura. Con estos datos pueden seguirse analizando utilizando otros indicadores como la desviación media, la varianza, la desviación estándar, la desviación cuartílica, coeficiente de variabilidad, variable estándar, Índice de asimetría, kurtosis, etc. Se deja como tarea a los alumnos determinar estos indicadores. Si de otro colegio, donde el promedio de estatura de los alumnos con las mismas características es de 1,44 mt., y una desviación estándar de 0,045 mt., se selecciona al azar a un alumno donde su talla es de 1, 46 mt, y se lo compara con un alumno cualquiera, del colegio en mención, cuya talla es 1,44 mt., ¿cuál de los alumnos está en mejor posición respecto a su respectivo colegio, y en cuál de los colegios, hay mayor uniformidad de tallas?
EJERCICIOS 4.1.
Debido a los avances de la ciencia y la tecnología, las personas que adquieren sus equipos de cómputo tienden a renovarlos a lo más dentro de cinco años, después de haberlos comprado; la siguiente tabla de distribución de frecuencias, presenta de una manera incompleta, las características de este proceso: Tiempo de renov ación de equipo s de PC
Tiempo de renovación de PC en años
Nº de PC renovadas
Nº acumulado Proporción de de PC renovadas Proporción
Nº
Acumulada de PC renovadas
PC renovadas
1 2 3 4 5 6 7
12
0,096 38 0,320 0,784
14
Guía de Prácticas de Estadística y Probabilidades
120
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 46 d e 92
k) l) m) n) o) p) q) r) s) t) u) v) w)
Complete las celdas vacías de esta tabla. Explique las características característic as de su curva de tendencia. Construya su curva de frecuencias acumuladas. ¿Cuántas PC son renovadas después de los tres años? ¿Qué porcentaje de PC se renuevan después de los cuatro años? ¿Qué porcentaje de PC se renuevan entre los dos y tres años y medio? En promedio, ¿cada cuánto tiempo son renovadas las PC? ¿Cuál es el tiempo medio de renovación de las PC? PC? ¿Con qué frecuencia de tiempo mayor se renuevan las PC? Explique las características característic as de su desviación cuartílica. Explique las características característic as de su coeficiente de variabilidad. Si una PC se renueva a los 3,4 años, ¿cuál es es su coeficiente estándar? Si en Chimbote una PC se renueva dentro de los los 3,2 años, cuando el promedio de renovación es de 2,87 años, con una desviación estándar de 2,04 años, ¿en cuál de los lugares hay mayor renovación? x) Construya y explique el significado signific ado de su diagrama de cajas. y) Explique el significado de su coeficiente de asimetría y su coeficiente de kurtosis. 4.2. En Lima el promedio de gasto diario de alimentación, de las personas que están cerca a su centro laboral es de S/ 7,20 con una desviación estándar de S/ 3,15; en tanto que en uno de de los estados de los Estados Unidos, cuesta un promedio de $ 4,20 con una desviación estándar de $ 1,58. Pedro pagó por un menú en Lima, un determinado día S/ 10,50, en tanto que en un viaje a los Estados Unidos, al hacer uso de este servicio, pagó $ 5,25. ¿En cuál de los lugares hay mayor uniformidad de precios en los precios de los menús, y en cuál de los lugares, Pedro gastó más? 4.3. Los salarios mensuales que paga una empresa a sus trabajadores en dos turnos de trabajo tienen las siguientes características: Medidas Primer turno Segundo turno N° trabajadores 43 36 Sueldo promedio mensual S/ 1 150 1 100 Sueldo medio mensual S/ 1 280 1 250 Mayores remuneraciones S/ 1 296 1 315 Varianza de sueldos 45 893 52 467 a) Compare los salarios mensuales en los dos turnos desde el punto de vista de su coeficiente de variación, y diga ¿cuál de ellos presenta mayor uniformidad? b) ¿Cuál será el coeficiente coeficient e de variación para cada turno, si la empresa decide aumentarles a todos los trabajadores, para el próximo año, siguiendo el siguiente criterio: Al primer turno S/ 300 mensuales, y a los del segundo turno S/ 150 y 10% más, de acuerdo al promedio de sus ingresos actuales?; a) ¿En cuál de estos dos sistemas de aumento, le sería más conveniente aplicarlos a fin de no perjudicar los intereses de los trabajadores? c) Para satisfacer los aumentos en cada uno de estos turnos, ¿qué montos adicionales deberá destinar la empresa? d) ¿De qué manera se distribuyen los ingresos de los grupos de trabajadores?
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 47 d e 92
QUINTA Y SEXTA SEMANA CÁLCULO DE PROBABILIDADES
EXPERIMENTOS En estadística, cuando se quiere conocer alguna característica de una población, no se trabaja con todos sus elementos; se toma una muestra pequeña, y con estos elementos muestrales se desarrollan una serie de ensayos o experimentos, con los cuales más adelante podrán extraerse conclusiones, válidas para toda la población. Los resultados de estos experimentos están sujetos al azar, es decir no se sabrá realmente de antemano qué podría suceder al hacer tal experimento, aunque supuestamente podría estimarse lo que si podría suceder. El número de resultados posibles del experimento se llama su espacio muestral.
EVENTOS Los eventos constituyen los resultados específicos de un espacio muestral, por lo tanto un evento es un sub conjunto del espacio muestral.; pueden haber eventos que nunca sucederán, en este caso, el evento es cero, como también puede suceder que sucedan todos los eventos, siendo en este caso, el número de eventos igual al espacio muestral; nunca el número de eventos será mayor que el espacio muestral.
NOCIÓN DE PROBABILIDAD Existen tres fuentes para definir el significado de probabilidad; la primera fuente explica la probabilidad como la proporción de ocurrencia de un evento; así si un experimento cuenta con 100 casos posibles, entonces la probabilidad de que ocurran cinco casos, será simplemente la razón de 5/100 = 0,05 ó 5%; en este caso, lo peor que podría suceder es que no ocurran ningún caso, siendo la probabilidad igual a cero, y en el mejor de los casos, podría suceder que todos los casos sucedan, entonces la probabilidad será de 1 ó 100%; esta forma de definir la probabilidad, se dice que tiene una base empírica, ya que su fuente es la observación o el experimento; sin embargo, no necesariamente hay que acudir a esta forma de estimar una probabilidad; también los fenómenos observados, pueden seguir ciertos comportamientos teóricos, como determinadas leyes matemáticas; en este caso, la fuente de probabilidad, tiene una base teórica, y no hay necesidad de estar haciendo observaciones o experimentando para hacer cálculos de probabilidades. En este último caso, algunos modelos teóricos, son la binomial, la normal, la Poisson, etc. También podría haber situaciones en que no es posible hacer cálculo de probabilidades por ninguno de estos dos métodos, ya que las condiciones no lo permiten; en este caso, el cálculo de probabilidades, se basará en el conocimiento y experiencia del investigador; así por ejemplo, ¿de qué manera se podría estimar la probabilidad de que en un determinado día llueve torrencialmente en la ciudad de Huacho? Si hay la necesidad de hacer estos cálculos, por el primer método sería imposible hallarlo, porque no hay ningún antecedente histórico de este suceso; por el segundo método tampoco hay forma de estimarlo, porque no hay leyes Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 48 d e 92
matemáticas que permitan explicar este fenómeno; entonces lo único que queda es hacer una estimación subjetiva, dependiendo quién lo hace; así un meteorólogo podría decir que esa probabilidad sería prácticamente cero, porque sabe que eso sería imposible, por las condiciones que se dan en el tiempo; en cambio, otra persona neófita podría dar un cierto valor, porque algunas veces ha visto en otros lugares que llueve así; esta última forma de hacer la estimación, se llama estimación subjetiva. En términos generales, la probabilidad de que ocurra un evento A, se define así: P(A) =
EVENTOS COMPLEMENTARIOS Si A es un evento y A´ su complemento, entonces la P(A) + P(A´) = 1.
LEY DE LA SUMA DE PROBABILIDADES Si A y B son dos conjuntos, ambos con elementos comunes, entonces P(A) ᴜ P(B) = P(A) + P(B) – P(A∩B).
A
Si A y B son eventos disjuntos, es decir que A y B no tienen ningún elemento en común, entonces P(A) ᴜ P(B) = P(A) + P(B)
B
B
A
PROBABILIDAD CONDICIONAL Si A y B son dos eventos, entonces la probabilidad condicional de que suceda A dado que sucedió , donde P(B) ≠0; de igual manera, la probabilidad condicional de B se denota por P(A/B) = que suceda B, dado que sucedió A se denota por (B/A) =
, donde P(A) ≠ 0.
MULTIPLICACIÓN DE PROBABILIDADES En el caso anterior, si P(A) y P(B) son diferentes de cero, entonces: a) P(A∩B) = P(A/B)*P(B), o b) P(A∩B) = P( B/A)*P(A) Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 49 d e 92
EVENTOS INDEPENDIENTES Si la ocurrencia de un evento no está condicionado a la ocurrencia del otro, se dice que los eventos son independientes, esto es si P(A/B) = P(A), o P(B/A) = P(A); luego del caso anterior: a) P(A∩B) = P(A)*P(B), b) P(A∩B) = P(B)*P(A)
Ejemplo 5.1 En el V ciclo Ing. Informática, de la Universidad, están matriculados 41 alumnos, de los cuales se sabe que 22 de ellos aprobaron el curso de ESTADÍSTICA Y PROBABILIDADES, y 20 aprobaron el curso de MATEMÁTICA III; además se sabe que solamente nueve aprobaron ambos cursos; determine la probabilidad: a) De que ninguno de ellos llevaron ambos cursos. b) Aprobaron ambos cursos. c) Solamente aprobaron ESTADÍSTICA. d) Solamente aprobaron MATEMATICA III. e) Si aprobó ESTADÍSTICA, también aprobó MATEMATICA III. f) Si aprobó MATEMATICA III, que también aprobó ESTADISTICA. Solución:
El diagrama de VENN es el siguiente:
E 13 8
M
9
11 s=41
S corresponde al tamaño del espacio muestral, luego n(S) = 8; E = 22 aprobaron el curso de ESTADISITICA y M = 20 aprobaron el curso de MATEMATICA III; la intersección de estos dos conjuntos (E∩M), significa que nueve aprobaron ambos cursos; los que están fuera de esta área común, dentro de los círculos, significa que solo aprobaron el curso de E o el curso de M. El número ocho, significa que ningunos de ellos llevaron estos cursos; por lo tanto: a) b) c) d) e)
Probabilidad de que ninguno de ellos llevaron ambos cursos: Prob(E M) = P(E)+P(M)-P(E∩M) = 80,45% Prob(solo E) = 31,71% Prob(soloM) = 26,83% P(E/M) = = =45,00%
f) P(M/E) ==
= 19,51%.
= 40,91%
Ejemplo 5.2 A la Plaza Vea, un cierto día acudieron un grupo de clientes, quienes luego de recorrer por los pasillos de los estantes optaron por hacer sus respectivas compras; estos clientes pagaron en efectivo o con tarjetas empresariales, según se puede apreciar conforme se muestra: Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 50 d e 92
Tabla Característic as de los clien tes qu e com praro n en la Plaza Vea
PAGÓ Contado (C) Tarjeta empresarial (T)
GENERO Hombre (H) 65 88
Mujer (M) 76 120
Se seleccionará al azar a un cliente; determine la probabilidad: a) Si es una mujer que haya pagado con Tarjeta empresarial. b) Si pagó con Tarjeta empresarial, que sea un hombre. c) Que sea una mujer. d) Si pagó con Tarjeta empresarial o al Contado que sea hombre. Solución: a) P(M/T) = c)
=
= 57,69%
P(M) = 56,16%
b) P(T/H) =
= 57,52%
d) P((T
=
=
= 100%
Ejemplo 5.3 Una casa comercial vende componentes y equipos de cómputo, de diversas características y marcas; tal es así, que sus PC y Laptop, tienen incorporados discos duros de las marcas SAMSUNG, MAXTOR e IMATION, conforme puede apreciarse en la siguiente tabla: Tabla Marcas incorporad as de disco duro de la s P C y La ptop
EQUIPO PC Laptop
MARCAS DE HD SAMSUNG MAXTOR 5 7 8 10
IMATION 11 14
Un cliente acude a esta casa comercial, observa y averigua las características de cada uno de ellos, y elige al azar uno de esos equipos; determine la probabilidad de que: a) Si seleccionó un equipo de cómputo con HD MAXTOR, que sea una Laptop. b) Si selecciona una PC, que tenga incorporado un HD SAMSUNG o IMATION. Solución:
a) P(HDMaxtor/Laptop) = b) P(PC/(Samsung
=
=31,25% =
= 42.10%
EJERCICIOS 5.1.
Una caja contiene tres bolas negras y dos bolas blancas; se extraerá sucesivamente dos bolas sin reponerla; construya su espacio muestral. 5.2. Se recibe a cuatro postulantes para ocupar una vacante en un nuevo puesto de trabajo; todos los postulantes han sido seleccionados correctamente y poseen buenas aptitudes para el Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 51 d e 92
puesto determinado, ¿de cuántas maneras puede seleccionarse a estos postulantes, para ocupar dicha plaza vacante? 5.3. Se recibe cinco laptops, sin saber si están en buenas o malas condiciones; construya su espacio muestral, considerando que se seleccionarán todas las laptops. 5.4. En un salón donde se imparte clases de francés, existen cinco hombres y cuatro mujeres; se va seleccionar tres personas al azar: a) Construya el espacio muestral de este grupo; b) Si solo se va seleccionar del grupo de los hombres, construya su espacio muestral; c) Si se va seleccionar el grupo de solo las mujeres, construya su espacio muestral. 5.5. Para viajar a Lima, desde Huacho, se dispone de tres posibilidades, y de allí, para ir a Ica, existen cuatro posibilidades, ¿cuántas posibilidades habrán para ir a Ica, partiendo de Huacho? 5.6. En la sala de cómputo hay cinco PC, dos impresoras y tres datas; se seleccionará al azar dos equipos, ¿cuál es su espacio muestral? 5.7. ¿Cuántos números de tres cifras se pueden formar con los números: 2, 4, 5, 7 y 1, sin que ninguno de estos números se repitan más de una vez? 5.8. En un nido escolar, un niño recibe 15 piezas de un rompe cabezas, de los cuales formará una figura geométrica con sólo siete piezas, ¿Cuántas figuras geométricas podrá formar? 5.9. En un accidente de tránsito, el chofer causante de la falta se dio a la fuga con su respectivo vehículo; un testigo circunstancial pudo distinguir solo las tres primeras letras de su placa y aseguró a la policía que ninguno de estas letras se repetían. ¿Cuántas listas de vehículos deberá buscar la policía a fin de encontrar al culpable, sabiendo que las placas tienen cinco letras? 5.10. ¿De cuántas maneras diferentes se puede ordenar en la Biblioteca de la Facultad, tres libros de Sistemas Operativos y cuatro libros de Lenguaje de Programación? 5.11. ¿De qué manera pueden obtenerse datos para estimar la probabilidad? Con ejemplos explique la naturaleza de cada una de ellas. 5.12. Explique el concepto de probabilidad conjunta. 5.13. Proporcione casos en los que se presenten probabilidades condicionales. 5.14. Explique el significado de probabilidad independiente; con ejemplos, ilustre su concepto. 5.15. Del salón de clases, se elegirá al azar a cuatro alumnos, con la finalidad de saber si aprenden o no el curso de Estadística: a) Señale su espacio muestral. b) ¿Cuál será la probabilidad de que dos alumnos aprenden el curso? c) ¿Cuál será la probabilidad de que solo un alumno aprende el curso? 5.16. Un grupo compacto está formado por siete personas, de los cuales cuatro son hombres y tres son mujeres; se va llamar sucesivamente al azar a tres de ellos, para ocupar tres cargos directivos; determine la probabilidad de que en esta llamada: a) el primero sea hombre; b) los primeros sean hombres; los tres sean hombres; c) la primera y la última sea una mujer; d) las dos últimas sean mujeres; e) los dos últimos sean hombres; f) todas sean mujeres; g) el primero sea un hombre, y la última sea una mujer. 5.17. Se van a formar una delegación de cuatro alumnos para conversar con las autoridades sobre los problemas académicos de la facultad; si en el salón hay 12 alumnos disponibles para ello, de los cuales cinco son mujeres, determine: a) El espacio muestral de este experimento. Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 52 d e 92
b) c) d) e) f)
¿De cuántas maneras se puede seleccionar a los hombres? ¿De cuántas maneras se puede seleccionar a las mujeres? ¿Cuál será la probabilidad de que la delegación esté integrado solo por mujeres? ¿Cuál será la probabilidad de que la delegación esté integrado solo por hombres? ¿Cuál será la probabilidad de que la delegación esté integrado mayoritariamente por hombres? g) ¿Cuál será la probabilidad de que la delegación esté integrado por parejas? 5.18. En un grupo de alumnos de informática, la probabilidad de que uno de los alumnos tenga una PC es de 0,25, la probabilidad de que tenga una data es de 0,03, y la probabilidad de que tenga un celular es de 0,76. Se va seleccionar al azar a uno de ellos; estime la probabilidad de que tenga simultáneamente todos esos equipos. 5.19. En una fila de clientes al cajero de la ventanilla de un banco, 15 personas están esperando su respectivo turno, de los cuales 8 son mujeres; se seleccionará al azar a cuatro clientes de la fila: a) determine la probabilidad de que el tercero y el cuarto sean mujeres, sin interesar cómo salieron los dos primeros; b) determine la probabilidad de que los dos primeros clientes sean hombres. 5.20. Se lanzan simultáneamente dos dados; determine la probabilidad de que la suma de los números sea: a) Mayor de ocho; b) la suma de los números impares sea menor de siete; c) la suma de los números pares esté comprendido entre cuatro y ocho. 5.21. Se tiene dos cajas con características similares; la primera contiene seis bolas blancas y cinco bolas negras, mientras que la segunda contiene nueve bolas blancas y seis bolas negras; se escoge una caja al azar y se extraen tres bolas en forma consecutiva: ¿Cuál será la probabilidad de que estas bolas sean: sean blancas; sean negras; la primera y la última sean negras; la última sea blanca? 5.22. Se recibe una caja conteniendo 10 memorias USB, de los cuales se sabe que tres contienen alguna grabación; a fin de proceder a grabar nuevos documentos se selecciona una muestra de tres USB; estime la probabilidad de que las memorias USB: a) Los tres tengan alguna grabación; b) solo dos tengan alguna grabación; c) solo uno tenga alguna grabación; d) ninguno tenga alguna grabación; e) solo la última tenga alguna grabación. 5.23. En un congreso de ciencia y tecnología están reunidos 115 ingenieros, quienes, entre otros puntos, conversan acerca de los diarios que leen con mayor frecuencia; de estos 35 dicen leer El Comercio, 40 dicen leer Gestión, en tanto que 21 dicen leer ambos diarios. Se selecciona al azar a uno de estos asistentes; determine la probabilidad de que, el ingeniero, lea: solo El Comercio; solo Gestión; ninguno de ellos; si leyó El Comercio que también haya leído Gestión; si leyó Gestión, que haya leído EL Comercio. 5.24. La siguiente tabla muestra las características preferenciales de un grupo de clientes de la provincia de Huaura y de la provincia de Barranca, quienes acuden a una feria tecnológica a informarse respecto a unos modelos de Laptop con multimedia, recientemente incorporados al mercado: Clientes Huaura Barranca
Les gustan 40 55
Guía de Prácticas de Estadística y Probabilidades
No les gustan 31 28
Indecisos 30 24 Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 53 d e 92
A fin de conocer el estado anímico del cliente, la empresa escogerá al azar a un cliente, determine la probabilidad de que: a) Al cliente no le guste la Laptop. b) El cliente sea de Barranca. c) El cliente no sea de Huaura y está indeciso. d) Si el cliente es de Barranca, que le guste la Laptop. e) Si le gusta la Laptop, que sea un cliente de Huaura. f) Al cliente de Huaura no le guste la Laptop. g) El cliente de Barranca está indeciso por la Laptop. h) El cliente le gusta la Laptop. i) El cliente no es de Huaura. j) Si el cliente es de cualquiera de esos lugares, no le guste la Laptop. k) No le guste la Laptop al cliente de Barranca. l) Si le gusta la Laptop, que sea de Huaura. m) Le gusta la Laptop y sea de Huaura, o esté indeciso y sea de Barranca. n) Si el cliente es de Barranca, que le guste la Laptop, o si es de Huaura, que esté indeciso. o) El cliente esté indeciso o no le guste la Laptop. 5.25. Tres personas participan en un premio; las probabilidades de ganar un premio por cada una de las personas es, respectivamente 0,15, 0,18 y 0,17; estime la probabilidad de que se gane el premio.
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 54 d e 92
SEPTIMA SEMANA DISTRIBUCIONES DE PROBABILIDADES EMPÍRICAS Si en un experimento se busca la ocurrencia de un evento A, entonces la probabilidad de ocurrencia de este evento se denota por P(A), y éste determina su respectiva probabilidad; si en este mismo experimento se busca la ocurrencia de una variable aleatoria cualquiera, como x, por ejemplo, entonces la probabilidad de ocurrencia de este evento se denota por P(x), y esto se conoce como distribución de probabilidad o función de probabilidad, cuando P(x) está asociado a una función f(x); en este caso P(x) = f(x). Dado que una variable aleatoria puede ser discreta o continua, una distribución de probabilidad, también será discreta o continua; los resultados de un experimento pueden seguir leyes matemáticas conocidos, como no pueden seguirlo; en el primer caso se dice que la distribución de probabilidad es teórica, y en el segundo caso, la distribución de probabilidad es empírica, porque proviene de la experimentación directa. Los modelos de distribuciones de probabilidad pueden clasificarse de la siguiente manera: Modelo s de distribu cion es de probabilid ad: P(x) = f(x)
Discretas Em p íri c as
Los modelos se construyen basados en la observación directa
Teóricas
Bernoulli Binomial Poisson Pascal Geométrica Hipergeométrica, etc.
Continuas
Em p íri c as
Los modelos se construyen basados en la observación directa
Teóricas
Normal t_student Chi cuadrado F Exponencial negativa Gamma, etc.
Ejemplo 7.1 Las notas de los alumnos de la facultad de ingeniería, están comprendidos entre 0 y 20; la función de distribución de probabilidad de estas notas es lineal y creciente entre 0 y 15, y a partir de éste, lineal y decreciente, determine: a) La función de probabilidad del comportamiento de estas notas. b) La probabilidad de que un alumno tenga una nota entre 13 y 16. Solución: Hay que construir la función de probabilidad; al observar las características del problema, puede apreciarse que la figura formada corresponde a un triángulo, cuya base está dada por las notas x, entre cero y 20; sus dos lados respectivos estarán formados por las dos rectas f(x 1) y f(x2); dado que esta es creciente entre 0 y 15, le corresponde una función f(x 1), y entre 15 y 20 otra función decreciente, f(x 2). También se sabe que las áreas bajo las curvas formadas por estas dos ecuaciones y la base del triángulo, será igual a uno, y como el área del triángulo es: b*h/2 = 1, se obtiene que h = 2/20 = 0,10. Guía de Prácticas de Estadística y Probabilidades
(15;0.10) fx2
f x1 h
0
Ciclo 2012-II
15
20
Prof. Moisés E. Armas
Pági na 55 d e 92
a) Para hallar las funciones de probabilidades, deberá determinarse las ecuaciones de la recta, los cuales s e obtienen aplicando el concepto de la geometría analítica, de que , para 0 ≤ x < 15; y f(x2) =. dos puntos determinan una recta; luego f(x 1) = , para 15 < x ≤ 20; por lo tanto, e stas dos ecuaciones determinan la función de probabilidad solicitada de f(x). b) P(13 < x < 16) = = 86,67%
Ejemplo 7.2 Los alumnos de ingeniería informática han desarrollado un “virus” que puede infectar un sistema de redes, dentro de un plazo máximo de seis horas, antes de ser detectado y eliminado. La función de probabilidad de este virus está regido por f(x) = , siendo A una constante y x la variable tiempo; determine: a) La probabilidad de que el “virus” pueda infectar al sistema de redes entre tres y cinco horas antes de ser detectado y eliminado. b) Promedio de vida del “virus” dentro del sistema de redes. Solución: Deberá determinarse previamente el valor de A, integrando f(x) entre 0 y 6, e igualando a uno; se obtiene a = 1/Ln(7) = 0,5139, luego: a) P(3 < x < 5) = = 88,48% b) E(x) = = 2,08 horas Ejemplo 7.3 Los ingresos mensuales de un grupo trabajadores se distribuyen uniformemente entre los S/ 1 250 y S/ 3400. Construya su función de probabilidad, y determine: a) La probabilidad de que un trabajador seleccionado al azar, gane más de S/ 2 000 mensuales. b) En promedio, ¿cuánto están ganando los trabajadores, y con qué desviación estándar? Solución: Siguiendo los mismos razonamientos de los ejemplos anteriores, puede construirse el comportamiento gráfico de estos ingresos; tal como lo manifiesta el problema, estos ingresos son uniformes o parejos entre los S/ 1 250 y S/ 3 400 mensuales, por lo tanto, su curva es una función constante en este intervalo, y la figura formado describe una distribución rectangular, cuya base estará limitada por los puntos (1250; 0) y (3400; 0) y la altura por f(x) = h. Dado que el área del rectángulo debe ser , para 1250 ≤ igual a uno, entonces f(x) = x ≤ 3400.
f x = 1 2150
0
a) Ahora se trata de hallar P(x > 2000) =
1250
65,11%.
b) Promedio esperado de sueldos: E(x) = será: σ = = S/ 620,65. Guía de Prácticas de Estadística y Probabilidades
3400
Ciclo 2012-II
= S/2 325; la desviación estándar Prof. Moisés E. Armas
Pági na 56 d e 92
EJERCICIOS 7.1 ¿Puede estar fuera del dominio de la función de probabilidad, la esperanza matemática? 7.2 ¿Cuáles de las siguientes funciones definen distribuciones de probabilidad? b. f(x) = 3x2, -1 x 0 c. f(x) = 4x3, 1 x 0 d. f(x) = (e-ax)/a, x 0 e. f(x) = 20x3 – 5x4, 0 x 1 f. f(x) = , x = 0,1,2,3,4,5 3 g. f(x) = 20x (1 – x), 0 x 1 h. f(x) = e-kx, x 0, siendo k una constante cualquiera. i. f(x) = x/26, x = 1, 3, 5, 7, 9 j. f(x) = 0,2500 – 0,1250x2, x = 1, 2, 3, 4 k. f(x) = 10e-10x para x 0 l. f(x) = m. h(t) =
4 x
3
85
, x = 3, 4, ..,7
, t = 2, 3, 4, 5
n. h(x) =
x = 0, 1, 2, …,7
o. f(x) =
, x = 2,3…,8
7.3 Determine el valor de A para que f(x) =
A
3 x
2
, definido para x en 8,9,…,15 denote una
función de probabilidad. R: A = 3,874 7.4 Si f(x) = para x = 3,4,5,6,7,8,9, define una función de probabilidad, determine: a) Valor de A b) P(x > 5) c) Su promedio. R: a) A = 2,5428 b) 75,25% c) 7,3307 define una función de probabilidad, para x ε [3, 9], determine: a) A, 7.5 Si la expresión f(x) = b) P(x < 5) R: A = 3 7.6 Encuentre el valor de A, para que f(x) = , si x está comprendido entre 0 y 5. R: A = 225. 7.7 Si f(x) = define una función de probabilidad donde x pertenece al intervalo [18, b], determine b y encuentre su valor esperado. R: b = 30 , define una función de probabilidad, para x € [0, 5], siendo x su variable aleatoria; 7.8 Si f(x) = determine: a) La probabilidad de que x sea mayor de 2. b) Determine su valor esperado. R: a = 50,60% 7.9 Dado la siguiente tabla de distribución de probabilidad: X 0 1 2 3 4 5 6 7 8 2 p(x) 4 6 5 6k 8 8k 4 ,05k .01k 2 Siendo k una constante, determine su promedio y su desviación estándar. 7.10 Si k y a son constantes, demuestre que: a) E(k) = k. b) E(kx) = kE(x). c) E(kx + a) = kE(x) + a. d) V(kk) = kV(x). e) V(kx) = k 2 2 Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 57 d e 92
7.11 Si f(x) = kx2 es una función de probabilidad en el intervalo [0, 5], halle el valor de k y calcule su valor esperado. R: k = 3/125, E(x) = 15/4 7.12 Determine el valor de a si f(x) =
1 2
2
x
define una función de probabilidad para a x
7;
del mismo modo determine su valor esperado. R: a = 2, E(x) = 13/3 7.13 En el centro de cómputo de una empresa, se puede encontrar hasta ocho alumnos de ingeniería informática, desarrollando sus prácticas pre profesionales. La probabilidad de encontrar un determinado número de practicantes está definido por la función f(x) =
Ax x
1
,
siendo x la variable aleatoria número de alumnos, y A una constante; determine: a) El valor de A. b) Número de practicantes que se espera encontrar en promedio. c) Su desviación estándar. R: a) A= 0,1620 b) 4,83 7.14 Si f(x) = es una función de probabilidad definida en el intervalo 0 < x
1). R: a) 1,50 b) 52,79% 7.15 Una empresa comercializadora de equipos de cómputo manifiesta que sus ganancias se distribuyen uniformemente entre los $ 500 y $ 2 500 por semana; determine: a) Promedio esperado de ganancias por semana. b) La probabilidad de que gane más de $ 1 256 por semana. 7.16 Una función de probabilidad se comporta linealmente pasando por los puntos (5, 0,01) y (45, h); encuentre dicha función y calcule P(x >20), así como su valor esperado. R: f(x) = 0,03x 40
0,25
; 76,56%
7.17 Si f(x) = 1,3333 –
0,5 x
1
para
3
x
3,91 define una función de probabilidad, grafique
esta función y determine: a) P(x > 3,5). b) P(x < 3,2). c) P(3,2 < x < 3,5) 7.18 Si f(t) = denota la probabilidad de que una bacteria puede vivir en un cultivo, hasta un tiempo B horas; determine: a) El valor de B. b) La probabilidad de que viva más de 4 horas. c) ¿Cuánto tiempo se espera que viva esta bacteria? R: B = 7,99 7.19 La edad de los alumnos que ingresan a una universidad se distribuye mediante la función de probabilidad f(x) = 0,3 – 0,01x, siendo x la variable aleatoria edad en años, comprendido entre 15 y 25 años; determine: a) Promedio de edad de los alumnos ingresantes. b) Probabilidad de que ingresen alumnos entre los 17 y 19 años. R: a) 19,17años b) 24% 7.20 Si f(x) = 0,15x + 0,05 para 0 x < 2 y f(x) = 0,526 – 0,088x para 2 x 4,5 define una función de probabilidad, construya su respectiva curva y determine su valor esperado. 7.21 La probabilidad de llegada de clientes a una estación de servicio sigue una función lineal creciente entre los 5 y 65 clientes por la mañana, y lineal y decreciente entre los 65 y 160 clientes por la tarde. Encuentre la probabilidad de que lleguen menos de 75 clientes en la mañana, así como el promedio esperado de llegada de clientes durante el día. Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 58 d e 92
7.22 Demostrar que f(x) =
ax x
1
es una función de probabilidad definido en 0
x 20 y determine
el valor de a. R: 0,05898 7.23 Un negocio vende computadoras personales semanalmente entre 15 y 31 unidades; el comportamiento probabilística de estas ventas sigue una tendencia lineal creciente hasta las 24 unidades, y decreciente a partir de esta cantidad. Encuentre su función de probabilidad y determine el promedio de ventas de las computadoras, así como su desviación estándar. R: f(x) =
x
15 72
para x
[15, 24> y f(x) =
31
x
56
para x
[24,31]; promedio esperado de ventas = 23,3 unidades por
semanas
7.24 Un centro poblado a partir de su creación, puede extinguirse dentro de un tiempo máximo de 200 años; determine su función de probabilidad si la curva de decaimiento sigue una función lineal; además determine la probabilidad de que esta población se extinga entre los 50 y 100 años. 7.25 Una nueva PC puede tener una vida útil de 4 años, antes de ser reemplazada por otro nuevo, con mejores configuraciones; el tiempo de vida de esta PC, está regido por la función f(f) = , siendo t el tiempo de vida en años y f(t) la probabilidad asociada a la vida de la PC. a) Determine la probabilidad de que la PC dure menos de 3 años. b) Determine el promedio de duración de la PC. 7.26 Un virus informático, recientemente creado, puede infectar un sistema de redes hasta las cinco horas antes de ser detectado y eliminado; si la función de probabilidad de vida de este virus se define por f(x) =
Ax x
1
, siendo x la variable aleatoria horas de vida del virus y A una
constante; determine: a) La probabilidad de que el virus “viva” más de tres horas.
b) Promedio de vida del virus dentro de la red . R: A = 0,312
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
21,79%
2,90 horas
Prof. Moisés E. Armas
Pági na 59 d e 92
NOVENA SEMANA DISTRIBUCION DE PROBABILIDAD BINOMIAL Una distribución binomial es un evento Bernoulli, que se repite para más de una muestra, y el evento puede ocurrir, como no ocurrir; la probabilidad de que ése evento ocurre se le denota por p, y la probabilidad de que no ocurra por q, de modo que p+q = 1; en una distribución binomial no hay otras alternativas, aparte de las indicadas; si el evento ocurre, se dice que es exitoso, de otro modo, constituirá un fracaso. A una casa comercial, acuden clientes que pueden comprar o no; existirá una probabilidad de que el cliente compre, y también que no compre; si un día asistieron 10 clientes, entonces basándose en esta distribución podría interesar conocer, a modo de ejemplo, la probabilidad de que: más de 6 clientes compren, o la probabilidad de que ningún cliente compre, etc. En este caso, la variable aleatoria es el número de clientes que pueden comprar, y éste varía de 0, 1, 2, hasta 10 clientes. x n-x
Su función de probabilidad es f(x) = nCxp q , para x = 0,1,2,…,n, que es su variable aleatoria, asociado a la probabilidad de ocurrencia exitoso p. El valor esperado de la binomial se calcula desarrollando la sumatoria: E(x) = n*p; de igual manera, su varianza se determina: σ2 =
=
Ejemplo 9.1 En una empresa que cuenta con 22 empleados, donde hay ocho mujeres y el resto varones, se seleccionará a cinco personas para ser capacitados en desarrollo de software; la selección se hará al azar, sin considerar sexo ni otros antecedentes. Determine la probabilidad de que en este grupo a) La mayoría sean mujeres, b) Existen a lo más dos varones. Solución: a) Si se va seleccionar una mujer, entonces la probabilidad de que sea seleccionado una mujer del grupo será: p = 8/22 = 0,364, y la probabilidad de que no sea seleccionado será q = 14/22 = 0,636; la muestra es de tamaño cinco; por lo tanto el que el grupo sea conformado mayoritariamente por mujeres significa que pueden haber, 3, 4, o 5 mujeres. La función de probabilidad que define el comportamiento de este problema es f(x) = nCxpx*qn-x, donde x = 0, 1, 2, 3, 4, 5 define la variable aleatoria, número de mujeres en el grupo a capacitarse; en términos de probabilidades debe determinarse: P(x 3) = f(3)+f(4)+f(5) = 25,73% b) La probabilidad de que en el grupo exista a lo más dos varones es equivalente a decir que pueden haber cero, uno o dos varones; en términos de probabilidades: P(x<3) = f(0)+f(1)+f(2), donde en este caso p = 0,636; luego P(x < 3) = 25,73% Ejemplo 9.2 Se sabe que los alumnos que llevan el curso de ESTADISTICA por primera vez, solo el 15% lo aprueban, sin pasar por el examen sustitutorio, el 23% lo aprueban con el examen sustitutorio, y el 62% sale desaprobado. Determine la probabilidad de que: Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 60 d e 92
a) Un alumno seleccionado al azar, de una muestra de ocho, apruebe el curso sin pasar por el examen sustitutorio. b) A lo más siete alumnos, aprueben el curso con el examen sustitutorio, si la muestra de alumnos fue de 12. Solución: a) Aquí p = 0,15 probabilidad de que un alumno apruebe sin pasar por el examen sustitutorio; por lo tanto f(x) = 8C10,151*0,857 = 38,47% b) Aquí p = 0,23, la probabilidad de que un alumno apruebe con el examen sustitutorio; por lo tanto P(x ≤7) = f(x ≤x) = Ʃ 12Cx0,23 x*0,7712-x ; donde x = 0 , 1….7. Ejemplo 9.3 Una casa comercial de Huacho que vende artefactos electrodomésticos bajo el sistema de venta al crédito reporta problemas de morosidad con sus clientes dado que el 20% de ellos se atrasan en sus pagos; no obstante esta situación está pensando ampliar su cobertura hacia la zona de Végueta y Medio Mundo; con la finalidad de tomar futuras contingencias, encarga a una empresa encuestadora tomar una muestra aleatoria diez clientes que hacen uso de este servicio; determine: a) El número esperado de clientes que tendrán problemas de morosidad. b) Desviación estándar de clientes que no tendrán problemas de morosidad. c) La probabilidad de que todos los clientes no sean morosos. d) La probabilidad de que todos los clientes sean morosos. e) La probabilidad de encontrar entre tres y cinco clientes morosos. f) Construya la tabla de la función de probabilidad, encontrar clientes morosos, y represéntelo gráficamente. Solución:
Si p = 0,20 es la probabilidad de encontrar clientes morosos, entonces q = 0,80 es la probabilidad de no encontrarlos; para una muestra de tamaño 10, la función de probabilidad de encontrar clientes con problemas de morosidad es una distribución binomial con función de probabilidad f(x) = 10Cx0,20 x0,80(10-x), donde x es la variable aleatoria, número de clientes con problemas de morosidad, y x = 0, 1, 2, ….., 10 clientes
Por las condiciones del problema: a) Número esperado de clientes con problemas de morosidad: = x = np = 10*0,20 = 2 clientes b) Desviación estándar de clientes que no tendrán problemas de morosidad: para este caso p = 0,80 (clientes sin problemas de morosidad) y q = 0,20, siendo n = 10; luego la desviación estándar será: = 10* 0,80* 0,20 = 1,265 clientes. c) Si x es la variable aleatoria clientes no morosos, entonces la probabilidad asociado a este evento es p = 0,80 y q = 0,20 define la probabilidad de encontrar clientes morosos; la función de probabilidad queda definido por: f(x) = 10Cx0,80 x0,20(10-x); en este caso todos los clientes no morosos, es x = 10, y la probabilidad asociado a este evento es P(x=10) = f(x=10) = 0%. d) En este caso: p = 0,20 es la probabilidad de encontrar clientes morosos y q = 0,80 es la probabilidad de no encontrarlos; por lo tanto P(x = 10) =f(10)= 10C100,20100,800 = 0%. e) Considerando el caso anterior: P(3 x 5) = P(3) + P(4) + P(5) = 31,58%. f) Para construir y graficar la función de probabilidad, clientes morosos, se construye previamente su tabla de p robabilidad, para x = 0, 1, 2, …..,10: Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 61 d e 92
Tabla de datos x f(x) 0
0.1074
1
0.2684
2
0.3020
3
0.2013
4
0.0881
5
0.0264
6
0.0055
7
0.0008
8
0.0001
9
0.0000
10
0.0000 Gráfico del comportamiento de morosidad de los clientes que obtienen sus artículos bajo la modalidad de crédito en la empresa comercial
La suma de todas las probabilidades es uno. Como podrá deducirse, su curva de tendencia sigue una distribución asimétrico positivo.
EJERCICIOS 9.1 9.2 9.3
9.4 9.5
9.6
Deduzca la función de probabilidad de una distribución Bernoulli, y diga en qué se diferencia de una binomial? Demuestre que el valor esperado de una distribución binomial es np. Un negocio dedicado al ensamble de equipos de PC, hace pedidos a otros proveedores de HD que tengan ciertas características; por experiencias previas conoce que la probabilidad de recibir un HD con falla es 0,072; si el negocio hace un pedido de veinte HD, construya su función de probabilidad, determinando la probabilidad de que todo el lote esté en mal estado; además indique el promedio de HD falladas que espera recibir. Un salón de clases de la universidad está conformado por alumnos provenientes de sectores urbanos y sectores rurales; construya una función de probabilidad para seleccionar un alumno proveniente del sector rural, considerando que el salón cuenta con 25 alumnos. La probabilidad de que un ingeniero industrial gane un concurso de precios en una licitación para un contrato de asesoría es de 0,28. Si a ese concurso se presentan ocho ingenieros industriales; determine: a) La función de probabilidad de ganar este premio. b) Gráfico de esta función. c) Probabilidad de que ganen el premio, más de tres industriales. ¿En qué casos ocurriría que el gráfico de una distribución binomial sea simétrica, y en qué casos sería asimétrico negativo? Con ejemplos sustente sus respuestas.
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 62 d e 92
9.7 Cuatro de cada quince clientes que acuden a un centro comercial que expenden equipos de cómputo, compran una PC; si x define la variable aleatoria de clientes que no compran una PC, y un día cualquiera asistieron a este centro 30 clientes: a) Determine su función de probabilidad. b) ¿Cuántos clientes se espera que no compren una PC? c) Si cada cliente que compra una PC genera una utilidad de US $ 80 al centro comercial, ¿cuánto se espera ganar durante ese día? d) ¿Cuál será la probabilidad de que a lo más cinco clientes compren una PC? 9.8 Por datos históricos se conoce que el 70% de los alumnos que llevan por primera vez el curso de Estadística y Probabilidades los repiten; si al inicio del presente ciclo se matricularon 21 alumnos que lo llevan por primera vez, determine la probabilidad de que: a) Todos lo aprueben a esta primera vez. b) Lo desaprueben solo 10 alumnos. c) Lo aprueben menos del 50% de los alumnos. R: a) 0% b) 0,97% 9.9 La probabilidad de recibir reclamos de clientes por supuestas ventas de productos en malas condiciones es del 6%; si un día cuarenta clientes compraron en la tienda, ¿cuál será la probabilidad de recibir quejas de cinco clientes? R: 5,87% 9.10 La probabilidad de que una PC sea infectada por un virus, al integrarse cada vez al ciber espacio, es del 2,5%, ¿cuál será la probabilidad de que sea infectada en la quinta vez? Con el mismo virus. 9.11 El 8% de las memorias ROM adquiridas por una importadora presentan fallas de diseño, lo que hace que los programas “se cuelguen” al momento de encenderlo; el cuerpo técnico recibe una muestra de siete memorias, ¿cuál será la probabilidad de que no menos de seis estén en buen estado? R: 65,84% 9.12 Cada vez que se compra una Laptop, existe una probabilidad de 0,008 de que ésa Laptop presente fallas de funcionamiento; si una empresa está interesado en comprar 90 Laptop para sus trabajadores, y para ella misma: a) Determine la función de probabilidad de recibir Laptop en buenas condiciones. b) ¿Cuántas Laptop espera recibir en buenas condiciones? c) ¿Cuál será la probabilidad de recibir menos de cinco Laptop, con fallas de funcionamiento? d) Si por cada Laptop que reciba con fallas de funcionamiento, la empresa solicitará una indemnización de S/ 200, aparte de la reposición por otro nuevo equipo, ¿cuánto esperará recibir la empresa? e) ¿De qué manera se distribuye, la función de probabilidad, recibir Laptop con fallas de funcionamiento? 9.13 ¿Cuál será la probabilidad de que una pareja con siete hijos? a) La mayoría sean mujeres. b) Si la probabilidad de que nazca una mujer es de 0,45, ¿cuál será la probabilidad de que la mayoría sean también mujeres? R: a) 50% 9.14 Se estima que solo el 4,4% de las Laptop con las que cuentan los alumnos de ingeniería de la universidad, cuentan con el MATLAB, un software matemático que permite resolver complejas ecuaciones matemáticas; si se selecciona al azar 60 Laptop de los alumnos, determine la probabilidad de que: a) Solamente tres cuenten con este software. b) Exista entre dos y cinco Laptop con este software. R: a) 22,42% b) 69,91% 9.15 A un establecimiento comercial, donde se expenden equipos de PC, acuden diariamente clientes, interesados en adquirir un equipo de cómputo; sin embargo no todos están en condiciones de adquirirlos al contado, por lo que se dedican a solicitarlos al crédito; la empresa lleva el registro de los clientes que solicitan al crédito, durante un cierto número de días, obteniendo los siguientes resultados: Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 63 d e 92
Nº de clientes Nº de días solicitantes de observados crédito 0 5 1 12 2 23 3 35 4 31 5 20 6 16 7 7 8 8 De acuerdo a ello, si un día cualquiera acudieron nueve clientes al negocio; determine la probabilidad, de que: a) Ningún cliente solicite crédito. b) Solo cinco clientes soliciten crédito. c) A lo más cuatro clientes soliciten crédito. d) No menos de cinco clientes soliciten crédito.
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 64 d e 92
DECIMA SEMANA DISTRIBUCION DE PROBABILIDAD DE POISSON En una distribución Poisson, la variable aleatoria está asociado al número de eventos que puede ocurrir un intervalo de tiempo, o en una unidad de superficie, o en una unidad de longitud, o en una unidad de volumen, etc. El número de ocurrencias constituye su promedio, denotado po r λ, y con esto su función de probabilidad queda definido por f(x) =
, siendo x la variable aleatoria, número de eventos que podría ocurrir en una unidad de medida; por lo tanto x = 0, 1, 2, ……,∞ (pueden ocurrir gran cantidad de eventos) Ejemplo 10.1 En la carretera Panamericana, comprendido entre Ancón y Pativilca ocurre en promedio dos accidentes de tránsito por mes; determine la probabilidad de que un mes cualquiera se produzca: a) Exactamente tres accidentes, b) Más de tres accidentes, c) Menos de dos accidentes, d) Entre uno y cinco accidentes, e) Considere que se quiere estudiar el caso de encontrar un número de accidentes cada 45 días; determine la probabilidad de que en este intervalo de tiempo ocurran 4 accidentes. Solución: Este experimento está asociado a una distribución de probabilidad Poisson, dado que ocurre un número de eventos cada cierto intervalo de tiempo, en este caso, dos accidentes cada mes. Por lo tanto = 2, y x es la variable aleatoria que define el número de accidentes en ese intervalo de tiempo; por lo tanto x = 0, 1, 2, …….,∞; luego su función de probabilidad estará definido por:
P(x; ) = f(x) = xe- / x!. Reemplazando las variables para cada caso: a) P(x = 3;2) = 2 3e-2/ 3! = 18,04%
3
x -2
b) P(x>3 ; 2) =
2xe-2/ x! = 14,39%.
2 e / x! =1 – P(x 3 ; 2)=1 x
4
x
0
c) P(x<2; 2) = f(0) + f(1) = 40,60% 5
2xe-2/ x! = 84,79%
d) P(1 x 5; 2) = x
1
e) En este caso, el nuevo promedio deberá determinarse mediante una regla de tres simple, haciendo el siguiente planteamiento: si 2 accidentes ocurren en 1 mes, en 1,5 meses ocurrirán 3 accidentes, por lo tanto λ 2 = 3 y con este nuevo promedio, se determina la nueva probabilidad: f(4) = 16,80% Ejemplo 10.2 En un libro de 500 páginas editadas por un editorial, es frecuente encontrar en promedio tres fallas de tipografía por libro; construya la función de probabilidad de encontrar fallas tipográficas para un libro de estas características, editadas por esta empresa y determine la probabilidad de encontrar: a) Ninguna falla tipográfica, b) No menos de tres fallas tipográficas; c) Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 65 d e 92
Considere que la empresa suspenderá de sus labores al tipógrafo si encuentra más de seis fallas en un libro editado, ¿cuál será la probabilidad de que el tipógrafo sea suspendido si sucede este evento? Solución: El experimento corresponde a una distribución de Poisson, dado que se espera encontrar en promedio 3 fallas por cada 500 páginas; por lo tanto λ = 3, y f(x) = 3 xe-3 / x!, para x = 0, 1, …., ∞ fallas por libro de 500 páginas. a) P(x = 0) = f(0) = 4,98% b) P(x>3) = f(x>3) = 35,28% c) P(x>6) = f(x>6) =3,36% Ejemplo 10.3 La probabilidad de ser asaltado entre las 09:00horas y las 17:00, en el cruce del Jr. San Martín y el Jr. Las Palmas, de la ciudad de Huacho, de lunes a viernes, es de 0,008; si en uno de esos días transitaron por esta esquina 200 personas, ¿cuál será la probabilidad de que: a) Cinco sean asaltadas. b) Ninguna sea asaltada. c) A lo más cinco fueran asaltadas. d) No menos de ocho fueran asaltadas. Solución: El experimento corresponde a una distribución binomial, ya que los eventos pueden ser asaltado o no ser asaltado al cruzar esas dos vías; por lo tanto p = 0,008 denota la probabilidad de ser asaltado y q = 0,992 denota la probabilidad de no ser asaltado; la muestra en uno de esos días corresponde a n = 200 personas. Si se observa las características del problema se puede notar que p 0 y q 1, y n es bastante grande; por lo tanto esta distribución podría aproximarse a una Poisson, siempre y cuando np ≤ 5; haciendo los reemplazos convenientes se puede apreciar = np = 1,6 personas; por lo tanto en una distribución λ = 1,6 personas, y x = 0, 1, 2, que …….200 personas que podrían ser asaltadas dentro de las condiciones establecidas por el
problema; luego de acuerdo a las preguntas formuladas: a) P(x = 5; 1,6) = f(5) = 1,6 5e-1,6/5! = 1,76% b) P(x = 0; 1,6) = f(0) = 1,6 0e-1,6/0! = 20,19% 5
1,6xe-1,6/x! = 99,38%
c) P(x < 6; 1,6) = f(x≤6) = x
0 8
x -1,6
d) P(x >8; 1,6) = f(x>8) =
1,6xe-1,6/x! = 1 – 0,9998 = 0,02%
1,6 e /x! = 1 x
9
x
0
La siguiente figura muestra el comportamiento de la función de probabilidad de ser asaltado en el mencionado lugar. x P(x)
0 1 2 3 4 5 6 7 8 0,2019 0,3230 0,2584 0,1378 0,0551 0,0176 0,0047 0,0011 0,0002
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 66 d e 92
0.3500 0.3000 0.2500 0.2000 0.1500 0.1000 0.0500 0.0000
Gráfico de su distrib ución de pr obabilidad de p ersonas que p odrían ser asaltadas
Como este problema corresponde netamente a una binomial, su solución le correspondería or este método; sin embargo haciendo los cálculos debidos se encuentra para el primer caso, con f(x=5)= 200C5(0,008)5(0,82)200-5 de donde P(5) = f(5) = 1,74%, lo cual no tendría mucho sentido hacer estos cálculos complejos teniendo en cuenta que con la Poisson, son más sencillos, y los errores de estimación son intrascendentes. Ejemplo 10.4 Se estima que la probabilidad de que falle una montaña rusa, al momento de estar en plena operatividad es de 0,0018; con motivo del aniversario de la provincia de Huaura se instalarán estos juegos, durante los diez días que durará la exposición se espera que el juego esté en funcionamiento 600 veces; determine la probabilidad de que: a) No se produzca ninguna falla mecánica durante el período observado. b) Falle dos veces la montaña rusa. c) Se produzcan más de cuatro fallas mecánicas. d) Solo se produzca cuatro fallas. Solución: De igual manera que el caso anterior, el problema puede resolverse con una Binomial, dado que la montaña rusa puede fallar o no; sin embargo se observa también que la probabilidad de ocurrencia es muy bajo p = 0,0018, y el número de veces en que funciona la montaña es muy grande ( n = 600); por lo tanto este fenómeno puede aproximarse a la Poisson, haciendo = np = 1,08 y f(x) = xe- /x!, siendo x la variable aleatoria número de fallas en el total de observaciones; luego: a) P(x = 0; 1,08) = f(0) = 33,96% b) P(x = 2; 1,08) = f(2) = 19,81% x -
c) P(x > 4; 1,08) = f(x>4) =
e /x! = 1 – P(x 4; 1,08) = 0,49%.
x
5
d) P(x = 4; 1,08) = f(4) = 1,93% Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 67 d e 92
Ejemplo 10.5 En una determinada región del país, se ha estimado que solo el 0,68% de la población, tienen ojos verdes; si se toma una muestra aleatoria de 500 personas de esa población, determine la probabilidad de que: a) más de tres de ellos tengan ojos verdes, b) más de cinco de ellos tengan ojos verdes. Solución: Es un problema binomial que puede aproximarse a una Poisson; por lo tanto el promedio de personas con ojos verdes será: λ = n*p = 500*0,0068 = 3,4 personas con ojos verdes, con función de probabilidad Poisson; luego, se debe calcular y demostrar que: a) P(x > 3) = 44,16% b) P(x > 5) = 12,94%
EJERCICIOS 10.1 Deduzca la función de probabilidad de Poisson. 10.2 Demuestre que el valor esperado de la Poisson es λ. 10.3 ¿Qué define una distribución de probabilidad de Poisson y cuáles son sus parámetros? 10.4 ¿En qué casos se producen distribuciones de probabilidad de Poisson? 10.5 Explique las semejanzas y/o diferencias entre una distribución de Poisson y una binomial? 10.6 En un libro de 500 páginas editadas por un editorial, es frecuente encontrar un promedio de cuatro fallas de tipografía por libro; construya la función de probabilidad de encontrar fallas tipográficas para un libro editado, según estas características, y describa gráficamente su comportamiento. Determine además, la probabilidad de que en un libro con estas características pueda encontrarse más de cinco fallas tipográficas. 10.7 La ciudad de Lima es considerada como zona de alto riesgo, donde se presentan frecuentemente accidentes de tránsitos con la secuela de muertos y heridos; describa una función de probabilidad para explicar este comportamiento para un determinado período de tiempo; de igual modo presente el gráfico del comportamiento de su variable aleatoria. 10.8 Cada tres días llegan dos barcos cargueros al Puerto de Huacho; determine la función de probabilidad de llegada de estos barcos y grafique el comportamiento de su variable aleatoria. ¿Cuál será la probabilidad de que durante estos tres días? a) No llegue ningún barco. b) Lleguen más de tres barcos. c) Lleguen a lo más tres barcos. d) ¿Cuál será la probabilidad de que durante cuatro días lleguen no menos de tres barcos? R: a) 13,53% b) 14,29% c) 85,71%.
10.9 En horario de atención de oficina, Mesa de Partes de la Universidad, recibe en promedio tres expedientes cada diez minutos; determine la probabilidad de que en ese lapso de tiempo: a) No reciba ningún expediente. b) Reciba entre dos y cuatro expedientes. R: a) 4,98% b) 61,6% 10.10 Por un puente vehicular circulan normalmente cuatro vehículos cada dos minutos; el puente está diseñado para soportar el peso de hasta diez vehículos, cuando lo circulan todos en conjunto; estime la probabilidad de que en este intervalo de tiempo, el puente sea sobrecargado; de igual manera, estime la probabilidad de que en un minuto, el puente sea sobrecargado. 10.11 Se recibe una caja que contiene memorias USB; se sabe que por cada 150 memorias nuevas recibidas, dos presentan fallas de fábrica. Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 68 d e 92
a) De una caja que contiene 214 memorias, se selecciona al azar tres de ellas; determine la probabilidad de que estas tres presenten fallas de fábrica. b) Determine la probabilidad de que no menos de tres memorias presenten fallas de fábrica. c) Si solo se recibe 70 memorias, determine la probabilidad de encontrar a lo más dos memorias con fallas de fábrica. 10.12 Una empresa dedicada a la venta de equipos de cómputo vende en promedio ocho PC cada tres días, ¿cuál será la probabilidad de que en este lapso de tiempo? a) Venda más seis PC, b) Venda no menos de cuatro PC. c) ¿Cuál será la probabilidad de que en un día venda solo dos PC? R: a) 12,21% 10.13 Una empresa encarga desarrollar a una empresa desarrollar un software para resolver sus problemas administrativos, dentro de ella y sus filiales. El sistema después de ser desarrollada es puesta en práctica y entregada a la empresa para su respectivo uso; sin embargo el personal usuario del sistema manifiesta su queja en el sentido de que el software en promedio se queda “colgado” tres veces al día, perjudicando el desarrollo de las actividades. Los analistas deciden verificar esta queja; determine: a) La probabilidad de que el software se quede “colgado” más de cuatro veces, observado durante un día de trabajo. b) La probabilidad de que el software se quede “ colgado” dos veces en el siguiente día, si el primer día, se colgó una sola vez.
R: a) 18,48%
b) P(x=2/x=1) =
=
=
=
29,85%
10.14 La probabilidad de que una persona pueda ser asaltado en la calle " Los seguros" , en un día cualquiera, es de 0,015; encuentre la probabilidad de que circulando veinte personas en un día: a) Tres hayan sido asaltadas. b) Hayan sido asaltados entre cuatro y ocho personas. c) Ninguno haya sido asaltado. d) Todos hayan sido asaltados. 10.15 Por cada lote de cien unidades de HD, se encuentra dos con problemas en su sector de arranque; determine la probabilidad de encontrar: a) Un HD con problemas si solo se recibe un lote de 25 unidades. b) Tres HD con fallas si se recibe un lote de 200 unidades. c) Exactamente dos HD falladas en un lote de cien. R: a) 30,33% b) 39,07% c) 27,07% 10.16 Una máquina empacadora produce normalmente una falla de empaque por cada dos horas de funcionamiento continuo; la máquina se prueba en una sesión continua de seis horas de trabajo, y si se encuentra hasta tres fallas de empaque, deberá pararse el proceso para hacer los ajustes respectivos a la máquina; determine el promedio esperado de fallas de empaque en el tiempo probado y la probabilidad de parar el proceso. R: 3; 64,77% 10.17 Un estudio relacionado con la ocurrencia de accidentes de tránsito en el tramo de la carretera Ancón y Pativilca, muestra que en promedio se producen tres accidentes; estime la probabilidad: a) Se produzcan a lo más cuatro accidentes. b) Se produzca no menos de tres accidentes. c) Se produzca un accidente cada mes. d) Se produzcan dos accidentes cada dos meses. e) Se produzcan menos de dos accidentes cada mes. 10.18 Se ha detectado que en cada m 2 de plancha de fórmica existen en promedio, tres defectos imperceptibles a simple vista de fábrica; la gerencia de producción quiere evitar este tipo de Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 69 d e 92
problemas y ordena un sistema de control de calidad más riguroso y luego revisa una muestra de cien planchas nuevas. a) ¿Cuál será la probabilidad de que en estas planchas existan más de cuatro fallas? b) ¿Cuántas planchas se esperan encontrar con estas fallas? 10.19 La probabilidad de que un cliente esté disconforme con la compra de un artículo en un Mall, es de 0,025; si un determinado día, hicieron sus compras 170 clientes; determine la probabilidad de que: a) Construya la función de probabilidad, clientes disconformes con la compra de un artículo. b) Más de 6 clientes resulten disconformes con la compra de un artículo. c) Exista entre 3 y 7 clientes, disconforme con la compra de un artículo. d) Si solamente compraron 10 clientes un artículo, construya el gráfico del comportamiento, clientes satisfechos con la compra de un artículo. 10.20 una PC de última generación Una tienda especializada en el desarrollo de Software de Sistemas Expertos, vende quincenalmente un promedio de cinco aplicaciones; determine la probabilidad de que en ese período: a) No venda ningún Sistema Experto. b) Venda sólo tres Sistemas Expertos. c) Venda no menos de cuatro Sistemas Expertos. d) ¿Cuál será la probabilidad de que en el período de una semana, venda sólo tres Sistemas Expertos? e) Venda más de cuatro Sistemas Expertos.
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 70 d e 92
DECIMO PRIMERA SEMANA DISTRIBUCION DE PROBABILIDAD NORMAL
Ejemplo 11.1 Supóngase que en una universidad la edad de los alumnos están comprendidos entre los 14 y 32 años, y éstos se encuentran distribuidos según se muestra en la siguiente tabla: Grupo de edades N° alumnos (años) 14 – 17 17 – 20 20 – 23 23 – 26 26 – 29 29 – 32
37 170 425 122 42 14
El histograma de frecuencias absolutas tiene las siguientes características:
350 20 - 23
300 s 250 o n m u 200 l a e d 150 o r e m ú N 100
50
14 - 17 17 - 20 23 - 26
20 - 23
17 - 20
23 - 26 26 - 29 29 - 32
14 - 17
26 - 29 29 - 32
0 Grupo de e dad (en años)
Figu ra 11.1 Histograma de frecuencias absolutas de la edad de los alumnos
El promedio de edad de estos alumnos es = 22,04 años con una desviación estándar de = 2,896 años. El histograma muestra que gran parte de los alumnos comprendidos entre los 20 y 23 años están concentrados hacia el promedio, y alumnos mayores o menores a esta edad están distribuidos casi en la misma proporción hacia ambos lados; una primera aproximación de su curva de tendencia se orientaría hacia un triángulo isósceles, lo que daría una distribución de Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 71 d e 92
probabilidad triangular, sin embargo en la teoría estadística, este comportamiento, más que a una distribución distribuci ón triangular, puede aproximarse a otra distribución de probabilidad cuya curva es parecida a una campana; a esta distribución se le denomina curva de distribución de normal, cuya función de probabilidad se expresa por: f(x) =
siendo
el promedio de la población y
su desviación estándar, es equivalente a 3,1416., e = 2,7218.... la base los logaritmos neperianos y x la variable aleatoria cuyo dominio es el intervalo < – , + >. La curva de tendencia del histograma mostrado, se parece a una campana, simétricamente distribuidos a ambos lados, como puede apreciarse en la figura y en la siguiente la curva de distribución normal. 350 300 s o n 250 m u l a 200 e d o r 150 e m ú 100 N
50 0 11 11- 14 14 14 - 17 17 - 20 20 - 23 23 23 - 26 26 - 29 29 - 32 32 32 - 35 Edad
Figu ra 11.2 Curva de tendencia de la edad de los alumnos observados
CARACTERÍSTICAS DE UNA DISTRIBUCIÓN NORMAL La variable aleatoria x que se distribuye normalmente con una media aritmética y varianza 2, se representa por: x ~N( , 2), la gráfica de esta función corresponde a una curva de campana, simétrica en su media, cuyas características se muestran en la figura:
f(x)
e f ( x)
1 2
(
x
)2
2 Punto de inflexión
=Media = Desviación estándar
x
Figu ra 11.3 Curva de distribución normal
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 72 d e 92
De esta figura pueden deducirse las siguientes apreciaciones: Es una curva acampanada, y su área total, limitada por el eje X es igual a uno. La curva es simétrica respecto a su media. Los extremos de la curva son asintóticas respecto al eje X. El promedio, la media y la moda coinciden. La desviación estándar está en el punto de inflexión de la curva y es igual a la distancia de la media a este punto. Cuanto más grande es el valor de la desviación estándar, la curva es más achatada, y cuanto más pequeña es, la curva será más delgada. Aproximadamente Aproximadamente el 68% 68% de las las observaciones observaciones se encuentran encuentran en el intervalo intervalo - , + Aproximadamente Aproximadamente el 95% de las observaciones observaciones se encuentran en el intervalo - 2 , + 2 Y de igual igual manera, manera, el 99,7% 99,7% de las observa observacion ciones es estarán estarán en el interval intervalo o -3 , +3 .
DISTRIBUCIÓN NORMAL ESTANDARIZADA Cualquier curva de distribución distribuci ón normal de la forma f(x) =
, puede llevarse a una forma
estándar; a ello se lo llama distribución normal estandarizada; este proceso consiste en trasladar el eje de las ordenadas de f(x) al centro de la campana, de tal manera que la campana queda dividido en dos partes iguales, teniendo como nuevo eje al centro de la campana, que viene a ser el nuevo origen; en este caso la nueva media será µ = 0 y su nueva desviación estándar = 1; este proceso requiere que el exponente de la función f(x) también sea transformada, para ello se lleva a la forma estándar la variable z = la nueva forma estándar: f(z f( z) =
( x
)
el que finalmente f(x) quedará transformada en
, donde el dominio de z estará conformado por todos los
números reales. Los cálculos de la integral de esta nueva función, están prácticamente resueltos, puesto que existen valores tabulados para cualquier valor de z, con los cuales se podrán estimar probabilidades para cualquier intervalo. La siguiente figura muestra una distribución normal estándar.
Figu ra 11.4 11.4 Curva normal estandarizada
En esta figura también se cumple que todo el área bajo la curva es igual a 1: a partir de la media = 0 y hacia la derecha, el área vale 0,500 y de la media hacia la izquierda también igual a 0,500; Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 73 d e 92
el área sombreada representa una porción del área total, en este caso, una porción de 0,500, entonces representará la probabilidad de que un evento se encuentre dentro de este intervalo, esto es P(0
Cantidad de PC vendidas 21 53 98 150 127 98 60 18 N= 625
La tabla de frecuencias observadas relacionadas con el ajuste teórico aproximado a la distribución normal se indica en la siguiente tabla: Tabla de frecuencias empíricas y teóricas de ajuste a la distribución normal Precio de las PC en US $ [x1 - x2[ [0 – 200[ [200 – 400[ [400 – 600[ [600 – 800[ [800 - 1000[ [1000 – 1200[ [1200 – 1400[ [1400 – 1600[
Frecuencia Frecuencia Probabilidad observada relativa P(x1
Frecuencia teórica f t 17 49 101 141 143 100 49 16
El promedio de ventas de las PC es de $ 708,56 y su desviación estándar $329,29; con estos datos se llena la cuarta columna que corresponde a la probabilidad teórica, aproximado a la distribución normal, de vender PC dentro de cada clase de precios; así por ejemplo, la Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 74 d e 92
probabilidad de vender PC entre $ 400 y $ 600 se determina desarrollando: P(400< x <600) = 0,161; la quinta columna corresponde a la frecuencia teórica normal, o frecuencia esperada, y se obtiene multiplicando las probabilidades teóricas de las respectivas clases, por el total observado; así para la quinta fila será: N*h 5 = 625*0,229 = 143. Ejemplo 11.2 Los precios de las Laptop se distribuyen normalmente con una media de S/ 2 015 y una desviación estándar de S/ 320. a) Una persona está interesado en comprarse uno de estos equipos; determine la probabilidad de se compre una que cuesta más de S/ 2400. b) Determine la probabilidad de que otra persona se compre una Laptop que cueste menos de S/ 2000. c) Determine la probabilidad de que otra tercera persona se compre una Laptop cuyo precio esté comprendido entre S/ 2000 y S/ 2200. Solución: Sea x la variable aleatoria precios de las Laptop, entonces de acuerdo a las condiciones del problema: x~N(2015, 600 2), donde µ = 2015 y σ = 600; para resolverlo den tro de la distribución normal estándar deberá estandarizarlo haciendo z = . a) Se trata de hallar P(x > 2400) = P(z > 1,23) = 10,93%. b) Se trata de hallar P(x < 2000) = P(z < -0,33) = 37,07% c) Se trata de hallar P(2000 < x < 2200) = P(-0,33 < z < 0,30) = 0,1293 + 0,1179 = 24,22% Ejemplo 11.3 Los sueldos de los ingenieros informáticos se distribuyen normalmente; si solamente el 9,18% de ellos ganan más de S/ 5000 mensuales, y solo el 12,10% ganan menos de S/ 2000 mensuales; determine: a) Promedio y desviación estándar de ingresos mensuales de los ingenieros informáticos. b) La probabilidad de que un ingeniero informático esté ganando entre S/ 3000 y S/ 4000 mensuales. Solución: a) Como los sueldos se distribuyen normalmente, deberá relacionarse los coeficientes estándar, teniendo en cuenta que z = ; esto es z 1 = y z2 = ; el valor del primer coeficiente se determina teniendo en cuenta que solo el 12,10% ganan menos de 2000; este valor de área dentro de la curva normal estandarizada nos permite hallar el valor de z 1 = -0,33; de igual modo, se obtiene el z 2 = 0,50. Reemplazando estos valores en las expresiones originales se obtiene: µ = S/ 3400 mensuales y σ = S/120 0 mensuales. b) P(3000 < x < 4000) = P(-0,33 < z < 0,50) 32,08% Ejemplo 11.4 Los ingresos mensuales familiares de un centro rural se distribuyen normalmente con una media de S/ 650 y una desviación estándar de S/ 300. Los indicadores de pobreza del gobierno central, le manifiestan que aquellas familias que tengan ingresos mensuales por debajo de los S/ 200, son considerados como pobladores en “extremas condiciones de pobreza”, por lo
tanto deberá proporcionárselos alimentos gratuitamente, a través del PRONAA; si en dicho centro rural existen 2000 pobladores, ¿a cuántos de ellos deberá proporcionárselos dichos alimentos? Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 75 d e 92
Solución: Primero deberá hallarse la probabilidad de encontrar a familias que esté ganando por debajo de esta cantidad; es decir: P(x < 200) = P(z < -1,14) = 0,1271; luego se determina el valor esperado: E(x) = n*p = 2000*0,1271 = 255; por lo tanto el gobierno deberá proveer de alimentos a 255 familias, por estar en condiciones de extrema pobreza. Ejemplo 11.5 El promedio de edad de los 1364 alumnos de ingeniería se distribuye normalmente con una media de 21,8 años. Si solamente 222 alumnos tienen edades comprendidas entre los 21,8 y 23,0 años, determine la desviación estándar de edad de estos alumnos. Solución: Se determina la probabilidad de que estos alumnos estén comprendidos entre los 21,8 y 23,0 años; esto es: p = = 0,1628; el valor de esta área permite determinar su z c, el cual de la tabla se puede apreciar que le corresponde: z c = 0,42; y relacionando este valor con la variable estándar se obtiene que σ = 2,857 años.
Ejemplo 11.6 Los ingresos mensuales de los trabajadores de la provincia de Barranca se distribuyen normalmente con una media de S/ 1550 y una desviación estándar de S/ 620; por otro lado se sabe que quienes ganaban entre S/ 1400 y S/ 1750 habían 500 trabajadores; determine el número de personas que ganaban entre S/ 1200 y S/ 1600. Solución: Se determina: P(1400 < x < 1750) = P(-0,24 < z < 0,32) = 0,2165; teniendo este valor y el concepto de valor esperado se obtiene el tamaño de la población: E(x) = N*p; E(x) = 500; por lo tanto N = 2310; ahora nuevamente se determina P(1200 < x < 1800) = 0,5852, y con esto se calcula el valor esperado para esta muestra: E(x 1) = 2310*0,5852 = 1352; o sea habrán 1352 personas que ganan dentro de ese intervalo.
EJERCICIOS 11.1 Una variable aleatoria se distribuye normalmente con media 40 y desviación estándar 22, determine la probabilidad de que un elemento extraído al azar sea mayor de 45. 11.2 La duración de unas baterías de litio se distribuye normalmente con un promedio de 3 años y una desviación estándar de 0,64 años; construya su función de probabilidad y determine el porcentaje de baterías que se espera, duren entre 32 a 39 meses. 11.3 El peso de los alumnos de un centro educativo se distribuye normalmente; una muestra seleccionada al azar de 200 alumnos pesan en promedio 52,3 kg con una desviación estándar de 21,7 kg. a) Determine la probabilidad de que un alumno seleccionado al azar, pese más de 54 kg. b) Determine la probabilidad de que un alumno seleccionado al azar, pese a lo más 50 kg. c) Determine la probabilidad de que un alumno seleccionado al azar, pese entre los 50 y 55 kg. Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 76 d e 92
d) ¿Cuántos alumnos pesarán entre 40,1 y 48,5 kg.? e) ¿Cuántos alumnos pesarán más de 55 kg.? 11.4 La planta química COLOR PAINT produce semanalmente 4 500 galones de pintura esmalte, con una desviación estándar de 865 galones; a fin de estimular el rendimiento por producción, la dirección de la empresa dispone que si la producción semanal supera el cuarto superior, el personal operativo de la planta será beneficiado con un incentivo por producción de 10% más en su salario semanal; en cambio si la producción está por debajo del 15% inferior, se rescindirá el contrato al personal operativo; ¿cuáles serán esas cantidades que permitan satisfacer dichas expectativas? R: 4669 galones y 4240 galones. 11.5 El sistema de calificación de notas de los alumnos de una institución académica, es de cero a cien, siendo la nota mínima aprobatoria de 65 puntos; este tiene el siguiente comportamiento: Calificativo
N° alumnos
20 – 30> 4 – 30 40> 11 40 – 50> 23 50 – 60> 39 60 – 70> 21 70 – 80> 9 80 – 90> 5 90 – 100> 2 a) Encuentre una curva de tendencia del comportamiento de estas notas. b) Explique porqué esta curva de tendencia puede aproximarse a una distribución normal, y cómo sería la ecuación de su curva, teniendo en cuenta este planteamiento. c) Determine la probabilidad de que un alumno cualquiera obtenga nota superior a 75. d) Determine la probabilidad de que un alumno, seleccionado al azar tenga nota comprendido entre 50 y 65 puntos. e) ¿Cuál será la probabilidad de que un alumno sea desaprobado? 11.6 En el examen de admisión a una universidad, la probabilidad de que los postulantes obtengan puntajes mayores de 150 es de 9,85% y la probabilidad de que obtengan puntajes menores a 90 es de 55,17%. Asumiendo que la distribución de estos puntajes sigue una distribución normal, determine el promedio de ingreso así como su desviación estándar. R: 83,276; 51,724 11.7 Se estima que la producción semanal de leche de ganado vacuno en la provincia de Huaura es de 30 000 galones con una desviación estándar de 7 000 galones. Una empresa productora de derivados lácteos debe acopiar esta producción, para ello cuenta con los tanques de almacenamiento que le permiten almacenarlo en suficientes cantidades; si un día cualquiera existe un 5% de probabilidad de que esta producción normal sea rebosada, ¿cuál será la capacidad mínima de almacenamiento que debe disponer la empresa a fin de acopiar este exceso? R: 41 550 galones 11.8 Un alumno de ingeniería informática, que lleva el curso de Estadística y Probabilidades, debe llegar a las clases a más tardar a las 08:00, ya que es hora de inicio de clase, de otro modo, si llega después perturbará a sus compañeros, distrayéndoles y desconcentrándoles; de acuerdo a sus experiencias de viaje, estima que sus viajes cotidianos se distribuyen normalmente con un tiempo promedio de 25 minutos, y una desviación estándar de 14 minutos; si un día cualquiera el alumno sale de su casa, para asistir a la clase de Estadística a las 07:30 horas: a) Estime la probabilidad de que llegue antes de las 08:00. b) Estime la probabilidad de que llegue con retraso de a lo más de dos minutos. Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 77 d e 92
c) Después de cinco minutos de iniciado las clases, el alumno podrá ingresar a ella; estime la probabilidad de ocurrencia de ese hecho. d) Estime la probabilidad de que el alumno llegue a la clase, entre las 07:55 y las 08:04 horas. 11.9 Las remuneraciones mensuales de unos jóvenes ingenieros, que prestan sus servicios en diferentes centros laborales se distribuyen normalmente; si solo el 10% de ellos ganan menos de S/ 1 000 y el 26% ganan más de S/ 1 500. a) calcule el sueldo promedio mensual ganados por estos profesionales. b) ¿Cuál será la probabilidad de que esté percibiendo entre S/ 1 200 y S/ 1 400 mensuales ? R: Promedio S/ 1332,47; Desviación estándar S/ 259,74 11.10 La producción mensual de glicerol de una fábrica química se distribuye normalmente con un promedio de 50 toneladas y una desviación estándar de 14 toneladas; ¿sí un determinado mes produjo más de 55 toneladas, qué porcentaje de producción le compitió? 11.11 Mediante un sistema de alimentos balanceados, proporcionado a un grupo de aves de corral, se está logrando que las posturas de huevos por cada kilo existan en promedio, 14 huevos, con una desviación estándar de 7 huevos; si se considera que un promedio aceptable de buen rendimiento es de 13 huevos por kilo para poder seguir manteniendo con este tipo de alimentación, ¿qué porcentaje de rendimiento será considerado como no apto para esta producción? 11.12 Solo el 2,5% de los alumnos de ingeniería cuentan con un promedio ponderado superior a 15,2, en tanto que el 75% de ellos tienen promedios ponderados inferiores a 12,8; si el promedio de notas se distribuye normalmente, determine: a) La probabilidad de que un alumno seleccionado al azar, tenga promedio ponderado comprendido entre 10,5 y 12,0 b) El promedio de notas que debería tener un alumno para pertenecer al quinto superior. 11.13 Supongamos que CONTRIAL, es una institución que entrega en concesión a particulares, carreteras, para su explotación y comercialización por un período de tiempo; de acuerdo a ello, CONTRIAL, entregará en concesión a una empresa, un tramo de 300 km de carretera en la costa peruana; antes de recibir esta concesión, la empresa alega, que de acuerdo a sus técnicos, existe una probabilidad de 0,008 de encontrar un grave defecto en 1 km de carretera concesionada, el que deberá ser reparada inmediatamente; determine: a) La probabilidad de encontrar al menos 5 defectos en todo el tramo concesionado. b) Si reparar cualquier defecto, en la carretera concesionada le generará un gasto de S/ 1250, ¿cuánto esperará gastar en todo el tramo?
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 78 d e 92
DECIMO SEGUNDA SEMANA DISTRIBUCION DE MEDIAS MUESTRALES Si de una población que se distribuye normalmente, con media y varianza conocida, se extrae una muestra aleatoria de tamaño n, entonces la media de esta muestra , será igual a la media poblacional, más no así su varianza poblacional, ya que es implícito saber, que cuanto más grande sea el tamaño de la muestra, mejor será la estimación de los valores poblacionales, y cuanto más pequeño se el tamaño de la muestra, la estimación estará más propenso a cometerse errores; por lo tanto al trabajar con muestras poblacionales, se dice que = µ, pero no así su varianza; por lo tanto la varianza muestral se define σ define como el error estándar de la media muestral σ
2
=
; la raíz cuadrada de esta varianza se . De esta expresión puede deducirse
que cuanto más grande sea el tamaño de la muestra, menor será el error estándar de la media muestral, y viceversa, así si un investigador podría estar interesado en reducir el error estándar de la media muestral al 50%, el tamaño de la muestra debería incrementarse en cuatro veces más, respecto al tamaño original. Si se desea estimar de qué manera puede comportarse probabilísticamente la media de estas muestras, tal como el siguiente: P( > a), lo que deberá hacerse es estandariza esta muestra del siguiente modo: P( > a) = , esto es cuando se conoce la varianza poblacional; en el caso de no conocer la varianza poblacional, como puede ocurrir, se trabaja con la varianza de su muestra, pero en este caso, la variable estándar seguirá una distribución t_student, con r = n – 1 grados de libertad. Ejemplo 12.1 El coeficiente de inteligencia de los alumnos de una universidad se distribuye normalmente con una media de 105 y una desviación estándar de 12. f)
Se selecciona al azar a un alumno de este centro de estudios; determine la probabilidad de que su coeficiente de inteligencia sea mayor de 112. g) Si se selecciona una muestra de 25 alumnos, determine la probabilidad de el coeficiente de inteligencia de esta muestra sea mayor de 112. h) Si la población de alumnos es de 567, y se saca una muestra de 25 alumnos, determine la probabilidad de que el coeficiente de inteligencia de esta muestra sea mayor de 112. Solución: En este caso, se conoce que la población se distribuye normalmente con media y varianza conocida; por lo tanto se trata de hallar: a) P(x > 112) b) P( , para una muestra de tamaño 25. c) P( , para una muestra de tamaño 25 y una población de tamaño N = 567. Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 79 d e 92
Por lo tanto, para el primer caso: P(x > 112) = P(z > segundo caso: P( P(z >
=
= P(
) = P(z > 0,58) = 28,10%; para el
= 0,18% , y para el tercer caso: P(
=
) = P(z > 2,98) = 0,14%.
Como podrá apreciarse, en estas tres situaciones los cálculo de probabilidades se van haciendo más pequeñas, porque una cosa es solo trabajar con una sola muestra, y otro esperar que más de una muestra tengan el mismo promedio.
EJERCICIOS 12.1. Explique el significado del teorema del límite central. 12.2. Explique el significado de la desviación estándar. 12.3. ¿Qué problemas pueden surgir al seleccionar muestras poblacionales? 12.4. ¿Qué significa que una muestra esté sesgada? 12.5. ¿De qué manera se puede hacer un muestreo? 12.6. ¿En qué consiste el muestreo sistemático?, con un ejemplo explique su uso. 12.7. Un investigador considera que los estudios que está desarrollando no son convincentes, dado que asegura que la muestra tomada de solo 20 elementos, no le garantiza confiabilidad en los resultados de la investigación; por ello considera que el error estándar de estimación de la media muestral debe reducirlo al 40%; ¿de qué tamaño deberá tomar una nueva muestra a fin de hacer una nueva investigación? 12.8. El promedio de nota de los alumnos de ingeniería en el curso de Matemática II fue de 12,7, con una desviación estándar de 3,68. a) Se selecciona al azar a un alumno, determine la probabilidad de que su nota promedio sea mayor de 13.2. b) Determine la probabilidad de que su promedio de nota sea a lo más 11,0. c) Si se toma al azar una muestra de 31 alumnos, determine la probabilidad de que el promedio de notas de estos sea mayor de 13,2. d) ¿Cuál será la probabilidad de que una muestra de 50, tengan un promedio superior de 13,2? Explique la diferencia entre este resultado con lo obtenido en el caso anterior. e) Considerando que la población de alumnos que han llevado este curso fue de 345, y la muestra seleccionada fue de 31, ¿cuál será la probabilidad de que el promedio de notas de estos sea mayor de 13,2? 12.9. Los ingresos mensuales de los ingenieros industriales se distribuyen normalmente con una media de S/ 2 892,54 y desviación estándar de S/ 1 235,87; si 65 ingenieros informáticos ganan entre S/ 3 120,00 y S/ 3 600,10, determine el tamaño de la muestra obtenida y diga ¿cuántos ingenieros ganarán más de S/ 3 000,00? 12.10. En el sistema de viviendas residenciales, la telefónica factura en promedio 150 llamadas con una desviación estándar de 30 llamadas. Si existe un 8% de estas viviendas que son considerados como los que más hacen llamadas, ¿cuál será el mínimo número de llamadas que deberá facturar la telefónica y si por este mínimo se cobrará un adicional de 15% al monto facturado, cuánto se esperará cobrar? R: 192 llamadas. 12.11. En un entidad bancaria, el promedio de ahorros bajo un nuevo sistema de pago de intereses de sus 657 clientes es de S/ 5 382 con una desviación estándar de S/ 1 631; se selecciona una muestra de 80 clientes: determine la probabilidad de que su cuenta de ahorros sea: Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 80 d e 92
a) Mayor de S/ 5 400. b) Sea menor de S/ 5 000. c) Esté comprendido entre los S/ 5 200 y S/ 5 400. d) Con la finalidad de conocer el nivel de ingresos de un grupo de empresarios vinculados al negocio de la compra y venta de piezas y partes de equipos de cómputo, se hace un muestreo a 45 de ellos y se encuentra que el nivel de ingresos medios fueron estimados con un error estándar de S/ 200; si se considera que este error es muy grande y se desea reducirlo solo a S/ 75, ¿de qué tamaño deberá ser la nueva muestra? 12.12. En promedio, el precio de los departamentos de vivienda de 75 m 2, en la ciudad de Lima, se distribuyen normalmente con una media de US $ 75 000 y una desviación estándar de US $ 26 400. De un conjunto de 360 departamentos que ofrece una constructora se selecciona una muestra de 31 departamentos, para ser ofrecido a una asociación de profesionales; determine la probabilidad: a) Estos departamentos estén costando en promedio, menos de US $ 72 000. b) El precio de estos departamentos estén costando entre US $ 70 000 y 78 000. c) Los departamentos que superen los precios de US $ 80 000, no serán vendidos a esta asociación, determine la probabilidad de que este suceso ocurra. 12.13.
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 81 d e 92
DECIMO TERCERA SEMANA PROPORCIONES POBLACIONALES Una proporción es un atributo poblacional; por ejemplo, se podría decir que el 30% de los huachanos son vegetarianos, por lo tanto el resto no lo será; la probabilidad de que ese atributo se de, se denota por p, y de la que no se dé, por q, de tal manera que p + q = 1. Si manifestamos que el 30% de los huachanos son vegetarianos, entonces al seleccionar una muestra de un grupo de huachanos, podría interesar saber la probabilidad de que más del 35% de esta muestra, sean vegetarianos, o cualquier caso de una probabilidad; esta forma de calcularlo se expresa del siguiente modo. P(p s > 35%), donde p s denota la probabilidad de la muestra. Si la población se distribuye normalmente, entonces su muestra de tamaño n, también se distribuirá normalmente, , siendo σ = por lo tanto su variable estándar será z = , con el cual se puede desarrollar fácilmente el cálculo de probabilidades, con las siguientes condiciones previas: sumar a p s cuando se trata de calcular probabilidad menor que, y restar a p s cuando se trata de calcular probabilidad mayor que; este cálculo se hace por ajuste de aproximación; en cuanto más grande sea n, el ajuste será menos imperceptible. Ejemplo 13.1 El 12% de los estudiantes que terminan la instrucción secundaria, de la provincia de Huaura, desean estudiar ingeniería en la Faustino; del CPU se selecciona una muestra de 80 estudiantes, determine la probabilidad: a) De que más del 15% desean estudiar ingeniería en la Faustino. b) De que menos del 10% desean estudiar ingeniería en la Faustino. c) De que entre el 9% y el 14% desean estudiar ingeniería en la Faustino. Solución: La muestra es de tamaño n = 80; en este caso se trata de una proporción poblacional, por lo tanto p = 0,12 la proporción de estudiantes interesados en estudiar ingeniería, y q = 0,88, la proporción de los no interesados en ello; p s es la proporción de la muestra obtenida; por lo tanto se pide: a) P(ps > 0,15) ≈ P(p s >0,144) = P( z > 0,66) = 25,36%; habiendo hecho previamente el ajuste de corrección, como el haber restado a p s . b) P(ps < 0,10) = P( z < -0,385) = 14,98%. c) P(0,09 < ps < 0,14) = P(-0,096 < z < 0,146) = 9,58%. Ejemplo 13.2 El 3% de las Laptop que adquiere el centro de cómputo de una universidad, presentan una serie de fallas, producto de un mal proceso de control de calidad; si dicha universidad ha recibido un nuevo lote de estas Laptop, y determinó que la probabilidad de encontrar más del 5% de Laptop en malas condiciones era del 2,5%, determine el tamaño de muestra seleccionada. Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 82 d e 92
Solución: En este caso p s = 0,05, donde p = 0,03 probabilidad de encontrar Laptop falladas; q = 0,97, probabilidad de encontrar no falladas. A la probabilidad de encontrar más del 5% con problemas de fallas de las Laptop es del 2,5%, por lo tanto a esta probabilidad le corresponde el coeficiente estándar z = 1,96, que se obtiene de la tabla de distribución normal; teniendo estos valores, z = se obtiene que el tamaño de la muestra seleccionada fue de n = 280 Laptop. Ejemplo 13.3 El 15% de los ingenieros egresados de la UNJFSC, quienes laboran en el sector privado, están considerados como “bien remunerados”; s i de una población de 250 ingenieros egresados de esta Casa de Estudios se selecciona una muestra de 31 ingenieros, determine la probabilidad de que más del 20% de éstos, estén considerados como “bien remunerados” en el
sector privado. Solución: Antes de resolver el problema, debe introducirse el factor tamaño de la población, en este caso, población finita, siendo z = , teniendo en cuenta esta condición, luego se trata de hallar P( ps > 0,20) ≈ P(p s > 0,198 )= P( z > 0,80) = 21,19%.
EJERCICIOS 13.1 Según la nueva tendencia de aparición de la pandemia, conocida como la gripe porcina, en una determinada localidad del país, se sabe que por cada 500 personas, hay seis que posiblemente estén infectados con este mal. a) Si una muestra compuesta por 1 600 personas, ha sido seleccionada al azar; estime la probabilidad de que más de veinticinco de ellas, estén infectados con este mal. b) Si se toma otra muestra de solamente doce personas, ¿cuál será la probabilidad de encontrar a lo más diez personas sanas, sin estar infectado con este mal? R: a) 11,12% b) 2,16%
13.2 El 5% de los postulantes que optan por la carrera de ingeniería de sistemas son de la provincia de Oyón; si para el próximo examen de admisión se están presentando 80 postulantes; estime la probabilidad de que más del 7% de ellos, postulen a la carrera de ingeniería de sistemas. 13.3 Un 10% de los productos diseñados con un nuevo sistema productivo, son propensos a fallar por diferentes naturalezas; tomando una muestra aleatoria de veinticinco nuevos productos, elaborados bajo este nuevo sistema, estime: a) La probabilidad de encontrar menos del 8% con estos problemas. b) Si se encuentra que un 92% de los productos estaban en buenas condiciones, ¿qué R: a) 37,07% porcentaje de productos no pasaron el control de calidad? 13.4 Según estadísticas del MTC, sólo el 9% de los accidentes de tránsito que ocurren en la ciudad de Lima son debidos a la imprudencia del peatón; si de una población de 500 peatones se toma una muestra de veinte, estime la probabilidad de que: a) Más del 10% de ellos estén expuestos a este accidente. b) Entre el 7% y 10,5% de estos estén expuestos a estos accidentes. 13.5 De acuerdo a una encuesta realizada en Lima Norte, el 13% de las personas dijeron leer el diario El Comercio, en tanto que en Lima Capital el 17% decían leer el mismo diario; se toma una muestra de 20 personas del primer caso, y 18 personas del segundo caso; Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 83 d e 92
estime la probabilidad de que la diferencia de los promedios de lectores de Lima Capital sea mayor del 1% en comparación al de Lima Norte 13.6 Según estudios realizados por una empresa encuestadora, la gestión del actual Gobierno Central tiene una aceptación de 56,2% de los electores; si en Huacho se toma una muestra de 80 electores, estime la probabilidad que a lo más solo el 50% aprueban la gestión del Gobierno. 13.7 El 12 % de los alumnos de ingeniería son provenientes de la provincia de Huaral; se toma una muestra de 35 alumnos de la facultad de ingeniería que cuenta con una población de 892 alumnos; determine la probabilidad de que de esta muestra: a) Más del 14 % sean provenientes de Huaral; b) Entre el 10% y 13% sean provenientes de Huaral; c) Menos del 11% sean provenientes de Huaral. 13.8 El 25% de los alumnos que estudian ingeniería informática manifiestan poseer una PC de última generación; se toma una muestra de 42 alumnos que estudian esta carrera, estime la probabilidad de que más del 30% de ellos cuenten con una PC de estas características. Si la población estudiantil está conformado por 315 alumnos, estime la probabilidad de entre el 28% y 33% de ellos cuenten con esta PC. 13.9 Si solo el 35% de los peruanos cree que en el año 2012, la economía del país mejorará por el boom minero, del que actualmente goza el país; haciendo una investigación de la percepción de este sentir en la población barranquina, se tomó una muestra de 90 pobladores y se encontró que el coeficiente estándar de esta estimación fue de 1,368. ¿Qué porcentaje de barranquinos consideraba que el 2012 mejorará el país? 13.10 El 45% de los peruanos considera que el proyecto CONGA debe seguir para adelante. a) Si en Huacho se selecciona una muestra de 75 pobladores, determine la probabilidad de que más del 49% de ellos, consideran que CONGA debe seguir adelante. b) Si se encuentra que solo hay una probabilidad del 2,5% de que más del 52% de los huachanos, consideraba que CONGA debe seguir para adelante, ¿de qué tamaño se tomó la muestra? R: a) 71,70% b) n = 194 13.11 El 8% de los viajeros hacia la selva muestran su disconformidad con el servicio prestado por los operadores turísticos; si una agencia transportó en el pasado año, 546 turistas, y selecciona una muestra de 70 de ellos; estime la probabilidad de que: a) Más del 12% de ellos muestren su disconformidad con el servicio prestado. b) A lo más, solo el 6%, muestren su disconformidad con el servicio prestado. 13.12
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 84 d e 92
DECIMO CUARTA Y QUINTA SEMANA DISTRIBUCION DE LA DIFERENCIA DE MEDIAS MUESTRALES MUESTRAS PEQUEÑAS Por lo general, se dice que las muestras son pequeñas, cuando la cantidad de elementos, es menor o igual 30; en poblaciones que se distribuyen normalmente, cuando no es conocido su varianza poblacional, es normal trabajar con muestras pequeñas para poder estimarlos, pero esta muestra ya no sigue una distribución normal; sigue una distribución t, llamada t_student, que también es una curva simétrica, acampanada, un poco más achatada que la curva normal; su forma depende del tamaño de la muestra; cuanto más grande sea su tamaño, más se irá aproximando a la normal, y cuando es mayor de 30, prácticamente es como decir que éste sigue una distribución normal, por el principio del Teorema del Límite Central. En este caso la variable estándar será t = , con r = n – 1 grados de libertad; donde es la media muestral, µ, la media poblacional, s la desviación estándar de la muestra, y n su respectivo tamaño. Para hacer uso de esta distribución, deberá emplearse la tabla de distribución t.
Ejemplo 14.1 Los gastos mensuales desarrollados en entretenimientos que realizan los estudiantes universitarios, se distribuyen normalmente con una media de S/ 75. Una muestra de un grupo de ellos, manifestó que en promedio, gastaban mensualmente en S/, cada uno de ellos, en entretenimientos: 82 62 65 72 78 79 61 70 69 y 81. Si con esta información se selecciona otra muestra de 17 estudiantes, determine la probabilidad, de que en promedio, esta muestra esté gastando mensualmente en entretenimientos: a) Más de S/ 83 mensuales. b) Menos de S/ 80 mensuales. c) Entre S/ 70 y S/ 78 mensuales. Solución: En este caso, se sabe que la población sigue una distribución normal con media conocida, pero no así su varianza poblacional; para trabajar con estas poblaciones se selecciona una muestra de cualquier tamaño y se recopila información requerida; sin embargo la muestra sigue una distribución t, con r = n-1 grados de libertad, siendo n = 17; la media poblacional µ = S/ 75. Con los Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 85 d e 92
datos obtenidos se determina que la varianza muestral es s 2 = 60,989 (S/) 2 y la variable estándar t= ; luego se trata de hallar: a) P( > 83) = P(t > 3,239) = 0% b) P( < 80) = P(t < 2.025) = 96,86% c) P(70 < < 78) = P(-4,04 < t < 1,215) = 87,77%
EJERCICIOS 14.1 De una tabla t se obtiene: t c(1-α; 1,372), donde α = 0,05; halle n. 14.2 En una población con distribución normal, para un α = 5%, se extrae una muestra de tamaño 12 encuentre su t c. 14.3 Si una muestra de tamaño 20 tiene una distribución t, con t c =2,852, encuentre α. 14.4 Si una muestra de tamaño 10, se distribuye con una t, donde α = 0,22; encuentre su valor crítico. 14.5 En una distribución t, con muestra de tamaño 15 se obtiene que sus coeficiente críticos están comprendidos entre ± 1,086; encuentre 1 – α. 14.6 La producción de leche de una estancia ganadera se distribuye normalmente con una media de 12 litros por vaca por día. Si de una muestra de 12 vacas, se obtuvo una desviación estándar de producción de leche de 5 litros, determine la probabilidad, que esta muestra produzca: a) Más de 15 litros de leche por día. b) Menos de 8 litros de leche por día. c) Entre 11 y 14 litros de leche por día. d) Si la muestra produce menos de 9 litros, se procederá a cambiar su dieta alimenticia, estime la probabilidad de que ese evento no ocurra. 14.7 La gerencia de producción de una empresa está probando una nueva máquina envasadora de pinturas anticorrosivas que tiene como propiedad llenar baldes de un galón, equivalente a 3,785 litros, por cada pasada. A fin de ver si está cumpliendo con las normas establecidas, se toman al azar, un conjunto de baldes recientemente envasadas, obteniéndose las siguientes medidas: 3,682 4,002 3,701 3,897 3,695 4,011 3,699 3,698 litros de pintura, respectivamente. Considerando que la medida de estos baldes sigue una distribución normal, determine la probabilidad de que la máquina pueda estar llenando entre los 3,895 y 4,104 litros de pintura por pasada. 14.8 Los pesos de las manzanas de una parcela se distribuyen normalmente con una media de 178 gramos; si de una determinada parcela se toma una muestra de 20 manzanas, encontrándose que en promedio pesaban 172 gramos con una desviación estándar de 65 gramos: a) ¿Qué porcentaje de la cosecha deberá desecharse para estos propósitos, sabiendo que no son aptas para comercializarlos en mercados exclusivos? b) Si el peso de las manzanas está comprendido entre los 180 y 200 gramos, serán consideradas como aptas para ser llevadas a un mercado muy exclusivo, ¿qué porcentaje de las cosechas serán declaradas como no aptas para ser introducidas en este mercado? 14.9 Una empresa manufacturera afirma que las baterías que utiliza en sus juegos electrónicos duran un período de 30 horas. Para mantener este promedio se prueban 16 baterías cada mes. Si el valor t que se calcula cae entre –t0,025 y t0,025, la empresa queda satisfecha con Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 86 d e 92
su afirmación. ¿Qué conclusiones debería obtener la empresa, de una muestra que tiene una media de 27,5 horas y una desviación estándar de 5 horas? Suponga que las duraciones de las baterías sigue una distribución normal. 14.10 La presión sistólica, para personas normales está en el orden de los 121 mmHg. Se toma una muestra a un grupo de personas comprendidos entre los 30 y 40 años, a quienes se les toma su respectiva presión sistólica, encontrándose los siguientes resultados: 116, 132, 140, 152, 123, 118, 128, 140, 150, 129, 132, 121, 133, 127, 118, 115, 129, 110, 115, 130, 140, 147. Se considera que la persona tiene una presión normal alta cuando está comprendido entre los 130 y 139; normal cuando está comprendido entre 120 y 130, y óptima cuando es menos de 120 y mayor de 108; asumiendo que las distribuciones de estas presiones se distribuyen normalmente ¿qué porcentaje de personas tendrá?: a) Una presión óptima. b) Una presión normal. c) Una presión normal alta.
DIFERENCIA DE MEDIAS MUESTRALES En estadística también podría suceder que se desea conocer el comportamiento de la diferencia de las medias muestrales de dos poblaciones distintitas; para ello de dos poblaciones que se distribuyen normalmente, se pueden extraer dos muestras aleatorias, determinar sus respectivos promedios y con ellos calcular la probabilidad de que la diferencia entre estas dos muestras sea mayor que o sea menor que cierto valor. Cuando se presenta estas situaciones, podría suceder dos casos: 1º Que se conozcan las varianza poblacionales, o 2º Supuestamente se conocen estas varianzas. P r i m e r c a s o : Diferencia de medias poblacionales cuando se conocen las varianzas poblacionales. σ 12 y σ22. Si de ambas poblaciones se extraen muestras aleatorias de tamaños n 1 y
n2 respectivamente, entonces si se trata de hallar la probabilidad de que P(x 1-x2 > a), deberá estandarizarse estas variables haciendo z = , donde µ 1 y µ 2, son las medias de las dos poblaciones, respectivamente. S eg u n d o c a s o : Diferencia de medias poblacionales cuando supuestamente se conocen sus varianzas poblacionales σ 12 y σ22. En este caso, de las dos poblaciones se extraen también dos
muestras aleatorias de tamaños n 1 y n2, de los cuales se extraen sus respectivas medias y varianzas muestrales s12 y s22, entonces si se está interesado en hallar la probabilidad de que P(x1-x2 > a), deberá tenerse en cuenta que su variable estándar sigue una distribución t con variable estándar t =
,, donde s 0 =
, representa el promedio de
las dos varianzas, y la variable t sigue una distribución t_student con r = n 1 + n2 - 2 grados de libertad. Ejemplo 14.2 El nivel de colesterol en los pacientes hombres y mujeres, que acuden a un hospital, se distribuye normalmente con una media de 215 mg/dl, para los hombres y una media de 206 mg/dl para las mujeres. Un día cualquiera se recibe una muestra de un grupo de pacientes hombres, y otro grupo de pacientes mujeres, cuyos resultados de los análisis de colesterol fueron: Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 87 d e 92
Hombres: 220 Mujeres : 226
210 198 205 230 231 217 198 215 mg/dl por cada uno de ellos. 205 210 212 215 217 210 190 180 194 mg/dl por cada una de
ellas. Determine: a) La probabilidad de que la diferencia del nivel de colesterol entre los hombres, respecto a las mujeres, sea mayor de 14 mg/dl. b) La probabilidad de que la diferencia del nivel de colesterol entre los hombres, respecto a las mujeres, sea menor de 5 mg/dl. c) La probabilidad de que en una muestra de 20 pacientes hombres, el nivel de colesterol sea mayor de 220 mg/dl. d) La probabilidad de que en una muestra de 12 pacientes mujeres, el nivel de colesterol sea menos de 200 mg/dl. Solución: En este caso se tiene dos poblaciones de los cuales se trata de hallar la diferencia de sus medias, basadas en la diferencia de su medias muestrales; como la población se distribuye normalmente y no se conocen sus varianzas poblacionales, de sus respectivas muestras se determinan sus respectivas varianzas, con la salvedad que estas muestras siguen una distribución t con r = n H + n M – 2 grados de libertad. Por lo tanto determinando sus respectivas varianzas, de las muestras dadas, se tiene s2H = 12,245 y s 2M = 194,100; el promedio de ambas varianzas es s 20 = 173,321. La variable estándar para esta distribución será: t = donde t se distribuye con r = n H+nM-2 grados de libertad; luego, se trata de hallar de las muestras seleccionadas: a) b) c) d)
P( P( P( P(
P(t > 0,826), r = 17 g.l; hacienda uso de la tabla: 21,17% P(t < -0,661) r = 17 g.l; hacienda uso de la tabla: 26.43% P(t > 1,826) r = 19 g.l; haciendo uso de la tabla t: 4,33% P(t < -0,371) r = 11 g.l; haciendo uso de la tabla t: 35,92%
EJERCICIOS 14.11 De una población que se distribuye normalmente con media 100 y varianza 400 se extrae una muestra de tamaño 50, y de otra población que también se distribuye normalmente, con media 120 y varianza 484 se extrae otra muestra de tamaño 60; determine la probabilidad de que la diferencia de las medias de estas muestras, de ésta última con relación a la anterior sea: a) Mayor de 15. b) Menor de 12. c) Esté comprendido entre 5 y 12. 14.12 Los salarios de los obreros de construcción civil se distribuyen normalmente; si en la ciudad de Lima se toma una determinada muestra de obreros, a quienes se les pregunta sobre sus salarios, estos respondieron que ganaban diariamente: 65, 72, 68, 73, 49, 53, 66, 78, 80 Nuevos Soles respectivamente; de igual manera, en la ciudad de Arequipa se toma otra muestra de un número de obreros, encontrándose las siguientes respuestas: 70, 46, 57, 71, 55, 50, 66, 60, 45, 53, 64, Nuevos Soles respectivamente; determine: Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 88 d e 92
a) La probabilidad de que la diferencia promedio de sueldos entre los obreros de Lima versus los obreros de Arequipa sea mayor de S/ 2,00. b) La probabilidad de que la diferencia promedio de sueldos entre los obreros de Lima versus los obreros de Arequipa esté comprendido entre S/ 3,50 y S/ 7,00. c) Si se selecciona aleatoriamente a un obrero de Lima y a otro de Arequipa, estime la probabilidad de que gane más de S/ 70 diarios. 14.13 Una muestra de 80 flats de un proveedor mostró que estas en promedio duraban 4 000 horas con una desviación de 900 horas, en tanto que tomando otra muestra de 50 flats de otro proveedor, indicó que en promedio duraban 4 200 horas con una desviación estándar de 1 020 horas; estime la probabilidad de que la diferencia entre el tiempo de duración de sus medias muestrales: a) Sea mayor a los 200 horas. b) Sea menor a las 100 horas 14.14 Un modelo de llantas para camiones, elaborado por la fábrica A, tiene una duración media de 10 000 km. con una desviación estándar de 4 200 km.; mientras que las producidas por otra fábrica, tienen una duración media de 9 400 km. con una desviación estándar de 2 400 km.; se toman 200 muestras de las llantas producidas por la primera fábrica y otra de 180 llantas producida por la segunda fábrica; determine: a) La probabilidad de que el promedio de vida de las muestras de llantas de la primera fábrica sea mayor que el de la segunda en 500 km. b) La probabilidad de que el promedio de vida de las muestras de las llantas de la segunda fábrica sea menor en 400 km. o en 550 km. 14.15 Se quiere contar con un proveedor exclusivo de Tintas de Impresora, para ello se toman muestras de dos fabricantes (CANON y LEXMARK), con las mismas características; de la CANON se tomó 5 muestras de chisguetes de tinta y cada una de ellas imprimieron 210, 215, 212, 208, 220 páginas; de la LEXMARK se tomó otra muestra de 6, los cuales imprimieron 200, 217, 222, 204, 200 y 210 páginas. Con esta información, se tomará una muestra de 12 chisguetes de la CANON y 10 de la LEXMARK; determine la probabilidad, de que la diferencia entre el promedio de impresión entre los chisguetes de las LEXMARK con la CANON sea más de 10 páginas. 14.16 En una feria se presentan una serie de equipos industriales; dentro de ellas dos máquinas llenadoras de botellas, que según sus fabricantes, el primero llena un promedio de 300 botellas por minuto con una desviación estándar de 50 botellas; en tanto el segundo manifiesta que sus máquinas llenan en promedio 280 botellas por minuto con una desviación estándar de 24 botellas; se escoge una muestra de 10 llenadoras del primer fabricante y de 16 llenadoras del segundo fabricante; determine la probabilidad de que la diferencia entre las medias muestrales sea: a) Mayor de 30 botellas por minuto. b) Menos de 15 botellas por minuto. c) Esté entre 20 y 25 botellas. 14.17 Como un paso previo hacia la acreditación universitaria, se están comparando los promedios generales de las notas de los estudiantes de dos universidades A y B; en este sentido, el calificativo promedio de los alumnos de la primera universidad es 14,3 con una desviación estándar de 4,4, en tanto que los de la segunda universidad es de 12,6 con una desviación estándar de 2,7; se toma una muestra aleatoria de 12 alumnos de ambas universidades, determine la probabilidad de que la diferencia de calificativo del primero al segundo sea: a) Mayor de dos puntos. b) Menor de tres puntos. R: a) 38,59% b) 89,62% 14.18 El nivel de triglicéridos en la sangre de los pacientes de un hospital, entre los hombres y mujeres, se distribuye normalmente, ambos con medias iguales. Un determinado día se Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 89 d e 92
tomó muestras de sangre a un grupo de pacientes a fin de determinar el nivel de sus triglicéridos, y cuyos resultados fueron: Pacientes mujeres: 200 168 150 146 210 176 168 161 y 174 mg%, respectivamente; pacientes hombres: 176 180 194 195 148 152 151 mg% respectivamente. Con esta información la administración del hospital decide tomar una muestra de 20 pacientes mujeres y 15 pacientes hombres a fin de estudiar el nivel de triglicéridos en la sangre de ellos, determine: a) La probabilidad de que el promedio de la diferencia de triglicéridos en la sangre de la muestra de mujeres, respecto a la de los hombres sea mayor de 6,17 mg%. b) La probabilidad de que el promedio de la diferencia de triglicéridos en la sangre de la muestra de mujeres, respecto a la de los hombres esté comprendido entre los 4,92 mg% y 18,64 mg%. R: a) 20%, b) 24% 14.19
DISTRIBUCIONES CHI CUADRADO y F
La distribución Chi cuadrado se utiliza para estudiar el comportamiento de las variaciones poblacionales, y la distribución F, para estudiar razones de comportamiento de las variaciones poblacionales. DISTRIBUCIÓN CHI CUADRADO. Si de una población que se distribuye normalmente con varianza conocida se extrae una muestra aleatoria de tamaño n de donde se puede extraer su varianza, entonces el estadístico x2=
, sigue una distribución Chi cuadrado con r = n -1 grados de libertad. Esta distribución
es asimétrico positivo, y su forma depende del tamaño de la muestra; cuanto más se va aproximando al tamaño de 30, su forma tenderá a ir reduciendo su asimetría. DISTRIBUCIÓN F Si de dos poblaciones que se distribuyen normalm ente, con varianzas conocidas σ 12 y σ22, se extraen dos muestras de tamaños n 1 y n2, respectivamente, entonces la razón F =
, con s 12
mayor que s22, sigue una distribución F, con r 1 = n1 – 1 y r 2 = n2 -1 grados de libertad. Ejemplo 14.3 Los precios de las Laptop en el mercado de la provincia de Huaura varían aproximadamente en S/ 55; si en un día cualquiera se selecciona una muestra de 21 Laptop en esta localidad, determine la probabilidad de que la variación de sus precios sea: a) Mayor de S/ 64. b) Menor de S/ 50. Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 90 d e 92
c) Si se desea comparar la razón de variación de estos precios, con respecto a lo de Lima, y en ésta última se selecciona una muestra de 9 Laptop, determine la probabilidad de que la razón de variación de los precios de estas Laptop, respecto a Huaura sea menor de 1,6. Solución: Se trata de hallar comportamiento de variaciones poblacionales, donde se hará uso de las distribuciones chi cuadrado y la F. a) P(sH > 64) = P(
) = P(χ2 > 27,081), con r = 20 g.l; con la tabla = 15,86%
) = P(χ2 < 16,529), con r = 20 g.l; con la tabla = 33,70% b) P(sH < 50) = P( c) P(sH/sL < 1,6) = P(F < 2,56), con r 1 = 8 g.l de Lima y r 2 = 20 g.l de Huaura; con la tabla F = 95,60%
EJERCICIOS 14.20 Explique, el uso de la distribución chi cuadrado. 14.21 En una distribución chi cuadrado, si una muestra de tamaño 18 genera una probabilidad mayor de 5%, determine su coeficiente crítico. 14.22 En una distribución chi cuadrado, de una muestra de tamaño 15, se obtiene que sus valores críticos son χ 12 = 5,42 y χ22 = 22,50, encuentre 1- α. 14.23 Determine la probabilidad de que una variable con distribución chi-cuadrado y cinco grados de libertad sea mayor que 9,24. 14.24 La desviación estándar de los pesos de los alumnos de un nido escolar se distribuye normalmente con 3,45 kg. Se extrae al azar una muestra de 12 niños, estime la probabilidad de que la desviación estándar de esta muestra, sus pesos sean mayores de 3,23 kg. 14.25 Las calificaciones de un examen que se aplicaron a estudiantes del primer año de una universidad, durante los últimos cinco años, están distribuidos aproximadamente de forma normal con una media de 74 y una varianza de 128. Si se selecciona al azar una muestra de 20 alumnos, estime la probabilidad de que la variación de sus notas: a) Sea mayor de 12,5. b) Sea menor de 11,5. c) Esté comprendido entre 12,2 y 13,9. 14.26 Una población normal con varianza desconocida tiene una media de 20. ¿Si tiene posibilidad de obtener una muestra aleatoria de tamaño 9 de esta población, con una media de 24 y una desviación estándar de 4,1, ¿qué conclusión obtendría? 14.27 La estatura de los pobladores de la sierra tienen una variación de 6,4 cm. Se toma una muestra de 18 pobladores al azar, determine la probabilidad de que la variación de sus estaturas sea; a) Mayor de 5 cm. b) Menor de 4,8 cm. 14.28 Si r 1 = 8 y r 2 = 5, encuentre su F c para 1 – α = 90%. 14.29 Si P(F>4,26) = 0,005, encuentre el valor de sus respectivos tamaños muestrales. 14.30 De dos poblaciones que se distribuyen normalmente con varianzas iguales, se extraen dos muestras aleatorias de tamaños 11 y 21, respectivamente; determine la probabilidad de que la razón de sus varianzas muestrales sea: a) Mayor de 2,35; b) Menor de 2,62 c) Esté comprendido entre 2,38 y 3,0. 14.31 La variación de los salarios de los obreros de construcción civil en la ciudad de Lima como en el Huacho, es de S/ 22,50; se sabe además que esta variación se distribuye normalmente; si en Huacho se toma una muestra de 11 obreros y en Lima otra muestra de Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas
Pági na 91 d e 92
16 obreros de esta rama, determine la probabilidad de que la variación de salarios entre: a) Un obrero de Huacho respecto a Lima sea mayor de 3,1 b) Esté comprendido entre 1,5 y 3,42. 14.32 Los ingresos mensuales de los ingenieros informáticos presentan una variabilidad de S/ 520 mensuales, y la de los ingenieros químicos, una variabilidad de S/ 750 mensuales. a) Se selecciona una muestra de 25 informáticos, determine la probabilidad de que la variación de sus sueldos mensuales sea mayor de S/ 600. b) Si se selecciona una muestra de 1º informáticos y otra muestra de 16 químicos, determine la probabilidad de que la razón de varianza de los sueldos entre los químicos e informáticos, sea menor de 3,50. R: a) 7,89%, b) 96,55% 14.33
Guía de Prácticas de Estadística y Probabilidades
Ciclo 2012-II
Prof. Moisés E. Armas