Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
I. LA ESTADISTICA 1. DEFINICIÓN: La Estadística es una ciencia que nos ofrece un conjunto de métodos y técnicas para recopilar, organizar, presentar, analizar e interpretar un conjunto de datos respecto a variables en estudio de una población, con el fin de obtener conclusiones y tomar decisiones sobre determinados hechos o fenómenos en estudio. La estadística es una rama de la matemática y es parte del método científico. En la actualidad, para hacer investigación científica se necesita conocer de estadística. 2. CLASIFICACION DE LA ESTADÍSTICA La Estadística se clasifica de la siguiente manera: 2.1. Estadística Descriptiva Es aquella área de la Estadística que describe y analiza una población, sin pretender sacar conclusiones de tipo general. Es decir, las conclusiones obtenidas con validas solo para dicha población. 2.2. Estadística Inferencial Es aquella área de la Estadística, cuyo propósito es inferir o inducir leyes de comportamiento de una población, a partir del estudio de una muestra. Es decir las conclusiones obtenidas a partir de una muestra, son validas para toda la población. 3. DEFINICIONES PRELIMINARES: 3.1. UNIVERSO: Es el conjunto de individuos, objetos o entes que tienen características comunes, definidas en forma general en un u n espacio y tiempo. Ejemplo: Conjuntos de alumnos, concjunto de docentes universitarios, conjunto de de pacientes, conjunto de clientes, conjunto de proveedores, conjunto de viviendas, conjunto de establecimientos, conjunto de documentos, etc.; de una determinada región o zona en un tiempo determinado. 3.2. POBLACIÓN: Es un conjunto grande y completo de individuos, elementos o unidades que presentan como mínimo una característica en común y observable. Para definir una población esta debe contener los siguientes elementos: elementos: contenido, espacio y tiempo. Al número de elementos de una población de denota por “N”. Una población puede clasificarse de la siguiente manera: A. Según su extensión: extensión: Población Finita: Finita: es aquella que tiene un determinado número de elementos. Población Infinita: Infinita: Es aquella cuyos elementos no se pueden contar. B. Según su ámbito o naturaleza: naturaleza: Población Objeto: Objeto: esta dada por los elementos que forman la población. Población Objetivo: Objetivo: esta dada por la información que da la población objeto Nota: De un universo se pueden desprender muchas poblaciones, pero operativamente se pueden hablar indistintamente como población o universo. 3.3. MUESTRA Es una parte o un subconjunto de la población en estudio. También se puede decir que es una colección de unidades de muestreo seleccionados de un marco muestral o de varios marcos muestrales. Al número de elementos de la muestra se denota por “n”.
MÉTODOS ESTADÍSTICOS ESTADÍSTICOS
- 20 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
Una muestra tiene las siguientes características: a. Es representativa. b. Es adecuada. MUESTR EO Es una técnica estadística por la cual se realizan inferencias o generalizaciones para una población examinando solo una muestra de ella. Es una técnica empleada para seleccionar elementos de una población. p oblación. Su propósito es proporcionar diferente tipo de información estadística de naturaleza cuantitativa o cualitativa. Por su gran importancia los investigadores lo utilizan en los diferentes campos de saber y también lo usamos en la vida diaria. 3.4. UNIDAD DE ESTUDIO: Es el animal persona o cosa de quien se dice algo. Es el elemento quien nos va a dar la información. Es el individuo u objeto del cual se toman las mediciones u observaciones. Ejemplos: Un docente, un auxiliar de educación, un votante, una factura, una empresa, una botella de cerveza, una universidad, una vaca, una gota de sangre, etc. 3.5. OBSERVACIONES: Estadísticamente son los datos que se recolectan para un estudio. Una observación o dato es cuando una variable en si toma un valor especifico. 3.6. VARIABLE: Una variable es una característica de estudio de una población. Una variable es lo que se quiere evaluar en una investigación. Las características toma diferentes valores que varían de individuo a individuo o de objeto a objeto. Aquellas características que permanecen inalterables en las unidades de estudio reciben el nombre de constantes. constantes. Generalmente, las variables se designan con las últimas letras mayúsculas del abecedario: X, Y, Z; y los valores de las variables se designan con letras minúsculas: xi , yi , etc. Las variables se clasifican de la siguiente manera: Por su relación: Variable dependiente - variable independiente. Por su escala de medición: Nominal – Ordinal – Intervalo – Razón. Por su naturaleza: Cuantitativas - Cualitativas.
Var iable
Cualidad
Cualitativa
Nominal
No orden
MÉTODOS ESTADÍSTICOS ESTADÍSTICOS
Cantidad
Cuantitativa
O Atributo
Ordinal
o número
Discreta Conteo
Orden
- 21 -
Continua Medición
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
Ejemplos: Ejemplos: Unidad de estudio Estudiante
Empresa
PYME
Variable Peso, talla, edad, ci, número de hermanos, raza, color de ojos, tipo de sangre, etc. Ganancia, costos, producción, número de trabajadores, numero de computadoras, etc. Número de trabajadores, años de funcionamiento, ganancias, etc.
3.7. PARAMETRO: Es un valor, una cantidad, un indicador que se obtiene con información de la población. Dentro de estos tenemos: a. El promedio poblacional b. La varianza poblacional. c. La proporción poblacional, etc. 3.8. ESTIMADOR: Es un valor, una cantidad, un indicador que se obtiene con información de la muestra. Dentro de estos tenemos: a. El promedio muestral. b. La varianza muestral. c. La proporción muestral, etc. 3.9. INVESTIGACIÓN CUANTITATIVA Y CUALITATIVA El objetivo de cualquier ciencia es adquirir conocimientos y la elección del método adecuado que nos permita conocer la realidad es por tanto fundamental. Los métodos inductivos y deductivos tienen objetivos diferentes y podrían ser resumidos como desarrollo de la teoría y análisis de la teoría respectivamente. Los métodos inductivos están generalmente asociados con la investigación cualitativa mientras que el método deductivo está asociado frecuentemente con la investigación cuantitativa. La investigación cuantitativa es aquella en la que se recogen y analizan datos cuantitativos sobre variables. La investigación cualitativa evita la cuantificación. Los investigadores cualitativos hacen registros narrativos de los fenómenos que son estudiados mediante técnicas como la observación participante y las entrevistas no estructuradas. La diferencia fundamental entre ambas metodologías es que la cuantitativa estudia la asociación o relación entre variables cuantificadas y la cualitativa lo hace en contextos estructurales y situacionales. La investigación cualitativa trata de identificar la naturaleza profunda de las realidades, su sistema sistema de relaciones, su estructura dinámica. La investigación cuantitativa trata de determinar la fuerza de asociación o correlación entre variables, la generalización y objetivación de los resultados a través de una muestra para hacer inferencia a una población de la cual toda muestra procede. Tras el estudio de la asociación o correlación pretende, a su vez, hacer inferencia causal que explique por qué las cosas suceden o no de una forma determinada.
MÉTODOS ESTADÍSTICOS ESTADÍSTICOS
- 22 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
VENTAJAS E INCONVENIENTES DE LOS MÉTODOS Tabla 1. Diferencias entre investigación cualitativa y cuantitativa. Investigación cualitativa
Investigación cuantitativa
Centrada en la fenomenología y comprensión
Basada en la inducción probabilística del positivismo lógico
Observación naturista sin control Subjetiva Inferencias de sus datos Exploratoria, inductiva y descriptiva Orientada al proceso Datos "ricos y profundos" No generalizable Holista Realidad dinámica
Medición penetrante y controlada Objetiva Inferencias más allá de los datos Confirmatoria, inferencial, deductiva Orientada al resultado Datos "sólidos y repetibles" Generalizable Particularista Realidad estática
Tabla 2. Ventajas e inconvenientes de los métodos cualitativos vs cuantitativos. Métodos cualitativos
Métodos cuantitativos
Propensión a "comunicarse con" los sujetos del estudio Se limita a preguntar. Comunicación más horizontal... entre el investigador y los investigados... mayor naturalidad y habilidad de estudiar los factores sociales en un escenario natural. Son fuertes en términos de validez interna, pero son débiles en validez externa, lo que encuentran no es generalizable a la población
Propensión a "servirse de" los sujetos del estudio. Se limita a responder.
Preguntan a los cuantitativos: ¿Cuan particularizables son los hallazgos?
Preguntan a los cualitativos: ¿Son generalizables tus hallazgos?
Son débiles en términos de validez interna -casi nunca sabemos si miden lo que quieren medir-, pero son fuertes en validez externa, lo que encuentran es generalizable a la población.
3.10. TÉCNICAS DE RECOLECCIÓN DE DATOS: Las técnicas de recolección de datos permiten la obtención sistemática de información acerca de los objetos de estudio (personas, objetos y fenómenos) y de su entorno. Como ya se mencionó, la recolección de datos tiene que ser sistemática, ya que, si los datos se recolectan al azar será difícil responder las preguntas de investigación de una manera concluyente. Las técnicas de recolección de datos son 1. Utilización de la información disponible 2. Observación 3. Entrevista( cara a cara) 4. Cuestionarios auto-administrados 5. Discusión con grupos focales 6. Otras
MÉTODOS ESTADÍSTICOS ESTADÍSTICOS
- 23 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
OBSERVACIÓN: La observación es una técnica que implica seleccionar ver y registrar sistemáticamente, la conducta y características de seres vivos, objetos o fenómenos. La observación de la conducta humana es una técnica de recolección de datos muy utilizada que puede llevarse a cabo de diferentes formas: a. Observación participativa: El observador participa en la situación que observa b. Observación no participativa: El observador no participa en la situación que observa Las observaciones pueden servir para diferentes propósitos. Pueden dar información adicional y más confiable de la conducta de las u.e. que las entrevistas o los cuestionarios. Los cuestionarios pueden ser incompletos ya que se pueden olvidar algunas preguntas o porque los entrevistados olvidan o no desean contestar algunas cosas. Con la observación se puede, entonces, verificar la información recolectada( especialmente sobre temas como alcoholismo, drogadicción, sida,) pero también puede ser una fuente primaria de información ( observación sistemática de los juegos de los niños). La observación de la conducta humana puede formar parte de algún estudio, pero como consume tiempo se usa con mayor frecuencia en estudios de pequeña escala. ENTREVISTA: La entrevista es una técnica de recolección de datos que involucra el cuestionamiento oral de los entrevistados ya sea individualmente o en grupo. Las respuestas a las preguntas durante la entrevista pueden ser registradas por escrito o grabadas en una cinta. La entrevista pueden conducirse con diferentes grados de flexibilidad. Las entrevistas utilizando una cedula para asegurar que se discuten todos los puntos, pero dando suficiente tiempo y permitiendo seguir cualquier orden. El entrevistador puede hacer preguntas adicionales para obtener tanta información adicional como sea posible, Las preguntas son abiertas y no hay restricciones para las respuestas. Este método poco estructurado de hacer las preguntas puede ser útil para entrevistas individuales o grupales con informantes claves. Un método de entrevista flexible es útil si el investigador sabe poco del problema o de la situación que esta investigando. Se aplica en estudios exploratorios y en los estudios de caso. ENCUESTAS: Hoy en día la palabra "encuesta" se usa más frecuentemente para describir un método de obtener información de una muestra de individuos. Esta "muestra" es usualmente sólo una fracción de la población bajo estudio. Una "encuesta" recoge información de una "muestra." Una "muestra" es usualmente sólo una porción de la población bajo estudio. Las encuestas pueden ser clasificadas en muchas maneras. Una dimensión es por tamaño y tipo de muestra. Las encuestas pueden ser usadas para estudiar poblaciones humanas o no humanas (por ejemplo, objetos animados o inanimados, animales, terrenos, viviendas). Mientras que muchos de los principios son los mismos para todas las encuestas, el foco aquí será en métodos para hacer encuestas a individuos. Las encuestas pueden ser clasificadas por su método de recolección de datos. Las encuestas por correo, telefónicas y entrevistas en persona son las más comunes. En los métodos más nuevos de recoger datos, la información se entra directamente a la computadora ya sea por un entrevistador adiestrado o aún por la misma
MÉTODOS ESTADÍSTICOS ESTADÍSTICOS
- 24 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
persona entrevistada. Un ejemplo bien conocido es la medición de audiencias de televisión usando aparatos conectados a una muestra de televisores que graban automáticamente los canales que se observan OTRAS TÉCNICAS DE RECOLECCION DE DATOS a. Técnica de grupo nominal b. Técnica delphi c. Historias de vida d. Escalas e. Ensayos f. Estudios de casos g. Mapeo h. Técnicas rápidas de evaluación de sondeo i. Encuestas participativas. 3.11. INSTRUMENTOS DE RECOLECCIÓN DE DATOS: Si tenemos presente el tema de investigación por el que nos estarnos guiando se percibirá que, una vez obtenidos los indicadores de los elementos teóricos y definido el diseño de la investigación, se hará necesario estructurar las técnicas dé recolección de datos correspondientes, para así poder construir los instrumentos que nos permitan obtener tales datos de la realidad. Un instrumento de recolección de datos es, en principio, cualquier recurso de que pueda valerse el investigador para acercarse a los fenómenos y extraer de ellos información. Ya adelantábamos que dentro de cada instrumento concreto pueden distinguirse dos aspectos diferentes: una forma y un contenido. La forma del instrumento se refiere al tipo de aproximación que establecemos con lo empírico, a las técnicas que utilizamos para esta tarea; una exposición más detallada de las principales es la que se ofrece al lector en este mismo capítulo. En cuanto al contenido éste queda expresado en la especificación de los datos concretos que necesitamos conseguir; se realiza, por lo tanto, en una serie de ítems que no son otra cosa que los indicadores bajo la forma de preguntas, de elementos a observar, etc. De este modo, el instrumento sintetiza en sí toda la labor previa de investigación: resume los aportes del marco teórico al seleccionar datos que corresponden a los indicadores y, por lo tanto, a las variables o conceptos utilizados; pero también expresa. todo lo que tiene de específicamente empírico nuestro objeto de estudio, pues sintetiza a través de las técnicas de recolección que emplea, el diseño concreto escogido para el trabajo.
PRACTICA CALIFICADA Resolver los ejercicios presentados en la parte final del material de trabajo.
MÉTODOS ESTADÍSTICOS
- 25 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
II. PR ESENTACIÓN DE LA INFOR MACIÓN: En la Estadística se trabaja generalmente con una gran cantidad de datos los cuales por facilidad de análisis y cálculos se organizan en Cuadros de Distribución de Frecuencias (CDF) y Gráficos Estadísticos (GE).
1. CUADRO DE DISTRIBUCIÓN DE FRECUENCIAS (CDF): 1.1. DEFINICIÓN: Un cuadro de distribución de frecuencias, es una tabla resumen de un conjunto de datos que muestra el comportamiento o distribución de la variable en estudio en forma rápida y resumida. Aún cuando un cuadro de frecuencias se construye a libre criterio de quien lo ejecuta, generalmente es común seguir algunos pasos que de alguna forma homogenizan criterios y ayudan a los fines didácticos. Para realizar este análisis se tienen que tener en cuenta el tipo de variable que se esta evaluando. 1.2. PARTES DE UN CUADRO DE DISTRIBUCION DE FRECUENCIAS: Las partes de un CDF son las siguientes: a. Número del cuadro de frecuencias en forma correlativa. b. Título: Especificar la variable y la población en estudio c. Encabezado o conceptos. d. Cuerpo o contenido del cuadro de frecuencias e. Nota de pie (no siempre es necesaria) f. Fuente g. Elaboración 1.3. ELEMENTOS PARA CONSTRUIR UN CDF: Para construir un cuadro de frecuencias se utilizan los siguientes elementos: A. Valores de la variable Xi: Los valores de la variable o datos se representan por Xi. Ejm: Si se tienen 50 datos sus valores correspondientes no agrupados se representan como X1, X2, X3, ..., X 50 . B. Intervalos de clase: Los intervalos son subconjuntos de la recta real Ron que están definidos por un límite menor o inferior Li y un límite mayor o superior Ls. C. Frecuencia: 1. Frecuencia absoluta simple: Se denotan por fi. Está constituida por el número de veces que se repite un valor. En el caso de intervalos es el número de observaciones comprendidas en dicho intervalo. Estas frecuencias siempre son enteros positivos y además la suma de todos ellos es el tamaño de la muestra “n”.
2. Frecuencia relativa: Se denotan por hi. Indica la relación o proporción existente entre la frecuencia absoluta simple y el número total de datos. Estas frecuencias son numeros fraccionarios positivos entre o y 1. Para fines interpretativos estas frecuencias se expresan en % (hi%) . Así:
hi
MÉTODOS ESTADÍSTICOS
fi n
ó
- 26 -
hi(%)
f i n
x100
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
3. Frecuencia absoluta acumulada: Se denotan por Fi. Resulta de la suma de las frecuencias cuyas marcas de clase son iguales o menores a la marca de clase del intervalo dado o considerado, es decir: F1 = f 1 F2 = f 1 + f 2 F3 = f 1 + f 2 + f 3 ............................................. ……………………………………………………
D.
Fj = f 1 + f 2 + f 3 + ....... + fi 4. Frecuencia relativa acumulada: SE denotan Hi. Resulta de la suma de las frecuencias relativas simples hasta la frecuencia del intervalo considerado. Así: H4 = h1 + h2 + h3 + h4 H6 = h1 + h2 + ....+ h6 Para fines interpretativos estas frecuencias se expresan en % (Hi%) Marca de clase: Se denota por “Yi”. Es el promedio de los valores correspondientes a los
límites inferior y superior de cada uno de los intervalos determinados.
1.4. PROPIEDADES DE UN CDF: A. Las fi y Fi son siempre números enteros positivos. Es decir: fi , Fi ≥ 0 B. Las hi y Hi son siempre números fraccionarios positivos comprendidos entre 0 y 1, es decir 0≤ hi , Hi ≤ 1 C. F1 siempre es igual f1 y H1 siempre es igual a h1. D. La suma de todas las fi es igual a n y la suma de las hi es igual a 1. E. Fm siempre es igual a n y Hm siempre es igual a 1. 1.5. CONSTRUCCIÓN DE CUADROS DE FRECUENCIAS: Para la construcción de los CDF hay que tener en cuenta el tipo de variable que se esta analizando, es decir, si es cuantitativa continua, cuantitativa discreta o variable cualitativa. A. CDF PARA UNA VARIABLE CUANTITATIVA CONTINUA: Para la construcción de este cuadro hay que realizar los siguientes pasos: PASO 1. Determinar el Rango del conjunto de datos. R = Valor máximo - Valor mínimo
PASO 2. Determinar el número de intervalos “m”. m = 1 + 3.322 log ( n ) Este valor siempre es un número entero (Redondeo)
PASO 3. Determinar la amplitud “A” interválica (de cada intervalo). A=R/m Este valor esta en función de la estructura de la base de datos (tomar el inmediato superior)
PASO 4. Determinar el nuevo rango “R 2” (Solamente si se tomo un inmediato superior) R 2 = A * m
A: es la amplitud teniendo en cuenta el inmediato superior. PASO 5. Determinar los intervalos y finalmente construir el cuadro.
MÉTODOS ESTADÍSTICOS
- 27 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
B. CDF PARA UNA VARIABLE CUANTITATIVA DISCRETA: Para la construcción de un CDF para una variable cuantitativa discreta (valores discretos) ya no se utiliza los pasos anteriores solamente colocar en los intervalos a los diferentes valores discretos. C. CDF PARA UNA VARIABLE CUALITATIVA: Para la construcción de un CDF para una variable cualitativa se sigue los mismos pasos que para una variable cuantitativa discreta, es decir, solamente colocar en los en los intervalos a las diferentes categorías de la variable cualitativa.
Aplicaciones: CASO Nº 01: A continuación se dan los datos relativos a las tasas de crecimiento de un grupo de Instituciones Educativas Particulares durante el año 2006. 1.39 1.35 2.27 1.15 2.29 1.75 1.32 1.52 1.72 1.08 2.14 1.65 1.15 2.52 1.75 2.26 2.23 1.93 2.55 1.89 1.68 1.48 1.70 265 2.67 1.23 2.02 1.65 1.71 1.37 1.84 1.92 1.35 1.46 3.09 1.16 1.40 1.09 1.61 1.44 1.18 1.04 2.59 1.95 1.92 2.13 1.67 1.59 1.92 1.31 Construya un cuadro de distribución de frecuencias. CASO Nº 02: Se ha registrado el peso en kilogramos de 50 alumnos que estudian Ingeniería Industrial en la Universidad Cesar Vallejo-Trujillo. 45 49 47 48 50
44 72 53 52 52
43 60 52 68 63
50 56 50 60 50
54 44 53 62 76
60 52 45 45 58
49 50 55 55 53
45 63 48 50 52
50 50 50 49 60
45 49 50 52 59
Construya un cuadro de distribución de frecuencias
PRACTICA CALIFICADA Resolver los ejercicios presentados en la parte final del material de trabajo.
MÉTODOS ESTADÍSTICOS
- 28 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
III. GR ÁFICOS ESTADÍSTICOS: 1. DEFINICION: Un gráfico estadístico es una representación pictórica, cuyo objetivo es expresar el comportamiento de una variable en estudio. Los gráficos estadísticos son representaciones de información real que existe en nuestro mundo, es una expresión artística de datos reales y observados. Un gráfico sirve también para comparar visualmente el comportamiento de dos o más variables similares o relacionadas. 2. PARTES DE UN GRAFICO ESTADISTICO: Numeración. Titulo: Aquí se señala la población en estudio y la variable de interés. Diagrama: esta dado por el propio dibujo el cual representa el comportamiento de los datos. Escalas y/o leyendas: Son indicadores donde se precisa la correspondencia entre los elementos del gráfico y la naturaleza de las medidas representadas. Fuente: Aquí se señala el CDF que permitió obtener el respectivo gráfico. 3. CRITERIOS PARA CONSTRUIR GRAFICOS: No existe una regla específica para la construcción de gráficos, pero si es posible considerar algunas recomendaciones o criterios. Se emplea una diversidad de gráficos, cuya estructura o forma dependerá del tipo de variable que se está estudiando. Este gráfico debe tener rasgos simples y de fácil comprensión. 4. TIPOS DE GRAFICOS ESTADISTICOS Hay varias tipos de gráficos, los cuales dependen del tipo de variable que esta evaluando. Presentaremos aquí los mas importantes: a. Gráfico de bastones: Se utiliza cuando se tienen datos de una variable cuantitativa discreta. b. Histograma: Se utiliza cuando se tienen datos de una variable cuantitativa continua. c. Gráfico de Barras: Se utiliza cuando se tienen datos de una variable cualitativa. d. Gráfico Sectorial o Pastel: Se utiliza cuando se tienen información de una variable cualitativa o cuantitativa discreta. e. Polígono de frecuencias: Se utiliza para indicar el comportamiento de un conjunto de datos. f. Gráfico de series de tiempo: Se utiliza para analizar variables cuantitativas continuas pero expresadas en el tiempo. g. Pirámide poblacional: Se utiliza para analizar el comportamiento de una población según sexo y edad.
PRACTICA CALIFICADA Resolver los ejercicios presentados en la parte final del material de trabajo.
MÉTODOS ESTADÍSTICOS
- 29 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
IV. ANALISIS ESTADISTICO DESCR IPTIVO: La estadística descriptiva es una técnica que consiste en obtener indicadores que describen el comportamiento de un conjunto de datos. Dentro de estas medidas estadísticas tenemos: A. Las medidas de Posición: Dentro de estas tenemos: a. Medidas de tendencia central: Media, Moda, Mediana. b. Medidas de localización: cuartiles, deciles y percentiles. B. Las medidas de variación: rango, varianza, desviación estándar, coeficiente de variación. C. Las medidas de deformación: asimetría y kurtosis. 1. MEDIDAS DE TENDENCIA CENTRAL 1.1. MEDIA ARITMÉTICA: Se denota por x Es la medida estadística más fácil de calcular. La media o promedio es el punto central de un conjunto de datos. Para calcular la media aritmética se utilizan las formulas adecuadas ya sea sin son datos agrupados o datos no agrupados. 1.2. MEDIANA: Se denota por Me. Es un valor que divide al conjunto de datos en dos partes iguales, es decir, cada segmento tiene el 50% de los datos. Para calcular la media aritmética se utilizan las formulas adecuadas ya sea sin son datos agrupados o datos no agrupados. 1.3. MODA: Se denota por Mo. La moda es el valor que más se repite en un conjunto de datos. En un conjunto de datos se presentan los siguientes casos: a. No existir datos Amodal b. 1 moda Unimodal. c. 2 modas Bimodal d. 3 a mas modas Multimodal Para calcular la media aritmética se utilizan las formulas adecuadas ya sea sin son datos agrupados o datos no agrupados. 2. MEDIDAS DE LOCALIZACIÓN: 2.1. CUARTILES: Se denotan por Qk, donde k=1,2,3 Son valores que dividen a un conjunto de datos en 4 partes iguales, es decir, cada sector tiene el 25% de los datos. Para calcular la media aritmética se utilizan las formulas adecuadas ya sea sin son datos agrupados o datos no agrupados. 2.2. DECILES: Se denotan por Dk, donde k=1,2,3,4,5,6,7,8,9 Son valores que dividen a un conjunto de datos en 10 partes iguales, es decir, cada sector tiene el 10% de los datos.
MÉTODOS ESTADÍSTICOS
- 30 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
2.3. PERCENTILES: Se denotan por Pk, donde k=1,2,3,4,5,6,7,8,9,10, … , 99 Son valores que dividen a un conjunto de datos en 100 partes iguales, es decir, cada sector tiene el 1% de los datos. Para calcular la media aritmética se utilizan las formulas adecuadas ya sea sin son datos agrupados o datos no agrupados. 3. MEDIDAS DE VARIABILIDAD: 3.1. RANGO: Se denota por R y la medida de variabilidad más fácil de calcular. Es la diferencia que existe entre el valor máximo y el valor mínimo del conjunto de datos. 3.2. VARIANZA: Mide la variabilidad de un conjunto de datos respecto a un valor central(promedio) Mide la variabilidad pero en unidades elevadas al cuadrado, por lo tanto es ilógica su interpretación. Para calcular la media aritmética se utilizan las formulas adecuadas ya sea sin son datos agrupados o datos no agrupados. 3.3. DESVIACIÓN ESTANDAR: Mide la variabilidad de un conjunto de datos respecto a su valor central pero en unidades originales. Esta es la medida de variabilidad que tiene una interpretación lógica. Se obtiene al sacra la raíz cuadrada de la varianza. 3.4. COEFICIETE DE VARIACIÓN: Se denota por C.V. El C.V. sirve para determinar si un conjunto de datos tiene un comportamiento homogéneo o heterogéneo. Para llegar a determinar la homogeneidad se compara con un valor convencional del 33%.
Si el CV ≤ 33% el conjunto de datos tiene un comportamiento homogéneo.
Si el CV > 33% el conjunto de datos tiene un comportamiento heterogéneo.
4. MEDIDAS DE FORMA: 4.1. ASIMETRIA: La asimetría se entiende como la deformación horizontal de un conjunto de datos. Para conocer esta asimetría se calcula el coeficiente de asimetría As. En un conjunto de datos pueden presentar los siguientes casos: a. As= 0, el conjunto de datos es simétrica. b. As<0, el conjunto de datos es asimétrica negativa. c. As>0, el conjunto de datos es asimétrica positiva. As
X Mo S
As
3( X Me) S
As
Q3 2Q2 Q1 Q3 Q1
4.2. KURTOSIS: MÉTODOS ESTADÍSTICOS
- 31 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
Se entiende por Kurtosis a la deformación vertical de un conjunto de datos, es decir, mide el apuntamiento o achatamiento de un conjunto de datos. Para conocer que tipo de asimetría tiene un conjunto de datos, se utilizan las siguientes formulas:
A. Kurtosis en función de los momentos: Si K1>3, el conjunto de datos es leptocúrtica. Si K1=3, el conjunto de datos es mesocútica. Si K1<3, el conjunto de datos es platicúrtica.
K 1
M 4 ( M 2 )
2
M4: Momento de orden cuatro respecto a la media M2: Momento de orden dos respecto a la media B. Kurtosis en función de los momentos de orden 4: Si K2>0, el conjunto de datos es leptocúrtica. Si K2=0, el conjunto de datos es mesocútica. Si K2<0, el conjunto de datos es platicúrtica.
K 2
M 4
( s)
2
3
C. Kurtosis en función de loscuantiles: Si K3>0.263, el conjunto de datos es leptocúrtica. Si K3=0.263, el conjunto de datos es mesocútica. Si K3<0.263, el conjunto de datos es platicúrtica.
As
Q1 2( P 90 P 10 ) Q3
PRACTICA CALIFICADA Resolver los ejercicios presentados en la parte final del material de trabajo.
MÉTODOS ESTADÍSTICOS
- 32 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
5. FORMULAS PARA CALCULAR LAS MEDIDAS DE TENDENCIA CENTRAL: MEDIDAS
PARA DATOS NO AGRUPADOS
PARA DATOS AGRUPADOS m
n
xi PROMEDIO
X
i
X
i 1
n
Xi: datos n = número de datos Procedimiento: Observar la base de datos y determinar el valor que más se repite.
MODA
Y f i
i i
n
Yi: Marca de clase o punto medio fi: frecuencia absoluta simple n: número de datos.
1 1 2
Mo Li A
Li: limite inferior del intervalo modal. A: amplitud interválica
1 f j f j 1 2 f j f j 1
MEDIANA
QUARTILES
S E L I T N A U C
DECILES
PERCENTILES
MÉTODOS ESTADÍSTICOS
Procedimiento: Ordenar la serie en forma ascendente Cuando “n” impar: Me = valor central Cuando “n” par: Me = promedio de los valores centrales
n / 2 F j 1 f j
Me Li A
Li: limite inferior del intervalo mediano. A: amplitud interválica. n / 2 es el elemento determinante Fj-1: Frecuencia acumulada anterior al intervalo mediano fj:Frecuencia abs. simple del intervalo mediano Q K
kn / 4 F j 1 Li A f j
D K
kn / 10 F j 1 Li A f j
Seguir pasos similares a la mediana. Similar a la Me. Lo único que cambia es el elemento determinante. Seguir pasos similares a la mediana.
Seguir pasos similares a la mediana.
- 33 -
Similar a la Me. Lo único que cambia es el elemento determinante. P K
kn / 100 F j 1 Li A f j
Similar a la Me. Lo único que cambia es el elemento determinante.
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
6. FORMULAS PARA CALCULAR LAS MEDIDAS DE DISPERSION O VARIACIÓN PARA DATOS NO AGRUPADOS
MEDIDAS
RANGO
R
V max
PARA DATOS AGRUPADOS
R LS LI
V min
Ls: Limite superior Li: Limite inferior m
(Y i u )
N
( X u)
2
2
i
POBLACIONAL
2
i 1
N
Xi : Datos de la población u : promedio poblacional N: Número de elementos de la población
2
* f i
i 1
N
Yi : Marca de clase u : promedio poblacional N: Número de elementos de la población fi: frecuencia absoluta simple
n
A Z N A I R A V
( x s
2
i
x )
i 1
n
m
2
1
( yi s 2
2
y ) * f i
i 1
n 1
MUESTRAL Xi : Datos de la muestra x : promedio muestral n : Número de elementos de la muestra
Formulas abreviadas
DESVIACION ESTANDAR
COEFIENTE DE VARIACIÓN
n ( xi ) 2 n 1 s 2 xi2 i1 n 1 i1 n
2
D.E. Poblacional C .V .
u
*100
C.V. Poblacional
MÉTODOS ESTADÍSTICOS
- 34 -
yi : Marca de clase y : promedio muestral n : Número de elementos de la muestra fi: frecuencia absoluta simple m ( yi f i ) 2 m 1 s 2 yi2 f i i1 n 1 i1 n
s
s 2
D.E. Muestral C .V .
s x
*100
C.V. Muestral
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
V. ANALISIS DE COR R RE LACIÓN:
El análisis de correlación es una técnica estadística que mide el grado de asociación o afinidad entre las variables cuantitativas consideradas en un estudio.
Se llamará CORRELACION SIMPLE cuando se trata de analizar la relación entre dos variables. Se llamará CORRELACION LINEAL O RECTILINEA si la función es una recta, y de CORRELACION NO LINEAL cuando la función es una curva o una función de grado superior.
El COEFICIENTE DE CORRELACION DE PEARSON, es el estadígrafo que mide el grado de asociación o afinidad entre las variables cuantitativas y se denota por “r” la cual se define como: n
n r
n
X Y X Y i
i 1
n
n
X i 1
2 i
Interpretación: -1
n
i
n
( X i ) i 1
-0.7
i
i 1
2
n
n
i
i 1
Y i 1
i
2
( Y 1 ) 2
-0.4
Perfecta Alta Regular NEGATIVA
n
i 1
0 Baja
0.4 Baja
0.7
-1
Regular Alta Perfecta POSITIVA
VI. ANALISIS DE R EGR ESION 1. ANALISIS DE REGRESION LINEAL SIMPLE:
El análisis de regresión es una técnica estadística que consisten en determinar la relación funcional entre dos variables cuantitativas en estudio.
Esta relación funcional entre las variables, es una ecuación matemática de la forma Y= A + B X, que recibe el nombre también de Función de Regresión o Modelo de Regresión.
A la variable Y se le denomina variable dependiente, a la variable X independiente y a A,B se les llama parámetros de la ecuación de regresión.
La finalidad del Análisis de Regresión es hacer pronósticos es decir, hacer estimaciones futuros de la variable dependiente.
PASOS A SEGUIR : a. Realizar el diagrama de dispersión y ver el comportamiento de la variable. b. Aplicar el método de los Mínimos Cuadrados Ordinarios para estimar los parámetros de la ecuación. Las formulas son las siguientes:
MÉTODOS ESTADÍSTICOS
- 35 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
n
n B
n
n
X Y X Y i
i 1
n
n
i
X i 1
2
i
i 1
n
i
i
i 1
( X i )
A Y B X
2
i 1
c. Para hacer el pronóstico o el valor estimado de Y, reemplazar en la ecuación matemática el respectivo valor de Xo, de la siguiente manera: Y = A + B (Xo) 2. REGRESION LINEAL MULTIPLE:
El ARLM es una técnica estadística que consiste en determinar el modelo de regresión linel múltiple de una variable respuesta (Y) y un conjunto de variables independientes (Xs). El modelo de regresión lineal múltiple esta dado por la siguiente ecuación:
Y 0 1 X 1 2 X 2
... K X K
Para encontrar este modelo, es decir, estimar sus coeficientes también se utiliza el Método de los Mínimos Cuadrados Ordinarios. Los elementos de este modelo de regresión múltiple son los siguientes: Y es la variable dependiente o variable respuesta. A las Xs se le llama variables independientes. Bs se les llama coeficientes de regresión. En el ARLM se pruebab las siguientes Hipótesis: Ho: Los Bs son iguales a cero (No hay efecto de las variables independientes en Y) ; H1: Los Bs son diferentes de cero (Por lo menos un X influye en Y). Para dar respuesta a esta Hipótesis se utiliza el análisis de varianza.
PRACTICA CALIFICADA Resolver los ejercicios presentados en la parte final del material de trabajo.
MÉTODOS ESTADÍSTICOS
- 36 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
VII. CALCULO DE PROBABILIDADES: 1. DEFINICIONES PRELIMINARES: 1.1. EXPERIMENTO ALEATORIO (E) : Un experimento aleatorio se caracteriza porque tienen las siguientes 3 propiedades: a. Es un experimento NO deterministico. b. Sus resultados posibles que pueden describirse con anterioridad. c. Se pueden repetir infinitas veces sin cambiar sus condiciones. Ejemplos: E1= Lanzamiento de un dado y ver su puntaje obtenido. E2= De una urna que contiene esferas blancas y negras seleccionar una y anotar su color Ejercicios: Indique Ud. si los siguientes experimentos son aleatorios: a. Elegir una carta de una baraja (52 cartas) y señalar la figura obtenida. V F b. Verificar el estado de dos transistores (apagado y prendido) V F c. Lanzar una piedra a una tina con agua. V F d. Lanzar 4 monedas y ver el número de caras. V F e. Extraer 3 bolas con reemplazo de una urna que contiene 12 bolas diferentes (la bola se devuelve antes de extraer la siguiente bola). V F f. Jugar un partido de fulbito V F g. Soltar un plumón en el aire. V F h. Rendir un examen. V F i. Jugar la tinka V F j. Realizar una operación quirúrgica. V F k. Aplicar una fuera a un cuerpo en reposo. V F 1.2. ESPACIO MUESTRAL (S): Es el conjunto de todos los resultados posibles de un experimento aleatorio. Así por ejemplo, los espacios muestrales asociados a los respectivos experimentos mencionados anteriormente, son: Experimento E1 E2
Espacio Muestral S1= {1,2,3,4,5,6} S2= {b,n}; b=blanca, n=negra
Ejercicios: Indique el espacio muestral para los siguientes experimentos: (Utilice el diagrama del árbol) S= {………………………………………………..} a. Lanzar 2 monedas: b. Lanzar 3 monedas
S= {………………………………………………..}
c. Lanzar 1 dado y una moneda
S= {………………………………………………..}
d. Anotar el sexo de un recién nacido S= {………………………………………………..} e. Lanzar 2 dados
MÉTODOS ESTADÍSTICOS
S= {………………………………………………..}
- 37 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
f. Jugar un partido de fútbol
S= {………………………………………………..}
g. Rendir un examen
S= {………………………………………………..}
h. Prender una computadora
S= {………………………………………………..}
i. Seleccionar dos bolas de una urna que contiene 2 bolas rojas, 2 bolas azules S= {………………………………………………………………….} y 2 bolas verdes. j. Seleccionar dos bolas de una urna que contiene 1 bola roja, 1 azul y 3 verdes. S= {………………………………………………………………………….……..}
k. Seleccionar tres bolas de una urna que contiene 2 bolas rojas, 2 azules y 2 verdes. S= {………………………………………………………………………………….}
1.3. EVENTO O SUCESO: Se llama Evento a cualquier subconjunto o parte del Espacio Muestral. Así por ejemplo, considerando los experimentos de los ejemplos anteriores: En el E1: A: “el puntaje obtenido es un número impar”.
Entonces, A= {1,3,5} En E2:
B: “se extrae una esfera blanca”.
Luego, B= {b}
Ejercicios: a. Una familia tiene 3 hijos, examinar su sexo, teniendo en cuenta la edad, del mayor al menor. 1. Determinar su espacio muestral: 2. Determinar el evento A: Los 3 sean masculinos 3. Determinar el evento B: Por lo menos uno sea femenino. b. Si un investigador de mercados entrevista a una ama de casa y a su esposo para determinar la “aceptación” o “no aceptación” de un cierto
c.
producto. Asigne el valor 1 si acepta el producto. Asigne el valor 2 si rechaza el producto. 1. Construya el espacio muestral para este experimento. 2. Determine el evento A: ambos acepten el producto. 3. Determine el evento B: Por lo menos uno de ellos acepte el producto. Un comerciante tiene en su bolsillo cheques de 10,20, 30 y 50 dólares. Si saca dos cheques de su bolsillo, uno tras otro. Calcular lo siguiente: Considere lo siguiente: D = Cheque de diez dólares V = Cheque de veinte dólares T = Cheque de treinta dólares C = Cheque de cincuenta dólares 1. 2. 3.
El espacio muestral asociado a este experimento El evento A: Que el primer cheque sea de 10 y el siguiente de 20. El evento B: Que el primer cheque halla sido de 20 dólares
MÉTODOS ESTADÍSTICOS
- 38 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
d.
e.
f.
g.
h.
Tres personas A, B, C solicitan empleo a una empresa. Si el experimento consiste en ordenar las solicitudes de acuerdo a sus habilidades para el trabajo. Construya: 1. El espacio muestral 2. El evento P: Que B ocupe el primer lugar. 3. El evento Q: Que A y B ocupen los primeros lugares. En una urna se tiene 2 bolas rojas, 2 bolas azules y 2 verdes. Seleccionar en forma aleatoria sin reemplazo 3 bolas de la urna. 1. Construir el espacio muestral. 2. Determinar el evento A: La primera sea roja 3. Determinar el evento B: Las 2 primeras sean azules. 4. Determinar el evento C: Obtener a los más 2 bolas verdes. En una urna se tiene 2 bolas rojas, 2 bolas azules y 2 verdes. Seleccionar en forma aleatoria con reemplazo 3 bolas de la urna. 1. Construir el espacio muestral. 2. Determinar el evento A: La primera sea roja 3. Determinar el evento B: Las 2 primeras sean azules. 4. Determinar el evento C: Obtener a los más 2 bolas verdes. Una urna contiene 5 bolas blancas y 6 negras, se extrae al azar sin reposición dos bolas. 1. Cual es el espacio muestral (sin reposición) 2. Cual es el espacio muestral (con reposición) 3. Determinar el evento A: Que las bolas sean blancas para ambos casos. Se tiene una baraja con 52 cartas. Se seleccionan al azar 2 cartas y se observa la figura. 1. Cual es el espacio muestral asociado con este experimento 2. Si se observa el número. ¿Cual es el espacio muestral?
1.4. PROBABILIDAD DE LA OCURRENCIA DE UN EVENTO “ P[A]” : “P[A]” → se lee: Probabilidad de que ocurra el suceso A. Una probabilidad mide
el grado de ocurrencia de enento o suceso y esta definido por: P A
n( A)
P[A] =
n( S )
Nº de casos favorables Nº de casos posibles
Ejemplo1: Sea: E1= Lanzamiento de un dado y su puntaje obtenido. Su espacio muestral esta dado por: S1= {1,2,3,4,5,6} Calcule la probabilidad de la ocurrencia de los sucesos A, B, C definidos a continuación: a) A: El puntaje obtenido es un número par: n ( A)
P [A]=
n ( S )
3
=
6
A = {2, 4, 6}
= 0.5 ó 50%
Interpretación: La Probabilidad de la ocurrencia del suceso A es de 50% b) B: Puntaje es menor ó igual que 5. P[B]=
n( B) n ( S )
=
5 6
B = {1,2,3,4,5}
= 0.8333 ó 83.33%
Interpretación: La Probabilidad de la ocurrencia del suceso B es de 83.33%
MÉTODOS ESTADÍSTICOS
- 39 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
c) C: Puntaje es mayor que 9. P [C]=
n(C ) n ( S )
0
=
C=
= 0 ó 0%
6
Interpretación: La Probabilidad de la ocurrencia del suceso C es de 0% Ejemplo2: Sea el E2 : Extracción de una carta de un juego de 52 naipes: a)
Cuál es la probabilidad de que sea espada P [A]=
b)
n ( S )
13
=
= 0.25 = ó 25%
52
Cual es la probabilidad de que sea menor de 9: 8 cartas son menores que 9, por lo tanto el total de cartas es igual a 32 (8x4) P [B] =
c)
n ( A)
n( B )
32
=
n ( S )
52
= 0.6153 ó 61.53%
Cual es probabilidad de que sea 13: Hay 4 cartas 13 es decir que n (C) = 4 (las cartas son: el 13 , el 13 , el 13 y el 13 ) P [C]=
n(C ) n ( S )
=
4 52
= 0.0769 ó 7.69%
1.5. ÁLGEBRA DE EVENTOS UNION DE EVENTOS: Esta definido de la siguiente manera: P [A B]= P[A] + P[B] – P [AB] =
n ( A) n ( S )
+
n( B) n ( S )
n( A B ) n ( S )
INTERSECCIÓN DE SUCESOS: Esta definido de la siguiente manera: P [A B]=
n( A B ) n ( S )
EJERCICIOS: Si se extrae una carta de un juego de 52 naipes.¿Cuál es la probabilidad de que la carta seleccionada : a. Sea roja ó mayor de 9 b. Sea roja y mayor de 9 c. Sea espada ó igual que 5 d. Sea menor de 5 ó mayor de 10 SOLUCIÓN: a. Sea roja ó mayor de 9. Luego se define los siguientes eventos: A= carta roja B= mayor de 9 Entonces, P [A
MÉTODOS ESTADÍSTICOS
B]= P[A] + P[B] - P[A B] =
- 40 -
n ( A) n ( S )
+
n( B ) n ( S )
n( A B ) n ( S )
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
b.
26 52
16 52
8
=
52
Sea roja y mayor de 9: A= roja B= mayor a 9 Luego, P [AB]
c.
=
n( A B ) n ( S )
34
= 0.6538 ó 65.38%
52
=
8 52
= 0.1538 ó 15.38%
Sea espada ó igual que 5: A= espada B= 5 Luego, P [AB] = P [A] + P [B] – P [AB] =
13 52
4 52
1 52
d. Sea menor de 5 ó mayor de 10 A<5 B >10 Luego, P [A B]= P [A] + P [B] – P [AB] = 16/52 + 12/52 – 0/52 = 7/13= 0.5384 ó 53.84%
1.6. ÁRBOL DE PROBABILIDADES El diagrama del árbol es más sugerente para determinar el espacio muestral de un experimento aleatorio compuesto. EJERCICIO: Se tiene 6 esferas de colores en una ánfora, de las cuales 3 son rojas, 2 son blancas y 1 es negra. Se extraen aleatoriamente ó a la suerte de 1 en 1 sin reposición a. Construya un árbol de probabilidades hasta la tercera extracción b. Cuál es la probabilidad de obtener 2 rojas hasta la tercera extracción c. Cuál es la probabilidad de obtener una esfera blanca y una esfera negra hasta la segunda extracción. SOLUCIÓN: a. Figura b. Probabilidad de obtener dos rojas hasta la tercera extracción: P [A]= 3/6 * 2/5 * 2/4+3/6 * 2/5 * 1/4+3/6 * 2/5 * 2/4+3/6 * 1/5 * 2/4+2/6 * 3/5 * 2/4+1/6 * 3/5 * 2/4 P [A]= 9/20 = 0.45 ó 45% c. Probabilidad de obtener una esfera blanca y una esfera negra hasta la segunda extracción: P [x] = 2/6 * 1/5 + 1/6 * 2/5 = 2/15 = 0.1333 ó 13.33%
MÉTODOS ESTADÍSTICOS
- 41 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
R
1/4
R
2/4
2/5
N 2/4
1/4
R
B
2/5
1/5
2/4 N
3/6
B R 1/4
1/4 R
B N R
2/4
B
R
2/4 1/4
3/5
N
1/4 B
2/6
R 1/6
R
N
1/4 3/4 R 1/4
2/4
R
B 3/4
1/5
1/5
B
N
B
3/5 2/4 N
3/4
B R
2/5 B
1/4
B
1.6. PROBABILIDAD CONDICIONAL: Es aquella en la que el total de casos posibles ya no es igual a n(S), sino que se refiere a un número menor o subconjunto de S. SE LEE:
P( A / B)
“probabilidad de que ocurra el suceso A, sabiendo que ha
ocurrido el suceso B”
Fórmula: P( A / B )
n( A B ) n( B )
En donde B es la condición
EJERCICIO: Se extrae una carta al azar. ¿Cuál es la probabilidad de que la carta seleccionada sea menor de 7, si se conoce que es roja? A = menor que 7 B = color rojo P [A/B] = 12/26 = 6/13 = 46.15 % Hay 46.15% de probabilidades de que la carta seleccionada sea menor que 7, sabiendo q ue es roja.
MÉTODOS ESTADÍSTICOS
- 42 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
VIII. DISTR IBUCIONES DE PR OBABILIDADES: LA DISTRIBUCIÓN NORMAL:
La distribución normal, llamada también Curva de Gauss (en recuerdo al científico que lo descubrió), es la distribución de probabilidad más importancia en la Estadística y por ende del Calculo de Probabilidades. Esta distribución de probabilidad es importante porque las variables aleatorias continuas (peso, edad, talla, producción, gasto en publicidad, temperatura, ventas, PBI, ganancias, etc) que son variables que más se evalúan en una investigación científica o investigación de mercados se aproximan a esta distribución de probabilidad. También es importante porque se utiliza como aproximación de las distribuciones discretas tales como: la Binomial, la Poisson, etc.
CARACTERÍSTICAS 1. Tiene como parámetros a y 2. Su función de probabilidad está dada por:
f ( x)
-
1 2
1 X
Además: < < +
2
2
,
X -
y
+
>0
3. El promedio puede tomar valores entre – y + mientras que > 0, entonces existen infinitas curvas normales. 4. Esta función de probabilidad es asintótica con respecto al eje X, (a pesar de tener recorrido infinito, la curva nunca toca el eje X); además es unimodal y es simétrica con respecto a la media . 5. El areá bajo esta función o curva es 1 ó 100%, de la misma manera se sabe que las áreas comprendidas bajo la curva normal son : 1.
2.
3.
-
3
2 1
1
2
3
= 68.3%
2 = 95.5% 3 = 99%
+
7. Para calcular probabilidades en la distribución normal se necesitaran infinitas tablas de probabilidad.
MÉTODOS ESTADÍSTICOS
- 43 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
LA DISTRIBUCIÓN NORMAL ESTÁNDAR: 1. Es una distribución a la cual se le ha modificado la escala original; esta modificación se ha logrado restando la media al valor de la variable original y dividiendo este resultado por , la nueva variable se denota por Z y recibe el nombre de variable estandarizada
Z
X
2. La modificación de la escala ha permitido elaborar una tabla para el cálculo de las probabilidades; si esto no hubiera sido posible, sería necesario construir una tabla para cada valor de y . 3. La función de densidad de la variable estandarizada es: 1
f ( z)
1
e2
z
2
2 4. El promedio (valor esperado) y la varianza de Z son: E(Z) = 0 , V(Z) = 1 5. Notación: Si X es v.a. continua distribuida normalmente con media y varianza 2 , la denotamos por : X N( , 2). Aplicando esta notación a la variable normal estandarizada Z, escribimos: Z N(0 , 1) , esto se interpreta como, Z tiene distribución normal con media 0 y varianza 1. 6. La superficie bajo la curva normal Z estandarizada también es igual a 1. Por consiguiente, las probabilidades pueden representarse como áreas bajo la curva normal escandalizada entre dos valores. 7. Debido a que la distribución normal es simétrica muchas de las tablas disponibles contienen solo probabilidades para valores positivos de Z. USO DE TABLA: Si se conoce el comportamiento de una variable, es decir, se sabe que tienen una distribución normal, para calcular las diferentes probabilidades se tiene que estandarizar la variable. Una vez estandarizada la variable, recién utilizar la tabla de la distribución normal estandarizada o tabla Z. FORMULAS: x a a a. P ( x a) P ( ) P ( Z ) x a a b. P ( x a) 1 P ( x a) 1 P ( ) 1 P ( Z ) a b a a c. P (a x b) P ( x ) P ( Z )
PRACTICA CALIFICADA
Resolver los ejercicios presentados en la parte final del material de trabajo.
MÉTODOS ESTADÍSTICOS
- 44 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
IX. ESTIMACIÓN ESTADÍSTICA ESTIMACIÓN: Es el proceso mediante el cual se intenta determinar el valor del parámetro de la población a partir de la información de una muestra. Al realizar una estimación siempre se va a cometer un error. Existen dos tipos de estimación: A. ESTIMACIÓN PUNTUAL B. ESTIMACIÓN INTERVÁLICA
A. ESTIMACION PUNTUAL: Es aquel único valor que se obtiene de la muestra, es decir, que para su cálculo se debe tener información muestral. Las formulas para calcular o realizar estas estimaciones son las siguientes:
PROMEDIO
VARIANZA
2
PARAM ETRO
x
PUNTUAL
ˆ
x
P
n
n
ESTIMACION
PROPORCI ON
i
i 1
2
ˆ
n
s 2
( x x ) i
i 1
2
P p ˆ
n 1
a n
B. ESTIMACIÓN INTERVÁLICA: Al realizar una estimación, siempre se va a cometer un error. Entonces, cuando estimamos un parámetro nunca va a ser exacto, ese valor será mayor o menor al verdadero. Entonces se obtendrá un intervalo de valores posibles. Ese intervalo se llama estimación interválica.A esa diferencia mayor o menor se llama error de estimación, el cual esta en relación directa con la variabilidad del estimador y el nivel de confianza determinado por el investigador. La estimación intervalica para un parámetro en general, esta dada por:
Z / 2
Z / 2
ˆ
ˆ
Error de Estimación
Error de estimación
También se puede escribir de la siguiente manera:
: Z / 2 ˆ
Para determinar este intervalo se necesita de: a. La estimación puntual b. La desviación estándar del estimador. c. Nivel de confianza, el cual será repartido para cada lado del intervalo.
MÉTODOS ESTADÍSTICOS
- 45 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
FORMULAS DE LOS INTERVALOS DE CONFIANZA I. INTERVALO DE CONFIANZA PARA EL PROMEDIO POBLACIONAL
A. Si la muestra (n) es mayor de 30 y la varianza poblacional es conocida:
: x
Z / 2
n
B. Si la muestra (n) es menor o igual a 30 y la varianza poblacional es desconocida:
: x
t ( / 2,n 1)
s n
II. INTERVALO DE CONFIANZA P ARA LA PROPORCION POBLACIONAL
A. Si la proporción poblacional se conoce:
PQ
P : p Z / 2
n
B. Si la proporción poblacional No se conoce: (entonces hay que calcularla en la muestra)
pq
P : p Z / 2
n
III. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS
A. Si las muestras son de tamaño n 1>30 y n2>30 (grandes) y además las varianzas poblacionales se CONOCEN:
1
2
: ( x1
x ) Z 2
12 /2
n1
22 n2
B. Si las muestras son de tamaño n 1<30 y n2<30 (pequeñas) y además las varianzas poblacionales DESCONOCIDAS: 1 2 : ( x1 x2 ) t ( / 2, n1 n2 2) sc2 (
1 n1
1 n2
)
Donde : 2
sc
(n 1
1)s (n 1)s n n 2 2
1
1
2
2 2
, se llama varianza mancomunada
2
IV. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES:
A. Si p1 y p2 se determinan a partir de muestras:
P 1 P 2 : ( p1
MÉTODOS ESTADÍSTICOS
p ) Z 2
p1 q1 /2
n1
p 2 q 2
- 46 -
n2
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
X. MUESTREO 1. DEFINICIONES PRELIMINARES: MUESTREO Es una TÉCNICA ESTADÍSTICA por la cual se realizan inferencias a la población examinando solo una parte de ella, ésta parte recibe el nombre de MUESTRA, la cual debe ser estadísticamente representativa y adecuada. Ventajas: Costo reducido Mayor rapidez y exactitud Minimiza los costos.
Desventajas: • Presencia del error de muestreo • Presencia de gran variabilidad de las obs.
TÉCNICAS DE MUESTREO Existen 2 tipos de técnicas de muestreo: A. TECNICAS PROBABILISTICAS: Muestreo aleatorio simple Muestreo aleatorio estratificado Muestreo sistemático Muetsreo por conglomerados Etc.
B. TECNICAS NO PROBABILISTICAS • • • •
El muestreo a criterio o juicio. El muestreo por cuotas. El muestreo por conveniencia. etc
UNIDAD DE ANÁLISIS: Para seleccionar una muestra, primero se define la unidad de análisis que puede ser un cliente, un votante, una organización, un libro contable, un periódico, un hospital, un paciente, etc. Esta definición nos permite identificar “Quien va ha ser medido” , “Quien nos va ha dar la información” y por lo tanto precisar claramente el
problema a investigar y los objetivos de la investigación.
POBLACION OBJETIVO: Una vez que se ha definido la unidad de análisis se procede a delimitar la población que va a ser estudiada y sobre la cual se pretende generalizar o inferir los resultados. Entonces, una población es el conjunto de todos las unidades de estudio que concuerdan con una serie de especificaciones o características. Para seleccionar la muestra debe delimitarse la población identificando sus características o variables de interés a fin de determinar los parámetros poblacionales. En algunos casos, la delimitación de una población no sólo depende de los objetivos del estudio, sino de otras razones prácticas. Las poblaciones tienen que ser especificadas en contenido, lugar y tiempo.
MUESTRA: La muestra es en esencia, un subconjunto de elementos que pertenecen a una población de estudio. Para seleccionar una muestra debemos de tener presente el tipo de muestreo a utilizar: muestreo probabilística y el muestreo no probabilístico. Se tiene que definir la variable de interés o de estudio principal, para que en función de esta se sepa que tipo de muestreo utilizar y por ende que formula utilizar. Luego calcular el tamaño de muestra y finalmente seleccionar las unidades MÉTODOS ESTADÍSTICOS
- 47 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
2. DETERMINACIÓN DEL TAMAÑO DE MUESTRA: Para determinar el tamaño, primeramente hay que identificar la variable a estudiar (Cuantitativa o cualitativa). Luego depende de cuatro factores o elementos que son los siguientes: PARA UNA VARIABLE CUANTITATIVA: a. Un nivel de confianza: Que es adoptado por el investigador, el cual puede ser 90%, 95% o 99% y que origina el valor de Z. b. El error de estimación (E): Que también es fijado por el investigador c. La desviación estándar ó varianza: que son valores que se obtienen por estudios anteriores, por la muestra piloto o por la distribución de la población. d. El Tamaño de la población (N): Que generalmente no se conoce. PARA UNA VARIABLE CUALITATIVA: a. Un nivel de confianza: Que es adoptado por el investigador, el cual puede ser 90%, 95% o 99% y que origina el valor de Z. b. El error de estimación (E): Que también es fijado por el investigador c. La proporción poblacional (P): que son valores que se obtienen por estudios anteriores, por la muestra piloto y si no se conoce asumir p=0.5. d. El Tamaño de la población (N): Que generalmente no se conoce.
3. FORMULAS PARA DETERMINAR EL TAMAÑO DE MUESTRA: Cualitativa (Proporción Poblacional)
VARIABLE
POBLACION INFINITA (Cuando no se conoce N) POBLACION FINITA (Cuando se conoce N)
n0
Cuantitativa (Promedio Poblacional)
Z 2 P (1 P )
n0
2
E 2
n
Z P (1 P ) N 2
2
E ( N 1) Z P (1 P )
n
Z 2 S 2 E 2
Z 2 S 2 N E 2 ( N 1) Z 2 S 2
Z= es el valor de la distribución normal estandarizada para un nivel de confianza fijado por el investigador. S= Desviación estándar de la variable fundamental del estudio o de interés para el investigador. Obtenida por estudios anteriores, muestra piloto, criterio de experto o distribución de la variable de interés. P= es la proporción de la población que cumple con la característica de interés. E= % del estimador o en valor absoluto (unidades). Fijada por el investigador. N= Tamaño de la población.
4. PASOS A SEGUIR PARA DETERMINAR LA MUESTRA ÓPTIMA: A. Identificar eL tipo de variable a analizar. B. Asumir que la población es infinita y aplicar la formula respectiva señaladas anteriormente. Esta muestra se llama muestra previa. C. Luego si se conoce el tamaño de la población N, obtener la fracción de muestreo n0 N
MÉTODOS ESTADÍSTICOS
- 48 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
Si
Si
n0 N n0 N
5% , entonces la muestra definitiva es n0 (muestra previa) 5% , entonces se ajusta la muestra.
D. Para ajustar la muestra se tiene que aplicar la siguiente formula:
n
n0 n0
1
, n es la muestra final.
N
5. ESTIMACION DE LOS VALORES A APLICAR EN LAS FORMULAS A. Valor de Z: es el valor de la abcisa de la distribución normal estandarizada teniendo en cuenta el nivel de confianza fijado por el investigador, por lo tanto este valor se encuentra en las tablas estadística respectiva. Para hacer el trabajo menos tedioso, presentamos a continuación los diferentes valores de Z TABLA N° 01 VALORES DE LA DISTRIBUCIÓN NORMAL ESTANDARIZADA(Z) Nivel de Valor Z Nivel de confianza significancia (1-) Bilateral Unilateral () 90% = 0.90 10% = 0.10 1.64 1.28 95% = 0.95 5% = 0.05 1.96 1.64 98% = 0.98 2% = 0.02 2.32 2.05 99% = 0.99 1% = 0.01 2.57 2.32
B. Cálculo del Valor de P: Se calcula este valor cuando la variable de estudio es cualitativa. TABLA N° 02 COMPORTAMIENTO DE P y Q P 0.05 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 0.95
Q=1-P 0.95 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0.05
PQ 0.0475 0.090 0.160 0.210 0.240 0.250 0.240 0.210 0.160 0.090 0.0475
C. Cálculo del Valor de la varianza (Si la variable es CUANTITATIVA): este valor es obtenida por estudios anteriores, muestra piloto, criterio de experto o distribución de la variable de interés. D. Cálculo del error de estimación: Generalmente se asume 2%, 5%, y 8% de error. Este valor es fijado por el investigador. Es la diferencia entre el parámetro (población) y el estimador (Muestra). Es decir: E o o .Este error puede ser absoluto o relativo. Si E=±0.35 se denomina error absoluto. Si consideramos un error del 10% de la media, es decir, E=10%( x )=0.10(3.5)=0.35 se denomina error relativo. ˆ
MÉTODOS ESTADÍSTICOS
- 49 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
XI. PRUEBA DE HIPOTESIS:
Para realizar un análisis de pruebas de hipótesis hay que conocer algunas definiciones preliminares que debemos conocer:
1. DEFINICIONES PRELIMINARES: a. b. c.
2.
HIPÓTESIS: Es una respuesta a priori a un problema. HIPÓTESIS ESTADÍSTICA: En un enunciado acerca del valor de un parámetro poblacional. PRUEBA DE HIPOTESIS: Es un procedimiento basado en la información muestral y en la teoría de probabilidad, para determinar si una hipótesis estadística debe ser aceptada o rechazada.
CLASES DE HIPOTESIS: 2.1.
HIPOTESIS NULA. Se denota por Ho. Es una afirmación o enunciado tentativo que se realiza acerca del valor de un parámetro poblacional. Por lo común es una afirmación acerca del parámetro de población cuando toma un valor específico.
2.2. HIPOTESIS ALTERNATIVA. Se denota por H1. Es una afirmación o enunciado contraria a la presentada en la hipótesis nula. 3. ERRORES QUE SE COMETEN EN UNA PRUEBA DE HIPOTESIS: Error Tipo I:
•Se comete este error cuando se rechaza la hipótesis nula, cuando es verdadera. •Se denota por P(Rechazar Ho/Ho es verdadera) α
=
Error Tipo II:
•Se comete este error cuando se acepta la hipótesis, cuando es falsa. •Se denota por β = P(Aceptar Ho/Ho es falsa) Decisión posible Aceptar Ho Rechazar Ho
Ho Verdadera Decisión correcta Error tipo I
Ho Falsa Error Tipo II
Decisión Correcta
MÉTODOS ESTADÍSTICOS
- 50 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
4.
TIPOS DE PRUEBAS DE HIPOTESIS: A. PRUEBA BILATERAL O PRUEBA DE DOS COLAS Ho: = 0 H1: 0
/2
/2
B. PRUEBA UNILATERAL O PRUEBA DE UNA SOLA COLA:
•Prueba de cola inferior o izquierda Ho: = 0 H1: < 0
•Prueba de cola superior o derecha Ho: = 0 H1: > 0
5.
ETAPAS DE UNA PRUEBA DE HIPOTESIS:
Plantear la hipótesis nula y alternativa. Especificar el nivel de significancia (o confianza) que se va a utilizar.(Generalmente la plantea el investigador) Elegir el estadístico de prueba que debe ser especificado en términos de un estimador del parámetro a probar. Establecer el valor o valores críticos para rechazar o aceptar Ho. (Se encuentran en la tabla de probabilidades) Determinar la Región de Aceptación y de Rechazo, en función a los valores críticos. Tomar la decisión de aceptar o rechazar Ho. Dar la conclusión respectiva
MÉTODOS ESTADÍSTICOS
- 51 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
6. FORMULAS DE LOS ESTADÍSTICOS DE PRUEBA: FORMULAS DE LOS ESTADISTICOS DE PRUEBA I. PRUEBA DE HIPOTESIS PARA EL PROMEDIO POBLACIONAL:
C. Si n es mayor de 30 y la varianza poblacional es conocida: Estadístico de prueba: x Z t Z / 2 (distribución normal) Z
n
D. Si n es menor o igual a 30 y la varianza poblacional es desconocida: Estadístico de prueba: x t t t t ( / 2, n 1) (distribución t de student) s
n II. PRUEBA DE HIPOTESS PARA LA PROPORCION POBLACIONAL
Estadístico de prueba: Z
p P
Z t
Z
/2
PQ n
Esta formula es tanto para muestras grandes como para muestras pequeñas. III. PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE MEDIAS
C. Si las muestras son de tamaño n 1>30 y n2>30 (grandes) y además las varianzas poblacionales se CONOCEN: Estadístico de prueba: Z
( x1 x 2 ) D 1
Z
/2
2
n1
Z t
n2
D. Si las muestras son de tamaño n 1<30 y n2<30 (pequeñas) y además las varianzas poblacionales DESCONOCIDAS: t
( x1 x 2 ) D S c
1 n1
t t
1
t (
(distribución t de
/ 2 , n 1)
n2
student) Donde : 2
sc
(n 1
1)s (n 1)s n n 2 2
1
2
1
2 2
, se llama varianza mancomunada
2
IV. PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE PROPORCIONES: B. Si p1 y p2 se determinan a partir de muestras:
Z
( p1
p ) D
p1 q1 n1
Z t
2
p 2 q 2
Z
/2
n2
Esta formula es tanto para muestras grandes como para muestras pequeñas.
MÉTODOS ESTADÍSTICOS
- 52 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
Métodos Estadísticos Ejercicios de Aplicación MsC. Luis Alberto Rubio Jacobo Enero - 2013
MÉTODOS ESTADÍSTICOS
- 53 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
ELEMENTOS Y CONCEPTOS BÁSICOS. Tema: Determinación de elementos.
Analizar los siguientes casos que se le presentan e identificar sus elementos. 1. El Ingeniero de producción de una empresa dedicada a la fabricación de bebidas alcohólicas desea saber si el grado de azúcar y porcentaje de alcohol han cumplido con los parámetros de calidad en la producción del día de hoy. Para ello toma una muestra de cinco botellas de cerveza y evalúa las características de su interés. Identificar la unidad de estudio, la variable en estudio, el tipo de variable, la población, muestra. 2. EPPO S.A. es una empresa de servicios de transporte de pasajeros en la ciudad de Piura, que se caracteriza por la responsabilidad y el compromiso de cada uno de sus integrantes. En dicha empresa trabajan 1000 personas y se está estudiando conceder un aumento de sueldo a los trabajadores, para ello se ha previsto realizar un estudio de factibilidad para ver si es posible realizar el aumento. La comisión de funcionarios encargada de este estudio toma una muestra de 180 trabajadores informando que ganan en promedio 1260 soles al mes. Identifique: la unidad de estudio, la variable en estudio, el tipo de variable, la población, muestra. 3. Una empresa de productos lácteos está realizando una investigación de mercados a nivel de la Provincia de Piura. En especial está considerando las familias residentes en los distritos de Piura, Castilla y Catacaos. Su interés es saber cuál es la cantidad de latas de leche que consumen semanalmente. Si usted fuera el encargado de realizar esta investigación, identifique la unidad de estudio, la variable en estudio, el tipo de variable, la población, muestra. 4. Un investigador social desea saber cuáles son las características socio demográficas que influyen en el rendimiento académico de los estudiantes de la Universidad Católica Los Ángeles de Chimbote – Católica. Para ello ha considerado tomar una muestra (a criterio) del 10% del total de la población estudiantil. Identifique la unidad de estudio, la variable en estudio, el tipo de variable, la población, muestra. 5. El administrador de una gasolinera está haciendo un estudio para determinar si es posible la instalación de un nuevo servidor de gasolina en dicho establecimiento. Para realizarlo toma una muestra de 150 automóviles y evalúa el tiempo transcurrido en recibir el servicio. Identifique la unidad de estudio, la variable en estudio, el tipo de variable, la población, muestra. 6. Se está haciendo un estudio de la calidad de los lingotes de acero producidos por una empresa siderúrgica. Se han evaluado los pesos y diámetros de una muestra de 50 lingotes de acero. Dicha muestra fue obtenida de la producción diaria y las unidades de medida están dadas en Kg. y cms. Identificar la unidad de estudio, la variable en estudio, el tipo de variable, la población, muestra. 7. Un comerciante mayorista quiere saber cuál es la marca de detergente que más se utiliza o de mayor preferencia por las amas de casa de la ciudad de Piura. Para llevar a cabo esta investigación se selecciona una muestra de 504 amas de casa y se les aplica un cuestionario. Identificar la unidad de estudio, la variable en estudio, el tipo de variable, la población, muestra.
MÉTODOS ESTADÍSTICOS
- 54 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
PRESENTACIÓN Y RECOLECCIÓN DE DATOS. Tema: Distribución de frecuencias.
1.
A continuación se presentan los resultados de una encuesta, cuyo fin es medir la aceptación o rechazo de cierto producto que se lanzará en el mercado: si si si no si no si no si si si si si si si no no si si si no si si si si si no no si si Construya con estos resultados un cuadro de distribución de frecuencias. La empresa decidirá lanzar el producto al mercado si es que los resultados muestran que el porcentaje de aceptación supera los 75%. ¿Se podrá tomar la decisión de lanzar el producto al mercado? Explique por qué.
2. El Jefe de Producción de la empresa Coca Cola desea presentar un informe a Gerencia sobre lo producido durante el mes de Diciembre, para ello tiene reportes de toda la producción según el formato 400 ML. coca cola fanta coca cola fanta sprite sprite sprite
coca cola sprite inca cola inca cola inca cola coca cola coca cola
coca cola fanta fanta fanta sprite sprite inca cola
coca cola fanta sprite inca cola inca cola inca cola inca cola
Elaborar un cuadro de distribución de Frecuencias e interprete lo más resaltante. 3. Al investigar el grado de instrucción* de 40 trabajadores de la empresa CLEAN SRL, se obtuvo los siguientes resultados: P
A
S
S
S
P
P
A
A
S
S
P
A
S
P
S
A
S
P
A
S
S
A
P
P
S
S
A
P
S
S
P
S
P
P
S
P
P
S
S
* Primaria (P) Secundaria (S) y Superior (A) Construir un cuadro de distribución de frecuencias e interpretar lo más resaltante. 4. La Empresa LUXNORT S.A., produce bombillas eléctricas, que son utilizados en las instalaciones de los departamentos en estreno. El gerente de dicha empresa, quiere saber cuántos artículos defectuosos produce en el mes de Septiembre del presente año. Para ello se revisaron 40 lotes y se encontró el siguiente número de artículos defectuosos por lote: 3, 2, 5, 0, 1, 3, 2, 1, 0, 1, 3, 4, 2, 4, 4, 3, 4, 3, 2, 3. 5, 1, 3, 0, 2, 2, 2, 1, 1, 1, 2, 4, 2, 3, 5, 3, 1, 0, 2,0. Construya con ellos una distribución de frecuencias. Interprete los resultados 5. En un trabajo de Investigación Social, organizado por la Municipal de Trujillo, los investigadores desean determinar cuál es el tipo de material de construcción de una vivienda que habitan los ciudadanos de Trujillo en el Asentamiento humano “ Alto Trujillo”. Con el fin de realizar un programa que les beneficiará a dichos pobladores, se seleccionó una muestra de 30 viviendas, dando los siguientes resultados:
MÉTODOS ESTADÍSTICOS
- 55 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
Esteras
Esteras
Esteras
Esteras
Adobe
Noble
Adobe
Adobe
Adobe
Esteras
Adobe
Adobe
Adobe
Noble
Noble
Adobe
Noble
Adobe
Adobe
Adobe
Esteras
Adobe
Esteras
Adobe
Adobe
Adobe
Adobe
Adobe
Adobe
Esteras
Construir un cuadro de distribución de frecuencias e interpretar lo más resaltante. 6.
Con la finalidad de otorgar una bonificación para época escolar, se investiga el número de hijos de una muestra de 40 trabajadores de la Municipalidad de la Esperanza en el presente año, para ello se registra entre otras características la cantidad de hijos que tiene cada trabajador obteniendo los siguientes resultados: 1
4
5
5
5
5
0
4
5
3
4
1
4
3
0
0
0
0
1
3
3
3
5
6
4
4
1
0
2
2
1
4
2
2
3
5
5
4
1
1
Elaborar un cuadro de distribución de Frecuencias e intérprete lo más resaltante 7.
A continuación se presentan los montos mensuales en nuevos soles correspondientes a las ventas de las 30 sucursales de Boticas Arcángel. 589
386
543
396
511
457
377 344 515 349
518 503 546 339
409 537 550 386
472 443 339 443
545 341 337 450
382 468 345 427
Realizar un cuadro de distribución de frecuencias e interprete lo más resaltante. 8. Se ha medido el contenido de calcio en los huesos a 30 pacientes del Hospital Regional de Trujillo en el mes de enero del 2010, dándose los valores de las muestras obtenidas 11.49
8.74
9.16
12.92
12.71
10.02
11.43
9.06
12.05
8.67
10.33
9.50
8.11
10.83
12.19
10.82
8.95
8.47
10.18
11.41
11.19 11.57 10.15 11.32 10.93 10.79 8.23 9.30 12.40 Elaborar un CDF. Interpretar los resultados más importantes en esta tabla.
11.66
9.
A continuación se presenta la distribución de 96 Farmacias de Trujillo de acuerdo a su ingreso neto en miles de soles durante el año 2009. La información se obtuvo de los registros de La SUNAT. INGRESO S/. Yi fi Fi hi % Hi% 0 – 4
6
4 – 8
11
8 – 12
27
12 – 16 16 – 20
29 23
TOTAL
96
MÉTODOS ESTADÍSTICOS
- 56 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
Completar el CDF (titulo, cuerpo y fuente) e Interpretar. 10. A continuación se presenta la distribución del pago por atención (en soles) de 500 pacientes de la Clínica Santa Ana de la Ciudad de Trujillo en el mes de Diciembre del 2012. Los datos fueron obtenidos del área de Estadística de dicho nosocomio. PAGO S/.
Yi
fi
Fi
hi %
Hi%
20 850 -
10% 210 - 1600
34% 96%
TOTAL
n=
Completar el cuadro de Distribución de Frecuencias e Interpretar:
11. A continuación se presenta la distribución de las ganancias diarias (Soles) durante los meses Febrero y Marzo (60 días) de la Clínica Peruano Americano de Trujillo en el 2012. GANANCIAS
Yi
fi
500 -
Fi
hi %
Hi%
4 15% - 950
20 10 20% 55
TOTAL
n=
Completar el cuadro de distribución de Frecuencias e Interpretar.
MÉTODOS ESTADÍSTICOS
- 57 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
PRESENTACIÓN Y RECOLECCIÓN DE DATOS. Tema: Gráficos Estadísticos
1.
Una variable categórica tiene tres categorías con las siguientes frecuencias: Categoría A B C
Frecuencia 13 28 9
a. Calcule el porcentaje de valores en cada categoría. b. Construya una gráfica de barras. c. Construya una gráfica de pastel. d. Construya un diagrama de Pareto. 2.
Una variable categórica tiene cuatro categorías con los siguientes porcentajes: Categoría A B C D a. Construya una gráfica de barras. b. Construya una gráfica de pastel. c. Construya un diagrama de Pareto.
3.
Porcentaje 12 29 35 24
En una encuesta se preguntó a 150 ejecutivos cuál creían que era el error más común de los candidatos durante las entrevistas de trabajo. Los resultados fueron los siguientes: Razón Porcentaje Poco o nulo conocimiento de la compañía 44 Sin preparación para discutir sus planes profesionales 23 Escaso entusiasmo 16 Falta de contacto visual 5 Sin preparación para discutir sus habilidades 3 Otras razones 9 a. Construya una gráfica de barras, una gráfica de pastel y un diagrama de Pareto. b. ¿Cuál es el método gráfico que mejor refleja los datos?
4.
El correo electrónico basura (spam) se ha convertido en un problema muy grave para la productividad. La siguiente tabla muestra el uso que una compañía da al software antispam con base a una encuesta realizada a ejecutivos de tecnología. Uso del software antispam por la compañía Tiene software para algunos usuarios Tiene software para todos los usuarios. Planea tener software en los próximos 12 meses No planea tener software a. Construya una gráfica de barras y una gráfica de pastel.
5.
Porcentaje 12 59 20 9
Un analista registró las causas de las caídas de una red durante los pasados seis meses
MÉTODOS ESTADÍSTICOS
- 58 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
Razón de la falla Conexión física Falta de energía Software del servidor Hardware del servidor Servidor falto de memoria Banda ancha inadecuada a. Construya un diagrama de Pareto.
Frecuencia 1 3 29 2 32 1
6. Los datos mostrados a continuación representan el costo de la energía eléctrica durante julio de 2009 para una muestra aleatoria de 50 departamentos de un condominio de una gran ciudad. Datos brutos en soles. 69 57 141 95 41
71 85 100 63 49
20 90 120 50 106
78 116 100 54 75
47 72 91 30 85
102 111 58 43 90
53 48 37 87 72
97 120 114 66 97
27 100 51 93 68
82 65 83 49 66
a. Trace un histograma. b. Trace una ojiva porcentual.
MÉTODOS ESTADÍSTICOS
- 59 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
MEDIDAS DE TENDENCIA CENTRAL, POSICIÓN, DISPERSIÓN Y DE FORMA. Tema: Medidas de tendencia central, posición, dispersión y de forma.
1.
A continuación se presenta la distribución de 96 empresas de Huamachuco de acuerdo a su ganancia neta en miles de dólares durante el año 2007. Esta información ha originado el siguiente cuadro de distribución de frecuencias:
NÚMERO DE EMPRESAS
GANANCIA 5,000 – 11,000 11,000 – 17,000 17,000 – 23,000 23,000 – 29,000 29,000 - 35,000 Total
6 11 27 29 23 96
Calcular: a. La ganancia neta promedio. Interprete b. La ganancia mediana. Interprete c. La ganancia modal. Interprete. d. Cuánto ganan como máximo el 25 % de las empresas. e. El rango de la ganancia neta de estas empresas. Interprete. f. La varianza. g. La desviación estándar. Interprete. h. Determinar si las empresas tienen una ganancia neta homogénea. i. Obtenga las medidas de asimetría y curtosis e interprete. 2. Para cubrir las 2 vacantes en el departamento de contabilidad de una empresa, en una prueba escrita los postulantes seleccionados obtuvieron los siguientes puntajes: 125, 148, 99, 132, 121, 114, 100, 98, 112, 123, 125 Calcular: a. Hallar el puntaje promedio. b. Hallar el puntaje mediano. c. Hallar el puntaje modal. d. Calcular el rango. Interprete e. Calcular la varianza. f. Calcular la desviación estándar. Interprete g. Calcular el coeficiente de variación. Interprete. h. Calcular las medidas de asimetría y curtosis e interprete. 3.
En la empresa CAMPOSOL S.A. trabajan 15000 trabajadores. La empresa está estudiando conceder un aumento y encarga hacer un estudio de factibilidad. La comisión encargada de este estudio toma una muestra de 180 trabajadores informando que ganan en promedio 1060 soles. Considerando que estos datos muestrales se pueden asumir como datos de la población laboral: a. Calcule el nuevo sueldo promedio si se produjera un aumento general de 245 soles. b. Si por fiestas patrias los trabajadores reclaman una bonificación extraordinaria de 240 soles y consiguen su objetivo. Calcule el nuevo sueldo promedio. c. Calcule el nuevo sueldo promedio en el caso que se produjera un aumento general del 14,5% de los sueldos más una cantidad fija de 68 soles. d. ¿A cuánto asciende el monto pagado por la empresa a los trabajadores en el caso de que se produjera un aumento del 16,25% de los sueldos más una bonificación de 135 soles?
MÉTODOS ESTADÍSTICOS
- 60 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
4.
A continuación se presenta la distribución de 135 familias residentes en las Urbanizaciones de San Andrés, California y La Merced de acuerdo a su gasto semanal en consumo de leche de vaca en dólares. Número de familias Marca de clase Gasto semanal en ($) ( fi ) ( Yi ) 0 – 10 4 5 10 – 20 22 15 20 – 30 51 25 30 – 40 27 35 40 – 50 31 45 Total n=135 a. Calcular el gasto promedio semanal. Interprete b. Calcular la mediana. Interprete. c. Calcular la moda. Interprete d. Calcular cuánto gastan como máximo el 75% de las familias. e. Calcular cuánto gastan como máximo el 85% de las familias. f. Calcular el rango. g. Calcular la variabilidad del gasto realizado por las familias, en el consumo de leche de vaca. Interprete. h. Calcular si este gasto es homogéneo. Interprete i. Obtenga las medidas de asimetría y curtosis e interprete.
5. En la empresa CAMPOSOL S.A. trabajan 15000 trabajadores. La empresa está estudiando conceder un aumento y encarga hacer un estudio de factibilidad. La comisión encargada de este estudio toma una muestra de 180 trabajadores informando que ganan en promedio 1060 soles. Considerando que estos datos muestrales se pueden asumir como datos de la población laboral: a. Calcule el nuevo sueldo promedio si se produjera un aumento general de 245 soles. b. Si por fiestas patrias los trabajadores reclaman una bonificación extraordinaria de 240 soles y consiguen su objetivo. Calcule el nuevo sueldo promedio. c. Calcule el nuevo sueldo promedio en el caso que se produjera un aumento general del 14,5% de los sueldos más una cantidad fija de 68 soles. d. ¿A cuánto asciende el monto pagado por la empresa a los trabajadores en el caso de que se produjera un aumento del 16,25% de los sueldos más una bonificación de 135 soles? 6.
La empresa de transportes LÍNEA S.A. cuentan con 80 trabajadores, los cuales se distribuyen de acuerdo a su edad (en años) de la siguiente manera: Años
15-20
20-25
25-30
30-35
35-40
40-45
45-50
50-55
N° de Trab.
4
9
17
23
14
9
3
1
a. b.
La empresa quiere proponer un plan de seguro familiar si la edad promedio de los trabajadores supera los 35 años. Con la información que se tienen se propondrá este plan de seguro familiar. La empresa desea conocer también si el 50 % de su población de trabajadores es menor de 30 años. Realizar el análisis estadístico respectivo.
MÉTODOS ESTADÍSTICOS
- 61 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
7. Una empresa consultora de investigación de mercados ha incorporado en su página web un formulario para solicitar un boletín informativo sobre los servicios que ésta ofrece. Esta estrategia de entrega de información ha obtenido los siguientes resultados durante los meses de julio y agosto:
Fecha
Número de solicitudes
Fecha
Número de solicitudes
Fecha
Número de solicitudes
Fecha
Número de solicitudes
01-Jul
1
01-Ago
2
17-Jul
1
17-Ago
2
02-Jul
0
02-Ago
2
18-Jul
4
18-Ago
4
03-Jul
0
03-Ago
2
19-Jul
10
19-Ago
4
04-Jul
1
04-Ago
2
20-Jul
5
20-Ago
2
05-Jul
2
05-Ago
2
21-Jul
4
21-Ago
2
06-Jul
2
06-Ago
3
22-Jul
3
22-Ago
3
07-Jul
0
07-Ago
2
23-Jul
3
23-Ago
4
08-Jul
1
08-Ago
7
24-Jul
2
24-Ago
1
09-Jul
5
09-Ago
1
25-Jul
3
25-Ago
2
10-Jul
1
10-Ago
2
26-Jul
1
26-Ago
1
11-Jul
0
11-Ago
1
27-Jul
4
27-Ago
0
12-Jul
1
12-Ago
2
28-Jul
5
28-Ago
1
13-Jul
2
13-Ago
0
29-Jul
4
29-Ago
0
14-Jul
1
14-Ago
5
30-Jul
0
30-Ago
2
15-Jul
3
15-Ago
2
31-Jul
2
31-Ago
0
16-Jul
5
16-Ago
1
a. b.
Obtenga la medida estadística de tendencia central adecuada para cada mes e intérprete. ¿En qué mes se obtuvo una mayor cantidad de visitantes (diaria)?
8.
Se ha medido el tiempo de duración de las visitas (en segundos) a la página web de Facebook. La finalidad de esta evaluación es tener el tiempo promedio de visita y proponer a las empresas un tiempo predeterminado para la realización de campañas publicitarias. 14 19 13 16 25 15 20 9 25 7 12 16 4 17 15 10 15 7 18 23 6 17 15 16 30 14 13 13 9 32 a. Determinar el tiempo promedio e intérprete. b. ¿Cuánto varía en tiempo, en promedio, las visitas respecto al promedio?
9.
Se ha medido el contenido de calcio en los huesos a cierto número de pacientes del Hospital Regional de Piura en el mes de enero del presente año, obteniéndose el siguiente cuadro de distribución de frecuencias: Cont. Calcio 13.7 -
MÉTODOS ESTADÍSTICOS
Pacientes
%
3
9%
- 62 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
-16.7
7
22%
9
28%
6
19%
1
3%
Total a. b.
Obtener la desviación estándar. Interprete su resultado. Obtener el cuartil 3. Interprete su resultado.
10. En el mes pasado la empresa Avícola NORAVES realizó un estudio de investigación sobre los pesos de 200 pollos nacidos en incubadora. De los resultados en ese estudio se obtuvo el siguiente cuadro de Distribución de Frecuencias: PESOS DE LOS POLLOS NACIDOS EN INCUBADORA. Pesos 30 - 70 70 - 110 110 - 150 Porcentaje 40% 25% 20% Fuente: Centro de Investigación – Avícola NORAVES.
150 - 190 10%
190 - 230 5%
Del cuadro de distribución de Frecuencias anterior, obtenga: a. Obtenga las tres medidas de tendencia central, estudiadas en clases, de los pesos de los pollos. Interprete. b. ¿Por debajo de que peso se encuentra el 85% del total de los pollos?
MÉTODOS ESTADÍSTICOS
- 63 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE. Tema: Regresión lineal simple, Correlación lineal simple.
1.
LA EMPRESA HIDRANDINA de la ciudad de Trujillo, está haciendo un estudio sobre los consumos de energía (en miles de kilowatts - hora) y el número de habitaciones en una residencia privada multifamiliar. Para este estudio se selecciona una muestra aleatoria de 10 residencias multifamiliares, en la cual se obtuvo los siguientes resultados:
a. b. c. 2.
Nº de casa
Número de habitaciones
Consumo de energía (miles de kw)
1 2 3 4 5 6 7 8 9 10
12 9 14 6 10 8 10 10 5 7
9 7 10 5 8 6 8 10 4 7
Determine la variable dependiente (y) y la variable independiente (x) Estime la ecuación de regresión lineal: Y = A + B X Evalúe el consumo (en miles de kilowatts-hora), para una casa de 11 habitaciones.
El gerente de una empresa esta haciendo un estudio entre el número de contactos que tienen sus vendedores y sus ventas en miles de dólares. Para esto recurre al departamento de ventas y contabilidad obteniendo la siguiente información:
Nº
Número de contactos
Ventas (en miles de dólares)
1 2 3 4 5 6 7 8 9 10
14 12 20 16 46 23 48 50 55 50
24 14 28 30 80 30 90 85 120 110
a. Determine la variable dependiente (y) y la variable independiente (x) b. Estime la ecuación de regresión lineal: Y=A + B X c. Evalúe las ventas estimadas si se contacta, o comunica, con 40 clientes. d. Calcule e interprete el valor del coeficiente de regresión lineal “ r ”
MÉTODOS ESTADÍSTICOS
- 64 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
3.
El departamento de producción de una fábrica desea explorar la relación entre el número de obreros que ensamblan y la cantidad de artículos producidos. Como experimento se asignaron grupos de trabajadores para verificar su producción y los resultados obtenidos fueron los siguientes:
a. b. c. d. 4.
Nº
Número de ensambladores
Producción en (unidades)
1 2 3 4 5
2 4 1 5 3
15 25 10 40 30
Determine la variable dependiente (y) y la variable independiente (x) Estime la ecuación de regresión lineal: Y = a + b X Para 6 operarios ¿Cuál es la producción esperada? Calcule e interprete el valor del coeficiente de regresión lineal “ r ”
El jefe de personal de una empresa cree que existe una relación entre la ausencia al trabajo y la edad del empleado. Con el propósito de estudiar el problema tomó en cuenta la edad de diez trabajadores escogidos al azar y contabilizó los días de ausencia durante el año. Los resultados fueron como se observa en la tabla que sigue:
Nº
Edad en años
Ausencia en días
1 2 3 4 5 6 7 8 9 10
25 50 35 20 45 50 30 40 62 40
20 5 10 20 8 2 15 12 1 8
a. b. c. d.
Construya el diagrama de dispersión. Obtenga la ecuación de la recta de regresión Si un trabajador tiene 38 años, ¿Cuántos días se espera que f alte al año? Si un trabajador faltó 3 días al año. ¿Qué edad se puede esperar que tenga este trabajador? e. Determinar el grado de relación entre las variables en estudio.
MÉTODOS ESTADÍSTICOS
- 65 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
PROBABILIDADES Tema: Probabilidades
1. Indique Ud. si los siguientes experimentos son aleatorios: l. m. n. o. p. q. r. s. t. u. v.
Elegir una carta de una baraja (52 cartas) y señalar la figura obtenida. V F Verificar el estado de dos transistores (apagado y prendido) V F Lanzar una piedra a una tina con agua. V F Lanzar 4 monedas y ver el número de caras. V F Extraer 3 bolas con reemplazo de una urna que contiene 12 bolas diferentes (la bola se devuelve antes de extraer la siguiente bola). V F Jugar un partido de fútbol. V F Soltar un plumón en el aire. V F Rendir un examen. V F Jugar la tinka. V F Realizar una operación quirúrgica. V F Aplicar una fuerza a un cuerpo en reposo. V F
2. Indique el espacio muestral para los siguientes experimentos: (Utilice el diagrama del árbol) l. m. n. o. p. q. r. s. t.
Lanzar 2 monedas: Lanzar 3 monedas Lanzar 1 dado y una moneda Anotar el sexo de un recién nacido Lanzar 2 dados Jugar un partido de fútbol Rendir un examen Prender una computadora Seleccionar dos bolas de una urna que contiene 2 bolas rojas, 2 bolas azules y 2 bolas verdes.
u. v.
Seleccionar dos bolas de una urna que contiene 1 bola roja, 1 azul y 3 verdes. Seleccionar tres bolas de una urna que contiene 2 bolas rojas, 2 azules y 2 verdes.
Determinar el espacio muestral y determine los experimentos:
3. Una familia tiene 3 hijos, examinar su sexo, teniendo en cuenta la edad, del mayor al menor. a. Determinar su espacio muestral: b. Determinar el evento A: Los 3 sean masculinos c. Determinar el evento B: Por lo menos uno sea femenino. 4.
Si un investigador de mercados entrevista a una ama de casa y a su esposo para determinar la “aceptación” o “no aceptación” de un cierto prod ucto. Asigne el valor 1 si acepta el producto. Asigne el valor 2 si rechaza el producto. a. Construya el espacio muestral para este experimento. b. Determine el evento A: ambos acepten el producto. c. Determine el evento B: Por lo menos uno de ellos acepte el producto. 5.
4. 5. 6. 7.
Un comerciante tiene en su bolsillo 4 billetes, de 10, 20, 50 y 100 nuevos soles. Si saca dos billetes de su bolsillo, uno tras otro. Calcular lo siguiente: Considere lo siguiente: D = Cheque de diez soles V = Cheque de veinte soles Q = Cheque de cincuenta soles. C = Cheque de cien soles.
El espacio muestral asociado a este experimento El evento A: Que el primer billete sea de 10 y el siguiente de 20. El evento B: Que el primer billete haya sido de 20 soles. El evento C: Que el segundo billete sea de 100 soles.
MÉTODOS ESTADÍSTICOS
- 66 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
6.
Tres personas A, B, C solicitan empleo a una empresa. Si el experimento consiste en ordenar las solicitudes de acuerdo a sus habilidades para el trabajo. Construya:
a. b. c. 7.
En una urna se tiene 2 bolas rojas, 2 bolas azules y 2 verdes. Seleccionar en forma aleatoria sin reemplazo 3 bolas de la urna.
a. b. c. d. 8.
Construir el espacio muestral. Determinar el evento A: La primera sea roja Determinar el evento B: Las 2 primeras sean azules. Determinar el evento C: Obtener a los más 2 bolas verdes.
En una urna se tiene 2 bolas rojas, 2 bolas azules y 2 verdes. Seleccionar en forma aleatoria con reemplazo 3 bolas de la urna.
a. b. c. d. 9.
El espacio muestral El evento P: Que B ocupe el primer lugar. El evento Q: Que A y B ocupen los primeros lugares.
Construir el espacio muestral. Determinar el evento A: La primera sea roja Determinar el evento B: Las 2 primeras sean azules. Determinar el evento C: Obtener a los más 2 bolas verdes.
Una urna contiene 5 bolas blancas y 6 negras, se extrae al azar s in reposición dos bolas.
a. b. c.
Cuál es el espacio muestral (sin reposición) Cuál es el espacio muestral (con reposición) Determinar el evento A: Que las bolas sean blancas para ambos casos.
10. Se tiene una baraja con 52 cartas. Se seleccionan al azar 2 cartas y se observa la figura.
a. b.
Cuál es el espacio muestral asociado con este experimento Si se observa el número. ¿Cuál es el espacio muestral?
Calcular las siguientes probabilidades:
11. Si el experimento consiste en E: Lanzar 2 monedas, calcular: a. b. c.
La probabilidad de que ambas sean cara. La probabilidad de que la primera sea cara. La probabilidad de que la segunda sea sello.
12. Si el experimento cosiste en E: Lanzar 3 monedas, calcular: a. b. c.
La probabilidad de que las tres sean cara. La probabilidad de que la primera sea cara. La probabilidad de que la segunda sea sello.
13. Si el experimento consiste en E: Lanzar 1 dado y una moneda, calcular: a. b. c.
La probabilidad que caiga el número 1 y sello. La probabilidad de que caiga el número 6 y cara. La probabilidad de que caiga el 3 y sello.
14. Si el experimento consiste en E: Observar el sexo de 2 recién nacidos, calcular: a. b. c.
La probabilidad de todos sean del sexo masculino. La probabilidad de que 2 sean del sexo masculino y uno femenino. La probabilidad de que el primero sea femenino y el último masculino.
15. Si el experimento consiste en E: Jugar 3 partidos de fútbol, calcular: a. b. c.
La probabilidad de que todos los partidos se ganen. La probabilidad de que por lo menos un partido se empate. La probabilidad de que a lo más un partido se pierda.
MÉTODOS ESTADÍSTICOS
- 67 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
16. Si el experimento consiste en E: lanzar dos dados simultáneamente, calcular: a. b. c. d.
La probabilidad de que el puntaje obtenido sea 5. La probabilidad de que el puntaje obtenido sea menor de 6. La probabilidad de que el puntaje obtenido sea mayor de 4 o mayor de 9. La probabilidad de que el puntaje total obtenido sea menor de 4.
17. Si el experimento consiste en E: Seleccionar dos bolas de una urna que contiene 2 bolas rojas, 2 bolas azules y 2 bolas verdes, calcular: a. b. c. d.
La probabilidad de que ambas sean rojas. La probabilidad de que una de ellas sea roja. La probabilidad de que una de ellas sean verde. La probabilidad de que la primera sea roja y la segunda roja.
18. Si el experimento consiste en E: Seleccionar dos bolas de una urna que contiene 1 bola roja, 1 azul y 3 verdes. a. b.
La probabilidad de que ambas sean verde. La probabilidad de que la primera sea roja y la otra azul.
Resolver las probabilidades de los siguientes casos:
19. Una familia tiene 3 hijos, examinar su sexo, teniendo en cuenta la edad (del mayor al menor). Calcular la probabilidad de que: a. b. c. d.
Los 3 sean masculinos. Por lo menos uno sea femenino. Uno de ellos sea masculino. El primero sea masculino.
20. Si un investigador de mercados entrevista a un ama de casa y a su esposo para determinar la “aceptación” o “no aceptación” de un cierto producto (asigne el valor 1 si acepta el producto y el valor 2 si rechaza el producto. Calcular la probabilidad de que: a. b. c. d.
Ambos acepten el producto. Uno de ellos acepte el producto. El esposo rechace el producto. La esposa rechace el producto.
21. Un comerciante tiene en su bolsillo 4 billetes, de 10, 20, 50 y 100 nuevos soles. Si saca dos billetes de su bolsillo, uno tras otro. Calcular la probabilidad de que: a. b. c.
El primer billete sea de 10 y el siguiente de 20 . El segundo billete haya sido de 20 soles. El primero sea de 20 y el segundo de 100.
22. Tres personas A, B, C solicitan empleo a una empresa. Si el experimento consiste en ordenar las solicitudes de acuerdo a sus habilidades para el trabajo. Calcular la probabilidad de que: a. b. c.
B ocupe el primer lugar. A y B ocupen los primeros lugares. C ocupe el primer lugar.
23. En una urna que contiene 2 bolas rojas, 2 bolas azules y 2 verdes, se seleccionar en forma aleatoria sin reemplazo 2 bolas. Calcular la probabilidad de que: a. b. c.
La primera sea roja. Las 2 primeras sean azules. Obtener a los más 2 bolas verdes.
MÉTODOS ESTADÍSTICOS
- 68 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
24. En una urna que contiene 2 bolas rojas, 2 bolas azules y 2 verdes. Seleccionar en forma aleatoria con reemplazo 2 bolas. Calcular la probabilidad de que: a. b. c.
La primera sea roja. Las 2 primeras sean azules. Obtener a los más 2 bolas verdes.
Calcular lo siguiente utilizando las reglas de propiedades:
25. Si A y B son eventos mutuamente excluyentes con P(A)=0.20 y P(B)=0.55, calcular: a. P(A U B)= b. P(A Π B)= c. P(A’ Π B’)= d. P(A’)= 26. Para el curso de estadística aplicada de la UPN – Trujillo, se han matriculado 80alumos de los cuales 50 son del sexo masculino y el resto de sexo femenino. el 50% de los varones fuman y el 20% de las mujeres también lo hacen. Si se selecciona un estudiante que lleva el curso de estadística aplicada calcular la probabilidad de que: a. Sea un varón. b. Fume c. Fume o sea varón. d. Sea mujer dado que fume. 27. Si el 60% de los hombres peruanos de 20 años y el 65% de las mujeres de 20 años viven hasta los 70 años. ¿Cuál es la probabilidad de que un matrimonio peruano que contrajo nupcias cuando ambos tenían 20 años de edad vivan para celebrar sus bodas de oro? 28. En una fabrica la maquina A produce el 30% de la producción, la maquina B el 25% y la maquina C el resto de la producción. La maquina A produce el 1% de defectuosos, la maquina B el 2% y C el 3% de defectuosos. Si la producción diaria de la fábrica es de 1000 artículos. a. b. c.
¿Cuál es la probabilidad de que sea producido por la maquina A o B.? ¿Cuál es la probabilidad de que sea producido por la maquina A o C? ¿Cuál es la probabilidad de que un artículo seleccionado de la producción sea defectuoso?
29. La ciudad de Trujillo tiene un carro de bomberos y una ambulancia disponible para emergencias. La probabilidad de que el carro de bomberos esté disponible cuando se necesite es 0.98 y la probabilidad de que la ambulancia esté disponible cuando se la requiera es de 0.92. Suponiendo que en estos momentos hay un edificio en llamas, calcular la probabilidad de de que la ambulancia y el carro de de bomberos estén disponibles. 30. A una muestra aleatoria de 200 personas se clasifica según su sexo y su nivel de educación: Educación Hombre Mujer Primaria 38 45 Secundaria 28 50 Superior 22 17 Si se escoge una persona al azar de este grupo, calcular la probabilidad de que: a. La persona sea hombre. b. La persona sea hombre dado que tiene educación secundaria c. La persona no tiene educación superior dado que es mujer.
MÉTODOS ESTADÍSTICOS
- 69 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
DISTRIBUCIONES DE PROBABILIDAD. Tema: Distribución Normal
Resolver los siguientes casos: 1.
La distribución de los salarios mensuales de los trabajadores de una minera tiene un comportamiento normal cuya media es S/. 2100 y una varianza de S/. 62 500. Si el número de trabajadores es de 4250 ¿Cuántos trabajadores tienen salarios: a. Menores de S/. 2100? b. Menores de S/. 2500? c. Mayores de S/. 2600? d. Entre 2000 y 2500 soles?
2.
Los focos de alumbrado eléctrico producidos por una compañía eléctrica tienen una distribución normal con una media de 1000 horas y una desviación estándar de 50 horas. Determinar la probabilidad de que: a. Un foco tomado al azar se queme en menos de 950 horas b. Un foco se que queme entre 900 y 1200 horas c. Un foco se queme en no menos de 990 horas
3.
NEUMA Perú, es una empresa que produce llantas para automóviles en nuestro país. La vida útil de estas llantas se distribuye aproximadamente como una normal con media y desviación estándar iguales a 32000 y 1000 millas respectivamente. En una corrida de producción de estas llantas se realizó el control de calidad respectivo y se determinó que estas llantas tienen una garantía de 30000 millas. ¿Qué porcentaje de esta producción necesitará ser reemplazada?
4.
La vida útil de la Batería BOSCH para automóvil se distribuye como una normal con un promedio de 38 meses y una desviación estándar de 2 meses. Si la empresa no desea reemplazar más del 6.68% de las baterías vendidas ¿Qué tiempo de garantía debe dar?
5. En un proceso fotográfico, el tiempo de revelado de las copias es una variable aleatoria cuya distribución normal tiene una media de 16.28 segundos y una desviación estándar de 0.12 segundos. Calcular la probabilidad de que un revelado cualquiera tarde: a. Entre 16 y 16.50 segundos. b. Al menos 16.20 segundos. c. A lo más 16.35 segundos. 6.
El tiempo requerido para ensamblar una pieza mecánica es una variable aleatoria cuya distribución es aproximadamente normal con media 12.9 minutos y una desviación estándar de 2.0 minutos. ¿Cuál es la probabilidad de que el ensamblado de una pieza mecánica cualquiera tarde a. Al menos 11.5 minutos? b. Entre 11.0 y 14.8 minutos? c. A lo más 12 minutos? d. Entre 10.9 y 13.4 minutos?
MÉTODOS ESTADÍSTICOS
- 70 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
7.
En la Empresa Agroindustrial Camposol se tiene dos líneas de producción: A y B. La línea A produce un 5% de productos no conformes y la línea B produce 10% de productos no conformes. Se extrae una muestra aleatoria de 5 piezas de la producción de cada línea. a. ¿Cuál es la probabilidad que la muestra de la producción de la línea A contenga por lo menos dos productos no conformes? b. ¿Cuál es la probabilidad de que la muestra de la producción de la línea A contenga más de dos productos conformes?
8. Una máquina troqueladora produce tapas de latas cuyos diámetros están normalmente distribuidos, con una desviación estándar de 0.01 pulgadas ¿En qué diámetro promedio debe ajustarse la máquina de tal manera que no más de 5% de las tapas producidas tengan diámetros que excedan las tres pulgadas? 9. En una investigación realizada por el Vicerrector Académico de la UCV se determinó que el 2% de los estudiantes matriculados en el año 2009 desertaron. a. ¿Qué cantidad de estudiantes desertó en dicha Institución si el número de estudiantes matriculados en el 2009 fue de 2500? b. ¿Cuál es la probabilidad de que el suceso anterior ocurra en el año 2010, si se tiene pensado matricular 3000 estudiantes? 10. En estudios realizados en un Hospital de la ciudad se dice que el peso de un bebe recién nacido vivo tiene una distribución normal con media de 210 gramos y una varianza de 64 gramos2. ¿Cuál es la probabilidad que un bebe recién nacido vivo: a. Tenga entre 200 y 215 gramos. b. Que al menos sea 200 gramos. 11. Muchos problemas de producción se relacionan con la unión exacta de partes de maquinaria, con flechas, que caben en el orificio de una válvula. Un diseño en particular requiere de una flecha con un diámetro de 22.00 mm, pero las flechas con diámetros entre 21.900 mm, y 22.010 son aceptables. Suponga que el proceso de manufactura fabrica flechas con diámetros que se distribuyen normalmente con una media de 22.002 mm y un desviación estándar de 0.005 mm. Para este proceso, ¿Cuál es a. La proporción de flechas con un diámetro entre 21.90 mm y 22.00 mm? b. La probabilidad de que una flecha sea aceptada? c. ¿Cuáles serían sus respuestas en los incisos a. y c. si la desviación estándar de los diámetros de las flechas fuera de 0.004 mm? 12. La fuerza de rompimiento de las bolsas de plástico usadas para empacar productos se distribuye normalmente con una media de 5 libras por pulgada cuadrada y una desviación estándar de 1.5 libras por pulgada cuadrada. ¿Qué proporción de bolsas tienen una fuerza de rompimiento de a. Menos de 3.17 libras por pulgada cuadrada? b. Al menos 3.6 libras por pulgada cuadrada? c. Entre 5 y 5.5 libras por pulgada cuadrada? d. ¿Entre cuáles dos valores simétricamente distribuidos alrededor de la media se encontrarán el 95% de las fuerzas de rompimiento? 13. Entre cuáles dos valores de Z (distribuidos simétricamente alrededor de la media) estarán contenidos el 68.26% de todos los posibles valores de Z?
MÉTODOS ESTADÍSTICOS
- 71 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
INTERVALOS DE CONFIANZA Tema: Intervalos de confianza.
1. Un grupo de estudiantes realizaron un trabajo de aplicación respecto a los sueldos de los trabajadores de una minera, para lo cual seleccionaron una muestra aleatoria de 24 trabajadores en el cual se determinó que el sueldo promedio semanal es de $160 y una varianza de 10 dolares2. a. Calcular un intervalo de confianza para el sueldo promedio con el 95% de confianza. b. Calcular un intervalo de confianza para el sueldo promedio con el 99% de confianza. 2. La Gerencia de una empresa fabricante de cigarrillos está interesada en conocer el contenido de nicotina promedio de sus productos. Para lo cual selecciona una muestra de 14 cigarrillos obteniendo un promedio de 25 miligramos y una variabilidad de 4 miligramos. a. Calcular un intervalo de confianza para el contenido promedio de nicotina con el 90% de confianza. b. Calcular un intervalo de confianza para el contenido promedio de nicotina con el 95% de confianza. 3.
Supongamos que usted se dedica al negocio de venta de automóviles y sospecha que su margen de beneficios mensual promedio por auto vendido está por debajo del promedio nacional de S/. 700. Para evaluar su margen de beneficio toma información (muestra) respecto a 8 meses. La información recolectada es la siguiente: MES 1 2 3 4 5 6 7 8 BENEFICIO 800 840 780 850 810 790 805 800 a. Calcule un intervalo de confianza para el margen de beneficio promedio con el 99% de confianza. b. Calcule un intervalo de confianza para el margen de beneficio promedio con el 95% de confianza.
4. La SUNAT está haciendo auditoria en ciertos grifos gasolineras. Selecciona en forma aleatoria 05 grifos de 2 empresas diferentes (Texaco y Repsol). Los ingresos en miles de soles semanales se presentan a continuación: TEXACO : 90 85 95 76 80 REPSOL : 84 87 90 92 90 a. Estimar un intervalo de confianza para el ingreso promedio del grifo TEXACO con el 90% de confianza. b. Estimar un intervalo de confianza para el ingreso promedio del grifo REPSOL con el 95% de confianza. 5. Según el Supervisor de Calidad de la Empresa Coca Cola, el 1% del total de botellas producidas se encuentra en estado no conforme. Para verificar esta hipótesis se toma una muestra de 500 botellas que se han producido durante el día y se halla que 10 botellas se encuentran en estado no conforme. Calcular e interpretar el intervalo confidencial para la proporción de botellas en estado conforme con un nivel de confianza del 95%.
MÉTODOS ESTADÍSTICOS
- 72 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
TAMAÑO MUESTRAL. Tema: Obtención del tamaño de muestra. 1. Por estudios científicos se sabe que el Coeficiente de Inteligencia promedio para jóvenes según la escala de Weshler es de 100 puntos con una desviación estándar de 15 puntos. Determinar el tamaño de muestra para realizar una investigación sobre niveles de inteligencia en la Universidad UCV, si se admite un error del 2% del promedio y una seguridad del 95%. 2.
Se desea estimar la proporción de la población que está de acuerdo con la actual gestión del Congreso de la República, con un error máximo de ±0.5% y con una confianza del 95%. Por estudios similares, se cree que la proporción será cerca al 1%. ¿Cuál será el tamaño de muestra requerido?
3.
El administrador del Restaurante “El Romano” desea saber qué proporción de sus Clientes-Turistas
están inconformes con las atenciones recibidas durante su estadía en Piura. ¿De qué tamaño debe ser la muestra si se considera E=0.05, nivel de confianza del 95% y no se dispone de alguna otra información? 4.
En un estudio realizado en la Minera Barrick se obtuvo que el promedio de horas extras por trabajador es de 3.3 hrs., con una varianza de 4.18 hrs2. Si en el presente año cuenta con 120 trabajadores, los cuales registran sus horas extras en tarjetas de control. Determinar el tamaño de muestra necesario para estimar el promedio de horas extras diarias con un error del 20% del promedio y una confianza del 95%.
5.
El Director del Departamento de Salud Pública de la Ciudad de Trujillo desea obtener una muestra de los registros de casos de mordidas de perro, reportadas durante el año anterior, para estimar la edad media de las personas mordidas. El Director desea una muestra con una seguridad del 95%, con un error del 5%. En base a estudios anteriores se conoce que la edad promedio de las personas que son mordidas por perros es de 25 años y la desviación estándar es de 5 años. ¿De qué tamaño debe ser la muestra?
6.
Se desea estimar el tiempo medio de duración de artefactos eléctricos (focos) producidos por la empresa PHILIPS. Se sabe por un estudio piloto de 10 focos que la desviación estándar del tiempo de duración es de 20 meses. De que tamaño debe ser la muestra para estimar el tiempo medio de duración con un error máximo de 4 meses y con una confianza del 95%?
7. El ministerio de Salud-Piura está realizando una investigación acerca del comportamiento del peso de niños en la ciudad de Trujillo y ver si presenta un plan de salud para mejorar este factor latente de bajo de peso. Como no se conoce la varianza se obtiene una muestra piloto de 20 niños cuyos pesos son: 14.8, 14.2, 15.3, 15.4, 15.0, 15.2, 15.3, 14.2, 15.2, 15.5, 14.5, 15.5, 15.2, 15.0, 14.3, 15.2, 14.0, 14.0, 14.2, 15.3 Determinar el tamaño de muestra apropiado con una confianza del 95% y un error tolerable del 1% respecto al promedio.
8.
Se desea estimar la proporción de jóvenes de la ciudad de Trujillo que hacen uso de Internet como mínimo una hora diaria con un 95% de confianza. De estudios anteriores se conoce que P=0.70 y se desea un E = 5%. Suponiendo que N = 1500. Cual debe ser el tamaño de muestra.
MÉTODOS ESTADÍSTICOS
- 73 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
PRUEBA DE HIPÓTESIS. Tema: Prueba de hipótesis para el promedio, proporción poblacional e Independencia de criterios.
1.
Una compañía controla su proceso de producción en tal forma que se pone en bolsitas un promedio de 20 grs. de un producto químico. El proceso se detendrá cuando el promedio no es de 20 grs. Se tomó una muestra aleatoria de 16 observaciones y el promedio muestral resultó ser 19 grs. ¿Debe pararse el proceso y ajustarse? La desviación estándar poblacional es de 2 grs. Y el nivel de significancia escogido es de 5%.
2.
Una compañía productora de transistores tiene un promedio de 20% de defectuosos. Cada hora se toma una muestra aleatoria de 100 transistores para realizar el control de calidad. A una hora determinada se encuentra un promedio de 28% de defectuosos. Debe detenerse el proceso de producción para regularlo?
3.
Una empresa constructora selecciona una muestra aleatoria de 200 votantes en Trujillo y 400 en los diferentes Pueblos Jóvenes; a quienes preguntan si en las próximas elecciones darían su voto al candidato A. Se determina que 50 trujillanos y 120 de los Pueblos Jóvenes votarías por el candidato. ¿Existe diferencia significativa entre las proporciones que en estos dos sectores apoyan al candidato A? Considerar un nivel de significancia del 10%.
4.
Se utiliza dos procesos para producir bombillas. Se toma una muestra de 16 bombillas de cada proceso y las vidas promedio de las dos muestras fueron M(x)=2000 para el proceso A y M(x)=2100 para el proceso B. Se sabe que la desviación estándar para el proceso A es σ=160 Hrs. Y para el proceso B, σ=240 Hrs. Verificar si hay diferencia significativa entre los procesos.
5.
La empresa productora de cereales embasados para consumo directo " ENERGIA" ha lanzado al mercado su nuevo producto "CRECIENDO FUERTE " el cual tiene como especificaciones un peso promedio neto de 1 kilogramo. Si un agente del gobierno toma una muestra representativa de 8 unidades y los pesos netos fueron los siguientes: 0.995, 0.974, 0.966, 0.935, 0.999, 1.06, 1.01 y 0.983 kilogramos. Con una significación del 5% ¿Podría el agente ordenar se multe a la empresa productora?
6.
Un estudio se realiza comparando el puntaje obtenido por los estudiantes egresados de los colegios A y B en el último examen de admisión a una universidad que tiene mucha acogida. Una muestra de 50 estudiantes egresados del colegio A tuvo un puntaje promedio de 135 puntos con una desviación estándar de 19 puntos y una muestra de 63 estudiantes egresados del colegio B tuvo un puntaje promedio de 141 puntos con una desviación estándar de 27 puntos. Con una significación del 5%, se podría afirmar que el puntaje alcanzado por los estudiantes egresados del colegio B fue superior al del colegio A?
7.
El Director de una universidad nueva afirma que solamente el 18% de los estudiantes no están de acuerdo con su actual gestión. En una encuesta aplicada a los estudiantes 90 de 450 estudiantes manifestaron estar en desacuerdo. ¿Se podría afirmar con una significación del 5% que la proporción en desacuerdo es mayor al 18% ?
MÉTODOS ESTADÍSTICOS
- 74 -
Prof. Luis Alberto Rubio Jácobo
Programas de Experiencias Adquiridas- Universidad Cesar Vallejo
8.
Una muestra aleatoria de 400 amas de casa seleccionadas por una organización de investigación de mercados indicó que el 20% prefería la marca de café X a todas las otras marcas. Después de una campaña intensa de propaganda por radio y televisión, se seleccionó una segunda muestra, esta vez de 600 amas de casa, la cual dio un 26% de preferencia para la marca X. ¿Se podrá afirmar con una significación del 5% que la campaña fue efectiva?
9.
Un fabricante requiere fibra de algodón con una resistencia media a la tensión de 6,50 onzas y σ
= 0.25. Investigó un nuevo lote de fibras mediante una muestra de 16 piezas y encontró x = 6,65 onzas. Existe evidencia de que este lote es de resistencia mayor a la requerida? 10. El promedio de las calificaciones del examen de admisión a la universidad fue de 500 puntos y la desviación estándar de 40 puntos; hubo 16 estudiantes del colegio A que obtuvieron un promedio de 485 puntos. Podrán considerarse las calificaciones de los estudiantes del colegio A como significativamente menores que la calificación promedio total? Asuma α=0.05.
11. Se dice que cierta bebida contiene un 4% de alcohol con una desviación estándar de 0.07%. Se toma una muestra de 25 botellas y se encontró que el contenido medio de alcohol es de 4.2%. El resultado de esta muestra confirma lo que se dice? Asuma un nivel de confianza del 95%. 12. Una fábrica sostiene que las cuerdas que producen tiene resistencia media a la rotura de 6500 libras. Un cliente de la fábrica tomó una muestra al azar de nueve cuerdas y encontró que la resistencia media a la rotura era de 6200 libras con una varianza de 3600 libras. ¿Tendrá que aceptar el cliente lo que la compañía dice? Suponga la normalidad de la población y aleatoriedad de la muestra. 13. Una compañía afirma que la resistencia a la rotura de sus maletas plásticas es de un promedio mayor a las 300 libras. Se toma una muestra aleatoria de 9 maletines se encuentra que el promedio de resistencia a la rotura es: 280, 290, 292, 300, 305, 295, 290, 310, 305. Verificar la afirmación de la compañía. Suponga que sus resistencias a la rotura están normalmente distribuidas α=0.05. 14. Si el 70% o más de los ladrillos viejos depositados en un corralón de materiales se ajustan a ciertas especificaciones, será lucrativo contratar peones para clasificarlos. Se examina una muestra aleatoria de 100 ladrillos, hallándose que 60 cumplen con las condiciones fijadas. ¿Contrataría UD. A los peones para hacerle la clasificación? 15. Si una tabla de contingencia tiene tres filas y cuatro columnas, ¿cuántos grados de libertad hay para la prueba de independencia de X2? 16. Al realizar una prueba de independencia de X 2 en una tabla de contingencia con r filas y c columnas, determine el valor crítico del estadístico de prueba X 2 de la cola superior en cada una de las circunstancias siguientes: a. a=0.05, r=4 filas, c=5 columnas. b. a=0.01, r=4 filas, c=5 columnas. c. a=0.01, r=4 filas, c=6 columnas. d. a=0.01, r=3 filas, c=6 columnas. e. a=0.01, r=6 filas, c=3 columnas.
MÉTODOS ESTADÍSTICOS
- 75 -
Prof. Luis Alberto Rubio Jácobo