UNIVERSIDAD CATOLICA DE HONDURAS NUESTRA SEÑORA DE LA PAZ CAMPUS DE SAN PEDRO Y SAN PABLO ESTADISTICA I
Lic. Carlos a. Ávila
Importancia de la Estadística: Estadística : El análisis estadístico permite la toma de decisiones en diversas áreas como ser la formulación de políticas económicas por parte de algún gobierno, las tasas tributarias, programas sociales, gastos en presupuesto, la búsqueda de rentabilidad, control de calidad, minimización de costos, combinación de productos e inventarios, el éxito de un nuevo producto, evaluación de oportunidades de inversión, la efectividad de un nuevo medicamento, etc. Oportunidades que ofrece la Estadística : Como la Estadística tiene aplicación universal, esta persigue dos objetivos primordiales: A. Tomar decisiones B. Solucionar problemas Ramas de la Estadística: Estadística : 1. Estadística Descriptiva: Es una evaluación del comportamiento de los valores de una variable o característica. Para realizar dicha evaluación, el experto se ayuda de graficas, tablas y diagramas para mostrar los datos y así facilitar facili tar su comprensión. 2. Estadística Inferencial : Se usa, para realizar comparaciones con datos históricos y bajo una determinada tendencia, tratar de predecir lo que podría suceder más adelante. 3. Teoría de decisiones: Los métodos y las técnicas de la inferencia estadística son usadas por los administradores para tomar decisiones en situaciones de incertidumbre. (Significa no saber con precisión que ocurrirá más adelante, pero además significa anticiparse y prepararse a lo que podría suceder más adelante). Definiciones Básicas: Básicas :
Datos: Son colecciones de cualquier cantidad de observaciones relacionadas a una característica que se denomina Variable. A una colección de datos se le conoce como Conjunto de Datos.
Asignatura: ESTADISTICA ESTADISTICA I
UNIVERSIDAD UNIVERSIDAD CATOLICA DE HONDURAS
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Página 1
Población: Es el conjunto completo o total de los individuos, objetos o medidas que poseen alguna característica común observable. Es la recolección completa de todas las observaciones de interés que el investigador desea estudiar y que por lo general suele ser inaccesible. Generalmente las poblaciones pueden ser finitas o finitas o infinitas. infinitas.
Parámetro: Parámetro: Es toda medida que describa una población. Ej. El ingreso promedio de los asalariados en Honduras, la producción total de todas las maquilas. El parámetro describe una población.
Muestra: Es una colección de algunos elementos o datos de una Población, pero no de toda la población. Es un subconjunto o parte de la población, que lleva implícita todas las características del universo. Ej.: Para determinar el sabor de una sopa no necesita comerse toda la olla, solo basta con comerse un plato. Una muestra contiene relativamente las características principales de una población.
Muestra Aleatoria: Aleatoria : Muestra elegida independientemente de todas las demás, con la misma probabilidad que cualquier otra, y cuyos elementos están elegidos independientemente unos de otros con la misma probabilidad. Nota: Nota: Estudiar en base a una muestra es más sencillo que basar un estudio con una Población completa por las siguientes razones: a. Ahorra tiempo. tiempo . Estudiar a menos individuos es evidente que lleva l leva menos tiempo. b. A consecuencia del punto anterior, se ahorran costos. costos. c. Estudiar la totalidad de individuos con una característica determinada en muchas ocasiones puede ser una tarea inaccesible o imposible de realizar. d. Aumenta la calidad del estudio . Al disponer de más tiempo y recursos, las observaciones y mediciones realizadas a un reducido número de individuos pueden ser más exactas y plurales que si se tuviese en realidad que realizar a una población.
Estadístico: Estadístico: Es una medida descriptiva de una muestra. El Estadístico es a la muestra lo que el Parámetro es a la población. Además se puede definir como el elemento que describe una muestra y sirve como una estimación del parámetro de la población correspondiente.
Muestra Representativa : Contiene las mismas características relevantes de la población en la misma proporción en que están incluidas en tal población.
Asignatura: ESTADISTICA ESTADISTICA I
UNIVERSIDAD UNIVERSIDAD CATOLICA DE HONDURAS
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Página 2
Variable: Es cualquier rasgo o característica de la muestra o población que se observa, que pueda medirse o clasificarse. Ej.: Edad, Sexo, Estado Civil, Peso, Grado de Motivación, Temperatura, Partidos Políticos. Tipos de Variable : Las variables se clasifican en dos grupos generales: a) Cualitativas: Cualitativas: Estas variables normalmente se miden por atributos. Ej.: La variable Sexo puede tener dos posibles resultados en su escala, Masculino o Femenino. Dentro de las variables cualitativas tenemos:
Variables Nominales: Nominales : Los resultados de estas características se registran dentro de categorías o clases desordenadas. Ej.: Una muestra de personas puede agruparse según su tipo de sangre, de manera que: 1----- A 1----- O 2----- B 2----- A 3----- AB 3----- B 4----- O 4----- AB El orden o las secuencias no tienen relevancia alguna, solo pueden enlistarse. Ej. Marcas de Vehículos, preferencia religiosa, color de cabello y raza de una persona. Variables Ordinales: Ordinales : Al igual que las nominales, estas clasifican sus resultados dentro de clases o categorías, solo que de forma ordenada. El orden entre categorías es relevante. Ej.: Los daños en general se pueden clasificar por su grado de gravedad: 1----- Fatal 5----- Sobresaliente 2----- Severo 4----- Muy bueno 3----- Daño moderado 3----- Bueno 4----- Daño menor 2----- No satisfactorio Nota: Nota: El orden de las categorías puede ser Ascendente o Descendente. En estas variables la magnitud no es relevante. b)
Cuantitativas: Cuantitativas: Estas variables se miden en base a números o cifras. Ej.: Una muestra de 100 personas puede ser clasificada por su Peso (en libras), Un periodo de 30 días puede ser medido por su Temperatura (en grados centígrados). Las variables cuantitativas se clasifican en:
Variables Discretas: Discretas: Se refieren a que las características tienen una cantidad finita de resultados. Estos resultados generalmente se restringen a valores enteros. Ej.: cantidad de veces que una mujer da a luz, número de camas disponibles en un hospital, numero de autos vendidos por una compañía, numero de estudiantes en una clase, etc. Asignatura: ESTADISTICA ESTADISTICA I
UNIVERSIDAD UNIVERSIDAD CATOLICA DE HONDURAS
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Página 3
Variables Continuas: Continuas : Aquí los datos o resultados de una característica no precisamente se restringen a ciertos valores específicos (admite tanto valores enteros como fraccionarios). Una variable de este tipo puede tomar cualquier valor entre dos valores dados. Ej .: El tiempo (horas, minutos, segundos), el nivel de colesterol en la l a sangre, la temperatura, peso, talla de ropa, etc. Nota: Nota: Una regla práctica para distinguir una variable discreta de una continua es: “Si los datos son el resultado de medir, medir, son variables continuas, y si los datos son el resultado de contar, son discretas. discretas. c)
Variables de clasificación de Rango: Rango : De una característica central se puede desglosar características más específicas. Estas observaciones pueden ordenarse de mayor a menor de acuerdo a su magnitud y después asignarle números para determinar secuencias correspondientes a su lugar en la lista. Ej.: “Principales problemas sociales que aquejan a Honduras ”: Rango Problema Total 1 Desempleo 2750 2 Inseguridad 1845 3 Problemas económicos 1270 4 Falta de vivienda 850 5 Poca calidad educativa 785
n = 7500 “Principales causas de muerte natural en Honduras en 2008 ”
1 2 3 4 5
Enfermedades del Corazón 12365 Diversos tipos de cáncer 10350 Enfermedades cerebro vasculares 7650 Neumonía 3820 SIDA 2815
n = 37000 La importancia del muestreo: muestreo : Gran parte del trabajo en Estadística se realiza en base a muestras. Las muestras son necesarias debido a que con frecuencia las poblaciones son demasiado grandes para ser estudiadas en su totalidad. Por su demanda de Costo y Tiempo excesivo, lo primordial es seleccionar una muestra de la población, calcular el estadístico de la muestra, y utilizar este resultado para estimar el parámetro correspondiente de la población. Asignatura: ESTADISTICA ESTADISTICA I
UNIVERSIDAD UNIVERSIDAD CATOLICA DE HONDURAS
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Página 4
La exactitud es vital en toda estimación. Esto depende en gran parte de la forma como se tomo la muestra. Sin embargo, frecuentemente se comprueba que la muestra no es del todo representativa de la población, lo cual provocara un error de muestreo. Un error de muestreo es la diferencia entre el parámetro desconocido de la población y el estadístico de la muestra utilizado para calcular el parámetro. Un error de muestreo puede presentarse por dos razones: 1) El azar en el proceso de muestreo : es posible seleccionar elementos de muestra atípicos que no representan a la población. 2) El Sesgo muestral: este ocurre cuando hay una tendencia a seleccionar determinados elementos de muestra en lugar de otros. Ej. En una encuesta a mujeres, tener una tendencia a seleccionar mujeres casadas por sobre las solteras. Funciones Primordiales de la Estadística: Recolección de los datos Organización de los datos Presentación de los datos Análisis de los datos Interpretación de los datos
1. Clasifique cada variable de acuerdo a su tipo y ejemplifique cada uno: a. Ciudad b. Calidad de producto c. Distancia recorrida d. Ingreso salarial e. Temperatura ambiente f. Magnitud de un desastre natural g. Puntaje en un examen de Estadística h. Estado civil de una persona i. Religión j. Sexo k. Raza l. Color de cabello m. Estatura n. Compra de alimentos o. Número de vehículos producidos p. Número de estudiantes inscritos en la UNICAH q. Edad Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Página 5
r. Preferencia política s. Profesión t. Marcas de gaseosas u. Área de un terreno v. Perímetro de una zona w. Volumen de un objeto x. Número de goles anotados por un equipo y. Peso de una caja de cereal z. Numero de amigos en Facebook aa. Clasificación de los hoteles bb. Calificación de un Banco cc. Tiempo de llegada a la universidad dd. Duración de una batería ee. Precio de un paquete de harina ff. Marcas de ropa gg. Tipos de Empresa hh. Grado de motivación ii. Cantidad de miembros de una familia jj. Número de camas en una clínica kk. Número de partos en una mujer ll. Numero de Identidad mm. Cantidad de pasajeros en una aerolínea nn. Problemas más graves de Honduras oo. Principales causas de decesos en el país pp. Modos de transporte qq. Intensidad de un huracán rr. Color de los ojos ss. Talla de Zapato tt. Duración de una película uu. Domicilio vv. Tipos de empresa de acuerdo al tamaño ww. Tipos de película cinematográfica xx. Numero de operarios en una maquila yy. Promedio de una asignatura zz. Deuda de una tarjeta de crédito aaa. Tipos de Fruta bbb. Numero de planetas en el sistema solar ccc. Cantidad de Remesas recibidas Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Página 6
ddd. Desempeño laboral de un empleado eee. Departamentos de un país fff. Grado de instrucción educativa ggg. Grado militar hhh. Jerarquía familiar 2. Genere 15 variables diferentes a las del listado anterior. Agregue el respectivo ejemplo para cada una.
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Página 7
Arreglo de Datos : A partir de datos sin procesar, el ordenamiento de datos tiene sus ventajas: a. Ordenados de forma ascendente o descendente, permite notar rápidamente los valores mayor y menor de los datos. b. Permite dividir los datos en secciones. c. Permite ver si los valores aparecen más de una vez en el ordenamiento. d. Permite observar la distancia entre valores sucesivos de los datos.
A. Distribuciones o Tablas de Frecuencias : Es la forma más común de organizar los datos en categorías o clases parciales y luego contar el numero de observaciones que quedan dentro de cada categoría. Las tablas de frecuencia (también conocida como Tabla Estadística) pueden organizar datos de solo una variable a la vez. Esto se realiza debido a que cuando la cantidad de datos o elementos a analizar es demasiado grande, este análisis se vuelve extenuante y monótono. Características de las Distribuciones de Frecuencias:
1. Las clases o categorías son completamente inclusivas pues todos los datos de una muestra caen en una u otra categoría. 2. Las clases son mutuamente inclusivas ya que ningún dato cae en más de una categoría. 3. Cada clase tiene un límite superior (LS) y un límite inferior (LI). Estos límites se pueden convertir por conveniencia, en limites reales superiores (LRS) y limites reales inferiores (LRI). 4. Los Estadísticos toman como un estándar el hecho de que en una distribución de Frecuencias, el número de clases este en un rango de entre 5 a 15 clases. (5< # clases <15) 5. Existe una fórmula para determinar el número de intervalos aproximados a usar. A partir de n muestras, el # de clases se obtiene a partir de la formula:
2c ≥ n C ≥ Log n Log 2
6. Para crear un arreglo de datos es “preferible” que la cantidad de datos obtenidos sea mayor o igual a 30. Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Página 8
7. Las categorías deben tener la misma amplitud. 8. Las clases jamás pueden traslaparse. Debe conocerse exactamente donde comienzan y donde terminan. 9. Existen clases abiertas cuando se usan “menos de” o “mas de”, para reducir el número de clases porque existe valores mucho menores o mucho mayores que el resto de datos. Elementos importantes de una Tabla Estadística o Distribución de Frecuencias:
a. Límites Reales Inferiores y Superiores (LRI y LRS): Se calculan a partir de los límites inferiores y superiores normales. Se realiza para que cualquier tabla o distribución quede mejor estructurada. Se encuentra a través de un promedio entre el límite inferior de una clase y el límite superior de la clase anterior o por arriba de ella. b. Frecuencia Absoluta (Fabs) : Es el número de datos que se encuentra presente en cada intervalo o clase. c. Ancho del intervalo (W) : Diferencia entre dos límites sucesivos de clase ya sean superiores o inferiores y también puede ser la diferencia entre dos puntos medios sucesivos (marca de clase). El ancho de que tendrá cada clase se puede definir a través de la siguiente fórmula: Anchura del intervalo (W) = Valor unitario siguiente Valor mas después del valor más __ pequeño de grande de los datos los datos _______________________________________ Número total de clases (C) d. Frecuencia Relativa (Fr) : Es el porcentaje que representa cada frecuencia del número total de datos. Fr = (Fabs/n)*100. e. Marca de Clase (Xm) : Es el punto medio entre los límites superior e inferior de un intervalo o clase. Xm = (LS + LI)/2. f. Frecuencia Acumulada (Fac) : De un intervalo es el número total de observaciones entre cada clase y todas las anteriores a esta. Es la suma sucesiva (en grada) de la frecuencia absoluta de una clase y las frecuencias absolutas de las clases anteriores. Fac = ∑ sucesiva de Fabs
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Página 9
g. Frecuencia Relativa Acumulada (Frac) : De un intervalo es el porcentaje del número total de observaciones con un valor menor o igual al límite superior del intervalo. También, es la suma sucesiva de la frecuencia relativa de una clase y las frecuencias relativas de las clases anteriores. Frac = ∑ sucesiva de Fr
Frac = (Fac/n)*100 B. Tablas de CONTINGENCIA: A diferencia de las tablas de frecuencia, las tablas de contingencia permiten examinar y comparar dos o más variables al mismo tiempo.
1. Un conjunto de datos contiene 60 observaciones, la más grande de 679 y la más pequeña de 140. a. ¿Cuántas clases debería tener la tabla de frecuencias? b. ¿Cuál sería la anchura del intervalo correspondiente? c. ¿Cuáles son los límites y puntos medios de cada clase? 2. En un estudio reciente sobre 580 graduados de administración de negocios, el salario inicial más alto que se reporto fue de L. 42,499 lempiras y el más bajo fue de L. 14,800 lempiras. Usted desea crear la tabla de frecuencias para analizar y comparar estos datos con las ofertas de trabajo que usted ha recibido. a. ¿Cuántas clases pondrá en su tabla de frecuencia? b. ¿Cuál es el intervalo de clase? c. ¿Cuáles son los límites y puntos medios de cada clase? 3. Los siguientes datos representan el número de pasajeros que reporta la aerolínea TACA de los últimos 58 vuelos. Los datos son los siguientes: 58 89 45 67 54 110 64 76 65 45 49 93 79 56 71 85 87 77 74 98 69 79 81 86 62 56 88 69 79 48 71 54 69 62 86 90 65 79 46 77 106 115 55 75 62 73 66 57 73 64 69 101 50 90 70 74 61 73 Desarrolle una tabla de distribución de frecuencias completa. Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 10
Lic. Carlos A. Ávila (MAE Administración de Empresas)
4. Los siguientes resultados sobresalen a partir de un estudio sobre el número de horas que pasan conectados a internet, algunos usuarios seleccionados al azar por semana: 23.6 31.9 12.1 10.3 20.8 42.0 24.0 15.2 19.1 11.6 34.3 42.4 60.0 30.5 31.8 22.4 13.2 10.4 17.2 35.4 56.0 13.0 42.5 31.8 38.5 23.8 44.2 50.8 16.5 52.3 34.2 42.6 14.1 22.4 48.2 29.6 64.3 75.0 32.0 15.2 26.9 41.3 53.7 32.4 13.8 25.1 43.2 39.7 67.2 23.8 40.6 23.7 67.0 54.0 49.8 23.9 36.3 45.4 33.2 20.9 14.7 53.1 Construya una tabla de distribución de frecuencias. 5. El departamento de tránsito a través de sus agentes, ha reportado el número de licencias que se han decomisado en San Pedro Sula, por faltas graves en los últimos 5 años: 125 157 113 127 201 165 145 119 148 158 148 168 117 105 136 136 125 148 108 178 179 191 225 204 104 205 197 119 209 157 209 205 221 178 247 235 217 222 224 187 265 148 165 228 239 245 152 148 115 150 265 190 135 180 120 Desarrolle una tabla de distribución de frecuencias completa. 6. A continuación se presentan los datos de 39 personas que llegaron a una entrevista de trabajo, de acuerdo a su tipo de sangre: A B A O AB O B O A O O AB B A O A O B AB O O A B O O B A O B A B O O AB A AB O A O Desarrolle una tabla de distribución de frecuencias. 7. Un dueño de auto lote, tiene registrados los automóviles que ha vendido en los últimos 6 meses. Aquí detallamos los datos: Nombre Marca y Modelo Nombre Marca y Modelo a. Roberto p. Alejandra Isuzu KB ‘99 Hyundai Accent ’00 b. Estela Kia Sorento ’04 q. Ramiro Toyota Corolla ‘06 Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 11
Lic. Carlos A. Ávila (MAE Administración de Empresas)
c. Antonio r. Romeo Kia Spectra ‘02 Hyundai Elantra ‘02 d. Benjamín Isuzu Rodeo ’98 s. Fernanda Toyota RAV4 ‘03 e. Daniel t. Armando Isuzu Dmax ’07 Hyundai SantaFe ‘04 f. Edgardo u. Rocío Toyota Camry ’08 Kia Sephia ‘00 g. José v. Carlos Toyota 3.0 ’07 Toyota Yaris ‘02 h. Esther w. Oscar Hyundai Veracruz ’05 Toyota Corolla ‘97 i. Oswaldo x. Lorena Isuzu Rodeo ’02 Hyundai Tiburón ‘98 j. Javier y. Iván Toyota Echo ’03 Kia Rio ‘00 k. Pedro z. Waleska Isuzu Dmax ’07 Toyota Prado ‘08 l. Nelson aa. Sandra Hyundai H100 ‘00 Kia Sportage ’01 m. Mario bb. Ricardo Kia Sorento ’06 Toyota Corona ‘04 n. Juan cc. Carolina Toyota Tundra ’08 Toyota Pickup ‘98 o. Vanessa dd. Cristian Isuzu KB ’98 Kia Spectra ‘05 Desarrolle una tabla de contingencia completa con las variables Sexo y Marca.
8. El director de transporte noroccidental de SOPTRAVI está muy preocupado por la velocidad a la que los conductores manejan en un tramo de carretera principal. Los datos de la velocidad de 48 conductores expresada en mph son los siguientes: 15 32 45 46 42 39 68 47 18 31 48 59 56 42 39 48 69 61 44 42 38 52 55 58 62 48 53 56 58 48 47 52 37 64 29 55 38 29 62 49 69 18 61 55 49 70 81 50 El Departamento de transporte ha determinado que la velocidad más segura para esta carretera es más de 39 y menos de 56 mph. ¿Qué proporción de conductores maneja dentro de este intervalo? 9. En una población bajo estudio existen 5,600 mujeres y 14,400 hombres. Si se decide seleccionar una muestra de solo 550 individuos de esta población, ¿Cuántos deberán ser mujeres y cuantos deberán ser hombres para que esta muestra sea considerada estrictamente representativa? 10. Si los siguientes grupos de edad son incluidos en las proporciones indicadas, ¿Cuántos individuos de cada grupo de edad deben incluirse en una muestra de 2800 personas para que esta sea representativa? 12 – 17 18 – 23 24 – 29 30 – 35 36 + Grupo de edad 0.17 0.31 0.26 0.21 0.05 Proporción relativa
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 12
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Para efectos de representación la mayoría de graficas se usaran en dos dimensiones (dos ejes). El eje horizontal muestra los valores de la variable (la característica que se está midiendo). El eje vertical indica o representa las frecuencias absolutas, relativas o acumuladas según sea el caso. La utilidad de los gráficos es doble . En primer lugar, sustituir a las tablas estadísticas, y segundo, constituir por si mismos una poderosa herramienta para el análisis de los datos, siendo en la mayoría de ocasiones el medio más efectivo no solo para describir y resumir la información, sino también para analizarla. El propósito de un grafico es ayudar a la comprensión y comunicación de la evidencia aportada por los datos respecto a una hipótesis en estudio. Gráficos para distribuciones de variables Continuas:
a) Histogramas: Consiste en una serie de rectángulos, cuyo ancho es proporcional a la anchura de intervalo (limites superior e inferior de cada clase) de los datos que se encuentran dentro de una clase y cuya altura es proporcional al número de elementos que caen dentro de cada clase. Describe una distribución de frecuencias discretas o continúas. Un Histograma puede ser de frecuencias absolutas o relativas. Ventajas del Histograma:
1. 2.
Los rectángulos muestran cada clase de la distribución por separado. El área de cada rectángulo, en relación con el resto, muestra la proporción del número total de observaciones que se encuentran en esa clase.
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 13
Lic. Carlos A. Ávila (MAE Administración de Empresas)
b) Polígonos de Frecuencias: Es muy parecido al Histograma en varios aspectos. Esta grafica emplea los mismos ejes que el Histograma. Se construye a partir del punto medio de cada clase (marca de clase). La altura de los rectángulos es directamente relacionada a la frecuencia absoluta o relativa de cada clase. Luego se unen los puntos relacionados (marca de clase con su frecuencia correspondiente) con una línea recta para formar el polígono. Para completar la grafica es necesario agregar dos clases, una en cada extremo, que contienen cero observaciones para que el polígono alcance el eje horizontal en ambos extremos. Ventajas de los Polígonos de Frecuencia:
1. Son más sencillos que el Histograma. 2. Traza con claridad el patrón de los datos. 3. El polígono se vuelve cada vez más liso y parecido a una curva conforme se aumenta el número de clases y de observaciones.
c) Ojivas: También se les conoce como Polígonos de Frecuencia Acumulada (También puede construirse a partir de frecuencias relativas acumuladas). Esta grafica se construye a partir de una distribución de frecuencias acumuladas “menor que ” y “mayor que”. Las clases se forman a partir del Limite Real Inferior de cada intervalo. Esta grafica nos permite obtener Deciles, Cuartiles y Percentiles (Valores de posición). Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 14
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Gráficos para distribuciones de variables Discretas:
d) Diagrama de Barra: Constituye un tipo popular de graficas para presentar distribuciones de frecuencia de variables nominales u ordinales. En el diagrama, las diferentes categorías de las observaciones se presentan a lo largo de un eje horizontal. Se dibuja una barra vertical sobre cada categoría de forma que la altura de la barra represente la frecuencia o la frecuencia relativa de las observaciones de cada clase. Las barras deben de ser de igual amplitud y estar separadas de forma que no se perciba continuidad.
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 15
Lic. Carlos A. Ávila (MAE Administración de Empresas)
e) Diagrama Circular : Esta grafica es de especial utilidad para mostrar proporciones (porcentajes) relativas de una variable. Este grafico se construye en un círculo, que tiene como medida 360 grados. La grafica representa una superficie o área, mas no un volumen. Los ángulos se grafican en sentido contrario a las manecillas del reloj y en cada sector circular generado se escribe el valor de la frecuencia y el nombre de su categoría correspondiente.
f) Grafico con líneas: Se usa cuando los datos se relacionan entre sí, es decir, cuando
existe cierta continuidad entre las observaciones, como por ejemplo, el crecimiento poblacional, la evolución del peso o estatura de una persona a través del tiempo, los ingresos o egresos de una empresa medido por días o semana, las variaciones presentadas en la medición realizada en algún experimento cada segundo o minuto. La grafica de líneas consiste en una serie de puntos trazados en las intersecciones de las marcas de clase y las frecuencias de cada una, uniéndose consecutivamente con líneas. Además, es posible presentar varias series de observaciones en un mismo grafico para así realizar análisis de información.
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 16
Lic. Carlos A. Ávila (MAE Administración de Empresas)
1. Construya para los ejercicios 3 y 5 de la sección 2: a. Histograma b. Polígono de Frecuencia c. Ojiva “Menor Que” 2. Para el ejercicios 6 de la sección 2, construya: a. Diagrama de Barras b. Diagrama Circular 3. En el siguiente reporte se muestran las muertes por lesiones de 150 niños de entre 5 a 9 años de edad en EUA (2005 – 2010). Causa
No. de muertes
Homicidios 11 Ahogamiento 21 Insolación 42 Incendios 18 Accidentes 15 Otros 13 Construya: a) Grafico de Barras b) Grafico circular.
4. IHADFA ha generado un estudio sobre el consumo anual de cerveza por botella (en millones) en HONDURAS. 2004 2005 2006 2007 2008 2009 2010 Año 290 570 420 600 540 690 Consumo 250 Construya un grafico de barra y un grafico de línea. 5. Según información del departamento de Migración, el numero de deportados que se han reportado en los últimos 6 años es: 2005 2006 2007 2008 2009 2010 Año 5358 6632 7849 7221 9388 11297 Casos
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 17
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Por lo general las distribuciones de frecuencia nos indican ciertas tendencias y patrones en los datos. Para describir completamente estas tendencias se requieren medidas más precisas. Estas medidas conforman una serie de números que se conocen como Estadística Sumaria, para así describir las características del conjunto de datos. Las características antes especificadas pueden ser: A. TENDENCIA CENTRAL: Se refiere al punto medio de una distribución. A estas medidas se le conocen también como medidas de posición. Estas medidas ubican e identifican el punto alrededor del cual se centran los datos. B. DISPERSION : Se refiere a la extensión de los datos en una distribución, es decir, el grado en que las observaciones se distribuyen. Las medidas de dispersión indican el punto hasta el cual las observaciones individuales se esparcen alrededor del punto central. Miden la dispersión o la variabilidad de los datos y reflejan la tendencia de las observaciones individuales a desviarse de dicho punto central. C. SESGO: Esta relacionado a las curvas que representan los puntos de un conjunto de datos, que pueden ser simétricas o sesgadas. Las curvas simétricas tienen una forma tal que una línea vertical que pase por el punto más alto de la curva, dividirá el área de esta en dos partes iguales. Las curvas son sesgadas cuando los valores de una distribución de frecuencias están concentrados en el extremo inferior o en el superior de la escala de medición del eje horizontal. Los valores no se encuentran igualmente distribuidos. D. CURTOSIS: Se refiere al grado de agudeza de una curva. Dos curvas pueden tener la misma tendencia central, la misma dispersión, y ser ambas simétricas. Pero una de las curvas tendrá un pico de grafica más agudo que el otro. Las medidas de Tendencia Central y de Dispersión se pueden calcular a partir de datos Agrupados y datos No Agrupados.
MEDIDAS DE TENDENCIA CENTRAL (DATOS NO AGRUPADOS) La Media Aritmética: es la medida de tendencia central a la cual se le considera como un simple promedio aritmético.
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 18
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Ventajas: 1. Es una medida familiar para la mayoría y es intuitivamente claro. 2. Cada conjunto de datos posee una y solo una media. 3. Es útil para llevar a cabo procedimientos estadísticos como la comparación de medias de varios conjuntos de datos. 4. La media puede calcularse aun cuando la serie de datos no esté ordenada. Desventajas: 1. Aunque la media es confiable en el sentido de que toma en cuenta todos los valores del conjunto de datos, puede verse afectada por valores extremos que no son representativos del resto de los datos. 2. Cuando el conjunto de datos es muy extenso (por decir 200 datos), resulta extremadamente tedioso calcular la media. En ese caso se tendría que usar el método de datos agrupados. 3. Es imposible calcular la media a partir de clases con un extremo abierto, ya sea en el inferior o superior de la escala.
Para datos No Agrupados se calcula de la siguiente forma:
µ = ∑X (Media para Población) N
ẋ=
∑x (Media para muestra)
n
La Mediana:
Es llamada también como la media posicional, porque queda exactamente en la mitad del conjunto de datos, después de que las observaciones se han colocado en serie ordenada. La mitad de las observaciones estará a la izquierda de la mediana y la otra mitad estará a la derecha de la mediana.
Ventajas: 1. Los valores extremos de una serie ordenada de datos no afectan tan intensamente a la mediana así como afecta a la media aritmética. 2. La mediana es fácil de entender y se puede calcular a partir de cualquier tipo de datos, incluido en clases con extremo abierto. 3. Es posible encontrar la mediana a partir de descripciones cualitativas en lugar de números. Desventajas: 1. Como la mediana es una posición promedio, para poder calcularla, la serie de datos debe estar totalmente ordenada a diferencia de la media que no lo necesita. Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 19
Lic. Carlos A. Ávila (MAE Administración de Empresas)
2. Ciertos procedimientos estadísticos que utilizan la mediana, son más complejos que aquellos que utilizan la media. 3. Cuando la serie de datos es extensa, se consume tiempo en demasía para calcular la mediana. NOTA: Si se desea utilizar una estadística de muestra para estimar un parámetro de población, es preferible usar la media aritmética, en lugar de la mediana.
Para datos No Agrupados se calcula de la siguiente forma:
a) Se obtiene la POSICION donde está ubicada la mediana. Mediana X = (n+1) / 2 (Posición de la mediana) b) Se define el VALOR de la mediana a través de la posición.
Si el conjunto de datos contiene: Un número par de elementos, la mediana es el promedio de los dos elementos de en medio. Un número impar de elementos, la mediana es el valor que está en medio del arreglo de datos (Posición exacta).
La Moda:
Es una medida de tendencia central diferente de la media, pero un tanto parecida a la mediana, pues en realidad no se calcula a partir de un proceso aritmético ordinario. La moda es el valor que más se repite en una serie de datos. Es la observación que se presenta con mayor frecuencia. La moda rara vez se usa como medida de cálculo para sacar conclusiones en datos no agrupados. Preferiblemente debe usarse para datos agrupados. Es importante destacar que así como una serie de datos normalmente una moda, también que no tenga ninguna o que tenga más de una moda.
Ventajas: 1. La moda, al igual que la mediana, se puede utilizar como una posición central para datos tanto cuantitativos como cualitativos. 2. Al igual que la mediana, la moda no se ve mayormente afectada por los valores extremos. 3. La moda se puede calcular incluso a partir de clases con extremo abierto.
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 20
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Desventajas: 1. La moda es la medida de tendencia central menos utilizada. 2. Cuando los conjuntos de datos contienen más de una moda, estas resultan más difíciles de interpretar y comparar. : 1. Los talleres de servicio del grupo Q, registran el numero de autos revisados el mes anterior por cada una de sus 25 sucursales de la forma siguiente: 823 648 321 634 752 669 427 555 904 586 722 360 468 847 641 217 588 349 308 766 634 480 590 805 720 La compañía tiene la creencia de que una sucursal no puede mantenerse con menos de 390 servicios mensuales. Es también política de la compañía otorgar una bonificación económica al gerente de la sucursal que genere más de 695 servicios mensuales. a. ¿Ordene los datos de la tabla e indique cuantas sucursales no pueden mantenerse y cuantas recibirán bonificación? b. Obtenga las medidas de Tendencia Central: Media, Moda y Mediana. c. Destaque dos conclusiones con los datos encontrados anteriormente. 2. El administrador de un hospital privado ordeno un estudio del tiempo que un paciente tiene que esperar antes de ser tratado por el personal de urgencias. Los datos que presentamos a continuación fueron tomados durante un día normal: Tiempo de espera (en minutos): 12 16 21 20 24 3 11 17 29 18 26 4 7 14 25 3 27 15 6 5 13 9 8 21 A partir de estos datos encuentre los valores de medidas de tendencia central. 3. Una fábrica hizo un muestreo del numero de ausencias de los trabajadores por semana, obteniendo los resultados siguientes: 4 12 8 14 11 6 7 13 11 13 11 20 5 19 10 15 24 7 29 6 13 9 a. Encuentre las medidas de tendencia central. b. La junta directiva de la fábrica define que si el promedio de ausencias es de al menos 8 días, entonces debería tomar medidas drásticas. ¿Sera esto necesario? Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 21
Lic. Carlos A. Ávila (MAE Administración de Empresas)
4. La UNICAH tiene registrados el número de estudiantes de primer ingreso que se matriculan por trimestre durante los últimos 6 años: 350 275 180 315 228 145 250 160 210 125 380 220 415 335 295 245 190 278 Calcule las medidas de Tendencia central. La administración de la universidad no ha tenido necesidad de poner publicidad pues asumen que con un promedio de 350 estudiantes de primer ingreso por periodo se considera muy aceptable. ¿Es correcta la información? 5. Un médico general recibe pacientes de todas las edades, en su clínica privada, en el que cobra precios módicos por cada consulta. Se presentan las edades de los pacientes que ha atendido la última semana: 10 25 50 4 12 24 12 31 24 36 66 55 42 48 27 19 23 44 30 Calcule las Medidas de tendencia central. 6. Una fabrica realiza un estudio sobre el numero de fallas por día que una maquina ensambladora presenta, en el depto. de producción. El gerente de la empresa decide que si el numero de fallas es de 10 o más, reemplazara la maquina: 14 5 9 10 9 12 7 12 13 7 8 6 11 5 4 7 9 13 11 a. ¿Sera necesario reemplazar la maquina? b. Encuentre la Moda y la Mediana. 7. Un fabricante de cosméticos adquirió una máquina para llenar de botellas de perfume de 3 ml. Para probar la precisión del volumen que deposita la maquina en cada botella, se hizo una corrida de prueba con 18 recipientes. Los volúmenes resultantes (en ml) de la prueba fueron los siguientes: 3.02 2.89 2.92 2.84 2.90 2.97 2.95 2.94 2.93 3.01 2.97 2.95 2.90 2.94 2.96 2.99 3.03 2.97 a. La compañía no está dispuesta a recalibrar la maquina a menos que el volumen de llenado este 0.04 ml por debajo de los 3 ml. ¿Deberán recalibrar? b. Encuentre la Moda y la Mediana.
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 22
Lic. Carlos A. Ávila (MAE Administración de Empresas)
La Media Ponderada o Pesada:
Nos permite calcular el promedio que toma en cuenta la importancia de cada valor respecto al total. Se calcula de la siguiente forma: Xw = ∑ (w * x)
donde w = peso asignado a cada observación
∑w
1. Un fontanero vende 5 tipos de limpiadores para desagües. A continuación se muestra la tabla con los resultados siguientes: Limpiador Utilidad por lata Volumen de ventas en latas Glunk Out L 2.25 7 Bubble Up L 3.50 9 Dream Drain L 5.75 15 Clear More L 7.50 12 Main Drain L 6.30 10 Encuentre la media correspondiente a este caso. 2. El director de planta de LACTHOSA desea comparar los salarios promedio en su planta de Honduras con los de la competencia que está ubicada en Guatemala. De los 5,930 empleados que tiene 1,212 ganan $12.30 la hora; a 650 les paga $15.50; 3098 ganan $23.50 y al resto se les paga $17.12. De los 5,364 empleados que laboran en la otra planta 1,654 ganan $12.75; 815 ganan $17.80 y los demás $20.10. Saque sus propias conclusiones. 3. Los miembros de un club deben pagar cuotas con base en su precio promedio. De los 80 miembros, 18 pesaron 110 libras, 23 pesaron 130 libras, 22 hicieron girar la balanza hasta 150 libras y el resto pesaron 180 libras. Si los miembros deben pagar L. 60.00 por cada libra que pesan en promedio. ¿Cuánto debe desembolsar cada miembro? 4. Un profesor decide utilizar un promedio pesado para obtener las calificaciones finales de los estudiantes que acuden a la clase que imparte. El promedio de tareas tendrá un valor de 10% de la calificación final, el examen semestral valdrá 20% de la nota final, el examen final, 30%; el proyecto semestral 25%, y los exámenes parciales Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 23
Lic. Carlos A. Ávila (MAE Administración de Empresas)
15%. A partir de los datos siguientes, calcule el promedio final para cinco estudiantes del seminario. Estudiante Tareas Ex. Parciales Proyecto Ex. Semestral Ex. Final 1 85 89 94 87 90 2 78 84 88 91 92 3 94 86 93 86 89 4 82 79 88 84 93 5 95 90 92 82 88 5. Un despacho de asesoría financiera y administrativa, tiene 4 tipos de profesionistas entre su personal: asesores financieros, asociados principales, personal de campo, y personal de oficina. Las tasas promedio que se cobran a los clientes por el desempeño da cada una de estas categorías profesionales son $75/hora, $55/hora, $40/hora y $25/hora, respectivamente. Los registros de la firma indican el siguiente número de horas cobradas el año anterior en cada categoría: 8,500, 13,750, 21,300, y 30,450 respectivamente. Si el despacho intenta allegarse una tasa promedio de cobro para estimar lo que se debe cobrar a los clientes en el año siguiente. ¿Cuál será la tasa promedio a cobrar? 6. La Ferretería Monterrosa vende tres tipos de cerca para casas, en San Pedro Sula. El tipo A cuesta L. 112.00 por pie de instalación, el tipo B cuesta L. 145.00 por pie, y el tipo C, el de mejor calidad cuesta L. 180.00 por pie. Ayer se vendieron 370 pies del tipo A, 250 pies del tipo B y 160 del tipo C. a. ¿Cuál fue el costo medio por pie vendido? b. ¿Cuál es el monto de la factura? 7. Mauricio Ruiz compro 35 acciones a L. 300.00 cada una, 54 acciones a L. 400.00 cada una, 96 acciones a L. 600.00 y 65 acciones a L. 700.00 cada una. a. ¿Cuál es el monto total de su inversión? b. ¿Cuál es el precio promedio por acción? 8. La siguiente tabla da el porcentaje de la fuerza laboral que está desempleada y el tamaño de la fuerza laboral en las tres ciudades más importantes de Honduras. El ministro de trabajo presenta un informe para el evento HOP. ¿Cuál sería la tasa de desempleo adecuada para presentarla como representativa del país? Ciudad % Desempleo Tamaño fuerza laboral La Ceiba 12.5 152,500 San Pedro Sula 19.8 473,800 Tegucigalpa 23.2 669,320 Asignatura: ESTADISTICA ESTADISTICA I
UNIVERSIDAD UNIVERSIDAD CATOLICA DE HONDURAS Página 24 24
Lic. Carlos A. Ávila (MAE Administración de Empresas)
9. Don Mario Flores, fabrica una pintura sellante para automóviles en San Pedro Sula. El utiliza 4 químicos diferentes en el proceso de producción. Para hacer su producto, Don Mario debe utilizar 2 galones de calcimina que cuesta L. 50 el galón, ½ galón de kalsolita a L.25 por galón, 1 galón de aglutinante que cuesta L. 15 por galón, y 3 galones de aceite secante a L. 40 por galón. Calcule el costo de un galón de sellante.
La Media Geométrica:
Proporciona una medida precisa de un cambio porcentual promedio en una serie de números. Estas cantidades tienden a cambiar en un cierto periodo de tiempo, por lo que la media geométrica busca encontrar para estas cantidades, una tasa de cambio promedio. El cálculo de la media geométrica es una forma apropiada de tomar en cuenta efectos multiplicativos, como la inflación y el interés compuesto. La media geométrica usa una variable conocida como factor de crecimiento que crecimiento que es Igual a: Tasa de interés FC = FC = 1 + 100 La fórmula para encontrar la media geométrica es: ________________________________ N
M.G. = M.G. = √ FC1 * FC2 * FC3 * FC4 *………………* FCn
1. El director ejecutivo de la compañía textilera Rio Lindo, desea determinar la tasa de crecimiento en los ingresos de la empresa en los últimos 7 años. Los resultados se presentan a continuación: Año Ingreso 2004 $48,000 2005 $56,000 2006 $70,000 2007 $65,000 2008 $74,000 2009 $69,000 2010 $69,000 El director determina que si el crecimiento promedio es menor que el promedio de mercado que es de 10%, se asumirá una nueva campaña publicitaria. Asignatura: ESTADISTICA ESTADISTICA I
UNIVERSIDAD UNIVERSIDAD CATOLICA DE HONDURAS Página 25 25
Lic. Carlos A. Ávila (MAE Administración de Empresas)
a. ¿Qué decisión tomara el director en este caso? b. Cuantos factores de “crecimiento” aparecen en el p roblema 2. El descontento de los empleados de una maquila se refleja en el número de quejas oficiales durante los últimos 8 meses: 36, 41, 37, 49, 42, 38, 40 y 28. Con base en estos datos ¿Cuál es el incremento promedio mensual en las l as quejas? 3. Una procesadora de frutas ha elevado el costo de la canasta completa en un periodo de que abarca los últimos 5 años en los siguientes porcentajes: 2006 2007 2008 2009 2010 2011 6.75% 12.5% 9% 6% 7.5% 5.25% ¿Cuál es el aumento porcentual promedio del costo de la fruta en el periodo de 5 años? 4. Luis Silva se encuentra calculando el factor de crecimiento promedio de su tienda de aparatos de sonido en los últimos seis años. Utilizando una media geométrica, llega a un resultado de 1.22. los factores de crecimiento individuales de los últimos 5 años fueron 1.19, 1.35, 1.23, 1.28 y 1.30, pero Bob perdió los registros del sexto año después de haber calculado la media. ¿Cuál era el factor de crecimiento del último año? 5. Una compañía fabricante de tableros de circuitos eléctricos, ha producido el siguiente número de unidades en los últimos 5 años: 2004 2005 2006 2007 2008 12500 13250 14310 15741 17630 Calcule el aumento porcentual promedio de unidades producidas en este periodo y utilice el resultado para estimar la producción proyectada para el 2011? 6. Una empresa de equipos deportivos está probando el efecto de tres planes publicitarios sobre las ventas en los últimos 6 meses. Dados los siguientes datos, ¿cuál de los planes es el más efectivo? Mes Plan A Plan B Plan C Enero 33,200 28,400 26,750 Febrero 36,800 31,450 29,675 Marzo 40,425 35,875 33,980 Abril 43,340 38,740 37,390 Mayo 46,395 41,250 40,465 Junio 44,875 42,550 40,955 Asignatura: ESTADISTICA ESTADISTICA I
UNIVERSIDAD UNIVERSIDAD CATOLICA DE HONDURAS Página 26 26
Lic. Carlos A. Ávila (MAE Administración de Empresas)
7. Una compañía tiene registros del costo de procesamiento de cada pedido. Durante los últimos 5 años, este costo fue (en lempiras) de 1045, 1202, 1089, 1195 y 1254. ¿Cuál fue el crecimiento porcentual promedio de la empresa durante ese lapso? Si esta tasa promedio se mantiene estable durante 3 años más, ¿Cuánto le costara a la empresa procesar un pedido al final de ese periodo?
La Media Aritmética: la formula general es:
_ X = ∑ (Fabs x Xm) N Existe un método “más corto” para calcular la media aritmética. A este método se le conoce
como Codificación. Codificación. A través de este método se elimina el problema de tener puntos medios o marcas de clase muy grandes o inconvenientes. En lugar de usar los puntos medios reales para realizar los cálculos, se pueden asignar enteros consecutivos de valor pequeño, conocidos como códigos, a cada uno de los puntos medios. El entero cero puede ser asignado a cualquier punto med io, pero para que los enteros asignados sean “pequeños” , se asigna el cero al punto medio de la parte media de la distribución (o la parte más cercana a esta). A partir de ahí se asignan enteros negativos a los valores menores a dicho punto medio y enteros positivos a los valores más grandes. La formula bajo este método es: _ X = X0 + w ∑ (u x fabs) n En donde: X0 = valor del punto medio al que se le asigno el código 0 w = ancho del intervalo u = código asignado a cada punto medio de clase fabs = fabs = frecuencia absoluta de cada clase n = número total de observaciones de la l a muestra La Mediana: La fórmula para calcularla es:
X = Lmed + (n+1) - (F+1) 2 w fm En donde: Lmed = Lmed = Limite inferior de la clase mediana n = número total de elementos de la distribución Asignatura: ESTADISTICA ESTADISTICA I
UNIVERSIDAD UNIVERSIDAD CATOLICA DE HONDURAS Página 27 27
Lic. Carlos A. Ávila (MAE Administración de Empresas)
F = frecuencia acumulada anterior a la clase mediana fm = frecuencia absoluta de la clase mediana w = anchura del intervalo La Moda: La fórmula para calcularla es:
X = Lmod +
d1 w d1 + d2
En donde: Lmod = Limite inferior de la clase modal d1 = fabs clase modal menos fabs clase anterior a la clase modal d2 = fabs clase modal menos fabs clase posterior a la clase modal w = anchura del intervalo
1. A continuación se presenta una distribución de frecuencias con un resumen de los niveles de azúcar en la sangre en una muestra de 70 pacientes que presentan problemas renales crónicos. Nivel de Azúcar
Número de pacientes
65 – 79 7 80 – 94 8 95 – 109 9 110 – 124 9 125 – 139 12 140 – 154 10 155 – 169 8 170 – 184 7 Calcule las medidas de tendencia central. Construya una ojiva menor que y formule 2 preguntas en sentido contrario
2. La siguiente tabla clasifica en categorías 100 visitas al consultorio de especialistas en enfermedades cardiovasculares en Honduras según la duración en cada visita. Duración (minutos)
Cantidad de visitas
1 – 5 6 – 10 11 – 15 16 – 20 21 – 25 26 – 30
12 15 21 30 13 9
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 28
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Total 100 Encuentre las medidas de tendencia central para este caso.
3. Una muestra de 90 comerciantes en San Pedro Sula, revelo las siguientes ventas del año pasado: Ventas (en miles de Lempiras) Numero de microempresas 100 – 149 9 150 – 199 14 200 – 249 20 250 – 299 25 300 – 349 16 350 – 399 6 a. Encuentre las medidas de tendencia central. b. Construya una ojiva menor que y saque dos conclusiones. 4. Las edades de 50 gerentes de las empresas más grandes del país, aparecen en la siguiente tabla de frecuencias. Calcule las medidas de tendencia central. Edades Frecuencia 50 y menos de 55 8 55 y menos de 60 13 60 y menos de 65 15 65 y menos de 70 10 70 y menos de 75 3 75 y menos de 80 1 5. A continuación el gerente de una sucursal bancaria presenta el saldo promedio mensual de 600 cuentas de cheques: Monto (dólares) Frecuencia Monto (dólares) Frecuencia 0.00 – 49.99 78 250.99 – 299.99 47 50.00 – 99.99 123 300.00 – 349.99 13 100.00 – 149.99 187 350.00 – 399.99 9 150.00 – 199.99 82 400.00 – 449.99 6 200.00 – 249.99 51 450.00 – 499.99 4 a. Encuentre la media aritmética a través de los dos métodos. b. Encuentre la moda y la mediana de la distribución. Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 29
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Medidas de Dispersión (Datos No Agrupados)
En un conjunto de datos, la media, la moda y la mediana solo revelan una parte de la información importante sobre las características de los datos. La otra parte relevante de la información para entender el patrón de los datos lo encontraremos en las medidas de dispersión, también conocidas como medidas de extensión o variabilidad. ¿Porque es importante la dispersión en una distribución de datos? Proporciona información adicional que permita juzgar la confiabilidad de las medidas de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es menos representativa de los datos, a diferencia de cuando estos se agrupan más estrechamente alrededor de la media. Permite reconocer y rechazar distribuciones de datos que tengan las dispersiones más grandes o amplias. Como existen problemas característicos para dispersiones muy grandes, es necesario distinguir qué tipo de dispersión presentara una distribución de datos.
El Rango o Alcance:
Es la medida de dispersión más simple pero menos utilizada. El alcance es la diferencia entre la observación más baja y la observación más alta de un arreglo de datos. Su fórmula es: Alcance = Valor más alto del arreglo - Valor más bajo del arreglo El alcance es fácil de usar pero de utilidad muy limitada, pues aparte de estos dos valores, no toma en cuenta ninguna otra observación del arreglo. En consecuencia ignora la variación entre todos los demás datos y se ve influido por los valores extremos. 2
La Varianza (σ ):
Es una de las medidas que calculan la distancia promedio de cualquier observación del conjunto de datos con respecto a la media de la distribución. La Varianza es el promedio de las observaciones respecto a su media elevadas al cuadrado. Cada población y cada muestra tiene su propia varianza. Las unidades que expresan la varianza se muestran elevadas al cuadrado lo cual provoca que la varianza se exprese en términos que en la realidad no tienen significado o interpretación lógica. a. La fórmula para Varianza de una población es : 2 2 2 2 σ = ∑ (x - µ) = ∑ x - µ N N Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 30
Lic. Carlos A. Ávila (MAE Administración de Empresas)
b. La fórmula para Varianza de una muestra es: S2 = ∑ (x – x)2 = ∑ x2 - nx2 n-1 n-1 n-1 La Desviación Estándar :
Es otra medida del cálculo de la distancia promedio de cualquier observación del conjunto de datos respecto de la media aritmética de la distribución. Es en esencia, la raíz cuadrada de la varianza.
a. La fórmula para desviación estándar de la población es:
σ= √σ
2
b. La fórmula para desviación estándar de la muestra es:
S= √S
2
Medidas de Dispersión (Datos Agrupados)
a. La formula de Varianza es: 2 2 2 2 σ = ∑ fabs (Xm - µ) = ∑ (fabs) Xm - µ (Población) N N S2 = ∑ (fabs) Xm2 - nX2 (Muestral ) n-1 b. La formula de Desviación Estándar es:
σ= √σ
2
(Población)
2
(Muestra)
S= √S
El Coeficiente de Variación:
En ocasiones cuando se consideran dos o más distribuciones, con medias significativamente diferentes o que están medidas en unidades distintas, no es adecuado sacar conclusiones respecto a la dispersión solo con base en la desviación estándar. El Coeficiente de Variación es una medida relativa (porcentual) de dispersión. Determina el grado de dispersión de un conjunto de datos relativo a su media. La formula es la misma tanto para datos agrupados como no agrupados. CV = S x (100) (Muestra) X
Asignatura: ESTADISTICA I
CV = σ x (100) (Población) µ
UNIVERSIDAD CATOLICA DE HONDURAS Página 31
Lic. Carlos A. Ávila (MAE Administración de Empresas)
1. La empresa de Transportes Rodríguez lleva un registro del kilometraje de todos sus vehículos. A continuación presentamos registros del kilometraje semanal: 810 450 756 789 210 657 589 488 876 689 1250 560 689 890 987 559 788 943 447 775 a. Calcule la media para el kilometraje de los 20 camiones. b. Encuentre las medidas de dispersión. 2. Calcule las medidas de dispersión del problema 5, sección 4. 3. Los siguientes datos de muestras se han obtenido para el número de clientes diarios en Tiendas Nichita: 34 45 23 37 26 32 31 41 39 42 29 30 43 36 34 40 38 27 a. Calcule las medidas de Dispersión. b. Calcule las medidas de tendencia central. c. ¿Si el número de clientes no sobrepasa los 32 clientes, la tienda cerraría operaciones. En este caso lo hará? 4. Dos marcas de Zapatos para correr fueron evaluados en cuanto a uso y desgaste. Cada uno reporto los siguientes números de horas de uso antes de que se detectara algún desgaste significativo. Marca A 97 83 75 82 98 65 75 93 Marca B 78 56 87 54 89 65 89 a. ¿Cuál zapato presenta mayor desgaste? (Media Aritmética) b. ¿Cuál zapato parece tener un programa de control de calidad que produzca la mejor consistencia en su desgaste? (Coeficiente de Variación) 5. Se usan dos procesos para producir diskettes de computadora. Han surgido problemas respecto a las variaciones en los tamaños de tales discos. Con base en los datos de muestra aquí observados, de ocho tamaños de discos en pulgadas para cada proceso, explique cual proceso aconsejaría usted si su objetivo es minimizar la desviación en el tamaño alrededor de la media. Proceso 1 Proceso 2 3.41 3.22 3.81 3.26 3.74 3.06 3.26 3.79 3.89 3.65 3.07 3.14 3.65 3.33 3.35 3.51
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 32
Lic. Carlos A. Ávila (MAE Administración de Empresas)
6. Encuentre las medidas de dispersión para datos agrupados de los ejercicios 2 y 3 de la sección 7. 7. Datos sobre las edades de los 100 mejores ejecutivos de las 500 mejores firmas de la Revista Fortune revelan una edad media de 56.2 años y una desviación estándar de 12.7 años. Su ingreso medio es de $89,432 con s=$16,097. ¿Cuál variable, edad o ingreso presentan la mayor variación? 8. Daniel Benítez, usa dos máquinas diferentes para producir papeleras para las fotocopiadoras CANON. Una muestra de las papeleras de la primera máquina midieron 12.2, 11.9, 11.8, 12.1, 11.9, 12.4, 11.3 y 12.3 pulgadas. Las bandejas elaboradas de la segunda maquina midieron 12.2, 11.9, 11.5, 12.4, 12.2, 11.9 y 11.8 pulgadas. Daniel debe usar la maquina con mayor consistencia en los tamaños de las papeleras. ¿Cuál maquina deberá usar? 9. Dos compañías de Radio mantienen una férrea competencia, para encontrar cual de las dos complace con más canciones. Durante las últimas 24 horas se recolectaron y tabularon los datos sobre el número de canciones puestas por ambas estaciones. Utilice los datos para preparar un reporte para comparar las estaciones. a. Calcule las medidas de tendencia central y de dispersión. b. Cual estación es más consistente en sus operaciones. Numero de canciones por hora Radioactiva W105 5 – 10 2 4 11 – 16 4 5 17 – 22 6 7 23 – 28 8 5 29 – 34 2 3 35 – 40 3 1 10. El chef jefe del restaurante Taco Bell acaba de recibir dos docenas de jitomates de su proveedora, pero todavía no los acepta. Sabe por la factura que el peso promedio de un jitomate es 7.5 onzas, pero insiste en que todos tengan un peso uniforme. Aceptara los jitomates solo si el peso promedio es 7.5 onzas y la desviación estándar sea menor a 0.5 onzas. Los pesos de los jitomates son los siguientes: 6.3 7.2 7.3 8.1 7.8 6.8 7.5 7.8 7.2 7.5 8.1 8.2 8.0 7.4 7.6 7.7 7.6 7.4 7.5 8.4 7.4 7.6 6.2 7.4 ¿Cuál es la decisión del chef y por qué?
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 33
Lic. Carlos A. Ávila (MAE Administración de Empresas)
11. El gerente de Cinemark en San Pedro Sula, saco un balance del número de asistentes por día que han llegado a las salas en los últimos 6 meses (datos en días): Número de asistentes Frecuencia (días) 180 – 249 18 250 – 319 37 320 – 389 49 390 – 459 44 460 – 529 19 530 – 599 13 Calcule las 3 medidas de dispersión.
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 34
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Otras Medidas de Dispersión : También son conocidas como medidas posicionales
de dispersión. Se utilizan para determinar a partir de qué valor o entre que valores se ubica un determinado segmento de los datos de una distribución. Entre ellas tenemos: Cuartiles (Q):
Dividen una distribución en 4 segmentos iguales, en donde cada una de ellas representa el 25% de los datos. Cada distribución tiene un máximo de 3 cuartiles. La fórmula para calcular la ubicación respectiva es: Qi = (n + 1) Q (Datos no Agrupados ) 4 Qi = LRI + (PQ - fai ) w ; en donde fac ≥ (N + 1) i = PQ (Datos Agrupados ) FQ 4
Deciles (D): Dividen una distribución en 10 segmentos iguales,
en donde cada una de ellas representa el 10% de los datos. Cada distribución tiene un máximo de 9 deciles. La fórmula para calcular la ubicación respectiva es: Di = (n + 1) D (Datos no Agrupados ) 10 Di = LRI + (PD - fai) w; en donde fac ≥ (N + 1) i = P D (Datos Agrupados) FD 10 (P): Dividen una distribución en 100 segmentos iguales, en donde cada una de ellas representa el 1% de los datos. Cada distribución tiene un máximo de 99 percentiles. La fórmula para calcular la ubicación respectiva es: Pi = (n + 1) P (Datos no Agrupados ) 100 Pi = LRI + (PP - fai) w; en donde fac ≥ (N + 1) i = P P (Datos Agrupados ) FP 100 Alcance o Rango Intercuartilico (RIQ): Es la diferencia entre el tercer cuartil y el primer cuartil. Dentro de este rango o alcance se ubican la mitad de las observaciones. Consta del 50% de los datos, que se ubican entre Q 1 y Q 3, cortando y dejando de paso al 25% inferior y al 25% superior de los datos. Esto
Percentiles
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 35
Lic. Carlos A. Ávila (MAE Administración de Empresas)
permite que esta medida no se vea influenciada por valores extremos. La formula es: RIQ = Q 3 – Q 1
1. Encuentre dos cuartiles, dos deciles y dos percentiles de los ejercicios 2 y 4, de la sección 4. 2. Encuentre dos cuartiles, dos deciles y dos percentiles de los ejercicios 1 y 3 de la sección 7. 3. Encuentre Rango Intercuartilico de los Problemas 2 (Sección 4) y 3 de (Sección 7)
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 36
Lic. Carlos A. Ávila (MAE Administración de Empresas)
El Teorema de Chebyshev =
Formulado por P.L. Chebyshev, matemático ruso, 1821 – 1894, establece que para todo conjunto de datos, por lo menos 1 – 1/K2 % de las observaciones están dentro de K desviaciones estándar de la media, en donde K es cualquier número mayor que 1:
Teorema de Chebyshev = 1 – (1/K2) La Regla Empírica y la Distribución Normal :
la desviación estándar se puede usar para sacar ciertas conclusiones si el conjunto de datos está distribuido normalmente. Una distribución normal es una distribución de datos continuos que produce una curva simétrica en forma de campana. Las observaciones ubicadas a los extremos de la curva ocurren con muy poca frecuencia, las observaciones que están más cerca de la mitad ocurrirán con mayor frecuencia, estas condiciones producen la campana simétrica. La observación modal (la más frecuente) se encuentra ubicada en el pico de la distribución. En una distribución normal la media, la moda y la mediana están ubicadas en la misma posición (son iguales). Es importante agregar que la mitad de las observaciones está por encima de la media y la otra mitad está por debajo (50% y 50%). La Regla Empírica, que es una extensión al Teorema de Chebyshev (en la cual se dice que no importa qué forma tenga la distribución, al menos 75% de los valores caen dentro de +/- 2σ a partir de la media y al menos 89% de los valores caen dentro de +/- 3σ a partir de la media), específica que: 68.3% de las observaciones caen dentro de +/- 1 desviación estándar de la media. 95.5% de las observaciones caen dentro de +/- 2 desviaciones estándar de la media. 99.7% de las observaciones caen dentro de +/- 3 desviaciones estándar de la media.
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 37
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Resultado Estándar :
A través de este resultado se puede describir que tan lejos las observaciones individuales de una distribución se apartan de la media de la distribución. Específicamente nos da el número de desviaciones estándar que una observación en particular ocupa por debajo o por encima de la media. Se calcula como:
Resultado estándar = x - µ
σ
Sesgo:
Se refiere a que no todas las distribuciones son normales, ya que algunas pueden estar sesgadas ya sea a la derecha o a la izquierda. En ambos casos, la moda es por definición la observación que ocurre con mayor frecuencia. Por lo tanto, se encuentra en el pico de la observación. Sin embargo por su sola naturaleza, la media se ve afectada por las observaciones extremas. Por tanto, es halada en dirección del sesgo, más de lo que esta la mediana, la cual se encuentra en algún sitio entre la moda y la media. El sesgo puede medirse mediante el Coeficiente de sesgo de Pearson:
Coeficiente de Sesgo (P) = 3 (X – mediana) S Si P < 0, los datos están sesgados a la izquierda Si P > 0, los datos están sesgados a la derecha Si P = 0, los datos están distribuidos normalmente
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 38
Lic. Carlos A. Ávila (MAE Administración de Empresas)
1. Un conjunto de datos distribuidos normalmente tiene una media de 5,000 y una desviación estándar de 450. Qué porcentaje de las observaciones (Si el numero de observaciones o elementos es 350) están: a. Entre 4550 y 5450. b. Entre 4100 y 5900. c. Entre 3650 y 6350. d. Por encima de 6350 e. Por debajo de 4550. 2. Una empresa maderera corta troncos a una longitud media de 25 pies, con una desviación estándar de 4.5 pies. Si los cortes están distribuidos normalmente (tenga en cuenta que en bodega hay 34,500 troncos inventariados) que porcentaje de troncos tienen: a. ¿Menos de 20.5 pies? b. ¿Mínimo 16 pies? c. ¿A lo sumo 25 pies? d. ¿Máximo 29.5 pies? 3. Un conjunto de datos sobre el peso de contenido de 1000 bolsas de comida para perros marca Puppy Chow tiene una media de 50 libras y una desviación estándar de 2.3 libras. No se sabe si los datos están distribuidos normalmente. Los fabricantes esperan que por lo menos 750 de las bolsas pesen entre 40.8 y 59.2 libras. ¿Qué seguridad puede darles? 4. Debido a que las tasas de interés han caído desde 2008 debido a la crisis mundial, se encontró que una muestra de las tasas hipotecarias a 15 años en las instituciones bancarias fue de: 7.1%, 7.3%, 7.0%, 6.9%, 6.6%, 6.9%, 6.5%, 7.3%, 6.85% a. Calcule las medidas de tendencia central. b. Calcule el coeficiente de Sesgo de Pearson, para determinar el tipo de sesgo del arreglo. c. Calcule la Varianza y la desviación estándar. 5. Una supervisora en una planta ensambladora recibió las siguientes clasificaciones de eficiencia durante 12 meses: 56, 69, 48, 75, 65, 72, 81, 43, 61, 42, 36, 52. a. ¿Cuál de las medidas de tendencia central será la que ella debe colocar para crear una impresión más favorable? Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 39
Lic. Carlos A. Ávila (MAE Administración de Empresas)
b. Calcule el coeficiente de Sesgo de Pearson. 6. Dados los siguientes puntajes de 12 pruebas para una clase de Estadística, calcule el coeficiente de Sesgo de Pearson. Asuma que estos datos son muestrales: 80, 83, 87, 85, 90, 86, 84, 82, 88, 98, 92, 77, 95 7. La compañía American Airlines revelo en el año 2009, una media de 78.7 pasajeros por día, con una desviación estándar de 12.14. Para programar los tiempos para una nueva ruta que la compañía ha abierto, la gerencia desea saber con qué frecuencia los pasajeros están dentro de K = dos desviaciones estándar de la media, y cual es dicho intervalo. 8. Calcule Pearson para el problema 9, sección 8. 9. Un conjunto de 60 observaciones tiene una media de 66.8, una varianza de 12.60 y una forma de distribución desconocida. a. ¿Entre que valores deberán caer al menos 75% de las observaciones, de acuerdo con el teorema de Chebyshev? b. Si la distribución es simétrica y con forma de campana, aproximadamente cuantas observaciones deberán encontrarse en el intervalo 59.7 – 73.9? c. Encuentre los resultados estándar para las siguientes observaciones tomadas de la distribución: 61.45, 75.37, 84.65, 51.50. 10. David Ordoñez, propietario de una enorme panadería, afirmo que el nivel de producción promedio por semana de su empresa fue 11,398 barras de pan, con una varianza de 49,729. Si los datos utilizados para calcular los resultados se recolectaron en el periodo de 32 semanas, ¿Durante cuantas semanas estuvo el nivel de producción debajo de 11,175? ¿Y cuántas arriba de 11,844? 11. Una compañía multinacional tiene 3 oficinas en 3 ciudades distintas. Los niveles de salario difieren de una ciudad a otra. En la oficina de Washington, D.C. el aumento promedio a los salarios durante el año anterior fue de $1500 con una desviación estándar de $400. En la sucursal de Nueva York, el aumento promedio fue de $3760 con una desviación estándar de $622. En Los Ángeles, el aumento promedio fue de $850, con una desviación estándar de $95. Se entrevisto a 3 empleados. El empleado de Washington recibió un aumento de $1100; el de Nueva York obtuvo un aumento de $3200 y el de Los Ángeles, $500. ¿Cuál de los tres tuvo el menor aumento en relación con la media y la desviación estándar de los aumentos correspondientes a su oficina? Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 40
Lic. Carlos A. Ávila (MAE Administración de Empresas)
En la actualidad, la teoría matemática de la Probabilidad es la base para las aplicaciones estadísticas tanto en investigaciones sociales como en la toma de decisiones.
Conceptos básicos de la probabilidad :
Probabilidad :
Es la posibilidad de que algo pase. Las probabilidades se pueden expresar como fracciones propias o como decimales que están entre cero y uno. Tener una probabilidad de cero, significa que algo nunca va a suceder y una probabilidad de uno significa que algo va a suceder siempre.
Evento: Es uno o
más de los posibles resultados de hacer un experimento. Ej. Los eventos del experimento de lanzar una moneda son cara y cruz. Sacar un as de copas de una baraja de naipes. Ser elegido de entre cien estudiantes para responder una pregunta.
Experimento: es la actividad principal que genera dichos eventos.
Ej. Lanzar una moneda. Lanzar un dado. Sacar una carta de una baraja. Cursar una materia en la universidad
Espacio Muestral : Es el
conjunto de todos los resultados posibles de un experimento. Ej. Del lanzamiento de una moneda se puede obtener cara o cruz. Del lanzamiento de un dado se pueden obtener resultados del 1 al 6. Al cursar una materia en la universidad, uno puede aprobar o reprobar. De una baraja se pueden obtener 52 resultados posibles.
Eventos Mutuamente Excluyentes:
Se dice que los eventos son mutuamente excluyentes si uno y solo uno de ellos puede tener lugar a un tiempo. Ej. De lanzar una moneda podemos obtener cara o cruz, pero no ambas. Usted puede pasar o reprobar una materia, pero no ambos resultados. Usted puede llegar tarde o temprano a clase, pero no ambas al mismo tiempo.
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 41
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Lista Colectivamente Exhaustiva :
Una lista es exhaustiva cuando en una lista de posibles eventos que pueden resultar de un experimento se incluyen todos los resultados posibles. Ej. Del lanzamiento de un dado los posibles resultados van del 1 al 6. Los estudiantes de una escuela pueden estar a tiempo o no estar en el salón de clase cuando se pasa lista.
Tipos de Probabilidad :
Probabilidad Clásica:
El Planteamiento clásico define la probabilidad de que un
evento ocurra como: Probabilidad de un evento = Numero de resultados en los que puede ocurrir un evento Número total de resultados posibles A la probabilidad clásica también se le define como probabilidad a priori, debido a que si se usan ejemplos previsibles como monedas no alteradas, dados no cargados y mazos de barajas normales, entonces es posible establecer el resultado sin la necesidad de realizar el experimento. Las conclusiones son basadas en puro razonamiento lógico. Este planteamiento es útil en experimentos como los mencionados anteriormente, pero se ve en problemas al quererlo aplicar en tomas de decisiones administrativas. Es importante tomar en cuenta que el experimento descrito de un evento puede ser “ con reemplazo o sin reemplazo” después de cada intento. Probabilidad de Frecuencia relativa de presentación :
También conocida como
probabilidad a posteriori, define la probabilidad como: 1. La frecuencia relativa observada en un evento durante un gran número de intentos
2. La fracción de veces que un evento se presenta a la larga, cuando las condiciones son estables.
Frecuencia Relativa = Numero de veces que ha ocurrido un evento en el pasado Número total de observaciones Ej. Cuál es la probabilidad de que yo viva hasta los 85 años. La probabilidad de que mañana haya un accidente aéreo. Este método usa la frecuencia relativa de las presentaciones pasadas de un evento como probabilidad. Se determina que tan frecuente ha sucedido algo en el pasado y se usa esa cifra para predecir la probabilidad de que el evento suceda de nuevo en el futuro. Otra característica es que el resultado de la probabilidad obtiene mayor precisión a medida
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 42
Lic. Carlos A. Ávila (MAE Administración de Empresas)
aumenta el número de observaciones. Claro está que hay que tener en cuenta el tiempo y el costo que implicaría tener más observaciones. Probabilidad Subjetiva:
Están basadas en las creencias de las personas que efectúan la estimación de probabilidad. Ej. Al dolerle los huesos, una anciana cree que se avecina la lluvia. Construir una planta nuclear sobre una falla geológica, en ese caso sería la probabilidad de que suceda un accidente en la planta, sin contar con antecedentes de ese tipo. Reglas de PROBABILIDAD
La mayoría de administradores que usa la probabilidad se preocupa por dos condiciones: El caso en que un evento u otro se presente. La situación en que dos eventos presenten al mismo tiempo. Probabilidad Marginal o Incondicional :
Es también denominada como probabilidad sencilla, que quiere decir que solo un evento puede llevarse a cabo.
Relaciones entre eventos :
Un Conjunto es toda reunión de objetos. Cada conjunto contiene una serie de elementos. Es totalmente probable que algunos elementos estén presentes en ambos conjuntos, si esto sucede, se dice que existe una Intersección de eventos, que es cuando los elementos tienen las dos características de los conjuntos. La intersección se simboliza como A∩B. Una herramienta muy importante para mostrar la relación entre conjuntos, es conocida como Diagrama de Venn, desarrollado por John Venn, matemático ingles (1834 – 1923). Los eventos se representan por medio de círculos que pueden ir o no ir interceptados, que van dibujados dentro de un rectángulo cuya área mide 1.
El diagrama de Venn representado en el ejemplo 1 puede describirse como la relación entre el conjunto A y el conjunto B. El área combinada de ambos conjuntos recibe el nombre de unión de los conjuntos A y B. La unión en este caso contiene Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 43
Lic. Carlos A. Ávila (MAE Administración de Empresas)
todos los tipos de criaturas que tienen dos piernas, pueden volar, o ambas cosas a la vez. El área donde los conjuntos A y B se solapan se define como la intersección de A y B . Contiene todos los tipos de criaturas que pertenecen a la vez a A y a B, es decir, que tienen dos piernas y pueden volar. Un diagrama de Venn de dos conjuntos define 4 áreas diferentes (la cuarta es la exterior), que pueden unirse en 6 posibles combinaciones:
A (dos patas) B (vuelan)
A y B (dos patas y vuelan)
A y no B (dos patas y no vuelan)
no A y B (más o menos de dos patas, y vuelan) no A y no B (ni tienen dos patas ni vuelan)
Diagrama de Venn mostrando todas las intersecciones posibles entre tres conjuntos A, B y C .
La Unión de A y B, se simboliza como AUB, consta de elementos que están o en A o en B o en ambos. Regla de la Adición:
Para eventos Mutuamente Excluyentes (eventos no pueden darse al mismo tiempo): P (AUB) = P (A) + P (B) Para eventos No Mutuamente Excluyentes (eventos pueden darse al mismo tiempo): P (AUB) = P (A) + P (B) – P (A∩B) Eventos Complementarios:
Son los eventos en que si uno de ellos ocurre, el otro no puede ocurrir. Estos eventos por supuesto que son mutuamente excluyentes y colectivamente exhaustivos. La referencia exacta es que de un mismo evento en particular, puede que este ocurra o no ocurra. La formula es:
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 44
Lic. Carlos A. Ávila (MAE Administración de Empresas)
P (A) + P (no A) = 1 P (A) = 1 – P (no A)
1. Sea A, el evento de que un estudiante en particular curse Calculo I y el evento B sea que curse Estadística I.
¿Qué significado tiene el evento AΩB?
¿Qué significado tiene el evento AUB? ¿Cuál es el complemento de A? ¿Cuál es el complemento de B? ¿Son los eventos A y B mutuamente excluyentes?
2. Al lanzar un dado, cual es la probabilidad de obtener: Un número impar Un 4 Sacar un número que no sea 5 Sacar un 7 No sacar un 2
3. Considere una pila de 9 cartas de espadas, numeradas del 2 al 10 y un dado. Proporcione la probabilidad de cada uno de los siguientes totales, al sumar los valores del dado y de la carta: 2 3 8 9 12 14 16 4. Durante el año anterior, las ventas semanales en una Tienda de mascotas, han sido “bajas” durante 1 0 semanas, “considerables” durante 2 6 semanas, y “altas” el resto del año. Cuál es la probabilidad de que las ventas de esta semana sean: Considerables Bajas Altas No Bajas Por lo menos considerables
5. Clasifique las siguientes estimaciones de probabilidad en cuanto a su tipo (clásica, frecuencia relativa o subjetiva): La probabilidad de lograr un tiro penal en hockey sobre hielo es 0.47 La probabilidad de que el presidente Lobo renuncie es de 0.75.
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 45
Lic. Carlos A. Ávila (MAE Administración de Empresas)
La probabilidad de sacar 2 seises al lanzar dos dados es 1/36. La probabilidad de caerme al caminar es 0.38. La probabilidad de que viaje a Europa este año es 0.14. La probabilidad de que un auto arranque en un día muy frio es 0.97
6. El gerente de Cinemark en San Pedro Sula, saco un balance del número de asistentes por día que han llegado a las salas en los últimos 6 meses (datos en días): Número de asistentes Frecuencia (días) 180 – 249 18 250 – 319 37 320 – 389 49 390 – 459 44 460 – 529 19 530 – 599 13 Calcule la probabilidad de que mañana lleguen a Cinemark: a) Entre 390 y 460 personas. b) Máximo 320 personas. c) Por lo menos 250 personas. d) No lleguen más de 530 espectadores. e) A lo sumo 180 personas. 7. Para el caso de bebes nacidos en Honduras, la probabilidad de que su peso sea menor a los 8.5 libras es de 19% y la probabilidad de que el periodo de gestación sea menor a 8 meses y medio es de 31%. Además la probabilidad de que estos dos eventos ocurran simultáneamente de 0.14. En el caso de una niña se elija al azar ¿Cuál es la probabilidad de que ocurra A o B? Trace un diagrama de Venn para ilustrar la relación entre los eventos. ¿Cuál es la probabilidad que un bebe, su peso no sea menor a 8.5 libras? ¿Son estos eventos mutuamente excluyentes?
8. Las siguientes estadísticas muestran el número de veces que una misma persona haya ido varias veces al cine. Edad
Menos de 6 6 – 10 11 – 15 16 – 20 21 – 25 Asignatura: ESTADISTICA I
Probabilidad
0.0030 0.1240 0.2630 0.2900 0.2200 UNIVERSIDAD CATOLICA DE HONDURAS Página 46
Lic. Carlos A. Ávila (MAE Administración de Empresas)
26 – 30 0.0850 31 – 35 0.0140 Más de 35 0.0010 Total 1.0000 ¿Cuál es la probabilidad de que una persona haya ido menos de 20 veces al cine en el año? ¿Cuál es la probabilidad de que esta persona haya ido por lo menos 30 veces? ¿Cuál es la posibilidad de que una persona no haya ido entre 20 y 25 veces al cine? ¿Cuál es la posibilidad de que una persona haya ido al cine entre 25 y 40 veces al año?
9. Se realizo un sondeo entre el personal del Hospital Mario Catarino Rivas sobre la destitución del Dr. Juan Carlos Zúñiga. El sondeo se realizo entre médicos y enfermeras de la institución: Sondeo de opinión Médicos (M) Enfermeras (E) Muy de acuerdo 5 3 Poco de acuerdo 7 5 NS/NR 8 6 Nada de acuerdo 20 26 ¿Cuál es la probabilidad de que un trabajador, seleccionado al azar del grupo sondeado, no haya respondido sobre la destitución? ¿Cuál es la posibilidad de que una enfermera seleccionada al azar este de alguna forma de acuerdo con la destitución? ¿Cuál es la probabilidad de que un trabajador seleccionado al azar no esté de acuerdo con la destitución? ¿Son mutuamente excluyentes los eventos? ¿Explique? ¿Existe dependencia o influencia alguna entre los eventos, Explique?
10. A continuación se presenta una distribución de frecuencias de las tomas de muestra de los niveles de azúcar en la sangre que presentan 500 pacientes del Hospital Escuela en Tegucigalpa. Nivel de azúcar en la sangre Frecuencia 60 – 69 14 70 – 79 23 80 – 89 95 90 – 99 106 100 – 109 122 110 o más 140 Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 47
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Si se considera que los pacientes que tienen un nivel de 110 o más de hemoglobina son personas diabéticas, ¿Cuál es la probabilidad de que un paciente escogido al azar, tenga diabetes? ¿Cuál es la probabilidad de que un paciente tenga nivel normal de azúcar en la sangre? Tome en cuenta que el nivel normal de azúcar es de 80 a 110. ¿Cuál es la probabilidad de que una persona seleccionada al azar tenga muy bajo nivel de azúcar? ¿Cuál es la probabilidad de que el nivel de azúcar de una persona no esté entre 90 y 100? ¿Son estos eventos independientes? Explique por qué.
11. A continuación se presentan datos de la probabilidad del número de hijos que en promedio tiene una familia en Honduras: Número de hijos Proporción de familias que tienen esta cantidad de hijos 0 0.04 1 0.12 2 0.32 3 0.23 4 0.13 5 0.09 6 0.07 ¿Cuál es la probabilidad de que una familia escogida al azar tenga 4 hijos o más? ¿Cuál es la probabilidad de que una familia escogida al azar tenga 2 o 3 hijos? ¿Cuál es la probabilidad de que una familia elegida al azar tenga al menos un hijo? ¿Cuál es la probabilidad de que una familia al azar no tenga hijos? ¿Cuál es la probabilidad de que una familia no tenga 5 hijos?
12. Hondutel registra la duración de las llamadas telefónicas efectuadas por 175 personas durante el día de navidad: Duración (minutos) Frecuencia 1 – 7 45 8 – 14 32 15 – 21 34 22 – 28 22 29 – 35 16 36 – 42 12 43 – 49 9 50 – 56 5 Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 48
Lic. Carlos A. Ávila (MAE Administración de Empresas)
a. b. c. d. e. f.
Cuál es la probabilidad de que la siguiente llamada dure: ¿Cuándo muchos 21 minutos? ¿Hasta 42 minutos? ¿Entre 22 y 36 minutos? ¿Mínimo 56 minutos? ¿Máximo 1 minuto? ¿No pase de 29 minutos?
13. La siguiente tabla muestra el número de computadores vendidos diariamente por una tienda minorista. Numero de computadores vendidos Número de días 0 10 1 38 2 16 3 26 4 20 Determine la probabilidad de que el número de computadores que se vendan hoy sea: a. 2 b. Menos de 3 c. Más de 1 d. Por lo menos 1 e. Ninguno f. No sea 4 14. La compañía multinacional Pfizer, ha producido una capsula para controlar la presión arterial. El departamento de producción realiza inspecciones permanentes de cada capsula ya terminada. Uno de los inspectores se ha dado cuenta que de cada 1000 capsulas que se revisan, 25 tienen defectos internos, 18 tienen defectos de empaquetado y 9 tienen ambos tipos de defectos. En su informe, el inspector debe incluir la probabilidad de que haya defectos en las capsulas. ¿Cuál es la probabilidad que haya defectos en las capsulas? ¿Cuál es la probabilidad de que una capsula no tenga defectos internos? ¿Cuál es la probabilidad que una capsula tenga defectos internos y de empaquetado? ¿Cuál es la probabilidad de que una capsula no tenga defectos? Construya un diagrama de Venn
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 49
Lic. Carlos A. Ávila (MAE Administración de Empresas)
15. La empresa CEMCOL distribuye una marca específica de tractor. El gerente de mantenimiento ha encontrado dos tipos de fallas en los tractores. Uno de los fallos es de problemas eléctricos y el otro consiste en problemas de temperatura. El gerente sabe que la probabilidad que un tractor seleccionado al azar tenga problemas eléctricos es del 45%. La probabilidad que un tractor tenga ambas fallas es del 35%. La probabilidad que el tractor tenga falla eléctrica o de temperatura es 70% a. ¿Cuál es la probabilidad que un tractor tenga falla de temperatura? b. ¿Cuál es la probabilidad que un tractor no tenga fallo eléctrico? c. ¿Cuál es la probabilidad que un tractor no tenga fallo eléctrico y no tenga fallo de temperatura? d. ¿Cuál es la probabilidad que un tractor tenga fallo de temperatura y fallo eléctrico? 16. Si suponemos que es igualmente posible que un bebe nazca en cualquier día de la semana, ¿Cuáles son las probabilidades de que un bebe nazca, a) ¿Un martes? b) ¿Un día que empiece con M? c) ¿Entre miércoles y viernes, incluyéndolos? d) No nazca un domingo. e) Nazca Lunes o Martes. f) Nazca Viernes y Sábado. 17. Un inspector de una compañía tiene la tarea de comparar la confiabilidad de dos estaciones de bombeo. Cada estación es susceptible a dos tipos de falla: descompostura en el bombeo y fugas. Cuando ocurre una de las dos (o ambas), la estación debe parar. Los datos disponibles indican que prevalecen las siguientes probabilidades: Estación
P(falla en bombeo)
P(fuga)
1 0.07 0.10 2 0.09 0.12 ¿Qué estación tiene la mayor probabilidad de parar?
Asignatura: ESTADISTICA I
P(ambas)
0 0.06
UNIVERSIDAD CATOLICA DE HONDURAS Página 50
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Tablas de Contingencia:
Estas tablas son útiles para calcular probabilidades de experimentos con eventos múltiples. Los valores en los márgenes de la tabla se llaman probabilidades marginales. De acuerdo a las celdas de la estructura principal de la tabla, la probabilidad de la intersección de dos eventos se denomina como probabilidad conjunta.
1. En una compañía de cobros, un gerente tiene 120 cuentas por cobrar pendientes. El gerente informa que de las 25 cuentas que están en el intervalo de $0 a $4999, 10 están vencidas, 5 atrasadas y el resto son morosos, colocando al deudor en peligro de ser visitado por el representante legal. De las 37 cuentas comprendidas entre $5000 y $9999, 15 están vencidas, 10 están atrasadas y el resto son morosas. Hay 39 cuentas en el intervalo entre $10000 y $14999, de las cuales 11 están vencidas, 18 son morosas y el resto están atrasadas. De las cuentas restantes que están en el intervalo comprendido entre $15000 y más, 7 están morosas, 7 están atrasadas y el resto están vencidas. El gerente general de la compañía desea ver una tabla de contingencia de estas cuentas. Calcule: La probabilidad de que las cuentas no sean morosas. La probabilidad de que las cuentas estén vencidas. La probabilidad de que las cuentas no estén atrasadas. Las cuentas de menos de $10,000 que no estén atrasadas. Las cuentas de más de $5,000 que hayan vencido.
2. Una organización recolecta datos sobre 500 economistas en la academia, la industria privada, y el gobierno respecto a sus opiniones sobre si la economía podría ser estable, podría expandirse o podría entrar en un periodo de contracción en el futuro próximo. Sin embargo, parte de la información se perdió, resultando la siguiente tabla de contingencia parcial. Con base en los datos restantes, cree una tabla de probabilidad. ECONOMIA Economistas Estable (S) Expansión (E) Contracción (C) Total Academia (A) 125 100 Industria Privada (I) 35 110 Gobierno (G) 25 40 65 Total 200
De la tabla de probabilidad, encuentre:
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 51
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Pb (I) Pb (G) Pb (A U I) Pb (S ∩ E) Pb (G U C) Pb (no E)
Pb (S ∩ no G)
3. La empresa Zip Zona Verde tiene 560 empleados de los cuales 320 son hombres y el resto son mujeres. 170 hombres son de Personal, 95 son Auxiliares y el resto son de Línea. De las mujeres, 140 son de Línea, 40 de Auxiliar y el resto de Personal. Construya una tabla de contingencia y calcule: a. Pb (A) b. Pb (no L) c. Pb (H ∩ no P) d. Pb (M U L) e. Pb (A ∩ P) 4. De 1000 jóvenes de 18 años, 550 tienen empleo y 780 son bachilleres. De los 780 bachilleres, 450 tienen empleo. Cuál es la probabilidad de que un joven de 18 años tomado aleatoriamente sea: Un bachiller empleado Empleado pero no bachiller Desempleado o un bachiller Desempleado y no bachiller No bachiller
5. Una caja contiene 75 canicas, 45 son azules, 30 de estas tienen una apariencia veteada. El resto de ellas son rojas y 20 de estas también están veteadas. Las canicas que no están veteadas, son transparentes. Cuál es la probabilidad de sacar: a) ¿Una canica azul? b) ¿Una canica transparente? c) ¿Una canica azul veteada? d) ¿Una canica roja transparente? e) ¿Una canica no transparente? f) ¿Una canica roja o transparente? g) ¿Una canica veteada transparente?
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 52
Lic. Carlos A. Ávila (MAE Administración de Empresas)
6. Editorial McGraw Hill, tiene en bodega 75 títulos distintos de libros, clasificados por tipo y costo de la siguiente manera: Costo Tipo US$10 US$15 US$20 Total Ficción 10 3 21 Biografías 12 10 Histórico 17 23 Total 2
Complete la tabla de contingencia y encuentre las siguientes probabilidades: Pb (B) Pb (no H) Pb (no $10) Pb (H ∩ F) Pb ($20 U B) Pb (B U >$10)
Pb ($15 ∩ no F)
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 53
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Se dice que los eventos son estadísticamente independientes, cuando la presentación de uno de ellos, no tiene efecto alguno, sobre la probabilidad de presentación de cualquier otro evento. Existen tres tipos de probabilidad bajo esta condición: a) P. Marginal : Es la probabilidad simple de la presentación de un evento. Si se lanza una moneda la primera vez y se obtiene como resultado una cruz, y luego se vuelve a lanzar por segunda vez, el resultado podría ser cara o cruz. El resultado del primer lanzamiento no marca en lo absoluto el resultado del segundo o de cualquier otro lanzamiento. Estos eventos son independientes. b) P. Conjunta: La probabilidad de dos o más eventos que se presentan juntos o en sucesión es el producto de sus probabilidades marginales. a. P (A∩B) = P (A) x P (B) c) P. Condicional : Es la probabilidad de que un segundo evento (B) se presente si un primer evento (A) ya ha sucedido. a. P (A/B) = P (B) b. P (B/A) = P (A) Aunque parezca incongruente, la formula lo que en realidad presenta es que en la realidad aunque se quiera establecer que un evento está condicionado porque otro ya haya sucedido, en la realidad no se da de esa forma.
1. Al observar la población de Honduras, se concluye que la probabilidad de que un adulto entre 50 y 65 años no cuente con un seguro de salud con cualquier tipo de cobertura es de 55%. Suponga que usted elige aleatoriamente a una mujer de 52 años y a un hombre sin relación alguna con ella de 59 años, entre esta población ¿Cuál es la posibilidad de que ninguno de los dos este asegurado? ¿Cuál es la probabilidad de que ambos posean seguro medico? Si se eligen 5 adultos de la población no relacionados entre sí de 50 y 64 años de edad, ¿Cuál es la probabilidad de que 3 de ellos carezcan de seguro? De 4 adultos al azar, cual es la probabilidad que dos de ellos cuenten con seguro.
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 54
Lic. Carlos A. Ávila (MAE Administración de Empresas)
¿Son estos eventos Independientes?
2. La Probabilidad de que una mujer casada elegida aleatoriamente al azar no use ningún método de anticoncepción es de 0.48 ¿Cuál es la probabilidad de que 5 mujeres de este grupo elegida al azar 3 no usen método anticonceptivo? ¿Cuál es la probabilidad que de las 5 mujeres elegidas todas usen método anticonceptivo? ¿Cuál es la probabilidad de que ninguna use método anticonceptivo? ¿Son estos eventos mutuamente excluyentes? ¿Son estos eventos independientes?
3. La señora Victoria ha llegado al hospital a dar a luz y el resultado es un lindo varón. Tres horas después llega doña Carmen a dar a luz al hospital. ¿Cuál es la probabilidad de que doña Carmen dé a luz una niña, dado que doña Victoria ha dado a luz un varón? ¿Cuál es la probabilidad de que doña Carmen dé a luz un varón, dado que doña Victoria ha dado a luz un varón? ¿Cuál es la probabilidad de que doña Carmen y doña Victoria den a luz un varón y una niña respectivamente?
4. Una clínica tiene 4 aparatos de Rayos X, que cuando fallan cada una se repara por separado. A partir de la experiencia se sabe que cada aparato se encuentra fuera de servicio el 14% del tiempo. Si la primera máquina está funcionando normalmente, ¿Cuál es la probabilidad de que tres de las otras maquinas estén defectuosas? Si la primera máquina se encuentra defectuosa, ¿Cuál es la probabilidad de que al menos dos de las otras maquinas se encuentren defectuosas? ¿Si la clínica tuviera 6 aparatos, Cuál es la probabilidad de que cuatro de ellas maquinas estén funcionando correctamente? ¿Cuál es la posibilidad de que 2 de las maquinas presenten fallos?
5. El señor William Robertson, ejecutivo de una tabacalera está consciente de la responsabilidad social que la empresa debe tener con la sociedad. La compañía lanza una campaña publicitaria para hacer conciencia en el consumo del cigarrillo. El señor Robertson acaba de instalar 4 anuncios panorámicos en la carretera a la entrada de la ciudad y sabe por su experiencia, la probabilidad de cada anuncio sea visto por un conductor escogido aleatoriamente. La probabilidad de que el primer anuncio sea Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 55
Lic. Carlos A. Ávila (MAE Administración de Empresas)
visto por un conductor es de 0.75, la probabilidad de que el segundo sea visto es de 0.83, la probabilidad para el tercero es de 0.86, y la del cuarto es de 0.90. Suponiendo que el evento consistente en que un conductor vea uno cualquiera de los anuncios es independiente de si ha visto o no los demás; ¿Cuál es la probabilidad de que: Los cuatro anuncios sean vistos por un conductor escogido aleatoriamente. El primero y el cuarto anuncios sean vistos, sin que el segundo y el tercero sean notados. Ninguno de los anuncios sea visto. El tercero y el cuarto no sean vistos. Dos de los anuncios no sean vistos. Tres anuncios sean vistos.
6. Una bolsa tiene 32 canicas: 4 rojas, 9 negras, 12 azules, 6 amarillas y 1 morada. Las canicas se sacan una a la vez con reemplazo. Calcule la probabilidad de que: La segunda canica sea amarilla dado que la primera fue amarilla La segunda canica sea roja dado que la primera fue negra La tercera canica sea morada dado que la primera y segunda fueron moradas La primera canica sea roja o azul La primera canica no sea negra La primera canica sea azul y morada 7. El departamento de salud efectúa rutinariamente dos inspecciones independientes a los restaurantes; un restaurante aprobara la inspección solo si ambos inspectores lo aprueban en cada una de ellas. El inspector A tiene mucha experiencia, en consecuencia, solo aprueba 4% de los restaurantes que realmente están violando el reglamento sobre salubridad. El inspector B tiene menos experiencia y aprueba 12% de los restaurantes con fallas. Cuál es la probabilidad de que: El inspector A apruebe el restaurante, aun cuando el inspector B haya encontrado violaciones al reglamento El inspector B apruebe un restaurante que este violando el reglamento, aun cuando el inspector A ya lo haya aprobado Un restaurante que este violando el reglamento sea aprobado por el departamento de salud Uno de los inspectores apruebe el restaurante El inspector B no apruebe el restaurante
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 56
Lic. Carlos A. Ávila (MAE Administración de Empresas)
8. Cuando fallan las compuertas de una pequeña represa hidroeléctrica, se les repara de manera independiente una de la otra; la represa tiene 4 compuertas. A partir de la experiencia, se sabe que cada compuerta esta fuera de servicio 6% de todo el tiempo. Si la compuerta uno está fuera de servicio, ¿Cuál es la probabilidad de que las compuertas 2 y 3 estén fuera de servicio? Cuál es la probabilidad de que 2 de ellas funcionen correctamente. Cuál es la probabilidad de todas funcionen bien. Cuál es la probabilidad de que al menos una de ellas no funcionen.
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 57
Lic. Carlos A. Ávila (MAE Administración de Empresas)
La dependencia estadística existe cuando la probabilidad de que se presente algún evento depende o se ve afectada por la presentación de otro evento. Existen dos tipos de probabilidad bajo esta condición: P. Condicional :
P (A/B) = P (A∩B) / P (B) P (B/A) = P (A∩B) / P (A) P. Conjunta:
P (A∩B) = P (A/B) x P (B) P (B∩A) = P (B/A) x P (A)
Cuando existe dependencia entre dos eventos, cada evento desempeña un rol importante para definir condicionalidad. Bajo estas condiciones siempre un evento ocurrirá primero ( llamado condicionante) e inmediatamente ocurrirá el segundo evento (llamado condicionado). La condicionalidad se presenta de dos maneras: Condicionado DADO Condicionante 2do. Evento / 1er. Evento
Si
Condicionante 1er. Evento
ENTONCES
Condicionado 2do. Evento
1. CONDICIONADO DADO CONDICIONANTE 2. SI CONDICIONATE ENTONCES CONDICIONADO El Condicionante es el evento que ocurre en primera instancia. El Condicionado es el evento que ocurre después de haber ocurrido el Condicionante.
1. En un comedor de beneficencia, una trabajadora social, reúne los siguientes datos. De las personas que acuden al comedor, 62% son hombres, 35% son alcohólicos y 24% son hombres alcohólicos. a. ¿Cuál es la probabilidad de que un hombre que asiste al comedor, tomado al azar sea alcohólico? Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 58
Lic. Carlos A. Ávila (MAE Administración de Empresas)
b. c. d. e.
¿Cuál es la probabilidad de que una persona seleccionada al azar no sea alcohólica? ¿Cuál es la probabilidad de que una persona seleccionada sea mujer? ¿Cuál es la probabilidad de que la persona al azar sea hombre o alcohólico? ¿Cuál es la posibilidad de que la persona no llegue al comedor no sea alcohólica?
2. Según una investigación, la probabilidad de que una familia posea dos seguros diferentes dado que sus entradas anuales son mayores de $50,000 es de 0.77. De las personas entrevistadas, 59% de las familias tuvieron entradas mayores a los $50,000 anuales y 48% tiene dos seguros diferentes. a. ¿Cuál es la probabilidad de que una familia tenga dos seguros diferentes y una entrada mayor a $50,000 al año? b. ¿Cuál es la probabilidad de que una familia no tenga 2 seguros diferentes? c. ¿Si una familia posee dos seguros, entonces cual es la posibilidad de que tenga entradas mayores a $50,000.00? d. ¿Cuál es la probabilidad de que una familia no tenga entradas mayores a $50,000? 3. Durante un estudio sobre accidentes automovilísticos, el Consejo de Seguridad en las carreteras encontró que 60% de los accidentes suceden de noche, 52% están relacionados con conductores alcoholizados y 37% se presentan de noche y están relacionados con conductores ebrios. a. ¿Cuál es la probabilidad de que un accidente esté relacionado con un conductor alcoholizado, dado que sucedió de noche? b. ¿Cuál es la probabilidad de que un accidente haya sucedido de noche, dado que está relacionado con un conductor ebrio? c. ¿Cuál es la probabilidad de que un accidente suceda de día? d. ¿Cuál es la probabilidad de que un accidente no esté relacionado con conductores ebrios? e. ¿Cuál es la probabilidad de que el accidente ocurra de noche o esté relacionado con un conductor alcoholizado? 4. El director regional de salud, está preocupado por la posibilidad de que algunos de sus empleados vayan a huelga. Estima que la posibilidad de que sus médicos vayan a huelga es de 0.70 y la probabilidad de que sus enfermeras vayan a huelga es de 0.55. Además estima que si las enfermeras van a huelga, existe 85% de posibilidades de que los médicos realicen un paro solidario de actividades. a. ¿Cuál es la probabilidad de que ambos grupos se vayan a huelga? b. Si los médicos hacen huelga, ¿Cuál es la probabilidad de que las enfermeras lo hagan también como acto de solidaridad? c. ¿Cuál es la probabilidad de que las enfermeras no vayan a huelga? Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 59
Lic. Carlos A. Ávila (MAE Administración de Empresas)
d. ¿Cuál es la probabilidad de que los médicos no vayan a huelga? e. ¿Cuál es la probabilidad de que los médicos o las enfermeras vayan a huelga? 5. Una compañía desea actualizar su sistema de computación y una parte importante de la actualización es un nuevo sistema operativo. La compañía ha pedido a un ingeniero que evalúe el sistema operativo. Suponga que la probabilidad de una evaluación favorable es 0.65. Si la probabilidad de que la compañía actualice su sistema dada una evaluación favorable es 0.85. ¿Cuál es la probabilidad de que la compañía actualice su sistema y reciba una evaluación favorable? 6. La biblioteca de la universidad ha entrevistado a afiliados elegidos al azar durante el último mes para ver quienes usan la biblioteca y que servicios requieren. Los afil iados se clasifican en licenciatura, postgrado y académicos. Los servicios se clasifican como consulta, publicaciones periódicas o libros. La tabla contiene los datos de 350 personas. Suponga que los afiliados usan solo un servicio por visita. Afiliados Referencia Publicaciones periódicas Libros Licenciatura 44 26 72 Postgrado 24 61 20 Académicos 16 69 18 84 156 110 Encuentre la probabilidad de que un afiliado seleccionado al azar: a) Sea estudiante de Licenciatura. b) Visite la sección de publicaciones periódicas, dado que es un estudiante de Postgrado. c) Sea Académico y visite la sección de libros. d) Si visita la sección de Referencias, entonces sea estudiante de Postgrado e) No sea Académico f) No visite las publicaciones periódicas g) Visite la sección de libros o no sea estudiante Académico 7. Dado que Pb (A)=3/4, Pb (B)=1/6, Pb (C)=1/3, Pb (AC)=1/7 y Pb (B/C)=5/21, encuentre las siguientes probabilidades: Pb (A/C), Pb (C/A), Pb (BC) y Pb (C/B). 8. Suponga que para 2 eventos A y B, Pb (A)=0.65, Pb (B)=0.80, Pb (A/B)=Pb(A) y Pb (B/A)=0.85. ¿Es esta una asignación de probabilidad consistente?
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 60
Lic. Carlos A. Ávila (MAE Administración de Empresas)
En cierta medida, estas distribuciones están relacionadas a las distribuciones de frecuencia. Es un despliegue de todos los posibles resultados de un experimento junto con las probabilidades de cada resultado. Es un listado de las probabilidades de todos los posibles resultados que podrían obtenerse si el experimento se llevara a cabo. Existen dos tipos de distribuciones de Probabilidad: Discreta: Aquí la variable principal solo puede tomar un número limitado de valores. Continua: En este tipo de distribución, la variable considerada puede tomar cualquier valor dentro de un rango o intervalo dado. Una variable es aleatoria si toma diferentes valores como resultado de un experimento aleatorio. Esta variable puede ser: Variable aleatoria discreta : la variable puede tomar solo un número limitado de valores. Variable aleatoria continua : la variable puede tomar cualquier valor dentro de un rango o intervalo dado. Valor Esperado E(X): De una variable aleatoria discreta, es la media ponderada de todos los
posibles resultados en los cuales los pesos son las probabilidades respectivas de tales resultados. Media o Valor Esperado µ = E(X) = ∑ (Xi) P (Xi) 2
2
Varianza de una distribución σ = ∑ (Xi - µ) P (Xi)
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 61
Lic. Carlos A. Ávila (MAE Administración de Empresas)
1. Basándose en la siguiente grafica de una distribución de probabilidad, construya una tabla que corresponda a la grafica.
2. La presidenta nacional de la asociación contra el cáncer, intenta estimar la cantidad que ofrecerá cada persona en la tele maratón anual de la asociación. Usando los datos recolectados en los últimos 10 años, calculo las siguientes probabilidades de las diferentes cantidades prometidas. Dibuje una grafica que ilustre esta distribución de probabilidad. Donaciones $25 $50 $75 $100 $125 Probabilidades 0.45 0.25 0.15 0.10 0.05 3. Las siguientes variables aleatorias ¿son discretas o continuas? En cada caso explique el porqué de su respuesta. Los carros vendidos por Roberto Los ingresos que gana Roberto Los tiempos de terminación de un trabajo en particular Los empleados requeridos para completar dicho trabajo
4. Bob Walters, quien invierte con frecuencia en el mercado de valores, estudia con detenimiento cualquier inversión potencial. En la actualidad examina la posibilidad de invertir en una compañía de electricidad. Mediante el estudio del rendimiento en el pasado, Walters ha desglosado los resultados potenciales en cinco resultados de sus probabilidades asociadas. Los resultados son tasas de rendimientos anuales sobre una sola acción que hoy cuesta $150. Encuentre el valor esperado del rendimiento sobre la inversión en una sola acción de la compañía. Rendimiento de la inversión ($) 0.00 10.00 15.00 25.00 50.00 Probabilidad 0.20 0.25 0.30 0.15 0.10 5. José Martínez acaba de comprar un Blue Ray en Jetstereo a un costo de L. 5700.00. Ahora tiene la opción de comprar una póliza de servicio extendido que ofrece 5 años de cobertura por L. 1900.00. Después de hablar con sus amigos y leer los informes, José cree que puede incurrir en los siguientes gastos de mantenimiento durante los próximos 5 años: Gasto 0 50 100 150 200 250 300 Probabilidad 0.35 0.25 0.15 0.10 0.08 0.05 0.02
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 62
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Encuentre el valor esperado de los costos de mantenimiento pronosticados. ¿Debe José pagar L. 1900.00 por la garantía? 6. Sea X una variable aleatoria discreta que representa la cantidad de servicios de diagnostico que un niño recibe durante una visita al consultorio de un pediatra; estos servicios incluyen procedimientos como los análisis de sangre y de orina. La distribución de probabilidad de X se muestra a continuación: r P (X=r) 0 0.671 1 0.229 2 0.053 3 0.031 4 0.010 5+ 0.006 Total 1.000 a) Elabore una grafica de distribución de probabilidad. b) Encuentre el valor esperado. c) ¿Cuál es la probabilidad de que un niño reciba exactamente tres servicios de diagnostico en una visita al consultorio del pediatra? d) ¿Cuál es la probabilidad de que el niño reciba por lo menos un servicio? e) ¿Cuál es la probabilidad de que un niño reciba cuatro o más servicios? 7. Sea X una variable aleatoria de una distribución de probabilidad, que representa el orden de nacimiento de los niños nacidos en Honduras: r P (X=r) 1 0.416 2 0.330 3 0.158 4 0.058 5 0.021 6 0.009 7 0.004 8+ 0.004 Total 1.000 a) ¿Cuál es la probabilidad de que un niño sea el primogénito o el segundo hijo? b) ¿Cuál es la probabilidad de que un bebe sea cuando mucho el tercer hijo nacido? c) Dibuje una grafica de distribución de probabilidad. d) Calcule el valor esperado. Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 63
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Entre las distribuciones aleatorias discretas más comunes tenemos : Distribución Binomial : Esta distribución describe una variedad de procesos de interés para los administradores y economistas, y describe datos discretos, que son resultado de un experimento conocido como Proceso de Bernoulli, en honor al matemático suizo del siglo XIX, Jacob Bernoulli. La distribución Binomial es apropiada solo si la probabilidad de éxito permanece constante, esto ocurre si el muestreo se realiza con reemplazo o cuando la población es infinita (muy grande). Este proceso puede describirse en cuatro propiedades: 1. Cada intento tiene solamente dos resultados posibles: Éxito o Fracaso. 2. La probabilidad de un éxito (p) sigue siendo constante de un ensayo al siguiente, al igual que lo hace la probabilidad de fracaso (q). Dicho de otro modo, la probabilidad de resultado de cualquier intento, permanece fijo con respecto al tiempo. 3. El éxito y el fracaso son mutuamente excluyentes. 4. Los intentos son estadísticamente independientes, es decir, el resultado de un evento no afecta el resultado de cualquier otro evento subsecuente. 5. El experimento puede repetirse muchas veces. La formula Binomial es: Probabilidad de r éxitos en n ensayos =
n! pr qn-r. r! (n-r)!
En donde: p = probabilidad de tener éxito q = probabilidad de de fracaso (q = 1 – p) r = numero de éxitos deseados n = numero de intentos hechos En distribución Binomial es posible obtener la media y la desviación estándar, así: La Media µ = np La desviación estándar
σ = √npq
1. En 2007, 35% de los adultos son fumadores de alguna forma (cigarrillos, puros o pipas). A través de una distribución Binomial, de una muestra de 14 personas, encuentre la probabilidad de: a. ¿Que por lo menos 6 personas fumen de alguna forma? Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 64
Lic. Carlos A. Ávila (MAE Administración de Empresas)
b. c. d. e. f.
¿Cuándo mucho 3 personas fumen? ¿Que 4 personas fumen de cualquier forma? ¿Que todas fumen? ¿Que ninguna persona fume? Encuentre la media y la desviación estándar para este caso.
2. Al ministerio de Salud le interesa estudiar la probabilidad de que un paciente que ha sido inyectado con una jeringa infectada con hepatitis B contraiga la enfermedad. Si 30% de los pacientes expuestos a la hepatitis B se infecta, encuentre a partir de una muestra de 17 personas: a. ¿La probabilidad de que por lo menos 3 individuos contraigan hepatitis B? b. ¿La probabilidad de que cuando mucho 6 pacientes contraiga la enfermedad? c. ¿La probabilidad de que 14 pacientes contraigan la enfermedad? d. Encuentre la media y la desviación Standard para este caso. 3. De acuerdo con la Encuesta Nacional de Salud en Honduras, 20% de la población es zurda. a. ¿Cuál es la probabilidad de que exactamente tres de once personas sean zurdas? b. ¿Cuál es la probabilidad de que por lo menos seis de once personas sean zurdas? c. ¿Cuál es la probabilidad de que cuando muchos dos individuos del total de la muestra sean zurdos? d. ¿Cuál es la probabilidad de que por lo menos cuatro personas sean zurdas? e. Encuentre la media y la desviación estándar de este caso. 4. En un fin de semana en la Emergencia del Hospital Mario Catarino Rivas, se presentan 9 casos sospechosos de ser portadores de la Influenza AH1N1, pues presentan los síntomas característicos de la enfermedad. De acuerdo a esta muestra asumiendo que tiene las características de una distribución Binomial (la tasa de incidencia es de 25%) encuentre: a. ¿Cuál es la probabilidad de que dos personas del grupo sean casos confirmados de la enfermedad? b. ¿Cuál es la probabilidad de que 9 de ellas tengan un cuadro positivo confirmado de la enfermedad? c. ¿Cuál es la probabilidad de que a lo sumo tres de ellas sean casos confirmados de la enfermedad? d. Encuentre la media y la desviación Standard de esta situación
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 65
Lic. Carlos A. Ávila (MAE Administración de Empresas)
5. En un jardín de niños, una profesora ha encontrado que existe un 60% de posibilidades de que un estudiante lleguen temprano. Encuentre la probabilidad de que de una muestra de 12 estudiantes: a. Tres lleguen tarde a clases b. Por lo máximo 7 lleguen tarde a clases c. Uno de ellos llegue tarde a clases d. Por lo menos 5 lleguen tarde a clases e. Encuentre la media y la desviación estándar para esta situación. 6. En una encuesta a boca de urna hoy 29 de noviembre, día de las elecciones generales, muy a pesar de los esfuerzos de la resistencia por no validar las elecciones, un periodista ha encontrado que existe un 55% de posibilidades de que una persona vote por el partido liberal. Cuál es la probabilidad de que de una muestra de 20 electores: a. ¿8 electores voten por el partido nacional? b. ¿Ningún elector vote por el partido nacional? c. ¿17 voten por el partido nacional? d. ¿Cuándo mucho 10 voten por el partido nacional? e. ¿Por lo menos 5 electores voten por el partido nacional? f. Encuentre la media y la desviación estándar de la intención de voto del día 29 de noviembre.
Distribución Hipergeometrica : esta distribución aplica en casos cuando la
población (N) es pequeña y ocurre el muestreo sin reemplazo, lo que implica que la probabilidad de éxito variara, y no será constante. La formula es: Distribución
P (x) = rCx
N-rCn-x NCn
Hipergeometrica En donde: N = tamaño de la población r = numero de éxitos de la población n = tamaño de la muestra x = numero de éxitos de la muestra
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 66
Lic. Carlos A. Ávila (MAE Administración de Empresas)
1. Como subgerente de una empresa de materias primas, usted debe contratar 10 personas entre 30 candidatos, de los cuales 22 tienen títulos universitarios. ¿Cuál es la probabilidad de que 5 de los que usted contrate tengan un titulo? 2. Cuarenta trabajadores de una oficina han recibido nuevos computadores. 27 tienen una nueva tecnología llamada MMX. Si se seleccionan 10 aleatoriamente, ¿Cuál es la probabilidad de que 3 de ellos estén equipados con la tecnología? 3. Una encuesta ha revelado, que 6 de 10 empleados ganan más de L.200,000 al año. De 3 empleados seleccionados, ¿Cuál es la probabilidad de que los 3 ganen esa cifra?
Distribución de Poisson : Ideada por el matemático francés Simeón Poisson (1781 –
1840), la distribución Mide la probabilidad de un evento aleatorio sobre algún intervalo de tiempo o espacio. Ejemplo de algunos procesos descritos a través de esta distribución como ser: la distribución de llamadas telefónicas que llegan a un conmutador, la demanda de pacientes que requieren servicio en una institución de salud, la llegada de automóviles a una caseta de peaje y el numero de accidentes registrados en cierta intersección de calles. Las características principales que determinan una distribución de Poisson son: 1. La probabilidad de ocurrencia del evento es constante para dos intervalos cualesquiera de tiempo o espacio. 2. La ocurrencia del evento en un intervalo es independiente de la ocurrencia de otro intervalo cualquiera. La fórmula para esta distribución es: P (x) = λx x е-λ
X! En donde: X = número de veces que se presenta el evento. λ = número promedio de ocurrencias por unidad de espacio o tiempo. e = 2.71828, base de la función exponencial natural. λ = np (Así se puede calcular la media cuando no se da directamente el valor de esta
variable) Es importante destacar que la distribución de Poisson es una buena aproximación de la distribución Binomial cuando n es igual o mayor que 20 y p es igual o menor a 0.05
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 67
Lic. Carlos A. Ávila (MAE Administración de Empresas)
1. De acuerdo con el Departamento de Salud de Massachusetts, 224 mujeres que dieron a luz en este estado, en 1998, obtuvieron resultados positivos del anticuerpo del VIH. Suponga que con el tiempo 25% de los bebes nacidos de estas mujeres lleguen a ser seropositivos. Bajo la distribución de Poisson: a) Si se eligen muestras de n=224 individuos de una población de niños nacidos de mujeres con el anticuerpo de VIH. ¿Cuál sería la cantidad media de niños infectados por muestra? b) ¿Cuál sería la desviación Standard? 2. La cantidad de casos de tuberculosis informados por la Secretaria de Salud durante un solo mes posee una distribución de Poisson con parámetro λ=3.5.
a) ¿Cuál es la probabilidad de que se informen al menos 8 casos de tuberculosis en un mes determinado? b) ¿Cuál es la probabilidad de que a lo sumo se presenten 5 casos de esta enfermedad? c) ¿Cuál es la probabilidad de que no se presente ningún caso? d) ¿Cuál es la probabilidad de que se presenten 7 casos de la enfermedad? e) Encuentre la media y la desviación Standard de este situación 3. En cierto municipio la cantidad de suicidios reportados cada mes en promedio es de 2.75 (λ). Suponga que la cantidad de suicidios da como resultado una distribución de
a) b) c) d) e)
Poisson. ¿Cuál es la posibilidad de que no se reporte un suicidio durante un mes determinado? ¿Cuál es la probabilidad de que se reporten 8 suicidios? ¿Cuál es la probabilidad de que a lo sumo se reporten cuatro suicidios? ¿Cuál es la posibilidad de que se reporten seis o más suicidios? Encuentre la desviación Standard.
4. El juzgado contencioso de San Pedro Sula, maneja varios tipos de litigios, pero la mayoría de tipo conyugal. De hecho 96% de los pleitos que se atienden en el juzgado son de tipo conyugal. Cuál es la probabilidad de que de 80 litigios que se atienden en los juzgados: a) Exactamente 7 no sean de tipo conyugal. b) 10 de ellos no sean de tipo conyugal. c) Por lo menos 8 no sean de tipo conyugal. d) A lo sumo 5 no sean de tipo conyugal.
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 68
Lic. Carlos A. Ávila (MAE Administración de Empresas)
5. El departamento de impresiones y grabados es el principal responsable de imprimir papel moneda en los Estados Unidos. El departamento tiene una impresionante baja frecuencia de errores de impresión; solo 0.5% de los billetes presentan errores graves que no permiten su circulación. Cuál es la probabilidad de que de un fajo de 1000 billetes: a) ¿Ninguno presente errores graves? b) ¿Diez presenten errores que no permitan su circulación? c) ¿A lo sumo catorce no presenten errores de circulación? d) ¿Por lo menos 8 presenten errores que impidan su circulación? 6. Sea X una variable aleatoria que representa la cantidad de niños en un grupo de 2000 que mueren antes de alcanzar su primer año de vida. En América Central, la probabilidad de que un niño muera durante su primer año de vida es de 0.0085. Asuma que este caso origina una distribución de Poisson. (Haga uso de la formula) a) ¿Cuál es la cantidad media de niños que morirían en un grupo de este tamaño? b) ¿Cuál es la probabilidad de que a lo sumo cinco años de un total de 2000 mueran en su primer año de vida? c) ¿Cuál es la probabilidad de que entre 15 y 20 niños mueran durante su primer año de vida? d) ¿Cuál es la probabilidad de que a lo sumo tres niños mueran durante su primer año de vida? e) ¿Cuál es la probabilidad de que 7 niños mueran durante su primer año de vida? f) Encuentre la desviación estándar de esta situación.
Distribución Exponencial :
Es una distribución continua. Mide el paso el paso del tiempo entre el numero de ocurrencias, a diferencia de la distribución de Poisson que mide el numero de ocurrencias en un determinado intervalo de tiempo o espacio. Mientras la distribución de Poisson describe las tasas de llegada dentro de algún periodo dado, la distribución exponencial estima el lapso entre tales arribos. Si el número de ocurrencias tiene distribución de Poisson, el lapso entre las ocurrencias estará distribuido exponencialmente. La probabilidad de que el lapso sea menor o que o igual a cierta cantidad x es: -µt Distribución Exponencial P (X≤x) = 1 – е En donde: t = lapso de tiempo е = la función exponencial natural µ = tasa promedio de ocurrencia
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 69
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Es importante mencionar que con el paso del tiempo X aumenta, y la probabilidad disminuye.
1. Los aviones llegan a un pequeño aeropuerto en Roatán, a una proporción de dos por hora. Tomara una hora reparar un rampa utilizada para desembarcar pasajeros. ¿Cuál es la probabilidad de que un avión llegue mientras la rampa esta en reparación? 2. El computador principal de la universidad queda fuera de línea tres veces por semana. Un catedrático debe completar un proyecto que necesita de la computadora. ¿Cuál es la probabilidad de que el computador este fuera de línea toda la semana? 3. Durante un día típico de trabajo de 8 horas, las computadoras usadas para vigilar la etapa de enfriamiento en la producción de neumáticos para autos señalan que la temperatura no se mantiene en forma apropiada en 30 oportunidades. El director ejecutivo de la compañía, está por hacer una inspección de la planta durante 30 minutos. ¿Cuál es la probabilidad de que este allí cuando se active la señal del computador?
Distribución Uniforme : Es una distribución en la cual las probabilidades de todos
los resultados son las mismas. Todos los resultados sobre el rango total de posibilidades de distribución son igualmente posibles desde el mínimo valor a hasta el máximo valor b. En una distribución uniforme, las probabilidades son las mismas para todos los posibles resultados. La media o valor esperado de una distribución uniforme esta a la mitad de camino entre sus dos puntos extremos, así:
E (x) = µ = a + b 2 La varianza de una distribución uniforme de probabilidad es: 2 2 σ = (b – a)
12 El área total bajo la curva debe ser igual a 1 o 100%. Debido a que el área es la altura por el ancho, la altura es:
Altura = Área = 1 Ancho b - a Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 70
Lic. Carlos A. Ávila (MAE Administración de Empresas)
En donde b-a es el ancho o rango de la distribución. La probabilidad de que una observación caiga entre dos valores es: P (X1≤X≤X2) = X2 – X1
Rango
1. Generalmente le toma entre 1.2 y 1.7 horas aproximadamente hacer su tarea de estadística. Los tiempos están distribuidos de manera uniforme. ¿Qué tan probable es que usted termine a tiempo para reunirse con sus amigos dentro de 1.4 horas? 2. Las latas de alimentos para perros Puppy Chow tiene un promedio de 16 onzas, con un rango de 4.2 onzas. a) ¿Cuál es la lata más pequeña en onzas que usted puede comprar para un perro? b) ¿Cuál es la lata más grande que usted puede comprar para su perro lobo llamado Killer? c) ¿Si usted selecciona una lata al azar, cual es la probabilidad de que pese entre 15.8 y 16.5 onzas? 3. El tiempo requerido para conseguir una pista de bolos en un local oscila entre 23.5 y 40.5 minutos. Asumiendo una distribución uniforme, si la probabilidad de que usted tenga que esperar más de 30 minutos excede del 60%, usted piensa jugar golf. ¿Cual bolsa debería colocar en su baúl, la bolsa de golf o la de bolos? 4. El agua utilizada por un car-wash para lavar los carros es de 30 galones por carros. Lo menos que se utiliza son 27 galones, y su uso esta distribuidora uniformemente. Una encuesta muestra que los carros no quedan limpios a menos que se utilicen 32 galones de agua en la lavada. ¿Qué porcentaje de carros que salen del car-wash quedan limpios?
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 71
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Distribución Normal : Es una distribución continua, pues se puede tomar cualquier
valor que este en un intervalo de valores dado. Aunque varios matemáticos han contribuido a su desarrollo, su principal aporte se le debe al astrónomo matemático Karl Gauss (siglo XIX). Existen dos razones básicas para definir que la distribución normal es la más usada y más importante de todas en la Estadística: 1. Tiene algunas propiedades que la hacen aplicable a un gran número de situaciones en las que es necesario hacer inferencias mediante la toma de muestras. 2. La distribución normal casi se ajusta a las distribuciones de frecuencias reales observadas en muchos fenómenos, que incluyen características humanas (pesos, alturas, IQ), resultados de procesos físicos (dimensiones y rendimientos), etc. Características de la Distribución Normal 1. La curva tiene un solo pico; por tanto, es unimodal. Tiene una forma de campana. 2. La media de la población distribuida normalmente cae en el centro de su curva normal. 3. Debido a la simetría de la distribución normal de probabilidad, la mediana y la moda de la distribución se encuentran también en el centro; en consecuencia, para una curva normal, la media, la mediana y la moda tienen el mismo valor. 4. Los dos extremos de la distribución normal de probabilidad se extienden indefinidamente y nunca tocan el eje horizontal. Se dice que no hay una sola distribución normal, sino una familia de curvas normales. Para definir una distribución de este tipo, solo se necesitan dos parámetros: la media (µ) y la desviación estándar (σ) . No importa cuáles sean los valores de µ y σ para una distribución normal, el área total bajo la curva es 1.00, destacando que las aéreas bajo la curva se consideran como probabilidades.
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 72
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Ya que puede existir un número infinito de distribuciones normales, cada uno con su propia media y desviación estándar, es imposible analizar por separado cada una de ellas, por lo tanto es necesario convertir todas estas distribuciones normales a una forma estándar. Esta conversión a la distribución normal estándar se efectúa con la formula de conversión o formula Z.
(Formula Z)
Z = X -µ σ
Valor de Z: Es el numero de desviaciones estándar a las que una observación estará por encima o por debajo de la media.
1. La presión arterial diastólica entre las mujeres de 18 a 74 años de edad se encuentra distribuida no rmalmente con una media de μ=80 mm Hg y una desviación Standard de σ= 11.6 mm Hg.
a) ¿Cuál es la probabilidad de que una mujer elegida al azar tenga una presión arterial diastólica menor de 65 mm Hg? b) ¿Cuál es la probabilidad de que la mujer tenga la presión arterial diastólica mayor que 85 mm Hg? c) ¿Cuál es la probabilidad de que una mujer tenga una presión arterial diastólica de entre 60 y 90 mm Hg? d) ¿Cuál es la probabilidad de que una mujer tenga una presión arterial diastólica superior a 70 mm Hg? e) ¿Cuál es la probabilidad de que una mujer tenga una presión arterial diastólica de por lo menos 80 mm Hg? 2. La distribución de pesos de la población de varones en Estados Unidos es aproximadamente normal con una media de μ= 172.2 libras y una desviación estándar de σ= 29.8 libras.
a) ¿Cuál es la probabilidad de que un hombre elegido al azar pese menos de 130 libras? b) ¿Cuál es la probabilidad de que pese más de 210 libras? c) ¿Cuál es la probabilidad de que un varón escogido al azar tenga un peso fuera del rango de 130 a 210 libras? d) ¿Cuál es la probabilidad de que pese más de 160 libras? e) ¿Cuál es la probabilidad de que pese menos de 180 libras?
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 73
Lic. Carlos A. Ávila (MAE Administración de Empresas)
3. En la zona noroccidental, la jefatura de transito ha determinado basado en hechos históricos, que anualmente se presentan 8000 accidentes de tránsito con una desviación estándar de 600. a) ¿Cuál es la probabilidad de que en este año 2009 se presenten menos de 7500 accidentes? b) ¿Cuál es la probabilidad de que en esta zona sucedan más de 9,000 accidentes? c) ¿Cuál es la probabilidad de que transito reporte entre 7000 y 8500 accidentes? d) ¿Que se presenten cuando mucho 8300 accidentes? e) ¿Que no se presenten a lo sumo 9500 accidentes? 4. En una unidad de la Cruz Roja se midieron los niveles de colesterol en la sangre en un grupo de personas mayores de 45 años resultados que arrojaron una media μ= 244 mg/100 ml y la desviación estándar σ= 51 mg/100 ml. A partir de estos datos estime:
a) ¿Cuál es la probabilidad de que el nivel de colesterol para este grupo sea de cuando mucho 220 mg/100 ml? b) ¿Cuál es la probabilidad de que una persona seleccionada al azar de este grupo tenga más de 260 mg/100 ml? c) ¿Si se establece que con un nivel de 300 mg/100 ml, una persona desarrollo una enfermedad coronaria, Cual es la probabilidad de que un individuo padezca de una enfermedad coronaria? 5. Una institución ha creado un programa de entrenamiento diseñado para mejorar las habilidades de supervisión para aplicar en el departamento de producción de cualquier empresa. Debido a que el programa es auto administrado, los supervisores requieren un número diferente de horas para terminarlo. Bajo estudios anteriores, el tiempo medio que se lleva para completar el programa es de 500 horas, con una desviación estándar de 100 horas, normalmente distribuida. Encuentre la probabilidad de que un participante requiera: a) ¿Más de 450 horas para completar el programa? b) ¿Entre 480 y 530 horas para finalizar el entrenamiento? c) ¿A lo sumo 700 horas para finalizar el programa? d) ¿Cuándo mucho 600 horas para finalizar el programa? e) ¿Un máximo de 460 horas? f) ¿Encuentre la media y la desviación estándar de la situación? 6. En su tercer año de funcionamiento, una liga de futbol tuvo un promedio de 16200 aficionados por juego, con una desviación estándar de 2500. De acuerdo con los datos cual es la probabilidad de que el número de aficionados en cualquier juego sea: Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 74
Lic. Carlos A. Ávila (MAE Administración de Empresas)
a) b) c) d) e)
¿Mayor de 20,000? ¿Menor a los 10,000? ¿Este entre 13,000 y 18,500? ¿Por lo menos 12,000? ¿Cuándo mucho 17,600?
7. Los sobrecostos por actualización de computadoras en su empresa tienen un promedio de $23,500, con una desviación estándar de $9,400. Como director ejecutivo de la división de investigación, usted no desea arriesgarse a más de 34% de probabilidad que el sobrecosto en una actualización propuesta recientemente exceda de $25,000. ¿Debería ejecutar la actualización? 8. Los empleados de una compañía trabajan un promedio de 55.8 horas por semana, con una desviación estándar de 9.8 horas. Los ascensos son más probables para los empleados que están dentro del 10% de los que pasan más tiempo trabajando. ¿Cuánto debe trabajar usted para mejorar sus oportunidades de ascenso?
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 75
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 76
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 77
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 78
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 79
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 80
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 81
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 82
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 83
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 84
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 85
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 86
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 87
Lic. Carlos A. Ávila (MAE Administración de Empresas)
Asignatura: ESTADISTICA I
UNIVERSIDAD CATOLICA DE HONDURAS Página 88
Lic. Carlos A. Ávila (MAE Administración de Empresas)