PROBLEMAS DE ESTADÍSTICA
2014/15
Estadística
PROBLEMAS
2014/2015
1.
Lo único legible de una tabla con las distribuciones de frecuencias absolutas y relativas de una variable estadística es 𝑥𝑖 𝑛𝑖 𝑓𝑖 1 12 2 0.125 3 18 4 0.175 8 20 0.25 9 0.075 a) Completa la tabla. b) Halla la mediana y la moda.
2.
Para la siguiente distribución, obtén la tabla de frecuencias completa, indicando la variable con la que se trabaja, los distintos tipos de frecuencia que pueden definirse para esa variable y, en caso de datos agrupados, los elementos que la caracterizan. Comenta la representación gráfica más adecuada y calcula el recorrido intercuartílico. a) 10 agentes hacen 2 visitas en un día 23 agentes hacen 3 o menos visitas en un día 30 agentes hacen 4 o menos visitas en un día 32 agentes hacen 5 o menos visitas en un día b) Importe de los géneros devueltos a almacén: 1/10 devoluciones por importe máximo de 1000€ 1/4 devoluciones por importe máximo de 2000€ 1/2 devoluciones por importe máximo de 3000€ 8/10 devoluciones por importe máximo de 5000€ todas las devoluciones por importe máximo de 8000€
3.
Se considera una variable estadística X a cuya distribución de frecuencias relativas le corresponde el diagrama de barras siguiente:
a) Halla la media y la varianza de X. b) Halla el porcentaje de las observaciones que son menores o iguales a 2.5 (llamado “rango percentil del valor 2.5”). c) Halla el menor valor de X en la muestra tal que al menos el 25 % de las observaciones son menores o iguales a él (llamado “percentil de orden 25” o “primer cuartil” de la distribución de X). 4.
Preguntadas 50 personas sobre su tiempo de espera en una parada de autobús se obtuvieron los siguientes resultados expresados en minutos: 2, 5, 3, 1, 0, 4, 6, 0, 3, 7, 8, 4, 6, 6, 9, 1, 2, 10, 8, 3, 0, 7, 1, 5, 2, 10, 1, 5, 4, 7, 9, 6, 2, 4, 8, 9, 3, 5, 6, 0, 7, 8, 1, 3, 7, 2, 10, 3, 6, 7. a) Construye la tabla de frecuencias absolutas y relativas (acumuladas y sin acumular). b) Calcula el tiempo medio de espera. c) ¿Qué porcentaje de individuos espera entre 3 y 5 minutos inclusive?
5.
Dadas una variable estadística X y una constante 𝑎: ̅̅̅̅ y ̅̅̅̅̅̅̅̅ a) calcula ̅̅̅̅̅̅̅ 𝑋 + 𝑎, 𝑎𝑋 𝑋 − 𝑋̅ b) calcula el valor de 𝑎 que minimiza ̅̅̅̅̅̅̅̅̅̅̅ (𝑋 − 𝑎)2 2 2 c) calcula 𝑆𝑋+𝑎 y 𝑆𝑎𝑋 d) demuestra que 𝑆𝑋2 = ̅̅ 𝑋̅̅2 − 𝑋̅ 2
6.
Se realizan 12 mediciones del pH de cierto compuesto químico, resultando un pH medio de 5.5. Se realiza una nueva medición del pH, siendo ésta de 5.6. Determina razonadamente el pH medio de las 13 mediciones.
7.
Sea X una variable estadística que sobre una muestra de 8 individuos toma los valores 1, 2 y 3. Si el número de individuos con 𝑋 ≤ 2 es 4 y 𝑋̅ = 17/8, define y calcula la mediana y la desviación típica de X.
Enunciados para pensar y/o resolver
Página 1
Estadística
PROBLEMAS
2014/2015
8.
La media de una variable estadística para una primera muestra es 3 y la varianza es 5. La media de esa variable estadística para una segunda muestra es 6 con una varianza de 8. Si la primera muestra consta de 15 individuos y la segunda muestra consta de 25, halla razonadamente la media y la desviación típica de esa variable para la muestra obtenida al unir las dos anteriores.
9.
Los datos siguientes corresponden al número de averías diarias en los ordenadores de una sala durante 30 días. 1 1 3 1 0 1 0 1 0 1 2 2 0 0 0 1 2 1 2 0 0 1 6 4 3 3 1 2 4 0 a) Construye la distribución de frecuencias y represéntala gráficamente. b) Calcula la media, mediana y desviación típica. ¿Cómo se vería afectada la media si todos los días hay dos averías más? ¿Y la mediana? c) Calcula el recorrido y el menor valor de la variable que deja por debajo al menos el 25 % de los datos. d) ¿Cómo se modifican las respuestas anteriores si la observación igual a 6 es un error de transcripción y, en realidad, es un 0? Interpreta los resultados.
10. Se han tomado 8 mediciones de la temperatura (en grados Farenheit) de diferentes hornos usados en la fabricación de semiconductores, con los siguientes resultados: 953 955 957 950 951 954 948 955 ¿Cuánto podría aumentar la temperatura máxima sin que cambie la mediana? 11. Propón, si existen, dos conjuntos de 5 datos que tengan: a) la misma media y diferente desviación típica b) distinta media y la misma desviación típica c) la misma mediana y diferente recorrido d) distinta mediana y el mismo recorrido 12. Una muestra de 𝑛 individuos se divide en dos grupos de tamaños 𝑛1 y 𝑛2 , respectivamente (𝑛1 + 𝑛2 = 𝑛) para estudiar cierta característica. a) Si la media en el primer grupo es 𝑎 y en el segundo grupo es 𝑏, ¿cuál es la media en dicha muestra? b) Si las medias de ambos grupos son iguales y las varianzas de cada grupo son respectivamente 𝑝 y 𝑞, ¿cuál es la varianza en la muestra global? 13. En una empresa 4 personas tienen un sueldo semanal entre 200 y 300 €, 7 cobran entre 300 y 400 €, 15 cobran entre 400 y 500 €, 12 cobran entre 500 y 600 €, 9 cobran entre 600 y 700 €, 5 cobran entre 700 y 800 €, 2 cobran entre 800 y 900 € y otras 2 cobran entre 900 y 1000 €. Calcula la tabla de frecuencias, indicando las marcas de clase, y construye una representación gráfica adecuada. 14. Un coche parte de Barcelona hacia Madrid efectuando el recorrido de ida a una media de 70 km/h, mientras que el de regreso lo hace a una velocidad media de 80 km/h. Halla la velocidad media del viaje completo. 15. En una empresa hay dos clases de trabajo: A y B. El sueldo medio es de 800 €. El sueldo medio de los que realizan el trabajo A es de 900 € y el de los de la clase B es de 750 €. ¿Qué porcentaje de empleados hay de cada clase? 16. Se hacen 360 observaciones de cierto proceso que pueden arrojar los siguientes resultados: A, B, C y D. Se sabe que las frecuencias relativas de A, B y C son respectivamente 1/3, 2/9 y ¼. Halla todas las frecuencias absolutas y relativas. 17. Una empresa de butano quiere colocar en una red viaria un depósito para abastecer a los pueblos que están situados en los kilómetros 10, 50, 80, 140, 290 y 450. Suponiendo que todos los pueblos consumen la misma cantidad, ¿en qué punto kilométrico deben colocar el depósito de forma que los gastos de abastecimiento sean mínimos? 18. Los datos siguientes corresponden a aumentos de peso en mg/cm3 en muestras de aleación Ti-Cr debido a la oxidación cuando se exponen a CO2 durante una hora a 1000ºC. Aumento de peso (𝑥𝑖 ) 5.8 5.9 6 6.1 6.2 6.6 1 6 12 25 49 7 𝑛𝑖 a) Calcula la media, mediana y desviación típica de los datos. b) ¿Qué porcentaje de muestras observadas aumentan menos de 6 mg/cm 3? ¿Qué porcentaje tienen un aumento de peso mayor de 6.5 mg/cm3? ¿Qué porcentaje tiene un aumento entre 5.8 y 6.1 mg/cm3? c) Posteriormente se aplican dos tipos de substancias A y B a dichas muestras. La substancia A produce un aumento de 0.2 mg/cm3 en el peso de las muestras a las que se aplica. La substancia B hace que el aumento de peso sea el doble del obtenido experimentalmente. ¿Cuál de los dos tipos de substancias produce una menor desviación típica en el peso? ¿Por qué? Enunciados para pensar y/o resolver
Página 2
Estadística
PROBLEMAS
2014/2015
19. En una empresa los empleados se encuentran clasificados en tres categorías A, B y C, de forma que se tienen los siguientes datos: Categoría Número de empleados Salario mensual (en euros) A 130 1450 B 50 2000 C 20 3000 a) Calcula el salario medio para el conjunto de la empresa. b) Estudia cómo se modificaría el salario medio si: 1) se elevan todos los salarios un 5 % 2) se incrementan todos los salarios en 40 euros 3) se aumentan un 10 % en la categoría A, un 8 % en la B y un 4 % en la C. 20. Una persona compra 5 kg de café a 15 € el kg, otros 5 kg a 19 € el kilo y otros 5 kg a 21 € el kg. ¿Cuál es el precio medio del café comprado? 21. Cierto tipo de instrumento electrónico ha sido fabricado simultáneamente por dos empresas A y B. En una muestra de 75 instrumentos fabricados por A la duración media resultó ser de 4.5 años, mientras que en una muestra de 90 instrumentos de B la duración media fue de 5 años. ¿Cuál fue la duración media en la muestra de los 165 instrumentos? 22. El número de empleados de las 30 oficinas que una entidad bancaria posee en una ciudad presenta la siguiente distribución: Nº empleados Nº oficinas 4 o menos 3 8 o menos 14 14 o menos 26 35 o menos 30 a) Obtén el número medio de empleados de esas oficinas. b) ¿Cuál es el número mínimo de empleados que tiene el 15 % de las oficinas con más empleados? c) ¿Cuántas oficinas tienen como máximo 15 empleados? ¿Tiene este valor alguna relación con el calculado en el apartado anterior? d) Si en otras dos ciudades esa entidad bancaria tiene 16 y 33 oficinas, siendo el número medio de empleados por oficina de 10 y 14 respectivamente, ¿cuál es el número medio de empleados de las oficinas de esa entidad bancaria en el conjunto de las tres ciudades? 23. Una empresa decide aumentar su plantilla en 80 personas. Para su selección organiza una prueba a la que se presentan 200 aspirantes. Los seleccionados obtuvieron los siguientes resultados: Puntuación Nº aspirantes 50-65 21 65-75 29 75-90 18 90-100 12 La empresa determina que el 30 % de los seleccionados con mayores puntuaciones sean destinados a la oficina principal y el resto a las sucursales. Suponiendo que la distribución de las puntuaciones dentro de cada intervalo es uniforme, se pide: a) puntuación mínima que se necesita para trabajar en la oficina principal. b) Porcentaje de seleccionados que han obtenido puntuación entre 82 y 95. 24. Se sabe que, en una clase, el número de alumnos que estudia como máximo media hora en casa es 5, el número de alumnos que estudian de media hora a una hora en casa es 8, 13 alumnos estudian entre una hora y una hora y media en casa, el número de alumnos que estudia entre una hora y media y dos horas en casa es 8, 5 alumnos estudian entre dos horas y dos horas y media en casa y un alumno estudia en casa entre dos horas y media y tres horas. a) Calcula la tabla de frecuencias y haz una representación gráfica adecuada. b) ¿Qué porcentaje de alumnos estudia en casa más de una hora y cuarto? c) ¿Qué tiempo medio dedican a estudiar en casa los alumnos de esta clase? d) ¿Cuánto tiempo estudian como mínimo el 18 % de los alumnos de esta clase que más tiempo dedican al estudio en casa? e) ¿Cuánto tiempo dedican al estudio en casa el 18 % de los alumnos de esta clase que menos tiempo dedican a esa actividad? 25. El departamento de contabilidad de una determinada empresa registró los siguientes datos relativos a la percepción anual de sueldos en miles de euros para sus empleados: Haberes netos 9 12 15 18 21 24 30 Nº de empleados 2 14 31 22 15 4 2 Calcula el sueldo medio, el sueldo mínimo que reciben el 40 % de los empleados que más cobran, el sueldo que reciben como máximo el 50 % de los empleados y el sueldo más frecuente. Enunciados para pensar y/o resolver
Página 3
Estadística
PROBLEMAS
2014/2015
26. Se ha obtenido la siguiente información sobre el número de análisis realizado en un mes por 65 empleados de cierta empresa multinacional Nº de análisis Nº de empleados 250-260 8 260-270 10 270-280 16 280-290 14 290-300 10 300-310 5 310-320 2 a) Calcula las marcas de clase e interpreta la del cuarto intervalo. b) Obtén la amplitud de cada intervalo y la altura del rectángulo que correspondería a cada clase al dibujar el correspondiente histograma. c) Realiza una representación gráfica adecuada. d) Calcula la media y la mediana, e interpreta los valores obtenidos. e) Obtén el primer cuartil y el percentil 64. f) ¿Cuántos empleados de la empresa realizan al menos 295 análisis al mes? g) ¿Qué porcentaje de empleados de la empresa realiza como mucho 277 análisis al mes? h) Calcula la varianza y la desviación típica de la distribución. i) Calcula el momento de orden tres respecto al origen y respecto a la media. 27. Una empresa inmobiliaria ofrece apartamentos en régimen de alquiler, en la Costa del Sol, cuyos precios mensuales son Precio de alquiler (en euros) Número de apartamentos De 700 a 1000 21 De 1000 a 1100 27 De 1100 a 1300 34 De 1300 a 1500 14 De 1500 a 2100 29 a) Obtén el alquiler medio por apartamento, el precio más frecuente y el precio que se sitúa en mitad de la oferta. b) Si una persona quiere gastar en alquiler entre 1250 y 1375 euros, ¿a qué porcentaje del total de apartamentos tiene opción? 28. Las edades de los empleados de una determinada empresa son las que aparecen en la tabla adjunta: Edad Nº empleados Menos de 25 22 Menos de 35 70 Menos de 45 121 Menos de 55 157 Menos de 65 184 Sabiendo que el empleado más joven tiene 18 años, a) obtén una tabla en la que aparecen las frecuencias absolutas y relativas, tanto acumuladas como sin acumular. b) Calcula la edad media de los empleados. c) ¿Cuál es la edad que, como máximo, tiene el 70 % de los que tienen menos edad? d) ¿Qué porcentaje de empleados tienen entre 40 y 50 años? 29. Los alumnos de una facultad acuden a consultar libros a la biblioteca según la siguiente distribución de frecuencias para la variable X (número de libros consultados en un mes por un alumno): Nº consultas 0-1 1-2 2-4 4-6 6-10 Nº alumnos 50 25 100 200 125 a) ¿Qué porcentaje de alumnos realiza al menos tres consultas en un mes? b) ¿Cuántas consultas realizan como mínimo en un mes el 75 % de los alumnos de esa facultad? c) ¿Cuántas consultas realizan como mínimo el 50 % de los alumnos de esa facultad? 30. Una empresa de distribución de productos farmacéuticos posee varios agentes comerciales para vender un nuevo producto. Las ventas del año pasado (número de unidades vendidas del producto por agente comercial) se resumen en la siguiente tabla Ventas 25 30 32 34 45 47 59 Nº agentes 2 1 2 3 2 2 4 a) La empresa premia con un viaje al 30 % de agentes comerciales con mayores ventas. ¿Cuál es el número mínimo de ventas del producto que han hecho los agentes premiados? b) Si cada agente se ha llevado una comisión de 10 euros por cada unidad de producto vendida, más una comisión fija de 150 euros al final del año, ¿cuál es la comisión media por agente que ha tenido que pagar la empresa? Enunciados para pensar y/o resolver
Página 4
Estadística
PROBLEMAS
2014/2015
31. Los desplazamientos de los operarios de una factoría para llegar a su puesto de trabajo son, en km, los siguientes: nº de km nº empleados Más de 1 91 Más de 15 30 Más de 30 13 Más de 45 6 Más de 60 5 Más de 75 3 Más de 90 1 a) Sabiendo que el operario más distante realiza 93 km de viaje, obtén la distribución de frecuencias absolutas, acumuladas y sin acumular. b) Indica cuántos operarios realizan un desplazamiento comprendido entre 30y 60 km. c) Indica cuántos operarios realizan un desplazamiento comprendido entre 20 y 70 km. d) Calcula el desplazamiento medio de los operarios de esa factoría. e) ¿Cuál es el desplazamiento más frecuente? 32. Con el fin de hacer un estudio de aceptación sobre dos modelos de automóviles de reciente fabricación (A y B), se han considerado las ventas efectuadas por un concesionario durante los días no festivos el mes de marzo último, que han sido las de la tabla adjunta. Ventas de A 0 1 2 2 3 3 4 4 Ventas de B 2 3 1 2 1 2 0 1 Nº de días 1 1 3 8 5 4 1 2 Para cada apartado, calcula las distribuciones correspondientes y responde a la pregunta formulada. a) ¿Cuántos coches del modelo B ha vendido el concesionario durante ese mes de marzo? b) ¿Qué número medio de coches del modelo A ha vendido el concesionario cada día? c) En los días en que el concesionario había vendido como mínimo dos coches del modelo A, ¿cuál es el número más frecuente de coches del modelo B que ha vendido? d) Sin tener en cuenta el modelo, ¿cuántos coches ha vendido como mínimo ese concesionario el 85 % de los días? 33. Una gran superficie ha preguntado a los clientes que han comprado un decodificador de TDT para Navidad si tienen pensado cambiar su televisor por uno de pantalla plana antes de un año, obteniéndose los siguientes resultados: ¿Comprará pantalla plana? Si No No sabe Bajo 10 22 3 Medio-bajo 12 16 2 Nivel de renta Medio-alto 22 37 1 Alto 27 13 0 a) ¿Cuántas personas compraron el decodificador para Navidad en esa gran superficie? b) ¿Cómo se distribuye la intención de compra de los que tienen un nivel medio de renta? c) ¿Es la intención de compra independiente del nivel de renta? d) ¿Cómo se distribuyen los clientes de esa gran superficie en función de sus rentas? 34. Dada la siguiente distribución conjunta
a) b) c) d) e)
Y\X 1 3 5 2 3 5 8 4 4 2 1 7 5 3 2 calcula las distribuciones de frecuencias marginales de las variables X e Y. Calcula la distribución de X/Y=4 Calcula la distribución de Y cuando X toma el valor 1. ¿Son X e Y variables independientes? Halla la covarianza entre X e Y.
35. Dada la distribución de frecuencias bidimensional X \ Y 10 6 1 9 0 12 4 a) calcula las distribuciones marginales. b) Calcula la media y la varianza de la variable X. c) Calcula la covarianza entre X e Y.
Enunciados para pensar y/o resolver
15 3 3 0
20 3 3 2
25 2 4 0
Página 5
Estadística
PROBLEMAS
2014/2015
36. Se preguntó a 10 empresarios sobre su antigüedad en años y su sueldo mensual en euros, obteniéndose los siguientes datos: 3 empresarios cobran 18000€ y tienen 4 años de antigüedad 2 empresarios cobran 25000€ y tienen 7 años de antigüedad 4 empresarios cobran 30000€ y tienen 6 años de antigüedad 1 empresario cobra 50000€ y tiene 7 años de antigüedad a) Obtén una tabla con la distribución conjunta de estas variables. b) Calcula el sueldo medio mensual de esos empresarios. c) ¿Cuál es la dispersión de los sueldos? d) ¿Es una distribución simétrica? ¿Por qué? e) ¿Cuál es el rango de la distribución? f) Determina la distribución de los sueldos para los empresarios con 7 años de antigüedad. g) Calcula la antigüedad más frecuente entre los empresarios que cobran más de 20000€. h) Calcula el sueldo máximo que cobra el 50 % de los empresarios con más de 5 años de antigüedad. i) Calcula la antigüedad mínima que tiene el 30 % de los empresarios que cobran más de 28000€. j) ¿Qué antigüedad tienen como mínimo el 45 % de esos empresarios? k) ¿Qué antigüedad es más frecuente entre esos empresarios? l) De existir relación lineal entre esas variables, ¿sería directa o inversa? ¿Por qué? 37. Se han examinado una serie de soluciones patrón de fluorescencia en un espectrómetro de fluorescencia que han conducido a las siguientes intensidades de fluorescencia (Y) para distintas concentraciones (X): Y 2 5 9 13 17 21 25 X 0 2 4 6 8 10 12 a) Calcula la intensidad media de fluorescencia de los experimentos realizados con concentraciones superiores a 7 unidades. b) ¿Para cuál de estas características es más representativa la media? c) Encuentra la mejor relación lineal entre X e Y. ¿Qué valor se prevé para la intensidad de fluorescencia cuando se trabaja con una concentración de 11? ¿Cuál es la fiabilidad de esta previsión? 38. Dados los datos correspondientes a la variable estadística bidimensional (X,Y) X -2 -1 -1 0 0 1 1 2 Y 0 -1 1 -2 2 -1 1 0 a) calcula la covarianza entre ambas variables y la varianza de la variable suma. b) Estudia la independencia estadística entre las variables X e Y. 39. Sobre una muestra de cuatro individuos se han observado los valores (1,4), (0,1), (3,28) y (2,12) de una variable estadística bidimensional (X,Y). Si nos piden escoger entre las relaciones ¿cuál es mejor y por qué?
y 3x 2
e
y 2 3x ,
40. Sea 𝑋 una variable estadística que toma los valores -1, 0 y 1, todos ellos con la misma frecuencia. Demuestra que 𝑋 y 𝑋 2 son incorreladas pero son estadísticamente dependientes. 41. Se han recogido los datos siguientes sobre número de trabajadores (X) y superficie cultivada en acres (Y) para un conjunto de 100 cooperativas agrarias en España. X \ Y 0-100 100-500 500-1500 5 20 10 10 5 15 15 10 20 10 30 a) ¿Cómo se distribuyen las cooperativas con menos de 100 acres cultivados? b) ¿Cuál es la superficie media cultivada en las cooperativas que tienen menos de 13 trabajadores? c) ¿Cuál es el número de trabajadores más frecuente en las cooperativas que cultivan más de 500 acres? d) ¿Qué porcentaje de cooperativas cultiva entre 150 y 900 acres? 42. Sabiendo que se verifica la relación 5𝑆𝑦 = 4𝑆𝑥 en una distribución bidimensional de medias aritméticas 𝑥̅ = 16 e 𝑦̅ = 12, y que la medida de la dependencia lineal entre las variables es 𝑟 2 = 9/16, halla la recta de regresión de X sobre Y y, a partir de ella, predice el valor que debe esperarse para la variable X en el caso en que Y tome el valor 4. 43. Estudia en qué casos los resultados que se ofrecen son incompatibles: a) 𝑟𝑋𝑌 = −0.3 y la recta de regresión de Y respecto de X tiene por ecuación 𝑦 = 4𝑥 + 5 b) 𝑆𝑋𝑌 = 100, 𝑆𝑋 = 5, 𝑆𝑌 = 20, 𝑆𝑒2 = 5 (varianza de los errores) c) Las dos rectas de regresión tienen ecuaciones 𝑦 = 5𝑥 + 8 e 𝑦 = 𝑥 ⁄5 + 9, y 𝑟𝑋𝑌 = 0.2. d) La recta de regresión de Y sobre X tiene por ecuación 𝑦 = 𝑥 ⁄2 + 4, la recta de regresión de X sobre Y tiene por ecuación 𝑥 = 𝑦 + 4, y además 𝑋̅ = 16, 𝑌̅ = 12. Enunciados para pensar y/o resolver
Página 6
Estadística
PROBLEMAS
2014/2015
44. La siguiente tabla presenta la información relativa al número semanal de coches vendidos (X) y al número de accesorios opcionales incorporados (Y) en 44 concesionarios de automóviles: Y \ X 2-8 8-12 12-28 𝑛.𝑗 1 12 2 16 2 8 13 4 2 12 14 44 𝑛𝑖. a) Completa los datos que faltan en la tabla. b) ¿Cuál es el número medio de accesorios incorporados? c) ¿Cuál es el número medio de coches vendidos en los concesionarios donde se incorporan dos accesorios opcionales? d) Da una relación entre el número de accesorios y el número de coches vendidos semanalmente. ¿Cuántos accesorios se prevé que incorpore un concesionario que vende 11 coches en una semana? Comenta el resultado obtenido. 45. Determina si es posible que las rectas y=3x+2, x=4y-7 sean rectas de regresión de una variable estadística bidimensional (X,Y). En caso afirmativo, calcula las medias de las variables X e Y y el coeficiente de correlación lineal. 46. Las estaturas (X) y los pesos (Y) de seis individuos fueron las siguientes 𝑥𝑖 1.70 1.65 1.69 1.70 1.75 1.72 60 65 80 85 70 𝑦𝑗 68 a) Calcula una recta que permita explicar la evolución de los pesos en función de la estatura. b) ¿Qué peso se prevé tenga un individuo de 1.73? ¿Y uno de 1.89? Comenta los resultados obtenidos. 47. Dada una variable estadística (X, Y) se sabe que la media de X es 24, la varianza de Y es 90 veces la de X y que 𝑦 = 6 − 9x es una recta de regresión. Calcula la media de X, la otra recta de regresión, el coeficiente de correlación lineal e interpreta el resultado. 48. ¿Pueden ser 3𝑥 + 2𝑦 = 7 y 𝑥 + 𝑦 = 2 rectas de regresión de una variable estadística bidimensional (X,Y)? En caso afirmativo, calcula sus medias, el coeficiente de determinación, el coeficiente de correlación lineal e interpreta los resultados. 49. Sea y+3x-2=0 una recta de regresión para una variable estadística bidimensional (X,Y). a) Sabiendo que la media de Y es 4, calcula la media de X. b) Sabiendo que además 𝑆𝑦2 = 3𝑆𝑥2 , determina qué recta de regresión es y calcula la otra. Además: 1) Dibuja las rectas y señala cuál es cada una. 2) Calcula la pendiente de la RR X/Y. 3) Calcula la pendiente de la RR Y/X. 4) Calcula el coeficiente de correlación lineal e interpreta el resultado. 5) Interpreta el valor del coeficiente de determinación. 6) Estima el valor de Y cuando X=3. ¿Es buena esta previsión? ¿Por qué? 7) Estima el valor de X cuando Y=20. ¿Es buena esta previsión? ¿Por qué? 50. Sea 20𝑦 + 38𝑥 = 96 una recta de regresión asociada a una variable estadística bidimensional (X,Y). a) Si nos dicen que la media de X es 2, ¿podemos deducir el valor de la media de Y? ¿Por qué? En caso afirmativo, calcúlala. b) Si además nos dicen que 𝑆𝑦2 = 4𝑆𝑥2 , ¿cómo podemos deducir cuál de las rectas de regresión es? ¿Por qué? c) Si queremos predecir el valor de Y para X=3, ¿qué recta utilizaremos? ¿Por qué? ¿Qué predicción nos sale? ¿Es buena esa predicción? d) ¿Podría considerarse igual de fiable una predicción para X cuando Y=20? ¿Por qué? ¿Qué recta utilizaríamos en este caso? ¿Por qué? 51. Se han estudiado las calificaciones de cien alumnos en dos asignaturas: Matemáticas (X) y Estadística (Y), obteniéndose los datos: 𝑥̅ = 110, 𝑦̅ = 2.5, 𝑆𝑥 = 10, 𝑆𝑦 = 0.5. Además se sabe que el coeficiente de correlación lineal entre ambas variables es 0.85. a) ¿Se puede decir que aquellos alumnos que obtienen mayor calificación en Matemáticas son los mismos que obtienen mayor calificación en Estadística? ¿Por qué? b) ¿Cuánto valen los momentos 𝑎20 y 𝑎02 ? c) ¿Cuál es la ecuación de las rectas de regresión? d) ¿Qué nota puede predecirse que sacará en Estadística un alumno que ha obtenido 125 puntos en Matemáticas? ¿Es fiable dicha previsión? e) ¿Qué nota puede predecirse que sacará en Matemáticas un alumno que ha obtenido 5 puntos en Estadística? ¿Es fiable dicha previsión? Enunciados para pensar y/o resolver
Página 7
Estadística
PROBLEMAS
2014/2015
52. Sea X la variable número de análisis clínicos realizados durante una semana en el servicio de hematología de un hospital e Y la variable número de analistas disponibles durante una semana en el servicio de hematología del mismo hospital. Observados los archivos del hospital de los últimos seis meses, se han encontrado los siguientes datos: Nº análisis 200 140 180 210 180 140 Nº analistas 5 4 5 5 4 3 Nº semanas 7 3 6 3 5 2 a) ¿Están relacionadas estadísticamente estas variables? b) ¿Para qué variable es más representativa la media de la distribución? c) ¿Cuál es el número de análisis más frecuente? d) ¿Cómo se distribuye el número de análisis realizados las semanas en las que se disponía como mucho de 4 analistas? e) ¿Qué número de análisis se espera hacer en una semana en la que se dispone exactamente de 2 analistas? ¿Es fiable dicha previsión? f) Sin realizar cálculos numéricos, ¿cómo calcularías el número de analistas del que se disponía en una semana en la que se realizaron 400 análisis? ¿Qué puedes decir de la fiabilidad de esta previsión? 53. Dada una variable estadística bidimensional (X, Y), se supone que las rectas de regresión son la de Y sobre X: y=3x+1 la de X sobre Y: x=2y-3 Determina las medias de X e Y e indica si el ajuste es bueno. ¿Era cierta la suposición inicial? ¿Por qué? 54. Los siguientes datos se reunieron para determinar la relación entre presión y la correspondiente lectura en la escala, con el propósito de calibración. Presión 0.2 0.4 0.45 0.6 5 Lectura 0.3 0.3 0.45 0.65 5.1 a) Halla el coeficiente de correlación lineal entre estas dos variables. ¿Qué lectura cabe esperar para una presión de 3.5? b) ¿Cuál sería la respuesta del apartado anterior si se elimina el punto (5, 5.1)? ¿Debe eliminarse ese punto? Justifica la respuesta. 55. Se desea llevar a cabo un estudio para analizar la viscosidad de la glicerina en función de la temperatura. Para ello se han seleccionado 8 muestras de un jabón y se ha medido la viscosidad de la glicerina (en centipoises) que la compone a diferentes temperaturas (en ºC). Los datos obtenidos son los siguientes: Temperatura (ºC) 15 20 30 40 45 50 55 60 Viscosidad (centipoises) 6.5 5.6 5.4 6 5 4.6 3 2.4 a) ¿Qué porcentaje de muestras de jabón tiene una viscosidad inferior a 5.8 centipoises? b) Si una muestra de jabón está entre el 65 % de las menos viscosas y el 70 % de las más viscosas, ¿entre qué valores está su viscosidad? c) Halla la recta de regresión adecuada para el estudio que se desea realizar. d) Explica, justificando la respuesta, qué tipo y qué grado de relación lineal existe entre la viscosidad de la glicerina y la temperatura a la que se encuentra. e) Predice, si es posible, qué viscosidad tendrán las muestras de jabón de un establecimiento cuya temperatura ambiente suele estar en torno a los 22ºC. ¿Será fiable la predicción? f) Si se mete una muestra de jabón en un congelador y se baja la temperatura hasta 0ºC, ¿qué viscosidad tendrá? ¿Será fiable la predicción? g) ¿A qué temperatura media se han tomado las muestras de jabón que tienen una viscosidad superior a 5 centipoises? h) ¿Qué viscosidad tienen como mínimo el 50 % de los jabones que se han observado a una temperatura inferior a 47 ºC? 56. En estudios recientes se utilizan las bacterias para luchar contra la contaminación del subsuelo pues, aunque las bacterias no degradan directamente los metales ni los elementos radioactivos, sí pueden fijarlos formando revestimientos salinos sobre los granos de roca, lo que impide que la contaminación se extienda. Los estudios geoquímicos sugieren que la cantidad de hierro fijada crece cuando el tamaño de los granos decrece. Los datos obtenidos tras varias mediciones en diferentes puntos del subsuelo son: Tamaño del grano de roca (en mm) 0.10 0.01 0.18 0.05 0.08 Cantidad de compuesto de hierro (en ppm) 350 590 220 460 390 Nº de puntos del subsuelo 4 5 6 2 3 a) ¿Cuál es el tamaño del grano de roca más frecuente entre aquellos puntos del subsuelo que tienen más de 300 ppm de compuesto de hierro? b) Si sólo tenemos en cuenta los puntos del subsuelo cuyo grano de roca tiene un tamaño de al menos 0.04 mm, ¿qué cantidad de hierro tienen como mínimo el 30 % de esos puntos con grano grueso? c) Determina el ajuste lineal de la cantidad de hierro en función del tamaño de los granos. ¿Es acorde dicho ajuste con los estudios geoquímicos previos? d) ¿Qué cantidad de hierro es previsible obtener en un grano de roca de 0.075 mm? ¿Y en uno de 0.35 mm? ¿Son fiables dichas previsiones? Enunciados para pensar y/o resolver
Página 8
Estadística
PROBLEMAS
2014/2015
57. En una gran compañía se ha constatado que, por término medio, el 65 % de sus pedidos se entrega con retraso. La distribución de los retrasos de los pedidos entregados con retraso en los últimos 6 meses es: Tiempo de retraso (en días) 0-1 1-2 2-3 3-5 5-10 Nº de pedidos 2000 3000 2500 2000 500 a) Determina el retraso medio y la desviación típica del tiempo de retraso de los pedidos que no han sido entregados a tiempo. Interpreta los resultados obtenidos. b) ¿Cuántos días se han retrasado como mínimo el 10 % de los pedidos con retraso que más tardaron en entregarse? c) La compañía ha calculada que, por cada pedido con retraso, se producen unas pérdidas fijas de 114 euros y una pérdidas variables de 60 euros por cada día de retraso. ¿Cuánto le cuesta, por término medio, el retraso de un pedido a la compañía? ¿Qué pérdidas totales tuvo la compañía en los últimos 6 meses debido a los retrasos producidos? 58. El consumo semanal de materia prima (X) y energía (Y) que ha tenido una empresa en un periodo de diez semanas viene dado por la siguiente tabla. X 1600 1650 1800 1650 1400 1250 1200 1300 1350 1700 Y 570 540 480 450 390 450 510 510 570 540 a) Suponiendo que existe una relación lineal entre ambas variables, calcula la ecuación que la representa y explica qué tipo y grado de relación lineal expresa. b) Obtén el consumo de energía previsible para una semana en la que el consumo de materia prima es de 1680 unidades. ¿Es fiable dicha previsión? c) ¿Qué cantidad de materia prima se utiliza una semana en la que el consumo de energía es de 780 unidades? ¿Es fiable dicha previsión? 59. Se está tratando de obtener empíricamente una fórmula para predecir la cantidad de carácter iónico Y de un enlace en función de la diferencia de electronegatividad X de los átomos que lo constituyen. En seis experimentos se han observado los siguientes valores: X 2 6 8 7 10 9 Y 6 8 9 9 10 12 a) Se pretende predecir el valor de Y cuando X vale 5 mediante una recta de regresión. Ajusta una recta al diagrama de dispersión y calcula la predicción pedida. b) Ajusta al diagrama de dispersión una función exponencial del tipo 𝑦 = 𝑎 𝑒 𝑏𝑥 y halla la predicción en ese caso. ¿Cuál de las dos predicciones resulta más fiable en la muestra? 60. Un ecólogo desea predecir el cambio de temperatura del agua (Y) que tiene lugar en un punto situado una milla por debajo de una planta industrial, tras el vertido de aguas residuales calientes en la corriente. La predicción se basará en la cantidad de agua liberada (X). La respuesta es el cambio de la temperatura del agua; el único regresor es la cantidad de agua liberada. Puesto que la cantidad de agua caliente liberada varía dependiendo del nivel de actividad de la planta, el experimentador no controla los valores del regresor utilizado para desarrollar la ecuación de predicción, sino más bien los valores medidos simplemente en el momento de liberación del agua. Los datos recogidos fueron los siguientes: X 1.0 1.1 1.5 1.7 2.0 2.5 3.0 3.0 3.0 3.1 3.2 3.5 3.6 4.0 Y 3.0 3.2 4.1 4.2 5.0 6.2 7.3 7.0 7.1 7.4 6.0 8.1 8.0 9.0 a) Dibuja la nube de puntos a que dan lugar estos datos. ¿Parece lógica la relación lineal? b) Calcula una ecuación que explique el comportamiento del efecto en función de la causa. c) ¿Podemos predecir cuál es el cambio de temperatura después de liberar 5 unidades de agua? ¿Es buena esa predicción? ¿Por qué? 61. Contabilizados los goles marcados en ocho partidos de fútbol y observada la temperatura media en los estadios a lo largo de los encuentros, se obtuvo la tabla adjunta: Número de goles 0 1 1 2 3 3 4 5 Temperatura 18 18 21 16 21 23 21 16 Utilizando la representación gráfica, decide si existe algún tipo de dependencia entre las variables. 62. Dada la distribución conjunta de la variable estadística bidimensional (X,Y) con la siguiente tabla, calcula X \ Y 1 2 0 0.3 0.1 1 0.2 0.4 a) la distribución de la variable Z=X+Y b) la distribución de Z cuando X=0. c) ¿Son X e Y variables estadísticamente independientes? d) Si estos datos provienen de una muestra de 50 individuos 1) ¿cuántos individuos se observaron para X=1? 2) ¿cuántos nos proporcionarían un valor de T igual a 1 si T=X-Y?
Enunciados para pensar y/o resolver
Página 9
Estadística
PROBLEMAS
2014/2015
63. Dos químicos estudian los efectos de la utilización de un equipo depurador en la eliminación de partículas contaminantes en muestras de aire de determinado volumen. Para ello observan las variables X (peso de las partículas contaminantes por muestra cuando no trabaja el equipo depurador) e Y (peso de las partículas contaminantes por muestra cuando sí trabaja el equipo depurador), ambas en las mismas unidades. Los datos recogidos son los siguientes: X 50 45 47 55 60 65 40 Y 35 30 40 45 55 55 45 Uno de los químicos estima que la utilización del equipo depurador hace disminuir el peso de las partículas contaminantes aproximadamente en 10 unidades de peso. El otro químico estima que la utilización del equipo depurador disminuye el peso de las partículas contaminantes en un 20 %. a) A la vista de los datos, ¿puede afirmarse que existe relación lineal entre estas características? b) ¿Cuál de las variables se consideraría la causa y cuál el efecto? c) Calcula la recta de regresión adecuada e indica cuál de los químicos se acercó más a la realidad ofrecida por los datos. d) ¿Crees que sería mejor otro tipo de relación? ¿Cuál? ¿Por qué? 64. Se han examinado 64 soluciones patrón en un espectrómetro de fluorescencia que han conducido a los siguientes valores de las intensidades de fluorescencia (Y) para diferentes concentraciones (X): X 4 4 5 5 5 6 6 7 7 9 9 Y 0-5 5-10 5-10 10-15 15-20 10-15 15-20 10-15 15-20 15-20 20-25 nº 7 5 5 9 1 8 1 7 5 15 1 a) Calcula la concentración media de los experimentos realizados con intensidades de fluorescencia superiores a 15 unidades. Especifíca la distribución utilizada. b) ¿Qué intensidad de fluorescencia tiene como mínimo el 20 % de los experimentos realizados con una concentración inferior a 5.5? Especifíca la distribución utilizada. c) ¿Qué fluorescencia se obtendrá para una concentración de 8 unidades? ¿Es buena dicha previsión? ¿Por qué? d) ¿Cuál sería el valor previsto para la fluorescencia si se usara una concentración de 15 unidades? ¿Es esta previsión igual de fiable que la anterior? ¿Por qué? 65. La edad en años (X) y la altura en metros (Y) de un grupo de árboles de una especie concreta seleccionados en un bosque vienen dadas en la siguiente tabla: X 3 3 4 4 4 5 5 6 6 7 7 Y 0-5 5-10 5-10 10-15 15-20 10-15 15-20 10-15 15-20 15-20 20-25 Nº árboles 2 4 2 10 1 9 2 7 8 14 1 Calcula una ecuación que explique el comportamiento del efecto en función de la causa. a) ¿Cuál es la altura de un árbol de 8 años? ¿Es buena dicha previsión? ¿Por qué? b) Con la misma ecuación del apartado anterior, ¿podemos predecir la altura de un árbol de 15 años? ¿Por qué? c) ¿Qué edad tendrá un árbol de 17 metros? 66. Los datos siguientes corresponden a la evolución del peso celular (en mg/ml) y la cantidad de nitrato en un cultivo de algas durante tres días: Tiempo Peso Nitrato Inicio 0.07 12.5 1 día 0.19 10.4 2 días 0.52 7.8 3 días 1.07 4.5 a) Ajusta una recta y una curva exponencial a la relación entre el peso y el nitrato. b) Ajusta una curva a la evolución temporal del peso. c) Mediante lo obtenido en los apartados anteriores, predice la cantidad de nitrato que habría en el cultivo al cabo de 36 horas. 67. La presión y el volumen de un gas están relacionados por una ecuación del tipo 𝑃 𝑉 𝑏 = 𝑎, donde 𝑎 y 𝑏 son constantes que dependen de la naturaleza del gas. En un experimento realizado con cierto gas, se obtuvieron los siguientes resultados: Presión (𝑃) 0.50 1.00 1.50 2.00 2.50 3.00 Volumen (𝑉) 1.65 1.03 0.74 0.61 0.53 0.45 Estima los valores de 𝑎 y 𝑏 de acuerdo con los datos del experimento, expresando 𝑃 en función de 𝑉. 68. Los resultados de un experimento para el estudio de la velocidad de una reacción enzimática han sido: X (concentración del sustrato) 2.5 5 10 20 40 Y (velocidad observada) 5.6 7.3 12.5 16.1 23.2 Se supone que la velocidad de la reacción está regida por la ecuación de Michaelis-Menten que es de la 1 𝐵 forma = 𝐴 + con A y B constantes. Estima, a partir de los datos anteriores, los valores de A y B. ¿Es 𝑌 𝑋 adecuada la suposición realizada para los datos obtenidos? Enunciados para pensar y/o resolver
Página 10
Estadística
PROBLEMAS
2014/2015
69. Según la ley de Boyle-Mariotte de los gases perfectos, si una masa de gas se comprime o se dilata a temperatura constante, el producto de la presión por el volumen permanece constante, es decir, 𝑃𝑉 = 𝑐, siendo 𝑃 la presión, 𝑉 el volumen y 𝑐 la constante característica de la naturaleza del gas. Utilizando el método de mínimos cuadrados, estima la constante 𝑐 para un gas del que se observaron los datos: 𝑃 (kg/cm2) 0.10 0.15 0.20 0.25 2.24 1.50 1.13 0.92 𝑉 (litros) ¿Qué volumen de gas corresponderá a un valor de la presión de 0.17 kg/cm 2? ¿Es adecuada la utilización de la ley de Boyle-Mariotte para los datos del ejercicio? 70. Se han tomado cinco muestras de glucógeno, de una cantidad fija cada una. Se les ha aplicado una cantidad X de glucogenasa (en mmol/l) anotando en cada caso la velocidad de reacción Y, medida en mol/min, obteniéndose así la siguiente tabla: X 1 2 3 0.2 0.5 Y 18 35 60 8 10 Sabiendo que la reacción no se ajusta al modelo de Michaelis-Menton, se pide: a) Justifica detalladamente si se desprende de estos datos que la velocidad de la reacción aumenta con la concentración de glucogenasa. b) Si a una de las muestras le hubiésemos aplicado una concentración de glucogenasa de 5 mmol/l, ¿cuál habría sido la velocidad de reacción? ¿Con qué grado de fiabilidad se obtiene esa predicción? 71. Dada una muestra y una variable estadística bidimensional (X, Y) sobre ella, a) obtén mediante el método de mínimos cuadrados el mejor ajuste del tipo 𝑌 = 𝑏 + 𝑋. 1 b) Se sospecha que la relación entre dos variables estadísticas es del tipo 𝑌 = + 𝑏. Mediante un cambio 𝑋 de variable, y aplicando el apartado anterior, estudia cómo debe ser 𝑏 cuando la muestra proporciona la siguiente tabla de frecuencias. X -1 1.25 2 1 0.25 1.5 1.75 -0.5 -0.75 -0.5 Y 2 3.8 3.5 4 7 3.7 3.6 1 1.5 0.75 1 ¿Se puede dar por buena la suposición de que la relación entre ambas variables es del tipo 𝑌 = + 𝑏? 𝑋
72. Se ha medido el contenido en oxígeno Y en mg/l de cierto lago a una profundidad X en m, obteniéndose los siguientes datos: X 15 20 30 40 50 60 Y 6.5 5.6 5.4 6 4.6 1.4 a) Obtén, mediante el método de mínimos cuadrados, el mejor ajuste lineal de Y en función de X. 𝑎 b) Estudios posteriores hacen sospechar que la relación entre X e Y es del tipo 𝑌 = + 𝑏. Aplicando el 𝑋−10 apartado anterior, ¿cuál debería ser el valor de 𝑎? c) Para una profundidad de 25 m, ¿qué contenido de oxígeno se podría predecir a partir de los dos modelos anteriores? ¿Cuál de las dos previsiones se considera más fiable en la muestra? 73. Dos médicos estudian los efectos de cierto régimen alimenticio en pacientes con sobrepeso. Para ello se observan las variables X=“peso (en kg) antes del tratamiento” e Y=”peso (en kg) después del tratamiento” en una muestra de 7 pacientes, obteniéndose los datos: X 100 90 90 110 120 125 85 Y 85 75 79 93 100 100 73 a) El primero de los médicos estima que el tratamiento hace disminuir el peso de cada paciente en 30 kg. El otro médico estima que, con el tratamiento, el peso disminuye en un 15 %. 1) A la vista de estos datos, ¿cuál de las dos afirmaciones parece más fiable? 2) Calcula la recta de regresión de Y sobre X. Sin realizar operaciones, compara la bondad de este ajuste con la de los dos anteriores. b) ¿Cuál sería el peso estimado tras el tratamiento para los que pesan 95 kg antes del tratamiento? ¿Es fiable esa predicción? En caso afirmativo, ¿cómo de fiable? En caso negativo, ¿por qué? c) ¿Por debajo de qué peso están el 25 % de los que menos pesan antes del tratamiento? ¿y por encima de que peso están el 25 % de los que más pesan antes del tratamiento? d) ¿Cuál es el porcentaje de los que pesan menos de 95 kg antes del tratamiento? ¿y el porcentaje de los que pesan menos de 95 kg después del tratamiento? 74. Dada la distribución bidimensional 1 𝑥𝑖 𝑦𝑗 2.2 ajusta una función del tipo 𝑦 = 𝑎𝑒 𝑏𝑥 .
1.5 6
2 16
2.5 44.5
3 121
4 895
75. Cada uno de los componentes de un equipo de relevos 4 × 100 metros alcanzó en una competición la siguiente velocidad: 10.16 m/s, 10.35 m/s, 10.40 m/s y 10.52 m/s. ¿Cuál fue la velocidad media desarrollada por el testigo que se entrega a los corredores? Enunciados para pensar y/o resolver
Página 11