4) La Covarianza. 5) La Desviación Media.
20. Es un Estadístico de Dispersión:
1) Moda. 2) Rango. 3) Mediana. 4) Media Armónica. 5) Media Geométrica.
21. El Coeficiente de Variación es:
1) Un estadístico de Centralización adimensional. 2) Un estadístico de Dispersión Adimensional. Adimensional. 3) Una medida de Variación conjunta entre dos variables. 4) Un índice de simetría. 5) 3 y 4 correctas.
22. La Varianza Muestral es:
1) El cuadrado de la Desviación Típica. 2) La raíz cuadrada de la Desviación Típica. 3) Un estadístico de dispersión. 4) El cociente entre la Media y los Grados de Libertad. 5) 1 y 3 correctas. 23. El Coeficiente de Variación se calcula: 1) Multiplicando la Varianza por la Media. 2) Dividiendo la Desviación Típica por la Media. 3) Dividiendo la Media por la Desviación Típica. 4) Dividiendo la Media por la Varianza. 5) Multiplicando la Desviación Típica por la Media.
24. Cuando la muestra es asimétrica, el mejor estadístico de centralización que puede usarse es:
1) Media Aritmética. 2) Moda. 3) Mediana. 4) Media Geométrica. 5) Media Armónica.
25. La media aritmética no debe emplearse como estadístico de Centralización, cuando:
1) Las muestras son simétricas. 2) Se desea conocer el centro de gravedad de la distribución. 3) Las muestras son asimétricas. 4) Se desea calcular otros estadísticos relacionados, como el Coeficiente de Variación. 5) Se desea un estadístico de gran estabilidad.
26. ¿Con cuál de los l os siguientes estadísticos, puede compararse el grado de dispersión dispersi ón (variabilidad) de distintas muestras, en las que se utilizan unidades de medida distintas?.:
1) Desviación Típica. 2) Varianza. 3) Coeficiente de Variación. 4) Rango o Amplitud. 5) Error Típico.
27. Si a todos los valores de una distribución, les sumas 9:
1) La Media aumenta 9. 2) La Media no varía. 3) La Varianza aumenta en 81. 4) La Varianza aumenta en 9. 5) La Desviación Estándar aumenta en 3.
28. Si a todos t odos los valores de una distribución de datos, les restas 4:
1) La Media no varía, la Varianza sí. 2) La Media disminuye 4, la Varianza 16. 3) La Media y Varianza no varían. 4) La Media disminuye 4, la Varianza no varía. 5) Ninguna es cierta.
29. Si a todos los valores de una distribución, los multiplicas por 4: 1) Su Media no varía. 2) A su Media se le suma 4. 3) Su media se multiplica por 4. 4) Su Varianza se multiplica por 4. 5) Su Desviación Estándar se multiplica por 16.
30. Si a todos t odos los valores de una distribución de datos, les multiplicas por 6:
1) La Media se multiplica por 6. 2) La Media y la Varianza se multiplican por 36. 3) La Media no varía, la Varianza se multiplica por 36. 4) La Media se multiplica por 6, la Varianza por 36. 5) La media se multiplica por 6, la Varianza no varía.
31. Si multiplicas por 6 todos los valores de una distribución:
1) La Media no varía. 2) La Desviación Estándar se multiplica por 36. 3) Varianza se multiplica por 6. 4) Coeficiente de Variación no varía. 5) Todas son falsas.
32. Cuando a todos los datos de una muestra se les multiplica una constante:
1) La Media queda multiplicada por esa constante, la Desviación Típica no varía. 2) El Coeficiente de Variación se multiplica por esa constante. 3) Tanto la Media como la Desviación Típica se multiplican por esa constante. 4) El Coeficiente de Variación no varía. 5) Correctas 3 y 4.
33. Cuando a todos los datos de una muestra se les suma una constante:
1) La Media no varía. 2) La Media queda incrementada en esa constante. 3) La Desviación Típica no varía. 4) La Desviación Típica queda aumentada en esa constante. 5) Ciertas 2 y 3.
34. Los datos originales a menudo necesitan ser transformados, t ransformados, codificados para para facilitar el cálculo. ¿Qué consecuencias tiene en el cálculo de la l a Media, la Desviación Típica y el Coeficiente de Variación el hecho de que a todos los elementos de una muestra se les reste una constante?
1) Ninguno de estos estadísticos varían. 2) La Media varía, el resto no. 3) La Media no varía, el resto sí. 4) Los tres estadísticos varían. 5) La Media y el Coef. de Variación varían, la Desv. Típica no.
35. La Distribución Normal:
1) Es asimétrica. 2) Es una distribución de probabilidad de variable discreta. 3) Es asintótica. 4) La Mediana no coincide con la Moda. 5) Es bimodal.
36. La Distribución Normal:
1) La Media coincide con la Moda y con la Mediana. 2) El máximo es la Media. 3) Es una Distribución de probabilidad de variables continuas. 4) Se define por m y s. 5) Todas son ciertas.
37. En la Distribución Normal:
1) El intervalo m±s abarca el 68% del área total. 2) El intervalo m±1.96s abarca el 95% del área. 3) El intervalo m±2.6s abarca el 99% del área. 4) El intervalo m±2.6s NO abarca el 5% del área. 5) Todas son ciertas.
38. Una de las siguientes afirmaciones no se refiere a la Normal.
1) Asintótica. 2) Es una Distribución de probabilidad de Variable Discreta. 3) Es simétrica respecto a su media. 4) Queda definida por la media y la desviación típica 5) La Media, Moda y Mediana coinciden.
39. Los parámetros m y s respectivamente de la Distribución Normal unitaria o tipificada son:
1) 0, 0. 2) 1, 1. 3) 0, 1. 4) 1, 0. 5) -1, 1.
40. Los Parámetros Media y Desviación Típica respectivamente de la Distribución Di stribución normal tipificada (z) son:
1) 2) 3) 4) 5)
1, 0. 0, 1. 1, 1. 0, 1,96. 1, 1,96.
41. En la Normal, el intervalo:
1) m±s abarca el 95%. 2) m±1.96s abarca el 68%. 3) m±2.56s abarca el 95%. 4) Ninguna es cierta. 5) Son todas ciertas.
42. Una distribución Binomial:
1) Es Distribución de Probabilidad de Variable Discreta. 2) Se define por N(número) y “p”(probabilidad de suceso). 3) La Media de la Binomial es np. 4) La desviación Típica es (npq)1/2. 5) Todas son correctas.
43. Los parámetros Media y Desviación Típica, respectivamente, de una Binomial se calculan:
1) np, npq. 2) n/p, npq. 3) np, (npq)1/2 . 4) n/p, pq. 5) n/p, n/pq.
44. Una de las siguientes distribuciones de probabilidad corresponde a una Variable aleatoria continua:
1) Poisson. 2) Normal. 3) Binomial. 4) Geométrica. 5) Hipergeométrica.
45. Cuál de las siguientes si guientes Distribuciones de probabilidad no corresponde a una Variable Aleatoria Discreta. 1) Poisson. 2) T. de Student. 3) Binomial. 4) Geométrica. 5) Hipergeométrica.
46. Una de las siguientes distribuciones de probabilidad corresponde a una Variable Discreta.
1) Normal. 2) Chi-Cuadrado 3) F. de Snedecor. 4) T. de Student. 5) Hipergeométrica.
47. La Distribución T. de Student St udent deriva de la distribución.
1) Binomial.
2) Normal. 3) Poisson. 4) Experimental. 5) Uniforme.
48. Una distribución es bimodal: 1) Si se puede representar en dos formas. 2) Si tiene dos Medias. 3) Si la Media y la Mediana coinciden. 4) Si la curva tiene dos máximos. 5) Ciertas 2 y 4.
49. Una Distribución Bimodal (Señala lo falso): 1) Nunca es una distribución Normal. 2) Nunca es una distribución “T” de Student. 3) Nunca es simétrica. 4) Nunca es de variables Normales. 5) Tiene dos máximos.
50. En una distribución simétrica:
1) La Media coincide con la Mediana. 2) El Coeficiente de Simetría es 0. 3) La mitad derecha es igual que la izquierda. 4) La Moda deja a su izquierda el 50% de la curva. 5) Son todas ciertas. ********************************************************************************************** **************************************
SOLUCIONES BIOESTADÍSTICA – TEST 1
1
2
3
4
5
6
7
8
9
10
2
4
1
3
5
3
5
5
3
3
11
12
13
14
15
16
17
18
19
20
5
3
3
4
5
4
4
2
3
2
21
22
23
24
25
26
27
28
29
30
2
5
2
3
3
3
1
4
3
4
31
32
33
34
35
36
37
38
39
40
4
5
5
5
3
5
5
2
3
2
41
42
43
44
45
46
47
48
49
50
4
5
3
2
2
5
2
4
3
5
51. En una distribución asimétrica (Señale lo falso): 1) Puede haber dos Modas. 2) El Coeficiente de Asimetría puede ser mayor de 0. 3) No hay sesgo. 4) La Mediana es el mejor índice de centralización. 5) Puede ser platicúrtica.
52. Un índice de Asimetría de -0,3, nos dice que: 1) La curva no es simétrica. 2) Tiene un sesgo negativo. 3) La Media es un índice de centralización sesgado. 4) La Mediana es un índice centrado. 5) Son todas correctas.
53. El índice de Curtosis:
1) Mide la simetría de la curva. 2) Mide la modalidad de la curva. 3) Es la Desviación Estándar dividida entre la Media y multiplicada por 100. 4) Mide el grado de apuntamiento. 5) Mide si la Media coincide con la Mediana.
54. En la distribución Normal:
1) El Coeficiente de Asimetría es >0. 2) El Coeficiente de Curtosis es <0. 3) Es bimodal. 4) Es Mesocúrtica. 5) Es asimétrica.
55. Se dice que una distribución es Mesocúrtica cuando: 1) Es simétrica. 2) El Coeficiente de Variación es =0. 3) El Coeficiente de Curtosis es =0. 4) El Coeficiente de Asimetría es =0. 5) Ciertas 3 y 4.
56. Una distribución Normal es:
1) Simétrica. 2) Unimodal. 3) Mesocúrtica. 4) Distribución de Variables Continuas. 5) Son todas ciertas.
57. El Coeficiente de Asimetría de una Distribución de Frecuencias simétrica tiene un valor: 1) 0. 2) -1. 3) 1,96. 4) 1. 5) -1,96.
58. El Coeficiente de Curtosis de una Distribución de Frecuencias platicúrtica tiene un valor: 1) 2) 3) 4) 5)
>0. <0. >1. =1. =3.
59. Un estimador es insesgado: 1) Si es de mínima varianza. 2) Si es de varianza máxima. 3) Si es centrado sobre el valor muestral. 4) Si es centrado sobre el parámetro poblacional. 5) Ciertas 1 y 4.
60. En una distribución Simétrica, ¿Cuál es un estimador centrado de la Media Poblacional?:
1) Media. 2) Moda. 3) Mediana. 4) Rango. 5) Ciertas 1, 2 y 3.
61. Señale un estimador insesgado de la Media poblacional, si la Distribución es asimétrica: 1) Media. 2) Moda. 3) Mediana. 4) Varianza. 5) Ciertas 1, 2 y 3.
62. ¿Cuál es el estimador de mínima varianza de la Media poblacional?: 1) Media. 2) Moda. 3) Mediana. 4) Rango. 5) Desviación Media.
63. En distribución Simétricas, es un estimador centrado de la Varianza poblacional: 1) Varianza muestral. 2) Desviación Típica. 3) Cuasivarianza. 4) Error estándar de la Media. 5) Mediana.
64. En distribución Asimétricas, el estimador insesgado de la Variación poblacional es: 1) Varianza muestral. 2) Desviación Estándar. 3) Cuasivarianza. 4) Rango intercuartílico. 5) Mediana.
65. A La Desviación Típica de una distribución muestral de Medias se llama: 1) Rango de la media. 2) Error Típico de la media. 3) Varianza muestral. 4) Coeficiente de Variación. 5) Ninguna es cierta.
66. El Error Estándar de la Media es: 1) Un estadístico de dispersión. 2) Es la Desviación Típica de una distribución muestral de medias. 3) Es la distancia de la Media poblacional al punto de inflexión de la curva. 4) Sirve para estimar Medias. 5) Son todas ciertas.
67. El Error Estándar del Porcentaje es:
1) Un estadístico de dispersión. 2) Es la Desviación Típica de una distribución muestral de porcentajes. 3) Es la distancia del porcentaje poblacional al punto de inflexión de la curva. 4) Sirve para estimar porcentajes. 5) Son todas ciertas.
68. La Desviación Típica de una distribución muestral de un estadístico se llama: 1) Coeficiente de Variación. 2) Error Sistemático. 3) Error Estándar. 4) Varianza. 5) Desviación Estándar o Típica.
69. El intervalo Media Muestral ± 1,96 EEM(Error Estándar de la Media): 1) No dice gran cosa. 2) Comprende un 95% de las veces a la Media poblacional. 3) Comprende un 99% de las veces a la Media poblacional.
4) Da una seguridad del 68%. 5) Da una seguridad del 5%.
70. El intervalo Media Muestral ± EEM(Error Estándar de la Media) 1) No se usa nunca. 2) Comprende un 99% de las veces a la Media poblacional. 3) Comprende un 95% de las veces a la Media poblacional. 4) Da una seguridad del 99%. 5) Todas son falsas.
71. El intervalo Media Muestral ± EEM (Error Estándar de la Media): 1) Abarca a la Media poblacional un 68% de las veces. 2) No abarca a la Media poblacional algo menos del 32%. 3) La seguridad de que la Media poblacional esté en dicho intervalo es del 68%. 4) No se usa porque las probabilidades de fallar son muy altas. 5) Todas son ciertas.
72. La seguridad mínima exigida a cualquier estimación de Medias es: 1) Del 68% 2) Del 95% 3) Del 99% 4) Del 5% 5) Del 1%
73. La probabilidad de error máxima, permitida en la estimación de parámetros es: 1) <68% 2) <5% 3) <1% 4) <0,01. 5) Ciertas 3 y 4.
74. La probabilidad de error mínima, permitida en la estimación de parámetros es: 1) <68% 2) 5% 3) <1% 4) <0,1% 5) No hay.
75. La seguridad máxima exigida a cualquier estimación de parámetros es: 1) Del 68% 2) Del 95% 3) Del 99% 4) Del 99,9% 5) No hay tal seguridad máxima.
76. Una seguridad del 95% en la estimación de parámetros, lleva asociada una probabilidad de error: 1) Del 5% 2) De 0,05% 3) <5% 4) <1% 5) Menor de 0,01.
77. Una seguridad del 99% en la estimación de parámetros, lleva asociada una probabilidad de error: 1) Del 1% 2) De 0,01. 3) Menor del 1% 4) Menor de 0,01. 5) Ciertas 3 y 4.
78. Leemos en un artículo que la glucemia media es de 110 mg/dl ±10 mg/dl. p <0,01. 1) El resultado muestral es 110±10. 2) La seguridad es de más del 99% 3) La glucemia poblacional estará entre 10 y 120, con toda seguridad. 4) El Error Estándar de la Media es 10 mg/dl. 5) Ninguna es cierta.
79. La media de la tensión arterial es 90±5. p<0,05:
1) La Media de la muestra es 90. 2) La media de la población está entre 85 y 95, con una seguridad del 95% 3) La Media de la población está entre 85 y 95, con una probabilidad de equivocarte menor del 5% 4) El EEM es 5/1,96. 5) Son todas ciertas.
80. La estimación de la Media poblacional:
1) Se hace cuando se desconoce tal Media. 2) Se realiza por un proceso de inferencia llamado estimación. 3) Se calcula el EEM basándose en la Desviación Muestral. 4) Se dice entre qué valores puede estar la Media poblacional, con una probabilidad de equivocarse conocida. 5) Son todas ciertas.
81. El Test de Hipótesis:
1) Es un tipo de estadística descriptiva. 2) La Hipótesis nula plantea la existencia de diferencias. 3) La Hipótesis alternativa plantea la no diferencia. 4) La Hipótesis nula y la alternativa pueden no ser excluyentes. 5) Puedes saber la probabilidad de equivocarte en tu afirmación.
82. La probabilidad de acertar si aceptas la Hipótesis nula es: 1) El nivel de significación. 2) Es a . 3) Lo fija el investigador. 4) Es 1- a. 5) Ciertas 3 y 4.
83. La probabilidad de equivocarte si aceptas la Hipótesis nula: 1) Es a . 2) Es el nivel de significación. 3) Lo fija el investigador. 4) Como máximo se usa un nivel de 0,05. 5) Son todas ciertas.
84. La probabilidad de equivocarte al aceptar la Hipótesis Alternativa: 1) Se la conoce como b . 2) No la fija el investigador. 3) Es el complementario del poder del test. 4) Es el error tipo II. 5) Son todas falsas.
85. Si la Hipótesis nula es cierta y la aceptas: 1) Es el nivel a . 2) Es el poder del test. 3) Es el error tipo I. 4) Es 1- a. 5) Es el complementario de 1- b.
86. Si la Hipótesis nula es cierta y la rechazas: 1) No sabes qué probabilidad hay de que ocurra. 2) No tiene importancia. 3) La probabilidad es 1- a. 4) Nunca ocurre. 5) Es el error tipo I.
87. La capacidad de encontrar diferencias, habiéndolas: 1) Es impredecible. 2) Es el error tipo I. 3) Es el error tipo II. 4) Es el poder o potencia del test. 5) Usualmente es de 0,05.
88. La potencia de un test de Hipótesis: 1) Depende inversamente del 1- b. 2) Es el 1- a. 3) No depende de la magnitud real de la diferencia.
4) Depende directamente del tamaño de la muestra. 5) Generalmente es de 0,01.
89. La potencia o poder de un test de Hipótesis: 1) Es 1- b. 2) Es la capacidad del test de encontrar diferencias, habiéndolas. 3) Aumenta al aumentar el tamaño de la muestra. 4) Aumenta al aumentar la diferencia real. 5) Son todas ciertas.
90. En un tipo de cáncer pulmonar, la Quimioterapia es MEJOR que la cirugía: Las diferencias son estadísticamente significativas p<0,01. 1) Usamos un intervalo de confianza del 95% 2) Es fácil que las diferencias observadas sean debidas al azar. 3) La Quimioterapia es 999 veces mejor que la cirugía. 4) No se ha visto que uno sea mejor que la otra. 5) La Quimioterapia es mejor que la cirugía, a ese nivel de significación.
91. En el tratamiento de una artritis con reposo, mejoran el 60%; con aspirina mejoran el 55%. La diferencia es significativa con p<0,05: 1) Siempre que trates con aspirina a ese tipo de pacientes, mejorarán un 55% de los pacientes. 2) El reposo es un 95% mejor que la aspirina. 3) El nivel de significación es del 1% 4) Hay diferencias entre los dos tratamientos, a ese nivel de significación. 5) No se puede concluir nada.
92. En el tratamiento de una artritis con reposo, mejoran el 60%, con aspirina mejoran el 55%. La diferencia NO es significativa con p<0,05: 1) Si tratas con reposo a otros pacientes similares mejorarán el 60% de ellos. 2) Se puede concluir que el reposo es un 5% mejor que AAS. 3) El nivel de significación es del 95% 4) No podemos concluir que haya diferencias entre los tratamientos, a ese nivel de significación. 5) El reposo es mejor que la AAS, y otro estudio más potente lo demostraría.
93. La Clonidina es efectiva en un 87%. El Diltiacem en un 80%. Diferencias no son estadísticamente significativas, p<0,01: 1) La diferencia hallada en el estudio es debida al azar. 2) La diferencia hallada no es debida al azar. 3) La Clonidina es mejor que el Diltiacem. 4) La Clonidina y el Diltiacem son igualmente efectivas. 5) Son todas falsas.
94. La Clonidina es efectiva en un 87%. El Diltiacem en un 80%. Diferencias no son estadísticamente significativas, p<0,01: 1) La diferencia hallada en el estudio puede ser debida al azar. 2) No hay suficiente evidencia para decir quien es mejor. 3) La Clonidina y el Diltiacem pueden ser igualmente efectivas, a pesar de los resultados observados. 4) La Clonidina puede ser mejor que el Diltiacem, pero no tenemos suficiente evidencia para afirmarlo. 5) Son todas ciertas.
95. La cirugía es efectiva en un 90%. La medicación en un 80%. Diferencias estadísticamente significativas con p<0,05: 1) La Hipótesis nula plantea que los dos son igualmente efectivos. 2) La Hipótesis alternativa dice que los dos tipos d e tratamiento no son igualmente efectivos. 3) Si la Hipótesis nula fuese cierta, hay menos de un 5% de probabilidades de concluir que un tratamiento es mejor que el otro. 4) Al afirmar que los dos tratamientos no son iguales, hay menos del 5% de probabilidades de equivocarnos. 5) Todas son ciertas.
96. La cirugía es efectiva en un 90%. La medicación en un 80%. Diferencias estadísticamente significativas con p<0,05.
1) Afirmamos que hay diferencias entre ambos tratamientos, p<0,05. 2) Decimos que ambos tratamientos son distintos, con una probabilidad de error <0,05. 3) Si ambos tratamientos fueran iguales, habría menos de un 5% de posibilidades de encontrar entre ellos una diferencia del 10%
4) El error tipo I es <5% 5) Son todas ciertas.
97. La Aspirina mejora al 60%. El paracetamol al 70%. Diferencias NO son estadísticamente significativas, p<0,05. Potencia del test de Hipótesis del 40%: 1) El error tipo II es del 60%. 2) Afirmamos que pueden ser ambos tratamientos iguales. 3) Hay menos del 50% de posibilidades de encontrar diferencias si las hubiera. 4) El error tipo I es menor del 5%. 5) Todas son ciertas.
98. La probabilidad de error a es:
1) Rechazar Ho cuando es verdadero Ho. 2) Equivocarse cuando se rechaza Ha. 3) Equivocarse cuando se acepta Ho. 4) Aceptar Ho cuando es verdadera Ha. 5) No rechazar Ho.
99. A la capacidad que tiene un test estadístico para detectar diferencias significativas se denomina: 1) Precisión. 2) Ajuste. 3) Sesgo. 4) Potencia. 5) Significación.
100. El error tipo I o alfa es la probabilidad de: 1) Aceptar una Ho siendo falsa. 2) Aceptar una Ho siendo cierta. 3) Rechazar una Ho siendo falsa. 4) Rechazar una Ho siendo cierta. 5) Son correctas 2 y 3. ********************************************************************************************** **************************
SOLUCIONES ESTADÍSTICA – TEST 2
51
52
53
54
55
56
57
58
59
60
3
5
4
4
3
5
1
2
4
5
61
62
63
64
65
66
67
68
69
20
3
1
3
4
2
5
5
3
2
5
71
72
73
74
75
76
77
78
79
80
5
2
2
5
5
3
5
5
5
5
81
82
83
84
85
86
87
88
89
90
5
5
5
5
4
5
4
4
5
5
91
492
93
94
95
96
97
98
99
100
4
4
5
5
5
5
5
1
4
4
Artículos relacionados:
101. El error tipo II o error beta es la probabilidad de: 1) Rechazar una Ho siendo verdadera. 2) Aceptar una Ho siendo verdadera. 3) Rechazar una Ho siendo falsa. 4) Aceptar una Ho siendo falsa. 5) Son correctas 1 y 3.
102. ¿Qué nivel de significación mínimo es utilizado en cualquier test de Hipótesis? 1) 0,1% 2) 0,5% 3) 1% 4) 5% 5) 10%
103. Si al realizar un test de Hipótesis, el resultado es no significativo, la probabilidad asociada es: 1) 2) 3) 4) 5)
p£0,01. p£0,05. p> 0,05. p> 0,005. p= 0,01.
104. Para comprobar la homogeneidad de varias medias independientes se usa el test no paramétrico de : 1) Kruskal-Wallis. 2) McNemar. 3) Cohcran. 4) Wilcoxon. 5) Friedmann.
105. Planteado un diseño experimental, y fijada una prueba de hipótesis, si se aumenta el tamaño de las muestras: 1) Aumenta la probabilidad de error ay b . 2) Disminuye la probabilidad de error a y b. 3) Aumenta la probabilidad de error a . 4) Disminuye la probabilidad de error b . 5) Aumenta la probabilidad de error a y disminuye la de b.
106. Si se desea realizar un contraste de hipótesis, ¿Cuál de las siguientes situaciones es mejor: 1) 2) 3) 4) 5)
a= 0,05 y b = 0,05. a = 0,05 y b = 0,10. a = 0,01 y b = 0,05. a = 0,01 y b = 0,10. a = 0,01 y b = 0,01.
107. Si la Ho es cierta y la aceptas: 1) La probabilidad es 1- a . 2) La probabilidad la fija el investigador. 3) Se usa como mínimo un intervalo del 95% 4) Es el tamaño del test de Hipótesis. 5) Son todas ciertas.
108. Un test de Hipótesis es tanto mejor cuanto mayor sea su:
1) Confianza. 2) Potencia. 3) Facilidad de cálculo. 4) Nivel de significación. 5) Error Tipo II.
109. El error tipo I se define como la probabilidad de: 1) Aceptar Ho siendo cierta. 2) Aceptar Ho y H1. 3) Rechazar Ho siendo cierta. 4) Rechazar Ho siendo falsa. 5) Aceptar Ho siendo falsa.
110. El error tipo II se define como la probabilidad de : 1) Aceptar Ho cuando es cierta. 2) Rechazar Ho y H1. 3) Rechazar Ho cuando es falsa. 4) Aceptar Ho cuando es falsa. 5) Rechazar Ho cuando es cierta. 111. ¿Qué significa que un coeficiente de correlación de Pearson es de “ -0,9″ : 1) Que hay una mala correlación entre las dos variables. 2) Que la relación es inversa o negativa. 3) Que la relación es lineal. 4) Que la relación es muy buena. 5) Ciertas 2 y 4.
112. ¿Qué significa un Coeficiente de Correlación de Pearson de +0,95? 1) Que no hay relación lineal. 2) Que la relación lineal es muy buena. 3) Que la relación es inversa. 4) Que cuando una variable aumenta, la otra disminuye. 5) Son todas falsas.
113. La existencia de relación entre dos variables cuantitativas se verifica mediante el test de : 1) Independencia (contingencia). 2) De Mann-Whitney. 3) ANOVA (Análisis de la Varianza). 4) Correlación. 5) Chi-Cuadrado.
114. Para estudiar la relación entre dos variables cuantitativas se puede usar: 1) Coef. de Correlación de Pearson. 2) Coef. de Correlación de Spearman. 3) Coef. de Contingencia de Pearson. 4) Regresión. 5) Ciertas 1, 2 y 4.
115. E Cuadrado de Coeficiente de Correlación r de Pearson (r 2 ) se denomina: 1) Coeficiente de Asimetría. 2) Coeficiente de Contingencia. 3) Coeficiente de Determinación. 4) Coeficiente de Indeterminación. 5) Coeficiente kappa.
116. ¿Cuál de las siguientes propiedades se refiere a la Covarianza? 1) Es un estadístico de posición. 2) Es un estadístico adimensional. 3) Es un coeficiente no paramétrico. 4) Puede tomar valores negativos. 5) Su valor oscila entre -1 y +1.
117. El coeficiente de Correlación de Pearson puede usarse : 1) Cuando la relación entre dos variables no sea lineal. 2) Cuando una de las dos variables no sea cuantitativa. 3) Cuando la relación entre las variables sea lineal.
4) Cuando se desconozca la distribución de las variables. 5) Cuando el nº de datos sea pequeño.
118. El estadístico de dispersión que permite conocer el grado de variación conjunta entre dos variables cuantitativas es : 1) Varianza. 2) Desviación Típica o estándar. 3) Covarianza. 4) Rango o recorrido. 5) Coeficiente de Variación.
119. Para comparar correctamente, desde un punto de vista descriptivo, la dispersión de dos o más variables debe usarse : 1) La desviación estándar. 2) La amplitud. 3) El Coeficiente de Variación. 4) La covarianza. 5) La desviación media. 120. Siendo “a” la ordenada en origen y “b” la pendiente de la recta, la ecuación de regresión la recta
de regresión de y sobre x es: 1) y’= b+ax. 2) y’= a+bx. 3) x’= b+ay. 4) x’= a+by. 5) y’= a+b/x.
121. El Coeficiente de Correlación de Pearson (r) es una medida de relación lineal entre: 1) Dos Var. Discretas. 2) Dos Var. Continuas. 3) Dos Var. Cualitativas. 4) Una Cualitativa y otra Discreta. 5) Ninguna es correcta.
122. Es Coeficiente de Correlación (r) de Pearson, puede tomar valores entre: 1) -1 y 0. 2) 0 y 1. 3) -1 y 1. 4) -0,5 y 1,5. 5) -1,5 y 1,5.
123. El Coeficiente de Correlación de Pearson sirve para estudiar: 1) Relación entre dos variables Cuantitativas de tipo logarítmico. 2) Relación lineal entre dos variables. de cualquier tipo. 3) Relación exponencial entre dos variables Cuantitativas. 4) Relación lineal entre dos variables. Dicotómicas. 5) Relación lineal entre dos variables Cuantitativas.
124. El Coeficiente de Correlación de Pearson (r):
1) Varía entre -1 y +1. 2) Tiene el mismo signo que la Covarianza de la que procede. 3) Sirve para estudiar la relación lineal entre dos Var. Cuantitativas. 4) Si se eleva al cuadrado, es el Coeficiente de Determinación. 5) Son todas ciertas.
125. La existencia de relación entre dos Var. Cualitativas se verifica mediante el test de: 1) U de Mann-Whitney. 2) Independencia (Contingencia). 3) Correlación. 4) Linealidad. 5) 2 y 3 son ciertas.
126. Los grados de libertad de una tabla de contingencia (independencia) 2×2 son: 1) 1. 2) 2. 3) 3.
4) 4. 5) 5.
127. Los grados de libertad de una tabla de contingencia 5×8 son: 1) 40. 2) 38. 3) 28. 4) 14. 5) 2.
128. Los grados de libertad de la Ji-Cuadrado de Pearson, en una tabla de contingencia (independencia) 3×2 son: 1) 0 2) 3. 3) 6. 4) 2. 5) 1.
129. El Coeficiente de Contingencia (de Pearson): 1) Mide la Correlación entre dos Var. Cuantitativas. 2) Mide la asociación entre dos Var. Cualitativas. 3) Mide la Variación entre medias apareadas. 4) Es un índice de centralización. 5) Todas son falsas.
130. El Coeficiente de Contingencia es un índice de: 1) Asimetría. 2) Curtosis. 3) Asociación. 4) Normalidad. 5) Ninguna es correcta.
131. La Distribución Chi-Cuadrado se usa: 1) Tablas de Contingencia. 2) Homogeneidad de varias muestras Cualitativas. 3) Bondad de ajuste de una distribución. 4) Test de Homogeneidad de varios parámetros de Poisson. 5) Todas son ciertas.
132. Si en una tabla de Contingencia, mayor que 2×2, hay más de un 20% de valores teóricos menores de 5, antes de hacer el Test de la Ji-Cuadrado: 1) No hay que hacer nada. 2) Hay que transformar la tabla, agrupando filas o columnas. 3) Hay que hacer como si no lo hubiéramos visto. 4) Hay que hacer la corrección de Yates. 5) Hay que hacer un Análisis de la Varianza.
133. Si en una Tabla de Contingencia de 2×2, hay algún valor menor de 5: 1) Se le suma 5. 2) Se agrupan filas o columnas. 3) Se hace una Regresión. 4) Se divide por la Media. 5) Se usa la Corrección de Yates.
134. El Coeficiente de Contingencia (de Pearson): 1) Mide la correlación entre dos Var. Cuantitativas. 2) Mide el grado de asociación entre dos Var. Cualitativas. 3) Es lo mismo que el Coeficiente de Correlación de Pearson. 4) Va desde 0 a +1. 5) Ciertas 2 y 4.
135. La Distribución Chi-Cuadrado se emplea para el test de: 1) Dos Medias paramétrico. 2) Bondad de ajuste. 3) Independencia (contingencia). 4) Tres Medias paramétrico.
5) Ciertas 2 y 3.
136. La Distribución de probabilidad usada para comparar 2 varianzas es: 1) Ji-Cuadrado. 2) F de Fisher-Snedecor. 3) Poisson. 4) T de Student. 5) Binomial.
137. El estudio de la relación entre una Var. Cuantitativa, y una Cualitativa de más de dos categorías, se hace mediante: 1) El Coeficiente de Correlación de Pearson. 2) El Coeficiente de Contingencia de Pearson. 3) El Coeficiente de Paciencia de Buda. 4) El Test de Friedmann. 5) El Análisis de la Varianza.
138. Los requisitos previos que deben cumplir las muestras para hacer el ANOVA: 1) Han de ser Aleatorias. 2) Han de ser independientes. 3) Las variables deben ser Normales en la población. 4) Las Varianzas de las muestras han de ser Homogéneas. 5) Todas son ciertas.
139. La Hipótesis de normalidad de la Variable se comprueba con el Test: 1) De Wilcoxon. 2) De Friedmann. 3) De Barlet. 4) De Kruskal-Wallis. 5) De Agostino.
140. El Análisis de la Varianza (ANOVA) se usa para: 1) Comprobar la asociación entre una variables Cuantitativa y una Cualitativa de más de dos categorías. 2) Comprobar la homogeneidad de varias muestras apareadas. 3) Comparar entre sí tres o más medias. 4) Comprobar la asociación entre dos variables Cualitativas. 5) Ciertas 1, 2 y 3.
141. Qué test estadístico permite comparar dos o más muestras independientes en condiciones de normalidad. 1) Friedmann. 2) Wilcoxon. 3) Barlet. 4) Kolmorogoff-Smirnow. 5) Análisis de la Varianza. 142. Cuál no es un test “a posteriori) en el Análisis de la Varianza. 1) Tukey. 2) Dunnet. 3) Bonferrony. 4) Barlet. 5) Todos son test “a posteriori”.
143. La Hipótesis de Homogeneidad de las Varianzas se verifica mediante el test de : 1) Wilcoxon. 2) Levene. 3) Los signos. 4) Barlet. 5) 2 y 4 son ciertas.
144. Si la F entre grupos resulta ser significativa en un Análisis de la Varianza, del criterio de clasificación (modelo fijo) realizado para comparar el efecto de cuatro fármacos, qué debe hacerse a continuación: 1) Se acaba el estudio. 2) Se realiza un test a posteriori de Comparaciones Múltiples. 3) Se realiza un test no paramétrico.
4) Se realiza un test de homogeneidad de la Varianzas. 5) Se realiza un test de bondad de ajuste.
145. Uno de los siguientes test estadísticos, es un test de Normalidad: 1) Barlet. 2) Agostino. 3) Kruskal-Wallis. 4) Levene. 5) Neyman-Pearson.
146. La posible asociación entre dos variables cualitativas se ve: 1) Test de la Ji-Cuadrado. 2) Ji-Cuadrado con corrección de Yates. 3) Test exacto de FISHER. 4) ANOVA. 5) Ciertas 1, 2 y 3.
147. La posible asociación entre dos variables cuantitativas se estudia con: 1) Coef. de Correlación de Pearson. 2) Coef. de Correlación de Spearman. 3) Regresión Lineal. 4) Regresión Logarítmica. 5) Son todas ciertas.
148. La asociación entre una Var. Cuantitativa y una Cualitativa de más de dos categorías se ve con: 1) Ji-Cuadrado. 2) Test de McNemar. 3) ANOVA. 4) “T” de Student. 5) Hipergeométrica.
149. La asociación entre una Var. Cuantitativa, y otra Cualitativa de 2 categorías se estudia con: 1) Ji-Cuadrado. 2) T de Student. 3) ANOVA. 4) “U” de Mann-Whitney. 5) Ciertas 2 y 4.
150. La asociación entre una Cuantitativa y una Cualitativa de dos categorías (método no paramétrico): 1) Test de la Ji-Cuadrado. 2) “U” de Mann-Whitney. 3) Coef. de Corr. de Spearman. 4) Test de Kruskal-Wallis. 5) T de Student. ********************************************************************************************** ***************************
SOLUCIONES ESTADÍSTICA – TEST 3
101
102
103
104
105
106
107
108
109
110
4
4
3
1
4
5
5
2
3
4
111
112
113
114
115
116
117
118
119
120
5
2
4
5
3
4
3
3
3
2
121
122
123
124
125
126
127
128
129
130
2
3
5
5
2
1
3
4
2
3
131
132
133
134
15
136
137
138
139
140
5
2
5
5
5
2
5
5
5
5
141
142
143
144
145
146
147
148
149
150
5
4
5
2
2
5
5
3
5
2
Artículos relacionados: 151. El test no paramétrico, para estudiar la asociación entre una Var. Cuantitativa, y una Cualitativa de más de dos categorías: 1) Test de Barlet. 2) Test de Tukey. 3) Test de Bonferroni. 4) Test de Kruskall-Wallis. 5) Test de Friedmann.
152. Es test no paramétrico, para estudiar la relación entre dos Var. Cuantitativas es: 1) Coef. de Correlación de Spearman. 2) Coef. de Correlación de Pearson. 3) Coef. de Correlación de Barlet. 4) Test de Wilcoxon. 5) Ciertas 1 y 2.
153. Cual de los siguientes es un dato apareado: 1) Talla entre hombres y mujeres. 2) Relación talla-peso. 3) Glucemia en diabéticos y en no diabético. 4) Glucemia antes y después de comer. 5) Agudeza visual en reptiles.
154. La asociación entre dos Var. Cualitativas, apareadas, se verifica con: 1) ANOVA. 2) Ji-Cuadrado. 3) Test de McNemar. 4) “T” de Student. 5) Test de Friedmann.
155. La asociación de dos Medias de tipo apareado, se hace con: 1) El test de McNemar. 2) Correlación de Spearman. 3) Ji-Cuadrado. 4) “T” de Student apareada. 5) ANOVA.
156. La asociación de varias Medias apareadas, se verifica mediante: 1) Test de McNemar. 2) Test de Ji-Cuadrado. 3) ANOVA de medias repetidas.
4) Test de Friedmann. 5) Ciertas 3 y 4.
157. Uno de los siguientes NO es un test NO PARAMÉTRICO: 1) “U” de Mann-Whitney. 2) Test de Kruskall-Wallis. 3) Coeficiente de Correlación de Spearman. 4) Test de Wilcoxon. 5) ANOVA.
158. Como se pueden comparar dos Medias: 1) Test de Ji-Cuadrado. 2) Test de McNemar. 3) Test de Cohcran. 4) “T” de Student. 5) Correlación.
159. ¿Cuál es un método NO PARAMÉTRICO, de comparar dos medias?: 1) “T” de Student. 2) Test de la Ji-Cuadrado. 3) Test de Wilcoxon. 4) Test de Friedmann. 5) ANOVA.
160. ¿Cómo se pueden comparar varias Medias?: 1) ANOVA. 2) Test de Kruskall-Wallis. 3) Test de Friedmann. 4) Test de McNemar. 5) Ciertas 1, 2 y 3.
161. ¿Con cuál se pueden comparar dos proporciones?: 1) Test de la Ji-Cuadrado. 2) Test de McNemar. 3) Test de Barlet. 4) Test de Wilcoxon. 5) Ciertas 1 y 2.
162. ¿Cómo se pueden comparar varias proporciones?: 1) Test de la Ji-Cuadrado. 2) Test de McNemar. 3) Test de Cohcran. 4) Test de Wilcoxon. 5) Ciertas 1 y 2.
163. Para comparar varias proporciones, con datos independientes, se aplica el test de: 1) La Ji-Cuadrado. 2) Cohcran. 3) McNemar. 4) Wilcoxon. 5) ANOVA.
164. ¿Con cuál de los siguientes se pueden comparar dos Varianzas, con datos independientes? 1) “T” de Student. 2) “F” de Snedecor. 3) Test de Agostino. 4) Distri. Binomial. 5) Test de Cohcran.
165. ¿Con cuál de los siguientes se pueden comparar dos Varianzas, con datos apareados? 1) A ojo. 2) “T” de Student. 3) “F” de Snedecor. 4) Test de McNemar. 5) Test de Wilcoxon.
166. ¿Cuál de los siguientes permite comparar varias Varianzas?:
1) Friedmann. 2) Pearson. 3) Levene. 4) Agostino. 5) Wilcoxon.
167. ¿Cuál de los siguientes permite comparar varias Varianzas?: 1) Agostino. 2) Pearson. 3) Barlet. 4) Wilcoxon. 5) McNemar.
168. Para convertir una distribución Exponencial en un Distribución Normal se usa la transformación: 1) Recíproca. 2) Angular. 3) Logarítmica. 4) Cuadrada. 5) Ordinal.
169. Si se pretende convertir una Distribución de Poisson en una Distribución Normal, se aconseja usar la transformación: 1) De la raíz cuadrada. 2) Recíproca. 3) Angular. 4) Logarítmica. 5) Ninguna es correcta.
170. La estimación de Medias se hace con: 1) La distribución Normal. 2) El Error Estándar. 3) La distribución “T” de Student. 4) La distribución Binomial. 5) Ciertas 1, 2 y 3.
171. La estimación de porcentajes se hace con: (señale lo FALSO): 1) La distribución Normal. 2) La distribución “T” de Student. 3) La distribución Binomial. 4) El porcentaje muestral. 5) El Error Estándar del Porcentaje.
172. Señale lo falso:
1) Si una variable cualitativa solo acepta dos posibilidades se llamara dicotómica. 2) El número de hijos es una variable cuantitativa discreta. 3) El nivel de colesterol es una variable cuantitativa continua. 4) Las variables cualitativas proporcionan más información que las cuantitativas. 5) Cuando una variable cuantitativa es susceptible de ser ordenada de un modo lógico y ascendente o descendente se dice que es ordinal.
173. Señale lo falso en relación con la media aritmética:
1) Es una medida de posición. 2) Sus unidades de medida son las mismas que las de la variable que se describe. 3) Es un índice muy fiable porque en su cálculo intervienen todos los valores de la distribución. 4) Este índice solo tiene sentido con datos cuantitativos. 5) Todas son falsas.
174. Hablando del coeficiente de variación, señale lo que es cierto:
1) Es el cociente entre la desviación estándar y la media. 2) No tiene dimensiones. 3) Es independiente de las unidades de medida. 4) Es una medida de dispersión relativa que permite comparar la dispersión de dos distribuciones diferentes. 5) Todo lo anterior es cierto.
175. En relación con la distribución normal, ¿Cuál de las siguientes afirmaciones es falsa?: 1) Es una distribución de probabilidad teórica discreta.
2) La distancia entre el eje vertical trazado en la media y el punto de inflexión de la curva es la desviación estándar. 3) Es simétrica y unimodal. 4) Cualquier valor entre – infinito y + infinito es teóricamente posible. 5) Tiene forma de campana.
176. Respecto a las pruebas de significación señala lo falso:
1) Es un procedimiento por el cual nos decidimos por la hipótesis nula (Ho) o por la alternativa (H 1). 2) La Ho es la hipótesis de la no diferencia. 3) La H1 es la que se pone a prueba al realizar una prueba estadística de significación. 4) La H1 es al que se aceptará si el resultado de la prueba permite rechazar la Ho. 5) La significación estadística es la condición resultante del rechazo de la Ho mediante las pruebas de significación. 177. Señale lo cierto sobre el grado de significación estadística o valor “p”: 1) Es la probabilidad de que la Ho sea cierta. 2) Es la probabilidad de que el resultado observado se deba al azar. 3) Su valor depende de la magnitud del efecto y del número de sujetos estudiados, entre otros. 4) Una y dos son ciertas. 5) Todas son ciertas.
178. Queremos comparar la talla media entre hombres y mujeres, ¿Cuál será la prueba estadística más apropiada ?: 1) F de Snedecor. 2) Chi-cuadrado. 3) t de Student. 4) Coeficiente de correlación de Pearson. 5) Ninguna de las anteriores.
179. Se desea comparar la prevalencia de hipertensión entre hombres y mujeres. Al aplicar la prueba de la Chi-cuadrado, los grados de libertad serán: 1) 1. 2) 2. 3) 4. 4) 6. 5) 3.
180. Hablando de regresión y correlación, señala lo verdadero: 1) En la regresión interviene una variable dependiente y una o más independientes. 2) En la correlación las dos variables juegan un papel simétrico. 3) Estudian la relación entre dos variables cualitativas. 4) Una y dos son ciertas. 5) Todas son ciertas.
181. El error estándar es:
1) Un índice de dispersión. 2) Un índice de centralización. 3) La desviación típica de la curva de Gauss tipificada. 4) Otro nombre de la desviación típica. 5) Todas son ciertas.
182. Hablando de índices de validez de una prueba diagnóstica, señala lo verdadero: 1) La sensibilidad es el cociente entre verdaderos positivos y el total de sanos. 2) La especificidad es el cociente entre verdaderos negativos y total d e enfermos. 3) El valor predictivo positivo es el cociente entre verdaderos positivos y total de individuos con resultado del test positivo. 4) Son ciertas 1 y 3. 5) Son ciertas 2 y 3.
183. Si la especificidad de un test de screening para una determinada enfermedad es de 95%, podemos esperar que: 1) El test será positivo en el 95% de los individuos con enfermedad. 2) Será negativo en el 95% de los individuos sin enfermedad. 3) Entre los individuos con test positivo, el 95% tendrán la enfermedad. 4) Entre los individuos con test negativo, el 95% no tendrán la enfermedad. 5) Ninguna de las anteriores.
184. El test no paramétrico que determina la asociación entre dos variables cuantitativas es el de:
1) Student. 2) ANOVA. 3) Wilcoxon 4) Kruskal-Wallis. 5) Correlación de Spearman.
185. Para comprobar la homogeneidad de varias proporciones t con datos apareados se usa el test de: 1) Chi-cuadrado. 2) ANOVA. 3) Friedmann. 4) Cohcran. 5) Student.
186. Es un test a posteriori: 1) Chi-cuadrado. 2) Bartlett. 3) F de Snedecor. 4) Tukey. 5) Ninguno de los anteriores.
187. Un estudio ha codificado el hábito tabáquico de los sujetos estudiados como: fumador importante, moderado y no fumador. ¿Qué escala de medida ha utilizado?.: 1) De intervalo. 2) Ordinal. 3) De razón. 4) Nominal. 5) Ninguna de las anteriores.
188. La medida de posición que corresponde al valor de la variable más frecuente en la distribución se llama: 1) Percentil. 2) Mediana. 3) Media aritmética. 4) Moda. 5) Ninguna de las anteriores.
189. En relación a la varianza señale lo verdadero: 1) Es una medida de dispersión. 2) La varianza se define como la media de la suma de cuadrados de las diferencia entre cada valor de la variable y la media aritmética de la distribución. 3) Las unidades de medida de la varianza son las mismas que las de variable que describe. 4) Junto con la media, define una distribución normal. 5) Todas son ciertas.
190. Se llama potencia o poder de una prueba estadística:
1) Al riesgo que voluntariamente asume el investigador, de equivocarse al rechazar su Ho cuando en realidad es cierta. 2) A la probabilidad de que el resultado observado se deba al azar. 3) A la probabilidad de rechazar Ho cuando es verdadera. 4) A la probabilidad de rechazar Ho cuando es falsa. 5) A la probabilidad Ho si es cierta.
191. ¿Cuál de las siguientes pruebas debe utilizarse para comparar tres medias observadas tres muestras independientes?.: 1) Chi-cuadrado. 2) t de Student. 3) ANOVA. 4) Coeficiente de correlación de Pearson. 5) Ninguna de las anteriores.
192. Respecto a la prueba estadística de la Chi-cuadrado, señala lo falso. 1) Se emplea para estudiar la relación entre dos variables cuantitativas. 2) Se basa en las diferencias entre las frecuencias observadas y las esperadas. 3) En ocasiones precisa una corrección por discontinuidad. 4) Requiere que ninguna frecuencia esperada sea menor de 1 y no más del 20% de ellas menor o igual que 5.
5) Si el valor de X²exp es mayor que de la X² teórica, rechazamos la Ho.
193. El rango intercuartílico es:
1) Un índice de dispersión. 2) Un índice de centralización. 3) La desviación típica de la curva de Gauss tipificada. 4) Otro nombre de la desviación típica. 5) Todas son correctas.
194. Los resultados de un estudio sobre la relación de dos variables señalan la siguiente ecuación de Regresión Lineal: Y=3+0.8x. Señala lo verdadero con relación a ella: 1) La variable dependiente (y) aumenta en 0.8 por cada unidad de aumento de la variable independiente (X). 2) El valor de la variable dependiente cuando la independiente vale 0 es igual a 3. 3) La pendiente de la recta vale 0.8. 4) La ordenada en el origen de la recta vale 3. 5) Todas son correctas.
195. ¿Cuál de las siguientes afirmaciones es verdadera?.:
1) La sensibilidad de una prueba diagnostica mide su capacidad para detectar la enfermedad que se estudia cuando dicha enfermedad está presente. 2) La especificación de un test diagnóstico mide su capacidad para descartar la enfermedad que se estudia cuando dicha enfermedad está ausente. 3) Cuanto mayor sea la sensibilidad de una prueba diagnóstica menor será la proporción de falsos ne gativos. 4) 1 y 3 son ciertas. 5) Todas son ciertas.
196. Señale lo cierto sobre le coeficiente de correlación:
1) Es una medida de asociación lineal entre dos variables. 2) Su valor va de -1 a +1. 3) No tiene unidades. 4) Cuando su valor es 0 decimos que las dos variables no tienen relación lineal. 5) Todas son ciertas.
197. Hablando de regresión y correlación, señale lo falso:
1) Estudia la relación entre dos variables cualitativas. 2) En la regresión interviene una variable dependiente y una o más independientes. 3) En la correlación las dos variables juegan un papel simétrico. 4) La pendiente de la recta de regresión lineal indica lo que aumenta la variable dependiente por cada unidad de aumento de la variable independiente. 5) La ordenada en el origen indica el valor de la variable dependiente cuando la independiente vale 0.
198. ¿Que test mide la relación entre dos variables cualitativas?.: 1) Wilcoxon. 2) ANOVA. 3) Chi-cuadrado. 4) t de Student. 5) Friedmann.
199. Para comprobar la homogeneidad de dos varianzas para datos apareados se usa el test de: 1) Bartlett. 2) Levene. 3) t de Student. 4) F de Snedecor. 5) ANOVA.
2000. ¿Que test se usa para comparar medidas repetidas?.: 1) Wilcoxon. 2) Friedmann. 3) T-Student para datos apareados. 4) 1, 2 y 3 son correctas. 5) 1, 2 y 3 son falsas. ********************************************************************************************** ***************************
SOLUCIONES ESTADÍSTICA – TEST 4
151
152
153
154
155
156
157
158
159
160
4
1
4
3
4
5
5
4
3
5
161
162
163
164
165
166
167
168
169
170
5
5
1
2
2
3
3
3
1
5
171
172
173
174
175
176
177
178
29
180
2
4
4
5
1
3
5
3
1
4
181
182
183
184
185
186
187
188
189
190
1
3
2
5
4
4
2
4
5
5
191
192
193
194
195
196
197
198
199
200
3
1
1
5
5
5
1
3
1
4
Artículos relacionados:
Cómo calcular el tamaño muestral Autor: JOSÉ MARÍA BELLÓN | Visitas: 2.704 views | Categoría: TEORÍA
Introducción La mayoría de las veces no es factible reunir todos los elementos de una población para poder estudiarlos y responder a las preguntas de nuestro estudio. Uno de los objetivos principales de la estadística es obtener información a partir de los resultados de una muestra e inferir dichos resultados a la población de la cual procede. El problema para el investigador es decidir qué tamaño muestral necesita y cuál será el procedimiento para elegir los elementos de su muestra. En este capítulo trataremos de ver las dificultades que subyacen a la primera pregunta y reflexionar sobre ella: ¿cuántos pacientes voy a necesitar? ¿Porqué calcular el tamaño muestral? No es fácil calcular el número de pacientes que un investigador necesita para responder a su pregunta de estudio, entre otras razones, porque no existe un número único, ya que va a depender de muchos factores. Por escasos que
sean nuestros conocimientos en estadística y en probabilidad, cualquier persona intuye que se puede fiar más de un estudio que tenga un gran tamaño muestral que de otro que tenga pocos pacientes. Efectivamente así es, cuanto mayor sea el tamaño muestral mejor. Sin embargo, para responder nuestra pregunta de estudio: ¿para qué reclutar 500 pacientes si 100 pueden ser suficientes? Los errores que podemos cometer en la recogida de los datos se pueden clasificar en errores sistemáticos y aleatorios. El primero puede estar originado por un defecto en el instrumento de medida o por la forma en la que obtenemos nuestras mediciones. El segundo, el error aleatorio, no es predecible y es debido al azar. Se relaciona con la falta de precisión. Este error se produce normalmente por errores en la medición y en la variabilidad de las observaciones, y en definitiva, porque trabajamos con una muestra. El error sistemático es más grave y también más difícil de detectar. Puede ser debido a la elección de una muestra no representativa, mediciones de mala calidad, etc. Este tipo de error nos va a provocar sesgos en los resultados y al mismo tiempo va a afectar a la validez del estudio. Un buen ejemplo para distinguir ambos errores es el siguiente: queremos saber nuestro peso y para ello disponemos de una báscula poco precisa. Cada vez que nos pesamos nos da un resultado distinto con una diferencia de +/- ? Kg. (donde ? es una cantidad desconocida). En este caso estaríamos ante un error aleatorio. Sin embargo si la báscula estuviese mal calibrada y diese en cada pesada un resultado +? Kg. superior a nuestro peso real (siendo ? una cantidad igualmente desconocida), cometeríamos un error sistemático. En el primer caso (error aleatorio), podemos saber nuestro peso real con repetir las pesadas y realizar una media. Sin embargo en el segundo caso, por más que repitiera las pesadas, siempre obtendría un resultado superior a mi peso real de +? kg. Podemos reducir el error sistemático mediante la selección y el análisis de una muestra lo más representativa de la población a estudio. Para conseguirlo, nos puede ayudar una selección aleatoria de los elementos que componen la muestra a estudiar (aunque esto por sí mismo, no es una garantía). También podemos reducir el error sistemático mediante un diseño de estudio eficaz, con una buena calidad en la información recogida y con mediciones estandarizadas. El error aleatorio no puede ser eliminado, pero sí reducido con un diseño de estudio más eficiente y aumentando el tamaño muestral. Este tipo de error es estimado y es el que se tiene en cuenta al calcular los intervalos de confianza y al aplicar las pruebas de contraste de hipótesis. Por lo tanto, a mayor tamaño muestral, mayor precisión y menor error aleatorio en nuestras estimaciones. Sin embargo, hay que tener en cuenta que el tamaño muestral no reduce el error sistemático como hemos podido ver en el ejemplo de la báscula y las pesadas. Las fórmulas para calcular el tamaño muestral Las fórmulas utilizadas para calcular el tamaño muestral, tienen en cuenta el error aleatorio, no el sistemático. Fórmulas hay muchas y dependen del tipo de estudio y de los objetivos planteados. Veamos el ejemplo más sencillo para calcular un tamaño muestral que es la estimación de una prevalencia. Imaginemos que un investigador desea calcular la prevalencia de EPOC en personas mayores de 40 años en la Comunidad Autónoma de Madrid. Suponiendo el diseño más sencillo posible que consiste en la elección de una muestra aleatoria simple (MAS) de toda la población elegible, la fórmula para calcular el tamaño muestral sería la siguiente:
Donde:
Z1-a: Es el valor Z correspondiente a un riesgo alfa prefijado de antemano. Aquí ya empiezan los problemas. La Z es el valor de una distribución Normal de media 0 y desviación típica 1. En función de la confianza deseada para la construcción de nuestro intervalo de confianza (IC), este valor puede variar. Si queremos construir un intervalo de confianza del 95%, el a será de 0,05, y para dicho valor, Z=1,96. Esta cifra se puede calcular con cualquier programa estadístico o simplemente en una tabla en donde aparezca tabulada la distribución Normal (0, 1). Los valores usados con más frecuencia son Z=1,96 para construir intervalos de confianza del 95% y de Z=2,58 para
crear IC del 99%. Un IC del 95% asume un riesgo alfa del 5% mientras que un IC del 99% asume un riesgo del 1%. En el caso del riego alfa del 5%, queremos decir que puede que el intervalo de confianza construido no incluya al verdadero valor poblacional, y asumimos que esto pueda suceder el 5% de las veces.
p: Es un valor aproximado del parámetro que queremos medir, en nuestro ejemplo es la prevalencia de EPOC (no confundir con la p de la significación estadística).
d: Es la precisión deseada para nuestro estudio. Dicho de otro modo, es la amplitud deseada para nuestro intervalo de confianza. Como vemos son varias las preguntas a responder por el investigador. En primer lugar debe decidir sobre el riesgo alfa dispuesto a asumir (probabilidad de cometer un error tipo 1), o lo que es lo mismo: la confiabilidad del intervalo de confianza (IC). Mayor confianza implica un intervalo más ancho y por tanto menor información en la estimación de la prevalencia de EPOC, ya que el rango de posibles valores será mayor. No es lo mismo decir que la prevalencia de EPOC está entre el 4 y el 16% con un IC del 99%, que decir que estará entre el 9 y el 11% con un IC del 95%. Si decidimos tener un IC del 95%, el valor de Z que se debe poner en la fórmula es de 1,96. Esto quiere decir que cuando estimemos nuestra prevalencia en función de los r esultados de nuestra muestra, podremos dar un IC dentro del cual confiamos que estará el verdadero valor poblacional en el 95% de las veces. Otra pregunta a responder es la prevalencia de EPOC que pensamos pueda tener la población de Madrid mayor de 40 años. El valor de “p” en la fórmula. Y aquí entramos en otro problema y en una clara contradicción. Tenemos que adelantar un valor que nos es desconocido y además es p recisamente el que estamos tratando de averiguar. Aquí las opciones son varias. Podemos buscar las prevalencias obtenidas en otros estudios similares al nuestro, revisar la bibliografía existente, adelantar un valor según nuestra experiencia y conocimientos, o r ealizar un estudio piloto. Con ello adelantamos el valor de “ p”, que aún siendo subjetivo, está lejos de ser un valor arbitrario. Imaginemos que por otros estudios previos pensamos que la prevalencia puede estar cercana al 10%, y por tanto p=0,10. Por último, debemos decidir la precisión de nuestra estimación ( d). Esta precisión vendrá determinada por la amplitud que deseemos para nuestro IC. Si queremos dar un precisión del 3%, entonces d=0,03. Un IC más estrecho se puede conseguir disminuyendo la confianza de los intervalos, por ejemplo al pasar del 99 al 95% o bien disminuyendo el valor d, lo que significa aumentar la precisión. Aplicando la fórmula obtendríamos los siguientes resultados:
Por tanto, bajos estos supuestos, se necesitaría una muestra de 384 personas mayores de 40 años para estimar la prevalencia de EPOC con una precisión de +/-3% y con una confianza del 95%. Otro investigador con la misma experiencia y utilizando la misma fórmula pero bajo supuestos distintos, podría obtener un tamaño totalmente distinto. Si espera una prevalencia de EPOC cercana al 15% y quiere una precisión de + /-2%, con el mismo nivel de confianza, necesitaría 1225 pacientes. Es decir, ¡necesitaría más del triple de pacientes que el investigador anterior para estimar lo mismo! Pero la cosa se complica aún más. El error muestral que se comete en la estimación de un parámetro depende del tipo de diseño escogido para seleccionar los elementos que forman la muestra. Con el mismo tamaño de muestra, es mayor el error cometido en un diseño complejo (por ejemplo, un muestreo de conglomerados) que el error cometido en un muestreo aleatorio simple (MAS). Normalmente, las fórmulas que calculan el tamaño de muestra en función de la precisión, asumen que se va a realizar un MAS. Sin embargo, diseños de estudio más complejos conllevan un mayor error, y por ello, para garantizar el grado de precisión hay que aumentar el tamaño muestral. Una forma de “corregir” el tamaño muestral en función del diseño, es multiplicar el tamaño obtenido por MAS por un valor denominado efecto de diseño . Este valor se calcula como el cociente entre el error estándar correspondiente al diseño empleado y el error que se hubiese obtenido si la muestra se hubiese elegido por MAS. Cuando toma el valor de 1, indica que el diseño utilizado es tan eficiente como uno simple al azar (MAS), y cuando toma un valor mayor a uno, indica que el diseño utilizado tiene un error estándar mayor al que se obtendría por MAS. No es nada fácil
obtener una buena estimación para este valor, pero en la práctica se asumen valores que oscilan entre 1,5 y 3. Un valor igual a 2, por ejemplo, significa que para obtener la misma precisión que la obtenida por MAS hay que estudiar al doble de individuos. En mi opinión, es un número obtenido muchas veces como por arte d e magia del cual no he encontrado ninguna explicación satisfactoria de cómo hay que calcularlo. Como vemos es todo bastante confuso a pesar de encontrarnos en el supuesto más sencillo, que es la estimación de una proporción. Imaginemos cómo se puede complicar el asunto en otras situaciones en las que estuviésemos ante estudios analíticos y tratásemos de averiguar si hay diferencias entre grupos. Problemas para calcular el tamaño muestral Resumamos brevemente algunos de los problemas que nos encontramos al calcular el tamaño muestral.
Subjetividad en los parámetros utilizados en las fórmulas de cálculo de tamaño muestral. Como hemos visto en nuestro ejemplo de prevalencia de EPOC, son muchas las decisiones que tiene que tomar el investigador para calcular el tamaño muestral, no estando a veces lo suficientemente preparado para ello. Debe decidir la amplitud de los intervalos de confianza, la precisión mínima admisible, la prevalencia aproximada de EPOC, etc. Además hay que añadir el efecto de diseño, ya que como hemos visto anteriormente, las fórmulas sirven cuando el diseño es un MAS, siendo más frecuentes diseños por etapas, como el diseño por conglomerados. Por lo tanto, pequeñas diferencias en la decisión inicial sobre cualquier parámetro que compone la fórmula, puede conducir a grandes diferencias en la estimación del tamaño muestral. No en vano, en muchas ocasiones se hace justo lo contrario: dada la limitación de los recursos disponibles, se manipulan los valores de a, P, d y el efecto de diseño para que la n obtenida sea la que el investigador había prefijado con anterioridad.
Estimación de más de un parámetro. Casi siempre que se realiza un estudio es para estimar más de un parámetro, sin embargo las fórmulas sólo incluyen para su cálculo un solo parámetro. En este caso lo aconsejable es calcular el tamaño muestral para el parámetro o parámetros más importantes, lo que puede dar lugar a una gran variedad de tamaños muestrales. Tampoco podemos olvidar que en la propia elección de los “parámetros importantes” hay un alto componente de subjetividad. Además una vez recogidos los datos, se hacen estimaciones de todo tipo de parámetros no contemplados en la fórmula inicial: coeficientes de correlación, concordancia, pendientes de regresión, etc.
Estimación de parámetros en subgrupos muestrales. Aparte de estimar un parámetro en población general, muchas veces se quiere estimar lo mismo en diferentes subgrupos. Por ejemplo, calculada la prevalencia de EPOC, seguro que interesa saber si difiere por grupos de edad, por sexo, por área de salud, etc. Sin embargo el tamaño muestral obtenido, se determinó inicialmente para estimar la prevalencia de EPOC en toda la población de Madrid no para hacerlo en subgrupos. El error de muestreo que se comete al estimar y comparar los diferentes subconjuntos muestrales, aumenta considerablemente, ya que el tamaño muestral de estos subgrupos puede ser claramente insuficiente invalidando cualquier comparación que se haga. Conclusiones En la práctica, vamos a estar limitados por los recursos disponibles para llevar a cabo la investigación, es decir, por algo tan simple como el tiempo y el dinero. Esta limitación va a estar siempre presente durante el diseño del estudio y en la recogida de los datos. En consecuencia, muchas veces la pregunta se transforma en esta otra: los pacientes que espero y puedo estudiar ¿van a ser suficientes para responder de forma satisfactoria mi pregunta de estudio y por tanto alcanzar los objetivos de mi investigación? Hay un gran componente subjetivo en la determinación de cualquier tamaño muestral por lo que debemos tomar los cálculos obtenidos por las fórmulas como valores solamente orientativos, ya que el tamaño muestral, inevitablemente está limitado e incluso a veces predeterminado por nuestros recursos materiales. Una adecuada revisión bibliográfica sobre los tamaños muestrales utilizados en estudios similares al nuestro, la propia experiencia
del investigador, su enfoque del problema y el uso del sentido común, pueden ayudar al establecimiento de un tamaño muestral, que como hemos visto, no es único. Bibliografía recomendada 1 Muñiz-García, J. y Santiago-Pérez, M. (2006). ¿Cuántos pacientes selecciono para mi estudio?. Angiología 58 (2): 145-150. 2 Martínez González, M. A.,Sánchez-Villegas, A. y Faulín Fajardo, F. J. (2006). Intervalos de confianza y contraste de hipótesis. Bioestadística Amigable. 2ª Edición. Ed: Díaz de Santos. 155-233. 3 Pita Fernández, S. (1996). http://www.fisterra.com/mbe/investiga/9muestras/9muestras.asp. Determinación del tamaño muestral. Cad Aten Primaria 3: 131-14. 4 EPIDAT 3.1. Programa para análisis epidemiológico de datos tabulados. Muestreo. http://dxsp.sergas.es/ApliEdatos/Epidat/Ayuda/3-Ayuda%20Muestreo.pdf. 5 Silva Ayçaguer, L. C. (1997). El enigma del tamaño muestral. Cultura estadística e investigación científica en el campo de la salud: una mirada crítica. Ed: Díaz de Santos. 285-305. 6 Martínez González, M. A.,Sánchez-Villegas, A. y Faulín Fajardo, F. J. (2006). Estimación del tamaño muestral. Bioestadística Amigable. 2ª Edición. Ed: Díaz de Santos. 373-417.
EXAMEN VIRTUAL
Segundo parcial, grupo T1
Prof. José M. Salinas
Cada pregunta presenta cuatro respuestas alternativas, de las cuales una es la respuesta correcta y las otras tres son falsas. Para realizar el examen señala en cada pregunta la respuesta que consideres correcta, haciendo click con el ratón en el circulo correspondiente. Por cada respuesta acertada se obtiene un punto y por cada una fallada se resta un tercio de punto. Puedes dejar sin contestar las preguntas de las cuales desconozcas la respuesta. Al finalizar haz click en el botón corregir el examen y obtendras tu calificación. 1.- Una variable aleatoria que indica el número de éxitos en n pruebas de Bernouilli, sigue una distribución binomial cuando:
a) El número de pruebas sea suficientemente grande. b) Las pruebas son independientes y la probabilidad de éxito permanece constante. c) Al aumentar el número de pruebas el producto np permanece constante. d) El resultado en una prueba no influye en el resultado de las restantes. 2.- ¿Qué es la distribución de la muestra?
a) Es el conjunto de los valores que aparecen en nuestra muestra, junto con las frecuencias que presentan. b) Es la distribución de la variable aleatoria n dimensional que se obtiene al considerar todos los posibles valores de la muestra. c) Es la distribución de la población, considerada como función del parámetro. d) Es la función que se obtiene multiplicando n veces la función de densidad de la población. 3.- De un cuestionario enviado por correo a 400 estudiantes, seleccionados aleatoriamente de la lista de matriculados en una Facultad, sólo se recibieron 200 ¿Cuál de las siguientes afirmaciones es cierta?
a) Las 200 respuestas son una muestra representativa del 50% de alumnos de la Facultad que habrían respondido si se les hubiese enviado a todos el cuestionario. b) Las 200 respuestas constituyen una muestra representativa de los 400 alumnos a los que se envió el cuestionario. c) Las respuestas constituyen una muestra representativa de los alumnos de la Facultad. d) Las 200 respuestas son una muestra aleatoria de todos los estudiantes. 4.- Un estimador se dice que es eficiente si:
a) Es insesgado y de mínima varianza. b) Utiliza toda la información que hay en la muestra referente al parámetro c) La distribución de cualquier otro estimador, condicionada por el valor de éste, no depende del parámetro. d) La probabilidad de que el estimador difiera del parámetro en más de un infinitésimo tiende a cero cuando el tamaño de la muestra tiende a infinito. 5.- Bajo las condiciones de regularidad, los estimadores de máxima verosimilitud son:
a) Insesgados y de mínima varianza. b) Consistentes y asintóticamente eficientes. c) Lineales insesgados y de mínima varianza. d) Los que asignan la máxima probabilidad al valor del parámetro. 6.- El teorema de Gauss-Markoff dice que los estimadores obtenidos por el método de mínimos cuadrados son:
a) Consistentes y asintóticamente eficientes. b) Los de mínima varianza.
c) Eficientes y suficientes. d) Los estimadores lineales e insesgados de mínima varianza. 7.- El teorema de Fisher, entre otras cosas, demuestra que:
a) La distribución de la media muestral no depende de la varianza de la población. b) La distribución de la varianza muestral no depende de la varianza de la población. c) La media y la varianza de una muestra procedente de una población Normal son independientes. d) La media muestral sigue una distribución con la misma media y varianza que la población. 8.- Un intervalo de confianza es:
a) La probabilidad "a priori" de que el intervalo contenga el verdadero valor del parámetro. b) Un intervalo donde se encuentra el estimador con un nivel de confianza determinado. c) La región del espacio muestral donde se va a encontrar el verdadero valor del parámetro con una determinada probabilidad. d) Un intervalo de extremos aleatorios donde se encuentra el valor del parámetro con un nivel de confianza determinado. 9.- Una hipótesis estadística es:
a) Cualquier afirmación acerca de la distribución de la población. b) Una región del espacio muestral que lleva asociada una alternativa. c) Una regla de decisión que nos indica cuando debe aceptarse o rechazarse el valor de un parámetro. d) Un valor que se asigna provisionalmente a un estadístico en tanto no se demuestre cual es su verdadero valor. 10.- Un test de hipótesis estadístico es:
a) Una región del espacio paramétrico. b) Una regla de decisión. c) Un estadístico de la muestra. d) Una afirmación acerca de la población. 11.- La región crítica de un test es:
a) Un subconjunto del espacio muestral tal que si la muestra pertenece a él se rechaza la hipótesis nula.
b) Un subconjunto del espacio muestral tal que si la muestra pertenece a él se rechaza la hipótesis falsa. c) Una región del espacio paramétrico tal que si el parámetro pertenece a ella se rechaza la hipótesis nula. d) Una región del espacio paramétrico tal que si el parámetro pertenece a ella se rechaza la hipótesis falsa. 12.- La potencia de un test es:
a) La probabilidad de rechazar la hipótesis nula cuando es falsa. b) La probabilidad de rechazar la hipótesis nula cuando es cierta. c) La probabilidad de cometer error de tipo II. d) Uno menos la probabilidad de cometer error de tipo I. 13.- Un contraste de significación es un test de hipótesis en el que:
a) Conocemos la probabilidad a priori de que el parámetro esté contenido en el intervalo. b) El nivel de significación se mantiene fijo y se elige el test de máxima potencia. c) Se contrasta una hipótesis simple frente a otra hipótesis simple. d) La hipótesis nula es una hipótesis simple. 14.- La hipótesis nula del Análisis de la Varianza afirma:
a) Existen diferencias entre las medias muestrales. b) No existen diferencias entre las medias de las subpoblaciones. c) Existen diferencias entre las medias de las subpoblaciones. d) No existen diferencias entre las medias muestrales. 15.- Si Z sigue una distribución Normal de media 0 y desviación típica 1, Normal(0,1) ¿Cúal es la probabilidad de que la variable Z tome valores mayores que -0,89?
a) 0,1867
b) 0,4562
c) 0,8133
d) 0,5438
16.- Si Z sigue una distribución Normal(0,1) ¿Qué valor de la variable deja por debajo de si el 93% de la población?
a) 0,8238
b) 0,1762
c) 0,07
d) 1,48
17.- Si las puntuaciones en un test X siguen una distribución Normal(25,5) ¿Qué proporción de individuos tendrán puntuaciones inferiores o iguales a 20?
a) 0,8413
b) 0,1841
c) 0,1357
d) 0,1587
18.- Si las puntuaciones en un test X siguen una distribución Normal(25,5) ¿Qué puntuación será superada por el 25% de los sujetos con mejores puntuaciones?
a) 21,65
b) 28,87
c) 28,37
d) 0,2799
19.- Si la variable X se distribuye según el modelo de la distribución Binomial con parámetros n=4 y p=0,4 ¿Cúal es la probabilidad de que la variable X tome el valor 2?
a) 0,3456
b) 0,821
c) 0,0576
d) 0,24
20.- En una muestra de 26 individuos se ha medido la ansiedad rasgo, obteniendose una media de 22 y una desviación típica de 10. A partir de estos datos se ha calculado un intervalo de confianza para la media de la población, a un nivel de confianza del 95%. Indique cuál es el tesultado correcto.
a) (18,71 25,29)
b) (18,584 25,416)
c) (18,08 25,92)
d) (17,88 26,12)
21.- En una muestra de 100 sujetos anoréxicos 24 de ellos son hombres. A partir de estos datos se ha calculado, a un nivel de confianza del 95%, un intervalo de confianza para la proporción de anoréxicos varones. Indique cuál de los siguientes resultados es el correcto.
a) (0,16 0,32)
b) (0,17 0,31)
c) (0,22 0,26)
d) (0,232 0,248)
22.- Se quiere contrastar si la prporción de alumnas en Psicología es significativamente distinta de 0,6. Sabiendo que en una muestra aleatoria de 100 matriculados hay 70 mujeres ¿Cuánto vale el estadístico de contraste?
a) 0,645
b) 2,04
c) 2,18
d) 20,41
23.- En una muestra de 18 sujetos se ha obtenido que el coeficiente de correlación entre dos variables es 0,3. Se quiere contrastar si este coeficiente es significativamente distinto de cero ¿Cuánto valdrá el estadístico de contraste?
a) 1,26
b) 1,33
c) 1,43
d) 5,27
24.- Se quiere contrastar la hipótesis de que por término medio alumnas y alumnos obtienen la misma calificación, frente a la alternativa de que las alumnas obtienen mayores puntuaciones. Si se toma una muestra de 6 alumnas y otra de 5 alumnos, suponiendo que las varianzas poblacionales son iguales ¿Cuánto valdría el valor crítico a un nivel de confianza del 95%?
a) 1,833
b) 1,96
c) 2,228
d) 2,262
25.- Se miden las pulsaciones por minuto a 4 alumnos antes y después de un examen obteniendo: Antes
70 62 80 64
Después 68 58 76 62
Se quiere contrastar si por término medio hay disminución significativa de la tasa cardiaca ¿Cuánto valdría el estadístico de contraste?
a) 0,53
b) 3,01
c) 5,20
d) 9,07
26.- Once sujetos se han distribuido aleatoriamente entre dos tratamientos y un grupo de control, asignándose cuatro, cuatro y tres sujetos respectivamente y se han medido sus rendimientos en una prueba de lecto-escritura. La suma de cuadradados entre grupos resulta ser 148 y la suma de cuadrados intragrupos 136. ¿Cuánto vale el estadístico de contraste del análisis de la varianza?
a) 1,09
b) 3,68
c) 3,81
d) 4,35
27.- Con los datos del ejercicio anterior calcule, a un nivel de confianza del 95%, el valor crítico para el estadístico de contraste del análisis de la varianza.
a) 3,59
b) 4,46
c) 5,12
d) 19,37 copyright José María Salinas
CONCEPTOS ESTADÍSTICOS 1) La media, moda y mediana son a: Medidas de variabilidad b: Lo primero que hay que calcular c: Medidas de la tendencia central d: Los tres parámetros poblacionales 2) Comparar la media con la mediana de un conjunto de datos te da una idea de lo esparcidos que se encuentran los valores del conjunto de datos. a: La media y la mediana tienen que coincidir para saber esto b: Si la media es mayor que la mediana los datos están mal c: Si la media es menor que la mediana los datos están mal d: Cuando la media y la mediana distan mucho los datos están muy desperdigados
3) Para calcular la moda a: Hace falta calcular primero la media b: Necesitamos tener todos los datos c: Contamos el número de veces que aparece el valor más frecuente d: Ninguna de las tres anteriores 4) A veces se habla de medias ponderadas a: Se suman las medias previas y se divide por el total b: Se suman las medias y se divide por el número de medias sumadas c: Se suman las medias, multiplicadas por sus respectivas frecuencias totales y se divide por todas las frecuencias totales sumadas. d: Todo lo anterior es falso 5) Cuanto mayor sea la muestra, mayor será el error de muestreo. a: Sí, porque hay más errores b: No, disminuye c: No hay relación alguna d: Ninguna de las tres anteriores 6) El error estándar a: Es el error que hay en cualquier encuesta b: Es el error muestral típico c: Es un modo frecuente de denominar la desviación estándar de una distribución d: Ninguna de las tres anteriores 7) En una distribución normal a: La moda, media y mediana tienen el mismo valor b: La media es mayor que la mediana c: La mediana es mayor que la moda d: Las opciones anteriores son falsas 8) La desviación estándar a: Es un medida de la variabilidad de los datos b: Es una medida de la tendecia central
c: Calcula la estimación bruta del parámetro d: Ninguna de las tres anteriores 9) En estadística a menudo se habla de muestras. Una muestra: a: Es el conjunto de datos que me interesan b: Sirve para echar un vistazo a los datos c: Es una selección de datos sobre el total de la población a estudiar d: Es una selección de los datos que necesito. 10) Los cambios porcentuales nos hablan únicamente parte de la historia cuando tratamos de comparar valores para distintos grupos o comunidades. Otra estadística importante para cada grupo es el valor "per cápita". El valor "per cápita": a: Ayuda a comparar valores entre grupos de distinto tamaño b: Solo vale para estadísticas económicas c: Es necesario para hacer comparaciones internacionales d: Ninguna de las tres anteriores 11) La muestra es un subconjunto de la población que... a: Es necesario para hacer estadísticas b: Es lo más representativo de la población c: Es un subconjunto al azar de la población d: Es un subconjunto de la población seleccionado para estimar el dato poblacional 12) El tamaño muestral a: Es proporcional al tamaño poblacional b: Es siempre el 5% c: Se calcula sobre la base de la estratificación d: Hay distintos modos de calcularlo 13) El muestreo aleatorio a: Es aquel que se escoje al azar b: Se selecciona a cualquier individuo para la muestra c: Todo individuo de la población tiene la misma probabilidad de resultar seleccionado
d: Ninguna de las tres anteriores 14) En el muestreo a: No debe haber error b: Es importante conseguir un tamaño muestral amplio c: Se calcula el tamaño óptimo para un determinado nivel de error. d: El error no debe superar el 3% 15) El coeficiente de correlación... a: Es una medida de relación entre dos sucesos b: Mide la relación entre dos variables contínuas c: Nos dice si hay diferencias significativas o no d: Siempre es positivo 16) El coeficiente de correlación... a: Puede tener cualquier valor b: Siempre es mayor que 0 c: Oscila entre 1 y -1 d: oscila entre 0 y 1 17) ¿Cuál de las siguientes es una variable cuantitativa continua? a: Tamaño de familia b: Situación de empleo c: Huevos en un cartón d: Edad ENHORABUENA. HAS COMPLETADO CON ÉXITO TODO EL CUESTIONARIO. (Total de preguntas:
17 )
Lea más: Cuestionario de preguntas y respuestas Eustat Under Creative Commons License: Attribution
Examen Tipo Las preguntas que se colocan a continuación son un ejemplo de algunos de cubiertos en los diferentes módulos del curso.
los temas
Módulo 1. Estadística descriptiva.
1.El proceso de usar muestreo aleatorio para inducir conclusiones acerca de los parámetros de la población es llamado:
2.-
a)
Inferencia estadística.
b)
El método científico.
c)
Muestreo.
d)
Estadística descriptiva.
El universo o totalidad de artículos o cosas en consideración es llamado: a)
Una muestra.
b)
Una población.
c)
Un parámetro.
d)
Un estadístico.
Módulo 2. Probabilidad y Distribuciones de Probabilidad.
1.-
2.-
Si dos eventos son independientes, la probabilidad de su intersección es igual a: a)
0
b)
0.50
c)
1.00
d)
No puede determinarse con la información disponible.
En un diagrama de Venn, el término A n B representa: a)
La intersección de los círculos A y B.
b)
El área incluida en el círculo A o el círculo B.
c)
El área afuera de los dos círculos.
d) Ninguno de los anteriores.
3.Si 9 es el parámetro de la distribución exponencial, entonces la media y la varianza de la distribución exponencial son respectivamente: a)
1/3 y 1/9
4.-
b)
3 y 9
c)
1/9 y 1/81
d)
9 y 3
¿Cuál de los siguientes enunciados acerca de la distribución normal es verdadero? a)
Teóricamente, la media, mediana y moda son iguales.
b) Alrededor de 2/3 de las observaciones caen dentro de ± 1 desviación estándar de la media. c)
Sus parámetros son la media, µ, y la desviación
d)
Todos los anteriores.
Módulo 3.
estándar,??
Inferencia estadística.
1.El error estándar de la media para una muestra de 100 es 30. Para disminuir el error estándar de la media a 15 deberíamos:
2.-
a)
Incrementar el tamaño de la muestra a 200.
b)
Aumentar el nivel de confianza.
c)
Incrementar el tamaño de la muestra a 400.
d)
Disminuir el tamaño de la muestra a 50.
El concepto de una distribución muestral:
a) Es esencial para inferir conclusiones acerca de la población usando los resultados de una muestra. b) estadística.
Está relacionado con el uso de teoría de probabilidad en inferencia
c) Nos ayuda a usar la estadística para estimar los valores verdaderos correspondientes en la población. d)
Todas las anteriores.
Módulo 4. Regresión Lineal Simple, Lineal Múltiple y No-Lineal.
1.-
Si el coeficiente de correlación es 1.0, entonces: a)
La intersección en Y (b0 ) debe ser cero.
b)
La variación explicada es igual a la variación no explicada.
2.-
c)
No hay variación explicada.
d)
No hay variación no explicada.
La longitud del intervalo de confianza para la estimación de Y depende de: a)
La estimación del error estándar.
b)
Del valor de X para el cual se hace la predicción.
c)
Del tamaño de la muestra.
d) De todo lo anterior.
Módulo 5. Pronósticos.
1.-
¿Cuál de los siguientes componentes puede contener una serie de tiempo? a)
Tendencia.
b) Cíclico c) Estacional. d)
Todos los anteriores.
2.¿Cuáles de las siguientes son razones comunes para estudiar tanto tendencias seculares como variación estacional? a)
Permitir la eliminación de la componente de la serie temporal.
b) Describir patrones pasados. c) Proyectar patrones pasados hacia el futuro. d)
Todas las anteriores.
Respuestas correctas:
Módulo 1: 1-a 2-b Módulo 2: 1-d
2-a 3-d 4-d Módulo 3: 1-c 2-d Módulo 4: 1-d 2-a Módulo 5: 1-d 2-d
VARIABLES ALEATORIAS BINOMIAL Y NORMAL DISTRIBUCIONES DISCRETAS DE PROBABILIDAD: 1) Sea X una variable aleatoria discreta cuya función de probabilidad es: x p
0 0’1
1 0’2
2 0’1
3 0’4
4 0’1
5 0’1
a) Representar gráficamente la función de probabilidad. b) Calcular las siguientes probabilidades: P(X<4’5); P(X3); P(3X<4’5).
P(X<4’5)=0'1+0'2+0'1+0'4+0'1=0'9 P(X3)=0'4+0'1+0'1=0'6 P(3X<4’5)=0'4+0'1=0'5
2) Sea X una variable aleatoria cuya función de probabilidad viene dada por P(X=r)=1/8; (r=2,3,..,9). Se pide hallar: a) La función de probabilidad. b) La media y la desviación típica. c) Las probabilidades: P(X<-3); P(X6); P(4
xi 2 3 4 5 6 7 8 9
pi 1/8 1/8 1/8 1/8 1/8 1/8 1/8 1/8 1
x ipi 2/8 3/8 4/8 5/8 6/8 7/8 8/8 9/8 44/8
xi pi 4/8 9/8 16/8 25/8 36/8 49/8 64/8 81/8 284/8
μ = 44/8=11/2=5'5 σ2 = 284/8-(11/2)2=21/4 =5'25 σ = √(21/4)=2'29 P(X<-3)=0 P(X≥6)=4(1/8)=1/2=0'5 P(4
SUBIR
DISTRIBUCIÓN BINOMIAL: 1) Una urna contiene 60 bolas blancas y 40 bolas negras. Sacamos 8 veces una bola devolviéndola, cada vez, a la urna. ¿Cuál es la probabilidad de que salgan 5 blancas?. ¿Y más de 4 blancas?.¿Cuántas blancas saldrán por término medio?. Es un experimento Binomial consistente en sacar 8 veces una bola, anotar el color y devolverla: a) Son 8 pruebas independientes; b) En cada prueba pueden ocurrir dos sucesos: A=sale blanca y A'=no sale blanca; c) P(A)=0'6=p y P(A')=0'4=q son constantes. X="nº de veces que sale bola blanca"; XєB(8,0'6). Usando las tablas (invertidas) para n=8 q=0'4 YP(X=5)=0'2787; P(X>4)=0'2787+0'2090+0'0896+0'0168=0'5941; F=np=4'8 2) Se lanza un dado 6 veces. ¿Cuál es la probabilidad de obtener 3 cincos?. ¿Cuál es el promedio de cincos que pueden salir y la desviación típica?. Sol: X є B(6;1/6); P(X=3)=0'0536; 1; 0'9129 3) Si el 20% de los cerrojos producidos por una máquina son defectuosos, determinar la probabilidad de que en una muestra de 4 cerrojos: a. a lo sumo, 2 sean defectuosos. b. al menos, 1 sea correcto. c. el promedio de defectuosos de cada muestra de 4 cerrojos.
Sol: X є B(4,0'2); P(X≤2)=0'9728; P(X≤3)=0'9984; 0'8 4) La probabilidad de que salga cara con una moneda trucada es 0'45. Se lanza la moneda 7 veces. Calcular la probabilidad de que: a) Salgan exactamente tres caras. b) Al menos tres caras. c) A lo sumo tres caras.
Sol: X є B(7,0'45); P(X=3)=0'2918; P(X≥3)=0'6836; P(X≤3)=0'6082
5) Se hace un control de calidad a 1000 coches en cuatro puntos de soldadura. Los resultados de los fallos en las soldaduras son: nº de fallos
0
1
2
3
4
nº de coches
530
357
98
14
1
Con ayuda de las tablas ajustar los datos empíricos a una distribución binomial: Calcula las frecuencias relativas, busca la función de probabilidad binomial más parecida y calcula las frecuencias absolutas esperadas. Calcula las diferencias entre las frecuencias absolutas empíricas y las teóricas y obtener la diferencia media. Sol: [0'5030; 0'3570; 0'0980; 0'0140; 0'0010]; [0'5220; 0'3685; 0'0975; 0'0115; 0'0005]; B(4,0'15) 6) Quinientos opositores han participado en una prueba escrita que consta de tres ejercicios. Los resultados son los que figuran el la siguiente tabla: nº ejercicios aprobados nº opositores
0 136
1 223
2 120
3 21
Ajustar la distribución empírica a una distribución teórica binomial y halla las frecuencias teóricas esperadas. Sol: [0'2720; 0'4460; 0'2400; 0'0420]; [0'2963; 0'4436; 0'2389; 0'0429]; B(3,0'35) SUBIR
DISTRIBUCIONES CONTINUAS DE PROBABILIDAD:
1) Una variable aleatoria continua X tiene como función de densidad f(x). Su gráfica se muestra a continuación:
a.- Comprobar que f(x) es una función de densidad. b.- Calcular la probabilidad de los siguientes sucesos:
I. II. III. IV.
P(X<3) P(3
6)
Sol: 0'6; 0'3; 0'4; 0 2) Una variable aleatoria continua X tiene como función de densidad f(x). Su gráfica se muestra a continuación:
a.- Comprobar que f(x) es una función de densidad. b.- Calcular la probabilidad de los siguientes sucesos: I. II. III. IV.
P(X<0’3) P(0’22)
Sol: 0'45; 0'5; 0'55; 0 SUBIR
DISTRIBUCIÓN NORMAL:
1) Al elegir 1000 personas de una población, resultó que su talla media era 170 cm y sus deviación típica de 15 cm. Si dichos datos se distribuyen normalmente, ¿cuántas personas miden entre 191 y 214 cm?.¿Y, a lo sumo, 158 cm?. Sol: 79; 212 2) El nivel medio de colesterol en sangre de la población adulta entre 50 y 60 años de edad es de 185 mg por cada 100 ml de sangre. La desviación típica es de 25 mg por cada 100 ml. Si las medidas se distribuyen según una normal, calcula: a) ¿Qué porcentaje de la población tiene niveles superiores a 200 mg? b) ¿Qué porcentaje de la población tiene niveles inferiores a 130 mg? c) ¿Qué porcentaje de la población está comprendido entre 130 y 200 mg? Sol: 27'43%; 1'39%; 71'18% 3) Se supone que el coeficiente intelectual de los alumnos de una Universidad se distribuye normalmente con una media de 100 y desviación típica de 20. Se pide: a) Porcentaje de alumnos que tienen coeficiente intelectual superior a 130. b) Si se toma una muestra al azar de 500 estudiantes, ¿cuántos tendrán coeficiente intelectual entre 90 y 105?. Sol: 6'68%; 145 4) El tiempo de recuperación de los enfermos de un hospital sigue una distribución N(7,3). Se pide: a) Probabilidad de que un enfermo esté menos de 5 días en el hospital. b) Probabilidad de que necesite para recuperarse entre 9 y 15 días de estancia. c) Si en el hospital hay 1000 enfermos, ¿cuántos necesitan estar más de 8 días en el hospital?. Sol: 0'2514; 0'2476; 371 5) La duración media en funcionamiento de un televisor es de 8 años, con varianza de 1/4. Si la vida util del televisor se distribuye normalmente, se pide hallar el porcentaje de televisores que duran: a) Más de 9 años. b) Como máximo 6 años. c) Entre 7 y 9 años. Sol: 2'28%; 0%; 95'44% 6) El número de visitantes que diariamente acuden a una atracción se distribuyen según una N(2000,250). a) Hallar la probabilidad de que un día determinado, el número de visitantes no supere los 2100. b) Calcular la probabilidad de que un día cualquiera, los visitantes sean más de 1500. c) En un día de treinta días, ¿en cuántos días cabe esperar que el número de visitantes supere los 2210?.
7) Los ingresos diarios en una empresa tienen una distribución normal, con media 35560 ptas y desviación típica 2530 ptas. Justificar si es razonable o no el esperar obtener un día ventas superiores a 55000 ptas. Calcula cuántos días en un año se espera obtener unas ventas superiores a 40620 ptas.
8) La altura de los jovenes de una determinada edad, en cm, se distribuye según N(168,8) y su peso, en Kg, según N(67,5). a) ¿Qué porcentaje de ellos pesan entre 60 y 80 kg?
b) ¿Qué porcentaje mide entre 160 y 180 cm?. c) ¿Se puede saber el porcentaje de de los que están a la vez en los intervalos de altura y peso anteriores?.
9) Las estaturas de 1400 mujeres se distribuyen según la N(168.8, 6.4). Calcular los valores µ-3σ, µ-2 σ, µ- σ, µ+ σ, µ+2 σ, µ+3 σ, y reparte a las 1400 mujeres, en los intervalos determinados por estos valores.
10) Aplicando un test a un grupo de 300 personas se ha obtenido una distribución normal de media 50 y desviación típica 5. Se pide: a) Calcular el percentil 33. b) Calcular las puntuaciones que delimitan el 30% central de la distribución. c) Calcular el nº de personas que obtiene en el test más de 56 puntos o menos de 47. Sol: 47'8; (48'05,51'95); 117 11) Tras un test de cultura general se observa que las puntuaciones obtenidas siguen una distribución N(65,18). Se desea clasificar a los examinados en tres grupos (de baja cultura general, de cultura general aceptable, de excelente cultura general) de modo que haya en el primero un 20% de la población, un 65% en el segundo y un 15% en el tercero. ¿Cuáles deben de ser las puntuaciones que marcan el paso de un grupo a otro?. Sol: 49,88; 83'72 12) Un test de sensibilidad musical da resultados que se distribuyen N(65,18). Se quiere hacer un baremo por el cual, a cada persona, junto con la puntuación obtenida se le asigna uno de los siguientes comentarios: duro de oído poco sensible a la música normal sensible a la música extraordinariamente bien dotado Sol: 94'61; 77'15; 62'66; 41'96
de modo que haya, respectivamente, en cada uno de los grupos un 10%, un 35%, un 30%, un 20% y un 5% del total de individuos observados. ¿En qué puntuaciones pondrías los límites entre los distintos grupos?.
13) Supongamos una distribución normal de media=50 y que el 7% de los casos tiene una puntuación por encima de 70. ¿Cuál es la desviación típica?. ¿Cuál será la probabilidad de los puntos por debajo de 45?. Sol: 13'51; 0'3557 14) Un test de inteligencia da una puntuación que sigue una ley normal con media 100 y desviación típica 15. Encontrar un intervalo centrado en 100 que contenga el 50% de las puntuaciones. En una prueba hecha a 2500 individuos, ¿cuántos se espera que tengan una puntuación superior a 125?.
SUBIR
APROXIMACIÓN DE LA BINOMIAL POR LA NORMAL: 1) En una cierta población, la probabilidad de que una persona pertenezca al grupo sanguíneo A es igual a 0'38. Se toma, aleatoriamente, una muestra de 25 personas de dicha población. Halla la probabilidad de que en dicha muestra haya exactamente 5 del grupo sanguíneo A. ¿Cuántas personas del grupo A cabe esperar que haya en la referida muestra?. X es B(25,0'38); P(X=5)=25C5·(0'38) (0'62) =0'02 Se puede aproximar por una normal porque se cum de Moivre: np=9'5≥5 y nq=15'5≥5.
X'єN(9'5, √(25·0'38·0'62))=N(9'5,2'43) P(X=5)=P(4'5(5'5-9' =P(-2'06
2) En un test hay 100 preguntas con cuatro opciones de respuesta, de las que hay que seleccionar una. Si se responde totalmente al azar, ¿cuál es el número medio esperado de respuestas correctas?. ¿Cuál es la desviación típica?. ¿Cuál es la probabilidad de acertar más de 25?. Sol: X es B(100,0'25); 25; 4'33; 0'4522 3) La probabilidad de que un golfista haga hoyo en un cierto lanzamiento es 0'2. Si lo intenta 5 veces, calcular la probabilidad de que: a) no acierte ninguna vez; b) acierte por lo menos dos veces; c) Supongamos que lanzara 10000 veces y su capacidad de acierto se mantuviera, ¿qué probabilidad hay de que acierte más de 2080 veces?. Sol: 0'3277; 0'2627; 0'0222 4) El porcentaje de españoles con estudios medios es del 35%. Elegidos 8 al azar, calcular la probabilidad de que entre 3 y 5 (ambos inclusive) tengan estudios medios, aplicando: a) la distribución binomial; b) la aproximación de la binomial por la normal.
5) En una asociación juvenil, el 40% de los socios juegan al voleibol. En un momento dado, se trata de reunir gente para formar un equipo, por lo que se pregunta a un grupo de 15 socios si practican dicho deporte. a) Describir la variable aleatoria que representa el número de individuos del grupo que lo practican.
b) ¿Cuál es la probabilidad de que en el grupo haya al menos 5 personas que jueguen a voleibol?. c) ¿Cuántos socios cabe esperar, por término medio, que práctiquen voleibol en un grupo de 15?. Sol: 6; 0'7852 6) En un proceso de control de calidad se sabe que el 3% de los artículos son defectuosos. Si estos se colocan en cajas de 300, se pide: a) Probabilidad de que una caja contenga 10 o más artículos defectuosos. b) Probabilidad de que el número de defectuosos esté comprendido entre 15 y 20, ambos inclusive. c) Si se rechazan todas las cajas con más de 10 defectuosos y se examinan 125 cajas, ¿cuántas de ellas se rechazarán?. Sol: 0'4325; 0'0313 7) La probabilidad de que un alumno matriculado en 2º de Bachillerato abandone los estudios es de 0'2. Si en un centro hay 100 alumnos de ese nivel, se pide: a) ¿De qué distribución se trata?. ¿Qué condiciones debe de cumplir para que se pueda aproximar por una normal?. b) Halla la probabilidad de que abandonen menos de 30 alumnos. c) Halla la probabilidad de que abandonen entre 10 y 20 alumnos. Sol: 0'9913; 0'4396 8) En un centro comercial se sabe que el 35% de los clientes pagan con tarjeta a) Si en una caja han pagado 120 clientes, ¿cuál es el número esperado de clientes que no han pagado con tarjeta? b) Si en una caja han pagado 200 clientes, ¿cuál es la probabilidad de que hayan pagado con tarjeta entre 60 y 85 clientes? c) Si en una caja han pagado 400 clientes, ¿cuál es la probabilidad de que al menos 260 no lo hayan hecho con tarjeta?
Sol: 78; 0'9049; 0'5199 9) Se sabe que el 40% de las mujeres embarazadas dan a luz antes de la fecha prevista. En un hospital, han dado a luz 125 mujeres en una semana. a) ¿Cuál es el número esperado de mujeres a las que se les retrasó el parto? b) ¿Cuál es la probabilidad de que entre 45 y 60 mujeres se les haya adelantado el parto?
Sol: 0'7521 10) El 70% de los alumnos de instituto tiene teléfono móvil. a) Si un instituto tiene 1400 alumnos ¿cuántos se espera que tengan móvil? b) ¿Cuál es la probabilidad de que, en una muestra de 150 alumnos, haya más de 100 con teléfono móvil? c) ¿Cuál es la probabilidad de que, en una muestra de 200 alumnos, haya como máximo 140 con teléfono movil?
Podemos considerar que estamos ante experimentos binomiales en los tres casos: 1) Se revisa a n alumnos
independientemente unos de otros; 2) En cada prueba vemos si tiene teléfono móvil (A) o no (A); 3) p(A)=0'7=p y p(A)=0'3=q. La variable a considerar es X=nº de alumnos con móvil. XєB(n,0'7) a) n=1400; μ=np=1400·0'7=980 b) n=150; ¿P(X>100)?. Se cumplen las condiciones de Moivre ya que: np=150·0'7=105≥5 y nq=150·0'3=45≥5, luego podemos aproximar la binomial por una normal X'єN(150·0'7, √(150·0'7·0'3))=N(105,5'61); teniendo en cuenta el ajuste de continuidad: P(X>100)=P(X'>100'5)=P(Z>(100'5-105)/5'61)=P(Z>-0'80)=1-P(Z≤-0'80)=1-0'2119=0'7881 c) n=200; ¿P(X≤140)?. Se cumplen las condiciones de Moivre: np=200·0'7=140≥5 y nq=200·0'3=60≥5, luego podemos aproximar la binomial por una normal X'єN(200·0'7, √(200·0'7·0'3))=N(140,6'48); teniendo en cuenta el ajuste de continuidad: P(X≤140)=P(X'≤140'5)=P(Z≤(140'5-140)/6'48)=P(Z≤0'08)=0'4681 Nota: Este problema se puede resolver como un problema de distribuciones de muestreo. SUBIR
INFERENCIA MUESTREO: 1) Una población está formada por seis elementos con valores: 2,4,6,8,10 y 12. Considerando todas las muestras posibles de tamaño 2 con reemplazamiento, se pide: a) La media y desviación típica de la población. b) La media y desviación típica de la distribución muestral de medias. La población finita es P={2,4,6,8,10,12} La variable X="número" sigue una distribución discreta cuya media y desviación típica se obtiene con la siguiente tabla: xi 2 4 6 8 10 12 totales
pi 1/6 1/6 1/6 1/6 1/6 1/6 1
x ipi 2/6 4/6 6/6 8/6 10/6 12/6 7
xi pi 4/6 16/6 36/6 64/6 100/6 144/6 364/6
μx =7 σ2x = (364/6)72=35/3 σ x = 3'4157
Todas las muestras de tamaño 2 obtenidas con reemplazamiento junto con sus medias muestrales se recogen en la tabla siguiente: {2,2}2 {4,2}3 {6,2}4 {8,2}5 {10,2}6 {12,2}7
{2,4}3 {4,4}4 {6,4}5 {8,4}6 {10,4}7 {12,4}8
{2,6}4 {4,6}5 {6,6}6 {8,6}7 {10,6}8 {12,6}9
{2,8}5 {4,8}6 {6,8}7 {8,8}8 {10,8}9 {12,8}10
{2,10}6 {4,10}7 {6,10}8 {8,10}9 {10,10}10 {12,10}11
{2,12}7 {4,12}8 {6,12}9 {8,12}10 {10,12}11 {12,12}12
La variable X="media de la muestra" sigue una distribución discreta cuya media y desviación típica se obtiene con la siguiente tabla: xi pi 2 1/36 3 2/36 4 3/36 5 4/36 6 5/36 7 6/36 8 5/36 9 4/36 10 3/36 11 2/36 12 1/36 totales 1
x ipi 2/36 6/36 12/36 20/36 30/36 42/36 40/36 36/36 30/36 22/36 12/36 252/36
xi pi 4/36 18/36 48/36 100/36 180/36 294/36 320/36 324/36 300/36 242/36 144/36 1974/36
μx = 252/36=7 σ2x = (1974/36)72=35/6 σ x = 2'4152 se cumple que μx =μx y que σ x = σ x:√n
2) Una población está formada por los elementos 1,2,4 y 6. a) Calcular la proporción de cifras impares; b) Para cada una de las muestras con reemplazamiento de tamaño 2, calcular la proporción de cifras impares; c) Calcular la media y la desviación típica de las distribuciones muestrales de proporciones. La población es finita P={1,2,4,6} y las muestras de tamaño n=2 son con reemplazamiento a) En la población la proporción de cifras impares es: p=1/4=0'25=25% b) Todas las muestras de tamaño 2 junto con la proporción de cifras impares se muestra en la siguiente tabla: {1,1}1 {2,1}0'5 {4,1}0'5 {6,1}0'5
{1,2}0'5 {2,2}0 {4,2}0 {6,2}0
{1,4}0'5 {2,4}0 {4,4}0 {6,4}0
{1,6}0'5 {2,6}0 {4,6}0 {6,6}0
c) La proporción de cifras impares define una variable aleatoria, p, a la que podemos tabular su distribución (en este caso la trataremos como discreta) y calcular su media y desviación típica: pi 0 0'5 1
pi 9/16 6/16 1/16
totales 1
p ipi 0 3/16 1/16
pi pi 0 1'5/16 1/16
4/16
2'5/16
μ = 4/16 = 1/4 = 0'25 σ2 = 2'5/16-(1/4)2= =1'5/16 = 3/32 = 0'09375 σ = 0'30619 se cumple que σ = √(pq/n)
3) Los tornillos fabricados por cierta máquina de precisión, que se distribuyen según una normal, tienen pesos medios de 142'32 g y una desviación típica de 8'5 g. a) Halla la probabilidad de que una muestra elegida al azar de 25 tornillos, tomada entre ellos, tenga un peso medio superior a 144'6 g b) Realiza el mismo cálculo si la muestra que se toma es de 100 tornillos. X= "longitud de un tornillo" XєN(142'32,8'5) Como X es normal → X es también normal; X25єN(142'32, 8'5/√25)=N(142'32,1'7); X100єN(142'32, 8'5/√100)=N(142'32,0'85) a) P(X25>144'6)=P(Z>(144'6-142'32)/1'7))=P(Z>1'34)=1-P(Z≤1'34)=1-0'9099=0'0901 b)P(X100>144'6)=P(Z>(144'6-142'32)/0'85))=P(Z>2'68)=1-P(Z≤2'68)=1-0'9963=0'0037 4) Suponiendo que las puntuaciones de un test se distribuyen según una normal N(100,15), encontrar un intervalo de probabilidad, con un nivel de confianza del 95%, dónde se encontrará la media de las puntuaciones de una muestra de 81 personas a las que se les pasará el test. Resolver el problema, también, para un nivel de confianza del 99% y un tamaño de la muestra de 120 personas. X="puntuación obtenida en el test" XєN(100,15) Tamaño de la muestra: n=81; Nivel de confianza: 1-α=0'95 → α=0'05 → α/2=0'025 → zα/2=1'96 El intervalo de probabilidad para este tamaño de muestra y este nivel de confianza es: (1001'96·15/√81,100+1'96·15/√81)=(96'73,103'27) y esto significa que P(96'730'5)=P(Z>(0'5-0'6)/0'04)=P(Z>-2'5)=1-P(Z≤-2'5)=1-0'0062=0'9938. 6) Supongamos que el 25% de los jóvenes fuma. Calcula la probabilidad de que en una muestra de tamaño 140 encontremos que más de 70 jóvenes son fumadores. Calcula el intervalo de probabilidad al 99%, para la proporción de fumadores en muestras de tamaño 100. Interpreta este último resultado. La población esta dividida en dos grupos: los fumadores (p=0'25) y los no fumadores (q=0'75). El tamaño de la muestra inicialmente es: n=140. Después es: n=100 Como n≥30, la distribución en las muestras de la proporción de los fumadores es normal: p140єN(0'25,√(0'25·0'75/140))=N(0'25,0'037); p100єN(0'25,√(0'25·0'75/100))=N(0'25,0'043)
Se pide en primer lugar: P(p140>70/140)=P(p140>0'5)=P(Z>(0'5-0'25)/0'037)=P(Z>6'76)~0 Para la segunda parte considerando que el nivel de confianza es: 1-α=0'99 → α=0'01 → α/2=0'005 → zα/2=2'575 El intervalo de probabilidad queda: (0'25-2'575√(0'25·0'75/100),0'25+2'575√(0'25*0'75/100))=(0'14, 0'36). Esto significa que para muestras de tamaño 100 la probabilidad de que en una de esas muestras salga una proporción de fumadores entre el 14% y el 36% es del 99%. 7) Una fábrica de coches lanza al mercado el modelo "Mathe" del que se sabe que sus pesos siguen una distribución normal de media 3100 Kilos y una desviación típica de 130 Kilos. a) ¿Cuál es la probabilidad de que, al comprar un coche Mathe, pese más de 3130 Kilos? b) ¿Qué distribución seguirán las muestras de tamaño 100 de coches Mathe? c) ¿Cuál será la probabilidad de que al comprar un coche pese más de 2900 Kilos y menos de 3500 Kilos?
8) Un estudio indica que la proporción de individuos que enfermarán después de suministrarle una determinada vacuna es del 5%. Se toma una muestra de 400 individuo vacunados. Determinar: a) El número esperado de individuos que no enfermará. b) La probabilidad de que el número de individuos que enferman sea, como mínimo, igual a 24. c) Determinar la probabilidad de que el número de individuos que no enferman sea, como mínimo 372.
SUBIR
ESTIMACIÓN A PARTIR DE UNA MUESTRA: 1) En una oposición en la que participaron miles de candidatos se hizo un examen tipo test. La desviación típica de las calificaciones fue σ =10. a. Si se elige una muestra de tamaño 100, con una media muestral de 71 puntos, ¿Cuál será el intervalo de confianza para la media poblacional con una probabilidad del 90%? b. Idem, si n=40, la media muestral es 74 y el nivel de significación 0,05. X="puntuación obtenida en el test". X="puntuación media de la muestra" Como las muestras de los dos apartados cumplen que n≥30, la distribución de las medias muestrales son normales: X100єN(μx, 10/√100)=N(μx, 1); X40єN(μx, 10/√40)=N(μx, 1'58) a) Tamaño de la muestra: n=100; media obtenida en la muestra: X100=71; nivel de confianza: 1-α=0'90 → α=0'10 → α/2=0'05 → z α/2=1'645; intervalo de confianza: (71-1'645·10/√100, 71+1'645·10/√100)=(69'36,72'65). Esto significa que la media de la población se encuentra en el intervalo (69'36,72'65) con una probabilidad del 90%, o igualmente, P(69'36<μx<72'65)=0'9 b) Tamaño de la muestra: n=40; media obtenida en la muestra: X40=74; nivel de significación: α=0'05 → α/2=0'025 → zα/2=1'96; intervalo de confianza: (74-1'96·10/√40, 74+1'96·10/√40)=(70'90,77'10). Esto significa que la media de la población se encuentra en el intervalo (70'90,77'10) con una probabilidad del 95%, o igualmente, P(70'90<μx<77'10)=0'95
2) Una encuesta realizada a 1100 personas da los siguientes porcentajes de voto para dos partidos de ámbito nacional: partido A, 37%; partido B, 39%. Si el mismo día que se hizo la encuesta , que se supone realizada correctamente, se hubiesen realizado las elecciones, ¿resultaría estadísticamente extraño que las hubiese ganado el partido A?. Pongamos una confianza del 95%. La población la podemos considerar formada de dos maneras: 1) los que votan al partido A y los que no lo votan; 2) los que votan al partido B y los que no lo votan. Tamaño de la muestra: n=1100. Nivel de confianza: 1-α=0'95 → α=0'05 → α/2=0'025 → zα/2=1'96. Tomaremos pq≤0'25. Vamos a encontrar un intervalo de confianza para la proporción de los que votan a A, pA, y otro para la proporción de los que votan a B, pB. Estimación de pA en la población: (0'37-1'96·√(0'25/1100), 0'37+1'96·√(0'25/1100))=(0'3405, 0'3995). Estimación de pB en la población: (0'39-1'96·√(0'25/1100), 0'39+1'96·√(0'25/1100))=(0'3605, 0'4195). Es decir, se estimaría a partir de la muestra (con probabilidad del 95%) que A sacaría entre el 34'05% y el 39'95% de los votos, y B entre el 36'05% y el 41'95% de los votos, por lo tanto podría haber ganado cualquiera de los dos aunque B tendría más opciones de ganar. 3) En una encuesta se pregunta a 10000 estudiantes de bachillerato sobre su consumo de refrescos semanal, encontrándose una media de 5 botes, con una desviación típica de 2. a. Halla los intervalos de confianza para la media al 80% y al 95% de probabilidad. b. Si aceptamos un error de 0,25 botes para la media poblacional con una fiabilidad de 0,2, ¿a cuántas personas es necesario entrevistar?.¿Y si queremos un nivel de confianza del 95%?. X="número de refrescos consumidos a la semana" Tamaño de la muestra: n=10000 (las distribuciones de las medias muestrales se pueden considerar normales); media de la muestra: X = 5; desviación típica de la muestra: s=2 (se tomará σ = s) a) 1er nivel de confianza: 1-α=0'80 → α=0'20 → α/2=0'10 → zα/2=1'28; 2º nivel de confianza: 1-α=0'95 → α=0'05 → α/2=0'025 → z α/2=1'96 I80%=(5-1'28·2/√10000, 5+1'28·2/√10000)=(4'9744, 5'0256); I95%=(5-1'96·2/√10000, 5+1'96·2/√10000)=(4'9608, 5'0392). Al aumentar la confianza aumenta la longitud del intervalo. b) Error máximo admitido E=0'25 En el primer caso: n=(1'28·2/0'25)2 ~105 personas. En el segundo: n=(1'96·2/0'25)2 ~246 personas. Si queremos estimar la media de la población con un margen de error de ±0'2 botes para obtener más confianza en la estimación (del 80% al 95%) debemos de aumentar el número de encuestados. 4) El nivel de colesterol (en mg/dl) para una muestra de 144 personas mayores de 60 años sigue una media de 235, con desviación típica 45. ¿Se puede admitir que la media de colesterol de la población de mayores de 60 años es de 225, con un nivel de confianza del 95%? X="nivel de colesterol para personas mayores de 60 años" Tamaño de la muestra: n=144 (las distribuciones se pueden considerar normales); media de la muestra: X = 235; desviación típica de la muestra: s=45 (se tomará σ = s); nivel de confianza: 1-α=0'95 → α=0'05 → α/2=0'025 → zα/2=1'96 Calculamos el intervalo de confianza para la media de la población: (235-1'96·45/√144, 235+1'96·45/√144)=(227'65,242'35). Según este resultado la media de la población está entre 227'65 y 242'35 con una probabilidad de que así sea del 95%, luego no podemos admitir que la media de la población sea 225 con ese nivel de confianza. 5) En 1995, un informe de uno de los grandes bancos españoles afirmaba, a partir de una muestra de tamaño n=1200, que el 65% de las familias españolas tenían dificultades económicas para llegar a fin de mes. Construye el intervalo de confianza al 95% para la totalidad de las familias españolas.
La población de todas las familias españolas de ese año está dividida en dos bloques: Las que tienen dificultad económica para llegar a fin de mes (porcentaje=p) y las que no. En la muestra de tamaño n=1200 salía como porcentaje de las que tenían dificultades p=0'65. Para un nivel de confianza del 95% se tiene: 1-α=0'95 → α=0'05 → α/2=0'025 → zα/2=1'96. Tomaremos pq≤0'25. El intervalo de confianza para estimar p será: (0'65-1'96·√(0'25/1200),0'65+1'96·√(0'25/1200))=(0'6217, 0'6783). Es decir el porcentaje de familias españolas del año 1995 que tenían dificultades económicas para llegar a fin de mes estaba entre un 62'17% y un 68'83%, con una probabilidad de que así ocurriera del 95% 6) Un granjero quiere conocer el peso ganado por sus pollos tras un período de 15 días con una nueva alimentación. Estima el número de pollos que habrá que pesar para conocer el peso medio ganado por cada pollo, con un error máximo de 50g y una confianza del 90%, si por estudios de nutrición se sabe que la desviación típica del aumento de peso es de 150 gramos. X="peso de los pollos después de 15 días de engorde" Nivel de confianza: 1-α=0'90 → α=0'10 → α/2=0'05 → zα/2=1'645; desviación típica de la población: σ = 150 Error máximo admitido: E=50 Tamaño de la muestra estimado: n=(1'645·150/50)2~25 7) En una muestra aleatoria de 1000 personas, están a favor de que el ministerio de Economía mantenga la presión fiscal el 65%. Halla el intervalo de confianza del 99%. En una encuesta realizada un año antes había resultado un 68% favorable al mantenimiento de la presión. ¿Cae este valor dentro del margen de confianza de la nueva encuesta?. En la población hay un porcentaje, p, que está a favor y otro, q, en contra. Tamaño de la muestra: n=1000 (las distribuciones se pueden considerar normales); porcentaje a favor en la muestra: p=0'65; nivel de confianza: 1-α=0'99 → α=0'01 → α/2=0'005 → zα/2=2'575; tomaremos pq≤0'25. Intervalo de confianza: I=(0'65-2'575·√(0'25/1000),0'65-2'575·√(0'25/1000))=(0'6093,0'6907). El resultado de la encuesta anterior cae dentro del margen de confianza de la nueva encuesta. 8) La duración de bombillas sigue una distribución normal de media desconocida y desviación típica de 50 horas. Para estimar la duración media, se experimenta con una muestra de tamaño n. Calcula el valor de n para que, con un nivel de confianza del 95%, se haya conseguido un error en la estimación inferior a 5 horas.
9) El diámetro medio interior de una muestra de 200 tubos producidos por una máquina es de 0,502 cm y la desviación típica es de 0,05 cm. El uso de los tubos permite una tolerancia en el diámetro de 0,496 a 0,508 cm; de otro modo se considerarán defectuosos. Determina el porcentaje de tubos defectuosos, supuesto que los tubos producidos por esa máquina están normalmente distribuidos.
10) Se hizo una encuesta aleatoria entre 130 estudiantes universitarios, de los cuales 85 eran mujeres, sobre el número de horas que estudian diariamente fuera del aula, obteniéndose una media de 3'4 horas. a) Si la desviación típica es de 1'1 horas, obtener un intervalo de confianza, al 98%, para la media del número de horas que estudian diariamente fuera del aula los estudiantes universitarios. b) Obtener un intervalo de confianza, al 90%, para la proporción de mujeres entre los estudiantes universitarios.
X="número de horas de estudio"
En la población hay dos grupos: mujeres (cuyo porcentaje es p) y hombres (q) Tamaño de la muestra: n=130 (las distribuciones se pueden considerar normales); media de la muestra: X = 3'4 a) Desviación típica de la población: σ lo tomamos como s =1'1; nivel de confianza: 1 -α=0'98 → α=0'02 → α/2=0'01 → zα/2=2'325 I98%=(3'4-2'325·1'1/√130, 3'4+2'325·1'1/√130)=(3'18,3'62). Los estudiantes universitarios estudian entre 3'18 horas y 3'62 horas de media con una probabilidad de que así sea del 98%. b) La proporción de mujeres en la muestra es: p=85/130=0'6538. El nivel de confianza del 90% da: 1-α=0'90 → α=0'10 → α/2=0'05 → z α/2=1'645. Tomaremos pq≤0'25. I90%=(0'6538-1'645·√(0'25/130), 0'6538+1'645·√(0'25/130))=(0'5817,0'7259). El porcentaje de mujeres universitarias estimado está entre el 58'17% y el 72'59% con una probabilidad de que así sea del 90%. 11) En un país se sabe que la altura de la población se distribuye según una normal cuya desviación típica es igual a 10 centímetros. a) Si dicha media fuera de 170 centímetros, calcular la probabilidad de que la media muestral, de una muestra de 64 personas, difiera menos de un centímetro de la media de la población. b) ¿Cuál es el tamaño muestral que se debe tomar para estimar la media de la altura de la población con un error menor de 2 centímetros y con un nivel de confianza del 95%? c) Y si, en el apartado anterior, aumentamos el nivel de confianza al 99%, ¿qué tamaño muestral se necesitará?
X="altura de una persona en centímetros" XєN(μ,10)→X64єN(μ, 10/√64)=N(μ, 1'25) a) Si μ=170, P(169
SUBIR
TEST DE HIPÓTESIS: 1) Hace algunos años la media de estatura de los españoles adultos (varones) era de 170 cm, con F =9 cm. Pasado el tiempo, un muestreo realizado a 36 adultos da una media de 172 cm. a)¿Podemos afirmar, con una confianza del 90%, que esa diferencia de 2 cm es debida al azar?. b)¿No es posible que la estatura media haya aumentado?. c)¿Cambiarían las conclusiones si esa media de 172 cm se hubiese obtenido tras un muestreo de tamaño n=900?.
X="estatura de los de los varones españoles adultos" Hace algunos años μ0=170 y σ0=9, hoy en día la media es μ1 y vamos a suponer que la desviación típica no ha cambiado σ1=σ0. La muestra tiene tamaño: n=36 (distribuciones se consideran normales); media de la muestra: X=172 a) H 0: Las medias de la población no han cambiado, μ1=μ0=170; H 1: Las medias son diferentes μ1≠μ0; Es un contraste de hipótesis de dos colas: 1-α=0'90 → α=0'10 → α/2=0'05 → zα/2=1'645; De ser cierta la H0, entonces encontraríamos que la media de la muestra estaría en el intervalo (170-1'645·9/√36, 170-1'645·9/√36) = (167'53,172,47) con una probabilidad de sea así del 90%. Como la media de la muestra cae en ese intervalo, es decir, ha ocurrido un suceso que tiene el 90% de probabilidad de ocurrir, entonces aceptamos H0 y rechazamos H1. Podemos cometer un error β con esta decisión. b) H 0: Las medias de la población no han cambiado, μ1=μ0=170; H 1: Las media actual ha aumentado μ1>μ0; Es un contraste de hipótesis de una cola: 1-α=0'90 → α=0'10 → zα=1'28; De ser cierta la H0, entonces encontraríamos que la media de la muestra estaría en el intervalo (-∞, 170+1'28·9/√36)=(-∞,171'92). Como la media de la muestra no cae entre estos límites, no ha ocurrido este suceso que tenía un 90% de probabilidades de ocurrir si la hipótesis nula fuese verdadera. En conclusión rechazamos H0 y aceptamos la alternativa H1 admitiendo que podemos cometer un error α en esta decisión. c) En el primer caso la región de aceptación sería: (170-1'645·9/√900, 170-1'645·9/√900) = (169'51,170'49), como 172 no pertenece al intervalo el resultado sería diferente, rechazaríamos H0 y aceptaríamos H1. En el segundo caso la región de aceptación sería: (-∞, 170+1'28·9/√900)=(-∞,170'38) y como 172 sigue estando fuera de este intervalo se mantendrían las conclusiones anteriores. 2) Supongamos que, respecto a una determinada ley, el 52% de los ciudadanos está en contra. Pasado un tiempo, una encuesta realizada a 400 personas indica que los ciudadanos en contra han descendido hasta el 49%. Para una significación de 0.05, nos planteamos: ¿Se admite que ha cambiado, realmente la opinión pública, o tal resultado es debido al azar?. ¿Se admite que ha disminuido el porcentaje de ciudadanos en contra de esa ley?.
3) La Concejalía de salud de una ciudad tiene serias dudas sobre el nivel de proteínas de los ciudadanos: se sospecha que ha descendido. Tal nivel es considerado normal si vale 7.25 gramos por decilítro, con desviación típica F =0.71. Para contratar las dudas se realiza un muestreo con 35 personas, del que se obtiene una media de 6.85. Si se desea una confianza en los resultados del 97.5%, ¿puede asegurarse que el nivel de proteínas ha descendido?.
4) Una encuesta a 64 profesionales de una institución reveló que el tiempo medio de empleo en dicha profesión era de 5 años con desviación típica de 4. Considerando un nivel de significación del 0.05, ¿sirven estos datos para afirmar que el tiempo medio de empleo de los profesionales de esta institución está por debajo de los 6 años?. Suponemos normales las distribuciones.
5) Un experto en temas electorales, basado en los resultados de anteriores comicios, sostiene que, si se celebran elecciones generales en la actualidad, tan sólo acudiría a votar el 48% del electorado. Sin embargo, en un sondeo electoral realizado recientemente con una muestra de 1500 personas, 800 manifiestan su intención de votar. Plantea la prueba de hipótesis más adecuada, para un nivel de significación de 0.05 y comenta el resultado.
6) Existe la hipótesis de que en una determinada región realizan estudios de nivel medio el mismo número de varones que de mujeres. Mediante un sistema aleatorio tomamos una muestra de 1000 expedientes escolares, de los cuales 532 son varones y 468 son mujeres. ¿Es este un resultado poco probable o, por el contrario, se ajusta a la gran mayoría del 99% de los resultados?.
7) Una marca de nueces afirma que, como máximo, el 6% de las nueces están vacías, se eligieron 300 nueces al azar y se detectaron 21 vacías. a) Con un nivel de significación del 1%, ¿se puede aceptar la afirmación de la marca?. b) Si se mantiene el porcentaje muestral de nueces que están vacías y 1-α=0'95, ¿qué tamaño muestral se necesitaría para estimar la proporción de nueces vacías con un error menor del 1%?
La proporción de nueces vacías vamos a llamarle p. El tamaño de la muestra es: n=300 (distribuciones se pueden considerar normales). La proporción de nueces vacías encontradas en la muestra fue p=21/300=0'07. a) H 0: La marca dice que p≤ 0'06 ; H 1: La alternativa es que p>0'06. Es un contraste de una cola: α=0'01 → zα=2'325. De ser cierta la hipótesis nula entonces la región de aceptación sería: (-∞, 0'06+2'325·√(0'06·0'94/300))=(∞,0'09). Como la proporción muestral cae dentro de este intervalo se verifica un intervalo con una probabilidad de ocurrir del 99%, por lo tanto aceptamos la hipótesis nula H0 y rechazamos la alternativa H1. Podemos cometer un error β. b) Para un nivel de confianza:1-α=0'95 → α=0'05 → α/2=0'025 → zα/2=1'96. Estimamos el porcentaje de nueces vacías de la población con un intervalo de confianza. Si el error máximo admitido es: E=0'01, entonces el tamaño de la muestra debe de ser: n=1'962·0'07·0'97/0'012~2609. 8) En una muestra de 900 páginas escritas por alumnos de bachillerato, 351 tenían algún tipo de falta de ortografía. a) Determinar un intervalo de confianza, de nivel igual a 0'95, para la proporción de páginas con faltas de ortografía. b) Si α=0'1, ¿se podría rechazar la hipótesis de que, como máximo, el 38% de las páginas escritas por los alumnos de bachillerato tienen algún tipo de faltas de ortografía?
La proporción de páginas con faltas de ortografía le llamaremos p. La muestra tiene de tamaño n=900, y la proporción muestral p=351/900=0'39 a) Para nivel de confianza 0'95 se tiene: 1-α=0'95 → α=0'05 → α/2=0'025 → zα/2=1'96 El intervalo de confianza para p será: (0'39-1'96·√(0'25/900),0'39+1'96·√(0'25/900))=(0'36,0'42). Es decir, P(0'360'38. Para α=0'1 se tiene:1-α=0'90 → α=0'10 → zα=1'28; La región o suceso de aceptación es: (∞,0'38+1'28·√(0'38·0'62/900))=(-∞, 0'40), y, como 0'39 pertenece a este intervalo, aceptamos la hipótesis nula H0 con un error de equivocarnos β. 9) Un vendedor de paquetes de carbón para barbacoa afirma que el peso medio de cada paquete es, como mínimo, de 20 kgr. Para contrastar esto se toma una muestra de 9 paquetes, obteniéndose una media de 19'3 kgr. Si se supone que el peso de los paquetes sigue una distribución normal con desviación típica de 1 kgr: a) Determinar si se puede aceptar la afirmación con α=0'05. b) Con un nivel de confianza del 90%, ¿qué tamaño muestral es necesario para estimar el peso medio de un