DISEÑO INSTRUCCIONAL EVALUACIÓN FINAL (B) ASIGNATURA
ESTADÍSTICA APLICADA
DOCENTE
ADIEL OMAR FLORES RAMOS
Instrucciones: Desarrolle las siguientes preguntas en Microsoft Word, las que requiriesen el uso de Microsoft Excel, copie las tablas, gráficos o resultados al documento de Microsoft Word. Tiempo: 90 minutos Items:
Pregunta 1 (1pto) De acuerdo al siguiente enunciado, identifique el tipo de muestreo que se utilizó: aleatorio, sistemático, de conveniencia, estratificado o por conglomerados. Encuestas de salida. salida . En épocas de elecciones presidenciales, los medios noticiosos organizan una encuesta de salida, en la que se eligen estaciones de sondeo al azar y se encuesta a todos los votantes conforme abandonan el lugar. Tipo de muestreo: muestreo por conglomerados
Pregunta 2 (1pto) De acuerdo al siguiente enunciado, identifique el tipo de muestreo que se utilizó: aleatorio, sistemático, de conveniencia, estratificado o por conglomerados. Puesto de revisión de sobriedad. Adiel Flores fue un observador en un puesto de revisión de sobriedad de la policía, donde se detenía y entrevistaba a cada quinto conductor. Tipo de muestreo: Muestro sistemático
Pregunta 3 (2pto) Construya el intervalo de confianza Temperatura media corporal . El conjunto de datos 2 del apéndice B incluye 106 temperaturas corporales, para las cuales media x = 98.20°F y s = 0.62°F. Utilizando los estadísticos de la muestra, construya un estimado del intervalo de confianza del 99% para la temperatura media corporal de todos los seres humanos saludables. ¿Los límites del intervalo de confianza incluyen los 98.6°F? ¿Qué sugiere la muestra acerca del uso de 98.6°F como la temperatura corporal media? En este caso p lanteamos:
Usando una precisión al 99%, entonces tenemos:
Entonces construimos el intervalo de confianza:
Media desv.Est 98.0.262 Z−/ Z−./ Z. 2.5758 [98.2Z∗ √ sn ;98.2+Z∗ √ sn] [98.22.5758∗ 0.√ 16062 ;98.2+2.5758∗ 0.√ 16062 ] 98.20.1551 ; 98.2+0.1551 .;.
Entonces notamos que el valor 98.6°F no está incluido en el rango usando 99% de confianza, por lo q ue es errada la afirmación.
Pregunta 4 (2pto) Prueba de hipótesis. Suponga que se seleccionó una muestra aleatoria simple de una población distribuida de manera normal, y pruebe la aseveración dada. Pelotas de béisbol. En pruebas anteriores, se dejaron caer pelotas de b éisbol desde una altura de 24 pies sobre una superficie de concreto; las pelotas rebotaron un promedio de 92.84 pulgadas. En una prueba realizada a una muestra de 40 p elotas nuevas, la altura del rebote tuvo una media de 92.67 in, con una desviación estándar de 1.79 in (según datos de B ookhaven National Laboratory y USA Today). U tilice un nivel de significancia de 0.05 para determinar si existe evidencia suficiente para sustentar la aseveración de que las nuevas pelotas tienen rebotes con una media distinta a 92.84 in. ¿Parecería que las pelotas son diferentes? En este caso planteamos:
Usando un nivel de significancia del 5%, entonces: Hipótesis: Entonces determinamos el estadístico:
Entonces ahora notamos que;
Media nMedia 40 92.92.8467 Sm 1.m79 Z−/ Z−./ Z. 1.9599 Ho:μ H1:μ ≠ 92.92.8844 Z x μ s √ n 84 Z 92.6792. 1.79 √ 40 Z 0.6007
Finalmente podemos concluir que se acepta Ho, y podemos dar aceptado que los rebotes tienen una media igual a 92.84, según la hipótesis nula.
Pregunta 5 (2pto) Pruebe la aseveración dada. Identifique la hipótesis nula, la hipótesis alternativa, el estadístico de prueba, el valor P o el valor (o valores) cr ítico(s), la conclusión sobre la hipótesis nula y la conclusión final referente a la aseveración original. Selección del género para niñas . El Genetics and IVF Institute llevó a cabo un ensayo clínico d el método XSORT, diseñado para incrementar la probabilidad de concebir una niña. El año pasado, ya habían nacido 325 bebés de padres que utilizaron el método XSORT, y 295 d e ellos fueron niñas. Utilice los datos muestrales con un nivel de significancia de 0.01 para pr obar la aseveración de que, con este método, la probabilidad de q ue un bebé sea niña es mayor que 0.5. ¿Parece que el método funciona? En este caso tenemos:
Se desea probar que:
Entonces analizamos el estadístico de prueba:
n 325 niñas 295 pm 232595 0.9077 Ho:p ≤> 0.0.55 H1:p
Z p̂∗ pp(1p) n 90770.5 Z 0.0.5∗ (10.5) 325 Z 14.6998 Ahora notamos que usando una cola para el valor de 0.01, tenemos:
Z− Z−. Z. 2.3263 Entonces podemos afirmar que se rechaza Ho por lo tanto p>0.5. Luego el método si funciona.
Pregunta 6 (2pto) Métodos de encuesta telefónica . En un estudio sobre la exactitud de las encuestas telefónicas, 720 personas se rehusaron a responder cuando formaron parte de los 1720 individuos incluidos en una encuesta “estándar” de 5 días. En el mismo estudio, 429 personas se rehusaron a responder
cuando formaron parte de los 1640 individuos incluidos en una encuesta “rigurosa” de 8 semanas. (Los datos se basan en resultados de “Consequences of Reducing Nonresponse in a National Telephone Survey”, de Keeter et al., Public Opinion Quarterly, vol. 64, núm. 2). Utilice un nivel de significancia de 0.01 para poner a prueba la aseveración de que el porcentaje de negativas es menor en la encuesta rigurosa. ¿Al parecer la encuesta rigurosa produce resultados más exactos? En este caso procedemos a determinar la hipótesis nula:
Luego planteamos las dos siguientes proporciones:
Ho: H1: π1π 1>⪕ππ22(Grafica con 1 cola derecha) 720 0.4186 p 1720
429 0.2616 p 1640 Recordando la hipótesis de pr oporciones:
Zu (p p)(π1 π1) ̅p∗ (1p̅ )n + n 720+429 0.3419 ̅p nx ++ xn 1720+1640 Reemplazando:
Zu
(0.41860.2616)(0) 1 + 1640 1 0.3419∗(10.3419)1720 Zu 9.59
Luego recordamos con un nivel de significancia de 1%:
Z− Z−. Z. 2.3263 Entonces podemos afirmar que se rechaza Ho. Luego el porcentaje de negativas es menor en la encuesta rigurosa y se podría afirmar que la encuesta rigurosa produce resultados más exactos a un nivel de confianza del 99%
Pregunta 7 (2pto) Puntuaciones de CI de gemelos s eparados al nacer . Se obtuvieron las puntuaciones de CI de gemelos separados al nacer, elegidos al azar. Para 20 de estos gemelos, el coeficiente de correlación lineal es 0.870 y la ecuación de la recta de regresión es ý =-3.22 + 1.02x, donde x representa la puntuación de CI del gemelo que nació primero. Asimismo, los 20 valores de x tienen una media de 104.2 y los 20 valores de y tienen una media de 103.1. ¿Cuál es el mejor CI predicho de un g emelo que nació en segundo lugar, dado que el gemelo que nació primero tiene un CI de 110? Tenemos:
Entonces tenemos:
y′ 3.22+1.02x R 0.87 n 20 Media 104.2 Media 103.1 110+3. 2222 1.02x 113. x 1.02 x 111
1.5 1 0.5 0 -0.5
0
0.5
1
1.5
2
2.5
3
3.5
4
4.5
-1 -1.5 -2 -2.5 -3 -3.5
Pregunta 8 (2.5pto) A partir de la observación de cinco años de las variables producción industrial (y) en millones de toneladas y el tiempo (x):
a) Grafique el diagrama de dispersión. b) Identifique el mejor modelo matemático (lineal, cuadrático, exponencial, logarítmico o potencial) que mejor se ajuste a los d atos de la tabla.
Argumente su respuesta. c) Realice una predicción para el año 2017.
a) Diagrama de dispersion
DIAGRAMA DE DISPERSION 35
30 25 20 DIAGRAMA DE DISPERSION
15 10 5 0 0
1
2
3
4
5
6
b) A continuacion presentamos las tendencias del mejor grafico que se ajusta a la relación:
MODELOS DE REGRESION 45 40 y = 17.041ln(x) - 2.7164 R² = 0.8398
35
DIAGRAMA DE DISPERSION
y = 0.8193e0.7775x R² = 0.9448
30
Linear (DIAGRAMA DE DISPERSION)
25
Poly. (DIAGRAMA DE DISPERSION)
y = 7.35x - 8.45 R² = 0.9671
20 y = 17.041ln(x) - 2.7164 15 R² = 0.8398
Expon. (DIAGRAMA DE DISPERSION) Log. (DIAGRAMA DE DISPERSION)
10 y = 1.1429x2 + 0.4929x - 0.45 R² = 0.9999
5
Log. (DIAGRAMA DE DISPERSION)
0 0
1
2
3
4
5
6
-5
Basta analizar dos curvas, donde notamos que la tendencia cuadrática tiene un ajuste casi perfecto debido al valor de R 2. c) Para el año 2017: x=7
Y 1.1429∗Y7 +59.0.0404929∗ 70.45
Pregunta 9 (2.5pto) Ejercicio y estrés . Se realizó un estudio para investigar los efectos del ejercicio sobre el estrés. En la siguiente tabla se listan las lecturas de la presión sanguínea sistólica (en mmHg) de sujetos, antes de iniciar 25 minutos de ejercicio aeróbico en bicicleta y antes d e generarles estrés por medio de una prueba de aritmética y otra de expresión verbal (según datos de “Sympathoadrenergic Mechanisms in Reduced Hemodynamic Stress Responses after Exercise”, de Kim Brownley et al., Medicine and Science in Sports and Exercise , vol. 35, núm. 6). Utilice un nivel d e significancia de 0.05 para probar la aseveración de que los diferentes grupos de sujetos tienen la misma presión sanguínea media. Con base en los resultados, ¿se puede considerar que los grupos provienen de la misma población?
Ho: Las medias de las poblaciones de los g rupos son las mismas. H1: Las medias de las poblaciones de los grupos son diferentes. Para el caso tenemos 24 datos, con k=4 y n=24, entonces:
Ahora como de la tabla tenemos:
n n + n + n + n 24 Sumamos los datos para cada columna:
F Fα,k−,−k F.,, 3.0984
SUMA=
Mujer / afroam
Hombre /afroam
Mujer/caucasica
Hombre/caucasico
117
115.67
119.67
124.33
130.67
120.67
106
111
102.67
133
108.33
99.67
93.67
120.33
107.33
128.33
96.33
124.67
117
102
92
118.33
113.33
127.33
632.34
732.67
671.66
692.66
T + T + T + T 2729.33
Calculo de suma de cuadrados:
k T 2729.33 SC ∑∑X j n 313619.3113 24 3234.2176 = k T= SC ∑ n Tn 632.634 + 732.667 + 671.666 + 692.666 2729.2433 225.423 875.6122 = SC SC SC SC 3234.2176875.6122 2358.6054 Cuadro de ANOVA:
Fuente de variación
Grados de libertad
Tratamiento Error Total
3 20 23
SC
875.6122 2358.6054 3234.2176
Entonces se acepta Ho. FLosbgrupos > Fu provienen de la misma población a un nivel de significancia del 5%.
CM
Fcal
291.8707 117.9303
2.4749
Pregunta 10 (3 pto) Un fabricante de triciclos selecciona diariamente al azar 8 armazones y determina la cantidad de defectos. El número de armazones defectuosos encontrado en los últimos 15 días es: 4; 3; 2; 4; 3; 3; 9; 3; 1; 4; 6; 3; 0; 5; 3. Elabore un diagrama de control para este p roceso y determine si está
“bajo control”.
Día 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 TOTAL =
Armazones fabricados 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 120
Línea central: P =
0.441666667
σ = √P(1-P)/ n=
0.17556951
Armazones defectuosos 4 3 2 4 3 3 9 3 1 4 6 3 0 5 3 53
Fracción defectuosa 0.5 0.375 0.25 0.5 0.375 0.375 1.125 0.375 0.125 0.5 0.75 0.375 0 0.625 0.375 6.625
LCS = P+3*σ =
0.968375196
LCI = P-3*σ =
-0.085041863
0
GRAFICO DE CONTROL 1.2
1
0.8 Fraccion defectuosa P
0.6
LCS LCI
0.4
0.2
0 1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Se observa que el grafico está en su mayoría bajo control salvo en el día 7 que se sale de los márgenes de control.