Proyecto Final xxxxxxxxxxxxxxx Estadística Instituto IACC 24-04-2017
Desarrollo a) La población son las dos comunas de Santiago b) Variable cualitativa nominal. c) Tipo: Construya un gráfico circular para la variable “Tipo de Licencia”.
Variable cualitativa nominal.
Tipo de licencia N° de conductores A1
29
A2
37
B
114 180
1) Considerando el histograma que se presenta a continuación: Para la interpretación del histograma considere los siguientes cuatro aspectos: la forma de la distribución (coeficiente de asimetría), el rango de la distribución, la mayor y menor frecuencia. Interpretación: Del grafico vemos que el coeficiente de asimetría es negativa entonces es una asimetría con cola a la izquierda, el rango de edad es de 32 es decir es la mayor diferencia de edad desde el más joven hasta el más adulto, las frecuencias nos proporcionan los datos de cuantas personas se encuentran en dicho rango siendo la mayor frecuencia de 48 en un rango de 34 a 38 años de edad y la menor cantidad de personas se encuentra en el rango de 50 a 54 siendo solo una persona en dicho rango.
intervalo
xi_marca_clase f_frecuencia F_acumulada h_relativa
H_relativa
Xi*f
f*(media_xi)^2 f*(media_xi)^4
22
26
24
8
8
0.044
0.04
192
1060.045432
140462.0398
26
30
28
19
27
0.106
0.15
532
1071.919012
60474.22995
30
34
32
39
66
0.217
0.37
1248
480.7881481
5927.108805
34
38
36
48
114
0.267
0.63
1728
11.47259259
2.742091267
38
42
40
44
158
0.244
0.88
1760
886.6054321
17865.20891
42
46
44
19
177
0.106
0.98
836
1369.163457
98663.60902
46
50
48
2
179
0.011
0.99
96
311.9446914
48654.74523
50
54
52
1
180
0.006
1.00
52
271.8834568
73920.61408
6392
5191.938765
372049.6838
180
Media= 35.5111111
Mediana:
Mediana= 32.7692308 Moda= 36.7692308 2) Utilizando la información de la base de datos, realice lo siguiente: a) Construya una tabla bidimensional de frecuencia absoluta que resuma la información con respecto a las variables “rango de tiempo” y “experiencia”.
rango de tiempo
baja
media
alta
fy
0.8
1.4
1
3
2
6
1.4
2
8
20
25
53
2
2.6
15
40
38
93
2.6
3.2
3
12
11
26
3.2
3.8
0
2
0
2
27
77
76
180
fx
b) Determine el porcentaje de conductores con experiencia alta o media y si tienen un tiempo de reacción sobre 2,0 segundos.
Rango de tiempo sobre 2 segundos De alta o media reacción Probabilidad
0.277777778
c) Determine el puntaje promedio de los conductores con experiencia alta y un tiempo de reacción de a lo más 2,6 segundos. Puntaje promedio de conductores con experiencia alta y tiempo de reacción de a lo más 2.6 Promedio= 2.123076923
4) Considerando que la variable “Tiempo de reacción” que depende de la variable “Nivel de Alcohol”. Con esta información: a) Construya un gráfico de dispersión que relacion e las variables mencionadas. Incluya la línea de tendencia lineal con su respectivo coeficiente de determinación.
diagrama de dispersion 4.0 3.5
y = 0.9561x + 1.0126 R² = 0.8494
3.0 2.5 2.0 1.5 1.0 0.5 0.0 0.0
0.5
1.0
1.5
2.0
2.5
3.0
b) Interprete el coeficiente de determinación del modelo de regresión lineal. Coeficiente de determinación R=0.84938803 El coeficiente de determinación es una medida de proximidad del ajuste de la recta de regresión mientras más cercano a la unidad la ecuación es mejor, es decir más ajustable.
c) Utilizando el modelo lineal, estime el tiempo de reacción de un conductor que marcó 1,8 gramos por litro de alcohol en la sangre.
Y=0.9561 (1.8)+1.0126 Y=2.73358
5) Considerando que la variable número de conductores seleccionados de un determinado género en un conjunto de n conductores, es una variable aleatoria con distribución binomial, realice las siguientes actividades: a) Construya una tabla de distribución de frecuencias relativas, con la variable género.
frecuencia relativa 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 femenino
masculino
b) Si se seleccionan 30 vendedores al azar, ¿cuál es la probabilidad de que 22 de ellos sean de género masculino?
Sea p= 0.733
PX ≤ 22 ∑CK 0.5k0.5−k k= PX ≤ 22 0.56916891
c) Si se eligen 25 vendedores al azar, ¿cuál es la probabilidad de que a lo más 8 de ellos sean de género femenino?
PX ≤ 8 ∑CK 0.5k0.5−k k=
PX ≤ 8 0.79964881 6) Suponiendo que la base de datos constituye la población y considerando que la variable “Tiempo de reacción” de los conductores es una variable aleatoria continua y que se distribuye normalmente, conteste las siguientes preguntas:
a) ¿Cuál es el promedio y la desviación estándar poblacional de la variable tiempo de reacción de los conductores? (2 puntos) µ = promedio u= 2.2 ơ= desviación ơ= 0.423586611
b) ¿Cuál es la probabilidad de que un conductor seleccionado al azar t enga un tiempo de reacción entre 2,1 y 3,2 segundos?
P2.1 ≤ X ≤ 3.2 PX ≤ 3.2 PX ≤ 2.1 P[X ơ µ < 3.2ơ µ] P[X ơ µ < 2.1ơ µ] PZ < 2.36079 PZ < 0.2360 0.99088197 0.40671634 0.58416857
Bibliografía IACC (2017) Estadística, Contenidos de la Semana 1. IACC (2017) Estadística, Contenidos de la Semana 2. IACC (2017) Estadística, Contenidos de la Semana 3. IACC (2017) Estadística, Contenidos de la Semana 4. IACC (2017) Estadística, Contenidos de la Semana 5. IACC (2017) Estadística, Contenidos de la Semana 6. IACC (2017) Estadística, Contenidos de la Semana 7. IACC (2017) Estadística, Contenidos de la Semana 8.