EJERCICIOS RESUELTOS DE ESTADÍSTICA BIDIMENSIONAL 1.- Escriba sobre una línea, “V” si el enunciado es verdadero o “F” si es falso: 1.1.- La covarianza mide la relación lineal entre dos variables, pero depende de las unidades de medida utilizadas…………………………………………………………….( ) 1.2.- Para encontrar las frecuencias relativas marginales de la va riable columna en una tabla de contingencia, se debe dividir el total de la columna por el tamaño muestral………….( ) 1.3.- Al calcular las frecuencias relativas condicionales de la variable columna dada la variable fila de una tabla de contingencia, las celdas se se dividen por el total columna……( )
Solución: El orden de las respuestas son: 1.1.- V; 1.2.- V; 1.3.- F 2.- Se ha observado conjuntamente "la edad" y "la antigüedad" de los trabajadores de una empresa. De los datos resulta que el 18% de d e los trabajadores tienen menos de 30 años y 2 años de antigüedad. Este 18% es: a) b) c) d)
Una frecuencia relativa de la variable antigüedad condicionada a la variable edad Una frecuencia relativa conjunta de las variables edad y antigüedad. Una frecuencia relativa de la variable edad condicionada a la variable antigüedad. Una frecuencia relativa marginal de la variable edad.
Solución: b) Una frecuencia relativa conjunta de las variables edad y antigüedad. 3.- La siguiente distribución corresponde a 210 ciudadanos considerado su opinión ciudadana agrupada en tres categorías (a favor, en contra e indeciso) en la construcción de una autopista según sexo. Opinión (Y) Sexo (X)
Total A favor
En contra
Indeciso
Hombres
41
39
20
100
Mujeres
40
43
27
110
TOTAL
81
82
47
210
a) Construir las distribuciones de frecuencias marginales para las variables X e Y respectivamente. Además interpretar f 2. y f .3 . b) Construir las distribuciones de frecuencias frecuencias relativas bidimensionales para las variables X e Y. Además interpretar: f 22 y h23
ING.ESTAD.VILLENA ZAPATA, LUIGI
c) Construir las distribuciones de frecuencias relativas marginales de X e Y respectivamente. Además interpretar: h1. y h.3 . to
4.- Los siguientes datos representan las calificaciones de los estudiantes del 5 grado de la I.E. 25014, en los cursos de matemática (X), y comunicación (Y). Los datos hipotéticos son: X
Y
X
Y
X
Y
9
13
12
12
12
13
11
12
16
18
10
16
14
17
14
14
13
16
11
13
10
16
10
12
16
15
11
14
13
13
13
11
14
15
10
14
15
14
6
8
Presentar dichos datos mediantes una tabla de distribución bidimensional de frecuencias. Considere para cada caso k=5 (número de intervalos).
Solución: Construiremos un cuadro de frecuencias bidimensionales con intervalos:
Para Y:
Para X: R X max X min 16 6 R 10 A R / k 10 / 5 A 2
Construyendo el cuadro de frecuencias bidimensionales:
X/Y [6-8> [8-10> [10-12> [12-14> [14-16] Total
[8-10>
[10-12>
[12-14>
[14-16>
[16-18]
Total
1 0 0 0 0
0 0 0 1 0
0 1 3 3 0
0 0 2 0 4
0 0 2 1 2
1 1 7 5 6
1
1
7
6
5
20
ING.ESTAD.VILLENA ZAPATA, LUIGI
5.- La tabla de frecuencias que se presenta a continuación es el resultado de una muestra aleatoria de parejas de padre e hijo. hijo
padre
Menos de 1.60 m De 1.60 a 1.80 Más de 1.80 Total
Menos de 1.60 m
De 1.60 a 1.80 m
Más de 1.80 m
Total
50 150 5
400 2000 300
10 200 60
460 2350 365
205
2700
270
3175
Hallar: a) La distribución marginal. b) La tabla de distribución absoluta acumulada.
Solución: En a) Distribución Marginal de la talla del hijo:
Condición X Menos de 1.60 m De 1.60 a 1.80 Más de 1.80 Total
f i.
hi .
460 2350 365
0.145 0.740 0.115
3175
1.000
Distribución Marginal de la talla del padre:
Condición Y Menos de 1.60 m De 1.60 a 1.80 Más de 1.80 Total
f . j
h. j
205 2700 270
0.065 0.850 0.085
3175
1.000
En b) La tabla de distribución de frecuencias absolutas acumuladas:
ING.ESTAD.VILLENA ZAPATA, LUIGI
1
1
F 11 f ij f 11 50 i 1 j 1 1
2
F 12 f ij f 11 f 12 50 400 450 i 1 j 1 1
3
F 13 f ij f 11 f 12 f 13 50 400 10 460 i 1 j 1 2
1
F 21 f ij f 11 f 21 50 150 200 i 1 j 1 2
2
F 22 f ij f 11 f 12 f 21 f 22 50 400 150 2000 2600 i 1 j 1 2
3
F 23 f ij f 11 f 12 f 13 f 21 f 22 f 23 50 400 10 150 2000 200 2810 i 1 j 1
3
1
F 31 f ij f 11 f 21 f 31 50 150 5 205 i 1 j 1 3
2
F 32 f ij f 11 f 12 f 21 f 22 f 31 f 32 50 400 150 2000 5 300 2905 i 1 j 1 3
3
F 33 f ij f 11 f 12 f 13 f 21 f 22 f 23 f 31 f 32 f 33 50 400 10 150 2000 i 1 j 1
200 5 300 60 3175
La tabla de distribución de frecuencias absolutas acumuladas completa es: padre
hijo
Menos de 1.60 m De 1.60 a 1.80 Más de 1.80
Menos de 1.60 m
De 1.60 a 1.80 m
Más de 1.80 m
50
450
460
200 205
2600 2905
2810 3175
6.- Dada la variable estadística bidimensional (X, Y) con la tabla de frecuencias: X/Y
1
2
4
6
1 3 5
2 3 0
0 1 1
1 0 0
1 1 5
Se pide: 3
a)
4
f ij
3
b) h23 , h34 , h21
i 1 j 1
ING.ESTAD.VILLENA ZAPATA, LUIGI
c)
4
f i. ; f . j i 1
j 1
d) h xi / Y 2 y h y j / X 3
Solución: En a) 3
4
f ij
f 11 f 12 f 13 f 14 f 21 f 22 f 23 f 24 f 31 f 32 f 33 f 34
i 1 j 1 3
4
f ij
2 0 1 1 3 1 0 1 0 1 0 5 15
i 1 j 1
En b) h23
h34
h21
f 23 n f 34 n f 21 n
0
15
0
0. 3
0.20
5
15
3
15
En c) 3
f i. f 1. f 2. f 3. 4 5 6 15 i 1 4
f . j
f .1 f .2 f .3 f .4 5 2 1 7 15
j 1
En d) h xi / Y 2 X
f xi / Y 2
h xi / Y 2
1 3 5
0 1 1
0 ½ ½
f .2 2
1
Y
f yi / X 3
h yi / X 3
1 2 4 6
0 1 0 5
h y j / X 3
f 3. 6
0 1/6 0 5/6 1
ING.ESTAD.VILLENA ZAPATA, LUIGI
7.- Las calificaciones obtenidas por un grupo d e alumnos en Estadística (E) y Macroeconomía (M): E
3
4
6
7
5
8
7
3
5
4
8
5
5
8
8
8
5
M
5
5
8
7
7
9
10
4
7
4
10
5
7
9
10
5
7
a) Hallar la tabla de frecuencias. b) Hallar las distribuciones marginales, medias y varianzas muestrales de las mismas. c) Covarianza muestral.
Solución: En a) Construyendo el cuadro de distribución bidimensional:
E/M 3 4 5 6 7 8
4
5
1 1
1 1 1
f . j
2
6
7
8
9
10
4 1 1
1
2
4
0
5
1
2
1 2
3
fi.
2 2 5 1 2 5 17
En b) Marginal de Y:
Marginal de X: X 3 4 5 6 7 8
fi.
2 2 5 1 2 5
hi. 0.118 0.118 0.294 0.059 0.118 0.294
Total
17
1.000
ING.ESTAD.VILLENA ZAPATA, LUIGI
Y 4
2
0.118
5
4
0.235
6
0
0.000
7
5
0.294
8
1
0.059
9 10
2 3
0.118 0.176
17
1.000
Medias y Varianzas Muestrales: X
X i f i. n
5.824
X i f i. n X 2
2 X
S
S
Y i f . j n
Y i
2
2
n 1
Y 2 Y
2
629 17 5.824 17 1
3.274
7
f i. nY
2
n 1
2
903 17 7 17 1
4.375
Covarianza: S xy
X i X Y i Y 46 2.875 n 1
16
8.- Se conocen las varianzas de la suma y la diferencia de dos variables: V x y 8.3 y V x y 10.1 Hallar la covarianza de ambas variables
Solución: V x y V x V y 2Cov x, y 8.3....... I V x y V x V y 2Cov x, y 10.1...... II Multiplicando a (I) por -1: V x V y 2Cov x, y 8.3
V x V y 2Cov x, y 10.1 4Cov x, y 1.8 Cov x, y 0.45
9.- La siguiente tabla de contingencia recoge la información sobre la preferencia de los jóvenes sobre conocidas marcas de gaseosas según edades:
GASEOSA/EDAD Marca A Marca B Marca C
Menor de 15 De 15 a 25 De 26 a 35 150 300 300
ING.ESTAD.VILLENA ZAPATA, LUIGI
100 125 200
200 200 300
Marca la respuesta correcta: 9.1.- La frecuencia marginal relativa porcentual para Edad de 15 a 25 es: a) 22.67%
c) 37.333%
b) 40.00%
d ) 33.33%
9.2.- La frecuencia relativa porcentual para gaseosa Marca B y edad menor de 15: a) 10.67%
b) 6.67%
c)16.00%
d ) 8.00%
9.3.- La frecuencia condicional relativa porcentual de Marca C dado que la persona tiene una edad de 26 a 35 años: a) 42.67%
b) 28.57%
c) 37.50%
d ) 42.86%
Solución: 9.1.- h.1 %
f .1
*100
750
*100 40.0% 1875 300 9.2.- h22 % *100 *100 16.0% n 1875 f ( x3. / Y 2635) 300 *100 *100 42.86% 9.3.- h( X 3. / Y 2635) % f .3 700 n f 22
10.- La relación entre gastos en publicidad (miles de soles) y ventas efectuadas (miles de unidades) de cierto producto por una empresa viene expresada por la siguiente tabla:
Publicidad
4
4
6
6
6
8
8
Ventas
6
8
6
8
10
8
10
5
1
1
3
5
4
3
f ij
Disponer los datos en forma de tabla de doble entrada y obtener: a) Hallar e interpretar las Medias b) Calcular e Interpretar la covarianza c) Calcular e interpretar el gasto medio en publicidad, cuando las ventas realizadas son ocho mil unidades.
ING.ESTAD.VILLENA ZAPATA, LUIGI
Solución: Primero definimos que X= Publicidad y Y=Ventas luego construimos nuestro cuadro de distribución de frecuencias bidimensionales: X/Y
6
8
10
4
5
1
0
6
1
3
5
8
0
4
3
En a) Media de X: X
X i f i. n
46 6 9 8 7 22
6.091
Interpretación: El gasto en publicidad promedio en cierto producto por una empresa es de aproximadamente 6 mil soles.
Media de Y: Y
Y i f . j
6 6 88 108
8.182 22 Interpretación: El número promedio de ventas efectuadas en cierto producto por una empresa es de aproximadamente 8 mil unidades.
n
En b) Utilizando la fórmula de la covarianza de una muestra para datos agrupados: Cov X , Y
f ij X i X Y i Y 54 6.0916 8.182 ... 38 6.09110 8.182 n 1
22 1
Cov X , Y 1.506
Interpretación: Existe una relación directa positiva entre el gasto e n publicidad y las ventas, es decir mientras más se invierta en publicidad, se venderán más unidades.
En c) X / Y 8
f i. / Y 8
41 63 8 4
6.75 8 Interpretación: El gasto medio en publicidad cuando la cantidad de unidades vendidas son 8 mil unidades, es de 6.75 mil soles.
f .2
ING.ESTAD.VILLENA ZAPATA, LUIGI
11.- Supongamos que la tabla de frecuencias relativas dada corresponde a una variable bidimensional (X,Y).
X/Y 38 40 42
40
45
50
55
60
65
0.04 0.05 0.05 0.03 0.00 0.05 0.06 0.10 0.00 0.07 0.05 0.10 0.12 0.05 0.05 0.03 0.10 0.05
Teniendo en cuenta que han sido 200 los elementos extraídos de la población, se pide: a) Determinar las distribuciones marginales. b) Determinar la media y desviación típica de X e Y. c) Determinar la distribución condicionada de X para Y=55. d) Determinar la distribución condicionada de Y para X=42.
Solución: En a: Determinamos las distribuciones marginales: Para “Y”:
Para “X”:
X i
hi .
38
0.22
40
0.22
40
0.38
45
0.20
42
0.40
Total
1.00
50 55 60 65
0.10 0.13 0.15 0.20
Total
1.00
En b: Determinamos las medias para ambas variables: X X i hi. 380.22 400.38 42 0.40 X 40.36 Y Y i h. j 400.22 450.20 ... 650.20 Y 51.95
ING.ESTAD.VILLENA ZAPATA, LUIGI
Determinamos las desviaciones típicas para ambas variables: 2 X
S
X h 2 i
S X 2
2
38 0.22 40 0.38 42 0.40 40.36 200 2
X n
i.
2
2
n 1 1631.28 1628.930200
2
200 1
199
S X 2 2.362 S X 1.537
Y h
2
2
2 Y
S
i
S Y 2
. j
40 0.22 ... 65 0.20 51.95 200 2
Y n
2
n 1 2785.25 2698.802200
2
200 1
199
2
S Y 86.882 S Y 9.321
En c: X i
h X / Y 55
38
0.231
40
0.538
42
0.231
Total
1.000
Donde: h X 1 / Y 55 h X 3 / Y 55
h14 h.4 h34 h.4
0.03 0.13 0.03 0.13
0.231; h X 2 / Y 55
h24 h.4
0.07 0.13
0.538 ;
0.231
En d: Y i
hY / X 42
40
0.300
45
0.125
50
0.125
55
0.075
60
0.250
65
0.125
Total Donde: hY 1 / X 42
1.000 h31 h3.
0.12 0.40
0.30 ; hY 2 / X 42
Así sucesivamente
ING.ESTAD.VILLENA ZAPATA, LUIGI
h32 h3.
0.05 0.40
0.125 ; hY 3 / X 42
h33 h3.
0.05 0.40
0.125