Estadística I Prof. Edmundo Peña Rozas
1
Tablas de Frecuencias Bivariadas I.- OBJETIVOS DE LA SESIÓN:
Construir tablas de frecuencia bivariadas. Calcular medidas de tendencia central, posición y dispersión
II. TEMA Cuando se desea analizar dos variables a la vez, las tablas de contingencia son un método de agrupación de datos que puede resultar de mucha utilidad. Los criterios para construir las tablas de frecuencia pueden ser de ayuda también para la confección de tablas de contingencia.
Ejemplo: Se analizó la distribución de la nota final en un curso de Estadística en una Universidad de la región. A los 72 alumnos, se les registró la nota final, y además el sexo. La información anterior se resume en la siguiente tabla:
Género Intervalo de Clase Hombres
Nota Final
[3,4 , 4[ [4 , 4,5[ [4,5 , 5[ [5 , 5,5[ [5,5 , 6[ [6 , 6,5[ [6,5 , 7]
1 10 17 15 5 3 1 52
Total
Mujeres 0,0139 0,1389 0,2361 0,2083 0,0694 0,0417 0,0139 0,7222
0 4 8 3 1 4 0 20
Total 0,0000 0,0556 0,1111 0,0417 0,0139 0,0556 0,0000 0,2778
1 14 25 18 6 7 1 72
0,0139 0,1944 0,3472 0,2500 0,0833 0,0972 0,0139 1
Como se puede ver, en la tabla se presentan dos variables, una continua (Nota Final), y una cualitativa (Sexo) y se analizan de manera conjunta. Es decir, cada celda contiene la frecuencia absoluta correspondiente al intervalo de clase de nota final y a la clase correspondiente al sexo, en este caso hombre o mujer. Además, si se desea, se puede agregar a la derecha de cada frecuencia absoluta, la frecuencia relativa respectiva.
Ejemplo: Una línea aérea realizó un estudio respecto de la edad de sus pasajeros, y el número de vuelos al año que realizan. Para ello se tomó una muestra de 50 personas. La información se resume en la siguiente tabla:
Edad [0 , 25[ [25 , 40[ [40 , 65[ [65 , 100[ Total
Número de vuelos mayor 3-5 que 5
1-2 1 2 1 1 5
0,02 0,04 0,02 0,02 0,1
1 8 6 2 17
0,02 0,16 0,12 0,04 0,34
2 10 15 1 28
Total 0,04 0,2 0,3 0,02 0,56
4 20 22 4 50
0,08 0,4 0,44 0,08 1
En relación a la tabla anterior, se puede concluir acerca de la relación entre ambas variables. Por ejemplo, se observa que las personas de entre 40 y 65 años son las que “más viajan” ya que tienen la mayor frecuencia correspondiente a 5 vuelos o más.
13/04/2015
Estadística I Prof. Edmundo Peña Rozas
2
A partir de los ejemplos anteriores resulta fácil establecer de manera más formal las llamadas tablas de contingencia.
Tablas de Contingencia Cuando las observaciones de una muestra pueden clasificarse en dos o más categorías, éstas pueden ser presentadas en las denominadas Tablas de Contingencia. Las tablas de contingencia más utilizadas son las que permiten clasificar las observaciones de acuerdo a dos criterios de clasificación (usualmente variables categóricas, pero no necesariamente) con r y c categorías en cada criterio respectivamente. Y
Total
X 1 2
1 n11 n21
2 n12 n22
j n1j n2j
… …
c n1c n2c
i
ni1
ni2
nij
…
nic
ni.
r Total
nr1 n.1
nr2 n.2
nrj n. j
…
nrc n.c
n1. n..
n1. n2.
Donde nij es la frecuencia absoluta conjunta del par (x i,yi), es decir, el número de objetos que presentan el valor x i en X e y j en Y. La frecuencia relativa conjunta correspondiente se calcula como:
f i j
nij
,
Frecuencia relativa con unta
n
..
donde r
c
nij
r
c
f ij
n..
i 1 j 1
1
i 1 j 1
Distribución Marginal A partir de la distribución conjunta de X e Y es posible estudiar cada una de las variables por Las distribuciones separado, dando con ello origen a las distribuciones marginales de X e Y. marginales se obtienen cuando se establecen las distribuciones de frecuencias de cada una variable de manera independiente La distribución marginal de X corresponde a los distintos valores de X junto a sus respectivas frecuencias, siendo n i. y f i. la frecuencia absoluta y relativa marginal de x i en X, independientemente del valor que adopte Y.
La frecuencia absoluta marginal del valor de la variable observada X, es el número de veces que aparece el valor xi de X, sin tener en cuenta cual es el valor de la variable Y. c
ni. nij ni1 ni 2 j 1
13/04/2015
nic
ni. fi. n..
Estadística I Prof. Edmundo Peña Rozas
3
De manera análoga, la distribución marginal de Y corresponde a los distintos valores de Y junto a sus respectivas frecuencias, siendo n .j y f .j la frecuencia absoluta y relativa marginal de y i en Y, independientemente del valor que adopte X. r
n. j nij n1 j n2 j
f. j
nrj
i 1
Y
n. j n..
Total
X 1 2
1 f 11 f 21
2 f 12 f 22
j f 1j f 2j
… …
c f 1c f 2c
i
f i1
f i2
f ij
…
f ic
f i.
r Total
f r1 f.1
f r2 f.2
f rj f. j
…
f rc f .c
f r. 1
f 1. f 2.
Frecuencia relativa marginal de X
Frecuencia relativa marginal de Y
Distribución condicional La distribución condicional permite observar cómo se distribuye una variable sobre la base de una determinada condición en la otra. La distribución de X condicionada al valor y i de Y (X\Y=y i) muestra el comportamiento de la variable X en aquellos sujetos que presentan el valor en Y el valor y i..
X
n ij
f ij
x 1 x 2
n1j f 1j n2j f 2j
x i
nij
x r Total
f ij
nrj f rj n. j
Ejemplo: Una línea aérea realizó un estudio respecto de la edad de sus pasajeros, y el número de vuelos al año que realizan. Para ello se tomó una muestra de 50 personas. La información se resume en la siguiente tabla:
Edad [0 , 25[ [25 , 40[ [40 , 65[ [65 , 100[ Total
13/04/2015
N° de Vuelos al Año 1-2 3-5 Más de 5 Total 1 2 1 1 5
1 8 6 2 17
2 10 15 1 28
4 20 22 4 50
Estadística I Prof. Edmundo Peña Rozas
4
Distribución Marginal de la Edad f i. Edad n i. 0,08 [0 , 25[ 4 [25 , 40[ 20 0,40 [40 , 65[ 22 0,44 0,08 [65 , 100[ 4 Total 50 1,00
Distribución Marginal del N° de Vuelos N° de Vuelos 1-2 3-5 Más de 5 Total al Año n .j f .j
5 0,10
Distribución Condicional, dado que el Número de Vuelos es entre 3 y 5 f i. X\Y=3-5 n i. [0 , 25[ 1 0,06 [25 , 40[ 8 0,47 [40 , 65[ 6 0,35 [65 , 100[ 2 0,12 17 c
r
y j n. j
xi ni. x
i 1
y
n..
j 1
n..
r
xi ni. x
i 1
n..
12,5 4 32,5 20 52,5 22 82,5 4 50
43,7
r
xi \ y [3 5[ ni \ y [3 5[
x y[35[
13/04/2015
i 1
n..
12, 5 1 32, 5 8 52, 5 6 82, 5 2 17
44,26
17 0,34
28 0,56
50 1,00
Estadística I Prof. Edmundo Peña Rozas
5
Ejemplo: Se analizó la distribución de la nota final en un curso de Estadística en una Universidad de la región. A los 72 alumnos, se les registró la nota final, y además el sexo. La información anterior se resume en la siguiente tabla:
Género Intervalo de Clase Hombres
Nota Final
[3,4 - 4,0[ [4,0 - 4,5[ [4,5 - 5,0[ [5,0 - 5,5[ [5,5 - 6,0[ [6,0 - 6,5[ [6,5 - 7,0]
Total Distribución Marginal de Notas Edad f i. n i. [3,4 - 4,0[ [4,0 - 4,5[ [4,5 - 5,0[ [5,0 - 5,5[ [5,5 - 6,0[ [6,0 - 6,5[ [6,5 - 7,0]
Total
1 14 25 18 6 7 1 72
1 10 17 15 5 3 1 52
Mujeres 0,0139 0,1389 0,2361 0,2083 0,0694 0,0417 0,0139 0,7222
0 4 8 3 1 4 0 20
Total 0,0000 0,0556 0,1111 0,0417 0,0139 0,0556 0,0000 0,2778
1 14 25 18 6 7 1 72
0,0139 0,1944 0,3472 0,2500 0,0833 0,0972 0,0139 1
Distribución Marginal del Género Género Hombres Mujeres Total n .j f .j
0,0139 0,1944 0,3472 0,2500 0,0833 0,0972 0,0139 1
52 0,7222
20 0,2778
72 1,00
Distribución Condicional, dado que la Nota es 4,5 – 5,0 Y\X=[4,5 - 5,0[ f i. n i. Hombres Mujeres
17 8 25
0,68 0,32
Bibliografía
D’Ottone, H. (1974). Estadística Elemental . Santiago, Chile: Publicaciones Multiactiva Ltda. Triola, M. (2004). Estadística; 9° edición, México: Editorial Pearson Educación. Webster, A., (2000), Estadística Aplicada a la Economía y los Negocios, 3°ed., Bogotá: McGraw-Hill
13/04/2015