Facultad de Ciencias de la Salud Escuela Profesional de Medicina Humana Curso Bioestadística
Laboratorio Nº 03 Tema: Distribución en tabal de Variables Cualitativas y Cuantitativas Cuantitativas
Docentes: Gialina Toledo Méndez Pedro Yvan Saenz Rivera Edward Huamaní Alhuay Timoteo Hincho Ccasa Olga Rocio Zumaran Alayo Mirian Mattos Jorge Mamani Sara Aquino Dolorier Gladis Vera Nuñes Elsa Guillen Guillen Alicia Bustamante
Introducción: Una vez que se ha recogido la información esta debe ser revisada cuidadosamente para verificar su consistencia y validez, seguidamente pasamos a resumirla y presentarla convenientemente en cuadros y graficas antes de analizarlas. Competencias 1: 1: Reconocerá el tipo de variables y presentara la tabla de Frecuencia Respectiva. Competencias 2: 2: Interpretación de Frecuencias Absolutas y Frecuencias relativas. ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------Teniendo ------------------Teniendo en cuenta los datos del archivo EVALUACIÓN PROFESIONALES.sav PROFESIONALES.sav que corresponde a un estudio echo en base a una muestra de 200 profesionales, resumiremos dicha información en tablas. tabl as. El tratam tratamien iento to y las consid considera eracio ciones nes en la elabora elaboració ciónn de las tablas tablas resume resumenn (tabla (tablass de frecue frecuenci ncia) a) dependerán principalmente del tipo de variable variable en cuestión, veremos a continuación continuación como proceder en cada caso. PASOS PARA LA ELABORACIÓN DE UNA TABLA DE FRECUENCIAS CASO I: VARIABLES CUALITATIVAS Considerando la variable rama (rubro de la especialidad), los pasos a seguir para construir una tabla de frecuencias es la siguiente: Paso 1 :
Observamos Observamos que que el tamaño tamaño de la muestra muestra es n = 200, luego identificamos el número de observaciones diferentes, en este caso son 5 “Ciencias Experimentales y de la Salud”, “Ciencias Sociales y Jurídicas”, “Enseñanzas Técnicas”, “Humanidades” y “Otros”. Es decir: y1 = 0, y2
=
1, y3 = 2, y4 = 3, y5
=
4
Paso 2:
Contamos ahora el número de profesionales por cada rama, presentamos dicho conteo en la siguiente tabla: Tabla Nº 01 i
1 2 3 4 5
f i
yi
hi ×100%
35
0
0.175
17.5
0.395
39.5
0.185
18.5
0.160
16.0
0.085
8.5
79
1
37
2
32
3
17
4 TOTA TOTAL L
hi
200
Docente: Gialina Toledo Méndez Página 1 Año 2011
Bioestadística Bioestadísti ca
Facultad de Ciencias de la Salud Escuela Profesional de Medicina Humana Curso Bioestadística
Donde: yi son los valores diferentes que toma la variable “rama” f i = i-ésima frecuencia absoluta del valor yi hi = i-ésima frecuencia relativa del valor yi hi × 100% = i-ésima frecuencia relativa porcentual del valor yi Interpretación: profesionales que pertenecen a la rama “Ciencias Sociales y Jurídicas”. h3 = 0.185 : La proporción de profesionales que pertenecen a la rama “Enseñanzas Técnicas” es de 0.185 h1 × 100% = 17.5 el porcentaje de profesionales que pertenecen a la rama “Ciencias Experimentales y de la Salud” es de 17.5 % f 2
=
79 : existen 79
CASO II: VARIABLES CUANTITATIVAS DISCRETAS Construir una tabla de frecuencias para la variable comprensión verbal . Paso 1 : Determinamos fácilmente que la variable comprensión verbal Toma solo 11 valores (pudiendo
haber tomado valores puntuales entre 00 y 20 por ser un examen) Paso 2 : De manera análoga al caso anterior hacemos el conteo de casos para cada valor observado y dichos
conteos se muestran en la siguiente tabla: Tabla Nº 02
yi
i
4
f i
0.010
0.020
1.0
2.0
14
0.050
0.070
5.0
7.0
26
0.060
0.130
6.0
13.0
41
0.075
0.205
7.5
20.5
66
0.125
0.330
12.5
33.0
105
0.195
0.525
19.5
52.5
133
0.140
0.665
14.0
66.5
176
0.215
0.880
21.5
88.0
200
0.120
1.000
12.0
100.0
43
10 16
4
28
9 15
1.0
39
8 14
0.5
25
7 13
0.010
15
6 12
0.005
2
12
5 11
0.5
0.005
10
4 10
0.5
1
2
3 9
0.005
H i
1
2 8
H i ×100%
hi
1
1 6
hi × 100%
F i
24
11 200
Donde: Docente: Gialina Toledo Méndez Página 2 Año 2011
Bioestadística
Facultad de Ciencias de la Salud Escuela Profesional de Medicina Humana Curso Bioestadística yi son los valores diferentes que toma la variable “comprensión verbal”
i-ésima frecuencia absoluta del valor yi F i = i-ésima frecuencia absoluta acumulada menor que, hi = i-ésima frecuencia relativa del valor yi H i = i-ésima frecuencia relativa acumulada menor que, hi × 100% = i-ésima frecuencia relativa porcentual del valor yi H i × 100% = i-ésima frecuencia relativa porcentual acumulada menor que. f i =
Interpretación: Existen 15 profesionales que obtuvieron 15 pts. en la evaluación de comprensión verbal. h8 × 100% = 19.5 El porcentaje de profesionales que obtuvieron 13 pts de calificación es de 19.5 % f 10
=
43
H 5 × 100% = 13 El porcentaje de profesionales que obtuvieron 10 puntos o menos fue del 13%
OBSERVACION: El procedimiento para obtener una tabla de frecuencias (para variables cualitativas o discretas) usando el SPSS es el siguiente:
a. Ir al menú seleccionar: Analizar/ Estadísticos descriptivos/frecuencia…
b.
Seleccionar la variable comprensión verbal, marcar la opción “Mostrar tablas de frecuencias” y darle aceptar
c. El SPSS mostrara el siguiente resultado:
Docente: Gialina Toledo Méndez Página 3 Año 2011
Bioestadística
Facultad de Ciencias de la Salud Escuela Profesional de Medicina Humana Curso Bioestadística
CASO III: VARIABLES CUANTITATIVAS CONTINUAS Construir una tabla de frecuencias para la variable estatura. Dado que la variable estatura es del tipo continua construiremos una tabla de frecuencias agrupando dicha variable de interés en K intervalos de igual amplitud. Paso 1:
Primero observamos en la variable ESTATURA y determinamos cual es la estatura mínima y máxima para luego poder calcular la AMPLITUD O RANGO ( R) R = X max − X min
Así tenemos que: R = 1.93− 1.52 = 0.41 Paso 2 : Utilizando la fórmula de Sturges, calculamos el número de clases que tendrá la distribución:
K = 1 + 3.32 log(200) = 8.639 ≈ 9 Paso 3 : Calculamos el valor de la amplitud de clase (c):
c=
R K
=
1.93 − 1.52 9
=
0.04555..
En este punto debemos de trabajar para la amplitud de clase con tantos decimales como decimales tengan los datos, ósea en este ejemplo son 2 decimales. En este caso si redondeamos según el criterio del cinco tendríamos c= 0.04, pero entonces el valor del nuevo rango seria R ' = K .c = 9(0.04) = 0.36 , lo cual sería inferior al rango inicial que fue de 0.41. Así que finalmente trabajamos con c = 0.05 RECOMENDACIÓN: Siempre redondear por exceso en este punto. Paso 3 :
Como por lo general el valor de c es obtenido redondeando su cálculo por exceso, debemos de corregir el rango para que este coincida con el valor de c y k Así tenemos que el nuevo rango R ' = K .c = 9(0.05) = 0.45 Luego debemos calcular la diferencia entre el rango original y el nuevo rango:
R '− R = 0.45 − 0.41 = 0.04
Esta diferencia deberá ser dividida entre 2 y afectara a los valores máximo y mínimo de los datos, es decir: d =
R '− R
2
=
0.02
X 'max
=
X max
+
d
=
1.95
X 'min
=
X min
−
d
=
1.50
Donde: X 'max : nuevo X máximo X 'minx : nuevo X mínimo , Paso 4: Docente: Gialina Toledo Méndez Página 4 Año 2011
Bioestadística
Facultad de Ciencias de la Salud Escuela Profesional de Medicina Humana Curso Bioestadística
Seguidamente construimos los intervalos iniciando con el nuevo valor mínimo de los datos ( X 'min ) , cuidando que la amplitud de los datos sea siempre constante e igual a c. Los 9 intervalos son: 1.50,1.55 , 1.55,1.60 , 1.60,1.65 1.65,1.70 1.00,1.75 , 1.75,1.80 , 1.80,1.85 1.85,1.90 1.90,1.95
Notemos que el límite superior del ultimo intervalo coincide con X 'max = 1.95 Paso 5 : Organizamos los intervalos en
una tabla y hacemos los conteos respectivos.
Los resultados se muestran a continuación (VER TABLA N°03):
Tabla Nº 03 i
1 2 3 4 5 6
y 'i −1 , y 'i 1.50,1.55 1.55,1.60 1.60,1.65 1.65,1.70 1.70,1.75 1.75,1.80
8
1.80,1.85 1.85,1.90
9
1.90,1.95
7
yi
f i
F i
hi
H i
hi × 100%
H i ×100%
1.525
9
9
0.045
0.045
4.5
4.5
1.575
20
29
0.100
0.145
10.0
15
1.625
54
83
0.270
0.415
27.0
42
1.675
44
127
0.220
0.635
22.0
64
1.725
38
165
0.190
0.825
19.0
83
1.775
16
181
0.080
0.905
8.0
91
1.825
10
191
0.050
0.955
5.0
96
1.875
5
196
0.025
0.980
2.5
98
1.925
4
200
0.020
1.000
2.0
100
TOTAL
200
Donde: y 'i −1 , y 'i Son los intervalos de clase. yi Es la marca de clase yi
=
y 'i −1 , y 'i
2
, i = 1, 2, 3,....K
i-ésima frecuencia absoluta del valor yi F i = i-ésima frecuencia absoluta acumulada menor que, hi = i-ésima frecuencia relativa del valor yi H i = i-ésima frecuencia relativa acumulada menor que, hi × 100% = i-ésima frecuencia relativa porcentual del valor yi f i =
Docente: Gialina Toledo Méndez Página 5 Año 2011
Bioestadística
Facultad de Ciencias de la Salud Escuela Profesional de Medicina Humana Curso Bioestadística H i × 100% = i-ésima frecuencia relativa porcentual acumulada menor que.
OBSERVACION: En este ejemplo al tratarse de 200 datos el conteo es tedioso por lo tanto debemos de recodificar las variables en el SPSS (transformar/recodificar en distintas variables..) y realizar el conteo de los datos codificados con la opción estadísticas descriptivas/frecuencias.... de dicho Software. La secuencia es la siguiente: Ir a la opción transformar/recodificar en distintas variables.. Introducir la variable estatura, en la celda que indica el Nombre de la Variable resultado, ingresar el nuevo nombre por ejemplo “estatura_codificada” luego darle click en Cambiar Ir a la opción Valores antiguos y nuevos
En la opcion Rango introducir los limites para cada intervalo, y su respectivo nuevo valor en el recuadro Valor. de 1.50 hasta 1.54 le asignamos el valor 1 y luego le damos añadir.
Docente: Gialina Toledo Méndez Página 6 Año 2011
Bioestadística
Facultad de Ciencias de la Salud Escuela Profesional de Medicina Humana Curso Bioestadística
Continuamosde modo analogo con todos los rangos de 1.55 hasta 1.59 le asignamos el valor 2 y luego le damos añadir. de 1.60 hasta 1.64 le asignamos el valor 3 y luego le damos añadir. de 1.65 hasta 1.69 le asignamos el valor 4 y luego le damos añadir. de 1.70 hasta 1.74 le asignamos el valor 5 y luego le damos añadir. de 1.75 hasta 1.79 le asignamos el valor 6 y luego le damos añadir de 1.80 hasta 1.84 le asignamos el valor 4 y luego le damos añadir. de 1.85 hasta 1.89 le asignamos el valor 5 y luego le damos añadir. de 1.90 hasta 1.94 le asignamos el valor 6 y luego le damos añadir
Le damos continuar y finalmente aceptar. Se habra generado una nueva variable “estatura_codificada” Al igual que en el caso discreto ir al menú seleccionar: Analizar/ Estadísticos descriptivos/frecuencia… Seleccionar la variable “estatura_codificada”, marcar la opción “Mostrar tablas de frecuencias” y darle aceptar El SPSS mostrara el siguiente resultado:
Docente: Gialina Toledo Méndez Página 7 Año 2011
Bioestadística
Facultad de Ciencias de la Salud Escuela Profesional de Medicina Humana Curso Bioestadística
Usamos estos resultados y con estos elaboramos la tabla mostrada anteriormente TABLA N°3
TAREA N° 01 En base a los resultados mostrados en la TABLA N°3, Responda e interprete: a. Cuantos individuos miden menos de 1.60 metros? b. Qué porcentaje de los individuos miden menos de1.80 metros? c. Cuál es la proporción de individuos que miden menos de 1.75 metros? d. Cuantos individuos miden 1.60 metros o más? e. Qué porcentaje de individuos miden 1.70 m o más pero menos de 1.80m? TAREA N° 02 A partir de los datos que se encuentran en el Blog de Bioestadística: Diabetes - Hospital Sergio Bernales-Año 2010.sav utilizando el criterio de Sturges en las preguntas 1,2,3,4 desarrolle los ejercicios: Elabore una Tabla de Frecuencias para la variable ESTADO CIVIL Realice la interpretación y análisis correspondiente.
Elabore una Tabla de Frecuencias para la variable grado de instrucción. Considera usted que se puede considerar la frecuencia acumulada en esta tabla?, Realice la interpretación y análisis correspondiente. Elabore una Tabla de Frecuencias para la variable EDAD Realice la interpretación y análisis correspondiente.
Docente: Gialina Toledo Méndez Página 8 Año 2011
Bioestadística
Facultad de Ciencias de la Salud Escuela Profesional de Medicina Humana Curso Bioestadística
Construya dos tablas de frecuencias para la variable Peso, una para hombres y otra para las mujeres, comete las diferencias observadas.
DISCUSIÓN: Suponiendo que el número de mujeres fuera 80 y el de hombres 170, y con el objetivo de hacer comparaciones construyen tablas de frecuencias por separado para hombres y mujeres, Que criterio tomaría usted con respecto al número de intervalos para la variable PESO? COMENTE Y SUSTENTE SU ARGUMENTO.
********************************
Docente: Gialina Toledo Méndez Página 9 Año 2011
Bioestadística