SOF T WA RE E ST A D ÍST I CO SPS SPSS S T em ema a N° 21:
A n ál i si s D escr crii pt ptii vo
Frecuencia
Descriptivo
Ed ic ión d e Gr áfic o s
Explorar – Tallos Ta llos y Hojas
Comunícate con nosotros. 481614 // PAC Presencial:
[email protected]//
[email protected] // PAC Virtual:
[email protected]
Capacidad del Tema
1. Elabora y Diseña tablas de resultados aplicando estadísticos descriptivos de SPSS.
Conocimientos Previos
Define variables en SPSS y realiza la manipulación de los datos.
Conflicto Cognitivo
El Estudiante reconoce la importancia de saber determinar un análisis descriptivo en SPSS mediante la formulación de la siguiente pregunta: ¿Qué tipo de procedimientos permiten determinar un análisis descriptivo y de qué dependen estos procedimientos?
Los Estudiantes identifican los diferentes estadísticos que se pueden obtener de un conjunto de datos, mediante una lluvia de ideas
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
ANÁLISIS DESCRIPTIVO CON SPSS 21.1.- INTRODUCCIÓN
Existen dos procedimientos básicos que permiten describir las propiedades de las distribuciones, estos dos procedimientos son Frecuencias y Descriptivos. Los procedimientos dependen del tipo de variables. Con variables categóricas, las medidas de tendencia central y de dispersión carecen de sentido, por el contrario, con variables continuas, una tabla de frecuencias pierde importancia. Por otro lado los gráficos que informan sobre la forma de una distribución son diferentes dependiendo de que la variable estudiada sea categórica o continua.
21.2.- FRECUENCIAS Una distribución de frecuencias informa sobre los valores concretos que adopta una variable y sobre el número (y porcentaje) de veces que se repite cada uno de estos valores. Se accede mediante:
Analizar Estadísticos Descriptivos Frecuencias
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
•
Mostrando la ventana de frecuencias:
GRÁFICOS Genera algunos diagramas básicos (Barras, sectores e histogramas). Los gráficos de barras y de sectores son apropiados para las variables categóricas (variables con un número limitado de categorías diferentes). Los valores cuya frecuencia sea cero no aparecerán en el gráfico.
Histogramas: Son similares a los gráficos de barras pero con las barras juntas, dando así la impresión de continuidad. Sólo pueden obtenerse para variables con formato numérico. Para construir el histograma, SPSS agrupa a las variables en 21 intervalos (o menos si la amplitud de la variable es menor de 21) Los histogramas son adecuados para variables cuantitativas continuas (por ejemplo salario o edad). Al seleccionar Con curva normal , se superpone en el histograma una curva normal (generada a partir de la media y la desviación típica de la variable representada). Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
ESTADÍSTICOS Obtener el cálculo de algunos valores de estadísticos descriptivos más utilizados(Valores percentiles, Tendencia Central, Dispersión y Distribución), estas opciones depende en gran medida del hecho a qué tipo de variable es la estudiada.
Valores percentiles: Cuartiles: Calcula los percentiles 25, 50 y 75, es decir, los valores por debajo de los cuales se encuentra el 25%, el 50% y el 75% de los casos, respectivamente. Puntos de corte para k grupos iguales: Calcula los k -1 valores que dividen la muestra en K grupos del mismo tamaño. El valor por defecto de K es 10, pero puede escribirse cualquier otro valor entre 2 y 100. Tendencia Central: Media(Media aritmética): Suma de todas las puntuaciones dividida por el número de puntuaciones. Mediana. Valor por debajo del cual se encuentra el 50% de los casos (equivale al percentil 50). Si el número de casos es par; la mediana se calcula como el promedio de los dos casos centrales cuando estos se encuentren ordenados. Si el número es impar, la mediana es el valor del caso central. Moda: Valor que más se repite. Si existen dos o más valores empatados en el número de repeticiones, solo se muestra el más pequeño de ellos. Dispersión: Desviación típica: Raíz cuadrada de la varianza. Mide el grado en que las puntuaciones de la varianza se alejan de su media. Varianza: Medida de dispersión en torno a la media, igual a la suma de los cuadrados de las desviaciones respecto a la media dividida por el número de casos menos 1. La varianza se mide en unas unidades que son el cuadrado de las de la propia variable. Amplitud: Diferencia entre los valores mayor y menor de una variable numérica; el máximo menos el mínimo. También se denomina recorrido o rango de la variable. Mínimo: Valor más pequeño. Máximo: valor más grande. E.T. media: Error típico de la media, o sea la desviación típica de la distribución muestral de la media. Se obtiene dividiendo la desviación típica por la raíz cuadrada del número de casos. Es una medida de cuánto puede variar el valor de la media de una muestra a otra, extraídas éstas de la misma distribución
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
FORMATO En esta ventana se determina como se mostrará en el visor de resultados las tablas de frecuencia y los estadísticos seleccionados.
Múltiples variables. Al solicitar gráficos o estadísticos para más de una variable permite: - Comparar variables: muestra todas las variables en una sola tabla. - Organizar resultados según variables: muestra una tabla de estadísticos separada por cada variable.
Suprimir tablas con más de n categorías. Esta opción elimina de la salida las distribuciones de más de n valores o categorías. Por defecto es diez peor puede elegirse cualquier número distinto de uno. Es recomendable utilizarla con variable cuantitativas.
Gráfico de frecuencia ordenada
Gráfico de frecuencia ordenada
por valores ascendentemente
por recuentos ascendentemente
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
Sabiendo que los valores asumidos en la variable de estudio
NIVEL para las gráficas
anteriores son:
¿Cómo se muestran los estadísticos en el Visor de Resultados?
Haciendo uso de las siguientes variables con los datos de la figura:
Realizamos los siguientes ejemplos de análisis descriptivo de frecuencias:
Ejemplo 1: Haciendo un análisis de frecuencia sin estadísticos y sin gráficos para una variable
cualitativa SEXO de una tabla de 10 casos, se obtuvo lo siguiente:
1
2
Habiendo especificado la selección de algunas opciones, el Visor de Resultado ofrece dos tablas: una de los casos válidos y perdidos (1); y la otra con la distribución de frecuencia solicitada (2).
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
Ejemplo 2: Haciendo un análisis de frecuencia con gráficos de barras ordenada por recuentos
ascendentemente con cálculo de algunos estadísticos para una variable cuantitativa discreta NUMERO_CONSULTAS de la tabla de 10 casos, se obtuvo lo siguiente:
Estadísticos NRO_CONSULTAS N
Válidos
10
Perdidos
0
Media
2,40
Moda
1a
Mínimo
1
Máximo
5
a. Existen varias modas. Se mostrará el menor de los valores.
NRO_CONSULTAS Frecuencia Válidos
Porcentaje
Porcentaje
Porcentaje
válido
acumulado
4
1
10,0
10,0
10,0
5
1
10,0
10,0
20,0
3
2
20,0
20,0
40,0
1
3
30,0
30,0
70,0
2
3
30,0
30,0
100,0
10
100,0
100,0
Total
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
Ejemplo 3: Determinar el porcentaje acumulado de casos que no tienen el grado de doctor.
Teniendo en cuenta el tema, para dar respuesta a este enunciado se tiene que efectuar un análisis de frecuencia ordenado por valores ascendentemente:
Obteniendo el siguiente resultado: Estadísticos NIVEL N
Válidos
10
Perdidos
0 NIVEL Frecuencia
Válidos
Porcentaje
Porcentaje
Porcentaje
válido
acumulado
TÉCNICO
2
20,0
20,0
20,0
BACHILLER
3
30,0
30,0
50,0
TITULADO
1
10,0
10,0
60,0
MAGISTER
2
20,0
20,0
80,0
DOCTOR
2
20,0
20,0
100,0
10
100,0
100,0
Total
Respuesta: El 80 % acumulado de valores válidos no tienen el grado de doctor. Nota.- Tener cuidado que el análisis de frecuencia no este ordenado por recuento ascendentemente, porque su resultado sería el siguiente, el cuál es erróneo. NIVEL Frecuencia
Válidos
Porcentaje
Porcentaje
Porcentaje
válido
acumulado
TITULADO
1
10,0
10,0
10,0
TÉCNICO
2
20,0
20,0
30,0
MAGISTER
2
20,0
20,0
50,0
DOCTOR
2
20,0
20,0
70,0
BACHILLER
3
30,0
30,0
100,0
10
100,0
100,0
Total
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
21.3.- DESCRIPTIVOS Descriptivos está diseñado para variables cuantitativas continuas a diferencia del procedimiento Frecuencias que contiene opciones para todo tipo de variables. El procedimiento
Contiene algunos estadísticos descriptivos que también incluye el procedimiento
Frecuencias, pero añade una opción especialmente importante: la posibilidad de obtener puntuaciones típicas.
Para acceder a este procedimiento, y obtener el cuadro de diálogo de la figura 5 se sigue la ruta:
Analizar Estadísticos descriptivos Descriptivos
Las opciones que se presente para este tipo de análisis son:
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
Asumiendo en la tabla anteriormente descrita, algunas opciones descriptivas para una variable cuantitativa continua, se logrará observar en el Visor de Resultados lo siguiente:
Estadísticos descriptivos N
Mínimo
INGRESO
10
N válido (según lista)
10
850,00
Máximo
Suma
Media
Desv. típ.
Varianza
3500,00 19900,00 1990,0000 910,06715 828222,222
21.4.-DIAGRAMAS DE TALLOS Y HOJAS. (STEM AND LEAF) Estos diagramas son procedimientos semi-gráficos cuyo objetivo es presentar los datos cuantitativos de una forma sintética, siempre y cuando, é stos no sean muy numerosos. Para su construcción seguiremos los siguientes pasos. a) Se redondean los datos expresándolos en unidades convenientes b) Se disponen en una tabla. A la izquierda se escribe, para datos con dos cifras, el primer número, que será el tallo, y a la derecha, las unidades que formarán las hojas. Si el número es el 54 se escribe 5/4 c) Cada tallo definirá una clase y sólo se escribe una vez. El número de hojas representa la frecuencia de dicha clase.
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
A continuación vamos a representar un diagrama de tallos y hojas, utilizando como variable las medidas en centímetros de una pieza de metal que se han obtenido a partir de una muestra de todas las piezas fabricadas por una unidad de fabricación: 58,00
65,50
68,00
62,20
72,00
59,00
60,00
75,60
62,50
64,00
Redondeamos los datos a milímetros 58
66
68
62
72
59
60
76
63
64
Representamos el diagrama de tallos y hojas 5
8
9
6
0
2
6
6
8
7
2
7
6
3
4
¿Cómo lo implementamos en SPSS? Redondeamos el peso generando una nueva variable.
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
Desde el software SPSS logramos obtener el recuadro a través de siguiente ventana de
GRÁFICOS, que se encuentra como opción en la ventana de EXPLORAR.
En el visor de resultados se logra mostrar la siguiente tabla con los gráficos de prueba de normalidad:
PESOREDONDEADO Stem-and-Leaf Plot Frequency 2,00 4,00 2,00 1,00 1,00 Stem width: Each leaf:
Stem & 5 6 6 7 7
. . . . .
Leaf 89 0234 68 2 6
10,00 1 case(s)
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
AutoEvaluación:
1) Existen dos procedimientos básicos que permiten describir las propiedades de las distribuciones. Según lo aprendido: ¿Cuáles son estos dos procedimientos? a) ___________________________ b)________________________
2) Teniendo en cuenta el tema desarrollado ¿De qué depende el tipo de análisis descriptivo que se hace a los datos registrados? _____________________________________________________________ 3) ¿Qué tipo de gráficos permite obtener un análisis de frecuencia en SPSS? _____________________________________________________________ ________________________________________________________ ________________________________________________________ 4) Describe el tipo de medidas en las variables aceptables para cada tipo de análisis: Frecuencia: _____________________________________________ Descriptiva:
_____________________________________________
5) Describe los pasos y/o requerimientos para determinar un diagrama de tallos y hojas en SPSS: _____________________________________________________________ _____________________________________________________________ _____________________________________________________________ _____________________________________________________________
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]
Práctica del Tema
1. De una consulta obtenida de 10 encuestados sobre el grado de eficiencia de un administrador se obtuvo lo siguiente: Bueno Regular Pésimo Malo Malo Malo Bueno Bueno Muy Bueno Malo a) Obtenga un gráfico de barras de frecuencias por el grado de eficiencia ordenado por recuento ascendentemente. b) Determina el porcentaje acumulado de casos que precisan que el trabajo del administrador es menos que regular?
2. De los siguientes datos:
a) Obtenga un diagrama de tallos y hojas de las notas solo del sexo masculino.
Referencias de interés sobre el Tema
Desviación Estándar como interpretar su significado http://www.youtube.com/watch?v=CdrhTnzGk9o Diagrama de tallos y hojas http://www.youtube.com/watch?v=I-FEVPbgv70
Comunícate con nosotros. 481614
// PAC Presencial:
[email protected]// PAC Virtual:
[email protected]