Guía SPSS v19 Apuntes de clases

2011

Apuntes de clases para guiar el uso del programa SPSS: Prácticas de estadística estadística básica Un primer intento de resumir la estadística básica a modo de apuntes de clases para facilitar a otros interesados en aplicar esta herramienta en investigaciones de biología y ecología. Para utilizar este documento obligatoriamente leer los siguientes modelos estadísticos: t para grupos independientes y relacionados, Anova de una y de dos vías, Correlación de Pearson y Spearman, Regresión, Prueba de Mann-Whitney, Kruskal-Wallis, Friedman y Wilcoxo n. Tener bases en

Apuntes de clases para guiar el uso del programa SPSS: Prácticas de estadística básica

Un primer intento de resumir la estadística básica a modo de apuntes de clases para facilitar a otros interesados en aplicar esta herramienta en investigaciones de biología y ecología. Para utilizar este documento obligatoriamente leer los siguientes modelos estadísticos: t para grupos independientes y relacionados, Anova de una y de dos vías, Correlación de Pearson y Spearman, Regresión,

I. INTRODUCCIÓN La estadística es una herramienta que ayuda describir datos de acuerdo al diseño y principalmente de acuerdo a la pregunta de investigación que corresponde o responde a una necesidad o problema que se requiere solucionarse con fines biológicos, ecológicos y socioeconómicos. Por lo anterior, para ejecutar los modelos estadísticos descriptivos e inferenciales se necesita conocer, como requisito: primero, la pregunta de investigación y segundo el diseño de investigación. Sin conocimiento de estos dos la investigación no tiene validez su aplicación. En este manual se asume que el alumno conoce estos dos requisitos. Por lo tanto se describe a continuación en la forma que se ejecuta el SPSS de manera básica en trabajos de biología y ecología. Principalmente se da a conocer las siguientes partes: introducción al programa SPSS, manejo de base de datos, utilización estadísticos descriptivos, estadísticos inferencias (paramétricos y no paramétricos). También se da a conocer la transformación de datos.

II. INTRODUCCIÓN AL PROGRAMA Opciones para abrir diferentes archivos que corresponden a distintos formatos. Abrir nuevos archivos de Datos, Sintaxis, Resultado y Proceso. Archivo ˃ Nuevo ˃ Datos

Exportar archivos del Excel

Indicar el rango de los datos existentes en Excel

Pantalla que muestra la base de datos extraídos de Excel

Pantalla que muestra las características de diferentes tipos de variables

Pantalla que muestra los resultados de los análisis estadísticos

III. ESTADÍSTICA DESCRIPTIVA a) FRECUENCIAS Analizar ˃ Estadísticos descriptivos ˃ Frecuencias…

La ventana de Frecuencias genera cuatro subventanas: Estadísticos, Gráficos, Formato y Bootstrap. La ventana Estadísticos ofrece cuatro tipos de estadísticos: Valores percentiles, Tendencia central, Dispersión y Distribución. La ventana de Gráficos sólo ofrece Gráficos de barras, Gráficos de barras (tortas) e Histogramas, este último con opción a curva normal, sólo para variables continuas. Ventana principal

Resultados de estadística descriptiva

FRECUENCIAS

Statistics DAP N

Valid Missing

Mean

32,3184 1,05860 33,1000

Std. Error of Mean Median Mode

31,50 14,82033

Std. Dev iation Variance

219,642 ,644

Skewness Std. Error of Skewness

,174 1,342

Kurtosis Std. Error of Kurtosis

,346 88,50

Range Minimum Maximum Sum Percentiles

196 0

6,10 94,60 25 50 75

6334,40 19,7500 33,1000 40,7750

Estadística de tendencia central son Media (Mean), Mediana (Median) y Moda (Mode); de dispersión son desviación estándar (Std. Deviation), varianza (Varience), rango o amplitud (Range), máximo y mínimo; de distribución son curtosis (Kurtosis) y asimétrica (Skewness). Las decisiones de normalidad, con valores de asimetría y curtosis, se realizan con el valor de 1,96. Valores calculados mayores a +1,96 y menores a -1,96 significa que no son normales. Pero los valores calculados que estén entre -1,96 y +1,96 significan que son normales (la muestra).

En los resultados se tiene Frecuencia, Porcentaje de lo que representa la frecuencia y el Porcentaje

b) DESCRIPTIVOS Analizar ˃ Estadísticos descriptivos ˃ Descriptivos…

Ventana principal

c) EXPLORAR Analizar ˃ Estadísticos descriptivos ˃ Explorar…

Explorar abre una ventana, donde se coloca una variable dependiente y en la otra la variable categórica u ordinal.

Ventana principal

La ventana principal da opción a otras subventanas: Estadísticos, Gráficos, Opciones y Bootstrap. También da una opción rápida de salida de resultados: Estadísticos, Gráficos o Ambos anteriores. Por omisión viene señalado en Ambos, como se muestra en el gráfico (Both).

Descriptivos: tiene opción para la

Resultados de estadística descriptiva

EXPLORAR

Guía principal para A,B,C…

A

B

C

d) TABLAS DE CONTINGENCIA (Chi-cuadrado) Pruebas para frecuencias Primero se da peso a las frecuencias: Datos ˃ Segmentar archivo…

Analizar ˃ Estadísticos descriptivos ˃ Tablas de contingencia…

IV. PRUEBAS PARAMÉTRICAS Los modelos deben cumplir con los siguientes puntos principales: los datos deben ser normales, las varianzas en los que se comparan deben ser similares.

a) T PARA MUESTRAS INDEPENDIENTES (t para dos grupos independientes) Analizar ˃ Comparar medias ˃ Prueba T para muestras independientes…

Ventana principal

b) T PARA MUESTRAS RELACIONADAS (t pareada) Analizar ˃ Comparar medias ˃ Prueba T para muestras relacionadas…

Se desplaza una ventana principal.

En esta ventana se puede colocar más de un par de análisis. Ahora con A20022003, pero se puede agregar otro, como B2003-C2004, y sucesivamente.

c) ANOVA DE UNA VÍA (un factor) Analizar ˃ Modelo lineal general ˃ Univariante…

Ventana principal

Post hoc (análisis a posterior)

Cuando existen diferencias entre las medias comparadas, para conocer entre cuales, es necesario recurrir a un análisis a posteriori, para ello existen modelos que asumen varianzas iguales y no. VARIANZAS IGUALES: DMS o LSD, Bonferroni y Sidak están basados en la distribución de T, la primera no controla la tasa del error, la segunda y la tercera controlan (2da conservador y la 3ra menos conservador). Scheffé basado en la distribución de F, solo para pares y es muy conservador. REGWF, en un modelo paso a paso, está basado en distribución de F, más potente que los anteriores, se utiliza cuando las muestras no son iguales, es bien rígido. REGWQ, paso a paso, basado en la distribución de rango estudentizado y para grupos de muestras iguales. SNK, basado en la distribución rango estudentizado. Tukey, equivale a utilizar método Student, método con mayor aceptación. Tukey-b, prueba del rango múltiple, por pasos, basado en la distribución de rango estudentizado. GT2 de Hochberg, similar al Tukey, pero está basado en

Resultados de ANOVA DE UNA VÍA

d) ANOVA DE DOS VÍAS (más de dos factores) Analizar ˃ Modelo lineal general ˃ Univariante…

Esta ventana de dos vías muestra 6 subventanas: modelo personalizado, tendencias, figuras, análisis a posterior, graba residuos y muestra opciones. Con la primera se construye un modelo cuando son completamente aleatorizados, los que se pueden hacer con interacción, con bloques aleatorios, modelos jerárquicos, etc.

Este tipo de análisis es para conocer de la distribución de los residuos, los que deben tener una distribución normal. Entre el pronosticado y el residuo tipificado debe formar una nube de punto en un gráfico.

Del factor que se elija se realiza un análisis asumiendo varianzas iguales o desiguales. Los modelos a posteriori ya fueron explicados en anova de una vía.

e) CORRELACIÓN BIVARIADA Analizar ˃ Correlaciones ˃ Bivariadas…

La ventana muestra un análisis paramétrico (correlación de Pearson) y no paramétrico (correlación de Spearman). La confiabilidad de los resultados se puede obtener con dos o una cola, que depende del objetivo del análisis.

g) REGRESIÓN LINEAL Analizar ˃ Regresión ˃ Lineales…

Esta ventana principal tiene opción para 4 subventanas: Estadísticos, Gráficos, Guardar residuos, Opciones y Bootstrap.

Expone los residuos, en forma de dispersión, saca histograma y su gráfico de normalidad.

Permite grabar los residuos, otros valores para analizar, etc.

V. TRANSFORMACIONES Las variables continuas es mejor analizarlas con las pruebas paramétricas, porque es más precisa en la estimación. Cuando estas variables no tienen normalidad y tampoco entre los comparando tienen unas varianzas similares, se recurre a la transformación para que cumplan los dos requisitos y entre otros, como se muestra en el siguiente cuadro.

Para ejecutar la transformación uno puede orientarse de acuerdo a la distribución que presentan los datos. Las distribuciones comunes se muestran en el si guiente cuadro.

A continuación se muestra cómo se puede transformar los datos en SPSS, para recordar, primero uno debe conocer la distribución y luego el tipo de variable, caso contrario la transformación sería inútil. Transformar ˃ Calcular variable…

VI. PRUEBAS NO PARAMÉTRICAS a) MANN-WHITNEY También: Kolmogorov-Smirnov, Moses, Wald-Wolfowitz. Analizar ˃ Pruebas no paramétricas ˃ Cuadros de diálogo antiguos ˃ 2 muestras independientes…

b) KRUSKAL-WALLIS También: Jonckheere-Terpstra, Mediana. Analizar ˃ Pruebas no paramétricas ˃ Cuadros de diálogo antiguos ˃ K muestras independientes…

c) WILCOXON También: Signo, McNemar, Homogeneidad marginal . Analizar ˃ Pruebas no paramétricas ˃ Cuadros de diálogo antiguos ˃ 2 muestras relacionada s…

d) FRIEDMAN También: Kendall, Cochran. Analizar ˃ Pruebas no paramétricas ˃ Cuadros de diálogo antiguos ˃ K muestras relacionada s…

FORMA DE COLOCAR DATOS EN PLANILLAS ELECTRONICAS PARA ANALIZAR CON DIFERENT ES PRUEBAS UTILIZANDO LOS PROGRAMAS SYSTAT Y JMP P R U E B A S P A R A M E T R I C A S t de

grupos

ANOVA DE 1 VIA

Categoría

Un factor

ANOVA DE 2 VIAS Dos factores

GRUPO$

Noind

GRUPO$

Noind

BLOQUE$

TRATA$

NoInd

F F F F F F F F O O O O O O O

7 6 9 6 6 12 12 15 8 5 3 5 17 4 4

F F F F F F F O O O O O O T T T T T T T

9 9 17 15 12 3 20 15 3 20 18 19 7 4 16 8 8 17 2 19

1 1 1 2 2 2 3 3 3 4 4 4 5 5 5

I II III I II III I II III I II III I II III

82 67 65 77 68 72 62 66 90 87 72 73 82 84 70

Ejecución en SYSStats, t-test, two group

Stats, Analy…(ANOVA), Estimate …

Stats, Gener…(GLM), Estimate …

t Pareada

CORRELACION

REGRESION

2 muestras pareadas

asociación

Predicción

ANTES

LARGO

42 46 44 70 51 47 52 51 63 62 50 53 45 69 49

DESPUES

43 77 85 73 40 74 77 50 70 73 65 49 73 50 61

Stats, t-test, paried

ANCHO

86 89 76 81 65 72 80 84 68 66 80 84 63 78 73

21 20 28 27 28 26 49 49 48 55 34 25 21 21 54

Stats, correla tio ns, simple

Variables= Tipos

indep depen indep depen indep indep depen depen depen depen depen categ interva categ interva categ categ interva interva interva interva interva Cuando los datos no tienen una distribución normal, sus varianzas son heterog eneas, …etc. se recurre a las pruebas no paramétricas que son análogas a las pruebas paramétricas, por debajo de cada prueba se citan:

P R U EB A S Mann Whitney

Kruskal Wallis

NO

Friedman?

DAP

81 76 48 81 60 87 97 91 45 85 58 88 51 60 93

DOSEL

82 98 70 98 87 76 60 80 58 75 83 68 52 58 78

Stats, regression, linear

indep interv

depen interv

P A R A M E T R I C A S Wilcoxon

Spearman

29

Guía SPSS v19 Apuntes de clases

Recommend Documents