2011
Apuntes de clases para guiar el uso del programa SPSS: Prácticas de estadística estadística básica Un primer intento de resumir la estadística básica a modo de apuntes de clases para facilitar a otros interesados en aplicar esta herramienta en investigaciones de biología y ecología. Para utilizar este documento obligatoriamente leer los siguientes modelos estadísticos: t para grupos independientes y relacionados, Anova de una y de dos vías, Correlación de Pearson y Spearman, Regresión, Prueba de Mann-Whitney, Kruskal-Wallis, Friedman y Wilcoxo n. Tener bases en
Apuntes de clases para guiar el uso del programa SPSS: Prácticas de estadística básica
Un primer intento de resumir la estadística básica a modo de apuntes de clases para facilitar a otros interesados en aplicar esta herramienta en investigaciones de biología y ecología. Para utilizar este documento obligatoriamente leer los siguientes modelos estadísticos: t para grupos independientes y relacionados, Anova de una y de dos vías, Correlación de Pearson y Spearman, Regresión,
I. INTRODUCCIÓN La estadística es una herramienta que ayuda describir datos de acuerdo al diseño y principalmente de acuerdo a la pregunta de investigación que corresponde o responde a una necesidad o problema que se requiere solucionarse con fines biológicos, ecológicos y socioeconómicos. Por lo anterior, para ejecutar los modelos estadísticos descriptivos e inferenciales se necesita conocer, como requisito: primero, la pregunta de investigación y segundo el diseño de investigación. Sin conocimiento de estos dos la investigación no tiene validez su aplicación. En este manual se asume que el alumno conoce estos dos requisitos. Por lo tanto se describe a continuación en la forma que se ejecuta el SPSS de manera básica en trabajos de biología y ecología. Principalmente se da a conocer las siguientes partes: introducción al programa SPSS, manejo de base de datos, utilización estadísticos descriptivos, estadísticos inferencias (paramétricos y no paramétricos). También se da a conocer la transformación de datos.
II. INTRODUCCIÓN AL PROGRAMA Opciones para abrir diferentes archivos que corresponden a distintos formatos. Abrir nuevos archivos de Datos, Sintaxis, Resultado y Proceso. Archivo ˃ Nuevo ˃ Datos
Exportar archivos del Excel
Indicar el rango de los datos existentes en Excel
Pantalla que muestra la base de datos extraídos de Excel
Pantalla que muestra las características de diferentes tipos de variables
Pantalla que muestra los resultados de los análisis estadísticos
III. ESTADÍSTICA DESCRIPTIVA a) FRECUENCIAS Analizar ˃ Estadísticos descriptivos ˃ Frecuencias…
La ventana de Frecuencias genera cuatro subventanas: Estadísticos, Gráficos, Formato y Bootstrap. La ventana Estadísticos ofrece cuatro tipos de estadísticos: Valores percentiles, Tendencia central, Dispersión y Distribución. La ventana de Gráficos sólo ofrece Gráficos de barras, Gráficos de barras (tortas) e Histogramas, este último con opción a curva normal, sólo para variables continuas. Ventana principal
Resultados de estadística descriptiva
FRECUENCIAS
Statistics DAP N
Valid Missing
Mean
32,3184 1,05860 33,1000
Std. Error of Mean Median Mode
31,50 14,82033
Std. Dev iation Variance
219,642 ,644
Skewness Std. Error of Skewness
,174 1,342
Kurtosis Std. Error of Kurtosis
,346 88,50
Range Minimum Maximum Sum Percentiles
196 0
6,10 94,60 25 50 75
6334,40 19,7500 33,1000 40,7750
Estadística de tendencia central son Media (Mean), Mediana (Median) y Moda (Mode); de dispersión son desviación estándar (Std. Deviation), varianza (Varience), rango o amplitud (Range), máximo y mínimo; de distribución son curtosis (Kurtosis) y asimétrica (Skewness). Las decisiones de normalidad, con valores de asimetría y curtosis, se realizan con el valor de 1,96. Valores calculados mayores a +1,96 y menores a -1,96 significa que no son normales. Pero los valores calculados que estén entre -1,96 y +1,96 significan que son normales (la muestra).
En los resultados se tiene Frecuencia, Porcentaje de lo que representa la frecuencia y el Porcentaje
b) DESCRIPTIVOS Analizar ˃ Estadísticos descriptivos ˃ Descriptivos…
Ventana principal
c) EXPLORAR Analizar ˃ Estadísticos descriptivos ˃ Explorar…
Explorar abre una ventana, donde se coloca una variable dependiente y en la otra la variable categórica u ordinal.
Ventana principal
La ventana principal da opción a otras subventanas: Estadísticos, Gráficos, Opciones y Bootstrap. También da una opción rápida de salida de resultados: Estadísticos, Gráficos o Ambos anteriores. Por omisión viene señalado en Ambos, como se muestra en el gráfico (Both).
Descriptivos: tiene opción para la
Resultados de estadística descriptiva
EXPLORAR
Guía principal para A,B,C…
A
B
C
d) TABLAS DE CONTINGENCIA (Chi-cuadrado) Pruebas para frecuencias Primero se da peso a las frecuencias: Datos ˃ Segmentar archivo…
Analizar ˃ Estadísticos descriptivos ˃ Tablas de contingencia…
IV. PRUEBAS PARAMÉTRICAS Los modelos deben cumplir con los siguientes puntos principales: los datos deben ser normales, las varianzas en los que se comparan deben ser similares.
a) T PARA MUESTRAS INDEPENDIENTES (t para dos grupos independientes) Analizar ˃ Comparar medias ˃ Prueba T para muestras independientes…
Ventana principal
b) T PARA MUESTRAS RELACIONADAS (t pareada) Analizar ˃ Comparar medias ˃ Prueba T para muestras relacionadas…
Se desplaza una ventana principal.
En esta ventana se puede colocar más de un par de análisis. Ahora con A20022003, pero se puede agregar otro, como B2003-C2004, y sucesivamente.
c) ANOVA DE UNA VÍA (un factor) Analizar ˃ Modelo lineal general ˃ Univariante…
Ventana principal
Post hoc (análisis a posterior)
Cuando existen diferencias entre las medias comparadas, para conocer entre cuales, es necesario recurrir a un análisis a posteriori, para ello existen modelos que asumen varianzas iguales y no. VARIANZAS IGUALES: DMS o LSD, Bonferroni y Sidak están basados en la distribución de T, la primera no controla la tasa del error, la segunda y la tercera controlan (2da conservador y la 3ra menos conservador). Scheffé basado en la distribución de F, solo para pares y es muy conservador. REGWF, en un modelo paso a paso, está basado en distribución de F, más potente que los anteriores, se utiliza cuando las muestras no son iguales, es bien rígido. REGWQ, paso a paso, basado en la distribución de rango estudentizado y para grupos de muestras iguales. SNK, basado en la distribución rango estudentizado. Tukey, equivale a utilizar método Student, método con mayor aceptación. Tukey-b, prueba del rango múltiple, por pasos, basado en la distribución de rango estudentizado. GT2 de Hochberg, similar al Tukey, pero está basado en
Resultados de ANOVA DE UNA VÍA
d) ANOVA DE DOS VÍAS (más de dos factores) Analizar ˃ Modelo lineal general ˃ Univariante…
Esta ventana de dos vías muestra 6 subventanas: modelo personalizado, tendencias, figuras, análisis a posterior, graba residuos y muestra opciones. Con la primera se construye un modelo cuando son completamente aleatorizados, los que se pueden hacer con interacción, con bloques aleatorios, modelos jerárquicos, etc.
Este tipo de análisis es para conocer de la distribución de los residuos, los que deben tener una distribución normal. Entre el pronosticado y el residuo tipificado debe formar una nube de punto en un gráfico.
Del factor que se elija se realiza un análisis asumiendo varianzas iguales o desiguales. Los modelos a posteriori ya fueron explicados en anova de una vía.
e) CORRELACIÓN BIVARIADA Analizar ˃ Correlaciones ˃ Bivariadas…
La ventana muestra un análisis paramétrico (correlación de Pearson) y no paramétrico (correlación de Spearman). La confiabilidad de los resultados se puede obtener con dos o una cola, que depende del objetivo del análisis.
g) REGRESIÓN LINEAL Analizar ˃ Regresión ˃ Lineales…
Esta ventana principal tiene opción para 4 subventanas: Estadísticos, Gráficos, Guardar residuos, Opciones y Bootstrap.
Expone los residuos, en forma de dispersión, saca histograma y su gráfico de normalidad.
Permite grabar los residuos, otros valores para analizar, etc.
V. TRANSFORMACIONES Las variables continuas es mejor analizarlas con las pruebas paramétricas, porque es más precisa en la estimación. Cuando estas variables no tienen normalidad y tampoco entre los comparando tienen unas varianzas similares, se recurre a la transformación para que cumplan los dos requisitos y entre otros, como se muestra en el siguiente cuadro.
Para ejecutar la transformación uno puede orientarse de acuerdo a la distribución que presentan los datos. Las distribuciones comunes se muestran en el si guiente cuadro.
A continuación se muestra cómo se puede transformar los datos en SPSS, para recordar, primero uno debe conocer la distribución y luego el tipo de variable, caso contrario la transformación sería inútil. Transformar ˃ Calcular variable…
VI. PRUEBAS NO PARAMÉTRICAS a) MANN-WHITNEY También: Kolmogorov-Smirnov, Moses, Wald-Wolfowitz. Analizar ˃ Pruebas no paramétricas ˃ Cuadros de diálogo antiguos ˃ 2 muestras independientes…
b) KRUSKAL-WALLIS También: Jonckheere-Terpstra, Mediana. Analizar ˃ Pruebas no paramétricas ˃ Cuadros de diálogo antiguos ˃ K muestras independientes…
c) WILCOXON También: Signo, McNemar, Homogeneidad marginal . Analizar ˃ Pruebas no paramétricas ˃ Cuadros de diálogo antiguos ˃ 2 muestras relacionada s…
d) FRIEDMAN También: Kendall, Cochran. Analizar ˃ Pruebas no paramétricas ˃ Cuadros de diálogo antiguos ˃ K muestras relacionada s…
FORMA DE COLOCAR DATOS EN PLANILLAS ELECTRONICAS PARA ANALIZAR CON DIFERENT ES PRUEBAS UTILIZANDO LOS PROGRAMAS SYSTAT Y JMP P R U E B A S P A R A M E T R I C A S t de
grupos
ANOVA DE 1 VIA
Categoría
Un factor
ANOVA DE 2 VIAS Dos factores
GRUPO$
Noind
GRUPO$
Noind
BLOQUE$
TRATA$
NoInd
F F F F F F F F O O O O O O O
7 6 9 6 6 12 12 15 8 5 3 5 17 4 4
F F F F F F F O O O O O O T T T T T T T
9 9 17 15 12 3 20 15 3 20 18 19 7 4 16 8 8 17 2 19
1 1 1 2 2 2 3 3 3 4 4 4 5 5 5
I II III I II III I II III I II III I II III
82 67 65 77 68 72 62 66 90 87 72 73 82 84 70
Ejecución en SYSStats, t-test, two group
Stats, Analy…(ANOVA), Estimate …
Stats, Gener…(GLM), Estimate …
t Pareada
CORRELACION
REGRESION
2 muestras pareadas
asociación
Predicción
ANTES
LARGO
42 46 44 70 51 47 52 51 63 62 50 53 45 69 49
DESPUES
43 77 85 73 40 74 77 50 70 73 65 49 73 50 61
Stats, t-test, paried
ANCHO
86 89 76 81 65 72 80 84 68 66 80 84 63 78 73
21 20 28 27 28 26 49 49 48 55 34 25 21 21 54
Stats, correla tio ns, simple
Variables= Tipos
indep depen indep depen indep indep depen depen depen depen depen categ interva categ interva categ categ interva interva interva interva interva Cuando los datos no tienen una distribución normal, sus varianzas son heterog eneas, …etc. se recurre a las pruebas no paramétricas que son análogas a las pruebas paramétricas, por debajo de cada prueba se citan:
P R U EB A S Mann Whitney
Kruskal Wallis
NO
Friedman?
DAP
81 76 48 81 60 87 97 91 45 85 58 88 51 60 93
DOSEL
82 98 70 98 87 76 60 80 58 75 83 68 52 58 78
Stats, regression, linear
indep interv
depen interv
P A R A M E T R I C A S Wilcoxon
Spearman
29