Universidad Nacional Autónoma de México Facultad de Estudios Superiores Zaragoza Carrera de Psicología
ETAPA DE FORMACION BASICA GUIA DE ESTUDIOS PARA EXAMEN EXTRAHORDINARIO ESTADISTICA INFERENCIAL TEORIA Y PRÁCTICA MÓDULO Fundamentos Metodológico-Instrumentales UNIDAD DE APRENDIZAJE Estadística Inferencial MODALIDAD Taller Lic. Gerardo Reyes Hernández Prof. Asignatura B definitivo
TEMARIO Tema 1. Conceptos Básicos de Estadística Población Población estadística, en estadística estadística,, también llamada universo o colectivo, es el conjunto de elementos de referencia sobre el que se realizan las observaciones.
Muestra En estadística una muestra estadística (también llamada muestra aleatoria o simplemente muestra) es un subconjunto de casos o individuos de una población estadística. Las muestras se obtienen con la intención de inferir propiedades de la totalidad de la población, para lo cual deben ser representativas de la misma. Para cumplir esta característica la inclusión de sujetos en la muestra debe seguir una técnica de muestreo. En tales casos, puede obtenerse una información similar a la de un estudio exhaustivo con mayor rapidez y menor coste
Variable Una variable es una característica que al ser medida en diferentes individuos es susceptible de adoptar diferentes valores.
Variables cualitativas
Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles como sí y no, hombre y mujer o son politómicas cuando pueden adquirir tres o más valores. Dentro de ellas podemos distinguir:
Variable cualitativa ordinal o variable cuasicuantitativa: La variable
puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado, grave.
Variable cualitativa nominal: En esta variable los valores no pueden ser
sometidos a un criterio de orden como por ejemplo los colores o el lugar de residencia. Variables cuantitativas
Son las variables que se expresan mediante cantidades numéricas. Las variables cuantitativas además pueden ser:
Variable discreta: Es la variable que presenta separaciones o
interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores específicos que la variable pueda asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5).
Variable continua: Es la variable que puede adquirir cualquier valor dentro
de un intervalo especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg, ...) o la altura (1,64 m, 1,65 m, 1,66 m, ...), que solamente está limitado
por la precisión del aparato medidor, en teoría permiten que siempre exista un valor entre dos variables, también puede ser el dinero o un salario dado y se puede identificar las clases de variables (cualitativas y cuantitativas).
las clases de variables se pueden ser cualitativas y cuantitativas
Según la influencia que asignemos a unas variables sobre otras, podrán ser: Variable independiente (VI)
Son las que el investigador escoge para establecer agrupaciones en el estudio, clasificando intrínsecamente a los casos del mismo. Un tipo especial son las variables de control, que modifican al resto de las variables independientes y que de no tenerse en cuenta adecuadamente pueden alterar los resultados por medio de un sesgo. Es aquella característica o propiedad que se supone ser la causa del fenómeno estudiado. En investigación experimental se llama así a la variable que el investigador manipula Variable dependiente (VD) Son las variables de respuesta que se observan en el estudio y que podrían estar influenciadas por los valores de las variables independientes. Hayman (1974 : 69) la define como propiedad o característica que se trata de cambiar mediante la manipulación de la variable independiente. La variable dependiente es el factor que es observado y medido para determinar el efecto de la variable independiente.
Medir El proceso de asignar un valor numérico a una variable se llama medición. Las escalas de medición sirven para ofrecernos información sobre las clasificaciones que podemos hacer con respecto a las variables (discretas o continuas). Cuando se mide una variable el resultado puede aparecer en uno de cuatro diversos tipos de escalas de medición; nominal, ordinal, intervalo y razón.
Niveles de Medición Estadístico Parámetro Tema 2. Muestreo y Tipos de muestra Tema 3. Estadística Inferencial Paramétrica y no Paramétrica Tema 4. Terminología básica en Estadística Inferencial.
Problemas e hipótesis de investigación Hipótesis estadística y prueba de hipótesis Potencia y eficiencia de las pruebas estadísticas Niveles de Significancia Criterios para la aplicación válida de procedimientos paramétricos Niveles de medición y selección de modelos estadísticos Comparación entre Estadística Paramétrica y no Paramétrica Selección apropiada de Pruebas paramétricas o de sus alternativas no paramétricas. Tema 5. Pruebas estadísticas para una muestra
Tema 6. Pruebas estadísticas para dos muestras independientes T de Student para muestras independientes. Mann-Whitney Tema 7. Pruebas para dos muestras relacionadas T de Student para muestras relacionadas Wilcoxon Tema 8. Pruebas estadísticas para más de dos muestras independientes ANOVA unifactorial Kruskal-Wallis Tema 9 Pruebas estadísticas para más de dos muestras relacionadas ANOVA unifactorial Friedman Tema 10 Comparación entre condiciones en ANOVA Prueba Bonferroni Diferencia honestamente significativa de Tukey Tema 11 ANOVA bifactorial para muestras independientes Tema 12 ANOVA bifactorial para muestras relacionadas Tema 13 Relación entre variables Medidas de asociación Regresión Bibliografía 1. Enríquez, E. (2000) Confiabilidad y validez. México: Mecanograma 2. Hernández, R. Fernández, C. y Baptista, M. (2010). Metodología de la investigación. México: Mc Graw Hill. 3. Linás S. H. y Rojas A. C. (2006) Estadística descriptiva y distribuciones de probabilidad. Columbia: Uninorte. 4. Marques D. S., M. J. (2004) Probabilidad y estadística para ciencias químico biológicas. México: UNAM.
5. McGuigan, F. J. (1991) Psicología Experimental. Enfoque metodológico. México: Trillas 6. Pagano, R. (2006) Estadística para las ciencias del comportamiento. México: Thomson 7. Siegel, S. (1991) Estadística no paramétrica . México: Trillas. 8. Siegel, S. y Castellan (1995) Estadística no paramétrica aplicada a las ciencias de la conducta. México: Trillas.
Aplique y justifique la prueba estadística adecuada para resolver los siguientes problemas. 1.- Se desea saber si existe relación entre el número de años de estudio que completo el padre y el número de años de estudio que completo el hijo. ¿Cuál es la relación entre estas dos variables? 1.- Plantee las hipótesis correspondientes 2.- Que concluirá le investigadora al 0.05 y 0,01 de significancia Niño Padre Niño
A 12 12
B 10 8
C 6 6
D 16 11
E 8 10
F 9 8
G 12 11
2.- Supongamos que una persona que investiga el funcionamiento de la memoria realiza un experimento para comprobar la teoría de que la cantidad de exposiciones a una palabra aumenta la probabilidad de que sea recordada. Dos individuos son elegidos al azar para observar una lista de 10 palabras una sola a la vez, otros dos individuos observaron la lista dos veces, y así sucesivamente, hasta llegar a ocho exposiciones de cada palabra, y 10 participantes en total. La tabla muestra los resultados del experimento. ¿Cuál es la relación entre estas dos variables? 1.- Plantee las hipótesis correspondientes 2.- Que concluirá le investigadora al 0.05 y 0,01 de significancia Efecto del número exposiciones en la cantidad de palabras recordadas Participante 1 2 3 4 5 6 7 8 9 10 Cantidad de exposiciones 1 1 2 2 3 3 4 4 5 5 Cantidad de palabras recordadas 4 3 3 5 6 4 4 6 5 7 3.- Se estudiaron los efectos de dos drogas en el tiempo de reacción a cierto estímulo en tres grupos de animales experimentales. Se usó el grupo II como control, mientras que los grupos I y III fueron tratados con las drogas A y B previamente a la aplicación del estímulo, la siguiente Tabla muestra los tiempos de reacción en segundos de 30 animales. Grupo I II III 29 3 24 6 3 17 18 6 3 19 20 7 3 21 24 6 3 26 25 6 35 29 28 39 27 31 4.- Para realizar un experimento 38 31 34 sobre la habituación a las áreas 40 32 30 contaminadas un grupo de psicólogos 23 3 22 ambientales registro la frecuencia 3
respiratoria (respiración por minuto) en 8 animales de laboratorio bajo tres niveles de exposición al monóxido de carbono. Los resultaos fueron los siguientes: Nivel de Exposición Animal Bajo Medio Alto 1 36 43 45 2 33 38 39 3 35 41 33
4 5 6 7 8
39 41 41 44 45
34 28 44 30 31
39 33 26 39 29
5.- Un investigador está interesado en determinar si la dificultad del material de aprendizaje afecta el nivel de ansiedad de los estudiantes universitarios. Una muestra de 12 estudiantes recibe tareas de aprendizaje: las difíciles y las fáciles. Antes de ejecutar cada tarea, se presenta a los estudiantes, se presentan a los estudiantes algunos ejemplos del material que aprenderán. Después se evalúa el nivel de ansiedad antes de cada tarea de aprendizaje. Los datos se exhiben en la siguiente tabla. A mayor puntaje mayor nivel de ansiedad. ANSIEDAD Estudiant e 1 2 3 4 5 6
Tareas difíciles
Tareas fáciles
48 33 46 42 40 27
40 27 34 28 30 24
6.- Se realizo un experimento en el cual 18 niños son seleccionados al azar de entre los niños de un año de edad que viven en una ciudad aledaña. Los 18 niños son después repartidos en dos grupos de nueve niños cada uno. El grupo control recibe la dieta usual baja en proteínas durante tres años, mientras que el grupo experimental se le proporciona una dieta alta en proteínas durante el mismo periodo. Al transcurrir los tres años, cada niño es sometido a una prueba de coeficiente intelectual (CI). Los datos resultantes se presentan a continuación. Puntajes de la prueba de CI Grupo control 102 104 105 107 108 111 113 118 129 Baja proteína Grupo experimental 110 115 117 122 125 130 135 140 Alta proteína
En el momento de iniciar un programa de pérdida de peso, se les solicito a las participantes que identificaran en una lista de alimentos aquellos que contenían un alto nivel de grasas saturadas (es decir, alimentos AGS). Terminando el programa de educación nutricional, se les mostro a los mismos participantes la lista de alimentos de nuevo y se les encargo la misma tarea. ¿Resultó eficaz el programa educativo para incrementar en conocimiento de las participantes con relación a los alimentos AGS? Asume que las varianzas poblacionales son iguales. X= número de alimentos AGS identificados correctamente en la lista (datos Ficticios). Justifica la utilización de la prueba A) Generar las hipótesis correspondientes.
B) ¿Qué concluirían los investigadores al 0.05 y 0.01 de significancia?
Número de alimentos AGS identificados Individuo Antes programa Después programa
del
1 7
2 4
3 8
4 7
5 5
6 2
7 6
8 5
9 7
10 8
11 5
12 4
13 7
14 6
15 8
16 4
17 7
18 6
19 6
20 8
del
11
9
14
12
11
7
15
12
10
13
11
10
13
10
12
8
14
11
10
13
PROBLEMA 2 Se utilizaron tres grupos de animales en un experimento para comparar los tiémpos de respuesta, en segundos, a tres diferentes estímulos. Se obtuvieron los siguientes resultados: ESTIMULO TÁCTIL 16 1 4 VISUAL 6 7 SONORO 8 9
1 3 8 1 0
1 3 4 6
1 2 8 7
1 17 17 2 9 6 8 1 9 1 0 1
17 14 6 1 1
4 9
Justifica la utilización de la prueba A) Generar las hipótesis correspondientes. B) ¿Qué concluirían los investigadores al 0.05 y 0.01 de significancia ? PROBLEMA 3 Un investigador predijo que los participantes recordarían más palabras de un texto sencillo que de un texto complejo. Todos los participantes tuvieron cinco minutos para leer un texto sencillo y un texto complejo y después de 10 minutos se les pidió que indicaran las palabras que recordaban. Para compensar los posibles efectos del orden de exposición a las dos condiciones, la mitad de los participantes leyó primero el texto sencillo y la otra mitad el texto complejo. Los resultados se muestran en la tabla: Participante 1 2 3 4 5 6 7 8 9 10 Condición 1 Texto sencillo 1 5 6 3 9 8 7 5 6 5 0 Condición 2 Texto complejo 2 3 7 4 4 5 2 5 3 4 Justifica la utilización de la prueba A) Generar las hipótesis correspondientes. B) ¿Qué concluirían los investigadores al 0.05 y 0.01 de significancia? PROBLEMA 1
Se condujo una investigación en una Universidad en la que se trataba de estudiar el efecto de cursar materias de alto índice de reprobación sobre el nivel de ansiedad de los alumnos. Los registros mostraban que tanto anatomo-fisiología como estadística eran materias frecuentemente reprobadas por los estudiantes. Por ello, se escogieron tres muestras aleatorias; la primera de alumnos que entre sus materias cursaban estadística, una mas de aquellos estudiantes que cursaban anatomo-fisiología y una tercera de aquellos que cursaban otras materias pero ninguna de las dos mencionadas. A los estudiantes se les aplico una prueba de ansiedad estandarizada, cuyas respuestas se presentan en escala Liker, obteniéndose los resultados de la siguiente tabla: Estadística Anatomo-fisiología Ninguna de las dos 34 43 32 25 51 50 36 55 44 25 45 34 31 57 46 27 59 35 28 64 30 Con base al problema anterior conteste las siguientes preguntas: 1.- ¿Cuál es la VI y cual es la VD? Justifica tu respuesta 2.- ¿Qué diseño experimental se utilizó? Justifica tu respuesta 3.- ¿Qué nivel de medición tiene cada una de las variables? Justifica tu respuesta 4.- ¿Debe utilizarse una prueba estadística paramétrica o no paramétrica? Justifica tu respuesta 5.- Elabore las hipótesis tanto nula como alterna 6.- ¿Qué prueba estadística consideras que sería adecuada aplicar en este caso? Justifica tu respuesta Resuelva el siguiente problema: PROBLEMA 1C Tanto antes como después de ver una película diseñada para reducir los prejuicios contra los grupos minoritarios, se interrogó a 6 estudiantes acerca de sus actitudes hacia las etnias indígenas. Probar la hipótesis de que no hay diferencias entre estos estudiantes antes y
después de ver la película (puntajes más altos indican actitudes más favorables hacia los indígenas. Estudiante 1 2 3 4 5 6
p. Antes 48 56 49 51 55 46
p. Después 36 54 48 53 53 47
A) Genere las hipótesis correspondientes B) ¿Qué concluirá el investigador al 0.05 y 0.01 de significancia
Se predijo una interacción entre la Variable A y la Variable B, en virtud de la cual se memorizarían más palabras cortas a una velocidad de presentación rápida y más palabras largas a una velocidad de presentación lenta. Se asignan cuatro grupos de cuatro participantes distintos a las cuatro combinaciones de las condiciones de la Variable A y la Variable B. Los resultados y las medias se muestran en la siguiente tabla. A1 (palabras cortas) B1 (velocidad alta) B2 (velocidad baja) 9 4 8 3 6 3 7 5 7.5 3.5 Medias
A2 (palabras largas) B1 (velocidad alta) 5 3 3 5 3.75
B2 (velocidad baja) 7 5 6 7 6.25
A) Genere las hipótesis correspondientes B) ¿Qué concluirá el investigador al 0.05 y 0.01 de significancia
Supongamos que un profesor de educación física conduce un experimento para comparar los efectos en el sueño nocturno de varias cantidades de ejercicio y de la hora del día cuando se realiza el ejercicio. El experimento utiliza un diseño factorial de efectos fijos 3 X 2 con grupos independientes. Hay tres niveles de ejercicio (ligero, moderado y pesado) y dos horas del día (mañana y tarde). Treinta y seis estudiantes universitarios en buena condición física son asignados al azar a las seis celdas de manera que hay seis sujetos por celda. Los sujetos que realizan el ejercicio pesado corren tres millas, los sujetos que realizan ejercicio moderado una milla y los sujetos que realizan ligero sólo un curato de milla. El ejercicio matutino se realiza a las7:30, mientras que el ejercicio vespertino se realiza a las 19:00. Cada sujeto se ejercita una vez y se registra el número de horas que duerme cada noche. Los datos se muestran en la siguiente tabla.
Ejercicio Hora del día Mañana
Ligero 6.5
Moderado 7.4
Pesado 8.0
Tarde
7.3 6.6 7.4 7.2 6.8
6.8 6.7 7.3 7.6 7.4
7.7 7.1 7.6 6.6 7.2
7.1 7.9 8.2 7.7 7.5 7.6
7.4 8.1 8.2 8.0 7.6 8.0
8.2 8.5 9.5 8.7 9.6 9.4
A) Genere las hipótesis correspondientes B) ¿Qué concluirá el profesor al 0.05 y 0.01 de significancia