Psicología experimental Cómo hacer experimentos en psicología Séptima edición
David W. Martin Universidad Estatal de Carolina del Norte
Traducción
Javier Dávila
Revisión técnica
Dra. María Elena Ortiz Salinas Facultad de Psicología, UNAM
ERRNVPHGLFRVRUJ Australia • Brasil • Corea • España • Estados Unidos • Japón • México • Reino Unido • Singapur
00Martin(i-xii)preliminares.inddi i
12/5/08 14:47:44
Psicología experimental. Cómo hacer experimentos en psicología, 7a. edición David W. Martin Presidente de Cengage Learning Latinoamérica: Javier Arellano Gutiérrez Director General México y Centroamérica: Héctor Enrique Galindo Iturribarría Director Editorial Latinoamérica: José Tomás Pérez Bonilla Editora: Rocío Cabañas Chávez Director de producción: Raúl D. Zendejas Espejel Editor de producción: Timoteo Eliosa García Diseño de portada: Daniel Moreno Composición tipográfica: José Jaime Gutiérrez Aceves
© D.R. 2008 por Cengage Learning Editores, S. A. de C. V., una Compañía de Cengage Learning, Inc. Corporativo Santa Fe Av. Santa Fe, núm. 505, piso 12 Col. Cruz Manca, Santa Fe C.P. 05349, México, D.F. Cengage Learning™ es una marca registrada usada bajo permiso. DERECHOS RESERVADOS. Ninguna parte de este trabajo amparado por la Ley Federal del Derecho de Autor, podrá ser reproducida, transmitida, almacenada o utilizada en cualquier forma o por cualquier medio, ya sea gráfico, electrónico o mecánico, incluyendo, pero sin limitarse a lo siguiente: fotocopiado, reproducción, escaneo, digitalización, grabación en audio, distribución en Internet, distribución en redes de información o almacenamiento y recopilación en sistemas de información a excepción de lo permitido en el Capítulo III, Artículo 27 de la Ley Federal del Derecho de Autor, sin el consentimiento por escrito de la Editorial. Traducido del libro: Doing Psychology Experiments, 7th ed. Publicado en inglés por Thomson/Wadsworth © 2008 ISBN-13: 978-0-495-11577-9 ISBN-10: 0-495-11577-0 Datos para catalogación bibliográfica Martin, David W.: Psicología experimental. Cómo hacer experimentos en psicología, 7a. edición ISBN-13: 978-607-519-029-7
Visite nuestro sitio en: http://latinoamerica.cengage.com
Impreso en México 1 2 3 4 5 6 7 11 10 09 08
00Martin(i-xii)preliminares.inddii ii
12/5/08 14:47:46
Este libro está dedicado a: Mi padre, Daniel W. Martin, finado, quien me enseñó el pensamiento lógico. Mi profesora de preparatoria, Doris Mitchell, quien me mostró que los profesores sí se interesan. Mi profesor de licenciatura, Harve E. Rawson, quien me introdujo en la psicología, Mi profesor de maestría George E. Briggs, finado, quien demostró el rigor experimental. Todos mis estudiantes, de quienes continuamente aprendo a enseñar.
00Martin(i-xii)preliminares.inddiii iii
12/5/08 14:47:46
00Martin(i-xii)preliminares.inddiv iv
12/5/08 14:47:46
CONTENIDO
ix
PREFACIO UNO
Cómo hacer observaciones ordenadas
1
La psicología como ciencia 3 Diseños cuantitativos 5 Diseños cualitativos 14 Diseños cuantitativos o cualitativos 19 Uso de los métodos en combinación 20 Resumen 22 DOS
Cómo hacer experimentos Variables 25 Amenazas a la validez interna 32 Resumen del método experimental Resumen 41
25
38
TRES
Cómo tener una idea para experimentar Temor a las ideas de experimentos 43 Observación 46 Observación vicaria 51 Amplíe su propia investigación 53 Cómo sacar ideas de las teorías 53 Importancia de la investigación psicológica Resumen 66
42
65
v
00Martin(i-xii)preliminares.inddv v
12/5/08 14:47:46
vi
Contenido
CUATRO
Cómo ser justo con los participantes Tratar a los participantes humanos con justicia El trato correcto a los animales 87 Resumen 93
68 69
CINCO
Cómo ser honesto con la ciencia
95
Trucos sucios 96 Trucos dudosos 104 Trucos limpios 108 Resumen 110 SEIS
Cómo averiguar qué se ha hecho ¿Por qué revisar la bibliografía? La vigencia de las fuentes 113 Fuentes formales 115 Fuentes informales 127 Resumen 129
111
111
SIETE
Cómo decidir qué variables manipular y medir
131
Elección de una variable independiente 131 Elección de una variable dependiente 136 Resumen 147 OCHO
Diseños entre sujetos e intrasujeto
148
Experimentos entre sujetos 150 Experimentos intrasujeto 151 Igualación 167 Resumen 170
00Martin(i-xii)preliminares.inddvi vi
12/5/08 14:47:47
Contenido
vii
NUEVE
Cómo planear experimentos de una sola variable, de variables múltiples y de series convergentes 171 Experimentos de una sola variable 171 Diseños factoriales 179 Diseños de series convergentes 185 Resumen 191 DIEZ
Cómo diseñar investigación que no es experimental
193
Los cuasiexperimentos (y diseños no experimentales) 193 Diseños de sujeto único y de línea base con N pequeña 204 Investigación con encuestas 212 Resumen 224
ONCE
Cómo saber cuándo está listo para empezar
227
La sociedad de los buenos modales 228 Preguntas para antes de empezar 229 Resumen 239
DOCE
Cómo interpretar los resultados experimentales Gráfica de las distribuciones de frecuencia 241 Estadística para describir distribuciones 244 Gráfica de relaciones entre variables 247 Describir la fortaleza de una relación 251 Interpretación de los resultados a partir de experimentos factoriales Estadística inferencial 257 Metaanálisis 263 Interpretación de resultados por computadora 264 Resumen 265
00Martin(i-xii)preliminares.inddvii vii
240
253
12/5/08 14:47:47
viii
Contenido
TRECE
Cómo informar los resultados experimentales Cómo difiere el estilo de la APA de los demás Partes de un informe 273 Cuidado de prejuicios lingüísticos 282 Estilo de escritura 283 La lista de los 10 principales 285 Muestra de un informe 286 Presentaciones en congresos 300 Resumen 306 EPÍLOGO
268
270
308
APÉNDICE A
Cómo hacer la estadística
309
APÉNDICE B
Tablas estadísticas
325
APÉNDICE C
Tabla de números aleatorios GLOSARIO
339
BIBLIOGRAFÍA ÍNDICE
337
351
359
00Martin(i-xii)preliminares.inddviii viii
12/5/08 14:47:47
PREFACIO
Psicología experimental. Cómo hacer experimentos en psicología ha estado disponible desde hace 30 años y todavía parece cumplir su función original: enseñar a los estudiantes con poco o ningún conocimiento sobre la materia a realizar experimentos simples en psicología. A lo largo de las siete ediciones del libro he tratado de mantener un estilo informal y amigable. Aunque los resultados científicos suelen presentarse en un estilo objetivo e impersonal, creo que la experimentación es una experiencia altamente personal. El experimentador revisa la bibliografía y se forma un punto de vista del cuerpo de conocimiento; crea las teorías y las hipótesis que debe someter a prueba. También decide cuáles variables manipular y cuáles medir. Además, interpreta los resultados, determina el avance en el conocimiento y se involucra personalmente en el proceso de la experimentación. Asimismo, desde mi punto de vista, la mejor manera de enseñar a nuevos experimentadores este proceso es a través de un libro personal. Se ha hecho cierta investigación sobre la evaluación de las preferencias y el aprendizaje de los estudiantes que utilizan libros escritos de manera personalizada. Por ejemplo, Paxton (1997) encontró que los estudiantes que leían un texto con un “autor visible” (uno que escribiera en primera persona que revelara las opiniones personales y el yo) entablaban conversaciones mentales con él, lo que llevaba a una relación más cercana con la información contenida en el texto. Lorin Sheppard (2001), una estudiante de la Universidad Estatal de Michigan, ha estado estudiando el recurso del humor en los textos tomando material de este libro y comparándolo con una versión correspondiente sometida a una “humorectomía”, para usar su término, es decir, una a la que se le quitaron las referencias humorísticas (comunicación personal, 27 de abril de 2001). Ella descubrió que los estudiantes no sólo informaron que los capítulos humorísticos eran más interesantes e informativos, sino que también recordaban más conceptos de la versión humorística durante una prueba demorada de recuerdo. Me satisface que apoyen mi intuición acerca de que tanto el humor como el estilo de escritura personal son pedagógicamente útiles. Ahora comentaremos acerca de lo que se persigue en la presente obra y lo que no. El libro proporciona suficiente información de modo que un estudiante sin antecedentes en experimentación será capaz de diseñar, ejecutar, interpretar e informar acerca de experimentos simples de psicología. Aunque se le ha utilizado con más frecuencia en cursos de licenciatura sobre métodos de experimentación, también ha sido texto en cursos de métodos de investigación. En algunas universidades lo utilizan para la parte de laboratorio de los cursos de introducción a la psicología. También se le ha empleado junto con un libro de estadística o un libro de contenido específico para cursos experimentales con esa orientación. Con freix
00Martin(i-xii)preliminares.inddix ix
12/5/08 14:47:47
x
Prefacio
cuencia ha sido adoptado para cursos de licenciatura (que van desde comportamiento anormal hasta psicología del consumidor) en los que el profesor requiere que se lleven a cabo experimentos y los estudiantes tienen poco conocimiento sobre experimentación. He platicado con muchos usuarios, tanto profesores como alumnos, y me han dicho que el libro puede emplearse de manera exitosa como texto y como suplemento. De hecho, en mi curso de métodos de experimentación, asigno los capítulos antes de cada clase, aplico un examen rápido del banco de pruebas disponibles con el libro, para alentar a los estudiantes a que lean el material antes, y luego dedico el tiempo de clase a aclarar los puntos que sean necesarios, pero principalmente a analizar las propuestas experimentales y los problemas. El libro permite nivelar a un conjunto diverso de estudiantes de manera que el tiempo de la clase se puede utilizar para una interacción más creativa. Aunque el libro suele ser texto básico de varias materias y puede parecer físicamente pequeño en comparación con otros en el mercado, analiza los principales conceptos de los métodos de experimentación. He tratado de proporcionar una cobertura exhaustiva del área; hay investigación al respecto que indica que el intento ha sido exitoso.* Se les pidió a varios autores de diversos textos de muchas áreas de la psicología que calificaran la importancia de los términos y conceptos de sus campos. De los 100 términos más importantes en el área de métodos/estadística, 33 enfatizaban la estadística o las pruebas psicométricas. De los 67 restantes que enfatizaban los métodos, este libro analiza todos menos seis. Cuatro de esos términos se analizan a nivel conceptual pero utilizando la terminología alternativa. Sólo dos términos no están representados en el libro. Creo que esta evidencia confirma la afirmación acerca de que el libro proporciona una cobertura exhaustiva de los métodos experimentales. Este libro no proporciona a los estudiantes contenido vasto ni presenta hallazgos actuales en las diversas áreas de la psicología experimental. Muchos de los ejemplos que utilizo son inventados; ilustran los métodos que se analizan, pero no son reales y de hecho no les darán a los estudiantes una cobertura representativa del contenido de la psicología experimental. Sin embargo, los estudiantes deberían poder acercarse a los temas conforme realizan búsquedas bibliográficas, como se describe en el capítulo 6. El libro tampoco enseña mucho acerca de los vericuetos del diseño experimental complejo ni del análisis estadístico. Traté de mantenerlo lo más sencillo posible. Si bien analizo el fundamento de las estadísticas descriptivas e inferenciales, las operaciones estadísticas reales presentadas en el apéndice A se presentan como recetas de libro de cocina. La séptima edición tiene varios cambios, algunos pequeños como las nuevas citas al inicio de los capítulos, correcciones de algunos errores y las caricaturas. Cambié algunos ejemplos inventados sobre los que varios usuarios objetaron, debido a que entran en conflicto con la información real. En el capítulo 3 presento una breve discusión sobre la diferencia entre las teorías que responden a una pregunta inmediata versus aquellas que responden a una pregunta primordial. En el capítulo 4, al analizar el uso del término participantes en lugar de sujetos, agregué algunos de los puntos de vista en desacuerdo. También actualicé la * Boneau, C. A. (1990). Psychological literacy: A first approximation. American Psychologist, 45, 891-900.
00Martin(i-xii)preliminares.inddx x
12/5/08 14:47:47
Prefacio
xi
sección sobre ética relacionada con los animales. En el capítulo 5 amplié el análisis sobre el plagio al incluir la Internet y citar algunos ejemplos específicos de violaciones. También incorporé la última versión del Principios éticos de los psicólogos y el Código de conducta de la APA (APA Ethical Principles of Psychologists and Code of Conduct) en su relación con la investigación. En el capítulo 6 actualicé la sección sobre la realización de búsquedas electrónicas incluyendo información adicional sobre PsycINFO y PsyARTICLES. Al analizar la lógica de la estadística inferencial en el capítulo 12, incluí más información sobre la prueba de hipótesis nula, errores tipo I y tipo II y la determinación de la potencia de las pruebas estadísticas. En este capítulo también agregué un breve análisis sobre las interacciones de tres vías. En el capítulo 13 actualicé la sección sobre hacer presentaciones en congresos debido a que casi todas se realizan en computadora. Varios revisores sugirieron que incluyera ejemplos de la forma apropiada para darles formato a los resultados estadísticos dentro del texto de un manuscrito, así que los incluí después de los ejemplos en el apéndice A. Asimismo, el banco de pruebas para los profesores fue ampliado y actualizado para esta edición. Además, se pueden encontrar nuevos sitios Web (en inglés) para los profesores y alumnos en http://www.thomsonedu.com/psychology/martin. Tenga en cuenta que las páginas electrónicas son dinámicas y pueden sufrir modificaciones, restricciones o ser eliminadas sin previo aviso. En la página www.cengage.com.mx, encontrará el glosario del libro. Usuario: DWMartin, clave: Experimentos. Al realizar los cambios traté de mantener el libro lo más breve posible cubriendo los temas necesarios. De hecho, el libro tiene menos páginas que la edición anterior. No quiero que sea demasiado imponente para los estudiantes ni demasiado costoso. Para aquellos que han utilizado las ediciones anteriores, espero que les gusten los cambios. Para los nuevos, espero que les agrade el libro. Agradezco a la Universidad Estatal de Carolina del Norte el haber proporcionado el tiempo y los recursos para que yo escribiera. Además, me gustaría agradecer a las siguientes personas de Wadsworth: Marcus Boggs, director; Karol Jurado, gerente de proyecto del contenido; Gina Kessler, editora asistente; Christina Ganim, asistente editorial; Lauren Keyes, gerente de proyecto de tecnología; Karin Sandberg, gerente de mercadotecnia, y Natasha Coats, asistente de mercadotecnia. También quiero agradecer a los revisores del manuscrito de esta edición por sus comentarios, entre ellos: la Dra. Jennifer Bonds-Raacke, de la Briar Cliff University; el Dr. Daniel Cerutti, de la Duke University; la Dra. Joy Drinnon, del Milligan College; la Dra. Julie Evey, de la University of Southern Indiana, y el Dr. William Hardy, del Sierra College. Por último, deseo agradecer a quienes han sido mis alumnos, que con su desempeño me han hecho saber si he tenido éxito (o si he fracasado), y a los muchos estudiantes de Estados Unidos que me han reconocido en reuniones y me han comunicado que les gusta el libro. David W. Martin
[email protected]
00Martin(i-xii)preliminares.inddxi xi
12/5/08 14:47:48
SEMBLANZA DEL AUTOR
David W. Martin es profesor y jefe del Departamento de Psicología de la Universidad Estatal de Carolina del Norte. Fue profesor y jefe de Departamento en la Universidad Estatal de Nuevo México. Estudió las carreras de psicología y física en la Escuela de Hanover. Tiene una maestría y un doctorado por la Universidad Estatal de Ohio, donde también se graduó en Ingeniería en Psicología. Sus intereses en la enseñanza incluyen métodos experimentales, introducción a la psicología, desempeño humano y atención. Ha obtenido premios a la enseñanza en ambas instituciones. El Dr. Martin ha publicado trabajos en diversas revistas de investigación en las áreas de atención, toma de decisiones y memoria. Es miembro de la Asociación Estadounidense de Psicología (American Psychological Association), Sociedad Estadounidense de Psicología (American Psychological Society), Sociedad de Factores Humanos y Ergonomía (Human Factors and Ergonomics Society) y de la Sociedad Psiconómica (Psychonomic Society). También fue presidente de la Asociación de Psicología de las Montañas Rocallosas (Rocky Mountain Psychological Association). En sus horas libres disfruta de hacer ejercicio, bucear, tocar la trompeta y cantar, así como divertirse con sus dos hijos. Durante 12 años ha corrido autos en pistas de tierra y es conocido como el “peligroso David, el profesor corredor”.
xii
00Martin(i-xii)preliminares.inddxii xii
12/5/08 14:47:48
1
Cómo hacer observaciones ordenadas La observación directa, intuitiva, acompañada de interrogantes, imaginación o intervención creativa, es una técnica precientífica engañosa y limitada. C. F. MONTE (1975)
La naturaleza de la vida es tal, que cuando uno la disecciona, deja de ser vida. El comportamiento, al ser un resultado de la vida, es todavía más elusivo. K. Z. LORENZ (1962)
Necesariamente, la tenacidad de los sujetos animados trae un grado notable de complejidad experimental en las ciencias del comportamiento. S. N. ROSCOE (1980)
E
scribí este libro para ayudarle a realizar experimentos científicos de psicología. Aparte del hecho de que este aprendizaje es obligatorio en la mayoría de las escuelas de psicología, ¿para qué necesita saber cómo llevar a cabo un experimento psicológico? Una razón podría ser que quiere convertirse en psicólogo, ese científico que estudia el comportamiento humano y, en ocasiones, la conducta animal. El método experimental es una de las principales herramientas de investigación para reunir datos y acumular los conocimientos científicos de la psicología. En este libro analizaré de manera breve otras herramientas utilizadas en la psicología, aunque mi principal enfoque estará en cómo realizar experimentos. Incluso si no planea estudiar psicología, aprender sobre la experimentación psicológica puede serle útil para convertirse en una persona culta y le dará habilidades útiles que pueden extenderse a otras profesiones. Por ejemplo, supongamos que se dedica a la banca y que trabaja con ahínco para convertirse en vicepresidente. Obviamente, parte de lo que aprendió en sus cursos de psicología podrá ayudarle a prosperar, ya que sabrá algo acerca de las relaciones humanas. Lo que sepa de experimentación también tiene su provecho. Supongamos que su jefe lo llama y le dice: “Como sabe, acabamos de instalar los cajeros automáticos en nuestros bancos y hemos gastado mucho dinero en estas máquinas de última generación, pero por alguna razón a los clientes no les gusta usarlas. Quiero que me diga por qué y que haga los cambios necesarios para que las utilicen.” 1
01Martin001-024.indd 1
8/5/08 17:07:21
2
Capítulo uno
Conforme lea este libro, verá que llevar a cabo tal tarea, aunque no es un experimento formal, requiere las habilidades necesarias para realizar un experimento en psicología. Primero, debe plantear varias hipótesis sobre por qué los clientes no usan los cajeros automáticos. ¿Se sienten despersonalizados al relacionarse con una máquina? ¿Se sienten intimidados? ¿Saben cómo utilizar las máquinas? ¿Se sienten menos seguros de manejar el dinero de un cajero automático porque no tienen la seguridad que les da la presencia de otra persona? Como segundo paso, debe recolectar datos para reducir el número de hipótesis posibles, quizá mediante entrevistas o con un cuestionario. Luego, probablemente lleve a cabo una manipulación para ver si puede cambiar el comportamiento de los clientes: quizás ofrezca un programa de educación, si el problema es el conocimiento; premios, si lo que falta es motivación, o tal vez aumente la privacidad, si el problema es la seguridad. Por último, le convendría medir el comportamiento de los clientes para ver si cambia después de la manipulación y para determinar si tal cambio es significativo. Aunque su jefe no le pidió que realizara un experimento psicológico, usted debe llevar a cabo la mayor parte de los pasos que se requieren en uno. En casi todos los trabajos hay que solucionar problemas de personas, y las habilidades que aprenderá en este libro lo harán mejor para resolver ese tipo de problemas. Si desea convertirse en psicólogo, las razones para aprender investigación y experimentación son obvias. De hecho, si quiere ser un psicólogo experimental, hacer experimentos será su actividad principal y utilizará repetidamente las técnicas que se enseñan aquí. Incluso si quiere ser psicólogo clínico, es necesario que por lo menos sepa cómo se realiza una investigación psicológica, pero lo ideal es que sea capaz de realizarla. Una de las principales características que distinguen a los psicólogos clínicos de otros profesionales que ofrecen terapia, como los trabajadores sociales y los psiquiatras, es la relación tan estrecha que tienen con los datos conductuales. En los inicios de la historia del entrenamiento clínico, hace unos 50 años, se reunieron educadores y decidieron que los estudiantes de psicología clínica debían formarse primero como científicos y luego como terapeutas, ya que sin la ciencia estarían adivinando sobre cuáles técnicas terapéuticas funcionan y cuáles no. Por ello, la mayoría de los psicólogos cursan un doctorado, que es un grado en investigación. En la actualidad, cerca de un cuarto de los psicólogos clínicos tiene un doctorado en psicología, no en filosofía, pero el currículum para este grado todavía requiere que los estudiantes sean diestros en los métodos de investigación. Los clínicos deben ser capaces de entender tanto la investigación como la experimentación, ya que de otra manera no estarían en la posibilidad de determinar la eficacia de los tratamientos ni evaluar nuevas intervenciones conforme se presentan. Aparte de aceptar estas razones prácticas para aprender a llevar a cabo experimentos psicológicos, espero que quiera aprender estas habilidades sólo por diversión. Todos somos curiosos acerca del mundo que nos rodea. Queremos saber por qué ocurren las cosas de cierta manera. Los humanos inventaron la ciencia para entender mejor su mundo.1 La ciencia es un intento de abordar ordenadamente este proceso de descubrimiento. Muy joven me di cuenta 1
Y, en el caso de la astronomía, también de otros mundos.
01Martin001-024.indd 2
8/5/08 17:07:22
Cómo hacer observaciones ordenadas
3
de que, para mí, la experimentación era la herramienta más fascinante de la ciencia ya que llevaba al descubrimiento de relaciones que se desconocían. Luego, cuando supe acerca de la ciencia de la psicología, descubrí que esta poderosa herramienta podía ser utilizada para entender lo que yo consideraba el tema más interesante de todos: el comportamiento humano. La mayoría de la gente siente curiosidad acerca de su comportamiento y el de los demás. Por eso vemos telenovelas, hablamos a espaldas de la gente, fantaseamos y leemos publicaciones amarillistas (como el National Enquirer) en la fila del supermercado: para especular acerca del comportamiento humano. La experimentación psicológica nos permite corroborar nuestras especulaciones. Fue toda una emoción la que viví, durante mi primer curso de psicología experimental, al encontrar relaciones científicas que nadie había visto. Incluso después de años de hacer experimentos, mi corazón late un poco más rápido cuando veo por primera vez los resultados de un nuevo experimento. Es probable que mis colegas estén hartos de que irrumpa en sus cubículos para mostrarles mis descubrimientos conforme se revelan en mi laboratorio. Espero que usted sienta alegría al realizar su investigación. Aunque los investigadores tienen razones más serias para practicar la ciencia de la psicología, espero que usted no deje de apreciar lo divertido que es investigar.
■ La psicología como ciencia Los psicólogos hacen su trabajo como los científicos de otros campos. En su intento por entender el comportamiento humano, los psicólogos tratan de: 1) establecer relaciones entre circunstancias y comportamientos y 2) ajustar estas relaciones a un conjunto ordenado de conocimientos. En este libro tratamos en primer lugar la primera actividad, aunque tocaremos la segunda en los capítulos 3 y 13. ¿Qué clase de relación es aceptable para nosotros como científicos? Cuando demostramos que un suceso guarda una relación previsible con otro, hacemos una afirmación que corresponde al conjunto de los conocimientos científicos. Cuando menos uno de estos sucesos debe ser un hecho mensurable, pero la naturaleza del hecho es lo que distingue a una ciencia de otra. El hecho de mayor interés para nosotros como psicólogos es el comportamiento humano (y a veces el comportamiento animal). Y es aquí donde nos topamos con uno de nuestros primeros problemas, un problema que acecha a los psicólogos pero no a los físicos. Los seres humanos y los animales son mudables. Nosotros, los seres humanos, no repetimos una respuesta con precisión incluso si nos lo proponemos, y en algunos casos no lo queremos. En términos de variabilidad, los físicos enfrentan menos dificultades que los psicólogos. Un físico que calcula el coeficiente de fricción de un bloque de madera mediría el tiempo que tarda el bloque en deslizarse por un plano inclinado. Aunque los tiempos varíen entre un ensayo y otro, la variabilidad sería pequeña. El físico no cometería un error muy grande si considera esa variabilidad una molestia menor y midiera el tiempo sólo en una ocasión. Sin embargo, el psicólogo que quiere medir el tiempo que tarda un ser humano en presionar un botón en respuesta a una luz cometería un gran error si ignorara la variabilidad humana. Es improbable que el bloque con el que experimenta nuestro físico se vuelva lento en ciertos
01Martin001-024.indd 3
8/5/08 17:07:23
4
Capítulo uno
ensayos porque estaba pensando en otras cosas, no estaba listo, parpadeaba o se quedó dormido, un humano sí pasa por todos estos problemas. Los psicólogos deben tomar en consideración no sólo la variabilidad entre los ensayos, sino también la variabilidad entre los seres humanos. El físico podría cortar otro bloque del mismo tamaño, peso y superficie que el original y repetir el experimento. En cambio, el psicólogo no puede recrear a los seres humanos, que rara vez compartimos los mismos antecedentes genéticos (los gemelos idénticos son la excepción) y nunca tenemos exactamente el mismo ambiente. Por esta razón, al responder a la luz, la respuesta rápida de un individuo se considera más lenta que la respuesta de otro. Por tanto, los psicólogos deben tratar no sólo con la variabilidad de la persona de ensayo a ensayo, sino también con la variabilidad entre los seres humanos.2 Una manera de manejar la variabilidad es aplicar técnicas estadísticas. Para este efecto, muchos estudiantes toman cursos de estadística al inicio de su trabajo académico. Ya que este libro no es un manual de estadística, no nos detendremos mucho a considerar las soluciones estadísticas. Menciono brevemente el tema en el capítulo 12, al analizar la interpretación de los resultados experimentales, y en el apéndice A, donde explico las operaciones estadísticas simples. La segunda forma de manejar la variabilidad es controlarla tanto como sea posible en el diseño de la investigación. La meta de este libro es ayudarle a realizar una buena investigación, que es una manera sencilla de decir: “Mira dónde está la variabilidad y aprende a explicarla.” 2
Vea por qué algunos psicólogos deciden utilizar animales en los experimentos. Si bien los psicólogos pueden criar animales con características genéticas similares y en ambientes similares, serían muy criticados si trataran de hacer lo mismo con los seres humanos. Quizá sus amigos le digan que todos los hombres son unos animales o que todas las mujeres son iguales, pero no les crea.
01Martin001-024.indd 4
8/5/08 17:07:23
Cómo hacer observaciones ordenadas
5
Los psicólogos y otros científicos sociales aplican diversas técnicas de investigación para llevar a cabo observaciones ordenadas en un intento por explicar la variabilidad. En este capítulo ofrezco un esbozo de las técnicas. En el siguiente capítulo y en la mayoría de los demás me extiendo en la experimentación debido a que ésta es la técnica que más se enfatiza en este libro. En el capítulo 10 profundizo en varias técnicas de investigación que no son experimentales: cuestionarios, diseños de un solo sujeto y diseños cuasiexperimentales. Las técnicas más utilizadas son los llamados diseños cuantitativos, en los cuales los eventos pueden ser tan cuantificados que los datos se tratan como números. Estos diseños comprenden experimentos y observaciones correlacionales. Para darle un panorama completo de las técnicas de investigación, en este capítulo hablo de los diseños cualitativos, en los cuales los hechos de estudio no se convierten fácilmente en números.
■ Diseños cuantitativos EL MÉTODO EXPERIMENTAL
Como científicos, establecemos relaciones entre hechos, que no siempre son comportamientos. Así, cuando realizamos un experimento o seguimos el método experimental, la relación que interesa está entre un conjunto de circunstancias y un comportamiento. Un físico quiere saber el tiempo que le toma a un bloque deslizarse por un plano inclinado, cuando el plano está en un ángulo en particular, tiene una superficie particular y una temperatura particular. Por el otro lado, el psicólogo quizá quiera estudiar el comportamiento de los estudiantes en un salón de clases. Los dos científicos tratan de establecer relaciones entre un conjunto de circunstancias y un comportamiento, ya sea de un objeto físico o de un ser humano. Estas relaciones son hechos científicos, los elementos fundamentales con los que erigimos nuestra ciencia. Sin embargo, no siempre es fácil diseñar un experimento para establecer tal relación. Idealmente, nos gustaría especificar de manera exhaustiva y con precisión un conjunto particular de circunstancias y luego medir todos los comportamientos que ocurren en esas circunstancias. Entonces podríamos decir que siempre que este conjunto de circunstancias se repita, dará como resultado los mismos comportamientos. Ahora bien, si pudiéramos hacer una lista de todas las circunstancias, tendríamos un solo conjunto. Si quisiéramos estudiar a los alumnos de un salón, qué circunstancias serían interesantes para nosotros? Quizá nos gustaría conocer el efecto del sexo del profesor o de la ropa que lleva; o tal vez el tamaño del grupo o quizás el uso de computadoras en el salón o la hora del día en que se reúnen. Está claro que se podrían investigar muchas circunstancias. En efecto, hay un número infinito de circunstancias y éstas forman un conjunto único que nunca se repetiría. Como en el caso del físico, el psicólogo quiere relacionar las circunstancias con los hechos, y aquí surge un problema similar. ¿Qué comportamientos queremos investigar? Tal vez qué tan atentos están los estudiantes o quizá cuántos apuntes toman, cuántas preguntas
01Martin001-024.indd 5
8/5/08 17:07:24
6
Capítulo uno
hacen, la asistencia a la clase o incluso qué tipo de ondas cerebrales generan. También es infinito el número de comportamientos que podríamos medir. Entonces, los científicos tienen un conjunto infinito de circunstancias y hechos para tratar de relacionar entre sí. Saber qué hacer con los comportamientos de menor interés no es tan problemático como saber qué hacer con las circunstancias de menor interés. Cuando se elige una conducta en particular, es posible ignorar las otras. En cambio, cuando se escoge una circunstancia, las otras no pueden ser ignoradas. Una posibilidad sería mantener todas las circunstancias constantes para hacer una afirmación precisa acerca de la relación entre las circunstancias y los comportamientos. Pero si hiciéremos eso, terminaríamos con un número infinito de afirmaciones, una por cada conjunto único de circunstancias emparejadas con cada uno del número infinito de comportamientos. Aunque pudiéramos hacer afirmaciones precisas acerca de la relación entre las circunstancias y los comportamientos, nunca seríamos capaces de predecir un comportamiento a partir de las circunstancias, ya que nunca podríamos encontrar las circunstancias peculiares que corresponden a un comportamiento particular. ¿Cómo se resuelve este problema? Los científicos han tenido que llegar a un compromiso. Después de escoger una o varias circunstancias para investigar, dejan que otras varíen, al menos dentro de ciertas restricciones. Esto significa que la circunstancia (o circunstancias) de mayor interés quede especificada de manera precisa, mientras que la mayoría de las demás forman un conjunto variable, no único. De esta manera, cualquier relación que se encuentre entre la circunstancia de interés y el comportamiento puede ser generalizado a la mayoría de las condiciones del grupo de circunstancias. Al aplicar el método experimental, el científico manipula por lo menos una circunstancia y mide por lo menos un comportamiento. Por ejemplo, supongamos que estamos interesados en saber qué es más fácil de recordar, si las palabras o las imágenes. Podríamos hacer listas de palabras como auto, árbol, casa y mano, y luego buscar imágenes simples o dibujos de cada palabra. Después podríamos presentar a las personas ya sea la lista de palabras o la lista de imágenes, para descubrir cuántos ensayos necesitarían para aprender las listas. Así, habríamos escogido una circunstancia para manipular y la habríamos establecido en dos planos, palabras en comparación con imágenes, y mediríamos el número de ensayos que la persona necesita para aprender cada plano. Así, cuando termináramos nuestro experimento, seríamos capaces de hacer una afirmación clara acerca de si presentar el material como palabras o imágenes tiene algún efecto en la capacidad de aprenderlo. No podemos ignorar todas las otras circunstancias. Como veremos en el siguiente capítulo, tenemos que considerar con sumo cuidado cómo manejar las circunstancias que no manipulamos. Sin embargo, cuando el experimento se lleva a cabo en la forma correcta, estamos en posición de afirmar que cualquier cambio en el comportamiento medido que ocurra cuando se manipula la circunstancia de interés es causado por la manipulación. El método experimental se sigue mucho en las ciencias, ya que ningún otro permite hacer tales afirmaciones causales. Cuando analicemos otros métodos científicos, veremos que se alejan de lo ideal: estar en posición de afirmar sin lugar a dudas que el cambio en la circunstancia causó el cambio en el comportamiento.
01Martin001-024.indd 6
8/5/08 17:07:24
Cómo hacer observaciones ordenadas
7
OBSERVACIÓN CORRELACIONAL
En el establecimiento de las relaciones que aumentan nuestro conocimiento del comportamiento humano, no siempre es posible llevar a cabo un experimento. En tales casos, suele ser apropiada la observación correlacional, en la cual tratamos de determinar si dos variables están relacionadas sin tratar de manipular una de manera experimental. Por ejemplo, supongamos que estamos interesados en encontrar la relación entre la densidad demográfica de lugares donde viven niños y la tasa de delincuencia juvenil entre ellos. Quizá nuestra hipótesis sea que el estrés de vivir en zonas densamente pobladas aumenta la tasa de delincuencia juvenil. Para adaptar este problema al modelo experimental, tendríamos que convertir la densidad demográfica en una circunstancia que podamos manipular y forzar a los padres de una muestra representativa de bebés a vivir en comunidades con diferentes densidades demográficas. Cuando los niños tuvieran 18 años, contaríamos el número de veces que los detuvo la policía. Obviamente, pocos papás estarían de acuerdo en semejante experimento, además de que la sociedad no aplaudiría nuestro sincero esfuerzo de llevar a cabo una buena investigación. Sin embargo, en lugar de darnos por vencidos en lo que pudiera ser una pregunta importante, podríamos recurrir a una observación correlacional. Para hacer observación correlacional, escogeríamos al azar varios niños de un gran número de comunidades con diferentes densidades demográficas. De acuerdo con la densidad, asignaríamos un número en la escala de menor a mayor. Luego, analizaríamos los expedientes policiales de cada muchacho para determinar si hay una relación. Los datos de las observaciones correlacionales se presentan en una gráfica de dispersión, en la que cada variable se representa en un eje y cada punto representa una medición única. Por ejemplo, en la figura 1-1 se da la gráfica con los datos hipotéticos de nuestro estudio sobre la densidad demográfica. En este caso, cada punto representa una puntuación de la densidad demográfica y el número de veces que cada niño ha sido presentado en la delegación de policía (número de presentaciones, para abreviar). Por ejemplo, el punto superior derecho en la gráfica representa a un niño con cuatro presentaciones y que vive en una comunidad de alta densidad demográfica, y el punto inferior izquierdo a un niño sin presentaciones y que vive en una comunidad de baja densidad demográfica. El diagrama de dispersión muestra que hay una relación moderada entre la densidad demográfica y las presentaciones ante el juez en nuestro ejemplo ficticio. Los puntos de los datos tienden a agruparse cerca de una línea imaginaria que corre desde la parte inferior izquierda hasta la parte superior derecha de la gráfica. En este ejemplo hipotético, los niños que viven en comunidades de baja densidad demográfica tienen menos presentaciones en la delegación. Estuvimos de acuerdo, al principio de este capítulo, en que el interés del científico era establecer relaciones entre hechos, entonces ¿por qué este resultado no es tan bueno como el de un experimento? Recuerde que, según el análisis que hicimos del método experimental, cuando realizamos bien un experimento, podemos decir que el cambio en la circunstancia que manipulamos causó un cambio en el comportamiento que medimos. Sin embargo, en una observación correlacional, lo mejor que podemos hacer es concluir que una variable está relacionada con otra.
01Martin001-024.indd 7
8/5/08 17:07:25
8
Capítulo uno
Número de presentaciones
4 3 2 1 0 Baja
Alta Densidad demográfica
FIGURA 1-1 Datos ficticios que muestran la relación entre la densidad demográfica y el número
de veces que cada niño ha sido presentado ante la policía.
¿Por qué no podemos decir que la densidad de población causa la delincuencia juvenil? No podemos hacer esta afirmación debido a que no manipulamos ninguna circunstancia; todo lo que hicimos fue medir dos comportamientos. Sólo si hubiéramos realizado un experimento en el cual hubiéramos manipulado la densidad demográfica, podríamos hacer una afirmación causal. En su lugar, lo que hicimos fue permitir a las familias que escogieran dónde vivir. Por tanto, la elección de vivir en una comunidad con una densidad demográfica particular fue un comportamiento, más que una circunstancia manipulada, de manera que ya no aplicaría la conclusión causal sólida que pudiéramos hacer a partir del experimento. ¿Por qué? En la observación correlacional, uno de los comportamientos podría ser la causa del otro, pero incluso si así fuera, no sabríamos qué comportamiento es la causa y cuál es causado. Se trata del llamado problema de la direccionalidad. En nuestro ejemplo, pudiera ser que conforme los jóvenes delinquen más, convencen a sus padres de mudarse a comunidades con mayores densidades demográficas. En otras palabras, aunque resulta improbable, la delincuencia podría causar las elecciones de densidad demográfica. A partir de un estudio correlacional no podemos saber con seguridad la dirección causal, incluso si un comportamiento causa al otro. Otra posibilidad es que ningún comportamiento cause al otro, aunque haya una relación. Quizá una tercera variable sea la causa de las dos conductas, lo que se conoce como problema de la tercera variable. En el ejemplo que analizamos, la pobreza, como tercera variable, podría ser la causa tanto de la elección del lugar donde vivir como de la tendencia a la delincuencia juvenil.
01Martin001-024.indd 8
8/5/08 17:07:25
Cómo hacer observaciones ordenadas
9
El siguiente ejemplo ilustrará la dificultad de hacer afirmaciones causales a partir de observaciones correlacionales. El ejército de Estados Unidos realizó un estudio sobre los accidentes en motocicleta, con la intención de correlacionar el número de accidentes con otras variables como el nivel socioeconómico y la edad. En este estudio se encontró que el mejor predictor era el número de tatuajes que el motociclista tenía. Hubiera sido un ridículo error concluir que los tatuajes causan los accidentes o, en ese mismo sentido, que los accidentes causan los tatuajes. Obviamente, hay una tercera variable relacionada con ambos, quizás el gusto por correr riesgos. A la persona que está dispuesta a arriesgarse le gusta tatuarse y tentar a la suerte en una motocicleta.
Estoy seguro de que está enterado del debate histórico entre las tabacaleras y el gobierno sobre las consecuencias médicas del tabaquismo. El dilema que enfrentó la Dirección de Salud Pública de Estados Unidos hace décadas es un buen ejemplo de la dificultad de hacer afirmaciones causales con base en datos correlacionales. Aunque se sabe desde hace mucho que hay una correlación positiva entre el número de cigarros fumados y la incidencia del cáncer de pulmón y otros problemas de salud, la Dirección de Salud Pública ha sido renuente a afirmar que fumar causa cáncer de pulmón. En parte, esta renuencia puede obedecer a motivos políticos; sin embargo, en gran medida fue una precaución científica justificable, ya que podía haber una tercera variable que causara el cáncer pero también que influyera en el tabaquismo. Por ejemplo, la gente que es nerviosa podría secretar una sustancia química que mantuviera su cuerpo en un estado propenso a la irritabilidad, lo que lesionaría determinadas células predispuestas a volverse malignas. También podría ser que la gente nerviosa fume más. El nerviosismo, entonces, podría haber causado el cambio en las dos variables. Por tanto, alguien de la Dirección de Salud Pública habría tenido que llevar a cabo un experimento para afirmar definitivamente, a partir del estudio, que fumar causa cáncer de
01Martin001-024.indd 9
8/5/08 17:07:25
10
Capítulo uno
pulmón. Tal experimento consistiría en que 1000 personas fumaran 40 cigarros por día, otras 1000 fumaran 30 diarios, y así sucesivamente. En este diseño, los experimentadores determinarían la probabilidad de que un individuo de cada uno de los grupos sufriera cáncer de pulmón en la vida. Suponiendo que los investigadores hicieran el experimento de manera adecuada, podría decirse que cualquier diferencia real en la incidencia de cáncer entre los grupos fue causada por los cigarros. Sin embargo, nuestra sociedad exige que se respeten las decisiones de las personas, así que no hay bases éticas para realizar tal experimento. ¿Entonces por qué las cajetillas de cigarrillos llevan una advertencia del tenor siguiente: “DEJAR DE FUMAR REDUCE IMPORTANTES RIESGOS EN LA SALUD” o “FUMAR CAUSA CÁNCER DE PULMÓN, ENFERMEDADES CARDIACAS Y ENFISEMA, Y PUEDE COMPLICAR EL EMBARZO”?3 En este caso, los experimentadores determinaron las correlaciones de otras muchas variables que pudieran estar relacionadas con problemas de la salud y el tabaquismo. A medida que eliminaron más y más variables, aumentó la probabilidad de que fumar fuera la causa. Al parecer, la Dirección de Salud Pública consideró que los experimentadores por fin habían eliminado todas las terceras variables posibles. Este hecho, en combinación con los experimentos con animales que mostraron una relación causal, convencieron a la dependencia de hacer tal afirmación. El punto, entonces, es que en ocasiones debemos reunir datos correlacionales para establecer las relaciones psicológicas importantes. Sin embargo, tenemos que considerar estos datos con sumo cuidado para no caer en el error frecuente de interpretar los resultados de una observación correlacional como una relación causal. Una de las técnicas comunes que se emplean para reunir los datos de observaciones correlacionales es la encuesta, que puede hacerse en forma de cuestionario o como entrevista. Debido a que los estudiantes que toman un curso de métodos de investigación suelen utilizar los cuestionarios, los analizo con mayor detalle en el capítulo 10. Aquí permítame hacer una referencia rápida de las encuestas. ENCUESTAS
En las encuestas se pregunta a las personas acerca de su comportamiento o sus opiniones. De seguro ha contestado muchas encuestas, en algunos casos tal vez sin darse cuenta. Por ejemplo, en mi escuela, a los que se titulan se les envía una encuesta en la que se les pregunta sobre sus experiencias en la universidad: competencia de los profesores, servicios de salud, disponibilidad de consejo vocacional, sabor de la comida que se ofrece, etc. O quizás ha contestado el teléfono y le han pedido su opinión acerca de ciertos temas y candidatos de un partido político. En la internet, al momento de suscribirse a algunos servicios tiene que responder preguntas acerca de quién es usted y cuáles son sus preferencias. Hasta ese cuestionario es una encuesta. Entre las encuestas se cuentan los cuestionarios, que pueden contestarse en papel y a lápiz o ser aplicados en persona, ya sea individualmente o en grupos de participantes 3
Hay varias afirmaciones que advierten de la gravedad de las consecuencias de fumar, pero todas implican que es el consumo de tabaco lo que causa los problemas de salud.
01Martin001-024.indd 10
8/5/08 17:07:26
Cómo hacer observaciones ordenadas
11
(llamados por lo común encuestados). Los cuestionarios también se envían por correo o por medio de internet. Las encuestas también incluyen las entrevistas en persona o por vía telefónica. Cada método tiene sus ventajas y desventajas, como veremos en el capítulo 10. Realizar una investigación por medio de encuestas tiene varias ventajas. Una es que puede preguntar directamente a los encuestados sus opiniones, actitudes y motivaciones, en lugar de inferirlas de su comportamiento. Por ejemplo, podríamos hacer un experimento en el que se cambiara la exhibición de la mercancía en una tienda y descubrir que los clientes compran más. Sin embargo, aunque sabemos que los clientes compran más, en realidad no sabemos por qué. Es posible que tengan una actitud más positiva hacia la tienda o quizás encuentran lo que buscan con más facilidad. Una encuesta nos serviría para determinar por qué compran más, o cuando menos por qué piensan que compran más. La segunda ventaja es la facilidad para reunir pronto grandes cantidades de datos. Por ejemplo, una vez, cuando veía el mensaje del presidente a la nación, una cadena de televisión presentó los resultados de una encuesta de espectadores justo antes de que terminara. Las encuestas también tienen desventajas. Aunque uno piense que la gente da información real acerca de su comportamiento u opiniones, lo que dice puede faltar a la verdad. Por ejemplo, durante 60 años la organización Gallup ha preguntado a la gente si va a la iglesia, y cerca de 40% de los entrevistados dicen que van una vez por semana. Esta cifra es mucho mayor que la de otras naciones occidentales y muchas iglesias se quejan de la pérdida de feligreses en los últimos años. ¿Cuál es la verdad? C. Kirk Hadaway y Penny Long Marler (1998) decidieron consultar a los ministros y realizar conteos. Encontraron que la asistencia era cercana al 20%, no al 40%. ¿Por qué mienten estas buenas personas? Quizás algunas decidieron que aunque no fueron la semana anterior, por lo regular van, de manera que está bien responder que sí. O quizá pensaron que las buenas personas deben ir a misa y quieren que las consideren tales. Cualesquiera que sean las razones, sabemos que en las encuestas la gente exagera la frecuencia con la que vota o hace donativos y subestima la frecuencia con que consume drogas o utiliza la copiadora de la oficina para fines personales. Así que, como investigador, debe tener presente que el problema más grande de las encuestas es que sólo nos revelan lo que la gente dice de cómo se comporta o lo que dice que piensa, no su comportamiento real ni lo que piensa en realidad. Otra desventaja de las encuestas es también una de sus ventajas: proporcionan demasiados datos. Un problema es que para reunirlos se necesita de muchos encuestados y en algunos casos no hay tantos. Por ejemplo, en mi universidad los investigadores que realizan grandes encuestas recurren a los estudiantes de introducción a la psicología para que sean sus encuestados, y a veces deben esperar a que otros colegas terminen su investigación, ya que de otra manera se acabaría la población con unas cuantas encuestas. Una desventaja más grave es que el investigador tiene dificultades para interpretar muchos datos. He leído muchos informes de encuestas de investigación escritos por estudiantes, en los cuales anotan los resultados de la encuesta que realizaron pero no saben qué más decir. Debido a que no es usual que una investigación por encuestas tenga una base teórica, los resultados no apoyan ni refutan ninguna teoría, como pasa con los experimentos. Además, hacer el análisis
01Martin001-024.indd 11
8/5/08 17:07:26
12
Capítulo uno
detallado de los resultados de la encuesta requiere que se apliquen técnicas estadísticas complejas, como el análisis factorial, que está más allá de la formación que reciben los investigadores principiantes. Analizo algunas otras ventajas y desventajas de las encuestas en el capítulo 10, donde profundizo en los cuestionarios. INVESTIGACIÓN DE ARCHIVOS
Otra forma de observación correlacional es la investigación de archivos (o documental). En este caso, otros le han hecho el favor de registrar sus observaciones. En otras palabras, hay registros públicos o privados con información útil para usted. Cuando usted los examina para propósitos de investigación y trata de organizar e interpretar la información para encontrar relaciones, realiza una investigación de archivos. Incluyo este tipo entre la investigación cuantitativa, ya que la mayoría de estos registros pueden ser cuantificados y convertidos en cifras. Sin embargo, cuando los registros constan de entrevistas, historias de casos y similares, la investigación puede ser caracterizada como cualitativa. Los registros que revisten interés para los psicólogos son: datos censales, registros judiciales, periódicos, expedientes de hospitales, informes de accidentes, informes de delitos, archivos clínicos, registros de dependencias gubernamentales, listas de salarios de funcionarios públicos, directorios telefónicos y cifras de ventas corporativas. Como ejemplo de una investigación que emplea datos de archivos, Doug Kenrick y un colega de la Universidad Estatal de Arizona examinaron las listas de matrimonios de varios periódicos (Kenrick y Keefe, 1992). Examinaban una teoría evolutiva de la atracción personal. Según esta teoría, en los tiempos ancestrales una de las mayores razones para que una mujer encontrara atractivo a un hombre era su potencial de proporcionar los recursos para sus hijos. Por su lado, un hombre encontraba atractiva a una mujer, cuando menos en parte, por su potencial de dar a luz muchos hijos. Si estas afirmaciones son verdaderas, la teoría predice que aún en la actualidad las mujeres deberían sentirse atraídas y casarse con hom¡Parece que es un buen bres maduros que ya han acumulado recurpartido para mí! sos y los hombres deberían casarse con mujeres jóvenes que tengan muchos años de fertilidad. Para investigar esta hipótesis, Kenrick y sus investigadores leyeron la sección de los periódicos donde aparecía la lista de las personas que se casaban y anotaron las edades. Como la teoría predice, encontraron que, hasta cierto punto, los novios eran mayores que las novias. Por supuesto, hay otras posibles explicaciones para esta diferencia en edad, y estas razones se han analizado a profundidad (Kenrick y Keefe, 1992).
01Martin001-024.indd 12
8/5/08 17:07:27
Cómo hacer observaciones ordenadas
13
No obstante, este estudio ilustra claramente que la información archivística, incluso la de nuestro periódico del día, puede formar la base de una investigación psicológica importante. Uno de los ejemplos más extensos de la investigación de archivos fue la base de Homicide, un libro de Martin Daly y Margo Wilson (1988), que también indagaban las predicciones hechas por una teoría evolutiva. En este caso, la información de archivo que examinaron eran informes policiacos de homicidios. La teoría predice que, en general, si alguien va a matar a otra persona, debería asesinar a quienes contribuyeran menos a su probabilidad de éxito reproductivo. Quienes tendrían menor probabilidad de ser asesinados por esa persona serían sus hijos biológicos, que son portadores de su material genético, y otras personas que contribuyan a la prosperidad de esos hijos o los hijos futuros, como sus fieles cónyuges. Por ejemplo, la teoría predice que es más probable que los padres maten a sus hijastros que a sus hijos biológicos, y que los hombres son más proclives a matar a sus compañeras si sospechan que son infieles, más que por cualquier otra causa. Los investigadores revisaron con mucho cuidado los informes de homicidios de los expedientes policiacos de Detroit y Canadá, y descubrieron que casi todas sus predicciones eran correctas. Los niños tenían entre 40 a 100 veces más probabilidades de ser asesinados por sus padrastros que por sus padres biológicos. Y como se predijo, los celos sexuales eran el motivo de la mayoría de los casos en que los hombres asesinaron a su compañera. Los datos apoyaban incluso algunas predicciones que parecían ir en contra del sentido común. Por ejemplo, los hijos adultos de cierta edad cuyos padres eran más viejos tenían mayor probabilidad de matarlos que quienes tenían padres jóvenes. La teoría evolutiva predice este resultado, ya que los padres más viejos tendrían menor probabilidad de tener más hijos, que portarían el material genético de la familia, pero va en contra de otras teorías de la psicología. En el estudio de Daly y Wilson, los registros de los archivos eran tan extensos que pudieron codificar la mayor parte de los datos y transformarlos en números, de tal manera que hicieron un análisis estadístico cuantitativo. La investigación archivística tiene varias ventajas. Si puede encontrar los registros adecuados, no tendrá que gastar tiempo y esfuerzo reuniendo sus propios datos. También en algunos casos los registros proporcionan datos más copiosos de los que uno podría reunir. Por último, parte de la información disponible en los registros sería imposible de reunir si hiciera su propia investigación. Los psicólogos no deben hacer que la gente se mate ni siquiera alentarla a casarse para reunir la información. Por supuesto, este enfoque también tiene desventajas. Al igual que en las observaciones correlacionales y las naturalistas, los participantes no son asignados de manera aleatoria ni se manipula ninguna variable independiente; por tanto, sólo se encuentran relaciones, no causas. Además, en la mayoría de los casos, los que reúnen la información contenida en los registros no tienen formación científica, de manera que no se conoce su confiabilidad y quizá sea sospechosa. A veces los registros son difíciles de encontrar o conseguir o, aunque estén disponibles, es difícil sistematizarlos. Por último, en la mayoría de los casos no hay registros que proporcionen la información que uno necesita.
01Martin001-024.indd 13
8/5/08 17:07:27
14
Capítulo uno
■ Diseños cualitativos La inmensa mayoría de los psicólogos investigadores utilizan los diseños cuantitativos, como experimentos u observaciones correlacionales, ya que a principios de la historia de la psicología su lado científico se labró a imagen de las ciencias exactas, como la física y la química. Los primeros efímeros intentos de los introspeccionistas de utilizar los informes verbales como datos en lugar del comportamiento mensurable numéricamente fueron echados por tierra por los conductistas, y ya no se repitieron durante muchas décadas. Sin embargo, en años recientes algunos psicólogos, en particular de campos como la psicología educativa, clínica y social, se sintieron limitados por estas reglas estrictas. Así, buscaron métodos para aprovechar informes verbales como datos y, al mismo tiempo, mantener el rigor científico. Descubrieron y adoptaron métodos llamados de investigación cualitativa de la antropología y, en últimas fechas, de la sociología. Los investigadores cualitativos utilizan datos descriptivos: descripciones escritas de personas —incluyendo opiniones y actitudes—, así como de acontecimientos y ambientes. ETNOGRAFÍA
Imagínese a un antropólogo cultural que ha viajado a una tierra lejana para investigar una cultura exótica. ¿Cómo debería proceder? Sabría tan poco de esa extraña cultura que sería imposible planear un experimento. Incluso sería difícil elaborar un cuestionario o un conjunto coherente de preguntas, hasta que el antropólogo conociera algunos hechos básicos acerca del pueblo. La meta inicial sería hablar con las personas y describirlas, junto con su escenario, de manera que la cultura dejara de parecer extraña y se volviera familiar. Quienes llevan a cabo una investigación cualitativa llamada etnografía a veces lo hacen al revés: estudian culturas familiares para hacerlas extrañas (Erickson, 1973). Por ejemplo, supongamos que estamos interesados en estudiar la dinámica de un programa particular de enseñanza en una primaria. Todos pasamos por la primaria, así que estamos familiarizados con ese entorno. Si quisiéramos aprender algo nuevo acerca del grupo escolar que estudiamos, los etnógrafos nos sugerirían que abordáramos la tarea como si acabáramos de llegar del espacio y viéramos el aula por primera vez, con el objeto de prepararnos para ver todo como extraño. Empezaríamos entrevistando a los niños y maestros, tratando de acercarnos a ellos con una mente abierta, sin tener formada ninguna hipótesis que pudiera movernos a prejuicios acerca de lo que ocurre ahí. No haríamos estas entrevistas al azar. En lugar de confiar en nuestra memoria, las grabaríamos y luego las transcribiríamos al pie de la letra. Tal vez tomaríamos notas extensas acerca del comportamiento de los individuos en el salón, los sucesos que tienen lugar y el escenario o contexto en el que ocurren. Debido a que los etnógrafos tratan de no interpretar sus datos, trataríamos de describir de manera tan precisa como fuera posible lo que los niños y maestros dicen y hacen en el salón. Los etnógrafos a veces actúan como observadores participantes. Por ejemplo, en el caso del salón de clases, un maestro podría hacer la investigación como observador participante. En general, el obser-
01Martin001-024.indd 14
8/5/08 17:07:28
Cómo hacer observaciones ordenadas
15
vador participante sería tan discreto como fuera posible para no inclinar el comportamiento de los otros participantes, por ejemplo, tomaría notas sólo durante los descansos. El ejemplo del salón de clases es también un caso de observación naturalista, un diseño que examinaremos a continuación. Sin embargo, no toda la etnografía o investigación cualitativa tiene que efectuarse en escenarios naturales. Tengo una colega que está interesada en la relación entre las madres y sus hijas y en cómo ha cambiado hasta el presente. Su método de reunir datos consiste en realizar en su laboratorio entrevistas exhaustivas a las madres e hijas, grabarlas en un casete y luego transcribirlas. También está interesada en interpretar los datos, en lugar de reducirse a describirlos como haría un etnógrafo. Aunque ha estructurado las entrevistas de manera que en cada una se analicen temas similares, no tiene un cuestionario que sus entrevistadores deban preguntar en un orden fijo. Diseñó la entrevista para que fuera flexible, en lugar de que sólo fuese un cuestionario oral. Los investigadores cualitativos afirman que esta flexibilidad es uno de los puntos fuertes de su método: que la interacción con los participantes debe permitirles describir sus experiencias, sentimientos y actitudes con su propio estilo. Creen que el método experimental, en el cual el investigador prueba una hipótesis y recopila información muy estructurada, es tan artificial y restringido que apenas toca la vasta cantidad de la información disponible. De hecho, algunos investigadores cualitativos creen que, a un nivel teórico básico, la investigación cualitativa es preferible por su orientación humanista. Los participantes son tratados como seres humanos y su humanidad se aborda por completo, mientras que en los experimentos tratan a los participantes como objetos (sujetos) sobre los cuales se conduce la investigación. OBSERVACIÓN NATURALISTA
Como lo hice notar en la sección anterior, algunos psicólogos creen que la investigación se realiza mejor estudiando el comportamiento en su escenario natural y que el acto de llenar un cuestionario o proporcionar información para un experimento podría distorsionar el comportamiento de un participante. Supongamos que estamos interesados en saber si el consumo de alcohol está relacionado con la agresividad social. Podríamos organizar un experimento en el que grupos de participantes bebieran cantidades moderadas de alcohol. Luego alternarían entre ellos mientras el observador se sienta en el salón y anota cuántos actos de agresión se suscitan. ¿Qué tan agresivos piensa que serían los bebedores en esta situación? Es probable que parezcan más feligreses de una congregación religiosa que parroquianos de un bar concurrido. Para tener una buena respuesta a nuestra pregunta, tendríamos que ir a un bar y observar a los clientes. Esta técnica de la investigación psicológica recibe el nombre de observación naturalista, ya que los investigadores examinan con atención los comportamientos en las condiciones en que normalmente ocurren.4 Las observaciones naturalistas son necesarias 4 Las observaciones naturalistas también reciben el nombre de estudios de campo, ya que el investigador va al campo a reunir los datos. (Aquí tendría que morderme la lengua para no recordarle el chiste del ranchero que fue al campo y se asomó a ver a la Ramona. . .)
01Martin001-024.indd 15
8/5/08 17:07:28
16
Capítulo uno
cuando queremos investigar un comportamiento que nos parezca que podría ser distorsionado por la artificialidad de una situación experimental. Por ejemplo, los niños se sienten inhibidos ante la presencia de un adulto, particularmente uno desconocido. Podríamos esperar que el comportamiento del niño que juega en su casa con sus propios juguetes sea muy diferente del que manifestaría en un laboratorio de psicología con juguetes desconocidos y ante la presencia de un psicólogo de aspecto extraño. Durante mucho tiempo, los psicólogos comparativos5 y los etólogos se preguntaron si algún animal, además del ser humano, utilizaba herramientas, y la observación naturalista les proporcionó la primera parte de la respuesta. Inicialmente, la información que reunieron observando a los chimpancés en los zoológicos apoyó la idea general de que ningún otro animal utiliza herramientas. Sin embargo, tiempo después, los investigadores empezaron a preguntarse si los chimpancés de los zoológicos no las utilizaban porque no las tienen a la mano. Así que les dieron herramientas como alicates y desarmadores, que no usaron. Por último, una brillante investigadora llamada Jane Goodall se mudó a la selva con chimpancés. Vivió con ellos y durante varios años observó constantemente su comportamiento. Un día, notó que un chimpancé tomaba una rama, le quitaba las hojas para dejarla lisa, luego la cortaba hasta cierta longitud y la metía en un montículo de termitas. Entonces, sacaba la rama y se comía las termitas que venían sujetadas. Aunque no es una herramienta tan compleja como las de los seres humanos, algunos investigadores la consideran adecuada para un chimpancé. Más recientemente se ha confirmado en el laboratorio el uso de herramientas. Ahora algunos investigadores sostienen que otros animales, como las aves, también tienen la capacidad de utilizar herramientas. Sin la observación naturalista, los investigadores todavía seguirían perdiendo el tiempo con animales de zoológico que no utilizan herramientas. Algunas ciencias aparte de la psicología utilizan la observación naturalista como su principal método, ya que no pueden controlar las variables que investigan. Por ejemplo, los astrónomos investigan el universo tal como se encuentra naturalmente. Lo mismo pasa con los arqueólogos, paleontólogos, etnólogos y antropólogos. Esta limitación no ha impedido que los científicos descubran fenómenos importantes, tales como la evolución. Debido a los problemas de control, los investigadores hacen observación naturalista en psicología para postular hipótesis que puedan ser estudiadas después, con experimentos de laboratorio. De este modo, la observación naturalista puede ser una herramienta de investigación valiosa. Le parecerá obvio el principal problema de la observación naturalista como técnica de investigación. Debido a que los investigadores no tienen el control sobre ninguna de las 5
Los psicólogos comparativos no son los que hacen comerciales de televisión en los que la marca X pierde ante la marca Y. Estos especialistas comparan el comportamiento entre especies de animales, incluyendo seres humanos. Sostienen que los demás somos demasiado egocéntricos en nuestras investigaciones. Los seres humanos constituyen tan sólo una pequeña parte del reino animal.
01Martin001-024.indd 16
8/5/08 17:07:28
Cómo hacer observaciones ordenadas
17
variables que observan, una puede cambiar de manera sistemática junto con la variable principal que se observa. Por ejemplo, en el caso del bar un investigador podría observar que cuanto más alcohol beban los clientes, más agresivas se harán sus interacciones sociales. Sin embargo, quizá no observe que conforme avanza la noche y se consumen más bebidas, el número de clientes se incrementa. Puede ser que la agresividad esté relacionada con la multitud. O quizá el cantinero está cansado y sirve las bebidas con más lentitud. Tal vez la agresividad se relacione con la frustración. Por tanto, aunque la observación naturalista tiene la ventaja del realismo, también tiene sus desventajas por su falta de control. Así como con la observación correlacional, los experimentadores deben estar conscientes de las variables de confusión potenciales y deben abstenerse de hacer afirmaciones causales. HISTORIA DE CASO
Una última técnica de investigación de los psicólogos es otro diseño cualitativo conocido como historia de caso. Es un relato detallado de las ocurrencias de un caso. El caso es por lo normal la vida de una persona, pero también puede ser un incidente, tal como la descompostura de una planta nuclear. Muchos de los datos de la psicología clínica provienen de estudios de caso, como los informes de Freud sobre casos clínicos. Así como con los diseños cualitativos típicos, los datos de los estudios de caso en general son verbales. Supongamos que usted es un terapeuta que tiene como pacientes a un par de siameses con personalidades múltiples. Quizá pueda estar interesado en explorar por qué los gemelos unidos desarrollan doble personalidad. Inmediatamente se daría cuenta de que tratar de realizar un experimento para responder la pregunta sería inútil. Incluso si encontrara suficientes gemelos unidos para llevar a cabo el experimento, la sociedad consideraría que no es ético provocar una enfermedad mental en los gemelos unidos; ¡tampoco es ético enfermar a los gemelos separados! Tal vez sería mejor una observación correlacional. Quizá pudiera correlacionar el número de personalidades en los gemelos unidos con el grado de estrés en la niñez. Necesitaría encontrar varios gemelos unidos con doble personalidad. Debido a que esta tarea es casi imposible y a que no tiene sentido la observación correlacional sobre datos únicos,6 tendría que abandonar también este método. La única opción que quedaría sería una historia del caso en la que perfilara los factores de la vida de los gemelos unidos que hayan contribuido a su desarrollo. Primero, pasaría muchas horas entrevistando a los gemelos para trazar una historia de su vida, desde el nacimiento hasta el presente. Además, hablaría con sus parientes y amigos y examinaría cualquier registro escolar, médico y psicológico que tuviera. Debido a que toda esta información requeriría mucho espacio en un informe, seleccionaría los que le parezcan los aspectos más importantes. La técnica de la historia de caso presenta todos los peligros de los otros métodos, incluyendo las variables de confusión desconocidas y la incapacidad para establecer la 6
Resulta difícil establecer una relación entre dos variables con datos únicos, pero no lo es establecer una relación entre dos grupos, ya que puede trazar una recta entre ellos. Declarar que encontró una relación basándose en dos puntos sería presumir. Es fácil de hacer, pero nadie presta atención.
01Martin001-024.indd 17
8/5/08 17:07:29
18
Capítulo uno
causalidad. Este método también tiene otras dificultades. Antes que nada, el investigador trata de reconstruir los sucesos pasados a partir de informes subjetivos de quienes estaban vinculados con dichos acontecimientos, y la investigación ha mostrado que la gente no es muy buena para recordar el pasado. Un investigador descubrió que las madres no recordaban con fidelidad los detalles de su embarazo y el nacimiento de su hijo de seis meses a un año después de la experiencia. Ya se imaginará los problemas cuando los recuerdos son de 20 años de antigüedad. Otro posible escollo del método de la historia de caso son las tendencias del investigador al seleccionar los sucesos que van a informarse. En un curso de psicología, me pidieron que apoyara una teoría de la personalidad con los hechos de la vida del personaje principal de la novela Crimen y castigo. Fue fácil seleccionar los hechos que ofrecían un apoyo convincente para mi teoría. Sin embargo, descubrí que otros estudiantes de la clase habían utilizado el mismo libro para apoyar otras tres teorías de la personalidad, también de manera convincente. Habían elegido pasajes diferentes o interpretaron de otra manera los que yo había elegido. Incluso con el conjunto limitado de hechos descritos en un solo libro, estas tendencias revestían extrema importancia para determinar las relaciones que establecimos. No es de extrañar que los investigadores justifiquen sus propias teorías con el conjunto ilimitado de hechos en la vida de una persona. Se han escrito libros para analizar la vida y la personalidad de figuras históricas, como Richard Nixon, John Kennedy y Sigmund Freud. Aunque sean una lectura especulativa interesante, estos relatos, llamados psicohistorias, son susceptibles de todos los peligros inherentes a la historia de caso. Además, la mayoría de los hechos que los autores refieren para apoyar sus teorías se basan en informes de segunda mano publicados en los medios de difusión. Por tanto, estos autores están un paso más lejos de la verdad objetiva (por ejemplo, un autor concluyó que Nixon era psicótico; otro que era neurótico). El método de la historia de caso también ha sido utilizado en contextos experimentales aplicados para investigar sucesos inusitados. Por ejemplo, es prácticamente imposible que un psicólogo interesado en las causas de un accidente aéreo planee los experimentos apropiados. Así que tiene que reconstruir los hechos que preceden al accidente con el mayor detalle. Al reunir suficientes incidentes críticos que relativos accidentes y conatos de accidentes, esperan establecer un esquema que les permita emitir las hipótesis sobre las causas. Estas hipótesis pueden ser investigadas con profundidad en condiciones experimentales controladas. Uno de los usos más defendibles del estudio de caso atañe a la neuropsicología. Los especialistas de esta disciplina y los neurocientíficos están interesados en determinar la función de las estructuras del cerebro. Una de las formas de descubrir lo que hace una parte del cerebro consiste en destruirla y averiguar cómo cambia el comportamiento. En los seres humanos hay obvios problemas éticos con la destrucción de tejido cerebral. Debido a que no crece de nuevo, cualquier procedimiento similar produciría una lesión permanente. La solución estriba en dar con un alma desafortunada con tejido cerebral lesionado por un accidente o enfermedad. Si ha tomado algún curso de introducción a la psicología, tal vez recuerde el caso de Phineas Gage, un individuo que sufrió un accidente minero en el que
01Martin001-024.indd 18
8/5/08 17:07:29
Cómo hacer observaciones ordenadas
19
una varilla metálica le atravesó el cerebro. Fue uno de los primeros casos que los investigadores utilizaron para entender el funcionamiento del cerebro. En la actualidad se ha documentado extensamente el comportamiento de muchos pacientes con problemas neurológicos. Estos casos se utilizan junto con otros datos, como los provenientes de la investigación con animales, para entender el funcionamiento del cerebro humano. Sin embargo, recuerde que la información de estos estudios de caso bien documentados no proviene de la experimentación, así que tenga extremo cuidado al establecer una relación causal entre estas circunstancias y las conductas. La ventaja obvia del método de la historia de caso es que sirve cuando no hay más que uno o pocos casos para examinarlos. Algunos dirían que otra ventaja es que el comportamiento puede ser estudiado en toda su complejidad en un contexto natural, mientras que en los experimentos se estudian artificialmente los comportamientos simples en medios que no son naturales. Sin embargo, debido a que este método tiene las desventajas mencionadas, incluyendo que a veces se justifican en informes subjetivos, acaso tendenciosos, sacados de la memoria de largo plazo, deberíamos sentirnos escépticos acerca de las conclusiones obtenidas de una sola historia de caso.
■ Diseños cuantitativos o cualitativos Muchos investigadores que se especializaron exclusivamente en investigación cuantitativa o cualitativa consideran que quienes utilizan el otro método están equivocados. Los primeros sostienen que a menos que los datos se conviertan en cifras, no es posible organizarlos como los elementos básicos para erigir el conjunto de los conocimientos científicos y que la ciencia no puede avanzar si no elaboramos teorías que nos sirvan para entender el comportamiento, y sin la experimentación, y en cierto grado sin la observación correlacional, no se podría establecer la causalidad. Además de estos problemas, queda la pregunta de la confiabilidad de los datos reunidos. Como no estamos en posición de repetir la investigación, nunca sabremos si nuestros datos son confiables. Algunos experimentadores dirían que los investigadores cualitativos (como los etnógrafos) no hacen más que escribir descripciones de comportamientos, un trabajo para historiadores y novelistas, no para los científicos. Del otro lado del debate están los investigadores cualitativos, que sostienen que la experimentación se ocupa de fragmentos pequeños de comportamiento infrahumano y de escenarios artificiales. Dicen que los investigadores cuantitativos nunca serán capaces de entender a cabalidad el comportamiento humano real. Además, sólo la investigación cualitativa aprovecha el potencial de los individuos que son estudiados, utilizando sus conocimientos y creatividad para acumular conocimientos científicos. Algunos irían más lejos y aseverarían que hay problemas éticos en la experimentación en la que las personas son tratadas como objetos de estudio, no como seres humanos. En la postura más extremada están los investigadores cualitativos que rechazan por completo la ciencia tradicional y sostienen que los investigadores cuantitativos que no están dispuestos a aceptar los diseños cualita-
01Martin001-024.indd 19
8/5/08 17:07:30
20
Capítulo uno
tivos están motivados por el deseo de mantener el poder político y el silencio de los que tradicionalmente han sido oprimidos.7 Una posición razonable y moderada sería que, como científicos, deberíamos aprovechar cualquier diseño que fuera necesario para responder a nuestras preguntas. Cuando menos, podríamos utilizar los métodos cualitativos para ayudarnos a formular las hipótesis que podamos corroborar con más rigor mediante diseños cuantitativos. No hay ningún motivo para que, en algunos casos, no apliquemos los métodos combinados. Por ejemplo, muchas encuestas tienen una sección cuantitativa que reúne los datos numéricos en una escala, como la de Likert, y también una sección cualitativa en la que se hacen preguntas abiertas. En este caso, nos valdríamos de las preguntas abiertas para entender e interpretar respuestas cuantitativas. El siguiente ejemplo también se refiere una pregunta de investigación que ha sacado provecho de una combinación generosa de los métodos que hemos estudiado en este capítulo.
■ Uso de los métodos en combinación Para ilustrar cómo podríamos utilizar las técnicas de investigación para investigar una hipótesis, consideremos la siguiente situación. Está listo para incorporarse con su auto a la avenida; mira a ambos lados, empieza a pisar el acelerador y entonces pisa el freno y piensa: “¡Vaya! Ahí viene una motocicleta. ¡Por poco y no la veo!” O quizá era usted el motociclista y vio que un auto se detuvo delante, como si el conductor no lo hubiera visto. ¿Por qué ocurre esto? Como analizaremos en el capítulo 3, las observaciones y preguntas cotidianas pueden desembocar en hipótesis para la investigación psicológica. El primer paso al formular una hipótesis es examinar la situación lógicamente. ¿Cuál es la mayor diferencia entre las motocicletas y otros vehículos como autos y camiones?8 Las motocicletas son más pequeñas y menos visibles que los vehículos grandes. Pero nosotros no somos los primeros en haber pensado en esta idea. Cuando lea el capítulo 6, sabrá cómo averiguar si alguien más ha investigado sobre el asunto. Verá que mucha gente lo ha hecho. Paul Olson, del Instituto de Investigación del Transporte de la Universidad de Michigan, revisó parte de esta investigación y llamó a nuestra hipótesis la hipótesis de la motocicleta visible (Olson, 1989). Voy a tomar parte de la investigación que cita para ilustrar las técnicas de investigación que podríamos aplicar para investigar esta hipótesis. Primero, aunque hemos visto que el método de la historia de caso tiene muchas desventajas, puede ser útil para ayudarnos a formular una hipótesis. Para estudiar la hipótesis de la motocicleta visible, aunque de manera diferente del método clásico del estudio de caso en el que se estudia un caso único a profundidad, podemos localizar personas que casi
7
Los investigadores cualitativos más extremos son los postestructuralistas, que cuestionan la posibilidad de constituir una ciencia objetiva. Una crónica interesante de los orígenes de la investigación cualitativa se encuentra en el capítulo 1 de Ethnography and Qualitative Design in Educational Research, de Margaret D. LeCompte y Judith Preissle (1993). 8 Ya sé que las motocicletas son más divertidas. ¡Respuesta incorrecta!
01Martin001-024.indd 20
8/5/08 17:07:30
21
M
OT CON OC TE IC NID LE TA O: U SI NA GI LO SA
Cómo hacer observaciones ordenadas
se interpusieron en el camino de una motocicleta y preguntarles qué causó este comportamiento. ¿Hay un medio más sistemático de reunir estos datos? Por suerte, alguien ya realizó el trabajo por nosotros: la policía. Los informes de los accidentes son como un breve estudio de caso. Si tomáramos los informes de accidentes entre motocicletas y autos y los leyéramos, veríamos que los conductores que no dieron el derecho de paso a los motociclistas afirman que no los vieron o que no los vieron con tiempo suficiente para evitar la colisión. Esperaríamos esta afirmación si la hipótesis de la visibilidad fuera verdadera. Al interpretar estos resultados debemos tener presentes las limitaciones del enfoque del estudio de caso. Aunque en este ejemplo hemos logrado cierta seguridad por tener muchos casos, debemos recordar que los datos dependen de la memoria de la gente, que son reunidos por personas que no son especialistas en investigación y que son informes de los propios conductores que sufrieron un accidente y cuyas respuestas pueden tener secuelas legales. ¿Podríamos utilizar la observación naturalista para investigar nuestra hipótesis? Si nos sobraran los años, podríamos sentarnos en la esquina de una calle y esperar a que ocurriera un accidente de motocicleta para observarlo. Aquí también tenemos suerte, ya que los informes de los accidentes también incluyen los datos de los testigos y de los oficiales de la policía que constataron las consecuencias de los accidentes. Podemos realizar una investigación archivística y ver datos estadísticos de varios tipos de accidentes entre motocicletas y autos y compararlos con los choques entre dos autos para determinar las diferencias. Si hiciéramos esto encontraríamos que, en general, los autos y las motocicletas sufren la misma clase de colisiones con la misma frecuencia, excepto en el caso del motociclista que va derecho y el auto que va adelante vira a la izquierda. Debemos recordar que, como en todas las observaciones naturalistas, estos datos son cuando mucho observaciones correlacionales. El experimentador no manipula nada ni luego mide el cambio en el comportamiento. Quizá podríamos interpretar las estadísticas como justificación de la hipótesis de la visibilidad, pero una justificación es débil. ¿Por qué las motocicletas son menos visibles sólo en estas circunstancias? Quizá los conductores de los autos no hubieran visto a los motociclistas sin importar cuán visibles fueran, ya que miraban a la izquierda, en la dirección a la que giraban, en lugar de ver adelante, hacia la motocicleta.
01Martin001-024.indd 21
8/5/08 17:07:30
22
Capítulo uno
¿Podríamos aplicar el método experimental para investigar nuestra hipótesis? Como veremos en el capítulo 10, se usan técnicas cuasiexperimentales en casos en los que no es posible realizar el experimento completo. Un ejemplo de esa técnica sería revisar las estadísticas de accidentes de cada año antes y después del hecho que haya cambiado la visibilidad de las motocicletas. Afortunadamente, en 1967 varios de los Estados Unidos hicieron obligatorios los faros durante el día para las motocicletas. Si usted midiera un comportamiento en particular, como el accidente de una motocicleta, tantas veces antes del hecho y tantas veces después, crearía un diseño cuasiexperimental llamado series de tiempo interrumpidas. Este diseño no es tan riguroso como un experimento, pero es más que una observación correlacional. Con tal método, algunos investigadores primero calcularon que las colisiones durante el día se redujeron entre 4 y 20%. Sin embargo, investigadores recientes han concluido que el efecto de llevar un faro de día tiene un efecto minúsculo o inexistente en los accidentes de motocicleta. Asimismo, cuando se percibió un efecto del uso del faro en las motocicletas, el uso de los faros de los autos, aunque en relación con éstos nunca hubiera habido problemas de visibilidad, podría ser igualmente eficaz en la reducción de colisiones. Por tanto los datos del faro no son concluyentes. También podemos conducir experimentos formales para investigar el comportamiento de los automovilistas hacia las motocicletas. En un estudio, los observadores estimaron, con base en una observación de dos segundos, cuándo pasaría frente a ellos un vehículo que se aproximaba cuando éste se encontraba a 100 metros de distancia. No se encontró ninguna diferencia con motocicletas, autos y camiones. Las diferencias aparecieron cuando los observadores juzgaron el último momento en que podían incorporarse al tránsito adelante de un vehículo; estaban dispuestos a aceptar espacios más cortos, en promedio, con las motocicletas. Sin embargo, no se ha realizado ningún experimento para probar en concreto la hipótesis de la visibilidad. Esta investigación, citada por Olson (1989), ilustra con claridad las técnicas de investigación que pueden seguirse para corroborar una sola hipótesis. La investigación también ilustra algunas ventajas y desventajas de las técnicas. El estudio de caso y la observación naturalista son más realistas pero les falta rigor y precisión. En contraste, los experimentos formales son muy rigurosos, pero con frecuencia son criticados de poco realistas. En la tabla 1-1 se anotan ventajas y desventajas de los diseños que hemos examinado. No quiero dejarlo en ascuas. ¿Qué es lo que concluye Olson de su revisión? Piensa que la hipótesis de la visibilidad carece de apoyo. La alternativa más plausible sería que dado que las motocicletas son más pequeñas, son más fáciles de quedar tapadas por otros autos, postes, árboles y arbustos. Una posibilidad es que los conductores no ven las motocicletas no porque no sean visibles, sino porque están ocultas.
■ Resumen Como científicos del comportamiento humano, los psicólogos disponen de muchos diseños de investigación, todos dirigidos a establecer relaciones entre sucesos y a insertar estas relaciones en un conjunto de conocimientos ordenados. Entre los diseños cuantitativos está el
01Martin001-024.indd 22
8/5/08 17:07:31
Cómo hacer observaciones ordenadas
23
■ TABLA 1-1 Resumen de las ventajas y desventajas de varios diseños de investigación Diseño
Ventajas
Desventajas
Método experimental
Es posible un control preciso Es posible extraer conclusiones causales Es posible hacer mediciones precisas Es posible someter a prueba la teoría
Son típicos los escenarios artificiales Intrusión típicamente alta Es difícil medir los comportamientos complejos Es difícil realizar investigación exploratoria no estructurada
Observación correlacional
Pueden distinguirse las relaciones entre variables Es posible hacer mediciones precisas Intrusión usualmente baja
Es imposible establecer conclusiones causales Dificultad en el control de las variables Se requiere de muchos participantes
Cuestionarios
Recopilación eficiente de los datos Pueden medirse actitudes u opiniones
Es imposible establecer conclusiones causales Es difícil verificar los informes de las personas Es difícil la selección no sesgada de la muestra Bajas tasas de respuesta cuando se envía por correo
Investigación archivística
No se requiere acopiar datos adicionales Pueden estudiarse comportamientos inusitados Pueden estudiarse sucesos no manipulables
A menudo no se dispone de registros apropiados Los datos no son recabados por científicos Cuando mucho los datos son correlacionales
Etnografía
Pueden describirse situaciones no familiares Pueden describirse comportamientos complejos Poca intrusión Trato humanista a los participantes
Es imposible el control de las variables Es difícil hacer mediciones precisas Cabida a tendencias del investigador Es imposible establecer conclusiones causales
Observación naturalista
Situaciones reales ayudan en la generalización Poca intrusión
Es imposible el control de las variables La recolección de datos suele ser ineficiente Cabida a tendencias del investigador Es imposible establecer conclusiones causales
Historia de caso
Pueden estudiarse casos raros Pueden estudiarse de manera intensiva comportamientos complejos
Es imposible el control de las variables Los datos con frecuencia se basan en recuerdos falibles Gran probabilidad de tendencias del investigador Es imposible establecer conclusiones causales
01Martin001-024.indd 23
8/5/08 17:07:31
24
Capítulo uno
método experimental, que es el foco principal de este libro. Este método requiere que se manipule una circunstancia en particular y que se mida algún aspecto del comportamiento. Con un experimento es posible decir si la manipulación de la circunstancia causó algún cambio en el comportamiento. A veces, cuando no cabe seguir el método experimental, es necesario recurrir a observaciones correlacionales, en las que se observan las variables y se evalúan sus relaciones. Los resultados de tal estudio no sirven para establecer relaciones causales, debido a que ninguna de las variables está bajo el control del investigador. Las observaciones correlacionales se realizan con una encuesta en la forma de un cuestionario o entrevista. Los datos correlacionales también pueden obtenerse mediante la investigación archivística con datos contenidos de registros públicos o privados, como el censo o los registros judiciales. Algunos investigadores realizan una forma de investigación que emplea diseños cualitativos. Los investigadores cualitativos toman datos descriptivos: descripciones escritas de la gente, incluyendo opiniones y actitudes, y de los sucesos y ambientes. En la etnografía, los investigadores recurren a las entrevistas y a veces a las observaciones participantes para reunir datos descriptivos. En una forma de la investigación cualitativa, llevan a cabo la observación naturalista, en la cual se acopian datos de situaciones reales. Un diseño cualitativo que se emplea cuando no son muchas las posibles observaciones es la historia de caso, en la que se describen y analizan relatos detallados de los sucesos en la vida de la persona o en un incidente histórico.
01Martin001-024.indd 24
8/5/08 17:07:31
2
Cómo hacer experimentos Durante su larga historia que se remonta a mediados del siglo XIX, la psicología fue cultivada por pensadores agudos que no se daban cuenta de la necesidad de observar los hechos con sumo cuidado [. . .] Al cabo, los psicólogos decidieron que debían seguir el camino de la física, la química y la fisiología y transformaron la psicología en una ciencia experimental. R. S. WOODWORTH (1940)
Debemos tener cuidado de [. . .] no sacar una conclusión preconcebida de experimentos u observaciones cuya preparación es tan vaga que de hecho permiten hacer muy diversas inferencias. K. DUNLAP (1920)
E
n el capítulo 1 analizamos brevemente el método experimental. Recordemos que la principal ventaja de este tipo de investigación es que permite realizar afirmaciones causales: que una circunstancia produjo un cambio en el comportamiento. Debido a que esta afirmación es precisa, las reglas que la justifican son muy estrictas y la mayoría consisten en tomar en cuenta todas las circunstancias que pudieran variar. Por ejemplo, supongamos que nos interesa saber cuánto tiempo se tarda una persona en presionar un botón como reacción a una luz de determinada intensidad. En este momento hemos escogido manipular una circunstancia, la intensidad de la luz, y vamos a medir un comportamiento, el tiempo que se tarda el sujeto en presionar un botón. Estas dos variables tienen nombres formales.
■ Variables VARIABLES INDEPENDIENTES
La circunstancia de mayor interés en un experimento (la intensidad de la luz en nuestro ejemplo) recibe el nombre de variable independiente. La mejor manera de recordar el nombre es entender que la variable es independiente del comportamiento del participante. Como experimentadores, manipulamos esta variable, es decir, escogemos dos o más niveles para presentarle al participante, y nada que haga éste puede cambiarlos. Por ejem25
02Martin025-041.indd 25
8/5/08 17:09:22
26
Capítulo dos
plo, si nuestra variable independiente es la intensidad de la luz, podríamos seleccionar como nuestros dos niveles una intensidad alta y otra baja, y observar el comportamiento en ambas circunstancias. Si no tenemos al menos dos niveles, no haremos un experimento, aunque somos libres de escoger muchos más niveles o tener más de una variable independiente. En los capítulos posteriores analizaremos el diseño de estos experimentos más complejos. VARIABLES DEPENDIENTES
Después de elegir la variable independiente, tenemos que medir el comportamiento del participante en respuesta a las manipulaciones de la variable. El comportamiento que queremos medir se denomina variable dependiente, ya que depende de lo que haga el participante.1 Por ejemplo, en el experimento del tiempo de reacción nuestro objetivo es averiguar si hay una relación entre la intensidad de la luz y el tiempo de respuesta. Nuestra variable dependiente es el tiempo que transcurre desde que se enciende la luz hasta que el participante presiona el botón. Es útil hacer una afirmación acerca de la naturaleza esperada de la relación; tal afirmación se llama hipótesis. En el ejemplo, podríamos formular la hipótesis de que cuanto más intensa sea la luz, más rápida será la respuesta. El resultado del experimento determinará si la hipótesis se sostiene y si se vuelve parte del conjunto de conocimientos científicos o si queda refutada. En otras partes del libro estudiamos la hipótesis. En el siguiente capítulo veremos cómo se deducen hipótesis de las teorías y diremos que deben ser verdaderas si la teoría es verdadera. En el capítulo 12 analizaremos el concepto de hipótesis nula. Como veremos, es una afirmación estadística que indica que, en una población, la variable independiente no tiene efecto en la variable dependiente. Sin embargo, si uno piensa que en verdad la variable independiente no tendría efecto en el experimento, lo más probable es que no lo lleve a cabo. Más bien, lo que se predice es que los cambios que se sucedan en la variable independiente causarán cambios en la variable dependiente. Esta predicción es la hipótesis real. De hecho, con frecuencia los experimentadores van más allá de esta hipótesis no direccional que se limita a predecir un cambio y establecen una hipótesis direccional que prevé la dirección en que cambiará la variable dependiente conforme se manipule la variable independiente. En algunos casos las hipótesis no se basan en teorías, en particular cuando nada más se indaga qué pasaría con el comportamiento si se manipulara la variable independiente. En este caso, la hipótesis es nada más la respuesta a una pregunta: ¿Qué efecto tiene el hacinamiento en la agresión? En los exámenes de opción múltiple, ¿contesta lo primero que se le ocurre o piensa con detenimiento para sacar mejores calificaciones? ¿Los candidatos que sonríen en sus carteles de campaña tienen mayor probabilidad de ganar las elecciones que los que no sonríen? Las respuestas que se plantean como hipótesis de estas preguntas también contribuyen a los conocimientos científicos.
1
Creo que es más fácil recordar el término de esta manera, aunque la palabra dependiente en realidad se refiere a que el comportamiento es potencialmente dependiente de los niveles de la variable independiente.
02Martin025-041.indd 26
8/5/08 17:09:23
Cómo hacer experimentos
27
VARIABLES DE CONTROL
Hasta aquí hemos escogido manipular una circunstancia, la variable independiente. Sin embargo, hemos de dar cuenta de las otras circunstancias en un experimento. Una posibilidad es controlarlas, de manera que pasen a ser variables de control. Podemos controlar tales circunstancias asegurándonos de que no varíen nada. Por ejemplo, en nuestro experimento de los tiempos de reacción, exigiríamos condiciones de iluminación constantes, sólo participantes diestros, temperatura constante, etc. Idealmente, todas las demás circunstancias aparte de la variable independiente permanecerían constantes durante el experimento. Así sabríamos que cualquier cambio en la variable dependiente se debe a las modificaciones hechas en la variable independiente. El concepto de control es vital para la experimentación y distingue al método experimental de las otras formas de investigación que analizamos en el capítulo anterior. Cuando usted experimente, dispondrá muchas de las variables como variables de control. Como experimentador, tiene que asegurarse de que tiene el dominio completo de las variables de control de su experimento. Por eso los psicólogos se esfuerzan tanto en crear entornos especiales en los que se controlen el sonido, luz y temperatura y en usar equipos especiales que aseguren que las características del estímulo son constantes y que las respuestas son medidas con cuidado. Sin embargo, aunque muchas variables de sus experimentos sean de control, tenga presente que, especialmente en la psicología, no todas las variables serán de este género. En primer lugar, el experimentador no puede controlar todas las variables. Es imposible controlar muchas condiciones genéticas y ambientales, así como también imponer la cooperación, estados de atención, ritmo metabólico y muchos otros factores que atañen a los participantes humanos. En segundo lugar, no queremos controlar todas las variables en un experimento, pues de lo contrario crearíamos un conjunto único de circunstancias. Si pudiéramos controlar todas las variables al tiempo que manipulamos la variable independiente, la relación que se establecería en el experimento sería cierta sólo en un caso, aquel en el que todas las variables fueran idénticas a las variables de control. En otras palabras, no podríamos generalizar los resultados experimentales a otra situación. Como regla práctica, cuanto más controlado sea un experimento, menos generalizables serán los resultados. Por ejemplo, supongamos que el general Fulano de la Fuerza Aérea se presenta ante usted y le dice: “Me enteré de que realizó un experimento sobre tiempos de reacción. Dígame cuán intensa tiene que ser la luz de advertencia de disparo de mis aviones caza, para que mis pilotos respondan en menos de medio segundo.” Como usted realizó un experimento bien controlado, respondería: “Mire, si puede garantizar que el piloto sea un estudiante universitario de 19 años con un CI de 115, sentado en un cuarto de tres por cinco metros con aire acondicionado, sin sonidos distractores, sin nada más que hacer y que siempre dará la señal de advertencia un segundo antes de que la luz se encienda, entonces podré darle mi respuesta.” Ya se imaginará la respuesta del general. La moraleja es: si quiere generalizar los resultados de su experimento, no controle todas las variables.
02Martin025-041.indd 27
8/5/08 17:09:24
28
Capítulo dos
La posibilidad de generalizar un resultado experimental también recibe el nombre de validez externa: qué tanto puede generalizarse una relación causal a personas, escenarios y momentos. Cook y Campbell (1979) definieron varios tipos de validez. El término validez lo usan para denotar si se justifica sacar de un experimento conclusiones acerca de la causa. En las partes pertinentes de la obra presentaremos otros términos que significan validez. La validez externa corre peligro si se toma una muestra limitada, como estudiantes universitarios, cuando lo que quiere es generalizar a todos los seres humanos de cualquier edad o inteligencia (incluidos los pilotos de la fuerza aérea). O quizá podría realizar un experimento de laboratorio muy controlado que fuera generalizable a las situaciones reales en las que hay ruido, calor y mucha gente, y en las que los trabajadores están cansados y desmotivados pero tienen mucha práctica. En general, cuanto más controlados estén los experimentos, esto es, cuantas más circunstancias abarquen las variables de control, mayor es la probabilidad de que sucumba a las amenazas de la validez externa. VARIABLES ALEATORIAS
Ya que dijimos que no queremos controlar todas las circunstancias, ¿qué podemos hacer con las circunstancias restantes de nuestro experimento? Una posibilidad es dejar que varíen. ¿Cómo aceptamos esto sin perder la seguridad de que no se sesgará nuestro experimento? Una alternativa es permitir que algunas circunstancias varíen de manera aleatoria. Estas variables reciben el nombre de variables aleatorias. El término aleatorio o aleatorización se utiliza de diversas formas en la ciencia. Uno de sus usos se circunscribe al contexto de la selección aleatoria de los individuos o elementos de una población para formar una muestra representativa. En este caso, se cuenta con una población de individuos y se recurre a un proceso aleatorio para hacer que la selección de cualquiera de sus elementos sea tan probable como la selección de cualquier otro. La selección aleatoria asegura la validez externa, esto es, asegura que la muestra de elementos de la población seleccionada al azar es generalizable a esa población. Así, si pretende generalizar los resultados de un experimento a todos los estadounidenses, debe utilizar un medio de selección equivalente a poner el nombre de todos y cada uno de los habitantes del país dentro de un enorme sombrero y sacar una muestra de nombres. Entonces, afirmaría que seleccionó su muestra de manera aleatoria y podría pregonar una buena validez externa de sus resultados. Sin embargo, en este contexto la palabra aleatoria del término variable aleatoria se refiere a la asignación aleatoria de las circunstancias a los niveles de la variable independiente. Muchas de las circunstancias en un experimento tienen que ver con las diferencias de los participantes. Obviamente, si utilizamos los mismos participantes para varios niveles de la variable independiente, no tendremos que preocuparnos por las diferencias individuales. Sin embargo, si empleamos diferentes participantes para cada nivel de la variable independiente, tendremos que asegurarnos de que las características de los participantes asignados a cada nivel no sesguen nuestras conclusiones. Por ejemplo, supongamos que queremos determinar los efectos de la violencia de la televisión en la agresividad infantil. Después de
02Martin025-041.indd 28
8/5/08 17:09:24
Cómo hacer experimentos
29
seleccionar de manera aleatoria 200 niños de 6 años de edad como muestra de una población más grande, podríamos asignarlos aleatoriamente a dos niveles de la variable independiente: ver programas de TV violentos y ver programas de TV no violentos. Quizá podría lanzar una moneda al aire para cada niño y asignarlo al primer grupo si cae cara y al segundo si cae cruz. ¿Es posible que la mayoría de los niños del primer grupo vayan a escuelas violentas o coman mucha azúcar o provengan de hogares con malos tratos y que hubiera pocos así en el segundo grupo? Sí, pero si la selección de verdad fue aleatoria, es estadísticamente improbable que tales muestras tan grandes estuvieran sesgadas. Supongamos que dejamos que los niños miren las dos clases de programas en casa. ¿Es posible que la mayoría de los niños del primer grupo tuvieran un sistema de teatro con una gran pantalla en la casa, mientras que los del segundo grupo tuvieran televisiones portátiles pequeñas? También esto es posible, pero no probable; la aleatoriedad hace que esta posibilidad sea muy improbable. No hay ningún misterio en la asignación y selección aleatorias. Podemos valernos de cualquier método que le dé las mismas oportunidades de asignación o selección a cada elemento. Como en el ejemplo, si formamos dos grupos, podemos echar una moneda al aire.2 Si existen seis grupos, podemos lanzar un dado. Si hay 33 grupos, podemos utilizar 33 hojas de papel del mismo tamaño. La mayoría de los libros de matemáticas y libros de estadística tienen tablas de números aleatorios compuestas según un proceso equivalente a sortear 10 000 papelitos. Al final de este libro se incluye una tabla aleatoria, como apéndice C. Mediante el uso de cualquier columna o columnas de la tabla de números aleatorios, podemos asignar un número a cada elemento y seleccionarlo cuando salga ese número. Ignoramos las otras columnas o los números que no están en la lista. Si usted es un aficionado a la computadora, puede utilizarla para generar números o eventos aleatorios.3 Si ha escogido como variable aleatoria una circunstancia, debe cerciorarse de que varía en forma aleatoria, pues no todos los eventos que parecen aleatorios lo son en realidad. Por ejemplo, si trata de aleatorizar las condiciones en un experimento asignando usted mismo los eventos, ¡tenga por seguro que no es aleatorio! Los seres humanos somos notoriamente malos para producir eventos aleatorios. Si supone que los participantes se presentarán al experimento a lo largo del día o del semestre en orden aleatorio, se equivoca. Los voluntarios de la mañana o los de la tarde o los de principio del semestre o los del final tienen características diferentes. Los experimentadores novatos cometen errores cuando quieren hacer aleatorio algo. ¡No lo intente! Quizá la mayoría de las circunstancias que se conviertan en variables aleatorias de su experimento estén asociadas con los participantes y puedan aleatorizarse asignando al azar a los participantes. Pero hay otras que sin atañer a los participantes, de todos modos pueden ser tratadas como variables aleatorias. Supongamos que en nuestro experimento sobre la 2
La mayoría de las monedas se encuentran ligeramente sesgadas a favor de la cara, pero a menos que su experimento tenga más de 10 000 ensayos, no se preocupe por esto. 3 Aunque las computadoras no son perfectas para generar eventos aleatorios, son mucho mejores que las monedas. El método que utilice para asignar los eventos en un experimento no es determinante.
02Martin025-041.indd 29
8/5/08 17:09:24
30
Capítulo dos
violencia de la televisión, el salón en el cual los niños miran la televisión está desocupado ya sea en la mañana o en la tarde. Si usted cree que por alguna razón el hecho de mirar televisión en la mañana o en la tarde ocasiona diferencias en la agresividad de los niños, independientemente de la cantidad de violencia en el programa, entonces lo mejor es que asigne de manera aleatoria los grupos violentos y no violentos a la mañana y la tarde. Como resulta obvio, no es aconsejable que un grupo mire exclusivamente en la mañana y el otro en la tarde. Hay otras circunstancias que podrían afectar la agresividad de los niños y que cabría considerar como variables aleatorias, aunque no fuera posible realizar asignaciones aleatorias verdaderas; por ejemplo, qué tan borrascoso es el tiempo o qué tanta violencia hay en las noticias de un día determinado. Si su experimento pasa por varias sesiones, tendría razón al suponer que estas circunstancias están distribuidas de manera aleatoria entre los niveles de su variable independiente y que no sesgarán sistemáticamente sus resultados. Como dijimos, la mayor ventaja de la selección aleatoria es la posibilidad de generalizar los resultados. Cada vez que decida convertir una circunstancia en variable de control, sólo podrá generalizar los resultados a ese nivel de la variable. En cambio, si acepta que haya en la población muchos niveles de esa circunstancia y luego toma una muestra aleatoria, podrá generalizar a toda la población. La mayor ventaja de la asignación aleatoria es la eliminación del sesgo de los resultados. La aleatorización es una herramienta experimental poderosa. ALEATORIZACIÓN RESTRINGIDA
En algunos casos no se quiere hacer aleatoria o variable de control una circunstancia. La aleatorización y el control definen los extremos de un continuo. Entre estos dos extremos están diversos grados de aleatorización restringida. En este caso, usted controla una parte de las asignaciones de los eventos y hace aleatoria la otra. Supongamos que en nuestro experimento de tiempos de reacción supiéramos que la práctica es una variable importante. Si presentáramos primero todos los ensayos de baja intensidad, seguidos por todos los de alta intensidad, nos acusarían de sesgar el experimento, pues cualquier diferencia entre los tiempos de respuesta ante luces de baja y alta intensidad podría deberse a la mayor o menor práctica. Para evitar este problema, controlaríamos la variable de la práctica y realizaríamos un solo ensayo con cada individuo. O bien asignaríamos al azar los ensayos de baja y alta intensidad en, digamos, 12 ensayos mediante el lanzamiento de una moneda al aire y presentar una luz de alta intensidad siempre que caiga cara y una de baja intensidad siempre que caiga cruz. Sin embargo, esta alternativa quizá no sea la más atractiva, ya que podría dar como resultado una representación inadecuada de altas y bajas intensidades (por ejemplo, lanzar una moneda podría tener como resultado sólo tres ensayos de alta intensidad y nueve de baja). Para evitar esta posibilidad, escogeríamos un número igual de ensayos de alta y baja intensidad.
02Martin025-041.indd 30
8/5/08 17:09:25
Cómo hacer experimentos
31
Por tanto, como solución podríamos establecer una restricción sobre la asignación de los ensayos (un número igual para cada tipo de ensayo) y hacer una asignación aleatoria según esta restricción. Podríamos escribir la palabra “alta” en seis papeles y la palabra “baja” en otros seis, meterlos en un sombrero y después irlos sacando para determinar el orden de presentación. Este procedimiento satisfaría el requisito de que las condiciones se ordenen de manera aleatoria en todos los ensayos, con la restricción de que las dos intensidades están igualmente representadas. Por supuesto que es posible establecer otras restricciones. Tal vez queremos evitar la posibilidad de que al inicio de la secuencia haya demasiados ensayos con una determinada intensidad. Podríamos aleatorizar en bloques, que serían nuestra restricción. En esta variación, escogeríamos tres bloques de cuatro ensayos cada uno, asegurándonos de que seleccionamos de manera aleatoria dos ensayos de alta intensidad y dos de baja intensidad en cada bloque. Al describir este procedimiento, diríamos que asignamos al azar las condiciones a los tres bloques de cuatro ensayos, con la restricción de representar cada intensidad las mismas veces en cada bloque. Es legítimo aplicar tales restricciones, siempre que se especifiquen. Pero cuantas más restricciones haya, menos aleatorio será el proceso de selección y menos generalizables serán los resultados. VARIABLES DE CONFUSIÓN
Si diseñamos perfectamente nuestro experimento de manera que hayamos escogido una variable independiente que manipular y una variable dependiente que medir, y convertimos el resto de las circunstancias en variables de control, variables aleatorias o variables aleatorias sometidas a ciertas restricciones, no tendríamos que preocuparnos de la variable que vamos a analizar. Sin embargo, no todo experimento se diseña en forma perfecta y en muchas situaciones del mundo real es imposible diseñar un experimento perfecto. En este caso, necesitamos saber cuándo una variable de confusión asoma su fea cabeza. Cualquier circunstancia que cambie de manera sistemática conforme el experimentador manipula la variable independiente es una variable de confusión. Por ejemplo, supongamos que utilizamos tres intensidades de luz en nuestro experimento de tiempos de reacción: una luz de baja intensidad para los primeros 20 ensayos, una de intensidad media para los siguientes 20 y una de intensidad alta para los últimos 20. Si decimos: “La gente respondió con más rapidez a la luz de mayor intensidad”, alguien podría decir: “No, la gente responde más rápidamente después de practicar.” De hecho, los dos podríamos estar en lo correcto o cualquiera podría estar equivocado. El problema está en que, sin quererlo, confundimos el experimento con una variable que cambia de manera sistemática con la variable independiente. Un experimentador podría registrar las mediciones más perfectas, con la mejor prueba estadística y escribir los resultados con el estilo de Hemingway, pero una variable de confusión puede inutilizar todo el esfuerzo. Una disputa frecuente entre Coca-Cola y PepsiCo ilustra la confusión que causa esta variable (“Coke-Pepsi SlugFest”, 1976). Pepsi puso a
02Martin025-041.indd 31
8/5/08 17:09:25
32
Capítulo dos
competir su refresco de cola contra el de Coca en una prueba de bebedores en la cual los degustadores, que decían ser bebedores de Coca-Cola, bebieron Coca de un vaso marcado con Q y Pepsi de un vaso marcado con M. Más de la mitad de los degustadores dijeron que habían escogido el vaso que contenía Pepsi como su favorita. Los directores de Coca-Cola contraatacaron con su propia prueba de preferencias, pero no de colas, sino de letras. Sostenían que más personas escogían el vaso M que el vaso Q no porque prefirieran la cola del vaso M, sino porque les gustaba más la letra M que la Q. Esta hipótesis encontró apoyo cuando la gente que había sido examinada sostenía que prefería beber en el vaso M cuando ambos vasos contenían Coca-Cola. En este ejemplo, las letras eran una variable de confusión. Debido a que variaban de manera sistemática con las colas de la prueba original, los experimentadores no distinguían la preferencia de los degustadores por las colas de su preferencia por las letras. Dijimos arriba que Cook y Campbell (1979) identificaron varios tipos de validez. Otro tipo es la validez interna, que se refiere a si el cambio manipulado en la variable independiente causó el cambio en la variable dependiente o si lo provocó otra cosa. Si no lo causó la variable independiente, entonces la variable de confusión pudo haberlo hecho. De manera que si queremos evitar las variables de confusión en nuestros experimentos, necesitamos entender las amenazas a la validez interna. No hay tarea más importante para usted como experimentador que ser capaz de reconocer y, si es posible, evitar las amenazas a la validez interna que introduzcan en sus experimentos las variables de confusión.
■ Amenazas a la validez interna HISTORIA
En los experimentos de laboratorio, uno reúne los datos en todos los niveles de la variable independiente en un periodo corto. En este caso, es improbable que un cambio en la varia-
USTEDES SON UNA AMENAZA A LA VALIDEZ INTERNA
02Martin025-041.indd 32
8/5/08 17:09:25
Cómo hacer experimentos
33
ble dependiente se deba a la historia, a sucesos que tienen lugar en las pruebas de los niveles de la variable independiente. Por ejemplo, supongamos que quiere averiguar si mejoran las calificaciones por utilizar imágenes generadas por computadora en lugar de las transparencias dibujadas a mano que se proyectan en grandes salones. Supongamos, además, que un profesor enseña su curso introductorio sólo una vez al año. Por razones prácticas usted decide pedirle que utilice el material visual hecho en computadora este año y que compare las calificaciones de la clase con las de los años anteriores. Si descubre que las calificaciones son mejores que las de los años pasados, quizá tendría razón al atribuir el mejoramiento al uso de las imágenes generadas por computadora. Sin embargo, algún suceso histórico pudo haber causado el cambio. Por ejemplo, quizá la escuela hizo más estrictos sus criterios de admisión y, por tanto, cambió la calidad académica de los estudiantes en la clase. O quizás el colegio de ingenieros decidió exigir que todos sus alumnos de posgrado tomaran la materia, lo que cambió la composición de la clase. O tal vez aumentó el interés en la materia, como ocurrió con los cursos de computación cuando apareció la computadora. O la asociación local de alumnos consiguió los exámenes del año pasado y los pasó a ciertos estudiantes. Para estar seguros al concluir que el cambio en las calificaciones entre clases se debió al uso de las imágenes generadas por computadora, debemos descartar los sucesos históricos, como también otros que amenacen la validez interna de la conclusión. MADURACIÓN
La maduración es una amenaza a la validez interna causada porque los participantes se hacen mayores o ganan experiencia. Obviamente, la maduración es más una amenaza con los niños que con los adultos, como cuando se evalúan los efectos de los programas preescolares. Sin embargo, incluso en los adultos la maduración puede ser un problema en los experimentos de largo plazo o cuando los participantes sufren un cambio rápido, por ejemplo, cuando un empleado asume por primera vez responsabilidades gerenciales. SELECCIÓN
La selección es una amenaza cuando los experimentadores no pueden asignar al azar a los participantes, particularmente cuando, por razones prácticas, son los participantes los que se asignan a sí mismos a las condiciones. Si, en el ejemplo anterior, las clases escogidas para comparar fueran clases de otoño y primavera, la selección podría ser un problema. A la clase de introducción a la psicología que imparto en otoño asisten muchos estudiantes de primer año, muchos de los cuales estudian psicología. A la clase de primavera van muchos más estudiantes de ingeniería, para los cuales es obligatorio tomar este curso antes de su último año. ¿Cree usted que podría haber diferencias entre los grupos además del uso de imágenes generadas por computadora? Los experimentadores que reclutan estudiantes universitarios como participantes están familiarizados con las posibles diferencias entre
02Martin025-041.indd 33
8/5/08 17:09:26
34
Capítulo dos
voluntarios 4 de los primeros semestres y los de los últimos. En general, aquéllos son más nerviosos, están más motivados y probablemente sean mejores estudiantes o cuando menos mejores en la planeación de su tiempo. Las peores amenazas de selección son las que están vinculadas con la variable independiente. Por ejemplo, supongamos que quiere evaluar un nuevo programa de capacitación industrial. Usted esperaría a que los trabajadores se ofrecieran a cursar el nuevo programa y luego compararía su desempeño con el de los trabajadores que no lo tomaron voluntariamente. ¿Cree que habría una diferencia en los trabajadores que decidieron su asignación a cada uno de los grupos? ¿Qué hay acerca de la diferencia entre las tasas de recuperación de la gente que escogió una terapia nueva y los que la rechazaron? MORTALIDAD
Los participantes que abandonan un experimento, la mortalidad,5 también plantean una amenaza a la validez interna. Por fortuna, en la mayoría de los experimentos los participantes mueren sólo con respecto al experimento, no con respecto a la vida. La mortalidad general no es un problema; la mortalidad diferencial, sí. Ocurre cuando muchos o diferentes clases de participantes abandonan los grupos asignados a varios niveles de la variable independiente. Por ejemplo, supongamos que una compañía decide probar un nuevo programa de capacitación para preparar a los nuevos gerentes de nivel medio a enfrentar las situaciones sociales estresantes.
GRUPO CONTROL
GRUPO EXPERIMENTA
L
COLINA DEL RECLUTA
LA AMENAZA DE LA MORTALIDAD DIFERENCIAL La compañía escoge al azar a la mitad de sus nuevos gerentes para darles una hora diaria de confrontación personal simulada con los empleados. Los otros gerentes no pasan por el programa. Se contabiliza el número de quejas de salud de los dos grupos durante cinco 4
Un voluntario en este caso es como un voluntario en la milicia. Aunque algunos de los estudiantes que se agolpan alrededor de las hojas para apuntarse a los experimentos serían voluntarios incluso si tal servicio no fuera un requisito del curso, la mayoría lo hace en lugar de alguna otra actividad, como escribir un ensayo. 5 Mortalidad es el término utilizado por Cook y Campbell (1979). Algunos experimentadores también lo llaman desgaste.
02Martin025-041.indd 34
8/5/08 17:09:26
Cómo hacer experimentos
35
años después de la capacitación. La compañía ve que el grupo inoculado contra el estrés se queja menos y concluye que el programa fue un éxito. ¿Lo fue? Entre las preguntas que usted debe hacerse, está: ¿cuántos gerentes abandonaron cada grupo durante el programa? 6 Al contrario, la capacitación pudo haber sensibilizado a los gerentes para que fueran más conscientes de los problemas de salud relacionados con el estrés. Es probable que no sólo más gerentes hubieran abandonado el grupo de estrés, sino también que esos gerentes fueran más sensibles al estrés. El éxito de grupo de capacitación podría tener poco que ver con el procedimiento de preparación, y deberse por completo al hecho de que la mortalidad cambió las características de los grupos. PRUEBA
El acto de aplicar una prueba puede cambiar el comportamiento independientemente de cualquier manipulación. La prueba puede ser una amenaza para la validez interna cuando se utiliza un diseño de pretest o de pruebas múltiples. Supongamos que está interesado en saber si una nueva campaña de publicidad incrementará la conciencia del público sobre la marca de crema de rasurar de su compañía. Puede escoger al azar una gran muestra de consumidores y enviarles un cuestionario en el que les hace varias preguntas acerca de diversas marcas de crema de rasurar y los comerciales de las marcas. A los tres meses, después de lanzar nuevos comerciales de su crema de rasurar, envía de nuevo el cuestionario a las mismas personas y descubre que ahora están mucho más familiarizadas con su marca. Usted declara que su campaña ha sido un éxito. ¿Está en lo cierto? Un problema de la conclusión de que la campaña produjo un cambio en la conciencia es que el pretest en sí mismo pudo haber sido la causa. El pretest pudo haber sensibilizado a este grupo de participantes para que se fijaran en las marcas de crema de rasurar en general. Durante los siguientes tres meses, quizá esas personas vieron con más atención los comerciales de crema de rasurar y ahora saben más de las marcas, independientemente de la nueva campaña de publicidad. Además de sensibilizarlos, las pruebas pueden comunicar a los participantes el tema de interés del experimentador o incluso la hipótesis experimental. Un pretest también proporciona información, lo que aumenta los conocimientos de los participantes sobre el tema, de manera que las calificaciones en el postest son más altas, independientemente de la manipulación del experimento. REGRESIÓN ESTADÍSTICA
Quizá la regresión estadística sea la amenaza más sutil a la validez interna. El término se refiere al hecho de que cuando los experimentadores escogen a los participantes que hayan 6
Además de la amenaza a la validez interna de la mortalidad, que destacamos aquí, usted debe estar en posición de encontrar otras amenazas potenciales. Por ejemplo, el programa de capacitación podría incluir características de la demanda (véase el capítulo 4) que sesguen a estos gerentes para que no informen sobre problemas de salud relacionados con el estrés.
02Martin025-041.indd 35
8/5/08 17:09:27
36
Capítulo dos
calificado muy alto o muy bajo en una prueba en particular, en una segunda prueba sus calificaciones tienden a moverse hacia la media. No es obvio inmediatamente por qué ocurre la regresión hacia la media. Supongamos que ha diseñado un programa que, en su opinión, aumentará las puntuaciones del CI de niños en edad preescolar que han sido clasificados con un retardo ligero (CI de 53 a 68). Administra la prueba de CI y escoge a 30 niños cuyo puntaje está en el rango de retardo ligero. Después de un año de programa, les aplica de nuevo la prueba y descubre que el CI promedio del grupo se ha incrementado siete puntos y que este cambio es estadísticamente significativo. Así, afirma que su programa es un éxito. ¿Lo es? 7 ¿Cómo podría la regresión estadística haber causado o contribuido a este resultado? Imaginemos que el pretest del CI incluye dos componentes separados: un CI “verdadero” que una prueba perfecta mediría y el “error”. La prueba perfecta da con exactitud el mismo puntaje de un niño en particular cada vez que se aplica. Si pudiera utilizar tal prueba, la regresión estadística no sería un problema. Pero, por desgracia, el CI que mide también tiene un componente de error.
REGRESIÓN ESTADÍSTICA
TARIFA$ ESPECIALE$ “PERMÍTANOS MOVER SUS PUNTAJES A LA MEDIA”
ACENAJE CAMIÓN Y ALM
Este error puede deberse a un número de variables impredecibles. Por ejemplo, el niño tuvo suerte y adivinó las respuestas correctas de varios reactivos del pretest o no tuvo suerte y atinó menos respuestas correctas de las que dictaba el azar. O tal vez el niño se levantó con el pie izquierdo de la cama y no podía concentrarse en el pretest. O quizás el examinador estaba de mal humor esa mañana y no se relacionó bien con él. Debido a que no podemos 7
Para este momento, ya debe poder identificar diversas amenazas potenciales a la validez interna, aparte de la regresión. Es evidente el problema de la madurez durante el año, tratándose de preescolares. La prueba pudo haber sido también un problema. Probablemente el pretest de CI fue la primera prueba de cualquier tipo que esos niños hayan presentado. Es probable que hayan aprendido algo en general acerca de responder las pruebas. Acaso recordaban reactivos del pretest y aprendieron las respuestas durante el año.
02Martin025-041.indd 36
8/5/08 17:09:27
Cómo hacer experimentos
37
predecir el tamaño o la dirección de este componente de error en cualquier puntaje,8 debemos tratar el error como si sacáramos al azar un número del sombrero, que se sumara o restara del puntaje real. Cuando eligió el grupo con retardo ligero tomando como base una calificación baja en el pretest, probablemente escogió muchos más niños para los que el error era una desventaja que niños a los que inflaba artificialmente su puntaje real. Es decir, en promedio, los puntajes verdaderos de este grupo no fueron tan bajos como los que recibieron en el pretest. Debido a que decidió escoger sólo niños con puntajes bajos, usted mismo sesgó al grupo hacia los niños para los que el error era desventajoso. Sin embargo, al aplicar de nuevo la prueba después de un año, esperaríamos un error con un sesgo menor. Anticiparíamos que habría tantos errores que aumentaran las calificaciones reales, como errores que las disminuyeran. Todavía hay un componente de error, pero ya no sesga la puntuación medida alejándola de la calificación verdadera. Si aún no está convencido, intente esta pequeña demostración. Escoja cualquier puntaje verdadero, digamos 100. Escriba números de ⫺10 a +10 en papeles del mismo tamaño y póngalos en un recipiente. Saque un número, súmelo o réstelo a 100, escriba el resultado y reemplace el número. Después de hacer esto 30 veces, tome los cinco números más bajos y calcule la media (sume los números y divida el resultado entre 5). Ahora, siga el mismo procedimiento, sacar sólo cinco números y calcular la media. ¿La primera media es más baja que la segunda? Acaba de demostrar la regresión estadística. INTERACCIONES CON LA SELECCIÓN
Por último, las amenazas a la validez, como la maduración y la historia, pueden tener interacciones con la selección. Como ejemplo de una posible interacción de la selección con la historia, considere la siguiente investigación. Stanley Coren y sus colaboradores estudiaron archivos y descubrieron que las distribuciones de los diestros y los zurdos en grupos de edades que iban de 10 a 80 años eran muy diferentes (Coren y Halpern, 1991; Porac y Coren, 1981). Partiendo de 15% de zurdos en el grupo de los 10 años, el porcentaje declinó hasta 0% en el de 80 años. Concluyeron que los zurdos tenían una “menor capacidad de supervivencia” que hacía que murieran a edades más tempranas. Obviamente, muchos zurdos, madres de zurdos y esposos de zurdos se preocuparon por esta conclusión. Sin embargo, Lauren Harris (1993a) cuestionó las conclusiones y ofreció pruebas de que la interacción de la selección y la historia podrían haber causado el cambio en los porcentajes. Hace 80 años, la gente estigmatizaba a los zurdos, por lo que padres y maestros presionaban a los niños para que fueran diestros, los obligaban a comer, escribir y hacer las tareas con la mano derecha. En otras palabras, la presión social seleccionó la mano derecha. Pero la historia cambió esta selección. Con los años, ser zurdo se volvió más aceptable, y los padres y maestros presio-
8 Si emplea una prueba estandarizada, se hará una idea de la magnitud general del componente de error para la prueba, un número que caracteriza su confiabilidad. Cuanto más bajo sea este número, más debemos preocuparnos por los efectos de la regresión estadística.
02Martin025-041.indd 37
8/5/08 17:09:28
38
Capítulo dos
naron menos a esos niños para que se volvieran diestros. Harris sostuvo que había pocos zurdos en los grupos de mayor edad no porque se murieran, sino porque de por sí no había muchos. La discusión no se ha resuelto (vea Halpern y Coren, 1993; Harris, 1993b), pero el caso de la desaparición de los zurdos ofrece un ejemplo interesante de la posible interacción de la selección con la historia. Espero que esta exposición de las amenazas a la validez interna le ayude en su búsqueda de las variables de confusión. Cuando planee un experimento, es útil comprobar las amenazas para ver que ninguna vaya a representar un problema. En algunos casos enfrentará amenazas potenciales que son difíciles o imposibles de eliminar —en cuyo caso es posible utilizar un diseño cuasi-experimental. En el capítulo 10 estudiamos muchos de estos diseños.
■ Resumen del método experimental Ahora que está familiarizado con el uso del método experimental, vamos a incorporar los términos que hemos aprendido en un marco esquemático. En la figura 2-1 se resume el modelo experimental. A la izquierda, aparecen anotadas las circunstancias que pudieran afectar el comportamiento. A la derecha, los comportamientos potencialmente mensurables. Arriba a la izquierda, escogí una de las circunstancias para manipulación, la variable independiente. A la derecha, seleccioné uno de los comportamientos para medirlo, la variable dependiente. La flecha indica que nos interesa saber si la variable independiente ocasiona un cambio en la variable dependiente. Aunque podemos ignorar los otros comportamientos, necesitamos asegurarnos de que damos cuenta de todas las circunstancias. En la figura, dividí estas circunstancias en variables de control, variables aleatorias, variables aleatorizadas con restricciones y variables de confusión. Al dividir las variables, debemos tener presente que la decisión de controlar incrementa la precisión de los resultados (validez interna) pero disminuye su generalidad (validez externa). En el otro extremo, la decisión de aleatorizar disminuye la precisión pero incrementa la generalidad. Como ejemplo final para ilustrar los tipos de variables de un experimento, veamos una investigación que hicimos dos colaboradores y yo (Grobe, Pettibone y Martin, 1973), algunas de cuyas variables presento en una figura similar a la 2-1. Estábamos interesados en saber si el ritmo con que el profesor da su clase determina qué tan atentos están los estudiantes. En ese tiempo, enseñaba introducción a la psicología a un grupo de 200 estudiantes, así que tuve el dudoso honor de tratar de dar mi clase a diferentes velocidades. Como variable independiente, escogimos tres ritmos para impartirla. Traté de dar la lección en cada ritmo por lo menos cinco minutos de cada clase. Grabamos esa parte y contamos el número de sílabas por minuto para asegurarnos de que mi ritmo estaba dentro del rango de error permitido. En la figura 2-2 verá el ritmo de la clase listado como la variable independiente. Pudimos haber medido la atención de los estudiantes de muchas maneras: pudimos haber grabado en video a los estudiantes para que los jueces dedujeran el grado de atención, los estudiantes pudieron haber llenado un cuestionario en el que indicaran qué tan atentos se
02Martin025-041.indd 38
8/5/08 17:09:28
Cómo hacer experimentos
Circunstancias
39
Comportamientos
Variable independiente ➤ Variable dependiente
Variables de control
Variables aleatorias
Otros comportamientos posibles
Variables aleatorizadas con restricciones Variables de confusión FIGURA 2-1 Diagrama que representa un experimento. Una de las circunstancias fue escogida
como la variable independiente. Las otras fueron divididas en variables de control, variables aleatorias, variables aleatorizadas con restricciones y variables de confusión. Uno de los comportamientos se eligió como la variable dependiente.
sintieron en cada clase, etc. Por tanto, pudimos haber escogido muchos comportamientos como variables dependientes. Para tener una medición cuantitativa confiable, grabamos el ruido de fondo en el salón e inferimos que cuando los estudiantes estaban callados, era cuando estaban más atentos. En la figura 2-2 se muestran los niveles de ruido del lado del comportamiento, como variable dependiente. Muchas variables se volvieron variables de control y no cambiaron durante el experimento: el salón, el profesor, la hora del día que daba mi clase, los estudiantes, etc. Algunas de estas variables se anotan como de control en la figura 2-2. Dejamos sin control otras variables para que variaran al azar (espero), como qué tanto dormí la noche anterior, el estado del tiempo, el resultado semanal del equipo de futbol, cuántas personas del grupo estaban resfriadas (y tosían fuerte) y muchas más. Algunas de estas variables están entre las variables aleatorias de la figura. Aleatorizamos una variable con restricciones. Debido a que temíamos que el día de la semana pudiera afectar la atención, no quisimos tener las clases de ritmo lento los lunes, el ritmo medio los miércoles y el rápido los viernes. Por tanto, aleatorizamos el día de la semana en que utilizaría cada ritmo con la restricción de que cada día utilizaría cada ritmo el mismo número de veces.
02Martin025-041.indd 39
8/5/08 17:09:29
40
Capítulo dos
Variable independiente
Variables de control
Circunstancias Ritmo de la clase
Comportamientos ➤
Nivel de ruido
Salón
Calificación de los jueces
Profesor
Calificación de los estudiantes
Variable dependiente
Hora del día Estudiantes Sueño del profesor
Variables aleatorias
Estado del tiempo Resultado del juego del equipo Salud de los estudiantes
Variables aleatorizadas con restricción Variables de confusión
Otros comportamientos posibles
Ritmo dentro del día de la semana Tono de voz Proporción de palabras por tema
FIGURA 2-2 División de las variables del experimento del ritmo de la clase en variables indepen-
dientes, variables de control, variables aleatorias, variable aleatorizada con restricción, variables de confusión y variable dependiente.
Por último, aunque tratamos de minimizar las variables de confusión, sabíamos que, como en muchos experimentos aplicados, las habría de todas maneras. Una fue, sin duda, el tono promedio de mi voz. No soy una máquina, de manera que como con toda la gente, mientras más rápido hablo, más alta se vuelve mi voz. Estoy seguro de que el tono se confundió con el ritmo de mi clase. Además, aunque la duración de la lección era constante, conforme hablaba más rápido pronunciaba más palabras acerca de un tema en particular o decía el mismo número de palabras pero variaba el número de temas cubiertos. Traté de hacer lo primero, de manera que la proporción de palabras por temas se confundió con el ritmo de la lección. También se apuntan estas dos variables en la figura 2-2. Espero que este ejemplo ilustre cómo pueden dividirse las variables en diversos tipos de circunstancias y comportamientos.9
9
Una lectora dijo que quisiera saber el resultado de este experimento. Brevemente diré que encontramos que el ritmo de la clase afectaba la atención. Por fortuna, los niveles de ruido ambiental fueron más bajos con mi ritmo medio. Los niveles de ruido fueron más altos con el rápido. Sacamos la conclusión de que es más conveniente un ritmo medio y que es mejor cometer el error de ir demasiado lento que demasiado rápido.
02Martin025-041.indd 40
8/5/08 17:09:29
Cómo hacer experimentos
41
■ Resumen El método experimental permite hacer afirmaciones causales, es decir, que cuando la circunstancia se manipula, causa un cambio en el comportamiento. La circunstancia que se manipula se llama variable independiente y el experimentador la establece cuando menos en dos niveles. El comportamiento medido recibe el nombre de variable dependiente, ya que depende de los niveles de la variable independiente. La relación predicha entre las dos variables recibe el nombre de hipótesis. Si la predicción es que la variable independiente causará el cambio en la variable dependiente, se dice que es una hipótesis no direccional, pero si la predicción es acerca de la dirección del cambio, entonces será una hipótesis direccional. Algunas de las demás circunstancias reciben el nombre de variables de control; son establecidas a un nivel particular y no se les permite variar. Otras circunstancias reciben el nombre de variables aleatorias y se les puede permitir variar al azar. En general, las variables aleatorias mejoran la validez externa de un experimento y permiten generalizarlo a otras personas, situaciones y tiempos. Algunas circunstancias reciben el nombre de variables aleatorizadas con restricciones, a las cuales se les permite variar aleatoriamente pero dentro de los límites impuestos por el experimentador. Éste debe tratar de eliminar o minimizar las variables de confusión, que cambian de manera sistemática con la variable independiente y distorsionan la relación entre las variables independientes y dependientes. Las variables de confusión pueden disminuir la validez interna y dificultar afirmar que sólo la variable independiente causó un cambio en la variable dependiente. Entre las amenazas a la validez interna, se encuentran la historia, la ocurrencia de un suceso no controlado durante el experimento; la maduración, el cambio de edad o experiencia de los individuos durante la experimentación; la selección, la asignación sesgada de los individuos a los grupos; la mortalidad, la pérdida no aleatoria de individuos de los grupos; la prueba, el cambio en los participantes debido a un proceso de prueba; la regresión estadística, el movimiento de los puntajes hacia la media en los grupos seleccionados sobre la base de los puntajes extremos, y las interacciones con la selección, el efecto diferencial de una amenaza sobre grupos no equivalentes.
02Martin025-041.indd 41
8/5/08 17:09:29
3
Cómo tener una idea para experimentar Uno observa mucho cuando sólo mira. YOGI BERRA
La perfección es el gran enemigo de un buen principio. ANÓNIMO
Cuando probaba la primera hipótesis con el método experimental, acudieron a su mente muchas otras hipótesis, y cuando las probaba, se le ocurrieron otras y al probarlas, más y más ocuparon sus pensamientos hasta que se le hizo dolorosamente patente que conforme probaba hipótesis y las eliminaba o confirmaba, su número no disminuía, sino que se incrementaba. R. M. PIRSIG (1975)
Cuanto más dilatada es la isla del conocimiento, más extensa es la costa de lo desconocido. JOHN DONNE
No sabemos ni una millonésima de uno por ciento acerca de nada. THOMAS ALVA EDISON
Einstein me dijo que siendo joven se le ocurrió la idea del hombre que corría detrás de un rayo de luz y el que estaba en un elevador que cae. La imagen del hombre tras el rayo de luz llevó a la teoría de la relatividad. La imagen del hombre en el elevador condujo a la teoría de la relatividad general. L. INFELD (1950)
[Holmes:] No tengo los datos todavía. Es un error garrafal teorizar antes de tener los datos. Sin darse cuenta, uno empieza a retorcer los hechos para que concuerden con las teorías, en lugar de que las teorías se ajusten a los hechos. A. CONAN DOYLE (1891-1989)
U
na vez cometí la osada tontería de encargar a mis estudiantes de introducción a la psicología la tarea de proponer siete experimentos como requisito del curso. Sus primeras reacciones me dejaron perplejo. Por encima del rechinido de los dientes, los quejidos y gemi42
03Martin042-067.indd 42
8/5/08 17:11:50
Cómo tener una idea para experimentar
43
dos, se podía escuchar la queja de mis estudiantes estupefactos: “¿De dónde sacamos una idea?” Se me hacía difícil entender por qué era problemático concebir una idea, pero también fue difícil responder la pregunta. Ahora he ponderado el problema y me he formado una opinión de por qué ocurre y qué puede hacerse para resolverlo. No creo que el problema sea que los estudiantes no tengan ideas. Cuando niños, somos curiosos acerca de todo, incluyendo el comportamiento humano: “Mami, ¿por qué aquel señor está tan gordo?” “¿Por qué Jenny come con la mano izquierda?” “¿Por qué no puedo deletrear tan bien como Betty?” “¿Por qué los papás de Tommy le pegan tanto?” Me rehúso a creer que esta curiosidad se desvanezca. De hecho, los mismos estudiantes que “no tienen una idea” elucubran muchísimo acerca del comportamiento humano en fiestas o en reuniones de solteros: “¿Cuál es la mejor manera de estudiar para mi examen de biología?” “¿Me caso con él o nada más vivimos juntos?” “¿Soy más creativo por la mañana?” Por esta razón me niego a creerle que no tenga ideas para su experimento. No es verdad que no tenga ideas. Lo que puede ser cierto es que tenga miedo de que no sean buenas las ideas que se le ocurran. Este temor puede paralizar su creatividad natural y, con el tiempo, hacer que todas sus ideas le parezcan inadecuadas.
■ Temor a las ideas de experimentos Los temores sobre las ideas para experimentos son irracionales y provienen de malentendidos sobre los experimentos de psicología. Los psicólogos los llaman fobias. Como yo mismo soy psicólogo, no puedo resistirme a la tentación de enumerar las fobias que sostienen nuestra inhabilidad de concebir ideas para experimentos. Las siguientes son las más comunes.1 GENIOFOBIA (EL TEMOR A LA GENIALIDAD)
La geniofobia proviene de la creencia muy común de que quien hace una investigación debe ser un genio y que las modestas facultades mentales de uno no estarían a la altura. Los investigadores hacen poco por contradecir esta creencia y se sabe de algunos que la fomentan. Durante años, cada vez que leía un artículo me imaginaba al autor como un hombre viejo y sabio con mechones de pelo blanco. Me sobresalté al saber que muchos experimentadores son jóvenes, gente ordinaria que comete errores torpes y dice tonterías como el resto de nosotros. Mi propia geniofobia todavía se está curando. Cuanto más conozco a los psicólogos experimentales, menos creo que sólo los genios puedan hacer este trabajo.2 Así que relájese. Sus ideas son tan buenas como las de ellos cuando empezaron. 1
Cualquier semejanza de estos nombres con la terminología psicológica aceptada es pura coincidencia. No quiero decir que los psicólogos experimentales sean más torpes que los demás científicos. Los biólogos y los físicos también lo son.
2
03Martin042-067.indd 43
8/5/08 17:11:51
44
Capítulo tres
UN PREFÓBICO MIENTRAS CONCIBE MONTONES DE IDEAS
IMITATOFOBIA (EL TEMOR A IMITAR)
La gente con imitatofobia tiene miedo de proponer una idea si no es absolutamente original. Un imitatofóbico que combina este temor con la creencia de que todo lo que vale la pena ya fue pensado por otras personas alcanza el estado de parálisis total. Los experimentadores originales son pocos en psicología. La mayoría de los experimentadores utilizan las variaciones del método ideado por otro para probar la teoría de un tercero. En el capítulo 6 aprenderemos a descubrir lo que otros experimentadores han hecho en su campo de interés y verá exactamente qué tan poco original es usted. Como sea, no tenga miedo de hacer avanzar la ciencia a pasitos. Eso es lo que hacemos todos. PARAFERNALIAFOBIA (EL TEMOR AL EQUIPO) Y MANUFOBIA (EL TEMOR A HACER COSAS CON LA MANO)
Si la suma total de sus conocimientos de mecánica automotriz es que el pedal derecho sirve para avanzar y el pedal izquierdo para detenerse, es un candidato ideal a la parafernaliafobia. Esta enfermedad lo ahuyentará de cualquier idea de un experimento que requiera un aparato más complicado que un mazo de cartas. Por otro lado, si no piensa realizar ningún experimento o si no tiene un equipo científico muy moderno, entonces es víctima de la dolencia opuesta, manufobia. Todo mundo sabe que cuanto más complejo el equipo, mejor la investigación. Ambas fobias son infundadas. Algunas de las mejores investigaciones han utilizado poco o ningún equipo. Jean Piaget desarrolló un gran campo de la psicología infantil sin más aparatos que bloques de madera, vasos de agua y plastilina. Otros campos de la psicología, como el aprendizaje verbal, la formación de conceptos, la evaluación de actitudes y la personalidad, no requieren más que papel y lápiz. Un aparato
03Martin042-067.indd 44
8/5/08 17:11:51
Cómo tener una idea para experimentar
45
puede ayudar a la investigación, pero no es la investigación en sí misma. Además, cuando es necesario un aparato, alguien estará disponible para enseñarle a usarlo. PARSIMONIFOBIA (EL TEMOR A LA SIMPLICIDAD)
Los parsimonifóbicos piensan que deben preparar grandes experimentos que cambiarán el curso de la ciencia de un solo golpe. Su lema es: “Si es simple, no puede ser ciencia.” Aunque realizar experimentos complejos tiene sus ventajas, es más conveniente enfocarse en el experimento más simple con que se pueda responder a su pregunta experimental. La gente con parsimonifobia rara vez termina sus grandes experimentos; y cuando lo hace, casi nunca puede interpretar los resultados. Entonces, para iniciar uno, piense en lo sencillo. Siempre podrá indagar sobre las preguntas complejas más adelante (en el capítulo 9 explicaremos lo que se entiende por experimentos simples y complejos). CALCULOFOBIA (EL TEMOR A LA ESTADÍSTICA)
Algunas personas se asustan de tener que hacer cálculos más difíciles que contar con los dedos. Si nunca se acuerda de cómo calcular el rendimiento de gasolina por kilómetro o cómo balancear su chequera, entonces es un calculofóbico. Si piensa sólo en experimentos que requieren pruebas estadísticas simples, recuerde que tales pruebas son herramientas para interpretar sus resultados y no tienen por qué llevarlo a desechar buenas ideas para experimentos. Siempre habrá alguien con afición por los números que le ayude a analizar los datos. No digo que los conocimientos de estadística carezcan de importancia, pero es sólo una herramienta de la ciencia, no la ciencia misma.
UN CALCULOFÓBICO IMPERFECTOFOBIA (EL TEMOR A SER IMPERFECTO)
Un imperfectofóbico no hablará de una idea para un experimento hasta que no haya resuelto el mínimo detalle y la propuesta parezca el informe final. Esta actitud proviene de haber leído demasiados artículos muy bien presentados. Como veremos en el capítulo 5, los ar-
03Martin042-067.indd 45
8/5/08 17:11:52
46
Capítulo tres
tículos publicados son productos finales; rara vez reflejan el pensamiento desmañado y el aire de confusión que antecede a la mayoría de los experimentos. Los experimentos terminados son diferentes de sus ideas originales. La idea inicial para un experimento forma apenas el núcleo; el procedimiento experimental evolucionará conforme se establezca y realice el experimento. Si pone manos a la obra y empieza a hablar de su experimento de una manera general, otros podrán ayudarle para que lo transforme en un experimento perfecto. Bueno, casi perfecto. PSEUDONONFONOSCIENCIAFOBIA (EL TEMOR A NO SONAR CIENTÍFICO)
La gente con esta aflicción tan atroz sólo reconoce una gran idea si está expresada en la jerga científica.3 La jerga científica es un seudolenguaje que algunos científicos inventan para oírse bien cuando hablan con otros científicos que hacen investigaciones similares. Ayuda a oscurecer la investigación para el público general y a veces para otros científicos también. Por ejemplo, en jerga, un experimento diseñado para determinar si la gente recuerda las palabras mejor cuando están en grupos es una investigación “del efecto del agrupamiento taxonómico y categórico en la retención de material verbal”. O la idea de que la gente vive en vecindarios del mismo grupo étnico por la presión de sus amigos se describe como un experimento que examina “el efecto de la distribución demográfica por la afiliación étnica, como función de la presión de grupo”. La jerga se deja traducir fácilmente al lenguaje cotidiano. Si está interesado en “el efecto de la preferencia afiliativa sobre la notoriedad de las dimensiones en la percepción de la persona”, en realidad quiere descubrir si la gente que se une a ciertas organizaciones ve a los demás de cierta manera peculiar. Trate de traducir esto: “los efectos del empleo materno en las tendencias agresivas entre hermanos”.4 ERGOFOBIA (EL TEMOR AL TRABAJO)
Lo siento, no existe cura conocida para esta enfermedad. Ahora que estamos conscientes de los temores que pueden bloquear nuestra creatividad, tratemos de obtener algunas ideas para experimentos. ¿Cuál es la mejor manera de empezar?
■ Observación Alguien dijo una vez que es fácil escribir: sólo siéntate enfrente de la computadora y fija la mirada en el teclado hasta que aparezcan gotas de sangre en tu frente. También es una descripción de la mejor manera de no tener buenas ideas para experimentos. Como estamos 3
Jerga significa: “habla o escritura caracterizada por pretensiones, terminología compleja y sintaxis rebuscada”, en lugar del significado: “el lenguaje peculiar de un tema, profesión o grupo particular”. 4 Si se acerca a: “¿los hijos de las madres trabajadoras pelean más?”, ya entendió. No deje de comprar mi próximo libro: Jerga científica para divertirse y lucrar.
03Martin042-067.indd 46
8/5/08 17:11:52
Cómo tener una idea para experimentar
47
interesados en el comportamiento humano y no en el comportamiento del teclado, lo mejor que hay que hacer es observar a los seres humanos, ¡no a los teclados! Concebir ideas para experimentos es cuestión de observar lo que pasa alrededor. Cuando se vuelva un buen observador, su curiosidad natural le sugerirá preguntas que se pueden probar experimentalmente. Una semana de observación constante le proporcionará los suficientes experimentos para tres carreras. Mucho de la investigación clásica de la psicología experimental inició con una simple observación. Si la esposa de Eckhard Hess no hubiera observado que las pupilas de éste se hacían más grandes cuando miraba pinturas de aves, tal vez nunca hubieran ideado la pupilometría. Si Iván Pavlov no hubiera observado que sus perros salivaban ante estímulos distintos de la carne, quizá Igor Nosnoranovitch habría sido el padre del condicionamiento clásico. Si Jean Piaget no hubiera observado que su hija Jacqueline dejaba de hacer ruidos de gorgoteo cuando ya no veía su botella, acaso mejor se hubiera convertido en un famoso relojero suizo. La mayoría de las ideas experimentales revolucionarias han surgido de la simple observación. OBSERVACIÓN PÚBLICA
Después de leer los siguientes párrafos, tome papel y lápiz y váyase adonde haya gente para observar. Como ejercicio de entrenamiento en observación, haga notas de preguntas experimentales posibles que se le ocurran en su caminata. Primero vamos a dar un paseo para mostrarle lo que quiero decir: salgo y veo que brilla el sol. 1. ¿La gente trabaja más o menos cuando el tiempo es agradable? Camino entre dos trabajadores que vacían concreto en un armazón para sujetar bicicletas. Uno trabaja, mientras que el otro observa. 2. ¿Los trabajadores flojean más si están sindicalizados? Un par de corredores pasan a mi lado. 3. ¿La gente que hace ejercicio regular duerme mejor de noche? Una muchacha está sentada a la sombra de un árbol con un joven barbudo. Se muestran cariñosos y me siento como un mirón. Mejor me voy. 4. ¿A las mujeres les gustan más los hombres con barba que los lampiños? Veo un gran grupo de estudiantes entrando a un salón de clases. 5. ¿Los estudiantes de grupos grandes tienen mejores calificaciones que los de grupos pequeños? Llego a un cruce. ¿Se detendrá el auto? Sí lo hizo. Cruzo.
03Martin042-067.indd 47
8/5/08 17:11:53
48
Capítulo tres
6. ¿Es más probable que los conductores den el derecho de paso a los peatones del sexo opuesto? Me detengo y observo los autos deportivos que pasan a toda velocidad por la calle. 7. ¿La gente conduce autos deportivos más rápido que los autos normales? Regreso a la biblioteca. 8. ¿Los alumnos que estudian en la biblioteca retienen mejor la información que los que estudian en su recámara? Paso por el armazón para sujetar bicicletas que está a la entrada del edificio de mi cubículo y veo cientos de bicicletas. 9. ¿Son las bicicletas de montaña más fáciles de montar que las normales? Subo por las escaleras hasta mi oficina. Estoy de regreso. Acabo de tener nueve ideas potenciales para experimentos. ¡Casi una por minuto! Ahora hágalo usted mientras lo espero.
YO MIENTRAS ESPERO ¡Hola! ¿Tuvo muchas ideas? Piense en las ideas que tendría si fuera ese observador en todo momento. Ahora el problema es qué idea debería convertir en experimento, ya que no todas las preguntas importantes pueden contestarse mediante experimentación. Todas las preguntas experimentales deben pasar la prueba ROE: deben ser repetibles, observables y examinables. Algunas preguntas no funcionan puesto que no son repetibles. Por ejemplo, los creyentes en la percepción extrasensorial (PES) afirman que sólo ocurre en ciertas condiciones y que es imposible predecir cuándo se darán estas condiciones adecuadas. En otras palabras, la PES funciona sólo ocasionalmente y no cumple la prueba de la repetibilidad. En tanto que este principio básico gobierne los efectos de la PES, es imposible examinar la existencia de esta habilidad. Otras preguntas no sirven porque no son observables: “¿Los perros piensan como los seres humanos?” “¿Mi experiencia del color rojo es la misma que la suya?” Por último, algunas preguntas no sirven por que no se prestan a examen. Por ejemplo, la ciencia no puede responder preguntas morales, como: “¿Es malo el aborto?” “¿Es aceptable que las mujeres lleven minifalda?” “¿Son malas las drogas?” Aunque podemos aplicar el método científico para determinar las opiniones de la gente acerca de estas preguntas, no podemos idear una prueba que responda a las preguntas en sí. Por tanto, debemos eliminar tales preguntas de la lista de ideas experimentales.
03Martin042-067.indd 48
8/5/08 17:11:53
Cómo tener una idea para experimentar
49
¿Todas las preguntas de su lista de ideas cumplen los requisitos ROE? Tómese un momento para repasar la lista y eliminar las que no lo cumplan.
¿LOS PÁJAROS HACEN ESO A PROPÓSITO?
NO TODAS LAS PREGUNTAS SIRVEN PARA EXPERIMENTAR Después de leer el capítulo 1, también sabe que ciertas preguntas deben ser respondidas por observación correlacional, más que por experimentación. Por ejemplo, si como en la pregunta 7 queremos analizar la respuesta sobre si la gente que prefiere los autos deportivos maneja más rápidamente, entonces deberemos hacer una observación correlacional. Por otro lado, si queremos responder a la pregunta de si la gente conduce más de prisa si va en un automóvil deportivo, deberemos diseñar un experimento. Vuelva a echarle una mirada a su lista de ideas y márquelas como experimental o correlacional. Nuestros pequeños paseos han sido interesantes, pero la gente en público nos proporciona un escenario limitado de comportamientos. ¿A quién más podemos observar? OBSÉRVATE A TI MISMO
La introspección fue una de las primeras técnicas de la psicología experimental. Sin embargo, los introspeccionistas se concentraban en sus propios procesos mentales, no en su comportamiento. Debido a una controversia iniciada acerca de si una persona está en posición de conocer sus propios procesos mentales, los psicólogos experimentales dejaron de observarse a sí mismos. En lugar de seguir la regla: “Conócete a ti mismo”, decidieron: “No te conozcas tú.”5 Todavía se desaprueba que uno, como psicólogo, haga un experimento en el que uno sea el único participante; no obstante, puede tener buenas ideas experimentales de esta manera. No sólo será capaz de reunir muchas muestras del comportamiento en el cual está interesado, sino que también podría tener alguna idea de por qué hizo lo que hizo. Lo primero puede darle una idea para un experimento; lo segundo, una idea para una teoría (examinaremos las teorías más adelante). Con poco esfuerzo, puede empezar por observar su propio comportamiento. Pudiera parecer ridículo sugerir que usted no se observa a sí mismo, pero probablemente sea cierto. 5
Algunos psicólogos experimentales todavía no saben quiénes son.
03Martin042-067.indd 49
8/5/08 17:11:54
50
Capítulo tres
¿CÓMO ESTÁ USTED?
OMÓC¿ ÁTSE ?DETSU
CONOCIÉNDOSE A SÍ MISMO Al vestirse, ¿cuál brazo introduce primero? Cuando se lava los dientes, ¿se cepilla primero el lado izquierdo o el derecho? ¿Mete su llave en la cerradura con los dientes para arriba o hacia abajo? Cuando cruza sus piernas, ¿cuál de las dos pone con más frecuencia sobre la otra? Éstas son las cosas que hace todos los días. ¿Las nota? Observarse a sí mismo puede ser entretenido,6 como también una buena fuente de ideas. Escriba las ideas conforme se le ocurran. OBSERVE A SUS AMIGOS
Sus amigos son también buenas fuentes de ideas experimentales. Sin embargo, es importante observar su comportamiento de manera tan discreta como sea posible. Mirar fijamente se considera descortés en el mejor de los casos y, en el peor, incita a una pelea. A veces a la gente no le gusta mucho la manera en que se comporta y preferiría que no la observaran. Por consiguiente, para no perder amigos, guárdese sus observaciones. Sacarlas a colación, por brillantes que sean, no le ayudará a ganar amigos ni a influir en las personas. OBSERVE A LOS NIÑOS
Observar a los niños es una necesidad si se interesa en hacer experimentos en el área de la psicología del desarrollo, aunque los niños también pueden darle buenas ideas para otras áreas de investigación. Si no ha sido bendecido con hijos,7 de seguro tiene amigos y parien6
Si adquiere esta habilidad, tendrá que aprender a controlarse en público. Pensarán que es raro si su propio comportamiento le causa accesos de risa. 7 O asolado (según su punto de vista).
03Martin042-067.indd 50
8/5/08 17:11:54
Cómo tener una idea para experimentar
51
tes que estarían más que felices de que les cuidara a sus niños un rato. A diferencia de los adultos, que aprendieron que su comportamiento debe aparecer racional, lógico y constante al observador externo, los niños se comportan con sencillez, sin complicaciones ni inhibiciones sociales. Debido a que a los niños les importan poco las normas de los adultos, podrá observar relativamente sin contaminación las pautas del comportamiento infantil. OBSERVE MASCOTAS
Los animales son interesantes para estudiar por derecho propio, aunque mucho de su comportamiento puede ser generalizado a los seres humanos. Hasta verá que las mascotas son más desinhibidas que los niños. Como son menos capaces de exhibir pautas de comportamiento muy complejas, sus actos son más fáciles de interpretar. Además, uno puede manipular el ambiente de las mascotas sin preocuparse tanto de las implicaciones morales del posible daño permanente (véase en el capítulo 4 una exposición de la ética del tratamiento a los animales).
OBSERVE A SUS MASCOTAS
■ Observación vicaria Aunque sea menos emocionante que la observación directa, también se sacan ideas para experimentos leyendo las investigaciones de otros. Acaso le parezca que esta técnica de observación vicaria medra con la creatividad de otros, pero este enfoque tiene ventajas prácticas. Primero que todo, debido a que la pregunta experimental ya tiene el sello de aprobación del autor y de los revisores, sabe que las preguntas que se plantean son consideradas importantes. En segundo lugar, alguien ya insertó el resultado del experimento en el conjunto de los conocimientos y probablemente ha propuesto una teoría, con lo que el campo de investigación ya se lo dan estructurado y le ahorran tiempo y esfuerzo. Por último, los investigadores anteriores han concebido un método de atacar que aparentemente funciona y que podría modificar y aprovechar en su investigación. Cuando busque una idea, primero debería identificar un campo de investigación que le interese, así sabrá qué publicaciones debe leer. Su tema debe ser tan específico como sea posible: la competencia en pequeños grupos, la terapia de juego en las escuelas, la percep-
03Martin042-067.indd 51
8/5/08 17:11:55
52
Capítulo tres
ción de las ilusiones visuales, el desarrollo de las habilidades aritméticas, etc. Para los temas más generales, simplemente puede consultar las revistas que tengan artículos relacionados. Para temas más específicos, este procedimiento es ineficiente, por lo que necesitará llevar a cabo una investigación bibliográfica, como se describe en el capítulo 6. Mientras lee estos artículos, trate de descubrir preguntas importantes que la investigación no haya contestado. A veces el autor le ayudará a descubrirlas indicando hacia dónde se deberían dirigir los estudios posteriores. Como sea, cuando termine de leer el artículo, deberá estar en posición de determinar si vale la pena contestar estas preguntas. Es posible que no quiera limitarse a replicar la investigación, pero es apropiado hacer algo similar. Por ejemplo, supongamos que leyó sobre un experimento acerca de si la violencia en la televisión incita la agresividad de los niños. En el experimento, niños de seis años de edad fueron expuestos a dos horas de televisión violenta o no violenta 30 minutos diarios durante un mes. Luego, su comportamiento fue medido de acuerdo con los juguetes que escogían: juguetes agresivos —como pistolas, cuchillos y tanques— o no agresivos —como muñecas, camiones y bloques de construcción. Después de leer el artículo, digamos que decide que hay una manera mejor de manipular la variable independiente. Quizá no le guste cómo se definieron la violencia y los programas que les mostraron a los dos grupos y le gustaría hacer algunas modificaciones. O tal vez quiera agregar un tercer grupo que mire una variedad de programas violentos y no violentos o programas neutros o incluso nada de televisión. En lugar de cambiar la variable independiente, podría cambiar la variable dependiente. Es probable que piense que determinar qué tan agresivos son los niños observando qué juguetes prefieren es una mala manera de medir la agresión. Quizá piense que sería mejor contar con jueces entrenados que miren los juegos de los niños y que califiquen su agresividad. O tal vez quisiera entrevistar a los profesores de los niños o a sus padres. También podría pensar que algunas variables de control fueron establecidas a niveles inapropiados. Los niños de seis años ya han sido expuestos a mucha televisión. Quizá piense que sería mejor estudiar niños más pequeños o varios grupos de diversas edades. Probablemente piense que dos horas de televisión es muy poco dado que los niños ven en promedio cerca de cuatro horas diarias. O quizá piense que un mes es muy poco tiempo para mostrar el efecto de la televisión en el comportamiento. Pudiera pensar que una de las variables de control debería ser aleatorizada. Por ejemplo, opina que los investigadores se equivocaron al hacer que los niños miraran televisión en grupos de seis en el laboratorio, en lugar de permitirles que la vieran en el ambiente de sus casas. Una razón más interesante para hacer su propia investigación sería que pensara que ha descubierto una variable de confusión que hay que eliminar. Por ejemplo, tal vez el sonido de los programas violentos tenía mayor volumen que los programas no violentos; es posible que los ruidos más intensos, y no la violencia, hicieran a los niños más agresivos. De seguro pensará en muchas modificaciones del experimento original para probar la hipótesis de otra manera, para elaborarla o para probar una similar pero diferente.
03Martin042-067.indd 52
8/5/08 17:11:55
Cómo tener una idea para experimentar
53
Así que mientras lee la investigación de otras personas, es útil que repase preguntas de este género: ¿Hay maneras mejores o diferentes de manipular la variable independiente, de medir la variable dependiente, de escoger los niveles para las variables de control o de convertir las variables de control en variables aleatorias o viceversa o de evitar las variables de confusión? En otras palabras, ¿se le ocurre cómo mejorar la validez interna o externa de la investigación? Creo que si lee los artículos con cuidado y se hace estas preguntas, terminará con ideas excelentes para la investigación.
■ Amplíe su propia investigación Una vez que ha realizado varios experimentos, verá que su propia investigación le proporciona muchas ideas. Cada experimento que haga dejará sin responder algunas preguntas. Por ejemplo, después de utilizar varios niveles de una variable independiente en un experimento, quizá quiera ver lo que ocurre cuando escoge otros niveles. O quizás haya controlado cierta variable en un nivel en un experimento y se pregunte qué pasaría si la pusiera en un nivel diferente. O tal vez resulte que se haya topado con resultados inesperados y quiera averiguar por qué el resultado no fue el pronosticado. Cada experimento trae más preguntas sin contestar que respuestas. Esta imagen de la ciencia como un crecimiento continuo de nuevas preguntas es diferente de la que tienen quienes piensan que la ciencia es un conjunto de conocimientos fijo que sólo necesita descubrirse. Esta última perspectiva ve la investigación científica como algo que deja menos y menos preguntas sin respuesta conforme avanza. No obstante, la realidad es que con cada experimento aumentan las preguntas que deben responderse. En lugar de echarnos del campo, profundizamos incluso más de lo que podemos manejar. Esta perspectiva abierta de la ciencia puede ser desalentadora y emocionante. Desalentadora, porque a veces es difícil medir nuestro progreso en un universo en constante expansión, donde a veces parece que retrocedemos cinco pasos por cada uno que avanzamos. Por otro lado, es emocionante porque terminamos haciendo mejores y mejores preguntas. Quizá la meta de la ciencia no es encontrar las respuestas a todas las preguntas experimentales posibles, sino responder a preguntas más prometedoras e importantes. Al seguir su propia investigación, descubrirá que su principal problema no es “¿cómo tener una idea para un experimento?”, sino “¿cuál idea es la más importante para trabajar?”.
■ Cómo sacar ideas de las teorías Ahora que ha reunido diversas observaciones, ¿cómo las puede reunir en un marco que le sugiera el experimento que podría hacer? Esto se hace con frecuencia al proponer una teoría. En el caso más característico, el propósito de un experimento es probar la teoría. Por consiguiente, una manera de concebir una idea es convertir algunas de las observaciones en una
03Martin042-067.indd 53
8/5/08 17:11:56
54
Capítulo tres
teoría y luego probarla con un experimento. Por desgracia, quienes no entienden cómo se usan las teorías en las ciencias suelen tener una opinión negativa. Una creencia errónea es que las teorías son extremadamente complejas y que sólo los genios las entienden: “Einstein habrá entendido lo que significa e = mc2, pero yo no.” Otra creencia errónea es que una teoría no es más que una conjetura infundada: “Eso es sólo una teoría.” De hecho, una teoría puede ser algo simple de entender, y a medida que se acumulan las pruebas que justifiquen una teoría particular, nos sentimos más seguros de que es verdadera, aunque, como veremos, nunca tendremos la certeza total. ¿Por qué necesitamos las teorías? Los resultados de los experimentos y otros estudios son datos. Pero la ciencia es más que una colección vaga de datos. Es un conjunto de conocimientos organizado; tiene una estructura, como la tiene un edificio, y así como un montón de ladrillos dispuestos al azar no es una construcción, una recopilación informe de datos no es una ciencia. La teoría dibuja los planos que dicen cómo se acomodan esos datos en el conjunto organizado de los conocimientos científicos. Desde mi punto de vista, una de las razones de que la psicología experimental sea más divertida que otras ciencias es que los psicólogos experimentales pueden ser arquitectos, constructores y cocineros de adobes. En otras ciencias se ha impuesto una división del trabajo. Por ejemplo, la mayoría de los físicos son físicos teóricos o físicos experimentales, pero no los dos. Los psicólogos experimentales siempre han realizado ambos trabajos.
LOS PSICÓLOGOS EXPERIMENTALES HACEN DOS TRABAJOS Es difícil dar una definición simple e inteligible de teoría. Si tuviera que hacerlo, diría que una teoría es una declaración acerca de la relación probable entre un conjunto de variables abstractas. La declaración teórica es sólo probable, ya que está sujeta a ser probada y, como veremos en breve, con las pruebas es más fácil refutar las teorías que verificarlas. Las relaciones se dan entre las variables abstractas, porque si las variables consistieran en eventos observables directamente, todo lo que tendríamos serían declaraciones de hechos, observaciones directas, en lugar de teorías. Las variables abstractas de una teoría son categorías generales de circunstancias o comportamientos y no circunstancias o comportamientos particulares. Por ejemplo, la declaración teórica de que ver violencia incita la agresividad es
03Martin042-067.indd 54
8/5/08 17:11:56
Cómo tener una idea para experimentar
55
diferente de una demostración experimental de que después de ver una película de guerra, los niños prefieren jugar con pistolas. Para entender mejor el uso de la teoría, voy a demostrar, mediante un ejemplo, que la formulación de teorías cabe en la planeación e interpretación de los experimentos. Supongamos que hemos estado observando el mundo y notamos lo siguiente: los niños juegan con más rudeza después de ver programas violentos en televisión. En años recientes, cada vez más niños pequeños han sido acusados de delitos violentos, al mismo tiempo que se ha incrementado la violencia en los medios. Los niños de países que pasan por conflictos bélicos toman las armas y pelean desde una edad temprana. Estas observaciones, y quizás otras, podrían llevar a proponer una teoría: “Cuantos más actos violentos atestigüen los niños, mayor será la probabilidad de que muestren un comportamiento agresivo.” Esta teoría es bastante fácil de entender. Observemos que es más abstracta y más general que cualquiera de las observaciones que llevaron a ella. Tal vez no nos demos cuenta, pero llegamos a esta teoría por inducción. La inducción es un proceso lógico en el cual la conclusión contiene más información que las observaciones sobre las cuales se basa. Esto es, esperaríamos de nuestra teoría de la violencia y la agresión que fuera verdad no sólo para las tres observaciones que llevaron a ella, sino también para todos los casos en los que los niños ven violencia. Claro que podríamos estar equivocados. Quizá la teoría es verdadera sólo para los casos que hemos observado, y entonces nuestra inducción es un error. Pero una vez que se declara la teoría, por lo menos puede probarse a través de la experimentación. Si nuestra teoría sirve para algo, debería permitirnos hacer varias predicciones. El proceso lógico mediante el cual las hacemos es la deducción. Por medio de la deducción llegamos a una conclusión a partir de un conjunto de premisas, y esta conclusión no contiene más información que las premisas tomadas colectivamente. Por tanto, si la información de las premisas es verdadera, la conclusión debe ser cierta. Por ejemplo, si un caballo es un mamífero y todos los mamíferos son animales, entonces por razonamiento deductivo, un caballo debe ser un animal. En nuestro ejemplo, si cuantos más actos violentos atestiguan los niños, más agresivos se vuelven y si mirar programas de detectives se relaciona con que se vean actos violentos, entonces mirar muchos programas de detectives debe llevar a un incremento en el comportamiento violento. A partir de nuestra teoría, a través de la deducción,
ERES UN TONTO!
03Martin042-067.indd 55
ME PREGUNTO SI ÉSA ES UNA INFERENCIA DEDUCTIVA O INDUCTIVA.
8/5/08 17:11:58
56
Capítulo tres
podemos predecir diversas observaciones como ésta. Cada observación predicha forma una hipótesis para un experimento. Para probar una hipótesis podemos diseñar un experimento en el cual un grupo de niños mira cuatro horas diarias de programas de detectives que contienen violencia y un segundo grupo mira programas no violentos el mismo tiempo. Después de varios días, observamos el comportamiento de juego de los niños para determinar qué tan agresivos son. La hipótesis deducida de nuestra teoría es que el grupo que observó los programas de detectives mostrará un comportamiento más agresivo. Si la teoría es cierta, la hipótesis lo es también. La figura 3-1 muestra la cadena de razonamientos por la que hemos pasado hasta ahora. Hasta este punto hemos utilizado la inducción para convertir nuestras observaciones en teoría y hemos utilizado la teoría para deducir una observación predicha. Ahora estamos listos para llevar a cabo el experimento para probar esta predicción. Supongamos que el experimento confirma la observación predicha. ¿Probamos la teoría? No, confirmar una hipótesis no prueba la teoría en que se basa. La respalda, pero sólo a través de la inducción, no de la deducción. Para probar concluyentemente la teoría necesitaríamos probar toda hipótesis que se dedujera de ella. En nuestro caso, tendríamos que probar todas las variedades en que los niños podrían atestiguar la violencia en televisión y medir cada forma de comportamiento agresivo que manifestaran. En breve, todo lo que podemos decir es que el resultado de nuestro experimento apoya la teoría. Conforme se realizan experimentos adicionales que apoyen la teoría, en particular si prueban más variables, nuestra confianza en la teoría continuará aumentando, pero verá qué difícil es llegar a decir que una teoría ha sido probada. Observación ➤
Inducción ➤
Teoría ➤
Deducción ➤
Observación predicha ➤
Experimentación ➤
➤
Observación confirmada
Observación contraria
➤
➤
Inducción
Deducción
➤
➤
Teoría apoyada
Teoría falsa
FIGURA 3-1 El papel de la inducción y la deducción para vincular la teoría a la experimentación.
03Martin042-067.indd 56
8/5/08 17:11:59
Cómo tener una idea para experimentar
57
Por otro lado, supongamos que el resultado del experimento contraría la observación predicha. ¿Hemos invalidado la teoría? Desde un punto de vista lógico, lo hemos hecho (véase la figura 3-1). Incluso la refutación de una sola predicción basta para refutar cuando menos una de las premisas, ya que se llegó a la predicción por deducción. Recordemos el ejemplo: “Un caballo es un mamífero, todos los mamíferos son animales, ¿un caballo es un animal?” Si descubrimos que un caballo no es un animal, entonces o bien no todos los mamíferos son animales o bien el caballo no es un mamífero. No hay más posibilidades lógicas. Con la misma lógica, si ver programas de televisión violentos durante cuatro horas en lugar de los no violentos no causara un incremento en el comportamiento agresivo, entonces lo que les mostrábamos a los niños no era violento o nuestra teoría estaba equivocada. Puede ver por qué Karl Popper, un reconocido filósofo de la ciencia, declaró que nuestro trabajo como científicos no es probar las teorías, sino refutarlas (Popper, 1968). Redujo este concepto a un lema: “Ningún número de avistamientos de cisnes blancos puede probar la teoría de que todos los cisnes son blancos. El avistamiento de un solo cisne negro la invalidaría.” La debilidad del argumento de que podemos invalidar lógicamente una teoría por experimentación es que los cálculos estadísticos que hacemos para nuestra refutación experimental no son deductivos. En el capítulo 12 examinaremos el tema detalladamente, pero aquí enunciamos el argumento básico. En nuestro ejemplo, hubiéramos invalidado nuestra hipótesis experimental de no haber encontrado ninguna diferencia de agresividad entre los dos grupos, esto es, no haber encontrado diferencia estadísticamente significativa. El problema es que por lo general nuestras pruebas estadísticas están diseñadas para determinar si los niveles de la variable independiente causan una diferencia en el comportamiento, no una similitud.8 Sin embargo, refutar experimentalmente una hipótesis implica mostrar que los niveles son equivalentes y no diferentes, y por lo general no realizamos las pruebas estadísticas para determinar una equivalencia. Así, debemos ser cuidadosos al concluir que una hipótesis, y por tanto una teoría, es falsa a partir de tal resultado. Incluso si pudiéramos refutar la hipótesis verificándola en la dirección estadística adecuada (esto es, determinando que la hipótesis es falsa debido a que el efecto es estadísticamente significativo), podríamos estar errados. Como analizaremos en el capítulo 12, aun cuando se utilizan como es debido, estas pruebas estadísticas sólo son precisas a un nivel probabilístico. Sobre la base de la diferencia de nuestra muestra, apenas tenemos cierto nivel de confianza de que haya una diferencia real en la población. Por ejemplo, podríamos concluir que nuestro resultado es estadísticamente significativo al nivel de 0.05 de significancia. Esta conclusión significa que podríamos estar equivocados hasta 5% de las veces; es decir, sabemos que una de cada 20 veces nos engañamos al creer que refutamos la hipótesis y, por tanto, estaríamos en un error al considerar invalidada la teoría.
8
Técnicamente, cuando probamos una hipótesis nula, comenzamos por suponer que no hay ninguna diferencia y que la prueba estadística nos dirá la probabilidad de que estemos equivocados en esa suposición. Sin embargo, la prueba todavía no nos dice la probabilidad de que sean iguales.
03Martin042-067.indd 57
8/5/08 17:12:00
58
Capítulo tres
Hay otras razones, además de las estadísticas que acabamos de mencionar, de que la refutación de una hipótesis no proporcionaría una refutación sólida de la teoría como sería de esperarse en la lógica deductiva. Por ejemplo, podría haber problemas con la expresión de la teoría en el experimento, con la manera en que se manipuló la violencia o se midió la agresión o bien con el control o aleatorización de las variables. Rara vez se piensa que un solo experimento invalida una teoría; hacen falta varios resultados contrarios. Hemos profundizado en alguna medida sobre el papel de la teoría para darnos ideas de experimentos e interpretar los resultados. Es importante que entienda, de manera general, qué relaciones guardan la teoría y la experimentación. Afortunadamente, no tiene que pasar por este proceso lógico formal cada vez que realiza un experimento. Los pasos son los mismos. De hecho, el proceso que describimos es muy natural. En la vida, continuamente hacemos observaciones, las generalizamos y verificamos nuestras generalizaciones con más observaciones. Aunque no las llamamos teorías, vivimos la existencia fundados en estas generalizaciones. Todo lo que hemos descrito aquí es una versión un poco más formal del mismo proceso natural. TIPOS DE TEORÍAS
Hasta aquí hemos dado un solo ejemplo de una teoría. Pero las teorías adoptan muchas formas. Veremos ahora tres tipos de teorías 9 y seguiremos ejemplificándolas con la pregunta sobre si la violencia en televisión produce agresividad. Teorías descriptivas
Una teoría descriptiva no hace más que poner nombre a los sucesos, sin explicar por qué ni cómo tuvieron lugar. Por ejemplo, Freud, como parte de la teoría psicoanalítica, decía que la represión ocurre cuando inconscientemente nos rehuVEN AQUÍ, samos a admitir en la conciencia ideas dolorosas o ¡GRANDÍSIMO desagradables. Aunque tal teoría ayude a los psicóloMEQUETREFE! gos clínicos en su trabajo, el puro nombre de represión no explica las condiciones en las cuales ocurre o cómo podría ser examinada experimentalmente. De manera similar, durante muchos años, los psicólogos interesados en la motivación se regodeaban en darle nombre a los instintos. Al principio, el concepto de instinto se consideraba útil, ya que parecía que la mayoría de los comportamientos animales podían clasificarse como manifestación de ciertos instintos (como el instinto de TEORÍA DESCRIPTIVA 9 Los tres tipos de teorías analizadas son similares a las que refiere Arnoult (1972) en su libro Fundamentals of Scientific Method in Psychology, aunque cambiamos algunos nombres.
03Martin042-067.indd 58
8/5/08 17:12:00
Cómo tener una idea para experimentar
59
alimentación o el de apareamiento). Sin embargo, con el tiempo los psicólogos acumularon tantos nombres de instintos como comportamientos observables (como el instinto de “Correr hacia un hoyo al ser atacado desde el frente”) y el concepto perdió su utilidad. Las teorías descriptivas pueden ser útiles si los nombres designan hechos abstractos, en lugar de sucesos observables directamente. Por ejemplo, podríamos decir que la observación de la violencia está relacionada con el comportamiento agresivo. Si definiéramos con mucho cuidado “violencia” y “comportamiento agresivo” como clases generales de eventos, podríamos tener una teoría descriptiva útil. Pero incluso esa clase de teoría tendría un valor limitado, ya que no explica cómo funciona la relación.
Teorías analógicas
Las teorías analógicas explican cómo funciona la relación haciendo una analogía entre una relación psicológica y un modelo físico, de manera que la analogía física se presenta como modelo psicológico del comportamiento. Por ejemplo, muchas teorías que tratan de explicar cómo procesamos los seres humanos la información utilizan la computadora como una analogía física. Claro que nadie cree que el cerebro trabaje exactamente como una computadora, pero hay suficientes semejanzas para postular teorías analógicas útiles. Como ejemplo de una teoría analógica, tomemos las propiedades físicas del momento como analogía de la relación entre violencia y ¡ÓYEME, CABEZA DURA! agresividad. Como se sabe, un objeto físico tiene un momento proporcionado a su velocidad y masa; cuanto más rápido se desplace y más masa posea, más momento tendrá. Este momento puede ser detenido por fricción. Así, postularíamos una teoría en la que se relacione la violencia y la agresión como: “La cantidad de agresión expresada por un observador es como la fuerza ejercida por un objeto en movimiento, donde el grado de violencia obserTEORÍA ANALÓGICA vado es análogo a la masa del objeto y el tiempo de observación es análogo a la velocidad del mismo. Después de la exposición a la violencia, las tendencias agresivas serán altas pero disminuirán con el tiempo de la misma manera en que la fricción detiene el momento.” Esta teoría analógica es más útil que la teoría descriptiva de la sección anterior porque explica algunas de las complejidades de la relación. Además, deberíamos poder probar la teoría con nuestros conocimientos de cómo funciona el modelo físico. Por ejemplo, sabemos que cuanto más tiempo se ejerza la fuerza sobre el objeto físico, su velocidad será mayor y más grande el momento. Por tanto, la fricción necesita más tiempo para detener el momento.
03Martin042-067.indd 59
8/5/08 17:12:01
60
Capítulo tres
En la analogía, cuanto más tiempo una persona observe la violencia, más tiempo tardarán en desaparecer las tendencias agresivas. Debido a su poder explicativo, una teoría analógica es más útil que una teoría descriptiva. Sin embargo, también las teorías analógicas están condenadas a ser incompletas porque, en algún punto, las propiedades del análogo físico ya no corresponderán a las propiedades de los seres humanos. Por eso, las teorías analógicas son cuando mucho una primera aproximación para identificar las principales variables y esquematizar en lo general los efectos recíprocos de dichas variables, pues casi nunca son tan potentes como para especificar las relaciones matemáticas exactas entre éstas. Teorías cuantitativas
Con las teorías cuantitativas se trata de establecer relaciones en términos matemáticos. Especifican no sólo la dirección de la relación entre las categorías de las variables, sino las relaciones cuantitativas entre estas categorías. Pocas teorías psicológicas han alcanzado esta perfección. Sólo en algunos campos del aprendizaje, memoria y cognición se ha tratado de utilizar las teorías cuantitativas. La razón de que haya pocas teorías cuantitativas en psicología es que los psicólogos tienen más dificultades con la variabilidad que los físicos. Por ejemplo, en la física la teoría de la gravedad es una teoría cuantitativa expresada en términos matemáticos precisos. Debido a que la gravedad afecta los objetos físicos de la misma manera, un físico asume que cualquier variabilidad en los resultados experimentales es un error de medición. Sin embargo, en psicología no podemos predecir el comportamiento de todos los individuos a partir del comportamiento de uno solo ni podemos predecir cómo se conducirá el mismo individuo en otro momento. En consecuencia, nuestras teorías cuantitativas deben ser capaces de dar cabida a tal variabilidad. La mejor manera de hacerlo es predecir qué tan probable es que ocurra un comportamiento,10 así que debemos expresar las relaciones matemáticas en términos probabilísticos (por ejemplo, la probabilidad de que un individuo aprenderá esta lista de palabras en cinco intentos es de 0.8). Los psicólogos también enfrentan el problema de decidir qué escala utilizar al medir los comportamientos. En las ciencias físicas, las unidades para medir la velocidad o la masa no están sujetas a polémica. En cambio, en psicología tenemos que encontrar escalas convenientes para medir conceptos como la violencia o la agresividad. Por ejemplo, consideremos la siguiente teoría cuantitativa: los seres humanos expresan un grado de agresividad directamente proporcional al nivel promedio de violencia que han observado en el pasado reciente. Debido a que nuestra teoría trata de establecer una relación matemática entre las escalas de
10
En algunos campos, los físicos tienen problemas similares. Por ejemplo, la estructura atómica se expresa probabilísticamente. De hecho, la teoría del caos, una teoría de los sistemas dinámicos basada en matemáticas no lineales, fue desarrollada para manejar sucesos probabilísticos de las ciencias físicas que no siguen las reglas deterministas de la ciencia clásica.
03Martin042-067.indd 60
8/5/08 17:12:01
Cómo tener una idea para experimentar
61
violencia y agresividad, primero debemos determinar cómo medirlas. Como se aprecia, no es tarea fácil establecer las escalas de tales conceptos. Hay varios campos de la psicología en que la teorización cuantitativa ha crecido rápidamente en los años recientes. Así, en el modelo de ecuaciones estructurales, se comienza con una teoría muy parecida a una descriptiva en la cual se identifican y describen muchos conceptos. En seguida se hace una conjetura bien fundada sobre cuál sería la relación que guarden estos conceptos y se trazan vínculos entre los conceptos para indicar estas posibles relaciones. Luego se realizan mediciones de los conceptos y calculan las estadísticas (que aquí usted no tiene interés en conocer). Con estos cálculos se asignan pesos a los vínculos para indicar cuáles son los más importantes. De esta manera, el investigador sabe cuantitativamente cómo se vinculan los conceptos. Otro campo en el que se hacen más teorías cuantitativas es el conexionismo (a veces llamado procesamiento distribuido en paralelo). Esta teorización empieza con un modelo analógico en el cual el análogo es el sistema nervioso del ser humano. En una computadora se simulan por lo menos tres niveles de unidad semejantes a tres niveles de neuronas; los niveles pueden enviarse señales. Conforme las unidades experimentan el mundo (por ejemplo, podrían analizar curvas y líneas de letras), envían señales a las unidades a niveles más profundos y hacen más o menos probable que éstos envíen sus propias señales, tal como lo hace una neurona. Después de experimentar repetidamente el mundo, las unidades empiezan a establecer ponderaciones que reflejan el progreso del aprendizaje (por ejemplo, las unidades más profundas empiezan a reconocer algunas letras). Estas ponderaciones cuantitativas pueden considerarse como una representación teórica del funcionamiento del sistema nervioso del ser humano y el comportamiento de la representación teórica puede compararse cuantitativamente con el comportamiento humano; por ejemplo, ¿el sistema cambia unas letras por otras, como lo hacen los seres humanos? Así, con algunas excepciones, la mayoría de las teorías psicológicas todavía son descriptivas o analógicas. Sin embargo, conforme la psicología se hace más compleja y aprendemos a manejar las dificultades causadas por la variabilidad y el escalamiento, más teorías psicológicas se volverán cuantitativas. PROPIEDADES DE UNA BUENA TEORÍA
¿Cómo reconocemos una buena teoría cuando la vemos? Hemos dicho que las teorías cuantitativas son mejores que las analógicas, las cuales a su vez son mejores que las teorías descriptivas. ¿Por qué? En primer lugar, una teoría debe ser capaz de dar cuenta de la mayoría de los datos recabados. No tiene caso proponer una teoría si no la justifican los datos (por eso es tan importante una investigación bibliográfica exhaustiva, porque permite eliminar teorías rivales antes de empezar a acopiar datos). Sin embargo, una o dos piezas de evidencia contradictorias no derrumban una teoría, a menos que otra teoría explique toda la evidencia. Una teoría debe poder examinarse (someterse a prueba). Como vimos, la ciencia avanza a medida que los resultados de las investigaciones eliminan algunas teorías y dejan otras como posibles. Que una teoría pueda examinarse significa que tiene la posibilidad de ser
03Martin042-067.indd 61
8/5/08 17:12:02
62
Capítulo tres
refutada. La teoría se rechaza si el resultado de un experimento no es lo que predijo la teoría. Si una teoría es tan universal que explica cualquier resultado experimental, entonces no es posible invalidarla.11 Una razón por la que una teoría no pudiera ser examinada (sometida a prueba) es que se espera que los resultados predichos ocurran de manera impredecible parte del tiempo. Por ejemplo, tal como está planteada, es imposible someter a prueba la teoría de Freud sobre la represión. ¿Cómo podría refutarse la represión de manera experimental? Quizá se daría a la gente una experiencia que prefirieran olvidar. Por ejemplo, podría tentar a sus sujetos a hacer trampa y luego confrontaría a quienes sucumbieran a la terrible hazaña.12 Luego, haría que un amigo cercano les preguntara si habían hecho trampa. Si nadie lo confesaba, tiene apoyo para la teoría, pues demuestra que todos reprimieron el incidente (o quizá que mintieron). Sin embargo, si todos confiesan que hicieron trampa, el resultado no elimina la teoría, ya que la teoría nunca afirmó que toda la gente reprime un hecho, sólo que algunos a veces reprimen ciertos sucesos. Por tanto, su experimento habría hecho poco por desacreditar la teoría. Una teoría que es tan general que no cabe proponer ninguna prueba para refutarla carece de valor desde el punto de vista científico. Aunque una teoría no tiene que ser tan general que explique todo comportamiento, tampoco debe ser tan restrictiva. Esto es, cuantos menos sucesos observables explique la teoría, menos valiosa es. En el caso más extremo, la teoría simplemente reformula la relación entre los hechos observables.13 Por ejemplo, la formulación de que “un niño de 8 años golpea mucho más un saco de arena después de ver por televisión una caricatura de El Correcaminos” es menos útil que la formulación de que “ver violencia por la televisión causa agresividad en los niños”. Una formulación más útil es: “atestiguar actos de violencia incita a la gente a ser más agresiva”. Cuanto más generales sean las formulaciones, más valiosas son, porque explican un conjunto más grande de sucesos observables. Una buena teoría debe también ser parsimoniosa, lo que significa que debe ser lo más simple posible a la vez que explica los datos. Las teorías que son demasiado detalladas y complejas no son muy útiles, ya que no conocemos el estado de todas las condiciones necesarias cuando tratamos de aplicar la teoría a nuevas situaciones. Una buena teoría también predice el resultado de los experimentos. Hasta las teorías descriptivas especifican la relación entre categorías de sucesos. Por tanto, la teoría debe permitir predecir las relaciones entre sucesos observables directamente que son miembros de estas categorías. Las teorías analógicas y cuantitativas también permiten predecir las relaciones entre sucesos y estas predicciones son incluso más precisas. Por último, las mejores teorías ayudan a responder las preguntas primordiales, no sólo las inmediatas. Una pregunta primordial es una pregunta sobre los porqués. Una pregunta inmediata es una pregunta sobre qué o cómo. La teoría que planteamos arriba: “cuanto más
11
Por esta razón, algunos llaman a la prueba de las teorías falsabilidad. Como dijimos, Karl Popper (1968) postuló que una idea sólo puede someterse a prueba si puede refutarse, es decir, si puede demostrarse que es falsa. 12 Por el momento, ignoremos si el experimento hubiera sido considerado ético. 13 De hecho, esta aseveración no se ajustaría a nuestra definición de teoría, pero algunos investigadores la llamarían una teoría.
03Martin042-067.indd 62
8/5/08 17:12:02
Cómo tener una idea para experimentar
63
vean los niños actos violentos, más probable es que muestren un comportamiento agresivo”, responde a una pregunta sobre qué: ¿Qué pasa cuando los niños observan actos violentos? Pero no responde la pregunta primordial sobre el porqué: ¿Por qué los niños actúan así? Una teoría que aborda una pregunta primordial diría que “la evolución ha imbuido en los seres humanos la tendencia a acentuar su agresividad en respuesta a la violencia ambiental, porque se hace más probable la supervivencia”. Hasta la fecha, la mayoría de las teorías psicológicas se basan en preguntas inmediatas. Sin embargo, el énfasis creciente de la psicología sobre la teoría evolutiva probablemente dará lugar a más teorías que respondan preguntas primordiales.
UNA BUENA TEORÍA SIEMPRE PERMITE PREDECIR. . . ¿LA TEORÍA SIEMPRE PRECEDE A LOS DATOS?
En este análisis idealizado de la relación entre las teorías y los experimentos, probablemente lo he llevado a creer que siempre hay que tener una teoría para hacer un experimento. Sin embargo, hay investigaciones en las que la teoría es menos importante. Algunos investigadores prefieren aplazar la teorización hasta después de haber reunido muchos datos. Son detectives como Sherlock Holmes: sólo hasta después de reunir todas las pistas (datos) señalarán al culpable (teoría). Les parece que, particularmente al inicio del programa de investigación, proponer una teoría antes de reunir los datos es como escoger un villano y luego buscar las pistas relacionadas únicamente con la culpabilidad de esa persona: los procedimientos son tendenciosos. De hecho, B. F. Skinner, el padre de la investigación del condicionamiento operante, sostuvo que la mayoría de las teorías hacen más daño que bien (Skinner, 1950). Skinner creía que nuestro trabajo como científicos es explicar los sucesos observables, y como las teorías se valen de abstracciones en lugar de hechos, no nos sirven. Además, ya que son abstracciones, las teorías también nos hacen creer que nuestra investigación está completa cuando no lo está. Nos sentimos tentados a utilizar las teorías para llenar los hoyos de nuestra investigación sin saber en realidad si las respuestas que nos dan son verdaderas. Por último, a Skinner le preocupaba que cuando dejamos que la teoría guíe nuestra investigación y luego queda refutada, perdemos mucho de la investigación que generó. La extrema
03Martin042-067.indd 63
8/5/08 17:12:02
64
Capítulo tres
posición de Skinner debe entenderse dentro del contexto del rechazo general del conductismo a todos los eventos mentales y variables interventoras que son la base de muchas teorías actuales. La mayor parte de los psicólogos investigadores no están de acuerdo en absoluto con la posición de Skinner y opinan que las teorías son vitales para la mayoría de los estudios. Sin embargo, estos investigadores saben también que en muchas ocasiones las teorías deben tener un papel menor al guiar la investigación. Cuando un tema de investigación está todavía en pañales, la teorización prematura puede causar más problemas de los que soluciona. Si antes de reunir muchos datos proponemos una teoría débil, tenemos que dedicar mucho tiempo y esfuerzo a probar la teoría, cuando nuestros esfuerzos podrían llevarnos a otra que fuera mejor. Particularmente al inicio de un nuevo programa de investigación, no hay nada equivocado en hacer muchos experimentos cuyo propósito sea simplemente responderse “qué pasaría si. . .”, en lugar de probar una predicción teórica. Después de que hayamos realizado numerosas observaciones que ameriten la teorización, pierde eficacia reunir los datos de esta manera exploratoria. Otro peligro es que jugar al juego de las teorías puede ser una gran diversión intelectual. Primero, el investigador se encuentra un problema importante, hace las observaciones preliminares y propone una teoría. Luego, otros someten a prueba la teoría, la rechazan, proponen la suya, que luego es refutada y así sucesivamente. Conforme una teoría engendra otra, el juego cobra vida propia y a veces olvidamos cuál era el problema importante. Podemos terminar investigando teorías que es fácil someter a prueba en lugar de indagar en los problemas importantes. Como ninguna ciencia tiene los recursos para investigar todos los problemas, tenemos que escoger, y obviamente, hemos de escoger los problemas importantes. Si por las teorías damos en investigar problemas fáciles y sin importancia en lugar de los más difíciles e importantes, desperdiciamos nuestros recursos.14 Para contrarrestar esta trampa, he amenazado con impartir un curso llamado Psi 371: “Cosas sobre las que la psicología no sabe nada”. El propósito de este curso sería encontrar campos importantes del comportamiento humano que nadie investigue en la actualidad y proponer cómo empezar a investigarlos. Un tipo de investigación en la cual a veces la teoría es menos importante es la investigación aplicada, que se destina a resolver un problema concreto, a diferencia de la investigación básica,15 la cual se lleva a cabo con el único propósito de incrementar el conocimiento científico. La mayor parte de la investigación que hemos considerado hasta este punto es 14
Kuhn, en su libro The Structure of Scientific Revolutions (1970, p. 37; trad. en español, México, La estructura de las revoluciones científicas), afirma que, una vez que la comunidad científica acepta un paradigma (un conjunto de suposiciones, un modelo aceptado ampliamente o una teoría general), los científicos trabajan sólo con problemas que se asume que tienen soluciones en el contexto del paradigma: “En gran medida, son problemas que la comunidad admite como científicos [. . .] Así, un paradigma incluso puede aislar a la comunidad de los problemas socialmente importantes que no son reducibles a un rompecabezas, ya que no pueden ser formulados en términos de las herramientas conceptuales e instrumentales que el paradigma provee.” 15 La investigación básica también recibe el nombre de investigación pura, quizá porque se supone que uno no debe tener motivos particulares para hacerla. Desafortunadamente, da la impresión de que algunas personas que hacen estas investigaciones preferirían otras acepciones del diccionario de puro: por ejemplo, sin mácula de malicia o culpa. Nunca he oído que los científicos puros defiendan la posición de que son físicamente castos, aunque sospecho que tal es la explicación subconsciente de que se pongan batas de laboratorio blancas.
03Martin042-067.indd 64
8/5/08 17:12:03
Cómo tener una idea para experimentar
65
NIEVE PURA
LABORATORIO DE INVESTIGACIÓN
44/ 00% 99 1 O PUR
investigación básica. Aun cuando no está diseñada para resolver problemas prácticos, ayuda. Las técnicas actuales de modificación de la conducta, que ofrecen procedimientos poderosos para corregir los problemas de comportamiento humano, se fundan en la investigación básica realizada con ratas en los laboratorios del pasado. Jack Adams (1972) vio que muchos de los sistemas militares de la década de 1970 habían sido diseñados utilizando información de investigación básica realizada más de 20 años antes. Por su parte, la investigación aplicada tiene como propósito primordial la solución de problemas. Quizá necesita saber cómo leemos números manuscritos para diseñar una máquina que lea códigos postales. O quizá quiera saber si exámenes breves diarios mejorarán el desempeño de los estudiantes en los exámenes semestrales. Quizás hasta quiera saber si la terapia cognitiva-conductual es más eficaz que el psicoanálisis. Muchos problemas prácticos necesitan respuestas inmediatas que los investigadores básicos no tienen. La necesidad de una respuesta a un problema práctico es una razón legítima para realizar la investigación, y puede ser satisfactoria, especialmente si los resultados tienen un impacto inmediato en el mundo. En muchos casos es incluso posible probar una teoría al tiempo que se lleva a cabo una investigación aplicada. En este caso, el investigador hace una contribución práctica y también ayuda a acumular conocimientos científicos. La observación es la clave para tener ideas de investigación aplicada. Encontrar un problema práctico es cuestión de observar con sumo cuidado el comportamiento humano y darle rienda suelta a su curiosidad. Como con los otros procedimientos para tener ideas de experimentos que hemos analizado, descubrirá que hay más problemas prácticos por resolver que los experimentos que pueda hacer para resolverlos. Como antes, la pregunta no es qué puedo hacer, sino qué debo hacer primero.
■ Importancia de la investigación psicológica Antes de terminar el capítulo, quiero señalar que aunque he subrayado que hay que divertirse con las investigaciones y que hay que hacer las que satisfagan nuestra curiosidad acerca
03Martin042-067.indd 65
8/5/08 17:12:03
66
Capítulo tres
del comportamiento humano, la investigación psicológica debe realizarse porque da respuestas a algunos de los problemas más importantes de la vida. Si le pidiera que dijera cuáles son los problemas que causan más penas a nuestra sociedad y que nos cuestan más dinero, ¿cuáles me diría? A continuación anoto los 10 que se me ocurren: 1. Nuestros niños no aprenden lo suficiente en la escuela (por ejemplo, muchos no saben leer, escribir, hacer cálculos, etcétera). 2. Demasiada gente se droga. 3. La gente tiene comportamientos poco saludables (tabaquismo, enfermedades de transmisión sexual, alimentación inadecuada, falta de ejercicio, etcétera). 4. Los conflictos humanos traen la posibilidad de las guerras. 5. La violencia doméstica daña a los miembros de la familia. 6. La violencia causa altas tasas de delincuencia. 7. Demasiadas personas viven de la asistencia pública. 8. En nuestra sociedad el civismo desaparece; por ejemplo, los manejadores son iracundos, se tira la basura donde sea, priva la descortesía y abundan las demandas frívolas. 9. Demasiadas personas mueren o resultan heridas en accidentes automovilísticos. 10. Demasiados trabajadores están mal preparados para realizar su trabajo o tienen que volver a capacitarse. ¿Cuántos de estos problemas tienen que ver con el comportamiento humano y, por tanto, están dentro del alcance de la psicología? Está en lo cierto: ¡todos! Piense en los temas de que hablan los políticos: delincuencia, salud, educación, drogas y la economía. Los problemas de estas esferas surgen por la conducta de la gente. Para solucionarlos, necesitamos entender mejor el comportamiento humano y para esto, necesitamos investigación. Por tanto, el trabajo que hacemos como psicólogos investigadores no sólo es interesante y divertido, sino también importante. La sociedad necesita esta investigación y las respuestas que encontremos ayudarán a la gente a vivir mejor.
■ Resumen Aunque todos tenemos una curiosidad natural por el comportamiento humano, muchos desarrollamos temores irracionales que bloquean nuestras ideas. Algunos tememos que los demás investigadores sean unos genios y que nuestras ideas no sean originales. Otras personas tienen miedo de proponer un experimento que requiere un aparato especial, mientras que unas más tienen miedo de experimentos con aparatos simples. Algunos más temen que su idea sea demasiado simple, que su experimento requiera estadísticas complicadas o que su idea no esté completa y perfecta cuando la propongan. Por último, mucha gente no cree que tenga buenas ideas si no las traducen a la jerga científica. La clave principal de tener ideas para experimentos es aprender a observar el mundo. También necesita saber qué ideas son apropiadas desde el punto de vista científico: deben
03Martin042-067.indd 66
8/5/08 17:12:04
Cómo tener una idea para experimentar
67
ser repetibles, observables y que puedan ser examinadas. Para obtener ideas puede observarse u observar a sus amigos, a los niños e incluso a las mascotas. Algunas de las mejores ideas vienen de la observación directa, pero también puede tener buenas ideas leyendo investigaciones de otros (observación vicaria) y del seguimiento de sus propios estudios. La forma característica en que las observaciones se transforman en experimentos es por medio de una teoría, un enunciado acerca de las relaciones probables entre un grupo de variables abstractas. Las observaciones desembocan en una teoría mediante un proceso de inducción, en el cual se deriva un enunciado general de ejemplos particulares. Entonces, a partir de la teoría cabe hacer una predicción, llamada hipótesis, mediante un proceso de deducción. Si el experimento que prueba la hipótesis la confirma, se apoya la teoría, aunque no se demuestra. Si la hipótesis es rechazada, de acuerdo con las reglas de la lógica, la teoría se refuta por deducción. Sin embargo, como las pruebas estadísticas utilizadas para rechazar una hipótesis son probabilísticas, la refutación de la teoría no es segura. La teoría descriptiva da nombres a los sucesos y es útil si denota sucesos abstractos pero definidos. Las teorías analógicas explican cómo funcionan las relaciones psicológicas bosquejando una analogía entre dichas relaciones y un modelo físico. Las teorías cuantitativas especifican esas relaciones en términos matemáticos. La psicología tiene pocas teorías cuantitativas debido a que todavía estamos aprendiendo a explicar la variabilidad y a crear escalas de medición precisas. Una buena teoría explica la mayoría de los datos, se puede examinar, no es demasiado restrictiva, es parsimoniosa y es capaz de predecir el resultado de los experimentos. Las mejores teorías ayudan a responder preguntas primordiales (preguntas sobre los porqués), en lugar de sólo preguntas inmediatas (preguntas sobre qué). Skinner sostuvo que las teorías son de hecho inútiles, ya que no ayudan a explicar los sucesos observables, nos hacen creer que una investigación sin terminar está completa y arruinan una investigación si se descarta su teoría. Aunque la mayoría de los investigadores están en desacuerdo con esta posición y creen que las teorías son útiles, no siempre se necesitan teorías para hacer una buena investigación, particularmente durante las etapas iniciales, y para la investigación aplicada, la que se realiza para solucionar un problema, a diferencia de la investigación básica, que se emprende para contribuir a acumular conocimientos científicos.
03Martin042-067.indd 67
8/5/08 17:12:04
4
Cómo ser justo con los participantes Todo lo que deseen que los demás hagan por ustedes, háganlo por ellos. MATEO 7.12
Nuestros datos muestran que la estructura social de la competencia y la recompensa es una fuente del comportamiento permisivo en la experimentación con sujetos humanos; el científico relativamente fracasado, que lucha por el reconocimiento, es el que mayor probabilidad tiene de ser permisivo. B. BARBER (1976)
¡Oh, qué telaraña tan enredada tejemos, cuando practicamos el engaño! SIR WALTER SCOTT
La mente humana no tiene otros medios de enterarse de las leyes del mundo orgánico, de no ser por los experimentos y la observación en animales vivos. IVÁN P. PAVLOV
Desde el punto de vista ético, todos estamos en el mismo terreno, ya sea que nos paremos en dos, cuatro o ningún pie o pata. P. SINGER (1985)
A
hora que tiene una idea para un experimento, está listo para empezar a planearlo con más detalles. Sin embargo, primero necesitamos considerar el tema de la ética. Como experimentadores, podríamos faltar a la ética de dos maneras: podríamos tratar mal a las personas o animales cuyo comportamiento medimos o también podríamos tratar mal al conjunto de conocimientos científicos que tratamos de establecer, en otras palabras, podríamos tratar a nuestra ciencia de manera improcedente. En este capítulo, analizamos el trato justo a los participantes; en el siguiente, el trato correcto a la ciencia. El conjunto de la sociedad, y la comunidad científica en particular, convino en establecer reglas mediante las cuales debemos hacer nuestra investigación. Algunas no están escritas, como las reglas básicas de la cortesía. Se presume que son reglas tan obvias que todo el mundo las entiende. Otras sí están escritas, como los Principios Éticos y Código de Conducta de los Psicólogos de la Asociación Psicológica Estadounidense (Ethical Principles of Psychologists and Code of Conduct, American Psychological Association [APA], 2002) y la Ética en la investigación con participantes humanos (Ethics in Research with Human Participants [Sales y Folkman], 2000). 68
04Martin068-094.indd 68
8/5/08 17:13:35
Cómo ser justo con los participantes
69
Estas reglas se revisan continuamente conforme cambia la concepción que tiene la sociedad del papel que cumple la experimentación y de los derechos de un individuo. En la primera parte del capítulo consideraremos la relación entre la persona que hace el experimento y la persona sobre la cual se realiza, incluyendo las normas básicas de educación de la relación. Luego examinaremos el efecto de esa relación en el resultado del experimento. También exploramos otras relaciones entre el experimentador y el participante. Por último, consideramos la ética del tratamiento justo a los animales.
■ Tratar a los participantes humanos con justicia Debido a que el propósito de la investigación psicológica es entender el comportamiento, por lo regular trataremos con seres humanos (y en algunos casos con animales). Tradicionalmente los psicólogos llaman sujetos a las personas que muestran su comportamiento. Es de creer que a los fundadores de la psicología les gustaba el término porque sonaba científico y los sujetos del estudio eran seres humanos. Pero por desgracia, el término también podría implicar que las personas quedaban sujetas a la voluntad del experimentador, o peor aún, sojuzgadas. En la década de 1930, se sugirió el término experimentée en lugar de sujeto, pero la propuesta no arraigó (Rosenzweig, 1970). Acaso esta exposición le parezca trivial: ¿Qué hay en una palabra, aparte de aire? En este caso, la palabra sujeto expresa la índole de la relación entre el individuo y el experimentador y apunta a ciertas consideraciones éticas. Los sujetos son pasivos y reaccionan a las condiciones de un experimento, como por ejemplo las sustancias químicas reaccionan pasivamente al ser combinadas en el laboratorio. Por esta razón, en 1994 la APA recomendó que se cambiara la terminología y que los que antes recibían el nombre de sujetos fueran llamados participantes. La APA consideró que este término reconoce la ayuda que nos brindan los participantes al colaborar en nuestra investigación y les concede un estado más equitativo con respecto al experimentador. Como veremos en el capítulo 13, al escribir los informes de investigación, es mejor referirse a los participantes como lo que son: estudiantes, niños, mujeres, etc., pero el término genérico apropiado es participantes. El uso del término participantes en lugar de sujetos no es aceptado por todos. Por ejemplo, la Sociedad Psiconómica permite a sus autores ignorar esta regla. Roddy Roediger, ex presidente de la Sociedad Psicológica Estadounidense (ahora la Asociación de Ciencias Psicológicas), se opone con vehemencia a que se aplique el término participantes a los sujetos y afirma que tiene una excusa especial para los artículos que envía a las revistas de la APA, debido a la grave dolencia que él mismo le explica a su corrector de estilo en una carta, de la que extractamos un fragmento: Tengo que señalar que soy miembro (de hecho, soy el fundador) de un grupo de Enfermos de Fobia al Participante (EFP). Debido a que he tenido que sobrevivir al uso de la palabra participante en muchas revistas de la APA […] también soy miembro de los Sobrevivientes al Síndrome de la Fobia al Participante (SSFP). El uso de la palabra participantes en nuestras publicaciones me ha causado angustia mental, estrés excesivo y me ha movido a que escriba esta carta y que busque un grupo de ayuda (con otros psicólogos experimentales que piensan que es abominable modificar el lenguaje). [Roediger, 2004]
04Martin068-094.indd 69
8/5/08 17:13:36
70
Capítulo cuatro
Como es obvio, en la carta se exagera la situación con ironía y humor, pero también se expresa la legítima preocupación que tienen algunos investigadores de que la ciencia de la psicología se vuelva demasiado sensitiva a lo que ellos consideran que son presiones de grupos de interés con designios más políticos que científicos. A principios de la historia de la psicología experimental nadie se inquietaba por cómo se llamara a la gente con la que se experimentaba, ya que el experimentador y el participante eran la misma persona. En aquellos días, la mayoría de los psicólogos se referían a sus propias experiencias internas como las variables dependientes en sus experimentos. Como creían que sólo el tiempo y el entrenamiento permitían tomar conciencia de estas experiencias internas, los experimentadores se consideraban a sí mismos como los mejores participantes. Más tarde, muchos experimentadores llegaron a creer que los informes verbales de los eventos internos no eran información apropiada para la ciencia de la psicología. Arguyendo que no era posible ser objetivos y subjetivos al mismo tiempo, estos experimentadores comenzaron una revolución en la psicología. Algunos, que reaccionaron exageradamente con la revolución, decidieron que sólo los animales eran apropiados para la experimentación psicológica. Si resulta que los informes verbales de los participantes no son buena materia, ¡entonces consigamos participantes que no hablen!1 En esos días la rata fue el principal participante de los experimentos. Otros investigadores pensaban que aunque los experimentadores tenían demasiada experiencia como para experimentar con ellos, las ratas eran un tanto diferentes a la mayoría de los seres humanos. Lo que necesitaban era un ser humano ingenuo, así que escogieron al estudiante universitario. Los estudiantes universitarios son los participantes de 70 a 85% de las investigaciones publicadas (Schultz, 1969; Smart, 1966) y de hasta 90% de los estudios que se realizan en los departamentos de psicología de las universidades (Jung, 1969). Según la opinión más actual, se supone que un participante debe ser un observador ingenuo y motivado que reaccione a las manipulaciones experimentales sin ninguna contaminación. Sin embargo, como veremos, los participantes son todo lo contrario. Tienen ideas definidas sobre el experimento en el que están y persiguen PARTICIPANTE SUPEREXmetas concretas que casi siempre son distintas DE 44.45 KILOS PERIMENTADOR de las del experimentador. Los seres humanos (incluso los estudiantes universitarios) tienen ciertos derechos legales y morales. Un físico puede tomar el tablón del experimento del plano inclinado y tirarlo, golpearlo, maldecirlo, besarlo o hacerle cualquier otra cosa. Sus colegas pensarán que está algo chalado, pero no llamarían a la policía ni lo expulsarían de la profesión. En cambio, los psicólogos deben cuidar en todo momento los derechos de los participantes. 1
Claro, me estoy tomando algunas libertades con la historia. Más adelante daré mejores razones para utilizar animales en la investigación.
04Martin068-094.indd 70
8/5/08 17:13:36
Cómo ser justo con los participantes
71
La naturaleza de la relación entre el experimentador y el participante hace que este último sea más vulnerable, debido a que el primero tiene más poder. Por ejemplo, muchos participan en un experimento para cumplir con un requisito de la clase de psicología. En estas circunstancias, los estudiantes llegan a sentir que su calificación corre peligro si no hacen lo que el experimentador les pide. Por otro lado, si la gente recibe una remuneración por sus servicios, pueden creer que si no cooperan, se les dará menos dinero. Por último, si los individuos se ofrecen como voluntarios para los experimentos porque creen que ayudan al avance de la ciencia de la psicología, pueden suponer que la sociedad sacará un provecho de su cooperación. En cualquier caso, los participantes ven al experimentador como el que tiene el poder último para evaluar o manipular su comportamiento. Además de los motivos académicos, monetarios o altruistas para cooperar con el experimentador, a veces también los participantes comparten la opinión de que los psicólogos tienen un saco misterioso lleno de trucos para adivinar si alguien coopera. Las tres primeras oraciones que intercambian un psicólogo y un desconocido ilustran esta creencia: “¿A qué se dedica?” “Soy psicólogo.” “Ah, ¿me está analizando?” Por alguna razón, mucha gente cree que los psicólogos tienen vista de rayos X con la que penetran en lo profundo de la mente para leer lo que uno piensa. Muchos creen que tienen que cooperar o el experimentador los descubriría. Este mito ayuda a desequilibrar la relación entre el experimentador y el participante a favor del primero.
A
E ¿M RÁ ? O TA ES ZAND LI NA
¿ME ESTARÁ ANALIZA NDO?
REGLAS DE CORTESÍA
Para equilibrar un poco la relación, los psicólogos experimentales deben seguir un código de conducta de trato respetuoso y digno hacia sus participantes. Como experimentador novel, debe colgar en su sala de experimentos un letrero (uno imaginario está bien) que diga: “¡Los participantes también son seres humanos!” Los participantes merecen el mismo trato cortés que le brinda a quien le ofrezca ayuda con un proyecto. Veamos algunas reglas básicas de cortesía: 1. Hacerse presente. Es muy frecuente que los experimentadores olviden que citaron a un participante o que no le avisen si se descompuso el instrumental o si, por alguna razón, se pospuso o se canceló el experimento. Si la persona se anota para un experimento, debe esforzarse por cumplir con su obligación de estar presente. 2. Sea puntual. También el tiempo del participante es valioso. No lo desperdicie.
04Martin068-094.indd 71
8/5/08 17:13:37
72
Capítulo cuatro
3. Esté preparado. Repase todas las fases del experimento antes de presentarse ante algún participante. No sólo es descortés no hacerlo, sino que también si tartamudea las instrucciones, juguetea con el equipo y en general si manosea y parlotea durante el experimento, los participantes se confunden o se enojan y trabajan mal. 4. Sea cortés. A menos que lo requiera el experimento, pida a sus participantes que hagan algo sin darles órdenes. Haga un uso libre de las expresiones: “por favor”, “gracias” y “de nada”. 5. Sea discreto. Trate como confidencial toda la información que el participante le dé en el contexto de un experimento. Sea discreto no sólo acerca de lo que le dice una persona, sino sobre la forma en que realiza la tarea asignada. En las subvenciones que proceden del erario, hay normas muy concretas sobre qué información se puede obtener, cómo puede aprovecharse y cómo debe codificarse y almacenarse. Si es posible, suprima los nombres de los participantes de las hojas de datos y siga un método que impida que terceros descubran la identidad de los individuos. 6. Sea profesional. No necesita ser tan grave ni tan rígido que sus participantes se sientan incómodos, pero tampoco hay que ser tan casual y frívolo que se convenzan de que no le importa mucho el experimento: a ellos tampoco les importará. Ni el experimento es el lugar adecuado para conseguir citas, piratearse compañeros para el golf, vender seguros o, en fin, valerse de la relación del experimentador con los participantes para cualquier propósito diferente al de la investigación. Estas reglas se ven muy sencillas, pero no todos los temas éticos concernientes a los participantes humanos son tan claros. Los temas más polémicos, como saber qué constituye un consentimiento informado o si debería tolerarse el estrés mental, se analizan exhaustivamente en los Principios Éticos en la Realización de Investigación con Participantes Humanos (Ethical Principles in the Conduct of Research with Human Participants, APA, 2002). Comoquiera que sea, ninguna publicación abarca todos los temas éticos y en muchos experimentos se dan situaciones comprometidas que exigen juicio y buen sentido. Por estos motivos, las instituciones de investigación tienen consejos institucionales de revisión (Institutional Review Boards, IRB).2 Los IRB están formados por investigadores experimentados y, a veces, médicos y otros expertos técnicos. Toda investigación con participantes humanos debería ser analizada por estos consejos.3 El investigador llena una forma que contiene varias pregun2 Los institutos nacionales de salud exigen que haya un IRB en toda investigación que se realice con sus fondos. Publicaron la guía: “Protección de los Sujetos de Investigación Humana: Guía del Consejo de Revisión Institucional” (NIH Guide, vol. 22, núm. 29, 13 de agosto de 1993), que está dirigida a ayudar a los miembros de consejos, investigadores y directores de las instituciones a que cumplan con sus responsabilidades. Se consiguen ejemplares en: U. S. Government Printing Office, Superintendent of Documents, P.O. Box 371954, Pittsburg, PA 15250 (referencia GPO Stock No. 017-040-00525-3). 3 En algunos casos, para los cursos que estudian un libro como el que tiene en sus manos, el profesor puede convencer al IRB de que lo deje evaluar los experimentos de la clase, por cuestiones éticas. Al hacerlo, el profesor tiende a ser conservador acerca de lo que será aprobado. Aunque ocasionalmente un experimento escolar resulta tan importante como para publicarlo, el propósito primordial de estos experimentos es capacitar a los estudiantes para que realicen investigaciones. De ordinario, los estudiantes aprenden tan bien en experimentos inocuos como en experimentos arriesgados. Si tiene planeado un experimento en el que los participantes se traguen un puñado de pastillas y luego revelen en público sus fantasías sexuales más pervertidas, mejor olvídelo.
04Martin068-094.indd 72
8/5/08 17:13:37
Cómo ser justo con los participantes
73
tas, como: “¿Se les pedirá a los participantes que den un consentimiento informado?” “¿Se mantendrá la confidencialidad de la información?” En esta forma también se le pide al investigador que describa brevemente la investigación que propone. Los miembros del consejo ponen particular atención a posibles daños físicos o psicológicos de los participantes. No es realista pedir que se elimine completamente el riesgo de lastimarse en una investigación. Un participante podría romperse una pierna al tropezarse con un tapete. Sin embargo, es deber del consejo cerciorarse de que se minimice el riesgo de lesiones. Y cuando se sabe que los riesgos son parte de la investigación, el consejo tiene que decidir si los beneficios que se deriven de la investigación sobrepasan esos riesgos. Los consejos eliminan o corrigen investigaciones que podrían faltar a la ética. Ahora bien, los IRB del campo biomédico han sido sometidos a investigaciones, ya que se descubrió que una minoría significativa de sus miembros no equilibran bien riesgos y beneficios de la investigación con seres humanos (B. Barber, 1976). Entre los interrogados, la gran mayoría no tienen estudios formales de ética de la investigación. Algunos psicólogos sostienen que no hay muchas pruebas de que los consejos logren reducir los riesgos que corren los participantes humanos (Mueller y Furedy, 2001). Asimismo, hay quienes consideran que los IRB pueden volverse tan quisquillosos que limiten las empresas intelectuales de las ciencias sociales. Otros, como Tom Puglisi (2001), ex director de la oficina del gobierno federal que supervisa los IRB, creen que los IRB sirven para un fin necesario y que en una lectura adecuada de las normas se ve que muchas ciencias de la investigación social y del comportamiento están exentas. En otras palabras, cuando la mayoría de los psicólogos presentan sus propuestas de investigación a un IRB, deben declarar por qué está exenta de las normas, en lugar de tratar de justificar por qué hay que hacerla. Cualquiera que sea su opinión sobre la utilidad de los IRB, tenga presente que la responsabilidad última de que una investigación sea ética recae en usted, el experimentador.
04Martin068-094.indd 73
8/5/08 17:13:38
74
04Martin068-094.indd 74
Capítulo cuatro
8/5/08 17:13:38
Cómo ser justo con los participantes
75
CARACTERÍSTICAS DE LA DEMANDA
Cuando los participantes se presentan para un experimento, tienen poca idea de lo que se les pedirá, aunque por lo regular están interesados en el experimento y quieren saber con exactitud de qué se trata. En cambio, los experimentadores guardan silencio en cuanto a su intención, lo cual provoca que los participantes traten de determinar de qué se trata en realidad el experimento a partir de las pistas que aquéllos les dan. Así, el experimento se convierte en un juego de adivinanzas. Las pistas que influyen en los participantes durante una situación experimental reciben el nombre de características de la demanda, ya que exigen ciertas respuestas (Orne, 1962). El experimentador proporciona muchas pistas, pero los participantes también confieren al experimento características de la demanda. Si han tomado un curso de psicología, habrán leído acerca de experimentos en psicología o incluso si un amigo les ha hablado del experimento, es posible que tengan las siguientes expectativas: El experimentador me va a dar descargas eléctricas. El experimentador trata de descubrir si soy inteligente. El experimentador trata de engañarme para que le revele algo vergonzoso sobre mí. A veces estas nociones son tan poderosas que el participante no puede sacudírselas. En uno de mis experimentos, a un participante se le pidió que memorizara un conjunto de palabras que se le repetían a través de unos audífonos. Poco después de empezar el experimento, se quitó el aparato y gritó: “¡Esto me está dando toques eléctricos!” Pensando que tenía razón, medí con cuidado para ver si pasaba alguna corriente a través de los audífonos; sin embargo, hacían tierra. Traté de continuar con el experimento, pero este joven continuaba diciendo que sentía descargas eléctricas. Se había hecho a la idea de que yo iba a aplicarle descargas y no creía lo contrario. Como resultado, sus datos tuvieron que ser desechados. Otras características de la demanda vienen de las pistas sutiles que el participante capta durante el experimento. Para minimizarlas, los experimentadores tratan de estandarizar todos los procedimientos experimentales. Por ejemplo, un experimentador lee las instrucciones en un formato fijo, de manera que todos los participantes cuando menos tendrán las mismas características verbales de la demanda, aunque, en algunos experimentos, incluso la forma en que el experimentador lee las instrucciones incide en el desempeño del participante. En un experimento, los experimentadores grabaron en un casete dos conjuntos de instrucciones manipuladas para que dieran resultados experimentales opuestos (Adair y Epstein, 1968). Encontraron diferencias significativas entre el desempeño de los que escuchaban los diferentes casetes. Aunque los experimentadores leyeron las mismas instrucciones, al parecer la diferencia sutil en sus voces produjo resultados congruentes con la manipulación. Parece que incluso los animales son influidos por pistas sutiles dadas por quien realiza la investigación. En uno de los más famosos experimentos sobre el sesgo del experimentador, estudiantes experimentadores entrenaron ratas para que recorrieran un laberinto (Rosenthal y Fode, 1973). A algunos se les dijo que sus ratas habían sido criadas para que fueran brillantes, de rápido aprendizaje; a los demás se les dijo que sus ratas habían sido criadas para ser tontas y lentas para aprender. Las primeras aprendieron a recorrer el labe-
04Martin068-094.indd 75
8/5/08 17:13:38
76
Capítulo cuatro
rinto en menos ensayos, aunque, de hecho, eran de la misma camada de las segundas. La razón inusual de este resultado es que los estudiantes experimentadores deben haberlas tratado de manera diferente; jugaron más con las ratas listas y las manejaban de forma que perdieron el miedo de ser manipuladas. Sin embargo, otros investigadores han sostenido que los resultados se debieron a que los estudiantes experimentadores hicieron trampa con sus datos (Barber y Silver, 1968). Cualquiera que sea la explicación, el sesgo del experimentador se reflejó en el resultado del experimento. Aunque mi presentación del concepto de las características de la demanda suena ominosa, es menos problemático de lo que dije. Investigadores (Weber y Cook, 1972) han dicho que tienen pocas pruebas de que los participantes traten de confirmar la que ellos creen que es la hipótesis del experimentador, según dedujeron de las pistas. Más bien, sostienen que los participantes tratan de dar su mayor empeño; es decir, tratan de parecer competentes, normales y agradables. El interés de los participantes en cómo serán juzgados es mucho más importante que su interés por cumplir las expectativas del experimentador o de confirmar la hipótesis. T. X. Barber (1976), en un libro que trataba acerca de los errores de la investigación con seres humanos, refiere que muchos experimentos que se supone demuestran las características de la demanda son bastante débiles por otros errores de diseño. Opina que gran parte de las investigaciones que apoyan el concepto están mal diseñadas. Sin embargo, aun si esas investigaciones son débiles, no podemos concluir que las características de la demanda deban ser ignoradas como problema potencial de nuestros experimentos. Deberíamos hacer todo lo posible para minimizar sus efectos potenciales y así mejorar nuestros experimentos. Respuestas de los participantes a las características de la demanda
¿Cómo responden los participantes si detectan las características de la demanda del experimento? Participantes cooperativos. Cuando los participantes humanos se forman una idea sobre cuáles son las características de la demanda del experimento, reaccionan según su actitud hacia el experimento (Adair, 1973). La mayoría de la gente tiende a ser cooperativa y trata de cumplir con las demandas percibidas del experimentador. Unos cooperan en un grado sorprendente. En un experimento que probaba la cooperación, el experimentador dio a un participante un paquete con 2000 hojas y le pidió que calculara 224 sumas en cada hoja. Aunque la tarea era imposible, el individuo sumó cinco horas y media, hasta que el experimentador se dio por vencido. En un segundo experimento, se instruyó a los participantes para que rompieran en cuando menos 32 pedazos la hoja después de terminar las sumas. Nuevamente, los participantes se empeñaron en la tarea durante varias horas sin hostilidad aparente. Para comprobar que el deseo de cooperar puede estar detrás de la respuesta de los participantes a las características de la demanda, consideremos el siguiente experimento sobre la presión de grupo: Se lleva a una persona a un cuarto con otras seis y se les plantean pro-
04Martin068-094.indd 76
8/5/08 17:13:39
Cómo ser justo con los participantes
77
blemas que consisten en calcular cuál de dos líneas es más larga. Los primeros problemas son fáciles y todo mundo está de acuerdo. Luego se les presentan dos líneas y nuestro participante está seguro de que la línea de arriba es más larga, pero los demás dicen que es la de abajo. Después de una pausa, el participante concuerda en que la línea de abajo es más larga. ¿Qué ocurrió? El experimentador diseñó el experimento para descubrir si la presión de grupo basta para que alguien adopte una respuesta que es claramente incorrecta. Los otros participantes eran cómplices a los que el experimentador les pidió que mintieran en el ensayo apropiado. Debido a que el participante real se dio por vencido ante la presión del grupo, el experimentador pensó que su hipótesis quedó confirmada. Pero leamos la mente de nuestro participante 5 y veamos lo que en realidad ocurrió: “Vaya, son otras dos líneas. En definitiva, la superior es la mayor. ¡Qué experimento tan tonto! ¿Por qué nos hacen perder el tiempo con esa tarea tan fácil? ¿Y por qué lo hacemos en grupo? De seguro el experimentador trata de ver si podemos influirnos unos a otros. Todos dicen que la línea inferior es más grande, pero no pueden pensarlo de verdad. Yo podría ser cómplice y decir que estoy de acuerdo o mantenerme en mi dicho. Quiero hacer un buen trabajo para poder salir de aquí. Además, estoy seguro de que un grupo puede hacer que alguien cambie de opinión, así que voy a estar de acuerdo. Además, el experimentador parece una buena persona y no quiero echarle a perder el experimento.” Si atinamos al leer la mente de esa persona, la conclusión del experimentador estaba equivocada. El participante, que sólo trataba de cooperar, lo llevó a una conclusión incorrecta. De hecho, a mediados de la década de 1970 se hizo evidente que los participantes en estudios de conformidad, como el anterior, eran muy suspicaces, en grados que iban de 50 a 90% (Glinsky, Glinski y Slatin, 1970). Sin embargo, el efecto de la suspicacia en el comportamiento parece ser insignificante. En otras palabras, hay muy poca diferencia en la conducta de los participantes suspicaces y los participantes ingenuos (Kimmel, 1996), y cuando se presentan efectos, los participantes prefieren quedar bien antes que reaccionar de manera negativa hacia el experimentador. Participantes defensivos. Algunos participantes están menos interesados en que se vea bien el experimentador que en verse bien ellos mismos; llamémosles participantes defensivos. Estos individuos buscan las características de la demanda como los participantes cooperativos, pero las utilizan de otra manera. Los participantes que tratan de desempeñarse muy bien son una ventaja para el experimento. Pero en algunos, sobre todo en experimentos de evaluación de actitudes, pueden crear problemas. Supongamos que estamos investigando las diferencias en cuanto a cómo los latinos y los anglosajones ven los comportamientos relacionados con los roles de género en los niños. Publicamos un anuncio solicitando voluntarios que tengan nombres españoles y que hablen español como primera lengua, y otro anuncio solicitando anglosajones que no cumplan ninguno de estos criterios. A continuación mostramos a cada voluntario imágenes de niños en los roles de género tradicionales (como niñas jugando con muñecas) y heterodoxos (como 5
Los psicólogos tienen poderes místicos.
04Martin068-094.indd 77
8/5/08 17:13:39
78
Capítulo cuatro
niños jugando con muñecas). Luego les pedimos que califiquen qué tan aceptable es cada comportamiento. Supongamos que más latinos que anglosajones dicen que son aceptables los comportamientos heterodoxos. Podríamos concluir que los latinos son más liberales que los anglosajones. Pero hay otra interpretación. Los miembros de cada grupo están conscientes de que fueron seleccionados por su origen étnico. Supongamos que los latinos estuvieran más interesados en defender el orgullo de su grupo étnico que los anglosajones. En este caso, los primeros se habrían puesto a la defensiva para no parecer inaceptablemente chovinistas. En otras palabras, habrían detectado las características de la demanda del experimento y habrán tratado de defender a su grupo. En un experimento real que demostró la reacción defensiva de los participantes ante las características de la demanda, los experimentadores les pidieron que oprimieran una tecla con el índice derecho primero y luego con el izquierdo (Rosenberg, 1969). La velocidad es mayor con el dedo dominante, pero a un grupo se le dijo que los estudiantes de Yale y Michigan oprimían la tecla a velocidades similares con cada dedo. Al segundo grupo no se le dio esta información. La diferencia entre las velocidades de los dos dedos fue significativamente menor en el primer grupo. Es decir, los participantes percibieron las características de la demanda no tan sutiles del experimento y trataron de verse lo mejor posible. Participantes que no cooperan. Algunos participantes no son ni cooperadores ni defensivos, sino que de plano no cooperan. El resultado de tal comportamiento ha sido llamado efecto “jódete” (Masling, 1966). El individuo que no coopera trata de determinar las características de la demanda del experimento y luego hace lo que puede para contrariar la hipótesis del experimentador. Estas personas actúan por diversos motivos. Quizá participan para cumplir el requisito de un curso y se sienten resentidos por la obligación. O bien se oponen a la idea de estudiar el comportamiento humano desde el punto de vista científico. O nada más es que no les cae bien el experimentador. Cualquiera que sea la causa, llegan a ser un verdadero problema para el experimento. Un medio de eliminar a los participantes que no cooperan es establecer un criterio mínimo de desempeño para excluir los datos de quien esté por debajo. Debe determinar ese criterio antes del experimento y anunciarlo cuando haga públicos los resultados. Pero ni este método eliminará los datos de todos los participantes que no cooperan. A veces lo mejor que podemos hacer es tratar de dar a los integrantes del grupo una impresión positiva de nuestro experimento y esperar que cooperen. Cómo minimizar las características de la demanda
Aunque no podemos eliminar del todo las características de la demanda de un experimento, es preciso hacer todo lo posible por minimizar las que pudieran volverse variables de confusión porque incidan diferencialmente en los niveles de la variable independiente. Es importante saber si un cambio de comportamiento obedece a la manipulación de la variable independiente del experimentador o a las características de la demanda percibidas por el participante. La confusión causada por estas últimas se palia de diferentes maneras.
04Martin068-094.indd 78
8/5/08 17:13:39
Cómo ser justo con los participantes
79
Automatización. Las características de la demanda pueden controlarse automatizando el experimento tanto como sea posible. Ya analizamos el uso de instrucciones grabadas como forma de automatización. Los experimentadores leen mal las instrucciones, sobre todo si ya las leyeron en voz alta 20 o 120 veces. También se le puede pedir a alguien que no esté al tanto de qué resultado se espera del experimento que grabe las instrucciones, para minimizar el sesgo del experimentador causado por las inflexiones de la voz. También he grabado las instrucciones en video en algunos de mis propios experimentos y he utilizado presentaciones de computadora con audio y video. En este caso, si los ensayos experimentales incluyen secuencias de eventos complicados, pueden presentarse ensayos de prueba a una tasa lo bastante lenta para que los participantes los sigan, con lo que se elimina la necesidad de que el experimentador regrese a explicar partes pasadas de las instrucciones. En algunos laboratorios se utilizan computadoras para cumplir en el experimento todas o parte de las funciones del experimentador. Algunos investigadores programan una computadora para que los participantes nunca los vean en persona. El participante llega a la hora señalada. Una señal le indica que se acomode frente a la pantalla y presione un botón. A partir de ahí, la computadora muestra las instrucciones. El individuo indica que las entendió e inicia el experimento. La idea general del método es que si los participantes no son los autómatas pasivos que pensamos que eran, bien podemos automatizar a los experimentadores. Muchos investigadores rechazan este procedimiento diciendo que la artificialidad de la situación hace que los participantes se sientan deshumanizados y disminuye la capacidad de generalizar los resultados. Este procedimiento también requiere que los participantes sean capaces de leer y entender instrucciones, lo cual lo vuelve inaccesible para algunos, como los niños y las ratas (¿y los estudiantes de nuevo ingreso?). Ciego y doble ciego. La segunda forma de reducir al mínimo las características de la demanda transmitidas por el experimentador es evitar que éste conozca el nivel de la variable independiente. En general, los participantes no saben cuál es el nivel de la variable independiente que se les presenta. Por eso, los estudios reciben el nombre de experimentos ciegos. Sin embargo, a veces es importante que ni los participantes ni el experimentador sepan de las manipulaciones. Por ejemplo, una vez hice un experimento para determinar si era posible “sentir” los colores con los dedos. A los participantes se les vendaron los ojos y se les dieron tres cartas, dos rojas y una azul. En cada ensayo se les pidió que pusieran las dos cartas que eran similares en una pila y la que era diferente en otra. Me preocupaba que, sin quererlo, les señalara cuándo acertaban por el cambio de mi ritmo de respiración, toses o gruñidos. Algunos amigos convencidos de la PES (percepción extrasensorial) me dijeron que les mandaba mensajes extrasensoriales cada vez que atinaban. Para evitar tal señalización, me senté detrás de una pantalla que me impedía observar a los participantes. Así, estaba “ciego” al color que ellos sentían. Este procedimiento a veces recibe el nombre de doble ciego, debido a que ni los participantes ni el experimentador conocen el nivel de la variable independiente.6 Los psicofarmacólogos, que investigan los efectos de las drogas en 6
Uno de mis revisores me dijo que este procedimiento me hizo ¡dos veces daltónico!
04Martin068-094.indd 79
8/5/08 17:13:39
80
Capítulo cuatro
el comportamiento, realizan investigaciones empleando el diseño de doble ciego. Suponga que usted, como investigador, quiere saber si un fármaco llamado Cuervozac, que ha sido desarrollado recientemente, cura de la depresión a los pacientes siempre que ven cuervos. Se da cuenta de que tiene el problema de si sólo le da el medicamento a un grupo de individuos y luego trata de determinar si se curó su depresión. Quizá la depresión mejora nada más por la esperanza de los pacientes de que los va a ayudar. También es posible que si evalúa la depresión de los pacientes, vea un mejoramiento fantasma, ya que usted lo esperaba. Para protegerse de los efectos de las expectativas del paciente o del experimentador, debe exponer a otro grupo, un grupo control, a un segundo nivel de la variable independiente (sin la droga). Tendría que tratar a este grupo control de la misma manera que al grupo al que le administra la droga, con la excepción de que no se la administra. Lo más probable es que se decida a darle al grupo control un placebo, en lugar del fármaco.
ESTOY CANSADO DE SER UN EXPERIMENTADOR CIEGO
ÉSTE DEBE SER UN EXPERIMENTO DE DOBLE CIEGO
Dar un placebo consiste en administrar una sustancia inerte de la misma manera en que se administra una sustancia activa. Si el medicamento es una píldora, el placebo sería, digamos, una píldora de azúcar, o si es una inyección, el placebo sería una solución salina. Incluso para estudios sobre la marihuana se han producido cigarros placebos que saben como marihuana pero que no contienen el ingrediente activo. El propósito del placebo es producir un diseño de doble ciego; ni el experimentador ni los participantes saben si un individuo cualquiera toma el fármaco o el placebo. A veces es difícil o imposible evitar que los participantes y el experimentador conozcan el nivel de la variable independiente a la cual están expuestos los primeros. Si es un investigador interesado en el efecto de las condiciones de iluminación en una planta de ensamblaje sobre la productividad de los trabajadores, podría dejar a un grupo de operadores en las condiciones actuales y a un segundo grupo bajo mayor iluminación. Aquí, es obvio que los trabajadores están conscientes de las condiciones de luz en cuanto entran en la planta y nada
04Martin068-094.indd 80
8/5/08 17:13:40
Cómo ser justo con los participantes
81
podrán hacer para impedirlo. Cito este ejemplo porque cuando fue realizado en la década de 1920, dio origen al término efecto Hawthorne. Hawthorne era el nombre de la fábrica de la Western Electric Company donde se llevó a cabo el experimento. El resultado fue que la productividad aumentó por igual en los dos grupos, con cualquiera de las condiciones de iluminación. El efecto Hawthorne, entonces, es un cambio de comportamiento que se debe a la atención que pone el experimentador en los participantes y no a los efectos de la variable independiente. El resultado general de la investigación fue que durante los cinco años en que se obraron cambios en condiciones de trabajo como iluminación, tiempos de descanso y horas trabajadas, la productividad no dejó de aumentar, independientemente de la condición en que estuvieran los trabajadores (Roethlisberger, 1977). La interpretación original de este resultado fue que la moral de los trabajadores mejoró mientras se les prestó una atención continua en cada cambio de las condiciones. Sin embargo, Mac Parsons (1974) revisó la investigación original y descubrió que durante el curso del experimento a los trabajadores se les dio cada vez más información sobre su productividad diaria. Esta información, en combinación con los cambios en los esquemas de pago, pudo haber traído un incremento en la productividad. Su tesis fue que los trabajadores incrementaron su productividad en función del incremento en el reforzamiento. Así, el efecto Hawthorne, como se interpreta generalmente, quizá no se debió a los resultados observados en la planta. No obstante, no deja de ser posible que una manipulación experimental incite en el comportamiento un cambio independientemente de cuál fuera dicha manipulación. Por ende, como experimentador debe tratar de minimizar estos efectos y los efectos del hecho de que los participantes sepan a qué nivel de la variable independiente están expuestos. Si no pueden eliminarse por completo, cuando menos debe estar alerta a la posible confusión que pudieran causar. Experimentadores múltiples. La tercera forma de enfrentar las características de la demanda causadas por el experimentador es recurrir a experimentadores múltiples. En este caso, no se controla la variable del experimentador, sino que se deja que varíe con la asignación al azar de los experimentadores a los niveles de la variable independiente. Este procedimiento aumenta la generalidad del resultado y disminuye las posibilidades de que un solo experimentador claramente sesgado influya en el resultado. ¿Las características de la demanda son un problema en su experimento?
Aun después de tratar de minimizar las características de la demanda, se entremeten en el experimento. A continuación presento los procedimientos para detectarlas. Interrogatorio posterior al experimento. Durante varios años después de la revolución en contra de los informes verbales subjetivos, los experimentadores rara vez cuestionaron a los participantes acerca de sus impresiones al terminar el experimento. Por fortuna, ahora muchos experimentadores recaban esa información de manera rutinaria, pues puede ser valiosa no sólo para revelar las características de la demanda, sino también para sugerir nuevas hipótesis que se prueben más adelante en un experimento formal.
04Martin068-094.indd 81
8/5/08 17:13:40
82
Capítulo cuatro
El interrogatorio posterior al experimento adopta muchas formas, desde preguntas casuales del experimentador hasta un cuestionario escrito bien estructurado. Si quiere estar seguro de descubrir las características de la demanda, debe planear las preguntas con mucha anticipación. Al planear sus interrogantes, cerciórese de que no incluyan las características de la demanda. Por ejemplo, en el experimento de la presión de grupo, una pregunta sesgada sería: “No estaba consciente de que los otros no eran participantes reales, ¿verdad?” La propia pregunta hace que el que responde diga que no. Si los entrevistados dicen que sí, admiten que no eran las personas ingenuas y cooperadoras que habían dicho que iban a ser. También se ponen en la posición de decir al experimentador que el experimento fue una pérdida de tiempo, ya que no puede emplear sus datos. También debe planear que sus interrogantes vayan de preguntas generales abiertas a preguntas específicas de sondeo. Por ejemplo, en un experimento diseñado para determinar si los seres humanos podían ser condicionados sin darse cuenta, se pidió a los participantes que hablaran sobre cualquier tema que se les ocurriera y que siguieran hasta que se les pidiese que se detuvieran (Krasner, 1958). Siempre que decían un sustantivo en plural, el experimentador asentía con la cabeza, decía “Bien” o “Ajá” y, en general, se mostraba reforzante. Al seguir hablando, utilizaban con más frecuencia sustantivos plurales. Como evidencia de que los participantes no estaban conscientes del condicionamiento, se les hizo la siguiente pregunta después del experimento: “¿Observó que el experimentador hiciera algo peculiar mientras usted hablaba?” La mayoría informó que no. Otros investigadores, no convencidos del experimento, realizaron uno similar pero después de la pregunta original hicieron otras preguntas cada vez más específicas: ¿Observó lo que el experimentador respondía cuando usted decía ciertas palabras? Aunque los participantes tenían dificultades para expresarlo en palabras, la mayoría estaban al tanto de que “el experimentador se veía más contento si le hablaba de ciertas cosas, como enumerar partes de autos”. Quienes referían esta conciencia fueron los mismos que habían mostrado el efecto del condicionamiento. Por tanto, para determinar si los participantes son influidos por las características de la demanda, debemos hacer preguntas que estén relacionadas con las características específicas de la demanda y otras más generales. Grupo control no experimental. Otra manera de determinar si las características de la demanda podrían haber afectado el resultado del experimento es comparar un grupo control no experimental con uno experimental (Adair, 1973). El grupo control no experimental no está expuesto a la manipulación de la variable independiente. Simplemente se les habla del experimento, se les dan las instrucciones, se les muestra cualquier aparato y luego se les pide que describan cómo creen que se desempeñarían si se les pusiera en tal situación. Si su pronóstico es similar al resultado del grupo experimental, es probable que hayan detectado las características de la demanda. Estas características, y no la variable independiente, podrían haber causado el resultado del experimento. Si su pronóstico es diferente del resultado experimental, se cree que las características de la demanda no causarían el comportamiento observado. Por ejemplo, Mitchell y Richman (1980) sospechaban de un resultado que apoyaba una representación “casi pictórica” en la memoria de las imágenes mentales. En un experimento
04Martin068-094.indd 82
8/5/08 17:13:41
Cómo ser justo con los participantes
83
característico, se les pedía a los participantes que memorizaran un estímulo visual, que generaran una imagen mental de él y que luego lo “escudriñaran” desde un punto de la imagen a otro. El resultado usual es que hay una relación lineal directa entre el tiempo de escudriñamiento y la distancia en el estímulo. Mitchell y Richman pensaron que este procedimiento podía incluir las características de la demanda, así que realizaron un no-experimento en el que se les pidió a los participantes que pronosticaran sus tiempos de escudriñamiento. Estos individuos produjeron diagramas de dispersión que no se distinguían de los encontrados en el trabajo experimental anterior. Los investigadores no pudieron descartar la posibilidad de que los resultados originales también pudieran haber sido causados por las características de la demanda. Grupos control simulados. Aunque preguntar a los participantes que no habían estado en el experimento real cómo se hubieran comportado da alguna idea de las características de la demanda, no dice cómo se hubieran comportado en realidad, lo que es engañoso. Por ejemplo, durante mucho tiempo se ha tenido curiosidad de saber si en estado de hipnosis la gente puede realizar actos antisociales o lastimarse. En 1939, Rowland informó de un experimento en el cual se les dijo a participantes hipnotizados que una gran serpiente cascabel albina (Crotalux atrox) era una cuerda y se les pidió que la tomaran. Uno de los dos participantes de inmediato trató de hacerlo y golpeó la mano contra el vidrio invisible que lo separaba de la serpiente venenosa. En cambio, 41 de los 42 participantes no hipnotizados del grupo control rehusaron hacer lo mismo cuando se les pidió. El descubrimiento fue reproducido en 1952 por Young (citado en Kihlstrom, 1995). Siete de los ocho participantes hipnotizados trataron de tomar a la serpiente, que estaba detrás de un vidrio invisible y también se mostraron dispuestos a lanzar una botella de ácido nítrico al asistente de investigación, que también estaba detrás de un vidrio. ¿Estos resultados indican que la gente hipnotizada está dispuesta a llevar a cabo acciones antisociales y dañinas? En 1965, Orne y Evans idearon un nuevo procedimiento, el grupo control simulado, para investigar el tema. El grupo control simulado se expone a la situación experimental pero sin la manipulación crítica de la variable independiente. En este caso, el grupo experimental de participantes muy sugestionables fue hipnotizado y se le pidió que levantara una serpiente venenosa llamada elápido australiano. Todos los participantes accedieron y además estuvieron dispuestos a sacar una moneda de un vaso de precipitados con ácido nítrico e incluso a lanzarle el ácido a uno de los experimentadores, que estaban detrás de un vidrio. Sin embargo, tanto el grupo de participantes no susceptibles a la hipnosis a quienes se les pidió que actuaran como si estuvieran hipnotizados como el grupo de los participantes no hipnotizados accedieron sin excepción. ¿Estos individuos eran tan insensibles que estaban dispuestos a lastimarse ellos mismos y al experimentador? Claro que no. Cuando se les entrevistó después del experimento, dijeron que se sentían perfectamente seguros en el experimento. Sabían que el experimentador no dejaría que se lastimaran; la seguridad era una de las características de la demanda del experimento y ellos lo sabían. En este caso, se necesitó el grupo control simulado para entender a cabalidad cómo las características de la demanda, y no la hipnosis, pudieron haber dictado el comportamiento.
04Martin068-094.indd 83
8/5/08 17:13:41
84
Capítulo cuatro
OTRAS RELACIONES ENTRE EXPERIMENTADOR Y PARTICIPANTE
Al inicio del capítulo estaba el participante ingenuo. Y el participante ingenuo halagaba la vista del experimentador. Sin embargo, no todos los participantes ingenuos son buenos; la mayoría ni siquiera son ingenuos. Hasta aquí hemos considerado los métodos de mantener a los participantes tan ingenuos como sea posible, o por lo menos, de descubrir cuándo no pueden ser considerados ingenuos. No obstante, tenemos otra alternativa. Podemos rendirnos ante el hecho de que los participantes no son ingenuos y aprovechar su habilidad para la solución de problemas. Engaño y representación de papeles
Una manera de aprovechar la habilidad de los participantes para resolver problemas consiste en darles pistas falsas, para que su interpretación de las características de la demanda sea incorrecta. Este procedimiento de engaño, definido como el acto de disimular o camuflar el propósito real de un experimento, es un tema polémico en la psicología, por razones tanto morales como prácticas. El engaño se usa mucho en psicología, en particular en campos de la psicología social. De hecho, hay ámbitos de la psicología social en que no es posible hacer investigación experimental sin el engaño. Por ejemplo, supongamos que está interesado en determinar las condiciones que llevan a los transeúntes a ayudar a una persona en problemas. Como es lógico, no resulta práctico instalarse en una esquina hasta que alguien se meta en dificultades. Entonces, se podría inventar una situación en la cual un confederado 7 simule que tiene problemas, mientras usted observa el comportamiento de los transeúntes. Claro está que tendrá que engañar a la gente que pasa, ¿pero de qué otra manera podría hacer el experimento? El engaño recorre el espectro desde el famoso y notorio experimento de Stanley Milgram (1963), quien engañaba a los participantes haciéndoles creer que aplicaban descargas eléctricas potentes e incluso mortales a otros participantes, hasta los experimentos inocuos de la psicología cognoscitiva. Por ejemplo, en un experimento sobre el aprendizaje incidental, se les podía pedir a los participantes que miraran una lista de palabras y que las clasificaran en alguna dimensión, como por ejemplo, la emoción. Luego, al final del experimento se les hacía una prueba de memoria y se les pedía que recordaran las palabras de la lista original. En cierto sentido, habían sido engañados, ya que nunca se les dijo que deberían memorizar las palabras. Pero si se les hubiera dicho con antelación, hubiera sido imposible estudiar el aprendizaje incidental; el aprendizaje hubiera sido intencional, no incidental. Está a debate si el uso del engaño va en aumento o se aminora. Como se muestra en varias encuestas, se incrementó en las décadas de 1970 y 1980 (Gross y Flemming, 1982). Sin embargo, encuestas más recientes indican que su uso ya no ha aumentado y que incluso ha disminuido (Nicks, Korn y Mainieri, 1977). Lo que parece seguro es que la forma del engaño ha cambiado; ahora hay pocos estudios que engañan con descaro a los participantes y muchos no hacen más que ocultar la información pertinente. 7
¡No es un soldado rebelde! En psicología le llamamos así a las personas entrenadas para ayudar al experimentador durante el experimento actuando de cierta manera.
04Martin068-094.indd 84
8/5/08 17:13:41
Cómo ser justo con los participantes
85
El argumento a favor del engaño reza como sigue: está mal mentir, pero nos justificamos de despistar temporalmente a los participantes, diciendo que contribuimos al avance de la ciencia. Como hemos visto, en ciertos campos de la psicología sería imposible responder a muchas de las preguntas más importantes sin recurrir al engaño. Además, se los contamos a nuestros participantes cuando termina el experimento y somos completamente honestos en ese punto, de modo que anulamos la mayor parte de los efectos del engaño. El argumento en contra del uso del engaño va por estas líneas: puede emplear el término “despistar”, si quiere, pero sólo es un eufemismo de “mentir”. Ya hay bastante deshonestidad en el mundo para todavía ser deshonesto en el nombre de la ciencia. ¿Cuántos de estos experimentos “justificables científicamente” han hecho que la ciencia avance a grandes saltos? ¡No muchos! Podemos idear otras formas de hacer muchos experimentos, como pedir a los participantes que representen un papel. Es ingenuo pensar que revelar la verdad a los participantes al final del experimento va a anular todos los efectos del engaño. De hecho, hay otros dos problemas: el engaño acrecienta las suspicacias de los futuros participantes y reduce la confianza en los psicólogos, lo que le da una mala reputación a la profesión. El engaño en la psicología no vale los costos y debería eliminarse (Ortmann y Hertwig, 1997). Se han investigado estos dos puntos (Kimmel, 1996), y los resultados muestran que los efectos de las sospechas de los participantes sobre el desenvolvimiento de la investigación son insignificantes. Además, en los estudios se indica que los participantes que han sido engañados no quedan resentidos con los investigadores y que el engaño no deja una huella negativa en su impresión de la psicología o en sus actitudes hacia las ciencias en general. Por ejemplo, Christensen (1988) revisó los estudios que evaluaron las reacciones de los participantes a los experimentos con engaños. Los individuos que participaron en tales experimentos dijeron que no les importaba haber sido engañados, que disfrutaron más la experiencia (que los que estuvieron en experimentos sin engaño), sacaron más provecho educativo y no sintieron que se violara su privacidad. Además, en las encuestas se muestra constantemente que la mayoría de la población en general no levanta objeciones graves al engaño utilizado en la investigación. Se ha propuesto la representación de papeles como un procedimiento alternativo al engaño. ¿Es igualmente eficaz? Algunos experimentadores se han valido tanto del engaño como de la representación de papeles en las mismas condiciones para comparar los resultados. En la representación de papeles, el experimentador les pide a los participantes que se imaginen en determinada situación y que respondan como lo harían si fuera real. Por ejemplo, si le interesa el comportamiento de las personas durante las negociaciones laborales, le pediría a un individuo que se imagine que es el líder de trabajadores, a otro que fuera el presidente de la compañía y a un tercero que actuara como un árbitro. Luego procede según la premisa de que sus respuestas se parecen a la conducta de las personas en la misma situación real. Por desgracia, aunque de algunos experimentos se desprenden resultados equivalentes del engaño y la representación de papeles (Greenberg, 1967), de muchos otros, no (Orne, 1970). También es difícil especificar las condiciones en que cabe esperar resultados similares con los dos métodos. En muchos aspectos los experimentos en los que se representa un
04Martin068-094.indd 85
8/5/08 17:13:42
86
Capítulo cuatro
papel son muy parecidos al control simulado mencionado en la sección anterior. Quizá refleja las características de la demanda del experimento, en lugar de servirnos para predecir qué comportamiento ocurriría en una situación del mundo real. Como psicólogo en cierne, debe tomar estas reglas con seriedad. Si está pensando en acudir al engaño en uno de sus experimentos, tiene que ponderar los costos y los beneficios. Observación naturalista
En el capítulo 1 ya mencioné esta última variedad en la relación entre el experimentador y los participantes. La observación naturalista depende de que el experimentador sea un observador no intrusivo. Por ejemplo, en lugar de que un participante represente un papel en una negociación fingida, el experimentador se introduce en una negociación real y observa las conductas. Ya hemos hablado de los problemas del método. Los experimentadores tienen poco control sobre las variables de la situación. Tienen que esperar a que las cosas ocurran naturalmente y además no pueden controlar las variables de confusión ni sacar conclusiones causales de los datos correlacionales. En esta sección hemos examinado los problemas de tratar a los participantes como observadores ingenuos, no contaminados. Por lo menos, debemos estar conscientes de que los participantes poseen la capacidad de resolver problemas y diseñar nuestros experimentos de manera que se puedan evaluar los efectos de sus intentos de hacerlo. Siempre que sea posible, estos intentos deben ir a favor nuestro, no en contra. Parafrasearé la última palabra de la APA sobre las responsabilidades del investigador al tratar a participantes humanos. El investigador hará bien en apegarse a los siguientes principios (APA, 2002): 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.
Evaluar la validez ética del experimento. Determinar si los participantes corren riesgos. Aceptar la responsabilidad de que los procedimientos sean éticos. Revelar los riesgos a los participantes y pedir su consentimiento informado. Decidir si el engaño se justifica y es necesario. Respetar la libertad de los participantes de negarse a tomar parte. Proteger a los participantes de molestias, daños y peligros. Ofrecer una reunión posterior de revelación, con preguntas y respuestas. Eliminar consecuencias indeseables de la participación. Mantener confidencial la información individual.
Si sigue estos principios básicos —cuando tenga dudas, pida el consejo de los investigadores experimentados—, es poco probable que llegue a tener problemas de ética con los participantes humanos. Quizás el mejor consejo tiene que ver con su actitud. Los participantes nos hacen un favor. Sin su voluntad de participar, la ciencia del comportamiento humano se pararía en seco. Trate a los seres humanos con la gratitud que corresponde.
04Martin068-094.indd 86
8/5/08 17:13:42
Cómo ser justo con los participantes
87
■ El trato correcto a los animales Cuando les pido a mis estudiantes de introducción a la psicología que se imaginen a un psicólogo experimental, la mayoría sale con la idea de un ñoño intelectual, con cabeza de huevo que usa una bata de laboratorio blanca mientras experimenta con ratas en un laberinto. Esta imagen es equívoca, no sólo porque no todos los psicólogos experimentales son ñoños ni tienen todos cabeza de huevo, sino además porque sólo 7 u 8% de los estudios psicológicos se hacen en animales. Es verdad que de los experimentos que se hacen con animales, 90% utilizan ratas, otros roedores y aves; pocos emplean perros, gatos o primates infrahumanos. Una encuesta reciente indica que en los programas de la licenciatura en psicología, 62% de los experimentadores utilizan animales con propósitos de enseñanza (Cunningham, comunicación personal, 24 de agosto de 2001). Las especies más comunes de animales vivos fueron ratas (81%), aves (27%), ratones (19%) y peces (13%). POR QUÉ LOS PSICÓLOGOS REALIZAN INVESTIGACIÓN CON ANIMALES
¿Por qué se investiga con animales, aunque sea con poca frecuencia? ¿Por qué no siempre se investiga con seres humanos? Continuidad de los comportamientos
Como científicos, adoptamos una postura evolutiva y suponemos una continuidad en el reino animal no sólo biológica sino también de comportamiento. Aunque los primates no se comportan como los seres humanos y las ratas mucho menos, el sistema nervioso de los seres humanos está formado por los mismos elementos básicos, y existen similitudes. Debido a que ciertas habilidades conductuales aparecieron pronto en la historia de la evolución, muchas pautas de la conducta humana también se aprecian en los infrahumanos. Por tanto, la investigación animal se basa en la suposición de que podemos investigar ciertos comportamientos básicos universales en animales de orden inferior. Sabemos que al evolucionar, los animales conservan los comportamientos básicos pero también adquieren otros más complejos que predominan sobre esos esquemas primitivos. Por tanto, si estamos interesados en estudiar los comportamientos básicos, tales como el aprendizaje simple o la motivación, es posible y aun preferible estudiar animales que muestren los comportamientos básicos sin que sean confundidos por las pautas de conducta más elaboradas que muestran los animales de orden superior. Sin embargo, debemos ser cuidadosos al generalizar el comportamiento de un animal de orden inferior a los seres humanos. Obviamente, somos mucho más complejos que las ratas y ningún investigador acreditado propone que el comportamiento de la rata sea exactamente igual al del ser humano. Ha habido ocasionales comentaristas de la investigación animal, menos confiables, que han generalizado en exceso los resultados, movidos por ignorancia o ingenuidad, pero estos eventuales usos incorrectos de los datos animales no invalidan la premisa que sustenta el uso de infrahumanos.
04Martin068-094.indd 87
8/5/08 17:13:42
88
Capítulo cuatro
Control
Además de las razones teóricas para utilizar animales en la investigación, hay otras de carácter práctico. Una es que los animales están disponibles casi todo el tiempo. Por algún motivo, los estudiantes universitarios insisten en tomarse libres los fines de semana y los días feriados. Los animales se utilizan también en experimentos que duran mucho tiempo. Asimismo, es posible y legal controlar las condiciones en las que viven los animales, tanto dentro como fuera del experimento. Por tanto, los que experimentan con animales pueden investigar las variables que interesan, como hacinamiento, privación sensorial, ciclos de sueño y vigilia y estresores ambientales. Podemos controlar tanto la herencia como el ambiente de los animales, una tarea que facilita la rápida reproducción y los nacimientos múltiples de los animales inferiores. En la investigación humana, la herencia rara vez es una variable controlada o restringida, mientras que en la investigación animal sí lo es. Pero no es cierto que “todo se valga” con los animales. Más adelante consideraremos la ética del trato a los animales.
Singularidad
Además, algunos animales tienen características singulares que los hacen más apropiados para ciertos tipos de investigación. Por ejemplo, las moscas de la fruta se reproducen rápidamente y tienen cromosomas grandes y simples. El calamar tiene células nerviosas más grandes que las de los seres humanos, así que se presta a la investigación de la estructura del sistema nervioso. De igual manera, el sistema nervioso central de muchos animales dedica al sentido del olfato o al sentido del equilibrio una parte mayor que el nuestro. En todos estos casos, los seres humanos no son los mejores participantes para las investigaciones.
Efectos irreversibles
Finalmente, es común que se recurra a animales inferiores cuando la investigación pudiera tener efectos irreversibles en órganos y funciones. El estudio de las ablaciones sólo puede realizarse con animales, ya que requiere la destrucción de parte del sistema nervioso para observar las secuelas en el comportamiento. De igual manera, no es posible trabajar con seres humanos en experimentos que requieren la implantación de electrodos en el sistema nervioso central. En muchos casos, estas investigaciones incluyen la muerte del animal y la realización de una histología8 para determinar los cambios estructurales.
8
La histología examina el tejido del sistema nervioso en busca de lesiones o de los lugares donde fueron colocados los electrodos. El cerebro se tiñe y se corta en muestras muy delgadas para examinarlas al microscopio.
04Martin068-094.indd 88
8/5/08 17:13:43
Cómo ser justo con los participantes
89
Manipulaciones como el aislamiento social también pueden causar efectos irreversibles. Un ejemplo famoso es el proyecto en el que algunos monos lactantes fueron separados de su madre poco después de su nacimiento y luego se les mostraron varias madres artificiales, para determinar cuáles eran las dimensiones más importantes de la maternidad (Harlow, 1958). La gente en general desaprueba que se investigue con bebés e incluso con crías de otros animales.
¡ESPERO HABER CUBIERTO EL REQUISITO DEL CURSO!
LABORATORIO DE PSICOLOGÍA
ÉTICA ANIMAL
La relación entre los humanos y los animales ha sido definida de distintas maneras por diferentes culturas a lo largo de la historia. En la tradición cristiana, los seres humanos tienen el dominio sobre los animales, que fueron puestos en la tierra para que los aprovecháramos. Tal era la visión más aceptada en Occidente hasta que llegó Charles Darwin, el padre de la evolución. La tesis de Darwin de que había una continuidad en el reino animal era una espada de doble filo. Por un lado, los animales se volvieron un tema importante para la comunidad científica debido a dicha continuidad. Por el otro, se despojaba a los seres humanos de su lugar único, superior al de los demás animales. Entonces, quizá no es de sorprender que hacia el final del siglo xix, los primeros grupos de derechos de los animales, los antiviviseccionistas, empezaran a tener un efecto notable en la opinión de la gente, en particular en Inglaterra (véase Dewsbury, 1990). Al inicio del siglo xx y durante varias décadas después, los antiviviseccionistas estuvieron bastante activos en Europa y en Estados Unidos. Tuvieron varias confrontaciones (verbales por ese entonces) con psicólogos notables como William James, Iván Pavlov, Walter Cannon y John Watson. El movimiento de los derechos animales decayó un poco hasta que fue revivido por el movimiento de los derechos civiles y la publicación del libro Animal Liberation de Peter Singer (1976). Sin duda está enterado del movimiento moderno a favor de los derechos de los animales. En la actualidad hay cerca de 7000 grupos de protección a los animales sólo en Estados Unidos (Departamento de Justicia, 1993). La organización más grande es Personas por un Trato Ético a los Animales (People for the Ethical Treatment of Animals, PETA), que tiene alrededor de 350 000 miembros, un personal de 70 empleados y un presupuesto de 7 millones de dólares (Meyers, 1990). Un aspecto del movimiento moderno que no manifestaban los antiviviseccio-
04Martin068-094.indd 89
8/5/08 17:13:43
90
Capítulo cuatro
nistas es el terrorismo. El grupo más combativo es el Frente de Liberación Animal (Animal Liberation Front, ALF), una organización encubierta que se ha acreditado la autoría de 60% de los atentados terroristas contra laboratorios de investigación e investigadores y que el FBI considera una organización terrorista. Aunque PETA niega cualquier conexión oficial con ALF, está de acuerdo en difundir las acciones de ese grupo, ya que cree que irrumpir en las instalaciones de estudio es la manera de exponer el supuesto trato abusivo hacia los animales. Hay quienes creen que el interés público en los derechos de los animales ya alcanzó su nivel más alto (Herzog, 1995). El número de artículos citados en una publicación periódica aumentó a 60 en 1990, pero disminuyó a 25 en 1994. Los actos terroristas continúan. En 1997, la ganadora de un premio por su investigación sobre drogadicción en una universidad famosa fue seguida por integrantes de una organización estudiantil. Más tarde, varios se aparecieron en su casa y con un individuo que portaba una máscara negra y se identificó como miembro del ALF hostigaron a la maestra y a su familia y amenazaron con quemar su casa (APA, 1997). Se han registrado 313 actos de terrorismo por parte de grupos que están a favor de los derechos de los animales. Los actos alcanzaron su máximo en los años 1987 y 1988 y algo han disminuido desde entonces (Burd, 1993). Estos incidentes y amenazas de hostigamiento le han costado miles de millones de dólares a las instituciones de investigación; también han aumentado las amenazas de muerte a los investigadores (Mangan, 1990). ¿Qué pasa? ¿Cuál es origen de esta controversia? Parte del problema es que los activistas más extremistas creen que los derechos de los animales son iguales a los de los seres humanos y que, por tanto, toda la investigación animal debería ser prohibida. Por ejemplo, un activista dice: “En la actualidad, los animales son por mucho el sector oprimido de la sociedad: su explotación es una gran maldición como lo fue la esclavitud de los negros, el trabajo infantil y la degradación de la mujer al principio del siglo xx. Es la mayor laguna de la ética de nuestra época” (Ryder, 1979, p. 14). Entre los abolicionistas de la investigación animal está una fundadora de PETA, quien afirma que la organización “trabaja para que algún día no haya animales en jaulas” (Havemann, 1989). ¿Piensan lo mismo el público general, los psicólogos y los estudiantes de psicología? No hay una encuesta sobre la opinión general sobre el uso de animales en la psicología. En el campo médico hay pruebas de que el apoyo público ha mermado. El porcentaje de los encuestados que declararon estar de acuerdo con la siguiente pregunta: “¿Debe autorizarse a los científicos a realizar investigaciones que causen dolor y lesiones a los animales (como perros y chimpancés), si el resultado proporciona nueva información acerca de los problemas de salud de seres humanos?” cayó de 63% en 1985 a 53% en 1993 (Pifer, Shimizu y Pifer, 1994, citado en Plous, 1996a). La opinión en contra es aún más fuerte en Gran Bretaña. Del lado positivo, una encuesta reveló que 88% estaba de acuerdo en el uso de ratas en experimentos médicos, en comparación con 55% que apoyó utilizar perros (Associated Press, 1985). Diversas encuestas han mostrado que más de tres cuartas partes del público cree que “el uso de los animales en la investigación médica es necesario para el progreso de la medicina” (American Medical Association, 1989, citado en Plous, 1996a). Para descubrir lo que piensan los psicólogos y estudiantes de psicología acerca del uso de los animales en los experimentos científicos, Plous (1996a, 1996b) realizó dos encuestas,
04Martin068-094.indd 90
8/5/08 17:13:43
Cómo ser justo con los participantes
91
una entre 3982 psicólogos y otra entre 1188 estudiantes de psicología. Sorprendentemente, en los dos grupos casi la misma proporción estuvo de acuerdo en la mayoría de los temas. Cuando se les preguntó en qué medida apoyaban al uso de animales en la investigación, alrededor de 80% de los psicólogos y 72% de los estudiantes dijeron que lo apoyaban firmemente o que lo apoyaban. Y de quienes dieron esta opinión, 84% de los psicólogos y 81% de los estudiantes pensaban que el uso de los animales en la investigación psicológica era necesario para el progreso de la disciplina. Sin embargo, el hecho que me sorprendió fue que 47% de los psicólogos y 44% de los estudiantes no estaban seguros sobre si los animales recibían un trato humanitario. Miremos las reglas al respecto. Durante muchos años, el Departamento de Agricultura de Estados Unidos ha vigilado las leyes federales que rigen el trato de los animales de investigación, menos ratas, ratones y aves. Por la presión de los grupos que defienden los derechos de los animales, en 1985 se realizaron enmiendas a la Ley de Bienestar de los Animales, que regula el cuidado de perros, gatos y primates infrahumanos. Después de muchas audiencias, en 1991 se aprobó un conjunto de leyes cuyo cumplimiento le costó a las instituciones aproximadamente 537 millones de dólares (Jaschik, 1991). Las normas se dirigen a temas como el ejercicio de los perros, establecimiento de comisiones institucionales de investigación animal y cuidados especiales para los animales jóvenes. En particular, los primates tienen derecho a un cuidado que les asegure un bienestar psicológico y físico.9 La Ley Agrícola aprobada por el Congreso de Estados Unidos en 2002 terminó con un largo debate acerca de si el uso de roedores y aves debería estar regulado por el Departamento de Agricultura de aquel país, con un fallo en sentido negativo. El Congreso opinó que ratas, ratones y aves, que se utilizan en cerca de 95% de los estudios con infrahumanos, quedaban bien protegidos por los institutos nacionales de salud, la Asociación para la Evaluación y Acreditación del Cuidado de los Animales de Laboratorio y las comisiones de instituciones de cuidado y uso animal. Toda institución que reciba fondos federales y que realice investigación con animales está obligada a tener una comisión de investigación animal compuesta por expertos, incluyendo un veterinario y un miembro del público. Esta comisión debe aprobar toda investigación propuesta que utilice animales y debe asegurarse de que se lleva a cabo siguiendo las reglas que hemos analizado. He profundizado en este tema para convencerlo de que muchas personas, incluyendo psicólogos, están interesadas en el tema de los derechos de los animales y ejercen una vigilancia estrecha. Debido a que los psicólogos usan animales para la investigación, la Asociación Psicológica Estadounidense no ha guardado silencio. En los Principios Éticos y Código de Conducta de los Psicólogos se incluye una sección sobre investigación animal, que citamos a continuación. Hay una extensa declaración sobre la ética animal en el sito en internet de la APA, http://www.apa.org/science/anguide.html 8.09 Cuidado humano y uso de animales en investigación a. Los psicólogos adquieren, cuidan, usan y desechan a los animales de conformidad con las leyes y normas federales, estatales y locales, y según los criterios de la profesión. 9
Irónicamente, uno de los investigadores más vilipendiado por los radicales de los derechos animales, Harry Harlow, realizó gran parte de la investigación que forma la base de estas normas.
04Martin068-094.indd 91
8/5/08 17:13:44
92
Capítulo cuatro
b. Psicólogos expertos en métodos de investigación y con experiencia en el cuidado de los animales de laboratorio supervisan todos los procedimientos que tienen que ver con animales y son responsables de que se preste la atención adecuada a su comodidad, salud y trato humano. c. Los psicólogos garantizan que todos los individuos bajo su supervisión que utilicen animales hayan recibido educación en los métodos de investigación y el cuidado, alimentación y manejo de las especies que correspondan y en la medida que convenga a sus funciones. d. Los psicólogos hacen esfuerzos razonables para minimizar la incomodidad, infecciones, enfermedades y dolor de los animales sujetos del estudio. e. Los psicólogos aplican procedimientos que provocan dolor, estrés o privación a los animales sólo cuando no hay otro método y siempre que la meta esté justificada por el valor científico, educativo o práctico que se espera. f. Los psicólogos realizan procedimientos quirúrgicos bajo la anestesia apropiada y siguen las técnicas para evitar infecciones y minimizar el dolor durante y después de las cirugías. g. Cuando sea apropiado poner fin a la vida de un animal, los psicólogos procederán con rapidez, esforzándose por reducir al mínimo el dolor y de conformidad con los procedimientos aceptados.
¿Por qué a los psicólogos les preocupa que se les niegue su derecho a realizar investigaciones con animales? Aparte del hecho de que la mayoría de los psicólogos que trabajan con animales lo disfrutan y se consideran amantes de los animales, muchos citan los avances que han alcanzado con estas investigaciones, que han acrecentado el bienestar de los seres humanos (Miller, 1985) y también el bienestar de los animales. En el frente médico, puede citarse la investigación médica que ha llevado a la virtual eliminación de la polio, la rabia, el cólera y la difteria, así como al desarrollo del tratamiento con insulina, la cirugía de cataratas y la cura de muchos casos de leucemia linfática infantil. En la psicología, la investigación animal ha traído avances significativos en el tratamiento de trastornos mentales, control del dolor, drogadicción y recuperación de apoplejías. Las terapias conductuales, tan exitosas, se fundamentan en investigaciones con animales realizadas hace 50 años. En algunos casos, sobre todo en la investigación básica, es difícil anticipar la naturaleza exacta de los beneficios futuros. No obstante, la mayoría de los investigadores cree que los costos, en términos del posible sufrimiento de los animales, están más que compensados por los beneficios potenciales. Incluso la mayoría de los defensores de los animales ocupan una posición intermedia entre las dos posiciones extremas y están dispuestos a abordar el tema desde una perspectiva informada y racional. En general condenan a los extremistas que aterrorizan a los investigadores. Si desea leer más sobre el tema, consulte la guía publicada y distribuida por la APA: Guidelines for Ethical Conduct in the Care and Use of Animals (“Guía para la conducta ética en el cuidado y uso de animales”, 1986). Boyce (1989) ofrece un tratamiento equilibrado en el Journal of the American Veterinary Medical Association, y Segal (1982) pondera bien las necesidades de la ciencia y las necesidades de la vida. Carrol y Overmier (2001) también publicaron un libro, Animal Research and Human Health: Advancing Human Welfare Through Behavioral Science (“Investigación animal y salud humana: El aumento del bienestar humano mediante las ciencias de la conducta”), en el que se incluye un análisis completo de estos temas. Por último, Dennis Feeney (1987), psicólogo parapléjico de la Universidad de Nuevo México, defiende
04Martin068-094.indd 92
8/5/08 17:13:44
Cómo ser justo con los participantes
93
con vigor la investigación animal en un artículo del American Psicologist. Sostiene que en el examen de los derechos de los animales en comparación con los derechos de los seres humanos se han mezclado personas provenientes de los campos de la ciencia y la agricultura y organizaciones del bienestar animal, pero que prácticamente se ha ignorado a los incapacitados. Feeney llama la atención sobre la investigación conductual básica de la biorretroalimentación y la recuperación de apoplejías, que ha traído avances terapéuticos inimaginados. En este fragmento se capta la esencia de su posición: Los que sufrimos una enfermedad incurable o que tenemos lesiones que nos han dejado lisiados sólo tenemos esperanzas de cura gracias a la investigación. Mucho de este trabajo experimental requerirá animales y, por consiguiente, debemos llegar a algún acuerdo que defienda tanto los derechos humanos como el bienestar de los animales. En la búsqueda de un compromiso entre paliar el sufrimiento humano y lesionar el bienestar de los animales, lo que a veces incluye causar dolores o molestias, yo me inclino inequívocamente por reducir el sufrimiento humano. (p. 593)
A la postre, tendrá que tomar su propia decisión ética en cuanto al uso de animales en la investigación. Tendrá que ir hasta el fondo de sus convicciones sobre la relación entre seres humanos y animales. Como a todo el mundo, le costará trabajo llegar a una posición congruente: ¿come hamburguesas? ¿Aceptaría que su perro o cualquiera que sea su mascota participe en un experimento médico? ¿Justificaría el sacrificio de 100 perros para encontrar la cura que podría salvarle la vida a su hijo? ¿Compra insecticidas en aerosol? ¿Está dispuesto a adoptar a todos los gatos de un refugio? Ahora examine sus respuestas: ¿puede determinar cuál es su postura y llegar a una opinión congruente? El tema no está bien delimitado. Como todo el mundo, de seguro tendrá que ponderar caso por caso y decidir si los beneficios sobrepasan los costos. Algunos experimentos psicológicos, por su naturaleza, someterán a estrés y dolor a los animales. En tales situaciones, antes de empezar la investigación deberá estar convencido de que las ganancias científicas potenciales valen los costos y deberá ser capaz de defender su decisión. Aunque las instituciones tienen comisiones de especialistas para evaluar la investigación animal, piense que no hacen más que fijar los criterios mínimos. Por cuenta propia deberá cumplir unas normas éticas más elevadas.
■ Resumen Revisamos en el capítulo los temas éticos y metodológicos de tratar con justicia a los participantes humanos y animales. Debido a que en las relaciones entre experimentadores y participantes el poder es de los primeros, es importante que sigan ciertas reglas básicas de cortesía. Deben estar presentes, listos, preparados y ser corteses, discretos y profesionales. Se han establecido consejos institucionales de revisión para someter a revisión las propuestas de investigación y ayudar a los experimentadores a tomar decisiones éticas con respecto al trato que dan a los participantes humanos y animales. Entre los temas que deben considerar es si los participantes dieron su consentimiento informado antes de entrar en un experimento.
04Martin068-094.indd 93
8/5/08 17:13:44
94
Capítulo cuatro
Antes se pensaba que los participantes humanos eran ingenuos y pasivos, pero en realidad son personas que solucionan problemas y son sensibles a las características de la demanda, las pistas ocultas de la situación experimental. De la manera en que reaccionen a estas características dependerá si cooperan, son defensivos o no cooperan en el experimento. Para reducir al mínimo las características de la demanda se automatiza gran parte del experimento, se traza un diseño ciego o doble ciego (para que el participante o el participante y el experimentador no sepan las condiciones específicas a las que tienen que responder) o se recurre a experimentadores múltiples. Una forma de diseño doble ciego en la investigación farmacológica emplea un placebo no activo para la condición de control. Cuando es imposible ocultar a los participantes la manipulación experimental, el experimentador debe estar consciente de que puede darse un efecto Hawthorne: un cambio en el comportamiento debido nada más a la atención que se les presta a los participantes. Si en un experimento hay características indeseables de la demanda, en ocasiones podemos detectarlas por medio de un interrogatorio posterior al experimento o mediante el uso de grupos control simulados o no experimentales. Una alternativa a la idea de que los participantes son ingenuos es aprovechar su capacidad de resolver problemas y darles características de la demanda falsas para engañarlos acerca del propósito verdadero del experimento. Las alternativas al engaño son pedir a los participantes que representen un papel u observarlos en una situación natural. Los psicólogos también utilizan animales en experimentos porque muestran una continuidad con los seres humanos. Manifiestan ciertas pautas básicas de conducta que también presentan los seres humanos, sin la confusión que traen los comportamientos más complejos de las personas. Los animales también abren una gran oportunidad de tener un mayor control genético y ambiental. Algunos animales presentan características únicas que los hacen superiores para determinadas investigaciones. La historia de los derechos de los animales es larga en todo el mundo. En las últimas décadas este movimiento atrajo defensores que adoptaron posiciones extremistas hasta llegar incluso a la violencia. El público, como también los psicólogos y estudiantes de psicología, están a favor de la investigación con animales. En años recientes, se han modernizado las leyes federales y estatales y las normas institucionales de la experimentación animal, de manera que la posibilidad de maltratos es mínima. La mayoría de los investigadores que se ocupan de este campo piensan que los beneficios son mayores que los costos y señalan que muchos avances en el bienestar humano son resultado de la investigación psicológica con animales; por ejemplo, el tratamiento de trastornos mentales y drogadicción, control del dolor y recuperación de apoplejías.
04Martin068-094.indd 94
8/5/08 17:13:45
5
Cómo ser honesto con la ciencia Ciencia es la voluntad de aceptar los hechos aunque se opongan a los deseos. B. F. SKINNER (1953)
Para obtener cierto resultado, hay que quererlo: si quiere un resultado, lo tendrá. T. D. LYSENKO, CITADO EN I. M. LERNER (1968)
Los fraudes en las ciencias no son puras manzanas podridas en un barril. Tiene que ver con el barril. NICHOLAS WADE, CITADO EN K. MCDONALD (1983)
La investigación es una actividad colegiada que requiere que quienes la practican confíen en la integridad de sus colegas. ARNOLD S. RELMAN, CITADO EN K. MCDONALD (1983)
Nuestra cultura, y todas las culturas salvo las más extrañas, siempre han visto la deshonestidad como un vicio fundamental de los seres humanos. Hay que notar que esta idea es congruente con cierta hesitación sobre lo que constituya una mentira y con la sospecha embozada de que habrá acaso contextos en los que mentir se justifique. TONY COADY (FILÓSOFO AUSTRALIANO)
. . .la vida ética es mucho más que una existencia que no es inmoral. MARTIN E. P. SELIGMAN (PRESIDENTE DE APA, 1998)
E
n este capítulo continuaremos nuestro examen de la ética, pero ahora enfocados en el trato honesto con la ciencia. En cierto sentido, la ciencia tiene menos defensas que un participante de una investigación. Los animales se retuercen y chillan, y a veces se mueren cuando los maltratan. Además, los grupos a favor de los derechos de los animales también gritan. Los participantes humanos se retuercen y gritan, y a veces presentan demandas si los maltratan. La ciencia ni se retuerce ni grita, pero si la maltrata mucho tiempo, al final sus colegas científicos van a retorcerse y gritar. Tal vez se pregunte cómo puede ser injusto con algo inanimado como la ciencia. Con todo, la ciencia puede ser considerada como animada en el sentido de que se mueve, cambia y, esperemos, acumula conocimientos. Las nuevas investigaciones reemplazan o abundan 95
05Martin095-110.indd 95
16/4/08 22:09:18
96
Capítulo cinco
continuamente sobre descubrimientos o teorías anteriores. Lo que detenga el avance de la ciencia o que la lleve en la dirección equivocada puede ser considerado científicamente inmoral. La ciencia incorpora ciertas salvaguardas que aseguran que el conjunto de los conocimientos siga acumulándose en la dirección correcta. Por ejemplo, antes de que se autorice la publicación del resultado de un experimento en las publicaciones científicas, lo revisa un grupo de científicos seleccionados por sus logros en la investigación. Los revisores verifican que la investigación se apega a las reglas de la experimentación, que ya revisamos en este libro, y determinan si su contribución es tal que justifica el gasto de las escasas páginas que tienen las publicaciones científicas. Así, revisores y editores tratan de revisar la investigación, a fin de que sólo los resultados aceptables y pertinentes se sumen a los conocimientos.1 Aunque este mecanismo no es perfecto, en general los psicólogos opinan que cumple bastante bien la función de filtro. Si bien el sistema de revisión está pensado de modo que excluya investigaciones realizadas con deficiencias o que no hacen una contribución sustancial, no determina si el investigador que realizó una buena investigación mintió acerca de su estudio. Un científico que conoce las reglas y que afirma que las sigue, cuando en realidad no lo hizo, está engañando a la ciencia. Su comportamiento se dirige a sacar ganancias personales de alguna clase: “No van a ascenderme si no junto cinco publicaciones.” “Tengo que hacer que nuestro producto se vea bien.” “Si no obtengo un resultado positivo en el experimento, voy a reprobar.” Debido a que el comportamiento inmoral es muy perjudicial para nuestra ciencia y a que tenemos muy pocos resguardos para detectarlo, en las ciencias no se tolera el comportamiento inmoral y el investigador pillado en esa conducta pierde rápidamente el privilegio de practicar su ciencia. Llamo trucos sucios a esos comportamientos claramente inmorales e inaceptables y los analizo en la primera sección del capítulo. En la siguiente sección, revisaremos conductas reprobables de las que hay que guardarse, pero que no son tan conspicuas como para que el investigador pierda sus privilegios científicos; las llamo trucos dudosos. Por último, hay ocasiones en que el investigador dice la verdad, pero no toda la verdad, y nuestra ciencia no sólo no pierde, sino que aun se beneficia. Este comportamiento puede hacer que nuestra ciencia sea más eficiente y fácil de entender, de manera que se le considera aceptable y también necesario. Lo llamaremos trucos limpios.
■ Trucos sucios MAQUINACIÓN
Una forma evidente de hacer trampa es maquinar los resultados. Algunos “experimentadores” saben que una forma fácil de realizar un experimento es no hacerlo. No tienen que molestarse con asuntos tan mundanos como la compra del equipo, reunir participantes o 1
Observe que aquí uso el término pertinente de manera distinta a como la gente común lo utiliza. Como lo empleo, significa algo que tiene importancia para la ciencia, sin referirme a que sea oportuno.
05Martin095-110.indd 96
16/4/08 22:09:19
Cómo ser honesto con la ciencia
97
EN CONSTRUCCIÓN: CONJUNTO DE CONOCIMIENTOS
aprender a utilizar la estadística. Todo lo que tienen que hacer es aprender a redactar los experimentos. (Maquinadores: lean el capítulo 13. También conviene que estudien otra carrera, porque no serán psicólogos mucho tiempo.) Como estudiante, quizá se sienta tentado a maquinar los datos, ya que su tarea tiene plazo y no la ha terminado. ¡No lo haga! Las tareas entregadas con retraso sacan malas calificaciones, pero los resultados inventados son causa de baja en la clase y cartas de presentación terribles. Los científicos profesionales no toleran en lo más mínimo tal comportamiento. Cada tanto, la Asociación de Psicología Estadounidense (APA) emite un documento llamado Principios Éticos y Código de Conducta de los Psicólogos en el que especifica las normas éticas con las que deben guiarse los psicólogos en su trabajo. Las normas más recientes fueron publicadas en 2002, y algunas se refieren al lado científico de la psicología (APA, 2002). Según la norma 8.10: “(a) Los psicólogos no deben maquinar los datos”, y “(b) Si los psicólogos descubren errores importantes en información publicada, deben seguir los pasos necesarios para enmendarlos mediante una corrección, retractación, fe de erratas o cualquier medio editorial apropiado.” A principios del siglo xx, un biólogo llamado Kammerer trató de demostrar que se heredaban las características adquiridas (Ley, 1955), un concepto muy diferente de la evolución darwiniana. Afirmaba que había mantenido generaciones de salamandras comunes en tierra negra. Publicó que las salamandras, que eran normalmente negras con manchas amarillas, presentaban menos manchas con cada generación y que, además, esta reducción se había transmitido por herencia. Un segundo investigador, que dudaba de estas afirmaciones, sumó el tiempo necesario para criar las generaciones que Kammerer había dicho y descubrió que era mucho más de lo que éste había publicado. Otros científicos empezaron a pedir explicaciones hasta que, siete años después, dos expertos revisaron algunos especímenes y descubrieron que les habían inyectado tinta china. Kammerer
05Martin095-110.indd 97
16/4/08 22:09:19
98
Capítulo cinco
admitió que sus resultados “habían sido ‘mejorados’ post mortem con tinta china”. A continuación, se suicidó. En las ciencias, el acto más ruin es llenar de basura los conocimientos. Si hace una mala investigación, la gente la ignorará, pero si finge que hizo una buena investigación, retrasará la acumulación de conocimientos. Otros vendrán y tratarán de basar su investigación en la de usted, pero van a descubrir que algo está mal y perderán tiempo arreglando los cimientos y quizá tengan que reconstruir toda la estructura. Cuanto más tiempo pase sin que se detecte la mentira, mayor será el desperdicio de recursos de la ciencia. Si no se detecta, el engaño a la ciencia puede convertirse en engaño a la sociedad. Por ejemplo, a finales de la década de 1930, un ruso llamado T. D. Lysenko, que también creía que las características adquiridas podían ser heredadas (Lerner, 1968), era tan inflexible acerca de su teoría que falsificó gran cantidad de datos. Los lysenkoístas afirmaban que habían llegado a resultados milagrosos como la transformación de trigo en arroz, cebada, avena e incluso aciano. Habían convertido remolacha en col, pino en abeto y un árbol del grupo del carpe en nogales silvestres (con fotografías adulteradas como evidencia). Incluso producían cuclillos de huevos puestos por currucas (Lerner, 1968). Este terrible comportamiento inmoral de Lysenko perjudicó no sólo a la ciencia, sino también a la sociedad. Lysenko fue responsable personalmente del despido, exilio y ejecución de muchos genetistas rusos. Convenció a Stalin, y más tarde a Krushchev, de que sus teorías eran las correctas y de que debían ser aplicadas a gran escala en los programas de cultivo (Medvedev, 1969). Cuando los devastadores fracasos de la agricultura que siguieron se atribuyeron en parte a los métodos de Lysenko, éste cayó, Krushchev cayó también (no sólo por esta razón) y la sociedad rusa sufrió las consecuencias. Cuando escribí esta sección para la primera edición del libro, tuve que remontarme en la historia para encontrar ejemplos de fraudes científicos. Por desgracia, en la actualidad es mucho más fácil encontrar ejemplos de fraude. Recientemente encontré los siguientes encabezados en varias publicaciones especializadas y locales: “Acusaciones de plagio en un manuscrito científico incrementan la preocupación sobre el ‘robo intelectual’”; “Premio Nobel enfrenta cargos por mala conducta”, y “Estados Unidos presenta una demanda legal acusando de fraude a científicos e instituciones”. ¿Son nuevos los trucos sucios o ahora hay más interés en descubrirlos? Al parecer, los científicos anteriores tampoco estaban libres de culpa. El genetista del siglo xix Gregory Mendel fue acusado de haber mentido (Fisher, 1936). Incluso sir Isaac Newton publicó correlaciones con un grado de precisión mayor a su capacidad de medirlas (Westfall, 1973). Más cercano a la psicología y a nuestro tiempo, un prominente investigador de la percepción extrasensorial descubrió que el director de su laboratorio había falsificado datos. Un asistente de investigación receloso se ocultó y observó cómo este director alteró los datos para que apoyaran sus resultados sobre la PES. En psicología, el caso más famoso se relaciona con sir Cyril Burt, un distinguido psicólogo inglés que fue nombrado caballero por el rey Jorge VI. Su investigación con gemelos idénticos fue uno de los grandes pilares que justificaban la tesis de que el CI se debía en gran medida a la herencia. Después de su muerte, otros investigadores descubrieron que las
05Martin095-110.indd 98
16/4/08 22:09:19
Cómo ser honesto con la ciencia
99
correlaciones que había publicado sobre gemelos idénticos fueron idénticas hasta el tercer lugar decimal durante muchos años, aunque se habían incorporado más gemelos a los estudios. Sería una coincidencia muy improbable. Las acusaciones de fraude se publicaron en el Sunday Times de Londres y la controversia continúa hasta la fecha. Por un lado están los investigadores que sostienen que los datos de Burt deben considerarse fraudulentos y que probablemente fueron maquinados (McAskie, 1978). Otros consideran que es muy débil la acusación de fraude y que la explicación más probable es descuido (Jensen, 1978). Por desgracia, este debate tan acalorado ha sido alimentado por las disputas políticas entre elitismo e igualitarismo. ¿Cómo nos defendemos de la posibilidad de que los investigadores sean deshonestos? Jamás tendremos un sistema infalible, porque tanto los costos como la pérdida de libertad intelectual arruinarían la empresa científica. Sin embargo, en la actualidad hay varias precauciones. El servicio de Salud Pública de Estados Unidos, que abarca a los institutos nacionales de salud, exige que las universidades tengan guías para la prevención de conductas inapropiadas (Cordes, 1990). La Asociación de Universidades Estadounidenses recomienda que las instituciones fijen normas explícitas sobre sus criterios y que hagan que los directores las pongan en vigor (“AAU Statement”, 1983). Cuando un investigador recibe fondos federales, aplica la ley del “soplón”, que data de principios del siglo xix y que permite a los ciudadanos demandar a los investigadores y a las universidades y cobrar un porcentaje considerable del dinero que el gobierno haya otorgado. Hace poco, un ex técnico de un laboratorio de investigación entabló una demanda en contra de un investigador y la correspondiente universidad, alegando que el primero había falsificado los resultados (Cordes, 1990). Una sugerencia para minimizar los fraudes es establecer archivos con los datos crudos (sin procesar) de la investigación (Bryant y Wortman, 1978). 2 Un problema que encontraron los investigadores al tratar de validar la investigación de Burt fue su enorme desaseo para guardar los daDATOS SIN tos. Guardaron las hojas de pruebas de los estudios PROCESAR de gemelos entre papeles atiborrados en cajas de té que después destruyeron. Con archivos de datos, los investigadores guardarían los de su investigación o podrían acumularlos en algún centro. Así, los datos estarían al alcance del público, lo cual no siempre sucede. Por ejemplo, un estudiante de maestría que pidió datos sin procesar a 37 autores recibió sólo 24% (Wolins, 1962). El método del archivo tiene otros beneficios: los investigadores serían más cuidadosos en su análisis de los datos originales; harían aportaciones a la ciencia examinando temas que 2
Las mediciones individuales de la variable dependiente antes de reunirlas para hacer un análisis estadístico son los datos crudos (sin procesar). A diferencia de la carne, los datos crudos no se echan a perder, sólo ocupan espacio.
05Martin095-110.indd 99
16/4/08 22:09:20
100
Capítulo cinco
no hubieran tratado antes y llevarían a cabo estudios longitudinales en los que se compararan datos de varios años. Los costos de un sistema central de almacenamiento de datos son el costo de la estructura burocrática que lo administre, el tiempo y dinero necesarios para copiar los datos o ajustarlos a un formato uniforme y quizás el costo para la ciencia de reconocer la pérdida de la confianza en la integridad de los científicos. Algunos opinan que los costos de esta solución son demasiado altos para un problema pequeño. Consideran que los controles del proceso de replicación son suficientes para detectar la mayoría de los fraudes y hacen que el problema de los trucos sucios sea una anomalía, no una práctica común. Cualesquiera que sean los requisitos formales, habría que conservar los datos por lo menos cinco años. Los investigadores se intercambian datos, y con las computadoras, es fácil guardarlos y recuperarlos. De hecho, otra de las normas éticas de la APA es la 8.14: “(a) Después de que se publiquen los resultados, los psicólogos no ocultarán los datos sobre los cuales basan sus conclusiones y deberán ponerlos a disposición de otros profesionales competentes que quieran verificar las afirmaciones sustantivas a través de un nuevo análisis y que deseen utilizar los datos sólo para ese propósito, salvaguardando la confidencialidad de los participantes, a menos que los derechos legales concernientes a la propiedad de la información impidan su difusión.” Si tiene el hábito de guardar datos sin procesar, ayudará a proteger a la ciencia, y a usted mismo, de acusaciones falsas. Algunos datos indican que el fraude científico es relativamente raro. Por ejemplo, de 1982 a 1988 los institutos nacionales de la salud, que apoyan la investigación de 50 000 científicos, han informado sólo de 15 a 20 acusaciones de mal comportamiento. Por otro lado, entre los científicos de una gran universidad dedicada a la investigación que contestaron una encuesta, un tercio dijo que había sospechado que un colega plagió o falsificó datos, pero menos de la mitad emprendió alguna acción para verificar sus sospechas (Hostetler, 1988). En este momento, parece ser que a menos que los científicos den los pasos conducentes para encontrar y eliminar las malas conductas, el Congreso los impondrá a través de la legislación. La posibilidad molesta a muchos científicos, que creen que dejar esa regulación en manos de quienes no son expertos o carecen de experiencia científica pudiera llevar a consecuencias indeseables. La manera más costeable de prevenir fraudes en la ciencia es recalcar a los nuevos investigadores la importancia de una conducta ética. Por supuesto, el propósito del capítulo que está leyendo es recargar ese acento. Para fincar una motivación verdadera para el comportamiento moral, hay que entender cómo funciona la ciencia. Los investigadores deben entender que la ciencia se funda sobre la confianza. Si no confiamos en los descubrimientos de nuestros colegas, hasta podríamos interrumpir el esfuerzo por acumular conocimientos científicos. PLAGIO
En las normas éticas de la APA se indica: “8.11 Plagio: Los psicólogos no presentarán partes del trabajo o datos de otro como propios, incluso si se citan de manera ocasional.” Aunque
05Martin095-110.indd 100
16/4/08 22:09:20
Cómo ser honesto con la ciencia
101
esta declaración es clara, el plagio se ha convertido en un problema importante en años recientes, así que es necesario explicarlo. Últimamente, se han dado casos de rectores de universidades que han perdido su trabajo por haber plagiado discursos y de autores que han sido acusados de plagiar partes grandes de sus libros. Tal comportamiento no significa que hayan cambiando los criterios de lo que designamos como plagio; es sólo que cada vez se ignoran o se rechazan más estas reglas. La mayoría de la gente sabe que el acto de citar literalmente las palabras publicadas de otra persona es plagio. Sin embargo, parece que algunos estudiantes creen que el material que está en internet es legítimo y que lo pueden tomar como suyo. Déjeme aclarar esto: robar textos de internet es tan malo como robar de publicaciones formales. Dése por advertido de que sus profesores consultarán sitios como http://www.turnitin.com para atrapar a estudiantes que plagian de fuentes de internet.
¿CÓMO TE AMO? DÉJAME ENUMERAR LAS MANERAS. (BROWNING, 1850)
El peor caso de engaño que me he encontrado fue el de un psicólogo consejero que copió 90 de las 120 páginas de su tesis doctoral de dos libros publicados. Incluía citas de ambos libros en su sección de referencias, pero en ningún sitio de su manuscrito citó formalmente los libros aunque de ahí tomó el material palabra por palabra. Incluso en este caso patente de cortar y pegar, el estudiante sostenía que no era un plagio lo que había hecho. Incluso, uno de sus ex profesores llegó a decir que no era plagio porque el estudiante no tenía la intención de plagiar. Déjeme ser claro: la intención no cuenta; el acto se define por sí mismo. En este caso, el psicólogo perdió su grado doctoral y su derecho a practicar la profesión. El plagio es más que tomar las palabras de otro; robar ideas es tan malo como robar palabras. Como veremos en el capítulo 13, en general los psicólogos hacen menos citas directas en sus ensayos que otros escritores. Tendemos más a parafrasear a otros autores; esto es, formulamos un pensamiento o idea con nuestras propias palabras. Sin embargo, parafrasear no nos exime de la obligación de hacer una cita apropiada. Al escribir sobre ideas, teorías o
05Martin095-110.indd 101
16/4/08 22:09:20
102
Capítulo cinco
incluso especulaciones de otro investigador, uno debe citarlo a él y a la fuente de donde proceden. Para ilustrar varias formas de plagio que hemos analizado, supongamos que leyó un párrafo del siguiente artículo escrito por Diener, Lucas y Scollon, publicado en el American Psychologist (2006): La teoría de la rutina hedonista se basa en un modelo de habituación automática en el cual los sistemas psicológicos reaccionan a desviaciones del nivel de adaptación actual de la persona (Helson, 1948, 1964). Los procesos de habituación automática son adaptativos, ya que permiten que los estímulos constantes se desvanezcan en el fondo. Así, se conservan los recursos para manejar los estímulos nuevos, que probablemente requieran una atención inmediata (Fredrick y Lowenstein, 1999).
¿Podría escribir en su informe lo siguiente?: La teoría de la rutina hedonista se basa en un modelo de habituación automática en el que los sistemas psicológicos reaccionan a desviaciones del nivel de adaptación actual de la persona. Los procesos de habituación automática son adaptativos, ya que permiten que los estímulos constantes se desvanezcan en el fondo.
No, definitivamente no podría hacerlo, ya que utilizó las palabras de otra persona sin citar la fuente sin ponerlas entre comillas. ¿Podría decir lo siguiente?: Un modelo de habituación automática es la base de la teoría de la rutina hedonista. Hay una desviación a partir de un nivel de adaptación habituada, de manera que los estímulos constantes se vuelven ruido de fondo, lo que permite que los recursos se dediquen a procesar nueva información.
Aunque ha parafraseado las palabras del párrafo, de todos modos tomó las ideas de otras personas, así que tiene que citarlas porque les pertenecen las ideas. ¿Podría decir lo siguiente?: Un modelo de habituación automático es la base de la teoría de la rutina hedonista (Helson, 1948, 1964). Hay una desviación a partir de un nivel particular de adaptación habituada de manera que los estímulos constantes se vuelven ruido de fondo, lo que permite que los recursos se destinen a procesar nueva información (Fredrick y Lowenstein, 1999).
Este párrafo es mejor, ya que ahora cita las fuentes. Sin embargo, en este caso no podría citarlas de esta manera si hubiera leído el artículo de Diener, Lucas y Scollon. Al enumerar las fuentes de Helson, y Frederick y Lowenstein, implica que leyó esos artículos y que parafrasea lo que leyó. Pero, si todo lo que sabe acerca de estas fuentes proviene de su lectura del artículo de Diener y sus colaboradores, las otras dos fuentes reciben el nombre de fuentes secundarias y deben citarse sólo en el contexto de la fuente primaria que leyó, por ejemplo: “Helson (1948, 1964), según la cita de Diener, Lucas y Scollon (2006), propone que el modelo de la habituación automática es. . .” En lugar de citar la segunda fuente de esta manera, simplemente consiga el original y luego cítelo como fuente principal.
05Martin095-110.indd 102
16/4/08 22:09:20
Cómo ser honesto con la ciencia
103
He dedicado mucho espacio a analizar el plagio, pues se considera una falta de ética grave. Incluso las infracciones menores pueden traer malas calificaciones. Las infracciones mayores acarrean la pérdida de reputación, del empleo y, en el caso de la tesis del ejemplo mencionado, del grado doctoral. FALSIFICACIÓN DE CREDENCIALES
Si fuera con un amigo y le pidiera que se parara de manos, su respuesta sería preguntarle por qué. En cambio, si fuera con otro amigo y le dijera que tiene que pararse de manos para un experimento, le respondería preguntándole cuánto tiempo. Esta diferencia surge del hecho de que nuestra sociedad le concede a los científicos privilegios que no tienen los ciudadanos comunes. Les permitimos, en especial a los científicos del comportamiento, la libertad de experimentar ya que, como sociedad, opinamos que los beneficios obtenidos de tales experimentos sobrepasan los costos. También les otorgamos prestigio y, en general, respondemos obedientemente. A los científicos no sólo se les permite manipular legítimamente la vida de la gente que tienen cerca, sino que a veces los apoyamos con nuestros impuestos. Sin embargo, podemos retirar estos privilegios si creemos que sus ventajas para la sociedad han dejado de ser mayores que sus desventajas. Exigir títulos profesionales es una forma de vigilarnos a nosotros mismos. En consecuencia, para demostrar a los otros científicos que usted es un investigador calificado, debe presentarse ante ellos con su registro profesional, en general en la forma de un curriculum vitae, que es un registro escrito que muestra lo que ha hecho profesionalmente. Ahí se anotan sus grados académicos, experiencia laboral, y artículos y ensayos que ha publicado. Sirve para inscribirse en las escuelas de posgrado, para certificarse o para conseguir trabajo. No tendría que decir que este documento debe ser fidedigno por completo, pero de todas formas lo diré: falsificar credenciales es un truco sucio bastante evidente. No es de sorprender que las normas éticas de la APA sean bastante claras sobre el punto. La norma 5.01 sobre evitar declaraciones falsas o engañosas proporciona la siguiente guía: b. Los psicólogos no harán declaraciones falsas, engañosas o fraudulentas con respecto a 1) su educación, experiencia o competencia 2) sus títulos académicos 3) sus credenciales 4) sus afiliaciones institucionales o asociaciones 5) sus servicios 6) las bases científicas o clínicas o los resultados o grado de éxito de sus servicios 7) sus honorarios 8) sus publicaciones o resultados de investigación.
Al inicio de mi carrera fui testigo de un incidente en el que un estudiante talentoso utilizó un curriculum vitae falso para tratar de inscribirse a una escuela de posgrado. Tenía buenas
05Martin095-110.indd 103
16/4/08 22:09:21
104
Capítulo cinco
calificaciones y cartas de recomendación de sus profesores, pero anotó artículos inexistentes. Cuando sus profesores descubrieron el engaño, dejó de tener buenas calificaciones y buenas cartas de recomendación, y no es psicólogo experimental. Como el acuerdo entre los científicos y la sociedad es frágil, esta deshonestidad trastorna el delicado equilibrio y no se tolera. Espero que esta exposición de los trucos sucios le haya parecido una pérdida de tiempo ya que nunca se le ocurriría ponerlos en práctica. Sin embargo, creo que estos temas deben mencionarse al inicio de la preparación del experimentador. Realizar experimentos psicológicos puede ser divertido, pero el propósito real de la experimentación es el avance de la ciencia. Los que no estén dispuestos a seguir las reglas que hacen que este proceso sea ordenado, no deben pertenecer a la ciencia.
■ Trucos dudosos Las acciones que los investigadores consideran inaceptables pero que llevan al fruncimiento del ceño y a regaños en lugar del destierro son los trucos dudosos. Estas acciones se dan durante el diseño de un experimento, su realización, el análisis de los datos o en el informe de los resultados. DISEÑO EXPERIMENTAL
En el capítulo anterior vimos que el sesgo del experimentador se comunica a través de las características de la demanda. Si diseña su experimento de manera que estas características produzcan un cambio deseado en la variable dependiente y no trata de minimizarlas o ni siquiera de descubrirlas, en cierto sentido sería deshonesto. También puede volver confuso un experimento si dice que convirtió una variable en variable de control cuando en realidad cambió sistemáticamente con la variable independiente. En algunos experimentos fuera del laboratorio, es difícil controlar esta confusión. Pero en muchos casos podemos afirmar legítimamente que esta situación es un engaño.
¡HOY VOY A HABLAR SOBRE SEXO, DROGAS Y POLÍTICA!
05Martin095-110.indd 104
HOY… EL TEMA… ES… FÓRMULAS… PARA EL ¡ANÁLISIS ESTADÍSTICO!
16/4/08 22:09:21
Cómo ser honesto con la ciencia
105
Por ejemplo, recordemos el experimento que está al inicio del capítulo 2, aquel en que traté de dar una clase de introducción a la psicología a diferentes ritmos para determinar si la velocidad tenía un efecto en la atención de los estudiantes. Unos días traté de hablar a un ritmo lento, otros a un ritmo moderado y otros más a un ritmo acelerado. Medimos la atención grabando el nivel del ruido de fondo. Tal experimento pudo haberse sesgado fácilmente. Pude haber cambiado no sólo mi ritmo, sino también la vehemencia con que abordaba el tema o quizás el número de ejemplos interesantes para ilustrar mis afirmaciones. Estos cambios en otras dimensiones además del ritmo, pudieron confundir fácilmente la variable independiente, en forma deliberada o sin quererlo. Una manera de minimizar la probabilidad de hacer trampa hubiera sido diseñar el experimento de modo que los colegas con poca preferencia por algún resultado calificaran las clases en términos de las posibles variables de confusión. Entonces, el experimentador hubiera recogido datos sólo de las lecciones con calificaciones equivalentes. Por supuesto, no por fuerza se observaría en el primer diseño un engaño moderado en la forma de sesgo del experimentador, pero el segundo diseño sería más convincente ya que es menos probable que ocurra dicho sesgo. ACOPIO DE DATOS
También se puede ser deshonesto al reunir los datos de la investigación, especialmente si hay que ejercer el buen sentido para determinar la respuesta del participante. En el experimento que acabamos de analizar, supongamos que el experimentador quiere clasificar el comportamiento de los estudiantes como atentos o distraídos para registrar el porcentaje de tiempo que dedican a escuchar o a estar distraídos. Supongamos que un estudiante se sienta a hacer garabatos en una hoja de papel. ¿Toma notas o garabatea? Otro tiene los ojos cerrados. ¿Está concentrado o dormido? Entonces, clasificamos los comportamientos de manera diferente, dependiendo de nuestro sesgo. Si el experimentador que tiene el sesgo también realiza la clasificación, los problemas potenciales son obvios.
¿CUÁL DE LOS DOS ESTUDIANTES PRESTA ATENCIÓN?
05Martin095-110.indd 105
16/4/08 22:09:21
106
Capítulo cinco
Para evitar esta artimaña, el experimentador puede hacer una lista estándar de verificación de los comportamientos atentos y distraídos, y conseguir varios jueces que observen las cintas y clasifiquen la conducta de los estudiantes. Incluso es posible ocultar a los jueces el ritmo que utilizó el profesor en la cinta que examinen. Esas precauciones disminuyen la probabilidad de engaño, deliberado o no. En ocasiones, se cuela el sesgo incluso en experimentos en los que la medición de las respuestas parece ser sencilla. Se llevó a cabo un experimento en el que los participantes debían mover una barra para alinearla con un objetivo en movimiento. Después de intervalos de 10 segundos, el experimentador leía rápidamente la carátula de un voltímetro y la restablecía (cuanto más lejos estaba el marcador del objetivo, más rápido se movía la aguja). Esta tarea era difícil, ya que la aguja rara vez caía directamente en una línea indicadora. Por lo tanto, era fácil que el experimentador emitiera juicios sesgados acerca de la posición de la aguja. En este caso, los experimentadores tuvieron que leer el voltímetro más de 15 000 veces, lo que aumentó la posibilidad de que se presentaran pequeñas incongruencias en la lectura del instrumento, lo que al final sesgó los resultados. Por tanto, siempre que experimentadores con sesgos deban aplicar su juicio para interpretar una respuesta, deben establecerse procedimientos para que las evaluaciones sean precisas. ANÁLISIS DE LOS DATOS
Debe evitar las artimañas al analizar sus datos de una manera sesgada. Como diremos en el capítulo 12, se calculan pruebas estadísticas para determinar si es probable que un resultado sea un efecto real o si se debe al azar. Estas pruebas estadísticas se utilizan sólo cuando se cumplen ciertas premisas. Utilizar la prueba cuando las premisas no se cumplen es, por lo menos, dudoso. Por ejemplo, las pruebas estadísticas más empleadas requieren que la distribución subyacente sea aproximadamente normal, es decir, en la forma de una campana simétrica. Aunque una pequeña desviación de esta premisa no invalida el examen, hay investigadores que siguen utilizando estas pruebas cuando sus distribuciones no son normales. Como experimentador, depende de usted saber qué premisas requieren sus pruebas estadísticas y qué tan probable es que cometa un error si no las cumple. Al analizar sus datos, probablemente descubra que aunque la mayoría de los participantes manifiesten el efecto experimental pronosticado, varios no lo harán. En este punto, no puede hacer nada con respecto a los renegados.3 Obviamente, si pudiera desechar los datos obtenidos de los participantes que no mostraron el resultado esperado, nunca tendría que llevar a cabo un experimento que no apoyara sus predicciones. Por esta razón, debe ser cuidadoso en cuanto a eliminar participantes de este análisis a partir de su desempeño en la variable dependiente. No debe eliminarlos nunca debido a sus respuestas diferenciales ante los niveles de la variable independiente.
3
A menos que esté interesado específicamente en las diferencias individuales.
05Martin095-110.indd 106
16/4/08 22:09:22
Cómo ser honesto con la ciencia
107
EL PARTICIPANTE FUE ELIMINADO POR FALLAR EN…
Puede eliminar a los participantes que no cumplan algún nivel de desempeño en la variable dependiente sólo si determina el nivel antes de reunir los datos, si puede justificarlo lógicamente y si especifica el nivel de desempeño en su informe del experimento. Por ejemplo, supongamos que le interesa saber si el ruido tiene algún efecto en la habilidad de la gente para realizar una tarea mecanográfica. Antes de iniciar el experimento, decide que no tomará en cuenta los datos de los participantes que no escriben al menos 10 palabras por minuto en ausencia de ruido. Su lógica sería que esos individuos son de por sí tan malos mecanógrafos que aunque el ruido tuviera un efecto nocivo en su conducta, no lo mostrarían. O bien, podría argumentar que le interesa el efecto del ruido en los mecanógrafos experimentados y que una velocidad menor de 10 palabras por minuto indica que la persona no tiene experiencia. Sin embargo, no debe eliminar a los participantes si no tiene un argumento lógico para ello, en función de un nivel predeterminado de desempeño en la variable dependiente. Es menos arriesgado aplicar un criterio distinto al desempeño en la variable dependiente para eliminar a los participantes. No obstante, debe establecer ese criterio antes del experimento y especificarlo al presentar los resultados. Por ejemplo, la tarea de los participantes podría ser escudriñar un conjunto de letras para identificar qué letra está impresa en tinta roja. En este caso, podría excluir a los individuos que no superaran una prueba de agudeza o de ceguera al color antes del experimento. INFORME DE LOS RESULTADOS
Supongamos que analizó su experimento y está listo para informar los resultados. De seguro va a representar parte de los resultados en una gráfica. En el capítulo 12 veremos algunas reglas para trazar una gráfica. Se han escrito libros sobre cómo mentir distorsionando gráficas y estadísticas (Best, 2001; Campbell, 1974; Huff, 1954; Wainer, 2000). Por ejemplo, un experimentador podría alargar uno de los ejes de la gráfica para hacer que un efecto pequeño
05Martin095-110.indd 107
16/4/08 22:09:22
108
Capítulo cinco
parezca enorme o también podría distorsionar la escala de un eje para que la función que se muestra cambie de forma. Si es una persona creativa, puede encontrar muchas maneras de que algo que está mal se vea bien. Obviamente, tal comportamiento no aporta nada al avance de la ciencia y se considera inapropiado. Otra forma cuestionable de trucar es informar en partes los resultados del experimento. Aunque la investigación avanza con un experimento cada vez, no debe publicar su investigación de esta manera. Hace muchas décadas, en el artículo característico de una revista de psicología se presentaban los resultados de un solo experimento. En años recientes, el campo ha crecido tanto que ha habido una explosión de la bibliografía. Hay tanta gente haciendo tantos experimentos que es casi imposible mantenerse actualizado en los avances experimentales. Por esta razón, pocas revistas aceptan el informe de un solo experimento, a menos que haga una contribución inusual por sí mismo. Por lo regular, uno publica los resultados de su propia investigación como una serie de experimentos concatenados. En este procedimiento, la acumulación de conocimientos se ha vuelto mucho más eficiente y ordenada y a los lectores se les evita la tarea de regresar a la investigación, leer nuevamente las secciones de introducción y el procedimiento con cada experimento e integrar la investigación fragmentada en una estructura coherente. En el mundo actual, en el que hay que publicar o morir, un investigador puede sentirse tentado a entregar un informe en partes para acumular publicaciones. Sin embargo, al final, tal comportamiento ni mejora la reputación del investigador ni aporta al cuerpo de conocimientos científicos.
■ Trucos limpios Aunque va en contra del sentido común, a veces es necesario “mentir” al lector de un informe de investigación para comunicar bien. La investigación es un proceso enmarañado, pero cuando uno lee un informe experimental, es como si el investigador procediera de manera sistemática y ordenada en todo momento.4 ¡No se lo crea! Rara vez la mente del investigador trabaja de una manera lógica como se refleja en el informe. Los experimentadores toman muchas decisiones siguiendo corazonadas o intuiciones. Dan salidas falsas basados en suposiciones erróneas. Llevan a cabo buenos experimentos por motivos equivocados o malos por motivos correctos. Desafortunadamente, muchos estudiantes se alejan de la psicología experimental porque piensan que es muy árida y poco emocionante, cuando en la mayoría de los casos es una búsqueda de un tesoro emocionante, desordenada y peligrosa. Poco será lo que sepa de experimentación hasta que no intente hacer su primer experimento.5 La razón más obvia para limpiar el informe experimental es ahorrar tiempo y espacio. Aunque es divertido leer acerca de los errores de sus colegas, uno no tiene tiempo y las revistas no tienen espacio para 4
B. F. Skinner escribió un artículo delicioso, “A Case History in Scientific Method” (1959), sobre los caminos a veces peligrosos de la investigación (1959). 5 Es como hacer el amor: leer sobre el tema es un pobre sustituto de hacerlo.
05Martin095-110.indd 108
16/4/08 22:09:22
Cómo ser honesto con la ciencia
109
permitirse el lujo. El informe experimental está diseñado para transmitir información de manera eficiente, no para entretener al lector.6 EXCLUSIÓN DE ELEMENTOS
Una manera de limpiar su informe experimental es excluir algunos experimentos y análisis.7 Suponga que tuvo un mal día cuando diseñó el tercer experimento de una serie, tuvo una mala intuición o estaba confundido. A nadie le interesa el estado de su vida, sus vísceras o su cabeza. Así que echó a perder el experimento. Yo no tengo por qué leer al respecto ni usted tiene por qué escribirlo. No lo haga. La ciencia no pierde, yo tampoco y usted salva su orgullo. Sin embargo, no caiga en la tentación de suprimir un experimento perfecto si los resultados no apoyan su hipótesis. No sería un truco limpio. No sólo es aceptable excluir todos los experimentos que no agregan algo al informe, sino que a veces también es adecuado ignorar los detalles de algunos análisis de datos. Quizás había varias formas de analizar sus datos y usted las probó todas. Aunque debería informarlo, nada más tiene que dar los detalles de los análisis que son más representativos y comunican más información.8 REORGANIZACIÓN
Sobre todo si hace investigación exploratoria, podría descubrir que el resultado de un experimento indica que no debió ser el primero de la serie. Tendría que regresar y realizar algunos experimentos preliminares. En tales casos, no necesita decirle al lector que “debido al error de cálculo y a la carencia de visión del experimentador, los siguientes experimentos están en desorden”. Puede presentarlos en el orden más lógico, aunque no sea igual al orden en que los llevó a cabo. Los datos son los datos, y debe informarlos de la manera más eficiente posible, siempre que torcer la verdad no tuerza la ciencia. REFORMULACIÓN
Por último, es aceptable reformular la teoría que justifica un experimento. En ocasiones, uno lleva a cabo un experimento por ciertas razones y más tarde descubre un mejor motivo para haberlo hecho. O quizá descubre que otro realizó un experimento que proyecta una luz diferente sobre el que usted hace. En este caso, tiene que determinar cómo dar forma a la aportación propia a los conocimientos científicos, de acuerdo con la nueva información. Desafortunadamente, habrá ocasiones en las que su teoría no funcione y tenga que regresar a la mesa de diseño. Lo más frecuente es que pueda ajustar su experimento a la teoría corregida cambiando de énfasis o mediante la reinterpretación de los resultados. Al publicar sus 6
Muchos autores de manuales también lo piensan. ¡Nunca se divierten! O lo ponen en un pie de página. Nadie lee los pies de página. 8 Observe que no fomento la práctica de llevar a cabo muchas pruebas para luego escoger las que arrojen resultados significativos. En este caso, se distorsionaría el nivel de significancia (véase el capítulo 12). 7
05Martin095-110.indd 109
16/4/08 22:09:23
110
Capítulo cinco
resultados, no necesita cargar al lector con una teoría obsoleta. Repitamos que su mayor consideración ética debe ser si enriquece los conocimientos científicos. En este capítulo de ninguna manera hemos agotado todas las cuestiones éticas que enfrentará como experimentador. En algunos casos, descubrirá que es difícil decidir si una acción es justa con la ciencia. Cuando aparezca un problema, tal vez sea conveniente discutirlo con sus colegas, quienes podrán señalar puntos y sugerir alternativas que no haya considerado. Pero, al final, la decisión es suya. Si aplica bien el principio de que acciones éticas son las que mejor contribuyen a la acumulación de conocimientos científicos, nunca hará trucos sucios y rara vez trucos dudosos.
■ Resumen Ya que la ciencia es un conjunto de conocimientos en aumento, cualquier acción que retrase su expansión eficiente es inmoral. La deshonestidad con la ciencia puede adoptar diferentes formas. Podemos realizar trucos sucios como la maquinación de resultados, el plagio o la falsificación de credenciales. También podemos incurrir en trucos cuestionables al no controlar las variables de confusión en el diseño de un experimento o al clasificar mal las respuestas y leer en forma errónea los instrumentos durante la recolección de nuestros datos. No es aceptable tampoco que durante el análisis de los datos no se cumplan las premisas de la prueba y se eliminen participantes sin razón, así como tampoco lo es distorsionar las gráficas ni informar parcialmente de una serie de experimentos. En aras de la eficiencia, es aceptable publicar los resultados de los experimentos en una forma que no sea exactamente la misma en que se realizaron. Por ejemplo, podemos excluir del informe ciertos experimentos y análisis, si no agregan valor, o podemos reordenarlos y reformular la teoría si estas acciones incrementan la eficiencia del informe experimental.
05Martin095-110.indd 110
16/4/08 22:09:23
6
Cómo averiguar qué se ha hecho
Polonio: ¿Qué lee, mi señor? Hamlet: Palabras, palabras, palabras. WILLIAM SHAKESPEARE
Pero ¿por qué tenemos que soportar a los académicos que insisten en hacer tormentas verbosas en vasos de agua intelectuales? S. I. HAYAKAWA (1978)
Desgraciadamente, la casa de la ciencia de la investigación social fue arruinada, esparcida entre el pedregal de cientos de revistas y yace entre los cascotes antiestéticos de millones de tesis. Aunque los cascotes no puedan convertirse en ciencia, hay que tamizarlos y escarbarlos para sacar lo que tengan de sustancia. G. V. GLASS, B. MCGAW Y M. L. SMITH (1981)
Q
uizá mientras leía el capítulo 3 referente a cómo tener una idea para hacer un experimento, tuvo un momento de inspiración. O quizás llegó una idea tan sigilosamente como un gato. Como sea, espero que haya empezado a darle forma a una idea interesante y que esté ansioso por iniciar su experimento. Sin embargo, antes de que planee seriamente, debe tomar en cuenta que acaso su idea ya fue una idea brillante de otra persona.
■ ¿Por qué revisar la bibliografía? Si bien la psicología es una ciencia relativamente joven, se publican más de 50 000 referencias por año. Aun cuando tal vez otro investigador no haya hecho exactamente lo que usted piensa hacer, es muy probable que de toda la investigación acumulada en la corta historia de la psicología, alguien ya haya hecho algo semejante. Sería muy improductivo que repitiera un experimento, a menos que pensara que los resultados publicados no fueran confiables. Asimismo, tal vez también le parezca útil estudiar la forma en que otros investigadores abordaron problemas similares. Quizá usaron técnicas experimentales que desconoce. Asimismo, es probable que se entere de que otros descubrieron errores en los que no habría perdido el tiempo. 111
06Martin111-130.indd 111
12/5/08 14:45:36
112
Capítulo seis
¡PERO ME ACUERDO QUE TENÍA ALGO QUE VER CON EL COMPORTAMIENTO!
SALA DE ESTUDIANTES
La ciencia se enfoca en producir un cuerpo organizado de conocimientos, no una acumulación desordenada de hechos creada a partir de experimentos aislados y pequeños. Por tanto, la razón más importante para averiguar lo que otros han investigado es que tendrá que hacer encajar sus hallazgos en ese cuerpo de conocimientos. Una vez que termine su investigación, no sólo dirá “resultó esto” sino también: “aquí es donde va”. Para saber cuál es el lugar que ocupa su trabajo, debe saber cómo era el cuerpo de conocimientos científicos antes de su investigación. En este capítulo se analiza cómo descubrir, a través de la búsqueda bibliográfica,1 lo que hay en ese conjunto de conocimientos. Mientras busca la bibliografía en una biblioteca, lleve un registro de lo que encuentra. Cada vez que encuentre un artículo o libro que pudiera serle útil, haga anotaciones de los puntos importantes y escriba la referencia. Incluya los nombres de los autores,2 título del trabajo, nombre de la publicación o libro, fecha, número del volumen, páginas correspondientes y editorial, en el caso de un libro. Después necesitará esta información si decide citar un artículo en el informe de su investigación. Para algunas personas, las fichas son de gran ayuda. La búsqueda automatizada es otro método utilizado. Como veremos adelante, se puede realizar una búsqueda automatizada, que se caracteriza porque se obtiene la ficha bibliográfica de toda referencia que encuentre y basta imprimirla. Independientemente de cómo lleve a cabo su búsqueda, cuanto más ordenado sea desde el comienzo, menos tiempo
1
Los científicos han denominado esta actividad búsqueda bibliográfica, aunque no se busque exclusivamente libros. A la gente que no sabe mucho de psicología le extraña que los psicólogos experimentales se refieran a los experimentos por su autor en lugar del tema. Si escucha a su profesor decir algo como: “Los resultados de Carothers, Finch y Finch (1972) concuerdan con los de Peterson, Bergman y Brill (1971)”, no están hablando de despachos de abogados sino de experimentadores.
2
06Martin111-130.indd 112
12/5/08 14:45:37
Cómo averiguar qué se ha hecho
113
perderá después buscando las referencias que puso al reverso de una envoltura de chicle. Si encuentra varios artículos bien escritos, saque copias y consérvelas para aprovecharlas como modelos cuando empiece a escribir. Aun cuando no es difícil hacer una búsqueda bibliográfica, quita tiempo y es poco estimulante, porque hay que rebuscar entre muchos trabajos. Pero manejar la bibliografía es de absoluta necesidad; ¡representa sus conocimientos científicos! Nada es más vergonzoso, cuando presente los resultados del trabajo de toda su vida, que escuchar un comentario como: “Desde luego que está familiarizado con Klip y Klap (2006), que hicieron el mismo experimento el año pasado.”
■ La vigencia de las fuentes Si no está bien familiarizado con las posibles fuentes de investigación, como libros o artículos, quizá no sepa por dónde empezar su búsqueda bibliográfica. Primero, necesita saber un poco de las fuentes disponibles y su actualización. Para ello, sigamos un experimento cualquiera, como se presenta a la comunidad científica. En la figura 6-1 se presenta un resumen de este proceso en un cronograma en el que cero representa el momento en el que el experimentador inicia un proyecto.3 Después de reunir los datos, el investigador presenta los resultados preliminares a un grupo reducido de amigos de una institución local. Si no se burlan de él, quizá decida asistir a una reunión profesional, como una convención anual, y leer una ponencia en la que resuma la investigación.4 Suponiendo ahora que este público más hostil ofrezca un mínimo apoyo, el investigador podría escribir un manuscrito basado en la investigación para someterlo a una publicación. De aceptarse el artículo, se publicará de nueve meses a un año después. Una vez publicado, Psychological Abstracts presentará un resumen del artículo. Si el artículo es importante, podría aparecer después en Annual Review, ser citado en otros artículos y quizá mencionado en una publicación como Psychological Bulletin. Por último, después de varios años, el autor de un libro de texto podría mencionar la investigación como parte de los conocimientos aceptados. En la figura 6-1 se señala el desfase en el proceso de la comunicación científica. Si recurre a la biblioteca, la primera vez que tiene acceso a un resultado experimental es como artículo de una publicación. Como se dará cuenta, pierde mucho tiempo en ello, ya que es probable que la investigación se iniciara cuando menos tres años antes de que se publicara. Si empieza su experimento en este punto y realiza el mismo proceso, el otro autor tendrá que esperar tres años más antes de que los resultados que usted obtuvo se den a conocer en un artículo. (¡Incluso el servicio postal de Estados Unidos tiene un mejor tiempo de res-
3 La figura se basa en una investigación que ahora ya es antigua. Es probable que con los avances tecnológicos en editoriales, en años recientes se haya comprimido el cronograma. Sin embargo, no conozco otra investigación reciente que se refiera a este problema. Creo que, en esencia, a la fecha no ha cambiado el orden de los eventos y que la figura de igual modo ofrece una manera útil para tener una idea clara del proceso editorial. 4 Ahí van los profesores cuando faltan a clases, y usted que pensaba que se iban de vacaciones a divertirse.
06Martin111-130.indd 113
12/5/08 14:45:38
114
Capítulo seis
puesta!) Como es necesario evitar tales retrasos, poco menos de una de cada siete investigaciones se origina de fuentes formales, como artículos publicados (Garvey y Griffith, 1971). La mayoría de las ideas se originan de comunicaciones más informales entre los científicos de cierto campo, como presentaciones en congresos, listas de discusión y páginas en internet. Sin embargo, como investigador nuevo, sin los contactos necesarios para dicha comunicación informal, tal vez por el momento se tenga que conformar con las fuentes formales. Si continúa trabajando en un campo de investigación en particular, descubrirá que hay más estudiosos de su materia y llegará a conocer personalmente a sus colegas investigadores. Entonces se habrá anticipado a las publicaciones y los “nuevos” investigadores nuevos. En la siguiente sección estudiaremos con más detalle las fuentes formales, analizaremos las ventajas y desventajas de cada una y determinaremos cómo localizar las fuentes pertinentes. Vamos a empezar con los libros y luego seguiremos con más fuentes recientes.
■ Fuentes formales LIBROS
Como en los libros sólo se incluyen investigaciones que ya tienen algunos años, tal vez considere que no son la mejor fuente. Sin embargo, en cierto sentido esta demora hace que sean la mejor fuente. En el periodo entre la conclusión de la investigación y el momento en que se presenta un informe en una de las fuentes ocurre un proceso importante: la investigación se revisa para verificar su importancia y calidad de manera que cuando se presente en un libro, quede integrada a otras investigaciones para formar un conjunto de conocimientos coherentes. Por tanto, el valor de la investigación del libro radica en el hecho de que un autor incluye el trabajo en el libro porque considera que está bien realizado, que es importante y que encaja en el conjunto de los conocimientos científicos. El autor ya hizo gran parte del trabajo por usted; sólo que es algo obsoleto. Un buen lugar para iniciar su búsqueda bibliográfica es un libro publicado recientemente que trate el tema de investigación general que le interesa a usted. Si el autor realizó un buen trabajo, puede confiar en que tiene un resumen útil que contiene lo más importante de la investigación desde el inicio de la psicología hasta unos 13 años antes de la fecha de publicación del libro. Ahora su trabajo es mucho más fácil: saber qué ocurrió durante los últimos 13 años. Un problema de este método es que el autor tuvo que seleccionar y no incluyó todas las investigaciones sobre un tema desde el inicio de la psicología. Cada autor se inclina por un planteamiento teórico o una metodología y selecciona su investigación con base en dicho sesgo. Además, casi ningún libro está sujeto al mismo nivel de revisión de iguales que se hace con los artículos. En esta revisión de pares, investigadores muy respetados tienen que leer el material y dar su sello de aprobación. La mayoría de las publicaciones imponen la revisión de todos los artículos seleccionados para publicar. En cambio, las editoriales no tienen tanto este requisito. Por consiguiente, para asegurarse de que puede
06Martin111-130.indd 114
12/5/08 14:45:39
Cómo averiguar qué se ha hecho
115
confiar en la capacidad académica del autor y su orientación, procure llegar a un consenso sobre varias fuentes bibliográficas; al menos, intente saber cuál es la orientación particular del autor. Supongo que sabe cómo encontrar libros en la biblioteca. Si no, pregunte al bibliotecario de su universidad cómo realizar una búsqueda que sirva mejor a su propósito, en lugar de que yo se la describa. Las bibliotecas tienen catálogos electrónicos de los libros disponibles. Primero, escriba el nombre del autor, título del libro o tema que le interesa. En la pantalla se desplegarán los libros que cumplan con sus requisitos. En la actualidad, incluso es posible utilizar la computadora para buscar en internet libros en otras bibliotecas, aunque quizá sea problemático conseguirlos. Los préstamos interbibliotecarios pueden ser útiles, pero no se espere hasta el último minuto, cuando ya recopiló los datos y anotó sus resultados. Sería demasiado tarde ya para conseguir las obras que necesite. Por último, también puede encontrar libros en las bases de datos de búsqueda computarizada que menciono más adelante en este capítulo. En este caso, no tendrá garantía de que el libro que encuentre esté en la biblioteca. Antes de que vaya a la biblioteca, sería conveniente que revisara un libro de introducción a la psicología que trate el tema que busca. La mayoría de los textos básicos incluyen una lista de lecturas sugeridas con las que puede empezar. También puede hablar con el profesor de su departamento de psicología, encargado de las investigaciones en ese campo. Probablemente le proporcione con gusto referencias de algunos libros. Por último, el Library Use: A Handbook for Psychology (Reed y Baxter, 2003) de la Asociación Psicológica Estadounidense (APA, por sus siglas en inglés) le servirá mucho para aprender habilidades bibliotecarias específicas para la psicología. RESEÑAS DE LIBROS Y ARTÍCULOS
Varias fuentes reseñan e integran las investigaciones de áreas especializadas de la psicología. Están más actualizadas que los libros de texto y, en consecuencia, hay menos tiempo para poner la investigación en perspectiva. Una de esas fuentes es una publicación de la APA llamada Psychological Bulletin, que publica “reseñas para evaluar e integrar, así como interpretaciones de temas sustantivos y metodológicos de la psicología científica”. La siguiente es una lista de varios títulos de diversos temas: “Activación y la hipótesis de la U invertida: Una crítica a la reconceptualización de la activación de Neiss” “Atribuciones en el matrimonio: Revisión y crítica” “Diferencias de género en el desempeño en las matemáticas: Un meta-análisis” “Efectos del alcohol en la agresión humana: Una reseña interactiva de la investigación” “Visión retrospectiva: Juicios sesgados de los eventos pasados después de conocer los resultados” “Ideas sobre la causalidad en la filosofía y la psicología”
06Martin111-130.indd 115
12/5/08 14:45:39
116
Capítulo seis
“Psicoterapia para el tratamiento de la depresión: Una reseña exhaustiva de la investigación controlada de los resultados” “Hijos de padres depresivos: Una reseña integradora” “La ciencia y la moralidad: El papel de los valores en la ciencia y el estudio científico de los fenómenos morales” Como se aprecia, los temas de estos artículos son más especializados que en los libros de texto. Un artículo del Bulletin puede tomar la reseña de un artículo previo como su punto de partida, en lugar de los inicios históricos de la psicología, y no representa un examen completo. Aun así, un artículo reciente puede ahorrarle mucho tiempo de búsqueda. En general, los artículos reseñados están más actualizados que los libros, que por lo regular tienen de cinco a ocho años de antigüedad con respecto a la investigación actual. En el caso de los experimentos que se asemejan a los que planea, un artículo reseñado no le proporcionará los suficientes detalles. Sin embargo, en las fuentes originales que se citan al final del artículo verá rápidamente las referencias importantes y sabrá qué lugar ocupa su experimento en el conjunto de las investigaciones. Otra fuente de reseñas de investigaciones es el Annual Review of Psychology, publicado por Annual Reviews, Inc. Los temas del volumen varían año con año, dependiendo de lo que decida una junta editorial. Cada capítulo está escrito por una autoridad reconocida en la materia y tiene el designio de resumir e integrar la investigación realizada desde que el tema se incluyó en la serie. Los temas son más amplios que los del Psychological Bulletin: “Personalidad” “Psicología del desarrollo” “Visión espacial” No obstante, algunos temas no son tan amplios:5 “Técnicas de intervención: grupos reducidos” “Influencias sociales y culturales en la psicopatología” En años recientes, se han publicado muchas compilaciones. Algunas resumen el trabajo más reciente de algún campo de la psicología. Por lo regular, cada capítulo está escrito por un investigador que hace una reseña actualizada de un área de investigación específica. Estos capítulos se parecen a los artículos de reseña, de modo que si encuentra uno que sea pertinente para su investigación, se ahorrará mucho tiempo de búsqueda. Estos libros tardan menos en editarse que los libros de texto. De hecho, muchos se producen con el sistema de edición personal, en el que el largo proceso de composición tipográfica, corrección y producción de un ejemplar es mucho más breve. En este caso, algunos informes pueden tener uno o dos años de antigüedad. Por otro lado, estos libros no son revisados por iguales, como los artículos de las publicaciones especializadas. 5
¿Observó una relación interesante? Cuanto más amplio el tema, más corto el título.
06Martin111-130.indd 116
12/5/08 14:45:39
Cómo averiguar qué se ha hecho
117
ARTÍCULOS EN REVISTAS
Las revistas especializadas de psicología son la columna de nuestra ciencia. Reciben el nombre de fuentes primarias, ya que presentan los resultados básicos interpretados por los experimentadores que realizaron la investigación, en lugar de la interpretación de terceros, como los que compilan reseñas. Para llevar a cabo una búsqueda bibliográfica exhaustiva, debe recurrir a los artículos de revistas, que son los más actualizados de todas las fuentes formales y tienen un retraso de la investigación real de pocos años. Por tanto, aunque los autores de artículos traten de articular su trabajo con el estado de los conocimientos, su esfuerzo sólo es parcialmente satisfactorio, porque es común que no sepan de otras investigaciones que se lleven a cabo al mismo tiempo. Así, usted mismo tendrá que hacer cierta labor de integración para que la investigación integre un cuerpo ordenado de conocimientos. Es imposible que anote aquí todas las revistas especializadas de psicología. Muchas organizaciones profesionales publican revistas para sus miembros y diversas editoriales patrocinan revistas. Para darle una idea de las publicaciones, a continuación encontrará algunos títulos: American Journal of Psychology Animal Learning & Behavior Audiology Behavioral and Brain Sciences Behavioral Neuroscience Cognition Cognitive Psychology Current Directions in Psychological Science Developmental Psychology Journal of Abnormal Psychology Journal of Applied Psychology Journal of Cognitive Neuroscience Journal of Comparative Psychology Journal of the Experimental Analysis of Behavior Journal of Experimental Psychology: Animal Behavior Processes Journal of Experimental Psychology: General Journal of Experimental Psychology: Human Perception and Performance Journal of Experimental Psychology: Learning, Memory, and Cognition Journal of Memory and Language Journal of Personality and Social Psychology Learning and Motivation Memory & Cognition Motivation and Emotion Perception & Psychophysics Psychological Record Psychological Review Psychological Science Quarterly Journal of Experimental Psychology. A, Human Experimental Psychology Quarterly Journal of Experimental Psychology. B, Comparative and Physiological Psychology
06Martin111-130.indd 117
12/5/08 14:45:40
118
Capítulo seis
ACTAS
En algunos campos de la psicología, las actas, que son los informes de las reuniones científicas, se consideran importantes. Por ejemplo, la Sociedad de Factores Humanos y Ergonomía (Human Factors and Ergonomics Society) publica actas en formato electrónico e impreso. Las actas contienen los informes de la mayoría de las ponencias leídas en sus reuniones anuales. Aunque estas actas son más breves que un artículo de revista, son revisadas por grupos de expertos y se les considera una de las fuentes de información importantes. Debido a lo limitado de su extensión y a la revisión menos rigurosa por parte de los colegas, en general, los trabajos de las actas se consideran de menor importancia que los artículos de las publicaciones especializadas, aunque ofrecen un medio para hacer llegar más oportunamente los resultados de investigaciones a la bibliografía científica. INFORMES TÉCNICOS
Muchas veces, los informes técnicos no se toman en cuenta como fuente bibliográfica de la psicología, aunque pueden ser de gran ayuda en ciertos campos de investigación. Cuando el gobierno federal de Estados Unidos apoya un trabajo de investigación, en particular del Departamento de Defensa, se requiere que el investigador presente un informe técnico, que es semejante al artículo de una revista aunque más detallado en cuanto a los procedimientos y el equipo y, a veces, incluso se agregan los datos. La dependencia gubernamental que lo respalda lo distribuye automáticamente a otros especialistas que realizan investigaciones semejantes y reciben apoyo de la misma. Aproximadamente uno de cada 10 autores escribe estos informes y apenas un tercio de éstos se publican después en alguna revista (Garvey y Griffith, 1971). La mayoría de las bibliotecas no solicitan informes técnicos, ya que se llenarían los estantes rápidamente y resultaría difícil organizarlos y clasificarlos de manera sistemática. Los investigadores que trabajan con subvenciones o por contrato de la Defensa reciben mensualmente una publicación con los resúmenes de todos los informes técnicos. Psychological Abstracts también hace pública una lista de muchos informes, pero, desafortunadamente, son difíciles de conseguir. Para comprarlos, el investigador debe enviar una solicitud al Centro de Documentación de la Defensa en Alexandria, Virginia, y saber el número del documento y precio del informe. En algunos campos de investigación, es una pérdida de tiempo rebuscar entre los informes técnicos. Sin embargo, si trabaja en un campo que respalda una dependencia gubernamental importante, los informes son una fuente valiosa de información. Algunos ejemplos de investigación con fondos del gobierno son la seguridad de los conductores de automóviles, capacitación y selección de personal, control de máquinas complejas y toma de decisiones de los seres humanos. EDICIONES ELECTRÓNICAS
Entre las fuentes formales, incluyo las ediciones electrónicas, aunque algunos consideren que les concedo mucho crédito. En la actualidad, hay numerosas ediciones electrónicas, que
06Martin111-130.indd 118
12/5/08 14:45:40
Cómo averiguar qué se ha hecho
119
son obra tanto de investigadores que deciden poner en su página de internet el último borrador de un artículo hasta revistas electrónicas que publican artículos revisados por colegas de calidad similar a los artículos impresos. Por eso, a veces es difícil determinar la calidad de lo que uno encuentra. Algunos expertos han pronosticado que la publicación electrónica dominará la comunicación científica y, al cabo del tiempo, eliminará por completo las ediciones impresas, aunque no ha ocurrido así. Las ventajas son obvias. Se reduce el tiempo entre la conclusión de la investigación y su publicación. La gente puede obtener de inmediato el artículo desde internet y tenerlo en papel por el precio de una impresión. El investigador puede colocar borradores sucesivamente y revisarlos con base en los comentarios de los lectores. Sin embargo, la publicación electrónica también tiene sus problemas. ¿Quién asegura la calidad de los artículos? Las asociaciones profesionales que publican revistas seleccionan con sumo cuidado sus editores y éstos envían los manuscritos de la investigación a revisores muy respetados. En algunos casos, un promedio de 10 a 20% de las presentaciones se escogen para su publicación, y el informe sólo se publica después de haber sido cuidadosamente revisado y corregido por un lector de manuscritos. En internet, cualquiera con acceso puede crear una página electrónica y colocar un ensayo de investigación. Un segundo problema surge cuando aparecen diferentes borradores de un mismo informe. ¿Cuál es la versión final? Las publicaciones, en particular los artículos de revistas, son los tabiques en la construcción de nuestra ciencia y los científicos necesitan saber si un artículo en particular es el único tabique que se agregará a la estructura científica. Por último, está la cuestión del dinero. Las sociedades profesionales han sido las guardianas de la ciencia, las que han proporcionado la infraestructura que ha favorecido la expansión ordenada del quehacer científico. Lo anterior cuesta dinero, que proviene sobre todo de las tarifas de suscripción que pagan las bibliotecas y cuotas de membresía que aportan los científicos en lo particular. Si los artículos se difundieran gratuitamente en internet, ¿de dónde saldría el dinero que sustente la infraestructura científica? Hay situaciones que deben resolverse. Por tanto, la APA, que edita el mayor número de revistas de prestigio, tiene la norma de que no publicará ningún documento que se haya hecho público en internet. La APA adopta la posición de que si un documento se ha subido a la red, ya está publicado. Lo anterior no significa que no se pueda enviar por correo electrónico un informe a ciertas personas para que le den su opinión. Pero tenga presente esta norma, por si un día quiere publicar su investigación en una revista científica normal. También debe tener presentes estas cuestiones al realizar su búsqueda bibliográfica. Tal vez encuentre artículos importantes en internet. En particular, los artículos que aparecen en las páginas principales de investigadores reconocidos quizá sean los que más vale la pena leer y citar en su documento. Aunque también hay mucha basura en este medio. Debe mantener una actitud escéptica ante la información que encuentre utilizando motores de búsqueda no científicos. No hay control de calidad obligatorio en internet, así que debe hacerlo por su cuenta. Antes de citar la información que encontró en internet, asegúrese de verificar las credenciales del autor y pida la opinión de otros que tengan experiencia en el campo de la información que va a citar.
06Martin111-130.indd 119
12/5/08 14:45:41
120
Capítulo seis
BÚSQUEDA BIBLIOGRÁFICA
BÚSQUEDA DE BIBLIOGRAFÍA FORMAL
Hasta aquí, es probable que se sienta abrumado por la imposibilidad de buscar entre una tal cantidad de revistas y libros. No lo culpo; podría pasar el resto de la vida en la biblioteca, consultando en las publicaciones conforme van apareciendo, y estar cada día más atrasado. Por fortuna, la APA ha llegado al rescate. Uno de sus servicios es PsycINFO, cuya misión es crear productos que ayuden a los investigadores a localizar la bibliografía que necesitan. Desde 1927, la APA ha publicado Psychological Abstracts, que contiene referencias y resúmenes de artículos. Hasta hace pocos años, los estudiantes que realizaban una búsqueda bibliográfica tenían que revisar muchos volúmenes de esta publicación y localizar manualmente los artículos relacionados con su tema, valiéndose de términos clave o el nombre de los autores. Era una tarea tediosa pero necesaria. En la actualidad, las comunicaciones electrónicas han simplificado el trabajo en buena medida. Además de Abstracts, la APA también compila la base de datos electrónica PsycINFO. Muchas grandes bibliotecas rentan un sitio para PsycINFO y lo ponen a disposición tanto en las computadoras de sus instalaciones como para consulta remota. Por ejemplo, en mi universidad, estudiantes y profesores hacen búsquedas bibliográficas en su computadora personal desde su dormitorio o cubículo. La base de datos contiene más de 1.5 millones de resúmenes de bibliografía sobre psicología, desde 1887 hasta nuestros días, y agrega cerca de 5500 referencias cada mes. Incluye artículos, tesis, informes, libros completos o parciales en inglés, así como otros documentos académicos. En la figura 6-2 se muestra un ejemplo de una forma de entrada de una base de datos. Las tres partes básicas de una entrada son la cita bibliográfica, el resumen y el índice temático universal. La cita bibliográfica comprende el título, el autor o autores y la fuente. Es la
06Martin111-130.indd 120
12/5/08 14:45:41
Cómo averiguar qué se ha hecho
121
NÚMERO DE ACCESO: 1997-05223-007 TIPO DE DOCUMENTO: Artículo de revista TÍTULO: The availability heuristic: Effects of fame and gender on the estimated frequency of male and female names. AUTOR: McKelvie,-Stuart-J. FUENTE: Journal of Social Psychology. 1997 Feb; Vol 137(1): 63-78 ISSN: 0022-4545 AÑO DE PUBLICACIÓN: 1997 RESUMEN: En dos experimentos, estudiantes canadienses de licenciatura escucharon una lista de 13 nombres masculinos y 13 nombres femeninos; luego calcularon cuántos nombres masculinos y femeninos habían escuchado. En el experimento 1, la lista constaba de 26 nombres famosos o 26 nombres comunes. Los participantes de ambos sexos hicieron cálculos semejantes del número de nombres masculinos y femeninos, lo que contradice la hipótesis de que existe un sesgo hacia los nombres masculinos o hacia los nombres del género de la persona. En el experimento 2, en que la lista contenía los nombres de hombres famosos y de mujeres no famosas o viceversa, los participantes hicieron cálculos mayores para el género famoso. Este resultado confirmó el efecto de disponibilidad de la fama de A. Tversky y D. Kahnemann (1973) y demostró que su tamaño iba de moderado a grande. ((c) 1997 APA/PsycINFO, todos los derechos reservados) FRASE CLAVE: fama y sexo del nombre, frecuencia calculada de los nombres masculinos y femeninos, estudiantes universitarios, Canadá, prueba del heurístico de disponibilidad de la fama PRINCIPALES DESCRIPTORES: *Cálculo; *Fama; *Diferencias sexuales humanas; *Nombres DESCRIPTORES SECUNDARIOS: Adultez FIGURA 6-2
Una entrada característica de PsycINFO que muestra varios campos de datos.
información que aparece en la sección de referencias, si fuera a incluir la entrada en el ensayo que escribe. El autor redacta el resumen en los artículos; no evalúa la investigación, sólo la describe. La indexación temática universal se realiza utilizando frases clave y descriptores. Observe que todo lo que obtiene de una entrada es una breve descripción de la investigación. Esto basta para saber si le interesa o no, pero no sustituye la lectura de la referencia original. Para leer toda la referencia necesita conseguir el artículo, el libro o el capítulo en su biblioteca. Las bibliotecas más grandes tienen una selección de las publicaciones más usuales. Si su biblioteca no cuenta con la publicación que busca, el bibliotecario le dirá cómo tramitar un préstamo interbibliotecario. En la actualidad, hay sitios que ofrecen documentos completos por una cuota a través de internet. Algunas bibliotecas también están suscritas a PsycARTICLES. Este servicio concede acceso al texto completo de los artículos de las publicaciones de la APA y recientemente se ha actualizado para incluir en las 24 publicaciones de la APA artículos de archivo desde 1894. ¿Cómo encuentra las entradas relacionadas con el tema de su investigación? Hay diversas maneras. Si tiene alguna idea del tema de investigación que le interesa, puede hacer la búsqueda mediante frases clave y descriptores. Así fue como encontré la entrada de la figura 6-2. Pensaba realizar un experimento para ver la influencia que ejerce el heurístico de la disponibilidad en la preferencia de la gente con respecto a la generación nuclear de electricidad. El heurístico de la disponibilidad dice que influye en nuestra opinión la disponibilidad mental de casos relacionados con dicha opinión. Por ejemplo, quizá yo sea de la opinión
06Martin111-130.indd 121
12/5/08 14:45:41
122
Capítulo seis
de que mueren más seres humanos por ataques de tiburón que por picaduras de avispa, ya que tengo más recuerdos de ataques de tiburón. Pero la realidad es que el índice de mortalidad por picaduras de avispa es mayor. En nuestro experimento, le pedimos a la gente que nos dijera las ventajas o desventajas de la generación de energía nuclear y luego les pedimos que calificaran qué tan favorable sería su actitud hacia esa fuente de electricidad. Esperábamos que el simple hecho de recordar aumentara la disponibilidad de las ventajas o desventajas y que esto pesara en la calificación. En este caso, me interesaba conocer referencias sobre el heurístico de la disponibilidad, de manera que esa frase fue la que usé en la búsqueda. Apareció un mensaje diciendo que la búsqueda había producido 50 documentos. Luego empecé a consultar las entradas, una de las cuales se muestra en la figura 6-2. Leí el título y el resumen de esa entrada en particular, y decidí que no me interesaba lo suficiente como para leer todo el artículo. En la búsqueda se seleccionó este artículo porque el título y la frase clave contienen el término heurístico de la disponibilidad. El término podía haber aparecido en cualquier parte de la entrada; habría sido suficiente para escogerlo. Pude haber limitado la búsqueda especificando qué campo buscar. Cada palabra en mayúscula indica un campo por separado. Así que, por ejemplo, pude haber buscado únicamente el campo correspondiente a la frase clave. En la figura 6-2 sólo se muestran 11 campos de búsqueda, pero en realidad hay 89 valores posibles para estos campos.6 Así puede uno limitar la búsqueda a artículos de revistas especializadas o a referencias en inglés o a participantes adultos, etc. Con este método, no hace falta rebuscar en tantas entradas. Los procedimientos exactos para realizar una búsqueda son demasiado detallados para mencionarlos aquí, además de que cambian con frecuencia. Para aprenderlos, consulte a un bibliotecario, estudie los folletos explicativos o, incluso, revise el sitio en línea de la APA (http://www.apa/psycinfo/). Por lo pronto, le voy a dar una descripción general de los pasos que hay que dar. Primero, debe poner por escrito, en forma de pregunta, qué es lo que busca. Por ejemplo, suponga que quiere saber si la gente se pone ansiosa cuando usa la computadora. Debe señalar los conceptos separados de su pregunta, por ejemplo, ansiedad y computadora. Luego, consulte en el tesauro de PsycINFO los descriptores adecuados. Esto le permitirá ampliar o acortar los términos cuanto sea necesario para personalizar la búsqueda según sus propósitos. Debe seguir este paso con cada uno de sus términos. Por ejemplo, uno pensaría que ansiedad debe incluir temor y fobia. Por tanto, es necesario que combine sus conjuntos de descriptores utilizando las palabras Y (AND), O (OR) y NO (NOT). Tenga cuidado cuando lo haga, porque estos conectores lógicos tienen significados muy específicos. ”Y” significa que usted quiere que la búsqueda se restrinja a las entradas que tengan todos los conceptos, en este caso, ansiedad y computadora. Con “O” la extensión de la búsqueda es más amplia, es decir, que las entradas tendrían cualquiera de los descriptores. “NO” se emplea cuando uno está seguro de que quiere excluir todas las entradas que tengan un descriptor. 6
Puede aprender más acerca de estos campos en la siguiente dirección de internet: http://www.apa.org/psycinfo/. En esta dirección también se dan muchos detalles de cómo realizar una búsqueda electrónica.
06Martin111-130.indd 122
12/5/08 14:45:42
Cómo averiguar qué se ha hecho
123
En cuanto se termina la búsqueda, la pantalla indica cuántas entradas se encontraron. Si hay pocas o ninguna, no suponga automáticamente que no hay investigaciones en ese campo. Lo que procede es volver a pensar en los conceptos de la solicitud o examinar esos pocos resultados para modificar los descriptores. Si la búsqueda ha producido pocas referencias útiles, revise los descriptores anotados en las entradas que ha encontrado y vea si sería apropiado buscar algunos; de ser así, agréguelos a su búsqueda. Intente combinar sus descriptores de diferentes maneras para ver si esto afecta el número de entradas encontradas. Por otro lado, si su búsqueda ha identificado cientos de entradas, revise someramente algunas para comprobar si hay áreas de investigación que no le interesen y procure eliminarlas mediante el conector lógico NO o combinando de otra manera los descriptores. Otra forma de consultar las bases de datos electrónicas es buscar por nombre de autor en lugar de descriptores. Quizá sepa de algunos autores que publican con regularidad en el área de su interés o los ha descubierto al hacer su búsqueda. Sería prudente introducir esos nombres en los campos de autor para ver qué más han publicado. Por ejemplo, mientras hacía mi investigación sobre el heurístico de la disponibilidad, supe que los que acuñaron el término, Daniel Kahneman y Amos Tversky, habían publicado otros artículos, capítulos y libros sobre el tema, de modo que hice una búsqueda usando sus nombres y encontré otras referencias más significativas, así como otras irrelevantes. Use todas las variantes de los nombres, con y sin iniciales, ya que a veces los nombres aparecen de diversas maneras. Cuando tenga una lista razonable de entradas de varias búsquedas, clasifíquelas en la pantalla, escoja las más apropiadas y “márquelas” en forma electrónica. Después podrá imprimir o bajar todas las entradas que haya marcado o retransmitírselas por correo electrónico. Esta lista le proporcionará la información necesaria para encontrar artículos originales, libros o capítulos que quiera leer en su totalidad y seleccionar después las entradas bibliográficas de la lista que formarán parte de la sección de referencias de su informe de investigación. Nos detuvimos en el uso de PsycINFO porque es la base de datos de psicología más consultada. Ahora bien, hay otras bases que reúnen bibliografía científica y que también son de gran ayuda. La biblioteca de mi universidad tiene 22 bases de datos agrupadas bajo el encabezado psicología. Por ejemplo, si se tratara del lado clínico o médico de la psicología, MEDLINE es una buena base de datos. Su consulta es muy parecida a la de PsycINFO. Supongamos que está interesado en el trastorno bipolar, que es uno de los padecimientos mentales más estudiados por los psicólogos. Anote bipolar en la línea de búsqueda. Luego, hay que llenar varias líneas que especifican si en la búsqueda se incluye la palabra clave en el título, en el nombre del autor, en el nombre de la revista o en todos los campos; las fechas primera y última de la búsqueda; cómo quiere que se ordenen los resultados, y si sólo quiere la cita, el resumen o todo el registro. Cuando introduje bipolar y especifiqué que quería hacer una búsqueda de los títulos de 1995 a 2002, el resultado arrojó 250 citas. Para hacer la búsqueda más eficiente, se restringe
06Martin111-130.indd 123
12/5/08 14:45:42
124
Capítulo seis
con palabras clave. Supongamos que lo que le interesa son los suicidios de pacientes diagnosticados con este trastorno. En este caso, puse en la línea de búsqueda bipolar y suicidio. Con este cambio, el número de citas encontradas disminuyó de 250 a 15, una cantidad más razonable. Lo insto a que acuda a su biblioteca, ya sea física o electrónicamente, para ver qué bases de datos tiene. Hay otras bases de datos, además de la de PsycINFO, con las que podrá ampliar su búsqueda, en particular si su área de interés se superpone con otro campo que no sea de la psicología. "BÚSQUEDA" RETROSPECTIVA DE REFERENCIAS
Hay otro método de buscar bibliografía, aunque no es tan exhaustivo como PsycINFO, pero es una buena forma de determinar si se olvidó de alguna investigación clave en su búsqueda anterior. Llamo a esta técnica búsqueda retrospectiva de referencias. El primer paso es encontrar el artículo más reciente que se refiera al tema de interés, y que será el “tronco” de la arborescencia de investigaciones. Vaya a las referencias al final del artículo. Muchas son pertinentes para su tema (con suerte, la mayoría ya estarán en su lista). Cada artículo tendrá también una lista de referencias para escoger. Rastree las referencias por la bibliografía hasta que haya encontrado todos los artículos importantes que formen el nuevo conjunto de ramas de su árbol. Este método puede ser de gran utilidad, mas no dependa de él como su única técnica, ya que no puede darse por sentado que todos los autores hicieron siempre un trabajo exhaustivo para localizar las referencias importantes.
BÚSQUEDA RETROSPECTIVA DE REFERENCIAS
06Martin111-130.indd 124
12/5/08 14:45:43
Cómo averiguar qué se ha hecho
125
"BÚSQUEDA" PROSPECTIVA DE REFERENCIAS
Si quiere ser meticuloso en su búsqueda bibliográfica, puede hacerla de modo que incluya investigaciones antiguas y modernas. Por ejemplo, si encuentra un artículo básico que es de hace varios años y quiere encontrar otros recientes que hagan referencia al mismo, puede recurrir al índice de citas de ciencias sociales (Social Sciences Citation Index, SSCI), una base de datos publicada trimestralmente y compilada cada año por el Instituto para la Información Científica. Abarca cerca de 1400 publicaciones de casi todas las disciplinas de las ciencias sociales. El SSCI ahora se presenta en formato electrónico e impreso. En cualquier caso, tiene un artículo esencial y quiere encontrar todos los artículos publicados a partir de la fecha de la cita. Para la búsqueda de un ensayo, deberá consultar todos los volúmenes anuales publicados desde que salió el artículo clave. En cada volumen aparecerá este artículo seguido por todos los otros artículos que lo citen. Si realiza una búsqueda electrónica, podrá buscar en todos los años a la vez y, al igual que en otras bases de datos electrónicas, podrá marcar electrónicamente las citas que le interesen e imprimirlas. En la actualidad, la base de datos electrónica también permite buscar por tema o ubicación del artículo.
CÓMO RECICLARSE USTED MISMO Si quiere, hasta puede reciclarse usted mismo: encuentre los artículos citados en el artículo original y luego haga una búsqueda retrospectiva con las referencias de cada artículo nuevo. Quizá quiera aprovechar algunas de esas referencias nuevas, usarlas como referencias clave y repetir el proceso, que puede continuar hasta que considere que ha cubierto todas las referencias importantes. SOLICITUDES DE SEPARATAS
Por una atención profesional de los científicos, es posible obtener gratuitamente algunos artículos de revistas especializadas. Cuando los autores publican sus artículos, encargan 100 o más separatas. Si un autor todavía tiene separatas, le mandará una, siempre que se lo pida de manera educada. La forma acostumbrada es enviar una tarjeta diciendo: “Me gustaría mucho recibir una separata de su artículo titulado _________, que apareció en _______.” O
06Martin111-130.indd 125
12/5/08 14:45:43
126
Capítulo seis
bien, podría enviarle un mensaje por correo electrónico. Si sabe dónde trabaja el investigador, podría localizar su dirección electrónica. Por ejemplo, si el autor es catedrático, vaya a uno de los servicios de búsqueda que listan las universidades, encuentre la página en internet de la universidad correspondiente, entre en la página del departamento de psicología o el directorio de la universidad y ahí verá direcciones de correo electrónico útiles. Si tiene un interés general en el campo de investigación, en sus comunicaciones con el autor, podría pedirle otros artículos que traten sobre el mismo tema. Asegúrese de incluir su dirección. El autor le enviará una copia gratuita como una atención. En algunos casos, si tiene el artículo en forma electrónica se lo enviaría como documento adjunto. Que no le dé pena enviar estas solicitudes de separatas. Muchos investigadores jóvenes que procuran familiarizarse con la investigación de un campo en particular, pero que no tienen los recursos para comprar sus propias revistas, las envían, y a la mayoría de los autores les parece un halago, más que un fastidio. INVESTIGACIÓN ACTUAL
El Intercambio de Información sobre Ciencia del Instituto Smithsoniano (Smithsonian Science Information Exchange) ofrece una manera de saber qué ocurre con la investigación actual. Este archivo contiene los registros de más de 14 000 proyectos en todos los ámbitos de las ciencias del comportamiento. Todos estos proyectos reciben el apoyo de instituciones como la Fundación Nacional de las Ciencias (National Science Foundation). Cada lista contiene una descripción de 200 palabras del trabajo en marcha. Puede pedir un paquete que contenga las listas de campos temáticos generales como “insomnio” o “terapia conductual para alcohólicos”. Por este servicio se cobra una cuota que depende del número de las listas. La desventaja del sistema es el costo y el hecho de que sólo aparecen las investigaciones financiadas. Sin embargo, es uno de los pocos medios para obtener información sobre las investigaciones en marcha.
■ Fuentes informales REUNIONES PROFESIONALES
Como dijimos, para estar completamente al tanto de las investigaciones de un campo en particular, debe familiarizarse con las fuentes informales de comunicación. Entre 15 y 18 meses antes de una publicación, muchos especialistas presentan su estudio en una reunión profesional en la forma de una ponencia. De hecho, la quinta parte de los artículos publicados en las principales revistas de psicología se basan en artículos presentados antes en una convención de la APA (Garvey y Griffith, 1971). Cada año, la APA patrocina una reunión nacional y seis convenciones regionales. Además, otros grupos que no pertenecen a la asociación, como la Sociedad Psiconómica, la Sociedad Psicométrica y la Asociación para la Ciencia de la Psicología, patrocinan estas reuniones.
06Martin111-130.indd 126
12/5/08 14:45:44
Cómo averiguar qué se ha hecho
127
Sobra decir que uno no puede ir a todas las reuniones o convenciones de su campo. Por eso, como dijimos, después de las reuniones se publican las ponencias leídas en las sesiones, en un documento llamado actas que se consiguen en casi todas las bibliotecas. Además, justo antes de las reuniones, los miembros de estas organizaciones reciben los programas de las convenciones. Quizá pueda buscar a los miembros del departamento de psicología de su escuela que pertenezcan a estas organizaciones y conseguir los programas. Si uno de estos documentos atañe a su interés, simplemente envíele al autor una solicitud de una separata. De todas maneras entenderá mejor una ponencia si la lee que si la escucha. La verdadera razón para asistir a estas convenciones, además de participar en actividades hedonistas superfluas,7 es hablar con otros investigadores que estén haciendo algún trabajo en el campo de su interés. Si no están muy a la defensiva, quizá pueda averiguar qué piensan hacer en el futuro cercano. De esta manera, puede completar la información faltante entre el “inicio del trabajo” y el “ensayo en la convención” de la figura 6-1. Por cierto, si se entera de algo en una de estas discusiones que quisiera citar en un artículo, asegúrese de escribirlo, anotar la fecha y obtener el permiso de la persona para utilizarlo. A partir de ese momento, podrá citar la fuente en un artículo como comunicación personal. GRUPOS DE INVESTIGACIÓN
Ya que sepa quiénes investigan en un campo que le interese, tal vez descubra que han establecido un medio informal de mantenerse informados entre sí. En algunos casos, se tratará de un grupo cuyos miembros se intercambian pruebas de impresión de artículos y ponencias recién terminadas o, incluso, en fase de borradores. En la actualidad, internet ofrece un medio para que estén en contacto los miembros de estos grupos. En algunos casos, la intención es la distribución de los ensayos. En otros, los miembros del grupo analizan sus investigaciones por correo electrónico o en salones de charlas. En ocasiones, tales grupos aceptan a quienes estén interesados en unirse a las discusiones. Otros grupos son más restrictivos y se participa por invitación. Una vez que haya establecido un interés en un área de investigación particular, procure estar al tanto de los grupos, porque ofrecen una forma valiosa de mantenerse informado acerca de las investigaciones más recientes. CLAUSTRO DE CATEDRÁTICOS
No pase por alto una fuente muy útil de ayuda informal en su búsqueda de bibliografía: el claustro de profesores del departamento de psicología de su universidad. A veces los estudiantes se muestran reacios a acercarse a los profesores e investigadores, ya sea que imaginen que estarán muy ocupados para ayudarlos o incluso que piensen que hacen trampa si les piden ayuda. Pero la mayoría no sólo estarán dispuestos a ayudar, sino que se sentirán halagados de que se les pregunte. Esta ayuda es también parte de la enseñanza, tanto como 7
¡Se divierten!
06Martin111-130.indd 127
12/5/08 14:45:44
128
Capítulo seis
impartir clases a un grupo. Los verdaderos investigadores recurren a todas las fuentes que encuentren para adelantar su investigación. La ciencia es un esfuerzo de equipo cuya meta es la acumulación de conocimientos, no una lucha entre investigadores o entre un estudiante y el maestro. Así que inténtelo. Se sorprenderá no sólo por la disposición de sus profesores, sino también de todo lo que saben. Aunque el registro escrito de nuestra ciencia se mantiene por medio de fuentes formales, las informales también dan un servicio vital a la ciencia. Ofrecen un foro para decir cosas absurdas pero creativas. Sus colegas informales quizá sonrían con discreción y le indiquen en qué se equivocó. Sus colegas formales están obligados a reírse a carcajadas y decirle al mundo a los cuatro vientos cuál fue su error. Si sólo contáramos con las fuentes formales, pocos habríamos tenido el valor de avanzar en la ciencia a saltos y brincos y daríamos pasos pequeños y conservadores. El valor y las refutaciones cordiales que brindan los contactos informales son importantes cuando amoldamos nuestras ideas a una forma adecuada para la bibliografía formal.
EN CONCLUSIÓN…
Mi intención es que el análisis de la búsqueda bibliográfica sea lo más completo posible. Espero que, con ello, no haya hecho parecer el proceso más complejo de lo que es. Muchos investigadores noveles consideran que buscar bibliografía requiere de alguna especie de poder místico y años de experiencia. Sin embargo, si sigue los pasos simples señalados en este capítulo, descubrirá que realizar una búsqueda bibliográfica completa puede ser una experiencia sencilla y satisfactoria.
■ Resumen Es necesario emprender una búsqueda bibliográfica para descubrir si su idea para un experimento ya ha sido investigada, para determinar si se han realizado experimentos semejantes y para ver qué lugar ocupa su experimento en el conjunto de los conocimientos científicos. Para hacer esta búsqueda de manera eficiente, debe entender los canales de comunicación
06Martin111-130.indd 128
12/5/08 14:45:45
Cómo averiguar qué se ha hecho
129
de la comunidad científica y el desfase propio de las diversas fuentes de información. Por lo regular, es más provechoso empezar la búsqueda en libros que sean pertinentes para su campo de interés. En estos libros se describe la investigación desde el inicio de la psicología hasta, aproximadamente, 13 años antes de las investigaciones actuales. Posteriormente, puede recurrir a reseñas de artículos, que lo acercan cinco a ocho años a la investigación actual. Los artículos de revistas especializadas formarán la columna de la búsqueda bibliográfica. Las actas de las reuniones y los informes técnicos pueden ser una fuente importante de información, particularmente en los campos de aplicación. Además, se localizan artículos relevantes, libros y capítulos de libros por medio de términos descriptores o por nombre de autor en el sistema de búsqueda electrónica de PsycINFO. También es posible hacer una búsqueda retrospectiva de las referencias de artículos de revistas recientes. El Índice de Citas de Ciencias Sociales también permite hacer una búsqueda prospectiva de las referencias, porque determina qué artículos han citado un artículo anterior en particular. Las fuentes informales, como las ponencias leídas en reuniones profesionales, comunicaciones personales, pruebas de artículos inéditos e incluso el contacto con profesores e investigadores son una forma valiosa de informarse sobre las investigaciones actuales y futuras.
06Martin111-130.indd 129
12/5/08 14:45:45
130
06Martin111-130.indd 130
Capítulo seis
12/5/08 14:45:46
7
Cómo decidir qué variables manipular y medir Creemos que un concepto no tiene más significado que el que se desprende de la operación que lo fundamenta. W. R. GARNER, H. W. HAKE Y C. W. ERIKSEN (1956)
A
prendimos sobre varios tipos de investigación en el capítulo 1, analizamos un modelo experimental general en el capítulo 2, vimos cómo obtener una idea para un experimento en el capítulo 3 y nos ocupamos de la ética en los capítulos 4 y 5. En el capítulo 6 quizá aprendió más de lo quería saber acerca de búsquedas bibliográficas. Ahora es tiempo de ponernos a trabajar y hacer lo que se supone que hacen los psicólogos experimentales: experimentos. En este capítulo consideramos dos decisiones que deben tomarse al planificar un experimento psicológico, la elección de las variables independiente y dependiente.
■ Elección de una variable independiente Según lo que estudiamos en el capítulo 2, la variable independiente es la que el experimentador manipula. El propósito de todo experimento es descubrir el efecto de la variable independiente en el comportamiento, por ello escogerla es casi la decisión más importante. A primera vista la decisión debería ser sencilla, y en algunos experimentos lo es. Por ejemplo, si quiere saber si la gente presiona más rápido un botón en reacción a una luz que viene acompañada de un tono de advertencia, la variable independiente es obvia: la presencia o la ausencia del sonido. Sin embargo, si quiere saber si los niños son más agresivos después de exponerlos a programas de televisión violentos en comparación con los programas no violentos, la variable independiente (violencia) va a ser difícil de definir. ¿Qué constituye la violencia en la televisión? ¿El partido de futbol del lunes por la noche es violencia? ¿Es violenta la caricatura de El Correcaminos? ¿Son violentos los videos de música de rap? No habría un acuerdo universal sobre la definición de programas de televisión violentos. 131
07Martin131-147.indd 131
8/5/08 17:20:34
132
Capítulo siete
LA DEFINICIÓN DE LA VARIABLE INDEPENDIENTE
El problema radica en la diferencia de precisión entre cómo un lego definiría un término y lo que el psicólogo experimental aceptaría. Los psicólogos experimentales deben dar las definiciones operacionales de las variables dependientes e independientes, lo cual significa que tienen que especificar las operaciones que deben realizarse a fin de establecer la variable independiente tal como ellos lo hicieron. La definición operacional es como una receta, sólo que los procedimientos y los ingredientes son para hacer una variable, en lugar de un pastel.
GORRA DOCTOR MÁSCARA ESCALPELO
BATA
GUANTES DEFINICIONES OPERACIONALES
En el experimento de la violencia en televisión que analizamos en el capítulo 2, la definición operacional especificaría los pasos para determinar si ciertos programas son violentos. Por ejemplo, antes de definirlos operacionalmente como violentos, se operacionalizaría el concepto de programa de televisión violento si al mostrar cada programa a un grupo de 100 personas seleccionadas al azar, 75% de ellas lo calificara como violento. Una alternativa sería diseñar una lista de cotejo: ¿Hubo contacto físico que lastimó a alguien? ¿Se cometió un acto ilegal? ¿Alguna persona humilló a otra? Podría especificar que para ser considerado violento, cada programa debería tener al menos dos respuestas positivas de cada 10. Este procedimiento especificaría con exactitud las operaciones que debe cumplir todo investigador para llegar a su definición operacional de programas de televisión violentos. Los psicólogos investigadores tienen más dificultades que los físicos para ponerse de acuerdo sobre las definiciones operacionales.1 Galileo no tuvo que ponerse a pensar en una definición de masa para determinar si los objetos con masas diferentes caen a la misma velocidad en el vacío. En cambio, muchas cuestiones psicológicas importantes requieren una definición operacional compleja. ¿Los individuos que tienen una madre más afectuosa tie1
Un físico fue el primero en utilizar el término definición operacional. Sin embargo, en las ciencias físicas, las definiciones operacionales son tan aceptadas que esos expertos pasan mucho menos tiempo que los científicos del comportamiento dándole vueltas a las definiciones.
07Martin131-147.indd 132
8/5/08 17:20:35
Cómo decidir qué variables manipular y medir
133
OBJETOS CON MASAS IGUALES… nen parejas matrimoniales más prósperas? ¿Los estudiantes aprenden más con los profesores populares? ¿El estado de ánimo de un trabajador afecta la producción? ¿La ansiedad causa depresión? Antes de realizar un experimento para responder estas preguntas, es necesario que cuente con las definiciones operacionales de los términos afectuoso, próspero, aprender, popular, estado de ánimo, producción, ansiedad y depresión. Trate de crear las definiciones operacionales de estos términos: verá en seguida a qué dificultades se enfrenta el psicólogo investigador. En la mayoría de los conceptos de los que quiera definiciones operacionales, su búsqueda bibliográfica le mostrará que otros investigadores ya se han enfrentado a ese reto. Lo bueno es que si lo hicieron bien, le ahorrarán mucho trabajo. Lo malo es que si no está de acuerdo con esas definiciones, le va a costar que los demás acepten su nueva definición. La ciencia es conservadora, no le gustan los cambios rápidos. Imagínese el caos que habría si cada investigador insistiera en una definición operacional diferente de todo concepto importante. El conjunto de los conocimientos científicos sería una torre de Babel, en la que todos hablarían un idioma diferente. Cuando un concepto tiene una definición operacional, la definición adquiere un estatus, y a veces es difícil convencer a los demás de que se necesita una nueva. Mientras defina los términos de su experimento, haga una búsqueda bibliográfica para averiguar cómo se han definido los conceptos que investiga. ELECCIÓN DEL RANGO DE SU VARIABLE INDEPENDIENTE
Después de definir la variable independiente, le queda escoger su rango. El rango es la diferencia entre el nivel más alto y el más bajo de la variable elegida. Por ejemplo, supongamos que decidimos definir los programas de televisión violentos valiéndonos de un grupo de 100
07Martin131-147.indd 133
8/5/08 17:20:36
134
Capítulo siete
personas que clasifiquen cada programa como violento o no violento. Podríamos fijar dos niveles de violencia en nuestro experimento: los programas clasificados como violentos por toda la gente y los que nadie considera violentos. Estos dos niveles de la variable independiente nos darían el rango más amplio posible. Por otro lado, podríamos definir como programas violentos los calificados así por más de 50% de las personas y como no violentos los clasificados por menos de 50% de la gente como violentos. Por supuesto, estos niveles establecerían un rango mucho menor. ¿Cómo determinamos cuál debe ser el rango? Desafortunadamente, no puedo darle una regla concreta para tomar esta decisión, pues es tanto un arte como una ciencia. Sin embargo, a continuación describo algunas directrices útiles. Sea realista
Primero, trate de determinar un rango que sea realista, en el sentido de que tenga niveles semejantes a los encontrados en la situación a la que generalizará. Evite los “martillazos” que se producen al establecer los niveles de la variable independiente en tales extremos que se tenga la certeza de encontrar una diferencia de comportamiento. Parte de la investigación médica inicial sobre la mariguana estaba plagada de martillazos. En algunos casos, los experimentadores les dieron a los ratones el equivalente a que un ser humano fumara un camión de mariguana por día. Obtuvieron resultados sorprendentes pero poco realistas. Seleccione un rango que muestre el efecto
Dentro de los límites realistas, debería tener un rango que fuera lo suficientemente amplio como para mostrar un efecto de la variable independiente en la dependiente, en caso de que existiera alguno. Por ejemplo, si está interesado en el efecto que la temperatura de un cuarto tiene en la destreza manual en una tarea de clasificación y escoge una temperatura de 23°C y otra de 25°C,2 podría equivocarse y concluir que la temperatura no tuvo ningún efecto en la destreza manual. Las situaciones experimentales del mundo real3 requieren que se preste atención especial a escoger un rango amplio, debido a que el experimentador no siempre tiene un control total de los niveles de la variable independiente. Aunque elija un nivel aproximado, el real puede variar entre los ensayos. Por ejemplo, en el experimento sobre el ritmo de la clase que describí en el capítulo 2, traté de variar el ritmo hablando a velocidad lenta, media y rápida. Los niveles que trataba de lograr eran de 100, 125 y 150 sílabas por minuto. Pero como no soy una máquina que pueda ajustarse a una velocidad en particular, estaba sujeto a generar cierta variabilidad alrededor de los niveles deseados. Para determinar mi velocidad real, grabamos las clases y contamos el número de sílabas por segundo. Por fortuna, la clase más 2
Para aquellos que se niegan a convertirse a la conversión de la temperatura en grados Celsius, 73°F y 77°F, respectivamente. 3 Con el término mundo real me refiero a los experimentos fuera del laboratorio, diseñados para responder a problemas aplicados, y no quiero insinuar que la mayoría de la gente de las universidades sea irreal. La gente que vive en torres de marfil no debería meter autogoles.
07Martin131-147.indd 134
8/5/08 17:20:36
Cómo decidir qué variables manipular y medir
135
rápida a una velocidad lenta fue todavía más lenta que la clase más lenta a una velocidad media, así que no se traslaparon los niveles. Sin embargo, si hubiera escogido un rango menor, hubiera tenido menos oportunidad de producir estas diferencias confiables entre los niveles de la variable independiente. Por lo tanto, en ciertos experimentos fuera del laboratorio, debe hacer que el rango sea lo bastante amplio para que las diferencias en los niveles de la variable independiente no queden ocultas por la variabilidad no controlada de esa variable. Realice un experimento piloto
Determinar el mejor rango para un experimento es, en cierto grado, conjetura. En algunos casos, durante su búsqueda bibliográfica encontrará experimentos que utilizan la misma variable independiente que usted quiere usar, lo que le dará una idea acerca del rango apropiado. Sin embargo, si su experimento es original y nadie ha utilizado una variable independiente similar a la suya, le convendría realizar un experimento piloto.4 Tal experimento es una versión a pequeña escala del experimento que tiene planeado y en el que puede resolver casi todos los problemas antes de iniciar. Ya que no tiene que hacer públicos los resultados de este experimento, puede romper algunas reglas de la experimentación. Por ejemplo, puede engañar a sus amigos para que participen e incluso usted mismo puede servir como participante. Incluso puede cambiar los niveles de la variable independiente a la mitad del ensayo, detener el experimento o hacer nada más una parte, depenPARTICIPANTE EN UN diendo de lo que aprenda conforme avanza. EXPERIMENTO PILOTO En un experimento piloto, a veces se descubre que lo que parecía bien en el papel, no funciona. Por ejemplo, una vez descubrí durante un experimento piloto que el estudio supuestamente simple que había diseñado requería cuando menos tres experimentadores para manejar el equipo. El experimento piloto también sirve para determinar si los niveles de su variable independiente son lo que esperaba, ya que parecen realistas durante la fase de planeación pero no siempre lo son en el laboratorio. Al realizar un ensayo de prueba, puede cambiar un rango inapropiado de la variable independiente antes de dedicar mucho tiempo y esfuerzo al experimento. El experimento piloto es una guía para experimentos futuros, que lleva al experimentador a través de aguas inexploradas. Aunque la búsqueda de la bibliografía y realizar experimentos pilotos pueden darle una idea del rango apropiado de su variable independiente, todavía tiene que hacer sus mejores conjeturas. Si atinó, puede decir que se lo debe a su buen juicio. Si está equivocado, culpe a su mala suerte. 4
Me imagino que el término piloto se utiliza en este caso en el sentido de “guiar a través de los lugares desconocidos”, así como cuando el piloto de un barco lo conduce a través de aguas desconocidas.
07Martin131-147.indd 135
8/5/08 17:20:37
136
Capítulo siete
■ Elección de una variable dependiente Como vimos en el capítulo 2, la variable dependiente es una medida de un comportamiento. Vimos que podíamos escoger un número infinito de comportamientos para medirlos. Por lo tanto, al seleccionar nuestra variable dependiente, debemos decidir qué mediremos. MÁS SOBRE DEFINICIONES OPERACIONALES
Regresemos a nuestra pregunta sobre si los programas de televisión violentos causan un cambio en la agresividad de los niños. En este experimento, está claro que queremos medir la agresividad, pero necesitamos la definición operacional de la agresión de manera que determinemos si el comportamiento de un niño cambia después de ver los programas de televisión violentos. Una manera de desarrollar una definición operacional en este ejemplo sería reunir un grupo de jueces que viera una película de cada niño mientras juega y luego calificara su agresividad con una escala de siete puntos. O podríamos contarles a los niños historias de otros niños en situaciones frustrantes y preguntarles qué harían ellos en su lugar. Entonces, tomaríamos el número de respuestas de “ataque directo” como medida de la agresividad. Otra alternativa sería observar a los niños cuando juegan con un surtido de juguetes que clasificamos como agresivos (pistolas, tanques, cuchillos) o no agresivos (camiones, herramientas, muñecas). Entonces, mediríamos el tiempo que cada niño jugó con cada juguete. De seguro se le ocurren muchos comportamientos que indiquen la agresividad de los niños.
¿JUGUETE NO AGRESIVO?
07Martin131-147.indd 136
8/5/08 17:20:37
Cómo decidir qué variables manipular y medir
137
A veces, incluso cuando una variable dependiente parece simple, pueden surgir problemas al establecer la definición operacional. Por ejemplo, dos investigadores querían determinar si las cifras de homicidios sustentarían diversos pronósticos de la teoría de la psicología evolutiva (Daly y Wilson, 1988). La teoría predice que es menos probable que la gente mate a parientes con quienes viven que a otros con los que vivan pero con los que no guarden ninguna relación genética. Parecería una pura cuestión de contar los homicidios de una muestra en particular. Pero ¿qué es con exactitud un homicidio? En varios países las estadísticas de homicidios incluyen todos los “asesinatos, intentos de asesinato y homicidios no premeditados”. ¿Deberían ser contabilizados estos dos últimos para el estudio? En la mayoría de los homicidios no premeditados, tales como un homicidio imprudencial en un accidente de tránsito, no existe la intención de matar. ¿La intención es importante? Si es importante, quizá los intentos de asesinato deberían tomarse como asesinatos. ¿Contamos como asesinatos nada más los casos juzgados? De inicio, este criterio parecería apropiado; no quisiéramos incluir un caso si el acusado fuera inocente. Pero tomar las condenas podría ser incluso más engañoso. En una muestra de homicidios cometidos en Detroit en un año, 20 hombres fueron condenados por matar a su esposa y nueve mujeres por matar a su marido. Uno concluiría que los hombres mataron más, pero, en realidad, las mujeres mataron con más frecuencia, sólo que consiguieron que se suspendiera su caso sin juicio 75% de las veces, mientras que apenas 20% de los esposos homicidas fueron eximidos de juicio. Como explicaron los investigadores, basarse sólo en las condenas diría más del comportamiento de los fiscales que del comportamiento de los delincuentes. Desafortunadamente, como lo muestra este ejemplo, establecer la definición operacional de las variables dependientes no es más fácil que con las variables independientes. Con las variables dependientes tenemos que enfocarnos en determinar una definición operacional y también tenemos que saber si la medición es confiable y válida.
CONFIABILIDAD Y VALIDEZ
Un instrumento de medición es del todo confiable si conseguimos exactamente el mismo resultado cuando repetimos la medición varias veces en condiciones equivalentes. Cuanto más varíen los resultados, menos confiable es el instrumento de medición. Por ejemplo, una regla de hule no sería muy confiable. Podría medir una mesa 45 centímetros la primera vez y 78 centímetros la siguiente. Para descubrir qué tan confiable es la regla tendríamos que medir muchos objetos cuando menos dos veces y ver cómo se correlacionan los resultados (véase el capítulo 1). Si el resultado de la primera medición es similar al de la segunda, la correlación es alta y suponemos que el instrumento es confiable. Por el contrario, si hay poca correlación sabemos que no es confiable. Volviendo a nuestro ejemplo de los programas de televisión violentos, podríamos mostrar a otro grupo de jueces cierto conjunto de videos del comportamiento de los niños y
07Martin131-147.indd 137
8/5/08 17:20:38
138
Capítulo siete
comparar las calificaciones de agresividad que hayan dado los dos grupos. Si dan calificaciones semejantes, nos sentiríamos más seguros de que las calificaciones son confiables. Determinar la confiabilidad es más importante cuando la variable dependiente es la calificación de un instrumento como una prueba de logro, aptitud o rasgos de personalidad. La confiabilidad de una prueba estandarizada ya ha sido verificada y en el manual de la prueba se da un valor estadístico que indica dicha confiabilidad. En cambio, si utiliza una prueba o un cuestionario que haya elaborado, tendría que determinar su confiabilidad usted mismo, para lo cual hay varios métodos. El más obvio es la confiabilidad test-retest, en que la misma prueba se repite después con el mismo grupo. La confiabilidad se determina calculando el coeficiente de correlación con dos calificaciones de cada examinado (véase el apéndice A). Sin embargo, la calificación de la segunda prueba aplicada a la misma persona puede resultar contaminada por la prueba anterior. Lo que sucede entre la aplicación de las pruebas también influye en las calificaciones. Por esto, una segunda forma de determinar la confiabilidad es el método de formas alternativas. Se construye una segunda prueba con reactivos similares a los de la primera prueba y se aplica a las mismas personas. Como antes, se correlacionan las dos calificaciones de cada persona. La tercera manera de establecer la confiabilidad es la técnica de la división por mitades, en la cual una sola prueba se divide estadísticamente en mitades (por ejemplo, se separan preguntas pares de nones) y se correlacionan las calificaciones. En la tabla 7-1 se enuncian algunas ventajas y desventajas de aplicar cada técnica para establecer la confiabilidad. Si la variable dependiente no es la calificación de la prueba, quizá no haya que determinar de manera formal su confiabilidad. No obstante, debe ser consciente de la necesidad de tener una medición confiable.
■ TABLA 7-1 Ventajas y desventajas de tres métodos para determinar la confiabilidad de la prueba Método de confiabilidad
Ventajas
Desventajas
Test-retest
Utiliza los mismos reactivos de la prueba. Es fácil de realizar.
La primera prueba puede contaminar la segunda. Los examinados pueden cambiar con el tiempo.
Formas alternativas
Minimiza la contaminación por repetición de los reactivos. Pasa poco tiempo antes de volver a realizar la prueba. Es útil para los diseños pretestpostest.
El uso de diferentes reactivos disminuye la confiabilidad.
División por mitades
Minimiza la contaminación por repetición de los reactivos. No transcurre el tiempo. Se realiza en una sentada.
El uso de diferentes reactivos disminuye la confiabilidad. Requiere de una prueba larga.
07Martin131-147.indd 138
8/5/08 17:20:38
Cómo decidir qué variables manipular y medir
139
La validez5 se refiere a confirmar si medimos en efecto lo que queremos medir. Supongamos que tenemos una regla de madera que indica que mide 30 centímetros, pero que en realidad es de 60 centímetros porque cada marca de un centímetro en realidad mide dos. En este caso, podríamos medir muchísimas veces una mesa y la regla siempre indicaría 30 centímetros. Tenemos un instrumento de medición confiable, pero, por supuesto, la medición está equivocada ya que diríamos que medimos centímetros cuando en realidad no es así. Por tanto, necesitamos saber si nuestros instrumentos de medición son válidos, esto es, si miden en las mismas unidades que un dispositivo de medición estándar que es válido. Por ejemplo, al establecer nuestra definición operacional de agresividad, supongamos que decidimos medir el tiempo que cada niño pasa jugando con juguetes agresivos y con juguetes no agresivos. Si nuestro cronómetro funciona bien, la medición sería confiable, ya que obtendríamos la misma lectura al volver a tomar el tiempo del comportamiento. Sin embargo, nos dirían que nuestra medida de la agresividad no es válida. Afirmarían que los niños tienden a jugar con los juguetes que ya saben usar. Como han visto usar pistolas, tanques y cuchillos en los programas de televisión, escogen estos juguetes para jugar. También cabría decir que los niños pueden utilizar los camiones, herramientas y muñecas de maneras agresivas y no agresivas. Para convencer a estos críticos de que su medición es válida, debe compararla con algún patrón en el que todos estén de acuerdo como una medición válida de la agresividad. Si su instrumento de medición concuerda con el patrón, entonces se dice que es un instrumento válido. Cuando la calificación de una prueba se emplea como variable dependiente, a veces es necesario establecer de manera formal la validez y confiabilidad de dicha prueba. La forma más débil de validación es la validez aparente, lo que significa que, en la superficie, parece que la prueba sí mide lo que se supone debe medir. Desde luego, es tan subjetiva que pocos científicos la utilizan; todos los investigadores piensan que sus pruebas tienen mucha validez aparente. Un procedimiento de validación más formal y defendible es establecer la validez de contenido. Aquí, el contenido del tema cubierto por la prueba se analiza con cuidado y en detalle. Luego, se diseña la prueba de manera que contenga una muestra representativa de preguntas de cada área de contenido identificada. Por ejemplo, si fuera a aplicar una prueba que supuestamente evalúa la comprensión que alcanza el lector de este capítulo, tendría que probar los grandes conceptos que abordamos, tales como validez del contenido. La tercera forma de validación consiste en establecer la validez predictiva para determinar si la prueba predice bien ciertos criterios específicos. Por ejemplo, las pruebas de los estudiantes de preparatoria para entrar a la universidad son valiosos porque predicen el criterio de su promedio de calificaciones en la universidad (GPA, grade point average). Una correlación alta entre la calificación de la prueba y el promedio indicaría una validez alta. La validez concurrente se establece comparando la calificación de la prueba con un patrón, pero en este caso las dos mediciones se realizan al mismo tiempo. Por ejemplo, si tratáramos de elaborar un cuestionario que los padres de los niños que ven televisión contestarían para medir la agresividad de los niños, determinaríamos su validez concurrente correlacionando la calificación 5
Para un análisis más detallado de los tipos de validez, véase el capítulo 2.
07Martin131-147.indd 139
8/5/08 17:20:38
140
Capítulo siete
del cuestionario de cada niño con una calificación numérica del profesor sobre la agresividad. Como puede ver, medir la validez de una variable dependiente es incluso más difícil que medir su confiabilidad. Con frecuencia, lo mejor que podemos hacer es afirmar que nuestras mediciones son válidas desde una posición lógica defendible. VARIABLES DEPENDIENTES OBSERVABLES DIRECTAMENTE
Cuanto más se acerque a observar directamente un comportamiento, menos debate habrá sobre la medición. Pero si lo que le interesa es el funcionamiento de la mente humana, hay que aceptar que todas las mediciones dependientes son, en cierto sentido, indirectas. Por ejemplo, supongamos que está interesado en la memoria y quiere comparar dos maneras de presentar un material que tiene que ser memorizado. Después de una semana, quiere medir cuanto recuerdan sus participantes. ¿Cómo debe medir? Es fácil; sólo pregúnteles lo que recuerdan. Pero digamos que no recuerdan nada del material en ninguna de las dos presentaciones. ¿Concluiría que no recuerdan nada? Quizá podría aplicarles mejor una prueba de reconocimiento y determinar con qué precisión distinguen el material nuevo del material presentado con anterioridad. O quizá haría que se aprendieran otra vez el material y mediría el tiempo ahorrado en el segundo aprendizaje. Estos métodos le darían diferentes respuestas a su pregunta sobre cuánto recuerda la gente. Espero que vea en este ejemplo que las variables dependientes, incluso las que al principio parece que se observan directamente, sólo guardan una vinculación indirecta con el comportamiento en el que está interesado. Variables dependientes únicas
Supongamos que quiere saber si la gente responde con más rapidez a la luz brillante que a la luz tenue para apretar un botón. Pondríamos en marcha un reloj cuando la luz se prendiera y lo detendríamos cuando el participante apretara el botón. Se entiende que medimos nada más una característica de la respuesta. Pudimos haber escogido cualquier otra característica, por ejemplo, cómo presiona la gente el botón. ¿El individuo mueve el dedo desde
CREO QUE ENTENDIÓ MAL LAS INSTRUCCIONES
07Martin131-147.indd 140
8/5/08 17:20:38
Cómo decidir qué variables manipular y medir
141
un lado del botón en un ensayo y desde arriba en el siguiente? ¿En una serie se equivoca de botón en el primer ensayo? ¿En otra, presiona ligeramente el botón y luego lo aplasta? A partir de estas respuestas diversas escogemos medir una única característica de la respuesta: el tiempo desde que se prende la luz hasta que se presiona el botón. En otras palabras, seleccionamos una variable dependiente única. Toda variable dependiente única que escogemos puede o no ser la medición apropiada. Por ejemplo, supongamos que les pedimos a los participantes que tracen con un lápiz el contorno de una estrella que ven reflejada en un espejo. Como en el espejo se invierte todo, a la mayoría le cuesta trabajo esta tarea en los primeros ensayos. Si queremos medir el mejoramiento desde el ensayo 1 hasta el ensayo 10, ¿qué variable dependiente mostraría este avance? La variable dependiente estándar utilizada en estos experimentos es el número de veces que el trazado del participante cruza el contorno de la estrella. En la figura 7-1 se muestran los trazos de dos individuos ficticios, a los cuales tuvimos el ingenio de llamar participante 1 y participante 2. En el ensayo 1, el participante 1 cruzó el contorno 20 veces y en el ensayo 10, seis veces. Para este individuo, la variable dependiente indica el mejora-
Participante 1
Ensayo 1
Ensayo 10 Participante 2
Ensayo 1 FIGURA 7-1
07Martin131-147.indd 141
Ensayo 10
Desempeño del trazado de una estrella de dos participantes en los ensayos 1 y 10.
8/5/08 17:20:39
142
Capítulo siete
miento esperado en el desempeño. Pero observe al participante 2, este individuo cruzó el contorno 14 veces en cada ensayo. Nuestra variable independiente indica que el participante 2 no mejoró en su desempeño del trazado con espejo. ¿Lo convence esta conclusión? El problema básico es que incluso al utilizar una variable dependiente observable de manera directa, como el número de cruces, debemos preocuparnos por la validez. El comportamiento de cruzar el contorno es sólo una medición posible del desempeño del trazado con el espejo. ¿Es una medición válida? Otras variables dependientes podrían reflejar mejor este desempeño. Como alternativa, podríamos haber medido la longitud total del trazo y determinar qué porcentaje cae dentro de los bordes de la estrella. O podríamos haber medido en cada ensayo el área entre el contorno y el trazo, o tomar el tiempo que tardaron los participantes en descubrir si estaban trazando la estrella con más rapidez en el décimo ensayo. Variables dependientes múltiples
Una manera de mejorar las oportunidades que tenemos de escoger los comportamientos apropiados y medirlos en nuestro experimento es mediante el uso de variables dependientes múltiples. De hecho, en algunos campos de la psicología experimental se considera inapropiado informar de una sola variable dependiente. Por ejemplo, en muchas investigaciones se toma el tiempo de reacción de la elección como la medición dependiente. Es el tiempo que toma dar una de varias respuestas cuando se presenta uno de varios estímulos. Como es natural, si la gente quiere cometer pocos errores, va a responder con lentitud. Si está dispuesta a que su respuesta sea menos precisa, podría ir algo más de prisa. Este equilibrio entre rapidez y precisión impone que los dos factores se informen como variables dependientes. Si nos interesa el nivel de desempeño, una medición es inútil sin la otra. Por esta razón, las mejores publicaciones no aceptan artículos que indiquen sólo la velocidad o sólo la precisión de la respuesta del tiempo de reacción de la elección. Variables dependientes compuestas
Aunque es buena idea informar tantos aspectos del comportamiento como sea posible, esta práctica dificulta la interpretación de los resultados. Supongamos que tenemos cuatro variables dependientes: una medición muestra una mejora en las condiciones, dos permanecen iguales y una disminuye ligeramente. Para decir algo acerca del cambio general del comportamiento, necesitamos una manera de combinar nuestras variables dependientes únicas en una variable dependiente compuesta que nos dará alguna indicación sobre el desempeño total. En varios campos de la psicología experimental, como las pruebas de inteligencia, se usan variables dependientes compuestas. La Escala de Inteligencia de Adultos de Wechsler, que es una prueba general del CI, es un ejemplo de variable dependiente compuesta. El CI está compuesto por dos escalas, una verbal y una de desempeño. La calificación de cada escala está compuesta por pruebas parciales. Por ejemplo, la calificación verbal se saca de las calificaciones en las siguientes pruebas: información general, retención de dígitos, vocabulario, aritmética, comprensión y semejanzas. Las pruebas de inteligencia se basan en la idea de
07Martin131-147.indd 142
8/5/08 17:20:40
Cómo decidir qué variables manipular y medir
143
que es útil tener una sola medición que caracterice la inteligencia. Por supuesto, no todos los psicólogos están de acuerdo en que un solo número representa bien la inteligencia, pero el uso de variables dependientes compuestas es tradicional en la psicología de las pruebas.6 El segundo tipo de variable dependiente compuesta combina varios casos de una medición única. Los casos se toman en distintos momentos o condiciones. El porcentaje de ahorro es una de tales variables dependientes empleadas en la investigación de la memoria. Supongamos, por ejemplo, que un grupo de gente aprendió a montar en bicicleta cuando era joven y que desde entonces no se volvió a subir a ninguna hasta después de los 40 años. Podríamos hacer que reaprendieran a montar bicicleta; practicarían varias veces hasta que se sostuvieran un minuto sin tocar el piso. Supongamos que requieren siete ensayos para lograrlo. Podríamos comparar esta cifra con el número de ensayos que tarda en mantener el equilibrio durante un minuto otro grupo de 40 años, que nunca aprendió a andar en bicicleta. Digamos que a este segundo grupo le tomó un promedio de 14 ensayos. Entonces, calcularíamos el porcentaje de ensayos ahorrados por haber aprendido a montar bicicleta en edad temprana. % ahorrado ⫽
Número de ensayos para aprender – Número de ensayos para reaprender Número de ensayos para aprender
× 100
En nuestro ejemplo: % ahorrado ⫽
14 – 7 × 100 ⫽ 50% 14
Mediante este tipo de variable dependiente compuesta, es posible indicar con una sola cifra el efecto de un cambio causado por la variable independiente (experiencia pasada de montar bicicleta). Tal vez no le quede claro todavía cómo se calculen estas variables dependientes compuestas o por qué son las mediciones apropiadas, pero se familiarizará con muchas si hace investigación en ciertos campos de la psicología. Quizás algún día usted mismo prepare sus propias variables compuestas. VARIABLES DEPENDIENTES INDIRECTAS
A veces, es imposible observar directamente un comportamiento. Sin embargo, sabemos que la prueba científica ROE (repetible, observable, examinable) exige que el comportamiento que estudiamos sea observable por todos. ¿Cómo, entonces, se realiza la investigación científica en áreas como la emoción, el aprendizaje o la inteligencia? Necesitamos una variable indirecta que cambie junto con el comportamiento interno que nos interesa. 6
Stephen Jay Gould (1981) en su libro This Mismeasure of Man adoptó la posición radical de que tomar un solo número, el CI, como medida de lo que vale una persona, ha sido el mayor abuso de la ciencia en el siglo xx. Pensaba que esta variable dependiente compuesta había sido aprovechada para mantener las jerarquías y distinciones sociales.
07Martin131-147.indd 143
8/5/08 17:20:40
144
Capítulo siete
Mediciones fisiológicas
Las variables indirectas más populares son las mediciones fisiológicas, que se basan en la idea de que si el comportamiento es un evento privado, por ejemplo una emoción, quizá la fisiología del organismo cambie al mismo tiempo. Ya que la tecnología moderna permite observar los cambios fisiológicos del organismo, los experimentadores infieren de estos cambios los eventos privados. Por supuesto, cuando utilizamos mediciones fisiológicas para inferir estados internos, suponemos que un esquema fisiológico único refleja con precisión un estado interno. Por ejemplo, el polígrafo o detector de mentiras mide cuatro procesos fisiológicos: ritmo respiratorio, ritmo cardiaco, tensión arterial y respuesta galvánica de la piel.7 Con estas mediciones, el operador determina si una persona dice la verdad. Muchos dudan sobre si la premisa en que se funda el uso de las mediciones fisiológicas es correcta. Por esta razón, los resultados del detector de mentiras se admiten en los tribunales sólo si las partes demandante y demandada están de acuerdo con su uso. Hace poco, una ley federal estadounidense restringió las pruebas del detector de mentiras para la investigación de antecedentes laborales. Otras mediciones fisiológicas se popularizan cuando investigadores sostienen que dan una indicación de algún estado emocional. Luego, estas mediciones se descartan, cuando otros investigadores demuestran que el mismo cambio fisiológico puede ocurrir con otro estado interno. Por ejemplo, un investigador llamado Hess señaló en alguna ocasión que el diámetro de la pupila de una persona aumenta cuando tiene pensamientos placenteros y disminuye en caso contrario. Durante un tiempo, los magnates de la publicidad quedaron tan impresionados que usaban las respuestas pupilares para escoger anuncios para revistas. Desde entonces, otros investigadores han descubierto que el diámetro de la pupila indica más bien cuánta información procesa una persona, y no tanto qué emoción siente (Johnson, 1971). Los pupilometristas ya no son tan bien recibidos en las agencias publicitarias más lujosas. Recientemente, algunos investigadores informaron que las características de la voz de una persona sirven para hacer una “evaluación del estrés”. Al grabar una voz en un casete, reproducirla lentificada y medir ciertos aspectos de las frecuencias vocales, estos investigadores pensaron que podían decir cuándo la gente estaba bajo una gran tensión, como lo estaría si mintiera. Las investigaciones no han justificado estas afirmaciones, por lo que ahora esta medición carece de valor para muchos especialistas. En las últimas décadas, uno de los campos de mayor y más rápido crecimiento en la psicología ha sido la imagenología cerebral, con la cual se mide la actividad del cerebro conforme realiza varias tareas. En los primeros trabajos se medía la actividad general de las ondas cerebrales en un electroencefalograma (EEG). Pero este patrón general de la actividad no sirve más que para el nivel de excitación general de una persona. Hace poco, investiga7
En caso de que no esté familiarizado con el término respuesta galvánica de la piel, sepa que no es una erupción causada por manejar muchos botes de basura. Es una medida de la capacidad de la piel de transmitir una corriente eléctrica pequeña. El razonamiento, dicho sin exactitudes técnicas, es así: como la piel húmeda transporta mejor la corriente eléctrica que la seca, una persona que está “preocupada” tiene una respuesta galvánica diferente de quien está “tranquilo y relajado”.
07Martin131-147.indd 144
8/5/08 17:20:40
Cómo decidir qué variables manipular y medir
¡HO
145
LA!
ALGUNOS ESTÍMULOS CONLLEVAN UNA ONDA CEREBRAL CARACTERÍSTICA
dores presentaron repetidas veces un estímulo y promediaron la actividad de las ondas cerebrales desde el momento de la presentación del estímulo o desde la respuesta. Es posible analizar los pequeños cambios en las crestas y valles de estos potenciales relacionados con los eventos (PRE), para determinar lo que ocurre cuando se modifica el estímulo presentado o se altera el procesamiento cognoscitivo que requiere la tarea. Más recientemente, investigadores aplicaron técnicas fisiológicas para trazar un mapa de la actividad de varias regiones cerebrales durante la realización de algunas tareas. La técnica más utilizada es la imagen de resonancia magnética funcional (IRMf). Los investigadores la emplean para medir la irrigación sanguínea a las regiones cerebrales. La idea general es que cuando una zona del cerebro procesa información, la actividad mental activa más neuronas locales. Cuando se activan las neuronas, necesitan un suministro mayor de sangre. De modo que si los investigadores piden a los participantes que realicen una tarea y luego encuentran que se incrementa la irrigación sanguínea en una zona particular del cerebro, pueden inferir que dicha zona es la que realiza la tarea. Por ejemplo, supongamos que mido el flujo sanguíneo mediante IRMf y le pido que mire cierta palabra. Digamos que en una condición nada más le pediría que leyera la palabra. En otra, le pediría que realizara un juicio acerca del significado de la misma. En cada condición sacaría una imagen del flujo de la sangre en diversas zonas cerebrales; al restar la primera imagen de la segunda, deduciría qué zonas se encargan de procesar el significado de la palabra. Para estos estudios, además de IRMf los investigadores se valen de la tomografía axial por computadora (barridos de TAC), tomografía por emisión de positrones y EEG de múltiples sitios. Con estas técnicas ha habido grandes progresos en la comprensión del funcionamiento del cerebro humano.8 Conforme aprendemos más acerca de lo que nos dicen estas medidas, se incrementará el uso de las mediciones fisiológicas. 8
Hay investigadores que aconsejan cautela para aceptar sin más la imagenología cerebral como medio de entender el cerebro (Van Orden y Paap, 1997).
07Martin131-147.indd 145
8/5/08 17:20:40
146
Capítulo siete
Mediciones del comportamiento
Algunas mediciones del comportamiento pueden emplearse como variables dependientes indirectas. Como con las mediciones fisiológicas, los cambios en la manera en que una persona realiza una tarea pueden reflejar su estado interno. Las mediciones indirectas del comportamiento son particularmente importantes en campos de la psicología cognoscitiva. Los expertos se interesan en determinar lo que pasa en la “caja negra” de la mente humana durante tareas cognoscitivas como leer o resolver problemas. Como lo único que tienen para trabajar son insumos (estímulos) y productos (respuestas) de la caja, necesitan concebir métodos ingeniosos de deducir lo que ocurre dentro. Por ejemplo, supongamos que quieren saber cuánta información se procesa para terminar una tarea. Si damos por sentado que el cerebro tiene recursos limitados para procesar la información cognoscitiva, una manera de determinar cuánta se procesa es medir qué tanto le toma responder: cuanta más información se procesa, más tiempo tarda en responder. Pero el tiempo de respuesta da una medición única de toda la tarea y dice poco del procesamiento requerido para las tareas secundarias, como la codificación o selección de la respuesta. La metodología de la tarea doble ofrece un método indirecto de determinar las necesidades de procesamiento de una tarea mientras se realiza. En este caso, mientras se realiza la tarea principal (la tarea primaria), se presenta otra (la tarea secundaria). A los participantes se les instruye para que realicen la tarea principal lo mejor que puedan y que dediquen a realizar la secundaria los recursos que queden. Entonces, mediríamos el desempeño de la segunda tarea y deduciríamos cuáles fueron las necesidades de procesamiento de la primera tarea. Cuanto mejor sea el desempeño de la segunda tarea, menos recursos se requieren para la primera. Por ejemplo, la primera tarea podría ser leer una oración. Durante la lectura, se hacen sonar tonos y se instruye a los participantes para que opriman un botón en cuanto escuchen los tonos. Podríamos inferir que entre más lenta sea la respuesta ante el tono, más procesamiento requeriría la lectura de la oración en ese momento. Con varios ensayos, sería posible graficar los tiempos de respuesta ante los tonos en distintos momentos durante la lectura de la oración y, por tanto, trazar un perfil de los recursos de procesamiento requeridos por la oración (Martin y Kelly, 1974). Como con todas las mediciones indirectas del comportamiento, esta medición es tan buena como sus premisas. En el caso de la metodología de la tarea doble, la premisa principal es que un fondo único de recursos de procesamiento proporciona los recursos para todas las tareas cognoscitivas. Algunos investigadores han objetado esta premisa (Navon y Gopher, 1979; Wickens, 1984). De hecho, tenemos pruebas de la existencia de múltiples fondos de recursos y de que el fondo empleado depende de si la tareas es visual o auditiva, espacial o verbal, etc. (Wickens, 1984). Aun cuando algunas premisas de la metodología de la tarea doble han sido puestas en tela de juicio, la técnica todavía da una buena medida de los recursos de procesamiento en muchos casos y es muy utilizada. Otras mediciones indirectas del comportamiento no necesariamente realizan las mismas suposiciones como la metodología de la tarea doble. En general, cuanto más indirecta sea la medición, más elaboradas tendrán que ser las premisas y menos seguros estaremos de nues-
07Martin131-147.indd 146
8/5/08 17:20:41
Cómo decidir qué variables manipular y medir
147
tras deducciones. La ventaja de las mediciones indirectas es que ofrecen un medio de investigar preguntas experimentales para las que no tenemos mediciones directas. En tanto que estemos conscientes de las premisas que sentamos cuando usamos mediciones indirectas, pueden ser una herramienta valiosa para tener una idea de la naturaleza de eventos que no son observables.
■ Resumen Al escoger una variable independiente para su experimento, debe especificar primero una definición operacional de esa variable con el fin de que otros experimentadores puedan realizar las mismas operaciones cuando lleven a cabo experimentos similares. Es también importante escoger los niveles de su variable independiente de manera que el rango sea lo bastante grande para mostrar el efecto experimental aunque tan pequeño que sea realista. A veces, un ensayo o experimento piloto sirve para tomar esta decisión. La variable dependiente también debe ser definida operacionalmente. Además, debemos ser capaces de mostrar que la variable dependiente es confiable y válida. Es confiable si se obtiene el mismo resultado cada vez que se toma la medida. Al utilizar puntuaciones en pruebas como variable dependiente, la confiabilidad de dichas pruebas se determina de diversas maneras: test-retest, forma alternativa y división por mitades. La variable dependiente es válida si concuerda con un patrón aceptado por todos. Hay varias formas de establecer la validez de la prueba: validez aparente, validez de contenido, validez predictiva y validez concurrente. Las variables dependientes observables de manera directa son más fáciles de medir, pero a veces es difícil decidir qué variable dependiente única utilizar. Así, algunos campos de la investigación exigen que se informe sobre variables dependientes múltiples o que las variables dependientes se combinen para formar una variable dependiente compuesta. Las variables dependientes indirectas se emplean cuando el comportamiento que nos interesa no es observable de manera abierta. Las mediciones fisiológicas dan indicaciones de los estados internos, pero son difíciles de interpretar. Las mediciones del comportamiento, tales como la metodología de la tarea doble, también ofrecen la posibilidad de determinar el estado interno del participante.
07Martin131-147.indd 147
8/5/08 17:20:41
8
Diseños entre sujetos e intrasujeto
Se dice que hay dos tipos de personas: las que constantemente dividen al mundo en dos clases y las que no. ROBERT BENCHLEY
A
hora ya tiene una variable independiente para manipular y otra dependiente para medir. Si todos fueran exactamente iguales, sólo haría falta una persona para realizar su experimento. Por fortuna, en aras de tener un mundo interesante, aunque lamentablemente para su tarea de investigador, no todos somos iguales. Como somos diferentes, tendrá que utilizar una muestra de participantes e intentar minimizar la variabilidad mediante trucos estadísticos, como sacar promedios. Sin embargo, tiene opciones sobre qué hacer con la variabilidad causada por las diferencias de los participantes, dependiendo de cómo decida asignarlos a los niveles de su variable independiente. Hay dos maneras básicas de asignar a los participantes: puede exponer a cada individuo a sólo un nivel de la variable independiente o a todos los niveles. El primer método recibe el nombre de diseño entre sujetos ya que la variable se manipula entre al menos dos sujetos o participantes;1 el segundo se denomina diseño intrasujeto, porque la variable independiente es manipulada con un solo sujeto o participante.2 En la tabla 8-1 se presentan los dos métodos de la asignación de participantes para un experimento con dos niveles de una variable independiente. En el diseño superior, dos conjuntos diferentes de 10 personas son 1 Hasta este punto, he seguido la guía de estilo de la Asociación Estadounidense de Psicología (APA) para referirme a quienes participan en experimentos como participantes en lugar de sujetos. Sin embargo, en este capítulo la terminología se tuerce un poco, ya que los nombres de los diseños y las pruebas estadísticas no han cambiado, para corresponder al manual de la APA. Por tanto, continuaré refiriéndome a los diseños y a las pruebas con los nombres aceptados (por ejemplo, “intrasujeto”), pero llamaré participantes a los sujetos con quienes se experimenta. Espero que pronto podamos llegar a un acuerdo sobre una terminología común. 2 Otros han llamado a los diseños intrasujeto diseños de tratamiento por sujeto o diseños de mediciones repetidas sobre los mismos sujetos. Los diseños entre sujetos también se denominan grupos separados o diseños de grupos independientes.
148
08Martin148-170.indd 148
16/4/08 22:45:05
Diseños entre sujetos e intrasujeto
149
■ TABLA 8-1 La asignación de participantes en un experimento entre sujetos y en un experimento intrasujeto Entre sujetos
Variable independiente Nivel 1 Participante 1 Participante 2 · · · Participante 10
Intrasujeto
Nivel 2 Participante 11 Participante 12 · · · Participante 20
Variable independiente Nivel 1 Participante 1 Participante 2 · · · Participante 10
Nivel 2 Participante 1 Participante 2 · · · Participante 10
asignados a cada nivel; en el diseño inferior, cada uno de los diez participantes es asignado a los dos niveles. Supongamos que queremos hacer un experimento para determinar si tomar descansos mejora el aprovechamiento de los estudiantes. En una condición tenemos alumnos que estudian cierto material continuamente durante dos horas. En la otra, los alumnos estudian dos horas pero toman un descanso de cinco minutos cada media hora. En cualquiera de los casos, hacen un examen al final del periodo de estudio. Podríamos utilizar un diseño entre
NIVEL #1
NIVEL #2
DISEÑO ENTRE SUJETOS: CADA PARTICIPANTE ES EXPUESTO A UN SOLO NIVEL
08Martin148-170.indd 149
16/4/08 22:45:06
150
Capítulo ocho
sujetos y formar grupos de estudiantes seleccionados al azar, asignados a cada condición de estudio. O bien, podríamos utilizar un diseño intrasujeto, en el cual el mismo grupo de alumnos estudiaría diferentes materiales en cada una de las condiciones de estudio. Si empleamos diferentes personas en los dos grupos, tenemos no sólo las diferencias de los individuos de los grupos, sino también una posible diferencia entre los grupos como tales. Por otro lado, si recurrimos a los mismos estudiantes, sabemos que aunque haya diferencias individuales en cuanto a las capacidades de los estudiantes, no debe darse una diferencia en general en la habilidad entre los grupos porque son las mismas personas. Sin embargo, debido a que se usan materiales de estudio distintos para las dos condiciones, puede haber diferencias en la dificultad de los materiales. Veamos con detalle algunas de las ventajas y desventajas de los dos tipos de diseños.
■ Experimentos entre sujetos VENTAJAS
La principal ventaja de los diseños entre sujetos es que la exposición a un nivel de la variable independiente no puede contaminar el comportamiento del participante que esté en otros niveles. Como cada participante está expuesto a un solo nivel, uno puede ignorar los demás niveles para ese participante. Al principio del libro, describí un experimento que realicé junto con mis estudiantes para probar el heurístico de la disponibilidad haciendo que los participantes mencionaran tres ventajas, tres desventajas o tres ventajas y tres desventajas de la generación de energía nuclear. Posteriormente, los participantes indicaron en una escala qué tanto apoyaban la energía nuclear. En este experimento se utilizó un diseño entre sujetos, de manera que cada participante indicó tres ventajas o tres desventajas o tres ventajas y tres desventajas. ¿Qué hubiera pasado si hubiéramos empleado un diseño intrasujeto? En este caso, cada participante hubiera mencionado tres ventajas y hubiera dado una calificación y después hubiera señalado tres desventajas y una calificación y, por último, hubiera listado tres ventajas y tres desventajas y dado una calificación. ¿Este diseño hubiera logrado lo que queríamos? Recuerde que la razón de esperar que el efecto de la calificación fuera afectada por el hecho de mencionar las ventajas o desventajas era que, al hacer la lista, dichas razones fueran más asequibles, que el participante las tuviera más presentes. Pero una vez que se dispone de una ventaja, ¿qué tanto tarda en ya no estar tan disponible? En este caso, si tuviéramos que utilizar un diseño intrasujeto, una vez que los participantes hubieran sido expuestos a las dos primeras condiciones, o sea mencionar las tres ventajas y luego las tres desventajas, ya hubieran estado expuestos a la tercera condición: anotar las dos. Como es lógico, para muchos experimentos, como el recién descrito, es imposible utilizar un diseño intrasujeto ya que no podemos revertir los efectos de la exposición anterior a los otros niveles de la variable independiente. En otros casos, puede ser lógicamente posible revertir esta exposición, pero, como veremos, el diseño puede complicarse. Al final, a veces ni siquiera con los diseños más elaborados tenemos la seguridad de contrarrestar del todo
08Martin148-170.indd 150
16/4/08 22:45:07
Diseños entre sujetos e intrasujeto
151
los efectos de la exposición anterior. En ocasiones se prefieren los diseños entre sujetos, porque no tienen este problema. Realizar experimentos entre sujetos también tiene ventajas prácticas. Ya que cada participante se desempeña en un solo nivel de la variable independiente en un experimento entre sujetos, podemos reunir más datos a este nivel durante una sesión experimental única. Como es probable que los participantes se cansen o pierdan interés en lo que están haciendo, es mejor que el tiempo total de experimentación de cada participante sea breve. También puede evitar que regresen para otras sesiones, lo que es una ventaja ya que el número de individuos que terminan un experimento se reduce drásticamente con cada nueva sesión. DESVENTAJAS
La mayor desventaja de un diseño entre sujetos es que los grupos asignados a cada nivel de la variable independiente pueden no ser equivalentes en algunas dimensiones, lo que podría alterar el comportamiento que se mide. Siempre que se forman grupos con personas diferentes, cabe la posibilidad de que difieran los grupos. Por ejemplo, en el experimento que pregunta si mirar programas de televisión violentos genera agresividad en los niños, puede ser que los niños asignados al grupo con programas violentos provengan de familias disfuncionales con una historia de abuso, mientras que los niños del grupo con programas no violentos sean de familias saludables. Pero si los niños son asignados al azar a los grupos, es improbable que eso ocurra. Cuando se usan diseños entre sujetos, los participantes son asignados al azar. Esta asignación puede llevarse a cabo de diversas formas, como sacar un papel de un sombrero, lanzar monedas o seleccionar a partir de tablas de números aleatorios, como la del apéndice C. Los novatos en la experimentación psicológica o en estadística suelen desconfiar de los procesos aleatorios. Piensan que la aleatorización equivale a ser desordenado o descuidado y que, incluso en grupos grandes, es probable que haya diferencias considerables en el comportamiento. Los investigadores confían más en la asignación al azar de los participantes debido a la experiencia y un mejor entendimiento del muestreo estadístico. Además, aunque la aleatoriedad pueda parecer el extremo del desorden, cuando menos no está sesgada, porque le permite asignar la variabilidad del participante a grupos de una manera uniforme. En los grupos grandes, la probabilidad de que difieran en cualquier dimensión del comportamiento es pequeña. Además, las pruebas estadísticas que efectúa cuando analiza sus datos toman en consideración las diferencias potenciales debidas a la asignación al azar. Asimismo, la asignación al azar de los participantes en los experimentos entre sujetos es eficaz para eliminar el sesgo potencial entre los grupos.
■ Experimentos intrasujeto Aunque los diseños intrasujeto no son de ninguna manera la mejor opción para todos los experimentos, ofrecen numerosas ventajas.
08Martin148-170.indd 151
16/4/08 22:45:07
152
Capítulo ocho
VENTAJAS PRÁCTICAS
Una ventaja práctica obvia de un experimento así se presenta en la tabla 8-1: se necesitan pocos participantes. Si se requieren N participantes3 para obtener un número adecuado de puntos de datos en cualquier nivel de un experimento intrasujeto, entonces en el caso de los experimentos entre sujetos se requieren N × 2 participantes para un experimento de dos niveles, N × 3 para un experimento de tres niveles y así sucesivamente. En muchos casos, al incrementar el número de participantes también aumenta el tiempo total requerido para un experimento. Por ejemplo, si su experimento requiere que primero entrene a los individuos para que lleven a cabo una tarea básica antes de exponerlos a la manipulación experimental, en un experimento entre sujetos de dos niveles tendrá que entrenar al doble de sujetos que en un experimento intrasujeto. Supongamos que quiere saber si pedirle a la gente que recuerde cierto número de palabras interferirá con su habilidad para realizar una tarea de seguimiento compleja cuyo aprendizaje toma varias horas. Si añade niveles a su variable independiente (número de palabras presentadas que hay que memorizar), no agrega más tiempo de entrenamiento previo en un experimento intrasujeto. Sin embargo, en un experimento entre sujetos, incrementa el número de participantes y, por lo tanto, el tiempo de entrenamiento previo. Es común hacer varios ensayos al inicio de un experimento, práctica que también aumenta el tiempo del experimento conforme incluya más participantes. Estos ensayos de práctica están diseñados para minimizar los efectos del calentamiento, es decir, la mejoría rápida que acontece durante los primeros ensayos conforme los participantes entran en un estado de preparación general. Además de la inconveniencia de utilizar muchos participantes en un experimento entre sujetos, a veces no se cuenta con muchos inscritos, sobre todo si tienen que cumplir determinados requerimientos. Por ejemplo, quizá busque pilotos, conductores de autos de carrera o bailarinas de ballet para ciertos experimentos. O quizá necesite participantes con cierto trastorno, como los psicóticos, daltónicos o zurdos.4 En tales casos, puede que no encuentre las suficientes personas que cumplan con estos requisitos para aplicar un diseño entre sujetos y tenga que apoyarse en un experimento intrasujeto. VENTAJAS ESTADÍSTICAS
Además de su mayor eficacia, los diseños intrasujeto son preferibles por razones estadísticas. En el capítulo 12 veremos brevemente la estadística, pero aquí se mencionan algunos conceptos. En una prueba estadística inferencial, los experimentadores tratan de inferir si las diferencias encontradas entre las muestras de los datos reunidos en los niveles de la variable independiente se deben a diferencias reales en el comportamiento de una población más grande o al azar. Para hacer esta inferencia, los experimentadores, en la mayoría de estas 3 4
Utilizo N aquí para referirme a cualquier número de participantes, como 10 o 20, en un experimento en particular. Es broma, queridos zurdos (¡qué chiste tan siniestro!).
08Martin148-170.indd 152
16/4/08 22:45:07
Diseños entre sujetos e intrasujeto
153
■ TABLA 8-2 Tiempos individuales para correr 100 metros planos de dos grupos de hombres escogidos al azar Hombres con calzado de tacos de 7 mm Mike Bob Homer George Harry Gordon John Bill Randy Tim
Tiempo (en segundos) 11.7 18.2 12.2 15.4 15.8 13.2 13.7 19.1 12.9 16.0
Hombres con calzado de tacos de 13 mm Don Héctor Ron Tom Steve Dale Pete Juan Dan Paul
Tiempo (en segundos) 15.7 13.4 18.0 12.8 13.6 19.0 16.2 11.9 14.6 18.0
Media para 7 mm = 14.82 segundos. Media para 13 mm = 15.32 segundos. Diferencia = 0.5 segundos.
pruebas, comparan las diferencias entre los desempeños promedio en los dos niveles con un cálculo de la variabilidad del desempeño dentro de cada nivel. Con una prueba estadística, es más probable que el experimentador afirme que la diferencia es real, si la diferencia entre los niveles es muy grande o si la variabilidad estimada dentro de los niveles es pequeña. Un ejemplo le demostrará cuán lógico es este principio. Supongamos que un fabricante de calzado para pista quiere saber si vende a velocistas de 100 metros planos de un equipo de pista varonil calzado con tacos de 7 o de 13 mm. Para probar este calzado, el fabricante podría escoger al azar en un campo universitario 10 hombres para que usen un tipo de calzado y otros 10 para el otro calzado. Probablemente varíen los tiempos de los dos grupos: desde un ex cantinero de 38 años y 127 kilos a un apoyador de futbol americano de 19 años y 53 kilos. Sus calificaciones podrían ser como las de la tabla 8-2. Si calculara la media5 de los dos grupos, encontraría que quienes utilizan tacos de 7 mm tienen una velocidad promedio 0.5 segundos menor que los que usan tacos de 13 mm. Al revisar los tiempos de los dos grupos, ¿esta diferencia le convencería de que los tacos cortos son mejores para correr los 100 metros planos? Ahora supongamos que el fabricante decidió hacer otro experimento, esta vez con miembros del equipo de pista que asigna al azar a los grupos de 7 y 13 mm. Digamos que sus calificaciones son como se muestra en la tabla 8-3. El promedio es otra vez de 0.5 segundos de ventaja para los corredores que utilizan tacos cortos. ¿Estos datos le convencerían de que los tacos cortos son mejores? Sin duda, quizá estaría más dispuesto a aceptar la diferencia en el segundo experimento como real. Debido a que las calificaciones del segundo experimento son menos variables, tal 5
Como analizaremos con más detalle en el capítulo 12 y en el apéndice A, la media es la suma de las calificaciones individuales divididas entre el número de calificaciones sumadas.
08Martin148-170.indd 153
16/4/08 22:45:07
154
Capítulo ocho
■ TABLA 8-3 Tiempos individuales para correr 100 metros planos de dos grupos de miembros del equipo de pista seleccionados al azar Hombres con calzado de tacos de 7 mm Art Simon Nick Daryl Ralph Will Reuben Ed Fred Wayne
Tiempo (en segundos) 10.6 10.3 10.3 10.2 10.4 10.0 10.2 10.1 10.3 10.4
Hombres con calzado de tacos de 13 mm Rob Frank Walt Gary Ken Bryan Dick Stan Rich Mark
Tiempo (en segundos) 10.8 11.0 10.8 10.6 10.8 10.7 10.6 10.7 10.7 11.1
Media para 7 mm = 10.28 segundos. Media para 13 mm = 10.78 segundos. Diferencia = 0.5 segundos.
vez considere que es menos probable que la diferencia encontrada aquí se deba por completo a una variación al azar. La mayor parte de la variabilidad de las calificaciones del primer experimento se debió aparentemente a grandes diferencias individuales en la habilidad de los hombres para correr los 100 metros planos, independientemente del calzado. En el segundo experimento, se eliminó gran parte de la variabilidad debida a las diferencias individuales entre los corredores porque se eligió a los corredores con más similitudes. ¿Cómo podríamos hacer que los participantes de los dos grupos tuvieran más similitudes? Utilizando los mismos participantes, ¡primero unos, luego otros! Debe estar en posición de ver por qué un experimento intrasujeto con un solo grupo produce una ventaja estadística: es la forma definitiva de minimizar las diferencias individuales entre los participantes. Al utilizar un diseño intrasujeto, es más probable que usted y las pruebas estadísticas se convenzan de que cualquier diferencia en el desempeño encontrada entre los niveles de la variable independiente es una diferencia real.6 DESVENTAJAS
Si hay tantas ventajas prácticas y estadísticas en utilizar diseños intrasujeto, ¿entonces para qué aplicamos diseños entre sujetos? Desafortunadamente, el diseño intrasujeto también lleva desventajas graves. Aunque su postura es debatible, algunos experimentadores se atreverían a decir que por estas desventajas, los experimentos intrasujeto son casi inservibles: “llegará el día en que ningún psicólogo respetable utilice un diseño intrasujeto, excepto para 6
Si prefiere el rigor estadístico, tal vez lo haga temblar y palidecer mi intento de hacer digerible la lógica de la estadística inferencial. Seré un poco más riguroso en el capítulo 12, aunque no tanto.
08Martin148-170.indd 154
16/4/08 22:45:07
Diseños entre sujetos e intrasujeto
155
un propósito especial, sin combinarlo con un diseño [entre sujetos] de grupos separados” (Poulton, 1973). Como dijimos al hablar de las ventajas de los diseños entre sujetos, el problema básico es que una vez que se expone a los participantes a un nivel de la variable independiente, no hay manera de que vuelvan a ser los individuos que eran antes. La exposición hace algo irreversible, de manera que ya no podemos tratarlos como puros, inmaculados e ingenuos. Algunos investigadores se refieren a la manera en que las exposiciones previas han afectado a los participantes como efectos de acarreo. Debido a que la forma en que los participantes cambian también depende del orden en que son expuestos a los niveles de la variable independiente, hay quienes denominan a estas diferencias efectos del orden. Se produce un efecto del orden en un experimento intrasujeto cuando el comportamiento resultante de un nivel de la variable independiente depende del orden en el que fue presentado. El aprendizaje es uno de los casos en que el efecto del orden incide en el comportamiento. En otras palabras, lo que los participantes aprendieron durante la exposición al nivel previo de la variable independiente puede afectar el comportamiento más adelante. Por ejemplo, supongamos que queremos saber si le toma a alguien más tiempo escribir en un teclado QWERTY 7 común o en un teclado recién diseñado en el que las letras más utilizadas se localizan en el lugar donde se colocan los dedos en posición de descanso. Nosotros decidimos que debido a que hay grandes diferencias individuales en la habilidad de mecanografiar, emplearemos un diseño intrasujeto. Tomamos 10 personas y averiguamos cuántas horas necesitan practicar para escribir 30 palabras por minuto en el teclado común. Luego las cambiamos al nuevo teclado y vemos cuántas horas deben practicar para escribir 30 palabras por minuto. Al final descubrimos que se tardan un promedio de 45 horas de práctica para alcanzar un criterio de buen desempeño en un teclado tradicional, pero sólo dos horas en uno nuevo. ¿Podemos concluir que emplear el nuevo teclado es mucho más fácil? Obviamente, no. Durante la primera parte del experimento, además de aprender la habilidad específica utilizando un teclado QWERTY, los participantes también adquirieron una habilidad general de digitación. La habilidad general se confunde con la específica. Cuando trabajaron en el nuevo teclado, su habilidad general de mecanografía se encontraba en un nivel más alto que cuando empezaron el experimento. Debido a que se empleó el teclado tradicional en primer orden, a los participantes les tomó más tiempo dominarlo porque aprendían tanto la habilidad mecanográfica general como la habilidad específica. Debido a que el nuevo teclado siempre se utilizó en segundo lugar, les tomó menos tiempo aprender porque ya habían aprendido la habilidad general. El aprendizaje es uno de los efectos del orden más comunes. Sin embargo, hay otros, como la fatiga y la maduración. Cada vez que el efecto cambia sistemáticamente durante el curso de un experimento, necesitamos estar conscientes de que es posible que se presenten efectos del orden y que debemos ser cuidadosos para evitar que nuestra variable independiente se confunda con el orden. 7
El teclado tradicional QWERTY recibe este nombre debido a que son las letras que están al principio del renglón superior del teclado común. En estudios se ha demostrado que hay mejores formas de disponer las teclas y que harían que la escritura fuera más rápida. Sin embargo, el esfuerzo requerido para volver a capacitar a tantas personas que ya conocen el sistema QWERTY hace improbable que se adopte un sistema nuevo.
08Martin148-170.indd 155
16/4/08 22:45:08
156
Capítulo ocho
Debido a esta desventaja de los diseños intrasujeto, se emplean con menos frecuencia en unos campos de la psicología que en otros. Por ejemplo, los investigadores que estudian el aprendizaje, la memoria y ciertos campos de la psicología social, como la formación de actitudes, esperan hacer cambios de larga duración en sus participantes en virtud de la propia naturaleza del experimento. No le puede decir a alguien: “Bueno, ahora olvide la lista de palabras que le pedí que memorizara en 10 ensayos” ni: “Recupere la actitud que tenía antes de leer esa propaganda.” En estos campos de investigación, los participantes se contaminarían sin remedio por la exposición a un nivel particular de la variable independiente. Sin embargo, hay otros campos de investigación en los que la exposición previa tiene pocos efectos. Por ejemplo, si estudiáramos la habilidad de la gente para distinguir la intensidad de dos sonidos, sería improbable que la exposición a una intensidad en particular afectara su habilidad para distinguir una segunda diferencia. En este caso, y para muchos otros experimentos de sensación y percepción, resultan apropiados los diseños intrasujeto y se recurre a ellos con frecuencia. CONTRABALANCEO
Una manera de minimizar los efectos del orden (como el aprendizaje) es el contrabalanceo. En esencia, al hacer un contrabalanceo, admitimos que existe la posibilidad de que el efecto del orden genere confusión. También aceptamos que no podemos controlarlo ni descartarlo por asignación aleatoria. Así, tratamos de distribuir de modo uniforme el efecto de confusión en los niveles de la variable independiente. De esta manera, esperamos que el efecto se compense y no sesgue un efecto causado por la variable independiente. Para ilustrar el concepto del contrabalanceo, emplearé las escalas que se muestran en la figura 8-1. Por un momento, pretendamos que somos omnipotentes y que sabemos el tamaño real de los efectos debidos a la variable independiente y a la variable de confusión. Si realizamos un experimento perfecto que presenta dos niveles de nuestra variable independiente, A y B, tendríamos el resultado ilustrado en la gráfica del panel 1 de la figura 8-1. Suponemos que ninguna variable, además de la variable independiente, afecta el resultado. El tamaño del efecto en la variable dependiente es una unidad para el nivel A y tres unidades para el nivel B. Debido a que estas cantidades se pondrán en las escalas, las convertí en pesos. Al colocar los pesos en las escalas del panel 2, vemos que el efecto sin confundir de la variable independiente es 2. Debido a que estamos utilizando un diseño intrasujeto y no podemos presentar ambos niveles de la variable independiente al mismo tiempo, debemos tener varios ensayos. Supongamos que algún efecto de confusión, como el aprendizaje, se incrementa con cada ensayo, como se muestra en el panel 1 de la figura 8-2. Como vemos, en el ensayo 1, el efecto de la variable de confusión sobre la variable dependiente es de una unidad, y en el ensayo 4, es de cuatro unidades. Volvemos a convertir en pesos el tamaño del efecto. Queremos distribuir los pesos de modo que las escalas estén equilibradas, para que no muestren ningún sesgo cuando se agregue la variable independiente. Uno de los esquemas de contrabalanceo más utilizados recibe el nombre de contrabalanceo ABBA. La A y B, como en nuestro ejemplo, representan los dos niveles de cualquier variable independiente, y la secuencia representa cómo se asignan los niveles a los ensayos.
08Martin148-170.indd 156
16/4/08 22:45:08
Diseños entre sujetos e intrasujeto
157
Variable dependiente
Tamaño del efecto
Nivel de la variable independiente Gráfica de la variable independiente
Efecto puro de la variable independiente
FIGURA 8-1 La gráfica del panel 1 muestra el efecto de los dos niveles, A y B, de la variable independiente sobre la variable dependiente. Las escalas del panel 2 indican que el puro efecto sin confundir de la variable independiente es de dos unidades.
Por tanto, el nivel A estaría presente en el ensayo 1, el B en el ensayo 2, el B en el ensayo 3 y el A en el ensayo 4. Cada participante recibe todos los ensayos. El panel 2 de la figura 8-2 ilustra lo que ocurre cuando los pesos de los ensayos 1 y 4 se colocan en el lado A de las escalas y los de los ensayos 2 y 3, en el lado B. Las escalas están equilibradas. Cuando agregamos además los pesos sombreados que representan los efectos de la variable independiente, el efecto combinado neto es dos, el efecto puro original de la variable independiente. Este resultado sin sesgos es lo que tratamos de lograr con todos los esquemas de contrabalanceo.
EL GRAN C.B.
08Martin148-170.indd 157
16/4/08 22:45:08
158
Capítulo ocho
Variable dependiente
Tamaño del efecto
Ensayos Gráfica de una variable de confusión
Variable de confusión contrabalanceada
Efecto combinado de la variable independiente y la variable de confusión
La gráfica del panel 1 muestra el efecto de una variable de confusión lineal en la variable dependiente. Las escalas del panel 2 indican que un orden ABBA de la variable independiente logró contrabalancear la variable de confusión. Cuando los pesos sombreados, que representan los efectos de la variable independiente, se agregan en el panel 3, se encuentra el efecto neto de dos unidades.
FIGURA 8-2
Antes de que quede extasiado por la belleza del contrabalanceo, permítame decirle que los esquemas de contrabalanceo se basan en ciertas premisas, que, cuando no se cumplen, la belleza se torna en monstruosidad. Una premisa del contrabalanceo ABBA es que el efecto de confusión es lineal, es decir, que traza una recta. Para ilustrar lo que ocurre cuando no se produce una recta, debemos regresar a nuestros pesos. Supongamos que el efecto de confusión se parece al que se muestra en el panel 1 de la figura 8-3. De hecho, el aprendizaje es el candidato más probable para generar la confusión y esta curva se asemeja a la mayoría de las curvas de aprendizaje: un incremento inicial muy grande en el desempeño seguido de cambios progresivos más pequeños. Al convertir los pesos y apilarlos de acuerdo con un diseño ABBA, podemos ver
08Martin148-170.indd 158
16/4/08 22:45:09
Diseños entre sujetos e intrasujeto
159
Variable dependiente
Tamaño del efecto
Ensayos Gráfica de una curva de aprendizaje como variable de confusión
Variable de confusión contrabalanceada con ABBA
Efecto combinado de la variable independiente y la variable de confusión
La gráfica del panel 1 muestra los efectos de una curva de aprendizaje como variable de confusión sobre la variable dependiente. Las escalas del panel 2 indican que un orden ABBA no logró contrabalancear la variable de confusión; las escalas tienen un sesgo de tres unidades hacia B. Cuando se agregan los pesos que representan a la variable independiente en el panel 3, el efecto neto de cinco unidades sobreestima en tres unidades el efecto de la variable independiente.
FIGURA 8-3
en el panel 2 que las escalas no están equilibradas, sino que presentan un sesgo de tres unidades hacia el lado B. Cuando se agregan los pesos que representan la variable independiente en el panel 3, el efecto neto es de cinco unidades en lugar de las dos unidades que, con nuestra omnisapiencia, sabíamos que deberían ser. En ciertas condiciones, el contrabalanceo ABBA no corrige una variable de confusión y aun complica el problema. Un ejemplo se muestra en la figura 8-4. El efecto de confusión primero mejora el desempeño, luego lo degrada. Combinar el efecto del aprendizaje con el de la fatiga puede causar tal función. Queda para usted el cálculo de la magnitud del sesgo causado por la variable de confusión desequilibrada.
08Martin148-170.indd 159
16/4/08 22:45:09
Capítulo ocho
Variable dependiente
160
Ensayos
Gráfica de una variable de confusión compleja
La gráfica muestra el efecto de una variable de confusión compleja en una variable dependiente. Tal función podría ser causada por el aprendizaje y la fatiga.
FIGURA 8-4
Hemos visto que el contrabalanceo ABBA puede eliminar los efectos de la variable de confusión en experimentos intrasujeto, pero sólo si el efecto de confusión es lineal. Si el efecto no es lineal, debemos escoger otra técnica de contrabalanceo o incluso otro diseño de experimento entre sujetos. Hay una técnica de contrabalanceo ABBA con que se trata de equilibrar los efectos del orden a la manera intrasujeto: tener a los mismos participantes tanto en el orden AB como en el orden BA. En otras técnicas se toma el orden como una variable entre sujetos contrabalanceándolo en los individuos. En el caso más simple de dos niveles, un grupo de participantes recibiría AB y un segundo grupo, BA. Los datos de “A” de los grupos uno y dos se promediarían, al igual que los datos de “B” de ambos grupos. Si emplea este método, el efecto de confusión no tendría que ser lineal. Sin embargo, todavía supone que el efecto de hacer que B siga a A es sólo el efecto contrario de que A siga a B (Poulton y Freeman, 1966). Esta premisa también se llama de transferencia simétrica.8 Cuando se trasgrede la premisa y se obtiene una transferencia asimétrica en su lugar, este contrabalanceo no es eficaz. Consideremos un experimento en el que se descubre una transferencia asimétrica: el investigador estaba interesado en el efecto del ruido sobre el desempeño complejo (Aldridge, 1978; Poulton, 1979). A los participantes se les entregó una secuencia de tres letras formada por una consonante, una vocal y una consonante (por ejemplo, DOF) para que la recordaran durante 16 segundos. Mientras hacían esta tarea de memoria, también escuchaban una serie 8
También se conoce como transferencia no diferencial.
08Martin148-170.indd 160
16/4/08 22:45:09
Porcentaje de trigramas correctos
Diseños entre sujetos e intrasujeto
161
Silencio
Silencio
Ruido Ruido
Prueba 1
Prueba 2
El efecto del ruido sobre el recuerdo de trigramas. El efecto ilustra la transferencia asimétrica. FUENTE: Adaptado de “Levels of Processing in Speech Perception”, de J. W. Aldridge, 1978, Experimento 4, Journal of Experimental Psychology: Human Perception and Performance, 4, 164-177.
FIGURA 8-5
de letras “B”, una vez por segundo, para detectar las “P” ocasionales. En la condición de ruido, también había un siseo fuerte continuo. Para contrabalancear los efectos del orden, un grupo recibió un bloque de ensayos silenciosos seguidos por un bloque de ensayos con ruido (AB), mientras un segundo grupo recibió el orden inverso (BA). En la figura 8-5 se aprecian los resultados del experimento. Los miembros del grupo expuestos primero a los ensayos silenciosos se desempeñaron bien en el recuerdo de los trigramas. Sin embargo, al ser transferidos a la condición de ruido, su desempeño cayó drásticamente. Los miembros del otro grupo mostraron un mal desempeño con el ruido, como se esperaba. Ahora bien, observe que su desempeño mejoró, pero muy poco, cuando fueron transferidos a una condición de silencio. El tamaño del efecto fue 31 puntos porcentuales para el primer grupo de silencio y 10 puntos porcentuales para el primer grupo de ruido. En el caso de una transferencia simétrica, esperaríamos que el efecto fuera de la misma magnitud. ¿Qué explica este resultado de una transferencia asimétrica? Al parecer, los dos grupos aprendieron a realizar la tarea de diferentes formas. Quizás el grupo de primero silencio aprendió a utilizar un almacenamiento ecoico para retener las palabras. El almacenamiento ecoico es una clase de eco en la cabeza que reverbera de manera automática durante un periodo breve después de que el estímulo auditivo haya desaparecido.9 Pero como en el caso del eco, puede apagarlo un estímulo auditivo fuerte que se produzca a continuación. Aunque la estrategia ecoica funciona bien en la condición silenciosa, es de suponer que el grupo de primero silencio tuvo que cambiar de estrategia cuando se agregó el ruido, para lo cual se valió de un almacenamiento articulatorio. En este caso, se repitieron el trigrama o cuando menos activaron el programa que mueve los músculos que intervienen en la articulación.10 A partir de que se cambió a esta estrategia, su desempeño 9
Almacenamiento ecoico es lo que hace el marido cuando recupera un recuerdo mientras lee el periódico y su esposa le dice: “¿Oíste lo que acabo de decirte?” 10 De hecho, equivale a musitar entre dientes.
08Martin148-170.indd 161
16/4/08 22:45:10
162
Capítulo ocho
cayó. Según parece, los miembros del grupo de primero ruido aprendieron la tarea aplicando la estrategia de la articulación. Cuando cambiaron a silencio, mantuvieron esta estrategia menos eficiente y su desempeño mejoró poco sin el ruido. Aunque esta explicación es especulativa, se justifica en datos con los que no lo voy a molestar. Otro ejemplo servirá para entender la transferencia asimétrica. Supongamos que le interesan los efectos de conducir alcoholizado en el desempeño motor complejo, como conducir un auto de carreras en un videojuego de realidad virtual. Por un lado, tenemos a un grupo que consume el equivalente a tres bebidas alcohólicas durante cada una de las primeras tres sesiones de una hora en la que tienen que conducir el auto. Luego cambian y manejan sobrios el auto durante las tres siguientes sesiones. Para controlar el orden, forma otro grupo con la secuencia inversa: una condición de sobriedad a embriaguez. Espera que los dos grupos tengan pocos puntos en la máquina de video cuando estén bajo el influjo del alcohol. Dependiendo de las condiciones específicas de la carrera, quizá se lleve una sorpresa al descubrir que el desempeño de los miembros del grupo de primero alcohol cayó al cambiar a la condición de sobriedad y que nunca sufrió un efecto del alcohol tan grande como el otro grupo. Tal resultado sería un ejemplo de la transferencia asimétrica debido a un aprendizaje dependiente del estado. Cuando aprendemos una habilidad en un estado en particular (no me refiero al estado de Idaho, sino al de sobriedad o embriaguez), tendemos a desempeñarnos mejor cuando estamos en ese mismo estado. Quizá conozca a alguien que juegue mejor billar después de un par de cervezas: es un aprendizaje dependiente del estado. En nuestro experimento, el aprendizaje dependiente del estado podría causar efectos de transferencia asimétrica similares a los que acabamos de ver. Si se produce tal transferencia asimétrica, ninguna forma de contrabalanceo podrá salvar un diseño intrasujeto. Al agregar más niveles a la variable independiente, se incrementa la complejidad de un procedimiento de contrabalanceo completo. En un diseño de contrabalanceo completo, cada nivel tiene que ocurrir igual número de veces y también seguir a cada nivel igual número de veces. En la tabla 8-4 se muestran diseños de contrabalanceo completos para experimentos de dos, tres y cuatro niveles. Como se aprecia, alcanzar un contrabalanceo completo llega a ser una tarea inmensa si hay muchos niveles o muchas variables independientes. Con los diseños experimentales grandes, es posible asignar los niveles de manera aleatoria o aleatorizar en los bloques, como se describió en el capítulo 2. A veces cabe utilizar la técnica de contrabalanceo parcial, en la cual se escoge sólo algunos de los órdenes al tiempo que se verifica que cada nivel ocurra el mismo número de veces en cada posición. Un esquema de contrabalanceo parcial que se usa con variables independientes que tienen más de dos niveles es el cuadrado latino, con el que se asegura que cada nivel aparezca en cada posición del orden con la misma frecuencia. Hay muchos cuadrados latinos para un número dado de niveles de la variable independiente. Quizás el más útil sea el cuadrado latino balanceado, en el cual no sólo cada nivel aparece en cada posición del orden con igual frecuencia, sino que cada condición también precede y sigue a cada una de las otras condiciones con la misma frecuencia. Supongamos que queremos saber cuánto tiempo se tarda la gente en leer párrafos estandarizados en la pantalla de una computadora en cuatro fuentes de letra: Chicago, Courier, Geneva y Times, y nos preocupa que el orden de la presentación
08Martin148-170.indd 162
16/4/08 22:45:10
Diseños entre sujetos e intrasujeto
163
■ TABLA 8-4 Diseño contrabalanceado completo para variables independientes de dos, tres y cuatro niveles Dos niveles de la variable independiente
Tres niveles de la variable independiente
Número
Orden de los niveles
Número
Orden de los niveles
1 2
AB* BA
1 2 3 4 5 6
ABC ACB BCA BAC CAB CBA
Cuatro niveles de la variable independiente Número
Orden de los niveles
Número
Orden de los niveles
1 2 3 4 5 6 7 8 9 10 11 12
ABCD ABDC ACBD ACDB ADCB ADBC BACD BADC BCAD BCDA BDAC BDCA
13 14 15 16 17 18 19 20 21 22 23 24
CABD CADB CBAD CBDA CDAB CDBA DABC DACB DBAC DBCA DCAB DCBA
*Las letras A, B, C y D representan los niveles.
08Martin148-170.indd 163
16/4/08 22:45:11
164
Capítulo ocho
Orden de la presentación 1º
2º
3º
4º
Participante 1
Chicago
Courier
Geneva
Times
Participante 2
Courier
Times
Chicago
Geneva
Participante 3
Times
Geneva
Courier
Chicago
Participante 4
Geneva
Chicago
Times
Courier
Un cuadrado latino balanceado para ordenar la presentación de cuatro fuentes de letra a cuatro lectores.
FIGURA 8-6
pudiera generar una confusión en el experimento. En la figura 8-6 se ilustra un cuadrado latino balanceado para este experimento. Observemos que las cuatro fuentes de letra aparecen en cada posición para los cuatro participantes. Tomando la letra Courier como ejemplo, observemos, recorriendo los renglones hacia abajo, que es precedida por la Chicago, nada, la Geneva y la Times, y seguida por la Geneva, la Times, la Chicago y nada. Por tanto, hemos satisfecho los requerimientos del diseño. Con el fin de que funcione el cuadrado latino, debemos contar con al menos tantos participantes como niveles de la variable independiente y, en general, algún múltiplo de ese número. Este contrabalanceo parcial da cuenta de la mayoría de las posibles variables de confusión que se deben al orden o a la transferencia asimétrica, pero deja algunas variables de confusión sutiles causadas por interacciones posibles entre el orden y la transferencia asimétrica. Un diseño de contrabalanceo completo es todavía mejor, pero si tiene muy pocos participantes, un cuadrado latino es perfecto. Hemos visto que la técnica del contrabalanceo es necesaria para minimizar efectos de confusión de la secuencia que se presentan en algunos experimentos intrasujeto. Hasta este punto, usted debe estar al tanto de las premisas de la técnica que aplique y debe escoger una técnica de contrabalanceo que le permita cumplir con esas premisas. Sin embargo, en algunos experimentos, como los que tienen una transferencia asimétrica, puede ser imposible cumplir con las premisas y no tendrá otra opción más que utilizar un diseño entre sujetos. Los efectos del rango son una desventaja potencial de los diseños intrasujeto que no puede ser corregida mediante contrabalanceos y que puede forzarlo a uno a optar por un diseño entre sujetos.
08Martin148-170.indd 164
16/4/08 22:45:11
Diseños entre sujetos e intrasujeto
165
EFECTOS DEL RANGO
Supongamos que es agente de compras de una fábrica de aparatos y ordena un nuevo juego de mesas de trabajo para armar los aparatos. Debe escoger la altura de las mesas, para verificar que sea la correcta para maximizar la producción. Entonces, decide realizar un experimento para determinar la altura adecuada. Primero toma un grupo de trabajadores, grupo A, y los sienta en mesas de varias alturas. Ahí, cuenta a cuántos bloques pueden dar vuelta durante tres minutos. Las alturas de las mesas que escoge son ⫺10, ⫺6, ⫺2, ⫹2, ⫹6 y ⫹10 pulgadas con respecto a la altura del codo. Como leyó este libro, se da cuenta de que podría tener un problema con los efectos del orden secuencial, así que realiza con cuidado un contrabalanceo con el orden de las alturas de la mesa. Al terminar el experimento, su jefe le dice que le gustaría que probara mesas de una altura mucho menor. Entonces, diseña otro experimento como el anterior, excepto que esta vez escoge a un grupo B que utiliza las mesas con las siguientes alturas: ⫺18, ⫺14, ⫺10, ⫺6, ⫺2 y ⫹2 pulgadas a partir de la altura del codo. La figura 8-7 muestra los resultados reales de este experimento. Lo sorprendente de estos resultados es que la mejor altura de la mesa es diferente en los dos grupos. El grupo A se desempeñó mejor a la altura del codo y el grupo B a seis pulgadas por debajo. ¿A qué se debe? En el aprendizaje de una tarea como dar vuelta a un bloque en una mesa de una altura dada, las personas también aprenden una habilidad que es útil para otras tareas, como dar vuelta a los bloques sobre una mesa de una altura diferente. Mientras más similares sean las dos alturas de la mesa, mejor podrán las personas transferir la habilidad de una altura a la otra. Éste es un principio básico del aprendizaje. De manera que si consideramos que el experimento de voltear bloques es un experimento de aprendizaje, esperaríamos que los trabajadores se desempeñaran mejor a una altura de la mesa que fuera similar a todas las demás alturas de la mesa utilizadas en el experimento. En la tabla 8-5 se muestra la diferencia promedio en la altura, en pulgadas, entre cada altura de la mesa y las otras cinco alturas presentadas para cada grupo. Por ejemplo, la diferencia entre +10 y ⫺6 es 16, y así sucesivamente. Si se suman todas las diferencias entre +10 y cada una de las otras cinco condiciones para el grupo A y se divide la suma entre 5, se obtiene una media de 12. Si hubiésemos anticipado que la mayor tasa de trabajo se observaría ante la condición más similar a las otras condiciones presentadas en cada experimento, hubiéramos pronosticado bien otra figura a partir de la tabla 8-5. Ahora puede ver por qué recibe el nombre de efecto del rango; la gente tiene el nivel de desempeño más alto a la mitad del rango de los niveles presentados ■ TABLA 8-5 El promedio de pulgadas de la diferencia entre cada altura de la mesa y las otras cinco alturas presentadas Altura de la mesa Grupo A Grupo B
08Martin148-170.indd 165
–18
–14
12
8.5
–10 12 7.2
–6 8.5 7.2
–2 7.2 8.5
+2 7.2 12
+6 8.5
+10 12
16/4/08 22:45:11
166
Capítulo ocho
debido a que la transferencia del aprendizaje es mayor a la mitad del rango. Los efectos del rango son resultado de un experimento intrasujeto siempre que los estímulos o las respuestas puedan ser puestas en un orden constante. Poulton (1973) detectó ejemplos de efectos del rango en muchos campos de la psicología experimental. Aunque Poulton y otros llaman a tomar con cautela los experimentos intrasujeto debido a los efectos del rango, otros investigadores sostienen que, en muchos casos, son preferibles estos experimentos. Por ejemplo, Greenwald (1976) señaló que el efecto del rango no es más que un efecto del contexto. El participante llega al experimento con un contexto ya establecido. En el ejemplo de la mesa, la gente ya ha experimentado ciertas alturas de la mesa. Greenwald dice que presentar repetidamente a un individuo sólo un nivel de la variable independiente, como en un experimento entre sujetos, no elimina el contexto. Conforme se realicen ensayos repetidos en un solo nivel de la variable independiente, se desarrolla un nuevo contexto, el del nivel único. Por estas razones, Greenwald afirma que los efectos del contexto no pueden evitarse utilizando cualquier tipo de diseño. Dice que al escoger un diseño, la pregunta más importante es a qué situación se piensa generalizar los resultados. Por ejemplo, en nuestro experimento sobre los programas de televisión violentos, resultaría más artificial exponer a un niño de forma reiterada a un nivel de violencia (un diseño entre sujetos) que a varios niveles diferentes. Puesto que queremos generalizar los resultados a una situación real con muchos niveles, deberíamos elegir un diseño intrasujeto. Es decir, el rango usado en el experimento debería acercarse al rango observado en la situación a la que queremos generalizar. Por lo tanto, aunque debe estar al tanto de que los efectos del rango pueden alterar el resultado de su experimento, debería elegir el diseño que le permita generalizar sus resultados a la situación apropiada. En resumidas cuentas, ¿qué diseño es preferible, el diseño entre sujetos, como afirma Poulton, o el diseño intrasujeto, como dicen Greenwald y otros investigadores que utilizan sólo estos diseños y diseños de un solo sujeto? Una posición razonable sería contestar que todo depende del experimento concreto que uno piense realizar. Como vimos, en algunos casos, como en el estudio de la formación de actitudes y varios aspectos de la memorización, es prácticamente imposible utilizar diseños intrasujeto. También hay campos de investigación en que los esquemas de contrabalanceo más elaborados no bastan para corregir los efectos de orden, como la transferencia asimétrica. En otros casos, como cuando se ve que una técnica terapéutica es atinada, llega a ser inmoral emplear diseños intrasujeto que reviertan los efectos benéficos de la terapia. Por otro lado, tomar a un participante como su propio control es un procedimiento experimental poderoso, que reduce la variabilidad en tal medida que podemos ver con claridad efectos pequeños pero importantes de las manipulaciones experimentales. Algunos campos de la investigación son más inmunes a los problemas como los efectos de orden que aparecen en los diseños intrasujeto: por ejemplo, en la investigación de la memoria, el estudio del intervalo de retención o cargas de memoria; en la investigación de la percepción, el estudio de las ilusiones o la localización del sonido, y en la investigación de la atención, el estudio de la preparación. En estos casos, los experimentos más eficientes y claros utilizan diseños intrasujeto. Por consiguiente, como investigador, lo mejor que puede hacer es escoger el diseño que mejor se ajuste al estudio que realiza.
08Martin148-170.indd 166
16/4/08 22:45:12
Diseños entre sujetos e intrasujeto
167
■ Igualación Una manera de aprovechar un experimento entre sujetos y evitar los problemas de las diferencias individuales entre los grupos de participantes es utilizar un diseño de grupos igualados. Esto significa que tiene que tratar de asignar la misma clase de participantes a cada nivel de la variable independiente. En el experimento ordinario entre sujetos, se espera que los individuos asignados a cada nivel sean bastante parecidos; además, tiene a su favor la aleatorización. La asignación aleatoria hace probable que los grupos sean equivalentes en lo esencial, lo que es más factible con los grupos grandes. Sin embargo, debido a que es un proceso aleatorio, ocasionalmente los asignados a cada grupo serán muy diferentes y quizás el investigador se equivoque al atribuir las diferencias de comportamiento a la variable independiente. Esto es, se puede generar una confusión en el experimento por las diferencias del grupo. Al igualar los grupos, se minimiza esta posibilidad. ¿Con base en qué se igualan los grupos? Se igualan en una variable muy correlacionada con la variable dependiente. En nuestro experimento del calzado de pista, sería un desperdicio de tiempo igualar a los dos grupos de corredores según la puntuación del CI. Una mente rápida no guarda una relación con pies rápidos. En cambio, haríamos que cada competidor corriera los 100 metros planos primero con tenis y luego haríamos parejas de sujetos: los dos más rápidos, etc. Después lanzaríamos al aire una moneda para asignar un miembro de cada par a cada una de las condiciones de calzado de pista. Así, antes de introducir la variable independiente sabemos que los grupos son equivalentes en velocidad. En este experimento, suponemos una gran correlación entre los tiempos de carrera con tenis y los tiempos de carrera con calzado de pista, ya que cuanto menor es la correlación entre la variable igualada y la variable dependiente, menos ganamos al igualar.
DISEÑO DE GRUPOS IGUALADOS Con la igualación disminuimos la probabilidad de equivocarnos al decir que la variable independiente causó un cambio en el comportamiento. La igualación también proporciona una ventaja estadística, pues cuando se forman grupos igualados, es más probable que la prueba estadística indique que una diferencia dada en las calificaciones de la variable dependiente se debe a la variable independiente en lugar de al azar. Esto es, las pruebas son más sensibles a toda diferencia asociada con la variable independiente. Para ilustrar este principio, en la columna de la izquierda de la tabla 8-6 se anotan los hombres escogidos al azar que corrieron los 100 metros planos con calzado de pista con
08Martin148-170.indd 167
16/4/08 22:45:12
168
Capítulo ocho
■ TABLA 8-6 Tiempos individuales de carrera de 100 metros planos para dos grupos igualados Hombres con calzado de tacos de 7 mm Mike Homer Randy Gordon John George Harry Tim Bob Bill
Tiempo (en segundos) (12.2) (12.8) (13.5) (14.0) (14.3) (16.1) (16.7) (17.0) (18.7) (19.7)
11.7 12.2 12.9 13.2 13.7 15.4 15.8 16.0 18.2 19.1
Hombres con calzado de tacos de 13 mm Vic Jack Barry Larry Jess Stuart Harvey Sid Pat Joe
Tiempo (en segundos) (12.2) (12.8) (13.5) (14.0) (14.3) (16.1) (16.7) (17.0) (18.7) (19.7)
12.2 12.6 13.5 13.8 14.2 15.8 16.2 16.6 18.7 19.6
Media para 7 mm = 14.82 segundos. Media para 13 mm = 15.32 segundos. Diferencia de la media = 0.5 segundos.
tacos de 7 mm (de la tabla 8-2). Para igualar a los participantes, supongamos que también hacemos que corran la carrera en tenis. Las marcas obtenidas con los tenis están en paréntesis. Para lograr un grupo igualado, ahora muchos más hombres corren con tenis y escogemos como participantes a los que tienen los mismos tiempos que los de nuestro grupo original. Estos nuevos participantes se anotan en la columna de la derecha, y entre paréntesis se incluyen los tiempos que obtuvieron con los tenis. Observemos que estamos en posición de eliminar cualquier diferencia en los grupos referida a las calificaciones obtenidas con los tenis: son exactamente iguales. Ahora tenemos un nuevo grupo que corre la carrera con tacos de 13 mm y descubrimos que, como en nuestros ejemplos anteriores, resulta un promedio de 0.5 segundos de aumento en el tiempo de carrera. ¿Creería que la diferencia de longitud de los tacos causó la diferencia promedio de 0.5 segundos en el experimento de los grupos aleatorios originales o en este experimento de grupos igualados? Las pruebas estadísticas toman la decisión de la misma manera que usted.11 Una desventaja de hacer experimentos con grupos igualados es que esta operación de igualar exige más tiempo, de manera que a veces los experimentos requieren dos sesiones, una para la prueba preliminar y otra para el experimento mismo. Si piensa usar muchos participantes, la probabilidad de obtener diferencias grandes entre los grupos utilizando asignaciones aleatorias es pequeña y el engorro de igualar no valdría la pena el esfuerzo. Una consideración final es que el proceso de igualación en sí mismo puede causar algunos problemas. Supusimos en el ejemplo que la prueba preliminar con tenis no tuvo un 11
Observemos, sin embargo, que en las pruebas estadísticas empleadas para los diseños de grupos igualados se supone que se hizo una igualación en una variable muy correlacionada con la variable dependiente. Por tal motivo, estas pruebas son más conservadoras para declarar que una diferencia es estadísticamente significativa. Si tiene que igualar con una variable que no esté muy correlacionada con la variable dependiente y utiliza una de estas pruebas, es menos probable que encuentre un efecto estadísticamente significativo del que encontraría sin hacer la igualación.
08Martin148-170.indd 168
16/4/08 22:45:12
Diseños entre sujetos e intrasujeto
169
■ TABLA 8-7 Resumen de las ventajas y desventajas de utilizar diseños intrasujeto y entre sujetos Experimentos intrasujeto Desventajas
Ventajas Se requieren pocos participantes. El tiempo del experimento es más corto. La variabilidad entre los grupos es más pequeña.
Es posible que haya transferencia entre las condiciones. El contrabalanceo ABBA asume un efecto de confusión lineal. Todo contrabalanceo asume una transferencia simétrica. Los efectos de rango pueden causar problemas.
Experimentos entre sujetos Ventajas No son posibles los efectos de transferencia entre condiciones. No se requiere contrabalanceo. La igualación puede reducir la variabilidad entre los grupos. La asignación aleatoria de los participantes elimina el sesgo.
Desventajas Son posibles las diferencias entre los grupos. Se requieren más participantes. Se requiere más tiempo experimental. La igualación exige tiempo y esfuerzo y supone que no hay ninguna transferencia de la operación de igualar.
efecto diferencial en la prueba con tacos. Sin embargo, supongamos que la prueba con los tenis enseñó a los corredores una técnica para correr con calzado blando que podrían transferir a la última prueba. Podríamos predecir que cuanto más suave fue el calzado en la última prueba, más rápido correrían los participantes. Debido a que los tacos cortos se parecen más a los zapatos suaves, éstos darán por resultado tiempos más rápidos. En este caso, la prueba preliminar afectaría de distinta manera el desempeño de los corredores en los dos niveles de la variable independiente. Por lo tanto, los diseños de los grupos igualados son valiosos en ciertas condiciones, aunque pueden causar más problemas de los que solucionan. Deberá sopesar las ventajas y las desventajas de utilizar un diseño de grupos igualados en su propio experimento. En la tabla 8-7 se resumen las ventajas y desventajas de los diseños que estudiamos en este capítulo. Como es obvio, le conviene considerarlas en el contexto del experimento que planee. Cuando analicemos los experimentos de variables múltiples en el capítulo 9, veremos que, en muchos casos, un experimento único tendrá tanto variables intrasujeto como variables entre sujetos. Por ejemplo, si nos interesara saber si depende del sexo el efecto que tiene en el tiempo de reacción de la gente presentar una luz de advertencia con un sonido, tendríamos “con luz de advertencia/sin luz de advertencia” como variable intrasujeto y el “sexo” como una variable entre sujetos (¡pero desde luego!).12 12
Analizar si manipular una variable intrasujeto o entre sujetos es motivo de duda con algunas variables: sexo, especie, rasgos de personalidad, coeficiente intelectual, etcétera.
08Martin148-170.indd 169
16/4/08 22:45:12
170
Capítulo ocho
Así que para experimentos de variables múltiples, tiene más sentido utilizar los términos intrasujeto y entre sujetos para referirnos a las variables, más que a los experimentos.
■ Resumen Hay dos maneras básicas de asignar a los participantes a los niveles de la variable independiente: asignar diferentes individuos a cada nivel o asignarlos a todos los niveles. El primer método le da un experimento entre sujetos, y el segundo, un experimento intrasujeto. El primero ofrece la ventaja de que los participantes son expuestos a un solo nivel de la variable independiente, de manera que los otros niveles no pueden afectar su comportamiento. Además, las sesiones experimentales pueden ser más cortas. La principal ventaja del segundo es que se minimiza la variabilidad debida a las diferencias individuales. Algunas ventajas prácticas de los diseños intrasujeto son que se necesitan pocos participantes y se minimiza el entrenamiento y el tiempo de enseñanza. Una desventaja de los diseños intrasujeto es que hay que realizar un contrabalanceo de los efectos del orden. Un contrabalanceo ABBA controla los efectos del orden en un participante, pero uno debe estar en la posición de asumir que el efecto del orden es lineal. También es posible efectuar un contrabalanceo completo del orden entre participantes, pero hay que plantearse una premisa de transferencia simétrica entre condiciones. En los grandes experimentos en los que no es posible realizar un contrabalanceo completo, puede emplearse contrabalanceo parcial, asignación aleatoria o aleatorización en bloques. El contrabalanceo no supera los efectos del rango en los experimentos en los que los estímulos o las respuestas se ordenan en forma constante. Las diferencias de los participantes asignados a cada grupo que representa un nivel de la variable independiente pueden reducirse mediante el procedimiento de grupos igualados.
08Martin148-170.indd 170
16/4/08 22:45:13
9
Cómo planear experimentos de una sola variable, de variables múltiples y de series convergentes Un diseño concebido y ejecutado con sumo cuidado no sirve si la hipótesis que condujo al experimento no tiene sustancia. R. E. KIRK (1968)
Todavía no he visto ningún problema, ni siquiera el más complicado, que, bien visto, no se haya vuelto más complicado. PAUL ANDERSON
E
n este capítulo analizaremos los experimentos de una sola variable, que son el diseño experimental de casi todos los ejemplos que hemos visto hasta ahora en el libro. En estos experimentos, se manipula una sola variable en dos o más niveles. También estudiaremos los experimentos de variables múltiples o factoriales, en los que se incluyen diversas variables independientes en el mismo experimento y se manipulan en dos o más niveles. En la bibliografía de psicología, son los experimentos más numerosos. Por último, veremos los diseños de series convergentes, en los que diversos experimentos de una sola variable o de variables múltiples se realizan en secuencia para probar una hipótesis o teoría.
■ Experimentos de una sola variable EXPERIMENTOS DE DOS NIVELES
En el experimento más simple, tenemos una variable independiente con dos niveles. Por lo común, los investigadores se refieren a los grupos que se exponen a esos niveles como grupo experimental y grupo control. En algunos casos, es obvio cuál debe ser la condición de control: no aplicar el tratamiento. Por ejemplo, si le interesara conocer los efectos de cierto fármaco en el comportamiento, no se lo daría al grupo control, mientras que al experimental, sí. En este caso, el primero también sería valioso para mostrar que sólo estar en el experimento no 171
09Martin171-192.indd 171
8/5/08 17:22:10
172
Capítulo nueve
fue causa del efecto observado. En otros casos, en especial cuando hay varios niveles de la variable independiente, no resulta claro cuál debe ser el nivel de control.1 Por esta razón, reservo el término nivel para describir la variable independiente. En cualquier caso, debemos utilizar cuando menos dos niveles para tener un experimento real. De lo contrario, sería imposible decir que un cambio en la variable independiente causó un cambio en el comportamiento, ya que no habría posibilidad de hacer una comparación. En los primeros tiempos de la psicología experimental, el experimento común que se publicaba era de una sola variable y dos niveles. Debido a que nuestra ciencia era joven, los investigadores estaban más interesados en descubrir si una variable independiente tenía algún efecto, que en determinar la naturaleza exacta de éste. Además, aún no habían desarrollado las pruebas estadísticas necesarias para analizar diseños experimentales más complejos. En algunos casos, se tenían ya las pruebas, pero el investigador promedio no las conocía bien. En la actualidad, los directores de las revistas científicas esperan ver más de dos niveles manipulados en un experimento. A veces aceptan experimentos de dos niveles que estén bien hechos, en particular cuando se informa de varios experimentos, pero en general un experimento característico tiene múltiples niveles. Sin embargo, uno de dos niveles es apropiado como primer proyecto. Los nuevos experimentadores necesitan meter los pies en el agua, pero sin ahogarse, y en algunos casos los experimentos de dos niveles pueden proporcionar resultados valiosos.
Ventajas En la actualidad, los experimentos de dos niveles tienen varias ventajas sobre los diseños más complejos. Son una manera de descubrir si vale la pena estudiar una variable independiente. Si la variable independiente no tiene efecto en el comportamiento de la persona, perdería el tiempo si realizara un experimento más complejo para determinar la naturaleza exacta del efecto. Los resultados de un experimento de dos niveles también son fáciles de interpretar y analizar. El resultado es: “Sí, la variable tuvo un efecto; el comportamiento cambió en esta dirección.” O bien: “No, la variable no tuvo ningún efecto”. Para determinar si un efecto es real o se debe a una variación al azar, se tiene que practicar una prueba estadística, que en el caso de los experimentos de dos niveles es fácil de hacer. Por ejemplo, quizá baste con unas sumas y restas. Cuando ya sabe qué prueba emplear, en pocos minutos debe realizar los cálculos manuales (o unos segundos si usa una computadora) para analizar estadísticamente la información. Por último, en algunos casos no necesitará más información que la que da el experimento de dos niveles. Si el propósito del experimento es probar dos teorías rivales, una de 1
Por ejemplo, si decidimos variar el sexo (no cuánto sexo tiene, sino el sexo al que pertenezca) como la variable independiente de un experimento, ¿deberíamos llamar a los hombres o a las mujeres el grupo control? Las feministas y los masculinistas podrían discutir durante días sobre el tema, así que, ¿por qué no mejor evadimos la pregunta y asignamos grupos al nivel 1 y al nivel 2?
09Martin171-192.indd 172
8/5/08 17:22:11
Cómo planear experimentos de una sola variable, de variables múltiples y de series convergentes
173
las cuales predice que habrá un comportamiento diferente para los dos niveles mientras que la otra afirma que no habrá cambio o que habrá un cambio opuesto, un experimento de dos niveles es adecuado para diferenciarlas. Asimismo, en algunos tipos de investigación aplicada, un experimento de dos niveles puede proporcionar información valiosa. Por ejemplo, si quiere comparar dos máquinas industriales y sólo cuenta con esas dos, el experimento de dos niveles le da toda la información que necesita. El mismo principio se mantiene si investiga dos técnicas terapéuticas, dos sistemas educativos, dos programas de entrenamiento, dos medicamentos, dos sexos o dos niveles de cualquier otra variable, cuando sólo se tiene o sólo son importantes dos niveles.
Desventajas
Tiempo de lectura
Aunque una recta es la distancia más corta entre dos puntos, no es la única línea que una los dos puntos. En otras palabras, se tiene una desventaja en muchos experimentos de dos niveles, porque no indican nada acerca de la forma de la relación entre la variable independiente y la variable dependiente. Supongamos que hicimos un experimento para descubrir con qué tamaño de letra debíamos imprimir el libro para que usted perdiera el menor tiempo posible luchando con mi prosa perifrástica. Quizá nos decidiríamos a imprimir varios párrafos con un procesador de palabras, algunos en un tipo de 12 puntos y otros en un tipo menor, de 10 puntos. Luego mediríamos cuánto se tarda la gente en leer los párrafos impresos con cada tipo. Por supuesto, haríamos una prueba preliminar de comprensión de los párrafos, nos ocuparíamos de contrabalancear los efectos del orden y haríamos todo lo demás que hemos aprendido hasta aquí. En la figura 9-1 se muestran los resultados ficticios de este experimento. La línea recta, arbitraria, que dibujamos entre los dos puntos indica que cuanto más pequeña es la letra, más tiempo se necesita para leerla. Por tanto, el experimento respondió nuestra pregunta: el
12 puntos
10 puntos
Tamaño de la letra FIGURA 9-1 Resultados posibles de un experimento que mide el tiempo necesa-
rio para leer párrafos en un tipo de letra de 12 y de 10 puntos.
09Martin171-192.indd 173
8/5/08 17:22:11
Tiempo de lectura
Capítulo nueve
Tiempo de lectura
174
12 puntos
10 puntos
12 puntos
10 puntos
12 puntos
10 puntos
Tiempo de lectura
10 puntos
Tiempo de lectura
12 puntos
FIGURA 9-2 Relaciones posibles entre el tipo de letra y el tiempo de lectura. To-
das las funciones pasan por los mismos puntos.
tipo de 12 puntos aligera la lectura. Sin embargo, si en verdad queremos saber cuál es el mejor tamaño de letra de todos los posibles y escogemos los dos tamaños utilizados en el experimento porque eran nuestras mejores suposiciones, no tenemos la suficiente información para tomar la decisión. Nuestros resultados no dan ninguna indicación sobre si una relación lineal entre el tipo de letra y el tiempo de lectura es verdadera con cualquier otro tipo de letra, diferente a los dos que tenemos. En la figura 9-2 se muestran otras relaciones que también podrían ser la real. Observe que no conocer la forma de la relación vuelve dudosa la interpolación.2 Haríamos mal en concluir que un tamaño de letra entre los 12 y los 10 puntos daría un tiempo de lectura entre los otros dos tamaños. Extrapolar a partir de los dos puntos es todavía más peligroso que interpolar. La mayoría de las funciones psicológicas tienen lo que llamamos efectos de techo y de piso. Un efecto de techo ocurre cuando la variable dependiente alcanza un nivel que no puede superarse. Ejemplos comunes de niveles de techo son 100% de precisión de la respuesta, probabilidad de respuesta de 1.0 y 100% de confianza en la respuesta. En estos casos, es materialmente imposible que alguien obtenga una respuesta que exceda un valor en particular (en otras palabras, no se puede tener más de 100% de precisión). En otros casos, el techo absoluto no limita las respuestas, pero uno más flexible, sí. Por ejemplo, incluso con práctica, el número de elementos que podemos retener en la memoria de corto plazo tiene un efecto de techo: 2
La interpolación es un estimado de los valores intermedios dentro de un rango conocido; la extrapolación es un estimado de los valores fuera de un rango conocido.
09Martin171-192.indd 174
8/5/08 17:22:12
Cómo planear experimentos de una sola variable, de variables múltiples y de series convergentes
175
EFECTO TECHO
EFECTO PISO
alrededor de 7. De igual manera, en un periodo finito los seres humanos tenemos una limitación real en cuanto al volumen de información que podemos procesar, como cuántos números podemos sumar, cuántos objetivos detectamos en una pantalla, cuántas palabras podemos teclear, etc. Aunque el techo no sea tan inflexible, sigue siendo impenetrable. El efecto del piso es un valor por debajo del cual no puede haber una respuesta. Por ejemplo, no es posible responder en menos de cero segundos o dar menos respuestas que ninguna. Tampoco el piso tiene que ser absoluto, y hay pisos que, de hecho, son más flexibles. Por ejemplo, el tiempo mínimo de detección de un estímulo, aunque teóricamente es cero, en realidad es de cerca de 150 milisegundos. Si tomamos los dos datos y extrapolamos a valores por encima del techo o por debajo del piso, no llegaremos al ático o al sótano; estaremos en problemas. No siempre es obvio dónde deben estar el techo y el piso. Para evitar estos problemas, en un experimento de dos niveles, adopte la regla de no interpolar o extrapolar más allá de sus niveles.
INTERPOLAR ENTRE DOS PUNTOS ES RIESGOSO
¡EXTRAPOLAR MÁS ALLÁ DE DOS PUNTOS ES TODAVÍA MÁS PELIGROSO!
A veces los experimentos de dos niveles tienen poco valor teórico. En los capítulos 1 a 3 estuvimos de acuerdo en que la ciencia se basa en relaciones y que los científicos utilizan las teorías para explicar las relaciones que encuentran en los experimentos. Toda teoría compite
09Martin171-192.indd 175
8/5/08 17:22:12
176
Capítulo nueve
con otras teorías posibles hasta que se realiza el experimento que apoya una teoría, lo que excluye a las demás. Debido a que muchas teorías predicen que un cambio en la variable independiente modificará la variable dependiente en cierta dirección, de ordinario, el resultado de un experimento de dos niveles no distinguirá entre las teorías. A excepción de los casos en que las teorías rivales predicen cambios en direcciones opuestas o una predice un cambio mientras que la otra no, es necesario recurrir a diseños experimentales más complejos para verificarlas. EXPERIMENTOS MULTINIVEL
Los experimentos multinivel son experimentos de una sola variable que presentan tres o más niveles de la variable independiente. Algunos investigadores también les llaman experimentos funcionales, ya que permiten hacerse una idea de la forma de la función que relaciona la variable independiente con la variable dependiente.
Ventajas La principal ventaja de un experimento multinivel es que su resultado permite inferir la naturaleza de la relación experimental. Incluso si un experimento tiene sólo tres niveles, proporciona una mejor idea que el de dos niveles de la forma de la relación entre la variable independiente y la dependiente. Supongamos que queremos saber cómo influye el nivel de ansiedad de los estudiantes en las calificaciones de los exámenes. Así, decidimos utilizar dos clases de introducción a la psicología3 y hacer un diseño entre sujetos de dos niveles. En la clase 1, la profesora pasa cinco minutos antes de cada examen pronunciando un enardecido discurso acerca de la importancia de las calificaciones para el éxito escolar. Pone de relieve que los estudiantes con mejores calificaciones obtienen los mejores puestos laborales, que quienes están titulados ganan un salario mucho mayor y que la universidad está un poco saturada en ese momento. En la clase 2, la misma maestra también les da una charla de cinco minutos antes de cada examen. Les recuerda a los estudiantes que lograr una buena calificación no es tan importante como aprender el material. Les dice que dentro de 10 años no recordarán la calificación que se sacaron. En este experimento, tenemos el cuidado de controlar todas las variables de confusión que podamos, como calificaciones, dificultad del examen y enseñanza de la lección. Por lo tanto, decidimos que la diferencia de calificaciones es atribuible a la ansiedad producida por la charla. Suponiendo que la primera charla causa mucha ansiedad en los estudiantes y la segunda, menos, obtendríamos los resultados mostrados en la figura 9-3. Hasta este punto, la mejor suposición que podríamos hacer es que no hay ninguna relación entre el nivel de ansiedad y el promedio de las calificaciones del examen: la recta tra3
Debido a que aquí tomamos dos grupos que ya están formados, en lugar de asignar los estudiantes al azar, este ejemplo no es en realidad un experimento, sino que utiliza un diseño cuasiexperimental, que veremos en el capítulo 10. Espero que haya notado esta diferencia.
09Martin171-192.indd 176
8/5/08 17:22:13
177
Calificación promedio en el examen
Cómo planear experimentos de una sola variable, de variables múltiples y de series convergentes
Bajo
Alto
Nivel de ansiedad FIGURA 9-3 Resultados imaginarios de un experimento de dos niveles en el que se varía
el nivel de la ansiedad de estudiantes y se mide el promedio de sus calificaciones en un examen.
zada entre dos puntos es plana. Sin embargo, supongamos que nos hemos decidido por un diseño multinivel y agregamos un tercer nivel de ansiedad, un nivel neutral en el cual la profesora les da una plática de cinco minutos para recordarles algunos detalles de procedimiento. En la figura 9-4 se dan los resultados imaginarios de este experimento multinivel. Cuando graficamos el tercer punto de datos, vemos que hay, de hecho, una relación importante entre el nivel de ansiedad y las calificaciones del examen,4 aunque haya duda acerca de la verdadera forma de la función. Cualquiera de las tres formas que aparecen en la figura 9.4 son una buena posibilidad; y debido a que la mayoría de las funciones psicológicas no hacen ciclos cerrados ni cambian rápidamente de dirección, sabemos que no muchas relaciones son posibles. Como se observa, el tercer punto de datos da una mejor idea de la forma de la relación experimental. Conforme agregamos más niveles a nuestro experimento, hacemos mejores suposiciones acerca de la verdadera relación funcional entre las variables independientes y dependientes. También podemos interpolar y extrapolar con más seguridad a partir de nuestros puntos de datos. En este ejemplo, el grupo neutral que agregamos podría considerarse el grupo control, ya que la profesora no trata de influir en la ansiedad. Hubiéramos podido añadir otro grupo control, en el que la profesora no dijera nada, para determinar si decir algo repercute en el comportamiento. Los experimentos multinivel ofrecen esta flexibilidad. Este ejemplo también ilustra la segunda ventaja del experimento multinivel: en general, cuantos más niveles se agreguen, menos crucial es el rango de la variable independiente. Como recordará de la exposición del capítulo 7, el rango debe ser realista, pero lo bastante 4
Si llevó un curso de motivación o atención, se habrá percatado de que esta función es una forma de la ley de Yerkes-Dodson, en la cual una U invertida describe la relación entre activación y aprendizaje. ¡Felicitaciones!
09Martin171-192.indd 177
8/5/08 17:22:13
Capítulo nueve
Calificación promedio en el examen
178
Bajo
Neutro
Alto
Nivel de ansiedad FIGURA 9-4 Resultados imaginarios de un experimento de tres niveles en el que se varía el nivel de ansiedad de los estudiantes y se mide el promedio de sus calificaciones en un examen.
grande para mostrar la relación, si existe. Por supuesto, los dos requisitos se nos hacen más fáciles de satisfacer conforme se representan más niveles de la variable independiente. Desventajas
Desde el punto de vista práctico, la mayor desventaja de un experimento multinivel es que requiere más tiempo y esfuerzo que el de dos niveles. Recordemos que cada vez que agregamos un nivel a un experimento entre sujetos, aumentamos el número de participantes necesarios. En los experimentos intrasujeto, los nuevos niveles no acrecientan el número de participantes, pero sí el tiempo total del experimento y hacen que los esquemas de contrabalanceo sean más laboriosos. Las pruebas estadísticas requeridas para analizar los experimentos multinivel también son un poco más difíciles de realizar. Exigen más tiempo y es más difícil interpretar los datos. Al ponderar las ventajas y desventajas de los diseños de dos niveles y los multinivel, los escasos costos adicionales de agregar niveles a la variable independiente suelen ser más que compensados por el valor de la información obtenida. Este beneficio es especialmente valioso para los primeros niveles agregados al diseño. En algún punto, añadir más niveles hace muy poco por nuestro conocimiento de la relación experimental. Hasta aquí hemos pretendido que todos los experimentos tienen sólo una variable independiente. Sin embargo, esta restricción ha obedecido más a propósitos analíticos que a un retrato del mundo real. Muchos experimentos que va a querer llevar a cabo necesitarán más de una variable independiente. Ahora analizo algunas estrategias generales empleadas en el diseño de experimentos más complejos. El diseño más utilizado en la psicología experimental es el diseño factorial. Para entender los resultados de la mayoría de los experimentos publicados en las revistas de psicología, debe entender el mecanismo de los diseños factoriales.
09Martin171-192.indd 178
8/5/08 17:22:14
Cómo planear experimentos de una sola variable, de variables múltiples y de series convergentes
179
■ Diseños factoriales La forma más característica de reunir variables es la combinación factorial, en la que se aparean cada nivel de una variable independiente con cada nivel de la segunda y la tercera, etc. Las variables independientes en ese diseño también se conocen como factores.5 Como ejemplo de un experimento factorial, supongamos que queremos saber si un grupo con líder llega más pronto a un consenso que uno sin líder. Tiene que decidir qué circunstancias controlará y cuáles permitirá que varíen: ¿deben ser o no del mismo sexo todos los miembros del grupo? ¿La comunicación debe ser estructurada o libre? ¿Debe darle al grupo un problema fácil o difícil? Tal vez le parezca insatisfactorio controlar o aleatorizar todos estos factores. Por ejemplo, quizá piense que el efecto de un líder en la eficiencia del grupo depende del tamaño de éste, en cuyo caso escogería variar el liderazgo y el tamaño del grupo como factores. Supongamos que quiere escoger dos niveles de liderazgo, con y sin líder, y cuatro tamaños, 3, 6, 10 y 20 miembros. En la figura 9-5 se muestra la representación acostumbrada de un experimento factorial. Como se ve en la figura, se traza una matriz con un factor en cada lado. Los cuadros de la matriz reciben el nombre de celdas. Al igual que con los experimentos simples, los participantes se asignan al azar a las celdas. En el ejemplo, la celda superior izquierda tendría los participantes asignados a los grupos con tres participantes, uno de los cuales sería el líder. También se observa que cualquier fila o columna por sí misma forma un experimento de una sola variable simple. El ejemplo que hemos escogido recibe el nombre de diseño 2 × 4,6 ya que un factor tiene dos niveles y el otro tiene cuatro. Sólo nuestra imaginación y la población del mundo limitarían el número de factores representados en un diseño factorial. Supongamos que hemos pensado que el tiempo de la toma de decisión del grupo difiere no sólo con el liderazgo y el tamaño, sino también con el
Liderazgo
Tamaño del grupo
Con líder
Sin líder
Representación esquemática de un diseño factorial 2 ⫻ 4. Un factor, liderazgo, tiene dos niveles: con y sin líder. Un segundo factor, tamaño del grupo, tiene cuatro niveles: 3, 6, 10 y 20 miembros.
FIGURA 9-5
5
Algunos investigadores también los llaman tratamientos, lo cual lleva al término combinaciones de tratamientos. Al hacer avanzar nuestra ciencia, emulamos a los constructores de la Torre de Babel; nadie está de acuerdo en el lenguaje. Es suficiente para que el nuevo investigador se quede como un idiota balbuceante. 6 La “⫻” en la expresión se lee “por”.
09Martin171-192.indd 179
8/5/08 17:22:14
180
Capítulo nueve
Femenino Sexo
Mixto
Masculino Con líder Liderazgo Sin líder
Tamaño del grupo FIGURA 9-6 Una representación esquemática de un diseño factorial 2 ⫻ 3 ⫻ 4.
Los factores son liderazgo (con y sin líder), sexo (masculino, mixto, femenino) y tamaño del grupo (3, 6, 10 y 20 miembros).
sexo de los miembros. Hacemos del sexo un tercer factor con tres niveles. ¿Tres niveles? Correcto: masculino, femenino y mixto (en el grupo mixto, aproximadamente la mitad son hombres y la mitad, mujeres). En la figura 9-6 se muestra un esquema de este diseño expandido,7 que llamaríamos diseño factorial 2 × 3 × 4. En el capítulo 8 examinamos los experimentos intrasujeto y entre sujetos, como era lo apropiado, puesto que considerábamos experimentos de una sola variable. Con los experimentos factoriales, los factores mismos se vuelven intrasujeto y entre sujetos, y las dos clases pueden incluirse en un experimento factorial único, a veces llamado diseño factorial mixto. Por ejemplo, en nuestro experimento de liderazgo, pudimos haber asignado un conjunto diferente de miembros del grupo a cada celda, para convertir a ambos en factores entre sujetos. También pudimos haber decidido crear un diseño mixto haciendo que los mismos miembros funcionaran con y sin líder. En este caso, el tamaño del grupo todavía seguiría siendo un factor entre sujetos, pero el liderazgo sería un factor intrasujeto. Al decidir si hace que un factor en particular sea intrasujeto o entre sujetos, debe considerar las ventajas y desventajas de cada uno, como vimos en el capítulo 8. De ser necesario, podría emplearse un contrabalanceo adecuado para los factores intrasujeto. VENTAJAS
La principal ventaja de un experimento factorial es que podemos estudiar las interacciones. Ocurre una interacción cuando la relación entre una variable independiente y el comportamiento del participante depende del nivel de la segunda variable independiente. Por 7
Representar esquemáticamente más de tres factores implica mayores dificultades. Es difícil conseguir una hoja de tres dimensiones. Sin embargo, los diseños experimentales no están limitados al espacio tridimensional. Sólo son difíciles de representar en un dibujo bidimensional.
09Martin171-192.indd 180
8/5/08 17:22:14
Tiempo de solución del problema
Cómo planear experimentos de una sola variable, de variables múltiples y de series convergentes
181
Tamaño del grupo
Sin líder
Con líder Liderazgo
FIGURA 9-7 Estos resultados hipotéticos muestran una posible interacción del
liderazgo con el tamaño del grupo. Observe que en el grupo más pequeño, el tiempo de solución del problema es independiente del liderazgo; en cambio, en los grupos mayores, el liderazgo tiene tiempos de solución más breves.
ejemplo, un grupo de tres no tiene grandes problemas para tomar decisiones con o sin líder, pero a medida que el grupo se hace más grande, los grupos sin líderes tardan más en alcanzar un consenso. Por lo tanto, la relación entre el liderazgo y el tiempo de la decisión depende del tamaño del grupo. En la figura 9-7 se da una gráfica de la interacción. Como se observa, la presencia de un líder en un grupo de tres participantes no influye en el tiempo que se necesita para resolver un problema. Sin embargo, conforme se hacen más grandes los grupos, tener un líder se vuelve importante para minimizar el tiempo para llegar a una solución. Dos experimentos de una sola variable no proporcionarían la información de tal interacción, aunque nos harían ver el efecto general, ya sea del liderazgo o del tamaño del grupo. Sólo un experimento factorial permite investigar las interacciones. Recordemos el capítulo 2, cuando consideramos el número infinito de circunstancias que podrían determinar el comportamiento. Decidimos que para hacer un experimento, tendríamos que escoger una de estas circunstancias como nuestra variable independiente. Las otras circunstancias se controlarían o se les permitiría variar de manera aleatoria. Una vez que determinamos el efecto de esta circunstancia en el comportamiento, podríamos elegir otra circunstancia para estudiar. El problema de este método es la suposición ingenua de que si conocemos los efectos de cada variable independiente, basta sumarlos para tener la explicación del comportamiento. Esta suposición ignora por completo los efectos recíprocos de las circunstancias. Ignorar las interacciones si es de creer que existan, puede llevarnos a conclusiones equivocadas. En el diseño de un experimento de una sola variable, cuando pensamos en convertir alguna circunstancia en una variable de control y pensamos que los resultados podrían verse afectados por el nivel en que decidimos establecer la variable, nos preocupamos por la posible interacción. La expresión todo depende debería darle una pista. ¿Tener un líder acelera los tiempos del grupo para la solución del problema? Todo depende del tamaño del grupo. ¿El tamaño
09Martin171-192.indd 181
8/5/08 17:22:15
182
Capítulo nueve
de la letra afecta la velocidad de lectura? Todo depende de la edad del lector. ¿Ver violencia en la televisión incide en la agresividad de los niños? Todo depende de cuánto la miren. Siempre que piense que el resultado del experimento que está diseñando pudiera depender de otra circunstancia, corre el riesgo de cometer un error si convierte esa circunstancia en una variable de control o en una variable aleatoria. Con base en los resultados experimentales mostrados en la figura 9-7, suponemos que, en lugar de hacer un experimento factorial, decidimos que el experimento de una sola variable es bastante bueno. Si hubiéramos convertido el tamaño del grupo en una variable de control y hubiéramos escogido sólo grupos de tres, habríamos concluido que el tiempo necesario para resolver el problema no se relacionaba con el liderazgo. Por otro lado, si hubiéramos optado por grupos de 20 participantes, podríamos haber concluido que el liderazgo tuvo un gran efecto en el tiempo de solución del problema. La situación no es mucho mejor si convertimos la circunstancia todo depende en una variable aleatoria. Con el resultado mostrado en la figura 9-7 para el experimento de liderazgo, si hubiéramos escogido al azar grupos con un tamaño entre 3 y 20, habríamos subestimado el gran efecto potencial del liderazgo. En otras palabras, habríamos encontrado un efecto mucho menor del liderazgo ya que habría sido un promedio obtenido de los tamaños de nuestros grupos de tamaño aleatorio. Supongamos que las interacciones básicas tuvieran una forma diferente, como las que se encuentran en cualquier panel de la figura 9-8. En este caso, si el tamaño del grupo fuera una variable aleatoria, de nuevo tendríamos promedios de los muy diversos tamaños del grupo y concluiríamos equivocadamente que el liderazgo no tuvo ningún efecto en el tiempo de solución del problema. Luego de esta exposición, debería empezar a entender por qué los experimentos factoriales son tan utilizados en la psicología. Son los únicos que permiten investigar las interacciones entre las variables (para más información sobre cómo interpretar las interacciones, véase el capítulo 12). En el capítulo 2 aprendimos que, siempre que una circunstancia se convierte en una variable aleatoria, los resultados del experimento incrementan la posibilidad de hacer geneTamaño del grupo
Tiempo de solución del problema
Tiempo de solución del problema
Tamaño del grupo
Con líder
Sin líder Liderazgo
Con líder
Sin líder Liderazgo
FIGURA 9-8 Dos interacciones posibles del liderazgo con el tamaño de grupo. En
cualquier caso, convertir el tamaño del grupo en variable aleatoria eliminaría el efecto del liderazgo.
09Martin171-192.indd 182
8/5/08 17:22:15
Cómo planear experimentos de una sola variable, de variables múltiples y de series convergentes
183
ralizaciones, pero a costa de la precisión. Por el otro lado, convertir la circunstancia en una variable de control acrecentó la precisión del resultado, pero disminuyó la posibilidad de generalizar. Un experimento factorial da una tercera alternativa: podemos convertir la circunstancia en otra variable independiente, y así incrementar la precisión y la posibilidad de generalizar el resultado. Podemos generalizar el resultado a un conjunto más grande de circunstancias, ya que en este caso convertimos más circunstancias en factores y conocemos con precisión cuál es el efecto en cada nivel de estos factores. Por tanto, tenemos el mejor de los mundos posibles, aunque cada vez que convertimos otra circunstancia en un factor, el experimento se hace progresivamente más complejo. La tercera ventaja de los experimentos factoriales es la ventaja estadística. Recuerde que, según vimos en el capítulo 8, en la mayoría de las pruebas estadísticas inferenciales se compara el tamaño de cualquier diferencia entre los niveles de la variable independiente con un cálculo de cuán variables son los datos. Es más probable que el resultado de una prueba considere que la diferencia es significativa si dicha diferencia es grande o si hay poca variación. En un diseño factorial, cuando una circunstancia que agregaría variabilidad a los datos se convierte en un factor, disminuye la variabilidad estimada de los datos. Por tanto, cuantas más circunstancias se conviertan en factores, más pequeño será el cálculo de la variabilidad y cuanto más pequeño sea éste, mayor es la probabilidad de que cualquier diferencia que encontremos resulte estadísticamente significativa.
DESVENTAJAS
Como sabemos, los diseños factoriales, además de todas sus bondades, tienen desventajas. En un experimento factorial, la principal desventaja es que tarda mucho tiempo y es caro. Supongamos que, como en el capítulo 2, otra vez trabaja para el general Fulano de la Fuerza Aérea. Colabora con un equipo de ingenieros que diseña la cabina de un nuevo avión. Debido a que usted es psicólogo y sabe todo acerca de los seres humanos, ellos esperan que les diga cómo diseñar los instrumentos y controles y dónde colocarlos. Está consciente de que algunas variables podrían interactuar con otras, de manera que escoge un diseño factorial. Por ejemplo, sabe que la ubicación del medidor de la velocidad del aire podría influir en cuanto al mejor lugar para colocar el altímetro. El primer factor que debe seleccionar es la longitud de la aguja en el altímetro. Descubre que en la actualidad se utilizan cuatro longitudes, así que asigna cuatro niveles a este factor. También tiene la opción de cinco posibles lugares para poner el altímetro, así que designa la ubicación como el segundo factor y le asigna cinco niveles. Su tercer factor es el tamaño del indicador de la velocidad del aire con tres niveles. Debido a que hay seis posibles ubicaciones para este instrumento, tiene un cuarto factor. El quinto factor es el tamaño de la empuñadura del joystick,8 que tiene cuatro diámetros y cinco longitudes posibles. Empezamos a considerar las variables importantes del diseño de la cabina y tenemos un experimento factorial de 8
Los que no son pilotos, dejen de reírse ahora. El joystick es la palanca de mando de un avión.
09Martin171-192.indd 183
8/5/08 17:22:16
184
Capítulo nueve
4 ⫻ 5 ⫻ 3 ⫻ 6 ⫻ 4 ⫻ 5. Hasta aquí, el diseño tiene 7200 celdas.9 Si asignamos 10 personas a cada celda, excederemos el número de pilotos de la Fuerza Aérea de Estados Unidos. Como observa, siempre que agrega otro factor a un experimento factorial, incrementa el número de celdas del diseño en un múltiplo del número de niveles de ese factor. A este ritmo, el tamaño del diseño factorial puede salirse de control con mucha rapidez. Debido a que cada nueva celda requiere más tiempo y esfuerzo, debe tener cuidado de no escoger un número poco realista de factores o niveles en cada factor.
AHORA, EN CUANTO A LA OTRA MITAD DEL MUNDO…
Si no tiene los recursos para llevar a cabo un enorme experimento factorial, ¿cómo puede descubrir una respuesta para su general Fulano? Un método consiste en realizar varios experimentos pequeños. Por ejemplo, podría hacer experimentos de 4 × 5, 3 × 6 y 4 × 5. El problema de esta solución es que hay que suponer que no interactúan las variables independientes que aparecen en experimentos separados (como la ubicación del altímetro y el tamaño del indicador de la velocidad del aire). Tampoco tenemos modo de verificar esta suposición sin reunir todas las variables en un experimento. Sin embargo, así es como trabajan en el mundo real los psicólogos que deben dar respuesta a tales preguntas. Más adelante examinaremos una estrategia para realizar una serie de pequeños experimentos. Hay otra forma, más elaborada, de tratar los grandes experimentos factoriales, la llamada metodología de la superficie de respuesta (Clark y Williges, 1973; Meyers, 1971). Este método permite determinar los lugares del diseño factorial en los que es probable que la variable dependiente esté a su máximo o mínimo, sin tener que llenar todas las celdas del diseño con puntos de datos. Para esto, es preciso suponer que no ocurren algunas de las interacciones más complejas, que suele ser una suposición correcta. Los detalles acerca de cómo aplicar la metodología de la superficie de respuesta rebasan lo que necesita un experimentador novato; es suficiente con que se dé por enterado de que cuenta con esas técnicas Ya le dije que interpretara el signo ⫻ como por, tal cual en el caso del experimento factorial de 4 por 5 por 3 por 6 por 4 por 5, para determinar el número de celdas.
9
09Martin171-192.indd 184
8/5/08 17:22:16
Cómo planear experimentos de una sola variable, de variables múltiples y de series convergentes
185
por si las requiriera en el futuro. Las referencias bibliográficas al final del libro son un buen lugar para empezar si necesita utilizar tales diseños. Los experimentos factoriales plantean otra dificultad: la interpretación de los resultados. El procedimiento estadístico con que se analizan los experimentos factoriales y todos los que tienen más de dos factores es el análisis de varianza. Este procedimiento requiere que se hagan ciertas premisas sobre el tipo de variabilidad de los datos. Una es que la variabilidad está distribuida normalmente en la conocida curva en forma de campana que coincide en lo general con muchas distribuciones del mundo real. Si la variabilidad de los datos no se aproxima a la distribución normal, no conviene utilizar una prueba estadística de análisis de varianza.10 Desafortunadamente, es común que no sepamos si podemos cumplir esta premisa hasta que termina el experimento, lo cual es muy malo, ya que son inadecuadas las otras pruebas estadísticas que tenemos para analizar interacciones complejas. En tales casos, le queda la desagradable alternativa de aplicar una prueba estadística dudosa o, de plano, no realizar ningún análisis estadístico. Por fortuna, la mayoría de los experimentos factoriales producen distribuciones que son una aproximación regular de una distribución normal, lo que permite utilizar el análisis de varianza (examinaremos el análisis de varianza con mayor detalle en el apéndice A). Incluso cuando se cumplen las premisas del análisis estadístico, llega a ser difícil interpretar los resultados de experimentos factoriales complejos. Las interacciones mencionadas hasta aquí son de dos vías, ya que la relación entre un factor y la variable dependiente depende del nivel del segundo factor. Sin embargo, como se analiza en el capítulo 12, también habría interacciones de tres vías en las cuales el tipo o el tamaño de la interacción de dos vías depende del nivel del tercer factor. Por ejemplo, quizá la eficacia de los líderes interactúe con el tamaño del grupo, pero sólo con los hombres. Para cuando llegue a las interacciones de cuatro o cinco vías, ya no le será obvia la interpretación de los resultados. Hemos visto que los experimentos factoriales pueden ofrecer muchas ventajas sobre los experimentos de una sola variable. Permiten investigar las interacciones, dan una ventaja estadística al disminuir la variabilidad no deseada y aumentan la capacidad de generalizar los resultados sin disminuir la precisión. Sin embargo, se paga por estas ventajas con el tiempo y esfuerzo dedicados y con la dificultad de interpretar los resultados. ¿Hay alguna manera de tener algunas ventajas de los experimentos de variables múltiples sin estas dificultades? Sí (siga leyendo).
■ Diseños de series convergentes La mayoría de los artículos de las publicaciones científicas informan resultados de una serie de experimentos, ya que en la actualidad muchos investigadores eligen realizar series convergentes de experimentos. Con este término me refiero a cualquier conjunto de experimen-
10
Bradley (1968), en su libro Distribution-Free Statistical Tests, hace un buen análisis de los errores que se cometen cuando no se respeta esta premisa.
09Martin171-192.indd 185
8/5/08 17:22:16
186
Capítulo nueve
tos que progresivamente se centran en una solución, en lugar de afrontar el problema de una sola vez. La mayoría de las series de experimentos están constituidas por una sola variable o pequeños experimentos factoriales. En un tipo de serie, podríamos tener un problema aplicado que es demasiado grande para un solo experimento factorial, como en el ejemplo del diseño de la cabina de pilotaje. En este caso, optaríamos por realizar una serie de pequeños experimentos factoriales debido a que las interacciones de orden superior (interacciones de tres, cuatro o más vías) son de poco interés. Cuando descubrimos el nivel óptimo para un factor en particular en un experimento, convertimos al factor en la variable de control de los experimentos subsecuentes. Entonces, variamos otros factores importantes hasta que hayamos manipulado todas las variables independientes que esperáramos que afectaran el desempeño. De esta manera, nos acercamos progresivamente a la solución óptima de nuestro problema. OPERACIONES CONVERGENTES
Una forma de diseño de series convergentes, que es más estimulante que los empleados para problemas prácticos, prueba las teorías psicológicas al converger en una hipótesis experimental única que explica el comportamiento observado. Este tipo de experimentación se conoce como método de las operaciones convergentes (Garner, Hake y Eriksen, 1956). Iniciamos la serie con muchas hipótesis posibles que podrían explicar el comportamiento que examinamos. Cada experimento nos ayuda a eliminar una o más hipótesis iniciales hasta que al final de la serie quede sólo una que explique los datos. Para ilustrar una técnica de operaciones convergentes, echémosle un vistazo a un experimento dedicado a investigar si la gente tarda más en percibir las palabras obscenas que las neutras. Supongamos que el experimentador presenta las palabras utilizando un taquistoscopio, que es un aparato que expone el material visual durante breves periodos controlados. El investigador presenta cuatro palabras, dos vulgares y dos neutras, e instruye a los participantes para que las pronuncien en voz alta en cuanto las reconozcan. Descubre que los participantes necesitan exposiciones más largas para informar las palabras vulgares; concluye que este descubrimiento apoya la hipótesis de que la gente suprime inconscientemente la percepción del material vulgar. Esta hipótesis de la defensa perceptual mantiene que se requieren exposiciones más largas para vencer esta supresión. Como experimentador sobresaliente, piensa en otras hipótesis que pudieran explicar este mismo descubrimiento. Primero, quizá las características específicas de las palabras hacen que las neutras sean más fáciles de leer en una exposición corta. Segundo, tal vez los participantes percibieron igual las cuatro palabras, pero involuntariamente suprimieron su respuesta ante las palabras vulgares, hasta que ya no pudieron esperar. Tercero, acaso los participantes estaban conscientes de las palabras y sabían cómo responder, pero contuvieron voluntariamente la respuesta hasta estar seguros de que habían leído bien. Por lo tanto, tenemos cuando menos cuatro hipótesis posibles que explicarían los resultados del experimento, los cuales anotamos en la figura 9-9. Ahora necesitamos realizar una serie de experimentos que converjan en una de estas hipótesis y excluyan al resto.
09Martin171-192.indd 186
8/5/08 17:22:16
09Martin171-192.indd 187
nvergentes
Supresión voluntaria de la respuesta
Supresión involuntaria de la respuesta
Operaciones co
Supresión voluntaria de la respuesta
Después del experimento 2 vergentes
Operaciones con
Hipótesis posibles
Supresión involuntaria de la respuesta
Defensa perceptual
Después del experimento 1
Supresión voluntaria de la respuesta
Después del experimento 3
FIGURA 9-9
Representación esquemática de la hipótesis en controversia en cada punto durante los tres experimentos de operaciones convergentes descritos en el texto.
Supresión voluntaria de la respuesta
Supresión involuntaria de la respuesta
Defensa perceptual
Características de la palabra
Antes del experimento 1
Cómo planear experimentos de una sola variable, de variables múltiples y de series convergentes
187
8/5/08 17:22:17
188
Capítulo nueve
En el primer experimento quizá distinga entre las hipótesis de las características de la palabra y las otras tres. Puede repetir el experimento original utilizando dos diferentes palabras vulgares y neutras. Si de nuevo resulta que las palabras vulgares requieren mayores exposiciones, está en camino a eliminar la hipótesis de las características de la palabra.11 Si no se requieren tiempos de exposición más largos para decir las palabras vulgares, se fortalece la confianza en la hipótesis de las características de la palabra.12 Suponiendo que se eliminara la hipótesis de las características de la palabra, todavía hay que discernir entre las tres restantes. En el experimento 2 trataríamos de determinar si los participantes perciben las palabras vulgares a menores exposiciones de las que informan. Recordemos que la respuesta galvánica de la piel (RGP) de una persona da una indicación de su respuesta emocional a un estímulo. Por tanto, decidimos medir la RGP de los participantes durante la presentación de las palabras vulgares para descubrir cuánto tiempo deben ser expuestas antes de que sean percibidas. La RGP puede indicar si los participantes perciben una palabra, aun cuando voluntaria o involuntariamente supriman su respuesta. Si descubre que la RGP no cambia hasta la duración de la exposición a la cual el participante informa de las palabras vulgares, la hipótesis de la defensa perceptual recibe apoyo. Si, por el contrario, la RGP muestra que los participantes perciben las palabras vulgares a iguales duraciones de exposición como las palabras no vulgares, una de las hipótesis restantes es verdadera. Para distinguir entre la supresión voluntaria e involuntaria de la respuesta, empleamos una operación que hace que la gente cambie a voluntad el grado de la supresión. Podría anticipar que cuando el experimentador sea del sexo opuesto al participante, hay una mayor supresión voluntaria que cuando ambos son del mismo sexo. Por lo tanto, en el experimento 3 trató de determinar si la diferencia del tiempo de exposición para detectar las palabras vulgares de las no vulgares es menor cuando el experimentador y el participante son del mismo sexo. Si es así, se apoya la hipótesis de la supresión voluntaria de la respuesta. En caso contrario, parece más probable la supresión involuntaria de la respuesta.
11
En realidad, un solo experimento rara vez determina que ya no se preste mayor consideración a una hipótesis. Por ejemplo, pudimos haber tenido mala suerte y elegimos otras dos palabras vulgares que eran todavía más difíciles de leer que las neutras. O quizá no tomamos en cuenta un subconjunto de esta hipótesis. Por ejemplo, que el efecto se deba a que las palabras vulgares tienen menor frecuencia de uso que las neutras. Y reconocemos más pronto las palabras de mayor frecuencia. Para excluir de manera concluyente la hipótesis, la operación convergente debe ser del todo independiente de cualquier otra operación posible. Al cambiar las palabras específicas, no hacemos a la frecuencia de la palabra completamente independiente de la vulgaridad de la palabra; por tanto, no podemos eliminar esta hipótesis. 12 Esta oración fue redactada con esmero ya que, en realidad, no dimos una prueba contundente que apoyara la hipótesis de las características de la palabra. En psicología experimental diseñamos nuestros experimentos para mostrar una diferencia en la variable dependiente debida a la manipulación de la variable independiente. Mostrar que una variable independiente no causa un cambio en la variable dependiente es poca evidencia de la proposición de que no puede causar un cambio. Hay muchas otras causas para que no haya habido cambios de comportamiento. Por ejemplo, si los participantes no obedecieron bien las instrucciones, se quedaron dormidos o fallecieron.
09Martin171-192.indd 188
8/5/08 17:22:17
Cómo planear experimentos de una sola variable, de variables múltiples y de series convergentes
LA PALABRA FUE _ _ _ _!
189
CÓMO SE ESCRIBE _ _ _ _?
Observe que las operaciones convergentes de este ejemplo nos han permitido eliminar todas las hipótesis, a excepción de una. Las operaciones que utilizamos para enfocarnos en una hipótesis fueron variadas: la manipulación del estímulo, la medición fisiológica y la manipulación de la relación interpersonal. Podríamos haber escogido otras operaciones, pero si las premisas de nuestras operaciones son correctas, todas las demás operaciones deben converger en la misma hipótesis. Cada vez que una nueva operación converge en la hipótesis, aumenta nuestra certidumbre. La verdad, hay algo de idealización en este estudio. Rara vez puede uno detallar toda posible hipótesis y toda operación que se llevará a cabo para distinguir entre las hipótesis, antes de realizar una serie de experimentos convergentes. Si usted es como la mayoría de los experimentadores, hará un experimento cada vez. Hasta que vea los resultados de un experimento, decidirá sobre la nueva operación que lo acerque a la hipótesis verdadera. También ocurre que, a medida que termina más experimentos de una serie, se encuentra con que las hipótesis aumentan en lugar de disminuir. Aunque elimina algunas de las hipótesis antiguas, se le hacen patentes otras nuevas conforme entiende mejor el problema experimental. ¡Hasta parecería que hace una serie divergente de experimentos en lugar de una serie convergente! En realidad, converge, pero el conjunto de las hipótesis potenciales es mucho más grande de lo que se imaginó al principio. VENTAJAS
A partir de nuestra exposición, se le harán obvias la mayoría de las ventajas de un enfoque de series convergentes. Tiene mucha más flexibilidad que en un gran experimento factorial. En éste, tiene que decidir sobre los factores y los niveles de los factores antes de iniciar el experimento, y luego quedará atado a ese diseño predeterminado. Una mala decisión puede destruir una gran inversión de tiempo y dinero. Sin embargo, una serie convergente ofrece muchos puntos para decidir. Usted puede escoger nuevas variables independientes o niveles en cada uno de estos puntos. También puede ser más eficaz ya que no necesita desperdi-
09Martin171-192.indd 189
8/5/08 17:22:18
190
Capítulo nueve
ciar el tiempo investigando qué factores y niveles tienen poco efecto en la variable dependiente. Un diseño de series convergentes también incorpora las replicaciones. Cada vez que muestra que un resultado experimental es reproducible, gana prestigio en la comunidad científica. Si hubiera realizado los tres experimentos de nuestro ejemplo de las palabras vulgares, habría replicado o repetido tres veces el resultado experimental básico de que las palabras vulgares requieren exposiciones más largas, lo que daría una prueba convincente de la confiabilidad de dicho resultado. DESVENTAJAS
Los diseños de series convergentes también tienen pequeñas desventajas. Es difícil, y a veces imposible, determinar cómo interactúan las variables si son manipuladas entre experimentos. En ciertas circunstancias, cabe combinar dos experimentos de una serie convergente ■ TABLA 9-1 Resumen de las ventajas y desventajas de los diseños experimentales de dos niveles, multinivel, factorial y series convergentes Ventajas
Desventajas
Experimento de dos niveles
Es eficaz para determinar si una variable tiene algún efecto. Los resultados son fáciles de interpretar y analizar. Es adecuado para probar una teoría. Es útil para comparaciones aplicadas.
Uno no puede inferir la forma de las funciones. La interpolación y la extrapolación son peligrosas. Las teorías complejas son difíciles de probar.
Experimento multinivel
Uno puede inferir la forma de las funciones. El rango de la variable independiente es menos crucial.
Requiere más participantes o tiempo. El contrabalanceo es más laborioso. Los cálculos estadísticos son más difíciles.
Experimento factorial
Uno puede investigar las interacciones. Agregar factores disminuye la variabilidad e incrementa la sensibilidad estadística. Aumenta la capacidad de generalizar sin disminuir la precisión.
Los experimentos se hacen grandes conforme se agregan más factores. Los cálculos estadísticos son más difíciles. Las interacciones de orden superior son a veces difíciles de interpretar.
Experimento de series convergentes
Ofrecen más flexibilidad que los grandes experimentos factoriales. Incluyen las replicaciones.
Las interacciones son difíciles de evaluar. Las comparaciones entre experimentos son también entre sujetos, con dificultades asociadas. Se debe analizar el experimento previo antes de hacer el siguiente.
Diseño
09Martin171-192.indd 190
8/5/08 17:22:18
Cómo planear experimentos de una sola variable, de variables múltiples y de series convergentes
191
para analizarlos como un único experimento factorial entre sujetos. Sin embargo, si le interesan sobre todo los efectos interactivos, debe realizar un experimento factorial. La segunda desventaja es que al comparar los resultados de experimentos separados de la serie, siempre hace una comparación entre sujetos con todas las desventajas de los diseños entre sujetos (véase el capítulo 8). Por último, cuando utiliza un diseño de series convergentes, debe analizar e interpretar los resultados de un experimento antes de empezar el siguiente. Se llegan a necesitar varias semanas y hasta meses para terminar tal análisis. Por esta razón, muchos investigadores trabajan en más de una serie a la vez, de manera que puedan realizar un experimento de una mientras analizan un experimento de otra. Considerando las ventajas y desventajas de los diseños de las series convergentes, es fácil ver por qué el método se ha vuelto tan popular en años recientes. Ofrece una manera muy eficaz y flexible para investigar tanto los problemas de investigación aplicados como los básicos. En la tabla 9-1 se da una referencia práctica que resume las ventajas y desventajas de todos los diseños experimentales que hemos examinado en este capítulo.
■ Resumen Cuando escoge un problema de investigación que vale la pena estudiar, debe seleccionar el diseño experimental. El diseño más simple presenta dos niveles de una sola variable independiente. Este diseño constituye una manera de determinar con rapidez si la variable independiente tiene algún efecto en el comportamiento de los participantes. Tales experimentos también son fáciles de interpretar y analizar; en algunos problemas teóricos y aplicados, proporcionan toda la información necesaria. Sin embargo, es posible también que estos experimentos simples no le informen acerca de la forma de la relación experimental, lo que vuelve arriesgadas la interpolación y la extrapolación. Agregar niveles a la variable independiente le dará una mejor idea de la relación funcional entre las variables independientes y dependientes. También es menos crucial escoger un rango para la variable independiente. Una desventaja de los experimentos multinivel es que requieren más tiempo y esfuerzo. También son un poco más difíciles de interpretar y analizar. El diseño experimental de variable múltiple más utilizado es el diseño factorial. En este diseño, las variables independientes, a veces llamadas factores, se reúnen de manera que los niveles de cada una aparecen en combinación con los niveles de todas las demás variables. Si se combinan los factores intrasujeto con los factores entre sujetos, se dice que el experimento utiliza un diseño factorial mixto. Los diseños factoriales permiten investigar interacciones. Cada vez que agrega un factor, se incrementa la capacidad de generalizar y la precisión de los resultados, al tiempo que disminuye la variabilidad estadística. Por el otro lado, los grandes experimentos factoriales llevan mucho tiempo y son caros. El diseño puede llegar a ser tan grande que se requiera una serie de experimentos pequeños o una metodo-
09Martin171-192.indd 191
8/5/08 17:22:18
192
Capítulo nueve
logía de la superficie de respuesta. A veces es difícil interpretar los resultados, particularmente cuando no se respetan las premisas estadísticas del análisis de varianza. Es posible aplicar un diseño de series convergentes en lugar de un diseño factorial complejo. Este diseño permite descubrir operaciones convergentes, que eliminan progresivamente las hipótesis hasta que sólo queda una que explica todos los datos. Los diseños de series convergentes ofrecen la ventaja de la flexibilidad y ya abarcan las replicaciones. Sin embargo, es difícil evaluar las interacciones entre factores que varían entre experimentos. Hay que manipular estos factores con un enfoque entre sujetos y analizar un experimento antes de comenzar el siguiente.
09Martin171-192.indd 192
8/5/08 17:22:19
10
Cómo diseñar investigación que no es experimental La tarea que enfrentan quienes tratan de interpretar los resultados de los cuasiexperimentos es, básicamente, la de separar los efectos de un tratamiento de los que se debieron a la desigualdad original entre las unidades promedio de cada grupo de tratamiento. T. D. COOK Y D. T. CAMPBELL (1979)
En lugar de estudiar mil ratas durante una hora cada una o cientos de ratas durante diez horas cada una, es probable que el investigador estudie una rata durante mil horas. B. F. SKINNER (1966)
H
asta ahora nos hemos concentrado en los diseños experimentales; pero no siempre es posible o deseable diseñar un experimento para responder una pregunta en particular. En este capítulo analizamos tres maneras de realizar una investigación que no sea estrictamente experimental. La primera, la cuasiexperimental, sigue muchas reglas de la experimentación que hemos aprendido, pero como no asigna al azar los participantes a los niveles de la variable independiente, debe utilizar diseños cuasiexperimentales para minimizar las posibles amenazas a la validez interna que se presenten. Los diseños de sujeto único y línea base con N pequeña constituyen el segundo grupo de diseños no tradicionales. En este caso, debido a que la disponibilidad de los participantes es limitada o a que se quiere mostrar un resultado claro de la manipulación en cada participante, se establecen reglas para observar los efectos sin grupos control ni contrabalanceo intrasujeto. La tercera forma no tradicional de investigación es la encuesta o el cuestionario, en la que se emplea un diseño correlacional, en lugar de un diseño experimental.
■ Los cuasiexperimentos (y diseños no experimentales) Recordemos del capítulo 2 que una de las opciones para la asignación de circunstancias es convertirlas en variables aleatorias. En el capítulo 1 también se hace énfasis a la importancia 193
10Martin193-226.indd 193
8/5/08 17:24:49
194
Capítulo diez
de que se presente una verdadera aleatorización. Si no tenemos la seguridad de que se ha empleado un verdadero proceso de aleatorización, la circunstancia puede variar de manera sistemática junto con los niveles de la variable independiente. Es una buena forma de decir que hemos permitido la llegada de la confusión. Si existe la posibilidad de una confusión, debemos estar conscientes de todas las probables amenazas a la validez interna analizadas en el capítulo 2, como la historia, maduración, selección, mortalidad, pruebas y regresión estadística. ¿Lo recuerda? El propósito de los diseños cuasiexperimentales es minimizar cada amenaza aun cuando no aleatoricemos nuestros grupos. Así esperamos evitar las variables de confusión. Para ilustrar el problema, supongamos que queremos determinar si hacer “evaluaciones del aprendizaje” (pequeños cuestionarios sin valor en créditos) al final de cada lección mejora el desempeño del grupo en los exámenes de un curso universitario particular. Por nuestro modelo experimental básico, sabemos que debemos utilizar cuando menos dos niveles de la variable independiente, quizá “evaluaciones del aprendizaje” en comparación con “ausencia de evaluaciones del aprendizaje”. Algunas circunstancias se convertirán en variables de control. Por ejemplo, probablemente impartiríamos el mismo material del curso a los participantes, presenten o no las evaluaciones del aprendizaje. Sin embargo, no podemos clonar a los estudiantes para un diseño entre sujetos ni utilizar un diseño intrasujeto porque no podemos deshacer lo que han aprendido del material desde el inicio. Así que haremos de los estudiantes asignados a cada grupo una variable aleatoria. Lo ideal sería poner los nombres de todos los estudiantes de la universidad que no hubieran tomado el curso en un sombrero y sacar 100 para asignarlos a una de dos clases: en una tendrían evaluaciones del aprendizaje; en la otra, no. Desafortunadamente, es probable que no nos permitan obligar a estos estudiantes a tomar determinada clase; en el mundo real, los estudiantes escogen las clases que quieren tomar. Tal vez podríamos aprovechar dos grupos que ya estén formados, uno por la mañana y el otro por la tarde, y asignarlos a los niveles de nuestra variable independiente. ¿Considera que habría diferencias entre los estudiantes que prefieren ir a clases por la mañana y los que van en la tarde? ¿Se imagina dimensiones en las que difieren estos estudiantes que pudieran estar relacionadas con su aprovechamiento? Supongamos ahora que los dos grupos tomaran la clase por la mañana, pero uno los lunes, miércoles y viernes, y el otro martes y jueves, en horario más largo. ¿Se imagina las dimensiones relacionadas con los días de la semana o la duración de la clase que pudieran afectar el aprovechamiento? Todavía tendríamos un problema más probable si el profesor sólo enseñara una sección del curso al semestre o año. ¿Cuántas dimensiones supone que varíen entre los estudiantes de otoño y primavera o los de un año al siguiente? Así, aunque mediante control y aleatorización evitamos que algunas circunstancias se conviertan en variables de confusión, no tenemos la opción de controlar la asignación de los participantes. En casi ninguna situación de campo tenemos la opción de convertir la asignación de los participantes en una variable aleatoria. Cuando no se puede asignar al azar a veces podemos emplear un diseño cuasiexperimental que nos permita minimizar o, en algunos
10Martin193-226.indd 194
8/5/08 17:24:51
Cómo diseñar investigación que no es experimental
195
casos, al menos evaluar las amenazas a la validez interna a las que nos exponemos al violar las estrictas leyes de la experimentación. Los diseños que estudiamos a continuación tienen algunas fortalezas para contrarrestar algunas amenazas, pero ninguno puede dar una seguridad absoluta de haberlas eliminado. Al analizar la cuasiexperimentación, conviene caracterizar los diseños mediante el sistema de notación utilizado por Cook y Campbell (1979) en su clásico libro sobre el tema. En este sistema, una X equivale a un nivel particular de la variable independiente (también llamada tratamiento). Una “O” equivale a la observación durante la cual se mide la variable dependiente. Los subíndices “1” a “n” se refieren al orden de la presentación de los tratamientos (X1 . . . Xn) o de la medición de las observaciones (O1 . . . On). Un guión entre los grupos experimentales indica que no fueron escogidos al azar. DISEÑOS NO EXPERIMENTALES Diseño de un grupo sólo con postest
Si mide el comportamiento de un grupo que ha sido expuesto a un solo nivel de la variable independiente, sigue un diseño de un grupo sólo con postest. Con nuestro sistema de notación, este diseño es semejante a: X
O
Cuando no tiene más información para complementar el resultado, el diseño no sirve para determinar el impacto del tratamiento. Por ejemplo, supongamos que una cadena de televisión transmite un programa sobre el Holocausto (X) y le interesa saber de qué manera influyó el programa en los conocimientos de la población sobre el suceso (O). Envía un cuestionario a un grupo y descubre que 76% de la gente está enterada de qué ocurrió durante el Holocausto. ¿Qué sabe acerca del impacto de la transmisión? ¿Acrecentó los conocimientos de la gente? ¿Los redujo? Si desconoce cuánto sabían antes del programa o cuál es el nivel de conocimiento de un grupo equivalente que no estuvo expuesto al programa, su resultado no le permitirá responder estas preguntas. Este diseño es similar al método de estudio de caso analizado en el capítulo 1. Sin embargo, algunas diferencias importantes hacen que, en general, los estudios de casos sean de mayor utilidad. En un estudio de caso, el investigador conoce mucho acerca del contexto en el que se observa el comportamiento. Por esta razón, aunque no hubiera una medición directa de los comportamientos previos a la observación, es posible inferirlos. Además, en un estudio de caso se observa más de un comportamiento. Estos comportamientos pueden formar una pauta que ofrece mucha más información de la que proporciona una variable dependiente única medida en un ambiente estéril de laboratorio.
10Martin193-226.indd 195
8/5/08 17:24:51
196
Capítulo diez
Diseños sólo con postest con grupos no equivalentes
Si agregamos al diseño que hemos analizado un postest en un grupo no equivalente, obtenemos un diseño como el siguiente: X
O O
Por no equivalente, me refiero a que el grupo se escogió según un mecanismo diferente al utilizado para elegir el grupo expuesto al tratamiento. En el ejemplo del Holocausto, supongamos que como había un partido de un equipo de futbol americano local, el programa no se transmitió en Miami. Podríamos decidir entonces utilizar una muestra seleccionada al azar de Miami como grupo no equivalente y enviarles el cuestionario. Si encontramos ahora una diferencia entre los grupos, ¿podemos atribuirla al programa de televisión? Miami tiene una población judía grande. ¿Cree que ser judío tiene alguna influencia en lo que conoce del Holocausto? El problema básico de un diseño sólo con postest con grupos no equivalentes es que cualquier diferencia observada podría deberse al tratamiento o las diferencias de selección entre los grupos. Cuanto más equivalentes sean los grupos, más convincente es la conclusión. Una manera de fortalecer la conclusión a ausencia de un pretest formal es tener la información de un pretest informal mediante la cual se puedan comparar los grupos. La información del pretest es más útil cuanto más se correlacione con la variable dependiente. Por tanto, compararíamos nuestras muestras en términos de edad, sexo, clase social, origen étnico y religión. Esta comparación nos daría una idea de la equivalencia de los grupos. Sin embargo, el diseño básico sigue siendo débil, por lo que debemos tener cuidado al interpretar los resultados de cualquier diseño sólo con postest con grupos no equivalentes. Diseño de un grupo con pretest y postest
Si tomamos de nuevo el diseño básico de un grupo sólo con postest, debemos considerar qué pasaría si también le aplicáramos a este grupo un pretest. Este diseño de un grupo con pretest y postest es como sigue: O1 X
O2
Este diseño se utiliza mucho en escenarios aplicados y es un mejoramiento del diseño de grupos no equivalentes en lo que se refiere a la selección. Al igual que en el ejemplo de los diseños intrasujeto, se seleccionan los mismos participantes para ambas observaciones, con lo que se reduce al mínimo la amenaza de la selección. Sin embargo, en los diseños intrasujeto, los procedimientos como contrabalancear el orden de la presentación y acercar
10Martin193-226.indd 196
8/5/08 17:24:51
Cómo diseñar investigación que no es experimental
197
las dos observaciones en el tiempo minimizan otras amenazas a la validez interna. Desafortunadamente, el diseño de un grupo con pretest y postest no abate estas otras amenazas. Si regresamos al ejemplo del Holocausto, ¿qué efecto considera que tendría un pretest que preguntara sobre los conocimientos del suceso histórico en un postest que evaluara la conciencia del Holocausto? Como se aprecia, en este caso el problema es la amenaza de la prueba. Si decidimos minimizar los problemas de la prueba aplicando el pretest con mucha anticipación al tratamiento, digamos un año antes, correríamos otros peligros. La historia podría conspirar en contra de nosotros en cuanto a que podría cambiar la conciencia del grupo algún acontecimiento relacionado con el Holocausto, además del programa, como la captura de un criminal de guerra. O, si en particular trabajamos con niños en edad escolar, la maduración podría influir. Si utilizáramos el pretest para seleccionar un grupo, la regresión causaría problemas. Por tanto, aunque el diseño de pretest resuelva el problema de la selección, se debe tener precaución con la interpretación debido a las demás amenazas a la validez interna. DISEÑOS CUASIEXPERIMENTALES
Los tres diseños analizados en la sección anterior reciben el nombre de diseños no experimentales, porque al utilizarlos no hay manera de evaluar muchas amenazas a la validez interna. Los diseños usados en esta sección se denominan diseños cuasiexperimentales ya que, aunque no cumplen con los requerimientos estrictos del modelo experimental básico, podemos evaluar muchas de las amenazas. No está dentro de las posibilidades de este libro cubrir exhaustivamente todos los diseños cuasiexperimentales, así que me concreto a mencionar varios que ilustran las dos clases principales. Para más detalles, consulte los excelentes libros de Cook y Campbell (1979) o Shadisch, Cook y Campbell (2002). Diseño de grupo control no equivalente con pretest y postest
El primer diseño utiliza un grupo control no equivalente que no se expone al tratamiento, y un grupo de tratamiento. A ambos grupos se les aplica un pretest y un postest. La notación del diseño es: O1 X
O2
O1 X
O2
Este diseño es quizá el más utilizado en los estudios del campo de las ciencias sociales. Permite evaluar la mayoría de las amenazas simples a la validez interna. El grado de preocupación por ciertas amenazas depende en gran medida del resultado experimental en particular. Si las calificaciones de los grupos en el pretest no muestran diferencias, podemos tener cierta confianza en que los grupos son relativamente equivalentes y se minimiza la posibilidad de una amenaza de selección o de regresión. Si las calificaciones del grupo control son iguales en el pretest y el postest, se minimizan las amenazas de la
10Martin193-226.indd 197
8/5/08 17:24:52
198
Capítulo diez
historia y la maduración. Ya que en ambos grupos se aplican las mismas pruebas, los efectos diferenciales en su aplicación deberían ser mínimos. Si el número de participantes que abandonan los dos grupos entre el pretest y el postest es diferente, el problema podría ser de mortalidad. Sin embargo, el diseño permite evaluar esta amenaza. El problema más grave al utilizar este diseño es tener una amenaza que interactúe con la selección. Si los dos grupos obtienen calificaciones equivalentes en el pretest, la amenaza de la interacción con la selección se reduce pero todavía es posible. Por ejemplo, aunque la escuela A recibe un tratamiento particular y la escuela B no lo recibe, es probable que en la escuela A contraten a un director nuevo que imponga nuevas normas a los maestros. La interacción entre la selección y la historia podría ser una amenaza para nuestras conclusiones. Nos deben preocupar más las interacciones con la selección cuando en el pretest los dos grupos reciben calificaciones muy diferentes. Por ejemplo, supongamos que nos interesa determinar si pagar por pieza a los obreros de una línea de ensamble incrementa la productividad. Solicitamos voluntarios a quienes se les reducirá el salario, pero que recibirán dinero extra por trabajo a destajo. En el pretest encontramos que los voluntarios son más productivos, pero calculamos que podemos comparar el tamaño de esta diferencia inicial con la diferencia en el postest. Sin duda, la diferencia es más grande en el postest. Ambos grupos mejoraron su productividad, pero el grupo que trabaja a destajo mejoró más. La conclusión es que pagar a destajo mejora la productividad. ¿No es así? Debido a que hubo una diferencia de productividad en el pretest, es probable que los voluntarios en el grupo de tratamiento no sólo hayan sido mejores en ese punto, sino que también hayan madurado (esto es, que aprendieron, que ganaron experiencia) más deprisa. Las habilidades de los trabajadores rara vez son estables y sabemos que se acrecentaron, porque incluso mejoró el grupo control. Cuando todos mejoran, no es ninguna sorpresa que los mejores trabajadores adelanten con más rapidez. El diseño básico no nos permite determinar el tamaño de esta interacción entre la maduración y la selección. Podríamos dividir el grupo de tratamiento mediante el pretest para tener alguna idea del efecto. Esto es, esperaríamos que los trabajadores menos hábiles del grupo de tratamiento mejoren con más lentitud que los demás. Sin embargo, tenemos un diseño diferente. El punto es que incluso cuando utiliza un diseño de grupo control no equivalente con pretest y postest, los resultados todavía están sujetos a amenazas como las interacciones de la selección. Variaciones. En lugar de detallar de manera exhaustiva todas las variantes de los diseños con grupo control no equivalente, sólo mencionaré unas cuantas posibilidades. Algunas veces, cuando no es posible ni práctico utilizar la misma prueba en el pretest y postest, se emplea un pretest sustituto. Es decir, en el pretest se mide alguna variable o variables que deberían correlacionarse con el postest. Por ejemplo, si quisiera evaluar los efectos de un nuevo método para enseñar álgebra, expondría un grupo al nuevo método al tiempo que enseñaría a otro con el método tradicional. En lugar de aplicar un pretest para evaluar el desempeño en álgebra a grupos que todavía no iniciaban el estudio de la materia, aplicaría un pretest sustituto que evalúa la aptitud matemática general.
10Martin193-226.indd 198
8/5/08 17:24:52
Cómo diseñar investigación que no es experimental
199
El pretest sustituto se emplea si no es posible aplicar un pretest, como cuando el tratamiento consiste en un hecho histórico imprevisible que afecta una porción de la población. Por otro lado, incluso cuando es posible administrar un pretest, la aplicación puede ser una amenaza para la validez interna, así que se utiliza una prueba sustituta para no exponer a los participantes al postest. En otros casos, cuando se requieren respuestas novedosas, es absurdo utilizar la misma prueba como pretest y postest. Por ejemplo, no tendría mucho sentido aplicar un examen final de un curso de introducción a la psicología antes de que los alumnos hayan oído las lecciones. Si la aplicación de las pruebas es una amenaza, podemos emplear muestras separadas para el pretest y el postest. En lugar de tomar una sola muestra para cada grupo que recibirá ambas pruebas, tomamos dos muestras para cada grupo, una para recibir el pretest y otra el postest. Por ejemplo, si un programa educacional se le da a un grupo y no al otro, los dos grupos pueden dividirse al azar para aplicarles a la mitad el pretest y a la otra mitad, más adelante, el postest. La debilidad obvia de este diseño es que depende por completo de que los grupos del pretest y el postest sean equivalentes. Si sospecha que haya diferencias entre los grupos en una dimensión relacionada con el tratamiento, el diseño es considerablemente débil. Otra manera de fortalecer el diseño básico del grupo control no equivalente con pretest y postest consiste en agregar observaciones del pretest en más de un intervalo. Agregar uno o más pretests nos ayuda a evaluar los efectos de dos posibles amenazas. Recuerde cuando decíamos que “los capaces se vuelven más capaces” y que esto causa una interacción entre maduración y selección. Si hubiéramos aplicado un pretest incluso más temprano, habríamos determinado si las calificaciones en esa prueba coinciden con la línea de la tendencia de cada grupo. En tal caso, tendríamos la justificación para concluir que esta interacción entre maduración y selección, más que el tratamiento, provocó la diferencia en el postest. Así, los dos pretests habrían establecido una tendencia de maduración y el postest habría sido interpretado como una continuación de esta tendencia. Un pretest adicional también sirve para evaluar los efectos de la regresión estadística. Si los grupos hubieran sido seleccionados de acuerdo con el primer pretest, los efectos de la regresión deberían aparecer en las calificaciones del segundo pretest como también en las calificaciones del postest. Otras variaciones que se emplean con menos frecuencia incluyen aquellas en las cuales existe un pretest, exposición al tratamiento, un postest, remoción del tratamiento, aplicación de otro postest, y así hasta el infinito (o posiblemente hasta el absurdo). Estos diseños se parecen a los diseños de línea base que analizamos más adelante. Sin embargo, a diferencia de los cuasiexperimentos, los experimentos de línea base recurren a muy pocos participantes y se examinan los datos de los individuos, en general sin la ayuda del análisis estadístico. En algunos casos, un grupo recibe el tratamiento con el que se espera que cambie la variable dependiente en una dirección y un segundo grupo recibe un tratamiento del que se espera que tenga el efecto opuesto. Por ejemplo, supongamos que dos grupos de trabajadores reciben parte de su pago por hora y parte por el número de piezas hechas. Podríamos imponer un tratamiento en el cual a un grupo se le pague sólo por la hora y al segundo, sólo por piezas. Si hubiéramos predicho que pagar por piezas aumenta la productividad, espe-
10Martin193-226.indd 199
8/5/08 17:24:52
200
Capítulo diez
■ TABLA 10 -1 Procedimientos para conducir varios diseños de grupo control no equivalente con pretest y postest Tiempo 1
Tiempo 2
Tiempo 3
Básico Grupo control no equivalente con pretest y postest
Aplicación de la prueba en el grupo 1 Aplicación de la prueba en el grupo 2
Aplicar tratamiento
Con pretest sustituto
Aplicación de la prueba sustituta en el grupo 1 Aplicación de la prueba sustituta en el grupo 2
Aplicar tratamiento
Aplicación de la prueba en el grupo 1
Sin tratamiento
Aplicación de la prueba en el grupo 2
Aplicación de la prueba a la primera mitad del grupo 1 Aplicación de la prueba a la primera mitad del grupo 2
Aplicar tratamiento
Aplicación de la prueba a la segunda mitad del grupo 1 Aplicación de la prueba a la segunda mitad del grupo 2
Aplicación de la prueba en el grupo 1 Aplicación de la prueba en el grupo 2
Aplicación de la prueba en el grupo 1 Aplicación de la prueba en el grupo 2
Pretest y postest en muestras separadas
Observaciones de pretest en más de un intervalo
Sin tratamiento
Sin tratamiento
Tiempo 4
Aplicación de la prueba en el grupo 1 Aplicación de la prueba en el grupo 2
Aplicar tratamiento Sin tratamiento
Aplicación de la prueba en el grupo 1 Aplicación de la prueba en el grupo 2
Nota: Los participantes de los grupos 1 y 2 no fueron asignados de manera aleatoria a las condiciones de tratamiento y no tratamiento y son considerados por tanto no equivalentes.
raríamos una disminución en el primer grupo y un incremento en el segundo. Un resultado que apoye nuestros pronósticos es un fundamento sólido para nuestra hipótesis. Hemos analizado apenas unas variaciones posibles del diseño básico con grupo control no equivalente, las que se muestran en la tabla 10-1. Hay otros diseños, y encontrará la información en los libros recomendados al final del capítulo. Diseños de series de tiempo interrumpidas
La segunda clase importante de los diseños cuasiexperimentales recibe el nombre de diseños de series de tiempo interrumpidas: un solo grupo es observado múltiples veces antes y después del tratamiento. O1 O2 O3 O4
10Martin193-226.indd 200
O5 X
O6 O7 O8 O9 O10
8/5/08 17:24:52
Cómo diseñar investigación que no es experimental
201
El resultado más fácil de interpretar de este diseño es un cambio instantáneo y permanente respecto al nivel de una línea plana. Por ejemplo, si utilizáramos un nuevo esquema de pago para los trabajadores y descubriéramos de inmediato que la productividad mejora 10% y si este cambio se mantuviese durante el curso del estudio, nos sentiríamos bastante seguros de que el nuevo esquema de pagos causó el cambio. Sin embargo, aun con este resultado ideal, de todos modos tenemos que preocuparnos por las posibles amenazas, como la historia o la mortalidad. Quizás algún hecho histórico coincidió con la introducción del tratamiento. También es posible, aunque improbable, que al tiempo en que se introdujo el tratamiento, algún suceso desconocido hizo que varios participantes abandonaran el estudio.
ENTRADAS VISITANTES MEDIAS
MED
MEDIA
S
ME
ME
SERIES DE TIEMPO INTERRUMPIDAS
Con los diseños de las series de tiempo interrumpidas se excluyen o evalúan otras amenazas potenciales a la validez interna. Por ejemplo, la selección e interacciones con las selecciones no son problemas, ya que el mismo grupo se utiliza en todo el experimento. Cualquier efecto de la aplicación de la prueba o de la regresión estadística debería haber desaparecido antes de introducir el tratamiento. En general, tenemos que estar en posición de excluir la maduración como problema, ya que sus efectos son lentos; por tanto, esperaríamos que la tendencia fuera una recta, no un cambio discontinuo. Cuando el cambio de la variable dependiente se retrasa, es temporal o se refleja en la pendiente de una tendencia ascendente o descendente, en lugar de en todo el nivel de una
10Martin193-226.indd 201
8/5/08 17:24:53
202
Capítulo diez
línea plana, planteamos nuestra conclusión con menos seguridad. En este caso, a veces complejas técnicas estadísticas ayudan a comprender los efectos del tratamiento. Variaciones. Como con el primer tipo de diseño, es posible hacer variaciones de un diseño simple de series de tiempo. Una variación que agregará una fortaleza considerable a una conclusión es la adición a las series de tiempo de un grupo control no equivalente sin tratamiento. En esta variación, se hacen mediciones en un segundo grupo no equivalente en cada uno de los intervalos de observación, pero no se aplica ningún tratamiento durante las series. El grupo control permite evaluar los efectos de la historia como una amenaza, ya que es probable que los dos grupos se vean afectados de igual manera por el hecho histórico. Si los dos grupos son seleccionados de manera diferente, puede ocurrir una interacción entre selección e historia. Sin embargo, esta amenaza es un problema solamente en el caso improbable de un suceso histórico único que ocurra al mismo tiempo que la presentación del tratamiento y sólo para el grupo que lo recibe. Cuando se espera que los efectos del tratamiento sean reversibles, se puede utilizar un diseño de series de tiempo interrumpidas con eliminación de tratamiento. Después de terminar el diseño básico, se suprime el tratamiento y se realiza otra serie de observaciones. Este diseño es una combinación de dos diseños básicos de series de tiempo: una en la que la presencia del tratamiento es el tratamiento en sí y otra en la que su ausencia es el tratamiento. En realidad, uno puede agregar y retirar el tratamiento tantas veces como se quiera, para crear replicaciones múltiples.1 Cada replicación refuerza la seguridad en el efecto causal del tratamiento. Este diseño es similar a los diseños de línea base que veremos adelante. Otra manera de aprovechar las repeticiones es el recurso a grupos no equivalentes más la introducción del tratamiento en diferentes puntos de la serie de observaciones de los dos grupos. Tal diseño recibe el nombre de series de tiempo interrumpidas con replicaciones cambiantes. El diseño ofrece una manera de contrarrestar o evaluar la mayor parte de las amenazas a la validez interna, como la historia y la maduración. Además, al incluir una replicación en una muestra de una población diferente, el diseño mejora la validez externa de la conclusión experimental. En la tabla 10-2 se resumen los diseños de las series de tiempo interrumpidas analizadas en esta sección. Análisis estadístico de cuasiexperimentos
Las técnicas para hacer análisis estadístico de datos cuasiexperimentales han mejorado notablemente los últimos años. En los libros que se recomiendan al final del capítulo se encuentran pruebas estadísticas complejas. Estoy seguro de que observará que varios de los diseños presentados aquí son similares a los diseños de línea base analizados a continuación. Sin embargo, una diferencia importante entre los diseños de línea base y los cuasiexperimentales es que mientras los primeros tienen muy pocos participantes, de manera que se imposibilita el análisis estadístico, los segundos pueden ser analizados con el mismo rigor estadístico 1
Por razones éticas, si el tratamiento resulta ser benéfico, se hace necesario terminar las series con el tratamiento en vigor.
10Martin193-226.indd 202
8/5/08 17:24:54
10Martin193-226.indd 203
Prueba en el grupo 1 Prueba en el grupo 2
Prueba en el grupo 1
Aplicar tratamiento Prueba en el grupo 2 Prueba en el grupo 3
Prueba en el grupo 1 Prueba en el grupo 2
Prueba en el grupo 1
Prueba en el grupo 1 Prueba en el grupo 2 Prueba en el grupo 3
Prueba en el grupo 1
Prueba en el grupo 1 Prueba en el grupo 2
Suprimir tratamiento
Prueba en el grupo 1 Prueba en el grupo 2 Aplicar tratamiento
Diseño básico de series de tiempo interrumpidas Prueba en Aplicar Prueba en el grupo 1 tratamiento el grupo 1 Con adición de un grupo control no equivalente sin tratamiento Prueba en Aplicar Prueba en el grupo 1 tratamiento el grupo 1 Prueba en Sin tratamiento Prueba en el grupo 2 el grupo 2 Con eliminación del tratamiento Aplicar Prueba en Prueba en tratamiento el grupo 1 el grupo 1 Con replicaciones cambiantes Prueba en Prueba en el grupo 1 el grupo 1 Aplicar Prueba en tratamiento el grupo 2 Prueba en Prueba en el grupo 3 el grupo 3
Prueba en el grupo 1 Prueba en el grupo 2 Prueba en el grupo 3
Tiempo 6
Tiempo 4
Tiempo 5
Tiempo 3
Tiempo 7
Prueba en el grupo 1 Prueba en el grupo 2 Prueba en el grupo 3
Prueba en el grupo 1
Prueba en el grupo 1 Prueba en el grupo 2
Prueba en el grupo 1
Nota: Los participantes de los grupos 1, 2 y 3 no fueron asignados al azar a las condiciones del tratamiento y, por tanto, se consideran no equivalentes.
Prueba en el grupo 1
Tiempo 2
Prueba en el grupo 1
Tiempo 1
■ TABLA 10 -2 Procedimientos para realizar varios diseños de series de tiempo interrumpidas
Cómo diseñar investigación que no es experimental
203
8/5/08 17:24:54
204
Capítulo diez
que los diseños experimentales totalmente aleatorizados. Ciertamente, no hay que descartar la cuasiexperimentación por las dificultades del análisis estadístico.
Ventajas La principal ventaja de los cuasiexperimentos es que permiten hacer investigaciones que antes no eran posibles. La cuasiexperimentación ha traído una nueva caja de herramientas a los psicólogos interesados en los problemas sociales, la evaluación clínica y los programas educativos y que quieren investigar estos temas en el mundo real. Aunque debe tenerse el cuidado de determinar si hay amenazas a la validez interna, por lo menos sabemos cuáles podrían ser esas amenazas. El diseño hace posible valorarlas casi todas y ver si presentan algún problema.
Desventajas Antes de que me emocione demasiado con la cuasiexperimentación, permítame señalar que también tiene sus desventajas. Aun con nuestro mayor esfuerzo, es posible que encontremos amenazas a la validez interna. Es cierto que podemos detectarlas cuando ocurren, pero descubrirlas invalida de alguna manera nuestros resultados. Por ejemplo, si utilizamos un diseño básico con un grupo control no equivalente con pretest y postest y descubrimos una diferencia en ambas pruebas en el grupo control, se vuelve problemático interpretar cualquier cambio en el grupo de tratamiento. Un segundo problema es que estos diseños son más complejos y requieren más tiempo y esfuerzo que un experimento tradicional. Las mediciones deben tomarse varias veces para cada condición. Como mencioné, las pruebas estadísticas para diseños cuasiexperimentales, aunque ahora son posibles, son más difíciles de hacer y de ordinario no se enseñan en los cursos básicos. Pese a estas desventajas, las ciencias del comportamiento han sido criticadas, unas veces por realizar investigaciones sólidas sobre problemas simples pero triviales o investigaciones frágiles sobre problemas complejos e importantes. Los avances en la cuasiexperimentación han permitido investigar problemas complejos e importantes. Debemos tener el cuidado de limitar nuestras interpretaciones de la investigación cuasiexperimental al compararla con la investigación experimental, pero con estos diseños es cuando menos posible investigar una variedad más amplia de problemas que con los puros diseños experimentales.
■ Diseños de sujeto único y de línea base con N pequeña DATOS INDIVIDUALES Y AGRUPADOS
Algunos investigadores argumentan que la manera en que la mayoría de los psicólogos realizan los experimentos es engañosa y sin sentido. El revolucionario más vociferante de este grupo ha sido Sidman (1960), quien sostiene que los experimentos tradicionales que hemos aprendido dicen poco acerca del comportamiento individual. Sidman señala que los experimentos se refieren al comportamiento de algún participante promedio imaginario que
10Martin193-226.indd 204
8/5/08 17:24:54
Cómo diseñar investigación que no es experimental
205
no refleja exactamente a ningún participante real. Sostiene que la mayoría de los experimentadores reúnen grupos y pretenden que el comportamiento de sus miembros se asemeja al comportamiento promedio del grupo. Dice que hay momentos en los que el comportamiento de un individuo en el grupo no se parece al comportamiento promedio del grupo. Para ilustrar, consideremos un experimento diseñado para descubrir qué tan pronto puede una persona aprender una simple analogía mediante ejemplos. Sea el primer reactivo, digamos, editar es a ratide como recapitulación es a _______. La respuesta es nóicalutipacer, ya que es recapitulación escrita al revés. El siguiente reactivo sería: mascota es a atocsam como herramienta es a ________. Nuevamente la respuesta es herramienta escrita al revés o atneimarreh. Le damos a cada participante tres segundos para resolver un reactivo antes de que le presentemos el siguiente. Esperaríamos que el aprendizaje ocurra o que no ocurra: todo o nada. Asumimos que en algún punto el participante diría ajá o eureka y en adelante tendría cada respuesta correcta. En la figura 10-1 se muestran los resultados ficticios de 10 personas. En la figura 10-2 se muestra la curva del grupo que representa a la persona promedio. Se aprecia que la curva del grupo de la figura 10-2 no representa a ninguna de las curvas individuales de la figura 10-1. La curva del grupo nos llevaría a concluir que la gente aprende la solución de manera gradual; sin embargo, en realidad, todos los individuos pasaron de no resolver ningún reactivo a resolverlos todos a la primera. Debido a tales discrepancias, Sidman cree que el desempeño del grupo rara vez dice mucho acerca de cómo se desempeñan los individuos. Recordará que vimos en el capítulo 8 que Poulton (1973) adoptó una posición muy diferente sobre este tema y llegó a sostener que los diseños intrasujeto están errados y que nada más las manipulaciones entre sujetos, en las que se utilizan grupos, se dejan interpretar con facilidad. Los psicólogos decidieron emplear grupos porque el comportamiento de los individuos es muy variable y porque es probable que la variabilidad de un participante sea anulada por la de otros individuos que varían en dirección opuesta. Ahora bien, Sidman dice que la variabilidad no es inherente a los participantes, sino que es causada por que el experimentador no controla todas las variables que afectan al individuo. Si los experimentadores logran un control adecuado del comportamiento, ya no necesitan grupos grandes. Al realizar un experimento de línea base, los experimentadores demuestran que han logrado tal control. PROCEDIMIENTOS DE LÍNEA BASE
Para ilustrar un experimento de línea base siguiendo la propuesta de Sidman, el llamado análisis experimental de la conducta, consideremos un experimento diseñado para descubrir si recurrir al castigo cambia el comportamiento de una persona con parálisis cerebral. Supongamos que el terapeuta trabaja con un cliente que tiene esta condición y que desea mejorar sus habilidades de entrevista.2 Los individuos con parálisis cerebral tienen problemas para 2
Deseo darle las gracias a David A. Sachs, de Las Cruces, Nuevo México, por este ejemplo en particular. Sachs desarrolló la técnica descrita, aunque los resultados que informo aquí son ficticios.
10Martin193-226.indd 205
8/5/08 17:24:55
206
Capítulo diez
Participante
Participante
Reactivos
Reactivos
Reactivos
Reactivos
Reactivos
Reactivos
Reactivos
Reactivos
Reactivos
Precisión
Reactivos
FIGURA 10-1 Posibles resultados de 10 participantes en un experimento de analogía. Cuando el individuo aprende la regla para solucionar este problema, acierta en todos los reactivos subsecuentes.
10Martin193-226.indd 206
8/5/08 17:24:55
207
Precisión
Cómo diseñar investigación que no es experimental
Reactivos FIGURA 10-2 Curva grupal de los participantes indicados en la figura 10-1. Observe que es una mala representación del comportamiento de cualquier individuo.
controlar los movimientos de la cabeza y, por eso, pierden el contacto visual. Con el fin de incrementar el contacto visual, que es un aspecto de una buena entrevista, el terapeuta decide diseñar un procedimiento en el que el cliente recibe una suave descarga eléctrica cada vez que rompe el contacto visual. El cliente, que desea mejorar sus habilidades sociales, acepta el procedimiento con las descargas.3 El primer paso en este experimento es establecer una línea base, que es un estado estable en el que la tasa de respuestas cambia muy poco. Uno de los problemas persistentes de los experimentos de línea base es determinar “cuánto es tantito”. Los métodos para determinar si la línea base ha alcanzado un estado estable va del criterio estadístico “no más de 3% del cambio en la tasa de respuestas entre sesiones” a una simple inspección visual de los datos en búsqueda de fluctuaciones o tendencias obvias. Cuando se determina la línea base, el experimentador empieza la manipulación experimental. En nuestro ejemplo, el terapeuta podría hacer que el cliente se presentara media hora todos los días a una entrevista simulada. Durante la entrevista, el terapeuta acciona un interruptor escondido siempre que los ojos del cliente pierdan el contacto visual. El interruptor está conectado a un reloj, para determinar el tiempo total de contacto visual en la media hora de la sesión. Después de varias sesiones, cuando el terapeuta considera que se ha alcanzado un desempeño estable de línea base (esto es, un tiempo constante de contacto visual por sesión), empieza el procedimiento de la descarga eléctrica. Siempre que el cliente interrumpa el contacto visual, el experimentador acciona el interruptor y el cliente recibe una descarga leve en el antebrazo. Luego, el experimentador trata de determinar si el contacto visual cambia con respecto a su línea base. En la figura 10-3 se muestra un posible resultado de este experimento. El terapeuta decidió que la línea base estable se había logrado después de la quinta sesión y empezó con las descargas en la sexta sesión. Una vez que empezaron las descargas, el contacto visual del 3
El acuerdo del cliente es necesario aunque no siempre es un requisito ético suficiente.
10Martin193-226.indd 207
8/5/08 17:24:56
208
Capítulo diez
EL PRIMER PASO ES ESTABLECER UN ESTADO ESTABLE…
Tiempo de contacto visual (en minutos)
cliente se incrementó notablemente. Para la décima sesión, el contacto visual había alcanzado un estado estable de transición4 y el experimentador dejó de aplicar las descargas. En las sesiones 12 a 14, el cliente retornó al comportamiento original de línea base. Un experimentador debe llevar a cabo las operaciones descritas en el ejemplo para tener un experimento de línea base verdadero: establecer una línea base estable, aplicar la manipulación experimental, establecer un estado estable de transición y luego mostrar reversibilidad: recuperar la línea base original al suprimir la manipulación experimental.
Sin descargas (línea base)
Descargas (transición) Sesiones
Sin descargas (recuperación de la línea base)
FIGURA 10-3 Resultados posibles de un experimento en el que el tiempo del contacto visual de un cliente con parálisis cerebral fue medido durante entrevistas simuladas de 30 minutos. Las primeras cinco sesiones proporcionaron una línea base. Las descargas se aplicaron en las sesiones sexta a décima. La recuperación de la línea base ocurrió en las sesiones 11 a 14. 4
En el trabajo clínico, el estado estable de transición se llama también tratamiento o modificación del estado.
10Martin193-226.indd 208
8/5/08 17:24:56
Cómo diseñar investigación que no es experimental
209
La justificación del método es que una vez que se ha obtenido la línea base, es improbable que una variable de confusión no controlada empiece a afectar el comportamiento en el mismo ensayo en que se hace la manipulación experimental. Aun si ocurriera este suceso improbable, son muy pocas las posibilidades de que una variable de confusión deje de tener efecto en el mismo ensayo en el que se suspende la manipulación experimental. Para ser más convincente, un experimentador podría realizar una replicación intrasujeto: repetir el procedimiento en el mismo individuo una o más veces. En el ejemplo, el experimentador podría aplicar nuevamente las descargas al cliente en la sesión 15, continuar hasta lograr un estado estable de transición, discontinuar las descargas y recuperar la línea base original. Cada vez que se repita el efecto, se incrementa nuestra seguridad de que el cambio en el comportamiento fue causado por la manipulación experimental y no por una variable de confusión no controlada. Se trata de un diseño de sujeto único, pero realizar una replicación entre sujetos, repetir el experimento con algunos individuos adicionales, también reforzaría nuestra confianza en el resultado. Siempre podríamos evaluar los resultados examinando datos de los individuos, más que los del grupo, pero poder hacer tal replicación entre sujetos fortalece nuestra conclusión. VENTAJAS
La mayor ventaja de un experimento de línea base es que constituye una poderosa manera de observar el comportamiento del individuo. Por ejemplo, si los resultados mostrados en la figura 10-3 fueran datos reales, casi acabarían por convencerme de que el contacto visual pueda ser controlado mediante descargas contingentes. Usted también se sentiría convencido, ¿no es verdad? Los resultados también son fáciles de interpretar; tanto, que los experimentadores no aplican pruebas estadísticas. Los investigadores que utilizan diseños de línea base afirman que si se necesita una prueba estadística para convencer a otros investigadores de que el efecto descubierto es real y no debido a variaciones aleatorias, o el efecto no es tan fuerte como para que tenga importancia o el investigador tiene que perfeccionar sus técnicas para obtener un mejor control sobre el comportamiento (esto es, eliminar la variabilidad indeseada). En un experimento de grupo tradicional, si utiliza muchos participantes en cada grupo, se llega a encontrar algún efecto que es estadísticamente significativo pero de poca importancia práctica. Esto es, puede haberse elegido una variable independiente que tiene un efecto sobre el comportamiento, pero un efecto pequeño en comparación con otras variables más importantes. Un procedimiento experimental de línea base no es sensible a los efectos baladíes. La variabilidad debida a las variables independientes más importantes opaca esos efectos reales pero pequeños. Por consiguiente, un procedimiento de línea base garantiza que cualquier efecto encontrado tenga la magnitud suficiente para ser de importancia. Otra ventaja del procedimiento es la flexibilidad que da para decidir cuándo imponer un nivel de la variable independiente y qué nivel debe ser. Antes de realizar un experimento ordinario, el investigador debe escoger el número de ensayos que va a presentar y los nive-
10Martin193-226.indd 209
8/5/08 17:24:57
210
Capítulo diez
les de la variable independiente. Debido a que la mayoría de las pruebas estadísticas lo requieren, el investigador necesita reunir el mismo número de puntos de datos para cada nivel de la variable independiente. En cambio, los investigadores que trabajan con diseños de línea base pueden tomar en cualquier momento del experimento la decisión de reunir más datos del nivel actual o cambiar de nivel. En el caso de nuestro ejemplo, si el terapeuta hubiera sentido la necesidad de tener más datos en la condición de descarga, tenía la flexibilidad de hacer más sesiones en esa condición antes de tratar de recuperar la línea base. El terapeuta también pudo haberse decidido a utilizar otro nivel de la variable independiente cuando ya estaba en marcha el experimento. Supongamos que el cambio de comportamiento no era muy convincente a la intensidad de la descarga escogida. Después de recuperar la línea base y alcanzar un desempeño estable, el investigador podría intentar una descarga de mayor intensidad en el siguiente grupo de ensayos. Por tanto, no se requiere que el investigador utilice niveles predeterminados de la variable independiente. Además de las ventajas de la facilidad de interpretación, eliminación de las pruebas estadísticas, garantía de descubrir efectos lo bastante grandes y flexibilidad, los experimentos de línea base pueden utilizarse con un solo individuo. Los terapeutas que tienen nada más un cliente con parálisis cerebral o los experimentadores con un solo participante que tenga algún trastorno, capacidad o dote inusitado no podrían estudiarlos con un diseño experimental tradicional. Tendrían que optar por un procedimiento de línea base. DESVENTAJAS
Aunque los experimentos de línea base ofrecen muchas ventajas, la mayoría de los experimentadores todavía se apegan a los tradicionales diseños experimentales de grupos, porque no pueden cumplir con las premisas de los experimentos de línea base. Por ejemplo, la premisa de que los efectos experimentales pueden ser reversibles requiere que el individuo vuelva al nivel original del comportamiento al final del experimento. Vimos en el capítulo anterior que muchos de los efectos potenciales de la secuencia y el orden exigen un contrabalanceo cuando se emplea un diseño intrasujeto. Un ALGUNOS PROCESOS experimento de línea base es una clase especial de un diseño SON IRREVERSIBLES intrasujeto en el cual es imposible establecer un contrabalanceo eficaz. Por tanto, cualquier variable de confusión que cambie de manera sistemática impide recuperar la línea base original. Si el comportamiento no vuelve a su estado original al suprimir la manipulación experimental, no sabemos si atribuir el comportamiento del estado de transición a la manipulación o alguna variable de confusión. Por este motivo, muchos campos tradicionales de la psicología no se dejan investigar mediante procedimientos de línea base. Entre los campos en los que es patente esta impropiedad están el ciclo de vida, memoria y ciertos sectores del aprendizaje. La mayoría de los
10Martin193-226.indd 210
8/5/08 17:24:57
Cómo diseñar investigación que no es experimental
211
Duración de la llamada (en segundos)
cambios que tienen lugar durante los experimentos en estos campos no pueden volver a su condición inicial (“ahora olvide todas las palabras que aprendió”). Una segunda desventaja es que los diseños de línea base no siempre revelan efectos pequeños pero importantes. Supongamos que trabaja en una compañía telefónica y que tiene el encargo de averiguar si el tiempo que tarda un operador asistente en encontrar un número se puede reducir con un sistema de búsqueda por computadora, en lugar del directorio telefónico ordinario. Decide utilizar un diseño de línea base. Con cada solicitud, va a registrar el tiempo de la llamada. Hará que el operador consulte un directorio telefónico estándar hasta lograr una línea base. Luego, hará que el operador adopte un sistema en el que captura la información en una computadora, que devuelve los números del teléfono. Al final, hará que el operador vuelva a usar al libro. En la figura 10-4 se muestran algunos resultados posibles. Una inspección visual de la figura no lo convence ni a usted ni a mí de que hay una diferencia entre utilizar un sistema computarizado y el directorio telefónico estándar. En otras palabras, el estado de transición no se diferencia de la línea base. Sin embargo, el promedio de la llamada con el sistema computarizado es tres segundos más breve que la llamada promedio con el sistema del directorio. Si hubiéramos realizado un experimento ordinario, en la prueba estadística se habría demostrado que esa diferencia es significativa. ¿Pero sería un efecto importante? Sí, porque cada segundo ahorrado en una llamada de asistencia al acumularse ahorra a las compañías telefónicas millones de dólares. ¡Vaya que es importante para las telefónicas! Los defensores del diseño de línea base explican que la variabilidad es culpa del experimentador y acaso tengan razón tratándose de ratas en un ambiente estéril de laboratorio. Sin embargo, me cuesta entender cómo podría un científico de la compañía telefónica haber tenido un mejor control del comportamiento que mide. En este caso, el comportamiento depende sobre todo del cliente, más que del operador. En algunas situaciones, la variabili-
Directorio
Computadora
Directorio
Llamadas de asistencia del directorio FIGURA 10-4 Experimento de línea base ficticio que mide el tiempo de cada llamada cuando el operador consulta un directorio telefónico o un sistema por computadora.
10Martin193-226.indd 211
8/5/08 17:24:58
212
Capítulo diez
dad es intrínseca. En este caso, efectos pequeños pero importantes pueden quedar tapados por esta variabilidad, de modo que un diseño de línea base no es el apropiado. La última desventaja de los experimentos de línea base es que es difícil determinar qué tan general sea el efecto descubierto. Ya que los individuos responden de manera diferente a las manipulaciones experimentales, nuestro participante puede ser un sujeto extravagante. Esta objeción se rebate mediante la replicación de los resultados, o bien con otros participantes o con los mismos o en diferentes condiciones experimentales. Sin embargo, la tradición en los experimentos de línea base es utilizar pocos individuos. Los diseños experimentales de línea base son una herramienta muy valiosa en ciertos campos de la psicología experimental. Históricamente, los diseños han sido utilizados en el laboratorio para investigar temas como el aprendizaje simple, pero algunos psicólogos creen que pueden ser aplicados a muchos otros problemas importantes, como la atención médica (Blampied, 2000; Morgan y Morgan, 2001). Cuando pueden cumplirse las premisas del diseño, un experimento de línea base demuestra convincentemente los efectos de las manipulaciones experimentales importantes. Pero por desgracia, las premisas son tan rigurosas que los diseños de línea base deben restringirse a algunos campos de la psicología experimental.
■ Investigación con encuestas FORMAS DE INVESTIGAR CON ENCUESTAS
Las encuestas sirven para reunir información de una muestra de personas y generalizar la información a una población más grande. Una encuesta puede abarcar información sobre comportamientos observables directamente; pero también otra información, como las opiniones, motivaciones e incluso comportamientos futuros anticipados. En estos casos, no hay más forma de recopilar la información que con encuestas. Es decir, con las encuestas se le pregunta a la gente qué hace y, también, por qué lo hace. Por eso las encuestas son tan utilizadas en las ciencias sociales; y cuando los estudiantes piensan en realizar un proyecto de investigación, una encuesta es una de las primeras formas de investigar qué se les ocurre. Hay varias formas de reunir información mediante encuestas. Quizás el método más utilizado es la encuesta por correo, que se remite directamente al participante (por obvias razones, los investigadores que trabajan con encuestas llaman encuestados a los participantes que responden a la encuesta). Las encuestas por correo ofrecen varias ventajas. Es posible muestrear personas de ubicaciones distantes a un costo relativamente bajo, una tarea que sería por mucho más difícil y costosa a través de contactos directos. Debido a que es fácil mantener el anonimato y la privacidad con este método, es más probable que los encuestados den respuestas honestas. También es posible enviar una encuesta por correo a una muestra representativa de una población de interés en cuanto se tengan los nombres y las direcciones.
10Martin193-226.indd 212
8/5/08 17:24:58
Cómo diseñar investigación que no es experimental
213
Sin embargo, el gran problema de las encuestas por correo es que la gente es libre de desecharlas junto con el resto del correo basura. Por eso la tasa de respuesta es baja, a veces tan baja como de 20 a 30%. ¿Por qué no basta con enviar cuatro veces más encuestas e ignorar a los que no responden? El problema de esta solución es que puede causar un sesgo por falta de respuesta. En el capítulo 2 analizamos el sesgo por falta de respuesta, aunque allí le llamamos selección y dijimos que era una amenaza a la validez interna. En el caso de una encuesta, quizás haya escogido con mucho cuidado una muestra representativa de una población a la que espera generalizar sus resultados. Ahora bien, la composición de la muestra cambia conforme los participantes dejan de responder. No habría problema si lo hicieran al azar; la muestra todavía sería representativa. Pero es difícil determinar por qué los participantes no responden y sus motivos podrían sesgar sistemáticamente la muestra. Quizá los que no responden están ocupados, y ocurre que la gente ocupada es más rica o está más educada. O tal vez algunos no respondieron porque les falta escolaridad y se les dificulta leer las encuestas. Quizá algunos no respondieron porque son conservadores y pensaron que invadió su privacidad. El problema es que no se sabe en qué difieren los que responden de los que no responden, así que no se sabe qué tanto se sesgó la muestra. Por tanto, está en riesgo la capacidad de generalizar los resultados a la población. La manera de minimizar el sesgo por falta de respuesta es obtener una tasa alta de respuesta. Dillman (1978) propone medios para mejorar las tasas de respuesta de las encuestas por correo. El contenido de la carta de presentación incluida con la encuesta puede marcar una diferencia. No anuncie que es una encuesta o cuestionario ni suplique que lo ayuden. Es mejor anotar la institución a la que pertenece, fecha, nombre y dirección del encuestado, una declaración sobre la importancia de que participe, una promesa de confidencialidad, explicación de la utilidad del estudio, un premio simbólico por la participación, dónde dirigir preguntas o comentarios, un mensaje de gratitud, su firma en tinta con su título. La carta debe dar la apariencia de ser personal, no un modelo repetido. El premio simbólico podría ser de tan poca cuantía como una moneda de 25 centavos de dólar o una pluma que el participante conserve después de haber contestado la encuesta. La investigación ha demostrado que estas prendas mínimas incrementarán las tasas de devolución (Pressley y Tullar, 1977). Otra buena estrategia es llamar a los encuestados por teléfono antes de enviarles la encuesta por correo, con la petición cortés de que llenen la encuesta cuando les llegue. Por último, las cartas de seguimiento también aumentan las tasas de respuesta. Algunos investigadores envían una tarjeta postal una semana después del correo original y luego una carta de seguimiento y otra copia de la encuesta semanas más tarde. Pero aun con todos los esfuerzos anteriores, no hemos de esperar una tasa de respuesta de 100%. Las mejores encuestas por correo tienen tasas de respuesta del orden de 80% y una cifra más realista es de 60%. Con estos niveles de respuesta es importante evaluar la representatividad de la muestra obtenida comparándola con la población. Por ejemplo, es probable que sepa algo acerca de la distribución de ciertas variables demográficas de la población como sexo, ingreso y escolaridad. Una razón para pedirles a los encuestados que proporcio-
10Martin193-226.indd 213
8/5/08 17:24:59
214
Capítulo diez
nen tal información es la finalidad de realizar comparaciones con la población. Desviaciones grandes de la muestra con respecto a la población en lo que se refiere a estas variables demográficas son indicio claro de que la muestra no es representativa, así que es peligroso generalizar. Otra manera de reunir datos es la encuesta telefónica, en la cual se llama a los participantes y se les formula una serie uniforme de preguntas. A primera vista, esta opción sorprende por ser más barata y fácil que la encuesta por correo. Tiene la ventaja de que es más personal que una carta y podría incitar unas respuestas más honestas y completas. Sin embargo, el método también tiene sus problemas. Hacer que alguien responda por teléfono puede ser difícil. Durante el día muchas familias no están en casa y en las tardes los hogares son agobiados por personas que venden por teléfono productos y servicios. En la actualidad, algunos inician su rutina de venta afirmando que se trata de una encuesta. Como es lógico, cientos de personas cuelgan o cortésmente se niegan a tomar llamadas que no sean personales, y esta reacción es más probable ahora que en muchos lugares es posible registrarse en listas para no recibir estas llamadas. Añádase que no todo mundo tiene teléfono, algunos tiene dos o más (quizá conectados sólo a una computadora o fax) y muchos tienen números privados. Incluso si logra que un participante responda, algunas preguntas son más difíciles de contestar por teléfono, en particular con la televisión encendida o un niño que llora en el fondo. En general, las preguntas tienen que ser cortas y deben limitarse las posibilidades de respuesta para no superar el tiempo de atención del encuestado. Por último, con ciertos temas delicados, acaso los encuestados duden de que se mantenga la confidencialidad; no están del todo seguros de si usted es quien dice ni de si hay otras personas que escuchan sus respuestas. A veces es posible ahorrar tiempo y esfuerzo mediante la aplicación grupal de una encuesta. En este caso, el investigador tiene acceso a un grupo de participantes y puede distribuir y recoger una encuesta escrita en un lapso breve. Por ejemplo, el semestre pasado les pedí a los alumnos de mi clase de introducción a la psicología que respondieran una encuesta de una hoja sobre sus actitudes hacia la generación nuclear de electricidad. El tiempo total para distribuir, llenar y recoger la encuesta fue de 10 minutos. Mi universidad exige que el tiempo de clase se dedique exclusivamente a propósitos educativos, así que después de analizar los resultados, pasé gran parte de la siguiente clase mostrándoles a los estudiantes los resultados y aprovechamos el estudio para ilustrar los métodos de investigación psicológica. Muchos estudiantes de mi universidad también utilizan al grupo de alumnos de introducción a la psicología para recabar información, en cuyo caso solicitan a 40 o más estudiantes que se presenten en un salón para llenar un cuestionario. En estos casos, los estudiantes pueden rehusarse a participar y cumplir de otro modo con los requisitos de la materia. La aplicación grupal de encuestas tiene la ventaja de que arroja grandes volúmenes de datos rápidamente. Una desventaja es que es difícil de asegurar una completa confidencialidad, si los otros encuestados se sientan a un lado. También es difícil conseguir una muestra representativa con grupos que ya están formados. ¿Los estudiantes de introducción a la psicología le parecen una muestra representativa de la población en general? Muchos de los grupos son seleccionados o se reúnen solos para un fin que no es
10Martin193-226.indd 214
8/5/08 17:24:59
Cómo diseñar investigación que no es experimental
215
la investigación que se realiza y casi nunca son muestras representativas de la población de interés. Una técnica de encuesta eficaz pero demorada es la entrevista directa (en persona). El encuestado se reúne con el entrevistador en algún lugar, como el laboratorio de investigación o en la casa o trabajo del encuestado. La entrevista puede ser estructurada (el entrevistador lee las preguntas de un guión) o no estructurada (el entrevistador tiene la libertad de explorar los temas conforme aparecen). La entrevista estructurada brinda más control y facilita el análisis de los datos. Por otro lado, la entrevista no estructurada le parece más natural al participante y puede ser que incite respuestas más profundas y detalladas. Una estrategia utilizada por algunos investigadores es conducir la primera parte de la entrevista de manera estructurada y luego cambiar a un método no estructurado, hacia el final de la sesión. No debemos pasar por alto internet cuando pensamos en las técnicas de encuesta. Una encuesta por internet puede realizarse por completo en formato electrónico, en el que los encuestados dan sus respuestas en la red. Internet también sirve para ponerse en contacto con los participantes o para anunciar la aparición de una encuesta que va a enviarse por correo al encuestado. Por ejemplo, un colega y yo acabamos de realizar una encuesta por internet. Pertenecemos a una sociedad profesional y queríamos reunir información de una muestra representativa de los miembros. Tomamos una muestra al azar del directorio de los integrantes de la organización y, cuando pudimos, enviamos a las direcciones electrónicas una encuesta de una página para que se llenara por medios electrónicos y nos las regresaran. Nos faltaron las direcciones electrónicas de algunos miembros y otras no funcionaron, así que con ellos hicimos la encuesta por correo. Todavía no conozco ninguna investigación que compare las tasas de respuesta de las encuestas por internet y por correo, aunque sospecho que las encuestas pequeñas que pueden responderse en internet tienen tasas de respuesta más altas. Los recordatorios por correo electrónico son fáciles de enviar. En el futuro, es posible que estas encuestas se consideren una infracción a la regla general que veda el correo no solicitado, pero creo que todavía no pasa así. También tengo un colega que mantiene una página electrónica en la que reúne datos de encuestas. En esta página le pide a los visitantes, por ejemplo, que valoren la belleza de imágenes de rostros generadas por computadora. Luego, con las calificaciones determina qué características faciales se relacionan con la belleza. Actualiza su sitio con regularidad, de manera que cuando los encuestados dan sus respuestas, pueden comparar sus calificaciones con las de los demás. Esta retroalimentación proporciona una motivación considerable para que la gente haga sus evaluaciones. De esta manera, el investigador ha reunido miles de respuestas. Ahora bien, cuando los encuestados se eligen ellos mismos se presentan los obvios problemas de representatividad de la muestra, pero en ciertas investigaciones no es un gran problema. ¿Los muy aficionados a la computación que navegan por la red tienen ideales de belleza diferentes que el resto de la población? Quizá sí, quizá no. Sin embargo, al realizar una encuesta por internet, debemos recordar que siempre tendremos una muestra sesgada. No todo mundo tiene acceso a internet y las proporciones de usuarios de diferentes grupos demográficos varían marcadamente. También es cierto que hay que saber mucho de
10Martin193-226.indd 215
8/5/08 17:24:59
216
Capítulo diez
elaboración de páginas electrónicas o conocer a alguien que haga el trabajo. Como sea, en la propia red hay manuales para crear encuestas. Si cree que puede realizar su encuesta por internet, puede usar un explorador o pedirle a su profesor que le ayude a encontrar un sitio.
SELECCIÓN DE LA MUESTRA
Como recalqué, al seleccionar la muestra de una encuesta se quiere un grupo que sea representativo de la población a la que se van a generalizar las conclusiones. ¿Cómo se escoge una muestra representativa? Una posibilidad es tomar una muestra aleatoria, una tarea más difícil de lo que uno imaginaría. Si quisiéramos generalizar a toda la población de Estados Unidos, se necesitaría primero una lista de todos sus ciudadanos y luego sacar de ahí, al azar, la muestra. ¡Haría falta un sombrero enorme para meter todos esos nombres y sacar una muestra! En la mayoría de los casos hay que contentarse con una población más pequeña, como una ciudad, universidad o clase de introducción a la psicología y esperar que la población escogida no sea muy diferente de la población que realmente nos interesa. De todos modos, no siempre es posible hacer una selección aleatoria. La mayoría de los departamentos de psicología reclutan a sus participantes del estudiantado de los cursos de introducción a la psicología, quienes se proponen como voluntarios para cumplir con el requisito de un curso o para ganar un crédito extra. Algunos departamentos pagan a los participantes. En cualquier caso, estos sujetos no fueron escogidos al azar. Sin duda, se le ocurrirían muchas diferencias entre esta muestra y una verdadera muestra aleatoria. Como un ejemplo del impacto de una muestra no aleatoria, en 1993 Ross Perot pidió a los televidentes que respondieran las preguntas impresas en tarjetas que venían en la revista TV Guide y descubrió que 97% favorecían grandes reducciones del gasto gubernamental. Sin embargo, la misma pregunta puesta en una muestra aleatoria mostró que sólo 67% estaba de acuerdo en esas reducciones (Tanur, 1994). Cuando no es posible tener una muestra aleatoria, algunos investigadores aplican una técnica llamada muestra estratificada. En este caso, se identifican subpoblaciones llamadas estratos5 y se escoge al azar a los participantes en dichos estratos. Por ejemplo, si la población de la que se va a tomar la muestra fueran todos los ciudadanos de un país, aunque una verdadera muestra aleatoria parezca imposible de determinar, el investigador se aseguraría de que las clases económicas quedaran representadas con una proporción adecuada. En este caso, los estratos podrían ser los ingresos hasta 20 000 dólares, de 20 001 a 40 000, de 40 001 a 60 000 y de 60 001 en adelante. Incluso si la población fuera el estudiantado de la universidad, un investigador podría delimitar estratos con subpoblaciones por sexo, grupo étnico y calificaciones, para cerciorarse de que cada estrato estuviera representado proporcionalmente en la muestra. 5
El significado ordinario de la palabra estrato no es muy diferente: capas, como las capas de rocas que se revelan en una montaña cortada para tender un camino. Es fácil imaginarse gente de varios ingresos dispuesta en capas.
10Martin193-226.indd 216
8/5/08 17:24:59
Cómo diseñar investigación que no es experimental
217
TOMA MI MUESTRA ESTRATIFICADA POR AQUÍ
año año año a año
PREPARACIÓN DE UN CUESTIONARIO PARA UNA ENCUESTA
Después de escoger una muestra, ¿cómo se prepara el cuestionario? Primero que todo, hay que averiguar si se necesita un cuestionario. Si el propósito del cuestionario es determinar la medida de la gente en alguna dimensión de la personalidad, como ser autoritario, ansioso, introvertido, creativo, etc., es muy probable que ya alguien haya diseñado un cuestionario para este fin. También es probable que si el cuestionario fue publicado, se haya probado su confiabilidad y validez (véase el capítulo 7), de modo que se sabe si es bueno. Tal vez encuentre tal cuestionario cuando lleve a cabo su búsqueda bibliográfica (capítulo 6) o uno de sus profesores puede recomendarle alguno. Si el cuestionario ha sido publicado como parte de un artículo, probablemente no haya muchos problemas con los derechos de autor. En cambio, si es un cuestionario editado, habrá que comprar sus ejemplares, que no son baratos. Resístase a la tentación de plagiar las preguntas de tal cuestionario. Es inmoral y, en el caso de material protegido, ilegal. Si su tema de interés es más específico o si no encuentra un cuestionario que se adecue a su propósito, tendrá que preparar uno usted mismo. Parece fácil. Nada más se trata de formular preguntas, ¿no? Por ejemplo, si quiere saber lo que la gente piensa acerca del tema del aborto, ¿por qué no preguntar directamente su opinión sobre el aborto? Es un ejemplo de una pregunta abierta, para que los encuestados respondan lo que quieran. Imagínese la oración, el párrafo o el tratado que le darán como respuesta a esta pregunta. Si convenciera
10Martin193-226.indd 217
8/5/08 17:25:00
218
Capítulo diez
a sus encuestados que se tarden lo que quieran en responder completamente la pregunta, ¿podría analizar las resmas de datos que le darían? Como primer paso en la preparación de su cuestionario, conviene plantearles a varias personas preguntas potenciales en una entrevista. Las respuestas que ofrezcan a las preguntas abiertas pueden darle una idea para redactar preguntas cerradas. Durante el proceso, recuerde que en algún momento tendrá que analizar los datos. Lo ideal es convertir los datos en cifras, para hacerlos cuantitativos. Los expertos en estadística cuentan historias de terror acerca de investigadores, a veces estudiantes, que llegan a sus oficinas, dejan caer un montón de cuestionarios y dicen: “Aquí están los cuestionarios. ¿Cómo los analizo?” No quiero decir que sea imposible analizar numéricamente las respuestas de todas las preguntas abiertas. Aunque requiere un esfuerzo adicional, es factible convertir las respuestas de preguntas bien estructuradas en datos cuantitativos. Por ejemplo, algunos encuestadores capacitan a jueces independientes para que lean las respuestas a preguntas abiertas y las codifiquen según categorías determinadas con antelación. Las clasificaciones de los jueces se comparan para determinar la confiabilidad del método de codificación. Lo importante es que cualquiera que sea el método que se utilice, al terminar de preparar el cuestionario, hay que saber con exactitud qué tipo de datos tendrá y cómo los analizará. Una manera de convertir las respuestas de los encuestados en cifras consiste en hacer preguntas de opción múltiple, preguntas cerradas en las que se restringen las respuestas posibles. A continuación tenemos un ejemplo: ¿Cuándo se debe permitir el aborto? ____ Nunca ____ Sólo en caso de violación o incesto ____ Sólo en caso de violación o incesto y con permiso de los padres en el caso de las menores ____ Siempre que una mujer lo decida Las instrucciones indicarían que el encuestado marque una sola opción. Con estos reactivos, contaríamos el número de encuestados que marcaron cada opción. Esto nos daría cifras como datos. Observemos que aunque esta pregunta arroja datos cuantitativos, ofrece un flanco a las críticas. Algunos encuestados podrían preguntarse qué significa permitir: ¿Quién permite? ¿El Estado? ¿Dios? Otros quizá no encuentren una opción que exprese bien sus sentimientos. Por ejemplo, que piensen que el padre del feto tiene derechos o que la edad del producto es de importancia crucial. La redacción de una pregunta marca una diferencia. ¿Le parece que las siguientes preguntas enmarcan el tema de modo que inclinaría a los encuestados a responder en cierto sentido? “¿El derecho de las mujeres a terminar un embarazo debe abordarse como cualquier otro problema de salud?”
10Martin193-226.indd 218
8/5/08 17:25:00
Cómo diseñar investigación que no es experimental
219
“¿Cuándo debe limitar el gobierno el derecho de las mujeres a abortar?” “¿Cuándo debe permitírsele a una madre disponer de la vida de su bebé no nacido? Ciertas palabras despiertan creencias y emociones particulares. En general, la gente cree que sus derechos deberían ser protegidos, que las limitaciones gubernamentales deberían ser mínimas, que las mujeres son independientes pero que las mamás tienen responsabilidades, que los fetos no son seres humanos, sino nonatos y que terminar no es matar sino disponer de la vida. La mayoría de las preguntas no son tan tendenciosas como en estos ejemplos, pero se cuelan incluso formas mínimas de sesgo aunque tratemos de evitarlas. Hace poco redactaba un cuestionario para saber si cierta clase de estadística de mi universidad preparaba en forma adecuada a nuestros estudiantes de psicología. Debo admitir que no me parecía que la clase fuera muy buena. A tiempo me di cuenta y cambié en el cuestionario que le iba a dar a los estudiantes un reactivo que decía: “Si cree que esta clase no se imparte bien, ¿cuál de las siguientes razones daría?” Luego enumeré problemas posibles de la materia, sin incluir ningún aspecto positivo. Me avergoncé cuando uno de mis colegas me señaló el evidente sesgo negativo que había introducido en la pregunta. Incluso modificaciones pequeñas de redacción terminan en grandes cambios de opinión. Por ejemplo, en una encuesta telefónica, 53% de la gente dijo que el gobierno gastaba demasiado dinero “en asistencia social”, 23% dijo que el gobierno gastaba mucho “en asistencia a los pobres”.6 En una encuesta similar que mencioné arriba, Ross Perot preguntó: “¿Cree que por cada dólar de aumento de impuestos deberían reducirse dos dólares de gasto y destinar los ahorros a aminorar el déficit y la deuda?” Contestó que sí 67% de una muestra aleatoria. Sin embargo, cuando la pregunta se redactó así: “¿Estaría a favor o en contra de una propuesta para reducir el gasto en dos dólares por cada dólar en nuevos impuestos, y dedicar los ahorros a la reducción del déficit, aun si con esto se producen recortes en los programas de atención médica y educación?”, sólo 33% de los encuestados estuvieron a favor (Tanur, 1994). Se observa que cambios sutiles de palabras pueden marcar grandes diferencias en la opinión de los encuestados. También hay que examinar las preguntas para cerciorarse de que las entienden los encuestados de su muestra. Como la mayoría de los estudiantes y maestros universitarios se relacionan con personas que tienen estudios superiores, es muy fácil olvidar que la población en general tiene menos habilidades de lectura y comprensión del vocabulario. Por eso, use el vocabulario apropiado para su muestra. Verifique también que las preguntas no estén tan mal redactadas que sean confusas. Por ejemplo, evite las preguntas negativas: “¿Las mujeres no tienen el derecho al aborto?” La mejor manera de saber si se entienden las preguntas es entregarle un borrador del cuestionario a una muestra pequeña semejante a la muestra del estudio, para que diga su opinión.
6
Tomado de una encuesta telefónica de 600 adultos estadounidenses realizada por Time y CNN el 18 y 19 de mayo de 1994, por Yankelovich Partners, Inc. Publicada en Time el 27 de junio de 1994, p. 26.
10Martin193-226.indd 219
8/5/08 17:25:01
220
Capítulo diez
Otra manera de forzar a los encuestados a dar respuestas que puedan ser convertidas en cifras es utilizar una escala de calificación. Varias escalas ofrecen respuestas graduadas. Por ejemplo, se podría preguntar: ¿Qué tan bien cree que la nueva senadora haya expresado su opinión sobre el aborto? Muy mal
1
2
3
4
5
6
7
8
9
10
Muy bien
Les pediríamos a los encuestados que encierren en un círculo o que pongan una marca sobre la línea. También podríamos dividir la línea en segmentos. En este ejemplo, sólo se pusieron etiquetas verbales en los extremos de la escala: se llaman anclas, ya que fijan el significado en los extremos del continuo. Otra opción consiste en asignar una denominación a las cifras o marcas, como “mal”, “regular”, “neutral”, “bien”, “muy bien”. El número de categorías varía de cinco a 10. Cinco se considera el mínimo, ya que alguna gente evita los extremos. Una escala de cinco puntos se convierte entonces en una escala de tres puntos, con poco espacio para expresar diferencias de opinión. Si le interesa la actitud de sus encuestados hacia diversos temas, conviene servirse de una escala de Likert. Se da a los participantes una serie de enunciados y se les pide que indiquen si están de acuerdo o en desacuerdo con cada uno. A continuación presento un ejemplo de tal serie: 1. Hay que legalizar el aborto si el embarazo es resultado de una violación. Muy de acuerdo 1
De acuerdo 2
Neutral 3
En desacuerdo 4
Muy en desacuerdo 5
A los encuestados se les pide que encierren en un círculo la alternativa que indica mejor su opinión. En lugar de utilizar cifras, puede trazarse una línea horizontal, dividida o no, y los encuestados hacen alguna marca para indicar su actitud. En este caso, la distancia se mide desde el inicio de la línea hasta la marca de manera que la respuesta pueda ser convertida a número. Una ventaja de esta metodología es que los encuestados utilizan la misma escala para responder a diversos reactivos. La consistencia interna del formato minimiza la confusión y hace probable que los participantes sean congruentes en todos los reactivos. Desde el punto de vista práctico, otra ventaja es que los enunciados pueden ponerse en una lista del lado izquierdo de la hoja, con las cifras de la escala del lado derecho. Las anclas, o descriptores, se anotan una sola vez, al inicio de la página. Este formato ahorra espacio y es muy fácil que los participantes lo entiendan. Un ejemplo se muestra en la figura 10-5.
10Martin193-226.indd 220
8/5/08 17:25:01
Cómo diseñar investigación que no es experimental
221
Opiniones sobre el tema del aborto Encierre en un círculo el número de la derecha que se aproxime más a lo que opina de cada enunciado. De Muy en Muy de En desacuerdo desacuerdo Neutral acuerdo acuerdo 1. El aborto es pecado.
1
2
3
4
5
2. El gobierno debería subsidiar los abortos de las mujeres pobres.
1
2
3
4
5
3. Debe ser ilegal que una menor de 18 años aborte sin el permiso de sus padres.
1
2
3
4
5
4. Los médicos que practican abortos deben aconsejar a sus pacientes sobre alternativas, como la adopción.
1
2
3
4
5
5. La decisión de abortar debe ser toda de la mujer embarazada.
1
2
3
4
5
6. La píldora del “día siguiente” debe ser legal.
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
7. Hay que arrestar a las personas que se manifiestan frente a las clínicas que practican abortos. 8. Debe permitirse el aborto en casos de violación e incesto.
FIGURA 10-5 Ejemplo de una encuesta de opinión utilizando una escala de Likert.
La mayoría de los investigadores también reúnen información demográfica en sus encuestas, información de sexo, edad, grupo étnico, escolaridad, ingreso, clase social, religión, promedio de calificaciones, etc. Qué información quiera uno preguntar depende del propósito de la encuesta. Por ejemplo, si se trata de determinar si las actitudes hacia el aborto sufren la influencia de la religión, es evidente que hay que incluir una pregunta para clasificar los cuestionarios de acuerdo con este factor. Como se aprecia, al diseñar el cuestionario es más importante saber cómo se van a analizar los datos. No todos los investigadores coinciden en cuál es el lugar del cuestionario donde deben incluirse los reactivos demográficos. El lugar más obvio sería al principio, pero algunos sostienen que así los participantes piensan que el cuestionario es aburrido y quizá no lo terminen (Dillman, 1978).
10Martin193-226.indd 221
8/5/08 17:25:01
222
Capítulo diez
VENTAJAS
Ya estudiamos muchas ventajas de las encuestas y cuestionarios. Ofrecen una manera de evaluar opiniones, actitudes, motivaciones y comportamientos futuros de la gente, que no conoceríamos mediante las técnicas experimentales estándares. Además, representan un medio de reunir grandes volúmenes de datos en forma barata y rápida. DESVENTAJAS
También vimos desventajas de la investigación con encuestas. Los grandes conjuntos de datos reunidos pueden ser difíciles de analizar, en particular si no se planeó el análisis durante el diseño de la encuesta. Pero aun si se planeó el análisis de los datos, llegan a ser necesarias técnicas estadísticas complejas para analizar grandes conjuntos de datos. Además, cuando las bajas tasas de respuesta son un problema, se vuelve difícil generalizar a grandes poblaciones debido al sesgo por la falta de respuesta. La tercera desventaja es que las encuestas son en realidad observaciones correlacionales, no experimentos. En una encuesta ninguna variable independiente ha sido manipulada para que cause un cambio en el comportamiento. Los datos de la encuesta son múltiples mediciones dependientes. Por esta razón, tenemos que evitar hacer declaraciones causales a partir de los resultados. Por ejemplo, si quisiéramos relacionar las actitudes hacia el aborto con el credo religioso, quizá descubramos que los encuestados que declararon convicciones religiosas más radicales también fueron los que se opusieron con más fuerza al aborto. Nos sentiríamos tentados a decir que las creencias religiosas son la causa de tener actitudes negativas hacia el aborto, pero en realidad todo lo que podemos decir es que están relacionadas. Recuerde la exposición de los capítulos 1 y 2, donde señalé que debemos ser cuidadosos al interpretar los datos de correlaciones. Hay una debilidad inherente a las encuestas y cuestionarios, incluso los buenos: no miden el comportamiento de manera directa, sino que son informes de los propios participantes. En efecto, los encuestados nos pueden decir lo que quieran y no tenemos modo de hacer una verificación independiente de la información. ¿Por qué mentirían? Hay varios motivos para que las respuestas no sean sinceras. Una es que quieren protegerse. Aunque el investigador les haya dicho que sus respuestas son anónimas y que no tienen que poner su nombre en la forma, quizá creen que las formas tienen alguna codificación que los identifica. O si llenan la forma en un salón con otros encuestados, tal vez piensen que alguien más verá sus respuestas. Aun si quedaran convencidos de que su información es confidencial, pueden tener ideas peculiares sobre qué fin le dará el investigador y sientan que tienen motivos para distorsionar sus respuestas. Por ejemplo, un individuo que fuma marihuana y piensa que hay que legalizarla podría declarar falsamente que nunca ha tenido una mala experiencia estando drogado. Se da cuenta de que si muchos usuarios hablan de malas experiencias, esta información estorbaría a su legalización. También podrían mentir porque quieren llamar la atención a su grupo o causa. Por ejemplo, si un estudiante piensa que debe hacerse algo con respecto a las armas en su escuela, tal vez diga que ha visto muchas más de lo que en realidad ha visto.
10Martin193-226.indd 222
8/5/08 17:25:01
Cómo diseñar investigación que no es experimental
223
En algunos casos los encuestados no mienten a propósito, sino que se mienten a sí mismos, tanto como al investigador. En el caso de temas cargados de emoción, unos individuos no quieren admitir sus sentimientos y actitudes, sobre todo si difieren de lo que se acepta en la sociedad. Por ejemplo, un encuestado negaría con vigor que fuera un racista, pero al mismo tiempo exhibe un comportamiento que indica todo lo contrario. Debido a que la sociedad no acepta a los racistas, a quienes lo son se les dificulta admitirlos. Por tanto, al analizar los datos de una encuesta, debemos tener presente siempre que al final los datos son producto de los informes de los propios participantes. Cuando analicemos los resultados de las encuestas, tenemos que matizar lo que decimos en virtud de este hecho. No debemos decir que 27% de los estudiantes de preparatoria han fumado marihuana, si todo lo que sabemos es que 27% dijo que la había fumado. Como decía mi abuela: “Decir y hacer son cosas diferentes.” La tabla 10-3 proporciona una referencia muy útil que resume las ventajas y desventajas de varias técnicas de investigación que examinamos en este capítulo.
■ TABLA 10-3 Un resumen de las ventajas y desventajas de realizar cuasiexperimentos, experimentos de línea base y encuestas Diseño
Ventajas
Cuasiexperimentos Permiten la investigación aplicada cuando no es posible hacer experimentos. Es posible valorar las amenazas a la validez interna.
Desventajas Hay amenazas a la validez interna. Los diseños son más complejos que los experimentos tradicionales. El análisis estadístico puede ser difícil.
Experimentos de línea base
Un individuo puede proporcionar resultados que son fáciles de interpretar sin estadísticas. La magnitud y el momento de la manipulación de la variable independiente son flexibles. Pueden estudiarse condiciones que ocurren rara vez.
Las premisas son difíciles de cumplir (por ejemplo, la reversibilidad). No se pueden investigar efectos pequeños pero importantes. La posibilidad de generalizar está limitada.
Encuestas
Pueden investigarse eventos internos (por ejemplo, actitudes). Se reúnen rápidamente grandes volúmenes de datos.
Es difícil analizar los grandes conjuntos de datos. Las bajas tasas de respuesta pueden causar un sesgo por falta de respuesta. Los resultados son correlacionales, así que no puede deducirse una causalidad. Los informes de los participantes pueden ser falsos.
10Martin193-226.indd 223
8/5/08 17:25:02
224
Capítulo diez
■ Resumen En situaciones aplicadas en que no es posible asignar al azar los participantes a los grupos, puede recurrirse a diseños no tradicionales llamados diseños cuasiexperimentales. Los diseños no experimentales son difíciles de interpretar debido a las múltiples amenazas a la validez interna. Aquí se incluyen el diseño de un grupo sólo con postest, en el cual el comportamiento de un grupo se pone a prueba después de la exposición al tratamiento; los diseños sólo con postest con grupos no equivalentes, en donde un segundo grupo, seleccionado de diferente manera, también se prueba, pero no se expone al tratamiento; y el diseño de un grupo con pretest y postest, en el que un grupo se prueba antes y después de la exposición al tratamiento. Los diseños cuasiexperimentales permiten eliminar o evaluar muchas amenazas a la validez interna. En un diseño de grupo control no equivalente con pretest y postest, se prueba un grupo antes y después del tratamiento, y un segundo grupo, seleccionado de otra manera, se prueba en momentos equivalentes pero sin exponerlo al tratamiento. Las variaciones de este diseño básico incluyen el uso de un pretest sustituto, para medir una variable correlacionada con el postest cuando el uso de un pretest no es posible; la aplicación del pretest y el postest en muestras separadas, en las que se dividen grupos no equivalentes y se prueba a la mitad de cada grupo antes y la mitad después de la exposición al tratamiento, y la realización de observaciones de pretest en más de un intervalo, en que se prueba cada grupo varias veces antes de la exposición al tratamiento. La segunda clase de diseños cuasiexperimentales son los diseños de series de tiempo interrumpidas, en los cuales se prueba un grupo en múltiples ocasiones antes y después de la exposición al tratamiento. Entre las variaciones del diseño se incluyen la suma a las series de tiempo de un grupo control no equivalente sin tratamiento, en la que un segundo grupo, seleccionado de manera diferente, se prueba en ocasiones equivalentes pero no es expuesto al tratamiento; las series de tiempo interrumpidas con eliminación del tratamiento, en que se aplica una tercera serie de pruebas después de eliminar el tratamiento; y las series de tiempo interrumpidas con replicaciones cambiantes, en las que varios grupos seleccionados de diferente manera se prueban en muchas ocasiones pero son expuestos al tratamiento en diferentes puntos en la serie. El segundo tipo de diseño no tradicional es el experimento de línea base, que muestra los efectos experimentales con los datos de un solo individuo. Este experimento se utiliza para evaluar los efectos de tratamientos o intervenciones terapéuticas. Después de establecer una tasa de estado estable de respuesta denominada línea base, el investigador comienza la manipulación experimental hasta que la tasa de respuesta cambia a un estado estable de transición. Entonces, el investigador demuestra la reversibilidad recuperando la línea base original. Una ventaja de los diseños de línea base es que ofrecen un medio convincente de mostrar cambios importantes en un comportamiento individual único. El experimentador también tiene la flexibilidad de escoger cuándo manipular la variable independiente y a qué nivel cambiarla. También es sencillo interpretar los resultados. Sin embargo, algunas premisas de los experimentos de línea base, como la reversibilidad, no se cumplen en muchos
10Martin193-226.indd 224
8/5/08 17:25:02
Cómo diseñar investigación que no es experimental
225
campos de la psicología. También a veces es difícil mostrar efectos pequeños e importantes y es riesgoso generalizar los resultados a una población más grande. El tercer tipo de diseño no tradicional es la encuesta, o cuestionario, que se emplea para evaluar las opiniones, actitudes, motivaciones o comportamientos futuros de una muestra de encuestados. Las encuestas por correo son baratas y permiten el muestreo de grandes zonas geográficas. Sin embargo, las bajas tasas de respuesta pueden causar problemas de sesgo por falta de respuesta, que es la pérdida desproporcionada de ciertos segmentos de la muestra, lo que daña la capacidad de generalizar los resultados de la muestra a una población general. Las tasas de respuesta mejoran con cartas de presentación adecuadas, pequeños regalos, contactos previos y cartas de seguimiento. Las encuestas telefónicas son más rápidas y personales. Sin embargo, la falta de respuesta todavía es problemática, como también la dificultad de obtener una muestra representativa entre quienes tienen teléfono. La aplicación grupal de las encuestas es eficiente, pero el grupo no es representativo de la población de interés. Las entrevistas directas (en persona), aunque menos eficientes que otros procedimientos, permiten una interacción más cercana con el encuestado. Estas entrevistas pueden ser estructuradas o no estructuradas. Un procedimiento de encuesta en desarrollo es la encuesta por internet, en la que se convoca la participación a través de la red y las respuestas se dan electrónicamente o a través del correo. La muestra de las encuestas puede ser aleatoria, en la que todos los miembros de la población tienen la misma oportunidad de ser seleccionados, o estratificada, en la que se identifican varias categorías o estratos, de los que se toman muestras aleatorias. Los cuestionarios se componen con preguntas abiertas, que son difíciles de cuantificar o preguntas cerradas, con opciones de respuesta restringidas, como las preguntas de opción múltiple o las preguntas que utilizan una escala de calificación como la escala de Likert. Aunque las encuestas representan la oportunidad de reunir pronto grandes volúmenes de datos acerca de opiniones, actitudes y comportamientos futuros, los grandes conjuntos de datos son difíciles de analizar, una respuesta baja causa el sesgo por falta de respuesta, no puede deducirse una causalidad a través de los datos correlacionales y los informes de los participantes pueden no ser ciertos. L I B R O S R E C O M E N D A D O S S O B R E E S TA D Í S T I C A C U A S I E X P E R I M E N TA L Para el estudiante de ingreso reciente Cook, T. D. y Campbell, D. T. (1979). Quasi-experimentation: Design and analysis issues for field settings. Chicago: Rand McNally. Para el estudiante avanzado Box, G. E. P. y Jenkins, G. M. (1976). Time-Seriesanalysis: Forecasting and Control. San Francisco: Holden Day. Campbell, D. T. y Stanley, J. C. (1966). Experimental and quasi-experimental designs for research. Chicago: Rand McNally. Kidder, L. H. y Judd, C. M. (1986). Research methods in social relations (5a. ed.). Nueva York: Holt, Rinehart y Winston.
10Martin193-226.indd 225
8/5/08 17:25:02
226
Capítulo diez
Shadish, W. R., Cook, T. D. y Campbell, D. T. (2002). Experimental and quasi-experimental designs for generalized causal inference. Boston: Houghton Mifflin.
LIBROS RECOMENDADOS SOBRE DISEÑOS DE LÍNEA BASE Hersen, M. y Barlow, D. H. (1984). Single-case experimental designs: strategies for studying behavior change. Nueva York: Pergamon Press. Robinson, P. W. y Foster, D. F. (1979). Experimental psychology: A Small-N approach. Nueva York: Harper y Row. Todman, J. B. y Dugard, P. (2001). Single-case and small-N experimental designs: A practical guide to randomization tests. Mahwah: Lawrence Erlbaum.
L I B R O R E C O M E N D A D O S O B R E D I S E Ñ O S D E E N C U E S TA S Dillman, D. A. (1978). Mail and telephone surveys: The total design method. Nueva York: Wiley.
10Martin193-226.indd 226
8/5/08 17:25:02
11
Cómo saber cuándo está listo para empezar Un error es un error sólo si se repite. ANÓNIMO
El mayor de los errores, diría yo, es no darse cuenta de ninguno. T. CARLYLE (1888)
El camino del necio es derecho en su opinión; más el que obedece al consejo es sabio. PROVERBIOS 12.15
P
ara este momento, ya debe tener todas las herramientas necesarias para empezar su experimento. Sin embargo, tendría que hacerse algunas preguntas para ver si ha considerado todos los temas importantes antes de empezar a reunir los datos.
LOS INFORMES EXPERIMENTALES SE ENTREGAN MAÑANA A
CÓMO SABER CUÁNDO ESTÁ LISTO PARA EMPEZAR SU EXPERIMENTO 227
11Martin227-239.indd 227
8/5/08 17:25:39
228
Capítulo once
Cuando enseño métodos experimentales, mis estudiantes tienen que pensar, diseñar y hacer un experimento original. Antes de que se les permita empezar a reunir los datos, les pido que presenten al grupo su propuesta de experimento. Juntos criticamos el experimento, tratando de encontrar errores y determinar si el estudiante experimentador ha considerado todos los detalles necesarios antes de hacer su investigación. Este ejercicio tiene varios propósitos. Afila el sentido crítico de los estudiantes que miran la presentación, lo cual es habilidad que todos los científicos debemos tener. Preparar la presentación también motiva a los estudiantes experimentadores a reflexionar en todo lo que han dado por sentado y en las pequeñas decisiones que habían dejado de tomar. El ejercicio sirve también para que todos sugiramos a los experimentadores mejoras a su estudio.
■ La sociedad de los buenos modales Antes de analizar las preguntas sin responder que hemos de considerar antes de empezar un experimento, me gustaría hacer aquí un comentario sobre la reacción emocional que tienen muchos de mis estudiantes ante la presentación de las propuestas de experimento. Quienes hacen las presentaciones las ven como la parte más desagradable y angustiante del curso. Parte de la inquietud es el solo acto de hacer una presentación, cualquier presentación, una habilidad que rara vez se cultiva en los cursos universitarios. Yo supongo que esta inquietud se debe a tener que defender el experimento ante un grupo potencialmente crítico de compañeros.
VIEJO
UN GRUPO POTENCIALMENTE CRÍTICO DE COMPAÑEROS La primera reacción de la audiencia es quedarse callada: “No haré olas si tú no las haces.” Aun si los acicateo, hay estudiantes renuentes a criticar las ideas de sus compañeros. Vivimos en una sociedad de buenos modos, donde las reglas dictan una tolerancia extrema de los comportamientos y opiniones de los demás. Algunos piensan que porque todos tene-
11Martin227-239.indd 228
8/5/08 17:25:40
Cómo saber cuándo está listo para empezar
229
mos el derecho a expresar nuestras opiniones, una opinión vale lo mismo que otra. Criticar las opiniones de los demás parece un ataque personal o una lesión de su derecho de libertad de palabra. A juzgar por sus comentarios sobre las evaluaciones de los estudiantes al final de la clase, algunos estudiantes toman mis comentarios sobre las presentaciones como personales e innecesarios. Por más que trato de sonreír, mantener mi voz baja y proyectar una actitud de ayuda, estos estudiantes no entienden por qué su maestro, agradable y cordial, se ha vuelto en contra de ellos. Espero que los capítulos anteriores lo hayan convencido, cuando menos en el plano intelectual, de que en la ciencia unas opiniones no son tan buenas como otras. Las opiniones son defendibles. Si se rompen las reglas de la ciencia, los resultados se vuelven sospechosos o inservibles. Las reglas de la lógica deductiva e inductiva analizadas en el capítulo 3, son la base para sostener que ciertos resultados apoyan o refutan una teoría. Como vimos en el capítulo 2, es necesario eliminar las posibles variables de confusión para estar en posición de defender una causalidad, es decir, para afirmar que la variable independiente causó el cambio en la variable dependiente. La selección aleatoria de una muestra experimental de participantes estudiada en el capítulo 2, es la base para generalizar los resultados a una población más grande. Cuando la clase, el profesor o los colegas critican una propuesta de proyecto, tratan de ayudar al postulante a seguir las reglas de la ciencia, a fin de que después de terminada la investigación, los resultados se defiendan y se sumen al conocimiento científico. En la etapa de propuesta, la crítica es irritante, pero cuando se termina la investigación es devastadora. La crítica a posteriori acusa al investigador de no haber profundizado lo suficiente y también de que desperdició su tiempo y el de los participantes, a más de recursos que pudieron haberse destinado al avance de la ciencia. La moraleja no es que la ciencia sea una empresa mortal en la que los errores acarrean grandes culpas, sino que hay ciertas reglas a las que debe apegarse un científico. Debería aprovechar todos los recursos, incluyendo el consejo de los demás, para seguir las reglas y realizar una buena investigación.
■ Preguntas para antes de empezar Las siguientes preguntas son las que hago a mis estudiantes cuando realizan sus propuestas de investigación. Quizá ya las haya contestado. ¡Bien por usted! Si no, hágalo antes de empezar a reunir los datos. ¿MI EXPERIMENTO SATISFACE LAS PREOCUPACIONES ÉTICAS?
Como vimos en el capítulo 4, la necesidad de dar un tratamiento ético a los participantes de la investigación incita diversas preocupaciones. ¿Ha meditado en estas inquietudes? ¿Sus participantes quedarán sujetos a tensiones psicológicas o físicas? Si es así, ¿cómo se reducen al mínimo? ¿Sus participantes darán un consentimiento informado? Si va a utilizar formatos
11Martin227-239.indd 229
8/5/08 17:25:41
230
Capítulo once
de registro, ¿dan una descripción clara del experimento para que los participantes den un consentimiento informado? ¿Puede documentar este consentimiento? ¿Recurre al engaño en su experimento?¿Tiene una sesión de preguntas y respuestas al final del experimento, para aclarar su verdadera índole a los participantes? ¿Redactó un texto aclaratorio? ¿Elaboró un calendario para reunirse oportunamente con todos los participantes? ¿Ha pensado lo que hará en caso de que su equipo se descomponga o que usted se enferme? ¿Sabe lo que va a hacer para garantizar la confidencialidad de los datos reunidos? ¿Su experimento tiene características de la demanda? ¿Es probable que afecten los resultados? Debe hacerse todas estas preguntas antes de empezar su experimento. Además, debe tramitar todo el papeleo para que su junta de revisión institucional lo autorice a llevar a cabo el estudio. En algunos casos, las juntas tardan semanas en considerar una propuesta de investigación y no puede empezar sin su aprobación final. Así que asegúrese de llenar y entregar los papeles necesarios en cuanto tenga un diseño. Seguir este consejo es todavía más importante si su experimento tiene sus puntas éticas, por ejemplo, si engaña, es potencialmente estresante, tiene que ver con drogas, etc. En este caso, la junta de revisión se reunirá con usted para pulir algunos detalles o incluso podría negar la aprobación para el estudio. ¿CUÁNTOS PARTICIPANTES NECESITO?
Con frecuencia es difícil calcular cuántos participantes se necesitan para el experimento. Uno de los errores que más cometen los estudiantes es conseguir muy pocos, de manera que lo que parece ser un buen resultado no es estadísticamente significativo. Claro está que hay consideraciones prácticas, como un fondo limitado de participantes, lo que restringe cuántos se puedan convocar. Si es así, tendrá que encontrar un equilibrio. Suponiendo que puede contar con tantos participantes como quiera, hay formas estadísticas de determinar el poder de la prueba estadística y el número aproximado de participantes necesarios. En el siguiente capítulo nos detendremos un momento en este poder de las pruebas, aunque el razonamiento de su cálculo está más allá del alcance de este libro. Debe tener presente que si muy pocos participantes no son suficientes para demostrar una significancia estadística con un efecto experimental de tamaño razonable, muchos pueden mostrar una significancia estadística con un efecto baladí. En este caso, utilizar demasiados participantes es ineficiente y también puede ser engañoso. Quizá la mejor manera de determinar cuántos participantes reunir es el estudio de la bibliografía. Si repite otro experimento en el que se informó de un efecto estadísticamente significativo, tendrá una buena idea del número necesario. Incluso si no se trata de una réplica, acaso encuentre experimentos similares que hayan utilizado la variable dependiente que usted proponga. La variabilidad de los datos generados a partir de ciertas variables dependientes, como los tiempos de reacción o las palabras recordadas de una lista, es predecible en cierto grado. En el caso poco probable de que no encuentre experimentos similares, tendrá que hacer un experimento piloto para hacerse una idea del número de participantes que necesitará.
11Martin227-239.indd 230
8/5/08 17:25:41
Cómo saber cuándo está listo para empezar
231
¿DEBO EMPLEAR A LOS PARTICIPANTES DE MANERA INDIVIDUAL O EN GRUPOS?
La mayoría de los nuevos experimentadores piensan primero en realizar experimentos con participantes individuales, en lugar de grupos. A veces no hay opción; por ejemplo, quizá sólo tenemos una máquina para registrar las respuestas. En otros casos, un individuo podría afectar el desempeño de los demás en el grupo. Sin embargo, si puede trabajar con los participantes en grupo, el acopio de datos es más eficiente. Al considerar sus opciones, tiene que hacerse varias preguntas: ¿Puedo darle un cuestionario a un grupo de participantes en lugar de hacerles las preguntas uno por uno? ¿Puedo reunir los datos necesarios mediante diapositivas o un proyector para mostrar los estímulos a un grupo en lugar de cartas o una pantalla de computadora con los individuos por separado? Si presenta una serie constante de estímulos y nada más registra la precisión de las respuestas o el número de respuestas de cierta categoría, probablemente le convenga más formar grupos. Si el orden de los eventos o el momento de su presentación dependen de las respuestas a eventos previos o si hay que esperar al momento oportuno de las respuestas, entonces hay que trabajar con los participantes de manera individual. ¿CUÁNTO TIEMPO TARDARÁ MI EXPERIMENTO?
Calcular la duración de un experimento plantea interrogantes en distintos niveles. En el nivel más grueso, ¿cuántas horas, días o semanas serán necesarios para reunir los datos? En el nivel más fino, ¿cuánto durará una sesión experimental? Si va a hacer ensayos individuales, no podrá responder ninguna pregunta sin determinar primero la duración del ensayo y el número de ensayos necesarios. Para calcular la duración del ensayo, es necesario que conozca la secuencia de los eventos que ocurrirán durante el ensayo y el tiempo requerido para cada evento, incluyendo la pausa entre ensayos. Luego, si sabe cuántos ensayos habrá, determine el tiempo total necesario para concluirlos. En algunos casos, hay que aproximar el número de ensayos, como, por ejemplo, cuando los participantes deben alcanzar un criterio de desempeño, como dos ensayos consecutivos en los que hayan recordado una lista de palabras. También debe acordarse de incluir tiempo para hacer otras tareas del experimento. Por lo regular, antes de empezar se deben dar instrucciones a los participantes y tiempo para que hagan sus preguntas. Quizá se agregue una serie de ensayos de práctica si se espera algún aprendizaje o si se desea un desempeño estable. Se necesitan descansos para evitar la fatiga durante experimentos largos y tediosos. Una sesión de preguntas y respuestas al final del experimento es necesaria, sobre todo, si participan en el experimento estudiantes, como parte de algún requisito académico y se supone que están aprendiendo sobre experimentación. Por último, es necesario considerar un “tiempo de espera” ya que a veces la gente llega tarde. Sin este tiempo, las sesiones empezarán progresivamente más tarde. En la figura 11-1 se indican pasos necesarios para aproximar el tiempo que dure una sesión experimental.
11Martin227-239.indd 231
8/5/08 17:25:42
232
Intervalo de respuesta
Estímulo
Preparación
Señal de advertencia
Un ensayo
Intervalo entre ensayos
Capítulo once
Tiempo para cada evento (en milisegundos) Tiempo total para un ensayo = 200 + 200 + 400 + 800 + 400 = 2000 ms, o 2 seg
Una sesión
Informe
Bloque 20
Bloque 4
Bloque 3
Bloque 2
Bloque 1
Instrucciones
Con 20 bloques de 20 ensayos cada uno, 30 seg de descanso, 5 minutos para instrucciones y 5 minutos de preguntas y respuestas:
Tiempo para cada evento (en segundos) Tiempo total para el experimento = 300 seg + (20 bloques ⫻ 40 seg) + (19 descansos ⫻ 30 seg) + 300 seg = 1970 seg o 32 minutos y 50 seg
Incluyendo flexibilidad para llegadas tardías, tiempo para sentarse, etc., este experimento debería ser programado para 40 a 45 minutos. FIGURA 11-1 Ejemplo de los cálculos necesarios para determinar el tiempo requerido para una sesión experimental. En este experimento cada ensayo consiste de 200 milisegundos de una señal de advertencia, 200 milisegundos de preparación (información antes del estímulo), 400 milisegundos del estímulo, 800 milisegundos para el intervalo de respuesta y 400 milisegundos entre ensayos.
Luego deberá determinar el tiempo total que dedique a la recolección de datos de los participantes. Aquí también necesita un margen de tiempo para dar cabida a participantes
11Martin227-239.indd 232
8/5/08 17:25:42
Cómo saber cuándo está listo para empezar
233
adicionales para reponer a los que no llegaron, los que arrojaron datos que hubo que eliminar por no cumplir los criterios o los que quedaron fuera por descompostura del equipo. En cuanto al tiempo necesario para terminar el experimento, recuerde que la recolección de los datos es sólo una parte del trabajo. También necesitará tiempo para analizar los datos, interpretarlos y redactar varios borradores del informe experimental. Estas tareas se tardan más de lo que uno se imagina. ¿NECESITO IMPONER RESTRICCIONES A LOS PARTICIPANTES?
En general, la decisión de establecer limitaciones sobre quienes pueden participar en su experimento depende de la población a la que quiera generalizar sus descubrimientos. El limitado grupo de participantes del cual tiene que escoger ya redujo su capacidad de generalizar. Por ejemplo, si trabaja con estudiantes universitarios, debe considerar que ciertas edades están representadas en demasía y otras, lo contrario. Además debe tomar en consideración que comparados con la población en general, un grupo promedio de estudiantes universitarios tiene un CI superior, ocupa un estrato socioeconómico más alto, tiene más habilidades de lectura y es muy poco probable que tenga problemas de salud. Por eso, no puede generalizar legítimamente a toda la población. Sin embargo, a veces, por razones prácticas, conviene excluir del experimento algunos individuos, aunque esto limite más la posibilidad de generalizar los resultados. Por ejemplo, si su estudio trata de facultades lingüísticas, como la habilidad de lectura, identificación de palabras, memoria de palabras y otras tareas relacionadas con el lenguaje, sería mejor limitar la participación sólo a los que tienen por lengua materna el español. Si estudia la percepción visual, es preferible tener gente con graduación de 20/20 o que apruebe un examen de daltonismo. Si estudia la habilidad motriz, como en psicología de los deportes, habrá que excluir a quienes tienen impedimentos físicos y que no arrojarían datos útiles. En otros casos, deberá utilizar sólo hombres o sólo mujeres, mientras que en otros es conveniente tener el mismo número de mujeres y hombres, para evaluar el efecto del sexo en el desempeño. Estos casos son apenas algunas posibles restricciones que debería tomar en cuenta. Dependiendo de la tarea que se va a desempeñar en su experimento, deben considerarse con cuidado otras restricciones.
¿DEBO ESTABLECER ALGÚN CRITERIO INICIAL PARA ELIMINAR PARTICIPANTES?
Como vimos en el capítulo 4, a veces se requiere establecer criterios de desempeño antes de reunir los datos. Por ejemplo, en mis experimentos con frecuencia reúno datos de tiempos de reacción. Hay ocasiones en que uno o dos participantes no tienen un desempeño total equiparable al de los demás, así que establezco un criterio de que los datos de todo individuo cuyo tiempo de reacción exceda 300 milisegundos del promedio de todos los participantes, quede eliminado del análisis. Tal criterio, junto con el número de participantes eliminados, debe declararse en la sección de resultados del informe experimental. Como se
11Martin227-239.indd 233
8/5/08 17:25:42
234
Capítulo once
observó en el capítulo 4, no cabe eliminar participantes ni suprimir datos porque no apoyan la hipótesis pronosticada. El propósito general de establecer un criterio inicial es eliminar a los participantes que son claramente diferentes de los demás y que, por lo tanto, aumentan mucho la variabilidad de los datos. Las diferencias pueden ser debidas a factores motivacionales, factores de la personalidad o limitaciones personales. Tales variaciones pueden ser de interés para los psicólogos que estudian las diferencias individuales o el comportamiento anormal, pero por lo regular no son de mucho atractivo para los psicólogos experimentales, cuyo interés está en el establecimiento de una ciencia de la norma conductual. ¿PUEDO DEFINIR OPERACIONALMENTE TODAS MIS VARIABLES?
En el capítulo 7 analicé la necesidad de definir operacionalmente las variables independientes y dependientes y establecer las operaciones que hay que llevar a cabo para repetir su experimento. Las definiciones operacionales se establecen en una etapa inicial del diseño del experimento, pero a veces los experimentadores no lo hacen. Como las variables independientes son las de mayor interés para el experimentador, debe tenerse mucho cuidado al especificar su definición. Supongamos que se propone realizar el experimento que tiene la marca de ser el más propuesto por mis estudiantes:1 quiere determinar los efectos de escuchar música sobre el estudio. Algunas variaciones del experimento básico son los efectos comparativos del rock y la música clásica, la televisión, el ruido y la música alta o la baja. Supongamos que la comparación es entre el rock y la música clásica. ¿Cuál es la música rock? ¿Heavy metal, punk rock, new wave, hip-hop o rock and roll? ¿Cuál es la música clásica? ¿Un vals de Strauss, la Sinfonía desde el nuevo mundo de Dvorak, una sonata de Beethoven o la Obertura 1812 de Tchaikovsky? Incluso cuando se trata de música clásica, el resultado del experimento puede ser diferente si toca un cuarteto de cuerdas o una obertura completa con timbales y cañones. De la misma manera, si la comparación es entre música fuerte y suave, la pregunta es qué tan fuerte. Una respuesta apropiada no es “Súbele hasta que se escuche fuerte” y ni siquiera: “Voy a poner el control del volumen en mi estéreo en 8.” Otro experimentador no sabría qué operaciones seguir para producir el mismo volumen. Idealmente, alguien tiene que medir el sonido con un instrumento y expresar el nivel de presión sonora promedio en decibeles. Para la variable dependiente también se requiere de una definición operacional. ¿Qué se va a medir para ver si la música tiene un efecto sobre el estudio? Hay muchas posibilidades. Podría averiguar cuántas páginas leen los participantes en cierto tiempo. Tal vez descubra cuántos problemas de matemáticas pueden solucionar. Quizá pueda aplicarles un examen breve sobre el material estudiado o pedirles que califiquen qué tanto les costó estudiar en
1
Lo siguen de cerca en popularidad los experimentos realizados para probar los efectos de la sustancia X (por ejemplo, marihuana, alcohol o cocaína) sobre el desempeño de la tarea Y (como conducir, estudiar o memorizar). Si su profesor le pide que proponga un experimento y usted quiere ser original, no proponga ninguno de éstos.
11Martin227-239.indd 234
8/5/08 17:25:43
Cómo saber cuándo está listo para empezar
235
determinada condición. Cada una de estas mediciones tiene sus ventajas y desventajas, pero tendrá que definir operacionalmente alguna variable dependiente, ya que una propuesta no está completa si no lo hace. ¿NECESITO EQUIPO O MATERIALES?
Muchos experimentos requieren equipo y para casi todos hay que preparar algún material. Afortunadamente, con computadoras pueden presentarse los estímulos en el momento oportuno y registrar y almacenar las respuestas. Si tiene acceso a equipo de cómputo y sabe cómo utilizarlo o lo ayuda alguien que sabe, podrá realizar muchos experimentos con la mínima preparación. Sin embargo, si no tiene computadoras o si su experimento no puede aprovecharlas, tendrá que realizarlo a la antigua, con el equipo que tenga a la mano o bien tendrá que construir el equipo y los materiales usted mismo. En algunos casos, quizá tenga que planear su experimento con los recursos disponibles. Entre los materiales que tiene que preparar están el juego de instrucciones, hojas de respuesta en las que se registran los datos y un guión de preguntas y respuestas. Las instrucciones se redactan con antelación. Más tarde quizá convenga incluirlas en un apéndice del informe experimental. En cualquier caso, las instrucciones deben hacerse públicas por si otro investigador quiere repetir su experimento. No es buena idea entregar las instrucciones a los participantes, con la esperanza de que las lean y las entiendan. Las habilidades de lectura de algunas personas dejan que desear, particularmente cuando el experimentador está encima, esperando a que terminen. Lo común es que los experimentadores den las instrucciones escritas y las lean en voz alta, con lentitud (es la primera vez que los participantes las oyen, mientras que el experimentador las ha leído muchas veces). La última oración de las instrucciones es, por lo general: “¿Tienen alguna pregunta?” Incluso en los experimentos en los que el aprendizaje no representa un problema, es útil darles a los participantes algunos ensayos de práctica, para que sepan qué esperar cuando inicie el experimento. Estos ensayos de práctica también pueden ser incluidos al final de las instrucciones. Si el experimento requiere que se registren datos de respuestas individuales (a diferencia, por ejemplo, de los cuestionarios), tendrá que preparar hojas de datos para este propósito. Si va a presentar varios tipos de ensayos que representen diferentes niveles de la variable independiente, las hojas de respuesta pueden incluir también esta información. En particular, si debe presentar al azar los tipos de ensayos, tenga determinados los órdenes aleatorios con mucha anticipación mediante el uso de una tabla de números aleatorios o algún otro dispositivo aleatorio. Si trata de crear una secuencia aleatoria en el momento de llevar a cabo el experimento, no será verdaderamente aleatorio (véase el capítulo 2). Por último, debe escribir un guión de preguntas y respuestas para que al final del experimento informe a los participantes acerca del propósito de la investigación. Cuando los participantes entran en un experimento como parte de un requisito de la clase, el guión es necesario. Pero aunque no lo sea, es una buena idea tenerlo. La gente terminará el experimento más a gusto y no se llevará ideas erradas acerca de lo que acaba de pasar. Además,
11Martin227-239.indd 235
8/5/08 17:25:43
236
Capítulo once
quizás aprenda algo de psicología con esta experiencia y, cuando menos, se sentirá mejor de que alguien se haya tomado el tiempo para explicar el propósito del estudio y agradecerles por su servicio.
¡YA ENTENDÍ!
INS
TR
UC
CIO
NE
S
¿SÉ CÓMO VOY A ANALIZAR LOS DATOS?
El capítulo 12 trata sobre cómo interpretar los resultados experimentales mediante estadística descriptiva e inferencial y en el apéndice A se proporciona una guía de las pruebas estadísticas más utilizadas. Si su experimento es relativamente simple y pequeño, puede ser suficiente para que determine cómo analizar sus datos. Si su experimento es más complejo, quizá necesite la ayuda de su profesor, un libro de estadística o un experto en la materia que le ayude a determinar la mejor manera de analizar sus resultados. Comoquiera que determine cuál es la mejor manera de analizar los resultados, antes de hacer el experimento debe saber cómo va a analizar los datos. Los expertos en estadística cuentan historias de terror de gente que llega con cantidades impresionantes de datos después de haber terminado el experimento, y se encuentran con que no sirven porque no se pueden analizar. No se convierta en personaje de estas historias. Conozca de antemano en qué forma necesita sus datos y cómo pueden analizarse. ¿CÓMO INTERPRETARÉ LOS POSIBLES RESULTADOS DE MI EXPERIMENTO?
Cuando se decida a realizar un experimento, lo probable es que tenga alguna idea acerca de cuáles serán los resultados. A diferencia de la suposición estadística inicial, la llamada hipótesis nula, de que no habrá efecto por la manipulación de la variable independiente, quizás uno espera que las diferencias en los niveles de la variable independiente causen una diferencia en la variable dependiente. Los científicos tienen que ser testigos imparciales, y no
11Martin227-239.indd 236
8/5/08 17:25:43
Cómo saber cuándo está listo para empezar
237
participantes activos que defiendan un resultado en particular. De hecho, mucho de la diversión de la ciencia está en predecir el resultado de los experimentos. Ser un buen pronosticador es parte del arte de ser un buen científico.2 Pero tenga cuidado de no enamorarse de sus pronósticos, ya que estará tentado a perder la objetividad y producir un experimento sesgado. Esté preparado para interpretar los resultados de su experimento cualquiera que sea el resultado. Algunos experimentos, debido a su diseño, se consideran fracasos si ocurren ciertos resultados. Los científicos llaman resultados negativos a los que apoyan la hipótesis nula. Por ejemplo, supongamos que realizó el experimento para determinar los efectos del rock y la música clásica sobre las capacidades de estudio de los universitarios y descubrió que el grupo que escuchó rock y el que escuchó música clásica no tuvieron un desempeño estadísticamente diferente. Como se analiza en el capítulo 12, debido a que nuestras pruebas estadísticas se diseñan para probar diferencias, no similitudes, no puede decirse que el desempeño de los grupos fuera igual, lo único que puede decir es que no logró demostrar que eran diferentes. Sería interesante saber que el rock afecta el estudio en forma parecida a la música clásica, pero no encontrar una diferencia podría deberse a varios factores que no tienen que ver con una diferencia real, por ejemplo, reunir muy pocos participantes o no tener un control adecuado de las variables, que produjeron mucha variabilidad de los datos, etc. En algunos casos, cuando una serie de experimentos con condiciones similares producen efectos estadísticamente significativos, se acrecienta la seguridad de que un resultado negativo es importante. Pero generalmente un resultado negativo no es interesante, salvo como ejemplo metodológico de lo que no se debe hacer. Pero si el resultado de su experimento es inesperado, ya negativo, ya positivo, hay que aceptarlo y tratar de explicarlo. Hay una tendencia a querer pasar por alto el resultado y culpar al diseño o a problemas en la metodología. Por mucho que estuviera convencido de su hipótesis al inicio de su experimento, cuando termina, hay que aceptar los resultados y tratar de explicarlos. Una manera de saber si será capaz de interpretar el resultado de su experimento es considerar varios resultados posibles y determinar si podría predecirlos todos. Como vimos en el capítulo 3, las teorías sirven para predecir. Recuerde que una teoría es una declaración de las posibles relaciones entre un conjunto de variables abstractas; y en el caso de una teoría experimental, entre una variable independiente y una dependiente. Es más general que una declaración de un resultado específico de cualquier experimento. Así, puede decidir que su experimento cabe dentro del contexto de cierta teoría; por tanto, su predicción del resultado del experimento será el mismo que predice la teoría. Es todavía mejor la situación si se proponen dos o más teorías con pronósticos diferentes. Si una de las teorías apoya un resultado positivo y la otra uno negativo, la interpretación de su resultado será todavía más fácil si ocurre el primero, por las razones analizadas arriba. Como quiera que sea, lo mejor de todo es cuando dos teorías predicen resultados positivos pero en direcciones opuestas. En este caso, cualquier resultado puede ser interpretado claramente. 2
Los maestros de español dirían que es un oxímoron (pero no, espero, un morón).
11Martin227-239.indd 237
8/5/08 17:25:44
238
Capítulo once
La segunda manera de hacer y apoyar una predicción es partir de una investigación previa. Quizás alguien haya hecho un experimento que es similar al de usted en algunos aspectos. En este caso, el pronóstico sería que descubrirá un resultado similar. Si lo hace, habrá demostrado que el resultado puede ser repetido y que puede ser generalizado a su situación experimental diferente y que está en camino de hacer una declaración teórica más general. Si su resultado es diferente del informado en el experimento anterior, habrá descubierto una limitación al resultado anterior, y nuevamente, algo se ha aprendido. La tercera justificación de una predicción, particularmente cuando no hay estudios anteriores o no hay teorías de un campo en particular, es un argumento lógico. Por ejemplo, quizá pudiera argüir que es lógico que la música fuerte e impredecible distraiga, ya que aparta la atención del estudio. También es posible predecir otros efectos con razonamientos similares. Por ejemplo, que la música pudiera ayudar si enmascara un ruido más fuerte e impredecible o que cuanto más conozca un estudiante la música, menos baja su desempeño. Estas predicciones parten de la lógica, pero pueden alcanzar un estatus teórico si las apoya el resultado de su experimento. El motivo para querer predecir los resultados de un experimento es, básicamente, saber con anticipación que al terminar, habrá aportado algo importante a la ciencia. Si no puede defender los resultados como apoyo de algo importante, no habrá dado nada útil. Por ejemplo, si el resultado que predijo fuera el esperado por todas las teorías propuestas y no las eliminara, su trabajo no llevaría nada a los conocimientos científicos. Como vimos en el capítulo 3, la ciencia avanza generalmente refutando las teorías, no al confirmarlas, y en este ejemplo no se descartó ninguna. El punto básico es que si cree que un resultado es importante para el avance de la ciencia, debe ser capaz de defender sus convicciones antes de realizar el experimento. De otra manera no tiene sentido el proceder. ¿ESTOY LISTO?
Si ha respondido a todas las preguntas anteriores, probablemente está listo para empezar su experimento. Como verificación final, debe preguntarse si podría, en este momento, redactar todas las secciones de un informe experimental, menos los resultados. De hecho, se ahorraría mucho tiempo si lo hace antes de reunir los datos. A los estudiantes de muchos posgrados en psicología experimental se les pide que entreguen un anteproyecto formal antes de realizar una tesis. Este documento es, esencialmente, el informe final del experimento, excepto que la sección de resultados tiene pronósticos, en lugar de datos reales y, como es obvio, no lleva un análisis estadístico. Una ventaja de hacer un anteproyecto es que se termina pronto la mayor parte de la redacción. En los posgrados, el procedimiento también protege al estudiante en alguna medida, ya que los integrantes del claustro pueden indicarle antes de que emprenda el trabajo si piensan que el diseño contiene errores graves. Para sus propósitos como alumno, la principal ventaja de escribir de antemano la mayor parte del informe es que habrá tenido que responder primero las preguntas del capítulo. Claro está, no se puede describir un procedimiento experimental hasta haber resuelto todos los detalles. No puede escribir una revisión de la bibliografía sin haberla recopilado. No puede predecir
11Martin227-239.indd 238
8/5/08 17:25:44
Cómo saber cuándo está listo para empezar
239
el resultado del experimento sin conocer las teorías propuestas ni los resultados anteriores. Escribir un anteproyecto es una buena manera de cerciorarse de que ha meditado exhaustivamente en el experimento que se propone hacer. Hasta aquí debería estar listo para la emoción de reunir sus propios datos. Planear un experimento puede ser divertido y un buen ejercicio intelectual. La búsqueda bibliográfica requiere disciplina y puede ser algo interesante. Descubrir las pruebas estadísticas apropiadas emociona a algunos experimentadores, pero, para ser honesto, yo mismo hago las pruebas estadísticas sólo porque son parte del proceso experimental. El acto creativo de reunir los datos y probar las teorías y predicciones valen la pena el duro trabajo de dar los pasos que a uno le parezcan los menos interesantes. Tengo la satisfacción de colaborar con la ciencia haciendo una contribución duradera y potencialmente inmortal a los conocimientos. Pero para mí (espero que para usted también) lo más divertido de ser un científico es la emoción del descubrimiento, una mirada primeriza a datos que nadie más ha visto. Y eso, por sí solo, es lo que hace que valga la pena todo el esfuerzo.
■ Resumen Antes de que esté listo para realizar un experimento, tiene que considerar muchos detalles prácticos. Una manera de determinar si ha anticipado estos detalles es presentar sus ideas a los demás, ya sea de palabra (en una presentación), o por escrito (en un anteproyecto). Un motivo de preocupación es si ha resuelto todas las cuestiones éticas y si el experimento ha sido aprobado por una junta de revisión institucional. Para determinar el número de participantes necesarios, hay que encontrar experimentos similares ya difundidos en las publicaciones especializadas y emplear números similares. Además, tiene que decidir si trabaja con los participantes de manera individual o en grupo. Para determinar el tiempo que tarda el experimento, tiene que calcular lo que tarda cada ensayo, el número de ensayos, el tiempo requerido por otras actividades y el número de participantes de cada condición. Para determinar si va a establecer restricciones en la selección de los participantes, debe considerar a qué población va a generalizar sus resultados. Para excluir ruidos experimentales en los datos, también hay que fijar los criterios para eliminar participantes. Para hacer las definiciones operacionales de las variables debe ser capaz de especificar con precisión qué operaciones son necesarias para manipular las variables independientes o para medir las variables dependientes. Al reunir el equipo y los materiales necesarios hay que incluir la preparación de instrucciones, hojas de respuesta y guiones de preguntas y respuestas. Por último, debe saber cómo analizar estadísticamente los datos e interpretar los resultados. Esta interpretación tiene que articularse con las teorías actuales, resultados anteriores o razonamientos lógicos. Si ponderó todos estos elementos antes de empezar el experimento, no tendrá contratiempos para terminarlo y publicar los resultados.
11Martin227-239.indd 239
8/5/08 17:25:44
12
Cómo interpretar los resultados experimentales Una estadística bien presentada es mejor que la “gran mentira” de Hitler; despista, pero la culpa no es del lector. D. HUFF (1954)
Existen tres clases de mentiras: las mentiras, las mentirotas y las estadísticas. BENJAMIN DISRAELI
Ahora bien, creo que con los años, la dependencia excesiva en conclusiones binarias empobrecidas que se sacan con el procedimiento de la prueba de la hipótesis ha llevado sutilmente nuestra disciplina a insidiosos callejones conceptuales que han dificultado nuestra visión y han sofocado nuestro potencial. G. R. LOFTUS (1993)
Pese a los abusos constantes, las estadísticas pueden ser una herramienta elegante y poderosa para tomar decisiones en momentos de incertidumbre. ROGER E. KIRK (1990)
A
hora está listo para recopilar datos. Si lleva un registro manual de las respuestas, tendrá que configurar hojas de respuestas por participante en las que incluya información como el número de identificación y el sexo del participante, la condición que se le presenta y cualquier comentario específico que quiera hacer constar acerca del participante o la sesión experimental. Obviamente, debe tener dónde registrar las respuestas de forma sistemática. Más adelante, estos datos se ordenan de acuerdo con las variables independientes y los niveles de las mismas. Si el experimento fue realizado en computadora, que es lo más usual hoy en día, el programa ordenará los datos en un conjunto. Si los recopiló manualmente, tendrá que ordenarlos y, si hace el análisis estadístico en computadora, tendrá que crear un conjunto de datos. Ya configuró un conjunto de números, pero aún le falta mucho para responder la pregunta experimental: ¿Qué efecto tiene la variable independiente en la variable dependiente? Para responderla, necesita manejar diversos métodos para analizar datos. En este capítulo entenderá el razonamiento en el que se funda el análisis de los datos. No le servirá para realizar las estadísticas necesarias a fin de analizar un experimento. Si necesita tales cálculos, lea primero este capítulo y luego consulte la operación estadística 240
12Martin240-267.indd 240
6/5/08 20:49:48
Cómo interpretar los resultados experimentales
241
adecuada en el apéndice A. Este apéndice no sustituye el libro de texto, pero con la ayuda de su profesor, le bastará para analizar un diseño experimental simple como los que hemos estudiado aquí. Ni tampoco este capítulo ni el apéndice sustituirán un curso de estadística. Sólo analizaremos lo básico, lo suficiente para que pueda elegir una prueba y esté en posición de analizar un experimento simple. Si quiere hacer mayores investigaciones, debe tomar un curso elemental sobre estadística.
■ Gráfica de las distribuciones de frecuencia Supongamos que le interesa saber si la ansiedad de los estudiantes que se van a titular en psicología es diferente de los que se titulan en economía. Tiene una lista del alumnado de la universidad, elige al azar 10 estudiantes de las dos carreras y los convence de contestar una prueba que indica el nivel general de ansiedad. Las calificaciones de la prueba de los dos grupos son sus datos crudos.1 En la tabla 12-1 se presentan algunas calificaciones ficticias entre 0 y 100. Cuanto más alta sea la calificación, mayor ansiedad siente el estudiante. ¿Hay una diferencia entre los dos grupos? Observar las calificaciones individuales es como escuchar separadas las notas de una canción: es difícil saber qué melodía es. Hace falta un método para reordenar los datos crudos e interpretarlos con más facilidad. Quizá pueda trazar una distribución de frecuencias, que es una gráfica sobre la frecuencia con que aparece cada calificación en los datos. Pero observe que ninguna calificación se presenta más de una vez. Por tanto, para que la distribución tenga un significado, necesita ordenar las calificaciones por categorías. Le con■ TABLA 12-1 Calificaciones ficticias de ansiedad en 10 estudiantes de economía y 10 de psicología Estudiantes de economía
Estudiantes de psicología
Núm. de estudiante Calificación Núm. de estudiante Calificación 1 2 3 4 5 6 7 8 9 10
62 56 67 91 53 87 51 63 46 71
11 12 13 14 15 16 17 18 19 20
55 42 61 58 70 47 62 36 74 51
1
Notará que, en realidad, no se trata de un experimento, sino de una observación correlacional, ya que compara dos comportamientos: el comportamiento de escoger una especialidad y el de responder preguntas de una prueba. No se manipuló ninguna variable independiente en el estudio.
12Martin240-267.indd 241
6/5/08 20:49:51
242
Capítulo doce
Frecuencia
Estudiantes de psicología
Categoría de las calificaciones
Frecuencia
Estudiantes de economía
Categoría de las calificaciones FIGURA 12-1 Distribuciones de frecuencias de calificaciones ficticias sobre la ansiedad de estudiantes de economía y psicología anotadas en la tabla 12-1.
viene tener varios puntos de datos en las categorías más frecuentes, de manera que incluye 10 calificaciones por categoría (por ejemplo, del 10 al 19). En la figura 12-1 se muestra tal distribución de frecuencias para los dos grupos. El eje vertical, llamado “Frecuencia”, es el número de los puntos de datos crudos que caen dentro de cada categoría. La gráfica de la distribución de frecuencias puede ser un primer paso útil para saber si hay alguna diferencia entre las condiciones. A veces, el efecto experimental es tan notorio que una inspección visual de las distribuciones convencen de que hay una diferencia. Sin embargo, en este ejemplo, las distribuciones son muy similares. Los expertos en estadística han asignado nombres a los tipos de distribución, para usar un lenguaje común y no tener que enseñarse una gráfica de toda la distribución. Ya hemos mencionado las propiedades de la distribución normal, que aparece en la parte superior izquierda de la figura 12-2. Para que sea normal, la distribución tiene que ajustarse a una fórmula matemática compleja. Pero, para nuestros propósitos, podemos decir simplemente que una distribución se aproxima a la distribución normal si se asemeja a una distribución en forma de campana, como se muestra en la figura. Es importante saber si sus distribuciones son similares a la distribución normal, ya que muchas pruebas estadísticas que deseará emplear requieren que los datos sean aproximadamente normales. En la figura 12-2 se ilustran también otros tipos de distribuciones. Una distribución que tiene dos categorías más frecuentes en lugar de una es una distribución bimodal. La distribución de las estaturas de un grupo compuesto por igual número de hombres y mujeres
12Martin240-267.indd 242
6/5/08 20:49:51
Cómo interpretar los resultados experimentales
243
CREO QUE YA ES NORMAL
sería bimodal. Una distribución es sesgada si es asimétrica por tener más calificaciones en una de las colas. Una distribución de calificaciones de CI para doctorados sería sesgada, ya que, en general, pocos tienen un CI bajo. Sin embargo, si una de las colas de la distribución aparece suprimida por completo, se dice que es truncada. Una gráfica de tiempos de reacción tendría la forma de una distribución truncada porque existe un límite para la velocidad a la que puede responder una persona.2
FIGURA 12-2 2
Normal
Bimodal
Truncada
Sesgada
Cuatro tipos de distribuciones de frecuencias.
¿Recuerda los efectos de techo y piso? Causan distribuciones truncadas.
12Martin240-267.indd 243
6/5/08 20:49:52
244
Capítulo doce
DISTRIBUCIÓN TRUNCADA Graficar la distribución de frecuencias permite describir los datos de modo más ordenado que anotarlos en forma cruda, pero sigue siendo complicado representar así los resultados de un experimento. Sería magnífico tener un solo número que represente el desempeño de los participantes de cada grupo. Lo que necesitamos es una forma de calcular una estadística descriptiva que detalle los datos de esta manera.
■ Estadística para describir distribuciones Los psicólogos aplican dos clases de estadística básica: la estadística descriptiva y la estadística inferencial. La primera no es más que un número que permite al experimentador describir algunas características de los datos, en lugar de tener que informar cada punto de datos. Más adelante estudiaremos la segunda. TENDENCIA CENTRAL
Una de las cosas más importantes que nos gustaría saber de un conjunto de datos es el comportamiento característico de los participantes en varias condiciones. Los psicólogos llaman a la estadística que describe este comportamiento característico una indicación de la tendencia central. Una manera de comparar los dos grupos en nuestro ejemplo es calcular la tendencia central de los estudiantes de psicología y los de economía. Hay tres formas de expresar la tendencia central. La moda es la estadística más fácil de calcular, pero por lo regular es la menos útil, ya que ignora muchos datos. La moda simplemente es la calificación que ocurre con mayor frecuencia. En nuestro ejemplo no hay moda porque ninguna calificación se presenta más de una vez. La moda se encuentra después de MODA vaciar los datos en categorías. La moda de los estudiantes de psicología es la categoría de 50 a 59, ya que ocurre con una frecuencia de tres. Aunque esta categoría parece representar bastante bien la tendencia central de la distribución, observamos que si se moviera una sola calificación, la moda cambiaría drásticamente. Por ejemplo, supongamos que el estudiante 14 PASTEL A LA MODA
12Martin240-267.indd 244
6/5/08 20:49:52
Cómo interpretar los resultados experimentales
245
tiene una calificación de 71 en lugar de 58. La moda de la categoría sería ahora de 70 a 79, ya que habría una frecuencia de tres en esa categoría. ¿Le parece que esta categoría representa la tendencia central de la distribución? El problema es que, en la moda, sólo se utiliza una propiedad de los datos, la calificación que ocurre con más frecuencia, para describir el comportamiento característico y se ignoran las demás calificaciones. Así que cuando se toma la moda, se desecha mucha información, como el orden y tamaño de cada número. En el caso de muestras pequeñas, es arriesgado depender de la moda para describir los datos. La mediana es, literalmente, la mitad de las calificaciones; tiene un número igual de calificaciones arriba y abajo. Para calcular la mediana, hay que anotar todas las calificaciones en orden y luego escoger la de la mitad. Con un número par de calificaciones, la mediana queda a la mitad de las dos calificaciones centrales. Por ejemplo, al ordenar las 10 calificaciones de los estudiantes de economía, encontramos que la quinta es 62 y la sexta es 63, de manera que la mediana es 62.5. En el caso de los estudiantes de psicología, es 56.5. La mediana no refleja el tamaño de las diferencias entre calificaciones, ya que el principio que la define es el orden. Por tanto, podemos cambiar cualquier calificación de la distribución sin cambiar la mediana, siempre que la posición de la mediana en la lista permanezca igual. También aquí perdemos parte de la información cuando describimos los datos en términos de una mediana. La media es el promedio ponderado de las calificaciones; esto es, es la suma de todas las calificaciones dividida entre el número de las calificaciones sumadas. Por ejemplo, para encontrar la media de los estudiantes de economía, sumamos las 10 calificaciones, que dan una suma de 647, y luego dividimos la suma entre 10, cuyo resultado es 64.7, que es la media. En el caso de los estudiantes de psicología, es 55.6. La media es el centro de gravedad de la distribución; por tanto, ya que el tamaño de las calificaciones influye en la media, cambia siempre que se modifique cualquier calificación de la distribución. ¿Qué medida de tendencia central describe mejor la distribución? Como pasa con las preguntas más interesantes, la respuesta “depende”. Primero, depende de la forma de la distribución. Si tenemos una distribución normal u otra distribución simétrica unimodal, las tres mediciones darán el mismo número. Sin embargo, conforme la distribución se sesga, las medidas se separan. En la figura 12-3 se muestra que el tamaño de las calificaciones extremas en la cola derecha de la distribución influye en la media. La influencia en la media se debe a que hay más calificaciones a la derecha, mientras que la moda permanece sin cambios.3 Deberá ejercitar su criterio para decidir qué medida utilizar. Si graficara los ingresos de un grupo grande de personas, tendría, digamos, una distribución similar a la figura 12-3. En este caso, la mediana sería el mejor promedio, porque en su caso la influencia de las pocas personas con salarios exorbitantes sería menor que en la media. De seguro se le ocurrirán más ejemplos extremos en los que pocas calificaciones muy grandes o muy pequeñas distorsionan la media. Cuando tenga que escoger una medición que describa un promedio, 3
Las características de los números que utilice también influyen en la medida a emplear. Véase en el apéndice A un análisis de las escalas y en la figura A-1 una medición de la tendencia central apropiada para cada una.
12Martin240-267.indd 245
6/5/08 20:49:53
Capítulo doce
Moda Mediana Media
246
FIGURA 12-3
Ubicación de la moda, la mediana y la media de una distribución
sesgada.
tendrá que examinar la forma de la distribución, determinar el propósito del promedio que se utilizará y ejercer su criterio.4 DISPERSIÓN
Una medida de tendencia central dice algo útil acerca de la distribución, aunque sólo describe un aspecto particular. Otra estadística que ayuda a describir una distribución es la medición de la dispersión o lo espaciado entre las calificaciones. Una medida de la dispersión es el rango, que se calcula restando la calificación más pequeña de la más grande. En nuestro ejemplo de los estudiantes de economía, el rango es 91 ⫺ 46 = 45; en el caso de los de psicología, el rango es 74 ⫺ 36 = 38. Aunque nos da una indicación de la dispersión, el rango es insensible a las calificaciones centrales, ya que sólo se determina por las calificaciones más pequeña y más grande. Una calificación extrema cambia totalmente el rango. Por esta razón, quizá sirva mejor una medida de dispersión diferente. Como alternativa, restamos la media de cada calificación para tener un número que indique la desviación de cada calificación de la media. Para obtener una desviación media, sumamos estas desviaciones y dividimos entre el número de éstas. Ahora bien, debido a que los números se cancelan cuando se suman, tendremos una suma de cero, lo cual no ayuda mucho. Podríamos ignorar el signo de las desviaciones, sumar los valores absolutos y obtener una desviación promedio; pero los estadísticos consideran que una indicación de dispersión más útil consiste en elevar al cuadrado5 cada desviación (lo que también elimina el signo de más o menos), sumar los cuadrados y dividir entre el número de las desviaciones cuadradas que se sumaron. Así tenemos una medición de la dispersión llamada varianza. Una medición todavía más útil es la raíz cuadrada de la varianza, un 4
Supongo que ya leyó el capítulo 5 y estoy tratando de ser justo con la ciencia. Los libros How to Lie with Statistics de Huff (1954) y Flaws and Fallacies in Statistical Thinking de Campbell (1974) dan muchos ejemplos humorísticos de cómo distorsionar estadísticas descriptivas. 5 Un número que multiplicado por sí mismo da la varianza.
12Martin240-267.indd 246
6/5/08 20:49:53
Cómo interpretar los resultados experimentales
247
número llamado desviación estándar. Las fórmulas para calcular estas mediciones se encuentran en el apéndice A. La desviación estándar es una medición útil de dispersión porque nos habla de la proporción de calificaciones entre ésta y la media. Cerca de dos tercios de las calificaciones de una distribución normal se encuentran en el intervalo entre una desviación estándar por abajo de la media y una por arriba. Por ejemplo, si aplicamos exámenes escritos a los estudiantes del primer año y a los del último año de una universidad y observamos que los primeros tuvieron un desviación estándar de 15, mientras que los segundos de cinco, sabríamos que las calificaciones de cerca de dos tercios de los estudiantes del primer año tuvieron alrededor de 30 puntos entre sí y que las calificaciones de dos tercios de los alumnos del último año tuvieron alrededor de 10 puntos entre sí. Tal resultado, además de un incremento en la media entre los estudiantes del primer año y los del último año, serviría como respaldo de la hipótesis de que la universidad logró enseñar a sus estudiantes a escribir bien. No sólo el estudiante característico se volvió un buen redactor, sino que todo el estudiantado mejoró su escritura. También es útil considerar que la desviación estándar es una manera de expresar el grado de error que se comete al utilizar la media para representar las calificaciones en una distribución. En realidad, la media es la mejor estimación de una calificación individual; por tanto, la desviación estándar indica, en promedio, si su estimación está bien. Si todas las calificaciones fueran las mismas, la desviación estándar sería cero, como indicación de que la media nunca sería un error. Conforme crecen las diferencias entre las calificaciones, la desviación estándar se incrementa, como también el error que se cometería al representar una calificación con la media.6
■ Gráfica de relaciones entre variables Realice un experimento para saber si existe una relación entre las variables independientes y dependientes. Aunque la gráfica de las distribuciones de frecuencias es un buen primer paso para analizar los datos, a menudo descubrirá que es útil trazar una gráfica para representar las relaciones experimentales. Las gráficas no son una novedad, ya que han aparecido en capítulos anteriores. Como sea, empecemos con los conceptos básicos. TRAZADO DE GRÁFICAS
Una gráfica tiene dos ejes. El eje vertical (eje de las y) recibe el nombre de ordenada y el eje horizontal (eje de las x), abscisa.7 Al graficar sus resultados experimentales, grafique la variable dependiente sobre la ordenada y la independiente sobre la abscisa. En algunos 6
Qué medición de dispersión se use también tiene la influencia de las características de los números que uno utiliza. Véase en el apéndice A un análisis de las escalas numéricas y la figura A.1 para ver la medición apropiada. 7 Le ayudará a recordar el nombre de los ejes al observar la forma que toma su boca cuando dice la primera parte de cada palabra; “ab____” se dice con una boca horizontal y “or___” con una boca vertical. Es un buen truco para recordarlas.
12Martin240-267.indd 247
6/5/08 20:49:53
248
Capítulo doce
casos, los niveles de la variable independiente no pueden ser representados por los números o si se usan números, no tienen un significado cuantitativo. En el apéndice A se observa que estos niveles se ubican en una escala nominal, ya que sólo son BSCISA nombres. En este caso, conviene utilizar una gráfica de barras para representar los datos. En la figura 12-4 se muestra una gráfica de barras con las calificaciones medias de ansiedad de los estudiantes de psicología y economía. En muchos casos, la variable independiente es continua, o, RDENADA para utilizar los términos del apéndice A, los niveles de la variable caen sobre al menos una escala ordinal y por lo tanto pueden ser puestos en orden. En este caso, se traza un histograma, como se muestra en la figura 12-5. Un histograma elimina los espacios entre las barras de una gráfica de barras. En la misma figura 12-5 se muestran datos ficticios que relacionan la duración que los pacientes están en terapia y la calificación de su imagen per-
Media de la calificación de la imagen personal
FIGURA 12-4 Gráfica de barras que muestra la media de las calificaciones de la ansiedad para los estudiantes de psicología y economía anotados en la tabla 12-1.
Alta
Baja
Meses en terapia FIGURA 12-5 Histograma que ilustra los resultados de un experimento multinivel que relaciona la imagen personal con los meses en tratamiento (datos ficticios).
12Martin240-267.indd 248
6/5/08 20:49:54
Media de la calificación de la imagen personal
Cómo interpretar los resultados experimentales
249
Alta
Baja
Meses en terapia FIGURA 12-6
Gráfica lineal que ilustra los mismos datos que el histograma de la figura 12-5.
sonal. El periodo de terapia es una variable continua, ya que podemos escoger los niveles en cualquier momento del continuo temporal. Una forma común de representar los datos cuando la variable independiente es continua es una gráfica lineal, o función. En la figura 12-6 se dan los mismos resultados que en la figura 12-5, pero, en vez de ser un histograma, es una gráfica lineal en la que se trazan datos que se unen con rectas. Observe que esta manera de representar los datos destaca bien las tendencias. Para utilizar esta gráfica, debe tener los datos de un continuo. Como mal ejemplo, supongamos que sobre la abscisa de la figura tuviéramos las categorías étnicas, como hispano, negro, etc., en lugar de los meses en terapia. Es obvio que estas categorías no se encuentran en un continuo, así que el listado de las categorías sería totalmente arbitrario. Es absurdo buscar una tendencia en dichos datos. Las gráficas lineales se emplean mejor para ilustrar los resultados de un experimento funcional (de varios niveles) en lugar de los experimentos de dos niveles. El problema con este tipo de experimento es que uno no sabe si la relación es lineal y de todos modos se representaría con una recta. En un experimento funcional se utilizan más de dos niveles de la variable independiente y se puede tener una idea de la forma de la función aun si los puntos están conectados con segmentos de rectas. Sin embargo, se debe tener cuidado al interpretar la forma de las funciones graficadas. La forma de la función sólo tiene un significado cuando los niveles de la variable independiente tienen el mismo espaciado que en la gráfica. En el apéndice A se dice que estos niveles caen por lo menos en una escala de intervalo, ya que un intervalo es igual a cualquier otro. Si los niveles únicamente representan una escala ordinal (pueden estar ordenados pero tener intervalos desiguales), entonces cabe inferir la tendencia general, pero la forma de la función no es interpretable (véase el capítulo 13 para más sobre el trazo de figuras para un informe experimental). DESCRIPCIÓN DE FUNCIONES
En la figura 12-7 se grafican varias funciones. Si el cambio de la variable independiente en una unidad causa que la variable dependiente cambie en una dirección dada y en una can-
12Martin240-267.indd 249
6/5/08 20:49:54
250
Capítulo doce Relación negativa
Relación positiva
Lineal
Acelerada positivamente
Curvilínea
Acelerada negativamente y asintótica
Asíntota
No monotónica
FIGURA 12-7 Gráficas con algunos de los términos empleados para describir las relaciones funcionales.
tidad constante, la función es lineal; cualquier otra relación es curvilínea. Si incrementar la variable independiente produce un incremento en la variable dependiente, la relación es positiva; si causa una disminución, la relación es negativa. Una función que nunca invierte la dirección (esto es, las porciones de la función son todas positivas o todas negativas) es una función monotónica; de otra manera, la función recibe el nombre de no monotónica. Si los
12Martin240-267.indd 250
6/5/08 20:49:55
Cómo interpretar los resultados experimentales
251
cambios en la variable dependiente son cada vez más grandes conforme se incrementa la variable independiente, la función está acelerada positivamente; si el cambio se hace más pequeño, es acelerada negativamente. Una función acelerada negativamente llega con el tiempo a un nivel en particular y entonces se aplana. La curva en este punto se acerca cada vez más a una recta llamada asíntota, aunque la curva y la asíntota nunca se tocan. Se dice que tal función es asintótica o se aproxima a una asíntota. Si es la primera vez que ve estos términos, quizá lo confundan. Sin embargo, conforme los use para describir las relaciones psicológicas, le serán más familiares y le permitirán analizar mejor los resultados.
■ Describir la fortaleza de una relación Las funciones de la sección anterior estaban idealizadas o eran gráficas de una estadística descriptiva, más que puntos de datos individuales. Sin embargo, rara vez verá caer todo dato exactamente sobre una función uniforme. Si emplea datos crudos para graficar una relación experimental, probablemente encuentre un poco de variabilidad, o dispersión, alrededor de las funciones. Como vimos en el capítulo 1, dicha gráfica se denomina diagrama de dispersión. DIAGRAMAS DE DISPERSIÓN
En la figura 12-8 se muestran algunos ejemplos de diagramas de dispersión, que pueden ser resultado de un experimento. En esos esquemas se grafican las relaciones entre las variables independiente y dependiente o de una observación correlacional (capítulo 1) con las variables dependientes sobre los dos ejes. Si observa el despliegue de los puntos en un diagrama de dispersión, tendrá una idea de la fuerza de la relación. Sin embargo, la observación visual es un método demasiado elemental de estimar esta fortaleza. Afortunadamente, cuando la relación es lineal,8 se puede usar una estadística descriptiva llamada coeficiente de correlación. HOGAR DULCE HOGAR
¿DIAGRAMA DE DISPERSIÓN DE UNA RELACIÓN FUERTE? 8 Una forma de correlación utiliza datos que sólo pueden clasificarse u ordenarse, en cuyo caso el término lineal no tiene sentido. Tal correlación se puede usar para cualquier relación monotónica.
12Martin240-267.indd 251
6/5/08 20:49:55
252
Capítulo doce
FIGURA 12-8 Cuatro ilustraciones de diagramas de dispersión. Los coeficientes de correlación se muestran en tres secciones. No se da uno para la sección inferior derecha, ya que la relación es curvilínea y no puede utilizar una razón de correlación.
COEFICIENTES DE CORRELACIÓN
Un coeficiente de correlación es un número entre ⫹1.0 y ⫺1.0, con el signo como indicador de si la relación es positiva o negativa. El tamaño del número indica la fortaleza de la relación. Una correlación de 1.0 (⫹ o ⫺) indica una relación perfecta y una de 0 indica que no hay relación. En la figura 12-8 se muestran los coeficientes de correlación de tres grupos de datos. No se presenta ningún coeficiente en la sección inferior derecha, ya que la función es obviamente curvilínea y no es apropiada una correlación lineal simple (sin embargo, hay una manera de describir una correlación curvilínea, llamada razón de correlación [Kirk, 1990]). En el apéndice A o en cualquier libro de estadística encontrará cómo calcular un coeficiente de correlación.9 Con frecuencia, cuando se informa de un coeficiente de correlación, también se da a conocer un coeficiente de determinación o proporción de la variación explicada. El coeficiente de determinación es el cuadrado del coeficiente de correlación y representa la proporción de la variabilidad compartida por las dos variables. Si la correlación informada es ⫹0.5, el coeficiente de determinación sería ⫹0.25; 25% de la variabilidad es compartida entre las dos variables. Muchos investigadores y manuales, incluyendo el manual de publicación de 9
Al final del capítulo se mencionan varios textos en estadística.
12Martin240-267.indd 252
6/5/08 20:49:55
Cómo interpretar los resultados experimentales
253
la Asociación Psicológica Estadounidense (American Psychological Association, 2001) recomiendan que se señale el coeficiente de determinación siempre que se informe de una correlación. Sin embargo, otros investigadores sostienen que el coeficiente de correlación es una mejor indicación del tamaño del efecto para una observación correlacional y que el coeficiente de determinación subestima en gran medida la importancia práctica de los resultados (Rosnow y Rosenthal, 1999). Si emplea estas estadísticas, deberá familiarizarse con estos argumentos y usar los números de manera informada.
■ Interpretación de los resultados a partir de experimentos factoriales Los resultados de los experimentos factoriales son más difíciles de interpretar que los de otros experimentos, ya que utilizan más de una variable independiente y requieren que evalúe las interacciones. La parte superior de la gráfica de la figura 12-9 muestra algunos resultados ficticios de nuestro experimento anterior, en el que medimos cuánto tardaron los estudiantes en leer los párrafos escritos en letra de 12 puntos o 10 puntos. Sin embargo, en este caso suponga que en un grupo hay niños de ocho años y de 12 en otro. Observe que se ha graficado una variable independiente (el tamaño de la letra) sobre la abscisa, mientras que la otra (edad) está representada por un código de puntos y líneas. No podemos preguntar nada más si la variable independiente ha tenido un efecto sobre la variable dependiente. Debemos hacer tres preguntas más específicas: 1) ¿Existe algún efecto por el tamaño de la letra?, 2) ¿Existe algún efecto por la edad?, 3) ¿El efecto de una variable depende del nivel de la otra? Las dos primeras preguntas se refieren a los efectos principales y la tercera a una interacción. EFECTOS PRINCIPALES
Debido a que en este experimento tenemos dos variables independientes, hay dos efectos principales posibles. Para descubrir si son significativos, tendríamos que realizar un poco de estadística. A fin de interpretar los resultados del experimento sobre el tamaño de la letra, asumamos que cualquier efecto que podamos ver es estadísticamente significativo. Para determinar si existe un efecto principal del tamaño del texto, tenemos que ignorar cualquier efecto de la edad. Por tanto, necesitamos encontrar un punto en la gráfica para cada tamaño de letra que esté en medio de los puntos para cada grupo de edad. En la pregunta de la gráfica de la figura 12-9, “¿efecto principal del tamaño de la letra?” verá unas X entre cada círculo abierto y el círculo negro correspondiente. Estas X representan el efecto del tamaño de la letra promediado en los dos niveles de edad, como si la edad nunca hubiera sido manipulada. Para saber si existe una diferencia en la velocidad de lectura para estas dos X, tracé una línea horizontal por la ordenada. La flecha muestra que hay una diferencia entre las dos X que representan los dos tamaños. La respuesta a esta pregunta es si hay un efecto principal por el tamaño de la letra. Ahora siga el mismo procedimiento para determinar si hay un efecto principal por la edad.
12Martin240-267.indd 253
6/5/08 20:49:56
Capítulo doce
Gráfica de resultados
Tiempo para leer el párrafo (en segundos)
254
8 años
12 años
12 puntos 10 puntos Tamaño de la letra
¿Efecto principal por el tamaño de letra?
Sí
Sí
Tamaño de letra
Tamaño de letra
¿Interacción?
¿Interacción?
Sí
Sí
Tamaño de letra FIGURA 12-9
¿Efecto principal por la edad?
Tamaño de letra
Efectos principales e interacciones en un experimento factorial 2 ⫻ 2.
INTERACCIONES
Si no recuerda qué es una interacción, conviene que revise el análisis de las interacciones del capítulo 9, en el que consideramos los experimentos factoriales. Recuerde que una interacción ocurre siempre que el efecto de una variable depende del nivel de otra varia-
12Martin240-267.indd 254
6/5/08 20:49:56
Cómo interpretar los resultados experimentales
255
ble. Así que, en el experimento del tamaño de letra, la pregunta es si el efecto del tamaño de la letra depende de la edad del niño o si el efecto de la edad depende del tamaño de la letra. En la gráfica inferior izquierda de la figura 12-9, tracé líneas horizontales sobre la ordenada para descubrir el efecto de incrementar el tamaño de letra de 10 a 12 puntos cada grupo de edades. Observe que para el grupo de los ocho años existe un decremento en el tiempo de lectura; sin embargo, para el grupo de los 12 años no lo hay. Por tanto, el efecto del tamaño de la letra depende de la edad y la respuesta a nuestra pregunta es sí, sí existe una interacción. En la gráfica inferior derecha, he replanteado la pregunta: ¿El efecto de la edad sobre el tiempo de lectura depende del tamaño de la letra? Si sigue las líneas sobre la gráfica, nuevamente verá que hay una diferencia. Por supuesto, en realidad existe sólo una interacción, de manera que las respuestas a las dos preguntas serán siempre iguales. Ambas formas de verificación le darán más práctica en la interpretación de las interacciones. En la figura 12-10 se muestran otros resultados posibles del experimento. Utilizando el mismo procedimiento que hemos estado analizando, responda las tres preguntas para cada gráfica. Al tratar de determinar si hay efectos principales e interacciones en las gráficas que hemos visto, espero que haya observado que cuando sólo se dan efectos principales, la interpretación es sencilla. Sin embargo, cuando hay una interacción, la interpretación es más compleja. Por ejemplo, para el resultado graficado en la figura 12-9, el efecto principal de la edad sobre el tiempo de lectura es significativo aunque haya una interacción, ya que el efecto se presenta con los dos tamaños de letra. Sin embargo, aunque haya también un efecto principal del tamaño de letra, la interacción dificulta su interpretación, ya que el efecto existe sólo para un grupo de edad. En la sección inferior de la figura 12-10 se ilustra lo que a veces se denomina interacción cruzada, en la que las líneas se cruzan entre sí.10 Cuando están presentes los principales efectos con una interacción cruzada, son difíciles de interpretar. De hecho, en general no tienen sentido. Limitamos nuestra exposición al tipo más simple de experimento factorial, cuando sólo hay dos factores, y cada uno tiene dos niveles. Si un experimento tiene factores adicionales o con niveles adicionales, es todavía más difícil interpretar los efectos principales e interacciones. A fin de darle una pequeña probada de esta complejidad, supongamos que agregamos un tercer factor a nuestro experimento de lectura: la dificultad del material de lectura: fácil o difícil. En la figura 12-11 se ilustra el resultado posible. En este caso, tendría que preguntar si cada uno de los tres factores tiene efectos principales: edad, tamaño de la letra y dificultad. Además, tendría que preguntar si la edad interactúa con el tamaño de la letra, si la edad interactúa con la dificultad y si el tamaño de la letra interactúa con la dificultad. Cada una de estas interacciones recibe el nombre de interacción de dos vías, ya que atañe únicamente a dos factores. Para responder a estas preguntas, ten10
Rosenthal y Rosnow (1981) dicen que la interacción cruzada es la única interacción posible, ya que afirman que hay que suprimir los efectos principales antes de graficar e interpretar, lo cual deja sólo a la interacción cruzada.
12Martin240-267.indd 255
6/5/08 20:49:56
Capítulo doce
Edad
Tiempo para leer el párrafo (en segundos)
256
8 años 12 años ¿Tamaño de la letra? ¿Edad? Interacción
10 puntos
12 puntos
Tiempo para leer el párrafo (en segundos)
Tamaño de la letra
¿Tamaño de la letra? ¿Edad? Interacción
10 puntos
12 puntos
Tiempo para leer el párrafo (en segundos)
Tamaño de la letra
¿Tamaño de la letra? ¿Edad? Interacción
10 puntos
12 puntos
Tamaño de la letra
Gráficas de tres resultados posibles en un experimento factorial de 2 ⫻ 2. En cada gráfica responda las tres preguntas (las respuestas pueden ser encontradas al final del capítulo). FIGURA 12-10
12Martin240-267.indd 256
6/5/08 20:49:57
Tiempo para leer el párrafo (en segundos)
Cómo interpretar los resultados experimentales
70
257
Edad 8 años 12 años
60 50
Material difícil
40 30
Material fácil
20 10 10 puntos
12 puntos
Tamaño de la letra
Gráfica que ilustra una interacción de tres vías de un experimento factorial de 2 ⫻ 2 ⫻ 2.
FIGURA 12-11
dría que encontrar la media entre los dos puntos en un tercer factor que ignora, algo muy similar a lo que hicimos previamente cuando tratamos de encontrar los efectos principales. Entonces, tendría que interpretar la interacción de dos vías como lo hicimos en la sección anterior. En este ejemplo también es posible observar una interacción de tres vías. Este tipo está presente cuando la naturaleza de cada interacción de dos vías depende del nivel de un tercer factor con el que ocurre. En la figura, ¿la interacción de dos vías entre la edad y el tamaño de la letra depende de si el material de lectura es fácil o difícil? Así es, por lo que existe una interacción de tres vías. Como se aprecia, cuando se emplean más de dos factores, la interpretación de las interacciones se hace más difícil, aunque los procedimientos básicos sean los mismos.
■ Estadística inferencial Para analizar la lógica general de la estadística inferencial, regresemos a las calificaciones de la prueba de ansiedad de estudiantes de psicología y economía. Para descubrir si los dos grupos difieren en el nivel de ansiedad, graficamos las distribuciones de la frecuencia y calculamos la media para cada grupo. Descubrimos que la media para los estudiantes de economía era de 64.7 y para los de psicología, 55.6. ¿Es una diferencia real? Por supuesto, se preguntará cómo es que una diferencia puede no ser una diferencia. Con estas dos muestras tiene razón: cualquier diferencia entre las muestras es una diferencia real entre las muestras. Sin embargo, lo que quiere decir un psicólogo con la pregunta no es si hay una diferencia real entre las calificaciones de las dos muestras que escogió para este experimento, sino si es probable que haya una diferencia en el nivel de ansiedad entre toda la población de los estudiantes de psicología y toda la población de los estudiantes de econo-
12Martin240-267.indd 257
6/5/08 20:49:57
258
Capítulo doce
mía de las que se obtuvieron las muestras. La meta del experimento es decir algo acerca de las dos poblaciones que pudieron haber sido escogidas, no nada más de las muestras que, de hecho, se escogieron. Supongamos que cultiva frijoles y no le va bien por un ataque de roya. Esta plaga es una enfermedad misteriosa que provoca que muchas plantas se marchiten y se sequen. Para descubrir si puede deshacerse de la plaga, planta un campo con una nueva especie de frijol resistente. Después de cosechar el campo plagado y el nuevo, llena dos contenedores, cada uno con 10 toneladas de frijol. Quiere saber si los contenedores están plagados. Obviamente, no quiere examinar cada grano de los contenedores, así que toma una muestra de 100 frijoles de cada uno y descubre 12 frijoles marchitos en la muestra del contenedor que sabe que tiene la plaga y siete en la otra muestra. Obviamente, hay una diferencia entre las muestras, pero lo que quiere saber es si hay también una diferencia entre las poblaciones de los dos contenedores. Se responde a esta pregunta con una prueba estadística inferencial. El “infer” de “inferencial” denota que la prueba sirve para inferir si hay una diferencia entre poblaciones. Como psicólogo, enfrenta el mismo problema que el agricultor. Escogió una muestra seleccionada al azar de datos de dos poblaciones potencialmente diferentes (los niveles de la variable independiente) y quiere saber si el comportamiento de las poblaciones difiere. PRUEBA DE SIGNIFICANCIA DE LA HIPÓTESIS NULA
La mayoría de las pruebas estadísticas inferenciales se basan en la prueba de significancia de la hipótesis nula. En el capítulo anterior introduje el concepto de la hipótesis nula, y lo ampliaré aquí. La hipótesis nula establece que los niveles de la variable independiente no tienen ningún efecto. Por ejemplo, supongamos que se pregunta si hay diferencia en cuanto a las capacidades para las matemáticas de hombres y mujeres. Para probar esta pregunta, aplicaría una sección cuantitativa de un examen válido de capacidades académicas a una muestra de hombres y otra de mujeres. En este caso, la hipótesis nula es que no hay diferencias en las capacidades matemáticas de las dos poblaciones. Aunque haya realizado el estudio porque piensa que existe una diferencia, el procedimiento de la prueba de significancia que utiliza requiere que imagine que no hay diferencia. Supongamos que a continuación hace el estudio y descubre que la media para la muestra de hombres es diferente de la media de las mujeres. Cuando realiza una prueba estadística inferencial, la pregunta que hace es qué tan probable es que la diferencia en las medias de las muestras se haya debido a una variación aleatoria si en verdad la hipótesis nula es cierta, es decir, que no hay diferencia en las medias de la población. Debido a que las muestras se toman al azar de una población, siempre es posible que encuentre una diferencia considerable entre las muestras aunque no haya diferencia en las medias de la población. Tal resultado es más cierto si las muestras son pequeñas. La prueba estadística toma en cuenta factores como el tamaño de la muestra y dice qué tan probable es que encuentre su resultado si fuera cierta la hipótesis nula.
12Martin240-267.indd 258
6/5/08 20:49:58
Cómo interpretar los resultados experimentales
259
■ TABLA 12-2 Formas de acertar o cometer errores en una prueba de hipótesis nula Verdad
Rechazar la hipótesis nula No se rechaza la hipótesis nula
Hipótesis nula falsa
Hipótesis nula verdadera
Correcto (potencia)
Error tipo I
Error tipo II
Correcto
ERRORES DE DECISIÓN EN PRUEBAS DE SIGNIFICANCIA
Siempre que nos vemos forzados a tomar una decisión en sentido positivo o negativo a partir de las evidencias, podemos acertar de dos maneras y equivocarnos de otras dos. Por ejemplo, supongamos que tiene evidencias de un detector de mentiras y que tiene que decidir si una persona miente. Podría acertar si afirma que dijo la verdad, si dijo la verdad, o si afirma que mintió, cuando dijo mentiras. Por otro lado, cometería un error al decir que la persona mintió, cuando en realidad dijo la verdad o que dijo la verdad, cuando de hecho mintió. En la tabla 12-2 se ilustran estos resultados para la prueba de la hipótesis nula. Como se muestra en la tabla, de los resultados probabilísticos de la prueba estadística se concluye o que se debe rechazar la hipótesis nula o que no hay que rechazarla (observe que, como veremos abajo, no puede decir que la hipótesis nula debe ser aceptada). Al sacar una de estas conclusiones, acierta o se equivoca. Las dos maneras de estar equivocado tienen nombres diferentes. Si rechaza la hipótesis cuando es verdadera, comete un error tipo I y si no la rechaza cuando es falsa, comete un error tipo II. La prueba estadística que indica qué tan probable es cometer el error tipo I se llama nivel de significancia.
ERROR TIPO CORREG
NIVELES DE SIGNIFICANCIA
Es una pena que tengamos que apegarnos a una norma tan estricta, pero la mayoría de los psicólogos están de acuerdo en que para que el resultado sea significativo, la probabilidad
12Martin240-267.indd 259
6/5/08 20:49:58
260
Capítulo doce
de obtener por azar una diferencia como la observada en las muestras debe ser menor a una en 20. Por tanto, si las muestras vienen realmente de la misma distribución de la población, uno esperaría obtener una diferencia significativa sólo en uno de cada 20 (o cinco de cada 100) experimentos. Algunos psicólogos son incluso más cuidadosos para no decir que hay una diferencia entre las poblaciones cuando no es así. No aceptarán ninguna diferencia como real a menos que la prueba indique que podría deberse al azar sólo una vez de cada 100. Estas estrategias reciben el nombre de prueba al nivel de significancia al .05 o al .01, respectivamente. Cuando se alcanzan o se exceden estas probabilidades, se dice que el resultado es estadísticamente significativo. Si lee un artículo en una publicación especializada, verá que estos niveles de significancia se denotan como p < .05 o p < .01. Este término significa que la prueba fue estadísticamente significativa al nivel de .05 o .01, de manera que cabe esperar esta diferencia en los niveles de la variable independiente menos de cinco veces de cada 100 o una de cada 100, respectivamente, si es que en realidad provinieron de la misma población. Observe bien la dirección en que apunta el signo; p > .05 significa que la prueba no fue significativa. También observe cómo redacté estas afirmaciones. Algunos estudiantes cometen el error de pensar que cuando se prueba en un nivel en particular, cabe hacer una afirmación acerca de la probabilidad de replicar el resultado. Por ejemplo, si encuentra un resultado estadísticamente significativo al nivel p < .05, podría concluir que si repitiera el experimento nuevamente rechazaría la hipótesis nula 95% de las veces. Del nivel de la significancia estadística no puede concluirse nada acerca de la probabilidad de replicar el resultado.
POTENCIA ESTADÍSTICA
Hemos analizado qué tan probable es que podamos concluir algo erróneamente, pero supongamos que hemos acertado. ¿Hay alguna manera de saber qué tan probable es que hayamos acertado? Observará que en la tabla 12-2 puse la palabra potencia entre paréntesis a continuación de la decisión correcta de rechazar la hipótesis nula cuando es en verdad falsa. Ciertamente, potencia se refiere a la probabilidad de que la prueba estadística le permita rechazar correctamente la hipótesis nula. Aunque está más allá del alcance de este libro, debe saber que es posible calcular la potencia de una prueba estadística para determinar qué tan probable es no detectar una diferencia real en la variable independiente cuando la hipótesis nula es falsa (esto es, cuando hay una diferencia real). Por ejemplo, si se determinó que la potencia de la prueba es de .50, sabríamos que la mitad de las veces que haga el experimento no rechazaría la hipótesis nula. Los tres factores que afectan la potencia de una prueba son el nivel de significancia, el tamaño del efecto y el tamaño de la muestra. De éstas, el experimentador tiene más control sobre el tamaño de la muestra. Por esta razón, con frecuencia los investigadores calculan la potencia de un experimento antes de realizarlo, para determinar si tienen una muestra lo suficientemente grande.
12Martin240-267.indd 260
6/5/08 20:49:58
Cómo interpretar los resultados experimentales
261
PRUEBAS PARAMÉTRICAS Y NO PARAMÉTRICAS
Tenemos muchas pruebas inferenciales para tomar esta decisión, que depende del diseño experimental y de las premisas de la prueba que los datos deben cumplir (véase el apéndice A para ejemplos de pruebas inferenciales). Las pruebas más utilizadas son las pruebas paramétricas. En estas pruebas, la suposición es que si se grafican las distribuciones de frecuencias de las poblaciones de interés, serían distribuciones normales. Cuando no se cumple esta suposición, deben aplicarse las pruebas no paramétricas. Las pruebas inferenciales son herramientas para evaluar los resultados de experimentos de psicología. De hecho, el desarrollo de pruebas estadísticas complejas ha representado un impulso importante para que la psicología sea una ciencia respetable. Sin embargo, debemos tener en cuenta las limitaciones de las pruebas estadísticas. MALA INTERPRETACIÓN DE LAS PRUEBAS ESTADÍSTICAS
Algunos experimentadores creen que cuando una prueba estadística no revela una diferencia significativa en los niveles de la variable independiente, demuestra que los niveles son significativamente los mismos. ¡Eso está mal! Para evitar este error, debemos tener en mente que las pruebas inferenciales están diseñadas para decir algo acerca de la probabilidad de obtener una diferencia si las muestran vienen de la misma población; no dicen nada acerca de llegar a alguna igualdad si las muestras vienen de poblaciones distintas. En consecuencia, los resultados negativos (los que no son estadísticamente significativos) rara vez se difunden en las publicaciones psicológicas. Nuestras pruebas estadísticas no están diseñadas para indicar la probabilidad de que dos muestras sean equivalentes si vienen de poblaciones diferentes; más bien indican qué tan probable es que las muestras vengan de la misma población.12 Un segundo error que cometen algunos investigadores al utilizar las pruebas de inferencia estadística es actuar como si los niveles de .05 y .01 estuvieran tallados en piedra; nunca se dignarían prestarle atención a un nivel .06. Un enfoque más realista de los niveles de significancia es tratarlos como lo que son: una manera de ayudar a tomar una decisión. Siempre que toma una decisión en un contexto de incertidumbre, tiene que considerar no 12
Aunque mi argumentación de que nuestras pruebas estadísticas no prueban igualdades es verdadera para la mayor parte de la bibliografía psicológica, técnicamente no es cierto. Las pruebas estadísticas formales de la equivalencia, aunque enormemente desconocidas por los psicólogos, han evolucionado durante las últimas décadas. Rebasan el alcance de este libro, pero remito a quienes se interesen al artículo “Using Significance Tests to Evaluate Equivalence between Two Experimental Groups”, de Rogers, Howard y Vessey (1993).
12Martin240-267.indd 261
6/5/08 20:49:58
262
Capítulo doce
sólo la probabilidad de acertar o equivocarse, sino también los costos y los beneficios. Al tomar otras decisiones no ignora estos factores. Por ejemplo, cuando pondera si pilotea un avión, espera que haya una gran probabilidad de que el tiempo sea bueno, más que si sólo calcula si se lleva el paraguas. Los beneficios y los costos son muy diferentes. Los niveles .05 y .01 ignoran tales beneficios y costos. Por tanto, debe considerar las consecuencias de acertar o equivocarse cuando interprete los resultados de sus experimentos y no probar ciegamente a un nivel de .05. Hay polémicas en la psicología sobre si el término significativo debe modificarse, por ejemplo, con un adverbio: “altamente significativo”. Algunos están en contra de tales modificadores ya que, por tradición, la psicología separa los resultados como significativos o no significativos y, más importante, porque el uso de modificadores sustituye equivocadamente la magnitud de la importancia del efecto con la probabilidad del mismo (Harcum, 1989; Levenson, 1990). Sin embargo, otros sostienen que debido a que la probabilidad es un continuo, no hay nada malo con decir que un efecto es más significativo que otro (Kanekar, 1990). Quienes se ponen de los dos lados de la discusión concuerdan en que la clave es no tomar el nivel de significancia estadística como si fuera la importancia práctica: el tema que acabamos de considerar. Por esta razón, al informar un resultado positivo es mejor decir que es estadísticamente significativo para destacar que no se afirma por fuerza una significación práctica. Y al informar un resultado negativo, decir que no es estadísticamente significativo en lugar de insignificante. Este último término ciertamente implica que carece de importancia. Cuando se trata de no confundir la significancia estadística con la importancia práctica, recuerde el viejo refrán que dice que una diferencia es una diferencia sólo si marca una diferencia. Suponga que es un empresario y los propietarios de la Escuela de Lectura Rápida “El Dedo Veloz” quieren convencerlo de que les pague para que le enseñen a sus empleados a leer de prisa. Dicen que tienen evidencias experimentales que demuestran que la gente lee significativamente más rápido después de tomar su curso. Como es escéptico, les pregunta cuánto más rápido. Le contestan que el estudio indica que los estudiantes leen en promedio media palabra más por minuto, e insisten que la diferencia es estadísticamente significativa. Quizá tienen razón. Si se reúnen suficientes participantes y suficiente información, aun las pequeñas diferencias entre las poblaciones llegan a resultar estadísticamente significativas. Como empresario, le interesa más la importancia práctica que la significancia estadística. También como científico debe importarle. En un intento por alentar a los experimentadores a considerar si sus resultados son importantes y estadísticamente significativos, y alejarse de la prueba rígida del nivel del .05, Geoffrey Loftus (1993, 1996), ex director de una revista de psicología, dice que la prueba estadística de hipótesis a menudo no es necesaria. Anima a los experimentadores a presentar sus datos en una gráfica que muestre las medias con las medidas asociadas de dispersión, como la desviación estándar. Cree que la mayoría de las veces, la inspección de la figura deja ver inmediatamente la significancia del efecto sin la necesidad de aplicar una prueba de inferencia estadística. En tal caso, desalienta el uso de tales pruebas.
12Martin240-267.indd 262
6/5/08 20:49:59
Cómo interpretar los resultados experimentales
263
Al final, la evaluación de la importancia práctica es una cuestión de juicio. Las herramientas que estudiamos en el capítulo sirven para determinar cuándo es importante un resultado, pero no establecen la importancia del mismo. Como experimentador, debe hacerlo mediante argumentos lógicos que convenzan a los demás investigadores de que sus diferencias marcan una diferencia.
■ Metaanálisis Aunque probablemente no la empleará si hace un experimento simple, de seguro se encontrará con artículos que aplican una técnica llamada metaanálisis, de la que debe saber algo para entender los textos. En el capítulo 6 estudiamos cómo realizar una búsqueda de bibliografía. Al realizar una investigación, se verá avasallado por la cantidad de artículos que hay sobre un tema en particular. Incluso en campos delimitados, constituyen la bibliografía cientos o miles de artículos. Lo común entre los investigadores que escriben artículos de revisión en los que evalúan e integran esos estudios es una reseña narrativa. El investigador lee los artículos, considera algunos importantes y otros no, trata de mantener en mente los resultados de cuando menos los más destacados y luego trata de resumir los principales resultados. Se ha estudiado el modo de llevar a cabo este proceso y se descubrió que es bastante descuidado (Jackson, 1980). En muchos casos, diferentes investigadores llegan a conclusiones completamente diferentes a partir de la misma bibliografía. El problema es que esos investigadores enfrentan una tarea casi imposible, casi como verse en la necesidad de estudiar los datos de 100 participantes de un experimento y llegar a una conclusión sin la ayuda de análisis estadístico alguno. Lo que hace el metaanálisis es proporcionar una forma estadística de integrar los datos de muchos estudios. No tiene que entender los detalles de las estadísticas para comprender los resultados de un estudio metaanalítico. Si necesita más detalles, lea los libros sobre metaanálisis que se anotan al final del capítulo. Básicamente, el metaanálisis permite tomar los resultados de un número ilimitado de experimentos que investigan el mismo problema, incluso si utilizan diferentes metodologías, y combinarlos estadísticamente. Por ejemplo, Lipsey y Wilson (1993) se interesaron en saber si los tratamientos educativos, psicológicos y conductuales eran eficaces. Para esto, examinaron las investigaciones sobre el tema realizadas en una década y media: 302 estudios. El dato básico de cada estudio en una revisión metaanalítica es la media del tamaño del efecto del tratamiento. Es muy fácil calcular esta estadística; es la media del grupo control, restada de la media del grupo en tratamiento y luego dividida entre la desviación estándar del grupo control. Así, en la revisión de Lipsey y Wilson, independientemente de cómo se midiera la variable dependiente o cómo se administrara el tratamiento en cada estudio, la media del grupo que no recibía el tratamiento se restaba de la media del grupo en tratamiento y este número se dividía entre la desviación estándar del primer grupo. Utilizando la media de los efectos del tratamiento como dato, los autores calcularon las estadísticas para determinar qué tan probable era que estos efectos pudieran
12Martin240-267.indd 263
6/5/08 20:49:59
264
Capítulo doce
haberse debido al azar. Los datos pueden reanalizarse de diversas maneras. Por ejemplo, es posible estudiar por separado todos los estudios que siguen a un diseño experimental particular o los que supuestamente son de alta calidad pueden ser analizados por separado de aquellos cuya calidad se considera baja. Estos análisis a menor escala permiten al investigador evaluar si el agrupamiento inicial de todos los estudios era el apropiado. Algunos investigadores han criticado el metaanálisis (Wilson, 1985), pues afirman que la técnica se emplea para combinar resultados de muchos experimentos, todos con errores graves. En tales casos, el resultado del metaanálisis sería tan equivocado como los estudios originales. Sin embargo, el metaanálisis también tiene defensores (Mann, 1990) que afirman que un enfoque complejo que incluya varios análisis más finos disminuye la posibilidad de combinar estudios con imperfecciones en un resultado con un defecto mayúsculo. El metaanálisis llegó para quedarse. Cuando se realiza de manera apropiada, puede ser una herramienta valiosa para integrar los resultados de un volumen inmanejable de investigaciones.
■ Interpretación de resultados por computadora En muchos campos de la experimentación psicológica se usan computadoras, como al realizar una búsqueda de bibliografía, presentar los estímulos o registrar respuestas. Sin embargo, el mayor uso de las computadoras está en el análisis estadístico de datos. Las computadoras son invaluables en esta tarea, ya que pueden almacenar y manipular rápidamente grandes cantidades de datos. En los últimos años, ha aumentado la disponibilidad de computadoras y ahora programas estadísticos poderosos permiten calcular la mayoría de las pruebas estadísticas en computadoras personales. Aunque el efecto neto de las computadoras sobre el cálculo estadístico ha sido abrumadoramente positivo, no les faltan sus problemas. Un problema es que como las computadoras eliminan buena parte del esfuerzo de realizar a mano las estadísticas, a veces la gente piensa que tampoco se necesita dedicarle mucho esfuerzo mental. Sin embargo, es de lo más importante entender cómo operan las pruebas estadísticas cuando uno empieza a utilizarlas. Con las computadoras es posible dejar de lado estos conocimientos. Si alguien le enseña los pasos necesarios para introducir los datos y luego la computadora da los resultados, es posible que realice todo el proceso sin siquiera entender lo que hizo. Yo les pido a mis estudiantes que calculen todas las pruebas estadísticas a mano una vez, antes de utilizar una computadora, para que entiendan lo que ocurre dentro de la caja mágica. Las computadoras son tan perfectas que difícilmente cometen un error y nos llevan a pensar que cualquier cosa que digan es la verdad. Pero el refrán dice: entra basura, sale basura. Tiene que recordar las lecciones acerca de interpretar los resultados que aprendió en este capítulo. También necesita conocer las suposiciones y limitaciones de las estadísticas que vaya a usar (véase el apéndice A). Por último, no acepte los resultados de una
12Martin240-267.indd 264
6/5/08 20:49:59
Cómo interpretar los resultados experimentales
265
computadora tal cual, sin antes hacer verificaciones sencillas. Aunque es improbable que la computadora haya cometido un error, usted sí pudo haberlo cometido al configurar e introducir los datos. Una computadora es rápida y precisa, pero es sumamente estúpida. No le importa en lo más mínimo si usted cometió un error, si, digamos, por accidente le dijo que iba a introducir los datos de la condición A antes de la condición B y no lo hizo en ese orden. La computadora no verificará si cometió ese error, tendrá que verificarlo usted mismo. Una manera de realizar una verificación rápida de sus resultados estadísticos es mirar las estadísticas descriptivas que arroje la computadora para ver si tienen sentido. Por ejemplo, en el experimento del tamaño de la letra, esperaríamos que los niños de ocho años leyeran con más lentitud que los de 12. Tomaríamos con recelo el análisis si no se sostuvieran esas expectativas lógicas, lo cual sería indicación de que cometimos un error al preparar los datos para ingresarlos a la computadora. También podríamos calcular a mano algunas medias de una pequeña parte de los datos para ver si concuerdan con el resultado de la computadora. En el ejemplo del tamaño de la letra, podríamos calcular la media de un grupo de edad, un párrafo, un tamaño de letra, para ver si la media concuerda con la que aparece en el resultado. Algunos cálculos menores se llevarían no más de un par de minutos, y a cambio incrementarían mucho nuestra seguridad de que el resultado es correcto. Espero que este análisis haya puesto el papel de las computadoras en perspectiva. Las computadoras y los programas estadísticos son meras herramientas para facilitar la interpretación de los datos. No hay razón para temerles, ya que son sus amigas, y cada vez lo son más. Pero al igual que con las herramientas complejas, se debe tener el cuidado de usarlas como es debido. Estas amigas no son flexibles y requieren que uno siga obsesivamente sus reglas. Creen lo que uno les dice, aun si se equivoca, y no tienen un sentido común para determinar cuándo algo anda mal. Para no meterse en problemas, conozca sus limitaciones tanto como sus capacidades.
■ Resumen Cuando termina un experimento, debe interpretar los datos de las hojas de respuesta. El primer paso es graficar la distribución de frecuencias que ilustra el número de puntos de datos que caen en las categorías de la variable dependiente. A veces, estas distribuciones son similares a una campana, la llamada distribución normal. Otras distribuciones son la bimodal, con dos categorías más frecuentes: la sesgada, que tiene más calificaciones en una cola de la distribución, y la truncada, que no tiene una cola de la distribución. Son tres las estadísticas más utilizadas para describir la tendencia central de una distribución: la moda es la categoría que ocurre con más frecuencia, la mediana es la calificación que se encuentra a la mitad y la media es el centro de gravedad de la distribución. Las dos estadísticas que se emplean para describir la dispersión de una distribución son el rango y la desviación estándar. El rango es la diferencia entre las calificaciones más alta y más baja. La desviación
12Martin240-267.indd 265
6/5/08 20:49:59
266
Capítulo doce
estándar y en ocasiones la varianza describen la dispersión de las distribuciones que se aproximan a la normal. Las gráficas ilustran la relación entre las variables independiente y dependiente. Los niveles de la variable independiente se ponen sobre el eje horizontal, la abscisa, y los valores de la variable dependiente sobre el eje vertical, la ordenada. Se emplea una gráfica de barras para ilustrar los puntos de datos que representan categorías cualitativamente diferentes. Se usa un histograma o gráfica de funciones lineales para ilustrar las variables continuas. Al describir las funciones, se indica si son lineales o curvilíneas, positivas o negativas, monotónicas o no monotónicas, aceleradas positivamente o aceleradas negativamente o asintóticas. La fortaleza de la relación experimental se muestra en un diagrama de dispersión, o si la relación es lineal, se calcula el coeficiente de correlación y el coeficiente de determinación. Para interpretar los resultados de un experimento factorial, primero hay que determinar si está presente un efecto principal, un efecto de un factor en la variable dependiente en un valor promedio de los otros factores. Además, debe determinar si el efecto de una variable es diferente dependiendo de los niveles de las otras variables. Tales diferencias reciben el nombre de interacciones y, en particular con las interacciones cruzadas, dificultan la interpretación de los efectos principales. Cuando haya tres o más factores, la interpretación de las interacciones es más ardua, ya que hay varias interacciones de dos vías, como también interacciones de tres vías, y con más factores se encuentran interacciones de orden más alto. Se emplea la estadística inferencial para inferir qué tan probable es que la diferencia entre las muestras de los datos se deba al azar y no a una diferencia real de las poblaciones (niveles de la variable independiente). Así, para propósitos estadísticos se postula una hipótesis nula, que establece que los niveles de la variable independiente no tienen efecto. La prueba estadística determina la probabilidad de que la diferencia encontrada en los datos de las muestras se deba al azar, si la hipótesis nula es verdadera. Una vez que la prueba determina esto, se presentan dos tipos de errores: error tipo I, en el que la hipótesis nula es rechazada cuando es verdadera, y el error tipo II, en el que la hipótesis nula no es rechazada cuando es falsa. La hipótesis nula debe rechazarse cuando sea falsa, y la probabilidad de que una prueba inferencial la rechace correctamente recibe el nombre de potencia estadística, que depende en particular de la sensibilidad del experimento y del número de participantes. Para que un efecto sea declarado estadísticamente significativo, la probabilidad de que la diferencia se deba al azar (error tipo I) debe ser menor a .05 o .01. Las pruebas paramétricas suponen que las distribuciones de la población son normales, mientras que las pruebas no paramétricas, no. A veces los investigadores aplican mal las pruebas estadísticas y equiparan los resultados no significativos con la equivalencia de las condiciones, porque resaltan demasiado los niveles .05 y .01 de la significancia o porque confunden la significancia estadística con la importancia práctica. El metaanálisis es una técnica estadística para combinar los resultados de muchos experimentos. Se calcula una estadística llamada media del tamaño del efecto del tratamiento para cada experimento. Estos tamaños del efecto se analizan para determinar qué tan probable es que el efecto se deba al azar.
12Martin240-267.indd 266
6/5/08 20:50:00
Cómo interpretar los resultados experimentales
267
Las computadoras se usan para realizar los análisis estadísticos. Sin embargo, se debe tener cuidado de revisar que se cumplan las premisas de las pruebas estadísticas y que los datos se introduzcan bien al programa. Antes de aceptar un resultado, hay que verificar su congruencia interna y precisión. Respuestas a las preguntas de la figura 12-10:
Gráfica superior:
¿Tamaño de la letra? ¿Edad? ¿Interacción?
no sí no
Grafica media:
¿Tamaño de la letra? ¿Edad? ¿Interacción?
sí sí no
Grafica inferior:
¿Tamaño de la letra? ¿Edad? ¿Interacción?
no no sí
L E C T U R A S S U G E R I D A S S O B R E E S TA D Í S T I C A Para el estudiante de recién ingreso Hinkle, D. E., Wiersma, W. y Jurs, S. G. (1988). Applied Statistics for the behavioral sciences. Boston: Houghton Mifflin. Kirk, R. E. (1990). Statistics: An introduction. Fort Worth, TX: Holt, Rinehart y Winston. Para el estudiante avanzado Keppel, G. y Zeddeck, S. (1989). Data Analysis for research designs: Analysis of variance and multiple regression/correlation approaches. Nueva York: W. H. Freeman. Maxwell, S. E. y Delaney, H. D. (1990). Designing experiments and analyzing data: A model comparison perspective. Belmont, CA: Wadsworth. Myers, R. H. (1971). Response surface methodology. Boston: Allyn y Bacon.
L E C T U R A S S U G E R I D A S S O B R E M E TA A N Á L I S I S Cook, T. D., Cooper, H., Cordray, D. S., Hartmann, H., Hedges, L. V., Light, R. J. et al. (comps.). (1992). Meta-analysis for explanation: A casebook. Nueva York: Russell Sage Foundation. Glass, G. V., McGaw, B. y Smith, M. L. (1981). Meta-analysis in social research. Newbury Park, CA: Sage. Rosenthal, R (1991). Meta-analytic procedures for social research (ed. rev.). Newbury Park, CA: Sage.
12Martin240-267.indd 267
6/5/08 20:50:00
13
Cómo informar los resultados experimentales La autocomplacencia es enemiga de la buena redacción [. . .] Saber leer críticamente el trabajo de uno mismo es una habilidad tan importante como ser capaz de escribir una oración hermosa o articular un argumento convincente. RACHEL TOOR (2006)
Todos somos ciegos en busca de la verdad Confundidos por la ruidosa multitud de las palabras No sabemos Si diremos lo que pensamos O pensaremos lo que decimos Sólo nuestros actos Nos enseñarán en su momento. B. DECKER (1967)
Como todos sabemos, los 10 mandamientos fueron aceptados y publicados. Lo que usted no sabe es que Moisés pidió que se revisaran otros 34 para volver a presentarlos; otros 16 todavía están en prensa como resultado de la demora en publicarlos. PALLADINO Y HANDELSMAN (1995)
Lo que se imprime es un recuento purificado y racionalizado de investigaciones que se apega al mismo esquema de narración. Aunque los investigadores experimentados a veces adivinan la verdadera historia de un informe publicado leyendo entre líneas, la presentación escrita de la investigación no incluye nada de esto. MADIGAN, JOHNSON Y LINTON (1995)
U
n conocido debate filosófico sigue aproximadamente estas líneas: si un árbol cae en el bosque y nadie lo oye, ¿de todas maneras hace ruido? La pregunta es si alguien tiene que oír un sonido para que sea sonido. ¿Qué piensa usted? Al hacer pública una investigación, hacemos una pregunta similar: ¿Una investigación es una investigación si nadie se entera? La respuesta metafísica a la pregunta depende de cómo queramos definir los términos. Como lo que nos interesa es una respuesta práctica, por lo menos diríamos que una investigación sin publicar bien pudo no haberse hecho. La meta de la investigación no es 268
13Martin268-307.indd 268
13/5/08 14:42:37
Cómo informar los resultados experimentales
269
hacer experimentos, sino acumular conocimientos científicos. Si los demás científicos no se enteran de los experimentos, sus resultados no sirven como elementos. Un informe experimental es la manera de hacer públicos los resultados de manera que la ciencia se beneficie de la investigación. Ya que su informe experimental es el producto de su investigación, debe esforzarse para que sea un producto de gran calidad. Una prosa elegante no salva un estudio malo, pero un texto mal escrito puede, de hecho, arruinar un buen estudio. Conozco investigadores que, si uno juzga por comentarios informales de sus investigaciones, parecen hacer experimentos bien pensados sobre problemas importantes, pero su habilidad para comunicarlos por escrito es tan escasa que su obra no se conoce. Es probable que buena parte de la investigación se pierda de esta manera. Hasta los maestros de redacción tienen grandes dificultades para enseñar a escribir las ideas de forma ordenada. No tengo suficiente espacio en este capítulo para enseñarle mucho sobre cómo escribir.1 William Safire (1979) ofrece las instrucciones más concisas que he visto sobre el tema. Teniendo presente que jamás se inicia un párrafo con gerundio, se agrega que la voz pasiva debe ser utilizada nunca. No ponga las oraciones en forma negativa. Los verbos debe concordar con los sujetos. Corrija con cuidado para si se le olvidó alguna palabra. Si relee su trabajo, en la relectura de su trabajo encontrará muchas repeticiones que se evitan releyendo su trabajo. Cuando escribimos, no debes cambiar de personas verbales. Y no empiece una oración con una conjunción. ¡¡¡No abuse de los signos de exclamación!!! Coloque el verbo tan cerca como sea posible, especialmente en las oraciones largas, las que se extienden a 10 o más palabras, de su complemento. Escrito con cuidado, evitados los participios sueltos. Si hay una palabra que no debe ir al final de la oración, el verbo lo es. Tome al toro por la mano y evite las metáforas confusas. Prívese de locuciones airosas que retiñen inusitadas. Todo mundo deben tener el cuidado de coordinar un pronombre singular con sustantivos singular en sus escrito. Para escribir a propiedad, escoja la preposición correcta. El adverbio siempre viene detrás del verbo. Y por último, pero no menos importante, evite los lugares comunes como a la peste: busque alternativas viables.
La meta de este capítulo es modesta. Describo las partes que componen un informe de investigación, le doy algunas sugerencias para determinar si lo que escribe es legible y le presento una muestra anotada de un informe. Los informes de investigación deben transmitir bien la información en un formato congruente. En virtud de esta máxima, la Asociación Estadounidense de Psicología (APA, 2001) reunió reglas para escribir un informe de investigación: el Manual de publicación de la Asociación Estadounidense de Psicología.2 Un ejemplar de este libro debería estar en el escritorio de todo psicólogo experimental. La publicación se inició en 1929 como un artículo de siete hojas
1
Si tiene dificultades con su escritura, consulte algún manual de redacción, como el de Martín Vivaldi. Verifique que siga la quinta edición del manual para escribir sus informes. Se hicieron cambios entre la cuarta y quinta ediciones. Incorporé ejemplos de gran parte de estos cambios en el informe de muestra que aparece al final del capítulo, pero tendrá que remitirse al manual para consultar las muchas variaciones posibles.
2
13Martin268-307.indd 269
13/5/08 14:42:39
270
Capítulo trece
y se convirtió en un libro de 439 páginas. Como puede imaginarse, es un reto tratar de dominar todas las reglas de estilo de la APA. Sin embargo, el trabajo que ponga en este esfuerzo valdrá la pena. Este manual de estilo es una referencia estándar y se emplea mucho. Por ejemplo, la editorial del libro que tiene en sus manos le pide a sus autores que se guíen con el manual. A menos que sus profesores de otros cursos especifiquen un estilo particular, lo que más le conviene es seguir las reglas del manual. En sus clases de psicología, incluso para un proyecto de clase, debe apegarse a esa guía. No puedo analizar aquí todos los temas cubiertos, mencionaré las reglas más importantes y señalaré dónde cometen errores los nuevos investigadores.3
■ Cómo difiere el estilo de la APA de los demás Antes de que me adentre en las reglas del Manual de publicación, las llamadas colectivamente Manual de estilo de la APA, quiero analizar algunas diferencias entre el estilo de la APA y el estilo de escritura de las demás disciplinas. Algunos de estos usos en psicología quizá no le resulten obvios de inmediato y, en algunos casos, apenas están implícitos en el Manual de publicación. A veces, los profesores de psicología no ponen de relieve estas diferencias, ya que el estilo se asimila después de leer cientos de artículos. Para los estudiantes, es importante estar conscientes de estos usos sutiles, ya que lo que aprendieron sobre redacción en otras clases tal vez no sea aceptable en los cursos de psicología. Mucha de la información que menciono se basa en la investigación de Madigan, Johnson y Linton (1995) que compararon el lenguaje de dos publicaciones de psicología con el de la Publication of the Modern Language Association y el Journal of American History.
LENGUAJE
Los psicólogos investigadores tratan de hacer transparente el leguaje que emplean. Con esta afirmación quiero decir que el lenguaje no debe interponerse en la transmisión de la información. En humanidades, se considera que el lenguaje y el pensamiento puestos por escrito en artículos están unidos en tal medida, que la elección de los términos es tan importante como las ideas que se presentan. En psicología, se espera que el lenguaje sea tan directo y claro como sea posible. Por ejemplo, aunque el Manual de publicación recomienda lo contrario, tradicionalmente muchos escritos científicos abusan de la voz pasiva, en lugar de una voz activa, como en “los datos fueron analizados” en lugar de “analizamos los
3
Para los estudiantes que quieren volverse unos verdaderos expertos en el estilo de la APA, esta asociación tiene a la venta el libro Mastering APA Style: Student’s Workbook and Training Guide (2002). Los profesores disponen de otro libro Mastering APA Style: Instructor´s Resource Guide (2002). En http://www.apastyle.org puede encontrar estos y otros materiales útiles, tales como Concise Rules of APA Style (2005).
13Martin268-307.indd 270
13/5/08 14:42:39
Cómo informar los resultados experimentales
271
datos”. Parecerá una sutileza, pero la voz pasiva pone el énfasis en los datos, no en el investigador. Si se empeña en escribir su texto científico de manera original e inusitada, quizá los otros investigadores no aprecien sus afanes literarios y pongan en tela de juicio la seriedad de su trabajo.
CITAS
A pesar de que los psicólogos citan casi tanto como los historiadores y mucho más que los críticos literarios, lo hacen de manera muy diferente. En el campo de las humanidades, los escritores hacen muchas citas directas; en promedio, los historiadores hacen una cita directa una vez cada 60 palabras de texto, mientras que los psicólogos hacen una cada 3000 palabras (Madigan et al., 1995). En lugar de citar directamente a los autores, los psicólogos los parafrasean. Como se observó en el párrafo anterior, esta diferencia refleja diferencias en el uso del lenguaje. Los historiadores creen que la forma de decir algo es tan importante como lo que se dice. Los psicólogos creen que datos, teorías y argumentos lógicos se sostienen por su propio peso, independientemente de las palabras con que se enuncien. A veces los estudiantes no entienden por qué su profesor de literatura les baja la calificación por parafrasear el trabajo citado y el profesor de psicología por hacer demasiadas citas directas. Desafortunadamente, el mundo no siempre es justo, y para salir avante tendrá que aprender estas diferencias sutiles. Sin embargo, déjeme subrayar que citar bien es tan importante cuando se parafrasean las ideas de otra persona como cuando se hace una cita directa. En cualquiera de los dos casos, si no lo hace bien, se considera plagio. La definición más aceptada de plagio dice que es la apropiación (robo) del lenguaje, ideas y pensamientos de otro autor. El plagio puede traer serias consecuencias si ocurre en un entorno académico o profesional. En el capítulo 5 se hace un análisis más completo sobre el plagio.
SUBTÍTULOS
Como se analiza en la siguiente sección, el estilo de la APA impone un orden lineal específico de las secciones de un informe. En las secciones, los psicólogos marcan con subtítulos la introducción de nuevos temas. Los subtítulos minimizan los pasajes de transición que se requieren para introducir nuevos temas, de modo que los informes de investigación son concisos. Los subtítulos son poco comunes en humanidades. Toda esta estructura impuesta al informe de investigación pone de relieve lo que se llama el esquema discursivo, lo que significa que al contar nuestra investigación con una estructura constante, proporcionamos un medio de comunicación entre el autor y el lector y creamos expectativas particulares acerca de la información que sigue. Por mantener un tono neutro, esta estructura estandarizada da por resultado textos poco entretenidos, pero transmite la información de manera constante y concisa.
13Martin268-307.indd 271
13/5/08 14:42:39
272
Capítulo trece
NOTAS AL PIE
Los psicólogos rara vez ponen notas al pie, en particular si son digresivas.4 Las notas que hacen los psicólogos son para clarificar un punto que acaba de plantearse o agregar información que sólo interese a pocos lectores. En cambio, los historiadores ponen cuatro o cinco veces más notas que los psicólogos, y los críticos literarios, el doble (Madigan et al., 1995) A veces, en las notas al pie, historiadores y críticos establecen un texto paralelo, de modo que la exposición transcurre en diversos niveles al mismo tiempo. Los psicólogos creen que estas notas distraen al lector, el cual espera un formato claro, conciso y lineal.
DESACUERDOS
Cuando los historiadores y los críticos literarios están en desacuerdo con sus colegas, a veces son francos acerca de sus diferencias, hasta el punto en que el desacuerdo se vuelve a veces personal. Un autor acusa a otro de ser “ingenuo”, “de no agotar el tema” o incluso de haber hecho “deliberadamente una mala interpretación”. En cambio, a los psicólogos los alientan a mantener su personalidad fuera de los desacuerdos. Prefieren conducir sus diferencias en términos de datos, metodología o teorías, en lugar de criticar directamente a otro investigador. Esta tradición de civilidad vendría de la constatación de que en la ciencia, tenemos el compromiso colectivo de acumular los conocimientos científicos. La falta de cooperación puede impedir o demorar este esfuerzo. Al quitar énfasis en lo individual se destacan los datos y las teorías que constituyen el conocimiento.
MULETILLAS CONCLUSIVAS
Los psicólogos tienden más a usar muletillas en sus ensayos; en promedio, las usan 10 veces más que los historiadores y los críticos literarios (Madigan et al., 1995). Estas muletillas son del tipo siguiente: concuerda con, da apoyo a, puede ser considerado, quizá se relacione con. Los psicólogos expresan sus conclusiones con muletillas de ese género. En la mayoría de los casos, el investigador las utiliza cuando se refiere a la teoría, no a los datos. Como vimos en el capítulo 3, las teorías son imposibles de probar y son difíciles, pero no imposibles de refutar. Entonces, incluso los datos más sólidos pueden articularse mal con la teoría. Los psicólogos, que están al tanto de la debilidad de estos vínculos, usan muletillas en sus conclusiones. Si los científicos plantean sus conclusiones dogmáticamente, sus colegas los acusan de ser ingenuos (¡pero de una manera civilizada!).
4
Para recalcar el punto, pondré aquí una nota al pie, aunque no una digresión. Una digresión es una nota al pie que se aparta un tanto del punto principal del análisis.
13Martin268-307.indd 272
13/5/08 14:42:40
Cómo informar los resultados experimentales
273
Espero que este análisis de los usos menos conocidos del estilo de la APA le ayude a entender por qué la redacción de los psicólogos es diferente de lo que ha aprendido en otros cursos. Todavía pasará tiempo para que entienda las sutiles diferencias culturales en el uso del lenguaje en otras disciplinas. Llegará con la experiencia en el campo, particularmente conforme lea la bibliografía de investigación y emprenda sus propios ensayos.
■ Partes de un informe Los informes deben contener ciertas secciones fijas en un orden preciso. De otra manera tendríamos que ser como el viejo orador que decía de sus sermones: “Primero les digo lo que les voy a decir, luego les digo lo que les dije.” Todos los informes experimentales siguen un patrón general, así que no hace falta mucho espacio para decirle al lector lo que vamos a decirle. La estructura estandarizada mejora la eficiencia del ensayo y la organización congruente permite al lector interesado en una sola sección (como la de metodología o de resultados) encontrar rápidamente la información que quiere. En el esquema siguiente se dan las partes de un informe. Vamos a describirlas en las siguientes secciones: iiiiI. Portada A. Título B. Autores C. Afiliaciones D. Encabezado iiiII. Página de resumen iiIII. Texto del informe A. Introducción 1. Antecedentes 2. Revisión de la bibliografía 3. Planteamiento del propósito B. Método 1. Participantes 2. Equipo/materiales 3. Procedimiento C. Resultados 1. Planteamiento verbal de los resultados 2. Referencias a tablas y figuras 3. Estadísticas descriptivas e inferenciales D. Discusión 1. Relación entre el propósito planteado y los resultados 2. Contribución teórica o metodológica 3. Direcciones futuras de la investigación
13Martin268-307.indd 273
13/5/08 14:42:40
274
ii IV. iii V. i VI. iVII. VIII. ii IX.
Capítulo trece
Referencias Notas del autor (si las hay) Notas al pie (si las hay) Tablas Leyendas de figuras Figuras
TÍTULO
En los dos meses siguientes a la publicación, cerca de la mitad de los informes de investigación de las principales publicaciones de psicología son leídos por poco menos de 200 psicólogos (Garvey y Griffit, 1971). En general, quienes leen un informe lo escogen por el título. Los psicólogos repasan la sección de contenido de las publicaciones, en busca de investigaciones actuales que les interesen. Las principales palabras claves utilizadas en la búsqueda de bibliografía (capítulo 6) se escogen a partir del título. Así, en cierto sentido el título es la parte más importante del informe; si un título transmite poca o mala información, perderá lectores antes de que sepan qué dice el autor en su texto. Las dos sugerencias más útiles para crear un título son contradictorias: 1) poner tanta información como LA DE CTO DEL sea posible y 2) abreviar lo más posible. El título debeE F D EL E GITUD NTA ría expresar las principales variables independientes LON LO O LU R A V U A A TÍT RE L OR P T B ICO y la variable dependiente. También debe identificar el SO L LEC TÍF N IEN DE U C campo general de investigación si es que no es obvio R L TA LEE RME O EN IM INF a partir de las variables. El Manual de publicación dice R PE EX que los títulos no deben ser de más de 10 a 12 palabras, y, de ordinario, deberían ser considerablemente más cortos.5 Una manera de cincelar un buen título es comenzar con una versión larga y eliminar palabras hasta tener la absoluta certeza de que no se puede acortar más. Por ejemplo, supongamos que necesitamos un título para el experimento del tamaño de la letra que estudiamos en capítulos anteriores. Digamos también que empezamos con esto: “Experimento en el que se examina el efecto del tamaño de la letra sobre el tiempo para leer un párrafo estándar en niños de varias edades.” Ahora, acortémoslo. Podemos eliminar de golpe “Experimento en el que se examina el efecto del”, ya que no da nueva información al lector. También eliminamos las preposiciones (de, sobre, para) cambiando el orden de las palabras. En este caso, es más eficiente identificar los niveles de la variable independiente (8 y 12 años de edad) que utilizar un descriptor general (niños de varias edades).
5
Aunque no tengo pruebas para respaldarlo, me parece que cuanto más corto es el título, mejor se difunde el artículo. Quizás este efecto se debe a la capacidad de memoria del lector o quizá los buenos escritores se esfuerzan por encontrar títulos breves. Quizá me hubiera convenido titular este libro como: libro.
13Martin268-307.indd 274
13/5/08 14:42:40
Cómo informar los resultados experimentales
275
Después de un poco de trabajo, el título queda así: “Efectos del tamaño de la letra sobre la velocidad de lectura de niños de ocho y 12 años.” Este título tiene la mayor parte de la información original y, desde luego, es más corto. El uso de los dos puntos acorta el título y permite eliminar algunas palabras. Si examina los títulos de las referencias que aparecen al final del libro, encontrará muchos ejemplos. Así, se ve un título de Johnson: “Respuestas pupilares durante una tarea de memoria de corto plazo: ¿Procesamiento cognitivo, activación o ambos?” Sin los dos puntos, el título sería más largo, como: “¿Las respuestas pupilares durante una tarea de memoria de corto plazo son indicación de un procesamiento cognitivo, activación o ambos?” También aparece un artículo de Greenwald titulado: “Diseños intrasujeto: ¿usar o no?” Greenwald podría haber optado por: “¿Deben o no deben usarse diseños intrasujeto?” En este caso, los dos puntos no acortan el título, sino que permiten algo más interesante, una versión shakesperiana de la pregunta existencial. AUTOR E INSTITUCIÓN
Después del título, se anota el nombre del autor o autores, seguido de la institución donde se hizo la investigación. Esto último es importante, porque la institución recibe el crédito por proporcionar recursos y porque se hace responsable de garantizar la ética y el cuidado del participante. Cuando hay varios autores, se anotan únicamente los que hayan hecho contribuciones científicas al estudio. Las personas que ayudaron a reunir o analizar parte de los datos deben recibir un agradecimiento en nota aparte del autor, y no aparecer como autores. En general, la persona que asumió la responsabilidad principal de la investigación también tiene que redactar el informe y aparece como primer autor. Sigue el nombre de los demás autores, ordenados por el peso de su contribución. Sin embargo, la magnitud relativa de la contribución de un investigador no siempre es obvia, por lo que llegan a surgir disputas, particularmente en el caso de colaboraciones entre estudiantes y maestros. Se ha sugerido que la mejor manera de evitar estas disputas es abordar estos problemas al inicio de la investigación (Fine y Kurdek, 1993). Entre los puntos que hay que considerar están las contribu-
¿QUIÉN QUIERE SER EL PRIMER AUTOR?
13Martin268-307.indd 275
13/5/08 14:42:41
276
Capítulo trece
ciones profesionales y no profesionales que requiere la investigación, las habilidades de cada persona y los deberes asignados a cada cual. Aunque es posible que haya que modificar los acuerdos conforme avanza la investigación, tener un consenso desde el principio previene la mayoría de las disputas. CORNISAS
Las cornisas son palabras del título que se imprimen en la esquina superior derecha de cada página, justo a la izquierda del folio. Si las páginas del manuscrito llegaran a dispersarse, con las cornisas y los folios es posible volver a organizarlas. RESUMEN
El resumen es la segunda parte más importante del informe. Cuando los lectores escogen su informe debido a que el título es interesante, a continuación consultan el resumen, sea en la publicación, en los Psychological Abstracts o en PsycINFO. Como un vendedor de cambaceo, el título sirve para poner el pie en la puerta, mientras que el resumen puede ganarse la invitación a entrar a la casa. El resumen debe ser una versión condensada del informe. La mayoría de los investigadores esperan a escribirlo hasta que terminan el ensayo, aunque en el informe final aparezca inmediatamente después del título. En el resumen se debe anotar el propósito de la investigación, nombrar las variables, presentar brevemente el método, mencionar los resultados importantes y analizar las implicaciones de los resultados. Para todo esto se conceden, como máximo, 120 palabras. Como ve, debe abarcar mucha información con muy poco texto. Es útil escribir un borrador largo y luego eliminar la información y las partes innecesarias del discurso. Verifique que el resumen es comprensible todavía y que contenga oraciones completas (a diferencia del título). Si después de la primera corrección el resumen es aún demasiado largo, deberá tomar algunas decisiones sobre la importancia relativa de la información
¡ESTÁ MUY RESUMIDO!
RESUMEN
13Martin268-307.indd 276
13/5/08 14:42:41
Cómo informar los resultados experimentales
277
restante, eliminando el material menos importante hasta que el resumen cumpla la longitud requerida. Algunos investigadores conceden poca importancia a los títulos y los resúmenes. Los escriben de prisa después de haber sufrido con el texto del informe. En esta exposición traté de convencerlo de que el título y el resumen son las dos partes más importantes de su informe experimental. Haga su mejor esfuerzo. INTRODUCCIÓN
En la introducción se describe el estado actual de los conocimientos científicos. Ya que siempre es la primera sección del informe, no necesita encabezado. Hay que suponer que el lector tiene alguna familiaridad con su campo de investigación, así que basta con mencionar los experimentos más pertinentes, según el que usted hizo. Cuando cite un experimento, dé sólo el nombre del autor y la fecha del artículo en el cuerpo del texto, y haga la cita completa en la sección de referencias.6 Describa estos experimentos principales con nada más que los detalles necesarios para delimitar el contexto de su experimento. Una buena introducción es una revisión bibliográfica en miniatura que deja a sus lectores con el sentimiento de que saben qué experimento debería hacerse a continuación: el que usted hizo. Después de revisar la bibliografía en que se justifica, debe establecer el objetivo o propósito de su experimento. En esta declaración se especifica la relación entre las variables independientes y dependientes que ha investigado. Por ejemplo: “El objetivo de este experimento fue determinar si el tamaño de la letra tendría el mismo efecto en la velocidad de lectura tanto en un niño de 8 años como en uno de 12.” Si puede predecir el resultado del experimento a partir de la revisión bibliográfica o de algún argumento teórico, enuncie su pronóstico como una hipótesis. Sin embargo, debe explicar el razonamiento de su hipótesis, ya que el propósito del pronóstico es facilitar la interpretación de los resultados en una sección posterior del informe. Si su hipótesis es una corazonada que no tiene cómo justificar, no haga perder el tiempo al lector. MÉTODO
Hasta aquí, sus lectores saben por qué hizo lo que hizo. Ahora debe decirles lo que hizo. La sección del método debe contener suficientes detalles para que sea posible replicar su experimento. Sin embargo, debe ejercer su buen sentido para discernir qué detalles son relevantes para el resultado experimental. Por ejemplo, en el experimento del tamaño de la letra, no hace falta especificar las dimensiones exactas del cuarto en el que se leyeron los párrafos, aunque debe especificar las dimensiones del papel en el que están impresos. Como no se 6
Una nota acerca de cómo citar experimentos: Con un autor, el nombre el autor y la fecha del artículo: “Jones (1967) descubrió…” o “Se descubrió (Jones, 1967)…” Con dos autores, escriba ambos nombres: “Jones y Smith (1971) descubrieron…”, o “Se descubrió (Jones y Smith, 1971) que…” Si son más de dos autores, ponga todos los nombres la primera vez que los cite y en adelante el nombre del primer autor seguido de la locución latina que significa “y otros”, et al., así: “Johnson et al. (1972) también descubrieron…”
13Martin268-307.indd 277
13/5/08 14:42:42
278
Capítulo trece
pueden mencionar las innumerables circunstancias, hay que circunscribirse a las que se espere lógicamente que influyan en los resultados. De ordinario, la sección del método se divide en varias partes. El informe común tiene tres partes, aunque cabe tener más, si lo pide el experimento. Participantes
En la sección de los participantes, o sujetos, 7 debe especificarse quiénes fueron. ¿Estudiantes, pilotos, niños? ¿De qué sexo eran? ¿Cuántos fueron y cómo los seleccionó? (¿Eran voluntarios? ¿Cumplían con un requisito académico? ¿Recibieron un pago?) Asiente esta información de modo que la entienda un lector en Samoa (“Los participantes eran estudiantes de PSY 204”… “¿Qué? ¿Qué es PSY 204?”). En el caso de los animales, no deje de anotar género, especie, proveedor y condiciones de alojamiento, junto con edad y sexo. Si eliminó datos de individuos (véase el capítulo 5), debe indicar en qué basa esta decisión. Equipo y materiales
En la sección de equipo y materiales debe describir lo que usó en su experimento. Si usó un aparato psicológico común, basta con dar el nombre genérico, fabricante y modelo (“Se usó un taquistoscopio de dos canales Scientific Prototype, modelo 800-F”). Describa con detalle los aparatos hechos a la medida, para que el lector pueda construir uno semejante (“Las diapositivas se proyectan sobre un panel de plexiglás de 15 centímetros de altura y 20 de ancho, montado verticalmente a 30 centímetros del participante”).8 No se olvide de tomar nota de todas las medidas en el momento del experimento. Reconstruir estos detalles después del experimento es difícil y, a veces, imposible. Procedimiento
En la sección del procedimiento debe especificar exactamente qué pasó con cada participante en el experimento. Cuando escriba esta sección, imagínese que su participante ingenuo acaba de entrar en la sala. ¿Qué pasó a continuación? ¿Qué instrucciones le dio? Puede parafrasear estos detalles, a menos que sean una parte importante de la manipulación experimental. ¿Qué sucedió durante un ensayo, en qué orden y oportunidad? ¿Cuántos ensayos se realizaron? ¿Se presentaron en bloques o por sesiones? ¿Fueron aleatorizados o contrabalanceados? ¿Qué se midió exactamente y cómo se midió y se registró? ¿Cuál fue el diseño experimental? ¿Por qué se decidió por el procedimiento descrito?
7 Cuando lea informes de experimentos realizados antes de 1974, verá las palabras sujeto y experimentador abreviadas como S y E respectivamente. Estas abreviaturas ya no se consideran aceptables. De hecho, el término sujeto debe evitarse siempre que sea posible y cambiarse por un término más concreto, como estudiantes, niños o ratas, o si se requiere un nombre general: participantes, entrevistados o individuos. 8 Informe todas las medidas en unidades métricas. Si el objeto se fabricó en otras unidades, señálelas, pero anote entre paréntesis las equivalentes métricas (“El panel tenía tres pies [0.91 m] de ancho”).
13Martin268-307.indd 278
13/5/08 14:42:42
Cómo informar los resultados experimentales
279
La sección del procedimiento es de las más difíciles de escribir bien, porque cuando llega el momento de escribir el informe, el autor está familiarizado con cada detalle y el procedimiento le parece obvio y directo. Haga todo lo posible para que alguien que no tenga la menor idea del estudio lea la sección de procedimientos y repita con sus propias palabras de qué trató la investigación. Luego, enmiende las falsas impresiones y repita el ejercicio con otra persona. Al cabo, los dos recuentos van a coincidir y en ese punto la sección estará completa. RESULTADOS
En general, la sección de resultados del informe debe empezar con la descripción de los datos. Proporcione datos crudos cuando ilustre un descubrimiento general o cuando muestre los resultados de experimentos de N pequeña. Primero se dan las estadísticas descriptivas.9 Cuando presente una medida de tendencia central, como la media o la mediana, debe también incluir una medida de dispersión, como la desviación estándar. Si tiene pocas mediciones que informar, las puede incluir en el texto: “Los tiempos de respuesta para los periodos iniciales 1, 2 y 3 fueron 50, 362 y 391 milisegundos, respectivamente.” En cambio, ponga una tabla o figura cuando deba informar más de cinco o seis puntos de datos. Los investigadores exponen en tablas los resultados de los principales efectos y dan los valores exactos de la variable dependiente cuando son importantes. Las tablas se elaboran en páginas separadas del texto. En la muestra breve de un informe que aparece al final del capítulo se ve cómo debe estar organizada una tabla. Para problemas específicos, consulte el Manual de publicación o la obra Presenting your findings: A practical guide for creating tables (Nicol y Pexman, 1999). Utilice pocas figuras, ya que ocupan mucho espacio y es más caro imprimirlas que las tablas.10 Sin embargo, como vimos en el capítulo 12, las figuras son un medio excelente para mostrar las interacciones e ilustrar las tendencias de los datos. En la mayoría de los casos, se prefieren las figuras a las tablas, ya que los lectores extraen y recuerdan mejor la información de figuras. Veamos algunas reglas generales para trazar una figura: 1. Marcar la abscisa y la ordenada y especificar las unidades de medición.11 2. Dibujar la ordenada de dos tercios a tres cuartos del largo de la abscisa. 3. Hacer 0 la marca más pequeña en la ordenada. Si hay que interrumpir la ordenada para ahorrar espacio (por ejemplo, si no tiene tiempos de respuesta entre 0 y 0.3 segundos), indique el corte mediante dos barras oblicuas en ese punto. 9
He visto muchos informes de estudiantes en los que la primera oración de la sección de resultados es algo como: “El efecto de la variable A fue significativa, t(18) = 4.7, p ⬍ .01.” Informar los resultados de una prueba estadística inferencial antes de describir los datos es tanto como informar los resultados de un partido de béisbol diciendo que “uno de los equipos ganó”. ¿Quién ganó? ¿Por cuánto? O en el experimento: ¿en qué dirección se dio el efecto? ¿Cuál fue el tamaño del efecto? 10 Una figura es cualquier representación visual de los datos que no puede ponerse en tipografía ordinaria. Las gráficas son las figuras más comunes en los informes experimentales. 11 Los nuevos investigadores olvidan este paso. Para evitar este error, impóngase la regla de no capturar ningún dato hasta que haya escrito los nombres de los ejes.
13Martin268-307.indd 279
13/5/08 14:42:42
280
Capítulo trece
4. Utilice códigos de puntos y guiones para indicar las variables independientes que no aparecen en la abscisa. Sea congruente con los códigos en todo el informe. No haga distinciones con colores. ¡Los colores son nada más para libros de ilustrar! 5. No ponga muchas curvas en una sola figura, no más de tres o cuatro. 6. Trace las figuras en páginas separadas del texto. Estas reglas están diseñadas para ayudarle a clarificar sus resultados y a minimizar la posibilidad de distorsiones. Sin embargo, habrá ocasiones en que tenga que flexionarlas un poco para no alterar sus datos. Ahora, las figuras que se entregan para una publicación formal pueden hacerse con un programa de computadora y una impresora. Si traza sus propias figuras, use una buena impresora y asegúrese de que el tamaño de línea y letras es el correcto, aun si hay que reducir la figura para publicarla. Para evitar que partes de la figura queden demasiado pequeñas, el tamaño de letras y números no debe variar más de cuatro puntos (por ejemplo, de 14 a 10 puntos). Después de describir los datos, se enuncian los resultados de las pruebas de inferencia estadística. Primero dígale al lector qué pruebas utilizó y cómo distribuyó sus variables en la prueba, si este factor no es obvio. Los resultados de las pruebas se expresan con un estilo fijo. Por ejemplo, si el resultado de una prueba t 12 realizada en dos grupos de 10 sujetos fue 4.7, lo cual encontró significativo a un nivel de .01, se diría lo siguiente: “Se encontró que la diferencia entre los grupos era significativa, t (18) = 4.7, p ⬍ .01.”13 Informe las demás pruebas de la misma manera, primero estableciendo el símbolo para la prueba estadística (en cursivas, si no es una letra griega), seguida de los grados de libertad entre paréntesis, un signo de igualdad, el resultado del cálculo de la prueba, una coma, una p minúscula en cursivas, un signo ⬍ (o para resultados que no son significativos, un signo ⬎) y finalmente el nivel de la prueba.14 Muchas publicaciones ahora piden que se incluya el tamaño del efecto, lo mismo que las pruebas ordinarias de significancia estadística. Indicar el tamaño del efecto permite al lector determinar no sólo si una diferencia encontrada en su muestra es expresión de una diferencia en la población, sino también si la diferencia fue lo suficientemente grande para que sea importante. Es fácil calcular el tamaño del efecto; se hace con los valores obtenidos de la prueba inferencial. Consulte un libro de estadística o pregunte a su profesor cuál es la fórmula exacta. En la sección de resultados no deberá interpretarlos, sino nada más dar la información aclaratoria necesaria. Aproveche la sección de resultados para establecer lo que encontró; la 12
Una prueba t es una prueba inferencial que indica si las medias de dos muestras son significativamente diferentes la una de la otra; su resultado es una cifra. Al comparar esta cifra con los números de una tabla, se determina si las medias son estadísticamente diferentes en un nivel de probabilidad particular (por ejemplo, un nivel de probabilidad de .01, p ⬍ .01). 13 El número entre paréntesis son los grados de libertad de la prueba t. La mayoría de las pruebas estadísticas tienen un término de grados de libertad de uno o dos números. Al estudiar esas pruebas aprenderá la forma de determinar esa cifra. 14 En el apéndice A, al final de los ejemplos trabajados para cada prueba estadística, muestro cómo informar el resultado de una prueba en el texto del manuscrito.
13Martin268-307.indd 280
13/5/08 14:42:43
Cómo informar los resultados experimentales
281
sección de discusión sirve para explicar por qué piensa que encontró lo que encontró y, en el formato estándar, nunca se mezclan las secciones, aunque, en algunos casos, si la información puede ser presentada mejor o con más claridad, puede combinar las secciones de resultados y análisis. Pero ponga este encabezado: Sección de resultados y discusión. DISCUSIÓN
CUERPO DEL CONOCIMIENTO
EXPERIMENTO
En la introducción explicó el estado de los conocimientos y qué necesitaba ampliación. La sección de resultados proporcionó un nuevo elemento.15 A continuación es preciso describir cuál es el lugar del nuevo elemento en la estructura y por qué esta estructura es diferente de la anterior. La sección de discusión es el lugar en el que actualiza el conjunto de los conocimientos con sus resultados.
En muchos casos, en la sección de introducción tuvo que identificar las teorías rivales y establecer una hipótesis que predijera el resultado del experimento. En la sección de la discusión debe revisar brevemente estas teorías e hipótesis y analizar si sus resultados las apoyan o las refutan. Si más de una teoría o hipótesis pueden explicar sus resultados, convendría sugerir otras formas de comprobarlas en experimentos futuros. Esta sección es también el lugar para matizar sus resultados, de ser necesario, y para especular sobre las razones de resultados imprevistos (haga breves sus especulaciones y aclare lo que son). No desperdicie el tiempo del lector explicando efectos que no fueron estadísticamente significativos. Solamente en ocasiones excepcionales los resultados negativos deben ser interpretados como debidos a algo diferente que el azar. En particular, si hace investigación aplicada, indique en la sección de discusión el valor práctico de sus resultados, cómo y dónde pueden ser utilizados y cómo cambiarían los procedimientos aplicados actuales. Por último, en esta sección se hacen sugerencias sobre la dirección de la investigación futura. Después de exponer el nuevo estado de los conocimientos, puede sugerir dónde debe ocurrir la nueva expansión. 15
O, en algunos casos, un experimento derriba parte de la estructura existente.
13Martin268-307.indd 281
13/5/08 14:42:43
282
Capítulo trece
REFERENCIAS
En esta sección debe anotar las referencias citadas en el informe, ordenadas alfabéticamente por el apellido del primer autor. La bibliografía al final del libro y las referencias en el informe de muestra se apegan al uso y le darán muchos ejemplos provechosos. Para referencias inusitadas, consulte el Manual de publicación.
■ Cuidado de prejuicios lingüísticos Sin darnos cuenta, a veces usamos un lenguaje que refleja prejuicios culturales históricos. Por ejemplo, aunque un motivo de la convención lingüística de usar las formas masculinas como genéricas fue acaso la eficiencia, pero otro motivo fue que, por razones históricas, la persona a la que se refería casi de seguro era un hombre. Los hombres hicieron cosas que valía la pena poner por escrito y las mujeres se quedaron en casa criando a los hijos, o cuando menos eso pensaban quienes tenían el control del lenguaje (o sea, los hombres). No necesito hacerle notar que el mundo ha cambiado. Quienes nos dedicamos a la psicología nos percatamos de este cambio; en la actualidad, la mayoría del estudiantado de posgrado y cerca de tres cuartos en licenciatura son mujeres. Nosotros, los psicólogos hombres, deberíamos considerarnos afortunados de que las mujeres no exijan el uso genérico del femenino los próximos dos siglos, para igualar las cosas. También se deslizan prejuicios en el lenguaje cuando nos referimos a grupos étnicos, edades, discapacidades y orientación sexual. Con la intención de minimizarlos, la APA incluyó en su Manual de publicación una sección con una guía de uso del lenguaje. Aquí está mi versión de la guía. La acorté y reorganicé, pero creo que no la traicioné. 1. Llame a las personas por lo que son. La primera norma tiene al menos dos implicaciones. La primera es que debemos especificar y referirnos a los grupos de personas con tantos detalles como sea necesario a fin de precisar. Por ejemplo, no debemos referirnos al hombre en una frase como el hombre en busca de conocimiento, si también se incluye a la mujer. Diga hombres y mujeres o seres humanos o use algún término incluyente. No diga él si podría referirse a una mujer; cambie la redacción, por ejemplo: “A cada participante se le preguntó si…”.16 Así, su lenguaje será más preciso y nadie quedará excluido. Por otro lado, no use formas de acotación referencial si se ocupa de un grupo muy grande. No escriba no blancos
16
No mezcle singular o plural, como: “A cada participante se les preguntó…” En la conversación, como es difícil organizar las oraciones con suficiente antelación para coordinar sustantivos, adjetivos y pronombres y evitar los usos incorrectos, la gente no nota cuando uno se equivoca. Pero se dará cuenta si el error está puesto por escrito. Véase Foertsch y Gernsbracher (1997), sobre las consecuencias prácticas de tales equivocaciones. También véase Madson y Hessling (2001) para saber qué piensa la gente de textos que alternan las diversas formas políticamente correctas.
13Martin268-307.indd 282
13/5/08 14:42:43
Cómo informar los resultados experimentales
283
si quiere decir afroestadounidenses. En otras palabras, sea tan específico como sea necesario para lograr la precisión. La segunda implicación de la norma es que los términos deben referirse a los participantes como personas, no como objetos. Ya comentamos el intento por minimizar el uso del término sujeto, ya que hace parecer que los participantes del experimento son objetos, en lugar de personas. Los mejores términos son los más específicos: niños, estudiantes, ratas, niños de 8 años, mujeres. Si se necesitan términos más generales, participantes, entrevistados o individuos son preferibles a sujetos. 2. Llamar a las personas como quieren que las llamen. El uso del lenguaje cambia con el tiempo. Entre estos cambios se encuentran los términos que se refieren a los elementos que componen nuestra población. En algunos casos, los cambios ocurren tan de prisa que este libro estaría obsoleto en dos años si quisiera darle toda la terminología actualizada. En los últimos 50 años hemos recorrido negro, oscuro, afroestadounidense, y actualmente se usa gente de color. Cuando esta edición iba a la imprenta, asiático estadounidense se prefería a oriental e indígena o nativo estadounidense a indio. En cuanto a la orientación sexual (observe que el término orientación se prefiere a opción, ya que no sabemos si entre en juego alguna elección), los términos preferidos son homosexuales y lesbianas. Pero en todos estos casos, tendrá que determinar qué lenguaje se prefiere en el momento de escribir su informe. La mejor manera de hacerlo es preguntar a los participantes cómo les gustaría que se les llamara. 3. Personas es sustantivo; sus atributos son adjetivos. Esta norma asienta que las personas son gente, no atributos ni condiciones. Por tanto, las personas con esquizofrenia no son esquizofrénicas: la esquizofrenia es una condición, no una persona. De igual manera las personas con discapacidades no deben ser llamadas discapacitadas, las personas de edad no son ancianos y los hombres homosexuales no son gays. Lo mismo es cierto de otros adjetivos, como masculino y femenino; debe referirse a las o los participantes. Los sustantivos son hombres y mujeres o, para los de edad escolar y jóvenes, niñas y niños. Por cierto, asegúrese de utilizar términos paralelos, particularmente cuando términos únicos ponen un grupo en un papel subordinado o estereotipado, como hombres y esposas. Las anteriores son las guías, no reglas rígidas. De seguirlas ciegamente, se produce mala terminología o prosa desmañada. Y no deben usarse como excusa para disminuir la precisión que exige la ciencia. Como prueba final de las implicaciones sociales del lenguaje que use, Maggio (1991) propone que uno se imagine como miembro del grupo que estudia. Si se sintiera excluido u ofendido por lo que ha escrito, necesita revisarlo.
■ Estilo de escritura Los informes experimentales no se escriben para dar obras maestras o monólogos entretenidos. Su estilo de escritura no debe estorbar la fluidez de los pensamientos ni llevar más la atención hacia usted que hacia su investigación. Para cumplir estos requisitos, el ensayo científico ha desarrollado un estilo estandarizado.
13Martin268-307.indd 283
13/5/08 14:42:44
284
Capítulo trece
Por tradición, quienes escriben textos científicos escriben con la voz pasiva de la tercera persona en lugar de la voz activa de la primera. En lugar de escribir: “Hice este experimento para…”, el investigador escribe: “Este experimento fue realizado para…” El estilo impidió que el informe se pareciera a una carta familiar, pero también le quitó mucha vida. La prosa se volvió aburrida y monótona y al lector le causó más dolor que placer. En la actualidad se considera adecuado utilizar, limitadamente, el pronombre de la primera persona; por ejemplo: “Pensé que…”, en lugar de: “Se pensó que…” Sin embargo, debe evitar el uso excesivo de la primera persona para que la atención del lector no se enfoque en usted en lugar de la investigación. También debe de tratar de usar las formas activas de los verbos, sobre todo cuando no hay problemas de pronombres; por ejemplo: “En un informe anterior se describió un nuevo método”, en lugar de: “En el informe anterior, fue descrito un nuevo método.”17 La regla general consiste en usar palabras que hagan que el texto cobre vida sin interrumpir el flujo de los pensamientos. El contexto de una oración indica qué verbo utilizar. La mayoría de las oraciones en las secciones de introducción y método se refieren a acciones pasadas: “Boles (1972) informó…” o “Los estudiantes recordaron las palabras…” Por otro lado, los resultados “son” y la teoría “es”, incluso después de que se terminó el experimento. Es decir, los conocimientos existen en el presente y hay que exponerlos con los verbos en presente: “Estos datos apoyan la teoría de la interferencia para explicar el olvido.” Finalmente, el ensayo científico debe ser conciso. Los recursos limitados de tiempo y espacio no nos permiten el lujo de la verborrea. Por ejemplo, el estilo con que escribí este libro no sería apropiado para un ensayo científico.18 A propósito he empleado más palabras de las necesarias, ya que he tratado de hacer más que transferirle información: he tratado de convencerlo, atraerlo y convertirlo, así como también comunicarme con usted. En el ensayo científico, debe suponer que el lector ya está convencido, atraído y convertido; el único trabajo, entonces, es comunicar. El problema más común que enfrentan los nuevos investigadores con el informe escrito es la flojera. Por supuesto, los investigadores no son flojos, ya que la gente floja no hace experimentos, pero su estilo de escritura puede ser flojo. Al escribir un informe, el extremo más importante de su lápiz es el que no tiene la punta; la tecla más importante es la de ”suprimir”. Es rarísima la persona que puede escribir un buen informe a la primera. La mayoría de los buenos redactores científicos ensayan palabras y oraciones antes de decidir la mejor. Cada palabra debe decir con precisión lo que se quiere decir y cada oración debe concatenarse suavemente con la siguiente. Escribir así es difícil. Al redactar un informe, la mayoría de los investigadores hacen primero un borrador de la mejor versión que pueden escribir. Llevar el informe hasta este punto puede tomar dos o
17
Algunos escritores objetan esta forma por considerar que no es el informe, sino el autor, el que describe. Supongo que es una cuestión de preferencia personal. En este caso, prefiero intercambiar un poco de precisión por mucha vida. 18 Si hubiera escrito el libro en un estilo científico, se habría aburrido, yo me habría aburrido y el editor se habría aburrido. Mi madre tendría el único ejemplar vendido; ella me ama incluso cuando aburro.
13Martin268-307.indd 284
13/5/08 14:42:44
Cómo informar los resultados experimentales
285
tres intentos, ya que es más fácil reescribir todas las secciones que hacer correcciones sobre correcciones. Cuando tenga un borrador final que lo haga sentir satisfecho, entréguelo a varias personas para que lo lean. Al menos una no debe saber mucho de su experimento, ya que usted está tan familiarizado que no puede juzgar si lo describe bien en el informe. Debido a que ya sabe lo que pasó, su mente rellena las lagunas que deja en el informe. Un lector desprevenido puede ser un buen detector de lagunas.19 También es de gran ayuda darle el informe a un lector que esté familiarizado con lo que hizo, para que diga si hizo lo que dice que hizo. Esta persona puede servirle como un detector de errores. Por último, debe tener un lector que conozca el estilo de escritura científica y sea un buen redactor. Este lector le ayudará a mejorar su forma de expresar lo que hizo.
INFORME
EL ENEMIGO ES EL MEJOR CRÍTICO Después de tener los comentarios de estos lectores, está listo para escribir una versión final del informe. Debe teclearla, imprimirla, verificar la ortografía y corregir antes de entregarla. Algunos alumnos verán que si siguen el procedimiento descrito aquí, sus informes son más claros; otros descubrirán que otro procedimiento les funciona mejor. Escribir es un arte, lo que funciona para un escritor puede no servirle a otro. Como sea, el punto principal que analizamos es la validez de cualquier procedimiento: el informe es el producto final de su investigación y merece cuando menos el mismo esfuerzo que puso en los demás aspectos de su investigación.
■ La lista de los 10 principales He calificado miles de informes de investigación escritos por mis estudiantes. He tratado de meterles en la cabeza las reglas de estilo de la APA, pero de todos modos cometen errores. 19
A la muerte de uno de sus colegas científicos, un amigo me dijo: “De veras lo voy a extrañar. Era uno de mis mejores enemigos. Ahora no sé a quién le voy a enviar mis informes.” Muchas veces, lo mejor es tener alguien que lea el informe y sea crítico, sin temor de que se rompa la relación. Los amigos son demasiado amables para ser buenos críticos.
13Martin268-307.indd 285
13/5/08 14:42:45
286
Capítulo trece
Algunos de estos errores ocurren con mucho más frecuencia que otros, así que pensé que sería de gran ayuda presentar una lista de los 10 principales errores que ocurren con más frecuencia, a la manera de David Letterman. A continuación la podrá leer. LAS 10 PRINCIPALES FALTAS AL ESTILO DE LA APA
10. 9. 8. 7. 6. 5. 4. 3. 2. 1.
Usar “desde” cuando no se refiere al momento sino a “porque” o “como”. En una cita, poner un punto después de et en “et al.”. Llamar a los participantes “sujetos”. En una referencia, dar el número de la publicación cuando la paginación es por volumen. Al expresar los resultados estadísticos en el texto, poner al revés los signos < o >. Emplear el nivel equivocado de los encabezados. No incluir todas las obras citadas en la sección de referencias. Confundir los tiempos verbales. Emplear “masculino” y “femenino” como sustantivos. No utilizar el tiempo pasado para lo que se hizo o el tiempo presente para la teoría o los resultados que tienen una aplicación continua.
■ Muestra de un informe Pase por alto los contenidos del informe que se encuentra a continuación. Además de que es ficticio, la redacción no es muy buena, ya que traté de ilustrar muchos casos del estilo de la APA en un informe breve. Las apostillas dan versiones cortas de reglas de estilo; la flecha apunta a un ejemplo en el informe. La última palabra la sigue teniendo el Manual de publicación. Es posible que su profesor le pida que se salte algunas reglas. Por ejemplo, cuando un informe no va a ser dado a la estampa, prefiero que los estudiantes incorporen las figuras y tablas dentro del texto. Así, el lector las tiene a la mano, conforme lee el texto. Su profesor tendrá sus propias preferencias. Para una cobertura más detallada del estilo de la APA, encargue un ejemplar del Manual de publicación: Publication Manual of the American Psychological Association, 5a. edición (2001). Hay más recursos si le parece que le falta ayuda con su escritura. Fred Pyrczak y Randal R. Bruce (2000) escribieron un libro, Writing Empirical Research Reports: A Basic Guide for Students of The Social and Behavioral Sciences que es una buena referencia. Si necesita más ayuda con el estilo de la APA, ésta publica un libro, Mastering APA Style: Student’s Workbook and Training Guide (Gelfand, Walker y APA, 2002). Existen también programas de software para incorporar el estilo de la APA en los informes; por ejemplo, el APA-Style Helper 5.0, que se puede descargar de http://www.apastyle.org, y el Reference Point Software´s Template for APA Style, que se consigue en ReferencePointSoftware.com.
13Martin268-307.indd 286
13/5/08 14:42:45
Cómo informar los resultados experimentales
Doble espacio.
Título abreviado, en letras mayúsculas y no más de 50 caracteres.
287
Cornisa en la parte superior de cada página.
Tamaño de la letra 1 Folios. Encabezado: TAMAÑO DE LA LETRA Título centrado; empiece las palabras importantes con mayúsculas; no más de 10 a 12 palabras. Tamaño de la letra y velocidad de lectura en niños de 8 y 12 años William T. Garcia
Nombre del autor, centrado.
Universidad del Este de California Institución, centrado; donde se realizó la investigación.
13Martin268-307.indd 287
13/5/08 14:42:45
288
Capítulo trece
No haga sangría en el resumen
Tamaño de la letra 2
Resumen ➤
➤
Se midió el tiempo que les tomó leer a niños de
Doble espacio.
➤
ocho y 12 años de edad un párrafo como función del tamaño de la letra. Los párrafos fueron escritos ➤
No más de 120 palabras.
➤
con letra de 12 o 10 puntos. Los resultados
Sin justificar a la derecha ni división de palabras.
indicaron que el tamaño de la letra es una dimensión importante para los niños pequeños, pues con la letra más grande leyeron 32% más rápidamente que con la pequeña. El tamaño de la letra no tuvo efecto sobre la velocidad de lectura
➤
interpretados en el contexto de la teoría del
➤
entre niños más grandes. Los resultados son
impacto del estímulo sobre la lectura.
Márgenes en todas las páginas en todos los lados debe ser de 2.5 centímetros.
13Martin268-307.indd 288
13/5/08 14:42:45
Cómo informar los resultados experimentales
289
Repetir el título completo centrado.
Sangrar los párrafos cinco a siete espacios.
Tamaño de la letra 3 ➤
Tamaño de la letra y velocidad de
Doble espacio.
➤
➤
lectura en niños de 8 y 12 años
los niños más chicos requieren objetos más
➤
➤
Muchos investigadores han especulado que
grandes para que haya cierto impacto visual, en
Cite las referencias por nombre de los autores, en orden alfabético y dentro de los paréntesis.
comparación con niños más grandes (Darling, ➤
1990; Millar y Hoaks, 1989; Williams, García y Levitz, 1992). En su reseña clásica, Millar y Hoaks ➤
(1989) especificaron la dinámica de esta
declaración y la llamaron teoría del impacto del estímulo.
Cite todos los autores, hasta seis, la primera vez que los mencione.
Más tarde, Williams et al. (1992) probaron la ➤
teoría midiendo la respuesta pupilar en niños de ➤
tres edades diferentes. Los niños de 3 años ➤
➤
requirieron una exposición 375 ms más larga para producir una respuesta del mismo tamaño que niños de 7 años. ➤
Escriba los números cero al nueve, con palabras en todo el informe, a excepción del resumen.
13Martin268-307.indd 289
Con tres o más autores, abrevie et al. después de la primera cita. Ponga abreviaturas con unidades que llevan cifras. Milisegundos es “ms” sin punto
Utilice números arábigos para hora, fechas, edades y cifras que preceden a las unidades de medición.
13/5/08 14:42:46
290
Capítulo trece
Escriba “en prensa”, para referencias en proceso de ser publicadas.
Utilice el sistema métrico.
Tamaño de la letra 4
➤
Escriba con arábigos los números de 10 en adelante.
Grant (en prensa) también midió el tamaño ➤
➤
pupilar para comparar el efecto de discos de 10 cm y 20 cm en 48 niños de diversas edades. El tamaño del disco tuvo poco efecto sobre niños de más de 10 años, pero tuvo un efecto en los más pequeños. En la investigación informada aquí, traté de aplicar la teoría del impacto del estímulo a una tarea de lectura. Basándome en la teoría, predije que el tamaño de la letra tendría poco efecto sobre la velocidad de lectura en niños de 12 años, pero tendría un efecto en niños de 8 años.
➤
Participantes
➤
Método
➤
Treinta alumnos de 8 años de una escuela primaria, 15 niñas y 15 niños, fungieron como
Los encabezados van en este orden: 1. CENTRADO EN MAYÚSCULAS 2. Centrado mayúsculas y minúsculas 3. Centrado mayúsculas y minúsculas en cursivas 4. Corrido a la izquierda mayúsculas y minúsculas en cursivas 5. Sangrado, en cursivas, en minúsculas encabezado de párrafo termina con punto Si se requieren sólo dos niveles de encabezados, como por lo general es el caso, utilice el número 2 y el número 4.
Escriba con palabras el número que empieza una oración. Trate de no iniciar una oración con número.
13Martin268-307.indd 290
13/5/08 14:42:46
Cómo informar los resultados experimentales
291
Tamaño de la letra 5
participantes en un grupo. Su director y un padre dieron el permiso para que participaran. Los 17 ➤
niños y 13 niñas del grupo de 12 años recibieron
un pago de 3.50 dólares por hora a cambio de su participación. Aparatos Un proyector de diapositivas mostraba los
La información del participante incluye número, sexo, edad, cómo fue seleccionado y por qué presta su ayuda.
Especificaciones de aparatos hechos a la medida.
➤
párrafos sobre una pantalla de cristal esmerilado de 20 × 40 cm. Se usó un cronómetro para medir el ➤
tiempo de lectura. Procedimiento
Descripción genérica de los aparatos comunes.
Los niños fueron examinados individualmente en sesiones de 20 min. Después de sentarlos frente de una pantalla, se les dijo que iba a aparecer un párrafo en la pantalla. Debían leer el párrafo con mucho cuidado, tardando el tiempo suficiente
13Martin268-307.indd 291
13/5/08 14:42:46
292
Capítulo trece
Tamaño de la letra 6
para entender el material. Después de leer un ➤
párrafo, se le formularon a cada niño tres
Procedimiento en tiempo pasado.
preguntas, de respuesta de una sola palabra, acerca del contenido del párrafo. Cuando respondieron, se presentó otro párrafo, hasta que ➤
todos los niños leyeron tres párrafos. Antes, se había verificado la legibilidad de los párrafos y se había visto si correspondía o estaba ligeramente debajo del nivel de un niño de
Los números menores a 10 se escriben con palabras. Los números que se refieren a tiempo, edades, calificaciones o puntos sobre una escala se escriben como guarismos.
➤
8 años. Se concluyó que las preguntas representaban una buena medición de la comprensión. El experimentador registró, cronómetro en mano, la latencia de lectura de cada ensayo. Se sacaron calificaciones de los tres ensayos en
13Martin268-307.indd 292
13/5/08 14:42:46
Cómo informar los resultados experimentales
293
Tamaño del texto 7
cada sesión. Por tanto, el diseño experimental fue un diseño factorial de 2 × 2 × 3, con dos niveles de edad (8 y 12 años), dos niveles de tamaño de la letra (10 y 12 puntos) y tres niveles de ensayos. ➤
Resultados
Había muy pocos datos aquí que justificaran una figura o tabla en el reporte real.
En la figura 1 se muestra el tiempo ➤
promedio de lectura de cada grupo de edad y tamaño de letra. Un análisis de varianza calculado sobre los tiempos de lectura indicó que el efecto principal de la edad era estadísticamente ➤
significativo, F (1, 58) = 26.73, p < .01. El efecto ➤
principal del tamaño de la letra no fue
Remita a la figura en el texto. Observe cómo se indican los resultados estadísticos. Los decimales menores a 1 van precedidos por un 0, a menos que no puedan pasar de 1 o se refieran a un nivel de significancia.
➤
significativo, F (1, 58) = 0.87, p > .05. Sin embargo, ➤
➤
la interacción Edad × Tamaño de la letra fue significativa, F (2, 116) = 10.31, p < .01.
Ponga con mayúscula la primera letra de las interacciones de esta forma.
Los efectos principales no van con mayúsculas.
13Martin268-307.indd 293
13/5/08 14:42:46
294
Capítulo trece
Cuando informe de medias, incluya siempre una medida de dispersión, como la desviación estándar.
Tamaño de la letra 8
La tabla se incluye solamente para ilustrar su uso. En un informe real, utilizar una tabla y una figura para presentar datos equivalentes es redundante.
➤
En la tabla 1 se muestra el promedio de los ➤
tiempos de lectura y las DE de los tres ensayos. El efecto principal de los ensayos no alcanzó a ser ➤
significativo, F (2, 24) = 1.53, p > .05.
Verifique la dirección de los signos < y >; p > para no significativo y p < para significativo.
➤
Discusión Los datos presentados son congruentes con ➤
la teoría del impacto del estímulo. No se encontró
Informar los estadísticos inferenciales, como t y F, con 2 decimales.
ninguna diferencia en el tiempo de lectura como función del tamaño de la letra en niños mayores. Sin embargo, en los niños menores la diferencia de tamaño de letra produjo una diferencia
Datos e interpretaciones persisten, por lo que deben expresarse en tiempo presente.
significativa en el tiempo de lectura. Una interpretación de estos datos dentro del marco ➤
de la teoría del impacto del estímulo es que incluso un tamaño de letra menor
13Martin268-307.indd 294
13/5/08 14:42:47
Cómo informar los resultados experimentales
295
Tamaño de letra 9
tuvo un impacto visual máximo sobre los niños mayores. Los niños menores requirieron letra más grande para desempeñarse en un nivel más alto. Como Millar y Hooks establecieron en su artículo ➤
de 1989, “se requieren estímulos de alto impacto
para un desempeño máximo en niños pequeños”
Para citas de menos de 40 palabras, utilice comillas; las más grandes deberán ser puestas a bando, sin comillas.
(p. 356). La implicación de estos resultados es obvia para los editores de material de lectura para niños. Sin embargo, antes de que se les presenten las recomendaciones, se necesitan más investigaciones para comparar los tiempos de lectura de otros tamaños de letra y con niños de más edades.
13Martin268-307.indd 295
13/5/08 14:42:47
296
Capítulo trece
Las entradas de la bibliografía se componen a la francesa.
Cada entrada debe haber sido citada en el informe.
Ordenar alfabéticamente por el primer apellido del autor.
Autor: Apellido e iniciales.
Tamaño de la letra 10
Año de publicación.
➤
➤
➤
➤
➤
Referencias
Darling, D. T. (1990). Internal consistency in
➤
➤
stimulus-impact theory. Journal of Child
Título: En mayúsculas la primera letra y los nombres propios. Nombre de la publicación: En mayúsculas la primera letra.
Behavior, 26, 58-63.
➤
➤
Grant, U. T. (en prensa). Pupillary response to disks. Sensation & Perception.
Páginas.
Millar, J. R. y Hoaks, A. R. (1989). Stimulus impact theory: A developmental theory of perception. Childhood Perception and Cognition, 7, 278-295.
Número del volumen: En cursivas el nombre de la publicación, las comas y el número del volumen.
Williams, E. T., Garcia, W. T. y Levitz, G. W. (1992). A review of size effects. Behavioral Review, 21, 326-354.
Encontrará ejemplos de cómo citar libros y revistas y otros documentos en la bibliografía al final del libro.
13Martin268-307.indd 296
13/5/08 14:42:47
Cómo informar los resultados experimentales
297
Tamaño de letra 11
Nota del autor William T. García, Departamento de ➤
Psicología (ahora en el Centro de Desarrollo
El primer párrafo señala la institución del autor y el departamento.
Infantil, Universidad Westbrook). Quiero dar las gracias a Nancy Wells por su ➤
ayuda en la recolección de los datos. Este
experimento fue presentado en la reunión de la Sociedad Psicológica del Noroeste en Madison, Washington, el 15 de mayo de 2001. La correspondencia sobre este artículo debe ➤
ser enviada a William T. Garcia, Center for Child
En el segundo párrafo se agradece a las instituciones que financiaron el estudio y a los ayudantes; también se indican las presentaciones anteriores de los datos. En el tercer párrafo se dan los datos para hacer contacto, incluyendo direcciones actualizadas.
Development, Box 4536, Westbrook University, Monroe, Washington 12342, o por correo electrónico a garcia.ccd.wu.edu.
13Martin268-307.indd 297
13/5/08 14:42:47
298
Capítulo trece
Tamaño de letra 12
Título en mayúsculas y minúsculas, justificado a la izquierda y en cursivas.
Tabla 1 ➤
Medias y desviaciones estándar del tiempo de lectura de un párrafo en segundos como función de la edad, tamaño de letra y ensayos. ➤
DE
➤
M
M
DE
10-puntos Ensayo 1
84.2
12.9
31.2
8.7
Ensayo 2
83.4
10.2
27.7
7.8
Ensayo 3
81.0
10.7
24.7
8.1
Ensayo 1
58.2
10.1
32.3
9.2
Ensayo 2
56.1
8.2
29.1
8.3
Ensayo 3
55.9
7.7
30.8
8.5
➤ ➤
Tamaño de la letra
12 años
➤
8 años
Trace sólo rectas horizontales.
Al indicar las medias, incluya siempre una medida de dispersión, como la desviación estándar.
➤
➤
12-puntos
La tabla con títulos debe entenderse por sí sola. El título debe explicar las abreviaturas usadas.
Haga una sangría cuando sea posible, en lugar de ocupar otra columna.
13Martin268-307.indd 298
13/5/08 14:42:47
Cómo informar los resultados experimentales
299
Leyendas en páginas separadas.
Tamaño de letra 13 ➤
Leyenda de figura Figura 1. Tiempo de lectura promedio en segundos en función del tamaño de letra y la edad.
➤
La figura con la leyenda debe entenderse por sí sola. En la leyenda debe explicarse cualquier abreviatura.
La ordenada deberá ser 2/3 a 3/4 del largo de la abscisa.
Coloque la leyenda cerca del borde o dentro del recuadro.
➤
▲
8 años
12 años
➤
➤
Ponga nombre a los ejes. Las unidades pueden abreviarse.
°
12 puntos
Tamaño de la letra
➤
°
➤
30 15 0
Utilice puntos muy distinguibles, como círculos blancos o triángulos rellenos.
➤
▲
➤
Tiempo de lectura (en segundos)
➤
90 75 60 45
10 puntos
13Martin268-307.indd 299
En el reverso de la figura, cerca del borde superior, escriba ligeramente “arriba”, el título y el número de la figura.
Las letras no deberán variar más de cuatro puntos.
Las letras y números de la figura deben ser lo suficientemente grandes que la figura sea legible cuando se reduzca al tamaño normal de una columna de una publicación.
13/5/08 14:42:48
300
Capítulo trece
■ Presentaciones en congresos PRESENTACIONES ORALES
Aunque un informe escrito es el principal medio de dar a conocer una investigación, la mayoría de los investigadores, incluyendo muchos estudiantes, también informan de sus resultados presentándolos en conferencias profesionales. Los estudiantes tienen cada vez más oportunidades de presentar sus resultados de la investigación en estos medios. Por ejemplo, el año pasado los estudiantes de mi universidad pudieron presentar sus trabajos en una sesión de carteles en el departamento de psicología o en una reunión de investigación de toda la universidad, con el patrocinio de organizaciones estudiantiles. También pueden leer ponencias en reuniones de licenciatura que atraen estudiantes de diversos lugares o en reuniones apoyadas por asociaciones locales de psicología. Algunos incluso presentaron ensayos o carteles en reuniones regionales o nacionales, en sesiones de estudiantes o como coautores en sesiones normales. A muchos estudiantes les emocionan esas presentaciones, tanto por hablar ante un público acerca de su propio trabajo, como por la posibilidad de ver por primera vez el ancho mundo científico. Sin embargo, mostrar en público una ponencia o un cartel puede ser una experiencia aterradora, y salvo por algún curso de oratoria, la mayoría de los estudiantes tienen poca experiencia. Aquí tiene un curso intensivo en el arte de hacer una presentación oral. ¿En que consiste la presentación de una ponencia? Aunque la respuesta varía dependiendo de la reunión, se espera que usted se pare en frente de un grupo de 20 a 100 colegas y presente su trabajo en menos de 20 minutos, dejando algo de tiempo al final para las preguntas. De ordinario, uno prepara auxiliares visuales, que hoy en día son presentaciones en computadora, como PowerPoint, o en algunos casos se entregan documentos impresos. Es importante darse cuenta de que presentar así su investigación es mucho muy diferente de escribir un ensayo. Si quiere leer un informe de investigación con el estilo de la APA, tendrá suerte si sus escuchas no lo abandonan. El informe escrito es muy largo, tiene muchos detalles y sigue un estilo para leerse, no para hablar. Puede esperarse que una persona lea completamente su informe, lo asimile y aprenda muchos detalles. Sabemos por investigaciones sobre la memoria humana, que la persona que escuche su presentación sólo se quedará con los puntos principales. El presentador quiere que el público capte estos puntos fácilmente y los recuerde. Idealmente, el estilo de su presentación debe ser conversacional. Recuerdo la primera ponencia que leí en una reunión. Hablaba ante un grupo nacional de investigadores en un campo de estudio en el que apenas había trabajado cinco meses. Estaba aterrado. Pero me esforcé y memoricé la presentación, para pronunciarla sin notas. Me levanté, mis rodillas temblaban y presenté la investigación sin tropezarme con mis muchas palabras. Me sentía orgulloso de mí. Pero en una recepción, más tarde, cuando mi consejero le preguntó al coordinador de la conferencia si había dado una buena presentación, el coordinador dijo que no, porque había sonado como si hubiera leído el documento, y así no se hace en esa reunión. Desde luego, me sentí perdido en el momento, pero fue el mejor consejo. Los estudiosos de
13Martin268-307.indd 300
13/5/08 14:42:48
Cómo informar los resultados experimentales
301
la comunicación saben que el habla conversacional no es lo mismo que leer un texto. En el habla conversacional variamos el ritmo de acuerdo con lo que pensamos; hacemos pausas para pensar en nuestra siguiente frase y luego pronunciamos las palabras más de prisa. El escucha aprovecha las pausas y el ritmo de las palabras para seguir la pauta del pensamiento del orador. Al leer un texto, las palabras tienen un ritmo más regular, sin pausas largas. Este estilo monótono es un buen método para curar el insomnio del escucha, pero muy malo para transmitir la emoción de la investigación. Como presentador, debería estar familiarizado con lo quiere decir, sin embargo no debe excederse hasta el punto en que suene como si leyera un trabajo escrito y estuviera aburrido. Como se trata, pues, de hacer la presentación con toda la naturalidad que sea posible, se tardará más en la exposición del material de lo que espera. Si practica leyéndose en voz alta una versión escrita, se acelerará, ya que no tiene que lentificar para que algo se asimile, pues entiende el contexto. Así, piense que se va a tardar cuando menos 20% más para presentar el material a una audiencia que lo escucha por primera vez. Idealmente, debe incorporar puntos optativos, en los que pueda agregar material o eliminarlo conforme hace su presentación, para controlar la duración. Si sus presentaciones son como las mías, tendrá que tomar la ruta corta en la mayoría de estos puntos. Piense en su público y trate de hacer su presentación a la medida de sus escuchas. ¿Son estudiantes, psicólogos, expertos en su campo de investigación o científicos de muchas disciplinas? Como estamos muy familiarizados con nuestro tema al momento de presentar nuestra investigación, tendemos a olvidar que no todo mundo está tan habituado ni tan interesado como nosotros. Trate de remontarse al pasado, a donde estaba cuando tuvo la idea de su investigación. Ahí mismo estará su audiencia cuando empiece su presentación. Hace muchos años hubiera criticado a los expositores por no utilizar suficientes gráficas en sus presentaciones. Las gráficas eran difíciles de trazar y de mostrar, así que los presentadores cometían el error de exhibir muy pocas. En la actualidad creo que los presentadores cometen el error de incluir demasiadas. Con programas como PowerPoint, es muy fácil hacer enumeraciones de todo lo que uno quiera y ponerlas en la pantalla. ¡Es un error! Yo no llegaría a tanto como Edward Tufte, quien ha escrito artículos y libros sobre las fallas del PowerPoint, pero sí creo que esta herramienta lleva a malas prácticas de presentación.20 Muchos buenos presentadores (y maestros) cuentan historias inspiradoras. Imagínese que convierte un cuento para dormir niños en una presentación de PowerPoint. No se me ocurre ninguna manera mejor de arrancar el misterio y la emoción de la historia. En el mismo tenor, si convierte su investigación en una sucesión de frases, el público mirará un momento la pantalla y cerrará los oídos hasta que aparezca la siguiente diapositiva. Prefiero poner los puntos principales y no mostrarlos hasta que haya explicado lo que constituye 20
Para hacerse una idea de la crítica de Tufte, véase http://www.wired.com/wired/archive/11.09/ppt2.html. Para ver una presentación en PowerPoint del discurso sobre Gettysburg, conéctese a http://www.norvig.com/ gettysburg/.
13Martin268-307.indd 301
13/5/08 14:42:48
302
Capítulo trece
cada uno. Me doy cuenta de que PowerPoint es seguro, particularmente para un presentador menos experimentado: todas sus notas están en la pantalla, donde es fácil leerlas. Pero mi consejo es que resista la tentación y que mejor trate de contar una historia, utilizando muy poco PowerPoint, apenas para destacar los puntos más importantes. A juzgar por tantas horas de ver muchas presentaciones, creo que el mayor error de los presentadores es pasar de prisa por el procedimiento experimental para irse a lo más importante: los resultados. Pero si no clarifica el procedimiento, los resultados carecen de importancia. He descubierto que la mejor forma de ayudar a los escuchas a entender el procedimiento, si es posible, es transformarlos en participantes. Si en mi experimento mostré una serie de diapositivas a los participantes y luego hice que respondieran, en mi presentación les doy a los escuchas un conjunto breve de instrucciones, les muestro una serie de gráficas similares a las diapositivas y hago que respondan. Algunos ensayos representativos quitan tan poco tiempo como explicar el procedimiento en palabras, y la audiencia lo recordará mejor. Los psicólogos saben que la gente aprende mejor haciendo que de oídas. Debemos sacar ventaja de ese principio. Al presentar su ensayo, trace el panorama general. Si la gente quiere saber los detalles de su esquema de contrabalanceo, los niveles de la significancia estadística de sus pruebas u otros detalles, más tarde puede preguntar o pedir una copia del informe escrito. La mayoría de los escuchas nunca recordarán estos detalles. Por lo regular, la mejor manera de presentar los resultados es en forma gráfica, utilizando un programa de diapositivas. Si es posible, tenga una computadora en frente de usted, para ver la misma diapositiva que se proyecta sobre la pantalla que está detrás. Esta disposición le permitirá ver a la audiencia y seguir frente al micrófono al tiempo que se refiere a las características de la diapositiva. Si utiliza un apuntador, como un láser, para resaltar algo en una diapositiva, tiene que hablar con seguridad y alto cuando voltee a la pantalla. Una mejor solución es agregar el apuntador a la diapositiva utilizando un programa de computadora, para que no tenga que moverse. La posibilidad de señalar algo en la pantalla hace que prefiera las diapositivas a los folletos. No se puede señalar nada en la papelería que tiene el público en las manos. Otros problemas de los documentos son el tiempo que se necesita para repartirlos y la pérdida de control sobre la presentación cuando el escucha lee la información del documento antes de que la presente (cuando tengo un documento en la mano, dejo de prestar atención al orador y me dedico a ver los resultados), para no hablar del costo, el desorden y la destrucción de árboles. Cuando se usan diapositivas, colóquese de lado, para que no obstruya la vista de la audiencia de la pantalla. Cuando muestre una gráfica, recuerde que es la primera vez que la audiencia la ve. A veces los presentadores muestran una gráfica e inmediatamente se lanzan a las conclusiones: “Como puede ver claramente, los resultados confirmaron nuestra hipótesis.” Si estoy entre el público, me digo: “Un momento. ¿Qué hay en cada eje? ¿Es un mejor desempeño arriba o abajo de la gráfica? ¿Qué condición representa la línea negra o la línea punteada? ¿Qué es lo que la figura apoya de su hipótesis? ¿Cómo se vería la figura si la hipótesis quedara rechazada?” El público no tiene por qué hacer estas preguntas. Debe mostrar la gráfica, hacer una pausa…, explicar lo que hay en cada eje, explicar lo que repre-
13Martin268-307.indd 302
13/5/08 14:42:48
Cómo informar los resultados experimentales
303
sentan las líneas o las barras e indicar en qué parte de la figura hay que mirar para encontrar la información importante, conforme se va señalando. Por último, trace figuras grandes y con letras gruesas para que la audiencia pueda verlas desde atrás del salón. Para el informe escrito habrá que volver a dibujar las figuras, para que cumplan con estos requisitos. Antes de que se declare satisfecho con sus gráficas, trate de proyectarlas sobre una pantalla en condiciones similares a las que habrá en el salón de la presentación. Con cada diapositiva, vaya al fondo del salón y vea si distingue todos los detalles. Muchas veces, colores y contrastes que se ven bien en la pantalla de la computadora no se ven bien proyectados, lo que hace que el material se vuelva difícil de leer. Afortunadamente, con el procesador de palabras moderno se facilita la tarea mecánica de dibujar figuras. A pesar de esto, todavía me encuentro con figuras ilegibles en muchas conferencias. Al final de su presentación, conviene tener una diapositiva con las conclusiones. Es el último momento para darle al escucha un mensaje que se lleve consigo. Sea conservador. El público no recordará más de tres a cinco conclusiones. Después de las conclusiones, debe estar preparado para cerrar con decisión. “Uhm… Supongo que eso es todo lo que tenía que decir”, no es una manera impresionante de terminar la presentación; “Gracias por su atención” o “Si el tiempo lo permite, con gusto responderé sus preguntas” dará a la audiencia una señal de que ha terminado y le hace saber que planeó con sumo cuidado su presentación. Ya terminó su presentación y está listo para sentarse, recuperar su aliento y relajarse. ¡Qué alivio! Pero el presidente de su sesión dice que queda tiempo para algunas preguntas. Por supuesto, no está preparado para las preguntas, porque ya las respondió todas en su impecable presentación. Entonces, alguien del público le dice: “No entiendo cómo puede asegurar que sus resultados apoyan la teoría de Landon. ¿La teoría de la reducción propuesta por Wagner el año pasado no predice sus descubrimientos? Usted, por supuesto, nunca ha oído hablar de ese Wagner. ¿Cómo responde?” “No tengo respuestas preparadas para esa interrogante.”21 Mi punto es que debe estar preparado lo mejor que pueda para sortearlas. Estudie todas las posibles preguntas que se le ocurran y luego pídales a otros que lo interroguen. La mejor manera de prepararse para presentar un informe es ensayar la presentación frente a un grupo de colegas, quizá sus compañeros de clase u otros estudiantes o miembros académicos de su departamento. Aliéntelos a hacer preguntas difíciles. Trate de responder las preguntas que le hagan y más tarde vuelva a pensar en las preguntas, cuando tenga tiempo de preparar mejor las respuestas. Quizás algunas reaparezcan en la conferencia. Prepárese.
21
Creo que la honestidad es la mejor política en estas situaciones, aunque me ha tocado escuchar a gente que trata de mentir para salir del paso. Hay varias salidas: 1) Tenemos poco tiempo: “Quizá sea cierto, pero el tema es demasiado complejo para analizarlo aquí. ¿Por qué no me busca después?” “Ya lo he pensado, pero lo rechacé por muchas razones demasiado elaboradas para analizarlas en este momento.” “No pienso que esta teoría se aplique directamente en este caso, pero estaría encantado de analizarla con usted más tarde.” 2) Dígame más: “¿En qué sentido cree que esta teoría se aplica a mis resultados?” “¿Podría ser más específico?” “Me encantaría oír sus ideas sobre el tema.” 3) No es mi culpa: “Mi coautor estaría encantado de responder esa pregunta.”
13Martin268-307.indd 303
13/5/08 14:42:49
304
Capítulo trece
CARTELES
Ahora la mayoría de las conferencias incluyen sesiones de carteles, además de las ponencias. Imagínese un gran salón lleno de carteles alineados. La gente que presenta los carteles se para en frente de tableros de boletines y detrás de ellos se pegan los carteles en los corchos. La gente pasa, unas personas meditan en los títulos y otras hablan con los presentadores. Por lo general, en estas sesiones los presentadores tienen una hora o más para pararse delante de su cartel, explicar su investigación y examinar lo que el público quiera. La ventaja de los carteles, a diferencia del informe escrito, es que permite dialogar con personas interesadas. El formato funciona particularmente bien con las investigaciones con diseños simples y resultados directos que se dejan expresar en pocas gráficas. La desventaja es que llega una persona, le pregunta lo que hizo y después de una explicación de dos minutos aparece otra persona que pregunta lo mismo. Si comienza de nuevo, la primera persona se aburrirá. Si continúa, la segunda no lo va a entender. Esta situación se repite toda la sesión y cuando termine, quizá sienta que no tuvo la oportunidad de explicarle todo su trabajo a nadie. Esta desventaja es más grave si su investigación es demasiado compleja, sigue una metodología complicada o pretende probar teorías muy detalladas y poco conocidas. En estos casos, no hay tiempo para contar todo lo necesario para que se le haga justicia a su investigación. Como estrategia general al prepararse para las sesiones de carteles, trate de armar varias presentaciones en miniatura. En una de menos de un minuto debe sintetizar su trabajo, para beneficio de un miembro casual de la audiencia que nada más quiere una breve panorámica. Prepare otra presentación de varios minutos, para quien muestre un interés considerable en su trabajo. Debe estar preparado para analizar exhaustivamente su trabajo con los pocos investigadores que pasen y resulte que trabajan en el mismo campo de investigación. Dedique mucho empeño para que el cartel se explique por sí mismo. Cuanto mejor se explique en el cartel lo que usted hizo, más fácil será que dedique tiempo a relacionarse con su público, en lugar de repetir lo fundamental. ¿Qué debe poner en el cartel? Cuando se acepte un cartel para su presentación, le enviarán información con los detalles de la preparación. Le darán un pizarrón de corcho que mide 1.20 m por 2.40 m y tachuelas (lleve las suyas, por si acaso). Ahí montará sus materiales. Sobre todo, no lleve una sola copia de su manuscrito para pegarla en el pizarrón. La impresión es demasiado pequeña, los detalles excesivos y nadie se tomará la molestia de leerlo. Recuerde que su audiencia tiene cuando mucho unos minutos para tratar de entender qué hizo usted. Lo que quiere es transmitir toda la información posible en pocos minutos. En este caso, una imagen vale mil palabras. En la figura 13-1 se muestra la organización de un cartel. La información se pone en secciones del tamaño de hojas carta. Observe que buena parte del material son figuras. Como estrategia general, presente el mínimo texto posible. Donde tenga texto, póngalo como leyendas de las figuras. El segundo principio general es que el flujo de la informa-
13Martin268-307.indd 304
13/5/08 14:42:49
Cómo informar los resultados experimentales
305
Título Autores e institución Resumen
2 Figura
3 Figura
5 Figura
6 Figura
1.20 m 1 Figura
4
7
Tabla
Conclusiones Tabla
2.40 m
FIGURA 13-1 Arreglo de un cartel muestra. La letra del título y el autor debe ser cuando menos de 2.5 centímetros de alto, las otras de cuando menos 0.85 centímetros. La información debe fluir desde la esquina superior izquierda a la esquina inferior derecha en columnas. Maximice las gráficas. Minimice el texto.
ción inicie en la esquina superior izquierda y se mueva hacia la derecha. Sin embargo, a diferencia de un texto, no hay que componer renglones de izquierda a derecha. Las personas van a chocar si las hace caminar de un lado a otro conforme revisa las secciones. Mejor ponga la información en columnas. Numerar las secciones como se muestra en la figura es de gran ayuda, y en algunos casos sería apropiado usar flechas para guiar a la audiencia. En la parte superior del pizarrón debe haber un título y el nombre de los autores. El tamaño de la letra debe ser de cuando menos 2.5 centímetros (72 puntos). Recuerde que el cartel será visto desde una distancia de un metro o más. El título debe ser lo bastante grande para que se lea sobre la cabeza de la gente que habla con el presentador. Mucha gente que pase leerá el título, no se sentirá interesada y seguirá. Debajo de los nombres de los autores debe anotar las instituciones a las que pertenece, como universidades y facultades. El tamaño de esta letra y el resto puede ser más pequeña, pero de no menos de 0.85 centímetros (24 puntos). Las figuras, dibujos, gráficas o ilustraciones deberán ser como en las diapositivas, con líneas más gruesas. Una de las organizaciones a las que pertenezco sugiere verificar la legibilidad de los materiales con la “prueba del dedo gordo” (Sociedad de Factores Humanos y Ergonomía, 1995). Haga que un amigo o dos se paren sobre los materiales de su cartel, dispuestos en el piso. ¿Pueden leerlos? Si no es así haga que empujen el material con los pies hasta el bote de basura e inténtelo nuevamente. El resumen debe ser simple y conciso. Saque todos los detalles innecesarios. Explique los métodos de investigación con unas cuantas palabras e imágenes. Dependiendo del estu-
13Martin268-307.indd 305
13/5/08 14:42:49
306
Capítulo trece
dio, las imágenes podrían mostrar materiales de estímulo para sus diversas condiciones o quizás algunos reactivos de la encuesta o un esquema del diseño experimental. Los resultados deben ser graficados con símbolos y letras legibles. Si es posible, ponga sus resultados estadísticos en las leyendas de las figuras. En general, no ponga datos crudos ni tablas estadísticas. Por último, incluya una sección de conclusiones en la que resuma sus resultados. No anote más de cinco puntos. La audiencia no tomará notas y ve otros carteles, así que hay que destacar pocos puntos que luego recuerde. También prepare sus materiales para su audiencia. Por ejemplo, si su audiencia incluye científicos de muchos campos en lugar de sólo psicólogos, debe tener el cuidado de evitar la jerga psicológica y de relacionar las conclusiones con aplicaciones prácticas. Por razones estéticas, algunas personas utilizan papel de colores para enmarcar sus carteles, pero no exagere. Los científicos se sienten más impresionados por datos claros que con gráficas bonitas. Si es posible, las secciones pueden montarse sin más sobre uno o dos pliegos grandes que pueden enrollarse en un tubo con fines de transportación. Así no hay que preocuparse sobre cómo poner los paneles en la posición correcta ni de espaciarlos bien al inicio de la sesión, cuando ya está un poco nervioso. Por último, ¡corrija los carteles! Quizá porque las letras son tan grandes y es más difícil leerlas normalmente, los carteles tienen más errores. He visto investigadores de renombre mundial con carteles de factura profesional que, sin embargo, llevan errores que ellos tuvieron que corregir con pluma. Estos investigadores se sintieron apenados y usted también lo estará. Como en el caso de las ponencias, muestre los carteles a sus colegas. Pídales que le hagan preguntas. Cuando termine, pídales su opinión de los carteles o la presentación y sugerencias para mejorar. Por último, si es posible, saque copias del informe escrito. Muchas personas los piden. Comoquiera que presente su investigación, debe enorgullecerse al presentarla y hacer un trabajo de calidad. Recuerde que es el producto de todo el trabajo que ha realizado hasta este momento. Todo el esfuerzo podría irse al traste si su trabajo es confuso y aburrido.
■ Resumen Como la investigación no tiene sentido a menos que otros científicos la conozcan, los experimentadores deben difundir sus resultados por medio de un informe experimental de alta calidad, que debe seguir las recomendaciones del Manual de publicación de la APA. El escrito psicológico difiere de otras disciplinas, como la historia y la crítica literaria. Por ejemplo, el lenguaje es más directo, se utilizan pocas citas directas, los encabezados se utilizan de manera más liberal, las notas al pie son poco frecuentes; los desacuerdos intelectuales rara vez se vuelven personales y muchas veces las conclusiones están matizadas. El informe tiene secciones estandarizadas. Como muchos lectores decidirán leerlo a partir de su título, éste debe transmitir la suficiente información para que tomen la decisión. Los autores y la institución donde se realizó la investigación deben aparecer después del título. El resumen, una versión corta (120 palabras) del informe completo, termina los preliminares.
13Martin268-307.indd 306
13/5/08 14:42:50
Cómo informar los resultados experimentales
307
En el cuerpo del informe, en la introducción se debe revisar la suficiente bibliografía para darle al lector una idea del estado actual de los conocimientos y se debe establecer el propósito del experimento. En la sección del método se proporciona la información necesaria para replicar el experimento. En general, se divide en tres partes: participantes, que describe su tipo, número y forma de reclutamiento; equipo/materiales, en la que se da a los demás la información necesaria para pedir o construir el equipo y los materiales similares a los que se emplearon, y el procedimiento, donde se da cuenta detallada de lo que ocurrió con cada participante. En la sección de resultados se resumen los hallazgos del experimento. Esta sección incluye estadísticas descriptivas y medidas de tendencia central y dispersión, ya sea en el texto o en tablas o figuras. Por lo regular, los resultados de las pruebas estadísticas inferenciales incluyen el tamaño del efecto. En esta sección se relacionan los resultados con el conjunto de los conocimientos en la sección de discusión. El informe concluye con una lista alfabética de las referencias citadas en el informe. Para transmitir la información de la manera más eficiente posible al tiempo que se mantiene un estilo de escribir vivido, no es necesario escribir los informes experimentales en la voz pasiva de la tercera persona. Los verbos activos se consideran más adecuados y el uso ocasional de la primera persona es aceptable. Las secciones de introducción y método se escriben en tiempo pasado, mientras que el presente es apropiado para las secciones de resultados y discusión. Como el informe debe ser muy conciso, evite una escritura floja y aproveche los comentarios de otos lectores para obtener un producto de alta calidad. Ya que es importante evitar el lenguaje prejuicioso y ser preciso en los informes de investigación, se deben seguir tres directrices: llamar a la gente por lo que es; evitar los términos genéricos masculinos al referirse a ambos sexos (hombre para seres humanos, él para él o ella) y emplear participante en lugar de sujeto. Llame a la gente como quiere que la llamen; pregúnteles a sus participantes la terminología correcta de su grupo étnico. Personas es sustantivo y sus atributos son adjetivos. Las personas con discapacidades no son los discapacitados; las participantes son mujeres, no participantes femeninas. También se comunican investigaciones en las reuniones profesionales, en la forma de ponencia o cartel. Las ponencias se leen ante un grupo de 20 a 100 colegas en un lapso de 10 a 20 minutos. El contenido debe transmitirse de manera conversacional, dejando fuera muchos detalles del informe escrito. Los auxiliares visuales, como proyecciones computarizadas, deben prepararse con sumo cuidado; en particular, hay que elaborar las secciones de procedimiento y resultados pensando en el nivel del escucha. Los presentadores deben estar preparados para las preguntas que les hagan. Los carteles se presentan de una manera más interactiva. Deben tener un título y de seis a nueve secciones. Además conviene preparar presentaciones en miniatura para los colegas que circulan haciendo preguntas. El cartel debe estar diseñado con sumo cuidado, con un tamaño de letra grande, figuras legibles y sin muchos detalles. Ponencias y carteles deben ensayarse con colegas amigos antes de la conferencia.
13Martin268-307.indd 307
13/5/08 14:42:50
Epílogo No cesaremos de explorar Al final de toda nuestra exploración Llegaremos a donde empezamos Y conoceremos el lugar por primera vez T. S. ELIOT
Felicidades por haberse abierto paso a través de mis ideas sobre cómo realizar experimentos en psicología. Que mis palabras e imágenes le hayan ayudado a mantener un interés en lugar de obstaculizar su progreso. Hay un delicado equilibrio entre la informalidad y la precisión, un equilibrio que varía de un lector a otro. Espero que mi prosa no le haya resultado muy desequilibrada. Obviamente, este libro no lo ha transformado de manera instantánea en un psicólogo experimental, pero confío en que le ha dado suficiente información para que trate de realizar algunos experimentos simples por su cuenta. Encontrará que hacer experimentos es mucho más divertido que leer acerca de hacer experimentos. ¡Ahora, diviértase!
308
14Martin308epilogo.indd 308
24/4/08 13:52:30
APÉNDICE A
Cómo hacer la estadística
Si es un calculofóbico (véase el capítulo 3), este apéndice está hecho para usted. Si no sabe más que lo básico del álgebra, le vendrá bien este “recetario” simplificado de estadística. Este libro no es de estadística, y la pequeña concesión que hago en este apéndice no contradice esa declaración. Algunos maestros y estudiantes que llevan este libro sienten la necesidad de una breve introducción a la estadística descriptiva básica y las pruebas estadísticas inferenciales. Aquí le voy a decir cómo hacer algunas pruebas. No veremos los razonamientos en que se fundan las operaciones y, en general, diré poco sobre las condiciones para decidir qué hacer. He observado que escribir acerca de números confunde. En su lugar, trato de mostrar mediante ejemplos qué hacer con los números. Si organiza las cifras de sus datos como se ve en el ejemplo y sigue los mismos pasos, tendrá pocos problemas. Primero mencionaré algunas características de los números. Luego le daré un glosario breve de símbolos estadísticos. Por último, veremos ejemplos resueltos de operaciones estadísticas. Al final de cada uno le indicaré cómo se da cuenta de ese resultado en un manuscrito.
■ Características de los números Los números se usan de diversas formas. Algunos transmiten mucha información (“Faltan 28 kilómetros para llegar a la feria”) y otros muy poca (“El primer bateador es el número 28”). Con cifras son posibles algunas expresiones y operaciones estadísticas (“El teatro, que está a 14 kilómetros, se encuentra a la mitad de camino de la feria”). Estas mismas afirmaciones son absurdas en otros casos (“El segundo bateador es el número 14; así que está a la mitad del primero”). Así, antes de hacer una operación estadística con cifras, debe determinar si la operación es lógica para las cifras que maneja. ESCALA NOMINAL
Los números con que se designa algo se dice que forman una escala nominal. La única operación estadística válida que puede hacer con datos nominales es contar el número de casos: ¿Cuántos jugadores hay con el número 28? 309
15Martin309-324apen.indd 309
13/5/08 14:45:47
310
Apéndice A Escalas de intervalo o de razón
Escala ordinal
Escala nominal Moda
Mediana Media Rango Varianza Desviación estándar Coeficiente de contingencia Coeficiente de correlación de rangos ordenados de Spearman Coeficiente de correlación producto-momento de Pearson Ji cuadrada Prueba U de Mann-Whitney Prueba t Prueba de rangos con signos en pares igualados de Wilcoxon ANOVA Anova de una vía de Kruskal-Wallis por rangos FIGURA A-1
Las operaciones estadísticas y las escalas que requieren.
ESCALA ORDINAL
Los números que pueden ser ordenados, o clasificados, se dice que yacen sobre una escala ordinal. Al conductor de un auto de carreras que fue campeón el año anterior se le permitió poner en su auto el número 1. El conductor que fue segundo en las listas es el número 2 y así sucesivamente. Sabemos a partir de estos números de la escala ordinal que el conductor 1 se desempeñó mejor que el conductor 2, pero no sabemos por cuánto. Los conductores 1 y 2
15Martin309-324apen.indd 310
13/5/08 14:45:50
Cómo hacer la estadística
311
podrían haber estado separados 500 puntos, mientras que los conductores 2 y 3 pudieron haber estado separados sólo dos puntos. ESCALA DE INTERVALO
Si los intervalos entre los números son significativos, los números ocupan una escala de intervalo. Por ejemplo, la temperatura medida en grados centígrados tiene una escala de intervalo. Hay 10 °C entre 10 °C y 20 °C. También hay 10 °C entre 15 °C y 25 °C. ESCALA DE RAZÓN
Si se puede sacar el cociente de dos números y la proporción es significativa, se trata de una escala de razón. Por tanto, aunque no puede decir que una temperatura de 20 °C es el doble de caliente de 10 °C, puede decir que 20 kilómetros es el doble de lejos que 10 kilómetros. La gran diferencia entre una escala de intervalo y una de razón es que la segunda tiene un punto de cero absoluto. En la escala centígrada, los “cero grados” no tienen otro significado en particular que el hecho de que debajo de esta temperatura el agua se congela. Para cantidades tales como distancia, peso y volumen, las cero unidades es un concepto significativo. Antes de realizar una operación estadística tiene que preguntarse con qué escala trabaja. En la figura A.1 se anotan las operaciones que analizamos en este apéndice y las escalas que requieren. Las operaciones que pueden realizarse con cifras de escalas de orden inferior (como la nominal) también pueden hacerse con cifras de escalas superiores (tales como la de razón). Por este motivo, el área sombreada de la figura indica que todas las operaciones pueden realizarse con datos intervalares y de razón, pero sólo tres se usan con datos nominales.
■ Símbolos de las fórmulas estadísticas X un dato o calificación N número total de calificaciones ⌺ sumatoria de las calificaciones X2 el cuadrado de X (multiplicado por sí mismo) X3 el cubo de X (multiplicado por sí mismo dos veces) 兹苶 X raíz cuadrada de X (¿qué número multiplicado por sí mismo es igual a X?) |x| valor absoluto de X (el número sin importar su signo)
■ Estadística descriptiva MEDIDAS DE TENDENCIA CENTRAL Moda
La moda es la calificación más frecuente. Cuenta el número de veces que ocurre cada calificación y escoge la calificación que ocurre más a menudo. La moda en el ejemplo de la siguiente sección es 2 ya que el número ocurre dos veces.
15Martin309-324apen.indd 311
13/5/08 14:45:50
312
Apéndice A
Mediana
La mediana es la calificación central. Para empezar, todas las calificaciones se ordenan en sucesión. Para un número impar de calificaciones, la mediana es la que está a la mitad. Para un número par de calificaciones, la mediana está entre las dos calificaciones centrales. En el siguiente ejemplo la mediana es 2.5, ya que es la mitad de las dos calificaciones de 2 y 3. Media Media
X N
– X
M
Ejemplo X 1 2 2 3 4 5 X 17 N 6
– X
17 6
2.8
Informe en el texto. M = 2.8 MEDIDAS DE DISPERSIÓN Rango
El rango es la calificación más grande menos la menor. En el ejemplo anterior: Rango 5 1 4 Varianza Varianza
S2
– (X X)2 N
Ejemplo X 6 calificaciones de manera que N6
1 2 3 3 4 5 X 18
– X*
– XX
3 3 3 3 3 3
2 1 0 0 1 2
– (X X)2 4 1 0 0 1 4 – (X X)2 10
– 18 * Media X 3. 6
15Martin309-324apen.indd 312
13/5/08 14:45:50
Cómo hacer la estadística
– X )2
(X
10 6
N
313
1.67
Desviación estándar S2
Desviación estándar = DE En el ejemplo anterior:
– X )2
(X N
DE 兹1.67 1.29
Informe en el texto. DE 1.29 MEDIDAS DE ASOCIACIÓN Coeficiente de contingencia
El coeficiente de contingencia (C) es una medida de la fuerza de la asociación entre dos conjuntos de números cuando se toman datos nominales. Primero debe hacerse una prueba de ji cuadrada (χ2) (véase infra). Suponga que se realizó una prueba de ji cuadrada en un experimento de dos variables y que desea conocer la fuerza de la asociación entre estas dos variables nominales. También suponga que se encontró que χ2 fue 15, con un número total de observaciones de N = 100. Entonces el coeficiente de contingencia es: C
兹
2 苶苶苶 N
2
15 苶苶苵苵
兹
100 15
兹苶苵 .130 .36
Ninguna prueba adicional de la significancia estadística de la asociación es necesaria ya que la ji cuadrada fue calculada para la prueba de significancia. Informe en texto. C (N 100) .36 Coeficiente de correlación de rangos ordenados de Spearman
El coeficiente de correlación de rangos ordenados de Spearman (rho) mide la fuerza de la asociación entre dos variables ordinales. En este caso, se obtienen dos calificaciones, o rangos, para cada participante y se determina la diferencia d. Ejemplo Participante Bill Jane Bob Pete Mary
15Martin309-324apen.indd 313
Rango en la primera medición
Rango en la segunda medición
4 1 5 2 3
4 2 5 3 1
d
d2
0 1 0 1 2
0 1 0 1 4 d 2 6
N5
13/5/08 14:45:51
314
Apéndice A
rho 1
6d 2 6(6) 36 1 1 3 N N 125 5 120
1 .3 .7
Para determinar si es probable que la rho obtenida se debiera a una variación al azar en lugar de una asociación real, debemos consultar la tabla de los valores críticos para rho del apéndice B (tabla B-1). Vemos que con N = 5, rho debe ser igual a 1 para que sea significativa. En este ejemplo no es significativa. También se ve en la tabla que cuantos más sean los participantes, mejores son nuestras oportunidades de encontrar un efecto estadísticamente significativo, dado que está presente una asociación. Informe en el texto. (N 5) .70, p .05 Coeficiente de correlación producto-momento de Pearson
El coeficiente de correlación producto-momento de Pearson (r) mide la fuerza de la asociación entre dos variables de escalas de intervalo o de razón. En el siguiente ejemplo, X representa la calificación en una variable y Y la calificación en la segunda variable. Ejemplo X
X2
Y
Y2
XY
9 4 4 2 1 3 7 5 X 35
81 16 16 4 1 9 49 25 X2 201
8 4 6 4 3 2 8 5 Y 40
64 16 36 16 9 4 64 25 Y2 234
72 16 24 8 3 6 56 25 XY 210
Participante Tom Sue Jill Dave Ken Jo Juan Al
r
NXY XY NX (X) 兹苶苶苶苶苶 NY (Y) 兹苶苶苶苶苶 2
2
2
1680 1400 1872 1600 1608 1225 兹苶苶苶苶苶 兹苶苶苶苶苶
2
N8
8(210) (35)(40) 8(201) 352 兹苶苶苶苶苵 8(234) 402 兹苶苶苶苶苵 280
383 兹苶 272 兹苶
280 (19.57)(16.49)
280 .868 322.7
Para probar si una r de este tamaño es estadísticamente significativa con ocho pares de calificaciones, consulte la tabla B-2 del apéndice B, que contiene los valores críticos de r. Para utilizar esta tabla, debe determinar una cantidad llamada grados de libertad (gl). Para esta prueba, los grados de libertad son N 2. Entonces, en el ejemplo gl = 6. Debido a que la r de
15Martin309-324apen.indd 314
13/5/08 14:45:52
Cómo hacer la estadística
315
.868 excede el valor listado de .834, es estadísticamente significativa al nivel p < .01. Esto es, esperaríamos que la fuerza de esta asociación ocurra en una muestra menos de una vez en 100, en virtud de la selección aleatoria en una sola población. Informe en el texto r (6) .87, p .01
■ Pruebas de estadística inferencial JI CUADRADA
Con la prueba de ji cuadrada (χ2) se determina si la frecuencia observada en la ocurrencia de las calificaciones es estadísticamente diferente de la frecuencia esperada. Ejemplo Número de participantes que predicen cara después de una serie de cruces Observadas Esperadas OE (O E)2 (O E)2 E
Número de participantes que predicen cruz después de una serie de caras
60 50 10 100
40 50 10 100
2
2
(O E) 2 224 E
2
La frecuencia esperada puede ser la frecuencia calculada a partir de un conjunto de observaciones previas o de una predicción teórica. Por lo regular, la predicción teórica es que la frecuencia observada será la que se espera por azar. Así, en el ejemplo la expectativa es que las predicciones de los participantes no mostrarán ningún sesgo (ninguna falacia del jugador): la mitad de las veces pronosticarán cara y la mitad, cruz. El último paso al hacer una prueba estadística inferencial es comparar el resultado del cálculo con una tabla de valores críticos. En el apéndice B (tabla B-3) se encuentran valores de ji cuadrada. Para encontrar el número apropiado en la tabla, debe primero determinar el número de grados de libertad de la siguiente manera: gl el número de O E que se considera, menos 1, lo cual en este caso es igual a 211
En la tabla encontramos que con 1 grado de libertad, la ji cuadrada debe ser mayor a 3.84 para que sea significativa en el nivel de significancia p < .05. Por tanto, los datos de nuestro ejemplo son estadísticamente diferentes del azar en el nivel .05. Si hubiéramos probado en
15Martin309-324apen.indd 315
13/5/08 14:45:52
316
Apéndice A
el nivel p .01, la ji cuadrada de 4 no habría excedido 6.64, y la prueba no hubiera alcanzado un nivel de significancia. Informe en la prueba. 2 (1, N 100) 4.00, p .05 PRUEBA t PARA MEDIDAS NO CORRELACIONADAS
Hay dos formas de la prueba t, una para las medidas no correlacionadas y la otra para las medidas correlacionadas. La prueba t para las medidas no correlacionadas determina la probabilidad de que una diferencia observada entre dos grupos independientes de participantes ocurriera al azar. Se supone que las distribuciones son normales. Ejemplo
X1 9 8 7 7 4 X1 35
– X1
Grupo 1 – X1 X 1
7 7 7 7 7
2 1 0 0 3
– (X1 X1)2 4 1 0 0 9 – (X1 X1)2 14
N1 5 M1 X1 1
兹
X2 5 4 3 2 1 X2 15
X1 35 7 N1 5
(X1 X1)2 苶苶苶苶苵 N1
– X2 3 3 3 3 3
兹
14 苶 5
兹苶 2.8 1.67
Grupo 2 – X2 X 2 2 1 0 1 2
– (X2 X2)2 4 1 0 1 4 – (X2 X2)2 10
N2 5
15Martin309-324apen.indd 316
13/5/08 14:45:53
Cómo hacer la estadística
M2 5 X2 5 s2 5 t5
5
SX2 15 53 5 N2 5
S(X2 2 X2)2 苶苶苶苶苵
兹
317
5
N2 M1 2 M2
兹
10 苶 5
5 兹苵 2 5 1.41
s2 s1 苶苶苶苶苵苶苶苶苶苵 1 兹N 苶苵苵苵 兹N 苶苵苵苵 121 221
兹(
) ( 4
1.67 1.41 苶苶苶苶苵苶
兹( ) ( ) 2
2
1
5
723 1.67 2 1.41 2 苶苶苶苶苵苶苶苶 1 21 21 兹5苵苵苵苵 兹5苵苵苵苵
) 兹( 2
2
2
5
4
.697 1 .497 兹苵苵苵苵苵苶
) (
5
4 1.194 兹苵苵苵苵
)
5
4 5 3.67 1.09
2
Los grados de libertad de una prueba t no correlacionada son: gl N1 N2 2
5528 La tabla B-4 del apéndice B indica que, con 8 gl, t debe ser de más de 3.355 para la que la diferencia sea significativa al nivel p < .01. Por tanto, nuestro valor de 3.67 es significativo en ese nivel. Informe en el texto. t (8) 3.67, p .01 PRUEBA t PARA MEDIDAS CORRELACIONADAS
La prueba t para medidas correlacionadas determina la probabilidad de que la diferencia observada (D) entre dos condiciones para los mismos participantes o participantes igualados ocurra por azar. XD t D
N
1
Ejemplo – – Participante Condición 1 Condición 2 Diferencia (D) XD* XD X D 1 2 3 4 5 N5
9 8 7 8 8 X1 40
6 5 5 4 5 X2 25
3 3 2 4 3 D 15
3 3 3 3 3
0 0 1 1 0
– (XD XD)2 0 0 1 1 0 – (XD XD)2 2
D 15 – *MD XD 3 N 5
15Martin309-324apen.indd 317
13/5/08 14:45:53
318
Apéndice A
D
(XD XD)2 苶苶苶苶苵
兹
t
N XD D
N1 兹苵苵苵苵
3 .632
苵2
兹
5
兹苵 .4 .632
51 兹苵苵苵苵
3 3 9.49 .632 .316 2
Los grados de libertad para las medidas correlacionadas son: gl N – 1 5 – 1 4
La tabla B-4 sirve para cualquier forma de la prueba t. En este ejemplo, t debe exceder 4.604 para que sea significativa en el nivel p .01, y tal es lo que ocurre. Informe en el texto. t (4) 9.49, p .01 PRUEBA U DE MANN-WHITNEY
La prueba U de Mann-Whitney se utiliza en las mismas condiciones generales que la prueba t no correlacionada, pero sólo cuando no se pueden cumplir las premisas de las distribuciones normales o de una escala de intervalo. U N1N2
U N1N2
N1(N1 1) R1 2 o N2(N2 1) R2 2
}
lo que sea menor
donde N1 el número de participantes en el grupo menor N2 el número de participantes en el grupo mayor R1 la suma de los rangos del grupo menor R2 la suma de los rangos del grupo mayor Ejemplo Grupo 1
N1 10
Grupo 2
X1
Rango
X2
1 3 3 5 6 8 9 9 10 12
1 3.5 3.5 6 7 9.5 11.5 11.5 13.5 15 R1 82
2 4 7 8 10 13 15 16 17 18
N2 10
Rango 2 5 8 9.5 13.5 16 17 18 19 20 R2 128
Nota: Los rangos fueron determinados ordenando todas las calificaciones independientemente del grupo del que vinieran. Cuando hubo empates en los rangos, se sacó el promedio.
15Martin309-324apen.indd 318
13/5/08 14:45:54
Cómo hacer la estadística
U N1N2 100
319
N1(N1 1) 10(10 1) R1 (10)(10) 82 2 2
110 82 73 2 o
U (10)(10)
10(10 1) 128 27 2
Debido a que 27 es menor, U = 27. En el apéndice B se dan dos tablas para determinar los valores críticos de U (tablas B-5 y B-6). Si deseáramos probar la significancia en el nivel p < .05, tendríamos que utilizar la tabla B.5. El valor de U cuando N1 = 10 y N2 = 10 es 23. Para que sea significativo, debe ser igual o menor que este valor crítico. Debido a que 27 no lo es, no es estadísticamente significativo a este nivel. Observe que la prueba U de Mann-Whitney es diferente de otras pruebas, ya que a fin de que sea significativo el valor, debe ser menor en lugar de mayor que el valor en la tabla. Para encontrar una tabla para los valores de N1 menores a 7, consulte un manual más avanzado. Para los valores de N2 mayores a 20, U debe convertirse a una calificación z utilizando la siguiente fórmula: U z
N1N2 2
(N 苶苶苶苶苵苶苶苶苶 1)(N2)(N1 N2 1)
兹
12
Entonces, la calificación z se compara con los valores críticos anotados en la tabla B-7 del apéndice B.
Informe en el texto. U (N1 10, N2 10) 27, p .05 PRUEBA DE RANGOS CON SIGNOS EN PARES IGUALADOS DE WILCOXON La prueba de rangos con signos en pares igualados de Wilcoxon sirve para determinar la probabilidad de que una diferencia observada (D) entre dos condiciones para los mismos participantes o participantes igualados ocurriera al azar. Difiere de la prueba t para las medidas correlacionadas en que puede ser utilizada con datos ordinales y las distribuciones básicas no necesitan ser normales.
T R T 冷 R冷
}
lo que sea menor
donde
R es un rango que tiene una diferencia positiva R es un rango que tiene una diferencia negativa
15Martin309-324apen.indd 319
13/5/08 14:45:54
320
Apéndice A
Ejemplo Rango de D Rango con D Par Condición 1 Condición 2 Diferencia (D) ignorando el signo positiva 1 2 3 4 5 6 7 8 9 10
54 47 39 42 51 46 42 54 42 47
50 32 33 45 38 39 44 46 39 33
4 15 6 3 13 7 2 8 3 14
3 9 4 2.5 7 5 1 6 2.5 8
Rango con D negativa
3 9 4 2.5 7 5 1 6 2.5 8 R 45.5 冷 R冷 3.5
El menor de 45.5 y 3.5 es 3.5; por tanto:
T 冷 R冷 3.5 Para probar la significancia estadística, consulte la tabla B-8 del apéndice B. Para alcanzar la significancia, T debe ser igual o menor que el número listado. En el ejemplo, hay 10 pares de calificaciones, de manera que n = 10, y asumiendo que no predijimos la dirección de la diferencia entre las condiciones, es conveniente realizar una prueba de dos colas. Vemos, entonces, que 3.5 es menor que 5 pero no que 3, de manera que p < .02. Informe en el texto. T (n 10) 3.50, p .02 ANÁLISIS DE VARIANZA
El análisis de varianza (ANOVA) se utiliza para datos de intervalo o de razón cuando las distribuciones se aproximan a la normal. Hay pruebas ANOVA para diseños intrasujeto (mediciones repetitivas) o entre sujetos (grupos separados) y para los diseños con múltiples variables independientes. Sin embargo, en este apéndice limitaremos nuestra consideración al diseño entre sujetos con una variable independiente. En el siguiente ejemplo, la variable independiente tiene tres niveles. Sin embargo, las fórmulas dadas también pueden ser utilizadas para diseños que tengan más de tres grupos. Aunque los cálculos del ANOVA parecen complicados, la argumentación de la prueba es simple. Supongamos que realiza un experimento en el que reunió datos de tres grupos. La pregunta experimental es si las tres muestras vienen de la misma población y si difieren sólo por una variación al azar o si las muestras vienen de diferentes poblaciones y difieren debido a la propiedad de la variable independiente y también a la variación al alzar. El ANOVA permite dividir la varianza encontrada en la distribución que contienen todas las calificaciones de la muestra. Parte de la varianza de esta distribución se debe a diferencias entre los grupos, incluyendo la varianza debida a la variable independiente. La segunda parte se debe a la variación aleatoria entre los participantes dentro de los grupos.
15Martin309-324apen.indd 320
13/5/08 14:45:55
Cómo hacer la estadística
321
El número calculado con el ANOVA se llama valor F. Es el cociente de la varianza entre grupos y la varianza dentro de los grupos. Si los grupos muestreados vienen de la misma población y la variable independiente no tiene efecto, podríamos esperar que el cociente se acerque a 1. Esto es, la varianza entre grupos debería ser de aproximadamente el mismo tamaño que la varianza dentro de los grupos. Sin embargo, si la variable independiente tiene un efecto y los grupos vienen de poblaciones diferentes, esperaríamos que la varianza entre grupos fuera más grande que la varianza dentro del grupo. El valor F sería mayor que 1. A medida que el valor de F es más grande, estaríamos más seguros de que las diferencias entre los grupos se debieron a los efectos de la variable independiente en lugar de a la variación aleatoria. En el siguiente ejemplo, primero calculamos una cantidad llamada suma total de los cuadrados (SCTOT) seguida por la suma de los cuadrados entre los grupos (SCeg) y dentro de los grupos (SCdg). Entonces dividimos SCeg y SCdg entre sus grados de libertad para obtener la media de los cuadrados entre los grupos (MCeg) y dentro de los grupos (MCdg). MCeg se divide entre MCdg para encontrar el valor de F. Está en posición de seguir el ejemplo, pero si se mete en problemas, las siguientes definiciones le pueden ayudar: T = la suma total de las calificaciones de todos los grupos Tj = la suma total de las calificaciones del grupo j N = el número de las calificaciones en todos los grupos nj = el número de las calificaciones en el grupo j k
significa la suma de todos los grupos de 1 a k j1 k = el número de los grupos Ejemplo Grupo 1
Grupo 2
Grupo 3
X1
X12
X2
X 22
X3
3 5 4 3 1 2 5 2 3 1 T1 29 n1 10
9 25 16 9 1 4 25 4 9 1 103
9 6 5 8 7 7 6 4 8 7 T2 67 n2 10
81 36 25 64 49 49 36 16 64 49 469
10 8 11 10 9 10 11 12 10 9 T3 100 n3 10
X 32 100 64 121 100 81 100 121 144 100 81 1012
N 10 10 10 30 T 29 67 100 196 k3
15Martin309-324apen.indd 321
13/5/08 14:45:55
322
Apéndice A
T2 (196)2 (103 469 1012) N 30 38416 1584 1584 1281 303 30 k T2 T2 292 672 1002 (196)2 j SCeg j1 nj N 10 10 10 30 841 4489 10 000 1281 10 10 10 84.1 448.9 1000 1281 1533 1281 252 SCdg SCTOT SCeg 303 252 51 gleg k 1 3 1 2 gldg N k 30 3 27 SCeg 252 126 MCeg gleg 2 SCdg 51 MCdg 1.89 gldg 27 MCeg 126 F 66.7 MCdg 1.89
SCTOT X2
Ahora comparamos este número con los valores críticos de F anotados en la tabla B-9 del apéndice B. Con 2 gl en el numerador y 27 gl en el denominador, F debe ser igual o mayor que 3.38 para ser significativo en p < .05 e igual o mayor que 5.57 para que sea significativo en p < .01. Debido a que 66.7 excede por mucho estos valores críticos, la diferencia entre los grupos es muy significativa. Observe que la prueba podría alcanzar la significancia estadística debido a una diferencia entre dos grupos cualesquiera. Para determinar qué medias son estadísticamente diferentes entre sí, se necesitaría hacer más pruebas. Estas pruebas rebasan el alcance de este libro. Pueden consultarse en los textos recomendados al final del capítulo 12. Informe en el texto. F (2, 27) 66.70, p .05 ANOVA DE UNA VÍA DE KRUSKAL-WALLIS POR RANGOS
Si no se pueden cumplir las premisas de una escala de intervalo o de razón, o si no se producen las distribuciones normales, se puede aplicar la ANOVA de una vía de KruskalWallis por rangos para probar las diferencias entre dos o más grupos independientes. Sólo se necesita una escala ordinal. En el siguiente ejemplo: K = número de grupos nj = número de calificaciones por grupo N = número total de calificaciones Rj = la suma de los rangos para el grupo j t = número de empates por cada calificación
15Martin309-324apen.indd 322
13/5/08 14:45:56
Cómo hacer la estadística
323
Ejemplo Grupo 2
Grupo 1
Grupo 3
X1
Rango
X2
Rango
X3
Rango
8 4 7 5 7
15 5.5 13 8.5 13 R1 55.0
2 5 2 3 1
2.5 8.5 2.5 4 1 R2 18.5
6 5 4 5 7
11 8.5 5.5 8.5 13 R3 46.5
K3 nj 5 N 15
Ordene todas las calificaciones para obtener los rangos de cada grupo. Calificación
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
1 2 2 3 4 4 5 5 5 5 6 7 7 7 8
t
Promedio de empates
Rango
1
}
2.5
}
5.5
2
}
8.5
4
}
13
2
4
11 3
15
Ahora coloque los rangos de la tabla después de las calificaciones individuales de cada grupo de la tabla anterior y súmelos para obtener R1, R2 y R3. H
12 N(N 1)
Rj2 3(N 1) j1 nj k
冤
冥
12 (55)2 (18.5)2 (46.5)2 3(15 1) 15(15 1) 5 5 5
12 3025 342.25 2162.25 3(16) 15(16) 5 5 5
冤
冤
冥
冥
12 5529.5 48 240 5 .05(1105.9) 48 55.295 48 7.295
15Martin309-324apen.indd 323
13/5/08 14:45:56
324
Apéndice A
La corrección para los empates se hace dividiendo H por 1 1
(t3 N3
t) . N
(23 2) (23 2) (43 4) (33 3) 153 15
(8 2) (8 2) (64 4) (27 3) 3375 15 96 1 1 .029 .971 3360 7.295 H 7.51 .971 1
De acuerdo con la tabla B-10 del apéndice B, para los tamaños de grupo de 5, 5 y 5, la probabilidad de tener una H tan grande como 7.51 es menor que .049. Por tanto, la diferencia entre los grupos es estadísticamente significativa en el nivel p .05. Debido a que este valor es menor que el 7.98 requerido para el nivel p .01, la diferencia no es significativa a ese nivel. Si los grupos incluyen más de cinco participantes, H se distribuye como ji cuadrada. Para determinar el valor crítico en este caso, es necesario consultar la tabla B.3 con k 1 grados de libertad. Informe en el texto. H (5, 5, 5) 7.51, p .05
■ Conclusión Con este apéndice debe estar en posibilidad de calcular algunas operaciones estadísticas básicas. Pero si va a seguir más que un curso básico de experimentación, tendrá que hacer por lo menos otras tres cosas. En primer lugar, tiene que aprender a utilizar pruebas más complejas para diseños que tengan múltiples variables independientes y mezclas de variables intrasujeto y entre sujetos. En segundo lugar, necesita aprender a utilizar programas de cómputo para ahorrar tiempo y esfuerzo. Tercero, y quizá lo más importante, necesita saber más estadística de la que hay en un recetario. Como investigador debe entender por qué hace lo que hace. Entender los conceptos que fundamentan las operaciones estadísticas no sólo permite escoger la herramienta más potente para analizar sus datos, sino también diseñar la investigación de manera que se analicen mejor los datos. Los expertos en estadística cuentan historias de terror acerca de investigadores inexpertos que les ponen volúmenes de datos sobre el escritorio y preguntan cómo se analizan. Llega a haber casos en que los datos no admiten ningún análisis. Lo esencial es que el diseño y el análisis estadístico estén vinculados. Si piensa diseñar su propia investigación, tiene que entender los conceptos básicos de las operaciones estadísticas que va a aplicar para analizar los resultados.
15Martin309-324apen.indd 324
13/5/08 14:45:56
APÉNDICE B
Tablas estadísticas
TABLA B-1 Valores críticos de rho (coeficiente de correlación de rangos ordenados de Spearman) N
p = .0500
p = .0100
5 6 7 8 9
1.000 .886 .786 .738 .683
— 1.000 .929 .881 .833
10 12 14 16 18
.648 .591 .544 .506 .475
.794 .777 .715 .665 .625
20 22 24 26 28
.450 .428 .409 .392 .377
.591 .562 .537 .515 .496
30
.364
.478
fuente: Calculado por Old, E. G., Distribución de la suma de los cuadrados de las diferencias de rangos para números pequeños de individuos, Annals of Mathematical Statistics, 1938, 9, 133-148 y el 5% de niveles de significancia para la suma de los cuadrados de las diferencias de rango y una corrección, Annals of Mathematical Statistics, 1949, 20, 117-118. La tabla B-1 se tomó de Elementary Statistics, Underwood et al., Appleton-Century-Crofts.
325
16Martin325-336apen.indd 325
12/5/08 21:55:00
326
Apéndice B
TABLA B-2 Valores críticos de r (coeficiente de correlación producto-momento de Pearson) Niveles de significancia para la prueba de dos colas .10
.05
.01
1 2 3 4 5
.988 .900 .805 .729 .669
.997 .950 .878 .811 .754
.9999 .990 .959 .917 .874
6 7 8 9 10
.622 .582 .549 .521 .497
.707 .666 .632 .602 .576
.834 .798 .765 .735 .708
11 12 13 14 15
.476 .458 .441 .426 .412
.553 .532 .514 .497 .482
.684 .661 .641 .623 .606
16 17 18 19 20
.400 .389 .378 .369 .360
.468 .456 .444 .433 .423
.590 .575 .561 .549 .537
25 30 35 40 45
.323 .296 .275 .257 .243
.381 .349 .325 .304 .288
.487 .449 .418 .393 .372
50 60 70 80 90 100
.231 .211 .195 .183 .173 .164
.273 .250 .232 .217 .205 .195
.354 .325 .303 .283 .267 .254
gl
fuente: Adaptado de Fisher, R. A., Statistical Methods for Research Workers, 14a. ed. Derechos reservados 1973, Hafner Press.
16Martin325-336apen.indd 326
12/5/08 21:55:01
Tablas estadísticas
327
TABLA B-5 Valores críticos de la prueba U de Mann-Whitney al nivel p < .05 N1 N2
7
8
9
10
11
12
13
14
15
16
17
18
19
20
3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1 3 5 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34
2 4 6 8 10 13 15 17 19 22 24 26 29 31 34 36 38 41
2 4 7 10 12 15 17 20 23 26 28 31 34 37 39 42 45 48
3 5 8 11 14 17 20 23 26 29 33 36 39 42 45 48 52 55
3 6 9 13 16 19 23 26 30 33 37 40 44 47 51 55 58 62
4 7 11 14 18 22 26 29 33 37 41 45 49 53 57 61 65 69
4 8 12 16 20 24 28 33 37 41 45 50 54 59 63 67 72 76
5 9 13 17 22 26 31 36 40 45 50 55 59 64 67 74 78 83
5 10 14 19 24 29 34 39 44 49 54 59 64 70 75 80 85 90
6 11 15 21 26 31 37 42 47 53 59 64 70 75 81 86 92 98
6 11 17 22 28 34 39 45 51 57 63 67 75 81 87 93 99 105
7 12 18 24 30 36 42 48 55 61 67 74 80 86 93 99 106 112
7 13 19 25 32 38 45 52 58 65 72 78 85 92 99 106 113 119
8 13 20 27 34 41 48 55 62 69 76 83 90 98 105 112 119 127
fuente: Adaptado y abreviado de las tablas 1, 3, 5 y 7 de Auble, D., “Extended tables for the Mann-Whitney statistics”, Bulletin of the Institute of Educational Research at Indiana University, 1953, 1(2).
16Martin325-336apen.indd 327
12/5/08 21:55:01
328
Apéndice B
TABLA B-6 Valores críticos de la prueba U de Mann-Whitney al nivel p < .01 N1 N2
7
8
9
10
11
12
13
14
15
16
17
18
19
20
3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
— 0 1 3 4 6 7 9 10 12 13 15 16 18 19 21 22 24
— 1 2 4 6 7 9 11 13 15 17 18 20 22 24 26 28 30
0 1 3 5 7 9 11 13 16 18 20 22 24 27 29 31 33 36
0 2 4 6 9 11 13 16 18 21 24 26 29 31 34 37 39 42
0 2 5 7 10 13 16 18 21 24 27 30 33 36 39 42 45 48
1 3 6 9 12 15 18 21 24 27 31 34 37 41 44 47 51 54
1 3 7 10 13 17 20 24 27 31 34 38 42 45 49 53 56 60
1 4 7 11 15 18 22 26 30 34 38 42 46 50 54 58 63 67
2 5 8 12 16 20 24 29 33 37 42 46 51 55 60 64 69 73
2 5 9 13 18 22 27 31 36 41 45 50 55 60 65 70 74 79
2 6 10 15 19 24 29 34 39 44 49 54 60 65 70 75 81 86
2 6 11 16 21 26 31 37 42 47 53 58 64 70 75 81 87 92
3 7 12 17 22 28 33 39 45 51 56 63 69 74 81 87 93 99
3 8 13 18 24 30 36 42 48 54 60 67 73 79 86 92 99 105
fuente: Adaptado y abreviado de las tablas 1, 3, 5 y 7 de Auble, D., “Extended tables for the Mann-Whitney statistics”, Bulletin of the Institute of Educational Research at Indiana University, 1953, 1(2).
16Martin325-336apen.indd 328
12/5/08 21:55:01
Tablas estadísticas
329
TABLA B-8 Valores críticos de T Wilcoxon Nivel de significancia para una prueba de una cola
Nivel de significancia para una prueba de una cola .05
.025
.01
.05
.005
.025
.01
.005
Nivel de significancia para una prueba de dos colas
Nivel de significancia para una prueba de dos colas n
.10
.05
.02
.01
n
.10
.05
.02
.01
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
0 2 3 5 8 10 13 17 21 25 30 35 41 47 53 60 67 75 83 91 100 110 119
— 0 2 3 5 8 10 13 17 21 25 29 34 40 46 52 58 65 73 81 89 98 107
— — 0 1 3 5 7 9 12 15 19 23 27 32 37 43 49 55 62 69 76 84 92
— — — 0 1 3 5 7 9 12 15 19 23 27 32 37 42 48 54 61 68 75 83
28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
130 140 151 163 175 187 200 213 227 241 256 271 286 302 319 336 353 371 389 407 426 446 466
116 126 137 147 159 170 182 195 208 221 235 249 264 279 294 310 327 343 361 378 396 415 434
101 110 120 130 140 151 162 173 185 198 211 224 238 252 266 281 296 312 328 345 362 379 397
91 100 109 118 128 138 148 159 171 182 194 207 220 233 247 261 276 291 307 322 339 355 373
nota: La T es la más pequeña de la suma de los rangos que tienen diferencias que son todas del mismo signo. Para un número dado de diferencias n, la T es significativa a un nivel en particular si es igual o menor que el valor mostrado. fuente: De Roger E. Kirk, Elementary Statistics, 2a. ed., Pacific Grove, CA: Brooks/Cole, 1984.
16Martin325-336apen.indd 329
12/5/08 21:55:02
330
Apéndice B
TABLA B-9 Valores críticos de F Grados de libertad para el denominador 1
2
3
4
5
6
8
12
24
∞
Grados de libertad para el denominador
1 161.45 199.50 215.72 224.57 230.17 233.97 238.89 243.91 249.04 254.32 4032.10 4999.03 5403.49 5625.14 5764.08 5859.39 5981.34 6105.83 6234.16 6366.48 2
18.51 98.49
19.00 99.01
19.16 99.17
19.25 99.25
19.30 99.30
19.33 99.33
19.37 99.36
19.41 99.42
19.45 99.46
19.50 99.50
3
10.13 34.12
9.55 30.81
9.28 29.46
9.12 28.71
9.01 28.24
8.94 27.91
8.84 27.49
8.74 27.05
8.64 26.60
8.53 26.12
4
7.71 21.20
6.94 18.00
6.59 16.69
6.39 15.98
6.26 15.52
6.16 15.21
6.04 14.80
5.91 14.37
5.77 13.93
5.63 13.46
5
6.61 16.26
5.79 13.27
5.41 12.06
5.19 11.39
5.05 10.97
4.95 10.67
4.82 10.27
4.68 9.89
4.53 9.47
4.36 9.02
6
5.99 13.74
5.14 10.92
4.76 9.78
4.53 9.15
4.39 8.75
4.28 8.47
4.15 8.10
4.00 7.72
3.84 7.31
3.67 6.88
7
5.59 12.25
4.74 9.55
4.35 8.45
4.12 7.85
3.97 7.46
3.87 7.19
3.73 6.84
3.57 6.47
3.41 6.07
3.23 5.65
8
5.32 11.26
4.46 8.65
4.07 7.59
3.84 7.01
3.69 6.63
3.58 6.37
3.44 6.03
3.28 5.67
3.12 5.28
2.93 4.86
9
5.12 10.56
4.26 8.02
3.86 6.99
3.63 6.42
3.48 6.06
3.37 5.80
3.23 5.47
3.07 5.11
2.90 4.73
2.71 4.31
10
4.96 10.04
4.10 7.56
3.71 6.55
3.48 5.99
3.33 5.64
3.22 5.39
3.07 5.06
2.91 4.71
2.74 4.33
2.54 3.91
11
4.84 9.65
3.98 7.20
3.59 6.22
3.36 5.67
3.20 5.32
3.09 5.07
2.95 4.74
2.79 4.40
2.61 4.02
2.40 3.60
12
4.75 9.33
3.88 6.93
3.49 5.93
3.26 5.41
3.11 5.06
3.00 4.82
2.85 4.50
2.69 4.16
2.50 3.78
2.30 3.36
14
4.60 8.86
3.74 6.51
3.34 5.56
3.11 5.03
2.96 4.69
2.85 4.46
2.70 4.14
2.53 3.80
2.35 3.43
2.13 3.00
16
4.49 8.53
3.63 6.23
3.24 5.29
3.01 4.77
2.85 4.44
2.74 4.20
2.59 3.89
2.42 3.55
2.24 3.18
2.01 2.75
18
4.41 8.28
3.55 6.01
3.16 5.09
2.93 4.58
2.77 4.25
2.66 4.01
2.51 3.71
2.34 3.37
2.15 3.01
1.92 2.57
20
4.35 8.10
3.49 5.85
3.10 4.94
2.87 4.43
2.71 4.10
2.60 3.87
2.45 3.56
2.28 3.23
2.08 2.86
1.84 2.42
25
4.24 7.77
3.38 5.57
2.99 4.68
2.76 4.18
2.60 3.86
2.49 3.63
2.34 3.32
2.16 2.99
1.96 2.62
1.71 2.17
30
4.17 7.56
3.32 5.39
2.92 4.51
2.69 4.02
2.53 3.70
2.42 3.47
2.27 3.17
2.09 2.84
1.89 2.47
1.62 2.01 (continúa)
16Martin325-336apen.indd 330
12/5/08 21:55:02
Tablas estadísticas
331
TABLA B-9 (continuación)
Grados de libertad para el denominador
Grados de libertad para el numerador 1
2
3
4
5
6
8
12
24
∞
40
4.08 7.31
3.23 5.18
2.84 4.31
2.61 3.83
2.45 3.51
2.34 3.29
2.18 2.99
2.00 2.66
1.79 2.29
1.52 1.82
50
4.03 7.17
3.18 5.06
2.79 4.20
2.56 3.72
2.40 3.41
2.29 3.19
2.13 2.89
1.95 2.56
1.74 2.18
1.44 1.68
60
4.00 7.08
3.15 4.98
2.76 4.13
2.52 3.65
2.37 3.34
2.25 3.12
2.10 2.82
1.92 2.50
1.70 2.12
1.39 1.60
70
3.98 7.01
3.13 4.92
2.74 4.07
2.50 3.60
2.35 3.29
2.23 3.07
2.07 2.78
1.89 2.45
1.67 2.07
1.35 1.53
80
3.96 6.98
3.11 4.88
2.72 4.04
2.49 3.56
2.33 3.26
2.21 3.04
2.06 2.74
1.88 2.42
1.65 2.03
1.31 1.47
90
3.95 6.92
3.10 4.85
2.71 4.01
2.47 3.53
2.32 3.23
2.20 3.01
2.04 2.72
1.86 2.39
1.64 2.00
1.28 1.43
100
3.94 6.90
3.09 4.82
2.70 3.98
2.46 3.51
2.30 3.21
2.19 2.99
2.03 2.69
1.85 2.37
1.63 1.98
1.26 1.39
200
3.89 6.97
3.04 4.71
2.65 3.88
2.42 3.41
2.26 3.11
2.14 2.89
1.98 2.60
1.80 2.28
1.57 1.88
1.14 1.21
∞
3.84 6.64
2.99 4.60
2.60 3.78
2.37 3.32
2.21 3.02
2.09 2.80
1.94 2.51
1.75 2.18
1.52 1.79
nota: El número superior de cada celda es para probar a un nivel de .05; el número inferior es para probar a un nivel de .01. fuente: Adaptado de la tabla F de Garrett, H. E., Statistics in Psychology and Education, 5a. ed. Derechos reservados 1958, David McKay Co., Inc.
16Martin325-336apen.indd 331
12/5/08 21:55:02
332
Apéndice B
TABLA B-10 Valores críticos de H (ANOVA de una vía de Kruskal-Wallis por rangos)
n1
Tamaños de la muestra n2 n3
H
p
2
1
1
2.7000
.500
2
2
1
3.6000
.200
2
2
2
4.5714 3.7143
.067 .200
3
1
1
3.2000
.300
3
2
1
4.2857 3.8571
.100 .133
3
2
2
5.3572 4.7143 4.5000 4.4643
.029 .048 .067 .105
3
3
1
5.1429 4.5714 4.0000
.043 .100 .129
3
3
2
6.2500 5.3611 5.1389 4.5556 4.2500
.011 .032 .061 .100 .121
7.2000 6.4889 5.6889 5.6000 5.0667 4.6222
.004 .011 .029 .050 .086 .100
3
3
3
4
1
1
3.5714
.200
4
2
1
4.8214 4.5000 4.0179
.057 .076 .114
4
2
2
6.0000 5.3333 5.1250 4.4583 4.1667
.014 .033 .052 .100 .105
4
3
1
5.8333 5.2083 5.0000 4.0556 3.8889
.021 .050 .057 .093 .129
Tamaños de la muestra n1 n3 n2
p
H
4
3
2
6.4444 6.3000 5.4444 5.4000 4.5111 4.4444
.008 .011 .046 .051 .098 .102
4
3
3
6.7455 6.7091 5.7909 5.7273 4.7091 4.7000
.010 .013 .046 .050 .092 .101
4
4
1
6.6667 6.1667 4.9667 4.8667 4.1667 4.0667
.010 .022 .048 .054 .082 .102
4
4
2
7.0364 6.8727 5.4545 5.2364 4.5545 4.4455
.006 .011 .046 .052 .098 .103
4
4
3
7.1439 7.1364 5.5985 5.5758 4.5455 4.4773
.010 .011 .049 .051 .099 .102
4
4
4
7.6538 7.5385 5.6923 5.6538 4.6539 4.5001
.008 .011 .049 .054 .097 .104
5
1
1
3.8571
.143
5
2
1
5.2500 5.0000 4.4500 4.2000 4.0500
.036 .048 .071 .095 .119
(continúa)
16Martin325-336apen.indd 332
12/5/08 21:55:03
Tablas estadísticas
333
TABLA B-10 (continuación)
n1
Tamaños de la muestra n2 n3
H
p
Tamaños de la muestra n1 n3 n2
H
p
5
2
2
6.5333 6.1333 5.1600 5.0400 4.3733 4.2933
.008 .013 .034 .056 .090 .122
5
4
4
7.7604 7.7440 5.6571 5.6176 4.6187 4.5527
.009 .011 .049 .050 .100 .102
5
3
1
6.4000 4.9600 4.8711 4.0178 3.8400
.012 .048 .052 .095 .123
5
5
1
5
3
2
6.9091 6.8218 5.2509 5.1055 4.6509 4.4945
.009 .010 .049 .052 .091 .101
7.3091 6.8364 5.1273 4.9091 4.1091 4.0364
.009 .011 .046 .053 .086 .105
5
5
2
7.0788 6.9818 5.6485 5.5152 4.5333 4.4121
.009 .011 .049 .051 .097 .109
7.3385 7.2692 5.3385 5.2462 4.6231 4.5077
.010 .010 .047 .051 .097 .100
5
5
3
6.9545 6.8400 4.9855 4.8600 3.9873 3.9600
.008 .011 .044 .056 .098 .102
7.5780 7.5429 5.7055 5.6264 4.5451 4.5363
.010 .010 .046 .051 .100 .102
5
5
4
7.2045 7.1182 5.2727 5.2682 4.5409 4.5182
.009 .010 .049 .050 .098 .101
7.8229 7.7914 5.6657 5.6429 4.5229 4.5200
.010 .010 .049 .050 .099 .101
5
5
5
7.4449 7.3949 5.6564 5.6308 4.5487 4.5231
.010 .011 .049 .050 .099 .103
8.0000 7.9800 5.7800 5.6600 4.5600 4.5000
.009 .010 .049 .051 .100 .102
5
5
5
5
3
4
4
4
3
1
2
3
fuente: Adaptado y abreviado de Kruskal, W. H. y Wallis, W. A., “Use of ranks in one-criterion variance analysis”, Journal of American Statistical Association, 1952, 47, 614-617, con el amable permiso de los autores y el editor. (Se han incorporado las correcciones de esta tabla hechas por los autores en la fe de erratas, Journal of the American Statistical Association, 1953, 48, 910.)
16Martin325-336apen.indd 333
12/5/08 21:55:03
334
Apéndice B
16Martin325-336apen.indd 334
12/5/08 21:55:03
Tablas estadísticas
16Martin325-336apen.indd 335
335
12/5/08 21:55:04
336
Apéndice B
16Martin325-336apen.indd 336
12/5/08 21:55:04
APÉNDICE C
Tabla de números aleatorios
Col. (1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
(13)
(14)
Línea 1 2 3 4 5
10480 22368 24130 42167 37570
15011 46573 48360 93093 39975
01536 25595 22527 06243 81837
02011 85393 97265 61680 16656
81647 30995 76393 07856 06121
91646 89198 64809 16376 91782
69179 27982 15179 39440 60468
14194 53402 24830 53537 81305
62590 93965 49340 71341 49684
36207 34095 32081 57004 60672
20969 52666 30680 00849 14110
99570 19174 19655 74917 06927
91291 39615 63348 97758 01263
90700 99505 58629 16379 54613
6 7 8 9 10
77921 99562 96301 89579 85475
06907 72905 91977 14342 36857
11008 56420 05463 63661 43342
42751 69994 07972 10281 53988
27756 98872 18876 17453 53060
53498 31016 20922 18103 59533
18602 71194 94595 57740 38867
70659 18738 56869 84378 62300
90655 44013 69014 25331 08158
15053 48840 60045 12566 17983
21916 63213 18425 58678 16439
81825 21069 84903 44947 11458
44394 10634 42508 05585 18593
42880 12952 32307 56941 64952
11 12 13 14 15
28918 63553 09429 10365 07119
69578 40961 93969 61129 97336
88231 48235 52636 87529 71048
33276 03427 92737 85689 08178
70997 49626 88974 48237 77233
79936 69445 33488 52267 13916
56865 18663 36320 67689 47564
05859 72695 17617 93394 81056
90106 52180 30015 01511 97735
31595 20847 08272 26358 85977
01547 12234 84115 85104 29372
85590 90511 27156 20285 74461
91610 33703 30613 29975 28551
78188 90322 74952 89868 90707
16 17 18 19 20
51085 02368 01011 52162 07056
12765 21382 54092 53916 97628
51821 52404 33362 46369 33787
51259 60268 94904 58586 09998
77452 89368 31273 23216 42698
16308 19885 04146 14513 06691
60756 55322 18594 83149 76988
92144 44819 29852 98736 13602
49442 01188 71585 23495 51851
53900 65255 85030 64350 46104
70960 64835 51132 94738 88916
63990 44919 01915 17752 19509
75601 05944 92747 35156 25625
40719 55157 64951 35749 58104
21 22 23 24 25
48663 54164 32639 29334 02488
91245 58492 32363 27001 33062
85828 22421 05597 87637 28834
14346 74103 24200 87308 07351
09172 47070 13363 58731 19731
30168 25306 38005 00256 92420
90229 76468 94342 45834 60952
04734 26384 28728 15398 61280
59193 58151 35806 46557 50001
22178 06646 06912 41135 67658
30421 21524 17012 10367 32586
61666 15227 64161 07684 86679
99904 96909 18296 36188 50720
32812 44592 22851 18510 94953
26 27 28 29 30
81525 29676 00742 05366 91921
72295 20591 57392 04213 26418
04839 68086 39064 25669 64117
96423 26432 66432 26422 94305
24878 46901 84673 44407 26766
82651 20849 40027 44048 25940
66566 89768 32832 37937 39972
14778 81536 61362 63904 22209
76797 86645 98947 45766 71500
14780 12659 96067 66134 64568
13300 92259 64760 75470 91402
87074 57102 64584 66520 42416
79666 80428 96096 34693 07844
95725 25280 98253 90449 69618
31 32 33 34 35
00582 00725 69011 25976 09763
04711 69884 65797 57948 83473
87917 62797 95876 29888 73577
77341 56170 55293 88604 12908
42206 86324 18988 67917 30883
35126 88072 27354 48708 18317
74087 76222 26575 18912 28290
99547 36086 08625 82271 35797
81817 84637 40801 65424 05998
42607 93161 59920 69774 41688
43808 76038 29841 33611 34952
76655 65855 80150 54262 37888
62028 77919 12777 85963 38917
76630 88006 48501 03547 88050
(continúa)
337
17Martin337-338apen.indd 337
28/4/08 10:57:30
338
Apéndice C
Tabla de números aleatorios (continuación) 36 37 38 39 40
91567 17955 46503 92157 14577
42595 56349 18584 89634 62765
27958 90999 18845 94824 35605
30134 49127 49618 78171 81263
04024 20044 02304 84610 39667
86385 59931 51038 82834 47358
29880 06115 20655 09922 56873
99730 20542 58727 25417 56307
55536 18059 28168 44137 61607
84855 02008 15475 48413 49518
29080 73708 56942 25555 89656
09250 83317 53389 21246 20103
79656 36103 20562 35509 77490
73211 42791 87338 20468 18062
41 42 43 44 45
98427 34914 70060 53976 76072
07523 63976 28277 54914 29515
33362 88720 39475 06990 40980
64270 82765 46473 67245 07391
01638 34476 23219 68350 58745
92477 17032 53416 82948 25774
66969 87589 94970 11398 22987
98420 40836 25832 42878 80059
04880 32427 69975 80287 39911
45585 70002 94884 88267 96189
46565 70663 19661 47363 41151
04102 88863 72828 46634 14222
46880 77775 00102 06541 60697
45709 69348 66794 97809 59583
46 47 48 49 50
90725 64364 08962 95012 15664
52210 67412 00358 68379 10493
83974 33339 31662 93526 20492
29992 31926 25388 70765 38391
65831 14883 61642 10593 91132
38857 24413 34072 04542 21999
50490 59744 81249 76463 59516
83765 92351 35648 54328 81652
55657 97473 56891 02349 27195
14361 89286 69352 17247 48223
31720 35931 48373 28865 46751
57375 04110 45578 14777 22923
56228 23726 78547 62730 32261
41546 51900 81788 92277 85653
fuente: Table of 105,000 Random Decimal Digits, Statement núm. 4914, Archivo núm. 261-A-1. Interstate Commerce Commission, Washington, DC, mayo de 1949.
17Martin337-338apen.indd 338
28/4/08 10:57:31
GLOSARIO
abscisa Eje horizontal (véase eje de las x) de una gráfica, sobre el cual se representan los niveles de la variable independiente. aleatorización Método de selección que opera al azar, de manera que cada elemento tiene las mismas posibilidades de ser seleccionado. aleatorización en bloques Método de selección en el que las condiciones se asignan al azar a los ensayos con la restricción de que cada condición ocurra igual número de veces en cada bloque de ensayos. aleatorización restringida Método de selección en el que los elementos se escogen al azar dentro de los límites de alguna regla o reglas de selección (por ejemplo, se escogen las condiciones al azar, con la restricción de que estén representadas igual número de veces). análisis de varianza Prueba paramétrica de la inferencia estadística utilizada para analizar los datos de un experimento factorial o de una sola variable con niveles múltiples. ANOVA de una vía de Kruskal-Wallis por rangos Prueba estadística inferencial apropiada para datos ordinales para establecer diferencias entre dos o más grupos independientes. aplicación de la prueba como una amenaza a la validez interna Cambio en la variable dependiente debido a la exposición previa de los participantes al instrumento o situación de prueba.
aplicación grupal de encuestas Acopio de datos de encuestas aplicadas al mismo tiempo a un grupo de entrevistados. asignación aleatoria Colocación de los participantes seleccionados de una población en los grupos experimentales según un proceso aleatorio. asíntota Línea imaginaria a la que se aproxima una función de aceleración negativa conforme se aplana. búsqueda bibliográfica Examen del conjunto de conocimientos formales de material escrito pertinente para un campo particular de investigación. características de la demanda Atributos de un experimento que llevan al participante a comportarse de cierta manera, de ordinario para respaldar la hipótesis experimental, independientemente de los niveles de la variable independiente. coeficiente de contingencia Medición de la fuerza de la asociación entre los conjuntos de números de escala nominal. coeficiente de correlación Número entre ⫹1.0 y ⫺1.0 que expresa la fuerza y dirección de la relación entre dos variables. coeficiente de correlación de rangos ordenados de Spearman Estadística para medir la fuerza de la asociación entre dos variables de una escala ordinal. coeficiente de correlación productomomento de Pearson Estadística empleada para medir la fuerza de la asociación entre dos variables de escalas de intervalo o de razón. 339
18Martin339-350glosario.indd 339
12/5/08 21:59:21
340
Glosario
coeficiente de determinación Estadística calculada elevando al cuadrado el coeficiente de correlación que especifica la proporción de la variación explicada. confiabilidad Grado en que la medición puede repetirse. confiabilidad de división por mitades Medio para determinar la confiabilidad de una prueba: la prueba única se divide estadísticamente en mitades y se correlacionan sus calificaciones. confiabilidad de formas alternativas Medio para determinar la confiabilidad de la prueba. Al mismo grupo se le aplica una segunda prueba con reactivos similares a los de la primera, y se calcula un coeficiente de correlación entre las dos calificaciones. confiabilidad test-retest Medio de determinar la confiabilidad de la prueba volviéndola a aplicar al mismo grupo y calculando el coeficiente de correlación de los dos conjuntos de calificaciones. consentimiento informado Procedimiento para certificar que los participantes de la investigación recibieron toda la información importante acerca del estudio y que estén formalmente de acuerdo en participar. contrabalanceo Manera de ordenar la presentación de los niveles de una variable independiente para minimizar o eliminar los efectos de las variables de confusión secuenciales. contrabalanceo ABBA Técnica para minimizar el efecto de una variable lineal de confusión en un experimento que tiene una variable independiente con dos niveles, A y B. El nivel A se presenta primero, seguido por dos presentaciones del nivel B y una presentación final de A. contrabalanceo completo Diseño experimental en el que el orden de los niveles de la variable independiente es tal, que todos
18Martin339-350glosario.indd 340
se presentan el mismo número de veces a los participantes de cada nivel de la variable independiente y siguen a otros niveles el mismo número de veces. contrabalanceo parcial Manera de ordenar la presentación de los niveles de la variable independiente para minimizar algunos efectos de las variables de confusión secuenciales. cornisa Primeras palabras del título del manuscrito, colocadas en la parte superior de cada página. correlación Relación entre dos variables que tiene una dirección y fuerza particular. cuadrado latino Tipo de contrabalanceo que asegura que cada nivel de la variable independiente aparezca con la misma frecuencia en toda posición ordenada. cuestionario Encuesta escrita que se aplica a individuos o en grupos. deducción Medio de alcanzar una conclusión lógica a partir de un conjunto de premisas; esta conclusión no contiene más información que las premisas tomadas colectivamente (por ejemplo, A es a B; B es a C; por tanto, A es a C). definición operacional Definición de un concepto al especificar la operación requerida para manipular o medir el concepto. desviación estándar Medida de la dispersión de una distribución de frecuencias en la que cada calificación se resta de la media, se eleva al cuadrado y se suma. A continuación, la suma se divide entre el número de calificaciones y se saca la raíz cuadrada. diagrama de dispersión Medio para graficar puntos de datos en el que la posición de cada punto está determinada por su valor con respecto a las variables de cada eje. diseño de grupo control no equivalente Diseño cuasiexperimental que utiliza un grupo control constituido de manera diferente que el grupo experimental.
12/5/08 21:59:22
Glosario
diseño de grupos igualados Método de asignación de participantes en diseños entre sujetos, en el que primero se forman grupos igualados en una variable que está muy correlacionada con la variable dependiente. A continuación, los participantes de cada conjunto son entonces asignados al azar a los grupos. diseño de grupos separados (Véase diseño entre sujetos.) Diseño experimental en el que cada grupo es expuesto a un solo nivel de una variable independiente. diseño de línea base con N pequeña (Véase experimento de línea base.) Tipo de experimento de una sola variable que revela los efectos de utilizar los datos de un número pequeño de participantes. Se establece un estado estable en la línea base de respuestas, a continuación se realiza la manipulación experimental y se establece un estado de transición. Por último, se quita la manipulación y se recupera la línea base. diseño de mediciones repetidas (Véase diseño intrasujeto) Diseño experimental en el que el mismo grupo de participantes es expuesto a todos los niveles de la variable independiente (o variables). diseño de series convergentes Secuencia de experimentos realizados para eliminar progresivamente hipótesis teóricas contradictorias. diseño de series de tiempo interrumpidas Diseño cuasiexperimental en el que se observa un solo grupo repetidas veces antes y después de la manipulación experimental. diseño de tratamiento por sujeto Véase Diseño intrasujeto. diseño de un grupo con pretest y postest Diseño no experimental en el que se pone a prueba un solo grupo: se expone a un solo nivel de una variable independiente y vuelve a probarse.
18Martin339-350glosario.indd 341
341
diseño de un grupo sólo con postest Diseño no experimental en el que un solo grupo es expuesto a un solo nivel de una variable independiente. diseño entre sujetos Estrategia de investigación experimental en la que cada participante aporta datos para un solo nivel de la variable independiente (o variables). diseño factorial Diseño experimental que tiene más de una variable independiente, en el cual todo nivel de cada variable independiente se combina con los otros niveles. diseño factorial mixto Diseño factorial que tiene cuando menos una variable independiente intrasujeto y una entre sujetos. diseño intrasujeto Diseño experimental en el que cada participante es expuesto a todos los niveles de la variable independiente (o variables). diseño no experimental Diseño de investigación que no se resguarda de las amenazas a la validez interna, a diferencia de los diseños experimentales o cuasiexperimentales. Por esta razón, los resultados de tal investigación son difíciles de defender. diseño sólo con postest con grupos no equivalentes Diseño no experimental en el que un grupo es expuesto a un nivel de la variable independiente y el segundo, en virtud de un mecanismo de selección diferente, queda expuesto a otro nivel. diseños cualitativos Diseños de investigación que utilizan datos descriptivos, como descripciones escritas de gente (incluyendo opiniones y actitudes) y de eventos y ambientes. diseños cuantitativos Diseños de investigación en los que los eventos se cuantifican para que los datos finales sean numéricos (por ejemplo, un experimento).
12/5/08 21:59:22
342
Glosario
diseños cuasiexperimentales Diseños de investigación que no satisfacen los requisitos de aleatorización del participante, pero en los que se pueden valorar muchas amenazas a la validez interna. distribución bimodal Distribución de frecuencias que tiene dos crestas, cada una con un valor máximo. distribución de frecuencias Gráfica del número de calificaciones que ocurren en cada valor o en uno o más rangos de valores. distribución normal Distribución de frecuencias, definida por una función matemática particular que tiene forma de campana, es unimodal, es simétrica y la media, mediana y moda son iguales. distribución sesgada Una distribución asimétrica cuya cola se extiende más lejos en una dirección que la otra. distribución truncada Limitación del rango de una variable que da por resultado una distribución limitada de las frecuencias (por ejemplo, el efecto del techo o piso). efecto de acarreo Efecto del diseño intrasujeto, en el cual una exposición previa a un nivel distinto de la variable independiente influye en un cambio en el comportamiento. efecto de piso Truncamiento de los datos en la parte inferior de la distribución debido a un límite sobre la calificación más baja posible. efecto de techo Truncamiento de los datos en la parte superior de la distribución debido a un límite en la calificación más alta posible. efecto del contexto Influencia de la exposición de los participantes a los niveles de las variables (las que traen consigo al experimento y las que desarrollan durante el experimento) sobre su comportamiento. efecto del orden En un diseño intrasujeto, el hecho de que un comportamiento medido
18Martin339-350glosario.indd 342
dependa del orden de presentación de los niveles de la variable independiente. efecto del rango En diseños intrasujeto en los cuales los estímulos o respuestas se disponen en un orden congruente, tendencia a que ocurra el mejor desempeño en las posiciones medias, debido a una transferencia importante del aprendizaje. efecto Hawthorne Cambio en el comportamiento debido simplemente a la atención que presta el experimentador a los participantes en lugar de a los efectos de la variable independiente. efecto principal En un diseño factorial, relación entre los niveles de una variable independiente y una variable dependiente que se promedian entre los niveles de otra variable independiente. eje de las x (véase abscisa). Eje horizontal de una gráfica, sobre el que se representan los niveles de una variable independiente. eje de las y (véase ordenada). Eje vertical de una gráfica, sobre el que se representan los niveles de una variable dependiente. encuesta Acopio de datos mediante preguntas a la gente acerca de sus opiniones o comportamientos. encuesta por correo Encuesta que se envía por correo. encuesta por internet Encuesta aplicada electrónicamente a través de internet. encuesta telefónica Encuesta realizada por teléfono. engaño Ocultar a los participantes o disfrazar el propósito real de un experimento. entrevista Acopio estructurado o no estructurado de datos en una encuesta realizada en persona entre el entrevistador y el entrevistado. error tipo I Rechazar la hipótesis nula cuando es verdadera. error tipo II No rechazar la hipótesis nula cuando es falsa.
12/5/08 21:59:22
Glosario
escala de intervalo Medidas en las que el intervalo entre los números es una unidad constante; 1 = n ⫺ (n ⫺ 1) (por ejemplo, la temperatura medida en grados). escala de calificación Técnica de respuesta en la que el encuestado da una respuesta graduada con la que indica su valoración personal (por ejemplo, desde muy de acuerdo hasta muy en desacuerdo). escala Likert Escala de calificación para investigar las actitudes de los encuestados hacia diversos temas, quienes indican el grado en que están de acuerdo con una afirmación. escala nominal Escala de medición sin propiedades cuantitativas, en la que los números son nombres (por ejemplo, un corredor con el número 342 en su camiseta). escala ordinal Escala de medición en la que el orden de los números es significativo pero los intervalos o razones entre los números no lo son (por ejemplo, 9 es mayor que 8). escala de razón Escala de medición en la que las razones de los números son significativas (por ejemplo, cuatro centímetros es el doble de largo de dos centímetros). estadística descriptiva Método para reducir los datos de manera que sólo se describen ciertas propiedades (por ejemplo, la tendencia central o la dispersión de una distribución). estadística inferencial Prueba estadística que permite inferir la probabilidad de que un resultado observado se deba únicamente al azar. estado estable Al inicio de un experimento de línea base, tasa de respuestas que muestra muy poco cambio. estado estable de transición Tasa de respuestas que muestra muy poca variación una vez que se inició la manipulación
18Martin339-350glosario.indd 343
343
experimental en un experimento de línea base. etnografía Diseño de investigación cualitativa que describe detalladamente una cultura. experimento ciego Experimento en el que los participantes no están enterados de los niveles de la variable independiente a la que los exponen. experimento de línea base Tipo de experimento de una sola variable que muestra efectos con datos de un solo participante. Se establece una tasa estable de línea base, a continuación se realiza una manipulación experimental y se establece un estado de transición. Por último, se retira la manipulación y se recupera la línea base. experimento doble ciego Experimento en el que ni el participante ni el experimentador conocen el nivel de la variable independiente que se presenta. experimento funcional Experimento que tiene tres o más niveles de una variable independiente, tales que se puede determinar una relación funcional entre las variables independiente y dependiente. experimento piloto Experimento a pequeña escala que podría no satisfacer todos los requisitos de la experimentación. Se realiza con el propósito de probar con antelación los niveles y procedimientos que se utilizarán en el experimento final. factores Variables independientes cuyos niveles se combinan en un experimento factorial. fuente secundaria Investigación publicada y citada en el manuscrito que no fue leído, pero la información se derivó de una fuente principal que sí fue leída. función Recta o curva que ilustra la relación de una variable con otra. función acelerada negativamente Función en la que la tasa de incremento o decremento de una variable disminuye
12/5/08 21:59:22
344
Glosario
conforme una segunda variable se incrementa. Se caracteriza por una pendiente inicial pronunciada que progresivamente se aplana. función acelerada positivamente Función en la que la tasa de incremento o decremento de una variable crece al tiempo que lo hace una segunda variable. Se caracteriza por una pendiente inicial plana que se vuelve muy pronunciada. función curvilínea Función que inicia como recta y cuyos componentes, mediante fórmulas matemáticas, se adaptan a las curvas. función lineal Función que forma una recta. función monotónica Función que crece o disminuye a lo largo de su rango. función negativa Relación en la que el incremento en los valores de una variable se asocia con la disminución de los valores de una segunda variable. función no monotónica Función que cambia de pendiente negativa a positiva o viceversa en al menos un lugar. función positiva Relación en la que el incremento en los valores de una variable se asocia con el incremento en los valores de una segunda variable. gráfica de barras Medio para ilustrar la frecuencia de datos cualitativos utilizando barras verticales espaciadas. Los intervalos cualitativos se grafican sobre la abscisa, la frecuencia se representa en la ordenada y la altura de cada barra simboliza la frecuencia de cada clase. gráfica lineal Medio para ilustrar la relación de dos variables mediante una línea continua o curva. grupo control Participantes de un diseño entre sujetos que son tratados como los del grupo experimental (o grupos), salvo que no son expuestos a la manipulación experimental.
18Martin339-350glosario.indd 344
grupo control no experimental Grupo de participantes reunidos para evaluar las características de la demanda de un experimento. Los participantes no son expuestos a los niveles de la variable independiente, sino que se le informa de las condiciones experimentales y se les pregunta cómo responderían. grupo control simulado Participantes a los que se pide que simulen que fueron expuestos a una manipulación experimental y que simulen también el comportamiento esperado, con el fin de evaluar las características de la demanda de un experimento. grupo experimental Participantes de un experimento entre sujetos expuestos a la condición de tratamiento. hipótesis Afirmación acerca de una relación pronosticada entre dos o más variables. hipótesis direccional Pronóstico tentativo de que los niveles de una variable independiente ocasionarán un cambio en la variable dependiente en una dirección particular. hipótesis no direccional Predicción tentativa de que los niveles de una variable independiente causarán un cambio en la variable dependiente, sin pronosticar la dirección de ese cambio. hipótesis nula Afirmación requerida por la prueba estadística de la hipótesis nula que indica que los niveles de la variable independiente no tienen efecto en la población, así que cualquier diferencia en las muestras se debe al azar. histograma Medio para ilustrar la frecuencia de datos cuantitativos mediante barras verticales contiguas. Los intervalos cuantitativos se grafican sobre la abscisa, al tiempo que la frecuencia se representa sobre la ordenada. La frecuencia de cada clase está representada por la altura de la barra.
12/5/08 21:59:23
Glosario
historia como amenaza a la validez interna Cambio en la variable dependiente debido a la ocurrencia de un suceso entre la prueba de los niveles de la variable independiente. historia de caso Medio no experimental de recolectar los datos que contiene una relación detallada del comportamiento de una sola persona o evento. incidente crítico En la investigación aplicada, caso único que se considera que es indicador de una relación posible ente las variables independiente y dependiente. inducción Proceso lógico mediante el cual la conclusión incluye más información que las observaciones sobre las cuales se basa. interacción cruzada Interacción a partir de los resultados de un experimento factorial en el que las líneas graficadas representan las variables independientes que se cruzan entre sí. interacción de dos vías En un experimento factorial, la naturaleza del efecto principal de un factor depende del nivel de un segundo factor. interacción de tres vías Interacción de orden superior que ocurre cuando la naturaleza de cada una de las interacciones de dos vías depende del nivel del tercer factor con el que ocurre. interacción en un diseño factorial Efecto sobre una variable dependiente de la combinación simple de múltiples variables independientes. interacciones con selección Amenaza a la validez interna causada por la maduración o la historia en interacción con la amenaza de la selección. investigación aplicada Investigación que tiene como propósito principal la solución de un problema específico. investigación básica Estudio dirigido a entender los mecanismos básicos de la ciencia. Aunque puede llevar a la solución
18Martin339-350glosario.indd 345
345
de problemas aplicados, la meta es acumular conocimientos. investigación de archivos Tipo de estudio en el que se examinan, organizan e interpretan registros públicos o privados. investigación pura (Véase investigación básica.) Investigación dirigida a entender los mecanismos básicos de la ciencia. Aunque tal investigación puede aportar soluciones a problemas aplicados, la meta es acumular conocimientos. junta institucional de revisión Comité de una institución constituido para verificar que todas las investigaciones se apeguen a los criterios de la ética. maduración como una amenaza a la validez interna Cambio en la variable dependiente debido a que los participantes se hacen mayores o a que ganan experiencia entre las aplicaciones de los niveles de la variable independiente. maquinación de los resultados Fraude científico en el que se fabrican datos falsos. media Medida de tendencia central de una distribución. Para calcularla, se suman todas las calificaciones y se divide el total entre el número de calificaciones. media del tamaño del efecto del tratamiento Estadística para representar el tamaño del efecto de la manipulación experimental sobre el comportamiento. Para calcularla, se resta la media del grupo control de la media del grupo de tratamiento y se divide entre la desviación estándar del grupo control. mediana Medida de tendencia central de una distribución. Para calcularla, se ordenan todas las calificaciones y se toma la calificación de la mitad. metaanálisis Técnica para calcular el tamaño acumulado de un efecto experimental en varios experimentos. método experimental Técnica de investigación en la cual se manipula la variable
12/5/08 21:59:23
346
Glosario
independiente y se mide una variable dependiente. Permite realizar una inferencia causal. Cualquier cambio en la variable dependiente fue causado por la manipulación de la variable independiente. metodología de la superficie de respuesta Técnica empleada para calcular los efectos de una combinación de muchas variables independientes, sin tener que conducir un experimento factorial completo en el que se reúnan todos los niveles de las variables. metodología de la tarea doble Método para inferir indirectamente los requisitos de procesamiento de la tarea midiendo el desempeño en una segunda tarea realizada al mismo tiempo. moda Medida de tendencia central de una distribución que es la calificación más frecuente. mortalidad como amenaza a la validez interna Diferencia en la variable dependiente debida a un desgaste dispar entre los grupos expuestos a niveles distintos de la variable independiente. muestra aleatoria Grupo tomado de una población mediante un proceso aleatorio. muestreo estratificado Proceso de tomar una muestra de una población, tal que represente convenientemente a sus grupos o estratos (como niveles de ingreso o grupos étnicos). nivel de significancia Probabilidad estadística requerida por los científicos para decir que es improbable que una característica observada de una muestra se deba al azar, en lugar de ser un elemento cierto de la población. De ordinario, esta probabilidad es de p < .05 o p < .01. observación correlacional Diseño de investigación en el que el investigador trata de determinar si dos o más variables están relacionadas, sin tratar.
18Martin339-350glosario.indd 346
observación naturalista Tipo de investigación en la que el comportamiento se estudia en su contexto natural. ordenada Eje vertical (véase eje de las y) de una gráfica, en el que por lo común se representan los niveles de la variable dependiente. participantes Seres humanos cuyo comportamiento estudia el investigador (anteriormente recibían el nombre de sujetos). placebo En una investigación sobre fármacos, sustancia inerte administrada de la misma manera que la sustancia activa. A veces el placebo causa un cambio en el comportamiento, aun sin actividad fisiológica. plagio Presentación de las palabras o ideas de otra persona sin la atribución adecuada. ponencia Presentación oral de un proyecto de investigación a un grupo de investigadores reunidos para compartir los resultados de sus investigaciones. porcentaje de ahorro Variable dependiente compuesta, en la que el número de ensayos para aprender de nuevo una tarea se resta del número de ensayos requeridos originalmente para aprender la tarea; el resultado se divide entre el número de ensayos que fueron necesarios originalmente para aprender y se multiplica por 100 para determinar el porcentaje de ensayos ahorrados debido al aprendizaje previo de la tarea. potencia (estadística) Probabilidad de rechazar la hipótesis nula cuando es falsa. pregunta abierta Pregunta de encuesta en que los encuestados frasean libremente sus respuestas. pregunta cerrada Pregunta de una encuesta que requiere que los encuestados respondan de acuerdo con una estructura fija.
12/5/08 21:59:23
Glosario
pregunta de opción múltiple Pregunta redactada de modo que las alternativas de respuesta están restringidas. pregunta inmediata Preguntas científicas que indagan la forma en que opera un comportamiento, no su explicación. preguntas primordiales Preguntas científicas sobre por qué ocurre un comportamiento. presentación en carteles Presentación de un proyecto de investigación en una serie de paneles sucesivos que lo representan. pretest sustituto Prueba cuyos resultados se correlacionan con los resultados del postest. Se utiliza en diseños cuasiexperimentales que tienen grupos no equivalentes, con el propósito de demostrar su equivalencia parcial. problema de direccionalidad No saber cuál de las variables fue la causa y cuál el efecto a partir de una observación correlacional. problema de la tercera variable Dada una observación correlacional, no saber si un cambio en la primera variable causó un cambio en la segunda o si una tercera variable causó un cambio en ambas. prueba de ji cuadrada Prueba no paramétrica de inferencia estadística con que se determina si la frecuencia observada en las puntuaciones es estadísticamente diferente de la frecuencia esperada. prueba de rangos con signos en pares igualados de Wilcoxon Prueba estadística inferencial apropiada para datos ordinales y para determinar la probabilidad de que ocurriera al azar una diferencia observada entre condiciones de los mismos participantes o de los participantes igualados. prueba no paramétrica Prueba de inferencia estadística que no requiere ninguna premisa acerca de las distribuciones de la
18Martin339-350glosario.indd 347
347
población general, como el hecho de que están distribuidas normalmente. prueba paramétrica Prueba de la inferencia estadística en la que se hacen suposiciones acerca de las distribuciones de la población general, usualmente, que están distribuidas de manera normal. prueba t Prueba paramétrica de la inferencia estadística para determinar la probabilidad de que se haya debido al azar una diferencia observada entre las muestras de datos que representan dos niveles de una variable independiente. prueba U de Mann-Whitney Prueba no paramétrica de la inferencia estadística que prueba la diferencia entre grupos utilizando información de rangos ordenados. psicohistoria Biografías psicológicas, usualmente de individuos conocidos, que examinan los sucesos cruciales de su existencia para tratar de explicar pautas de conducta. PsycARTICLES Servicio por suscripción de la Asociación Psicológica Estadounidense (American Psychological Association, APA) que brinda acceso a todos los artículos de las publicaciones de la APA. PsycINFO Servicio por suscripción de la Asociación Psicológica Estadounidense para buscar resúmenes de investigaciones psicológicas. publicación electrónica Difusión pública de información electrónica, como en internet, en lugar de imprimirla en papel. rango Diferencia entre el menor y mayor valor de un conjunto de números. regresión estadística como una amenaza a la validez interna Movimiento de las calificaciones extremas de los participantes hacia la media del grupo durante la repetición de una prueba. resumen Síntesis (no más de 960 caracteres) de un informe de investigación.
12/5/08 21:59:23
348
Glosario
reversibilidad En un experimento de línea base, recuperación del estado estable original de la tasa de respuestas, después de suspender la manipulación experimental. selección aleatoria Aplicación de un proceso aleatorio para escoger una muestra de elementos o personas de una población. selección como amenaza a la validez interna Diferencia en la variable dependiente debida a alguna diferencia en la composición de los grupos participantes expuestos a niveles distintos de la variable independiente. sesgo por falta de respuesta Distorsión de los resultados de una encuesta debido a la tasa diferencial de respuesta de los grupos. significancia estadística Se dice que un resultado es estadísticamente significativo si se alcanza la probabilidad estadística requerida por los científicos para afirmar que es improbable que una característica observada de la muestra se debe al azar, más que ser verdadera de la población general. Esta probabilidad es por lo regular de p <.05 o p < .01. teoría Afirmación acerca de las relaciones posibles entre un conjunto abstracto de variables. teoría analógica Teoría que explica la operación de las relaciones psicológicas mediante una analogía con un modelo físico. teoría cuantitativa Teoría que establece relaciones en términos matemáticos. teoría descriptiva Teoría que asigna nombres a los eventos sin explicar necesariamente por qué o cómo ocurrieron. tiempo de reacción de la elección Tiempo necesario para dar una de varias respuestas a uno de varios estímulos. transferencia no diferencial (Véase transferencia simétrica.) En un experimento en el que los dos niveles de la variable indepen-
18Martin339-350glosario.indd 348
diente son A y B, el efecto en la conducta de que B siga a A es el mismo que si A sigue a B. transferencia simétrica En un experimento en el que los dos niveles de la variable independiente son A y B, el efecto en la conducta de hacer que B siga a A es igual que hacer que A siga a B. tratamiento Aplicación de una manipulación experimental por parte del experimentador, usualmente como contraste de la condición de control. validez Grado al que algo (un dispositivo de medición, un concepto) corresponde a una norma. validez aparente Forma más débil de establecer la validez de una prueba. Se examina la prueba para determinar si, en la superficie, da la impresión de que mide efectivamente lo que debe medir. validez concurrente Medio de establecer la validez de una prueba determinando si predice algún criterio específico cuando se realizan al mismo tiempo la prueba y las mediciones del criterio. validez de contenido Medio para establecer la validez de una prueba mediante el análisis cuidadoso del tema que se supone que se cubre en la prueba, la cual entonces se prepara de modo que incluya un conjunto representativo de reactivos. validez de la conclusión estadística Grado al que una relación estadísticamente significativa entre las variables independiente y dependiente indica que hay una relación real. validez externa Capacidad de generalizar un resultado experimental a una población, situación o escenario real, diferente del representado en el experimento. validez interna Certidumbre en la afirmación de que la manipulación de la variable independiente lo que causó el cambio en la variable dependiente.
12/5/08 21:59:24
Glosario
validez predictiva Medio de establecer la validez de la prueba determinando si predice algún criterio específico. variable aleatoria Circunstancia en un experimento cuyo nivel se determina al azar, en lugar de que lo controle el experimentador. variable de confusión Variable cuyos niveles se correlacionan con los niveles de la variable independiente, de manera que cualquier cambio en el comportamiento podría deberse ya sea a los niveles de la variable independiente o a los de la variable de confusión. variable de control Circunstancia del experimento que el experimentador establece en un nivel particular e impide que varíe. variable dependiente Comportamiento que el experimentador mide; este comporta-
18Martin339-350glosario.indd 349
349
miento puede depender de los niveles de la variable independiente. variable dependiente compuesta Medición del comportamiento que combina los resultados de diversas variables dependientes en una medición de todo el desempeño. variable independiente Circunstancia en la que el experimentador manipula dos o más niveles para observar los efectos sobre la variable dependiente. varianza Medición de la dispersión de una distribución de frecuencias en la que cada calificación se resta de la media, se eleva al cuadrado y se suma. A continuación, la suma se divide entre el número de calificaciones.
12/5/08 21:59:24
18Martin339-350glosario.indd 350
12/5/08 21:59:24
BIBLIOGRAFÍA
AAU statement on preventing and probing research fraud. (1983). Chronicle of Higher Education, 26, 8. Adair, J. G. (1973). The human subject. Boston: Little, Brown. Adair, J. G. y Epstein, J. (1968). Verbal cues in the mediation of experimenter bias. Psychological Reports, 22, 1045–1053. Adams, J. A. (1972). Research and the future of engineering psychology. American Psychologist, 27, 615–622. Aldridge, J. W. (1978). Levels of processing in speech perception. Journal of-Experimental Psychology: Human Perception and Performance, 4, 164–177. American Medical Association. (Abril de 1989). AMA surveys of physician and public opinion on health care issues: 1989. Chicago: Author. American Psychological Association. (1997). Animal rights activity increases: Threats made against behavioral scientists. Science Agenda, 10, 1, 4. American Psychological Association. (2001). Publication manual of the American Psychological Association (5a. ed.). Washington, D.C.: Author. American Psychological Association. (2002). Mastering APA style: Instructor’s resource guide. Washington, D.C.: Author. American Psychological Association. (2002). Mastering APA style: Student’s workbook and training guide. Washington, D.C.: Author. American Psychological Association. (2002). Ethical principles of psychologists and code
of conduct. American Psychologist, 57, 1060– 1073. American Psychological Association. (2005). Concise rules of APA style. Washington, D.C.: Author. American Psychological Association. (2007). Guidelines for ethical conduct in the care and use of animals. Consultado el 17 de enero de 2007, en http://www.apa.org/ science/ anguide.html. Arnoult, M. D. (1972). Fundamentals of-scientific method in psychology. Dubuque, IA: William C. Brown. Associated Press. (1985). [Data available from POLL computer database]. Storrs, CT: Roper Center for Public Opinion. Barber, B. (1976). The ethics of experimentation with human subjects. Scientific American, 234, 25–31. Barber, T. X. y Silver, J. J. (1968). Fact, fiction, and the experimenter bias effect. Psychological Bulletin. Monograph Supplement, 70, 1–29. Barber, T. X. (1976). Pitfalls in human research. Nueva York: Pergamon Press. Best, J. (2001). Damned lies and statistics: Untangling numbers from the media, politicians, and activists. Berkley, CA: University of California Press. Blampied, N. M. (2000). Single-case research designs: A neglected alternative. American Psychologist, 55, 960. Boyce, J. R. (1989). Use of animals in research: Can we find a middle ground? Journal of
351
19Martin351-358referencias.indd 351
13/5/08 14:47:21
352
Bibliografía
the Veterinary Medicine Association, 194, 24–25. Bradley, J. V. (1968). Distribution-free statistical tests. Englewood Cliffs, NJ: Prentice-Hall. Bryant, F. B. y Wortmen, P. M. (1978). Secondary analysis: The case for data archives. American Psychologist, 33, 381–387. Burd, S. (1993). Report finds animal rights activists have stepped up attacks. The Chronicle of Higher Education, 40, A31. Campbell, S. K. (1974). Flaws and falla-cies in statistical thinking. Englewood Cliffs, NJ: Prentice-Hall. Carlyle, T. (1888). On heroes, hero- worship and the heroic in history. Nueva York: Fredrick A. Stokes & Brother. ii. Vol. 5, núm. 3. Editorial. Carroll, M. E. y Overmier, J. B. (Eds.). (2001). Animal research and human health: Advancing human welfare through behavioral science. Washington, D.C.: American Psychological Association. Christensen, L. (1988). Deception in psychological research: When is its use justified? Personality and Social Psychology Bulletin, 14, 664–675. Clark, C. y Williges, R. C. (1973). Response surface methodology central-composite design modifications for human performance research. Human Factors, 15, 295–310. Coke-Pepsi slugfest. (26 de julio de 1976). Time, pp. 64–65. Cook, T. D. y Campbell, D. T. (1979). Quasi-experimentation: Design & analysis issues for field settings. Chicago: Rand McNally. Cordes, C. (1990). U.S. enters lawsuit accusing scientist, institutions of fraud. The Chronicle of Higher Education, 37, A1, A24, A25. Coren, S. y Halpern, D. F. (1991). Lefthandedness: A marker for decreased survival fitness. Psychological Bulletin, 109, 90–106. Coren, S. y Porac, C. (1977). Fifty centuries of right-handedness: The historical record. Science, 198, 631–632.
19Martin351-358referencias.indd 352
Daly, M. y Wilson, M. (1988). Homicide. Nueva York: Aldine de Gruyter. Decker, B. (1967). Words about words: I. Pessimistic. Journal of Creative Behavior, 1, 34. Dewsbury, D. A. (1990). Early interactions between animal psychologists and animal activists and the founding of the APA committee on precautions in animal experimentation. American Psychologist, 45, 315–327. Diener, E., Lucas, R. E. y Scollon, C. N. (2006). Beyond the hedonic treadmill: Revising the adaptation theory of well-being. American Psychologist, 61, 305–314. Dillman, D. A. (1978). Mail and telephone surveys: The total design method. Nueva York: Wiley. Doyle, A. C. (1989). A scandal in Bohemia. In The adventures of Sherlock Holmes. Nueva York: Tom Dougherty Associates. (Obra original publicada en 1891.) Dunlap, K. (1920). Mysticism, Freudianism, and Scientific Psychology. St. Louis, MO: C. V. Mosby. Erickson, F. (1973). What makes school ethnography “ethnographic”? Anthropology & Education Quarterly, 4, 10–19. Estes, W. K. (1993). How to present visual information. APS Observer, 6(2), 6–9. Feeney, D. M. (1987). Human rights and animal welfare. American Psychologist, 42, 593–599. Fine, M. A. y Kurdek, L. A. (1993). Reflections on determining authorship credit and authorship order on-faculty-student collaborations. American Psychologist, 48, 1141–1147. Fisher, R. A. (1936). Has Mendel’s work been rediscovered? Annals of Science, 1, 115. Foertsch, J. y Gernsbacher, M. A. (1997). In search of gender neutrality: Is singular they a cognitively efficient substitute for generic he? Psychological Research, 8, 106–111. Gallup, G. G. y Suarez, S. D. (1985). Alternatives to the use of animals in psychological
13/5/08 14:47:22
Bibliografía
research. American Psychologist, 40, 1104– 1111. Gantt, W. H. (1928). Ivan P. Pavlov: A biographical sketch. En W. H. Gantt (Ed.), I. P. Pavlov’s lectures on conditioned reflexes (pp. 11–31). Nueva York: Liveright. Garner, W. R., Hake, H. W. y Eriksen, C. W. (1956). Operationalism and the concept of perception. Psychological Review, 63, 149– 159. Garvey, W. D. y Griffith, B. C. (1971). Scientific communication: Its role in the conduct of research and creation of knowledge. American Psychologist, 26, 349–362. Gelfand, H., Walker, C. J. y American Psychological Association (2002). Mastering APA style: Student’s workbook and training guide. Washington, D.C.: American Psychological Association. Glass, G. V., McGaw, B. y Smith, M. L. (1981). Meta-analysis in social research. Newbury Park, CA: Sage. Glinski, R. J., Glinski, B. C. y Slatin, P.-T. (1970). Nonnaivety contamination in conformity experiments: Sources, effects, and implications for control. Journal of Personality and Social Psychology, 16, 478–485. Gosling, C., Knight, N. y McKenney, L.-S. (Eds.). (1989). Search PsycINFO: Student Workbook. Washington, D.C.: American Psychological Association. Gould, S. J. (1981). The mismeasure of man. Nueva York: Norton. Greenberg, M. S. (1967). Role playing: An alternative to deception? Journal of Personality and Social Psychology, 7, 152–157. Greenwald, A. G. (1976). Within-subjects designs: To use or not to use? Psychological Bulletin, 83, 314–320. Grobe, R. P., Pettibone, T. J. y Martin, D.-W. (1973). Effectiveness of lecture pace on noise level in a university classroom. Journal of Educational Research, 67, 73–75.
19Martin351-358referencias.indd 353
353
Gross, A. E. y Flemming, I. (1982). Twenty years of deception in social psychology. Personality and Social Psychology Bulletin, 8, 402–408. Hadaway, C. K. y Marler, P. L. (1998). Did you really go to church this week? Behind the poll data. The Christian Century, 115, 472– 476. Halpern, D. F. y Coren, S. (1993). Lefthandedness and life span: A reply to Harris. Psychological Bulletin, 114, 235–241. Harcum, E. R. (1989). The highly inappropriate calibrations of statistical significance. American Psychologist, 44, 964. Harlow, H. F. (1958). The nature of love. American Psychologist, 13, 673–685. Harris, L. J. (1993a). Do left-handers die-sooner than right-handers? Com-mentary on Coren and Hal-pern’s (1991) “Left-handedness: A mar-ker-for decreased survival fitness.” Psychological Bulletin, 114, 203–234. Harris, L. J. (1993b). Reply to Halpern and Coren. Psychological Bulletin, 114, 242–247. Havemann, J. (13 de julio de 1989). Proposals on animal research rattle cages. Albuquerque Journal, p. E4. Hayakawa, S. I. (1978, junio-julio). Change, 6. Herzog, H. A. (1995). Has public interest in animal rights peaked? American Psychologist, 50, 945–947. Hostetler, A. J. (junio de 1988). Indictment: Congress sends message on fraud. APA Monitor, p. 5. Huff, D. (1954). How to lie with statistics. Nueva York: Norton. Human Factors and Ergonomics Society. (1995). Instructions and guidelines for poster presenters: Guidelines for preparing and arranging posters. Santa Monica, CA: Author. Infeld, L. (1950). Albert Einstein. Nueva York: Scribner’s.
13/5/08 14:47:22
354
Bibliografía
Jackson, G. B. (1980). Methods for integrative reviews. Review of Educational Research, 50, 438–460. Jacobson, J. W., Mulick, J. A. y Schwartz, A. A. (1995). A history of facilitated communication: Science, pseudoscience, and antiscience. American Psychologist, 50, 760. Jaschik, S. (1991). Agriculture Dept. issues final rules on care of research animals. The Chronicle of Higher Education, 37, A25–A31. Jensen, A. R. (1978). Sir Cyril Burt in perspective. American Psychologist, 33, 499–503. Johnson, D. A. (1971). Pupillary responses during a short-term memory task: Cognitive processing, arousal, or both? Journal of Experimental Psychology, 90, 311–318. Jung, J. (1969). Current practices and problems in use of college students for psychological research. Canadian Psychologist, 10, 280–290. Justice Department and Department of Agriculture release report on animal rights extremism activities. (septiembre de 1993). Federation News, p. 6. Kanekar, S. (1990). Statistical significance as a continuum. American Psychologist, 45, 296. Kennedy, J. E. y Landesman, J. (1963). Series effects in motor performance studies. Journal of Applied Psychology, 47, 202–205. Kenrick, D. T. y Keefe, R. C. (1992). Age preferences in mates reflect sex differences in reproductive strategies. Behavioral and Brain Sciences, 15, 75–133. Kihlstrom, J. F. (junio de 1995). From the subject’s point of view: The experiment as conversation and collaboration between investigator and subject. Ponencia dictada en la Convención Anual de la Sociedad Psicológica Estadounidense. Kimmel, A. J. (1996). Ethical issues in behavioral research: A survey. Cambridge, MA: Blackwell.
19Martin351-358referencias.indd 354
Kirk, R. E. (1968). Experimental designs: Procedures for the behavioral sciences. Pacific Grove, CA: Brooks/Cole. Kirk, R. E. (1990). Statistics: An introduction. Fort Worth, TX: Holt, Rinehart & Winston. Krasner, L. (1958). Studies of the conditioning of verbal behavior. Psychological Bulletin, 55, 148–170. Kuhn, T. S. (1970). The structure of scientific revolutions (2a. ed.). Chicago: University of Chicago Press. LeCompte, M. D. y Preissle, J. (1993). Ethnography and qualitative design in educational research. San Diego, CA: Academic Press. Lerner, I. M. (1968). Heredity, evolution, and society. San Francisco: W. H. Freeman. Levenson, R. L., Jr. (1990). Comment on Harcum. American Psychologist, 45, 295–296. Ley, W. (1955). Salamanders and other wonders. Nueva York: Viking Press. Lipsey, M. W. y Wilson, D. B. (1993). The efficacy of psychological, educational, and behavioral treatment: Confirmation from meta-analysis. American Psychologist, 48, 1181–1209. Loftus, G. R. (1993). Editorial comment. Memory & Cognition, 21, 1–3. Loftus, G. R. (1996). Psychology will be a much better science when we change the way we analyze data. Current Directions in Psychological Science, 5, 161–171. Lorenz, K. Z. (1962). The editors of King Solomon’s Ring. Chicago: Time-Life Books. Madigan, R. M., Johnson, S. y Linton, P. (1995). The language of psychology: APA style as epistemology. American Psychologist, 50, 428–436. Madson, L. y Hessling, R. M. (2001). Reader’s perceptions of four alternatives to masculine generic pronouns. The Journal of Social Psychology, 141, 156–158. Maggio, R. (1991). The bias-free word finder: A dictionary of nondiscriminatory language. Boston: Beacon Press.
13/5/08 14:47:22
Bibliografía
Mangan, K. S. (1990). Universities beef up security at laboratories to protect researchers threatened by animal-rights activists. The Chronicle of Higher Education, 37, A16–A19. Mann, C. (1990). Meta-analysis in the breech. Science, 249, 476–480. Martin, D. W. y Kelly, R. T. (1974). Secondary task performance during directed forgetting. Journal of Experimental Psychology, 103, 1074–1079. Masling, J. (1966). Role-related behavior of the subject and psychologist and its effects upon psychological data. En D. Levine (Ed.), Nebraska symposium on motivation. Lincoln: University of Nebraska Press. McAskie, M. (1978). Carelessness or fraud in Sir Cyril Burt’s kinship data? A critique of Jensen’s analysis. American Psychologist, 33, 496–498. McDonald, K. (1983). Fraud in scientific research: Is it the work of “psychopaths”? Chronicle of Higher Education, 26, 7. Medvedev, Z. A. (1969). The rise and fall of T. D. Lysenko (I. M. Lerner, Trans.). Nueva York: Columbia University Press. Meyers, C. (1990). Association fights restrictions on use of animals in research, drawing praise from scientists and anger from its critics. The Chronicle of Higher Education, 37, A25–A27. Meyers, R. H. (1971). Response surface methodology. Boston: Allyn & Bacon. Milgram, S. (1963). Behavioral study of obedience. Journal of Abnormal and Social Psychology, 67, 371–378. Miller, N. E. (1985). The value of behavioral research on animals. American Psychologist, 40, 423–440. Mitchell, D. B. y Richman, C. L. (1980). Confirmed reservations: Mental travel. Journal of Experimental Psychology. Human Perception and Performance, 6, 58–66. Monte, C. F. (1975). Psychology’s scientific endeavor. Nueva York: Praeger.
19Martin351-358referencias.indd 355
355
Morgan, D. L. y Morgan, R. K. (2001).-Single-participant research design. American Psychologist, 56, 119–127. Mueller, J. H. y Furedy, J. J. (2001). Reviewing for risk: What’s the evidence that it works? APS Observer, 14 (7), 1. Navon, D. y Gopher, D. (1979). On the economy of the human processing system. Psychological Review, 86, 214–255. Nelson, N., Rosenthal, R. y Rosnow, R. L. (1986). Interpretation of significance levels and effect sizes by psychological researchers. American Psychologist, 41, 1299–1301. Nicks, S. D., Korn, J. H. y Mainieri, T. (1997). The rise and fall of deception in social psychology and personality research, 1921 to 1994. Ethics and Behavior, 7, 69–77. Nicol, A. A. M. y Pexman, P. M. (1999). Presenting your findings: A practical guide for creating tables. Washing-ton, D.C.: American Psychological Association. Olson, P. O. (1989). Motorcycle conspicuity revisited. Human Factors, 31, 141–146. Orne, M. T. (1962). On the social psychology of the psychological experiment: With particular reference to demand characteristics and their implications. American Psychologist, 17, 776–783. Orne, M. T. (1970). Hypnosis, motivation and the ecological validity of the psychological experiment. In W. J. Arnold & M. M. Page (Eds.), Nebraska symposium on motivation. Lincoln: University of Nebraska Press. Orne, M. T. y Evans, F. J. (1965). Social control in the psychological ex-periment: Antisocial behavior and hypnosis. Journal of Personality & Social Psychology, 1, 189–200. Ortmann, A. y Hertwig, R. (1997). Is-deception acceptable? American Psychologist, 52, 746– 747. Palladino, J. J. y Handelsman, M. M. (1995). On the light side: The history of APA format and style. Psy Chi Newsletter, 21, 6.
13/5/08 14:47:23
356
Bibliografía
Parsons, H. M. (1974). What happened at Hawthorne? Science, 183, 922–932. Paxton, J. P. (1997). “Someone with like-a life wrote it”: The effects of a visible author on high school history students. Journal of Educational Psychology, 89, 235–250. Pifer, L., Shimizu, K. y Pifer, R. (1994). Public attitudes toward animal research: Some international comparisons. Society & Animals, 2, 95–113. Pirsig, R. M. (1975). Zen and the art of motorcycle maintenance. Nueva York: Bantam. Plous, S. (1996a). Attitudes toward the use of animals in psychological research and education: Results from a national survey of psychologists. American Psychologist, 51, 1167–1180. Plous, S. (1996b). Attitudes toward the use of animals in psychological research and education: Results from a national survey of psychology majors. Psychological Science, 7, 352–358. Popper, K. R. (1968). The logic of scien-tific discovery (Rev. ed.). Nueva York: Basic Books. Porac, C. y Coren, S. (1981). Lateral preferences and human behavior. Nueva York: SpringerVerlag. Position statement on the use of animals in research. (1993). NIH Guide, 22, 2–3. Poulton, E. C. (1973). Unwanted range effects from using within-subject experimental designs. Psychological Bulletin, 80, 113–121. Poulton, E. C. (1979). Composite model-for human performance in continuous noise. Psychological Review, 86, 361–375. Poulton, E. C. y Freeman, P. R. (1966). Unwanted asymmetrical transfer effects with balanced experimental designs. Psychological Bulletin, 66, 1–8. Pressley, M. M. y Tullar, W. L. (1977). A factor interactive investigation of mall survey response rates from a-commercial sample. Journal of Marketing Research, 14, 108–111.
19Martin351-358referencias.indd 356
Protecting Human Research Subjects: Institutional Review Board Guide (1993). NIH Guide Grants Contracts, 22. Puglisi, T. (2001). IRB review: It helps to know the regulatory framework. APS Observer, 14 (5), 1. Pyrczak, F. & Bruce, R. R. (Eds.). (2000). Writing empirical research reports: A basic guide for students of the social and behavioral sciences. Los Angeles: Pyrczak Publishing. Reed, J. G. y Baxter, P. M. (2003). Library use: A handbook for psychology (3rd ed.). Washington, D.C.: American Psychological Association. Roediger, R. (2004). What should they be called? APS Observer, 17 (4), 5, 46–48. Roethlisberger, F. J. (1977). The elusive phenomena: An autobiographical account of my work in the field of organized behavior at the Harvard Business School. Cambridge, MA: Division of Research, Graduate School of Business Administration (distribuido por Harvard University Press). Rogers, J. L., Howard, K. I. y Vessey, J.-T. (1993). Using significance test to evaluate equivalence between two experimental groups. Psychological Bulletin, 113, 553–565. Roscoe, S. M. (1980). Aviation psychology. Ames: Iowa State University Press. Rosenberg, M. J. (1969). The conditions and consequences of evaluation apprehension. In T. Rosenthal & T.-L. Rosnow (Eds.), Artifact in behavioral research. Nueva York: Academic Press. Rosenthal, R. y Fode, K. L. (1973). The effect of experimental bias on the performance of the albino rat. Behavioral Science, 8, 183– 189. Rosenzweig, S. E. G. (1970). Boring and the Zeitgeist: Eruditone gesta beavit. Journal of Psychology, 75, 59–71. Rosnow, R. L. y Rosenthal, R. (1999). Beginning behavioral research: A conceptual primer
13/5/08 14:47:23
Bibliografía
(3a. ed.). Upper Saddle River, NJ: Prentice Hall. Rowland, L. W. (1939). Will hypnotized persons try to harm themselves or others? Journal of Abnormal and Social Psychology, 34, 114–117. Ryder, R. D. (1979). The struggle against speciesism. In D. Paterson & R. D. Ryder (Eds.), Animal rights—a symposium (p. 14). Londres: Centaur Press. Safire, W. (1979, November 4). On language; the fumblerules of grammar. Nueva York Times Magazine, pp. 16–18. Sales, B. D. y Folkman, S. (2000). Ethics in research with human participants. Washington, D.C.: American Psychological Association. Schindler, G. E. (1967). Why engineers and scientists write as they do: Twelve characteristics of their prose. IEEE Transactions on Engineering Writing and Speech, EWS–10, 32. Schultz, D. P. (1969). The human subject in psychological research. Psychological Bulletin, 72, 214–228. Segal, E. (1982). Editorial. Journal of the Experimental Analysis of Behavior, 38,-115. Seligman, M. E. P. (1988). President’s comments. American Psychological Association Monitor, 29, 2. Shadish, W. R., Cook, T. D. y Campbell, D. T. (2002). Experimental and quasi-experimental designs for generalized causal inference. Boston: Houghton Mifflin. Sheppard, L. (2001). Examining the effect of humor in text-based instruction on learner’s enjoyment and recall. Unpublished practicum paper. Sidman, M. (1960). Tactics of scientific research. Nueva York: Basic Books. Singer, P. (1976). Animal liberation. Londres: Jonathan Cape. Singer, P. (1985). In defense of animals. Nueva York: Basil Blackwell. Skinner, B. F. (1950). Are theories of learning necessary? Psychological Review, 57, 193–216.
19Martin351-358referencias.indd 357
357
Skinner, B. F. (1953). Science and human behavior. Nueva York: Free Press. Skinner, B. F. (1959). A case history in scientific method. In S. Koch (Ed.), Psychology: A study of a science. Nueva York: McGrawHill. Skinner, B. F. (1966). Operant behavior. In W. K. Honig (Ed.), Operant behavior: Areas of research and application (p. 21). Nueva York: Appleton-Century-Crofts. Smart, R. (1966). Subject selection bias in psychological research. Canadian Psychologist, 7, 115–121. Staff (1983). Chronicle of Higher Education, 29, 7. Staff. (27 de junio de 1994). Vox pop. Time, p. 26. Strunk, W., Jr. y White, E. B. (1979). The elements of style (3a. ed.). Nueva York: Macmillan. Tanur, J. M. (1994). The trustworthiness of survey research. The Chronicle of Higher Education, 40, B1–B3. Todman, J. B. y Dugard, P. (2001). Single-case and small-N experimental designs: A practical guide to randomization tests. Mahwah, NJ: Lawrence Erlbaum. Toor, R. (2006). What’s to ‘enjoy’? The Chronicle of Higher Education, 52, B5. Van Orden, G. C. y Paap, K. R. (1997). Functional neural images fail to discover pieces of mind in parts of the brain. Philosophy of Science Journal, 64, 885–994. Wainer, H. (2000). Visual revelations: Graphical tales of fate and deception from Napoleon Bonaparte to Ross Perot. Mahwah, NJ: Lawrence Erlbaum. Weber, S. J. y Cook, T. D. (1972). Subject-effects in laboratory research: An examination of subject roles, demand characteristics, and valid inference. Psychological Bulletin, 77, 273–295. Westfall, R. S. (1973). Newton and the fudge factor. Science, 179, 751–758. Wickens, C. D. (1984). Processing resources in attention. En R. Parasuraman & D. R.
13/5/08 14:47:24
358
Bibliografía
Davies (Eds.), Varieties of attention. Nueva York: Academic Press. Wilson, G. T. (1985). Limitations of metaanalysis in the evaluation of the effects of psychological therapy.-Clinical Psychology Review, 5, 35–47.
19Martin351-358referencias.indd 358
Wolins, L. (1962). Responsibility for raw-data. American Psychologist, 17, 657–658. Woodworth, R. S. (1940). Psychology (4a. ed.). Nueva York: Holt.
13/5/08 14:47:24
ÍNDICE
A Abscisa, 247 Aleatorización, 29 en bloques, 31 restringida, 30, 39 Almacenamiento de datos, 99 Amenazas a la validez interna, 33 historia, 33 interacciones con la selección, 38 maduración, 33 mortalidad, 34 prueba, 35 regresión estadística, 36 selección, 33, 34 Análisis de varianza, 185, 320 Animales en la investigación, 89 ANOVA, 324 ANOVA de una vía de Kruskal-Wallis por rangos, 322 Aplicación de la prueba como una amenaza a la validez interna, 35 Aplicación grupal de una encuesta, 214 Apoyos visuales para una presentación, 302 Asignación aleatoria, 28 Asíntota, 251 Asociación, medidas de, 313 Automatización de un experimento, 79 Autor de un informe de investigación, 275, 287
B Búsqueda prospectiva de referencias, 126 Búsqueda retrospectiva de referencias, 125
Búsquedas bibliográficas, 111 actas como fuentes, 119 artículos de revisión como fuentes, 116 artículos periodísticos como fuentes, 118 bases de datos, 121 búsquedas en computadora, 122 comunicaciones personales como fuentes, 128 fuentes formales, 121 fuentes informales, 127 grupos de investigación como fuentes, 128 informes técnicos como fuentes, 119 libros como fuentes, 115 miembros de la academia como fuentes, 128 oportunidad de las fuentes, 114 reuniones profesionales como fuentes, 127 publicaciones electrónicas como fuentes, 119
C Calificaciones z, 331 Capacidad de generalizar, 27 Características de la demanda, 75 minimización, 78 Causalidad, 8 Ciencia, 3 CIR, 72 Citas en el informe, 271 Coeficiente de contingencia, 313 Coeficiente de correlación de rangos ordenados de Spearman, 313, 325 Coeficiente de correlación producto-momento de Pearson, 314, 326
359
20Martin359-364Indice.indd 359
12/5/08 22:05:49
360
Índice
Coeficiente de determinación, 252 Computadoras para el análisis de datos, 264 Conexionismo, 61 Confiabilidad, 137 de división por mitades, 138 de formas alternativas, 138 test-retest, 138 Consentimiento informado, 73 Contrabalanceo, 156 ABBA, 157 completo, 162 parcial, 162 Contrabalanceo ABBA, 157 Contrabalanceo completo, 162 Contrabalanceo parcial, 164 Cornisa, 276, 287 Cuadrado latino, 162 Cuestionario, 10, 212, 217
D Deducción, 55 Definiciones operacionales, 132, 136, 234 Desfase en la comunicación científica, 113 Desviación estándar, 247, 313 Diagrama de dispersión, 7, 251 Diseño de grupo control no equivalente con pretest y postest, 197 Diseño de grupos igualados, 167 Diseño de grupos independientes, 148 Diseño de series convergentes, 185 Diseño de un grupo con pretest y postest, 196 Diseño de un grupo sólo con postest, 195 Diseño factorial mixto, 180 Diseños cualitativos, 5, 14, 19 Diseños cuantitativos, 5, 19 Diseños cuasi-experimentales, 193, 197, 227 Diseños de grupos separados, 148 Diseños de línea base, 205, 227 Diseños de línea base con N pequeña, 204 Diseños de mediciones repetidas, 148 Diseños de series de tiempo interrumpidas, 22, 200
20Martin359-364Indice.indd 360
Diseños de sujeto único, 204 Diseños entre sujetos, 148, 150, 172 Diseños factoriales, 178, 194, 253 Diseños intrasujeto, 148, 151, 172 Diseños no experimentales, 193, 195 Diseños sólo con postest con grupos no equivalentes, 196 Diseños tratamiento x sujeto, 150 Dispersión, 246, 312 Distribución normal, 242 Distribución truncada, 243 Distribuciones bimodales, 242 Distribuciones de frecuencia, 241 Distribuciones sesgadas, 243 Duración del experimento, 231
E Efecto de piso, 175 Efecto de techo, 174 Efecto del contexto, 166 Efecto del orden, 155 Efecto Hawthorne, 81 Efectos de acarreo, 155 Efectos principales, 253 Eje x, 247 Eje y, 247 Encabezado de un informe de investigación, 276, 287 Encuesta, 10, 212 Encuesta por correo, 212 Encuesta por Internet, 215 Encuesta telefónica, 214 Engaño, 84 Entrevista como técnica de encuesta, 215 Error tipo I, 259 Error tipo II, 259 Errores de decisión en pruebas de significancia, 259 Escala de calificación en una encuesta, 220 Escala de intervalo, 311 Escala de razón, 311 Escala Likert, 220
12/5/08 22:05:49
Índice
361
Escala nominal, 309 Escala ordinal, 310 Escalas de medición, 309 Escalas numéricas, 309 Estadística, 244, 262, 313 Estadística descriptiva, 244, 311 Estadística inferencial, 57, 257, 315 Estado de tratamiento, 208 Estado estable en un experimento de línea base, 207 Estilo APA, 270 Estilo de redacción en los informes de investigación, 283 Ética de la ciencia, 95 con animales, 87, 89 con participantes, 69, 229 Etnografía, 14 Experimentadores múltiples, 81 Experimento piloto, 135 Experimentos ciegos, 79 Experimentos de dos niveles, 171 Experimentos de una sola variable, 171 Experimentos doble ciego, 79 Experimentos funcionales, 176 Experimentos multinivel, 176, 194
Función negativa, 250 Función no monotónica, 250 Función positiva, 250
F
I
F, valores críticos, 333, 334 Factores, 179 Falsificación de credenciales profesionales, 103 Figuras en un informe de investigación, 279, 299 Frase clave en una búsqueda bibliográfica, 123 Fuentes primarias para búsqueda bibliográfica, 118 Fuentes secundarias, citar de, 102 Función, 179, 249 Función acelerada negativamente, 251 Función acelerada positivamente, 251 Función asintótica, 251 Función curvilínea, 250 Función lineal, 250 Función monotónica, 250
Igualación de los participantes, 167 Incidentes críticos, 18 Inducción, 55 Informe de investigación, partes de, 276 Informe experimental, 271 Informe por partes, 108 Institución de un autor en un informe, 275, 287 Interacción cruzada, 255 Interacción de dos vías, 255 Interacción de tres vías, 257 Interacciones, 180, 254 con selección como amenazas a la validez interna, 37 Interpretación de los resultados experimentales, 240 Interrogatorio posterior al experimento, 81
20Martin359-364Indice.indd 361
G Gráfica de barras, 248 Gráfica lineal, 249 Gráficas, 108, 247 Grupo control, 174 Grupo control no experimental, 82 Grupo control simulado, 83 Grupo experimental, 171 Grupos de investigación, 129
H H, valores críticos, 335, 336 Hipótesis, 26, 56 Hipótesis direccional, 26 Hipótesis no direccional, 26 Hipótesis nula, 236, 358 Histograma, 248 Historia como amenaza a la validez interna, 32 Historia de caso, 17, 24
12/5/08 22:05:49
362
Índice
Introducción de un informe de investigación, 277, 289 Investigación aplicada, 64 Investigación básica, 64 Investigación de archivos, 12, 24
N
J
O
Juntas institucionales de revisión, 72
Observabilidad, 48 Observación correlacional, 7, 24 Observación naturalista, 15, 24, 86 Observación para obtener una idea de investigación, 46 Observación vicaria, 51 Observaciones de pretest en más de un intervalo, 202 Operaciones convergentes, 186 Ordenada, 247
L Lenguaje en los informes de psicología, 273 Línea base, 207
M Maduración como una amenaza a la validez interna, 33 Manual de publicación de la Asociación Estadounidense de Psicología, 269 Maquinar resultados, 96 Media, 245, 312 Media del tamaño del efecto del tratamiento, 263 Mediana, 245, 312 Mediciones fisiológicas, 144 MEDLINE, 124 Metaan