capítulo
1
HISTORIA DE LOS ENFOQUES CUANTITATIVO, CUALITATIVO RAÍCES Y MOMENTOS DECISIVOSY MIXTO:
Introducción En este capítulo no se pretende abarcar la historia de la investigación, mucho menos la historia de la ciencia. Una enciclopedia completa no bastaría para abordar este tema. Solamente queremos ubicar al estudiante que se inicia en la investigación sobre algunos de los momentos históricos más importantes en la indagación cuantitativa, cualitativa y mixta. Asimismo, el capítulo pretende sentar las bases para comprender un poco más estas tres formas de efectuar un estudio.
El enfoque cuantitativo: sus dos principales antecesores Como ya se mencionó en el primer capítulo de Metodología de la investigación, 6ª edición, el enfoque cuantitativo en las ciencias sociales se srcina en la obra de Auguste Comte (1798-1857) y Émile Durkheim (1858-1917), con la influencia significativa de Francis Bacon (1561-1626), John Locke (1632-1704) e Immanuel Kant (1724–1804). Es decir, el “abuelo” de tal enfoque es el positivismo. A mediados del siglo XIX, el racionalismo iluminaba la actividad cientíica, la revolución iniciada por Isaac Newton se encontraba en plena consolidación,
particularmente por los avances cientíicos y tecnológicos alcanzados en la época.
2
Capítulo 9Recolección de los datos cuantitativos
Con la publicación en 1849 delDiscurso sobre el espíritu positivo, de Auguste Comte, se inició
en las ciencias sociales un paradigma denominado “positivista”. Cabe señalar que, en términos sencillos, un “paradigma” es una manera de concebir al mundo; un conjunto de creencias y premisas respecto a la naturaleza de éste (Greene, 2007). Esta visión proclama, entre otras cuestiones, que la realidad es una sola y es necesario descubrirla y conocerla. Asimismo, el sentido de la percepción resulta la única base admisible del conocimiento humano y del pensamiento preciso. Las ideas esenciales del positivismo provienen de las denominadas ciencias “exactas”, como la Física, la Química y la Biología; por tal motivo, los positivistas se fundamentaron en cientíicos como Galileo Galilei (1564-1642), Isaac Newton (1642-1727), Nicolás Copérnico (1473-1543), Thomas Robert Malthus (17661834) y Charles Darwin (1809-1882). Así, “el mundo social puede estudiarse de manera similar al mundo natural” (tal como se investigan los átomos, las moléculas, los planetas y los invertebrados; se pueden analizar los patrones de conducta de los trabajadores, las razones de las enfermedades mentales, los efectos de un método educativo sobre el aprendizaje o las migraciones humanas) y existe un método exclusivo para indagar ese mundo social, que es libre de los valores del investigador. Por ello, para el positivismo, la objetividad es muy importante, el investigador observa, mide y manipula variables; además de que se desprende de sus propias tendencias (la relación entre éste y el fenómeno de estudio es de independencia). Lo que no puede medirse u observarse con exactitud se descarta como “objeto” de estudio. Además, éste se encuentra determinado por leyes y axiomas. El positivismo solamente acepta conocimientos que proceden de la experiencia, esto es, de datos empíricos. Los hechos son lo único que 1
2
cuenta. Es decir, los positivistas establecen como fundamental el principio de veriicación: una proposición o enunciado tiene sentido sólo si resulta veriicable por medio de la experiencia y la observación. Todo debe ser comprobable y esta condición es válida para cualquier ciencia. Asimismo, este paradigma considera que es posible establecer generalizaciones libres del contexto y del tiempo, así como vínculos causales (causas reales que preceden temporalmente a los efectos). La experimentación constituyó la forma principal para generar teoría. El positivismo (muy rígido) fue remplazado por el “pospositivismo”, fundamentado en el paradigma anterior, pero más abierto y lexible. Tal visión comienza a gestarse hacia ines del siglo XIX, pero realmente se consolida hacia la mitad del siglo pasado. La germinación la inician las obras de autores como Wilhelm Dilthey (1833-1911) y William James (1842-1910). Karl Popper (1902-1994) lo impulsa de forma notoria. Además, en cada campo o disciplina, diversos autores lo desarrollan. Sus propuestas esenciales se pueden resumir en los siguientes puntos: • Existe una realidad, pero solamente puede ser conocida de manera imperfecta debido a las limitaciones humanas del investigador (Mertens, 2005). Por tanto, tal realidad es factible descubrirla con cierto grado 1
643, según el calendario gregoriano.
2
Note el lector que estamos hablando de casi 300 años de conocimiento previo para la consolidación de un paradigma.
¿Qué significa medir?
de probabilidad. • El observador no se encuentra aislado de los fenómenos que estudia, sino que forma parte de éstos, lo afectan y él, a su vez, inuye en ellos. • Las teorías y explicaciones se consolidan y eliminan otras posibles teorías y explicaciones rivales. • La investigación es inuida por los valores de los investigadores y por la teoría o hipótesis en que se apoyen éstos. La objetividad es solamente un estándar que guía la investigación, por lo que el investigador debe estar atento y tratar de permanecer neutral para prevenir que sus valores o ten dencias inuyan en su estudio, además de seguir rigurosamente procedimientos prescritos y estandarizados. • La experimentación en el laboratorio es una forma central para probar hipótesis, pero no la única. ello, se desarrollaron losconsideradas diseños cuasiexperimentales 2005). • Por Los conceptos de las teorías y las hipótesis a (Mertens, probar deben tener referentes empíricos y consecuentemente, es necesario medirlos, aunque estas mediciones nunca son “perfectas”, siem pre hay un grado de error.
En conclusión, pudiéramos establecer que la diferencia esencial entre el paradigma positivista y el pospositivista se ubica en su concepción del conocimiento. En el segundo, se supera el esquema que considera la percepción como simple relejo de las “cosas reales” y el conocimiento como “copia” de esa realidad. Éste, en cambio, se visualiza como el resultado de una interacción, de una dialéctica, entre el conocedor y el objeto conocido. El pospositivismo es una especie de “padre” del enfoque cuantitativo y le otorga tres principales elementos que lo caracterizan: 1.
Recolectar datos en la forma de puntuaciones (que se srcina en las matemáticas). Es decir, los atributos de fenómenos, objetos, animales, personas, organizaciones y colectividades mayores son medidos y ubicados numéricamente. 2. Analizar tales datos numéricos en términos de su variación. 3. La esencia del análisis implica comparar grupos o relacionar factores sobre tales atributos mediante técnicas estadísticas (en el caso de las ciencias del comportamiento, mediante experimentos y estudios causales o correlacionales).
El enfoque cuantitativo se consolida a lo largo del siglo claves como los que se presentan a continuación.
XX
y tiene momentos
EL ENFOQUE CUANTITATIVO: MOMENTOS CLAVE Es diícil deinir con precisión cuándo se inició el enfoque cuantitativo, más bien sus comienzos provienen de distintas fuentes y su evolución ha sido continua (algunos
3
4
Capítulo 9Recolección de los datos cuantitativos
autores de la historia de la ciencia los ubican desde Aristóteles y otros en diferentes puntos de los siglos XVI, XVII y XVIII). Gottfried Achenwall (en 1748 o 1749) acuñó el término en alemán “Statistik” para referirse al análisis de los datos del Estado, en particular los censos poblacionales (Aliaga, 2000 y Columbia Encyclopedia, 2009). En 1801, William Playfair, un ingeniero y economista, desarrolla las gráicas estadísticas como un mejor medio para representar los resultados (anteriormente se utilizaban tablas). En 1816, Carl Friedrich Gauss propone la desviación media, y alrededor de esa época genera el análisis de la distribución normal y plantea la técnica de mínimos cuadrados que posteriormente derivarían en el análisis de varianza (Scott y Rice, 2005). En 1817, el francés Marc Antoine Jullien realiza una encuesta sobre diversos sistemas educativos en el mundo. Alrededor de 1880, se genera el análisis de correlación en Inglaterra y Karl Pearson, profesor desde 1884 en The University College (Londres), presenta en la última década del siglo XIX: la moda (medida de tendencia central), una fórmula producto del momento de correlación, un procedimiento para calcular el tamaño de muestra adecuado para representar a una población, la regresión lineal y múltiple (con la identiicación de la capacidad para predecir puntuaciones mediante la información sobre la correlación entre las variables), así como el coeiciente de contin-gencia y la chi-cuadrada (χ2) (Creswell, 2005, Aldrich, 2005 y Aliaga, 2000). Otro investigador que trabajó sobre la correlación múltiple fue George U. Yule (1897). En 1901, Pearson junto con Frank Raphael Weldon y Francis Galton fundan Biometrika, una revista que se dedicó al desarrollo de análisis estadísticos en el campo de la Biología (Norton, 1978). A inales del siglo XIX ha nacido un pilar del enfoque cuantitativo: la estadística. Asimismo, en la década de 1890 a 1900 se desarrollan las primeras pruebas mentales con los esfuerzos de investigadores como Francis Galton, James McKeen Cattell y Alfred Binet (Lachapelle, 2008). Para 1901, Edward Lee Thorndike y Robert S. Woodworth discuten sobre la necesidad y valor del grupo de control en los experimentos. En 1904, Charles Spearman presenta su coeiciente rho. Además por esos años se aplica el pro-cedimiento para reducir variables denominado el análisis de factores y la prueba t (Creswell, 2005). En 1910 la armada estadounidense, comienza a usar pruebas psicológicas estandarizadas, particularmente durante la Primera Guerra Mundial (Creswell, 2005). De igual forma surgen por tal año, los diseños experimentales como los latinos cuadrados de Thorndike. Además, las encuestas s(urveys) incrementan su popularidad en las primeras décadas del siglo XX. En 1916, William Anderson McCall concibe la asignación al azar en experimentos y en 1917, F. Stuart Chapin publica sobre la experimentación en ciencias sociales
¿Qué significa medir?
(Downey, 2006). Durante la década de 1920 se continúa el desarrollo de pruebas psicométricas y de logro, así como la estadística inferencial (conclusiones de la muestra a la población) se comienza a utilizar y diversos procedimientos se fortalecen. McCall publica a mediados de esa década su famosa obra:Cómo experimentar en Educación.Entre 1924 y 1932, Elton Mayo realiza sus experimentos en la planta Hawthorne de la compañía Western Electric, lo que da inicio a este tipo de estudios en las organizaciones. En la siguiente década, se desarrollan las pruebas de selección de personal y un sinnúmero de tests estandarizados en diferentes campos. En 1935, Sir Ronald Fisher consolida en su libro El diseño de experimentos el análisis de varianza y las pruebas de signiicancia en general, además de los experimentos modernos. En 1938, este último autor publica junto con Frank Yates, las tablas estadísticas para la investigación en la Agricultura, la Biología y la Medicina. Asimismo, la Asociación de Educación Progresiva de Estados Unidos comienza a realizar estudios longitudinales. Durante la década de 1950, la investigación cuantitativa se encuentra en su apogeo, surgen diversas encuestas, experimentos, revistas cientíicas, diseños, etcétera. También comienzan a desarrollarse las máquinas para caliicar pruebas y la computadora. En los años de 1960, Donald T. Campbell y Julian Stanley (1966) generan una tipología sobre los estudios experimentales que priva hasta nuestros días (incluso en la presente obra) y un análisis de las fuentes que pueden atentar contra la claridad de sus resultados. De igual forma, el querido profesor Fred Kerlinger identiica tipos de diseños cuantitativos y fortalece el enfoque respectivo. Por otra parte, se desarrolla una concepción que explica cómo los ítems diieren en diicultad y discriminación (teoría de las respuestas a los ítems) (Creswell, 2005). Surgen una gran cantidad de textos de estadística. Los programas de análisis de datos se desarrollan, particularmente el Paquete Estadístico para las Ciencias Sociales (SPSS). En la década comprendida entre 1970 y 1980 se identiican diversos modelos causales multivariados (por ejemplo, el modelamiento de ecuaciones estructurales), se desarrolla el metaanálisis (técnica para analizar datos provenientes de distintos estudios con mediciones similares) y autores como Thomas Dixon Cook y Donald T. Campbell sugieren los tipos de validez que más recientemente se conciben como clases de evidencia acerca de la validez (Shadish y Cook, 1998). Asimismo, John W. Tukey empieza con el análisis exploratorio de datos (publica en 1977). En la década de 1980, se reta a las aproximaciones clásicas con las pruebas estadísticas, esto es, mediante el examen de la magnitud de la relación entre variables, a
través de la estimación del tamaño del efecto (Creswell, 2005). Se introduce el concepto de sensibilidad experimental.
5
6
Capítulo 9Recolección de los datos cuantitativos
En la última década del siglo XX surgen mediciones y análisis multivariados más complejos, además se consolida la idea de “poder de medición” mediante la utilización de diferentes instrumentos para medir las variables de la investigación. Los programas de análisis se soistican y comercializan. En la primera década de este tercer milenio se cuenta con gran cantidad de escalas y posibilidades de análisis sumamente avanzados y diversos. Y es aquí donde ahora estamos. Cabe señalar que el primer enfoque de la investigación en desarrollarse completamente fue el cuantitativo.
EL ENFOQUE CUALITATIVO: SUS COMIENZOS Diferentes autores ubican sus orígenes en distintos momentos, por ejemplo, Vidich y Lyman (2002) los sitúan en los siglos XV y XVI con la denominada etnograía temprana, en la que se estudiaba a los pueblos primitivos; o Lincoln y Denzin (2003) fundamentalmente los circunscriben a principios del siglo XX, al igual que Creswell (2005). A nuestro juicio, el enfoque cualitativo realmente se inicia como un proceso investigativo a inales del siglo XIX y sobre todo en el comienzo del siglo XX, aunque algunos arqueólogos realizaron estudios inductivos en la mitad del XIX. El primer problema es que hay diversas visiones que se han considerado como tipos de investigación cualitativa (Tesch, 1990, ubica 26 clases) y las bases epistemológicas son variadas. Sin embargo, concordamos con Mertens (2005) en que el constructivismo es tal vez el paradigma que inluyó más en el enfoque cualitativo (ciertamente muchos diferirán, pero su peso es innegable). Éste tiene sus primeros cimientos en Immanuel Kant (siglo XVIII), quien señala básicamente que el mundo que conocemos es construido por la mente humana. Las “cosas” en sí mismas existen, pero nosotros las apreciamos del modo como es capaz de percibirlas nuestra mente. De los postulados de Kant va a surgir el constructivismo, en un intento de conciliar el racionalismo y el asociacionismo. Otro autor clave para esta corriente paradigmática es Max Weber (1864-1920), quien introduce el término verstehen o “entender”, reconoce que además de la descripción y medición de variables sociales, deben considerarse los signiicados subjetivos y la comprensión del contexto donde ocurre el fenómeno. El constructivismo propone:
1. No hay una realidad la realidad es ediicada por consecuencia, múltiplesobjetiva, construcciones mentales pueden sersocialmente, “aprehendidas” sobre ésta, algunas de las cuales pueden estar en conlicto con otras; de este modo, las percepciones de la realidad son modiicadas a través del proceso del estudio (Mertens, 2005).
¿Qué significa medir?
2. El conocimiento es construido socialmente por las personas que participan en la investigación. 3. La tarea fundamental del investigador es entender el mundo complejo de la experiencia vivencial desde el punto de vista de quienes la experimentan, así como comprender sus diversas construcciones sociales sobre el signiicado de los hechos y el conocimiento. 4. La investigación es en parte producto de los valores del investigador y no puede ser independiente de ellos. 5. El investigador y los individuos estudiados se involucran en un proceso interactivo. El conocimiento resulta de tal interacción social y de la inluencia de la cultura. 6. No es posible establecer generalizaciones libres del contexto y del tiempo. Entre algunos de los autores que durante el siglo XX inluyeron en el desarrollo del constructivismo tenemos a Mary Parker Follett (1868-1933), en el campo de la Administración y las organizaciones; Jean Piaget (1896-1980) y Lev Semenovich Vygotsky (1896-1934) en la Educación y John Dewey (1859-1952) en la Pedagogía; así como Margaret Mead (1901-1978) en la Antropología. El constructivismo como uno de los “padres” del enfoque cualitativo le otorga los énfasis principales que lo caracterizan: 3
• El reconocimiento de que el investigador necesita encuadrar en los estudios los puntos de vista de los participantes. • La necesidad de inquirir cuestiones abiertas. • Dado que el contexto cultural es fundamental, los datos deben recolectarse en los lugares donde las personas realizan sus actividades cotidianas. • La investigación debe ser útil para mejorar la forma en que viven los individuos. • Más que variables “exactas” lo que se estudia son conceptos, cuya esencia no solamente se captura a través de mediciones.
EL ENFOQUE CUALITATIVO: MOMENTOS CLAVE En la década de 1920, Bronislaw Malinowski realiza y publica su estudio de las islas Trobriand y un grupo de investigadores conocidos como la Escuela de Chicago comenzaron a realizar diversos estudios cualitativos, entre los autores destacan: Albion Small, William Isaac Thomas, Florian Znaniecki y el ilósofo George Herbert Mead. Por ejemplo, Thomas y Znaniecki publicaron una investigación en 1927 sobre los inmigrantes polacos, en la cual se utiliza la biograía de los participantes como herramienta de recolección de los datos. Otros estudios se centraron en culturas especíicas y grupos urbanos marginados. Margaret Mead (uno de cuyos maestros fue Franz Boas) publica sus conocidas obras Coming of age in Samoa y Growing up in New Guinea , en 1928 y 1930, respectivamente 3 Podríamos decir “padres” o “madres”, para no generar susceptibilidades.
7
8
Capítulo 9Recolección de los datos cuantitativos
(Sullivan, 2004; Mead, 2001); y para 1932, un libro que reseña su indagación sobre la cultura de una tribu india. Posteriormente, en la misma década se agregaron otros estudios de Robert E. Park y Ernest W. Burgess. Everett C. Hughes y Herbert Blumer, en la siguiente década, comenzaron a desarrollar una aproximación conocida como el interaccionismo simbólico, el cual inluyó en la evolución del enfoque cualitativo. Prácticamente, de manera simultánea, en las décadas de 1920 y 1930 Edward Evan Evans-Pritchard (1902-1973) realiza investigaciones etnográicas con los azande en el Nilo y los nuer en Sudán y Etiopía. En 1940, publica su obra The Nuer: A description of the modes of livelihood and political institutions of a Nilotic people, que ayudó a consolidar la etnograía. Ruth Benedict publica en 1934 su libro Patrones en la cultura. Zora Neale Hurston, en los años treinta efectúa sus estudios antropológicos (etnográicos) sobre el folklore rural del sur de los EE. UU. (Murchison, 2010) y la práctica del vudú y el judú (hoodoo) en el Caribe inglés (Hemenway, 1977). En las décadas de 1940 y 1950 decayó la importancia del enfoque cualitativo debido al posicionamiento de su “rival” cuantitativo (Gobo, 2005), y a que la Segunda Guerra Mundial exigía estudios basados en mediciones y estadística para la industria bélica, de construcción e incluso la propaganda (Hernández Sampieri y Mendoza, 2008); aunque en 1945, Morris Edward Opler establece los principios del análisis temático cualitativo al analizar sistemas culturales. Señaló que la importancia de una categoría o tema está relacionada con la frecuencia de aparición, qué tanto se presenta en diferentes ideas y prácticas culturales, cómo reaccionan las personas cuando se infringe y el grado en el cual el número, fuerza y variedad de expresiones temáticas son controladas por el contexto. Además, se realizaron algunos trabajos etnográicos de investigadores como Elizabeth y Allison Davis, y Burleigh y Mary Gardner, que estudiaron las clases sociales en Natchez, Mississippi, Estados Unidos; al igual que Conrad Arensberg, quien hizo algunas investigaciones similares en Irlanda. Clair Drake y Horace Cayton publicaron una obra que fue el resultado de los análisis efectuados en la población afroamericana del sur de Chicago (Strong, 1946). George Spindler también trabajó la antropología educativa y George M. Foster estudió diversas culturas latinoamericanas. Asimismo, Howard S. Becker analiza diferentes profesiones. Cabe destacar que la investigación-acción comienza a desarrollarse en esta etapa (1945-1955) con nombres como John Collier, Ronald Lippitt y Marian Radke y Stephen Maxwell Corey. Todos ellos siguieron a quien muchos autores consideran el fundador
¿Qué significa medir?
formal de tal visión, Kurt Lewin (Masters, 2000; Creswell, 2005). En la década de 1960, el enfoque cualitativo recobra vitalidad e importancia. La etnometodología surge con vigor. Peter L. Berger y Thomas Luckmann en 1966 presentan sus modelos de construcción de la realidad (Berger y Luchmann, 1966). Dos sociólogos —Barney G. Glaser y Anselm L. Strauss—, con pacientes en estado terminal en el San Francisco Medical Center de la Universidad de California, realizan diversos estudios y de sus experiencias publican el libro Discovery of grounded theory (1967), así emerge la Teoría Fundamentada (después ambos autores presentan visiones diferentes de dicha teoría, como se comentó en el libro). Philip W. Jackson publica un trabajo cualitativo derivado de sus estudios en las aulas (1968). A esta época se le denomina la “primera encrucijada del paradigma cualitativo” (Shank, 1995). Asimismo, Paulo Freire comienza con la investigación participativa en América Latina, especíicamente en Brasil. En la década de 1970, el enfoque cualitativo continúa popularizándose. Norman K. Denzin (1970) reanaliza el concepto de triangulación. Egon G. Guba consolida la propuesta de un enfoque alternativo, el naturalista (1978). La Teoría Fundamentada continúa evolucionando. Para la década de 1980, Terrence E. Deal y Allan A. Kennedy proponen estudiar las culturas organizacionales al estilo etnográico. John K. Smith (1983) distingue entre dos aproximaciones ilosóicas: idealismo y realismo. Matthew Miles y Michael Huberman (1984) presentan procedimientos para el análisis cualitativo. Yvonna Lincoln y Guba (1985) identiican diferencias entre el naturalismo y otras clases de investigación. Strauss publica en 1987 su obra: Qualitative analysis for social scientists. Cabe destacar que la investigación bajo el marco de referencia feminista, se desarrolla notablemente en esta década con los trabajos de McRobbie (1982), Patai (1983), Clegg (1985), Cook y Fonow (1986), y McCormack (1989). John Elliot propone el concepto de triangulación en la investigación cualitativa en 1991 y la investigación-acción deliberativa y a lo largo de la década de 1990, Strauss y Corbin (1990 y 1994) publican procedimientos más avanzados sobre la Teoría Fundamentada, y LeCompte, Milroy y Preissle (1992) presentan nuevos esquemas etnográicos. De igual forma, Denzin y Lincoln (1994) muestran alternativas del proceso cualitativo. Creswell (1998) distingue entre cinco diferentes procedimientos de indagación cualitativa. Las editoriales McGraw-Hill y SAGE publican varios libros de investigación cualitativa. Surgen diversas revistas cientíicas cualitativas en todos los campos, continúan la tendencia de la década anterior. Cabe señalar 4
®
que entre 1989 y 1992, se desarrolla un software para análisis cualitativo: el Atlas.ti , por 4 Hasta este punto se han mencionado los
nombres completos de los fundadores y autores iniciales del enfoque cualitativo, ahora no se mencionarán nombres completos porque se trata de referencias.
9
10
Capítulo 9Recolección de los datos cuantitativos
Thomas Muhr en la Universidad Técnica de Berlín; así, para 1993, se presenta el prototipo y en 1996 se realiza la primera versión. De igual forma, Decision Explorer® fue diseñado a principios de la década para apoyar la labor de mapeo cognitivo realizada por Colin Eden en las universidades de Bath y Strathclyde. Posteriormente es comercializado por Banxia Software. Otros programas son generados durante el periodo. A partir de 2000, es un hecho que pocos dudan ya de lo valioso del enfoque cualitativo. Clandinin y Connelly (2000) revitalizan los diseños narrativos; mientras que Kemmis y McTaggart (2000) hacen lo mismo con la investigación participativa. Los diferentes marcos conceptuales cualitativos comienzan a integrarse en diseños con autores como Álvarez Gayou (2002) y Creswell (2005). Mertens (2005) comenta que las aproximaciones feminista, participativa y marxista —entre otras— más bien son parte del paradigma transformativo, que reconoce diversas realidades y la inluencia del contexto social y cultural en todas sus dimensiones (política, económica, de género y srcen étnico, de habilidades y capacidades distintas). La relación entre el investigador y los participantes es de total interdependencia y se sugiere que la investigación debe servir para mejorar las condiciones de vida de los grupos marginados de la sociedad. Hacia el inal de la primer década del siglo surgen textos de metodología cualitativa aplicada a diferentes disciplinas: Relaciones Públicas y Mercadotecnia (Daymon, 2010), Geograía Humana (DeLyser et al., 2009) y Educación (Luttrell, 2009), solamente por mencionar algunas. Y aquí estamos.
EL ENFOQUE MIXTO: LA TERCERA VÍA El enfoque mixto surge como consecuencia de la necesidad de afrontar la complejidad de los problemas de investigación planteados en todas las ciencias y de enfocarlos holísticamente, de manera integral. En 1973, Sam Sieber (citado por Creswell, 2005) sugirió la combinación de estudios de caso cualitativos con encuestas, creando “un nuevo
estilo de investigación” y la integración de distintas técnicas en un mismo estudio. En 1979 dos trabajos fueron “detonantes” clave de los métodos mixtos: Trend (1979) y Jick (1979). El primero hizo un llamado a combinar el análisis de datos cuantitativos y cualitativos para resolver las discrepancias entre los estudios cuantitativos y cualitativos; y el segundo introdujo los conceptos básicos de los diseños mixtos, propuso recabar datos mediante técnicas cuantitativas y cualitativas, e ilustró la triangulación de datos; además de comentar la necesidad de obtener “una fotograía más enriquecedora y con mayor sentido de entendimiento de los fenómenos”. Como señalan Hernández Sampieri y Mendoza (2008), dos nociones fueron importantes para la concepción de la investigación mixta: la referente a la triangulación y la de utilización de varios métodos en un mismo estudio para incrementar la validez del análisis y las inferencias.
¿Qué significa medir?
La idea de la triangulación, la cual durante años impulsó el enfoque cualitativo al referirse a la triangulación de distintas fuentes para veriicar los datos, fue aplicada a los métodos cuantitativo y cualitativo. En su trabajo titulado: “Mezclando métodos cualitativos y cuantitativos: La triangulación en acción”, Jick (1979) propuso que cuando una hipótesis o resultado sobrevive a la confrontación de distintos métodos, tiene un grado mayor de validez que si se prueba por un único método. La utilización simultánea de diferentes procedimientos de indagación fue “catapultada” en la matriz de multimétodos-multirasgos de Campbell y Fiske (1959), 5
quienes sostenían que el hecho de utilizar varios métodos para medir las variables de interés incrementaba la validez convergente y discriminante del instrumento o instrumentos para recolectar los datos (Jacobson y Carlson, 1973; Jackson, 1977; Hubert y Baker, 1978). En los años de 1970 y 1980, se manifestó la denominada “guerra de los paradigmas”, tal vez en parte debida a la noción popularizada por Tomas Kuhn (1962) de los “paradigmas en competencia” en su libroLa estructura de las revoluciones científicas
(Teddlie y Tashakkori, 2009). El caso es que la rivalidad entre los seguidores del enfoque cuantitativo y cualitativo fue abierta, con los argumentos mencionados en el capítulo 1 del texto impreso “Deiniciones de los enfoques cuantitativo y cualitativo, sus similitudes y diferencias”. La tesis generalizada fue la de la “incompatibilidad de paradigmas”. En América Latina el debate resultó muy intenso, al grado que diversas instituciones separaron ísicamente a los investigadores de una u otra aproximación. La discusión se volvió dicotómica y se enfatizaron las diferencias entre constructivistas y positivistas en cuestiones ilosóicas como la ontología, epistemología, axiología, posibilidad de generalización y vínculos causales (Teddlie y Tashakkori, 2009). Hasta algunos autores en materia de metodología de la investigación incluyeron tablas que contrastaban al constructivismo y al positivismo (por ejemplo: Lincoln y Guba, 1985). La mayoría de los investigadores se adhirió a un enfoque único y consideró que el constructivismo y el positivismo como métodos, eran irreconciliables, porque provenían de paradigmas cuya lógica y premisas eran muy distintas, incluso opuestas (Hernández Sampieri y Mendoza, 2008). Tal incompatibilidad se asociaba con la supuesta conexión entre los paradigmas y los métodos de investigación. De acuerdo con esta idea, los paradigmas se vinculaban con los métodos en una especie de correspondencia “uno a uno”. Consecuentemente, si las premisas subyacentes de los paradigmas entraban en conlicto, los métodos relacionados con éstos no podían combinarse (Lincoln, y Guba, 1988; Teddlie y Tashakkori, 2009). Pero en la década de 1980, unos cuantos metodólogos e investigadores siguieron trabajando en la mezcla de ambas visiones a la investigación, por ejemplo: Connidis (1983) 5 El término triangulación proviene de la ciencia naval militar como un proceso que los marineros utilizan, y consiste en tomar varios puntos de referencia para localizar la posición de un objeto en el mar (Jick, 1979).
11
12
Capítulo 9Recolección de los datos cuantitativos
y Howe (1988). Greene, Caracelli y Graham (1989), así como Rossman y Wilson (1985) identiicaron varios motivos para usar la investigación mixta, tales como: enriquecer la información, triangular datos, complementar perspectivas, clariicar resultados, iniciar nuevos modelos de pensamiento, etcétera. Asimismo, el pospositivismo desplazó al positivismo y ello permitió mayor lexibilidad de algunos investigadores tanto cuantitativos como cualitativos, y la conceptualización de la triangulación se expandió (Hernández Sampieri y Mendoza, 2008). Por otro lado, el desarrollo de los métodos mixtos fue posible en parte a: 1) la introducción de una variedad de nuevos instrumentos metodológicos tanto cuantitativos
como cualitativos, 2) la vertiginosa evolución de las nuevas tecnologías para accesar y utilizar las herramientas metodológicas más fácilmente (hardware y software e internet), y 3) el incremento en la comunicación a través de las distintas ciencias y disciplinas. Para la década de 1990, el debate sobre los modelos mixtos “amainó” en el panorama internacional, pero en Iberoamérica fue sumamente conlictivo y se polarizaron opiniones: rechazo y aceptación, las cuales desafortunadamente se mantienen al comenzar el tercer lustro del presente siglo, más por desconocimiento de los detractores de la visión mixta que por otras cuestiones. Entre 1990 y 2000, en el mundo anglosajón, comenzó la institucionalización del enfoque mixto (Teddlie y Tashakkori, 2009). Tal hecho no hubiera ocurrido sin el surgimiento de un sustento ilosóico de los métodos mixtos: el pragmatismo (Hernández Sampieri y Mendoza, 2008), el cual representó una vía alternativa ante el pospositivismo y el constructivismo, ya que: 6
1. Rechaza la dicotomía entre dualismos tradicionales (racionalismo versus empirismo, realismo en contraposición al antirrealismo, libre albedrío vs. determinismo, etc.) (Teddlie y Tashakkori, 2009). El pragmatismo objeta la visión de que debe escogerse entre las dos categorías de la dicotomía sobre el contexto, va en contra tanto de que los resultados sean completamente especíicos de un contexto en particular como de que los resultados son una instancia de algún conjunto de principios generalizados (Hernández Sampieri y Mendoza, 2008). 2. Concibe a los paradigmas no solamente como visiones globales del mundo (entendimientos comunes sobre la “realidad” que afectan cada aspecto de la indagación cientíica), posturas epistemológicas (sistemas de creencias que inluyen la manera como son elaboradas y contestadas las preguntas de investigación) y sistemas de creencias compartidos por los miembros de un área del conocimiento (consenso sobre qué preguntas son las más signiicativas 6 Este paradigma toma diversas ideas de John
Peirce (1839-1914), entre otros.
Dewey (1859–1952), William James (1842-1910) y Charles S.
¿Qué significa medir?
y qué procedimientos son los más apropiados para responderlas); sino también como “ejemplos modelo de investigación”, lexibles respecto a la forma en que debe inquirirse en un campo determinado del quehacer cientíico (Hernández Sampieri y Mendoza, 2008). 3. Considera que el conocimiento es construido pero que también se basa en la realidad del mundo que experimentamos y en el cual vivimos (Teddlie y Tashakkori, 2009). 7
4. Se orienta a la “acción” más que a la discusión ilosóica (Teddlie y Tashakkori, 2009). 5. Endosa a la “teoría práctica”, a lo que funciona. 6. Refuerza el pluralismo y la compatibilidad (Johnson y Onwuegbuzie, 2004). 7. Adopta una aproximación hacia la investigación explícitamente orientada a valores, que se deriva de los valores culturales. 8
Este crecimiento de los métodos mixtos en la década de 1990 fue vertiginoso: Patton (1990) en el campo de la evaluación señaló las siguientes combinaciones de métodos: a) diseño experimental, datos cualitativos y análisis de contenido cuantitativo y cualitativo; b) diseño experimental, datos cualitativos y análisis estadístico; c) indagación naturalista (cualitativa), datos cualitativos y análisis estadístico; y d) indagación naturalista, datos cuantitativos y análisis estadístico. Morse (1991) delineó dos tipos de triangulación: simultánea y secuencial. Para esta autora, la triangulación simultánea (CUAN + CUAL o CUAL + CUAN) representaba usar al mismo tiempo métodos cualitativo y cuantitativo, con una interacción limitada entre las dos fuentes de datos al momento de la recolección de datos, pero en el momento
de interpretar los descubrimientos ambos métodos se podían complementar. Asimismo, la triangulación secuencial (CUAN → CUAL o CUAL → CUAN) era utilizada cuando los resultados de un enfoque resultaban necesarios para planear el método subsecuente. También, Janice Morse concibió el sistema utilizado hoy en día para simbolizar los diseños mixtos y propuso modelos. Steckler et al. (1992) propusieron cuatro modelos: • • • •
Modelo 1: métodos cualitativos para desarrollar medidas cuantitativas. Modelo 2: métodos cuantitativos para reforzar descubrimientos cualitativos. Modelo 3: métodos cualitativos para explicar descubrimientos cuantitativos. Modelo 4: métodos cuantitativos y cualitativos para ser usados por igual en paralelo.
Estas concepciones de lo que son los paradigmas provienen de Morgan (2008); así como Neal, Hammer y Morgan (2006). 8 Para profundizar un poco más sobre el pragmatismo, se sugiere ver el capítulo 12 del centro de recursos en línea: Ampliación y fundamentación de los diseños mixtos. 7
13
14
Capítulo 9Recolección de los datos cuantitativos
Dzurec y Abraham (1993), así como Sechrest y Sidana (1995), fortalecieron las razones para utilizar los métodos mixtos y agregaron otras, como facilitar el monitoreo de los datos recolectados, reducir la complejidad para entender los fenómenos bajo
estudio, innovar, obtener mayor signiicado de los datos, etcétera. En 1997 Richard Grinnell visualizó diseños especíicos, al igual que Creswell (1998). Tashakkori y Teddlie (1998) proporcionaron otras posibilidades para análisis en los diseños mixtos y revisan la reciente historia de los métodos mixtos. Durante esta década el enfoque mixto se aplica en diversos campos, como la Educación, la Comunicación, la Psicología, la Medicina y la Enfermería. Se realizan varios congresos para debatir el tema. Denzin y Lincoln (2000) presentaron una amplia discusión sobre la triangulación. Creswell, Plano Clark, Guttman y Hanson (2003) proponen una tipología de diseños mixtos. Tashakkori y Teddlie (2003) efectúan una revisión del estado del arte en la materia. En el 2004 y 2005 se realizan diversas revisiones de las posibilidades del enfoque mixto (Creswell, 2005; Mertens, 2005; Grinnel y Unrau, 2005). Mertens (2005, pp. 8 y 9) compara los paradigmas presentados en el presente capítulo, haciéndose las siguientes preguntas: La pregunta relativa a la realidad (ontológica): ¿cuál es la naturaleza de la realidad? (¿cómo se concibe?). 2. La pregunta sobre la naturaleza del conocimiento y la relación entre el investigador y el fenómeno estudiado (epistemológica): ¿cómo son concebidos el conocimiento y la relación entre el investigador y el fenómeno estudiado? 3. La pregunta sobre el método: ¿de qué manera el investigador obtiene el conocimiento deseado y comprende el fenómeno? 1.
Hemos adaptado las respuestas en la tabla 1.1. Cabe señalar que en octubre de 2003, la prestigiada publicación British Educational Research Journal editó un número especial para celebrar e incluir “algunos de los mejores
estudios recientes” en el campo de la investigación educativa, ocho en total, de los cuales
seis eran mixtos (Scott, 2007).9 Asimismo, en 2007 se comenz ó a public ar la revista Journal of Mixed Methods Research . En 2010 se publica la segunda edición de la obra SAGE Handbook of Mixed Methods in Social & Behavioral Research, que hace notables aportaciones para estructurar el campo de la investigación híbrida. En años recientes (2010 a 2014), el incremento en los textos de metodología mixta 9
La fuente srcinal en la cual se basó Scott (2007) fue: Gorard, S. y Taylor, C. (2003).“In praise of educational
research”,British Educational Research Journal , 29, 5, 619–622.
¿Qué significa medir?
Tabla 1.1 Principales paradigmas en la investigación Características y supuestos Etiquetas asociadas con el paradigma
P os p os i t i v i s m o
Co n s t r u c t i v i s t a
Tr a n s f o r m a t i v o
Experimental
Naturalista
Teoría crítica
Cuantitativo
Fenomenológico
Neomarxista
Causal
Hermenéutico
Feminista
Comparativo
Interaccionista simbólico (interactivo)
Participativo
P r a g m á t i co Métodos y modelos mixtos o híbridos
Emancipatorio
Etnográfico Cualitativo Supuesto de realidad
Una realidad conocida en términos de probabilidad
Múltiples realidades construidas socialmente
Múltiples realidades formadas por el contexto social, político, económico, cultural y étnico
Lo que es útil para explicar integralmente un fenómeno es lo verdadero
Supuesto del conocimiento y relación entre el investigador y el fenómeno
La objetividad es importante, el investigador observa, mide y manipula variables; trata de desprenderse de sus tendencias
El conocimiento es interactivo, producto del vínculo entre el investigador y los participantes o fenómeno. Los valores y tendencias de todos los involucrados son hechas explícitas, generan descubrimientos
El conocimiento es interactivo, producto del vínculo entre el investigador y los participantes o fenómeno. Se sitúa social e históricamente
Las relaciones entre el investigador y el fenómeno o participantes del estudio, están determinadas por lo que el investigador considera como apropiado para cada estudio en particular y por el contexto
Supuesto metodológico
Básicamente cuantitativo e intervencionista
Básicamente cualitativo, hermenéutico y dialéctico
Con bases cualitativas, pero pueden utilizarse métodos cuantitativos y mixtos. Los factores históricos están incluidos
El método depende del planteamiento específico del estudio. Son válidas las técnicas cuantitativas, cualitativas y mixtas
ha sido considerable, los nombres de los pioneros en esta materia, como John Creswell, Abbas Tashakkori, Alan Bryman, Donna Mertens, Janice Morse, Michael Patton, Jennifer Greene, Richard Grinnell, Charles Teddlie, etc., seguirán dando de qué hablar. En América Latina, la propuesta de los métodos mixtos ha provenido, desde 1993, de algunos autores y se ha consolidado en el trabajo de Hernández Sampieri y Mendoza (2008). El siglo XX inició con un enfoque principal, el cuantitativo, y culminó con dos enfoques fundamentales: cuantitativo y cualitativo. No es el caso de que uno sustituyera al otro, sino que el segundo se agregó al primero. El siglo XXI comenzó con una tercera vía (que se vino gestando desde décadas atrás): el enfoque mixto. Los próximos años son fundamentales para que este adolescente (o híbrido) siga consolidándose.
15
capítulo
2
Ética en la investigación
La investigación involucra a seres humanos La investigación en cualquier rama siempre involucra a seres humanos en diferentes roles: como realizadores (investigadores), participantes (sujetos del estudio) y/o usuarios (desde simples lectores de los informes en distintos formatos hasta quienes utilizan los reportes para desarrollar nuevas investigaciones o tomar decisiones). En el caso de las ciencias de la salud, las administrativas y sociales, o aquellas donde se consideran procesos en los que participan individuos, la implicación es en los tres papeles. Veamos algunas cuestiones éticas respecto a cada rol.
Aspectos éticos de los seres humanos como participantes Como participantes las personas son medidas, observadas, evaluadas y/o analizadas. Aun cuando estas tareas sean indirectas (por ejemplo: revisión de registros escolares, cartas y materiales audiovisuales), se les involucra. Y desde luego, tienen derechos como sujetos de un estudio. Por ello, los aspectos éticos son sumamente relevantes.
Respeto a los derechos de los participantes odos los seres humanos nacemos libres y con los mismos derechos. Debemos ser tratados con idéntico respeto, fraternidad y dignidad. Estos principios consignados en la Declaración Universal de los Derechos Humanos de 1948, guían la investigación en todas las disciplinas (Bell, 2008). al documento y varios principios éticos en las ciencias fueron reforzados en gran parte como consecuencia del Código de Nuremberg, desarrollado en 1947, y el cual, a su vez, resultó del juicio a 23 científicos nazis que habían realizado experimentos atroces con diferentes prisioneros de campos de concentración (Lurie, 2010).1 A partir de entonces, se han generados diversos documentos, como la Declaración de Helsinki de 1964 y otros códigos éticos y de conducta que consideran que los participantes en una investigación tienen al menos los siguientes derechos:2 1
Los acusados estaban encabezados por Karl Brandt, médico personal de Hitler. De los 18 condenados se ahorcó a siete y los 11 restantes recibieron condenas desde diez años hasta cadena perpetua (Coronado, Alfaro y Ramírez, 2006). 2 Por ejemplo: The Belmont Report de 1979 (surgido a partir de los excesos de experimentos de la CIA), The Ethical Guidelines for Good Research Practice de la Association of Social Anthropologists of the UK and the Commonwealth (ASA) (1999), International Ethical Guidelines for Biomedical Research Involving Human Subjects (en 2002), The Code: Standards of Conduct, Performance and
2
Capítulo 9Recolección de los datos cuantitativos
•
•
•
Estar informados del propósito de la investigación, el uso que se hará a los resultados obtenidos y las consecuencias que puede tener en sus vidas. Negarse a participar en el estudio y abandonarlo en cualquier momento que así lo consideren conveniente, así como negarse a proporcionar información. Cuando se utiliza información suministrada por ellos o que involucra cuestiones individuales, su anonimato debe ser garantizado y observado por el investigador (Ogden, 2008b). Por ejemplo, podemos usar datos de un censo sin tener que pedir la aprobación de toda la población incluida, pero estos datos no son individuales ni personales. Comstock (2013), deRoche y deRoche (2009) y Wiersma y Jurs (2008) identifican dos aspectos
relacionados con tales derechos: •
•
•
Consentimiento o aprobación de la participación. Además de conocer su papel en una investigación específica, es necesario que los participantes proporcionen el consentimiento explícito acerca de su colaboración (preferentemente por escrito) (Owens, 2010). Las formas de aprobación deben adaptarse a los requerimientos legales de la localidad donde se lleve a cabo la investigación (en varios países no existe todavía una regulación en la materia, entonces debemos explicitar en el documento algo así como: Yo, nombre de la persona, consiento o apruebo participar en el estudio —nombre de éste— de manera voluntaria y en el pleno uso de mis facultades físicas y mentales…). En el caso de menores de edad se requiere la autorización de los padres de familia o tutores y de los propios niños o jóvenes participantes (por escrito). Si, además, se involucra a una o varias instituciones, se requiere también de la aprobación de su representante legal (por ejemplo, en escuelas, empresas, asociaciones, centros deportivos o comerciales). A veces, por cuestiones de tiempo, podemos tener una sola forma con la leyenda o frase de anuencia y espacios para que cada participante la firme (formato colectivo). Esto es muy común en encuestas. De igual manera, en una parte del cuestionario se puede agregar un breve mensaje: “el responder a este cuestionario implica su autorización para participar en el presente estudio”. El consentimiento depende de qué tan efectivos seamos al presentar los objetivos de la investigación. Asimismo, si vamos a grabar a los participantes (audio y video), ellos deben aprobar tal acción. odo lo anterior aplica también cuando se usa internet para recolectar datos e información. En Estados Unidos, y de acuerdo con McNutt (2007), los formularios de consentimiento informado utilizados una afirmación contundente y clara de que la participación es voluntaria. Confidencialidad y anonimato. Se refiere a que no se revele la identidad de los participantes ni se indique de quiénes fueron obtenidos los datos (Ogden, 2008c y Kennedy, 2008). Por ejemplo, en un estudio del clima organizacional que hace patentes aspectos delicados de una empresa como la moral interna y la motivación, no resulta conveniente señalar el nombre de la organización, salvo que así lo soliciten la directiva y los representantes de los trabajadores. En el caso de una investigación cualitativa en que se manifiestan sentimientos profundos, la confidencialidad debe ser absoluta ya que es una promesa que se hace a los participantes. En una ocasión, el autor principal de esta obra efectuó un estudio sobre clima laboral y los directivos quisieron que les proporcionara los nombres de quienes habían evaluado desfavorablemente a la empresa, por supuesto, la negativa a tal petición fue rotunda, lo que significó la renuncia inmediata y sin concesiones. raicionar la confianza de los participantes es una seria violación a los principios de la ética y la moral… es inaceptable. En el caso de los materiales de audio y video, éstos nunca podrán ser mostrados a personas ajenas al equipo de investigación, cuyos miembros se comprometen por escrito a nunca revelar la identidad de los participantes ni enseñar los materiales. Se deben guardar en un lugar seguro y destruirse en un tiempo razonable. Los participantes deben decidir cuándo eliminarse. Por lo anterior, en la investigación se utilizan seudónimos y no nombres reales de los sujetos involucrados.
Ethics for Nurses and Midwives (de 2008) y The American Psychological Association's Ethical Principles of Psychologists and Code Conduct (2010), el cual es revisado periódicamente desde el decenio de 1960. Su página es: http://www.apa.org/ethics/code/index.aspx.
¿Qué significa medir?
Otro elemento importante es el respeto a la privacidad de los participantes, no podemos entrometernos en las vidas de las personas (Ogden, 2008a). Cuando se filma abiertamente (por ejemplo, en un parque o un centro comercial), por lo regular las conductas de las personas son públicas (observadas por otros) y no es una situación crítica (de hecho, las cámaras de seguridad graban de forma permanente el comportamiento de los individuos que transitan por el lugar), pero dentro de un hogar, en una escuela o un hospital, debemos obtener la autorización de los gatekeepers y de los participantes, quienes al principio estarán conscientes del hecho, pero paulatinamente se olvidarán de éste, normalmente no se afecta la calidad de los resultados si se procede con cuidado y profesionalismo. El investigador está obligado a proteger a los participantes de riesgos, daños y amenazas que pudieran afrontar ellos y el equipo de investigación (Ogden, 2008e). Cualquier cuestión que los pue3
da afectar física y/odebatida mentalmente, deamenazas manera irreversible reversible,ocurre debe cancelarse. Una cuestión sobre las potencialesoaaún participantes frecuentemente en la medicina, pues siempre hay una primera persona que se expone a un nuevo tratamiento o medicamento y corre un riesgo elevado. al fue el caso de una bebé (Eileen Saxon y sus padres), quien en 1944 debió someterse en el hospital Johns Hopkins a una operación innovadora para su época y que la comunidad médica de ese entonces, en su mayoría, concebía como algo casi imposible. La cirugía implicó ensamblar una arteria que se dirigía al corazón a una arteria que conducía a los pulmones, en una tentativa de dar a la sangre una segunda oportunidad para su oxigenación. Esta primera operación del “bebé azul” vino a ser conocida como la desviación de Blalock-aussig. La intervención quirúrgica era parte de una investigación. El dilema para el médico cirujano-investigador y su asistente (doctor Alfred Blalock y Vivien Tomas, respectivamente) fue que para continuar el estudio y salvar muchas vidas, se necesitaba efectuar la cirugía, que evidentemente colocaba en riesgo a la pequeña participante. ¿Qué hacer en estos casos? La respuesta es compleja. En el ejemplo todo resultó bien y la operación de la bebé (cuya esperanza de vida era de unos meses) fue un éxito.4 Pero no siempre ocurre así, porello, el doctor Roberto Hernández Galicia recomienda que en estos casos deben agotarse todas las demás posibilidades antes de seguir adelante, minimizarse los riesgos, experimentar con animales (con el debido cuidado y apego a las leyes que los protegen) hasta que los procedimientos estén asegurados y así seestudio evite que sea el egolos delderechos investigador quienpor “guíe” las decisiones. ambién es importante que en todo se observen de respeto la dignidad humana, la igualdad, la autonomía individual y la libertad de expresión (los participantes deben poder manifestarse abierta y libremente), así como la justicia y el acceso a la información (Serago et al., 2009; Lo, 2009; Bell, 2008; e Israel y Hay, 2006). Adicionalmente, mencionaremos que es conveniente que los participantes reciban “algo” en reciprocidad de su involucramiento en un estudio, un beneficio (Ogden, 2008f). Por ejemplo, capacitación, información, un regalo, ayuda de algún tipo (como una terapia, soporte emocional después de que el estudio concluyó, una consulta médica, consejos, entre otros), recursos económicos (aunque como señala Creswell, 2009, este financiamiento no debe ser excesivo), un reconocimiento (un diploma, una carta) o al menos, un agradecimiento particularizado. Asimismo, es sumamente importante que conozcan los resultados finales de la investigación, asunto que en los estudios cualitativos es necesario para garantizar la calidad de éstos. Cuando se recolectan opiniones, especialmente en un estudio cualitativo, debemos intentar incluir todas las voces y puntos de vista de los diferentes actores y grupos sociales. No podemos marginar a ciertas personas. Asimismo, en la investigación no tienen cabida el racismo o la discriminación. odos los participantes, sin importar el género, nivel socioeconómico y srcen étnico, son igualmente importantes y merecen mismo respeto. Otro aspecto es que,el normalmente la institución que encarga un estudio, para verificar la calidad de la información, solicita los ejemplares de los instrumentos contestados por los participantes (por ejemplo cuestionarios) y las bases de datos, ¿qué debemos hacer? La ética de la investigación marca que tenemos que entregarlos a quien o quienes solicitaron el estudio, pero ellos también deben compro3
Este principio es conocido ampliamente como “no maleficencia” e incluye cuestiones físicas, psicológicas y morales (incluyendo la reputación) (Herrera, 2010 y Ogden, 2008d). 4 Hernández Galicia (2005).
3
4
Capítulo 9Recolección de los datos cuantitativos
meterse a respetar los principios esbozados previamente, a no utilizar información para perjudicar a algún participante y mantener la confidencialidad (en el ejemplo de la investigación del clima laboral mencionado previamente debe pactarse, desde antes de que se inicie la recolección de los datos, que no se entregarán ejemplares de los instrumentos si hay forma de saber quién respondió). Incluso, cuando se captura en un medio electrónico (internet, intranet, cuestionario en PC, etc.), debe llevarse un registro del momento en que se recabó la información. ransparencia es el “nombre del juego”. Otros conceptos o cuestiones éticas que deben observarse respecto a los participantes, algunas de las cuales están vinculadas con las expuestas anteriormente en es 5te capítulo, se incluyen en la tabla 2.1.
Aspectos éticos de los investigadores Además de considerar y observar los principios éticos con los participantes, los investigadores Tabla 2.1 Cuestiones éticas adicionales
Cuestión
Comentario
Sensibilidad
El investigador debe ser sensible a las ideas, características, inclinaciones y preferencias de los participantes, mostrando respeto y evitando criticar a los individuos. Esto es particularmente necesario en el caso de cuestiones como la conducta sexual, la religión y los valores personales. También debe mostrarse una gran sensibilidad y respeto a la cultura de los sujetos del estudio (Low, 2008).
Confianza
El investigador debe ganarse la confianza de cada participante; una vez lograda, ello implica una seria responsabilidad. A lo largo del estudio tiene que demostrar a los sujetos que se puede confiar en él (Haggerty, 2008).
Decepción
Es importante no decepcionar a los participantes con el estudio (O'Neill, 2008). Siempre tenemos que hablarles con claridad sobre los beneficios o ventajas de participar en el estudio y nunca prometer algo que no pueda cumplirse ni levantar las expectativas más allá de la realidad.
Reciprocidad
Este concepto se refiere a un equilibrio entre lo que se le solicita a un participante y lo que se le otorga. En la medida de lo posible, es conveniente que se mantenga tal equilibrio y esto se relaciona con los beneficios que reciban los sujetos del estudio (desde conocimiento hasta una compensación económica) (Crow, 2008 y Goodyear, 2004).
Vulnerabilidad
Algunos participantes son más vulnerables que otros al contexto de la investigación o al proceso mismo por sus características o condiciones, lo cual se debe tomar en cuenta. Especialmente tratándose de aspectos médicos, psicológicos o legales (Duffy, 2008). Ejemplos de grupos o poblaciones vulnerables son las mujeres embarazadas, los enfermos, aquellos seres humanos que viven en condiciones de pobreza y marginalidad, las personas de edad avanzada, los individuos con trastornos mentales o capacidades diferentes y desde luego, los menores de edad.
Presión o coerción
Nunca debe presionarse ni la participación en un estudio ni la inducción de respuestas.
Imparcialidad
Es una(Kushner, postura que todoNoinvestigador debe mantenera en cualquier estudio 2004). se puede dar preferencia algún individuo o grupo de participantes sobre otro (por ejemplo, a quienes están en una condición experimental).
Legalidad
Todo estudio debe conducirse de manera legal y con estricto apego a las normas.
¿Qué significa medir?
también deben estár sujetos a otros criterios. El primero de éstos es la honestidad o integridad (Dik, 2006 y Fitzpatrick, 2004), lo cual implica: 1) adherirse a los datos, resultados y hechos, 2) no manipular información , 3) veracidad en el reporte de resultados (Comstock, 2013, Smith y Li-Ching, 2008 y AagaardHansen y Johansen, 2008), 4) describir a detalle el método y resultados y 5) asegurar que los colaboradores no incurran en falsificación en la recolección, codificación y análisis (Guterbock, 2008) . Asimismo, involucra citar apropiadamente las referencias bibliográficas y no incurrir en piratería o plagio. Previamente se había comentado que nunca se debe poner en riesgo tanto a los participantes como al equipo de investigación. Respecto a lo segundo, el investigador es responsable de la seguridad de sus colaboradores (Hughes, 2008). Por ejemplo, tiene que vigilar que en los casos necesarios (como en un experimento con sustancias químicas o en el cual se utilizan materiales delicados) todos utilicen los equipos de seguridad requeridos. Asimismo, no debe exponer a alguien a amenazas o peligros. Por ejemplo, hace algunos años un grupo de investigadores realizó un estudio en una prisión para evaluar los factores que contribuyen a la readaptación positiva de los reos a la sociedad. En este trabajo participaron estudiantes. Cuando concluyó la etapa exploratoria, uno de los investigadores les pidió a los alumnos que obtuvieran información sobre la corrupción dentro de la cárcel, lo cual obviamente ponía en un severo riesgo a los jóvenes; eso es algo que resulta inadmisible. Se impidió que tal situación se presentara, pues si al investigador le interesaba el fenómeno de la corrupción, él mismo debía investigarlo bajo su propia responsabilidad. Otro ejemplo ilustrativo sucedió en 2011: nueve encuestadores fueron secuestrados en un municipio de la provincia de Michoacán en México mientras recolectaban datos sobre preferencias en una elección para la alcaldía. Afortunadamente, su liberación ocurrió pocos días después (Martínez, 2011 y Milenio, 2011). En situaciones donde el clima social sea crítico, violento y riesgoso debe evitarse enviar a investigadores, encuestadores y observadores. Adicionalmente, ellos deben contar con seguros médicos y de vida. En el caso de estudiantes que levantan información en el campo, resulta indispensable que los seguros escolares cubran esta actividad. Por otra lado, un elemento muy importante es el evitar un conflicto de intereses (Herrera, 2010, deRoche y deRoche, 2009 y Fitzpatrick, 2004). Resulta relevante asegurar que ningún interés pueda influir el estudio (desde el planteamiento hasta los resultados). Incluso, diversas revistas científicas solicitan explícitamente una declaración de no conflicto de intereses. Por ejemplo: “El autor(a) (o los autores) declara(n) que no hay conflictos de interés potenciales con respecto a la autoría y/o publicación de este trabajo (artículo, libro, etc.)”. Conflicto de intereses Se presenta cuanSobra señalar que todo lo anterior se aplica no sólo al investigado un investigador o alguien que finandor sino a todo el equipo que colabora en el estudio. cia el estudio tienen un interés personal
Aspectos éticos de los usuarios
que puede influir negativamente en la búsqueda de la verdad en el proceso de investigación.
ambién el usuario o consumidor de la investigación debe apegarse a cuestiones éticas. iene que utilizar los resultados para el bien común y la justicia, así como tomar decisiones éticas con un alto y genuino sentido de responsabilidad social. Desde luego, no siempre ocurre así. Hay empresas, agencias y gobiernos que han patrocinado estudios y utilizado los resultados de investigaciones para injuriar al prójimo, destruir ciudades, desarrollar medicamentos dañinos, etcétera… es una lástima. Desde un punto de vista personal, el conocimiento no debe generarse si implica lastimar a seres humanos o a la sociedad. Para una discusión sobre el tema “ciencia versus las personas” se recomienda a deRoche y deRoche (2009).
5
6
Capítulo 9Recolección de los datos cuantitativos
Respeto al lugar donde se efectúan las investigaciones El contexto en el cual se conducen las investigaciones debe ser respetado. Primero, obteniendo los debidos permisos para acceder al lugar de parte de personas autorizadas (gatekeepers). Segundo, al observar y cumplir con las reglas del sitio y recordar que somos “invitados”, por lo cual tenemos la obligación de ser amables, cooperativos, cordiales y respetuosos de las personas, sus creencias y costumbres.
Los comités de investigación odas las universidades, colegios, asociaciones e instituciones de todo tipo, deben integrar comités o figuras que vigilen que se observe cuidadosamente la ética de la investigación. Desafortunadamente en América Latina estamos rezagados en esta materia. Para ampliar este último tema y lo expuesto en el capítulo se recomiendan las siguientes referencias: Comstock (2013), deRoche y deRoche (2009), Aagaard-Hansen y Johansen (2008), Larkin, de Casterlé y Schotsmans (2008); y Watson, Jones y Burns (2007), además de la bibliografía citada. Para el tema de la ética en la investigación en ciencias de la salud se recomienda a Iltis (2007).
capítulo
3
Perspectiva teórica: comentarios adicionales
Introducción Este capítulo complementa al capítulo 4 de Metodología de la investigación, 6ª edición, parte impresa: “Desarrollo de la perspectiva teórica: revisión de la literatura y construcción del marco teórico”. Se profundiza en los conceptos relativos a la teoría, sus funciones, valor y criterios para evaluar distintas teorías. Asimismo, se amplían las diferentes fuentes que alimentan la búsqueda de la literatura (particularmente en internet) y el desarrollo de una perspectiva teórica. Además, se ejemplifican los diversos tipos de información que podemos obtener de las referencias y la extensión que es recomendable para el marco teórico. Finalmente, se comentan las principales enciclopedias que pueden ayudarnos a integrar nuestros marcos teóricos y el capítulo de método en el reporte de investigación.
Teorías: amp liación de conceptos Profundicemos en conceptos relativos a las teorías.
Acepciones del término teoría El término “teoría” se utiliza de diferentes formas para indicar cuestiones distintas. Cuando revisamos la literatura al respecto, nos encontramos con definiciones contradictorias o ambiguas; además, ocasionalmente, conceptos como teoría, orientación teórica, marco teórico de referencia, esquema teórico o modelo se usan como sinónimos y otras veces con leves matices diferenciales (Sjoberg y Nett, 1980, p. 40). En ocasiones, con teoría se indica una serie de ideas que una persona tiene respecto de algo (“yo tengo mi propia teoría sobre cómo educar a los hijos”). Otra concepción considera a las teorías como conjuntos de ideas no comprobables e incomprensibles, que están en las mentes de los científicos, y que tienen muy poca relación con la “realidad” (Black y Champion, 1976). Con frecuencia, las teorías se perciben como algo totalmente desvinculado de la experiencia cotidiana. Hay incluso quienes piensan que, debido a que no tratan “problemas relevantes” de la vida
2
Capítulo 3PERSPECTIVA TEÓRICA: COMENTARIOS ADICIONALES
diaria (por ejemplo, cómo conseguir trabajo o hacerse millonario, conquistar a una persona, ganar dinero en un casino, tener una vida matrimonial feliz o superar una tragedia), no son de utilidad. De acuerdo con este punto de vista, solo cuando las teorías explican cómo vivir mejor deben tomarse en cuenta seriamente. Al respecto, cabe señalar que en ocasiones las teorías se relacionan con cuestiones cotidianas mediante los estudios que sirvieron para establecerlas, desarrollarlas y perfeccionarlas. Por ejemplo, la satisfacción en el matrimonio puede ser explicada por la concurrencia de varias teorías e investigaciones: teoría de la atribución, teoría de la reducción de la incertidumbre, teoría del intercambio de afecto y otras relativas a las relaciones interpersonales (Celenk y van de Vijver, 2013 y Baxter y Braithwaite, 2008), así como por distintos modelos y estudios empíricos. ambién hay quienes creen que la teoría representa simples ideas para las cuales no se han creado procedimientos relevantes conmística. el fin deDesde medirlas recolectar datos sobre ellas.que Estase concepción confiere a laempíricos teoría cierta cualidad esta operspectiva, la información obtiene de la realidad sobre una proposición teórica sirve únicamente para ser refutada, porque no captura toda la esencia o el “corazón” u otra cualidad no mensurable del fenómeno que se investiga (Black y Champion, 1976). Una vez que “un fenómeno es mensurable, observable o se puede recolectar información sobre él, deja de ser importante desde el punto de vista teórico”. Para los que están de acuerdo con este enfoque, en apariencia lo teórico es lo que no se puede medir, que escapa al escrutinio empírico. En consecuencia, no importa cuánta investigación se lleve a cabo, ésta siempre resulta “teóricamente irrelevante” o, al menos, de trascendencia secundaria. Estas interpretaciones, a nuestro juicio erróneas, han provocado controversias y conducido a la investigación por diferentes caminos. Algunos científicos del comportamiento humano identifican cualquier clase de conceptualización con teoría. Conceptos como nacionalismo, cultura, medios de comunicación colectiva, opinión pública, cambio climático, etc., cuando se definen y utilizan para interpretar materiales de investigación, se equiparan con la teoría social (Sjoberg y Nett, 1980). Así, se habla de teoría de la opinión pública, teoría de la información, teoría de la socialización, entre otras. Otro uso del término teoría es el de pensamiento de algún autor; se identifica la teoría con los textos de autores clásicos como Karl Marx, Max Weber, Émile Durkheim, Burrhus Frederic Skinner, Albert pero Einstein, Sigmund Freud y Stephen Hawking. ales personajesigualar pudieron haber propuesto teoría, no todo su pensamiento lo es. Considerarlo así implicaría el concepto “teoría” una con “historia de las ideas” (Sjoberg y Nett, 1980). Como parte de esta noción de teoría, algunos utilizan el término como sinónimo de “escuela de pensamiento”. Asimismo, hay quienes la conciben como esquema conceptual (Ferman y Levin, 1979). En tal sentido, la teoría se considera un conjunto de conceptos relacionados que representan la naturaleza de una realidad. Por ejemplo, en psicología social, los esquemas de la figura 3.1, que relacionan varios conceptos, se suponen como representaciones teóricas motivacionales de la agresión. Como cualquier tipo de esquemas, los modelos conceptuales que representan teorías no guardan toda la riqueza que estas poseen. Los esquemas de la figura 3.1, si bien relacionan conceptos —incluso secuencialmente— y proporcionan un panorama de las razones por las cuales surge la agresión, no especifican cómo se relacionan todos los conceptos entre sí, pues solo se establece que cada concepto tiene un efecto sobre otro. Por ejemplo, el tercer esquema (teoría del aprendizaje social) no nos indica si las experiencias negativas o aversivas y las inducciones del estímulo están relacionadas entre sí; tampoco se menciona cómo se provoca la reacción final; se sabe que depende de la excitación emocional y de las consecuencias anticipadas, pero no se concreta qué tipo de consecuencias está asociado con la dependencia o con la agresión, la resolución constructiva del problema, etc.; tampoco se precisa si la cantidad de experiencias negativas es directamente proporcional a la excitación emocional. Así, el esquema es tan solo una guía para comprender la agresión, aunque no ofrece todos los elementos para entenderla a fondo. Lo mismo sucede con los otros esquemas que, aunque son más sencillos, solo relacionan conceptos. El segundo, por ejemplo, no señala si a mayor frustración corresponde mayor impulso agresivo; o a mayor frustración, menor impulso agresivo. En efecto, en este caso, ya sea por nuestra lógica o porque estamos familiarizados con el fenómeno, sabemos que lo primero es lo que ocurre normalmente
3
Tabla 3.1 Esquematización de análisis motivacionales alternativos de la agresión3 Teoría del instinto •
Instinto agresivo
•
Conducta agresiva
•
Conducta agresiva
Teoría del impulso •
Frustración
Impulso agresivo
Teoría del aprendizaje social •
•
Experiencias de aversión
•
Excitación emocional
•
•
Dependencia Ejecución Privación y resignación Agresión
• •
•
Inducción del estímulo
•
Consecuencias antcipadas
•
Psicomatización Autoanestesia con drogas y alcohol Resolución constructiva del problema
(a mayor agresión, corresponde mayor impulso agresivo y mayor probabilidad de que se presente una conducta agresiva más intensa). Pero esto se debe a nuestro conocimiento obtenido de otras fuentes, no únicamente al esquema.
La definición científica Por último, otros investigadores conceptúan la teoría como explicación final o conocimiento integral que nos ayuda a comprender fenómenos, situaciones, eventos y contextos (Babbie, 2012). Según esta acepción, la teoría consiste en un conjunto de proposiciones vinculadas lógicamente, capaces de explicar por qué y cómo ocurre un fenómeno, es decir, proporcionar un sentido de entendimiento de este. El significado de teoría que ha sido adoptado en el presente libro desde su primera edición ha sido precisamente este último, el cual se encuentra manifiesto, en mayor o menor grado, en otros autores, por ejemplo: Una teoría es un conjunto de proposiciones vinculadas sistemáticamente que especifican relaciones causales entre variables ( Te SAGE Glossary of the Social and Behavioral Sciences, 2009m, Kerlinger y Lee, 2002 y Black y Champion, 1976). Las teorías no solo consisten en esquemas o tipologías conceptuales, sino que contienen proposiciones semejantes a leyes que vinculan dos o más conceptos o variables simultáneamente. Más aún, estas proposiciones deben estar interrelacionadas entre sí (Maxwell y Mittapalli, 2008, y Blalock, 1985). Una explicación unificada y sistemática respecto de un fenómeno (Creswell, 2013a, y Schwandt, 2007). Un último comentario sobre las teorías como forma de consumar una explicación es que pueden acompañarse de esquemas, diagramas o modelos gráficos, los cuales son utilizados por muchos autores porque resultan convenientes para fines didácticos y para ilustrar los conceptos teóricos más importantes. El hecho de que un esquema conceptual no especifique varios aspectos de la teoría a la que hace referencia, y que no sea una explicación completa del fenómeno, no significa que carezca de utilidad. Simplemente se menciona que es uno de los significados que se le ha dado al término “teoría”. Muchos esquemas conceptuales suelen ser acompañados por explicaciones adicionales que ayudan a compren•
•
3
Extraído de Bandura (1978, p. 17). Vigencia consultada en Bandura, Ross y Ross (2013).
4
Capítulo 3PERSPECTIVA TEÓRICA: COMENTARIOS ADICIONALES
der un fenómeno; tal es el caso de la teoría del aprendizaje social y la agresión (Bandura, 1977 y 1978). Con frecuencia, en la investigación cualitativa se produce “teoría fundamentada” que explica un fenómeno en un contexto específico (local) y es generada por datos narrativos (Te SAGE Glossary of the Social and Behavioral Sciences, 2009n y eddlie y ashakkori, 2009). Esta cuestión se explica en el capítulo 15 del texto impreso.
¿Cuáles son las funciones de la teoría o para qué es útil? La función más importante de una teoría es explicar: decir por qué, cómo y cuándo ocurre un fenómeno. Por ejemplo, una teoría de la personalidad autoritaria debe explicarnos, entre otras cuestiones, en qué consiste este tipo de personalidad, cómo surge y por qué una persona imperiosa se comporta de cierta manera ante determinadas situaciones. Una segunda función consiste en sistematizar o dar orden al conocimiento sobre un fenómeno, planteamiento o realidad, conocimiento que en muchas ocasiones es disperso y no se encuentra organizado. Otra función, muy asociada con la de explicar, es la de predecir. Es decir, hacer inferencias a futuro sobre cómo se va a manifestar u ocurrir un fenómeno dadas ciertas condiciones. Por ejemplo, una teoría adecuada de la toma de decisiones de los votantes debe indicar cuáles son los factores que afectan al voto y, con base en información válida y confiable respecto de dichos factores, en relación con un contexto determinado de votación, predeciría qué candidato triunfará en esta. Así, la teoría proporciona conocimiento de los elementos que están relacionados con el fenómeno sobre el cual se habrá de efectuar la predicción. Si hubiera una teoría precisa sobre los temblores, se sabría con exactitud qué factores provocan los sismos y cuándo es probable que ocurran. Por lo tanto, en el caso de que alguien familiarizado con la teoría observara que estos factores se presentan y los midiera con exactitud, podría predecir la ocurrencia de este fenómeno, así como el momento en que sucedería. Con frecuencia, para la explicar y predecir ciertos fenómenos, se requiere de la concurrencia de varias teorías, una para cada aspecto del hecho (Neuman, 2009, y Yurén Camarena, 2000). Hay fenómenos que, por su complejidad, requieren de varias teorías para predecirse: la órbita de una nave espacial, la productividad de un individuo (donde requeriríamos teorías de la motivación, la satisfacción laboral, el desarrollo de habilidades, el desempeño y otras), el grado de satisfacción de los cónyuges en una relación marital, el srcen de la vida, el calentamiento global, la extinción de los dinosaurios, la resistencia estructural de los edificios en zonas sísmicas, etc. Sin embargo, es indudable que una teoría incrementa el conocimiento que tenemos sobre un fenómeno o realidad.
¿Todas las teorías son igualmente útiles o algunas son mejores que otras? odas las teorías construidas mediante investigaciones adecuadas aportan conocimiento y, en ocasiones, enfocan los fenómenos que estudian desde ángulos diferentes (Littlejohn y Foss, 2011), pero algunas se encuentran más desarrolladas que otras y cumplen mejor con sus funciones. Para decidir el valor de una teoría, se cuenta con varios criterios, principalmente:4 1. Capacidad de descripción, explicación y predicción. 2. Consistencia lógica. 3. 4. 5.
4
Perspectiva. Innovación‐inventiva (fructificación heurística). Sencillez (parsimonia).
Con aportaciones de Babbie (2012), Kerlinger y Lee (2002) y Ferman y Levin (1979).
5
Capacidad de descripción, explicación y predicción Una teoría debe ser capaz de describir, explicar y predecir el fenómeno o los fenómenos a que hace referencia. Describir implica varias cuestiones: definir el fenómeno, sus características y componentes, así como delimitar las condiciones y los contextos en que se presenta, y las distintas maneras en que llega a manifestarse. Describir también implica claridad conceptual. Explicar tiene dos significados importantes. En primer término, implica poseer una forma de entender las causas del fenómeno. En segundo término, se refiere a “la prueba empírica” de las proposiciones de la teoría. Si estas se encuentran apoyadas por los resultados, “la teoría subyacente debe supuestamente explicar parte de los datos”. Pero si las proposiciones no son confirmadas por la realidad, la teoría no se considera como una “explicación efectiva” (Ferman y Levin, 1979). La predicción está asociada con este segundo significado de explicación, que depende de la evidencia empírica de las proposiciones de la teoría. Si estas poseen un considerable apoyo empírico (es decir, han demostrado que ocurren una y otra vez, como lo explica la teoría) es de esperarse que en lo sucesivo vuelvan a manifestarse del mismo modo (como lo predice la teoría). Así, la teoría de la relación entre las características del trabajo y la motivación intrínseca explica que “a mayor variedad en el trabajo, habrá mayor motivación intrínseca hacia este”. Entonces debe ser posible pronosticar, al menos parcialmente, el nivel de motivación intrínseca al observar el nivel de variedad en el trabajo. Cuanta más evidencia empírica (datos) apoye a la teoría, mejor podrá esta describir, explicar y predecir el fenómeno o los fenómenos estudiados por ella (Maxwell y Mittapalli, 2008). Congruencia lógica Una teoría tiene que ser lógicamente consistente, es decir, las proposiciones que la integran deben estar interrelacionadas (no puede contener proposiciones sobre fenómenos que no estén vinculados entre sí), ser mutuamente excluyentes (no puede haber repetición o duplicación), y no caer en contradicciones internas o incoherencias (White y McBurney, 2012, y Black y Champion, 1976). Perspectiva Este vocablo se refiere al nivel de generalidad de la teoría (Maxwell y Mittapalli, 2008 y Ferman y Levin, 1979). Una teoría posee más perspectiva mientras mayor cantidad de fenómenos explique y más aplicaciones admita. Hay teorías que abarcan diversas manifestaciones de un fenómeno; por ejemplo, una teoría de la motivación que pretenda describir y explicar qué es y cómo surge la motivación en general. Hay otras que abarcan sólo ciertas manifestaciones del fenómeno; por ejemplo, una teoría de la motivación que intente describir y explicar qué es la motivación en el trabajo, cómo se srcina y qué la afecta. Innovación‐inventiva (fructificación heurística) Es “la capacidad que tiene una teoría de generar nuevas interrogantes y descubrimientos” (Ferman y Levin, 1979, p. 34). Las teorías que srcinan, en mayor medida, la búsqueda de nuevos conocimientos son las que permiten que una ciencia avance. Sencillez (parsimonia) Es mejor que una teoría sea sencilla; esto no es un requisito, sino una cualidad deseable. Sin duda, las teorías que pueden explicar fenómenosunengran u nas cuantas ningún aspecto, son más útiles uno que olasvarios que necesitan número deproposiciones, proposiciones sin paraomitir ello. Desde luego, la sencillez no significa superficialidad.
6
Capítulo 3PERSPECTIVA TEÓRICA: COMENTARIOS ADICIONALES
Revisión de la literatura: ampliación de conceptos En este apartado se expanden algunos conceptos relativos a la revisión de la literatura.
Tipos de fuentes en la detección de la literatura y otros documentos al como se comentó en el capítulo 4 del libro impreso, la finalidad de revisar la literatura es obtener y examinar las fuentes primarias o referencias relevantes para nuestro estudio de acuerdo con el planteamiento del problema. Podemos llegar a estas directamente o a través de fuentes intermedias. Se distinguen tres tipos básicos de fuentes de información para llevar a cabo la revisión de la literatura:
1. Fuentes primarias Constituyen el objeto de la investigación bibliográfica o revisión de la literatura y proporcionan datos de primera mano, pues se trata de documentos que incluyen los resultados de los estudios correspondientes. Ejemplos de ellas son: libros, antoFuentes primariasProporcionan datosde primera mano, pues se trata de doculogías, artículos de publicaciones periódicas, monografías, tesis y mentos que contienen los resultados de disertaciones, documentos oficiales, reportes de asociaciones, trabajos estudios, como libros, antologías, artículos, presentados en conferencias o seminarios, artículos periodísticos, testimonografías, tesis y disertaciones, documonios de expertos, documentales, videograbaciones en diferentes formentos oficiales, etcétera. matos, foros, páginas y sitios en internet, etc. En el apéndice 1, incluido también en el centro de recursos en línea, se ofrece una lista de las publicaciones periódicas más importantes en el campo de las ciencias sociales y otras disciplinas, que contienen un tipo muy significativo de fuentes primarias: los artículos científicos. Desde hace algunas décadas podemos tener acceso a tales publicaciones mediante internet. Asimismo, es fácil conseguir de manera instantánea o en tiempos relativamente breves la mayoría de las obras (artículos, libros, etc.) que se encuentran en diversos formatos, como PDF, .LI, HML, etc., en las propias revistas o editoriales (como es el caso de McGraw‐Hill: www.mcgraw‐hill‐educacion.com) y las “librerías electrónicas”. Incluso, ordenar de manera previa referencias que van a publicarse en el futuro cercano (por ejemplo, Amazon, Google Books, Te Internet Book Shop, etc.). ambién se han puesto de moda los dispositivos para comprar, bajar y leer tanto libros como artículos en formato digital (por ejemplo: Kindle, de Amazon, iLiad, de iRex, Reader, de Sony, HanLin, SAReBOOK, Bookeen Cybook y eSlick). Además, diversas obras tienen su formato electrónico, como en el caso de esta obra (la cual puede adquirir en formato electrónico en www.mcgrawhill-educacion.com 2. Fuentes secundarias Son listas, compilaciones y resúmenes de referencias o fuentes primarias FuentessecundariasSon listas, compublicadas en un área de conocimiento en particular. Es decir, reprocepilaciones y resúmenes de referencias o fuentes primarias publicadas en un área de san información de primera mano. Comentan brevemente artículos, conocimiento en particular, en las cuales se libros, tesis, disertaciones y otros documentos (publicados básicamente comenta sobre artículos, libros, tesis, disertaen inglés, aunque también se incluyen referencias en otros idiomas); ciones y otros documentos especializados. algunos ejemplos son: Academic Search Premier y Fuente Académica de EBSCO, la Review of Educational Research, Sage Journals, Latindex, REDALyC, SciELO, PubMed y el Annual Review of Psychology. Estas herramientas pueden encontrarse en internet. La mayoría de las fuentes secundarias incluyen los datos de las referencias y un breve resumen de cada una de ellas. A continuación se reproduce un ejemplo de algunas referencias de un índice hipotético (fuente secundaria) en el área de la investigación multivariada de la conducta humana.
7
Ejemplo De un índice de referencias Beh, E. J. y Lombardo, R. (2014). Correspondence analysis: Theory, practice and new strategies. Hoboken, NJ, EE. UU.: Wiley. Esta obra revisa los enfoques convencionales del análisis de correspondencia, así como los nuevos avances que se han logrado en la última década. Discute cuestiones teóricas y prácticas de este método multivariado. Asimismo, examina las adaptaciones necesarias para que se pueda utilizar el análisis de correspondencia. El texto proporciona a los estudiantes e investigadores una relación integral entre la asociación de medidas, la representación gráfica de correlaciones, el ordenamiento de las variables categóricas y las cuestiones inferenciales. Los autores presentan una descripción teórica completa del análisis de correspondencia no simétrico.
De un índice de referencias Beh, E. J. y Lombardo, R. (2014). Correspondence analysis: Theory, practice and new strategies. Hoboken, NJ, EE. UU.: Wiley. Esta obra revisa los enfoques convencionales del análisis de correspondencia, así como los nuevos avances que se han logrado en la última década. Discute cuestiones teóricas y prácticas de este método multivariado. Asimismo, examina las adaptaciones necesarias para que se pueda utilizar el análisis de correspondencia. El texto proporciona a los estudiantes e investigadores una relación integral entre la asociación de medidas, la representación gráfica de correlaciones, el ordenamiento de las variables categóricas y las cuestiones inferenciales. Los autores presentan una descripción teórica completa del análisis de correspondencia no simétrico. Freedman, D. A. y Berk, R. A. (2008). Weighting regressions by propensity scores. Evaluation Review, volume 32, number 4, pp. 392‐409. Artículo sobre el modelo de regresión que analiza si es o no conveniente ponderar las puntuaciones de propensión en las regresiones causales, a fin de reducir sesgos potenciales. Asimismo, comenta la importancia de tener un modelo completo que se haya comprendido adecuadamente y se especifique con toda claridad. Kerlinger, F. N. y Lee, H. B. (2002).Investigación del comportamiento: Métodos de investigación en ciencias sociales (4a. ed.). México, D. F., México: McGraw‐Hill Interamericana. Libro que presenta distintos aspectos de la investigación, tales como elaboración de hipótesis, definición de variables, algunos conceptos estadísticos fundamentales, análisis de varianza, diseños de investigación, investigación experimental y de campo, encuestas, medición por medio de diversos métodos, regresión múltiple, análisis de factores y uso de la computadora. Es un libro “clásico” sumamente difundido para utilizarse en cursos intermedios y avanzados. Kerlinger, F. N. y Pedhazur, E. J. (1997).Multiple regression in behavioral research (3a. ed). Nueva York, NY, EE. UU.: Holt, Rinehart & Winston. Texto fundamental para el análisis de la regresión, el análisis univariado y multivariado de varianza, la regresión múltiple, el análisis discriminante, la correlación canónica, el análisis “path” y otros métodos multivariados. Explica la naturaleza, el cálculo y las aplicaciones de cada método con detalle. Krippendorff, K. (1980). Clustering. En P.R. Monge y J.N. Cappella (eds.), Multivariate techniques in human communication research (pp. 259‐308). N ueva York, NY, EE. UU.: Academic Press. Capítulo que desarrolla la técnica estadística para extraer tipologías, conocida como “agrupamiento” (clustering), la cual consiste en reunir objetos o variables que comparten cualidades observadas o dividirlas en clases mutuamente excluyentes, cuyos lazos reflejan diferencias entre las cualidades observadas.
8
Capítulo 3PERSPECTIVA TEÓRICA: COMENTARIOS ADICIONALES
En otras fuentes de este tipo no siempre aparecen las referencias comentadas, sino solo las citas o datos. Asimismo, algunas fuentes secundarias incluyen el título y los autores, y la posibilidad de acceder vía electrónica al resumen (esto es gratuito) o a la referencia completa (en ocasiones con algún costo para tener entrada a esta y poder descargarla y almacenarla en nuestro disco duro u otro dispositivo, otras de manera gratuita). Hoy en día, la mayoría de las instituciones de educación superior ofrece a sus alumnos acceso a fuentes secundarias y primarias como parte de sus servicios regulares. En su caso, consulte con su profesor o profesora de investigación o centro de cómputo al respecto. Los resultados de la búsqueda de referencias en fuentes secundarias se ejemplifica a continuación con SAGE Journals Online (efectuada el 19 de octubre del 2013, abarcando de 2010 a octubre de 2013 y usando los términos: “diabetes”, “hypertension” y “elder”) y Medline Plus en español (misma fecha, periodo abierto y con: “diabetes, hipertensión, adultos mayores”). Ejemplo Parciales de dos índices de referencias (acceso eléctrico a las fuentes primarias) SAGE Journals On Line
MedlinePlus en español
Por otra parte, la mayoría de estas fuentes se encuentran en inglés (con excepciones como Redalyc, Latindex, Medline en español y Fuente Académica Premier). Las referencias se presentan y ubican como resultado de la búsqueda o consulta hecha de acuerdo con los términos de referencia usados y según la clasificación que se utilice para ordenarlas (por relevancia, alfabéticamente por autor, tema, cronológicamente, área de conocimiento, etc.). Debe recalcarse que este tipo de fuentes contiene índi-
9
ces y sumarios no sólo de libros y revistas, sino también de otros materiales, como películas en cualquier formato, grabaciones, ponencias en congresos y seminarios, páginas web, entre otros. En el apéndice 2 del centro de recursos (Principales bancos/servicios de obtención de fuentes/bases de datos/ páginas web para consulta de referencias bibliográficas), se presentan listas de algunas de las principales fuentes secundarias que se utilizan comúnmente en la investigación en diversos campos. La lista crece de manera considerable con el avance y la globalización del conocimiento. En cada ciencia o disciplina se cuenta con cientos de ellas y sería poco práctico numerarlas en estas líneas.
2. Fuentes terciarias o generales Estas fuentes están conformadas por documentos o espacios en internet donde se encuentran registradas las referencias a otros documentos de características diversas y que compendian títulos de revistas y otras publicaciones periódicas, así como nombres de boletines, conferencias y simposios, sitios web, empresas, asociaciones industriales y de diversos servicios (por ejemplo, directorios de empresas que se dedican a cuestiones de recursos humanos, mercadotecnia y publicidad, opinión pública, ingeniería ambiental, etc.); títulos de reportes con información gubernamental; catálogos de libros básicos que contienen referencias y datos bibliográficos y nombres de instituciones nacionales e internacionales al servicio de la investigación. Son útiles para detectar fuentes no documentales tales como organizaciones que realizan o financian estudios, miembros de asociaciones científicas (quienes pueden dar asesoría), instituciones de educación superior, agencias informativas y dependencias del gobierno que efectúan investigaciones.
Diferencia entre fuentes secundarias y terciarias La diferencia estriba en que una fuente secundaria compendia fuentes de primera mano y una fuente terciaria reúne fuentes de segunda mano. Una fuente secundaria agrupa referencias directas (por ejemplo, artículos de satisfacción laboral: “Expanding the literature on job satisfaction in corrections: A national study of jail employees”, de Jeanne B. Stinchcomb y Leslie A. Leip. Fuente: Criminal Justice and Behavior, noviembre de 2013; vol. 40, número 11, pp. 1209-1227; “Exploring the determinants of job satisfaction of civil servants in Beijing, China”, de Xingkun Yang y Weijie Wang. Fuente: Public Personnel Management, doi: 0091026013502169, publicado en línea en octubre de 2013 y por publicarse en la revista, etc.) En cambio, una fuente terciaria agrupa compendios de fuentes secundarias; por ejemplo, revistas que contienen artículos de satisfacción laboral, como Journal of Organizational Behavior, Contaduría y Administración de la UNAM, Investigación Administrativa del IPN, entre otras. Los catálogos temáticos (PsycINFO, ERIC: Te Education Resources Information Center, etc.), directorios y guías de índices suelen servir como fuentes terciarias para llegar a las primarias. Sin embargo, su uso debe ser con enfoque y guía, pues de lo contrario pasaríamos muchas horas sin encontrar fuentes primarias o referencias que nos sean útiles. Un ejemplo de fuente terciaria sería un directorio con datos de empresas industriales de un país o directorios de medios escritos (datos de periódicos, revistas y otro tipo de publicaciones), un catálogo de revistas periódicas (como, en el caso de México, el que elabora el Instituto Nacional de Estadística, Geografía e Informática, INEGI) o el Eurostat, que incluye listas de fuentes estadísticas europeas e internacionales.
El marco teórico y, consecuentemente, la revisión de la literatura, deben tener dirección y progresión La dirección es un factor necesario para elegir fuentes primarias apropiadas. Esto implica demostrar la forma en que otros investigadores han utilizado el conocimiento disponible para refinar sus problemas de investigación y cómo sus preguntas, hipótesis y resultados han evolucionado este conocimiento. Asimismo, en el marco teórico debe resultar evidente la forma en que tales investigadores utilizaron la literatura para establecer sus conclusiones y responder a las preguntas de sus estudios. El marco teórico se desarrolla para documentar cómo nuestra investigación agrega valor a la lite-
10
Capítulo 3PERSPECTIVA TEÓRICA: COMENTARIOS ADICIONALES
ratura y/o conocimiento existentes (progresión). Si nuestro estudio solo duplica lo que ya se sabe, no agrega ningún valor. Recordemos que debemos sistematizar las referencias por título, autor, temas y subtemas, palabras claves u otro criterio lógico (o una organización cruzada que considere varios criterios). ambién lo es buscar fuentes primarias recientes o clásicas, pero relevantes en la historia del análisis del problema de nuestra investigación.
Otro ejemplo de q ué hacer cuando “no existe literatura” Incluso planteamientos novedosos o que han recibido poca atención en el pasado comparten alguna similitud con aquellos sí han sido estudiados, por lofuentes cual sus referencias pueden asernos útiles (este caso solo ocurre cuandoque verdaderamente existen pocas primarias vinculadas nuestro planteamiento). Veamos un ejemplo.3 A finales de la década de 1980, si nuestro planteamiento se hubiera referido a la indiferencia de los jóvenes para evitar tener relaciones sexuales o tomar precauciones mediante diversas técnicas novedosas para la época (desinterés que provoca embarazos no deseados), al momento de iniciar la investigación nos hubiéramos percatado de que muchas de esas técnicas no se conocían (algunas no se habían inventado o su creación era reciente) y se habían efectuado muy pocos estudios sobre este tema. No se disponía de literatura sobre el planteamiento concreto, pero sí podríamos haber encontrado referencias abundantes sobre tópicos vinculados, los cuales hubieran proporcionado dirección a la investigación. Entre tales temas (con fuentes primarias para la revisión de la literatura) ubicaríamos los siguientes: Uso de los anticonceptivos tradicionales. asas de éxito de los anticonceptivos. Actitudes respecto de la utilización de tales anticonceptivos. emores de los jóvenes para utilizarlos. Valores que evitan tener relaciones sexuales prematrimoniales. • • • • • • • •
Obstáculos para utilizar sociales los servicios (públicos y privados) para prevenir los embarazos. Recompensas y castigos para de las salud jóvenes embarazadas. Niveles de información sobre las consecuencias del embarazo antes del matrimonio. Y otras más. Respecto de cada problema, casi siempre hay literatura disponible.
Operadores del sistema booleano Ya dijimos que las palabras o descriptores sirven para limitar o ampliar el universo de referencias que se solicita. Se usan conjuntamente con tres preposiciones (denominadas operadores del sistema booleano): and (en español “y”), or (en español “o”) y and not (en español “y no”). Con los descriptores y las preposiciones estableceremos los límites de la consulta al banco o la base de datos bibliográficos. Para comprender lo que tratamos de explicar, tomemos primero un ejemplo ficticio relacionado con una supuesta base de datos. Supongamos que queremos analizar la música del grupo de rock Te Beatles y que acudimos a la base de datos ROCKERS para hacer nuestra revisión de la literatura. Consultamos el manual o diccionario (thesaurus) de ROCKERS, buscamos por orden alfabético las palabras que nos lleven a obtener una lista de referencias pertinentes para nuestro tema a investigar o simplemente elegimos los descriptores apropiados las (la palabras música del grupo Stones”, Te Beatles). Obviamente elegimos no el término “Beatles”. Si seleccionáramos “Rolling “Coldplay” o “Madonna”, nos servirían. Por lo tanto, solicitamos una lista de referencias con la palabra elegida (“Beatles”); así obtendremos todas las referencias contenidas en ROCKERS que hablen o que estén relacionadas con Te Beatles, incluso sobre la niñez de sus integrantes, la historia de sus familiares, sus gustos, la trágica muerte de John Lennon o George Harrison y muchos otros aspectos, todo lo cual se representa en la figura 3.2. 3
Adaptado de Yedigis y Weinbach (2005).
11
Figura 3.2 Universo de referencias en la búsqueda del ejemplo.
Pero si nos interesan solo los contenidos de sus canciones, debemos elegir, además, otras palabras o descriptores para delimitar nuestro universo de referencias; por ejemplo: “ SONGS” (canciones) y conectarlos con “AND”. Entonces nuestro universo de referencias sería la intersección entre “ Beatles” y “songs” (que se muestra en el espacio coloreado). Solo se recuperan los registros que contienen todos los términos incluidos en la búsqueda y las referencias que comprenden las dos palabras, lo cual se muestra en la figura 3.3.
AND
Songs
and
Songs
Figura 3.3 Intersección de la búsqueda en el ejemplo.
Si agregáramos el término “CONEN” (contenido), nuestros descriptores serían “Beatles”, “songs” y “content”, los cuales se utilizarían de diferente modo según las preposiciones que escojamos para vincularlos. Si incluimos todos los términos entrecomillados (“BEALES SONGS CONEN”), nuestra lista producto estaría constituida por todas las referencias a Te Beatles vinculadas con el contenido de sus canciones. Lo mismo ocurriría si los relacionamos con la preposición AND (BEALES AND SONGS AND CONEN). La figura 3.4 refleja lo anterior.
12
Capítulo 3PERSPECTIVA TEÓRICA: COMENTARIOS ADICIONALES
Beatles
Content
Songs and
and
Beatles
Songs
Content
Figura 3.4 Búsqueda en el ejemplo con tres descriptores.
“Beatles” es un universo de referencias que contiene todo lo escrito o grabado física y electróni camente sobre ellos. “Songs” es un universo que incluye todo lo que se relacione con las canciones de Te Beatles, Maroon 5, Wagner, Mozart, Joan Manuel Serrat, Michael Jackson, Juanes, Vivaldi, Los igres del Norte, Pitbull, Joaquín Sabina, Plácido Domingo, Pink Floyd, U2, Shakira y todos los compositores e intérpretes de cualquier género en la historia de la música; pero a nosotros en este caso sólo nos interesan los contenidos (CONEN) de las canciones (SONGS) de Te Beatles (BEALES). Insistimos en que la lista de referencias a obtener se limitaría a investigaciones sobre el contenido de las canciones de Te Beatles; nada más. La lista sería resultado de la intersección de los tres descriptores. El uso de la preposición “OR” (“o”) es menos frecuente y tiene un efecto de expansión del universo de referencias (BEALES OR SONGS). La lista a obtener son todas las referencias sobre Te Beatles y sobre canciones en general (de Te Beatles y de todos los demás grupos e intérpretes en la historia musical). Veámoslo gráficamente en la figura 3.5.
Figura 3.5 Ampliación de la búsqueda del ejemplo por el uso de la preposición "or"..
13
El uso de la preposición “AND NO” (“y no”) produce el efecto de excluir las referencias del universo de uno de los descriptores (BEALES AND NO SONGS). La lista que obtendremos incluirá todas las referencias sobre Te Beatles, excepto las relacionadas con sus canciones (vea figura 3.6). Songs
Beatles and not
Beatles
Songs
Figura 3.6 Delimitación de la búsqueda con la preposición "and not".
Thesaurus La mayoría las bases aclarar de datos un thesauruscontiene o manual su correspondiente vocabulario, por lo que esdenecesario quetienen este vocabulario uncon número limitado de palabras o descriptores. Si no encontramos alguna palabra, es posible recurrir a un sinónimo o a un término relacionado. El caso es que las palabras o descriptores reflejen el planteamiento del problema de investigación. Hemos de decir que hoy en día algunas bases de datos aceptan casi cualquier término.
¿Qué nos proporciona la bas e de datos? La lista de referencias Como ya sabemos, el producto de nuestra búsqueda en internet vía las fuentes secundarias es la lista de las referencias o fuentes primarias. La joven Mariana (del ejemplo sobre el noviazgo que se presentó en el capítulo 4 del libro) realizó el 19 de octubre del 2013 una búsqueda de artículos en revistas académicas en varias bases de datos, tarea que enfocó paulatinamente: primero usó descriptores generales y específicos en fuentes iberoamericanas, y encontró pocas referencias; entonces, acudió a bases de referencias en inglés (ERIC, PsychoINFO, Sage Journals, etc.), con términos como “romantic” (romántico), “love” (amor), “interpersonal” (interpersonal) y “relationships” (relaciones). Por ejemplo, en ERIC (Education Resources Information Center), sin límites temporales o de fechas:
14
Capítulo 3PERSPECTIVA TEÓRICA: COMENTARIOS ADICIONALES
Como puede verse, obtuvo 772 referencias. En SAGE Journals, con los mismos términos y limitándose al periodo comprendido entre 2010 y octubre de 2013 localizó 898 fuentes primarias. Luego agregó “similarity” (similitud), para precisar, con lo cual la lista incluyó 329. Posteriormente, el 21 de octubre efectuó una búsqueda en EBSCOhost Research Databases, usando Academic Search Premier (opción disponible en diversas instituciones de educación superior) y con iguales palabras claves. Luego incorporó el thesaurus para realizar una búsqueda más específica, y detectó 12 referencias en inglés y cuatro en español. Por lo regular, en esta fuente hay mayores filtros que en otras, por lo cual el número resultante es menor, pero las referencias están sumamente vinculadas a los términos utilizados. Así, de todas las fuentes primarias eligió las 18 que le parecieron más pertinentes (pudo bajar sin costo 12, compró tres y buscó el resto en bibliotecas, otros sitios de internet, etcétera). La lista inicial de Mariana en SAGE Journals es:
15
He aquí el principio de la lista de Mariana en Academic Search Premier (en inglés): Términos de búsqueda
Título de referencia
Resumen Artículo completo
Y en español:
Términos de búsqueda Números de referencia Título de referencia
Artículo completo
16
Capítulo 3PERSPECTIVA TEÓRICA: COMENTARIOS ADICIONALES
Resumen del proceso de búsqueda de referencias manuales y en internet El proceso de búsqueda de información se resume gráficamente en la figura 3.7, etapa por etapa, y corresponde a cualquier estudio, cuantitativo, cualitativo o mixto. Identificar términos o palabras claves: pueden derivarse del planteamiento o de un título preliminar del trabajo o investigación
Seleccionar una base de referenciars apropiada (las principales bases se presentan en el apéndice dos de esta página web)
Recomendaciones:
En “search” (búsqueda) o “advanced search” (búsqueda avanzada), introducir los términos y las preposiciones booleanas, de acuerdo con el propósito de búsqueda
Utilice palabras que los autores suelan utilizar Busque términos en los thesaurus o catálogos de palabras de las bases de referencias
Recomendaciones: Localice artículos, libros, anuarios y guías (handbooks) Para la selección de referencias tome en cuenta actualidad, calidad y similitud con el propio planteamiento
Obtener una lista de referencias vinculadas con el planteamiento Revisarlas Elegir las más adecuadas (primero unas cuantas para elaborar el mapa o índice del marco teórico, una vez desarrollado el bosquejo, seleccionar las demás referencias
Si fotocopia, respete las leyes de derechos de autor
Figura 3.7 Proceso de búsqueda de referencia.
Recopilación de información de las referencias ¿Qué información o contenido se extrae de las referencias? La respuesta es variable: a veces es una idea; otras, una cifra, un resultado o múltiples comentarios. Veamos algunos casos de fichas bibliográficas:
Una idea extraída de una referencia Alshouibi1, E. N., Kaye, E. K., Cabral, H. J., Leone, C. W. y Garcia, R. I. (2013). Vitamin D and periodontal health in older men. Journal of Dental Research, 92 (8), pp. 689-693. doi: 10.1177/0022034513495239. La vitamina D es un mediador antiinflamatorio que posee beneficios potenciales para la salud física y bucal. En un estudio longitudinal con 562 veteranos mayores estadounidenses que duró 12 años, se encontró una relación entre la ingesta de vitamina D y su estado de salud periodontal.
Una cifra extraída de una referencia Rodríguez, A., De la Puente, J., y Alum, A. (2009). Diagnóstico y abordaje del riesgo cardiovascular en la diabetes tipo 2. Actualización en Medicina de Familia, 5 (1), 4‐10. Según los datos publicados por la Federación Internacional de Diabetes (IDF), el número de personas que presentan diabetes en 2007 es de aproximadamente 246 millones. Se prevé que en 2025 este número llegue a 380 millones (p. 4).
17
Una idea extraída de la referencia más la opinión del investigador sobre esta idea o alguno de sus aspectos Neisser, U. (1979). Te concept of intelligence. En R. J. Stennberg y D. K. Detterman (Eds.), Human intelligence: Perspectives on its theory and measurement (pp. 179‐189). Norwood, NJ, EE. UU.: Ablex Publishing Corporation. Idea
La inteligencia en sí no existe, excepto como retrato de un prototipo, pero el concepto de persona inteligente está basado en hechos, por ejemplo, en características humanas genuinamente correlacionadas. La similitud de un individuo con el prototipo puede medirse, aunque tan sólo de manera parcial. No todos lostiende atributos relevantes proporcionan sí mismos una medición estandarizada. al medición parcial a crear su propio prototipo ypor categoría. Opinión
En este sentido, una alternativa de la psicometría es no pretender medir “la inteligencia” como tal, ni hacer comparaciones entre individuos en cuanto a este prototipo general (que es ambiguo y varía de acuerdo con las diferentes perspectivas existentes para su estudio). En cambio, tal vez resultaría conveniente medir las características humanas que algunos consideran como componentes de la inteligencia (fluidez verbal, orientación espacial) y realizar comparaciones entre individuos en cada una de esas características en particular. Así, por ejemplo, podríamos hablar de que una persona posee mayor fluidez verbal que otra, pero no diríamos necesariamente que es más inteligente.
Análisis de una idea extraída de una referencia Ejemplo 1
Bahar, E. (2008). Intelligence: An analysis of the American experience from the perspective of Critical Teory. Educational Sciences: Teory & Practice, 8 (1), 79‐87. Actualmente, en Estados Unidos y otros países, las puntuaciones respecto del IQ (coeficiente de inteligencia) constituyen el principal factor que toma enelcuenta para que los estudiantes accedan a programas para el desarrollo de sus talentos. Sinseembargo, entendimiento general de la “inteligencia” parece orientarse a su definición psicométrica, la cual contempla solo las inteligencias verbal, lógica y matemática. Por ello resulta indispensable volver a examinar tal definición, típica de las culturas occidentales, y considerar a los demás tipos de inteligencia (como la emocional, musical y atlética), así como a otras culturas. Ejemplo 2
Freedman, J. L. (1988). Social psychology (6a. ed.). Englewood Cliffs, NJ, EE. UU.: Prentice‐Hall. Descubrir similitudes con alguien produce mayor atracción hacia esa persona. Sin embargo, la teoría del balance sugiere que lo opuesto también ocurre; cuando alguien nos resulta atractivo, esperamos concordar con esa persona en aspectos de los cuales no hemos hablado aún con ella. Es decir, las variables atracción y similitud están correlacionadas. La similitud incrementa la posibilidad de atracción y viceversa. Cuando a una persona la percibimos atractiva, buscamos las cuestiones que tiene en común con nosotros y les damos una valencia más elevada a estas, para tratar de minimizar los aspectos en los que diferimos. Varias ideas y datos extraídos de una referencia
Paniagua, M. L. (1980). Grado de aplicación y mercado de trabajo de la mercadotecnia en México . México, DF, México: Instituto Politécnico Nacional, Centro de Investigación en Ciencias Administrativas de la Sección de Graduados de la Escuela Superior de Comercio y Administración. En un estudio que incluyó a 124 empresas de las ciudades de México, Guadalajara, Monterrey, San Luis Potosí, Chihuahua, Veracruz y Saltillo (66% ubicadas en la ciudad de México, 11% en Guadalajara, 8% en Monterrey y 15% en las demás) se encontró, entre otros aspectos, lo siguiente:
18
Capítulo 3PERSPECTIVA TEÓRICA: COMENTARIOS ADICIONALES
1. 2. 3. 4. 5. 6.
Sesenta y cuatro por ciento de las empresas no tienen planes futuros de mercadotecnia. Las empresas más antiguas son las que aplican en mayor medida la mercadotecnia (hay una relación entre la fecha de constitución de la empresa y el grado de aplicación de tal disciplina). A mayor tamaño de las empresas, se incrementa el grado en que aplican la mercadotecnia (correlación = 0.40, p < 0.001). Cuanto mayor sea el tamaño de las empresas, más altos serán los salarios que ofrezcan al personal que trabaja en el área de mercadotecnia. Las empresas de mayor tamaño presentan más variedad de profesiones entre su personal del área de mercadotecnia. A mayor tamaño de la empresa, existen más puestos en el área de mercadotecnia.
Reproducción textual de una o varias partes de la referencia Hernández-Sampieri, R. (2012). Medios de comunicación en las organizaciones. En C. Fernández, La comunicación en las organizaciones (pp. 238-261). México, D. F., México: rillas. “Con frecuencia, los altos directivos se impacientan al introducir nuevas tecnologías, incluso algunos sufren lo que se denomina ‘fiebre tecnológica’ y no pocas veces cometen errores como: ignorar las necesidades y sentimientos de los empleados que utilizarán la tecnología” (p. 259).
Resumen de una referencia Muñoz, J., Hernández-Sampieri, R., López, L. y Méndez, S. (en prensa). Exploración de los valores en el medio laboral mexicano. Humanitas.4 La investigación se centró en comenzar una exploración de los valores predominantes en las organizaciones de la sociedad mexicana de acuerdo con el modelo de Schwartz y determinar su jerarquía, bajo la premisa de que los valores son un elemento clave para entender la cultura organizacional. Se aplicó el cuestionario Portrait Value Questionnaire (PVQ, Cuestionario que retrata los valores), versión en español de Luis Arciniega, a una muestra de 536 empleados de dos empresas, una comercial y otra industrial, que generó datos satisfactorios en cuanto a confiabilidad y validez del instrumento. Los resultados señalan un paralelismo entre los puntajes de las tipologías estudiadas en las dos empresas, con una intensidad mayor en la empresa comercial. Sobresalen los valores de benevolencia, autodirección, universalismo y seguridad. Se confirma totalmente la polaridad del modelo en el eje autotrascendencia–autoengrandecimiento, y parcialmente en el eje apertura al cambio–conservación. Queda pendiente para estudios posteriores determinar las causas de la baja valoración que los empleados dan al hedonismo, estimulación y autoridad (poder).
Resultado Abdel‐Khalek, A. M. (2006). Measuring happiness with a single‐item scale. Social Behavior and Personality, 34 (2), 139‐15. Cuando se examinó la exactitud de medir la felicidad con un solo ítem (en general, ¿se siente usted feliz?) en una escala de 11 puntos (cero a diez), se obtuvo una estabilidad temporal de 0.86. Las correlaciones entre el reactivo y el inventario sobre la felicidad de Oxford (OHI) y la escala de satisfacción con la vida resultaron altamente positivas, lo cual denota una buena validez concurrente, explicada porque el ítem logró una fuerte y positiva asociación con el optimismo, la esperanza, la autoestima, el afecto y laestimar extroversión, así concurrente como con lasdel autoevaluaciones de lafue salud mental. Para la validez reactivo, la muestra de física 1 412yindividuos.
4
En prensa, implica que fue aceptada su publicación para 2014.
19
Conclusión Ramírez Carrasco, E. (2011). Estimación de masa en sistemas de control ambiental en aeronaves durante la fase de diseño conceptual. Linköping, Östergötland, Suecia: Linköping University. Versión del reporte especialmente preparado para la 6a. edición del libro Metodología de la investigación de R. Hernández-Sampieri, C. Fernández y P. Baptista (2010). México, D.F., México: McGraw-Hill Interamericana Editores. Con base en el método desarrollado en esta investigación, se logró crear una interfaz con el uso de M.S Excel que ayuda a predecir la masa del Sistema de Control Ambiental (ECS) en aeronaves comerciales con una mayor precisión de la que brindan los métodos existentes.
Resumen de referencia completa La siguiente es una manera de resumir una referencia completa que incluye: 1. Cita o datos bibliográficos. 2. Problema de investigación e hipótesis. 3. Participantes (muestra). 4. Procedimiento(s) de la investigación (diseño y forma de recolección de datos). 5. Resultados. 6. Discusión o conclusiones. A continuación se muestra un par de ejemplos de ello. Ejemplo 1
Spurgeon, P., Hicks, C. y erry, R. (1983). A preliminary investigation into sex differences in reported friendship determinants among a group of early adolescents. Te British Journal of Social Psychology, 22 (1), 63‐64. Problema: determinar si hay diferentes tipos globales de relación amistosa entre géneros y dentro de cada género, así como los determinantes de dichos tipos globales. Participantes: 26 adolescentes a 12 años de(middle edad (15school). de género femenino y 11 de género masculino) que cursan el último añodede11escuela básica Procedimientos: los individuos contestaron un cuestionario para avalar un rango de determinantes de la amistad; el cuestionario estuvo basado en descubrimientos de investigación sobre las razones más importantes subyacentes en la formación y el mantenimiento de la amistad. Se incluyeron preguntas cerradas (con escala de cinco puntos) concernientes a razones ambientales, sociológicas y de personalidad, así como preguntas abiertas acerca de la naturaleza de la amistad y la relación amistosa. Asimismo, se les pidió que calificaran a su mejor amigo o amiga en cada pregunta, y a su segundo y tercer mejores amigo o amiga. Resultados: en el caso de las mujeres, las razones para vincularse con su mejor amiga son cualitativamente diferentes de las razones para vincularse con su segunda o tercera mejores amigas. Los aspectos más importantes para la mejor amistad fueron, en orden: “jugar juntas”, “sentarse juntas” y tener “la misma actitud positiva” hacia la escuela. Menos importante resultó “vivir cerca”. Respecto de la segunda y tercera mejores amigas, los aspectos más relevantes fueron similares en ambos casos (por ejemplo, “actitud positiva” hacia la escuela, “agradar a la maestra y sentarse juntas”). En cambio, “visitar el hogar de la otra persona y viceversa” resulta menos importante. En contraste, el orden de aspectos importantes de la amistad entre los jóvenes es idéntico entre los tres niveleshacia (mejor amigo,y segundo y tercerjuntos”. lugares).“Visitar Los aspectos fueron:fue“actitud negativa” la escuela “jugar y sentarse el hogarmás deldestacados otro y viceversa” menos importante. Desde un punto de vista global, las percepciones de ambos géneros en relación con los determinantes importantes de la amistad son muy similares (r = 0.82, p = 0.01). Las respuestas a las preguntas abiertas se clasificaron como situacionales, contractuales o psicológicamente internas. Los resultados demostraron un paso a través de las fases de la amistad. De las relaciones amistosas de las
20
Capítulo 3PERSPECTIVA TEÓRICA: COMENTARIOS ADICIONALES
jóvenes, 97% están basadas en razones psicológicas internas, mientras que para los jóvenes se distribuyen entre razones psicológicas internas (54%) y contractuales (45%). Conclusiones: esta investigación inicial revela que, para ambos géneros, los aspectos más importantes de la amistad adolescente son similares, pero existen diferencias en la variación de niveles de amistad que pueden reflejar preferencias por actividades distintas o tasas de maduración entre los dos géneros. Ejemplo 2
De la Ossa, S., Martínez, Y., Herazo, E. y Campo, A. (2009). Estudio de la consistencia interna y estructura factorial de tres versiones de la escala de Zung para ansiedad. Colombia Médica, 40 (1), 78‐84. Antecedentes: la escala de Zung para ansiedad se ha usado en varias investigaciones en Colombia. Sin embargo, no se ha informado sobre la consistencia interna y la estructura de factores en estudiantes universitarios. Objetivo: estimar la consistencia interna y la estructura factorial de tres versiones de la escala de Zung para ansiedad en estudiantes de una universidad privada de Cartagena, Colombia. Método: 221 estudiantes de medicina y psicología completaron la versión de 20 puntos de la escala de Zung para ansiedad. La media de edad fue 20.5 (DE = 2.6), 64.4% eran mujeres y 55.3% estudiaban medicina. Se calculó el alfa de Cronbach y se realizó un análisis de factores exploratorio para las tres versiones. Resultados: la escala de 20 puntos mostró un coeficiente de alfa de Cronbach de 0.77 y tres factores principales responsables de 40.1% de la varianza total. La versión de 10 puntos presentó una consistencia interna de 0.83 y una estructura bidimensional que explicaba 54% de la varianza. La versión de cinco puntos mostró una consistencia interna de 0.74 y una estructura unidimensional que daba cuenta de 49.5% de la varianza. Discusión: las versiones de 10 y cinco puntos de la escala de Zung para ansiedad presentan mejor comportamiento psicométrico que la versión srcinal de 20 puntos. Se necesita estimar el comportamiento psicométrico de estas versiones frente a un criterio de referencia.
Otra manera de recopilar y organizar la información de las fuentes primarias o referencias bibliográficas Otra forma de extraer información de las referencias para el marco teórico, más resumida, la sugieren Savin-Baden y Major (2013, p. 125), la cual se muestra en la tabla 3.1, con adaptaciones de acuerdo al proceso de investigación. Tabla 3.1 Extracción de información de las referencias Contenido a incluir Artículo 1 (datos por rubro completos de la referencia)
Tema o tópico Enfoque Objetivos Ideas Preguntas de investigación Hipótesis Variables (conceptos) Definiciones conceptuales de variables Definiciones operacionales de variables
Artículo 2 (datos completos...)
Li b r o ( d a t o s . . . )
P on e n c i a en congreso (datos...)
Capítulo de libro (datos...)
Referencia...
21
Diseño Muestra (población/ unidad/participantes) Instrumentos de recolección Análisis de los datos Validez/confiabilidad/rigor Principales resultados
Datos que apoyan la magnitud de la problemática (estadísticas , importancia, etcétera)
Desde luego, no todos los rubros se aplican a todos los tipos de referencia (por ejemplo, diseño, muestra, instrumentos, análisis y rigor no se aplican a ensayos; o bien, habrá capítulos de libros a los cuales tampoco correspondan). En investigaciones sencillas, es muy probable que con una tabla o matriz sea suficiente, aunque ocupe varias páginas; sin embargo, en investigaciones con un marco teórico más elaborado, puede requerirse una tabla para cada apartado. Asimismo, también es posible elaborar una matriz con los tipos de información que se trataron previamente, como puede apreciarse en la tabla 3.2. Tabla 3.2 Extracción de información de las referencias con otros conceptos. Contenido a incluir por rubro
Artículo 1
Artículo 2
Libro
Ideas Cifra Idea + opinión Resultado Resumen Definiciones operacionales de variables
Comentarios sobre la primera vez que se efectúe una búsqueda Como se mencionó en el capítulo 4 de la obra impresa, en la web se incluyen documentos que no son útiles para revisar la literatura si pretendemos contar con un trabajo digno y serio, ya sea porque no tienen fundamentos, sus fuentes no resultan confiables o contienen información insustancial o no corroborada. Por ello, debemos acudir a los bancos de referencias de asociaciones e instituciones académicas o profesionales, los que contienen artículos arbitrados o indexados que poseen respaldo científico. Desde luego, podemos comenzar con los disparadores generales de búsqueda: http://www.altavista.com / http://www.ask.com http://www.bing.com http://www.google.com http://www.hotbot.com http://www.dogpile.com http://www.yahoo.com
22
Capítulo 3PERSPECTIVA TEÓRICA: COMENTARIOS ADICIONALES
http://go.com http://webcrawler.com http://www.about.com/espanol/ http://www.lycos.com http://www.answers.com http://ipl.org http://www.proquestk12.com/ ambién podemos utilizar los canales de televisión en internet: Discovery, History, NAGEO, etc. Para libros podemos recurrir a: Amazon (http://www.amazon.com/) y SearcheBOOKS (http:// www.searchebooks.com/). Sin embargo, se deben utilizar palabras claves precisas y abrir solo sitios con respaldo académico, científico o profesional. Recordemos que el dominio .com indica que se trata de uno comercial y es mejor abrir sitios con los dominios: .org, .gov, .net y .edu, aunque siempre es necesario verificar que el documento o sitio tenga un verdadero soporte. Por ejemplo, si colocamos solo la palabra “depresión” en un disparador, varias de las primeras páginas serán anuncios de “métodos para superarla”, medicamentos y consejos, aunque también encontraremos definiciones de Wikipedia, algún libro muy fundamental y explicaciones de MedlinePlus, pero pocos artículos de revistas o reportes de investigación cuya naturaleza sea empírica. Ello nos lleva a señalar que en parte la utilidad de una fuente depende de la asignación del profesor o los propósitos de ella. Por ejemplo, diversos artículos de Wikipedia cuentan con un sustento fundamentado en referencias producto de estudios y pueden ser útiles para un trabajo dentro de alguna asignatura (pero no debemos basarnos exclusivamente en ellos, porque simplemente nos ayudan a entender conceptos), y resultan pobres para una tesis o, al menos, insuficientes. Lester y Lester (2013) recomiendan que cuando se considera la pertinencia de una fuente, documento o sitio en internet, se debe: 1. Acudir a sitios que contengan los dominios: .org (organizaciones profesionales, sociales, educati-
2.
3. 4.
.gov (organizaciones gubernamentales) .net (genérico, usarlo con precaución al vas empresas), igualo que .com), .edu. (educación, instituciones educativas) y .mil (militar), según campo de búsqueda. Determinar si el autor del documento tiene una afiliación institucional seria (o su correo lo indique). Si esta no existe, será necesario buscar en cualquier disparador si se trata de un académico, profesional o científico con experticia y conocimientos. Asegurarnos que el documento cite referencias confiables. Distinguir sitios con respaldo profesional, académico o científico de páginas personales, de información general, de negocios y comerciales.
Como auxilio a los requisitos anteriores, recuerde que los elementos de lectura de una dirección en línea son: 1. Protocolo (http://): transmite la información. 2. El servidor (www) (World Wide Web): red global de internet. 3. El dominio: nombre de la organización y su sector. Por ejemplo: - Universidad de Celaya: udec.edu (educación). - Universidad César Vallejo: ucvlima.edu. 4.
País o si es un sitio global (abreviado): - Universidad de Celaya: udec.edu .mx/ (México). - Universidad César Vallejo: ucv.edu.pe/ (Perú) - Oxford University: http://www.ox.ac.uk/ (United Kingdom, Reino Unido) - Universidad del Sur de California: http://www.usc.edu/ (global)
23
Finalmente, algunos “metamotores de búsqueda” (que agrupan a diversos motores de búsqueda simultáneamente como Yahoo o Google) son: http://www.dogpile.com http://www.metacrawler.com http://www.surfwax.com http://www.mamma.com
Enciclopedias Además de todos los recursos anteriores (libros, artículos de revistas científicas, ponencias, etc.) existe 5 uno adicional que resulta útillaspara buscar autores, teorías, definiciones de variables y resultados de estudios sobremuy estas: enciclopedias sobretérminos, campos específicos del conocimiento. Existe tan grande variedad de ellas que sería imposible mencionarlas en unas cuantas páginas, pero incluimos algunas a manera de ejemplo: Encyclopedia of architecture: Design, engineering & construction (v. 1‐5) (arquitectura e ingenierías). Encyclopedia of behavior modification and cognitive behavior therapy (psicología de la conducta). Encyclopedia of children, adolescents, and the media (medios de comunicación). Encyclopedia of community (sociología y demografía). Encyclopedia of counseling (psicología y trabajo social). Encyclopedia of disability (ciencias de la salud y psicología). Encyclopedia of educational psychology (psicología y educación). Encyclopedia of global health (ciencias de la salud). Encyclopedia of global warming and climate change (ciencias físicas, ambientales y sociales). Encyclopedia of health and behavior (ciencias de la salud y psicología). Encyclopedia of human development (psicología y ramas afines). Encyclopedia of industrial and organizational psychology (psicología y administración de recursos
humanos). Encyclopedia of interpersonal violence (psicología). Encyclopedia of leadership (administración y psicología). Encyclopedia of multicultural psychology (psicología). Encyclopedia of obesity (ciencias de la salud). Encyclopedia of psychology and law (psicología y leyes). Encyclopedia of social psychology (psicología social). Encyclopedia of epidemiology (ciencias de la salud). Encyclopedia of evaluation (ciencias sociales y administrativas). Encyclopedia of measurement and statistics (ciencias sociales, administrativas, ingenierías). Encyclopedia of social science research methods (ciencias sociales y administrativas). Encyclopedia of stem cell research (ciencias de la salud y biológicas). Encyclopedia of survey research methods (todas las ciencias, enfocado en encuestas).
Encyclopedia of social problems (ciencias sociales). Encyclopedia of social theory (ciencias sociales). ENGnetBASE: Engineering handbooks online (ingenierías). McGraw‐Hill concise encyclopedia of engineering (ingenierías). MechanicalEngineeringnetBASE (ingenierías). Te Sage encyclopedia of qualitative research methods (todos los campos, desde luego, desde el enfoque cualitativo). Te SAGE Handbook of healthcare (ciencias de la salud). Además, se puede acceder a otras de SAGE citadas a lo largo de la obra impresa de esta sexta edición. 5 No nos referimos a las tradicionales enciclopedias en línea (que también son útiles y deben usarse y recomendarse) como la Enciclopedia
Britannica, Enciclopedia Columbia, Encarta, Encyclopedia.com, Wikipedia, Encyclopedia Smithsonian y otras similares, sino a enciclopedias más dirigidas a determinadas áreas del conocimiento.
24
Capítulo 3PERSPECTIVA TEÓRICA: COMENTARIOS ADICIONALES
Desafortunadamente, estas herramientas tienen un costo que a veces resulta elevado, sobre todo para los estudiantes o profesores, circunstancia que se reduce en el caso de las instituciones educativas. Por otra parte, todas ellas se localizan a través de su nombre vía un navegador en internet (Google, Yahoo, etc.). La mayoría se actualiza periódicamente.
Ejemplo adicional d e índice de marco teórico Referencia: Gueguen, N., Jacob, C. y Lamy, L. (2010). Love is in the air: Effects of songs with romantic lyrics on compliance with a courtship request. Psychology of music, 38 (3), 303-307. DOI: 10.1177/0305735609360428 Enfoque: de cuantitativo. Pregunta investigación: ¿La exposición a canciones con letras románticas afecta la respuesta al cortejo? Objetivo: Determinar si la exposición a canciones con letras románticas afecta la respuesta al cortejo. Justificación abreviada: de acuerdo con North y Hargreaves (2008) la música y su letra tienen capacidad para influir en el comportamiento de las personas. En un reciente experimento dirigido por Jacob, Gueguen, Boulbry y Selmi (2009) se descubrió que los hombres que durante su estancia en tiendas florales escuchaban música romántica gastaban más dinero en la compra de arreglos florales que aquellos que no se veían expuestos a este tipo de música. La importancia de la presente investigación radica en comprobar que el contenido multimedia puede afectar de manera más específica que lo que hasta este momento se consideraban tan solo como comportamientos agresivos o prosociales. Índice principal del marco teórico: 1. Introducción. 2. Efectos que provocan los medios audiovisuales en 3. el comportamiento humano. 4. Estudios antecedentes. 5. Modelo de exposición general. 6. 7.
Modelo de aprendizaje general. el efecto de la exposición a canciones con letras románticas en el Investigaciones que demuestran cortejo romántico.
capítulo
4
Estudios de caso
HACIA UNA DEFINICIÓN DEL ESTUDIO DE CASO En el capítulo 7 de Metodología de la investigación, 6ª edición, se comentó que el estudio de caso se podría definir como una investigación en la cual mediante los procesos cuantitativo, cualitativo y/o mixto se analiza profundamente y de manera integral una unidad para responder al planteamiento del problema, probar hipótesis y desarrollar teoría (Hernández-Sampieri y Mendoza, 2008). Otras definiciones se presentan en la tabla 4.1 Tabla 4.1 Definiciones del estudio de caso. Autory/oreferencia U.S. General Accounting Office, 1990 (en Mertens, 2010) Creswell et al. (2007) Blatter (2008) Wiersma y Jurs (2008) Grinnell, Williams y Unrau (2009) The SAGE Glossary of the Social and Behavioral Sciences (2009r) Merriam (2009) Mertens (2010) Thomas (2011b) y Elger (2009)
Yin (2013) y Hijmans y Wester (2009)
Definición Método para aprender respecto de una instancia compleja, basado en su entendimiento un “todo” y su contexto, mediante datoscomprehensivo e información como obtenidos por descripciones y análisis extensivos. Análisis profundo de un caso y su contexto, con fines de entender su evolución o desarrollo e ilustrar una teoría. Aproximación investigativa en la cual una o unas cuantas instancias o unidades de un fenómeno son estudiadas en profundidad. Examen detallado de “algo”: un evento específico, una organización, un sistema educativo, por ejemplo. Examen intensivo de una unidad de análisis. Estudio en profundidad de uno o más unidades o sistemas identificados y delimitados Descripción y análisis intensivos y holísticos de una sola instancia, fenómeno o unidad. Investigación sobre un individuo, grupo, organización, comunidad o sociedad, que es visto y analizado como una entidad. Análisis de personas, eventos, decisiones, periodos, proyectos, políticas, instituciones u otros sistemas que son estudiados holísticamente por uno o más métodos. El caso que es objeto de la indagación será una instancia de una clase de fenómenos que proporciona un marco analítico dentro del cual se lleva a cabo el estudio. Dentro de este, el caso contribuye a iluminar y explicar el fenómeno (su clase o a este). Indagación empírica en profundidad sobre un fenómeno contextualizado en el mundo real, particularmente cuando los límites entre el fenómeno y su contexto no son evidentes.
2
Capítulo 4 Estidos de caso
De las definiciones anteriores podemos concluir que el estudio de caso se centra en la descripción y el examen o análisis en profundidad de una o varias unidades y su contexto de manera sistémica y holística. Harvard Business School (1997) lo considera un método y lo utiliza desde 1908 para evaluar unidades organizacionales. Varios autores, como Grinnell, Williams y Unrau (2009), Hernández-Sampieri y Mendoza (2008) y Stake (2006), opinan que más que un método es un diseño y una muestra, es decir, sostienen que los estudios de caso utilizan o pueden incluir diversos métodos. Al respecto, su importancia —más que discutir sobre si es un método, un diseño o una muestra— reside en su uso, por lo cual dejamos que el lector forme su propia concepción sobre el estudio de caso. Blatterel(2008), (2006) y Hammersley (2003) que es complejo problemático tar asociar estudioStake de caso con una forma específica dereconocen investigación, debido a quey se ha utilizadointentanto en el enfoque experimental como en otras aproximaciones cuantitativas y en la investigación cualitativa. Para resolver el asunto, utilizan el criterio de que el estudio de caso no está definido por un método específico, sino por su objeto de análisis. Entre más concreto y único sea este, y constituya un sistema propio, con mayor razón podemos denominarlo estudio de caso. Yin (2013 y 2011) compara a los estudios de caso con otros diseños de investigación, en términos de preguntas de investigación y control de eventos. El contraste de esta comparac ión se muestra en la tabla 4.2. Tabla 4.2 Comparación de los estudios de caso y otros diseños. Estrategia o diseño Experimento
Esencia de las preguntas de investigación ¿Cómo?,¿cuánto?,¿porqué?
¿Requiere control de eventos? Sí
Encuestas(surveys)
¿Quién?,¿qué?,¿dónde?,¿cuánto?
No
Estudioshistóricos
¿Cómo?,¿dónde?,¿porqué?
No
Análisisdearchivos
¿Quién?,¿qué?,¿dónde?,¿cuánto?
No
Estudiosdecaso
¿Cómo?y¿porqué?
Enocasionessíyenotrasno
Diversos autores señalan que los diferentes diseños se superponen y que los estudios de caso siguen el proceso de investigación (de la idea a la presentación de resultados) y utilizan fuentes múltiples de datos y análisis, lo que significa que su naturaleza es empírica (Yin, 2013, Sekaran y Bougie, 2013, Green, 2011 y Aaltio y Heilmann, 2009).
FUNCIONES DE LOS ESTUDIOS DE CASO Seguramente el lector se cuestionará cuál es la utilidad de los estudios casos, ¿para qué sirven? Como cualquier otro diseño o método, los estudios de caso permiten analizar una gran variedad de fenómenos, desde situaciones o eventos inusuales hasta interacciones complejas (immons y Cairns, 2009) y responder a diversos planteamientos de problemas de investigación. Green (2011), Robson (2011), Mertler y Charles (2010), así como Armenian (2009), identifican algunas funciones o propósitos de los estudios de caso: 1. 2. 3. 4. 5. 6.
Generar descripciones vívidas de individuos o fenómenos. Identificar patrones de un fenómeno en su ambiente natural. Explicar las causas y cómo ocurren fenómenos, identificando sus causas. Proveer datos para evaluar procesos, programas, individuos o ambientes. Ilustrar descubrimientos. Resolver problemáticas sociales, industriales, administrativas, económicas, políticas y de otro tipo.
Metodología de la investigación
Por su parte, Yin (2013), Hernández-Sampieri y Mendoza (2012), además de Xiao(2009a), consideran que los estudios de caso son útiles para refinar, confirmar y/o extender la teoría, y producir conocimiento y validar resultados obtenidos por otros diseños (complementación). Sobre el primer punto regresaremos más adelante. Asimismo, Starke y Strohschneider (2009) señalan que ofrecen varios beneficios, entre los que se destacan que proporcionan una base de datos enriquecedora e información completa sobre el fenómeno o unidad considerada y revelan diferencias entre expresiones de dicho fenómeno o los casos analizados. Tomas (2010) indica que el estudio de caso cuando es implementado con respeto al proceso de investigación, ejemplifica el conocimiento o la teoría a través de sustraer manifestaciones reveladoras. Con frecuencia, el valor del estudio de caso reside en su oportunidad, ya que posibilita analizar unidades a las es difícil acceso mediante otro Imaginemos investigaciones sobre fenómenos que nocuales ocurren “todostener los días” o que resultan dediseño. acceso difícil, tal como lo sería una supernova, un asesino serial, una catástrofe natural, una devaluación o un presidente de una nación. Es lo revelador del caso lo que lo hace un método invaluable.
CARACTERÍSTICAS DE LOS ESTUDIOS DE CA SO Los estudios de caso han sido ampliamente usados por investigadores y profesionales durante los últimos siglos. Sigmund Freud los implementó para generar su teoría psicoanalítica, Charles Darwin a fin de analizar ciertas especies y Frédéric LePlay (1806-1882), sociólogo francés, los llevó a cabo con el propósito de investigar familias de la clase trabajadora y así entender cómo operaba cada unidad familiar y de ello obtener conclusiones acerca de cómo funcionan las familias dentro de la sociedad. Bronislaw Malinowski y la Escuela de Chicago del enfoque cualitativo los utilizaron de manera considerable. Asimismo, se aplican a todas las disciplinas o ciencias. Por ejemplo, la investigación clásica de Graham Allison y Philip Zelikow sobre la crisis de los misiles en Cuba (1962) y que estuvo a poco de generar una guerra entre la entonces Unión Soviética y Estados Unidos, se basó en un estudio de caso. Algunas de sus principales características son: 1. Constituyen métodos o diseños flexibles, ya que el investigador puede utilizar múltiples herramientas
2. 3. 4. 5. 6. 7. 8. 9.
para capturar y analizar los datos que le permitan comprender las peculiaridades del fenómeno o problema bajo indagación y conocer sus causas (Yin, 2011, Bell, 2010, Te SAGE Glossary of the Social and Behavioral Sciences , 2009r y immons y Cairns, 2009). El investigador y el objeto de investigación interactúan constantemente entre sí (Aaltio y Heilmann, 2009). El objeto de estudio o caso es examinado de manera sistémica, global y holística (Xiao, 2009a). El investigador casi siempre trata de identificar patrones (Green, 2011). Se realizan en ambientes naturales (Yin, 2013 y Moore, 2009). Son de naturaleza empírica, por lo cual los datos recolectados deben ser “ricos y profundos” (Sekaran y Bougie, 2013, y Mertler y Charles, 2010). Son completamente contextuales, es decir, se analizan tanto el caso como su contexto, pues ambos son igualmente importantes (Hernández-Sampieri y Mendoza, 2012 y Stake, 2006). Utilizan la triangulación de fuentes de datos como eje del análisis (Green, 2011). Se fundamentan en la premisa de que un examen en profundidad de un caso y su contexto puede generar información significativa sobre otros casos similares ( Te SAGE Glossary of the Social and Behavioral Sciences, 2009ñ).
10. Incluyen todas las perspectivas posibles de los participantes (Raufflet, 2009).
DEFINICIÓN DE CASO Hemos hablado de los estudios de caso, pero… ¿qué se considera un caso o cómo se define en el marco de este diseño o método?
3
4
Capítulo 4 Estidos de caso
Un caso es una unidad o entidad sistémica identificada en sus límites y características y ubicada en relación a su contexto (Elger, 2009 y Stake, 2006) y que es el principal objeto o sujeto de estudio (Bell, 2010). En otras palabras: el caso es la unidad de análisis. De acuerdo con Yin (2013 y 2011), Hernández-Sampieri y Mendoza (2012), Azapagic y Perdan (2011), Green (2011), Xiao (2009a),Te SAGE Glossary of the Social and Behavioral Sciences (2009r), Stein, Rocco y Goldenetz (2001) y King, Keohane y Verba (1994), un caso puede ser una persona (un líder histórico, un directivo, un profesor, un ama de casa, un empresario, un experto en un área —ingeniería aeronáutica, medicina interna, psicoanálisis….—, etc.), un grupo (familia, equipo que rediseña un proceso industrial, equipo de cirugía, etc.), una colectividad (una colonia, una cultura corporativa, un salón de clases grande, el departamento de una empresa, etc.), un programa o proyecto (para construir un hospital oncológico, de calidad total, para innovar un proceso de manufactura, de vacunación, etc.), una política (educativa, social, económica, etc.), una organización (fábrica, empresa, institución de educación, hospital, etc.), un proceso (mercadológico, arquitectónico, quirúrgico, de diseño industrial, etc.), una decisión (en cualquier ámbito), un tratamiento o intervención (psicológica, médica, veterinaria, de asesoría industrial, etc.), un fenómeno o evento (meteorológico, biológico, histórico, de masas, una catástrofe natural, el cambio climático en una región, una guerra, etc.), un animal o especie, una ley o reglamento, una construcción (pirámide, conjunto de vestigios arqueológicos, un edificio moderno, etc.), un ritual, un producto (de consumo, de manufactura, etc.), una ocupación, una cuestión o asunto intangible (una declaración, un argumento, etc.) y en fin, otros elementos diversos. Es decir, el caso debe cumplir la condición de considerarse sistémica y holísticamente, así como en relación con su contexto y no agregarse a otras unidades para realizar los análisis (el análisis no es agregado ni aditivo como en otros diseños o métodos pues, por ejemplo, no se promedian las unidades). Desde luego, pueden compararse casos (como en el diseño de casos múltiples que se revisará más adelante), pero cada uno es visto como una entidad completa. En términos de Te SAGE Glossary of the Social and Behavioral Sciences (2009r), en el estudio de caso cuando se examinan diversas unidades, los datos se analizan primero dentro de cada caso y posteriormente se establecen las comparaciones entre los casos. La selección del caso es el elemento central de este método o diseño y por ello debe ser muy cuidadosa. El que investigador tieneDesde que informar criteriosdepende y el proceso que se usaron para determinardelelproblecaso o casos se estudiarán. luego, tallosselección principalmente del planteamiento ma y del alcance de la investigación: exploratorio, descriptivo o explicativo (Azapagic y Perdan, 2011, Bleijenbergh, 2009 y Xiao, 2009). El caso se considera en sus dimensiones espacial y temporal. Asimismo, los límites o fronteras se determinan mediante la teoría que guía el estudio, el planteamiento y el sentido común (Elger, 2009).
COMPONENTES Y FASES DEL ESTUDIO DE CASO Si integramos los elementos de Yin (2013 y 2011), Robson (2011), Hak y Dul (2009), HernándezSampieri y Mendoza (2008), Price (2008a) y Stake (2006), podemos decir que el estudio de caso está conformado por los siguientes componentes: • • • • • • • • •
Planteamiento del problema. Proposiciones o hipótesis. Unidad o unidades de análisis (caso o casos). Contexto del caso o casos. Fuentes de información e instrumentos de recolección de los datos. Lógica vincula los datos con preguntas y proposiciones. Análisisque de toda la información. Criterios para interpretar los datos y efectuar inferencias. Reporte del caso (resultados).
Respecto de la secuencia general del estudio de caso, al revisar la literatura más citada en ciencias de la salud, ciencias sociales y administrativas e ingenierías, encontramos varios procesos. Azapagic y Perdan
Metodología de la investigación
(2011), Xiao (2009), Aaltio y Heilmann (2009), Davis (2009) y Dul y Hak (2008) consideran el siguiente: Planteamiento del problema. Definir el caso Seleccionar el caso y el sitio o contexto. Construir el marco teórico base del estudio. Recolectar los datos o evidencia necesaria. Construir una base de datos para poder adicionar, cruzar y comparar información proveniente de distintas fuentes. 7. Procesar y analizar los datos (la base de datos).
1. 2. 3. 4. 5. 6.
8. Reportar resultados.
Por su parte, Harvard Business School (1997) establece las siguientes fases para el estudio de caso en organizaciones (ver figura 4.1). Figura 4.1 Fases para el estudio de caso organizacional según Harvard Business School y Design Management Institute.1
Identificar el caso (un éxito, pero también puede ser un fracaso, un asunto complejo, típico o extremo).
Trabajo de campo:
•Entrevistas con los individuos par ticipantes en el caso (de todos los niveles) • Visitas a la planta, oficinas o sitios donde ocurrió el caso (para entender cuestiones como la tecnología, los procesos de producción, organización y trabajo; el ambiente de la compañía, entre otras). En las visitas se realiza entrevistas, observación sistemática, recolección de más documentos específicos, con la inclusión de materiales audiovisuales, etcétera) • Elaborar notas de campo (recuérdese las notas del proceso cualitativo) Es importante enfocar el caso en aspectos relevantes y centrales.
Investigación de antecedentes y su contexto: • Leer tanto como sea posible sobre la compañía, producto, negocio, mercado o tópico. • Ubicar, definir y contextualizar el caso.
Solicitar permiso de los gatekeepers de la empresa (directivos, líderes de los trabajadores, representantes legales, etcétera) y obtenerlo
Involucrar a la compañía o institución (el caso mismo o cuya par ticipación es decisiva en él, como lo sería un mercado o producto): • Obtener documentos de la empresa o institución, o del caso (reportes anuales, reportes de investigaciones de mercado, boletines, folletos, revistas internas, artículos en los medios de comunicación, entre otros) • Recolectar información sobre los individuos que participan o par ticiparon en el caso (ejecutivos, diseñadores, asesores, etcétera) •Recolectar información sobre el contexto (por ejemplo, competidores, legistalación, datos históricos de la evoluación de un mercado y otros)
Análisis de los datos (de acuerdo con el tipo de datos e información recolectada)
Elaboración del reporte de caso: • Narración (descripciones) • Tablas, figuras, material de apoyo
1 Este proceso se adaptó de la fuente srcinal y resulta más bien propio para estudios de caso de empresas, industrias, mercados, negocios o productos.
5
6
Capítulo 4 Estidos de caso
El proceso de la figura 4.1 puede adaptarse a muy diversos fenómenos o situaciones. Por ejemplo, Price (2008a) propone estudios de caso para que se analice cómo las familias con hijos que tienen enfermedades crónicas y dependen de equipos para usos médicos (como los aparatos de hemodiálisis) aprendan a cuidarlos y vincularse con ellos. En este ejemplo, el caso en cuestión es la familia (incluido, por supuesto, el o la infante), mientras que el contexto es la enfermedad crónica y la dependencia del equipo. En estas investigaciones se selecciona el caso (familia), se revisan los antecedentes y su contexto (historia de la enfermedad y la dependencia del aparato). Por su parte, los gatekeepers son los familiares y el personal médico, quienes deben involucrarse en el estudio (son participantes todos ellos). La información se recolecta mediante diversos métodos: •
• •
•
•
Documentos y diarios (apuntes médicos, régimen médico o patrones estándares de atención y registros médicos; asimismo, se puede solicitar a los participantes que lleven un diario o bitácora de sus experiencias, por escrito o mediante grabaciones de audio). Entrevistas (al niño o niña, familiares, médicos, enfermeras, personal de apoyo, etcétera). Observación (desde una inspección visual del hogar, hasta las consultas médicas, interacciones entre miembros de la familia, etcétera). Artefactos físicos (por ejemplo, elementos de autoayuda para enfrentar el padecimiento y usar los equipos, como manuales, instructivos o videos educativos y de entrenamiento. Incluso, el investigador puede examinar la maquinaria y cualquier manual de instrucciones para poder apreciar la complejidad que enfrentan los niños y sus familias). Las piezas de comunicación que consultan los participantes sobre la enfermedad y la situación en general (anuncios en los medios de comunicación colectiva, libros, folletos, etcétera).
Así, se va efectuando el trabajo de campo, se realizan diversos análisis y se reporta el caso. Como podemos ver, en los estudios de caso es recomendable agregar diversas técnicas para recabar información, inclusive encuestas o grupos de enfoque, esquema que resulta compatible con un proceso cuantitativo, cualitativo o mixto. Yin (2013 y 2011), Green (2011), Te SAGE Glossary of the Social and Behavioral Sciences (2009r) y Aaltio y Heilmann (2009) consideran que las principales herramientas de recolección de los datos son las siguientes: observaciones directas, entrevistas, registros de archivos, documentos y artefactos. Casi siempre se utilizan al menos dos técnicas y múltiples fuentes. Se recaba evidencia hasta responder a las preguntas de investigación. Otro esquema para un estudio de caso es el de Hernández-Sampieri y Mendoza (2008), el cual se muestra en la figura 4.2. En este proceso, Stake (2006) recomienda recolectar datos e información sobre: • •
• • • •
La naturaleza del caso. Antecedentes históricos (por ejemplo: clínicos en una enfermedad física o psicológica, historial de ventas en una cuestión empresarial, rendimiento en una maquinaria, índices de desempeño en un proceso industrial, etcétera). Ambiente físico. Contexto o contextos pertinentes (económico, político, legal, social, estético, etcétera). Otros casos a través de los cuales el de interés se puede conocer más ampliamente. Informantes potenciales. Asimismo, sugiere establecer una agenda de recolección de datos.
TIPOLOGÍAS EN RELACIÓN CON EL ESTUDIO DE CASOS
En la literatura sobre estudios de caso podemos encontrar diversas clasificaciones, las cuales se mencionan a continuación.
Metodología de la investigación
Figura 4.2 Esquemas para el estudio de casos. !
Analizar el casod e manera exploratoria: descripción inicial del caso, sus antecedentes y contexto
Formular el planteamiento del problema con el caso: objetivos, preguntas de estudio, justificación y explicación del motivo o razones por las cuales se eligió
Elaborar un primer inventario del tipo de información que se desea recolectar Preparar el estudio de caso: información completa que se requiere del caso, tipo de datos que son necesarios y métodos para obtenerlos
Obtener la información inicial y analizarla
Recolectar información adicional
Analizar información adicional
Desarrollar alternativas o cursos de acción, si es el objetivo
Presentar el reporte con recomendaciones y su justificación
Por su finalidad Grandy (2009a) y Stake (2006) identifican tres diferentes tipos de estudios de caso: intrínsecos, instrumen-
tales y colectivos. Veamos cada uno. El propósito de los primeros no es construir una teoría, sino que el caso mismo resulte de interés. Frecuentemente son de naturaleza exploratoria y el investigador es guiado por el deseo de analizar el caso en sí más que producir teoría, pretender alguna clase de generalización o representar a otros casos. En términos de Grandy (2009b), explorar es la pretensión en el estudio de caso intrínseco y regularmente el deseo o intención es conocer más respecto de la singularidad de éste. Los estudios de casos instrumentales se examinan para proveer de insumos de conocimiento a algún tema o problema de investigación, construir y/o perfeccionar una teoría o aprender a trabajar con otros casos similares. El caso por sí mismo es menos importante que el entendimiento que genera. La diferencia entre el caso intrínseco y el instrumental no radica en la unidad de análisis sino en la finalidad del estudio. Los casos colectivos involucran varios estudios de casos instrumentales (Grandy 2009a) que sirven para construir un cuerpo teórico (sumar hallazgos, encontrar elementos comunes y diferencias, así como acumular información). Stake (2006) comenta que en ocasiones un estudio de caso puede ser tanto intrínseco como instrumental porque sirve a ambos propósitos, lo que dificulta categorizarlo. Un ejemplo de caso intrínseco nos lo proporcionan Stephen Connolly y Sorrel Penn-Edwards (citado por Grandy, 2009b), el cual se relacionaba al Programa de Educación de Valores (VEP, por sus siglas en
7
8
Capítulo 4 Estidos de caso
inglés) del Departamento de Educación, Ciencia y Capacitación (DEC) de Australia. El interés primario radicaba en el caso en sí y los investigadores se centraron en la operación y desempeño del programa durante cuatro años. Su estudio es de naturaleza exploratoria y se enfocó en descubrir las particularidades de la comprensión de los docentes sobre el VEP, su identificación con el programa y aceptación. Los resultados les sirvieron para entender el funcionamiento de este emprendimiento, así como la inversión financiera y de tiempo que requiere un esfuerzo de esta magnitud. No intentaban teorizar ni generalizar. Por su parte, Stein, Rocco y Goldenetz (2001) implementaron un estudio de caso instrumental para explorar la forma en que las políticas de recursos humanos relativas a los trabajadores adultos mayores deben ser modificadas para que coincidan con los cambios demográficos. A través de su investigación sometieron a prueba una teoría en un sitio real. Adoptaron la teoría de Doering sobre permanencia, retiro y regreso al trabajo para explicar temas que emergieron de suscómo datos.laAsí, eligieronsecomo caso a una gran universidad del medio oeste delosEstados Unidos para explorar institución está adaptando al “envejecimiento” de la fuerza laboral, ya sean empleados mayores de 55 años que permanecen en sus puestos o regresan a integrarse a la organización, y la experiencia subjetiva de ser un trabajador “más viejo” en el ámbito universitario. El sitio en sí no orientó su indagación, sino que constituyó una herramienta para comprender mejor dicha experiencia. Usaron la triangulación para garantizar una descripción completa y profunda del fenómeno y aumentar la confiabilidad de sus resultados. Además, examinaron documentos de la institución vinculados con el planteamiento (por ejemplo, políticas, comunicados de prensa y cobertura de los medios) y estadísticas de la base de datos de empleo del departamento de recursos humanos. Asimismo, realizaron entrevistas estructuradas con 12 trabajadores universitarios mayores de 55 años. Stein, Rocco y Goldenetz no tenían la intención de generalizar. Sin embargo, su investigación sugiere pautas para la futura exploración de cuestiones específicas de recursos humanos relativas al envejecimiento de los trabajadores (por ejemplo, estrategias para proporcionar mejores consejos a los empleados de mayor edad y redefiniciones de los acuerdos laborales para el personal de la tercera edad).
Por el número de casos o unidades de análisis Aaltio y Heilmann (2009), Te SAGE Glossary of the Social and Behavioral Sciences (2009o) y Stake (2006), ofrecen otra tipología de los estudios de casos que se relaciona con el número de unidades o entidades a considerar: 1. Un solo caso o unidad de análisis. 2. Múltiples unidades de análisis o casos (en primera instancia, evaluar cada uno por sí mismo holística
o integralmente, para después establecer tendencias y comunalidades). 3. Múltiples casos “cruzados”, a“nidados” o “entrelazados” (la diferencia con la clase anterior es que
desde el inicio se pretende revisar comparativamente los casos entre sí para tratar de detectar similitudes y diferencias). De acuerdo con Burns (2009), Campbell (2009) y Miles y Huberman (2002), se pueden contrastar los casos de manera holística o eligiendo ciertas dimensiones o variables, pero siempre se analizan sistémicamente. A su vez, Yin (2013 y 2011), Goddard (2009) y Chmiliar (2009) establecen una clasificación de los estudios de caso, para lo cual toman en cuenta dos factores: número de casos y clase de unidad de análisis. En cuanto al número de casos la tipología considera un caso o varios casos (regularmente de dos a diez). Por lo que respecta a la unidad de análisis, estos autores los subdividen en casos con unidad holística (todo el caso tomado como una sola unidad de análisis) y casos con unidades incrustadas (varias unidades de análisis dentro del caso). Los tipos de casos resultantes de esta clasificación cruzada son diseños de investigación del método de caso o pueden ser concebidos como diseños específicos del estudio de caso (en concordancia con otros autores) y se muestran gráficamente en la figura 4.3.
Diseños de un solo caso En los estudios de caso holísticos, el caso debe ser crítico y revelador, esto es, generado para confirmar, desafiar o extender una teoría o hipótesis. Asimismo, pueden documentar una situación o evento único y
Metodología de la investigación
Figura 4.3 Diseños del estudio de caso de acuerdo con Robert Yin. Diseños de un solo caso Contexto Holístico (se estudia la unidad de análisis completa)
Caso
Diseños de múltiples casos Contexto Contexto
Contexto
Caso
Caso
Contexto
Contexto Cont exto
Caso
Incrustado (múltiples unidades de análisis)
Caso
Contexto
Contexto
Contexto
Caso
Caso
Caso
(UA1) (UA2)
(UA1) (UA2)
Contexto
Contexto
Unidad de análisis 1 incrustada (UA1) Unidad de análisis 2 incrustada (UA ) 2
Caso
Caso
(UA1) (UA2)
(UA1) (UA2)
extremo (un individuo con una enfermedad extraña, un producto cuyas ventas se incrementan de manera estratosférica en un periodo relativamente corto, digamos, un año; un sistema social que se transforma radicalmente, una invasión bélica sorpresiva, un fenómeno climático que provoca daños inimaginables —como la confluencia de los ciclones Ingrid y Manuel en México en 2013 o el terremoto de Chile en 2010—, un proceso de producción de acero completamente innovador, entre otros). El caso debe ser evaluado de manera completa y profunda, de acuerdo con el planteamiento del problema. Por ejemplo, una institución educativa con un crecimiento vertiginoso, que pasó de 90 a 1 500 alumnos en sólo cinco años, que transitó de ser una organización con estándares académicos bajos y una imagen sumamente negativa en la localidad, a constituirse en una institución con estándares elevados y una imagen por completo favorable. El análisis debe abarcar diversos rubros, tales como sus antecedentes, el clima y la cultura organizacional, los sistemas y programas de mejora, el estilo administrativo, la productividad, la estructura funcional, etc. Lo importante es descubrir las razones de tal éxito. Por su parte, en los estudios de caso con unidades incrustadas, la “gran unidad” es segmentada en varias unidades (o subunidades), de las cuales se seleccionan algunas (por importancia, representatividad analítica, acceso o muestreo teórico) para ser analizadas con amplitud y profundidad. Por ejemplo, Hernández-Sampieri, Méndez y Cuevas (2008) evaluaron el caso de una administración municipal en lo referente a la calidad en la atención directa a los ciudadanos (áreas que tienen contacto con estos). De todos los departamentos, seleccionaron organismo municipal de agua potable, obras públicas (recepción
9
10
Capítulo 4 Estidos de caso
de quejas y solicitudes para la construcción de obras en el municipio), receptoría de pagos (por servicios recibidos, como trámites de licencias, expedición de documentos, etc.), receptoría de trámites empresariales (para abrir negocios, refrendar permisos, etc.), registro civil (matrimonios, registro de nacimientos, etc.), oficina del alcalde, y finalmente, la dirección de policía (recepción de denuncias sobre delitos, información de detenciones, entre otras). El riesgo de los estudios con unidades incrustadas es que el investigador “pierda de vista” la naturaleza entera del caso al enfocarse en una problemática más local (o departamental, como en el ejemplo). Sin embargo, de cualquier manera siempre debemos tener en mente toda la unidad de análisis, el caso completo. En la página web el lector podrá encontrar un ejemplo de estudio de un único caso instrumental de
de las mejores prácticas empresariales las áreas de una empresa fabricante de calzado exitosa: Análisis administración, mercadotecnia, manufactura y desarrollo organizacional: un estudio de casoen(Arredondo, Hernández-Sampieri y Méndez, 2013)
Diseños de múltiples casos En estos diseños, el proceso que se utiliza para cada caso se “repite” en los demás. La revisión de los casos es similar (se consideran holísticamente o se eligen las mismas variables o aspectos, al igual que los instrumentos para recolectar los datos y el proceso en general, aunque puede haber variantes) (Gondo, Amis y Vardaman, 2009, Burns, 2009, Campbell, 2009 y Miles y Huberman, 2002). Por ejemplo, varios hospitales, escuelas, pacientes, procesos de manufactura, etc., con características equivalentes. De acuerdo con Yin (2013), son diseños más “robustos” y poseen mayor validez. A veces se eligen casos significativos, lo que en términos prácticos resulta muy difícil, ya que encontrar varios casos que compartan similitudes es complicado. Es importante remarcar que cada caso debe servir a un propósito específico dentro del alcance total. Asimismo, es necesario insistir que el conocimiento generado por los diversos casos no es aditivo (los casos no son como entrevistados en una encuesta o survey). En este sentido, la lógica de replicar casos es muy parecida a la de los experimentos. Reproducimos algunos casos con condiciones similares y otros se replican modificando ciertos elementos. Por ejemplo, un par de hospitales que muestran ciertos indicadores y características similares (número de camas, personal, especialidades, estilo administrativo, antigüedad u otras características); luego, un hospital con menos camas y una nómina más pequeña; posteriormente, un hospital equivalente a los dos primeros, pero con estilo administrativo o antigüedad diferente; más adelante, un hospital especializado en cierto tipo de servicios, etcétera. Cada caso se selecciona cuidadosamente, de tal modo que se analice el planteamiento del problema, que una vez más, actúa como la guía durante toda la investigación. Si se aplica para obtener casos similares, es importante y necesario desarrollar un marco teórico, el cual nos debe señalar qué variables resulta lógico que se presenten en los casos (lógica cuantitativa, estandarización). De cualquier forma, cada caso es un “todo”, una entidad por sí misma. anto la recolección de los datos como el análisis tienen como uno de sus objetivos explicar consistencias e inconsistencias entre casos. El nivel de análisis es simultáneamente individual (caso por caso) y colectivo. Por ejemplo, Ferlie, Fitzgerald, W ood y Hawkins (2005) llevaron a cabo un estudio de múltiples casos en dos unidades de atención médica en el Reino Unido (parte del Sistema Nacional de Salud), una primaria y otra intensiva. El objetivo central era comprender cómo se desarrollaban y difundían ocho innovaciones (casos) seleccionadas por muestreo guiado por propósito (básicamente, que se fundamentaran en evidencia científica) y la influencia que ejercía la participación en ello de diferentes yclases de profesiones, entre cuestiones. La investigación implicó tres años de seguimiento, la recolección de datos fueotras realizada por medio de entrevistas semiestructuradas, reuniones y revisión de reportes formales e informales. ¿Cuántos casos deben incluirse en un diseño múltiple? En primer término, la lógica de muestreo cuantitativo no opera (Price, 2008b). Entre más casos, es posible desarrollar un mayor sentido de entendimiento en relación con el planteamiento del problema; sin embargo, el número de casos más bien depende de los recursos económicos y el tiempo a disposición del investigador . El ideal es
Metodología de la investigación
muy parecido al análisis cualitativo, cuando respondamos a la(s) pregunta(s) de investigación. A veces, intentamos comparar casos extremos (por ejemplo, una escuela donde hay una elevada violencia entre los estudiantes y una escuela sin violencia; o un producto exitoso, digamos un determinado refresco de limón, con un producto del mismo sabor qu e ha fracasado). En los casos múltiples, además de intentar descubrir patrones, también queremos profundizar en el plano individual, por lo que, como hemos señalado, la revisión de todos debe ser exhaustiva. Pero cada caso implica un enorme esfuerzo no exclusivamente en el proceso indagatorio, sino en el de gestión. Recomendamos a los estudiantes que realizan por primera vez un estudio de caso que comiencen por una sola unidad de análisis. Después, pueden ampliarse a más casos. Ciertamente observar casos similares o diferentes ayuda a enriquecer el conocimiento de un problema de investigación, pero no resulta sencillo. Además, insistimos, el interés fundamental de un caso es intrínseco; la comparación con otros es conveniente, pero se encuentra supeditada a lo primero. El proceso de un diseño de casos múltiples se presenta en la figura 4.4. Figura 4.4 Secuencia de un diseño de casos múltiples. 2 CONCEPTUALIZACIÓN Y DISEÑO
Planteamiento del problema
Seleccionar casos Desarrollo del marco teórico
RECOLECCIÓN Y ANÁLISIS
Conducir el estudio del primer caso
Conducir el estudio del segundo caso
Elaborar reporte del primer caso
Conducir estudios de casos remanentes
Establecer conclusiones entre casos Modificar teoría
Elaborar reporte del segundo caso
Generación de los instrumentos para recolectar datos
METAINFERENCIAS Y DISCUSIÓN
Elaborar reportes individuales de cada caso
Establecer implicaciones Elaborar el reporte final que incluye el análisis entre casos
Cuando vamos a estudiar varios casos secuencialmente, Yin (2011) y Stake (2006) recomiendan que el primero se considere como una especie de “caso piloto”, esto es, que nos resulte útil para perfeccionar los instrumentos de recolección de datos. Respecto de los múltiples casos cruzadoso entrelazados, en los cuales el investigador desde el inicio pretende revisar comparativamente los casos entre sí, buscando similitudes y diferencias, su diseño se podría esquematizar como lo sugieren Hernández-Sampieri y Mendoza (2008) (figura 4.5). En ciencias de la salud, Joerg y Bigby (2007) comentan que los estudios de caso de un solo paciente generalmente incluyen varios reportes del sujeto, mientras que los casos en serie (múltiples) implican colecciones de información de dos o más pacientes. Creswell (2013a y 2013b), Yin (2013), Mertens (2010) y Stake (2006), consideran que en un estudio de caso con una unidad o múltiples unidades debe haber triangulación de fuentes de datos y es necesario utilizar diferentes herramientas tanto cuantitativas como cualitativas, como ya hemos visto. Además, es necesario generar una base de datos para fines de auditoría de los datos y confirmación. Un ejemplo de un estudio de casos múltiples puede encontrarse en la investigación de Molla S. 2 Extraído de Hernández-Sampieri y Mendoza (2008).
11
12
Capítulo 4 Estidos de caso
Figura 4.5 Diseños de múltiples casos entrelazados. Similitudes y diferencias
Similitudes y diferencias
Caso 1
Caso 2
Caso k
Similitudes y diferencias
Discusión (similitudes y diferencias, patrones)
Elaborar reporte del estudio comparativo
Donaldson sobre la calidad del servicio médico en Estados Unidos. Los resultados se basan en un examen intensivo de 45 instituciones, una de las cuales se localiza en Canadá y otra en el Reino Unido. Se realizaron entrevistas en diversos tipos de unidades de siete ciudades: centros de atención primaria y hospitales especializados, así como clínicas familiares. La muestra incluyó a unos 270 000 pacientes y 15 equipos de médicos. Se recolectaron datos de 14 variables que fueron identificadas y refinadas como altamente significativas para la calidad de la atención, mediante el análisis entre casos. Al final, emergieron ocho temas claves. Como parte de los resultados, se hicieron generalizaciones acerca de cómo funciona el sistema de salud estadounidense y los factores que inciden en la innovación y la excelencia médicas. Asimismo, se presentaron sugerencias para optimizar la formación de los profesionales de la salud y la formulación de políticas sanitarias nacionales (Kohn, Corrigan y Donaldson, 2000).
Por el tipo de datos recolectados Los estudios de caso también pueden subdividirse, dependiendo de la clase de datos que recolecten, en: cuantitativos, cualitativos y mixtos (Creswell, 2013a y 2013b, Hernández-Sampieri y Mendoza, 2012, y Te SAGE Glossary of the Social and Behavioral Sciences, 2009q). Esta clasificación se comprenderá si previamente se revisaron todos los capítulos del libro impreso, puesto que en los primeros se aplica el proceso cuantitativo al estudio de una unidad; en los segundos, el proceso cualitativo; y en los terceros, cualquier modalidad mixta.
Cuantitativos En los estudios de caso cuantitativos se utilizan herramientas estandarizadas como pruebas, cuestionarios, escalas, observación estructurada, aparatos y dispositivos, indicadores medibles y análisis de contenido con categorías preestablecidas. A su vez, se subdividen en experimentales cronológicos (a través del tiempo) y no experimentales (transversales y longitudinales). En los primeros, que denominaremos —de acuerdo con León y Montero (2003)— como experimentales de caso único, se aplica un tratamiento y se efectúan diversas mediciones para analizar la evolución o consecuencia de este (Dugard, File y odman, 2011 y Grinnell, Williams y Unrau, 2009). De hecho, la validez de las inferencias se establece al efectuar varias mediciones repetidas a través de las fases del experimento con una n = 1, antes y después del estímulo (Mertens, 2010).
Metodología de la investigación
Se utilizan comúnmente con variables que permanecen en la persona participante o fenómeno (caso) por largos periodos y se ha establecido que no cambian con el mero paso del tiempo (Mertens, 2010). La hipótesis sostiene que el tratamiento las modificará. Consideremos el siguiente ejemplo. Un neurólogo dedicado a auxiliar a pacientes que han sufrido lesiones cerebrales traumáticas. Estos frecuentemente tienen problemas específicos individuales que requieren conocimientos, experiencia, imaginación y creatividad para sugerirles un tratamiento que les pueda ayudar, especialmente en casos difíciles o complejos. Supongamos que el médico, basado en su experticia y una extensa revisión de la literatura, así como en la consulta a otros expertos, decide implementar un nuevo procedimiento, pero es importante que la intervención la desarrolle con oportunidad y bajo el esquema experimental. Si hay progreso tiene que asegurarse de que fue el procedimiento lo que logró la mejorano y no otras Este cuestiones evitar que en entusiasmo de “hacer la diferencia” vea cambios que realmente lo son). diseño(y experimental (nsu =1), puede arrojar información prometedora pero requiere de estudios posteriores de carácter confirmatorio (Dugard, File y odman, 2011). Robson (2011) y León y Montero (2003) se cuestionan: ¿hay realmente un experimento con una sola persona? La respuesta proporcionada por ellos es que debe comprobarse: a) covariación entre la variable independiente (estímulo) y la(s) dependiente(s), b) la aplicación de la independiente debe anteceder a la medición de la dependiente y c) otras variables, diferentes de la independiente, tienen que descartarse como posibles explicaciones de los cambios observados en las dependientes. De acuerdo con Mertens (2010), el tratamiento debe aplicarse a varias personas para comenzar a pensar en generalizaciones y evaluar el efecto en distintos tipos de individuos. En este sentido, los procedimientos para el estímulo se deben estandarizar y describir en detalle, además de que deben implementarse de forma cuidadosa. Asimismo, resulta importante que la medición de la variable dependiente se encuentre plenamente fundamentada y documentada. El asunto de la generalización es debatible, pero en la historia experimental los diseños de caso único (de cierta manera una forma de preexperimentos) han contribuido al desarrollo del conocimiento en diversos campos. Sobre el tema de la generalización en los estudios de caso en general, volveremos más adelante. Veamos algunos de estos diseños, conforme a la simbología de Mertens (2010), así como de Williams, Grinnell y Unrau (2005) y León y Montero (2003).
Diseños experimentales (n = 1) AB Este diseño es el más sencillo y abarca dos etapas: la fase A, en la cual no hay tratamiento [en términos de León y Montero (2003), se establece la “línea base” o tendencia], y la fase B, en la que se administra un tratamiento y se mide(n) la(s) variable(s) dependiente(s) durante la terapia. Así, el diseño “AB es un plan en el que primero se establece la línea base —sin tratamiento— y una vez estabilizada se produce la intervención y la medida de la nueva serie” (León y Montero, 2003, p. 313). Por ejemplo, una madre que ha perdido el “sentido de vida” por el fallecimiento de un hijo. Con el fin de lograr que esta mujer recupere dicho sentido, se plantea un estímulo: sesiones terapéuticas con un psiquiatra experto en el manejo de “duelos emocionales” y psicología transpersonal; sin embargo, antes de aplicarse el tratamiento experimental, se establece la línea base (se mide su sentido de vida en por lo menos dos ocasiones, para verificar el nivel de la participante en la variable). Una vez que se evaluó su condición con toda precisión, se administra el estímulo (sesiones, digamos durante 12 semanas) para posteriormente volver a valorar el sentido de vida y analizar su evolución. Otro ejemplo podría ser el de un tratamiento para reducir la dependencia o adicción hacia el consumo de alguna droga ilegal y dañina o estupefaciente (como la cocaína). Primero, se estima el grado en que el participante realmente es adicto. En segundo término, se administra el tratamiento. Finalmente, se vuelve a medir para examinar el puntaje-ganancia (aumento o disminución propuesta hipotéticamente en la variable dependiente, según sea el caso). Este diseño podría representarse como se muestra en la figura 4.6.
13
14
Capítulo 4 Estidos de caso
Figura 4.6 Diseño AB del estudio de caso experimental. 70 60
Nivel del sentido de vida (medición en la variable dependiente)
2
50 40
Escala de 10 a 70
30
X 20
2
(inicio)
2
10
2
Primera medición
2
2
Segunda medición
2 Tercera medición
= Medición
Primera Segunda medición medición posterior al posterior inicio y durante el tratamiento
Tercera medición posterior
Semanas (12)
X = Tratamiento
= Línea base
Tendencia posterior =
En la notación tradicional que se muestra en el capítulo siete del libro, el diseño se representaría así: 01
02
03
04
05
X continúa
06
(en un periodo de 12 semanas)
implementándose
El estímulo puede implicar días, meses o aun años (método educativo, terapia física de rehabilitación, proceso de mejora continua, innovación específica en manufactura, etc.). Cabe señalar que no es un diseño donde primero se administren prepruebas, luego se implemente el estímulo, se suspenda este, y finalmente se apliquen pospruebas, sino que las mediciones se realizan durante la administración del tratamiento (simultáneamente). De este modo, se monitorea el funcionamiento del estímulo. Es decir, el esquema no sería así: 01
02
03
04
05
06
(no es antes y después, sino antes y durante)
X ya
está suspendida cuando se administraron las prospruebas
Desde luego, el diseño puede extenderse a una tercera etapa sin tratamiento (ABA). En estos diseños AB se pueden producir diferentes esquemas de resultados, lo cual podemos apreciar en las gráficas de la figura 4.7.
Diseños experimentales (n = 1) ABAB Se trata de una extensión del diseño anterior: primero se establece la “línea base” o tendencia, pero no hay tratamiento o intervención (etapa A); luego, se implementa la fase B, en la que se administra un tratamiento y se mide. Posteriormente, se retira el tratamiento y se continúa con la evaluación (otra vez A). Finalmente, se vuelve a introducir el tratamiento y se mantiene el monitoreo (otra vez B).
Metodología de la investigación
Figura 4.7 Esquemas de resultados en el diseño AB. !
Incremento durante la intervención
Decremento durante la intervención
X
X
X X X X X
Mediciones durante la intervención
Diagnóstico o mediciones previas
Mantenimiento durante la intervención (sin cambios)
X X X X X
Mediciones durante la intervención
Diagnóstico o mediciones previas
Altibajos durante la intervención (no hay una tendencia definida)
X
X
X X X X X
X X X X X Diagnóstico o mediciones previas
Mediciones durante la intervención
Diagnóstico o mediciones previas
Mediciones durante la intervención
Lo importante de este diseño es mantener el seguimiento de la evolución de la(s) variable(s) dependiente(s) durante las fases (medición constante). Un reto de este diseño es que pudieran afectar todas las fuentes de invalidación interna señaladas por Campbell y Stanley (1966) y que se revisaron brevemente en el capítulo siete del libro impreso, pero que se amplían en el próximo capítulo de esta página web:“Diseños experimentale s: segunda parte”, principalmente la historia; además de que es factible que actúen otras explicaciones rivales (por ejemplo, el terapeuta que conduzca las sesiones puede establecer una comunicación con la participante que no necesariamente ocurriría con otras personas de un modo similar). El desafío es posible afrontarlo a través de diversas acciones (algunas de ellas serán consideradas más adelante), pero la principal, sin lugar a dudas, consiste en que el investigador tiene que mantenerse “muy cerca” del desarrollo del experimento (pendiente de sucesos externos y de cambios, además de aplicar varias mediciones y recolectar datos cualitativos complementarios, producto —por ejemplo— de entrevistas y observación). La esencia de un diseño ABAB se presenta en la figura 4.8. En el siguiente capítulo, el 5, del centro de recursos en línea, se muestran los diseños experimentales cronológicos que tienen esquemas similares, pero se trata de grupos, en tanto que las pospruebas se administran después de la aplicación del estímulo o tratamiento, no durante su implementación. Asimismo, podemos tener diseños BAB (intervención o estímulo, retirada y reintroducción), que se usan cuando alguna persona requiere urgentemente un tratamiento (por ejemplo, un adicto que necesita atención de emergencia). ambién existen diseños más complejos ABABA. al sería la situación si estamos experimentando con un proceso de capacitación o un método para que un individuo deje de fumar: Sin tratamiento ABABA
Con tratamiento
Sin tratamiento
Con tratamiento
Sin tratamiento
15
16
Capítulo 4 Estidos de caso
Figura 4.8 Diseño ABAB.
Variable dependiente
A
B
Establecer línea Introducción del base o tendencia tratamiento, (nivel de la estímulo o dependiente) intervención
A Retirada del tratamiento, estímulo o intervención
B Reintroducción del tratamiento, estímulo o intervención
Medición continua de la variable dependiente
Periodo
Los estudios de caso transversales implican recolectar datos cuantitativos sobre la unidad en un momento único y no se manipula una intervención o tratamiento (Xiao, 2009a). En síntesis, son una especie de estudios no experimentales, cuyo alcance puede ser descriptivo, correlacional o explicativo, pero toman en cuenta una sola entidad de análisis, por ejemplo, diagnosticar el estado de salud física de una persona y las causas a través de distintas pruebas en diferentes cuestiones (funcionamiento pulmonar, resistencia, presión arterial, nivel de ácido úrico, plaquetas, etc.) o analizar la conveniencia de invertir en un país a la luz del análisis de sus sistemas económico, social, político, jurídico, educativo, etcétera). Debemos considerar también los estudios de caso longitudinales, en los cuales podemos reconstruir el caso a través del tiempo (Aaltio y Heilmann, 2009). La modalidad mínima implica dos puntos en el tiempo, por ejemplo, antes y después de un evento o incidente crítico (McDonald, 2009). al sería el caso de una empresa antes y después de una reingeniería o reestructura, un paciente previa y posteriormente a un infarto o la eficiencia de un proceso industrial antes y después de la introducción de una nueva maquinaria. Estos diseños resultan muy apropiados para medir y analizar cambios. La validez de los estudios de caso de corte cuantitativo (experimentales o no experimentales) requiere una serie de tácticas: •
•
• •
•
•
• •
•
•
La planeación debe ser muy cuidadosa, es decir, desde antes de la implementación debe definirse cómo se va a validar la información y establecer la confiabilidad (Bell, 2010). La documentación de la evidencia debe ser sistemática, completa y ofrecer detalles específicos del desarrollo de la investigación. Es necesario utilizar fuentes múltiples de datos e información. Se requiere establecer la cadena de evidencia sobre la causalidad. Esto significa que un investigador externo debe monitorear la derivación de cualquier evidencia, desde el planteamiento hasta el reporte de resultados. Si involucra individuos, grupos u organizaciones, resulta indispensable verificar los resultados con los participantes (un elemento que se utiliza en las investigaciones cualitativas chequeo con miembros , puede aplicarse a los casos cuantitativos). Elaborar predicciones sobre resultados, basadas en la teoría y al final comprobar que estas se hayan cumplido, lo que ayuda a soportar el caso (Yin, 2013). Si cuando contrastamos los resultados con la teoría y las hipótesis o proposiciones encontramos diferencias, debemos revisar y ajustar las hipótesis y replicar nuevamente el caso, hasta que logremos responder al planteamiento del problema. Evaluar cuidadosamente cómo los detalles del caso explican los resultados. Recordemos que los experimentos y estudios de caso confían más bien en una generalización analítica, mientras que las investigaciones no experimentales confían en una generalización estadística (Te SAGE Glossary of the Social and Behavioral Sciences, 2009r). Los procedimientos utilizados deben documentarse en cada estudio de caso (todo el proceso) (Tomas, 2011). La base de datos debe ser accesible para que otros investigadores puedan establecer la validez y confiabilidad de los procedimientos (fines de auditoría). Yin (2013), Gerring (2007) y Hancock y
Metodología de la investigación
Algozzine (2006) sugieren que la base de datos debe contener los materiales tabulados (matrices de datos), los documentos centrales (con permiso de la persona que constituye el caso o los líderes de la organización o comunidad involucrada), así como los esquemas y procedimientos de análisis. Los análisis estadísticos del estudio de caso dependen del planteamiento del problema, las hipótesis (si se establecieron), el diseño específico y el tipo de datos recolectados. Al igual que en otras clases de investigación, el análisis consiste en examinar, categorizar, tabular, probar y evaluar la evidencia obtenida, para valorar las proposiciones iniciales del estudio (planteamiento). Asimismo, es necesario idear una estrategia analítica general, que incluya la definición de prioridades respecto de lo que vamos a analizar y las razones de ello. Yin (2011), Burns (2009), Campbell (2009) y Mills, Durepos y Wiebe (2009) proponen que la estrategia de análisis debe: 1) confiar en la teoría, 2) organizar y efectuar el análisis sobre la base de las proposiciones (hipótesis) o por las preguntas de investigación (una por una o vinculándolas), 3) reflexionar y evaluar explicaciones rivales (nuestras hipótesis o proposiciones frente a otras) y 4) desarrollar cuidadosamente la descripción del caso y su contexto. al descripción puede ser cronológica (por ejemplo, de una empresa exitosa, por las etapas que atravesó) o por subunidades del caso (como serían las áreas de una empresa o sistemas del cuerpo humano). A veces, las explicaciones rivales surgen durante la recolección de los datos. Por ejemplo, podemos realizar un estudio de caso en una empresa (digamos, del clima organizacional).3 al variable es propia del estudio de caso4 porque el clima de cada organización es único, esto es, no existen dos empresas con la misma historia, liderazgo, estructura, entorno, procesos y productos (es decir, que en todo sean iguales). Dicho diagnóstico puede reflejar un clima organizacional elevado (en cuanto a moral, motivación, orgullo, etc.). En este caso, la explicación podría ser que es una compañía con un liderazgo positivo, cuyo personal se involucra en su trabajo, donde la comunicación fluye honesta y abiertamente, se facilita la cooperación, el rumbo de la empresa se ha expuesto a los empleados y las decisiones les han sido explicadas. Sin embargo, debemos descartar otras explicaciones rivales como: •
• •
•
Explicación rivalun 1: diagnóstico efecto Hawthorne (el clima es elevado simplemente porquefavorase está llevando a cabo y el personal ha organizacional desarrollado expectativas altas sobre cambios bles que resulten de él). Explicación rival 2: se realizó recientemente un ajuste salarial favorable. Explicación rival 3: en el país o región fue elegido como presidente o gobernador una persona muy estimada por los trabajadores, lo cual generó un efecto de entusiasmo social generalizado. Otras razones.
Por ello, las fuentes de datos deben ser variadas y los rubros amplios, profundos y completos; además, la información del contexto resulta fundamental. Asimismo, Price (2008b) sugiere que en los estudios de caso de esta naturaleza se establezcan los límites entre el caso en sí y su entorno.
Cualitativos En los estudios cualitativos de caso, el ambiente o contexto está constituido por el mismo caso y su entorno, pues los límites entre uno y otro son más difíciles de establecer. Asimismo, no se utilizan herramientas estandarizadas ni se establecen categorías a priori. Al igual que otros diseños cualitativos, la materia prima de los datos la constituyen las narrativas verbales, escritas y audiovisuales, incluyendo artefactos (Flick, 2013, Creswell, 2013b, Hernández-Sampieri y Mendoza, 2012 y Norlyk y Harder, 2010). El proceso es 3 Un estudio de caso de esta naturaleza requeriría no solo de un diagnóstico del clima organizacional, sino de un análisis profundo de sus causas y efectos.
4 Salvo que realicemos una validación de un instrumento de medición, como el ejemplo de Hernández-Sampieri (2005) que requiere varias empresas e instituciones; o bien que pretendamos vincular el clima con otras variables en diferentes organizaciones.
17
18
Capítulo 4 Estidos de caso
el mismo que en otras investigaciones cualitativas (inmersión inicial para que el investigador evalúe si el caso a considerar reúne las condiciones que requiere, inmersión final, recolección de datos, análisis, etc.). Gran parte de los estudios de caso de este tipo tienen como objetivo documentar una experiencia o evento en profundidad o entender un fenómeno desde la perspectiva de quienes lo vivieron. El estudio de caso cualitativo no persigue ninguna clase de generalización. La transferencia es muy difícil de alcanzar, es decir, regularmente se requieren varios estudios de caso (como en el descubrimiento de las tumbas de faraones egipcios de la antigüedad, se establecieron cuestiones comunes una vez que se consideraron varios casos). En el capítulo 15 del libro se mencionó que el diseño de estudio de caso bajo la óptica cualitativa se iba a ampliar en la página web. Es tiempo de responder a esta promesa. Este diseño es muy apropiado para planteamientos descriptivos, cuyas preguntas de investigación se establecen para desarrollar un entendimiento profundo de cómo diferentes casos proporcionan información sobre un problema o ayudan a comprender una unidad relevante (Creswell et al., 2007). La información que se obtiene generalmente está constituida por descripciones de casos vinculados a la pregunta de investigación y datos completos de un caso significativo e ilustrador así como por categorías vinculadas con los casos. Asimismo, Creswell (2013b) señala que esta estrategia de indagación sirve para analizar procesos y diversidades, sobre todo perspectivas en relación con el caso y su contexto. En el citado capítulo se incluyó una tabla comparativa de las características de los principales diseños cualitativos (15.2), a la cual habría que agregarle la siguiente columna referente a los estudios cualitativos de caso (tabla 4. 3). Tabla 4.3 Características del estudio de caso cualitativo. Característica
Estudiosdecasocualitativos
Tipo de problema de investigación más Cuando se encuentra un caso enmarcado por el tiempo y el espacio que apropiado para ser abordado por el diseño. puede informar sobre un problema. Disciplinas en las cuales se cuenta con más Psicología, derecho, ciencias de la salud ciencias administrativas (negocios) antecedentes. e ingeniería. Unidades comunes de análisis. Evento, proceso, programa, actividad, organización, un individuo. Instrumentos de recolección de los datos más usados. Estrategias de análisis de los datos. Producto (en el reporte).
Entrevistas, observaciones, documentos, artefactos. Descripción del caso y su contexto, categorías del caso o entre casos. Descripción de un caso o varios y explicación de las causas que lo(s) produjeron(s) y el fenómeno o planteamiento estudiado.
Estos diseños pueden parecer similares a los narrativos, sobre todo cuando se estudia a un único individuo, pero tienen diferencias. En los estudios cualitativos de caso interesa una o varias unidades seleccionadas en relación con su contexto y al problema de investigación. Las investigaciones narrativas se enfocan en los individuos y sus historias respecto del planteamiento (Creswell et al., 2007). Por otro lado, en el estudio de caso la descripción y presentación puede ser o no cronológica, mientras que en los diseños narrativos siempre debe existir una cronología de hechos. En la recolección de datos dentro de los estudios de caso se utilizan regularmente múltiples instrumentos, mientras que en los diseños narrativos se recaban historias individuales. Los estudios de caso de corte cualitativo son diseños en los cuales el investigador explora un sistema especificado (un caso) o múltiples sistemas definidos (casos) a través de la recopilación detallada de datos y enmaterial profundidad, utilizando múltiples fuentes de información (pordescripción ejemplo, observaciones, entrevistas, audiovisual y documentos e informes) y reporta una de los casos y las categorías vinculadas al planteamiento que emergieron al analizarlos.
Un ejemplo de estudio de caso cualitativo sería una investigación que pretenda analizar a un asesino en serie (sus motivaciones para cometer los crímenes, sus experiencias derivadas de ellos, su modo de
Metodología de la investigación
operar, los patrones que ligan a los asesinatos entre sí, la forma en que elige a sus víctimas, su estado de salud mental, sus antecedentes, el contexto de sus actos, etc.). Una vez más, el estudio no parte de hipótesis ni de concepciones preestablecidas, sino que las categorías y entendimiento se generan conforme se recolectan y analizan los datos. Además, cada asesino vive condiciones distintas y posee una historia de vida diferente, por lo que su evaluación es única (a pesar de que comparta algunos rasgos o forma de operación con otros). Asimismo, se podría implementar este diseño para analizar juicios, debates políticos, casos clínicos, etcétera. Para establecer la dependencia (confiabilidad) y credibilidad del caso cualitativo es conveniente: •
• • • •
•
• •
Documentar la evidencia de manera sistemática y completa, así como ofrecer detalles específicos del desarrollo de la investigación. Utilizar fuentes múltiples de datos e información. Realizar triangulación de datos y entre investigadores. Establecer la cadena de evidencia sobre la cronología y vínculos entre categorías. Verificar con la persona o personas pertinentes los resultados (chequeo con participantes y observadores). Evaluar meticulosamente cómo los detalles del caso explican los resultados (categorías y teoría emergente). Documentar los procedimientos utilizados. La base de datos debe ser accesible para que otros investigadores puedan establecer la confiabilidad de los procedimientos (fines de auditoría), y debe contener los documentos centrales (con permiso de la persona que constituye el caso o los líderes de la organización o comunidad involucrada), las notas de campo, materiales narrativos (ejemplo, transcripciones de entrevistas), así como los esquemas y procedimientos de análisis.
Otros aspectos que se deben considerar son la “autenticidad” y la “autoridad” (Hammersley, 2003). Frecuentemente, los estudios de caso de corte cualitativo se dirigen sobre la base de que pueden capturar el carácter único de una persona, situación, grupo, etc., sin que importe la generalización. El objetivo es representar al caso de manera auténtica, en sus “propios términos” y con la autoridad que es otorgada por quienes son parte del caso. Creswell et al. (2007) consideran que los estudios de caso cualitativos pueden tener diversas variaciones dependiendo del tamaño del caso: un individuo, varios individuos, un grupo, una comunidad, un programa, una actividad. Asimismo, se adhieren a la tipología por intento ya revisada: intrínseco, instrumental y colectivo. En el instrumental cualitativo, el investigador plantea un problema y selecciona un caso para ilustrarlo. En el colectivo o de múltiple casos, también se indaga un problema pero se eligen varios casos para describirlo, analizarlo e ilustrarlo. El investigador puede seleccionar diversos casos (por ejemplo, programas) en distintos lugares o contextos, o bien, múltiples casos (programas) dentro de un único sitio o ambiente. A menudo se escogen distintos casos para mostrar diferentes perspectivas sobre el planteamiento. Una vez más, se utiliza la lógica de la réplica (se repiten los procedimientos en distintos casos considerados) (Yin, 2011). Un tipo de estudios de caso cualitativos muy socorridos son los etnográficos. Pueden enfocarse en una cultura en particular y su efecto en un proceso, grupo, evento o individuo (Creswell, 2005). En algunas ocasiones se centran en patrones culturales y en otras, en los procesos de interacción. Desde luego, implican una exploración completa de la cultura analizada (caso) y una recolección intensiva de datos sobre los elementos culturales. Se consideran los símbolos, ritos, mitos, lenguaje, costumbres, valores, relaciones, etc., a la vez que se utiliza toda la gama de herramientas cualitativas para recabar datos. El mismo Creswell los subdivide en: a) Casos culturales inusuales, extremos o extraños. Por ejemplo, la investigación de una cultura indígena
completamente alejada de los patrones urbanos y las costumbres occidentales actuales (que practique su propia religión, tenga un bajo contacto con los medios de comunicación colectiva, se encuentre geográficamente distante, etc.) o el de la cultura de un grupo terrorista.
19
20
Capítulo 4 Estidos de caso
b) Casos culturales ilustrativos. Son aquellos que pretenden mostrar un caso típico de una cultura. Por
ejemplo, un grupo representativo de la cultura de los niños abandonados de la calle de cualquier gran urbe latinoamericana, que deben trabajar para sobrevivir. c) Casos que se presentan en diferentes culturas (implica considerar varios de ellos, es de orden colectivo). Por ejemplo, analizar diversas culturas organizacionales sexistas (que discriminan a las mujeres y les impiden el acceso a altos puestos de la empresa). En los estudios de caso cualitativos la selección de la(s) unidad(es) de análisis muchas veces se enfoca, como ocurre con otros diseños cualitativos, en casos típicos, diversos, extremos, desviados, influyentes, muy similares o completamente distintos, de acuerdo con el planteamiento del problema (Seawright y Gerring, 2008). Una estrategia analítica muy común consiste en identificar categorías en cada caso vinculadas al planteamiento y luego buscar cuáles son comunes y construir de este modo teoría fundamentada (mezcla de diseños). Asimismo, como resultado de los análisis se pretende lograr una interpretación más amplia de lo que hemos aprendido mediante el examen de los casos. El investigador interpreta el significado del caso y las lecciones asimiladas.
Mixtos Para diversos autores, una gran cantidad de estudios de caso son mixtos porque recolectan, analizan e integran datos cuantitativos y cualitativos provenientes de diversas fuentes (Creswell, 2013a, HernándezSampieri y Mendoza, 2012, Green, 2011, Davis, 2009 y Harder, 2009). Imaginemos casos como los que se mencionaron en el capítulo 17 del texto impreso: un diagnóstico clínico médico o psicológico (en el cual al menos se integra evidencia proveniente de una entrevista cualitativa con información de los expedientes del paciente y el análisis cuantitativo de indicadores producto de pruebas de laboratorio y mediciones como la presión arterial, el peso y la estatura), una investigación de las causas de un accidente aéreo específico o la indagación en una escena de un crimen para evaluar lo sucedido. En este sentido y de acuerdo con Hernández-Sampieri y Mendoza (2008), un estudio de caso puede seguir cualquiera de las series de los diseños mixtos:
1) Secuencial En esta sucesión puede haber al menos tres variantes que sugieren los autores mencionados: a) un solo caso (que en una primera etapa se aborde cuantitativamente y en una segunda cualitativamente o viceversa); b) dos casos similares (un primer caso enfocado cuantitativamente y un segundo caso estudiado bajo la óptica cualitativa o viceversa, pero siguiendo una secuencia, ya sea que los resultados de ambos casos se manejen de manera relativamente independiente para después realizar metainferencias, o bien, que los resultados del primer caso sirvan para desarrollar la estrategia de investigación del segundo caso); y c) múltiples casos similares (unos investigados cuantitativamente y otros cualitativamente, ya sea que los resultados de los casos se interpreten primero por separado y luego se efectúen metainferencias, o bien, que los resultados de algunos casos sirvan como base para la estrategia de indagación de los otros casos). Desde luego, como mencionan Hernández-Sampieri y Mendoza (2008), es necesario establecer la similitud de los casos con bastante precisión.
2) Concurrente o simultánea Aquí también pueden presentarse al menos tres opciones: a) un solo caso, en el cual una parte de él sea abordada cuantitativamente y otra cualitativamente; b) dos casos similares, uno enfocado cuantitativamente y el otro cualitativamente; y c) múltiples casos, unos estudiados cuantitativamente y otros cualitativamente. En las dos últimas situaciones se llevan a cabo inferencias por caso y metainferencias que abarcan los distintos casos (Hernández-Sampieri y Mendoza, 2008).
Metodología de la investigación
3) Anidada En esta modalidad existen las siguientes posibilidades: a) un caso con varias unidades dentro de él y que algunas sean abordadas cuantitativamente y otras cualitativamente, pero cada una de ellas sea tratada sistémicamente (como casos incrustados), por ejemplo, una empresa y sus áreas funcionales; y b) multiniveles: cierto nivel del caso sea analizado cuantitativamente o cualitativamente, y otros niveles con la otra aproximación.
4) Integración completa Se trata de estudios con uno o más casos, en los cuales desde el inicio se tiene una perspectiva mixta, es decir, incorporan ambosy enfoques en todo el proceso indagación, obviamente recolectando y analizandosedatos cuantitativos cualitativos, así como mixtosde(Hernández-Sampieri y Mendoza, 2008). Herrera (2004) realizó un estudio de caso mixto. La unidad fue la misma autora (se autoanalizó). Veamos el ejemplo con un poco de mayor profundidad y sin entrar en demasiados tecnicismos, a fin de evitar el agobio a estudiantes que están fuera de campos médicos, psicológicos y químicos. Ella era una paciente con 31 años de evolución con una enfermedad crónica multisistémica (lupus eritematoso sistémico). Había sido tratada desde pequeña de muchas formas (entre las cuales se encontraban la mayoría de las desarrolladas por la “medicina tradicional”). El pronóstico de diferentes especialistas era contundente: Norma Herrera moriría en poco tiempo (cuestión de semanas o meses). Ante ello, decidió abandonar todo tratamiento y suspender la medicación indicada. Se inscribe en una maestría en desarrollo humano. Al principio de sus cursos la enfermedad siguió su evolución natural. Sin embargo, comienza a trabajar diversas áreas de sí misma, como el manejo de sentimientos, emociones y actitudes; la aceptación de su enfermedad (que no la resignación), el sentido de vida, la autoestima, la espiritualidad (su relación con Dios en general), etc. Asimismo, trabaja la psicología transpersonal, la psicoterapia centrada en la persona y la gestalt, la logoterapia y la terapia de reconstrucción personal. Es decir, se concentra en su desarrollo integral como ser humano. De pronto, ocurre una remisión y reversión de la enfermedad (esto es, desaparece el cuadro central). Lo anterior, a un año de haber iniciado la maestría. Ella Afortunadamente, se cuestiona: ¿qué sucedió? plantea(experta un estudio de caso. de química aplicada a la medicina), había Norma yHerrera en estudios construido una base de datos con su historial clínico (entre otros rubros: srcen de la enfermedad, etiología, pronóstico, síntomas y tratamientos). Poseía mediciones de elementos tales como:5 • • • • • • • •
Hemoglobina (Hb). Valores de células blancas (leucocitos). 6 Valores de creatinina sérica. Valores de depuración de creatinina Urea (valores de proteínas en primera micción –matutina– y en orina de 24 horas). Indicadores de funcionamiento renal. Valores de complemento hemolítico, fracciones 3 y 4 (C3 y C4). Anticuerpos antinucleares y patrón de inmunofluorescencia.
Asimismo, documentó desde el inicio su proceso personal de desarrollo (anotaciones y bitácora), lo cual incluía reflexiones sobre la aceptación de la enfermedad, la adquisición de un elevado sentido de vida, una sólida autoestima y una sensación de crecimiento; la evolución de sus sentimientos, emociones y experiencias en general; su acercamiento con un Ser supremo y otras cuestiones similares. Sus explicaciones rivales eran:
5 El ejemplo está sumamente simplificado, por lo cual presentamos una disculpa a los médicos y les sugerimos que lean el estudio completo referido en la bibliografía del libro. Asimismo, más que presentar y discutir los resultados o generar una polémica, el interés se centra en analizar el método que utilizó Herrera (2004) como una muestra de estudio de caso mixto
6 La literatura marca que el lupus cursa con leucopenia, situación que expone al organismo a ser susceptible de sufrir infecciones constantes (Herrera, 2004).
21
22
Capítulo 4 Estidos de caso
E1: “La enfermedad no era tan crítica, tal como se había documentado, pues hoy se conocen más tipos de lupus”. E2: “La remisión fue espontánea, natural; nada tuvo que ver el trabajo con su persona”. Al concluir la maestría, la remisión era patente. Su estudio de caso incluyó análisis cuantitativo (de las mediciones sobre su enfermedad a través del tiempo), análisis cualitativo (del trabajo consigo misma efectuado durante la maestría que abarcó terapia individual y grupal), análisis mixto (relacionando momentos y logros personales con las mediciones). Entre sus conclusiones se destacan las siguientes: •
•
•
•
ratar al paciente de manera integral y considerar a la enfermedad en retrospectiva, es decir, lo que se encuentra detrás del síntoma (psiconeuroimunoendocrinología y desarrollo humano) es un comienzo positivo para recuperar la salud en ciertas enfermedades, como el lupus. Al ser humano, bajo sistemas tradicionales, se le trata de forma separada, como si estuviese fraccionado, es decir, si existe una enfermedad inmune, endocrina, psíquica, neurológica; se le atiende en el área específica y se olvida el resto. El desarrollo humano pugna por ver y considerar al individuo de manera holística. El sentido de vida, la autoestima, creer en un Dios, la unión con uno mismo y la espiritualidad pueden ayudar notablemente a que esta clase de enfermedades se combata. La influencia de actitudes y pensamientos positivos sobre la enfermedad, si se procesan a nivel de sistema nervioso, pueden influir en los sistemas inmune, endocrino y psíquico.
En pocas palabras, “más que enfermedades, hay enfermos y contextos de cómo se presentan las primeras en los segundos” (doctor Roberto Hernández Galicia). Bien dice el refrán popular: “Una golondrina no hace un verano”, pero el estudio de caso de Herrera (2004) demuestra la importancia del sistema inmunológico individual ante la enfermedad. Cabe señalar que, durante el periodo comprendido entre 2004 y principios de 2009, Norma Herrera ha tratado exitosamente cuatro casos de niñas con más de una década padeciendo lupus con el mismo cuadro que ella tuvo; además, en Costa Rica, en la provincia de Alajuela (Ciudad Quesada), un caso similar de una mujer adulta joven (15 años de sufrir la enfermedad) entró a una fase de remisión, al trabajar en el sentido de vida y otras áreas humanas. Un segundo ejemplo de estudio de caso mixto, ahora conducido bajo la modalidad anidada, es el ejemplo ya mencionado de carácter instrumental de una exitosa fábrica de calzado: Análisis de las
mejores prácticas empresariales en las áreas de administración, mercadotecnia, manufactura y desarrollo organizacional: un estudio de caso (Arredondo, Hernández-Sampieri y Méndez, 2013), que puede consultarse o descargarse en esta misma página web de la obra. En él se utilizó una medición perceptual del clima organizacional entre el nivel de empleados, un análisis cuantitativo que abarcó las áreas de personal, producción e innovación utilizando el instrumento PDG Manufacturier de 2010, indicadores estadísticos de ventas y manufactura, la aplicación del Modelo Europeo de Excelencia Empresarial por puntaje (EFQM) en los ámbitos de la empresa donde se encontraron coincidencias con esta herramienta, entrevistas cualitativas con el dueño de la empresa y todo el nivel gerencial, así como con los líderes de las instituciones más importantes del sector calzado y de atención y promoción empresarial en la provincia en cuestión y otra adjunta geográficamente (Secretaría de Economía Delegación Guanajuato, Cámara de la Industria del Calzado del Estado de Guanajuato, Coordinadora de Fomento al Comercio Exterior, Cámara de la Industria del Calzado del Estado de Jalisco), y con una empresa considerada como competencia de la empresa analizada. Otro ejemplo de estudio de caso mixto sería uno en el cual se pretendiera comprender los factores que inciden en la productividad de un proceso industrial o de manufactura en una empresa. El planteamiento debería centrarse en las variables y elementos que pueden alterarlo y que son las causas de la productividad del objeto de estudio. Obviamente, a esta debemos cuantificarla a través de indicadores apropiados, pero también tenemos que medir la productividad en cada fase (en el presente e históricamente, analizando reportes y documentos previos), así como realizar observaciones sistemáticas de todo el proceso (incluso por actividad), efectuar grupos de enfoque y/o entrevistas con actores claves involucrados en el proceso
Metodología de la investigación
(por ejemplo, un grupo con los supervisores y entrevistas con operarios). El estudio debería incluir datos cuantitativos y cualitativos. Al final, el reporte de resultados incluirá una descripción detallada del proceso, un análisis de los determinantes o causas de la productividad, problemas potenciales, elementos a mejorar y sugerencias.
Por su temporalidad Esta tipología ya ha sido contemplada en los estudios de caso cuantitativos, por lo que basta decir que la clasificación (que se aplicaría a cuantitativos, cualitativos y mixtos), se resume en: a) temporales (duración no prolongada, regularmente un año o menos) y b) longitudinales o evolutivos (más de un año y varias etapas de recolección de los datos o mediciones).
Por su alcance Esta tipología ha sido considerada por diversos autores [por ejemplo: Yin (2013), Woiceshyn (2009), obin (2009) y Eisenhardt (2007)]. Antes de continuar la lectura, recomendamos al lector revisar el capítulo cinco de Definición del alcance de la investigación . De acuerdo con ella, los estudios de caso se subdividen en exploratorios, descriptivos y explicativos. Los estudios de caso exploratorios y descriptivos narran una historia (lo que aconteció y cómo sucedió), pero no precisan la causalidad (por qué ocurrió) (Woiceshyn, 2009). Simplemente incluyen una cronología de los hechos o eventos. Por ejemplo, un estudio exploratorio clínico puede revelar que un paciente tiene antecedentes familiares con enfermedades cardiacas (digamos, su padre), es un individuo básicamente sedentario y consume una dieta alta en grasas, y sufrió un ataque al corazón. Un estudio de caso descriptivo puede narrar la historia de un negocio que ha experimentado una caída de ventas y ganancias, así como señalar que sus empleados están desmotivados y la dirección ha reducido la inversión en investigación y desarrollo. En ambos casos no se tiene certeza de las causas precisas del infarto o de la disminución y cuánto contribuyó cada una. Se intuyen, pero no hay demostración de causalidad, mientras que en los estudios de caso explicativos se presentan con detalle. Los estudios de caso exploratorios se caracterizan por la falta2007). de investigación previa la ausencia de proposiciones e hipótesis (Streb, 2009 y Eisenhardt, Además, uno de susdetallada objetivosy es precisamente identificar hipótesis que puedan someterse a prueba en investigaciones subsecuentes. Son un paso preliminar para formular preguntas de investigación más refinadas. Los estudios de caso explicativos comienzan con la descripción del problema de investigación o fenómeno. No se pueden señalar las causas de algo, ya sea un infarto, la baja productividad de un proceso o la disminución de ventas de una empresa hasta que se describe, es decir, después de que podamos exponer cómo se manifiesta y qué secuencia de eventos lo precede. Desde luego, una secuencia temporal de eventos no es un indicador suficiente de las relaciones de causa y efecto; para descubrirlas, el investigador debe profundizar su análisis.
Clasificación de estudios de caso clínicos (en medicina, enfermería, psicología y ciencias de la salud en general) Dugard, File y odman (2011), basados en el modelo de R.R. Robey para el proceso de investigación clínica (Robey, 2004), el cual consta de cinco fases con distintos propósitos, sugieren los diseños de estudios de caso que se presentan en la tabla 4.4. Figura 4.8 Tipos de estudios de caso en la investigación clínica, por propósito, de acuerdo al modelo de Robey. 7 Fase I
Propósito Identificar un efecto terapéutico y estimar su magnitud.
Estudidoceas(odiseño) Exploratorio cualitativo de un caso o unos cuantos casos.
7 Hernández-Sampieri y Mendoza (2012), quienes lo adaptaron de Dugard, File y Todman (2011).
23
24
Capítulo 4 Estidos de caso
Fase II III
IV
Propósito Explorar las dimensiones del efecto terapéutico y preparar una intervención o ensayo clínico. Determinar la eficacia, eficiencia y/o efecto de una intervención o ensayo clínico (incluyendo medicamentos y toda clase de tratamientos). Probar la eficacia, eficiencia y/o efecto de un tratamiento en una población definida y variantes de los protocolos.
Estudidoceas(odiseño) Experimento con un solo caso o unos cuantos casos y estudios para establecer confiabilidad y validez. Experimento o ensayo controlado aleatorio (ECA, o RTC por sus siglas en inglés). Réplicas de casos independientes pero en condiciones de máximo control. Experimentos con un caso o casos múltiples y experimentos de campo. Estudios de caso no experimentales y longitudinales o de seguimiento pero en condiciones de máximo control.
V
Conocer quién se beneficia con el tratamiento, en qué condiciones y a qué costo.
Estudios de caso múltiples de la eficiencia en costos.
Desde luego, en todos estos diseños se debe observar la ética de la investigación, que se explica en el capítulo dos de esta misma página web. Además, dada la cantidad de variables y características individuales que intervienen en la investigación clínica, es importante replicar casos y administrar los tratamientos en distintas circunstancias. Los estudios de casos clínicos han sido empleados por décadas en la medicina y las demás ciencias de la salud (Kazdin, 2010). Un ejemplo histórico es el estudio en los años cincuenta del paciente “H. M.”, en el cual se experimentó la resección bilateral de la porción media del lóbulo temporal en función de la memoria. Los resultados dieron pie a diversas publicaciones sobre la epilepsia, la memoria y la función del lóbulo temporal (Paslawski, 2009). Un ejemplo de un estudio de casos múltiples podría ser analizar los efectos de tratar con insulina la diabetessobra mellitus en diversos pacientes. Sin embargo, al implementar investigaciones de esta naturaleza, decirtipo que1debe ser observado el máximo rigor (Joerg y Bigby, 2007).
GENERALIZACIÓN El tema de la generalización de los resultados del estudio de caso es un asunto sumamente debatido y debe abordare desde diferentes ópticas. La mayoría de los autores es contundente: los resultados de los estudios de caso no pueden generalizarse desde un sentido estadístico o probabilístico (Yin, 2011 y Mills y Durepos, 2012). Asimismo, esta cuestión ha sido discutida ampliamente en el capítulo relativo al muestreo en la obra impresa de Metodología de la investigación, 6ª edición. Sin embargo, hay otra clase de generalización que es posible utilizar mediante los estudios de caso: la generalización analítica o naturalista (Yin, 2013 y Te SAGE Glossary of the Social and Behavioral Sciences, 2009r), es decir, efectuar generalizaciones a casos o situaciones similares. Además, puede operar la transferencia ya considerada en la parte cualitativa de dicho libro. Los estudios de caso pueden ayudar o contribuir, tanto en las ciencias físicas o naturales como en las sociales a establecer regularidades y Estudiosde caso Con frecuencia se patrones, anomalías y excepciones (Tomas, 2011a). Apoyan la generaliutilizan como pilotos de investigaciones más amplias. zación, pero sus conclusiones no son definitivas. En este sentido, su papel es complementario a otros diseños. Como apunta Eidlin (2009), frecuentemente los estudios de casos se implementan por la singularidad de la unidad de análisis y con propósitos descriptivos, mientras que en otras ocasiones son el inicio o la base para posteriores indagaciones que establezcan la generalización o la extrapolación a una población o universo. Ahora bien, el investigador no puede simplemente asumir que un caso es típico, debe demostralo
Metodología de la investigación
(Eidlin, 2009). Desde luego, como señala Paslawski (2009), el tamaño de muestra en un estudio de un caso por definición es extremadamente limitado (n=1), lo cual implica una debilidad desde el paradigma positivista o empirista, pero cuando se compilan varios estudios de caso con factores comunes y resultados similares, se comienza la tarea de generalización, más aún si las unidades son heterogéneas. La extrapolación se realiza, al igual que en los experimentos, después de múltiples réplicas de casos representativos y análogos, además de que se encuentren patrones constantes con claridad. Sin embargo, recordemos que el estudio de caso es sumamente contextual (Mills y Durepos, 2012). Como dice Roberto Hernández Sampieri: “conocimiento por acumulación de evidencias”. Bell (2010) comenta que la transferencia o generalización analítica dependen del nivel se semejanza del caso con otros de su tipo y prefiere utilizar el término “relacionabilidad” (relación con otros casos) en lugar de generalización.
ROL DE LA TEORÍA EN LOS ESTUDIOS DE CASO En los estudios de caso como en cualquier tipo de diseño o método se realiza una intensiva revisión de la literatura y se desarrolla un marco teórico apropiado. De acuerdo con Hernández-Sampieri y Mendoza (2012), la teoría: 1. Es útil para especificar qué se va a explorar. 2. Ayuda a definir la naturaleza del caso a estudiar y su contexto. 3. Orienta las descripciones y resultados obtenidos.
Algunos autores consideran que el estudio de casos sirve para construir y probar teoría con ciertas estrategias analíticas (por ejemplo: Hak y Dul, 2009, Starke y Strohschneider, 2009, Dul y Hak, 2008, Eisenhardt y Graebner,2007, y Eisenhardt, 1989). Pero, dada la naturaleza introductoria de este capítulo, no se profundizará en esta polémica. A quien se interese por ella le recomendamos consultar las fuentes citadas en este mismo párrafo. Simplemente mencionaremos el proceso, de acuerdo con Hak y Dul (2009): Paso 1: formular la proposición teórica de quelos será sometida a prueba. Enproposición los estudiosrespecto de caso es ción sobre las características casos individuales. Una deuna unaafirmacondición necesaria es un ejemplo: “X es necesaria para Y”. Paso 2: seleccionar un caso apropiado de acuerdo con el marco teórico y el planteamiento. Los criterios para la elección del caso pueden diferir si se enfoca más bien desde la variable independiente o la independiente. En el diseño centrado en la variable independiente, se selecciona un caso en el que está presente Y —dependiente— (y un patrón esperado se formula sobre el valor de la variable independiente X). En el diseño enfocado en la variable dependiente se escoge un caso en el cual X está ausente (y un patrón esperado se formula sobre la variable dependiente Y). Paso 3: especificar la hipótesis del caso (debe formularse como un patrón esperado). En el caso en el cual el resultado Y está presente, el patrón esperado es “ X está presente”. En el caso en que la condición es que X está ausente, el patrón esperado es “Y está ausente” Paso 4: medir las variables relevantes de manera confiable y válida. En el ejemplo, la medida implica determinar si X está presente o ausente, o bien, si Y se encuentra presente o ausente. El resultado de esta medición es el patrón observado. Paso 5: probar la hipótesis. La prueba consiste en comparar el patrón observado con el patrón esperado. En el ejemplo actual, la prueba consiste en determinar si X está presente (en el diseño de la variable independiente) o si está ausente Y (en el diseño de la variable dependiente). Paso 6: establecer el resultado de la prueba. El resultado es una confirmación o no de la hipótesis. En el ejemplo, la hipótesis será rechazada si X está ausente (en el diseño de la variable independiente) o si Y está presente (en el diseño de la variable dependiente). Paso 7: formular las implicaciones del resultado de la prueba de la teoría. Las conclusiones acerca de la robustez de una afirmación teórica no pueden establecerse sobre la base de una sola prueba, sino sólo después de una serie de pruebas. Por lo tanto, discutir las implicaciones de un resul-
25
26
Capítulo 4 Estidos de caso
tado de la prueba implica siempre compararlo con los resultados de pruebas anteriores en una serie de réplicas. En el estudio de caso, el investigador puede obtener una imagen detallada de procesos individuales y revelar diferencias entre varios casos. Si se agregan más unidades o casos es factible lograr una comprensión más profunda de los acontecimientos, fenómeno o planteamiento del problema y perfeccionar el marco conceptual hasta que casos adicionales ya no añadan información novedosa o distinta (“saturación”) (Starke y Strohschneider, 2009). En lo particular, un caso crítico puede ser utilizado para confirmar, desafiar o ampliar una teoría existente a través de probar proposiciones relacionadas o sugiriendo explicaciones alternativas. Los casos extremos pueden constituir instancias para documentar y analizar un fenómeno por su singularidad u ocurrencia poco frecuente (Xiao, 2009a).
REPORTE DE LOS ESTUDIOS DE CASO Yin (2013) establece diferentes formatos para elaborar el reporte de resultados de los estudios de caso: 1. Analítico lineal. Este formato es como el de cualquier reporte de resultados (tema cubierto en los
capítulos 11 y 16 del libro impreso) y tal vez sea el más común, por lo que no entraremos en detalles. El índice de un reporte de este tipo sería: • • • • • •
Introducción. Planteamiento del caso y el problema de investigación. Revisión de la literatura. Método. Resultados. Discusión.
omando como referencias a Sekaran y Bougie (2013), Hernández-Sampieri yMendoza (2008) y Budgell (2008), otra estructura lineal para presentar un estudio de caso sería: •
•
• •
•
• • •
Resumen: preámbulo (dos oraciones que enuncien el caso y contexto), presentación del caso en unas pocas líneas, manejo del caso y principales resultados en unas cuantas oraciones y discusión (principales resultados e inferencias, también en pocas sentencias). Introducción: prefacio para colocar el estudio en su contexto (histórico, geográfico, social, de disciplina o campo profesional, etc.), presentación muy breve de casos similares, retos y limitaciones del estudio (obviamente centrándose en el caso), procedimientos centrales y utilidad que tiene revisar el caso para el lector. Revisión de la literatura. Presentación del caso: contexto completo del caso, su abordaje (cuantitativo, cualitativo, mixto; transversal o longitudinal; número de casos y diseño específico), unidades o participantes, procedimientos, tiempos (duración del proyecto en general y por etapa) y resultados. Discusión: explicaciones, inferencias, metainferencias, conclusiones, alcances y limitaciones, recomendaciones, lecciones aprendidas y planes de trabajo para resolver problemas e implementar soluciones y líneas de acción futura sobre casos similares, así como recomendaciones en aspectos de investigación (método y análisis). Reconocimientos. Referencias.
Anexos. Sin embargo, algunos autores prefieren invertir parte del orden y comenzar con la introducción y el planteamiento, es decir, pasan de inmediato a los resultados y la discusión, y dejan para el final tanto la revisión de la literatura como el método. 2. Estructuras comparativas. Los mismos datos son presentados mediante diferentes modelos conceptuales. Desde luego, deben existir al menos dos modelos para utilizar este formato. El fin de este tipo de
Metodología de la investigación
reporte es evaluar el grado en que los resultados del caso embonan en cada modelo. Si suponemos que el estudio de caso es una evaluación del clima organizacional, los resultados podrían explicarse por dos modelos: el de Hernández-Sampieri (2005) y el de Parker et al. (2003).8 Entonces, se comparan tales resultados frente a ambos modelos. En la medida que encajen con estos y se presente congruencia entre los modelos, se considerarán con mayor validez. El estudio de caso operaría de la siguiente manera: a) b) c) d)
El investigador considera las variables o conceptos que presenta cada modelo. Recolecta datos sobre tales variables o conceptos (de los dos modelos) y los analiza. Presenta los resultados de acuerdo con cada modelo. Idealmente, los resultados de ambos modelos deben ser consistentes.
3. Cronológico. Cuando se opta por este formato, la presentación de resultados se realiza por fases del
estudio de caso. Por ejemplo, si evaluamos a una comunidad indígena mediante un método cualitativo, podemos presentar los resultados por etapas: • • • • •
Inmersión en el caso y contexto. Recolección inicial de los datos: primeras entrevistas. Resultados preliminares: observación y entrevistas a líderes. Resultados definitivos: observación, recolección de materiales y entrevistas con los pobladores. Discusión.
4. Construcción de teoría. Un formato donde el caso se presenta de tal forma que cada parte (hipótesis,
conceptos, etc.) del reporte revela un aspecto de la teoría. 5. Sin estructura. Cuando no hay un orden, hay quienes escriben el reporte conforme avanza el estudio
de caso, aunque siempre hay narrativa (Creswell et al., 2007). En cualquier situación es importante que el caso se redacte y presente adecuadamente.
RECOMENDACIONES PARA LOS ESTUDIOS DE CASO Yin (2013 y 2011), Farquhar (2012), Green (2011), Tomas (2011b), Elger (2009), Aaltio y Heilmann (2009) y Hernández-Sampieri y Mendoza (2008) hacen algunas recomendaciones para los estudios de caso, entre las que se destacan las siguientes: • •
•
• •
•
•
•
•
El caso debe ser significativo y de interés para un grupo, una comunidad y/o una sociedad. El caso tiene que ser una instancia de una clase de fenómenos que proporcione un marco analítico para que el estudio sea implementado y los resultados iluminen el planteamiento, el conocimiento y la teoría. El caso es estudiado holísticamente, por lo que no debe restringirse a ciertas áreas o algunos cuantos lugares o personas. Se recaba la mayor evidencia posible y frecuentemente se triangulan datos y fuentes. Se considera que el caso puede concluirse cuando se responde de manera satisfactoria al planteamiento del problema. El caso debe ser analizado desde diferentes perspectivas (por ejemplo, si es una organización, el abordaje debe incluir a la alta dirección o gerencia, las diferentes áreas, el sindicato y los trabajadores, los clientes y proveedores y demás participantes). El caso tiene que estar contextualizado y es necesario definir con la máxima claridad posible los límites entre el contexto y el caso (si no los hay, explicarlo). El estudio debe ser conducido con una enorme sensibilidad, ya que normalmente tratamos con situaciones humanas complejas. Respeto, humildad, interés genuino y humanidad en fuertes dosis. Es necesario estar preparado para manejar grandes volúmenes de datos en múltiples formas.
8 Este modelo se aborda en el capítulo siete de la parte impresa de esta edición.
27
28
Capítulo 4 Estidos de caso
•
Antes de iniciar el estudio debe charlarse con todos los participantes, demostrarles la utilidad del estudio para ellos y para un campo científico determinado. Es indispensable asegurar el anonimato.
EJEMPLOS DE ESTUDIOS DE CASO EN DIFERENTES CAMPOS O PROFESIONES Veamos de manera breve diversos ejemplos de estudio de caso en distintas disciplinas y posibles aplicaciones.
Ciencias administrativas En el campo de los negocios y las ciencias administrativas en general, los estudios de caso han sido sumamente utilizados para analizar los factores críticos de éxito de una organización. Con frecuencia se usan para investigar temáticas que es muy difícil indagar con técnicas cuantitativas (Eriksson y Kovalainen, 2009). Por ejemplo, Eriksson, Fowler, Whipp y Rasanen (1996) efectuaron estudios longitudinales de casos en Gran Bretaña y Finlandia para analizar comparativamente cómo el manejo de la mezcla de producto afecta el desarrollo de los negocios en empresas de confitería. Centonze (2010), con base en el modelo de clúster de Porter, condujo un típico estudio de caso para analizar las fortalezas y debilidades de la zona del valle del río Hudson para transitar de una región de agroturismo hacia una vinícola. La investigación incluyó cuestiones como la competitividad y el grado en que estaban listos los agricultores para enfrentar los desafíos que representa tal cambio en la vocación productiva de la región. Por su parte, Vuori y Kingsley (1999) realizaron estudios de casos con la finalidad de contrastar las culturas organizacionales de hospitales públicos y privados, así como los servicios de salud. Puente y Cervilla (2007) analizaron las prácticas de la gerencia de relaciones con el cliente (CRM) y el estado de su adopción en cinco casos de empresas grandes que operaban en el mercado venezolano. Utilizaron técnica de recolección de datos las entrevistas estructuradas, cuales administraron gerentes decomo las organizaciones involucradas. Se evaluaron las prácticas seguidaslaspor las empresas para laa adopción, implantación y uso del CRM. Entre las lecciones aprendidas por las empresas mediante la adopción, implantación y uso de la gerencia de relaciones con el cliente, se destaca el reconocimiento del fracaso al tratar de emprender proyectos de alcance amplio, y, como consecuencia, la necesidad de cubrir los diferentes niveles de CRM por etapas, de acuerdo con las prioridades de la organización. odos los gerentes entrevistados consideraron que el desarrollo de una estrategia de CRM fue una decisión acertada, aunque, en general, aún era pronto para evaluar el efecto en las ventajas competitivas de la empresa (Puente y Cervilla, 2007, p. 1). Un área donde se implementan estudios de casos con regularidad es el turismo. Xiao y Smith (2006) llevaron a cabo un análisis de contenido de 76 estudios de caso publicados en revistas académicas de turismo en el periodo comprendido entre 2000 y 2004, y encontraron que abarcan muy diversas temáticas, entre ellas: planeación y desarrollo de centros turísticos, determinación de ciclos de vida de áreas turísticas, medición de la satisfacción de los visitantes de centros turísticos, evaluación de programas de relaciones con los clientes y mercadológicos, análisis integral de centros de turismo religioso, culinario, de negocios, de vida salvaje y ecoturismo; valoración de la imagen de destinos turísticos, exploración del impacto ambiental de complejos turísticos, operación de empresas turísticas, etc. La conocida serie de televisión “Gigantes de la industria” ( Te men who built America) de History Channel (David, 2012), presenta estudios de caso de connotados empresarios norteamericanos que construyeron enormes consorcios: Cornelius Vanderbilt (ferrocarriles), John D. Rockefeller (petróleo), Andrew Carnegie (acero), J. P. Morgan (electricidad y finanzas) y Henry Ford (automóviles).
Metodología de la investigación
Piekkari, Welch y Paavilainen (2009) hicieron un análisis de 157 estudios de caso publicados en cuatro reconocidas revistas académicas sobre negocios internacionales, realizados entre 1975 y 2005, lo que nos da una idea de que es un diseño sumamente recurrente en las ciencias administrativas.
Ciencias de la conducta Por lo regular, los estudios de caso psicológicos se centran en individuos, particularmente aquellos que muestran trastornos de conducta. Sus puntos focales incluyen la descripción y el análisis de factores contextuales, estructuras personales y sociales y los procesos, para lograr una comprensión más completa y profunda de los fenómenos (Starke y Strohschneider, 2009). Riccardi, impano y Schmidt (2010) efectuaron un estudio de caso para investigar por qué un individuo varón de 39 años con trastorno obsesivo-compulsivo se resistía al tratamiento indicado y cómo una intervención podía aumentar la adhesión a la terapia recomendada. Esta consistía en entrevistas y asesoría emocional para aumentar el apego al tratamiento, así como ejercicios de exposición. Durante el estudio se midieron las conductas compulsivas y al final se demostró que las técnicas habían funcionado positivamente en la variable dependiente. Wilson, olputt, Howe y Kemp (2010) presentan un estudio de caso del asesino serial revor Joseph Hardy, quien privó de la vida a tres jóvenes en Manchester, Inglaterra, entre 1974 y 1976, y que en la actualidad es uno de los presos con mayor antigüedad en Gran Bretaña. Los autores no solo consideraron el caso, sino que también analizaron por qué este homicida ha desaparecido de la conciencia popular y académica, para lo cual entrevistaron a los periodistas que cubrieron los asesinatos. Billette, Guay y Marchand (2008) llevaron a cabo un estudio de caso para aumentar la eficacia de la terapia cognitiva-conductual en víctimas de agresión sexual que presentan trastorno de estrés postraumático (PSD) que, además, también “atrapa” al cónyuge. La terapia hizo hincapié en el apoyo del esposo y la reducción del impacto psicológico en la relación de pareja. res víctimas participaron en el estudio y se estableció la línea base previa a la administración del estímulo (terapia). Después de tres meses, ninguna de las participantes presentó un diagnóstico de PSD y todas reportaron una mejoría significativa en la satisfacción respecto al soporte recibido de su cónyuge. Pyke y Adams (2010) exploraron mediante estudios de caso cualitativos la relación matrimonial entre varones adultos mayores (35 a 64 años) y sus esposas más jóvenes (10 a 17 años de diferencia), con la finalidad de examinar la naturaleza y características del vínculo, los lazos de poder o dominación y los roles desempeñados. Basándose en la teoría de los recursos y las perspectivas del poder marital, analizaron las historias de vida, los entendimientos psicosociales y los acuerdos cotidianos de ocho parejas. Entre algunos hallazgos descubrieron que los hombres tienden a ser el elemento dominante en la relación, pero quienes estuvieron casados anteriormente con otra persona, tienden a compartir más en su matrimonio con la mujer joven.
Ciencias de la salud Los estudios de casos clínicos y epidemiológicos resultan muy frecuentes en todas las ciencias de la salud. Como ya se mencionó, son útiles para evaluar integralmente tratamientos y medicación, así como para mejorar las técnicas de diagnóstico. Se considera todo el contexto del paciente. Por ejemplo, Edwards, McCarthy y Konishi (2010) analizaron, entre otros, el caso de una mujer japonesa de 88 años hospitalizada con anemia, edema en una pierna y ascitis. La paciente vivía sola y su único familiar era su hija, quien habitaba en la misma ciudad. La anemia se debió a sangrado estomacal (seis meses ante su nivel de hemoglobina era debido de 12 yacuando el estudio era 4). Ella se negócomo al tratamiento recomendado el internista su edadsey efectuó a que consideraba a ladecámara gástrica “aterradora”. Los autorespor analizaron qué posición debía tomar el galeno ante tal negativa y cómo manejar el caso desde un punto de vista médico y ético. Mediante estudios de casos múltiples cruzados, Senn, Rolfe y Julious (2010) evaluaron la respuesta individual a tratamientos y a la medicación hecha “a la medida” para intentar “aislar” el componente de variación correspondiente a la interacción paciente-tratamiento.
29
30
Capítulo 4 Estidos de caso
Por su parte, Halterman, Conn, Hernández y anski (2010), condujeron entre padres de familia de niños urbanos (con asma y sin asma) un estudio controlado de casos múltiples, cuyo objetivo era describir y comparar sus conocimientos, actitudes y prácticas domésticas con respecto a la exposición al humo de segunda mano (humo de tabaco ambiental o ES) por parte de los infantes. Asimismo, se hicieron contrastes por nivel socioeconómico, ya que los investigadores partieron de la base de que los niños más pobres muestran mayores índices de asma y se encuentran más expuestos al ES. Los resultados sugirieron que los padres cuyos hijos tienen asma son más conscientes de los daños del humo del tabaco, pero todavía hay lagunas y varios niños siguen expuestos a este contaminante.
Educación En el campo educativo, los estudios de caso son muy socorridos, entre otros planteamientos, para probar métodos de enseñanza, documentar prácticas que mejoran el desempeño escolar, evaluar políticas educativas y diagnosticar el aprendizaje individual y colectivo (immons y Cairns, 2009). Lance (2010) implementó un estudio de caso en dos escuelas primarias étnicamente diversas de Inglaterra, ambas con reconocimiento local y nacional por su participación en proyectos de prácticas educativas innovadoras. El trabajo documenta el impacto de la teoría de la eficacia y la mejora continuas en las escuelas e identificó como factores críticos de éxito el enfoque ético del liderazgo, el compromiso de los directivos y su respeto a los alumnos y padres de familia, así como la importancia que se le atribuyó a ampliar y diversificar las experiencias de aprendizaje. Neumann y Rodwell (2009) realizaron en Australia un estudio con múltiples casos para comparar a los alumnos de doctorado de “medio tiempo” con aquellos dedicados a sus estudios “tiempo completo” en términos del desempeño escolar, la satisfacción respecto de su vida académica y la eficiencia terminal (conclusión de sus estudios). Ng y Nicholas (2010) efectuaron un estudio de casos múltiples con un grupo de diez estudiantes de 14 años que participaron en un proyecto con actividades extracurriculares en línea, durante seis meses. Los jóvenes se encontraban en el Reino Unido, Malasia y Australia. En lugar de utilizar un enfoque en línea tradicional, estructurado y estandarizado para todos los alumnos, implementaron una aproximación pedagógica progresista centrada en el individuo, personalizada y abierta. Entre algunas de las variables dependientes se encontraban el aprovechamiento y la motivación para participar en proyectos de aprendizaje en línea. Asimismo, se exploró la naturaleza de las interacciones en un ambiente de aprendizaje virtual. Desde luego, se demostró la eficacia del enfoque innovador. McFadden, aylor, Campbell y McQuilkin (2012) desarrollaron un estudio de casos múltiples para evaluar la precisión de las bases de datos o referencias y la sensibilidad ante temas sobre la resiliencia y la labor de los trabajadores sociales. Los casos fueron: Applied Social Sciences Index and Abstracts, Social Services Abstracts, Social Sciences Citation Index (SSCI), PsycINFO, Cumulative Index to Nursing, Allied Health (CINAHL), Google Scholar y Medline.
Otros campos Los estudios de caso son aplicados en otros campos del conocimiento. Por ejemplo, Lima y Legey (2010) investigaron mediante un estudio de caso el problema de la contaminación de la bahía Guanabara, un estuario ubicado en Río de Janeiro, Brasil, que sirve como cuenca hidrográfica con más de 11 millones de personas. Mediante el enfoque sistémico midieron el nivel de demanda bioquímica de oxígeno (DBO) y examinaron las causas de la polución. Finalmente, propusieron soluciones que implican implementar políticas para atender restauración de lalos calidad del agua en la bahía y una estructura eficiente capaz de públicas proporcionar servicioslasanitarios a todos ciudadanos y mitigar los problemas de contaminación, así como otras cuestiones técnicas específicas. Carcaño, Martínez y González (2009) efectuaron un estudio de caso para analizar las principales causas de las demoras en un proyecto de construcción desarrollado en la costa del mar Caribe de México (un edificio de apartamentos en condominio ubicado en la zona turística de Playa del Carmen, a aproximadamente 70 kilómetros de Cancún). Los resultados sirven para analizar esta problemática en la región,
Metodología de la investigación
la cual ha experimentado un auge en la construcción en las últimas décadas. Gómez, Chávez y Briceño (2009) realizaron un estudio de caso prospectivo para evaluar un programa de recambio de artefactos que combustionan a leña por tecnologías más eficientes, el cual pretende lograr 30% de reducción de emisiones. La empresa Calizas Industriales del Carmen (CALICA) ejecutó un estudio de caso a finales de 1988, con el propósito de analizar la resistencia estructural de un puerto en construcción con un avance aproximado del 80% ante el embate del huracán Gilberto en el mes de septiembre de dicho año (categoría cinco, la más elevada, con vientos máximos de 296 km/h y una presión mínima de 888 hectopascales). Cabe señalar que la estructura resistió totalmente, lo cual llamó la atención de los constructores por lo que se hizo la investigación a fondo. al resistencia se debió entre otras cuestiones al diseño y los materiales usados en laejemplos construcción (CALICA, Otros de estudio de caso1998). que podrían implementarse son: •
•
•
• • •
•
•
•
• • •
Análisis de las causas del colapso o derrumbe de una construcción (como las orres Gemelas del World rade Center, después de los atentados con aviones comerciales el 11 de septiembre del 2001). Determinación de las causas de un accidente aéreo o el hundimiento de un transatlántico (como el itanic —1912—o el Costa Concordia —2012—). Evaluación del desempeño de un nuevo equipo industrial o la implementación de mejoras en un proceso de calidad. Análisis de las causas de la disminución de la recaudación fiscal de un país en un año determinado. Investigación del comportamiento migratorio de una manada de animales. Indagación de las causas y el contexto del trágico deceso del Rey del Pop, Michael Jackson. El análisis de su legado musical y artístico podría constituir otro estudio de caso. Valuación de un hotel para una operación de compraventa, utilizando un modelo de flujos de caja descontados, con especial atención en la prima de riesgo. Es un estudio realizado por Stambler (2011) sobre un hotel en China. Caracterización de varias mujeres directoras de grandes empresas (factores de éxito y obstáculos) (casos múltiples). Evaluación del desempeño de un deportista de alto rendimiento (Sebastian Vettel en automovilismo, Mariano Rivera en béisbol o ony Romo —Dallas— en fútbol americano; o casos múltiples: Lionel Messi, Claudio Pizarro, Alexis Sánchez, Patrick Pemberton, Oribe Peralta, Luis ejada, Luis Suárez y Pablo Escobar Olivetti, en fútbol soccer). Examen de la calidad del servicio del área de urgencias de un hospital. Análisis de las propiedades y características de un determinado cuásar o quásar. Exploración del significado e implicaciones para el estudio de la cultura Moche del notable descubrimiento de las tumbas reales del Señor de Sipán, en Chiclayo, Perú (estudios de caso realizados por el célebre arqueólogo Walter Alva y su brillante equipo).
Figura 4.9 Tumbas reales del señor de Sipán.
31
capítulo
5
Diseños experimentales. Segunda parte
INTRODUCCIÓN El presente capítulo amplía algunos conceptos vertidos en el capítulo 7 de Metodología de la investigación, 6ª edición, en particular, los referidos a las fuentes de invalidación interna, la necesidad de varios grupos de comparación, la equivalencia de los grupos experimentales y la técnica de emparejamiento, así como el diseño experimental de Solomon. Asimismo, se revisan otros diseños experimentales: las series cronológicas múltiples y los factoriales. Finalmente, se comentan los diseños cuasiexperimentales.
FUENTES DE INVALIDACIÓN INTERNA (AMPLIACIÓN Y EJEMPLIFICACIÓN) En el libro impreso se describieron estas fuentes y se recomienda eliminarlas mediante el control, lo que Te SAGE Glossary of the Social and Behavioral Sciences (2009p) y León y Montero (2003) denominan “descartar causas alternativas o extrañas”. A continuación se amplían y ejemplifican. 1. Historia. Estas fuentes constituyen acontecimientos que ocurren durante el desarrollo del experimento, que pueden afec-
tar a la variable dependiente y llegan a confundir los resultados. Por ejemplo, durante un experimento para analizar el efecto que tienen distintas formas de realimentación en el trabajo sobre la motivación (vía el supervisor “cara a cara” y por escrito), se consideran dos grupos de obreros: a uno le aumentan el salario o se le felicita por su desempeño laboral mientras se lleva a cabo el experimento y al otro grupo, no. Las diferencias en la variable dependiente pueden atribuirse a la manipulación de la independiente o a un acontecimiento que sucedió durante el experimento. Supongamos que experimentamos la mejora de procesos industriales y el estímulo es la introducción de un sistema ISO de calidad, pero en una sola planta, no en la otra. Para tener certeza respecto de los resultados debemos evitar que en ambas ocurra algo que altere significativamente tal mejora y que sea independiente del estímulo. O bien, imaginemos que en un experimento donde se prueba la eficacia de un medicamento y se tienen grupos pequeños (digamos de cuatro personas cada uno), al grupo experimental se les administra el medicamento y al grupo de control, no. Sin embargo, no sabemos que dos miembros de este último se automedican en secreto, lo cual invalida los resultados del experimento. 2. Maduración. Son procesos internos que afectan a los participantes que operan como consecuencia del tiempo y afectan los resultados del experimento, tales como cansancio, hambre, aburrimiento, envejecimiento y cuestiones similares. Si a un grupo de niños se le expone a un nuevo método de aprendizaje por dos años, los resultados pueden estar influidos simplemente por la maduración de los infantes durante el tiempo que duró el experimento. En un experimento quizá los sujetos pueden cansarse y sus respuestas serán afectadas por ello. Si tenemos dos grupos y la condición experimental del primero implica mucho más tiempo que la del segundo, puede alterar esta fuente. Lo mismo sucede cuando experimentamos con medicamentos, intervenciones o tratamientos médicos
2
Capítulo 5 Diseños experimentales. Segunda parte
o psicológicos. En estos casos, el factor tiempo tiene que ser idéntico entre los grupos participantes, al igual que cuando experimentamos con sustancias o elementos como el fuego. 3. Inestabilidad del instrumento de medición . En este caso, la poca o nula confiabilidad de las mediciones provoca desconfianza en laspuntuaciones obtenidas,es decir,no sabemos silas deducciones son certeras porque el instrumento a veces da unos resultados y luego, otros. Este inconveniente se evita mediante el diseño de instrumentos válidos y confiables (vea el capítulo 9 del libro: “Recolección de los datos cuantitativos”). 4. Inestabilidad del ambiente experimental . al como se mencionó en el capítulo 7 del texto impreso, las condiciones o componentes del ambiente o entorno del experimento pueden ser desiguales para los
grupos participantes. Imaginemos que dos grupos son sometidos a un mismo experimento sobre memorización y, al sortearlos, a uno le corresponde realizarlo en un aula cerca de donde se efectúa una remodelación del edificio y al otro, en un recinto donde priva el silencio. Si el experimento requiriera de una elevada concentración de los individuos que participan en él, la concentración de un grupo podría ser diferente de la del otro (a causa del ruido, del tránsito de personas, etc.), lo que afectará la interpretación de los resultados. al vez las diferencias entre los grupos se deban a variaciones en la concentración y no a la variable independiente, o es posible que esta sí ejerza algún efecto, pero no podemos estar seguros de ello. No tenemos confianza en los resultados. En experimentos en ciencias naturales es claro que cuestiones como la temperatura ambiental deben estar perfectamente controladas. Asimismo, en experimentos médicos el entorno debe ser similar para todos. 5. Administración de pruebas. Se refiere al efecto que puede tener la aplicación de una prueba sobre las puntuaciones de pruebas subsecuentes. Por ejemplo, si en un experimento sobre prejuicio a un grupo se le aplica una prueba para detectar su nivel de prejuicio, y luego se le expone a un estímulo experimental (que supuestamente debe reducir el prejuicio), y después se mide nuevamente el prejuicio para evaluar si disminuyó o no, puede ocurrir que las puntuaciones de prejuicio de la segunda medición (después del estímulo) sean influidas por la aplicación de la primera prueba (antes del estímulo). Es decir, la administración de la primera medición puede sensibilizar a los participantes del experimento y, cuando responden a la segunda prueba, sus respuestas podrían estar afectadas por esa sensibilización. Si disminuye el prejuicio y no hay control, no sabremos cuánto se debió al estímulo experimental o a la variable independiente y cuánto a dicha sensibilización. 6. Instrumentación. En este caso se hace referencia a cambios en los instrumentos de medición o en los observadores, modificaciones que pueden producir variaciones en los resultados. Si la prueba del grupo experimental es diferente a la del grupo de control u otro grupo experimental, puede ser a causa de la instrumentación. Por ejemplo, si queremos ver el efecto de dos métodos de enseñanza, sometemos a cada grupo a un método diferente y después aplicamos un examen de conocimientos para ver la eficacia de cada método y comparar los resultados. Si los exámenes no fueran equivalentes podría presentarse esta fuente. Imaginemos que el examen de un grupo es más fácil que el del otro. En este caso, ¿cómo podremos estar seguros de que las diferencias entre las puntuaciones de los exámenes se deben al estímulo (método de enseñanza) y no a que las mediciones son distintas? Esta incertidumbre se repite en el caso de un experimento para probar la eficacia de dos medicamentos que reducen la hipertensión. El procedimiento y no sólo el aparato para medir la presión arterial debe ser el mismo (incluyendo número de mediciones, tiempo entre ellas, posición de los pacientes, etcétera). 7. Regresión estadística. Esta fuente se presenta si seleccionamos participantes sobre la base de puntuaciones extremas. Cuando las variables que nos interesan se miden por primera vez, se encuentran en valores muy altos o bajos, pero a regresarentre a su las estado normal, y en una un segunda medición se obtienen valores no después extremos;tienden la comparación dos mediciones indica cambio, pero en realidad lo que ocurre es que la primera medición la realizamos cuando la condición de la variable era extrema. En términos de Campbell y Stanley (1966), se trata de un efecto provocado por la tendencia que muestran los participantes seleccionados sobre la base de puntuaciones extremas a regresar en pruebas posteriores a un promedio en la variable en la que fueron medidos.
3
Por ejemplo, si pretendemos evaluar el efecto del liderazgo autocrático de un profesor en la ansiedad de los alumnos y primero aplicamos al grupo una prueba de ansiedad, para posteriormente exponerlo a otro profesor dictatorial y volvemos a medir su ansiedad, los participantes se encontrarán muy ansiosos durante la aplicación de la primera prueba (porque tienen un examen difícil al día siguiente); podría ocurrir que se observara que están “menos ansiosos” después de recibir la manipulación, es decir, aparentemente el profesor autocrático redujo la ansiedad. Pero en realidad lo que sucedió fue que durante la segunda prueba estaban “retornando” a su nivel normal de ansiedad. Otro caso sería el de una medición de la presión arterial en la preprueba, después de que las personas tuvieron que subir escaleras prolongadas o desplazarse rápidamente para que se les hiciera el examen respectivo u otras mediciones cuando estaban en ayunas. La regresión estadística representa el hecho de que puntuaciones extremas en una distribución particular tenderán a desplazarse (esto es, regresar) hacia el promedio de la distribución en función de mediciones repetidas (Christensen, 2006). Entre una primera y una segunda mediciones, las puntuaciones más altas tienden a bajar y las más bajas a aumentar. En ocasiones, este fenómeno de regresión se presenta porque ambas mediciones no están adecuadamente correlacionadas. 8. Selección. Esta fuente puede presentarse cuando se eligen para integrar los grupos del experimento a personas no equiparables. Es decir, si no se escogen participantes equivalentes, la selección resulta tendenciosa. Por ejemplo, en un experimento sobre métodos educativos, si en un grupo se incluyen a los estudiantes más inteligentes y estudiosos, y en el otro a los estudiantes menos inteligentes y abúlicos, las diferencias entre los grupos se deberán a una selección sesgada, aparte del tratamiento experimental o variable independiente. Lo mismo sucede con ciertos experimentos médicos: imaginemos que al probar un tratamiento un grupo está conformado básicamente por individuos jóvenes y sanos, y el otro, por personas significativamente mayores. En experimentos con materiales sometidos a distintas condiciones, dichos materiales deben ser completamente equivalentes. 9. Mortalidad experimental. Esta situación se refiere a las diferencias entre las pérdidas de participantes que sufren los grupos que se comparan. Si un grupo pierde 25% de sus miembros y el otro grupo sólo 2%, los resultados serán influidos por ello, además de por el tratamiento experimental. La pérdida de participantes puede deberse a diversas razones, por ejemplo, desmoralización, fatiga ante el tratamiento o desesperación por no ver progreso (Grinnell et al., 2009), por lo que algunos autores la incluyen como una fuente de invalidación interna por sí misma (Hulley, Cummings, Browner, Grady y Newman, 2013). Imaginemos un experimento que utiliza como estímulo un programa de televisión antisocial que ha sido visto por una tercera parte del grupo al que se le expondrá, mientras que al otro grupo se le expone a un programa prosocial que nadie ha visto. Condiciones agresivas, dolorosas, de cansancio, etc., pueden provocar mortalidad diferencial entre los grupos, la cual puede ocurrir no sólo por el experimento en sí, sino por el tipo de personas que componen cada grupo o por factores externos al experimento. En experimentos médicos, esta posibilidad es una amenaza ante la cual el investigador debe estar muy pendiente. 10. Interacción entre selección y maduración. En este caso se trata de un efecto de maduración desigual en los grupos del experimento, debido a algún factor de selección, el cual puede dar srcen a diferentes tasas de maduración o cambio autónomo entre grupos. Por ejemplo, si un grupo está compuesto por personas que acostumbran alimentarse a cierta hora (12:00 p.m.) y el otro, por personas que se alimentan a otra hora (3:00 p.m.), y el experimento se lleva a cabo de 11:00 a.m. a 2:30 p.m., la selección tendenciosa puede provocar un efecto de maduración distinto en los dos grupos: hambre. Este sesgo se puede presentar si en una convención de una empresa multinacional experimentamos con ejecutivas de distintos países latinoamericanos (cuyos horarios de alimentación son muy distintos), y no tomamos en cuenta la interacción que puede producirse entre la selección y la maduración. 11. Difusión de tratamientos experimentales. En este caso, los participantes de los grupos experimentales y de control intercambian información sobre la naturaleza del experimento, en particular respecto del estímulo, lo cual podría “nublar” los efectos de este. Por ejemplo, si ambos grupos saben que uno de ellos recibe dinero por participar y el otro no, los integrantes de este último podrían protestar y per-
4
Capítulo 5 Diseños experimentales. Segunda parte
turbar a toda la muestra, lo cual afectaría al experimento. Si en el caso de Naves y Poplawsky (1984), los estudiantes hubieran comentado a los demás participantes que se les “aparecía” un deficiente mental, los siguientes individuos no actuarían con naturalidad y el experimento resultaría un fracaso. Esta fuente resulta un riesgo cuando los grupos del experimento mantienen cercanía o contacto, pero se puede evitar si se eligen participantes que pertenezcan a diferentes ámbitos, pero equivalentes (en el ejemplo, estudiantes de diferentes carreras y semestres). Cuando se sospeche que los tratamientos se difunden, conviene entrevistar a los participantes para evaluar el grado de comunicación entre grupos y sus consecuencias. 12. Actuaciones anormales del grupo de control. Consiste en que si el grupo testigo conoce su condición y se esfuerza en un grado superlativo por obtener puntuaciones más favorables en la variable dependiente. Por ejemplo, en un experimento para probar un nuevo método educativo, los participantes del grupo que no aprende por medio de este enfoque innovador, al deducir que se espera de ellos que obtengan las puntuaciones más bajas, se esfuerzan más de lo normal y obtienen calificaciones elevadas. O bien, pacientes del grupo de control que al saber que no reciben el estímulo, cuiden mucho más su alimentación, se automediquen, hagan más ejercicio, etcétera. 13. Compensación. Los beneficios de un experimento pueden ser desiguales o inequitativos para los grupos, lo que puede provocar que el grupo de control lo resienta y esto afecte los resultados (Creswell, 2013a). Por ejemplo, si el grupo experimental recibe una terapia o tratamiento médico y el de control, no, los miembros de este último pueden sentirse devaluados o desmoralizados, situación particularmente crítica cuando a un grupo se le otorgan estímulos económicos y al otro, no, como ya se señaló. Por ejemplo, en un experimento para analizar si un equipo de trabajo incrementa significativamente su productividad y calidad cuando se le asigna una nueva maquinaria, para lo cual se comparan sus resultados con los de otra cuadrilla que aún trabaja con el equipo antiguo, podría presentarse la compensación o una actuación anormal de cualquiera de los grupos. 14. Otras interacciones. Es posible que se presenten diversos efectos provocados por la interacción de las fuentes de invalidación interna. La selección puede interactuar con la mortalidad experimental, la historia con la maduración, la maduración con la inestabilidad, etc. ambién pueden operar simultáneamente de estas fuentes la validez interna deterioraa las aúncausas más. Cada vez que haycambios mayor presencia de varias tales amenazas, crece lay incertidumbre conserespecto que produjeron en las variables dependientes. Si no hubo cambios, no podemos saber si se debió a que una o más fuentes contrarrestaron los posibles efectos del tratamiento. Por ejemplo, un método de enseñanza exitoso se utilizó con los participantes menos motivados y el menos exitoso con los más motivados, lo cual provocó que se compensaran ambos factores. De este modo, no sabremos cómo interpretar los resultados.
Los sujetos participantes y el experimentador como fuentes de invalidación interna Otra razón que atenta contra la interpretación correcta y certera de los resultados de un experimento en el que se involucran personas, es el comportamiento de estas. Es posible que ellas ingresen al experimento con ciertas actitudes, expectativas y prejuicios que alteren su comportamiento durante el estudio, por ejemplo, no colaborar y actuar negativamente, hasta el punto de llegar a ser hostiles. Este posible comportamiento debe tenerse presente antes y durante la investigación. Es necesario evaluar qué participantes pueden arruinar el experimento y descartarlos, o procurar que en todos los grupos haya personas con actitudes positivas y negativasRecordemos (si todos losque quelos tienen actitudes integran un grupo, la validez interna estaría en problemas). individuos quenegativas intervienen en un experimento, de una manera u otra, tienen motivos para participar y su conducta muchas veces puede afectar la calidad de las interpretaciones. Además, el mismo experimentador no es un observador pasivo que no interactúa, sino un sujeto activo que puede influir en los resultados del estudio (Christensen, 2006). El investigador tiene una serie de motivos que lo impulsan a realizar su experimento, pues con los resultados que este genere puede pro-
5
bar sus hipótesis. Ello, conscientemente o no, puede conducirlo a afectar el comportamiento de los sujetos en dirección de su hipótesis. Por ejemplo, dar explicaciones más completas a uno de los grupos. Hay que evitar todas estas posibles desviaciones. Por ello, en ciertos casos quien trate con los participantes no debe ser el experimentador, sino alguien que no conozca la hipótesis, las condiciones experimentales ni los propósitos del estudio, sino que sólo reciba instrucciones precisas sobre lo que debe hacer y cómo desempeñarse. En ciencias exactas, a pesar de que se experimenta con sustancias o fuerzas, el investigador que manipula las condiciones también debe estar consciente de su rol. Quienes participan en el experimento tampoco deben conocer las hipótesis ni las condiciones experimentales; incluso, con frecuencia es necesario distraerlos de los verdaderos propósitos del estudio, aunque al finalizar se les deba dar una explicación completa de la investigación. Cuando, por ejemplo, se analizan los efectos de ciertos medicamentos, los investigadores hacen creer a un grupo que se le está administrando una medicina cuando en realidad no es así, sino que se le proporciona píldoras de azúcar. Este “truco” evita la influencia que la expectativa de recibir medicamento pudiera tener en la variable dependiente. A esta sustancia que no tiene efectos se le denomina “placebo”. Con métodos de instrucción, por ejemplo, ocurre que el grupo que se expondrá al método innovador es influido por el simple hecho de decirle que se trata de un nuevo método. Lo mismo con pruebas de sabor de un producto alimenticio, programas de televisión, experiencias motivacionales, diseños arquitectónicos, sistema de calidad en las empresas, etc. Por tanto, estos aspectos deben tomarse muy en cuenta.
VARIOS GRUPOS DE COMPARACIÓN En el capítulo siete del texto impreso y en líneas anteriores, se hace hincapié en que para lograr la validez interna y el control en un experimento es necesario que se aplique, por lo menos, a dos grupos comparables. En primer término, porque si se trabaja con un solo grupo no es posible saber con certeza si influyeron las fuentes de invalidación interna o no. Por ejemplo, mediante un experimento intentamos probar la hipótesis que sostiene que “a mayor información psicológica sobre una clase social, menor prejuicio hacia ella”. Sisedecidimos trabajar con un sobre solo grupo, se debería un programa de sensibilización donde proporcione información la manera en que exponerlo vive dichaaclase, sus angustias y problemas, necesidades, sentimientos, aportaciones a la sociedad, etc., para luego observar el nivel de prejuicio (el programa debe incluir charlas de expertos, películas y testimonios grabados, lecturas, etc.). Este experiMomento1(X) G
Exposición al programa de sensibilización
Momento2(O) Observación del nivel de prejuicio
mento se esquematizaría así: odo en un único grupo. ¿Qué sucede si se observa un bajo nivel de prejuicio en el grupo? ¿Podemos deducir con absoluta certeza que se debió al estímulo? Desde luego que no. Es posible que ese bajo nivel se deba al programa de sensibilización, que es la forma de manipular la variable independiente “información psicológica sobre una clase social”, pero también a que los participantes tenían un bajo nivel de prejuicio antes del experimento y, en realidad, el programa no afectó. Además, no lo podemos saber porque no hay una medición del nivel de prejuicio al inicio del experimento (antes de la presentación del estímulo experimental); es decir, no existe punto de comparación. Pero, aunque hubiera ese punto de contraste inicial, con un solo grupo no podríamos estar seguros de cuál fue la causa del nivel de prejuicio. Supongamos que este nivel de prejuicio antes del estímulo o tratamiento era alto, y después del estímulo, bajo. Quizás el tratamiento sea la causa del cambio, pero tal vez también ocurrió lo siguiente: 1. Que la primera prueba de prejuicio sensibilizara a los sujetos participantes y que influyera en sus
respuestas en la segunda prueba. De este modo, las personas crearon conciencia de lo negativo de ser prejuiciosas cuando respondieron a la medición previa (administración de prueba).
6
Capítulo 5 Diseños experimentales. Segunda parte
2. Que los individuos seleccionados se agotaran durante el experimento y sus respuestas a la segunda
prueba fueran “a la ligera” (maduración). 3. Que los sujetos prejuiciosos o parte importante de ellos hubiera abandonado el experimento (mor-
talidad experimental). ambién podrían existir otras razones. Además, si no se hubiera observado un cambio en el nivel de prejuicio entre la primera prueba (antes del programa) y la segunda (después del programa), se podría asumir que la exposición al programa no tiene efectos, aunque también podría suceder que el grupo seleccionado es muy prejuicioso y tal vez el programa sí tiene efectos en personas con niveles comunes de prejuicio. Asimismo, si el cambio es negativo (mayor nivel de prejuicio en la segunda medición que en la primera), se podría suponer que el programa incrementa el prejuicio, pero supongamos que haya ocurrido un suceso durante el experimento que generó momentáneamente prejuicios hacia esa clase social (una violación en la localidad a cargo de un individuo de esta), pero después los participantes “regresaron” a su nivel de prejuicio normal (regresión). Incluso podría haber otras explicaciones. Con un solo grupo no estaríamos seguros de que los resultados se debieran al estímulo experimental o a otras razones. Siempre quedará la duda. Los “experimentos” con un grupo se basan en sospechas o en lo que “aparentemente es”, pero carecen de fundamentos científicos. Cuando se trabaja con un solo grupo se corre el riesgo de seleccionar sujetos atípicos (los más inteligentes al experimentar con métodos de enseñanza, los trabajadores más motivados cuando se aplican programas de incentivos, los consumidores más críticos, las parejas de novios más integradas, etc.) y de que intervengan la historia, la maduración y demás fuentes de invalidación interna, sin que el experimentador se percate de ello. Por todas estas razones, el investigador debe tener al menos un punto de comparación: dos grupos, uno al que se le administra el estímulo y otro que no lo reciba (el grupo de control). al como se mencionó al hablar de manipulación, a veces se debe trabajar con varios grupos cuando se desea averiguar el efecto de distintos niveles o modalidades de la variable independiente.
EQUIVALENCIA DE LOS GRUPOS EN EXPERIMENTOS Para tener control no basta con dos o más grupos, sino que estos deben ser similares en todo, menos en la manipulación de la o las variables independientes. El control implica que todo permanece constante, salvo tal intervención. Si entre los grupos que conforman el experimento todo es similar o equivalente, excepto la manipulación de la variable independiente, las diferencias entre ellos pueden atribuirse a esta y no a otros factores (entre los cuales están las fuentes de invalidación interna). Imaginemos que deseamos indagar si una serie de programas educativos de televisión para niños genera mayor aprendizaje que un método tradicional. Un grupo recibe la enseñanza a través de los programas, otro la recibe por medio de instrucción oral tradicional, mientras que un tercero dedica ese mismo tiempo a jugar libremente en el salón de clases. Supongamos que los niños que aprendieron mediante los programas obtienen las mejores calificaciones en una prueba de conocimientos relativa a los contenidos enseñados, los que recibieron el método tradicional obtienen calificaciones mucho más bajas, y los que jugaron obtienen puntuaciones de cero o cercanas a este valor. En forma aparente, los programas son un mejor vehículo de enseñanza que la instrucción oral. Pero si los grupos no son equivalentes, no podemos confiar en que las diferencias se deban realmente a la manipulación de la variable independiente (programas televisivos-instrucción oral) y no a otras causas, o a la combinación de ambas. Por ejemplo, a los niños más inteligentes, estudiosos y con mayor empeño se les asignó al grupo que fue instruido por televisión, o simplemente su promedio de inteligencia y aprovechamiento era el más elevado; o la instructora del método tradicional no poseía buen desempeño, o los niños expuestos a este último método recibieron mayor carga de trabajo y tenían exámenes los días en que se desarrolló el experimento, etc. ¿Cuánto se debió al método y cuánto a otros factores? Para el investigador la respuesta a esta pregunta se convierte en un enigma: no hay control. Si experimentáramos con métodos de motivación para trabajadores, y un grupo estuviera conformado por los que laboran en el turno matutino, y el otro por los empleados del turno vespertino, ¿quién nos
7
asegura que antes de iniciar el experimento ambos tipos de trabajadores están igualmente motivados? Puede haber discrepancias en la motivación inicial porque los supervisores de distintos turnos motivan de diferente manera y grado, o tal vez los del turno vespertino preferirían trabajar en la mañana o se les pagan menos horas extras, etc. Si no están igualmente motivados, podría ocurrir que el estímulo aplicado a los del turno de la mañana aparentara ser el más eficaz, cuando en realidad no es así. Veamos un ejemplo que nos ilustrará el efecto tan negativo que puede generar la inequivalencia de los grupos sobre los resultados de un experimento. ¿Qué investigador probaría el efecto de diferentes métodos para sensibilizar a las personas respecto de lo terrible que puede ser el terrorismo si un grupo está constituido por miembros de Al-Qaeda y el otro por familiares de las víctimas de los atentados en Londres, en julio de 2005? Losengrupos sera equivalentes cuando se inicia y durante todo el desarrollo del experimento, menos lo que deben respecta la variable independiente. Asimismo, los instrumentos de medición deben ser iguales y aplicados de la misma manera.
Equivalencia inicial Este requisito implica que los grupos son similares entre sí en el momento de iniciarse el experimento. Si este versa sobre los métodos educativos, los grupos deben ser equiparables en cuanto a número de personas, inteligencia, aprovechamiento, disciplina, memoria, género, edad, nivel socioeconómico, motivación, nutrición, conocimientos previos, estado de salud física y mental, interés por los contenidos, extraversión, etc. Si inicialmente no son equiparables, digamos en cuanto a motivación o conocimientos previos, las diferencias entre los grupos —en cualquier variable dependiente— no podrían atribuirse con certeza a la manipulación de la variable independiente. La equivalencia inicial no se refiere a equivalencias indiviEquivalencia inicial Implica que los duales, porque todos diferimos de manera natural en muchos grupos son similares entre sí en el momento de iniciarse el experimento. aspectos, sino a la equivalencia entre grupos. Si trabajamos con dos grupos, es indudable que habrá, por ejemplo, personas muy inteligentes en uno de ellos, pero también debe haberlas en el otro. Si en uno hay mujeres, en el otro debe haberlas en la misma proporción. Y así con todas las variables que puedan afectar a la o las variables dependientes, además de la variable independiente. Para hablar de experimentos válidos no pueden existir diferencias significativas entre los grupos.
Equivalencia durante el experimento Durante el estudio, los grupos deben mantener la equivalencia inicial en los aspectos concernientes al desarrollo experimental, excepto en la manipulación de la variable independiente: mismas instrucciones (salvo variaciones que sean parte de esa manipulación), personas con las que tratan los participantes y maneras de recibirlos, lugares con características semejantes (iguales objetos en los cuartos, clima, ventilación, sonido ambiental, etc.), igual duración del experimento, así como del momento y, en fin, todo lo que sea parte del estudio. Cuanto mayor sea la equivalencia, durante su desarrollo, habrá mayor control y posibilidad de que, si observamos o no efectos, estemos seguros de que verdaderamente los hubo o no. Cuando trabajamos simultáneamente con varios grupos, es difícil que las personas que dan las instrucciones y vigilan el desarrollo de los grupos sean las mismas. En este caso debe buscarse que su tono de voz, apariencia, edad, género y otras características capaces de afectar los resultados sean iguales o similares, y mediante entrenamiento debe estandarizarse su proceder. Algunas veces se dispone de menos cuartos o lugares grupos. En consecuencia, la asignación de los grupos a los y horarios se realiza al azar, que perode se debe procurar que los procedimientos se apliquen, dentro de locuartos posible, en horarios coincidentes. Otras veces, los participantes reciben los estímulos individualmente y su exposición no puede ser simultánea. Se deben sortear de manera que en un día (por la mañana) personas de todos los grupos participen en el experimento, lo mismo por la tarde y durante el tiempo que sea necesario (los días que dure el experimento).
8
Capítulo 5 Diseños experimentales. Segunda parte
Recordatorio: ¿cómo se logra la equivalencia inicial? Asignación al azar Como se comentó en el capítulo 7 de la obra impresa, el método más exacto para lograr la equivalencia inicial es la asignación aleatoria o al azar de los participantes a los grupos del experimento (en inglés, randomization). La asignación al azar nos asegura probabilísticamente que dos o más grupos son equivalentes entre sí (Kirk, 2012; Knapp, 2008; Pettygrove, 2007 y Peng, 2003). Esta técnica de control tiene como propósito dar al investigador la seguridad de que variables extrañas, conocidas o desconocidas, no afectarán de manera sistemática los resultados del estudio (Christensen, 2006). Esta técnica, que fue diseñada por Sir Ronald A. Fisher, en la década de 1940, ha demostrado durante años que funciona para hacer equivalentes a grupos de participantes. Como mencionan Cochran y Cox (1992), la asignación aleatoria es en cierta forma análoga a un seguro, por el hecho de que es una precaución contra interferencias que pueden o no ocurrir, y ser o no importante si suceden. Por lo general, es aconsejable tomarse el trabajo de distribuir aleatoriamente, aun cuando no se espere que haya un sesgo importante si se opta por otro enfoque. Si la única diferencia que distingue al grupo experimental y al de control es la variable independiente, las diferencias entre ellos pueden atribuirse a esta última. Pero si hay otras diferencias, no podríamos hacer tal afirmación.
EJEMPLO DE EQUIVALENCIA INICIAL DE LOS GRUPOS EN EXPERIMENTOS En el capítulo 7 del libro impreso se señaló que en un experimento, los grupos de comparación deben poseer equivalencia inicial.5 A continuación ejemplificamos esta noción. Si suponemos que todas las variables (V) pudieran medirse de uno a 10, la equivalencia entre grupos se debería conceptualizar tal como en la tabla 5.l.
Tabla 5.1 Esquema para ilustrar la equivalencia inicial de los grupos. Al inicio del experimento Grupo 1
Grupo 2
V1 = 8
V1 = 7.9
V2 = 4
V2 = 4.1
V3 = 6
V3 = 6
V4 = 7.2
V4 = 7.4
V5 = 10
V5 = 9.9
20 mujeres, 21 hombres
19 mujeres, 22 hombres
Promedio de edad = 25 años, 6 meses
Promedio de edad = 25 años, 4 meses
V6 = 2
V6 = 2
Vk = K
Vk = K
V = una variable (V1 = variable 1, V2 = variable 2...)
Veamos en la tabla 5.2 un ejemplo de equivalencia entre dos grupos respecto de ciertos rasgos físicos para ilustrar el concepto.
1En
experimentos en ciencias biológicas, obviamente los ejemplares de los grupos que se contrastan también deben ser similares, y en experimentos con materiales, sustancias, fuerzas y objetos en ciencias físicas, por ejemplo, ocurre lo mismo (incluso idénticos, por ello les denominamos “ciencias exactas”). La equivalencia inicial es una condición de la experimentación.
9
Tabla 5.2 Ejemplo de dos grupos equivalentes. G1rupo
G2rupo 10 hombres de tez morena y ojos cafés
10 hombres de tez morena y ojos cafés 5 hombres de tez morena y ojos negros 11 hombres de tez clara y ojos cafés 5 hombres de tez clara y ojos verdes 10 mujeres de pelo rubio y tez muy clara
equivalencia
=
4 hombres de tez morena y ojos negros 12 hombres de tez clara y ojos cafés 5 hombres de tez clara y ojos verdes 10 mujeres de pelo rubio y tez muy clara
8 mujeres de pelo castaño claro y tez clara
9 mujeres de pelo castaño claro y tez clara
5 hombres de pelo castaño oscuro y tez clara
3 hombres de pelo castaño oscuro y tez clara
En la tabla 5.3 se presenta un ejemplo de dos grupos que interculturalmente no son equivalentes.
Tabla 5.3 Ejemplo de dos grupos no equivalentes. Grup1o
Grup2o
3 venezolanos
1 venezolano
6 colombianos
3 brasileñas
5 mexicanos
2 mexicanos
6 estadounidenses 4 ingleses
≠
1 estadounidense 28 franceses
7 bolivianos
10 ingleses
3 italianos
4 rusos
5 israelitas
2 alemanes
4 afganos 3 cubanos
5 suizos 2 nicaragüenses
12 españoles
Desde luego, es prácticamente imposible alcanzar la equivalencia perfecta o ideal con seres humanos o animales, pero no deben permitirse diferencias iniciales significativas entre los grupos.
EJEMPLO DE LA TÉCNICA DE EMPAREJAMIENTO EN EXPERIMENTOS A fin de explicar aún más lo que se expuso en el capítulo 7 del libro sobre el emparejamiento, a continuación presentamos un ejemplo con dos grupos. Suponga que se tienen 16 personas para un experimento sobre desempeño académico (recuerde la sugerencia de tener 15 o más en cada grupo; aquí se incluyen 16 solo para abreviar el caso), divididas en un grupo al cual se le otorgará una beca de 50% para sus estudios universitarios, y un grupo de control al que no se le concederá beneficio económico alguno. La variable dependiente sería el desempeño académico, medido por el promedio de sus calificaciones en todas las asignaturas. Los estudiantes se ordenarían de la siguiente manera:
10
Capítulo 5 Diseños experimentales. Segunda parte
Participante 01 02 03 04 05 06 07 08
Coeficiente de inteligencia (ci) 129 127 119 119 117 116 114 113
Participante 09 10 11 12 13 14 15 16
Coeficiente de inteligencia (ci)
110 110 108 107 106 105 104 102
Se procede entonces a empatar gradualmente a dos grupos en la variable deseada, en este caso, inteligencia:
Sujeto 01 (CI = 129)
Grupo 1
Sujeto 03 (CI = 119)
Grupo 1
Sujeto 02 (CI = 127)
Grupo 2
Sujeto 04 (CI = 119)
Grupo 2
Hasta ahora, el grupo 1 lleva dos puntos más que el grupo 2 (grupo 1 = 248, grupo 2 = 246), por lo cual es necesario compensarlo. Sujeto 05 (CI = 117)
Grupo
Sujeto 07 (CI = 114)
Grupo
Sujeto 06 (CI = 116)
Grupo 2
Sujeto 08 (CI = 113)
Grupo 2
11
Hasta aquí se ha 1 = 477 y grupo 2 = 477).
conservado
el
Sujeto 09 (CI = 110)
balance
entre
Sujeto 10 (CI = 110)
Grupo 1
Grupo 2
Sujeto 11 (CI = 108)
Sujeto 12 (CI = 107)
Grupo 1
Grupo 2
Sujeto 13 (CI = 106)
Sujeto 14 (CI = 105)
Grupo 1
Grupo 2
Sujeto 15 (CI = 104)
Sujeto 16 (CI = 102)
Grupo 1
Grupo 2
De esta forma, los grupos quedarían emparejados en inteligencia. Grup1o Sujeto S01
los
Grup2o CI
129
Sujeto S02
CI 127
S03
119
S04
119
S06
116
S05
117
S08
113
S07
114
S09
110
S10
110
S11
108
S12
107
S13
106
S14
105
S16
102
S15
104
Promedio = 112.87
Promedio = 112.87
grupos
(grupo
12
Capítulo 5 Diseños experimentales. Segunda parte
Ambos grupos son equivalentes en cuanto a la variable deseada. Este procedimiento puede extenderse a más de dos grupos (si se trata de tres, en lugar de parejas se iguala por tercias, con cuatro grupos por cuartetos, etcétera). Respecto del emparejamiento debemos recordar lo que señalamos en el texto impreso: la asignación al azar es el mejor método para hacer equivalentes los grupos (más preciso y confiable). El emparejamiento no la sustituye por completo, pues llega a suprimir o eliminar el posible efecto de la variable apareada, pero nunca nos asegura que otras variables (no apareadas) no puedan afectar los resultados del experimento. En cambio, la asignación aleatoria garantiza que otras variables (además de la o las variables independientes de interés para el investigador) no afecten las dependientes ni confundan al experimentador. Como comentan Te SAGE Glossary of the Social and Behavioral Sciences
asignación al azar de los parti(2009s), Knapp (2008) y Nunnally y Bernstein (1994), lo bueno de la cipantes o casos a los grupos de un diseño experimental es que el procedimiento asegura absolutamente que, en promedio, los grupos no diferirán (antes de que participen en los tratamientos experimentales) en ninguna característica más de lo que pudiera esperarse por pura casualidad.
DISEÑO DE CUATRO GRUPOS DE SOLOMON: AMPLIACIÓN Para iniciar, recordemos al lector que este diseño es una mezcla de dos diseños: 1) diseño con posprueba únicamente y grupo de control y 2) diseño de preprueba-posprueba con grupo de control. La suma de estos dos diseños srcina cuatro grupos: dos experimentales y dos de control, pero mientras los primeros reciben el mismo tratamiento experimental, los segundos no reciben ningún tratamiento. Sólo a uno de los grupos experimentales y a uno de los grupos de control se les administra la preprueba; a los cuatro grupos se les aplica la posprueba. odos los participantes son asignados al azar. engamos en mente que el diseño se diagrama así: RG 1
RG
X
0
—
0
—
X
0
—
—
0
0
1
0 2
RG 3
RG 4
3
2
4 5
6
El diseño srcinal incluye sólo cuatro grupos y un tratamiento experimental. Los efectos se determinan comparando las cuatro pospruebas. Los grupos uno y tres son experimentales, y los grupos dos y cuatro son de control. La ventaja de este diseño es que el experimentador tiene la posibilidad de verificar los posibles efectos de la preprueba sobre la posprueba, puesto que a unos grupos se les administra un test previo y a otros no. Es posible que la preprueba afecte la posprueba o que aquélla interactúe con el tratamiento experimental. Por ejemplo, con promedios de una variable determinada podría encontrarse lo que muestra la tabla 5.4. Tabla 5.4 Ejemplo de efecto de preprueba en el diseño de Solomon.
RG RG
01 = 8.0 03 = 8.1
X —
02 = 14.0 04 = 11.0
RG RG
—
X
05 = 11.0
—
—
06 = 8.0
13
eóricamente, 02 debería ser igual a 05, porque ambos grupos recibieron el mismo tratamiento; asimismo, 04 y 06 deberían tener el mismo valor, porque ninguno recibió estímulo experimental. Pero 02 ≠ 05 y 04 ≠ 06. Entonces, ¿cuál es la única diferencia entre 02 y 05, y entre 04 y 06? La respuesta es la preprueba. Las diferencias pueden atribuirse a un efecto de la preprueba (la preprueba impacta, aproximadamente, tres puntos, y el tratamiento experimental también tres puntos, poco más o menos). Veámoslo de manera esquemática: Ganancia con preprueba y tratamiento = 6 Ganancia con preprueba y sin tratamiento = 2.9 (casi 3).
Debido a que, al inicio, la técnica de distribución aleatoria atribuye equivalencia a los grupos, supuestamente el promedio de la preprueba hubiera sido para todos cerca de ocho, si se hubiera aplicado a los cuatro grupos. La “supuesta ganancia” (supuesta porque no hubo preprueba) del tercer grupo, con tratamiento y sin preprueba, es de tres. Y la “supuesta ganancia” (supuesta porque tampoco hubo preprueba) del cuarto grupo es nula o inexistente (cero). Estas conclusiones indican que cuando hay preprueba y estímulo se obtiene la máxima puntuación de 14, si sólo hay preprueba o estímulo la puntuación es de 11, y cuando no hay preprueba ni estímulo es de ocho (calificación que todos deben tener inicialmente por efecto de la asignación al azar). ambién podría ocurrir un resultado como el de la tabla 5.5. Tabla 5.5 Ejemplo del efecto de interacción entre la preprueba y el estímulo en el diseño de Solomon.
RG
01 = 7.9
X
02 = 14.0
RG
03 = 8.0
—
04 = 8.1
RG RG
— —
X —
05 = 11.0 06 = 7.9
En este caso, la preprueba no afecta (vea la comparación entre 03 y 04), pero el estímulo sí lo hace (compare 05 con 06); sin embargo, cuando el estímulo o tratamiento se junta con la preprueba se observa un efecto importante (compare 0 1 con 02), un efecto de interacción entre el tratamiento y la preprueba. El diseño de Solomon controla todas las fuentes de invalidación interna por las mismas razones que fueron explicadas en diseños “puros” del texto impreso. La administración de pruebas se somete a un análisis minucioso.
FUENTES DE INVALIDACIÓN EXTERNA A DETALLE En el texto impreso se dijo que se ampliarían las fuentes de invalidación externa en el centro de recursos en línea, por lo que aquí se hace.
1. Efecto reactivo o de interacción de las pruebas Este efecto se presenta cuando la preprueba aumenta o disminuye la sensibilidad o la calidad de la reacción de los participantes a la variable experimental, lo cual contribuye a que los resultados obtenidos para una población con preprueba no puedan generalizarse a quienes forman parte de esa población sin preprueba. Babbie (2012) utiliza un excelente ejemplo de esta influencia: en un experimento diseñado para analizar si una película disminuye el prejuicio racial, la preprueba podría sensibilizar al
14
Capítulo 5 Diseños experimentales. Segunda parte
grupo experimental y la película podría lograr un efecto mayor del que tendría si no se aplicara la preprueba (por ejemplo, si se pasara la película en un cine o en la televisión).
2. Efecto de interacción entre los errores de selección y el tratamiento experimental Este factor impone que se elijan personas con una o varias características que permitan que el tratamiento experimental produzca un efecto, el cual no se lograría si las personas no tuvieran esas peculiaridades. Por ejemplo, si seleccionamos trabajadores muy motivados para un experimento sobre productividad, podría ocurrir que el tratamiento sólo tuviera efecto en este tipo de trabajadores y no en otros (solo funciona con individuos sumamente motivados). Ello se resolvería con una muestra representativa de todos los trabajadores o mediante la introducción de un diseño factorial y que una de las variables fuera el grado de motivación (vea más adelante diseños factoriales). En ocasiones, este factor se presenta cuando se reclutan voluntarios para la realización de algunos experimentos.
3. Efectos reactivos de los tratamientos experimentales La “artificialidad” de las condiciones puede hacer que el contexto experimental resulte atípico respecto de la manera en que se aplica regularmente el tratamiento (Campbell, 1975). Por ejemplo, a causa de la presencia de observadores y equipo, los participantes cambian su conducta normal en la variable dependiente medida, la cual no se alteraría en una situación común donde se aplicara el tratamiento. Por ello, el experimentador tiene que ingeniárselas para hacer que los sujetos se olviden de que están en un experimento y no se sientan observados. A esta fuente también se le conoce como “efecto Hawthorne”, por una serie de experimentos muy famosos desarrollados entre 1924 y 1927, en una planta del mismo nombre de la Western Electric Company, en la cual, al variarse la intensidad de la iluminación se observaban incrementos de la productividad de los trabajadores, tanto al aumentarla como al disminuirla. Por lo tanto, se concluyó que los cambios en la productividad se debían a que los participantes se sentían observados (Ballantyne, 2000).
4. Interferencia de tratamientos múltiples En este caso se aplican varios tratamientos a un grupo experimental para conocer sus efectos por separado y en conjunto (por ejemplo, enseñarle a niños hábitos higiénicos con un video, más una dinámica que implique juegos, más un libro explicativo); incluso, si los tratamientos no son de efecto reversible, es decir, si no es posible eliminar sus efectos, las conclusiones solo podrán hacerse extensivas a los infantes que experimenten la misma secuencia de tratamientos, sean múltiples o repetitivos (vea en páginas subsecuentes los diseños con diversos tratamientos).
5. Imposibilidad de replicar los tratamientos Cuando los tratamientos son tan complejos que no pueden replicarse en situaciones no experimentales, es difícil generalizar sus efectos.
6. Descripciones insuficientes del tratamiento experimental En ocasiones, el tratamiento o los tratamientos experimentales no se describen con suficiente detalle en el reporte del estudio, por lo que si otro investigador desea reproducirlos, le resultará muy difícil o imposible hacerlo (Mertens, 2010). Por ejemplo, señalamientos tales como “la intervención funcionó” no nos dice nada, por lo cual se debe especificar en qué consistió tal intervención. Las instrucciones deben incluirse, y la minuciosidad con que se comuniquen es un elemento importante.
15
7. Efectos de novedad e interrupción Un nuevo tratamiento puede tener resultados positivos simplemente por ser percibido como novedoso, o bien, lo contrario: tener un efecto negativo porque interrumpe las actividades normales de los participantes. En este caso, es recomendable inducir a los sujetos paulatinamente al tratamiento (no de manera intempestiva) y esperar a que asimilen los cambios que este naturalmente provoca (Gerber y Green, 2012 y Mertens, 2010).
8. El experimentador A quien también consideramos una fuente de invalidación interna, pues puede generar alteraciones o cambios que no se presentan en situaciones no experimentales. Es decir, que el tratamiento solo tenga efecto con la intervención del experimentador.
9. Interacción entre la historia o el lugar y los efectos del tratamiento experimental Un experimento conducido en un contexto en particular (tiempo y lugar), en ocasiones no puede ser duplicado (Mertens, 2010). Por ejemplo, un estudio que se efectúe en una empresa en el momento en que se reestructuran departamentos (donde algunos quizá se mantengan, otros se reduzcan y hasta algunos desaparezcan). O bien, un experimento en una escuela secundaria que se lleva a cabo al tiempo que su equipo de futbol obtiene un campeonato nacional. Asimismo, en ocasiones los resultados de un experimento no pueden generalizarse a otros lugares o ambientes. Si se realiza una investigación en una escuela pública recientemente inaugurada, que cuenta con los máximos avances tecnológicos y educativos, ¿podemos extrapolar los resultados a todas las escuelas públicas de la localidad? A veces, el efecto del tratamiento lo tenemos que analizar en distintos lugares y tiempos (Creswell, 2013a).
10. Mediciones de la variable dependiente Puede suceder que un instrumento no registre cambios en la variable dependiente (ejemplo: cuestionario) y otro, sí (observación). Si en un experimento se utiliza un instrumento para recolectar datos, y de este modo sus resultados puedan compararse, otros estudios deberán evaluar la variable dependiente con el mismo instrumento o uno equivalente (lo mismo en situaciones no experimentales).
DISEÑOS EXPERIMENTALES DE SERIES CRONOLÓGICAS MÚLTIPLES Cuando el experimentador se interesa en analizar los efectos en el mediano o largo plazos , porque supone que la influencia de la variable independiente sobre la dependiente tarda en manifestarse, por ejemplo, en programas de difusión de innovaciones, tratamientos médicos, métodos educativos, procesos industriales, introducción de tecnologías o estrategias psicoterapéuticas, es conveniente que adopte diseños con varias pospruebas. A estos diseños se les conoce como series cronológicas experimentales. En realidad, el término serie cronológica se aplica a cualquier diseño que permita efectuar varias observaciones o mediciones sobre una variable a través del tiempo, sea o Series cronológicas Diseños que, a no experimental, sólo que en este caso se les llama experimentravés del tiempo, efectúan diversas tales porque reúnen los requisitos para serlo. observaciones o mediciones sobre una Estos diseños operan con dos o más grupos y los participantes o casos son asignados al azar a ellos. Sin embargo, debido a que transcurre mucho más tiempo entre el inicio y la terminación del experimento, el investigador debe tener cuidado de que no ocurra algo que afecte de manera distinta a los grupos (con excepción de la manipulación de la variable independiente). Lo mismo sucede cuando el estímulo se aplica durante mucho tiempo (por ejemplo, programas motivavariable.
16
Capítulo 5 Diseños experimentales. Segunda parte
cionales para trabajadores que duran semanas), pues con el paso del tiempo es más difícil mantener la equivalencia inicial de los grupos. Un ejemplo del proceso de diagramación de las series cronológicas experimentales se muestra en la tabla 5. 6. Tabla 5.6 Ejemplos de experimentos de series cronológicas.
Serie cronológica sin preprueba, con varias pospruebas y grupo de control RG1 X1 01 02 03 RG2 X2 04 05 06 0 0 0 3 3 7 8 9 RG X RG4 010 011 012 Serie cronológica con preprueba, con varias pospruebas y grupo de control RG1 01 X1 02 003 004 RG2 05 X2 06 007 008 RG3 09 010 011 012 Serie cronológica basada en el diseño de cuatro grupos de Solomon RG1 01 X 02 03 RG2 04 05 06 RG3 X 07 08 RG4 09 010 Las pospruebas pueden ser tantas como se requiera y sea posible aplicar. Asimismo, en otras ocasiones se desea analizar la evolución de los grupos antes y después del tratamiento experimental. En esta situación pueden incluirse varias prepruebas y pospruebas, en cuyo caso se tendrían esquemas como el siguiente:
R
G1
01
02
03
X1
0
0
0
R
G2
04
05
06
X2
0
0
0
R
G3
07
08
09
0
0
0
Ejemplo Diseño experimental de serie cronológica Un consultor en cuestiones organizacionales estudia el efecto sobre la dedicación al trabajo que tiene la difusión de una serie de valores, que la directiva de una corporación considera deben ser implantados en la empresa. Pregunta de investigación: ”Cuanto más conozca el personal de una corporación los valores de esta (definidos por su directiva), ¿mostrará mayor dedicación al trabajo? Hipótesis estadística: de investigación: Hipótesis rxy > 0“El mayor conocimiento de los valores corporativos genera mayor dedicación al trabajo”. El consultor selecciona a 99 personas de la corporación, de todos los niveles jerárquicos, y los asigna al azar a tres grupos: 1) Uno participa en una reunión de dos horas en donde se le presentan ampliamente los valores corporativos con aplicaciones a situaciones específicas de trabajo; posteriormente sus miembros reciben un folleto con explicaciones adicionales. 2) Otro asiste a una sesión breve donde se proporciona un folleto sobre los valores corporativos (no hay explicación verbal ni discusión o sesión de preguntas y respuestas).
17 3) El tercer grupo asiste a una sesión donde se trata algún aspecto no relacionado con el trabajo o la organización (digamos, un tema de interés general). Antes de administrar los tratamientos a todos los participantes, se les aplica tres mediciones de la dedicación al trabajo. Asimismo, después de los tratamientos, también se les aplica tres mediciones de la misma variable (al corto, mediano y largo plazos). El diseño se debería diagramar como se muestra en la figura 5.1. Recuerde que se pretende medir la dedicación al trabajo. Cada grupo estaría integrado por 33 personas.
Figura 5.1 Diseño del ejemplo de serie cronológica sobre la dedicación al trabajo de tres grupos.
Una ventaja del diseño consiste en que es posible evaluar la evolución comparativa de los grupos. Por ejemplo, si se encontraran los siguientes resultados con una escala (hipotética) de dedicación al trabajo, con valores de 0 a 25:
R
G1
11
11
11.2
X1
16
18
21
R
G2
10.8
11
10.9
X2
15
14
11.8
R
G3
11.1
10.9
11.3
11
10.8
11.4
Podemos observar que X1 tiene un efecto que aumenta con el paso del tiempo y X2 produce un efecto en el corto plazo, pero tiende a desvanecerse con el paso del tiempo. Esto podría graficarse del siguiente modo:
18
Capítulo 5 Diseños experimentales. Segunda parte
e t n ie d n e p e d e l b ia r a v la e d l e iv N
) o j a
b rta l e n e n ió c a in l c e d (
09
08
07
X
1
04
Tratamiento uno
05
06
19
En los diseños experimentales de series cronológicas se realiza este tipo de gráficas, las cuales enriquecen la interpretación de la evolución de los grupos. Algunas de las diversas configuraciones que se presentan se muestran en las figuras 5.2, 5.3 y 5.4. En este caso, debe observarse que no sea algún suceso ajeno el que provoque el efecto, en lugar de la manipulación de la variable independiente. Podría ocurrir que: Figura 5.2 Ejemplo de un suceso ajeno a X que provoca el efecto.
e t n e i d n e p e d e l b a i r a v a l e d a l a c s E
Suceso que es independiente aX
01
02
03
04
05
06
07
08
20
Capítulo 5 Diseños experimentales. Segunda parte
Figura 5.3 Ejemplo de un efecto que perdura.
01 01
02
03
X
04
05
06
07
Figura 5.4 Ejemplo de ausencia de efecto por el tratamiento.
e t n e i d n e p e d e l b ia r a v a l e d la a c s E
01
02
03
04
X
05
06
07
21
Este diagrama se podría comparar con el del grupo de control o demás grupos para analizar lo que ocurre. Quizá se deba a que no se obtuvo una equivalencia real de los grupos al inicio del experimento. Se podrían elaborar tantos diagramas o gráficas como grupos, o bien podrían agruparse los efectos provocados en los distintos grupos en una sola gráfica (varios diagramas en esta), como se observa en la figura 5.5. Desde luego, si se mide más de una variable dependiente, en el primer caso se tendrá un diagrama para cada grupo por cada variable dependiente, mientras que en el segundo, un diagrama por cada variable dependiente. Figura 5.5 Ejemplo de gráficas de series cronológicas.
!
22
Capítulo 5 Diseños experimentales. Segunda parte
Ejemplo Si el tratamiento es un programa motivacional y las variables dependientes son la motivación intrínseca, la productividad y la calidad de la producción (con dos grupos experimentales y uno de control), se presentarían las opciones que se muestran en las figuras 5.6 y 5.7.
Figura 5.6 Ejemplo de varios diagramas para cada variable dependiente.
23
Figura 5.7 Ejemplo de un solo diagrama por variable dependiente.
En estos diseños de series cronológicas se controlan todas las fuentes de invalidación interna, siempre y cuando se lleve a cabo un seguimiento minucioso de los grupos , para asegurarse de que la única diferencia entre ellos sea la manipulación de la variable independiente. En algunos casos, la repetición de las mediciones influye sobre la variable dependiente (administración de pruebas múltiples), sobre todo en las pruebas donde el individuo participa activamente y sabe que está respondiendo a una medición (cuestionarios, entrevistas, tests estandarizados, aparatos o equipos, etc.), no tanto así en las medidas en las que el participante es más pasivo y no se encuentra consciente de qué se le mide (por ejemplo, la observación). De cualquier manera, en caso de que exista dicha influencia, se presentará de forma similar en todos los grupos (porque son equivalentes y el número de pruebas aplicadas es el mismo). Para estos diseños se suelen utilizar diversas técnicas estadísticas complejas , lo cual depende del nivel de medición de las variables y del tipo de análisis e interpretación que se desee realizar, como análisis de regresión múltiple o análisis de cambio y series de tiempo. Se recomiendan las siguientes fuentes para conocer tales análisis: sugerimos a Shmueli (2012), Cryer y Chan (2009); Hawkins (2008); Box, Jenkins y Reinsel (2008); Kollo y von Rosen (2005), y Kerlinger y Pedhazur (1997).
24
Capítulo 5 Diseños experimentales. Segunda parte
Diseños de series cronológicas con repetición del estímulo Con cierta frecuencia, el investigador anticipa que el tratamiento o estímulo experimental no tiene efecto o este es mínimo si se aplica una sola vez, tal como sería hacer ejercicio físico un solo día (no se esperaría un cambio en la musculatura) o consumir vitaminas por una vez. ambién, en otras situaciones el investigador quiere conocer el efecto sobre las variables dependientes en cada ocasión que se aplica el estímulo experimental. Por ejemplo, en técnicas de condicionamiento es común preguntarse cuántas veces se debe aplicar el reforzamiento a una conducta para condicionar la respuesta a un estímulo. En estos casos es posible repetir el tratamiento experimental y administrar una posprueba después de cada aplicación, para evaluar su efecto. Los participantes se asignan al azar a los distintos grupos y a cada uno se le administra varias veces el tratamiento experimental que le corresponde. Algunos de estos diseños diagramados se muestran en la tabla 5. 7. Tabla 5.7 Ejemplo de diseños cronológicos con repetición del estímulo.
El mismo tratamiento se aplica dos veces al grupo experimental: R G1 01 X1 02 X1 03 R G2 04 05 06 Cada tratamiento se aplica cuatro veces al grupo respectivo: R G1 01 X1 02 X1 03 X1 R G2 06 X2 07 X2 08 X2
04 09
X1 X2
005 010
R
G3
011
X3
012
X3
013
X3
014
X3
015
R
G4
016
017
018
019
020
En algunos casos se podría prescindir de las pruebas, y el experimentador, por alguna justificación teórica o empírica, podría aplicar pospruebas a intervalos sistemáticos diferentes. R G1 X1 01 X1 X1 X1 02 X1 X1 X1 03 R G2 X2 04 X2 X2 X2 05 X2 X2 X2 06 R G3 07 08 09 O bien, aplicar las pospruebas a intervalos irregulares (por alguna determinada razón): R G1 X1 X1 01 X1 02 X1 X1 X1 003 X1 004 R G2 X2 X2 05 X2 06 X2 X2 X2 007 X2 008 R
G3
09
010
011
012
Un ejemplo de estos diseños sería el caso de un publicista que pretende analizar los efectos de un comercial televisivo en la preferencia del producto anunciado, en comparación con otras marcas, y postula la hipótesis de que una sola exposición al comercial no surtirá efecto alguno. Asimismo, son herramientas comunes para probar la eficacia de medicamentos o tratamientos psicológicos. Las pruebas estadísticas usuales para validar estos diseños son las mismas que para las series cronológicas múltiples.
Diseños con tratamientos múltiples A veces, el investigador desea analizar el efecto de la aplicación de los distintos tratamientos experimentales a todos los grupos o participantes. En estos casos es posible utilizar los diseños con tratamientos múltiples. La aplicación de tratamientos puede ser individual o grupal y asumir distintas configuraciones:
25 a) Varios grupos. En este caso se trabaja con varios grupos a los cuales se asignan los sujetos o parti-
cipantes al azar. A cada grupo se le aplican todos los tratamientos, cuya secuencia puede o no ser la misma para todos los grupos y es posible administrar una o más pospruebas (posteriores a cada tratamiento experimental). Dos posibles diagramas de estos diseños son los de la tabla 5. Tabla 5.8 Diseños con tratamientos múltiples, varios grupos.
Misma secuencia para los grupos R G1 X1 01 X2 02 X3 03 R G2 X1 04 X2 05 X3 06
Secuencia diferente R G1 X1 01 X2 02 X3 03 R G2 X2 04 X3 05 X1 06
R G3
R G3 X3 07 X2
X1 07 X2 08 X3 09
08
X1
09
Consecuencia diferente. El experimentador debe tener cuidado cuando interpreta las segundas pospruebas y mediciones subsecuentes, ya que puede existir una influencia diferente en los grupos provocada por las distintas secuencias de los tratamientos. En realidad, durante el experimento es muy probable que haya diferencias entre grupos, e incluso que al finalizar el experimento los resultados se deban, en buena medida, a la secuencia con que fueron administrados los tratamientos. Los diseños experimentales con tratamientos múltiples y secuencia diferente en los grupos, así como los dos casos que vamos a ver a continuación, llegan a tener distintos efectos que deben analizarse con minuciosidad. Algunos tratamientos tienen efectos reversibles; en este caso no hay interferencia entre tratamientos, a la vez que las pospruebas son influidas solo por el tratamiento inmediato anterior (por ejemplo 03, del diseño con secuencia diferente, se vería afectada por X3, pero no por X2 o X1), lo cual facilita la interpretación. Sin embargo, a menudo los efectos no son reversibles, sino aditivos o interactivos; esto es, los resultados de una posprueba pueden ser influidos no sólo por el tratamiento inmediatamente anterior, sino por los que antecedieron a este, y no es fácil saber cuánto se debió a X1, cuánto a X2 o Xk. Para ello, en el análisis debe incluirse la secuencia como factor.
b) Un solo grupo. En situaciones en las que el experimento cuenta con un número reducido de par-
ticipantes, es posible realizar un diseño con tratamientos múltiples y un solo grupo. No hay asignación al azar puesto que se tiene a un único grupo. La equivalencia se obtiene puesto que no hay nada más similar a un grupo que este mismo. El grupo hace las veces de “grupos experimentales” y de “control”. Este diseño se diagrama así:
G único X1 01 X2 02 — 03 X3 04 — 05 Xk 0k… Cuando se considere conveniente, se utiliza como grupo de control, por ejemplo, antes de 03 y 05. Sin embargo, tal diseño está limitado a que los efectos de los tratamientos múltiples sean reversibles; de lo contrario no es un diseño experimental, sino cuasiexperimental. Si en estos diseños se introduce sistemáticamente y como variable independiente la secuencia de administración de los tratamientos, se convierten en factoriales (que se verá a continuación). Con el fin de comprobar si las secuencias se relacionan con características de los grupos, algunos autores consideran que es útil introducir sistemáticamente otros elementos a los diseños, tales como de ladel preprueba (por ejemplo, el diseño de cuatro grupos Solomon, que sepresencia-ausencia vio en el capítulo siete texto impreso), así como secuencias diferentes de de tratamientos en varios grupos. Por ejemplo, se podría tener un diseño así: Niños de 8º año,
G1 G2
X1 X2
01 03
X2 X1
02 04
26
Capítulo 5 Diseños experimentales. Segunda parte
G3 X1 X2 05 06 G4 X2 X1 07 08 G5 X1 X2 Niños de 4º año, 09 010 G6 X2 X1 011 012 O un número de pospruebas diferentes en los grupos. Por ejemplo, con un diseño como el siguiente, se tienen diseños factoriales: Niños de 6º año,
R
G1
X1
01
R
G2
X1
03
R
G3
X2
04
R
G4
X2
06
R
G5
07
R
G6
09
02
05
08
En realidad, estos autores tienen razón, porque se manipulan como si fueran una variable independiente. Sin embargo, la experiencia ha demostrado a algunos profesores que los alumnos que ven por primera vez el tema suelen desconcertarse si se analizan como diseños factoriales, a menos que estos se expliquen primero. Las pruebas estadísticas que se utilizan en estos diseños son las mismas que se emplean para las series cronológicas y los diseños con repetición del estímulo. Hasta aquí se han revisado diseños experimentales que manipulan una sola variable independiente (los tratamientos representan niveles de presencia o modalidades de manipulación de esta; X1, X2, X3, Xk son variaciones de la misma variable independiente); sin embargo, como ya se señaló en la obra impresa, normalmente se miden diversas variables dependientes para optimizar el costo e incrementar el conocimiento, lo cual permite analizar los efectos de la variable independiente sobre cada dependiente. Por ejemplo, en un experimento con métodos educativos, en lugar de medir nada más el aprendizaje, es posible medir también la motivación del alumno, su integración al grupo, etc., lo cual se debería realizar en la preprueba y la posprueba. O bien, cuando se experimenta con un medicamento (digamos para controlar la hipertensión), se incluyen diversas variables dependientes, como el nivel de presión arterial, glucosa, peso, etc. Cuando se introduce como estímulo una nueva tecnología en una línea de producción, se consideran distintas variables dependientes tales como productividad, tiempo de procesamiento, parámetros de calidad, etcétera. Asimismo, por lo regular se incluyen mediciones para verificar qué tanto funcionó la manipulación (verificaciones de la manipulación).
DISEÑOS FACTORIALES Los diseños factoriales manipulan dos o más variables independientes e incluyen dos o más niveles o modalidades de presencia en cada una de ellas para analizar su efecto sobre una o más variables dependientes. Este enfoque se utiliza muy a menudo en la investigación del comportamiento, las ciencias de la salud y las diferentes ramas de la ingeniería. La construcción básica de un diseño factorial consiste en que todos los niveles de cada variable independiente sean tomados en combinación con todos los niveles de las otras variables independientes (Patience, 2013, Te SAGE Glossary of the Social and Behavioral Sciences, 2009t y Cramer, 2003).
27
Diseño factorial 2 X 2 El diseño factorial más simple manipula (hace variar) dos variables, cada una con dos niveles. A este diseño se le conoce como “diseño factorial 2 × 2”, en donde el número de dígitos indica el número de variables independientes: 2
Un dígito (primera variable independiente)
×
2
Número de grupos resultantes o del experimento.
El valor numérico de cada dígito indica el número de niveles o modalidades de la variable independiente en cuestión. En este caso es 2, lo cual quiere decir que cada una de las variables tiene dos niveles. Como mencionan Wiersma y Jurs (2008), no es necesario que los valores numéricos sean los mismos para todas las variables independientes. En teoría, puede haber cualquier número de variables independientes con cualquier número de niveles cada una. Por ejemplo, el diseño factorial 2 × 2 × 3 indica que hay tres variables independientes, la primera y la segunda con dos niveles, mientras que la tercera tiene tres niveles. El diseño factorial 4 × 5 × 2 × 3 indica una variable independiente con cuatro niveles, otra con cinco, otra más con dos y una última con tres. Un ejemplo de un diseño factorial 2 × 2 sería que las variables independientes fueran “método de enseñanza” y “género”, y la variable dependiente el “aprovechamiento escolar”. La primera tiene dos variantes: “método de enseñanza presencial” y “método de enseñanza en línea”. La segunda, con las modalidades “masculina” y “femenina”. Otro ejemplo estaría constituido por las variables independientes “administración del medicamento” (con los niveles: suministro y placebo) y “condición de fumador” (fumador-no fumador), y la variable dependiente “control de la hipertensión arterial”. Un diseño factorial 2 × 3 × 4 (tres variables independientes) podría incluir: “tipo de medicamento” (medicamento A-medicamento B), “dosis diaria” (30mg, 50 mg y 90mg) y “edad” (menos de 30 años, 31-40 años, 41-50 años, más de 50 años). La variable dependiente podría ser “disminución de síntomas de la enfermedad” (Kamala y Wright, 2008). El ejemplo de Pérez, Arango y Agudelo (2009) que se presenta en varios capítulos del libro impreso constituyó un diseño factorial 2 × 2 × 2 × 2, es decir, cuatro variables independientes, cada una con dos niveles o modalidades: “experiencia del operario” (menos de cinco años/más de cinco años), “tipo de dobladora” (hidráulica electrónica/que conduce por aire), “clase de material utilizado” (acero laminado en frío o cold roll/acero galvanizado) y “grosor” (0.8 mm/ 1 mm). Las variables dependientes fueron dos: “longitud” y “ángulo de doblado de las piezas de metal producidas”. ambién podríamos considerar undiseño 3 × 4 que experimentara la “resistencia al fuego” (variable dependiente), así como tres tipos de materiales (variable independiente 1) y cuatro clases de grosor (variable independiente 2).
Otros diseños factoriales El número de grupos o condiciones que se forman en un diseño factorial es igual a todas las posibles combinaciones que surgen cuando se cruzan los niveles de una variable independiente con los niveles de las otras variables del mismo tipo. Así, en un diseño 2 × 2 tendremos cuatro grupos (2 por 2 = 4); en un diseño 3 × 2 resultarán seis grupos, y en un diseño 3 × 3 × 3, 27 grupos. Debe observarse que el resultado de la multiplicación es el número de grupos resultante. En estos diseños, el número de grupos aumenta con rapidez a la par con el incremento del número de variables independientes o niveles (exponencialmente). Veámoslo:
28
Capítulo 5 Diseños experimentales. Segunda parte
22 =4 23 =6 33 =9 3 4
=12
Número de grupos resultantes o del experimento
3 2 2 =12 3 3 4
=36
Ello se debe a que los niveles tienen que tomarse en cuenta respecto de todas sus posibles combinaciones. Cheng (2014) y Wiersma y Jurs (2008) señalan que en los diseños factoriales, al menos una de las variables independientes debe ser propiamente experimental; las demás pueden ser variables orgánicas o cuya variación no es provocada para fines del experimento, introducidas en el diseño con fines de control [por ejemplo, género, edad, año, escolaridad, inteligencia en intervalos, etcétera. En el estudio de Pérez et al. (2009), tal fue el caso de la experiencia del operario]. Figura 5.8 Un diseño factorial 2 X 2. Diseño 2 × 2 Variable independiente A B e t n ie d n e p e d n i le b ia r a V
A1
A2
B1
A1B1
A2B1
B2
A1B2
A2B2
Con objeto de simplificar la forma en que se diagraman los diseños factoriales, acudiremos a la simbología que comúnmente se utiliza.2 Para designar a las variables independientes se usan letras (A, B, C,… K) y para los niveles, números (1, 2, 3,… K); las combinaciones de letras y números que aparecen en las casillas (o celdas) representan las mezclas de niveles de las variables independientes. Cada celda es un grupo o condición. En la figura 5.8 se diagrama un diseño factorial 2 × 2. Otro ejemplo sería un diseño factorial 2 × 4 × 3 (figura 5.9).
5 Por ejemplo Wiersma y jurs (2008), Ramsey (2006) y Christensen (2006).
29
Figura 5.9 Diseño 2 X 4 X 3. A A1 C
C1
A2
C2
C3
C1
C2
C3
B1
A1B1C1
A1B1C2
A1B1C3
A2B1C1
A2B1C2
A2B1C3
B B 2
A1B2C1
A1B2C2
A1B2C3
A2B2C1
A2B2C2
A2B2C3
B3
A1B3C1
A1B3C2
A1B3C3
A2B3C1
A2B3C2
A2B3C3
B4
A1B4C1
A1B4C2
A1B4C3
A2B4C1
A2B4C2
A2B4C3
En la figura 5.9 se puede observar que todas las posibles combinaciones de los niveles entre A, B y C están presentes; además, ninguna es exactamente igual a la otra. Cada combinación representa una celda o un grupo. Si las tres variables se manipulan deliberadamente (recordemos que al menos una debe serlo para que hablemos de experimento), los participantes tienen que asignarse al azar a todas las celdas o grupos. Si dos variables se manipulan intencionalmente (por ejemplo, B y C), los sujetos de cada nivel de la variable restante (A) serán asignados aleatoriamente a las casillas que les correspondan. Veámoslo con un ejemplo. Si A = género (A1, masculino; A2, femenino), B = violencia televisada (B4, elevada; B3, mediana; B2, baja; y B1, nula) y C = orientación paternal sobre el programa visto (C1, por parte de ambos padres; C2, del padre; y C3, de la madre). Si hay 120 niños y 120 niñas, los niños ( A1) se asignarían al azar a las celdas donde A1 está presente (10 niños en cada celda), y las niñas (A2) a las 12 casillas restantes (donde A2 está presente, 10 niñas por celda). Si una sola variable es la que se manipula deliberadamente (por ejemplo, C), los participantes de los niveles combinados de las otras dos variables se asignan al azar a los niveles de aquella (C1, C2 y C3 en el ejemplo). Los sujetos A1 B1 serían asignados aleatoriamente a C1, C2 y C3, igual los sujetos A1 B2, A1 B3, etcétera. Cuando los diseños son factoriales es posible agregar un grupo de control o varios (que no se expongan a la variable o las variables manipuladas deliberadamente, figura 5.10). Figura 5.10 Diseño factorial con grupo de control. Diseño 2× 2
A1
A2
B1
A1B1
A2B1
B2
A1B2
A2B2
Control
Utilidad de los diseños factoriales Los diseños factoriales son sumamente útiles porque permiten al investigador evaluar los efectos de cada variable independiente sobre la dependiente por separado, así como los efectos de las variables independientes de manera conjunta. Por medio de estos diseños se observan los efectos de interacción entre las variables independientes. En términos de Wiersma y Jurs (2008), la interacción es un efecto producido sobre la variable dependiente, de tal manera que el efecto de una variable independiente no permanece constante en los niveles
30
Capítulo 5 Diseños experimentales. Segunda parte
de la otra u otras independientes. El efecto de interacción está presente si el efecto conjunto de las variables independientes no es igual a sus efectos por separado (aditivos). Ello significa que el efecto de una variable independiente por sí mismo no es igual que cuando se toma en combinación con los niveles de otra variable independiente. Por ejemplo, si el alto contenido de violencia televisada afecta sólo cuando hay orientación sobre el programa por parte de la madre, pero no cuando dicha orientación está a cargo del padre o de ambos. Así, hay dos tipos de efectos que es posible evaluar en los diseños factoriales: los efectos de cada variable independiente (llamados efectos principales) y los efectos de interacción entre dos o más variables independientes (si se consideran cuatro variables, por ejemplo, pueden interactuar dos entre sí y otras dos entre sí, o pueden interactuar tres o las cuatro variables independientes). Los diseños factoriales responden a estructuras entre variables que se esquematizan en la siguiente forma: Figura 5.11 Ejemplo de estructura de un diseño factorial.
Variables dependientes
Variables independientes X W •
Y
•
•
K Asimismo, se analizan el efecto de X sobre Y (X à Y), de W sobre Y (W à Y) y el de …K sobre Y (K àY); el efecto conjunto de X y W sobre Y es X Y
.
.
W
y el efecto conjunto deX y …K sobre Y X •
Y
•
K
Por su parte, el de W y …K sobre Y sería W •
•
K
Y
31
Finalmente, el efecto conjunto de todas las variables independientes sobre Y (tres variables) es el siguiente: X
W Y .
.
K
Ejemplo Supongamos una investigación cuya hipótesis se puede resumir así: "A mayor exposición por parte de jóvenes universitarios a videos musicales con alto contenido sexual, habrá una mayor predisposición para establecer contacto heterosexual”.
Posteriormente se diseña un experimento para someterla a prueba. La variable independiente es la exposición a contenidos sexuales (por medio de la televisión) y la dependiente es la predisposición para establecer contacto sexual (relaciones sexuales). Se decide agregar otra variable independiente: género. En consecuencia, se ha elaborado un diseño factorial con dos variables independientes. La exposición tendría tres niveles: a) contenido sexual elevado y manifiesto, b) contenido sexual moderado y c) contenido “romántico”. En consecuencia, cada video que se elabore tendrá tres versiones: la música es la misma, los modelos, la duración, la historia y el contexto también. La única diferencia es el tratamiento sexual de los contenidos verbales y no verbales. El género implicaría dos niveles: masculino y femenino. El esquema del diseño se indica en la figura 5.12.
Figura 5.12 Diseño factorial 2 x 3 (correspondiente al ejemplo). Exposición al contenido sexual Elevada
o r e n é G
Moderada
Mínima
Masculino
Femenino
Christensen (2006) desarrolla una excelente explicación de los efectos principales e interactivos en los diseños factoriales, la cual sirve de base para la exposición de dichos efectos que se presenta a continuación. Supongamos que, una vez que los grupos se han expuesto a los videos, se les aplica una posprueba que mide su predisposición para establecer contacto sexual y se obtiene el promedio de cada grupo (asimismo, pensemos que los resultados que lleguen a obtenerse en esta prueba oscilaran entre 0 y 30, donde un valor mayor indica una más alta predisposición). Analizamos varias configuraciones posibles de resultados (figura 5.13).
32
Capítulo 5 Diseños experimentales. Segunda parte
Figura 5.13 Diagramas del ejemplo de diseño factorial). Si hay diferencias signicavas entre los promedios de los marginales, hubo efecto de la variable “horizontal” (en el ejemplo, el género).
Marginal
Marginal Marginal
Marginal
Marginal
Si hay diferencias significativas entre los promedios de los marginales, hubo efecto de la variable “vertical” (en el ejemplo, exposición al contenido sexual). Interpretación de efectos Promedios de marginales
25
15
7
15.7
25
15
7
15.7
25
15
7
No efecto
Efecto B
A
Masculino
Femenino
Elevada
Moderada
Mínima
25
15
7
25
15
7
Masculino
Femenino
Moderada
Mínima
18
18
18
8
8
8
La variable exposición no tiene efecto; la variable género tiene efecto. No hay efecto de interacción.
La variable exposición tiene efecto; la variable género no tiene efecto. No hay efecto de interacción. C
Elevada
D
Masculino
Femenino
Elevada
Moderada
Mínima
26
18
10
10
18
25.9
Ninguna de las variables tiene efecto por sí misma, pero hay un efecto de interacción.
Masculino
Femenino
Elevada
Moderada
Mínima
23
18
13
18
13
8
Las variables tienen efecto, pero no hay efecto de interacción.
33
Figura 5.13 Diagramas del ejemplo de diseño factorial) (continuación). E
B
Masculino
Femenino
Elevada
Moderada
Mínima
29
23
12
20
12
12
Las dos variables tienen efecto yhay efecto de interacción.
Masculino
Femenino
Elevada
Moderada
Mínima
18
18
18
8
8
8
No hay ningún tipo de efecto.
Interpretación y posibles configuraciones En la configuración A, no hay diferencias por género (cada casilla en cada nivel de género es igual a la del otro nivel). En cambio, sí las hay entre los niveles de exposición en ambos géneros. Los efectos principales (es decir, los de cada variable por separado) se observan comparando los promedios de los marginales de los niveles de cada variable (vea la interpretación de efectos de la figura 5.13, primera parte). En la configuración B, no hay diferencias por exposición, pero sí por género (el marginal masculino es mayor). En la configuración C, las diferencias entre las celdas se explican porque las dos variables interactúan (cuando el género es masculino y la exposición elevada, y cuando el género es femenino y la exposición mínima, se obtiene un valor alto; cuando el género es masculino y la exposición mínima, y cuando el género es femenino y la exposición elevada, se obtiene otro valor bajo; finalmente, cuando ambos géneros se exponen moderadamente se obtiene un valor distinto de las demás celdas). El máximo efecto se encuenNo se registran efectos principales. tra en “masculino” y “elevada” y “femenino” y “mínima” (26 y 25.9). En la configuración D, hay cambios verticales y horizontales provocados por efectos principales, pero no efecto de interacción (ambas variables tienen efecto por sí mismas, únicamente). En la configuración E, hay efectos principales (cada variable por sí misma afecta significativamente) y también efecto de interacción (este se alcanza si la diferencia entre las medias de los niveles de variación de una variable independiente cambian en función de los niveles de variación de la otra variable independiente, como también ocurrió en la configuración C). En la configuración F, las diferencias entre todas las celdas es prácticamente nula: no hay ninguna clase de efecto.
Métodos estadísticos de los diseños factoriales Los métodos estadísticos más usuales que se aplican a estos diseños son el análisis de varianza factorial (ANOVA) y el análisis de covarianza(ANCOVA), con la variable dependiente medida en intervalos, y la Chi cuadrada para múltiples grupos, con esa variable medida nominalmente. Por último, a estos diseños se les pueden agregar más variables dependientes (tener dos o más) y se convierten en diseños multivariados experimentales que utilizan como método estadístico el análisis multivariado de varianza (MANOVA).
34
Capítulo 5 Diseños experimentales. Segunda parte
¿QUÉ OTROS EXPERIMENTOS EXISTEN? CUASIEXPERIMENTOS Ya se comentó en el capítulo 7 del libro que los diseños cuasiexperimentales también manipulan deliberadamente una o más variables independientes para observar su efecto y relación con una o varias dependientes, sólo que trabajan con “grupos intactos”, formados por motivos ajenos al experimento: cuando se opta por los diseños cuasiexperimentales los participantes no se asignan al azar a los grupos ni se emparejan, sino que dichos grupos se integran antes del experimento (Tyer, 2012 y Stone-Romero, 2006).En nuestro ejemplo, los grupos del experimento son cuatro de diferentes áreas de una empresa que estaban conformados con anterioridad al experimento (las razones por las que cada participante se integró a cada área no se relacionan con la realización del experimento). Veámoslo gráficamente: Grupo A
(50 empleados del departamento de producción)
Ø
Grupo experimental con X1
Grupo B
(26 empleados de la gerencia de recursos humanos)
Ø
Grupo experimental con X2
Grupo C
(37 empleados de la gerencia de administración y finanzas)
Ø
Grupo experimental con X3
Grupo D
(29 empleados del departamento de aseguramiento de la calidad)
Ø
Grupo de control
De igual manera, pueden ser pacientes de dos hospitales, uno el grupo experimental y el otro el de control; o bien, tres líneas de producción integradas por distintos colaboradores.
Problema de los diseños cuasiexperimentales Estos diseños se utilizan cuando no es posible asignar en forma aleatoria los participantes a los grupos que recibirán los tratamientos experimentales. La falta de aleatorización introduce posibles problemas de validez interna y externa . Como comenta Weiss (1990, p. 89): […] estos diseños deben luchar con la selección como fuente posible de interpretación equivocada, lo mismo que con la interacción de la selección y otros factores; así como, posiblemente, con los efectos de la regresión. Asimismo, diversos elementos pudieron operar en la formación de los grupos (que no están bajo el control del investigador), los cuales impiden afirmar que sean representativos de poblaciones más amplias (Holmes, 2013). De este modo, dado que su validez es menor que la de los experimentos “puros”, reciben el nombre de cuasiexperimentos. A causa de los problemas potenciales de validez interna, cuando opta por un diseño el investigador debe intentar establecer la semejanza entre los grupos, lo cual requiere considerar las características o variables que estén relacionadas con las variables estudiadas (Babbie, 2014 y Wiersma y Jurs, 2008). Por ejemplo, si grupos intactos de trabajadores se involucran en un experimento sobre motivación o la introducción de ciertas normas de calidad, el turno probablemente tenga que ser introducido como una constante (grupos intactos, que sean todos del mismo turno) o como otra variable independiente (de control). Además, el investigador debe recabar evidencia de que los grupos son equiparables en salario, productividad, competencia, antigüedad en la organización y, en general, en todo lo que genere diferencias significativas entre ellos. Cuanta mayor información se obtenga sobre los grupos, mayores bases se tendrán para establecer su semejanza. En algunos casos se debe observar si la proporción de mujeres y hombres en los grupos es semejante, si la edad promedio es similar, si los grupos no fueron constituidos con base en un criterio que pudiera afectar (por ejemplo, formación de los salones por inteligencia) y si a los grupos en el pasado no les ha ocurrido algo que llegara a influir en los resultados. Además, como mencionan Campbell y Stanley (1966, p. 70):
35
…precisamente porque hay falta de control experimental total, es imprescindible que el investigador conozca a fondo cuáles son las variables particulares que su diseño específico no controla. Así, estará más pendiente de su posible influencia y tendrá mejores elementos para evaluarla. La ausencia de asignación al azar obliga al investigador a poner especial atención cuando interpreta los resultados para no caer en conclusiones erróneas. Las limitaciones deben identificarse con claridad, la equivalencia de los grupos debe discutirse y la posibilidad de generalizar los resultados, así como la representatividad, deben argumentarse sobre una base lógica (Tyer, 2012, Wiersma y Jurs, 2008 y Reichardt, 2004). Los cuasiexperimentos difieren de los Cuasiexperimento Experimento en el que los sujetos no se asignan al azar a los grupos ni se emparejan, porque tales grupos ya existían. La variable exposición no tiene efecto; la variable género tiene efecto. No hay efecto de interacción.
experimentos “puros” en la equivalencia inicial de los grupos (los primeros trabajan con grupos intactos y los segundos utilizan un método para hacer equivalentes a los grupos). Sin embargo, esto no quiere decir que sea imposible realizar un cuasiexperimento en el cual las variables relevantes para el estudio sean equiparables. Si así fuera, los cuasiexperimentos ya se hubieran desechado como diseños de investigación. Más bien quiere decir que, en algunos casos, los grupos pueden diferir significativamente o no ser equiparables; de este modo, el investigador debe analizar si los grupos son o no comparables desde el inicio. En caso negativo, el investigador no debe realizar la investigación con fines explicativos, esto es, limitarla a propósitos descriptivos y/o correlacionales. Una recomendación útil para consolidar la validez interna de esta clase de diseños experimentales es asignar al azar los tratamientos o estímulos.
Tipos de diseños cuasiexperimentales Con excepción de la diferencia que acabamos de mencionar, los cuasiexperimentos son muy parecidos a los experimentos “puros”. Por lo tanto, podemos decir que hay tantos diseños cuasiexperimentales como experimentales “puros”, sólo que no se recurre a la asignación al azar ni al emparejamiento. Por lo demás son iguales, pues la interpretación es similar, las comparaciones y los análisis estadísticos son los mismos (salvo que a veces se consideran las pruebas para datos no correlacionados y relaciones no lineales). Es por ello que nos limitaremos a ver sólo algunos de los diseños cuasiexperimentales (el resto puede ser deducido de sus correspondientes diseños experimentales “puros”, con solo quitarles la “R” de asignación al azar) y se comentarán brevemente porque se insiste en que las comparaciones, interpretaciones y los análisis son prácticamente equiparables.6 Consideramos que no sería adecuado volver a explicar dichas comparaciones, interpretaciones y análisis. 1. Diseño con posprueba únicamente y grupos intactos. Este primer diseño utiliza dos grupos, pero solo
uno recibe el tratamiento experimental. Los grupos son comparados en la posprueba para analizar si el tratamiento experimental tuvo un efecto sobre la variable dependiente (01 con 02). El diseño puede diagramarse del siguiente modo, en el cual, tal como se ve, no hay asignación al azar ni emparejamiento: G1 X 01 G2 — 02 Observe si los grupos equiparables entre sí,olas diferencias entre ambos gruposque se deben atribuirno a lason variable independiente a otras razones, perolaslopospruebas peor es quede el investigador quizá no se dé cuenta de ello. Por ejemplo, supongamos que se lleva a cabo un cuasiexperimento para analizar el efecto de la realimentación que los médicos dan a sus pacientes (respecto 6 Si al lector le surge alguna duda respecto de qué comparaciones, interpretaciones y análisis pueden llevarse a cabo en un diseño cuasiexperimental, le recomendamos que revise el diseño experimental “puro” correspondiente. Vale recordar que la diferencia es que en el cuasiexperimental no hay aleatorización y los grupos pueden estar no correlacionados.
36
Capítulo 5 Diseños experimentales. Segunda parte
de su conducta en el tratamiento prescrito) sobre la obediencia o apego al tratamiento. En este caso se podría partir de la siguiente hipótesis: “Los pacientes que reciban mayor realimentación de parte de sus médicos, acerca de cómo se comportan en el tratamiento prescrito, se apegarán más a este”. Es decir, los médicos que informen más a sus pacientes sobre su observancia del tratamiento prescrito propiciarán en estos un mayor deseo de continuar con la terapia. La cuestión es motivar al paciente. Entonces, el investigador toma dos grupos de pacientes. Uno de ellos recibe realimentación sobre su conducta en el tratamiento prescrito y el otro, no. Posteriormente se evalúa en qué medida se apega cada grupo, en lo sucesivo, al tratamiento. Supongamos que obtenemos el siguiente resultado: 0 1 > 02 (el grupo experimental se apega más); entonces, deducimos que la hipótesis fue confirmada. Pero, para estar seguros de ello, debemos analizar con mucho cuidado que sea posible comparar a los grupos. Imaginemos que el grupo experimental estaba formado por pacientes que asisten a un hospital donde con frecuencia se imparten pláticas motivadoras para que los enfermos sigan los tratamientos prescritos, mientras que el grupo de control estaba integrado por personas que asisten a un hospital donde no se le asigna importancia a ello. ¿A qué razón se le podrían atribuir con certeza los resultados? ¿A la manipulación de la variable independiente, a que los grupos de pacientes provienen de diferentes hospitales, a ambos factores, a la sensibilización previa o a algún otro? Como los grupos no son razonablemente equiparables, no tendríamos la certeza de cuál fue la causa o qué tanto contribuyeron los diversos factores involucrados. En casos como este podemos decir que existe un problema de validez interna. ambién podría ser que el grupo experimental estuviera compuesto por pacientes que, desde antes del experimento, tuvieran una motivación elevada para apegarse a tratamientos médicos; o tal vez hayan operado otras causas que provocaran diferencias iniciales entre los grupos. Por ello, es importante que los grupos sean inicialmente comparables y que durante el experimento no ocurra algo que los haga diferentes, con excepción de la presencia-ausencia del tratamiento experimental (por ejemplo, misma enfermedad y tratamiento, hospital, médico que los atiende, instrucciones y lugar, equivalencia como grupos en género, edad, avance de la enfermedad, etc.; nada más imaginemos que el grupo experimental, en los promedio, está “más enfermo” quealeltratamiento). de control, yEllos pacientes lo saben; también llega a suceder que más enfermos se apeguen más criterio de los experimentos “puros” de mantener la igualdad de los grupos (salvo la manipulación de la variable independiente) se aplica por igual a los cuasiexperimentos. Puede extenderse el diseño para incluir más de dos grupos. Se tienen así diferentes tratamientos experimentales o niveles de manipulación. Su formato general sería:
G1
X1
01
G2
X2
02
G3
X3
03
Gk
Xk
0k
Gk=1
0k=1
37
El último grupo es de control. Un ejemplo de este diseño serían cuatro grupos escolares de un mismo semestre y carrera (licenciatura) en una universidad, como grupos del cuasiexperimento. Veámoslo esquemáticamente en la tabla 5.9. Figura 5.9 Diagrama de un ejemplo del diseño cuasiexperimental con posprueba únicamente. Universidad del Centro Escuela de Psicología Tercer semestre Grupo
X1
01
Grupo
X2
02
X3
Grupo Grupo
—
03 0
4
Recuerde que los grupos son intactos (no se generan) y ya se habían constituido por motivos diferentes al cuasiexperimento (en este caso, la elección de estudiar una carrera y la asignación de alumnos a los grupos por parte de la escuela de psicología). Los tratamientos experimentales podrían ser métodos educativos. Otro ejemplo sería tener tres plantas de manufactura y dos sistemas de calidad o normas ISO experimentales (la tercera planta constituiría el grupo testigo). Peña, Hancock y Merola (2009) efectuaron un cuasiexperimento que demostró que los individuos que utilizan avatares de color negro desarrollan intenciones más agresivas y menor cohesión grupal que quienes usan avatares de color blanco.7 El estudio apoya el efecto de proteus, el cual indica que en un ambiente virtual el tipo de vestimenta y caracterización del avatar puede tener efectos en la activación de pensamientos negativos (como la agresión) y la inhibición de pensamientos prosociales (por ejemplo, cohesión y afiliación). Incluso estos efectos podrían tener implicaciones para quienes en la vida real desempeñan papeles mediatizados por un ambiente virtual, como los pilotos de aviones de guerra. 2. Diseño con prueba-posprueba y grupos intactos (uno de ellos de control). Este diseño es similar al que incluye posprueba únicamente y grupos intactos, sólo que en este caso a los grupos se les administra una preprueba, la cual puede servir para verificar la equivalencia inicial entre ellos (si son equiparables no debe haber diferencias significativas entre las prepruebas de los grupos). Su esquema más sencillo sería el siguiente: G1 01 X 02 03 — 04 G2 Este enfoque puede extenderse a más de dos grupos (niveles o modalidades de manipulación de la variable independiente), lo cual se esquematizaría así: G
1
01
X1
02
G
2
03
X2
04
G
3
05
X3
06
• •
• •
• •
• •
Gk
02k–1
Xk
02k
Gk+1
02k+1
—
02(k+1)
7 Recordemos una vez más que en este contexto un avatar es un personaje o representación de un usuario para participar en un juego o tarea.
38
Capítulo 5 Diseños experimentales. Segunda parte
Las posibles comparaciones entre las mediciones de la variable dependiente y las interpretaciones son las mismas que en el diseño experimental de preprueba-posprueba con grupo de control, solo que, en este segundo diseño cuasiexperimental, los grupos son intactos y en la interpretación de resultados debemos tomarlo en cuenta. Recuerde todo lo que se ha dicho de la probable no equivalencia de los grupos. Este aspecto se aplica a todos los diseños cuasiexperimentales. 3. Diseños cuasiexperimentales de series cronológicas
En ocasiones el investigador pretende analizar efectos a mediano y largo plazos o los efectos de la
administración del tratamiento experimental varias veces, pero no cuenta con la posibilidad de asignar de manera aleatoria los casos, sujetos o participantes a los grupos del experimento. En estas condiciones, pueden utilizarse los diseños cuasiexperimentales, salvo que los grupos son intactos. En ambas situaciones se aplican mediciones repetidas de la variable dependiente y se inserta el tratamiento experimental entre dos de esas mediciones en, al menos, un grupo, mientras que al otro grupo no se le aplica ningún tratamiento en el periodo de “experimentación”. Sin embargo, desde la perspectiva de la literatura clásica sobre experimentos (vea Campbell y Stanley, 1966) se reconoce como cuasiexperimento a un diseño que no tiene grupo de control, tema que trataremos a continuación. Domina (2009) implementó un diseño de esta naturaleza para evaluar la eficacia de los programas de asesoría, vinculación y orientación a alumnos que transitan de la educación media a la educación superior. El grupo experimental estuvo constituido por alumnos de escuelas que participaron en algún programa de este tipo y el grupo de control por estudiantes de instituciones que no contaban con un esfuerzo similar. El efecto se midió durante su desempeño en la universidad. Obviamente, no había posibilidad de asignación aleatoria. Al final, se eligieron casos similares en cada condición, una especie de “emparejamiento”.
Series cronológicas de un solo grupo G
01
02
03
X
04
05
06
A un único grupo se le administran varias prepruebas, después se le aplica el tratamiento experimental y finalmente varias pospruebas. El diseño se diagrama así: El número de mediciones está sujeto a las necesidades específicas de la investigación que realizamos. Idealmente, puede convertirse enuna serie cronológica con varios grupos(tema que se revisa más adelante).
Un ejemplo muy difundido de este diseño lo constituyó la evaluación de un programa que tenía por objeto disminuir la velocidad en carreteras del estado de Connecticut, Estados Unidos (Campbell, 1975). Los investigadores recolectaron informes y datos de accidentes de tránsito correspondientes a varios años anteriores y ulteriores a la implantación del programa. Descubrieron que después del programa el número de accidentes disminuyó. Sin embargo, como las distintas mediciones habían mostrado una pauta ascendente y descendente inestable durante varios años, no se podía tener la certeza de que el programa hubiese sido la razón del descenso del número de accidentes (Weiss, 1990). En consecuencia, fue necesario comparar las estadísticas de Connecticut con las de otros cuatro estados vecinos en los que no se habían efectuado los cambios en los reglamentos de tránsito propuestos por el programa del mencionado estado. Dichas entidades actuaron como grupos de control. Finalmente, se observó que en los otros estados no se había registrado una disminución equivalente del número de accidentes. Las comparaciones dieron pie para concluir que el programa había generados los efectos deseados (Campbell, 1975 y Glass, 1968).
39
Figura 5.14 Ejemplo de un cuasiexperimento en su primera etapa. G
X Accidentes 1951
Estado de Connecticut
Accidentes 1952
Accidentes
Accidentes
Accidentes
Accidentes
1953
1954
1955
1956
Accidentes 1957
Programa para disminuir accidentes
En su primera etapa, esta investigación cuasiexperimental utilizó las series cronológicas de un solo grupo (figura 5.14). Otro ejemplo de este diseño sería medir las ventas de un producto durante varios meses, introducir una campaña publicitaria para ese producto y, después, medir durante meses el nivel de ventas. Además, de nuevo, en una situación ideal, los grupos testigos podrían ser otros productos de la competencia sin campañas similares. Estos diseños suelen utilizarse cuando se introducen innovaciones tecnológicas en empresas, probar resistencia y durabilidad de procesos de construcción, etc. ambién podrían emplearse para evaluar el efecto de reformas hacendarias, políticas públicas, medidas epidemiológicas (como una campaña de vacunación) o programas sociales. Las series cronológicas de un solo grupo llegan a producir diversos patrones de resultados. A Figura 5.15 Ejemplos de resultados en series cronológicas de un solo grupo.
Accidentes 1958
40
Capítulo 5 Diseños experimentales. Segunda parte
manera de ejemplo podríamos tener los patrones que se muestran en la figura 5.15 (algunos de los cuales fueron expuestos en las series cronológicas experimentales). En las series cronológicas de un único grupo debe tomarse muy en cuenta que no se tiene punto de comparación (grupo de control); por lo tanto, la interpretación del patrón de la variable dependiente (o patrones de las variables dependientes) tiene que ser muy cuidadosa, y debe analizarse si no han actuado o interactuado otras posibles causas, además del tratamiento experimental o variable independiente. La historia y el hecho de que el grupo sea atípico son riesgos que se afrontan cuando se emplea este diseño, al igual que la instrumentación. Normalmente, este diseño cuasiexperimental se utiliza con propósitos correlacionales y no explicativos.
Series cronológicas cuasiexperimentales con múltiples grupos
Estos diseños pueden adoptar la estructura de las series cronológicas experimentales, con la diferencia de que en estas últimas la asignación de los individuos a los grupos es aleatoria, mientras que en las cuasiexTabla 5.10 Ejemplos de diseños cuasiexperimentales con series cronológicas. Sin prepruebas y grupo de control
G1
O1
O2
O3
X
O4
O5
O6
G2
O7
O8
O9
—
O10
O11
O12
perimentales tenemos grupos intactos. Por lo tanto, ocurrirían las mismas variaciones8 que se muestran en la tabla 5. 10.
G 1
G 2
O
O
O11
O
1
X 2
12
1
—
O O
3
13
O
X
O
—
4
14
1
O O
5
15
O O
6
16
O O
X 7
17
1
—
O
O
O
O
O
O
8
18
9
19
10
20
5 Recomendamos al lector que revise los apartados relativos a las series cronológicas experimentales antes de leer este apartado. En ellos podrá notar que los diseños son los mismos, salvo que en los esquemas y diagramas de las series experimentales aparece el símbolo “R” de asignación al azar. Por lo tanto, aquí se omiten explicaciones, interpretaciones y ejemplos; de lo contrario, pecaríamos de redundantes. Solo nos limitaremos a esquematizar los diseños, sin explicaciones, porque lo que puede decirse es lo mismo que lo que dijimos en las series cronológicas experimentales. Desde luego, debe resaltarse que en las series cuasiexperimentales los grupos son intactos y es necesario asegurar que los grupos sean equiparables.
22456
G3
X3
O7
O8
O9
G4
—
O10
O11
O12
41
Con prepruebas y grupo de control G 1
G 2
G 3
0 0 0
X 1
1
X 7 13
2
—
0 0 0
X 2
1
X 8
2
14
—
0 0 0
X 3
0
1
X 9 15
0
2
—
0
X 4
0
1
X 10 16
0
2
—
0
5 11 17
0 0 0
6 12 18
Series cronológicas cuasiexperimentales con repetición de estímulo Estas series también son similares a sus correspondientes experimentales, pero con grupos intactos. Así, tendríamos los siguientes diagramas para ilustrarlas:
Series cronológicas cuasiexperimentales con tratamientos múltiples Al igual que en los casos anteriores, estas series son similares a sus correspondientes experimentales, sólo que con grupos intactos. Por lo tanto, tendríamos diagramas como estos: G1
X1
G2
X2
G3
X3
G4
X2
G5
X1
G6
X3
01 08 015 022 029 036
02 09 016 023 030 037
X2 X1 X2 X3 X3
X1
03 010 017 024 031 038
04 011 018 025 032 039
X3 X3 X1 X1 X2 X2
05 012 019 026 033 040
06 013 020 027 034 041
07 014 021 028 035 042
TIPOS DE VARIABLES EN EXPERIMENTOS Y CUASIEXPERIMENTOS Como complemento de lo que se menciona en el libro sobre variables y experimentos, solo queremos ahondar un poco sobre los tipos de variables en los diseños experimentales y cuasiexperimentales. Los principales tipos de variables son: 1. Independiente: tratamiento experimental que provoca efectos (causa). Resulta la variable manipula-
da.
2. Dependiente: efecto o consecuencia (provocado/a por el tratamiento o variable independiente). Es
la variable medida. 3. Interviniente: moderador de la relación causal entre la variable independiente y dependiente. Si no
se conoce su efecto o no se controla, el experimento puede invalidarse. 4. Explicaciones rivales o fuentes de invalidación interna (pueden ser variables independientes o inter-
vinientes): su influencia debe conocerse o controlarse pues, de no ser así, el experimento puede invalidarse. Asimismo, es factible que se combine con otras variables para afectar a la dependiente. 5. Variable de control: influye en la dependiente, pero es neutralizada por el diseño o por los procedimientos estadísticos. La diferencia entre la variable de control e interviniente reside en que en la primera se neutralizan Figura 5.16 Diferencia entre variables interviniente y de control. Variable de control: tipo de escuela (pública-privada)
Variable independiente: método educativo (tradicional-moderno): dos grupos experimentales
Variable dependiente: aprendizaje de estadística
Variable interviniente: horas de estudio
42
Capítulo 5 Diseños experimentales. Segunda parte
sus efectos, y en la segunda estos se conocen (Creswell, 2013a y Clark y Shadish, 2007). Un ejemplo sería el que se muestra en la figura 5.16. La variable independiente se manipula (a un grupo se le expone a un método, al otro a un método distinto). El tipo de escuela se controla asignando a los dos grupos (en la misma proporción) alumnos de escuelas públicas y privadas por igual (la composición de cada uno sería: 50% de estudiantes de instituciones públicas y 50% de escuelas privadas). Los efectos de la variable interviniente se conocen cuando se mide el número de horas dedicadas al estudio (con su introducción al análisis). La variable dependiente se mide. Los análisis estadísticos ayudan a esclarecer las relaciones entre todas las variables. Otros ejemplos podrían ser: • • • • • • • •
Variable independiente: tipo de maquinaria (A y B). Variable dependiente: productividad (número de piezas producidas en un cierto periodo). Variable de control: capacitación del equipo de trabajo (número de horas y cursos). Variable interviniente: experiencia del equipo de trabajo (años). Variable independiente: tipo de tratamiento médico (A y B). Variable dependiente: presión arterial. Variable de control: género. Variable interviniente: nivel de ejercitación (horas y tipo). Nota final: Los pasos de un diseño cuasiexperimental son los mismos que los de uno experimental.
DISEÑOS NO EXPERIMENTALES CAUSALES En el capítulo 7 de Metodología de la investigación se señaló que, en ocasiones, en los diseños no experimentales causales se reconstruyen las relaciones a partir de la(s) variable(s) dependiente(s), en otras a partir de la(s) independiente(s) y en otras más sobre la base de variabilidad amplia de las independientes y dependientes (Maggetti, Gilardi y Radaelli, 2013 yLeón y Montero, 2003). Al primer caso se leconoce como retrospectivo, al segundo como prospectivo y al tercero como causalidad múltiple. Veámoslos más a detalle. Supongamos que mi interés es analizar las causas por las cuales algunos clientes, y otros no, han utilizado el crédito que les fue otorgado por una cadena de tiendas departamentales. En este caso, la variable dependiente tiene dos niveles: a) clientes que sí han utilizado su crédito y b) clientes que no lo han hecho. Empleamos la base de datos de los clientes y los agrupamos en el nivel que les corresponde. Luego, les Figura 5.17 Ejemplo de una reconstrucción causal retrospectiva.
43
preguntamos a quienes sí han empleado el crédito los motivos que tuvieron para ello; del mismo modo, a quienes no lo han hecho, les preguntamos las razones por las que no lo han utilizado. Así determinamos las causas que nos importan. El estudio podría diagramarse tal como se muestra en la figura 5.17. El estudio causal se desarrolla en un momento particular y único. Veamos ahora una investigación causal prospectiva: imaginemos que deseamos indagar si la variable antigüedad provoca o no mayor lealtad a la empresa y por qué. Como primer paso, dividimos a los empleados con relación a la variable independiente: a) muy alta antigüedad (25 o más años en la organiFigura 5.18 Ejemplo de una reconstrucción causal prospectiva.
zación), b) alta antigüedad (16 a 24 años), c) mediana antigüedad (9 a 15 años), d) baja antigüedad (cuatro a ocho años), e) muy baja antigüedad (uno a tres años) y f ) ingreso reciente (un año o menos). Posteriormente, medimos los niveles de lealtad y cuestionamos a los empleados sobre cómo la antigüedad ha generado o no mayor lealtad. De esta forma determinamos los efectos de interés (figura 5.18.) En los diseños donde se reconstruyen las relaciones sobre la base de variabilidad amplia de las independientes y dependientes no se parte de una variable en especial ni de grupos, sino que se evalúa la estructura completa (las relaciones en su conjunto. la figura 5.19). odos loscausal estudios transeccionales causales nos brindan Vea la oportunidad de predecir el comportamiento de una o más variables a partir de otras, una vez que se establece la causalidad. A estas últimas Figura 5.19 Modelo mediatizador del clima organizacional.
44
Capítulo 5 Diseños experimentales. Segunda parte
se les denomina variables predictoras. ales diseños requieren de análisis multivariados, que se mencionan en el capítulo 8 de este centro de recursos: Análisis estadístico: segunda parte. En la figura 5.19 simplemente incluimos un ejemplo de una estructura causal compleja. Lo importante es que se comprenda cómo en ocasiones se analizan múltiples variables y secuencias causales. En el caso del modelo de la figura 5.19, las percepciones sobre las variables o dimensiones del clima organizacional (trabajo, papel que se desempeña, líder o superior, grupo de trabajo y elementos de la organización) influyen en la motivación y el desempeño, pero con la mediación de las actitudes hacia el trabajo (satisfacción en el trabajo, involucramiento en el trabajo y el compromiso con la empresa o institución). Es decir, hay dos niveles de variables intervinientes: las del clima y las actitudes hacia el trabajo. El modelo se fundamenta en Parkeret al. (2003) y Hernández-Sampieri (2005). Las percepciones psicológicas del clima son las variables predictoras iniciales.
45
capítulo
6
Encuestas (surveys)
DEFINICIÓN DE ENCUESTA O SURVEY La investigación por encuestas es una de las opciones más socorridas en las diferentes ciencias sociales, ambientales y de la salud, aunque también la utilizan otras disciplinas más exactas, debido a su flexibilidad y a que puede responder a una amplia gama de preguntas de estudio, desde el “qué” y “quién”, hasta el “cómo” y “por qué”. Las encuestas recolectan sistemáticamente datos de numerosos individuos para entender a la población o universo al que representan (McLaren, 2014, Nardi, 2013, Julien, 2008 y McMurtry, 2005). Creswell (20013a) considera la encuesta como un diseño que provee un plan para efectuar una descripción numérica de tendencias, actitudes u opiniones de una población mediante el estudio de una muestra de ella. Por su parte, Fink (2008) las define como métodos de recolección de información que se usan para describir, comparar o explicar conocimientos, sentimientos, valores, preferencias y conductas. decir, en la literatura sobredatos metodología de laseleccionado investigación, la encuesta consideramás como una técnicaalgunos cuantitativaEspara recabar, mediante clásica preguntas, de un grupo de personas; sinseembargo, recientemente autores consideran que también a través de ella pueden recolectarse datos cualitativos o mixtos (por ejemplo, cuantificados) (Te SAGE Glossary of the Social and Behavioral Sciences, 2009v y Julien, 2008). En realidad, las encuestas son diseños no experimentales que la mayoría de las veces resultan transversales, aunque si se repiten periódicamente desarrollan un formato longitudinal, e implican preguntar a los individuos sobre cuestiones específicas y obtener sus respuestas (Henry, 2004). Su alcance puede ser descriptivo o correlacional-causal: 1. Descriptivo. Se pretende caracterizar a una población o contexto geográfico en función de las variables seleccionadas
(Bowers, 2008). Además, las encuestas descriptivas pueden ser útiles para: • • • • •
Elaborar un perfil más o menos exacto del fenómeno, variables o planteamiento de interés. Mostrar las facetas o dimensiones de un fenómeno, sistema, proceso o mecanismo. Crear tipologías o categorías. Clarificar secuencias o conjuntos de etapas. Documentar información que confirme o contradiga datos previos sobre un fenómeno o planteamiento.
2. Correlacional-causal. Cuando se busca caracterizar relaciones entre variables en una población o contexto geográfico.
ambién para: • • • • •
Encontrar información nuevas explicaciones. Determinar la validez deque un estimule principio. Vincular diferentes asuntos, tópicos o cuestiones en un ámbito o una proposición. Confirmar o construir teoría e hipótesis generadas por medio de otros diseños. Extender teoría e hipótesis a nuevas áreas de conocimiento o campos.
2
Capítulo 6 Definición de encuesta o
survey.
Incluso, cuando realiza una encuesta el investigador podría tener en mente ambos alcances. Como ya se mencionó, las encuestas pueden ser utilizadas para recabar datos sobre diversas cuestiones, como preferencias, actitudes, opiniones, creencias, motivaciones, conocimientos, emociones, condiciones de vida, etc. (Coughlan, Cronin y Ryan, 2009 y Henry, 2004), pero también se han utilizado para analizar a los animales (Ballou, 2008). Por ejemplo, censos del estado de una población animal para tomar medidas de preservación (búfalos, ballenas, tigres, osos polares, etcétera.). Por lo general, su método de recolección de los datos lo constituye el cuestionario o guía de entrevista (Garson, 2012, Te SAGE Glossary of the Social and Behavioral Sciences, 2009u y Henry, 2004), aunque pueden utilizarse otras técnicas como la observación sistemática (Julien, 2008). Recordemos que el cuestionario consiste en un conjunto de preguntas respecto de una o más variables que se desean medir y puede aplicarse de diferentes formas: autoadministrado de manera individual, autoadministrado en grupos pequeños o medianos, autoadministrado que se envía por correo tradicional, electrónico o mensajería, por entrevista telefónica o mediante entrevista personal o que se inserta en una página web (en sus distintas modalidades) para que lo responda quien lo desee. Este tema se amplía en el capítulo 7, “Recolección de los datos cuantitativos. Segunda parte”, de este centro de recursos en línea. Asimismo, las encuestas se efectúan en una muestra del universo (con excepción de los censos), que puede ser probabilística o no probabilística. La opción más conveniente es la primera si se pretenden generalizar estadísticamente los resultados de la muestra a la población (McLaren, 2014 y Creswell, 2013a). De acuerdo con Te Psychology Research Handbook (2006) y Henry (2004), tres cuestiones son esenciales para llevar a cabo una encuesta de calidad: a) una adecuada formulación de preguntas estructuradas y sus opciones de respuesta, b) un cuidadoso control en la recolección de los datos y c) recoger datos de una muestra grande, representativa, dispersa y cuidadosamente seleccionada. La encuesta es un diseño investigativo de relativamente bajo costo y que se implementa de manera más o menos rápida. El proceso es similar a cualquier otro tipo de estudio cuantitativo, cuyas etapas generales se presentan en la figura 6.1, las cuales ya fueron comentadas en el texto impreso, pero debemos puntualizar algunos elementos. En primer término, es necesario identificar con precisión al usuario usuarios de la encuesta. A veces el usuario resulta ser el mismo investigador, pero con frecuencia se trataode un candidato a un puesto de elección popular y su equipo de la campaña política; o bien, un grupo de directivos de una empresa; o tal vez, los editores de un diario o periódico de amplia circulación o una página web, funcionarios que toman decisiones sobre políticas públicas, los habitantes de una colonia o la opinión pública de un sistema social. al identificación implica obtener un perfil de los usuarios: ¿quiénes son? (edad, género, nivel educativo y socioeconómico, conocimientos en materia de investigación, afiliación política, intereses y otras cuestiones que pudieran vincularse a la investigación),12 así como sus requerimientos: ¿qué necesidades de información tienen?, ¿cuáles son sus expectativas respecto de la encuesta?, ¿qué tipo de decisiones tomarán sobre la base de los resultados de la encuesta?, ¿de qué manera utilizarán los resultados?, ¿cómo va a ser clasificada la información?, ¿qué datos generales y específicos demandan?, ¿en qué formatos desean que se les proporcione la información?, etc. Las respuestas a estas y otras preguntas ayudarán a que el investigador y los usuarios, conjuntamente, planteen de una manera más adecuada su problema de estudio y definan los tópicos que pretenden incluir en la encuesta. Los tópicos son ubicados como variables. En ocasiones, un tópico es una variable y, en otras, está conformado por diversas variables. Recordemos que cada variable debe ser definida conceptual y operacionalmente. odas las precisiones se realizan “mano a mano” con los usuarios (ya sea interactivamente o mediante desarrollo de se lasacuerdan respectivas propuestas conusuarios la obtención realimentación por parte). En la el siguiente etapa decisiones cony los sobre de tareas con las cuales el su lector estará familiarizado; esta fase resulta clara para quien haya leído los capítulos 7, 8 y 9 del libro (que se refieren 12 A veces, asuntos aparentemente triviales resultan importantes. En una ocasión se presentaron los resultados de una encuesta electoral a un candidato al gobierno de una provincia que era daltónico (los colores utilizados en las gráicas no fueron lo suicientemente contrastantes y el usuario se sintió agredido). Igualmente, pueden molestarse los usuarios si se les muestran estadísticas que no comprenden.
3
Figura 6.1 Proceso de una encuesta o survey. Identificar con precisión a los usuarios de la encuesta
Definir cómo será administrado el cuestionario
Integrar al equipo que llevará a cabo la encuesta
Llevar a cabo la prueba piloto y ajustar cuestionario y procedimientos
Especificar con los usuarios el tipo de información que se requiere
Planteamiento del problema (conjuntamente con los usuarios)
Establecer quiénes serán entrevistados (unidad o unidades de análisis y muestreo, con inclusión del tamaño o n)
Determinar los tópicos y/o las variables que van a medirse
Determinar qué recursos son necesarios para conducir la encuesta
Construir el instrumento
Recolectar datos Analizar datos
Establecer si se usa un instrumento existente o si se genera uno nuevo
Determinar la forma en que los datos e información de la encuesta van a ser analizados y reportados
Revisar resultados con el equipo de investigación
Elaborar reporte de resultados de la encuesta
al diseño, la muestra, el cuestionario y su contexto de administración). Asimismo, se integra el equipo que colaborará con el investigador en la implementación de la encuesta (esta decisión casi siempre recae en el investigador). al grupo abarca a los coinvestigadores (si se requieren), supervisores de campo (que guían a los encuestadores, además de monitorear y revisar su trabajo), los propios encuestadores y personal auxiliar (que pueden ser especialistas en análisis estadístico, computación y diseño
4
Capítulo 6 Definición de encuesta o
survey.
gráfico), aunque sabemos que estos equipos suelen ser más pequeños en los ambientes académicos latinoamericanos (incluso los jóvenes estudiantes suelen hacer tareas de investigador, encuestador, analista y diseñador). El equipo debe encontrarse compenetrado con el estudio y motivado por su trabajo. Por otra parte, nunca debemos olvidar la importancia de la capacitación del grupo en sus funciones y todo lo que se explicó en el libro. Respecto del tipo de preguntas en una encuesta, Henry (2004) distingue dos clases fundamentales: a) ítems fácticos o conductuales y b) reactivos actitudinales o de opinión. Los primeros pueden ser verificados externamente o por medio de otro indicador, mientras que los segundos se relacionan con estados subjetivos y solo pueden ser examinados por la consistencia de las respuestas (indicadores de validez y confiabilidad). Cada tipo tiene su propia manera de obtener respuestas más precisas (Fowler, 2002). En los ítems es mejor tenerun undeporte, punto de contraste o validación. Porel ejemplo, si preguntamos sobre quéconductuales tanto una persona practica debemos cuestionarlo sobre lugar donde lo practica y sobre ciertos comportamientos típicos de un deportista, a fin de verificar veracidad de las respuestas. Si se efectúan preguntas sobre el estado de salud a un paciente, las respuestas se vinculan con análisis clínicos de laboratorio. Además, cuando se habla de comportamientos pasados, es mejor efectuar preguntas que se refieran al periodo más reciente posible y evitar el pasado remoto. Recordemos que es importante tomar en cuenta preguntas que hayan integrado encuestas previas y que hayan funcionado. Una vez más, la revisión de la literatura resulta crucial. Además, es importante considerar los costos que se desembolsarán con motivo de la realización de la encuesta, principalmente pagos u honorarios del equipo humano, viáticos, impresión y reproducción de cuestionarios, envío de cartas, cuestionarios y otros documentos, o llamadas telefónicas, recursos de cómputo (adquisición de programas, ingreso y procesamiento de datos) y los costos de elaboración del reporte, así como de las presentaciones respectivas. El resto de los pasos de la implementación de la encuesta resultan conocidos si se revisó la parte impresa de la presente obra: decidir si empleamos un cuestionario desarrollado previamente, adaptamos uno o generamos un nuevo instrumento; de este modo, construir los ítems o preguntas y sus formatos de respuesta, elaborar la introducción e instrucciones, diseñar el cuestionario, efectuar la prueba o pruebas piloto (que abarca tambiénellostrabajo tiempos de labores respuesta al instrumento) diseñar la versión final.sea general, Además, se programa (con y movimientos en yun calendario, aunque como en la figura 6.2). Asimismo, se recolectan y analizan los datos. Durante esta parte es muy recomendable que el investigador y su equipo se reúnan frecuentemente para llevar a cabo la evaluación de los avances, problemas, respuestas de los encuestados y la evolución general del estudio. ambién, antes de preparar el reporte de resultados conviene reunirse con el grupo de colaboradores para conocer las interpretaciones de todos, sus opiniones (particularmente de quienes trabajaron con los entrevistados) y producir realimentación. Por lo general, se obtiene información más amplia y profunda sobre las respuestas de los participantes. De igual manera, después de que hayamos elaborado el reporte es útil organizar una sesión para verificar una vez más su contenido. Figura 6.2 Ejemplo de calendario o cronograma de trabajo (general y sencillo). Semana 123
45
9
678
A B C D
F E F
F G H
5
•
• •
•
Desarrollo de la primera versión del cuestionario Prueba piloto Construcción de la versión definitiva del cuestionario Análisis de los datos
•
•
•
•
Capacitación de encuestadores Evaluación de la prueba piloto Recolección de los datos Elaboración de los reportes de investigación
Por lo regular, los resultados se exponen por medio de una presentación audiovisual y la entrega del informe escrito en dos versiones: ejecutiva (breve) y técnica (larga). Con la finalidad de que los estudiantes que nunca hayan participado en una encuesta se familiaricen un con el trabajo de campo, incluimos al final de este (capítulo ejemplo de unsus documento tips) paraun quepoco suelemás entregárseles a los encuestadores con recomendaciones que desarrollen labores. En la actualidad, en Iberoamérica crece el número de encuestas que se aplican, lo cual en parte se debe a que son citadas cotidianamente en los medios de comunicación colectiva. Las encuestas telefónicas son muy socorridas, debido a su utilidad cuando los encuestados potenciales se encuentran dispersos geográficamente. Algunos ejemplos de encuestas serían los siguientes:
Integración de la tecnología en salones de clase Judge (2001) estudió el estatus de la integración de la tecnología computacional en los salones de clase de educación especial en el nivel preescolar. Su cuestionario incluyó como variables centrales: a) selección de programas de computación (software), b) uso e integración de la tecnología computacional en la enseñanza y c) actitudes de los profesores hacia dicha tecnología (fundamentalmente disposición a utilizarla y soporte). Su muestra objetivo estaba constituida por maestros de educación especial del nivel preescolar del estado de ennessee, Estados Unidos (el procedimiento de muestreo fue el sistemático). Conformó la muestra mediante el directorio de escuelas públicas del Departamento de Educación Estatal. Identificó a 225 docentes, a quienes les envió por correo un paquete con el cuestionario integrado por 30 ítems y la carta explicativa de la encuesta. Le fueron devueltos 106 (47%), de los cuales solo 91 (40.4%) estaban correctamente contestados. Luego, procedió a su análisis y reporte.
Censos económicos en México Desde 1930, y cada cinco años, el Instituto Nacional de Estadística, Geografía e Informática (INEGI) realiza los censos económicos, en los cuales pretende incluir a todo el universo de las unidades económicas que componen el sector productivo del país (urbanas y rurales), es decir, no se muestrea. El objetivo es obtener información estadística básica actualizada y fidedigna sobre todos los establecimientos productores de bienes, comercializadores de mercancías y prestadores de servicios, para generar indicadores económicos de México a un gran nivel de detalle geográfico, sectorial y temático (Instituto Nacional de Estadística, Geografía e Informática, 2014a).12 Los datos son útiles para diversas cuestiones, tales como planear las políticas económicas del sector público y alimentar al Sistema de Cuentas Nacionales de México en la elaboración de la Matriz de Insumo-Producto. Los empresarios pueden efectuar análisis para conocer las condiciones del mercado interno en el que compiten, mientras que los académicos tienen una base para contrastar la información del aparato productivo nacional, estatal y regional (INEGI, 2014a). Mediante cada censo se registran las características de tales unidades (una parte fundamental de las cuales son las empresas formalmente constituidas). La información se levanta o recaba mediante un conjunto de cuestionarios diseñados específicamente para recopilar los datos de cada establecimiento (según la actividad que desarrolle). Los rubros (variables) principales que abarcan los cuestionarios generales (de todas las unidades económicas) son: 12 Para 2014 el universo estimado fue de 5.7 millones de unidades económicas (INEGI, 2014b).
6
Capítulo 6 Definición de encuesta o
•
•
•
•
•
•
•
survey.
Datos de identificación y ubicación. Categoría jurídica ipo o forma de organización de la unidad económica Periodo de operaciones Clasificación económica Personal ocupado Remuneraciones
•
•
•
•
•
•
•
Gastos Ingresos Valor de la producción Activos fijos Crédito y cuentas bancarias Existencias ecnologías de la información utilizadas
Además, se pretende conocer las características particulares de cada sector económico obtenidas por cuestionarios complementarios (INEGI, 2014b), como por ejemplo: •
• •
Manufacturas: materias primas y auxiliares consumidas, productos producidos, maquila de exportación. Comercio: identificación de clientes y proveedores. Minería: reservas mineras.
Barómetro en España En España, el Centro de Investigaciones Sociológicas (CIS), efectúa mensualmente —desde 1979, con excepción del mes de agosto— una encuesta nacional denominada Barómetro (cuyo muestreo se comentó en el capítulo 8 del libro impreso). Su objetivo es medir …el estado de la opinión pública española en relación con la situación política y económica del país y sus perspectivas de evolución. Asimismo, en cada barómetro se abordan temas referidos a aquellas cuestiones que destacan en la actualidad social, económica y política del momento (Centro de Investigaciones Sociológicas, 2005). Desde 1998 los resultados se incluyen en su página web. Las muestras oscilan entre 2 400 y 2 700 casos. Los tópicos que pueden ser incluidos son básicamente los siguientes (macrovariables): •
•
•
•
•
•
•
•
Política (incluyendo tendencias de votación) emas internacionales Economía rabajo Población Medio ambiente Comunicación Cultura
•
Deporte y ocio
•
Ciencia y tecnología
•
•
•
•
•
•
Educación Sanidad Justicia Vida cotidiana Valores y actitudes Conflictos y problemas sociales
Es importante recalcar que el cuestionario puede variar en ciertas preguntas. 12 Veamos el caso del Barómetro correspondiente a octubre de 2013. n = 2 485 entrevistas, puntos de muestreo: 241 municipios y 50 provincias. El universo está constituido por población española de ambos géneros de 18 años y más. Los cuestionarios se aplicaron mediante entrevista personal en los domicilios. Procedimiento de muestreo: polietápico, estratificado por conglomerados, con selección de las uni3 Estudio CIS no. 3.001, Barómetro de octubre (Centro de Investigaciones Sociológicas, 2013).
7
dades primarias de muestreo (municipios) y de las unidades secundarias (secciones) de forma aleatoria proporcional, y de las unidades últimas (individuos) por rutas aleatorias y cuotas de género y edad. Los estratos se formaron por el cruce de las 17 comunidades autónomas con el tamaño de hábitat, dividido en siete categorías: menor o igual a 2 000 habitantes, de 2 001 a 10 000, de 10 001 a 50 000, de 50 001 a 100 000, de 100 001 a 400 000, de 400 001 a un millón y más de un millón de habitantes. Error muestral: para un nivel de confianza de 95.5% (dos sigmas), y P = Q, el error real es de ±2.0% para el conjunto de la muestra y en el supuesto de muestreo aleatorio simple. Fecha de realización: del 1 al 10 de octubre de 2013. 12
Se hicieron preguntas como: 1. Refiriéndonos a la situación económica general de España, ¿cómo la calificaría usted: muy buena, buena, regular, mala o muy mala? Los resultados se muestran en la tabla 6.1. Tabla 6.1 Percepción de la situación económica en España.5 % Muybuena Buena
0.7
Regular
10.4
Mala
35.8
Muymala No supo
(n)
0.0
(1) (18) (258) (889)
52.6
(1308)
0.3
Nocontestó
0.1
TOTAL
100.0
(8) (3) (2485)
2. ¿Cree usted que la situación económica actual del país es mejor, igual o peor que hace un año? 3. Y, ¿cree usted que dentro de un año la situación económica del país será mejor, igual o peor que
ahora? 4. Y refiriéndonos ahora a la situación política general de España, ¿cómo la calificaría: muy buena,
buena, regular, mala o muy mala? 5. ¿Y cree usted que la situación política actual del país es mejor, igual o peor que hace un año? 6. Y, ¿cree usted que dentro de un año la situación política del país será mejor, igual o peor que aho-
ra? ¿Cuál es, a su juicio, el principal problema que existe actualmente en España? ¿Cuál considera el segundo? ¿Y el tercero? Los principales resultados se presentan en la tabla 6.2. 7. ¿Podría decirme qué importancia tienen en su vida los siguientes aspectos? Aquí tengo una tarjeta con una escala que va del 0 al 10, en la que 0 significa “nada importante” y 10 “muy importante”. ¿Dónde se colocaría usted en ella? •
•
•
La familia Los amigos El tiempo libre
•
•
•
El trabajo La religión Las asociaciones, clubes y otras actividades asociativas
4 Se mencionan solamente algunas con el número correspondiente en el cuestionario del barómetro de octubre de 2013. 5 Estos datos pueden contrastarse con otros barómetros para tener encuestas integradas en un diseño longitudinal (si el cuestionario y la muestra es similar entre los puntos de comparación). Por ejemplo, en septiembre de 2005 las percepciones de los españoles eran muy distintas. Las respuestas a esta pregunta tuvieron los siguientes resultados: muy buena (0.6%), buena (21.8%), regular (51.3%), mala (19.5%), muy mala (5.2%), no supieron (1.2%) y no contestaron (0.4%) (Centro de Investigaciones Sociológicas, 2005).
8
Capítulo 6 Definición de encuesta o
survey.
Tabla 6.2 Problemas percibidos en España.6 Problemas
%
El paro
53.0
Losproblemasdeíndoleeconómica
32.7
La corrupción el yfraude
31.7
Los políticos en general, los partidos políticos y la política
28.6
sanidad La
13.4
educación La
9.1
Losproblemasdeíndolesocial
7.4
recortes Los •
5.1
La política
42 . Actualmente, entre todos los miembros del hogar (incluida la persona entrevistada) y por todos los conceptos, ¿de cuántos ingresos disponen por término medio en su hogar al mes, después de la deducción de impuestos (o sea, ingresos netos)? No le pido que me indique la cantidad exacta, sino que me señale en esta tarjeta en qué tramo de la escala están comprendidos los ingresos de su hogar. •
•
•
•
•
•
No tiene(n) ingresos de ningún tipo Menos o igual a 300 euros De 301 a 600 euros De 601 a 900 euros De 901 a 1 200 euros
•
•
•
•
•
De 1 801 a 2 400 euros De 2 401 a 3 000 euros De 3 001 a 4 500 euros De 4 501 a 6 000 euros Más de 6 000 euros
De 1 201 a 1 800 euros
En total, 47 preguntas base y otras derivadas de ellas. Los barómetros son un ejemplo de que los resultados de las encuestas suelen variar con el paso del tiempo o producto de sucesos del entorno físico, social, económico o político.
Encuestas de tendencias electorales y conocimiento de precandidatos La empresa Comunicometría, S. C., ha realizado diversas encuestas de tendencias electorales en municipios de diferentes países latinoamericanos, que son clásicas y muy socorridas en todo el mundo. Los principales objetivos de estas encuestas son: • • • •
Comprender el estado de las tendencias electorales y preferencias políticas en el municipio. Evaluar ante la opinión pública la imagen de los partidos políticos en el municipio. Explorar el conocimiento y la percepción por parte de la ciudadanía sobre los candidatos a la alcaldía. Conocer las intenciones de voto para presidente municipal por partido y candidato. Entre las preguntas que se incluyen en el cuestionario base de tales encuestas tenemos como ejemplo:
1. ¿Pertenece o está afiliado a algún partido político? ¿A cuál? En caso de que pertenezca a algún partido :
¿desde hace cuántos años? En caso de no pertenencia: si usted tuviera que pertenecer a algún partido político, ¿cuál sería? 2. ¿Me podría indicar en qué fecha son las próximas elecciones para alcalde aquí en… (municipio)? 6 Se trata de una tabla de respuestas múltiples, por lo cual la suma de porcentajes no es 100%. Se menciona el porcentaje agregado de mención como primero, segundo y tercer problemas. Se incluyeron solo los problemas con menciones mayores a 5%.
9 3. En las próximas elecciones para alcalde, ¿por qué partido piensa usted votar? (se entrega una tar-
jeta simulando una boleta electoral, si la legislación vigente lo permite). ¿Cuál es la razón principal por la que piensa votar por ese partido? En las próximas elecciones para alcalde, ¿por qué partido o partidos nunca votaría? ¿Cuál es la razón principal por la que nunca votaría por ese o esos partidos? Le voy a mencionar algunos nombres de políticos y le pediría que en cada caso me dijera si sabe usted: ¿quién es? (cuando sí lo identifican, se pregunta si saben a qué partido pertenece y se solicita su evaluación mediante una escala de Likert o de 0 a 10, así como los motivos que generaron tal evaluación). Se pueden agregar fotografías de políticos. 8. En las próximas elecciones para alcalde, ¿por cuál de los siguientes candidatos piensa usted votar? 4. 5. 6. 7.
(se entrega una tarjeta que simula una boleta electoral, si la legislación vigente lo permite).
9. Y, ¿por cuál o cuáles candidatos nunca votaría?, ¿por qué? 10. ¿Qué partido considera usted que ha contribuido más a solucionar los siguientes problemas en
11. 12. 13. 14.
este municipio? (se va preguntando respecto de los principales problemas detectados, por ejemplo: desempleo, inseguridad en las calles, inseguridad en el hogar, escasez de agua, etcétera). De los siguientes candidatos a la Alcaldía y de acuerdo con su opinión, ¿quién es más honesto?, ¿le da mayor confianza?, etc. (previo sondeo de atributos deseables en el municipio). ¿Sabe usted quién es el actual alcalde de …? ¿Me podría indicar si sabe a qué partido pertenece? ¿Qué tan favorable o desfavorable es su opinión acerca del actual alcalde… (nombre)?
Y así otras preguntas. Veamos un par de resultados (de los diversos generados) de dos encuestas. El primero corresponde a una encuesta realizada en Naucalpan, Estado de México, en mayo de 2005. Se efectuó un total de 500 entrevistas en el hogar (en ese año, la población del municipio, o N, era prácticamente de 900 000 habitantes).7 Figura 6.3 Intenciones de voto por partido.8 40
37.90
35 30
24.00
25 20
17.6
15
10.90 10
5.30
5
3.60 0.70
0
0
7 Fuente: Instituto de Información e Investigación Geográfica, Estadística y Catastral del Gobierno del Estado de México (dato de 2000). Disponible el 3 de abril de 2005, en: http://www.edomexico.ob.mx/r_edomex/regiones.asp 8 Se omiten nombres de partidos porque simplemente intentamos mostrar el tipo de información producto de la encuesta
10
Capítulo 6 Definición de encuesta o
survey.
El segundo corresponde a una encuesta que se llevó a cabo en epic, Nayarit, México, en 2008 (n = 800 entrevistas). Figura 6.4 Conocimiento de la fecha de las próximas elecciones para presidente municipal de Tepic.
Cabe destacar que esta clase de encuestas ha perdido credibilidad en distintas naciones debido a que algunas de ellas han producido datos significativamente distintos de los resultados definitivos de la elección correspondiente, lo cual no se debe a que las encuestas sean un método inadecuado, sino a que su implementación ha sido deficiente (muestras no representativas, recolección apresurada de los datos, falta de supervisión de encuestadores) o a que han obedecido a intereses no éticos (falsificación de datos, deformación de resultados para agradar al usuario, muestras intencionalmente sesgadas). Muchos políticos se niegan a aceptar la realidad cuando les es desfavorable. Entre las encuestas electorales se destacan las denominadas “de salida”, en las cuales se pregunta a los sujetos por su voto en una determinada elección. Obviamente, se interroga a las personas inmediatamente después de que emitieron su sufragio (por qué candidato/partido votaron y razones de su preferencia). Estasdistrito encuestas un muestreo que sea representativo no solo del universo de votantes, sino de cada y/orequieren sección electoral.
Otros ejemplos En 2005, Te National Opinion Research Center (NORC), de la Universidad de Chicago (2005), con el patrocinio de la Fundación de Poesía de Chicago, realizó una encuesta nacional telefónica en Estados Unidos (n = 1 000 casos). La finalidad del estudio fue determinar dónde se encuentra la poesía en la cultura estadounidense, por medio de una medición de actitudes respecto de ella y preguntas a los participantes sobre cuánta poesía leían, cuáles eran sus autores favoritos, etcétera. Raw, Regan, Rigotti y McNeill (2009) efectuaron una encuesta en 36 países sobre los servicios para tratar la dependencia del tabaco. El objetivo fue describir tales servicios y discutir los resultados en el contexto del artículo 14 del Convenio Marco para el Control del abaco (CMC) de la Organización Mundial de la Salud (OMS), publicado en 2003. La encuesta se fundamentó en un cuestionario de 10 ítems que se envió por medio del correo electrónico y que preguntaba sobre las políticas y prácticas de tratamiento contra el tabaquismo en la salud pública. Entre los diversos resultados, cabe destacar que menos de la mitad de los países cuentan con una política oficial escrita (44%). Por su parte, Yanget al. (2008) investigaron la influencia del incremento salarial sobre la satisfacción laboral entre jóvenes oficiales de la Armada China. Para ello, aplicaron un cuestionario antesdespués y de un aumento económico, cuyos resultados indicaron que estegeneró –de manera significativa– una mayor satisfacción laboral. La medición de este experimento se implementó mediante dos encuestas. El diario Te Star-Ledger (1991) llevó a cabo en New Jersey una encuesta con 800 adultos para evaluar si las personas tenían armas en sus hogares y el uso que les daban, si planeaban comprar un arma, si habían poseído armas, si estaban inscritos en Te National Rifle Association, etcétera.
11
En 2010, la Secretaría de Desarrollo urístico del Gobierno de Guanajuato y la Universidad de Celaya implementaron una encuesta cuyo propósito fue conocer el perfil del visitante al estado de Guanajuato (México) y su grado de satisfacción con la experiencia turística y la atención recibida. Se entrevistó a una muestra de 636 visitantes a los principales destinos turísticos de dicho estado (Guanajuato, San Miguel de Allende, León, Celaya, Salamanca, Dolores e Irapuato). 12 Los participantes debían ser mayores de 18 años que hubieran tenido contacto con los servicios del destino por al menos tres horas, además de no tener residencia en el estado (hubo personas que acudían por toda clase de turismo: de negocios, ecológico, histórico, simple diversión, etc.). Una encuesta se realizó en verano y otra en invierno (diciembre), que son las épocas más concurridas por los turistas. Entre otras variables, además de las demográficas (género, edad, escolaridad, ingresos, etc.), se consideraron las siguientes: procedencia, si viajaban de solos o acompañados (y con quiénes: naturaleza —amigos, familiares, pareja, compañeros trabajo, etc.—), motivo del viaje,número tipo dey viajero, estadía y hospedaje, medio de transporte, visitas anteriores, comparación de la actual visita con previas, lugares visitados anteriormente, si viajaban en paquete o tour o no, gastos por rubro —desde el lugar de srcen hasta el destino, en el destino y de regreso/en hotel o lugar de llegada, comidas, compras, etc.—, satisfacción general y de aspectos específicos —transporte, hospedaje, establecimientos para alimentos y bebidas, tiendas, museos, etc.—, nivel de satisfacción respecto de visitas previas, comparación con otros destinos, exposición a publicidad y promociones del destino y descripción de la experiencia (cualitativa) (Secretaría de Desarrollo urístico de Guanajuato y Universidad de Celaya, 2010). La Organización Mundial del urismo (OM, 2013) realiza periódicamente el Barómetro OM del turismo mundial, que integra diversas encuestas y mecanismos de obtención de información (constituye un censo de todos los viajeros a los países que conforman dicho organismo). Entre algunas variables que se miden se encuentran: 1. Llegadas de turistas internacionales (por regiones y subregiones), como por ejemplo “América” en
general y América del Norte, El Caribe, América Central y América del Sur en específico, además por país (de los integrantes de la OM). Asimismo, datos anuales y mensuales por cohortes (2000, 2005, 2010, 2011, 2012 y 2013). ambién por nivel de desarrollo económico (economías avanzadas y economías emergentes). Incluso, se compara la evolución de esta variable a través de las cohortes. 2. Ingresos (en dólares, euros y moneda local, precios constantes) por región, subregión y país en 2009,
2010, 2011 y 2012. 3. Gastos (bajo los mismos términos que las llegadas y los ingresos). 4. endencias de viajes de pasajeros por transporte aéreo, región de destino por región de srcen. 5. Previsiones del producto interno bruto (PIB) y desempleo por región y país (para fines de planea-
ción). Otro caso lo constituyen las famosas encuestas de empleo de medios de comunicación masiva, que son muy socorridas (por ejemplo, aquellas para conocer el uso de la televisión: canales, horarios y programas preferidos, entre semana y en fin de semana; tiempo de exposición a la televisión, condiciones de exposición —solos, en pareja, en familia—, etc.). En ocasiones, estas encuestas combinan dos herramientas de medición: cuestionario y aparato que registra cuando se prende y apaga la televisión, canales sintonizados, cambios de canal y otras cuestiones. Algunos ejemplos clásicos en cuestiones noticiosas son las encuestas del New York imes, la de CBS News y la de ABC News/Washington Post (Ballou, 2008). Los gobiernos aplican diversas encuestas para conocer y supervisar ciertos temas como el empleo (en Estados Unidos las lleva a cabo el Bureau of Labor Statistics). Las empresas utilizan las encuestas para conocer evaluaciones de los clientes respecto del servicio que ofrecen, detectar preferencias de consumidores, etc. No hay límites. Asimismo, las encuestas han sido una herramienta para revisar asuntos y hechos históricos. En 2013, la famosa agencia Gallup realizó una encuesta nacional en Estados Unidos sobre el asesinato de John F. 9 Este tamaño de muestra representó un nivel de confianza de 95% y un margen de error de ±3.9 % estatal.
12
Capítulo 6 Definición de encuesta o
survey.
Kennedy, en el marco del 50º aniversario de este trágico evento. Sesenta y uno por ciento de los participantes consideró que su muerte no fue orquestada por un solo hombre, Lee Harvey Oswald, sino que fue producto de una conspiración entre varios actores (en noviembre de 1963, 52% de los entrevistados por Gallup en una encuesta similar creían que el presidente había sido víctima de una conspiración. Este número aumentó en la encuesta de 1976 a 81%). Por otro lado, 71% de los estadounidenses no creen en la versión oficial inicial (Gallup, 2014, Ievoli, 2013 y ADNPolítico, 2013). Además, 74% de los estadounidenses encuestados consideró que Kennedy es el presidente más sobresaliente que ha tenido el país desde la Segunda Guerra Mundial, frente a 3% que cree que tuvo una actuación pobre en la Casa Blanca (Gallup, 2014). ambién se han llevado a cabo encuestas sobre temas de entrenamiento. Por ejemplo, Fox Sports Latinoamérica ha hecho encuestas vía internet (a veces mediante twitter) sobre quién va a ser campeón en determinadas ligas de futbol (México, Argentina, Chile, etc.), quién es el mejor futbolista y asuntos afines. Incluso se han usado para evaluar sitios de internet y páginas web (Boslaugh, 2008). Por último, cabe señalar que las encuestas por medio de internet han crecido y tienen una tasa de respuesta que va en aumento. Lo recomendable es utilizar al menos dos medios (por ejemplo, entrevista personal e internet, correo tradicional e internet, etc.) (Sala y Lynn, 2009 y McMorris et al., 2009). Este tema se ampliará en el siguiente capítulo de este centro de recursos en línea: “Recolección de los datos cuantitativos: segunda parte”.
Encuestas de salud De manera continua se hacen encuestas epidemiológicas a fin de describir la ocurrencia de una enfermedad o una epidemia (en este último caso resulta vital saber la velocidad con que se propaga y por qué medio, así como su grado de mortalidad, etcétera).12 En Colombia, cada cinco años se desarrolla la Encuesta Nacional de Demografía y Salud, que entre otros tópicos incluye el de salud sexual y reproductiva en mujeres y adolescentes (Profamilia, 2009). En Estados Unidos se efectúa una “familia” de ocho encuestas denominada Encuesta Nacional de la Atención a la Salud, auspiciada por el Centro Nacional para Estadísticas de Salud (NCHS, por sus siglas en inglés). Cada una recaba datos y registros de proveedores o establecimientos de atención a la salud (como los hospitales), mediante muestreo polietápico. Entre la información que se recolecta podemos señalar datos de pacientes, sus médicos y personal que los atiende, así como las instituciones, incluyendo consultas médicas, hospitalizaciones (altas y bajas) y cirugías (Centers for Disease Control and Prevention, 2013 y Boslaugh, 2008). Asimismo, se evalúa la calidad de la atención y el servicio médicos. ambién, periódicamente se implementa la Encuesta Nacional de Atención Médica Ambulatoria, la cual abarca servicios de urgencia y consultas externas. Además, la misma NCHS realiza una encuesta para evaluar su página web (número de visitas, opinión sobre el sitio y la información contenida —facilidad para encontrar la información deseada, facilidad de interpretarla, relevancia, exactitud y oportunidad de la información—, medio por el cual se accesa al sitio web, motivos de utilización, evaluación general del sitio, los archivos, las publicaciones, las encuestas, los productos y el servicio, tipo de encuesta e información consultada, estadísticas obtenidas, usos de la información y variables demográficas). En esta misma nación se efectúa desde 1961 la Encuesta Nacional de Mortalidad (NMFS), que se basa en una muestra de 22 957 certificados de defunción (Bezy, 2007). El lector interesado en encuestas de salud a nivel macro en Estados Unidos puede consultar Harris-Kojetin, Sengupta, Park-Lee y Valverde (2013) o su equivalente más inmediato. Otro ejemplo es la encuesta que indaga las tasas de embarazo entre adolescentes y jóvenes estadounidenses (15 a 19 años), que incluso presenta los datos por srcen étnico (cabe señalar que en 12
Para introducirse en este tema se recomienda ver Waghorn y Lloyd (2009).
13
2009, la tasa de embarazo de las mujeres blancas en estas edades es menos de la mitad —42.8 por 1 000— que de las jóvenes hispanas —100.5 por 1 000— yafroamericanas —114.5 por 1 000—) (Curtin, Abma, Ventura y Henshaw, 2013). En el ámbito de la práctica hospitalaria se pueden aplicar encuestas para analizar diversas cuestiones como opiniones de cirujanos respecto de ciertos procedimientos quirúrgicos u opiniones de internistas sobre un medicamento. Por ejemplo, Watson et al. (2010) condujeron una encuesta para determinar y comparar las actitudes de médicos y enfermeras (n=71 y 74 respectivamente) hacia la práctica de pesar a los pacientes y la pérdida de peso de estos con las mismas actitudes por parte de los propios pacientes ambulatorios con un diagnóstico de cáncer avanzado ( n=129), en hospitales de Irlanda, Reino Unido y Nueva Zelanda. Los investigadores de los servicios salud utilizan los resultados encuestas realizadas porperfiles otros (denominado análisis secundario) para de llevar a cabo evaluaciones de lasdenecesidades, desarrollar transversales de las poblaciones, monitorear las poblaciones o cohortes longitudinalmente y recoger medidas de preprueba y posprueba para estudios con diseños experimentales o cuasiexperimentales (Kviz, 2009). Otros ejemplos se muestran en la tabla 6.3. Tabla 6.3 Ejemplos adicionales de encuesta en áreas de salud. Nombre de la encuesta
Institución y país
Año
Muestra
Ejemplosdevariables 1. Características sociodemográficas. 2. Prevalencia de trastornos mentales (alguna vez en la vida, últimos 12 meses y últimos 30 días).
Estudio nacional de salud mental (Ministerio de la Protección Social, 2005).
Ministerio de Salud y Protección Social, Colombia.
2003 (en proceso de reportar la de 2013).
Probabilística con 4 544 adultos entre 18 y 65 años de edad, residentes en 5 526 hogares urbanos de los diferentes estratos socioeconómicos de 60 municipios de 25 departamentos del país.
3. Tipos de trastornos: del estado de ánimo (trastorno depresivo mayor, trastorno depresivo menor, trastorno bipolar I, trastorno bipolar II, trastorno distímico, otros), trastornos de ansiedad (trastorno de angustia, agorafobia sin trastorno de angustia, fobia social, fobia específica, trastorno de ansiedad generalizada, trastorno de estrés postraumático, otros), trastornos relacionados con sustancias (abuso del alcohol, dependencia del alcohol, abuso de drogas, dependencia de drogas, dependencia de nicotina), otros (trastorno del déficit de atención, anorexia nerviosa, ansiedad por separación en trastorno el adulto, bulimia nerviosa, disocial, trastorno negativista desafiante, síndrome de tensión premenstrual, trastorno de ansiedad por separación), etcétera.
14
Capítulo 6 Definición de encuesta o
survey.
Tabla 6.3 Ejemplos adicionales de encuesta en áreas de salud (continuación). Nombre de la encuesta
Encuesta demográfica y de salud familiar (Instituto Nacional de Estadística e Informática, 2013).
Institución y país
Instituto Nacional de Estadística e
Año
2012
Informática, Perú.
Encuesta nacional de adicciones (Secretaría de Salud, 2012).
Comisión Nacional contra las Adicciones, Secretaría de Salud y Centro Nacional para la Prevención y Control de las Adicciones, México.
Primer estudio nacional de la discapacidad (Fondo Nacional de la Discapacidad, 2005).
Fondo Nacional de la Discapacidad e Instituto Nacional de Estadísticas, Chile.
Muestra
28 376 viviendas del país, en las que se entrevistó a más de 24 500 mujeres en edad fértil, es decir de 15 a 49 años de edad.
2011
Muestra probabilística estratificada en ocho regiones del país. 1 994 viviendas por región.
2004
Muestra estratificada por regiones a nivel país de 13 350 viviendas (11 000 urbanas y 2 350 rurales).
Ejemplosdevariables Niveles de salud materna e infantil, prevalencia anticonceptiva, fecundidad y mortalidad de la población, conocimiento del VIH-SIDA y características de la violencia doméstica. Asimismo, proporciona información sobre el estado nutricional de la población menor de cinco años y sus madres, prácticas de lactancia y nivel de anemia tanto de mujeres como de niños, a nivel nacional y departamental. Se consideran todas las adicciones. En el caso del tabaco se estimó, entre otras variables,: estatus como fumador (fumador activo, exfumador y nunca ha fumado), edad de inicio del consumo diario, consumo promedio de cigarrillos de los fumadores diarios, adicción a la nicotina, exposición al humo del tabaco, gasto en tabaco, lugar de compra y marca, etc. Prevalencia nacional de discapacidad, discapacidad, grados estado de de salud de la población objetivo, discapacidad y trabajo, acceso a servicios de salud, apoyos sociales y ayudas técnicas, uso del tiempo libre, etcétera.
Más ejemplos de encuestas Las encuestas se pueden utilizar también en otras áreas de conocimiento además de las ciencias sociales. Por ejemplo, un ingeniero civil puede llevar a cabo una encuesta entre colegas para analizar qué materiales se han utilizado para construir cierto tipo de edificios y cuál ha sido su desempeño. En ingeniería industrial podría efectuarse una encuesta para evaluar qué sistemas o métodos de manufactura o calidad se implementan en plantas de cierto rubro específico (por ejemplo, de ensamblado de automóviles), cómo se ejecutan, qué estrategias y prácticas se utilizan, qué problemas se han presentado y la manera como se resolvieron, etc. O bien, cómo abordan un modelo de gestión o producción como el lean manufacturing. En ellas se incluyen preguntas cerradas y abiertas (imaginemos la siguiente interrogante: si tuviera que hacerUn una línea deen producción másseeficiente, modelo o metodología implantaría?, ¿por qué?). ingeniero sistemas que encuentra¿qué frecuentemente con problemas técnicos, podría hacer una encuesta para analizar cómo los enfocaron y resolvieron otros colegas o simplemente recolectar sugerencias.
15
Tabla 6.4 Ejemplos adicionales de encuestas. Naturaleza Encuesta sobre el conocimiento, actitud y comportamiento concernientes al uso de anticonceptivos entre adolescentes embarazadas en Beijing, China.
Referencia
Wu (2010)
Descripción El estudio incluyó a 53 adolescentes embarazadas (muestra no probabilística por conveniencia) que fueron invitadas a participar y se contactaron en hospitales. A todas ellas se les aplicó un cuestionario que medía el conocimiento respecto de los anticonceptivos, su actitud a utilizarlos y si los habían usado en sus encuentros sexuales previos, incluyendo la primera vez. La encuesta integró dos muestras de estudiantes y académicos, así
Creencias y actitudes del consumidor hacia el jamón curado en seco y la denominación de srcen protegida del jamón de Teruel en dos regiones españolas que difieren en el conocimiento del producto.
Cilla et al. (2006)
Encuesta de cargas de fuego en las escuelas primarias y secundarias
Hadjisophocleous y Chen (2010)
como sus parientes, cuyas edades oscilaron entre los 20 y 80 años: una de Zaragoza, Aragón (conocimiento elevado, n=390) y otra de Cataluña (bajo conocimiento, n=312). Para ser incluidos se requería que fueran consumidores habituales de jamón curado en seco. El cuestionario fue proporcionado a los sujetos, quienes lo contestaban en sus hogares (autoadministrado). Las preguntas cuestionaban básicamente sobre su frecuencia de consumo, los lugares donde compran del producto, sus creencias respecto de factores que incidían en la calidad del jamón y actitudes hacia el jamón de Teruel con denominación de srcen protegida. Los autores llevaron a cabo una encuesta sobre la carga de fuego en cuatro escuelas primarias y tres secundarias de Ottawa, Canadá, lo que implicó considerar una superficie de piso de 6 313.0 m2. En las primarias se evaluaron tres clases de cuartos: salones de clase, cuarto de cómputo y las bibliotecas. En las secundarias, además de los cuartos anteriores, se agregaron los salones de ciencia y arte. Se incluyeron las áreas de piso libres y las de piso cubiertas por mobiliario. Los resultados muestran que la densidad promedio de carga de fuego para los salones de clase de las escuelas primarias es 397.5 MJ/m2, que es aproximadamente el doble que la densidad de las aulas en las escuelas de secundaria encuestadas. La media de densidad de la carga de fuego total de todas las habitaciones encuestadas en las escuelas primarias es de 426.3 MJ/m2 y de las escuelas secundarias de 313.7 MJ/m2.11
Encuesta nacional sobre los programas y servicios que se ofrecen a padres reclusos en centros penitenciarios de Estados Unidos.
Hoffmann, Byrd y Kightlinger (2010)
Asimismo, Claret y Andrade (2007) implementaron una encuesta para analizar la carga de fuego de edificios históricos en Ouro Preto, en la provincia de Minas Gerais, Brasil. Los investigadores efectuaron una encuesta nacional en centros penitenciarios masculinos y femeninos, nacionales y estatales, con la finalidad de conocer qué programas y servicios se estaban implantando para padres y madres reclusos que tuvieran hijos menores de edad, dado que la literatura indica que el encarcelamiento parental aumenta el riesgo de que los niños y jóvenes experimenten problemas emocionales y conductuales, y más adelante tengan bajo desempeño en la escuela y se involucren en situaciones criminales. Los programas relacionados con la crianza de los hijos en prisión ofrecen cierta promesa de disminuir las consecuencias negativas del confinamiento del padre y/o la madre, tanto en el caso de niños y jóvenes como en el del propio prisionero. El asunto es preocupante, ya que cuando se hizo el estudio (2007), aproximadamente 810 000 hombres y mujeres reclusos eran padres de más de 1.7 millones de menores de 18 años, un tercio de los cuales se convertirá en adulto mientras su progenitor está encarcelado. La muestra consistió en 387 directores de centros carcelarios (39% de tasa de respuesta).
11 En términos más sencillos, la carga de fuego de un edificio o compartimento es una forma de establecer la posible gravedad de un incendio hipotético potencial. Es la producción de calor por determinada unidad de superficie, a menudo en MJ/m2 o KJ/m2, calculada a partir del valor del poder calorífico de los materiales presentes. Carga de fuego se utiliza para la evaluación de riesgos de seguridad industrial. El objetivo de realizar un estudio de carga de fuego es determinar la cantidad total de calor capaz de desarrollar la combustión completa de todos los materiales contenidos en un sector de incendio. Además, con el resultado obtenido, se puede establecer el comportamiento de los materiales constructivos, resistencia de las estructuras, tipos de ventilación, sea esta mecánica o natural, y por último, calcular la capacidad extintora mínima necesaria a fin de instalarla en dicho lugar, etcétera (Menendez, 2013).
16
Capítulo 6 Definición de encuesta o
survey.
Tabla 6.4 Ejemplos adicionales de encuestas (continuación). Naturaleza Efecto del bullying personal y el ambiente organizacional caracterizado por este sobre la rotación de personal.
Referencia
Descripción
Houshmand, O’Reilly, Robinson y Wolff (2012)
La investigación se realizó utilizando el diseño de encuesta. El objetivo era analizar el efecto del bullying laboral sobre la rotación de los empleados. Las participantes eran enfermeras blancode tal clase de intimidación. Se incluyeron 357 casos de 41 unidades hospitalarias. Asimismo, se consideró elefecto del bullying personal y a nivel organizacional (ambiente). Los resultados indicaron que la intención de renunciar es similar cuando las enfermeras son el objeto directo del bullying que cuando laboran en
Estudio de conocimiento de las tarjetas médicas y las marcas que compiten en el mercado mexicano.
Hernández-Sampieri, Fernández, Cuevas y Méndez (2007)
Satisfacción de los beneficiarios de los programas sociales del Gobierno de
Cuevas, Hernández-Sampieri y
Guanajuato.
Méndez (2009)
una unidad caracterizada por altos niveles de este tipo de agresión. La encuesta pretendía establecer el conocimiento por parte de los clientes potenciales de un producto (tarjeta médica) y una marca, la participación de esta en el mercado, las razones por las cuales los clientes compran o no el producto y la preferencia por la marca adquirida, los beneficios que perciben de una tarjeta médica y la marca elegida, el grado de satisfacción con el producto y la marca seleccionada, percepción del costo en general de la tarjeta médica y por marca, recordación de las campañas publicitarias por marca, etcétera. El tamaño de muestra fue de 1 979 personas encuestadas en urbes mexicanas donde se promocionaba la marca (con más de medio millón de habitantes). Mediante una encuesta se evaluó el grado de satisfacción de la población beneficiaria de dos programas sociales aplicados en el estado de Guanajuato, México: SAVETAS y ADRENEL, los cuales abarcan diversos rubros: apoyos para el empleo —capacitación y generación de empleos y autoempleos—, educación —becas—, vivienda —techo digno y piso firme—, servicios para la comunidad—drenaje y agua potable—, salud —servicios y campañas—, alimentación —despensas, dotación de alimentos y servicios de nutrición—, seguridad jurídica —regularización de documentos personales y de la tenencia de la vivencia y tierras agrícolas/ganaderas— y desarrollo humano —asesoríafamiliar, problemas de alcoholismo y drogadicción, esparcimiento, incremento de la autoestima, conflictos, etc.—, entre otros. Asimismo, se recolectaron datos sociodemográficos.
La encuesta Toronto entre adolescentes (servicios de salud sexual).
Flicker et al. (2010)
Uso de medios de comunicación en la Ciudad de México.
Hernández-Sampieri et al. (2004)
La estrategia de muestreo fue probabilística y polietápica (muestreo aleatorio simple para seleccionar comunidades y muestreo sistemático para elegir viviendas e informantes). De un universo de 157 211 familias beneficiarias se encuestó a 1 217. La encuesta Toronto entre adolescentes tiene como objetivo recabar información sobre la relevancia y el acceso a los servicios de salud sexual para los adolescentes de dicha población (13 a 17 años). Se mide, entre otras cuestiones, el conocimiento y definición de salud sexual, los riesgos para esta y los servicios disponibles. Con la finalidad de conocer los usos y hábitos de los adultos que viven en el área metropolitana de la Ciudad de México respecto a los medios de comunicación colectiva, se realizó una encuesta en una muestra por conglomerados de 1 812 personas. Entre otros tópicos se consideró el canal de televisión predilecto, los programas televisivos, contenidos y horarios favoritos, el número de horas que diariamente escuchan la radio, la estación radiofónica y contenidos preferidos, los horarios en que sintonizan emisiones radiofónicas, la frecuencia de lectura de periódicos y revistas, cuáles escogen leer y qué contenidos les interesan más, la frecuencia de así asistencia cine, géneros, películas,publicitarios días y horarios predilectos, como laalexposición a anuncios espectaculares y otros medios alternativos (publicidad en autobuses, el metro y diversas formas de transporte público). Se incluyeron menciones y recordación.
17
Encuestas para niños Las encuestas han sido muy eficaces para conocer las opiniones y puntos de vista de los niños. Lloyd y Devine (2010) demostraron que pueden aplicarse exitosamente vía internet a infantes de 10 y 11 años y desarrollaron un método para ello. Desde luego, también las encuestas que utilizan la autoadministración del cuestionario son eficaces en el caso de los menores de edad (De Leeuw, Hox y Kef, 2003), pero debe tomarse en cuenta que hay niños que tienen deficiencias para leer y comprender las preguntas y las alternativas de respuesta, así como la secuenciación de ellas. Otra alternativa son los cuestionarios que se contestan a través de entrevistas asistidas en un dispositivo electrónico (por ejemplo, computadora, sistema CASI). El contexto puede ser la escuela o el hogar. En el caso de infantes algunos estudios demuestran que es más eficaz este medio que los cuestionarios impresos (Borgers, De Leeuw y Hox, 2000).
EJEMPLO DE UN DOCUMENTO QUE SUELE ENTREGÁRSELES A LOS ENCUESTADORES CON RECOMENDACIONES (TIPS) PARA EL TRABA JO DE CAMPO Este documento fue entregado durante la capacitación a encuestadores de un estudio que pretendía evaluar a empresas del estado de Guanajuato, México, en términos de su responsabilidad social. En cada organización seleccionada se aplicaba un cuestionario estandarizado, grupalmente a los empleados (al mayor número posible de ellos) y mediante entrevista a los directivos (cuando esto no era factible, por horario y ocupaciones, podían responderlo en uno de los grupos o de manera autoadministrada). Con base en los resultados, el Gobierno Estatal certificaba o no a las empresas en cuanto a dicha responsabilidad.12
Tips Arreglo personal Es importante vestir un atuendo formal pero sencillo, pues debemos considerar que se establecerá contacto con tres niveles diferentes dentro de la empresa: • • •
Director Gerentes o mandos medios Empleados
Esto provoca que tengamos que cuidar la imagen que se busca proyectar, puesto que por un lado se debe ser profesional y generar una percepción de responsabilidad y seriedad en el proyecto para que los directivos nos respeten y colaboren con lo que les solicitaremos; pero al mismo tiempo tenemos que generar confianza en los trabajadores para que tengan una respuesta positiva ante nosotros y expresen honestamente sus percepciones acerca de la empresa, los procesos y las relaciones y/o comunicación que existe dentro de la misma. Por ello, se sugiere cuidar la presencia, limpieza y: • •
•
Hombres: de preferencia usar pantalón de vestir y camisa, zapatos limpios y estar bien peinados. Mujeres: pantalón de vestir, camisa o blusa discreta, su peinado, maquillaje y accesorios deben ser también discretos, zapatos de preferencia de tacón pero no alto (cerrados por normas de seguridad). En ambos casos es importante llevar una chaqueta americana, chamarra o saco discreto preparado para el momento de entrevistarse con los altos mandos o mandos medios.
“Yo” como encuestador Antes de presentarse en la empresa, es importante considerar varios aspectos. 12 El estudio fue conducido simultáneamente por la Subsecretaría del Trabajo y Previsión Social y la Universidad de Celaya en 2008 y 2009. Manuscrito no publicado.
18
Capítulo 6 Definición de encuesta o
survey.
Visualizarnos como un agente externo de las empresas, por lo que los integrantes de estas pueden: • •
•
Sentirse amenazados o nerviosos ante la evaluación. Considerar que sus respuestas serán usadas en su contra y recibirán represalias por parte de sus superiores. Exagerar en sus respuestas y generar alboroto con sus compañeros (nunca falta).
Ante estas situaciones, el encuestador debe mantener la calma, usar un tono de voz tanto amable como respetuoso y debe aclarar el motivo de su presencia. Pedir a los demás miembros de la empresa que se encuentren presentes (además del entrevistado) que guarden silencio en caso de encontrarse inquietos, que respeten a sus otros compañeros y que sean honestos en sus respuestas. En situaciones de extremo nerviosismo o tensión, se puede bromear un poco o modular la voz al explicar el cuestionario, de tal manera que nos mostremos amigables sin ser irrespetuosos ni mostremos abuso de confianza (es importante cuidar estos detalles para que podamos establecer una buena comunicación con los encuestados sin perder la autoridad).
Con empleados •
•
• • •
•
•
• • •
•
•
•
Comenzar con la presentación e introducción de nuestra persona (nombre, de qué institución venimos). Aclarar el motivo de nuestra visita a la empresa (“buscar la certificación de la empresa como empresa socialmente responsable”). Agradecerles por su presencia, tiempo y colaboración para auxiliarnos en este proyecto. Explicar cómo se va a ejecutar el modelo de certificación. Preguntar por directivos para conocer si es un grupo mixto o si se van a aplicar todas las encuestas al mismo tiempo a todos los niveles. Revisar en conjunto con ellos el cuestionario (pregunta por pregunta para aclarar cualquier problema de redacción). Enfatizar las opciones de respuesta. Hacer hincapié en: Que la encuesta es para fines de evaluación de la empresa en general. Que las respuestas serán confidenciales. Que ningún colaborador o miembro de la empresa tendrá acceso a las encuestas (ni empleados, ni directivos). Que sus jefes (especificar siempre) no podrán conocer sus respuestas y, por ende, no puede existir ningún tipo de represalias o consecuencias en su trabajo, sueldo o trato personal. Aclarar y solicitar repetidamente que en verdad requerimos de su HONESIDAD al responder, para que los resultados que se obtengan realmente reflejen lo que se vive en la empresa y pueda servirnos para conocer la compañía y hacer una propuesta efectiva que les beneficie a ellos como empleados y a los directivos (BENEFICIO MUUO, “ganar, ganar”). Asegurarse que han entendido cada pregunta. Observar la forma en que contestan las encuestas:
• • •
De forma rápida y sin prestar atención. Con dudas y demostrando confusión.
Con nerviosismo. En cualquiera de estas situaciones, acercarse a la persona en cuestión y preguntar si todo está claro, si necesita que se despeje alguna duda y/o recordarle que será confidencial la encuesta. Durante el llenado de las encuestas, nosotros como encuestadores, debemos tomar nota de todos los detalles que se presenten:
19
• •
•
•
Cómo se encontraba el grupo (nervioso, bromista, alterado, silencioso, con prisa o apurado, etcétera). Señalar si el grupo en general compartía un mismo estado de ánimo o si sólo se presentaba en una persona o en un sector de los encuestadores (sólo los mandos medios, sólo los empleados generales, sólo una o dos personas). Si surgieron dudas en cuanto a: •
Cómo responder.
•
Alguna cuestión de redacción.
•
Confusión sobre lo que se pregunta.
Señalar en qué pregunta hubo la duda y qué fue lo que se acordó de forma grupal (es decir, cómo se especificó que debía ser contestada o cómo se interpretó la pregunta)
Al finalizar el llenado de las encuestas agradecer nuevamente por su participación y su disposición para auxiliarnos, recordarles que es confidencial y que no habrá represalias. **Nota: es importante ofrecer una expresión relajada y amable en todo momento, sonreír al escuchar una pregunta o cuestionamiento de los participantes o al responderles.
Resulta conveniente mostrarse receptivos ante cualquier indicio de molestia o desconfianza por parte de los encuestados o bien, durante la entrevista con directivos. En este caso tenemos que seguir nuestros instintos para afrontar la situación, pero siempre manteniendo una actitud serena, paciente y activa para esclarecer dudas y garantizar el cumplimiento de nuestro trabajo (explicando lo que buscamos, mostrando seriedad en lo que hacemos, especificando la trascendencia y el impacto del proyecto), y por supuesto, buscando mejorar la actitud de nuestro interlocutor, asegurando que el resultado de la evaluación será para beneficio de todos los involucrados. Algo importante es usar el sentido común para averiguar más acerca de la situación que vive la empresa, para ello se pueden emplear distintos métodos ante ciertas circunstancias: Por ejemplo, si se observa que hay un grupo en particular que está inconforme o nervioso, se puede comenzar una plática “informal” asegurándonos que ellos perciban que estamos hablando únicamente para “pasar el tiempo”, o “en lo que terminan el cuestionario”, iniciando con frases como: • • • • • •
¿Y usted(es) lleva(n) mucho tiempo colaborando en esta empresa? ¿En qué puesto se encuentran? o ¿qué actividades realizan? ¿Cómo se enteraron del puesto? ¿Y se sienten cómodos? ¿Habían trabajado en puestos similares en otra empresa? ¿Es un buen lugar para trabajar?
Desde luego, debemos poner atención a las respuestas y en cuanto se pueda (sin que nos vean) anotar la esencia de estas o grabarlas en audio o video (por ejemplo, usando el teléfono celular o móvil). Generalmente los empleados que se encuentran inconformes se liberan cuando se les interroga de esta manera más informal, puesto que no se sienten amenazados. Pero, tomar en cuenta: 1. No obstruir el proceso de llenado de encuestas (procurar que sea al finalizar las mismas, puesto que
quizá no se cuente con el tiempo necesario y se perjudique el itinerario). 2. Asegurarnos de utilizar un tono de voz que denote curiosidad, “sin amenaza” de chisme, y ser amables
y respetuosos, evitando hacer comentarios o emitir opiniones personales, limitarnos a “sólo escuchar”.
Entrevistas con directivos Presentarnos y explicar el motivo de nuestra presencia. Agradecer por su tiempo y disponibilidad para cooperar con el proyecto. Entregar y explicar el cuestionario (en caso de que no lo haya llenado al mismo tiempo que el resto de los empleados). Aclarar cualquier duda que tengan. Solicitar la evidencia que se pide para demostrar que la organización es socialmente responsable (es importante que el trato sea amable pero con firmeza y sin titubear, puesto que al ser ellos directivos tienen
20
Capítulo 6 Definición de encuesta o
survey.
que percibir nuestra seguridad y profesionalismo, para que así cooperen con nosotros). En caso que se muestren evasivos, negativos o no quieran mostrarnos los documentos, explicarles que son necesarios para validar la evaluación y poder certificar a la empresa. Supuestamente ellos deberán estar enterados previamente, por lo que es muy baja la posibilidad de que desconozcan este requisito, así que con respeto se les debe recordar que se les avisó y que a nosotros como encuestadores se nos dijo que no había inconveniente en mostrarnos dicha evidencia. Al finalizar, reiterarles nuestro agradecimiento e informarles que una vez finalizado el proceso de evaluación se les notificará de los resultados obtenidos de la investigación.
Durante el recorrido Observar de manera “cuidadosa” y sin causar interrupciones o interferir en las actividades de los empleados (recordemos que no porque estemos evaluando ellos dejan de cumplir con sus obligaciones dentro de la empresa). Solicitar algún tipo de explicación por parte de los empleados (únicamente si es necesario, como lo relativo al uso del equipo de seguridad, si es que se observa que no se utiliza). A los encuestadores se les pueden dar breves recomendaciones adicionales sobre cuestiones de comunicación, realización de entrevistas (etapas, cómo lograr rapport, cierre de entrevistas, programación neurolingüística, etcétera).
capítulo
7
Recolección de los datos cuantitativos. Segunda parte
INTRODUCCIÓN En este capítulo se tratan algunos temas que por cuestiones de espacio no fueron incluidos en el capítulo 9 (Recolección de los datos cuantitativos) del texto impreso de Metodología de la investigación , 6ª edición, o bien, no se profundizó en ellos. Fundamentalmente, esos temas son los siguientes: procedimiento “paso a paso” para construir un instrumento de medición, el escalograma de Guttman (escala de actitudes), pruebas e inventarios, contextos de administración de cuestionarios, análisis de contenido, observación cuantitativa, y obtención y análisis de datos secundarios (comprendido el metaanálisis) y un comentario sobre las fuentes de error en las mediciones.
PROCEDIMIENTO PARA CONSTRUIR UN INSTRUMENTO DE MEDICIÓN “PASO A PASO” En el capítulo 9, en la sección “¿Qué procedimiento se sigue para construir un instrumento de medición?”, se expuso en términos generales el proceso para desarrollar un instrumento o sistema de recolección de datos. Ahora revisaremos con mayor profundidad cada una de las fases.
Fase 1: Redefiniciones fundamentales Al comenzar a desarrollar el o los instrumentos de medición, vale la pena una última reflexión para cerciorarnos de cuáles son nuestras variables y algunas otras precisiones. Para tal efecto, sugerimos contestar las preguntas que se muestran en la tabla de la página 2. Una vez que se responden estas preguntas, se cuenta con las redefiniciones más importantes para proseguir.
Fase 2: Revisión de la literatura enfocada en instrumentos de medición Si al elaborar el marco teórico efectuamos una revisión adecuada de la literatura, esta fase suele ser innecesaria. Pero puede ocurrirle a quien se inicia en la investigación, que al consultar las fuentes primarias no se haya enfocado en los instrumentos de medición utilizados. En esta situación, resulta indispensable evaluar nuevamente la literatura, centrándose en tales instrumentos, lo cual resulta sencillo, porque —supuestamente— tenemos las referencias a la mano. Cuando se valoran los diferentes instrumentos utilizados en estudios previos, conviene identificar —en cada caso— el propósito del instrumento tal como fue concebido por el investigador o investigadores, y analizar si es similar al nuestro.
2
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
¿Qué va a ser medido? (identificación y lista de variables). Variable o concepto 1: _____________________________________________________________________. Variable o concepto 2: _____________________________________________________________________. Variable o concepto 3: _____________________________________________________________________. Variable o concepto k: _____________________________________________________________________. ¿Qué o quiénes van a ser medidos? __________________________________________________________. ¿Cuándo (fechas precisas)?_________________________________________________________________. ¿Dónde (lugar específico)? _________________________________________________________________. ¿Cuál es nuestro propósito al recolectar los datos? (debe ser coherente con el planteamiento) ______________________________________________________________________________________ ______________________________________________________. Nuestras definiciones operacionales son: Variable o concepto 1: ____________________________________________________________________. Variable o concepto 2: ____________________________________________________________________. Variable o concepto3: ____________________________________________________________________. Variable o concepto k: ____________________________________________________________________. ¿Qué tipo de datos queremos obtener? (Por ejemplo: respuestas verbales, conductas observadas, contestaciones escritas, estadísticas epidemiológicas, proyecciones internas, marcas de sistema electrónico, mediciones del desempeño de una maquinaria, indicadores económicos, etcétera).
Este es el primer punto que tomamos en cuenta para ver qué instrumentos pueden sernos útiles. Asimismo, se recomienda considerar los siguientes elementos: • •
•
•
•
•
• •
Las variables que mide el instrumento o herramienta: ¿cuántas y cuáles? Los dominios de contenido de las variables (dimensiones, componentes o indicadores): ¿cuáles y qué tan extensos son? (Sharma y Petosa, 2014, Mertens, 2010 y Punch, 2009). La muestra: ¿a qué o a quiénes fue administrado? ¿Qué perfil o características poseen las unidades medidas? Las condiciones de aplicación: ¿en qué lugar y contexto fue utilizado? ¿Cómo y cuándo fue administrado? ¿Por quién o quiénes se aplicó? ¿Eran individuos con capacidades y entrenamiento para implementarlo, calificarlo e interpretarlo? ¿Qué tiempo requiere para ser aplicado, codificado y calificado? La información sobre la confiabilidad: ¿de qué tipo es? ¿Cómo fue establecida? ¿Qué procedimientos se utilizaron para calcularla? ¿Cómo se reportó? ¿Los resultados son aceptables y significativos? La información sobre la validez: ¿qué evidencia de contenido, criterio y constructo se aportó? ¿Se estableció suficiente evidencia sobre la validez total? (de Vet , erwee, Mokkink y Knol, 2011). La información sobre la objetividad: ¿se aplicó de manera estandarizada? Los recursos necesarios para administrarlo y su costo: ¿qué recursos se requieren para aplicarlo? (por ejemplo: informáticos). Sobre la base de tales elementos, se seleccionan uno o varios instrumentos que pueden ser apropiados
para nuestra investigación.
Fase 3: Identificación del dominio de las variables que se medirán y sus indicadores Esta fase, prácticamente simultánea a la anterior, se refiere a la precisión del dominio de las variables que mediremos, fundamentándonos en las definiciones conceptuales de estas y la revisión de instrumentos
Metodología de la investigación
previos de recolección de datos. Es decir, debemos señalar puntualmente los componentes, dimensiones o factores que teóricamente integran cada variable. Incluso, se sugiere hacerlo gráficamente como en la figura 7.1., con la “satisfacción laboral”). Figura 7.1 Ejemplo de establecimiento de factores con la variable satisfacción laboral. Satisfacción en relación con el entrenamiento o capacitación
Satisfacción con el jefe o superior
Satisfacción respecto de los compañeros Satisfacción en torno a las condiciones de trabajo
Satisfacción con el salario (recompensas, retribuciones...)
Satisfacción hacia el desarrollo o crecimiento personal logrado Satisfacción respecto de las perspectivas futuras en la organización
Satisfacción con el desempeño personal en el trabajo
Una vez ubicados tales factores es necesario establecer los indicadores de cada uno de ellos. Por ejemplo, en el caso de la “satisfacción en torno a las condiciones de trabajo”, estos podrían ser: satisfacción sobre la jornada laboral, horarios de entrada, salida y alimentación, lugar, transporte, iluminación, servicio médico y vacaciones. Cuando se trata de la “satisfacción sobre el desempeño personal en el trabajo”: satisfacción respecto a la productividad, eficiencia, eficacia, calidad del servicio, desperdicio y calidad factual. Para cada indicador se generan uno o más ítems tal como se comentó Operacionalización Paso de una variaen el capítulo 9 del texto impreso, lo que, recordemos, se denomina opeble teórica o abstracta a indicadores e racionalización de las variables (la secuencia: variable → factores, dimenítems o valores empíricos verificables. siones o componentes → indicadores → ítems o valores). La operacionalización es la base de las definiciones operacionales de las variables. Una vez que se ha operacionalizado la variable (se cuenta con ítems o valores concretos), se especifica qué instrumento puede medirla y se construye su definición operacional, la cual implica especificar y describir el procedimiento para medir la variable a través del instrumento. Para reforzar lo anterior paso por paso, Solís (2013), Hernández-Sampieri et al. (2013) y Sjoberg y Nett (1980) consideran que las siguientes etapas conforman la medición de una variable: Definición nominal de la variable: identificarla y nombrarla. Definición conceptual de la variable. Dimensionalización de la variable: determinar sus factores, dimensiones o componentes. Definición de indicadores empíricos e índices de cada factor o dimensión de la variable (que es lo que en este apartado denominamos identificación del dominio de la variable que se debe medir y sus indicadores). 5. Identificación, desarrollo o generación de ítems o valores de cada indicador o índice.1
1. 2. 3. 4.
1 Recordemos que a veces se sigue la secuencia completa: variable→ dimensiones → indicadores → ítems o valores, mientras que en otras ocasiones se transita de la variable directamente al <<<<ítem, escala o valor. Por ejemplo, temperatura→ lectura de un valor en una escala de un aparato (termómetro); o bien, presión arterial (aplicación de un procedimiento y lecturas de escalas en un esfigmomanómetro: mmHg).
3
4
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
6. Definición instrumental de la variable: especificar los instrumentos que se utilizarán para recopilar
los datos pertinentes de los indicadores empíricos y de los ítems o valores requeridos para cada indicador. 7. Definición operacional de la variable: determinar el procedimiento detallado que se seguirá para aplicar el instrumento de recolección de datos y medir la variable. Para ilustrar la operacionalización, tomemos el ejemplo de Lee y Guerin (2009), el cual se trata en la obra impresa. Recordemos que esta investigación tuvo como objetivo “identificar si la satisfacción respecto de la calidad del diseño ambiental del interior de áreas de trabajo u oficinas afectaba significativamente la satisfacción general del espacio de trabajo por parte de sus ocupantes y su desempeño laboral”. La satisfacción respecto de la calidad del diseño ambiental del interior del área de trabajo fue medida aplicando a los participantes la encuesta IEQ ( Indoor environmental quality) desarrollada por el Centro para el Medio Ambiente de la Universidad de California en Berkeley. Se establecieron las dimensiones de tal satisfacción y los indicadores de ellas, que fueron operacionalizados utilizando ítems escalados bajo el sistema de Likert con siete puntos que van de “muy satisfecho” (+3) a “muy insatisfecho” (—3); lo mismo se aplicó a la satisfacción general sobre el espacio de trabajo. Las dimensiones consideradas y sus indicadores se muestran en la tabla 7.1. Tabla 7.1 Dimensiones e indicadores de la variable "satisfacción de la calidad del diseño ambiental del interior del área de trabajo". Dimensión o criterio Diseño de la oficina
Indicadores m edidos (satisfacción sobre…) • • •
Mobiliario
• • •
Temperatura
•
Ventilación
•
Iluminación
• •
Acústica
• •
Limpieza y mantenimiento
• • •
Espacio aprovechable para el trabajo individual, guardar/almacenar Nivel de privacidad visual Facilidad para interactuar con compañeros de trabajo Confort Capacidad/adaptabilidad Colores y texturas del piso, muebles y acabados Temperatura ambiental Calidad del aire en el espacio personal (respirable, ambiente ventilado, rancio/no rancio, olores agradables…) Cantidad de luz Confort visual (deslumbrante/oscuro, reflejos, contraste, etcétera) Ruido. Privacidad de sonidos (aislamiento) Limpieza del espacio Mantenimiento del edificio Servicio de limpieza y mantenimiento del espacio de trabajo
El desempeño, como ya se mencionó en el texto impreso, se midió perceptualmente preguntándoles a los participantes el grado en que cada criterio facilita/interfiere con la capacidad de terminar el trabajo. Desde luego, hubiera sido ideal agregar datos directos del desempeño que son estándares de toda clase de ocupaciones y organizaciones (porque las empresas hacen distintas y muy variadas valoraciones del desempeño laboral y también dependen del puesto) tales como asistencia-ausentismo (número de días laborados), productividad e índice de asuntos resueltos en el último mes (número de asuntos encargados/número de asuntos resueltos), etcétera. En ocasiones, las dimensiones o factores son pruebas (caso frecuente en ciencias físicas o de la salud). Por ejemplo, la medición fisiológica del sueño según lo determinado por la polisomnografía, (del griego poly, “muchos”; somno, “sueño”; y graphy, “escritura”) que no es otra cosa que una prueba de múltiples parámetros usada en el estudio del sueño.
Metodología de la investigación
El estudio polisomnográfico incluye tres estudios básicos: electroencefalografía (EEG), electrooculografía (EOG) y electromiografía (EMG). Los otros parámetros analizados son: electrocardiografía, oximetría de pulso, esfuerzo respiratorio, CO2 trascutáneo, registro de sonidos para evaluar ronquidos, EMG de extremidades y monitorización continua por video (Hall et al., 2008). Para reforzar este punto se recomienda que en el curso de la investigación se discutan en clase ejemplos de operacionalización de variables de la ciencia o disciplina en la cual se enmarca la asignatura (por ejemplo, en ingenierías, ver cómo se operacionalizan variables como presión, aceleración, volumen, masa, etc.; en medicina, presión arterial, crecimiento de un tumor cancerígeno, obesidad, etc.; en administración, productividad de los trabajadores —dependiendo del tipo de organización— , rentabilidad de la empresa, etc.; en psicología, autoestima, depresión, personalidad, etcétera).
Fase 4: Decisiones claves Una vez evaluados varios instrumentos (al menos un par en el caso de estudiantes de licenciatura o pregrado) que se utilizaron previamente, es necesario tomar una serie de decisiones fundamentales, que agrupamos en tres rubros: 1. Utilizar un instrumento de medición ya elaborado, adaptarlo o desarrollar uno nuevo
En el primer caso, debemos elegir un instrumento que obviamente se encuentre disponible (“esté a la mano” y podamos utilizarlo sin violar ningún derecho de autor) y sea posible su aplicación (al respecto, debemos cuestionarnos si en realidad podemos administrarlo). Asimismo, debemos seleccionar que: a) se haya generado lo más moderno posible; b) se cite con mayor frecuencia y amplitud en la literatura; c) sea bien evaluado por expertos de asociaciones académicas y profesionales; d) demuestre mayor confiabilidad, validez y objetividad; e) se pueda aplicar más a nuestro planteamiento y propósito de recolección de datos; f) se adecue mejor a nuestra muestra y contexto, y g) se adapte en mayor medida a las aptitudes que tenemos (que estemos más calificados para utilizarlo). Solo deben seleccionarse instrumentos que reporten fiabilidad, validez y objetividad ya que no es posible confiar en una forma de medir que carezca de este tipo de evidencia clara y precisa. Cabe señalar que algunos instrumentos se han validado para contextos iberoamericanos. Por ejemplo, la Escala Clima-UNI con 96 ítems para medir el clima organizacional, puede ser aplicada tal cual al medio laboral mexicano (Hernández-Sampieri, Méndez y Contreras, 2013 y Hernández-Sampieri, 2005). Su confiabilidad promedio es de 0.95 y posee evidencia de validez de todo tipo. Desde luego, si se quisiera administrar en otra nación latinoamericana, debe volver a validarse y, en el caso de España, tendría que adecuarse. Si se trata de una herramienta escrita (como un cuestionario), es ineludible revisar la redacción. En la segunda situación, elinstrumento elegidose adapta al ambiente de nuestro estudio; esdecir, se realizan algunos ajustes a supresentación, instrucciones, ítems (preguntas, categorías de observación, etc.). ambién se revisan cuidadosamente el lenguaje y la redacción. Este es el caso de instrumentos que se traducen y validan. Por ejemplo, el instrumento Children’s Knowledge of Abuse Questionnaire-Revised generado en Estados Unidos y (CKAQ-R), versión en español,2 fue adaptado de su homólogo, el cual fue se tradujo como Cuestionario del Conocimiento del Abuso Infantil-Revisado. Si ninguna de las dos opciones anteriores resulta satisfactoria, tenemos que desarrollar uno propio. Este puede elaborarse a partir de varios instrumentos previos, de nuevas concepciones e ítems, o bien, una mezcla de estos. Para tal efecto, idealmente debe generarse un conjunto de ítems y/o categorías para los indicadores de cada dimensión, con el apoyo de un grupo de expertos (en una o varias sesiones del tipo denominado “tormenta de ideas”). Posteriormente, los ítems se deben someter a evaluación de otros expertos y redactar la introducción e instrucciones. Por ejemplo, HernándezSampieri (2005), construyó su instrumento mediante la selección de ítems de varios cuestionarios y escalas desarrolladas en Estados Unidos, y otras más que habían sido aplicadas en México, además de incluir nuevos reactivos. 2 Este instrumento es parte del ejemplo “El abuso sexual infantil” tratado en la sexta edición impresa de Metodología de la investigación (capítulos cuantitativos), cuyo reporte del estudio srcinal se presenta en forma de artículo académico en los ejemplos de este centro de recursos en línea o página web.
5
6
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
Una vez más, recordemos que el tránsito de la variable a los ítems es progresivo, como se muestra en el siguiente ejemplo:
Ejemplo Variable
Dimensión
Intención de voto por partido
Intención del voto para las próximas elecciones para alcalde
Intención de voto por candidato
Indicadores
Ítems
Intención de voto favorable
En las próximas elecciones para alcalde, ¿por qué partido piensa votar? (con sus opciones de respuesta)
Intención de voto desfavorable
En las próximas elecciones para alcalde, ¿por qué partido nunca votaría? (con sus opciones de respuesta)
Intención de voto favorable
En las próximas elecciones para alcalde, ¿por qué candidato piensa votar? (con sus opciones de respuesta)
Intención de voto desfavorable
En las próximas elecciones para alcalde, ¿por qué candidato nunca votaría? (con sus opciones de respuesta)
2. Resolver el tipo de instrumento, formato y/o procedimiento
La segunda decisión es simultánea a la primera cuando se utiliza un instrumento ya elaborado o adaptado, pues este ya posee sus características y tiene un formato y procedimiento propios. Sin embargo, cuando se desarrolla uno nuevo, elescala investigador debe decidir qué tipo seráetc.) (cuestionario, procedimiento, hoja de observación, de actitudes, pruebade estandarizada, y cuál seráaparato, su formato y procedimiento de aplicación, lo cual depende dela clase y características físicas (tamaño, colores, tipo de fuente, especificaciones de papel y aspectos similares). Por ejemplo, no es lo mismo un cuestionario escrito en papel que uno incluidoen una página web, e incluso que un cuestionario en tableta. O bien, para medir la masa corporal hay distintos escáneres. 3. Determinar el contexto de administración Este paso implica decidir en qué espacio físico se implementará (si en un aula de capacitación, en un salón de clases, en la calle, en los hogares, de manera telefónica, en una cámara Gesell, en un laboratorio, en el consultorio, en una sala ambulatoria, en un acelerador de partículas, etc.). Desde luego, la naturaleza de los datos que se buscan y el tipo de instrumento elegido nos ayudan en esta tarea. Por ejemplo, ya sabemos que si deseamos datos escritos y vamos a utilizar un cuestionario, este puede administrarse en distintos contextos, mientras que si nuestro interés es observar, lo podemos hacer en un lugar público, en un salón o en una cámara Gesell. Cuando se comentó sobre las formas de aplicar cuestionarios se profundizó en el tema, pero en el caso de pruebas estandarizadas estas suelen administrarse en lugares que permitan a los participantes concentrarse, como aulas universitarias, salones de hoteles y despachos privados. En cambio, la observación depende de los hechos o conductas que se pretende registrar.
Fase 5: Construcción del instrumento En esta etapa se generan todos los ítems o reactivos (o escalas de valores) y categorías del instrumento, de acuerdo con la naturaleza de este y su formato. Recordemos que un ítem es, por ejemplo, una pregunta
Metodología de la investigación
de un cuestionario, una categoría de un sistema de observación, un valor en la escala de un dispositivo o una estadística en un sistema de registro. Al final de esta etapa el producto es una primera versión del instrumento. Una parte muy importante de ella es cómo vamos a registrar los datos y el valor que les otorgaremos (codificación).
Fase 6: Prueba piloto Esta prueba consiste en administrar el instrumento a personas, objetos o fenómenos con características semejantes a las de la muestra objetivo de la investigación (unidades). Se somete a prueba no solo el instrumento de medición, sino también las condiciones y contexto de aplicación y los procedimientos involucrados. Se debe verificar que las instrucciones se comprenden y que los ítems (lecturas o equivalentes) funcionen de manera adecuada. En el caso de cuestionarios, se debe evaluar el lenguaje y la redacción. Los resultados se utilizan para calcular la confiabilidad inicial y, de ser posible, la validez tentativa del instrumento de medición. La prueba piloto se realiza con una pequeña muestra (inferior a la muestra definitiva). Recordemos que el tamaño de la muestra para la prueba o estudio piloto se puede calcular utilizando SAS®, donde el tamaño de la población o universo es el tamaño de la muestra calculado y el nivel de confianza puede ser de 95 o 99%. Es decir, y valga la redundancia, se extrae una muestra de la propia muestra de la investigación. Por ejemplo, Hernández-Sampieri (2005) aplicó el cuestionario del clima organizacional a una prueba piloto en dos muestras de 30 y 32 participantes, respectivamente. La confiabilidad inicial de estas pruebas fue de 0.91 y 0.92. En ocasiones, el instrumento se somete a varias pruebas piloto y se depura paulatinamente (en el caso de dispositivos, se calibran). Núñez (2001) generó una primera versión de su escala del sentido de vida (conformada por 135 reactivos), la aplicó a un grupo y realizó ajustes sobre los resultados; posteriormente, una segunda versión (180 ítems) fue administrada a otro grupo piloto similar al primero; se volvieron a efectuar cambios en el instrumento, hasta que llegó a una versión final, la cual contenía 99 reactivos. Cabe señalar que cuando se desarrolla un nuevo instrumento, es conveniente incluir un elevado número de ítems, para elegir a los que más contribuyan a su confiabilidad, validez y objetividad. Desde luego, sin excedernos ni caer en redundancias excesivas, es decir que el número o cantidad de reactivos debe ser manejable. Además, la inclusión de cada ítem debe estar justificada (Neuman, 2009). Por ello, se recomienda que los reactivos se generen mediante una o varias sesiones con expertos (DeVellis, 2012 y Gall, Gall y Borg, 2003), los cuales pueden ser profesores universitarios, consultores de empresas y especialistas en el tema de estudio. Cuando no encontramos expertos, nuestra revisión de la literatura tiene que ser exhaustiva y profunda. Como ya se comentó, la prueba piloto evalúa todo el procedimiento de medición. Así, por ejemplo, en el experimento de Naves y Poplawsky (1984), se evaluó la conducta de aceptación-evitación de los participantes hacia el supuesto individuo con capacidad mental distinta (que recordemos era un actor) mediante observación. Cada interacción se filmó y se analizó. Durante la prueba piloto se descubrió que la iluminación era insuficiente y no se podían registrar ciertas conductas no verbales; ante ello, la prueba se perfeccionó. En el caso de instrumentos para aplicar mediciones en personas, parte fundamental de la prueba piloto consiste en conversar con los participantes para recoger sus opiniones con respecto al instrumento y al contexto de aplicación (por ejemplo, si lo consideran largo o corto, comprensible, no intrusivo, etc.). Una vez, al comenzar una prueba piloto de un instrumento para evaluar al superior inmediato, uno de los participantes inquirió: “En el cuestionario se pregunta sobre nuestro jefe, pero, ¿a cuál de ellos se refieren? Porque en estos momentos en el área de producción tenemos dos superiores, el de siempre, nuestro supervisor regular; pero como estamos fabricando un nuevo modelo de automóvil, también tenemos un superior de este proyecto”. Sin la prueba piloto, al levantar los datos no se hubiera sabido a qué superior se referían, y la confusión hubiera sido inevitable.
7
8
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
A continuación incluimos algunas recomendaciones para tal prueba en el caso de instrumentos escritos (cuestionario, examen o prueba estandarizada).3 • •
• •
•
Es aconsejable que se otorguen espacios para comentarios de los participantes. Solicitar a los participantes que señalen ambigüedades, opciones o categorías no incluidas, términos complejos y redacción confusa. omar en cuenta y evaluar lo que escribieron los participantes durante todo el proceso. Estar atento a que no se presenten “patrones tendenciosos” por efecto del instrumento en: a) el orden de las preguntas, b) el orden de las opciones de respuesta, c) tendencias en las respuestas (por ejemplo: que siempre tiendan a estar de acuerdo o en contra de todo, sin que realmente sea su opinión; o que respondan “no sé” a una buena parte de las preguntas; que dejen de contestar a varios ítems, etcétera). Simular las condiciones reales de administración de la mejor manera posible (por ejemplo, si el cuestionario va a enviarse por correo, la prueba piloto debe hacerse por este medio: se les envía y, posteriormente, pero de manera inmediata, se les reúne en grupo para comentar o, al menos, se simulan las condiciones en el grupo: a los participantes se les entrega el cuestionario en un sobre postal, el cual abren y leen, etcétera).
Fase 7: Versión final Así, con los resultados de la prueba piloto, el instrumento de medición preliminar se modifica, ajusta y mejora, dependiendo de su tipo: se calibra el dispositivo, se reconsideran escalas o categorías, se eliminan o agregan ítems, se cambian palabras, se otorga más tiempo para responder, etc. Finalmente, se tiene la versión definitiva administrar (si se trata de cuestionarios, se incluye un diseño gráfico atractivo para los participantes y de acuerdo con el medio: impreso en papel, página web, tableta o PC, etcétera).
Fase 8: Entrenamiento del personal Las personas del equipo de investigación que van a administrar y/o calificar el instrumento, ya sea que se trate de operadores, entrevistadores, observadores, encuestadores o individuos que dirijan las sesiones para aplicarlo, deben recibir un entrenamiento en varias cuestiones: a) La importancia de su participación y su papel en el estudio. b) El propósito del estudio. c) Las personas e instituciones que patrocinan y/o realizan la investigación. d) La calendarización y tiempos del estudio (fechas claves de entrega de información). e) La confidencialidad que deben guardar respecto de la investigación y sobre todo de los participantes. Esta no puede violarse bajo ninguna circunstancia. f) La manera en que deben vestirse si van a entrevistar o tener contacto con los participantes. g) El respeto y la sensibilidad que deben tener hacia los participantes (por ejemplo, no discriminar ni utilizar lenguaje que pudiera resultar ofensivo). h) No discutir ni molestarse con los participantes (ya que nos están haciendo un favor). i) Cómo establecer un ambiente de confianza. j) Usar gafetes y cartas de identificación. k) El instrumento de medición (estructura, orden, ítems, instrucciones para el personal y para los participantes) y sus condiciones de administración. Durante el entrenamiento, el personal que aplicará y/o calificará las respuestas o mediciones debe realizar ensayos aolaprocedimiento, vista de todos (de observación, aplicación prueba, implementación de varios un dispositivo etc.),entrevista, porque ello la permitirá corregir de aquellas situaciones que puedan afectar la objetividad y el correcto desempeño en la recolección de los datos. El entrenamiento puede llevarse a cabo mediante una o más sesiones, según sea el caso. Se recomienda —al menos— una reunión previa al inicio de la recolección de datos y una después del levantamiento 3 Algunas de estas sugerencias fueron adaptadas de Mertens (2010) y Koretz (2009).
Metodología de la investigación
de estos. Durante la sesión o sesiones se motiva al personal, se escuchan sus sugerencias y se responden inquietudes.
Fase 9: Autorizaciones Antes de recolectar los datos, es necesario gestionar varias autorizaciones, las cuales dependen del contexto de la investigación. Por ejemplo, en estudios con materiales delicados (sustancias radioactivas o peligrosas), de parte de organismos públicos que supervisan su manejo y utilización. Si se trata de estudios en empresas, se necesita el permiso por parte de los representantes de las organizaciones a las cuales pertenecen los participantes (directivos y líderes sindicales, directores y maestros en las escuelas —si son menores de edad, de sus tutores,—, funcionarios gubernamentales, etcétera). Para este fin conviene producir una breve presentación del estudio en un programa para tal efecto (Power Point, Flash, Prezi, etc.) e idealmente en algún formato multimedia o de video (que pueda reproducirse utilizando un programa para PC, DVD u otros dispositivos) y presentar el protocolo o proyecto escrito que de cualquier manera debemos elaborar. En segundo término, es ineludible obtener el consentimiento de los propios participantes, en particular por escrito. Desde luego, en encuestas en la vía pública o en los hogares, a veces esto resulta complicado y la autorización suele ser verbal o implícita. El asunto es más delicado cuando se trata de menores de edad y personas con capacidades diferentes. En este caso, el consentimiento tienen que otorgarlo los tutores y las personas que se integrarán a la muestra. No obtenerlo o lograrlo mediante engaños es una clara violación a la ética de la investigación. No puede filmarse a alguien sin su autorización, salvo conductas públicas manifiestas (consultar capítulo 2 de este centro de recursos en línea).
Fase 10: Administración del instrumento Este es el momento de la verdad, en el cual todo nuestro trabajo conceptual y de planeación se confronta con los hechos. La administración depende del tipo de instrumento que hayamos seleccionado y la experticia de todo el equipo que participa. Debemos aclarar que una cuestión es el tipo de instrumento en sícierta y otraconfusión el contexto administración. En la literatura sobre recolección de datos cuantitativos todavía hay al de respecto. Por ejemplo, ciertos autores desarrollan el tema de los “cuestionarios” en las secciones de surveys o encuestas, otros en el apartado sobre entrevistas, algunos más los consideran en sí mismos como un tema o los incluyen en medición. Debido a estas diferencias, hemos decidido ver en el capítulo 9 del libro y en este capítulo del centro de recursos en línea cada instrumento y los contextos más comunes en que se usan.
CONTEXTOS DE ADMINISTRACIÓN DE LOS CUESTIONARIOS En el capítulo 9 del libro (dentro del apartado “¿En qué contextos puede administrarse o aplicarse un cuestionario?”), se comentaron los principales contextos de administración de los cuestionarios. Ahora, en esta sección reforzaremos algunos aspectos sobre el tema.
Autoadministración grupal Cuando el cuestionario se aplica grupalmente, es importante verificar algunas cuestiones, que se incluyen en la tabla 7.2.
Autoadministración por envío En el caso de autoadministración por envío mediante el correo o mensajería , el cuestionario se remite junto con una carta explicativa firmada por el investigador o investigadores, la cual cumple las funciones de la introducción (con los elementos comentados previamente en el capítulo 9 del libro: propósito del estudio, motivadores, agradecimiento, tiempo de respuesta, etc., excepto las instrucciones que suelen incluirse en el instrumento). Si la carta está membretada con el logotipo del instrumento, mejor aún.
9
10
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
Tabla 7.2 Listado de puntos a verificar al administrar cuestionarios en grupo.4 1.¿Tenemossuficientescuestionarios?
Sí ______________
No ______________
2. ¿Hemos diseñado alguna medida para que quienes no puedan asistir a la sesión respondan al cuestionario?
Sí ______________ ¿Cuál? ______________
No ______________
3. ¿Se notificó formalmente a los participantes potenciales de la fecha, hora y lugar en que se aplicaría el cuestionario?
Sí ______________ ¿Cómo? (carta, correo electrónico, memo, mensaje) ______________
No ______________
4. ¿Se verificó que el lugar donde se aplicará el cuestionario presenta las condiciones adecuadas de espacio e iluminación?
Sí ______________ ¿Quién verificó? ______________
No ______________
5. ¿Se aisló el lugar de fuentes potenciales de ruido u otras distracciones?
Sí ______________
No ______________
6. ¿Quiénes van a leer las instrucciones y asistir a los participantes a lo largo de la sesión?
Persona(s): ______________
No hay designados ______________
7. ¿Las instrucciones incluyen cómo responder al cuestionario?
Sí ______________
No ______________
8. ¿Se contempló un tiempo razonable para responder dudas e inquietudes de los participantes antes de que comiencen a contestar el cuestionario?
Sí ______________
No ______________
9. Quienes van a leer en voz alta las instrucciones, ¿tienen una voz nítida y suficientemente fuerte para que todos le escuchen y su lectura será pausada?
Sí ______________
No ______________
10. ¿Se verificará que todos hayan respondido al cuestionario?
Sí ______________
No ______________
11. ¿Quién dará las gracias a los participantes por su cooperación?
Persona(s): ______________
No hay designados ______________
12.o¿Quién entregará enviará las cartas de agradecimiento equivalentes a loso participantes y a quienes facilitaron la sesión? ¿A través de qué medios?
Persona(s): ______________ Medios: ______________
No hay designados ______________
4 Adaptado de McMurtry (2005).
Metodología de la investigación
Se recomienda que los cuestionarios sean breves y concisos de acuerdo al planteamiento y los objetivos de medición. Si al hablar de otros instrumentos autoadministrados se comentó que las instrucciones deben ser precisas y claras, esta condición resulta particularmente importante en estos casos, ya que las posibilidades de realimentación y resolución de dudas se reducen al mínimo. La carátula, además de lo que se señaló previamente, debe contener la fecha exacta de envío. En las instrucciones es necesario agregar la fecha en que se requiere sea devuelto y la forma de regresar el cuestionario contestado, paso a paso. De ser posible, resulta aconsejable designar a una persona para que atienda dudas y comentarios del instrumento y el estudio, por medio telefónico, correo electrónico y/o una red social (whatsApp, twitter o facebook, por ejemplo). Obviamente, esta persona tiene que proporcionar sus datos completos. Ofrecer a los participantes un resumen de los resultados, una vez que concluya la investigación, es una práctica recomendable (este informe se puede enviar por correo electrónico, mostrar en una página web o equivalente). Asimismo, el paquete para cada individuo potencial incluye dos sobres personalizados: uno que contiene el cuestionario y la carta, y el otro para que devuelva el cuestionario cumplimentado. Desde luego, este último con los datos completos del remitente (destinatario final) y con el porte de regreso o la guía de paquetería prepagada (es necesario cubrir todos los gastos generados en este proceso). Un diseño srcinal de los sobres puede ser de gran ayuda, al menos para que sean abiertos. Es fundamental contactar vía telefónica y/o correo electrónico al futuro encuestado, para motivarlo a que conteste el cuestionario. Una vez que se reciba su respuesta, es preciso agradecerle su cooperación. Algunas personas se niegan a participar en investigaciones, porque fueron tratadas con descortesía una vez que se obtuvo de ellas lo que se deseaba. Los cuestionarios autoadministrados pueden ser procesados de forma casi inmediata si se usa codificación por lectura óptica u otros medios electrónicos. Es decir, si el papel del cuestionario cubre ciertos requisitos y es respondido con un lápiz o bolígrafo especial o en computadora, celular o tableta, se evita la codificación, puesto que el sistema lee las respuestas y automáticamente las envía a la base de datos correspondiente. Vinuesa (2005) señala que la encuesta por correo postal permite una selección muestral de los participantes de acuerdo con su perfil sociodemográfico, de compra, estilo de vida, etc., y de individuos concretos (profesionales, miembros de alguna asociación, etcétera). Algunas desventajas residen en que nunca podremos estar seguros de quién respondió el cuestionario y la ausencia de un encuestador impide asegurar la franqueza de las respuestas. Por correo electrónico. Se trata de un procedimiento similar, pues lo único que cambia es el medio de contacto y el cuestionario puede ser contestado en el dispositivo de quien responde (PC, laptop, tableta, celular, etc.). La carta, carátula, instrucciones y el cuestionario son enviados a través de un correo electrónico (e-mail). Por medio de una página de internet o servidor de la web. Esta vía es similar a las dos anteriores en cuanto a la mecánica. Sin embargo, en este caso se le pide al participante (por contacto telefónico, correo electrónico, mensaje en celular u otro medio; o bien, mediante una red social en internet) que acceda a un sitio web o hipervínculo (locación URL única),5 donde se localiza el cuestionario, el cual se puede contestar en el momento o por etapas; otra modalidad puede ser que se “descargue” o “baje” el cuestionario para guardarlo como archivo en la computadora y posteriormente, una vez contestado, se envía por correo u otro mecanismo electrónico.6 Los cuestionarios utilizados en medios electrónicos regularmente se elaboran en un programa de texto e imagen, o se escanean (si están impresos con anterioridad) y “se anexan” al correo electrónico (como un “archivo adjunto”), o se pueden colocar o “subir” al sitio web, aunque para este segundo caso lo más común es que se elaboren especialmente para tal medio. En ambas situaciones, las posibilidades de diseño del instrumento son amplísimas.
5 El acceso puede ser público o limitado mediante contraseñas (ID) o números PIN. 6 Entre los principales programas para el uso de encuestas electrónicas podemos mencionar a: WebCT, Googledocs y Blackboard.
11
12
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
Las limitaciones de los estudios que utilizan el correo electrónico y la web residen en que no todas las personas poseen computadora e internet (sobre todo en América Latina) y algunos individuos (por ejemplo, los mayores de 60 años) se resisten a utilizar estos recursos, porque es una tecnología relativamente reciente y desconocida para gran parte de ellos. Varios estudios han encontrado que la mayoría de los usuarios de internet son personas educadas, jóvenes y de estratos medios o altos (y en Estados Unidos, Tabla 7.3 Ventajas y desventajas de administrar cuestionarios mediante internet.7 Costorelativamentebajo.
Ventajas
Desventajas Dificultaddeaccesoadirectorios.
Codificaciónautomática.
Nosesabequiéncontesta.
Normalmente se aplican rápidamente (pero no es una regla). Instrumentos con diseños sumamente atractivos e interactivos (por ejemplo, posibilidad de incorporar gráficas multimedia, sonido y videos). Elevado control del proceso de envío y recepción de cuestionarios.
Generalmente la muestra es no probabilística. No hay una elevada representatividad o poder de generalización. Riesgo de que quien responde se concentre más en la forma que en el fondo.
predominantemente blancos) (Nathan, 2008). Algunas ventajas y desventajas de aplicar cuestionarios vía internet se mencionan en la tabla 7. 3. La administración de cuestionarios por internet es útil en estudios exploratorios y descriptivos (Nathan, 2008). En cuanto a las tasas de respuesta por internet y correo, la situación es variable y las investigaciones a este respecto arrojan distintos resultados. Fricker y Schonlau (2002), en una primera revisión de estudios que recolectaron datos a través de la web (muestras probabilísticas o censos), reportan índices de entre 38 y 44%, que son las más altas las que se conocen entre empleados, y un estudio entre estudiantes con una tasa de 8%. En otra revisión de la literatura, consideraron investigaciones en las cuales preguntaban a los encuestados si preferían contestar vía internet o mediante el correo, oportunidad en la que descubrieron preferencias mucho mayores por el segundo medio (seis investigaciones con porcentajes que oscilaron entre 73 y 96%, mientras que por internet el porcentaje varió entre 4 y 27%). Solo se conoce un estudio donde la elección por internet fue de 80% y por correo tradicional 20%, y una entre dentistas con tasas de 84% y 16%, respectivamente, lo que podría indicar que personas con alto nivel educativo y tecnológico prefieren la web para responder a cuestionarios. En una tercera revisión de trabajos donde se compararon el correo electrónico y el correo tradicional, en ocho estudios se obtuvo una tasa de respuesta mayor o mucho mayor vía este último (las muestras incluyeron profesores y empleados federales). Solo en el caso de colaboradores de la empresa telefónica A& la tasa fue de 38% por correo y 68% por e-mail). En otros tres estudios, en dos se prefirió el primer modo. En definitiva, todavía no hay claridad sobre cuál tipo de contexto de administración es mejor en términos de calidad de la información obtenida y las tasas de respuesta, lo que significa que se requiere mayor investigación al respecto (Fowler, 2014 y Carley-Baxter, Peytchev y Black, 2010). Desde luego, como menciona Mertens (2010), una tasa de devolución de cuestionarios cumplimentados por correo o de manera electrónica por encima de 50% es muy favorable. Asimismo, el tópico o tema está relacionado con la tasa de respuesta y puede interactuar con el medio elegido (Carley-Baxter, Peytchev y Black, 2010). En ello también influye el contexto histórico, social y económico del momento en el que se lleva a cabo el levantamiento de datos. Por ejemplo, si el entorno está caracterizado por violencia y delincuencia, preguntar sobre temas de seguridad pública y criminalidad puede ser delicado debido a que las personas pueden atemorizarse al responder o pensar que hay “trasfondo” en la recolección de respuestas. Preguntar sobre asuntos de salud en el momento de una epidemia, 7 Tourangeau, Conrad y Couper (2013); Sue y Ritter (2012); Nathan (2008) y Couper (2003).
Metodología de la investigación
también resulta inconveniente. Otro caso de estos se presenta cuando se inquiere sobre niveles socioeconómicos o temas relacionados cuando se ha concretado una reforma fiscal o acciones de fiscalización. Las encuestas de casa en casa son problemáticas si hay robos en la ciudad o comunidad, pues las personas no permiten el acceso a sus domicilios y ni siquiera desean contestar en las puertas de sus hogares. La desconfianza es mayúscula. Las tasas de respuesta por cualquier medio se incrementan cuando: 1) quienes responden al cuestionario reciben beneficios económicos, 2) los instrumentos no son extensos, 3) se produce un seguimiento sistemático de las respuestas y persistente a casos de no respuesta, 4) se establece una vinculación personal con los participantes y 5)hay contacto antes del envío (Häder, 2012; McCarty, House, Harman y Richards, 2006 y Cook, Heath y Tompson, 2001 y 2000).
De acuerdo varios experimentos tipos efectos de estudios, en encuestas donde el cuestionario es contestado encon dispositivos pequeños sey otros producen negativos en las respuestas (Peytchev y Hill, 2010). Si algunas opciones no aparecen en la pantalla, algunos participantes señalan no haber visto todas las categorías o ignorar aquellas que necesitan de recorrer la pantalla. Lo mismo en las preguntas, varios sujetos contestan con base en la parte de la interrogación que se percibe primero. En ocasiones, si los teclados son pequeños, los encuestados no proporcionan toda la información requerida, incluso evitan contestar ciertas preguntas. En ocasiones, con pantallas y teclados miniatura surgen sesgos al contestar (por ejemplo, marcar regularmente la primera opción). Este mediocre panorama puede mejorar en el futuro cuando las personas de todas las edades se familiaricen con estas tecnologías. Es necesario efectuar más investigación sistemática en relación con el tema. Otra ventaja de la autoadministración por envío (correo tradicional, correo electrónico y página de internet) es que cuando se hacen preguntas personales o de mayor carga emotiva, el sujeto puede contestar de manera más relajada y sincera, puesto que no está frente a otra persona.
Entrevistas interactivas y telefónicas Una posibilidad novedosa son lasentrevistas interactivas(algunas representan modalidades telefónicas, otras se trata de los denominados “medios inteligentes” de correo electrónico o de sitios web), en donde un sistema se contacta vía telefónica o por correo electrónico con los participantes potenciales y administra el cuestionario o lo envía. Son mecanismos con reconocimiento de voz, lectura óptica y dictado digital. El problema es —hasta el momento— que la mayoría de las personas se percata de que no es otro ser humano con quien entra en contacto y suele negarse a responder. Además, la saturación de correos electrónicos, llamadas telefónicas y sitios web hacen difícil captar la atención de los participantes potenciales. Si se utilizan estos sistemas, se aconseja que los cuestionarios sean muy breves, no más de diez preguntas. Desde luego esta situación irá modificándose y cada vez serán más los estudios que utilicen tales tecnologías. Para administrar cuestionarios vía entrevista telefónica se dispone de varias tecnologías, además de las ya comentadas de reconocimiento de voz y dictado digital, como el CAI (Computer-Assisted elephone Interviewing), la cual permite que el entrevistador se siente frente a su computadora u ordenador, cuyo sistema selecciona números telefónicos generados al azar y los marca automáticamente (Outwater, 2008 y Boslaugh, 2007). Una vez que contesta la persona indicada, él comienza a leer las preguntas en el monitor y anota las respuestas (desde luego, mediante el teclado o el mouse), las cuales son capturadas y codificadas de manera automática. El sistema gestiona el desarrollo de la entrevista, ya que remite a las opciones adecuadas (en caso de preguntas condicionadas, como por ejemplo: “¿iene usted una cuenta en este banco, sí o no?” Si la respuesta es “sí”, el sistema continúa con la siguiente pregunta enlazada: “¿Qué servicios usa…?” Pero si la respuesta fue un “no”, puede concluir con un muchas gracias…, o pasar a otras preguntas). El entrevistador puede utilizar diademas con audífonos y micrófono. O bien, el sistema tiene la facilidad de reconocimiento de voz y de capturar directamente la respuesta. Es una interfase con el Random Digit Dialing (Sue y Ritter, 2012 y Outwater, 2008). Algunas recomendaciones para las entrevistas telefónicas son las siguientes:8 8 Mertens (2010); Kuusela, Callegaro y Vehovar (2009) y The Psychology Research Handbook (2006). Esta última fuente es una excelente introducción para el alumno que comienza a adentrarse en las encuestas telefónicas.
13
Tabl Tabla 6.3 Ejemplos adicionales de encuesta en áreas de salud (continuación). 14
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
1. Reclutar entrevistadores con habilidades de comunicación verbal (voz clara, capacidad de realimentar,
manejo de conflictos verbales, agilidad mental para responder, etcétera). 2. Asignar a una persona que monitoree permanentemente a los entrevistadores (supervisor). 3. Enviar una carta, telefonema o correo electrónico previo, en que se indique el objetivo de la entrevis-
ta, la persona o institución que realiza la encuesta y el día y hora en que se efectuará la comunicación telefónica. 4. Llevar a cabo la comunicación en el día y hora acordados. 5. El entrevistador debe identificarse y recordarle al entrevistado el propósito del estudio; asimismo, debe asegurarse de que es un buen momento para la comunicación. 6. Entre la comunicación previa y la entrevista telefónica no debe pasar más de una semana (programar llamadas adecuadamente).
7. El entrevistador debe asegurarse de que está hablando con la persona correcta o que posee el perfil
adecuado según la definición de la muestra. 8. Indicar el tiempo que tomará la entrevista. 9. Utilizar un cuestionario breve con preguntas preferentemente estructuradas (cerradas) y sencillas. 10. 11. 12. 13. 14.
Más de 15 o 17 preguntas suelen complicar la situación. El entrevistador debe vocalizar correctamente y a la misma velocidad de su interlocutor. Anotar casos de rechazos y las razones. En el entrenamiento, simular las condiciones de aplicación (igual en la prueba piloto). Establecer metas de comunicaciones telefónicas por hora. Si se pretende grabar la entrevista, debe interrogarse al participante si está de acuerdo con ello.
Desde luego, estas recomendaciones se aplican a una encuesta telefónica cuyos tiempos de ejecución son extensos. Sin embargo, en ocasiones tenemos que realizar sondeos inmediatos para obtener tendencias en la opinión pública y algunas de estas recomendaciones no son pertinentes. Por ejemplo, después de una catástrofe (como un magnicidio, acto terrorista o desastre natural), una noticia mundial (la elección de un nuevo pontífice, una invasión de un país o un acuerdo de paz) o local (un triunfo electoral, un nuevo impuesto o el rechazo a un mandatario). ales fueron los casos de las encuestas que se realizaron en los días posteriores al asesinato de J. F. Kennedy (Sheatsley y Feldman, 1964), las que se efectuaron después de los ataques terroristas del 11 de septiembre de 2001 en Nueva York (University of Southern California y Bendixen & Associates, 2002), las que se realizaron con motivo de los atentados ocurridos en Madrid el 11 de marzo de 2004 (Michavila, 2005), las ulteriores a las explosiones del 7 de julio de 2005 en Londres (COMPAS, 2005; Te Harris Poll, 2005 y British Broadcasting Corporation, 2005), la encuesta telefónica nacional que se implementó en México luego del brote del virus de la influenza humana (Consulta Mitofsky, 2009) y la que se aplicó también en México después de la elección del papa Francisco (BGCExcélsior, 2013). Finalmente, es necesario destacar la importancia de no realizar investigaciones que requieran enviar el cuestionario en épocas complejas del año (vacaciones de verano o invierno: en Navidad la saturación es impresionante) o que lo sean para la población en estudio (por ejemplo, a fiscalistas y contadores de empresas durante momentos de cierres contables y pago de impuestos; a las personas de edad avanzada en épocas de frío extremo, etcétera).
Un apunte: comparación entre contextos de entrevistas personales Jaffe, Pasternak y Grifel (1983) hicieron un estudio para comparar, entre otros aspectos, las respuestas obtenidas eny los dosresultados puntos: enconcluyeron el hogar y en losselugares deobtener venta. El estudio se interesaba la conducta comprador que pueden datos exactos en ambosen puntos, aunquedel la entrevista en los lugares de compraventa es más barata. A la misma conclusión llegaron Hernández-Sampieri, Cuevas y Méndez (2009), quienes entre 2007 y 2009 hicieron ocho encuestas para conocer la intención del voto y las tendencias electorales en varios municipios de México, y encontraron resultados similares a las que arrojaron las entrevistas en el hogar y en sitios públicos (parques, mercados, centros comerciales, etcétera).
6.4 Ejemplos adicionales de encuestas.
Metodología de la investigación
Aplicaciones multimodales de cuestionarios El ideal de la aplicación de cuestionarios es la versión multimodal o su implementación utilizando varios contextos de administración (por ejemplo, en encuestas), la cual se ha popularizado en los últimos años y combina diferentes maneras de recolectar la información en un mismo proyecto de investigación que incluye datos cuantitativos y cualitativos. Por ejemplo, utilizar la encuesta tradicional por entrevista personal para obtener datos cuantitativos básicos y respuestas a unas cuantas preguntas abiertas, junto con otras formas complementarias como la encuesta telefónica (tanto a teléfonos fijos como móviles o celulares) para realizar preguntas muy cortas y cerradas, la encuesta por internet para penetrar ciertos aspectos mediante preguntas abiertas y otras más complejas, y la administración de cuestionarios grupales con la finalidad de lograr profundidad en determinadas respuestas. Aunque, desde luego, las preguntas centrales son las mismas. Se recomienda este enfoque cuando se dispone de un presupuesto suficiente y se pretende elucidar problemas asociados con la potencial cobertura deficiente que implica utilizar un solo método o incrementar las tasas de respuesta (Link, 2008). ambién, cuando se intenta acceder a diversas poblaciones con distintas características, como disponibilidad de teléfono e internet, dispersión geográfica y nivel socioeconómico y educativo. Por ejemplo, una encuesta que sea administrada a diversos tipos de personas del sector salud: funcionarios o ejecutivos (que como tienen poco tiempo para responder el cuestionario puede ser autoaplicado), enfermeras y empleados de apoyo (administración grupal), médicos y pacientes actuales (mediante entrevistas personales), pacientes dados de alta (telefónica e internet), etcétera. Dillman, Smyth y Christian (2009) sugieren que cuando se implemente una encuesta multimodal, se limite a ciertas preguntas y que las opciones de respuesta sean las mismas entre los varios formatos (y se reduzcan categorías o se disponga de las alternativas básicas del método más sencillo, por ejemplo, el cuestionario para la versión telefónica), se eviten cambios en la estructura esencial de las preguntas para no modificar el estímulo, las instrucciones sean equivalentes en los diferentes modos y se efectúen pruebas pilotos con todos los instrumentos, para asegurar que siempre se obtenga la misma información de manera válida y confiable, lo cual depende del planteamiento del problema y lo que pretenda el investigador.
ESCALOGRAMA DE GUTTMAN En el libro Metodología de la investigación , 6ª edición, concretamente en las escalas de actitudes, como técnicas para recolectar datos, se comentaron el escalamiento tipo Likert y el diferencial semántico, por lo que quedó pendiente el escalograma de Guttman. Ahora lo consideraremos. 9 Este método para medir actitudes fue desarrollado por Louis Guttman (1916-1987). Se basa en el principio de que algunos ítems indican en mayor medida la fuerza o intensidad de la actitud. La escala está constituida por afirmaciones, las cuales poseen las mismas características que el escalamiento tipo Likert. Sin embargo, el escalograma garantiza que la escala mida una dimensión única. Es decir, cada afirmación mide la misma dimensión de la misma variable. A esta propiedad se le conoce como unidimensionalidad (Reckase, 2009). Algunos autores consideran que el escalograma, más que un método de medición de actitudes, es una técnica para determinar si un conjunto de afirmaciones reúne los requisitos de un tipo particular de escala (Engelhard, 2008; Shye, 2008 y Edwards, 1983). Para construir el escalograma es necesario desarrollar un conjunto de afirmaciones pertinentes al objeto de actitud, las cuales deben variar en intensidad (rochim, 2008). Por ejemplo, si pretendiéramos medir la actitud hacia la calidad del trabajo en el nivel gerencial, la afirmación “la calidad tiene que vivirse en todas 10
las actividades del trabajo y en el hogar”, es más intensa que “la calidad debe vivirse sólo en las actividades más importantes del trabajo”. Dichas afirmaciones se aplican a una muestra a manera de prueba piloto. Una 9 Para profundizar en esta escala, se sugiere consultar a DeVellis (2012); Abdi (2010); Roberts y Jowell (2008); Fabrigar y MacGregor (2006); Dunn-Rankin et al. (2004); Cliff, Kyats y Keats (2002); Weller y Romney (1990); Black y Champion (1976); Guttman (1976); Lingoes (1976); Dotson y Sumers (1976) y Nie et al. (1975). 10 Guttman hizo importantes aportaciones a la medición, además del escalograma, entre otras cuestiones, fue quien conceptualizó en 1944 los niveles de medición nominal, ordinal, de intervalos y de razón (Katz, 1988 y Stevens, 1951).
15
16
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
vez administradas, se procede a su análisis. Cabe mencionar que las categorías de respuesta para las afirmaciones pueden variar entre dos (“de acuerdo-en desacuerdo”, “sí-no”, etc.)o más categorías (por ejemplo, las mismas categorías que en el caso de Likert).
Técnica de Cornell La manera más conocida de analizar los ítems o las afirmaciones y desarrollar el escalograma es la técnica de Cornell (Guttman, 1976), en la cual se procede a: 1. Obtener el puntaje total de cada participante o sujeto en la escala. 2. Ordenar a los sujetos o encuestados de acuerdo con su puntaje total (del puntaje mayor al menor, de
manera vertical descendente). 3. Ordenar las afirmaciones de acuerdo con su intensidad (de mayor a menor y de izquierda a derecha). 4. Construir un cuadro donde se crucen los puntajes de los participantes ordenados con los ítems y sus categorías, de
manera jerarquizada.Así, tenemos un cuadro donde los sujetos constituyen los renglones y las categorías de los ítems forman las columnas, lo cual se representa en la figura 7.2. 5. Analizar el número de errores o rupturas en el patrón ideal de intensidad de la escala.
Figura 7.2 Manera de disponer los resultados para el análisis de ítems mediante la técnica de Cornell. Menos intenso Ítems
Categorías
Más intenso
Menos intenso
Personas
Puntajes De acuerdo con su puntaje
Mayor
Menor
Ejemplo Suponga que aplicamos una escala con cuatro ítems o afirmaciones a 14 participantes, cuyo objeto de actitud es “la calidad dentro de la organización” (la variable es la conciencia sobre la calidad por parte de los empleados).
La calidad de la organización, definida como “el grado en que los empleados de una empresa se orientan a cumplir con las especificaciones y requerimientos de los clientes en cuanto a sus productos y servicios” (en precio, tiempo de entrega, cumplimiento de estándares del mercado, etcétera). Cada afirmación tiene dos categorías de respuesta (“de acuerdo” y “en desacuerdo”, codificadas como uno y cero, respectivamente). Afirmación A: “La calidad tiene que vivirse siempre en todas las actividades del trabajo y en el hogar”. Afirmación B: “La calidad tiene que vivirse siempre en todas las actividades del trabajo”. Afirmación C: “La calidad tiene que vivirse solamente en las actividades más importantes del trabajo”. Afirmación D: “La calidad tiene que vivirse solamente en la actividad más importante del trabajo”. Los resultados se muestran en la tabla 7.4.
Metodología de la investigación
Tabla 7.4 Ejemplo de la técnica de Cornell para el análisis de ítems o afirmaciones. AFIRMACIONES A
B C D Sujeto DA ED DA ED DA ED DA ED (1) (0) (1) (0) (1) (0) (1) (0) (1) 1 2 3 4
PUNTUACIONES TOTALES
X
X
X
X
X X X
X X X
X X X
4 3
5 6 7 8 9 10 11 12
X X
X X
X X
X X
3 3
X X X X X X
X X X X X X
X X X X
X X X X X X
2 2 2 2 1 1
13 14
X X
X X
X X X
X X X X
4 4
X X
DA = de acuerdo o “1”
0 0 ED = en desacuerdo o“0”
Ahora bien, como se observa en la tabla 7.4, los participantes están ordenados por su puntuación en la escala total. Asimismo, las frases deben ordenarse por su intensidad (en el ejemplo, A tiene mayor intensidad que B, B mayor que C, y a su vez, C mayor que D), y sus categorías se encuentran jerarquizadas de acuerdo con su valor, de izquierda a derecha. Hay que recordar que si la afirmación es negativa, la codificación se invierte (si a la frase la calidad es poco importante para el desarrollo de una empresa recibe la respuesta “de acuerdo” se codificará con cero, y si es “en desacuerdo” con uno). En el ejemplo de la tabla 7.4 encontramos cuatro afirmaciones positivas. Los sujetos que estén “de acuerdo” con la afirmaciónA, que es la más intensa, muy probablemente también lo estén con las afirmaciones B, C y D, ya que su intensidad es menor. Los individuos que respondan “de acuerdo” a la afirmaciónB tenderán a estar “de acuerdo” conC y D (afirmaciones menos intensas), pero no necesariamente con A. Quienes estén “de acuerdo” conC lo más probable es que se encuentren “de acuerdo” conD, pero no necesariamente con A y B. Debe observarse que el individuo número 1 estuvo “de acuerdo” con las cuatro afirmaciones. Los casos 2 y 3 respondieron de igual forma. Las puntuaciones de estos equivalen a cuatro (1 + 1 + 1 + 1). Los participantes 4, 5 y 6 obtuvieron una puntuación de tres, pues estuvieron “de acuerdo” con tres afirmaciones y así sucesivamente (los últimos dos sujetos estuvieron “en desacuerdo” con todas las afirmaciones). En forma ideal, las personas que obtienen una puntuación total de cuatro en esta escala particular, es porque respondieron “de acuerdo” a las cuatro afirmaciones. Los individuos que alcanzan una puntuación total de tres respondieron que están “en desacuerdo” con la primera afirmación, pero “de acuerdo” con las demás afirmaciones. Quienes reciben una puntuación de dos manifiestan estar “en desacuerdo” con los dos primeros ítems, pero “de acuerdo” con los dos últimos. Del mismo modo, los participantes con puntuación de uno respondieron “en desacuerdo” a las tres primeras afirmaciones y “de acuerdo” a la última. Por último, aquellos que estuvieron “en desacuerdo” con las cuatro afirmaciones, recibieron una puntuación total de cero. Los sujetos se escalan de manera perfecta, sin que nadie rompa el patrón de intensidad de las afirmaciones: si están “de acuerdo” con la afirmación más intensa, también lo están con las menos intensas. En otro ejemplo, si estoy de acuerdo con la afirmación “podría casarme con una persona de nivel económico diferente al mío”, seguramente estaré de acuerdo con la afirmación “podría viajar en un
17
18
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
automóvil con una persona de nivel económico diferente al mío” (casarse es mucho más intenso que viajar). Cuando los individuos se escalan de manera perfecta respecto de las afirmaciones, se puede decir que los ítems en realidad varían gradualmente en intensidad. Es la prueba empírica de que están escalados por su intensidad. Se le denomina reproductividad al grado en que un conjunto de afirmaciones o ítems escalan perfectamente según su intensidad. Esto significa que el patrón de respuesta de una persona en relación con todos los ítems puede reproducirse con exactitud si tan solo se conoce su puntuación total en la escala completa (Roberts y Jowell, 2008 y Black y Champion, 1976). La reproductividad ideal se logra cuando nadie rompe el patrón de intensidad de la escala. Sin embargo, en la realidad sólo algunas cuantas escalas del tipo de Guttman reúnen la reproductividad ideal; la mayoría contienen inconsistencias o rupturas del patrón de intensidad. El grado en que se alcanza el patrón perfecto intensidad de la dicho escala patrón o reproductividad se que determina mediante el análisis delelnúmero de personas de o casos que rompen (Abdi, 2010), es el quinto paso para construir escalograma de Guttman.
Análisis del número de errores o rupturas del patrón ideal de intensidad de la escala Un error es una inconsistencia en las respuestas de una persona a una escala; es un rompimiento con el patrón ideal de intensidad de esta. La tabla 7.5 muestra tres ejemplos de error encerrados en círculos que, como puede verse, son inconsistencias del patrón ideal. El segundo participante respondió “de acuerdo” a los ítems más intensos o fuertes y “en desacuerdo” al ítem menos intenso. El cuarto sujeto manifestó estar “de acuerdo” con las afirmaciones B y C (supuestamente más intensas), pero “en desacuerdo” con D (supuestamente menos intensa). El quinto estuvo “en desacuerdo” con los ítems menos intensos, pero “de acuerdo” con el más intenso. Son inconsistencias o errores. Si un escalograma presenta diversos errores significa que los ítems en realidad no tienen distintos niveles de intensidad (o que los participantes no entienden o son deshonestos). Tabla 7.5 Ejemplos de errores o inconsistencias en un escalograma de Guttman.
AFIRMACIONES A B C D ujeto DA ED DA ED DA ED DA ED 1 2 3 4 5 6
X X X X X
X
X
X X X
X X X X X
X
PUNTUACIONES TOTALES
X
X X
4 3 3 2 1
X
X
0
X X
DA = de acuerdo o “1”
ED = en desacuerdo o “0”
Los errores se detectan mediante el análisis de las respuestas que rompen el patrón; para ello, se establecen los puntos de corte en el cuadro donde se cruzan las afirmaciones y sus categorías con las puntuaciones totales. En el ejemplo de la tabla 7.4, los “puntos de corte” serían los que se muestran en la tabla 7.6.
Metodología de la investigación
Tabla 7.6 Ejemplo de establecimiento de los puntos de corte en la técnica de Cornell. AFIRMACIONES A
B C D Sujeto DA ED DA ED DA ED DA ED (1) (0) (1) (0) (1) (0) (1) (0) 1 2 3 4 5
PUNTUACIONES TOTALES
X
X
X
X X
X X X X
X X X X
X X X X
6
X
X
X
X
4 3 3 3
7 8 9 10 11 12
X X X X X X
X X X X X X
X X X X
X X X X X X
2 2 2 2 1 1
13 14
X X
X X
X X X
X X X X
4 4
X X
DA = de acuerdo o “1”
0 0 ED = en desacuerdo o “0”
No se aprecia ninguna inconsistencia. En cambio, la tabla 7.7 muestra cuatro inconsistencias o errores; las respuestas están desubicadas respecto de los puntos de corte , es decir, rompen el patrón de intensidad (los errores están encerrados en un círculo.) Tabla 7.7 Ejemplo de errores respecto a los puntos de corte. AFIRMACIONES A B C D Sujeto DA ED DA ED DA ED DA ED (1) (0) (1) (0) (1) (0) (1) (0)
1 2 3 4 5
X
X
X
4
X X X X
X X X X
4
X X
X X X X
X
X
X
X
X X X X
X X X
X X X
6 7 X 8 9 10 X 11 12 X
PUNTUACIONES TOTALES
X X X
X X X X X X
4 3 3 3 3 2 2 2 1 1
X X X
X X
13
X
X
X
X
14
X
X
X
X
0 0
= Puntos de corte (líneas punteadas)
Como ya se mencionó, cuando el número de errores es excesivo la escala no presenta reproductividad y no puede aceptarse. La reproductividad se determina mediante un coeficiente, cuya fórmula es:
"
Coeficiente de reproductibilidad 1 − $ =
Número de errores
% '
# ( número de ítems)(número de sujetos) &
En este caso, el número total de respuestas es igual al número de ítems o afirmaciones multiplicado por el número de sujetos. Por lo tanto, la fórmula directa es:
19
20
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
"
% Número de errores ' # ( número de ítems)( número de sujetos) &
Coeficiente de reproductibilidad 1 − $ =
En el ejemplo de la tabla 7.7, el coeficiente de reproductividad es:
Cr = 1 – 0.071 Cr = 0.929 = 0.93
El coeficiente de reproductividad oscila entre 0 y 1; cuando equivale a 0.90 o más nos indica que el número de errores es tolerable, además de que la escala es unidimensional y se acepta. Cuando es menor que 0.90 no se acepta la escala. Originalmente, Guttman recomendó administrar un máximo de 10 a 12 ítems o afirmaciones a un mínimo de 100 personas (Black y Champion, 1976). Una vez determinado el número de errores aceptable mediante el coeficiente de reproductividad, se procede a aplicar la escala definitiva (si dicho coeficiente fue de 0.90 o más, esto es, si el error permitido no fue mayor a 10%) o a realizar ajustes en la escala (reconstruir ítems, eliminar los que generen errores, etc.). Estos cinco pasos son una especie de prueba piloto para demostrar que la escala es unidimensional y funciona.
Codificación de respuestas Cuando se aplica la versión definitiva de la escala, los resultados se codifican dicotómicamente o usando los mismos valores que en la escala de Likert, lo que depende del número de categorías de respuesta que se incluyan (Abdi, 2010; Fabrigar y MacGregor, 2006 y Carmines y Woods, 2003). Al igual que la escala Likert y el diferencial semántico, todos los ítems deben tener el mismo número de categorías de respuesta, requisito de todas las escalas de actitud. Asimismo, se considera una respuesta inválida si se marcan dos o más opciones ante una misma afirmación. El escalograma de Guttman es una escala estrictamente ordinal, pero que se suele usar como si fuera de intervalo. Puede aplicarse mediante entrevista (con uso de tarjetas que contengan las opciones o categorías de respuesta) o autoadministrarse.
PRUEBAS E INVENTARIOS En las ciencias y disciplinas del siglo XXI, gran cantidad de estudios utilizan para sus mediciones pruebas e inventarios de muy diversos tipos. Estos instrumentos se aplican en seres humanos.
Clasificación de las pruebas e inventarios Fundamentalmente, las pruebas e inventarios pueden clasificarse en dos tipos: estandarizados y no estan-
darizados. Los primeros se caracterizan esencialmente porque las instrucciones para administrarse y calificarse son uniformes, y cuentan con ciclos específicos de desarrollo y reconfirmación. Los segundos, usualmente se generan mediante un proceso menos riguroso y su aplicación es limitada (como una prueba de un maestro para evaluar el aprendizaje de sus alumnos en una asignatura). Desde luego, los no estandarizados pueden irse robusteciendo (validándose en diferentes contextos) hasta convertirse en pruebas estandarizadas. En teoría, un inventario estandarizado puede aplicarse a cualquier persona del tipo para el cual fue elaborado (Mertens, 2010), y el tiempo que se brinda para contestarlo en ocasiones es flexible y en otras no. Cabe destacar que solo podemos comparar los resultados entre grupos a los que se les administró una prueba estandarizada (por ejemplo, en experimentos), cuando no existen diferencias entre los grupos que puedan generar sesgos en las respuestas (sería incorrecto comparar las respuestas a un test de razonamiento matemático entre niños de diez años y niñas de seis). Por supuesto que, cuando contrastamos grupos
Metodología de la investigación
(hombres frente a mujeres, entre distintos niveles socioeconómicos, jerarquías en la empresa, ocupaciones, etc.) intentamos detectar si hay o no diferencias, pero solo nos interesan las desigualdades entre las variables medidas o los resultados de la prueba. En cambio, no nos deben interesar las discrepancias entre grupos en las capacidades para el desempeño de esta, porque supuestamente las capacidades son las mismas (salvo que el objetivo del estu dio sea considerar disparidades en la ejecución de un inventario). El esquema que se pretende lograr cuando se comparan grupospodría esquematizarse como en la figura 7.3. Figura 7.3 Interés al comparar grupos con la misma medición.
Grupo 1
Grupo 2
Nos interesan las similitudes-diferencias en las puntuaciones de la prueba de los grupos (en la variable de interés)
Las capacidades y habilidades para responder (desempeño) deben ser equivalentes entre los grupos
Grupo 3
Por ejemplo, si queremos comparar a varios pilotos y saber cuál es el mejor, los autos deberán ser los mismos, la pista igual, el combustible, equipo humano, etc. Si probamos autos y pilotos, la pista será la misma, las condiciones ambientales también, etc. Imaginemos que queremos comparar la inteligencia de cuatro grupos, uno de españoles, otro de peruanos, un tercero de italianos y un cuarto de germanos, y la prueba está en alemán En este caso, los resultados reflejarán la inteligencia o el conocimiento del idioma? Más bien lo segundo.
¿Qué pruebas estandarizadas se encuentran disponibles?
En la actualidad existe una amplia diversidad de pruebas e inventarios desarrollados por diversos investigadores para medir un sinfín de variables. Estas pruebas, que tienen su propio procedimiento de aplicación, codificación e interpretación, se encuentran disponibles en diversas fuentes secundarias y terciarias, así como en centros de investigación y difusión del conocimiento. Hay pruebas para medir habilidades y aptitudes (como habilidad verbal, razonamiento, memoria, inteligencia, percepción, habilidad numérica), personalidad, intereses personales, valores, desempeño escolar, motivación, aprendizaje, clima laboral en una organización, inteligencia emocional, etc. ambién se puede disponer de pruebas clínicas para detectar conductas anormales, pruebas para seleccionar personal, pruebas para conocer las percepciones u opiniones de las personas sobre diversos tópicos, pruebas para medir la autoestima y, en fin, otras muchas variables internas y del comportamiento. El reto que implica el empleo de estas pruebas es que la mayoría se han desarrollado en contextos muy diferentes al iberoamericano, por lo que en ocasiones su empleo resulta inadecuado, inválido y poco confiable. Cuando se utilice una prueba estandarizada como instrumento de medición, es conveniente que se seleccione una desarrollada o adaptada por algún investigador para el mismo ámbito de nuestro estudio, que sea válida y confiable (debemos tener información sobre este aspecto). En caso de que elijamos una prueba diseñada en otro contexto, será necesario adaptarla y efectuar pruebas pilotos para calcular su validez y confiabilidad, así como ajustarla a las condiciones de nuestra investigación. Recordemos que cada vez que se administra un instrumento resulta indispensable demostrar que es válido y confiable para el contorno en el cual se va a aplicar. Como ya comentamos, Nuñez (2001) desarrolló una prueba estandarizada para medir el sentido de vida (bajo la concepción de Victor Frankl), una versión con 59 ítems, mediante el escalamiento tipo Likert, con el reporte de una confiabilidad alfa-Cronbach de 0.91, y una solución de ocho factores,
21
22
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
ubicados en cuatro cuadrantes de dos ejes: homo faber (éxito-fracaso) y homo patiens (plenitud-desesperación). Revisó, antes de crear su prueba, 15 instrumentos como el PIL, Logo est y Song est, Mile est, Life Purpose Questionnaire est, etc. Comenzó con un instrumento de 180 reactivos que depuró hasta llegar a sus 59 finales. Este es un excelente ejemplo de una adaptación al medio latinoamericano de una prueba estandarizada sobre el sentido de vida. Los ítems definitivos se incluyen al terminar esta sección del capítulo. En la actualidad encontramos gran variedad de estas pruebas en formato digital (internet, CD, DVD y USB) que hacen mucho más fácil y divertido contestarlas; un ejemplo es la prueba Emotional IQ est (prueba de inteligencia emocional) de Meyer, Salovey y Caruso (1999). En la web hay diversos sitios donde se localizan estas pruebas: en su buscador teclee entre comillas la variable a medir la palabra “prueba o test ”, y encontrará sinnúmero de estos instrumentos recolectar datos,ypero adáptelos/contextualícelos de acuerdouncon lo señalado en el capítulo 9 del para libro impreso. ambién busque en los sitios recomendados en el capítulo 3 de este centro de recursos en línea. Un tipo de pruebas estandarizadas bastante difundido lo constituyen las pruebas proyectivas, las cuales presentan estímulos a los participantes para que respondan a ellos; después se pueden analizar e interpretar las respuestas tanto cuantitativa como cualitativamente. Estas pruebas evalúan proyecciones de las personas, como, por ejemplo, la personalidad y sus trastornos (Rodríguez, 2007). Dos pruebas proyectivas muy conocidas son el test de Rorschach (que presenta manchas de tinta en tarjetas o láminas blancas numeradas a los sujetos y estos relatan sus asociaciones e interpretaciones en est de Apercepción emáticao A relación con ellas) (Choca, 2012; Weiner, 2009 y Karson, 2006) y el (que, con un esquema similar al de Rorschach, muestra a los participantes cuadros que evocan pasajes o historias, y ellos deben elaborar una interpretación, que es analizada por expertos). Por ejemplo, Pirkko (2008) examinó mediante esta prueba historias de 40 niños para evaluar sus fantasías y construcción de la realidad, mientras que Blankenship et al. (2006) lo utilizaron para medir la necesidad de logro. Por su parte, Gau y James (2013) implementaron el A para confirmar los valores presentes en los espectadores de deportes (diversión, socialización, estatus, moral, ritual, epistémico, espiritualidad y estético, entre 11
otros). Dichas pruebas se estructuran sobre un procedimiento estandarizado, aunque también se consideran instrumentos cualitativos para recolectar datos, dada la profundidad de información que recogen de las personas en sus propias palabras. Cabe señalar que, regularmente, su aplicación es estandarizada, no así su interpretación. Por su parte, el análisis es más bien de corte cualitativo. Muchas pruebas estandarizadas (como las proyectivas) requieren de un entrenamiento considerable y un conocimiento profundo de las variables por parte del investigador que las administra e interpreta. No pueden aplicarse con superficialidad e indiscriminadamente. La manera de emplear, codificar, calificar y explicar los resultados de las pruebas estandarizadas es tan variada como los tipos existentes. Algunos ejemplos de las pruebas, se incluyen en la tabla 7.8. Hay miles de pruebas e inventarios en las fuentes secundarias y bases de datos que se mencionan en los apéndices 1 y 2 de esta página web o centro de recursos en línea, así como páginas en internet como: •
• •
ests and Measures in the Social Sciences: ests available in compilation volumes (pruebas de diversas clases):http://libraries.uta.edu/helen/test&meas/testmainframe.htm PsycInfo: http://www.apa.org/psycinfo/ estLink (ES est Collection Advanced Search o ests on Microfiche) y Te Mental Measurements Yearbook (también en versión manual de base datos). Se ingresa por medio de las páginas de las uni-
•
versidades (debe estar suscrita su institución). ERIC (mencionada ampliamente): http://www.eric.ed.gov/ Psych ests, BBC Surveys and Psychology ests o Queendom.com.
•
Amazon.
•
11 Para profundizar en la técnica y ver ejemplos de su aplicación se recomienda a: Teglasi (2010); Husain (2009); Sheldon et al. (2007); Clemence (2006); Langan-Fox y Grant (2006); Blankenship et al. (2006) y Weertman et al. (2006).
Metodología de la investigación
Tabla 7.8 Ejemplo de pruebas estandarizadas. Variable general Inteligencia
Variableespecífica Coeficiente de inteligencia o IQ de adultos
Instrumento/referencias o ejemplos de aplicación Escala de inteligencia de Wechsler (WAIS) (Grégoire, 2013; Lichtenberger y Kaufman, 2009; Hartman, 2009 y Kaufman, 2009).
Coeficiente de inteligencia o IQ de niños
Escala de inteligencia para niños de Wechsler (WISC-IV) (Grégoire, 2013).
Inteligencia sensorio-motriz de bebés (6 meses a 2 años)
Escala argentina de Inteligencia Sensoriomotriz (Caballero y Contini, 2008 y Oiberman, Mansilla y Orellana, 2001).
Memoria
Memoria (funcionamiento cognitivo)
Escala de la memoria Wechsler (WMS-IV) (Chu, Lai, Xu y Zhou, 2012).
Personalidad
Personalidadenprácticamentetodassus dimensiones
Inventario Multifacético de la Personalidad (MMPI), buscar las actualizaciones más recientes (versión adultos y versión adolescentes) (Tarescavage et al., 2013; Greene, 2009; Toomey, Kucharski y Duncan, 2009; Elliott, 2008 y Dao, Prevatt y Horne, 2008).
Aptitudes mentales
Nivel general de aptitudes mentales de niños
Escala Stanford-Binet para niños (Oerbeck, Johansen, Lundahl y Kristensen, 2012; Wallace, 2009 y Newton et al., 2008). En el caso de niños autistas se sugiere a Coolican, Bryson y Zwaigenbaum (2008).
Aptitud cognitiva (nivel mental) para adolescentes y adultos
Escala Binet-Simon o Standfor-Binet (Pierson, Kilmer, Rothlisberg y McIntosh, 2012; Wallace, 2009; Terman, 2008 y Roid, 2003).
Machismo
Machismogeneral
Escalademachismo(Pardo,Weisfeld,Hilly Slatcher, 2013).
Actitud hacia el colegio
Actitud de adaptación al colegio en estudiantes de educación media y superior
Inventario de adaptación al colegio WPS de Brown y Leigh (2009).
Creencias familiares
Creencias familiares de los padres Creencias familiares de los adolescentes
Inventario de las creencias familiares de los padres (Fischer y Corcoran, 2007). Inventario de las creencias familiares de los adolescentes (Fischer y Corcoran, 2007).
Dolor
Dolorfísico
CuestionariosdeldolorMcGill[MPQ](McClellan et al., 2012; Ljunggren, Strand y Johnsen, 2007 y Hyunjeong et al., 2008). Escala visual análoga (VAS) y Escala de calificación verbal (VRS) (Aicher, Peil, Peil y Diene, 2011).
Percepción en el matrimonio
Satisfacción de la relación marital
Escala de felicidad marital [MHS] (Fischer y Corcoran, 2007). Escala-cuestionario del amor en el matrimonio y la relación (Pardo, Weisfeld, Hill y Slatcher, 2013).
Actitud hacia el matrimonio
Escala de actitud e integración hacia el matri-
Amor y sexo
Percepciones sobre el amor y el sexo
monio (Riggio y Weiser, 2008). Escala del amor y el sexo (Hendrick y Hendrick, 2002).
23
24
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
Tabla 7.8 Ejemplo de pruebas estandarizadas (continuación). Variable general Percepción de la vida
Variable específica Satisfacción con la vida
Instrumento/referencias o ejemplos de aplicación Escala de satisfacción con la vida (SWLS) (Wiest, Schüz y Wurm, 2012; Lopez y Snyder, 2003; Vassar, 2008 y Gouveia et al., 2009). Batería de escalas sobre satisfacción con la vida de pacientes depresivos y con adicciones: 1) Escala multidimensional sobre la satisfacción con la vida (breve), 2) Escala de construcción positiva de la vida/sentirse contento/ bienestar y 3) Inventario la depresión Beck (Büssing, Heusser y de Götz, 2011). de
Conciencia ecológica
Conciencia ecológica
Calidad de la práctica de la enfermera
Intervenciones para asistir al paciente en estado de estrés
Inventario de intervenciones para asistir al paciente en situaciones estresantes de Edelman y Mandle (Stanhope y Knollmueller, 2001).
Dependencia
Dependencia interpersonal
Inventario de dependencia interpersonal de Hirschfield (IDI) (Shahar, 2008 y Tzeng, 1993), así como también la subescala del Inventario del estilo personal de Robins (PSI) (Shahar, 2008).
Lealtad del cliente
Lealtad hacia la marca
Escala de nueva conciencia ecológica de Ellis y Thompson (Robinson, Shaver y Wrightsman, 1999).
Escala de Wunderman de experiencia con la marca (Morel, 2003). Encuesta de conciencia y lealtad a la marca (Panchal , Khan y Ram, 2012).
Jubilación
Actitud hacia la jubilación
Escalas para medir las actitudes hacia la jubilación usando diferencial semántico y escalamiento de Thurstone (Rodríguez, 2006).
Inteligencia emocional
Inteligencia emocional y personalidad
Veinte cuestionarios de personalidad (rasgos) (Carter, 2009), así como pruebas de inteligencia emocional (EI) (Stough, Saklofske y Parker, 2009). Prueba audiovisual de la inteligencia emocional [para PC o dispositivo electrónico] (Zysberg y Tell, 2013). En España se adaptó el Meta Mood Scale-24 para medir la inteligencia emocional (Pérez y Castejón, 2007).
Trastorno alimentario
Trastorno o desorden alimentario
Inventario del desorden alimenticio II (Zysberg y Tell, 2013).
Mascotas
Actitud hacialasmascotas
Comportamiento de compra
Comportamiento
Compulsive Buying Scale (Escala de compra
de compra compulsiva
compulsiva) (Koran et al., 2007).
Creencias, asistencia a la iglesia y participación o membresía en organizaciones religiosas
Diversas escalas y cuestionarios, considerando un metaanálisis con 63 estudios (Zuckerman, Silberman y Hal, 2013).
Religiosidad
Escalade actitud hacialasmascotas(Morovati et al., 2008).
Metodología de la investigación
Además, se recomiendan: Urbina (2014), Yan, von Davier y Lewis (2014) (pruebas estandarizadas en dispositivos electrónicos), Cohen, Swerdlik y Sturman (2012), Mertens (2010), Kubiszyn y Borich (2009), Barrett (2009), Anastasi y Urbina (2009), Groth-Marnat (2009), Abell, Springer y Kamata (2009), Torndike y Torndike-Christ (2009), Kaplan y Saccuzzo (2008) y Mertens y McLaughlen (2004) (particularmente pruebas para personas con capacidades diferentes), Kamphaus y Reynolds (2003), Torndike y Hagen (1989), Cronbach (1984), Norton (1980), Woelfel y Danes (1980) y, desde luego, las obras clásicas de orgerson (1985) y Nunnally (1970). Se trata de autores especializados sobre medición y manejo de pruebas estandarizadas. Además, existen métodos propios de las diferentes ciencias sociales, como el análisis de redes, para evaluar la forma en que se manifiesta la comunicación en un sistema social (quién se comunica con quién, quiénes distorsionan la información, la comunicación, quiénes son los líderes comunicativos, etc.). Para este análisis se sugiere a cómo Rogersfluye y Kincaid (1981), Wellman y Berkowitz (1997), Wellman (1999), Knoke y Yang (2007) y Hassanien, Abraham y Snasel (2009). Un ejemplo de esta clase de investigación es la de Crossley (2008), quien analizó la red social de los “actores claves” involucrados en el “círculo central” del movimiento punk en el Reino Unido. Asimismo, los sistemas de medición fisiológica [por ejemplo, Jagroop, Persaud y Mikhailidis (2011), generaron un método más rápido para medir el colesterol en las plaquetas humanas], escalas multidimensionales que miden a los sujetos en varias dimensiones [como los sistemas Galileo y ALSCAL de Woelfel y Fink (1980), así como Borg y Groenen (2005), para medir la distancia psicológica entre conceptos en individuos (como por ejemplo: “patria”, “madre”, “presidente”, “nación” y cualquier otro), en las que se consideran dimensiones cognitivas y emocionales]; y en fin, otros métodos que escapan del alcance introductorio de este libro. En el caso de ingenierías y ciencias físicas vale la pena señalar que cada año se busquen actualizaciones de libros clásicos como: Instrumentation and measurement in electrical engineering , de Roman Malaric (Brown Walker Press), Measurement and instrumentation principles, de Alan S. Morris (ButterworthHeinemann), Measurement and instrumentation: Teory and application, de Alan S. Morris y Reza Langari (Butterworth-Heinemann), Teory and design for mechanical measurements, de Richard S. Figliola
for processes measurement control y DonaldA.E.Anderson Beasley (John e Instrumentation , de Norman (CRCWiley Press),and soloSons) por mencionar algunos; además, útil recurrir aand revistas científicas. Normalmente los profesores que imparten asignaturas específicas en su institución conocen varios de estas fuentes.
Ejemplo de ítems de prueba estandarizada (Sentido de vida Celaya)12 Los ítems o afirmaciones son calificados a través de una escala de Likert que va desde “totalmente de acuerdo” hasta “totalmente en desacuerdo”. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15.
En mi familia nos escuchamos, nos demostramos amor y ocasionalmente analizamos los desacuerdos. Mi religión ha fomentado el crecimiento de mi capacidad de amar y desarrollarme. Dedico parte de mi vida a realizar actividades desinteresadamente. Estoy convencido de que estoy bien; me acepto y me amo. En la búsqueda de la felicidad intento lograr satisfactores materiales. Honestamente tengo conciencia de que amo las cosas y utilizo a las personas. La afectividad es muy importante en mi vida. Mi alto nivel de energía lo empleo para triunfar. Mi religión me ha proporcionado razones para vivir con rectitud, para estar bien con Dios. Acepto que me traten indignamente, con tal de tener seguridad económica. Promuevo que las personas que dependan de mí tengan aprendizajes significativos. Me gusta todo lo que es fácil y que no requiere pensar mucho. Asisto a congresos, conferencias, tomo cursos y diplomados. Me gusta comunicarme conmigo y sentir que mi cabeza sabe lo que tiene mi corazón. Le agrado a la mayoría de las personas.
25
26
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
16. 17. 18. 19. 20. 21. 22. 23. 24. 25.
Si me dieran la oportunidad, podría hacer algo que realmente ayudara a otros. Repentinamente mi estado de ánimo cae en la desesperanza. Valoro todo lo que favorece mis posibilidades de estar bien. Puedo vislumbrar la posibilidad de cambiar y de crecer en mi persona. Me gusta comprometerme en obras de tipo social. Contagio mi optimismo. Mis problemas personales influyen en mi trabajo. En mi proyecto de vida establezco metas relacionadas con un aprendizaje importante. En mi familia muchas veces hemos rezado juntos. Siento que mi cuerpo pierde fortaleza interna.
26. 27. 28. 29. 30. 31. 32. 33. 34.
He buscado activa libremente a Dios. A mis familiares lesydisgusta comprometerse en obras de tipo social. En mi familia mis padres acostumbraban devaluarse uno a otro. Me siento insatisfecho con mi trabajo. Mis sentimientos me impiden ver con claridad la realidad. engo la sensación de que “algo” le falta a mi vida. A la persona que amo la acepto incondicionalmente. Mi meta al educar no sólo es informar, sino afinar la conciencia. En estos momentos me doy cuenta de que no puedo ocuparme de nada porque no tengo voluntad de hacerlo. Promuevo una educación que tenga una relación más estrecha con la vida. Invierto parte de mis ingresos en adquirir revistas científicas, buenos libros, videos, documentales, enciclopedias. Con frecuencia siento que algo malo me va a ocurrir. Mis opiniones políticas no están bien definidas. Renuncio a mi libertad para obtener satisfactores que me convengan. Soy muy sensible al sufrimiento de los demás.
35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52.
rato estar secon personas divertidas para que me ayuden a salir de mi aburrimiento. En mi de familia carece de sentimientos de lealtad y de pertenencia. Me siento lleno de vida y vitalidad. Disfruto la lluvia y no me importa mojarme. Me parece que sufro más que los demás cuando rompo una relación. Prefiero mantenerme a cierta distancia de la gente y quedarme en mi soledad. Me considero una persona optimista. La vida es como una “pizza” llena de ingredientes, apetecible y deliciosa. Me siento capaz para trabajar eficientemente. Soy instrumento de las circunstancias y el destino. No pasa un día en que no dedique unos minutos para contemplar la belleza de la naturaleza. En mi trabajo confío en mis dotes y en mi capacidad de adaptarme para hacer frente a los desafíos que se presentan. Admiro a personas como Martin Luther King, Nelson Mandela y la madre eresa de Calcuta. Diariamente trato en mi trabajo de dar lo mejor de mí mismo. engo necesidad de protagonismo, de ser notado. Me gusta echarme boca arriba en el césped y sacar figuras de las nubes.
53. 54. 55. 56. 57. Hay enpermitirme mi interior vivir una gran riqueza ydelicados sensibilidad. 58. Puedo sentimientos o tiernos. 59. Me siento capaz de hacer bien mi trabajo.
Metodología de la investigación
ANÁLISIS DE CONTENIDO ¿Qué es y para qué sirve el análisis cuantitativo de contenido? Este método tiene mayores implicaciones que simplemente recoger contenidos, pues es, al mismo tiempo, un cierto tipo de diseño de investigación y/o técnica de análisis, pero lo incluimos en este capítulo porque innegablemente su proceso comienza con la recopilación de contenidos de comunicaciones en sus múltiples formas: verbales, no verbales, escritas y audiovisuales. De acuerdo con la definición clásica de Berelson (1971), el análisis de contenido es una técnica para estudiar y analizar la comunicación de una manera Análisis de contenido Técnica para estudiar la comunicación de una
objetiva, y cuantitativa. y Krippendorff (2013) manera objetiva, sistemática y que extiendensistemática la definición del análisis deStalnaker contenido(2014) a un método de investigación cuantifica los contenidos en categorías. para hacer inferencias válidas y confiables de datos sobre contenidos con respecto a su contexto. Krippendorff y Bock (2008), así como Weber (1990) señalan que tales inferencias implican a la fuente de los mensajes, a los mensajes en sí mismos y a sus receptores o destinatarios. Esta herramienta es una técnica muy útil para analizar los procesos de comunicación y sus características en muy diversos contextos (Neuendorf, 2001). El análisis de contenido puede aplicarse virtualmente a cualquier forma de comunicación [páginas web (como las de anuncios publicitarios o personales) y a toda clase de blogs, mensajes en redes sociales de internet (whatsApp,twitter, facebook, etc.), programas televisivos o radiofónicos, artículos en prensa o periódicos electrónicos, libros, poemas, conversaciones, pinturas, discursos, cartas, melodías, leyes y reglamentos, etc.)]. Por ejemplo, para analizar la personalidad de alguien es conveniente evaluar sus escritos; conocer las actitudes de un grupo de personas mediante la valoración de sus expresiones verbales (desde pandillas hasta movimientos de protesta y pacientes que sufren una determinada enfermedad); indagar sobre las preocupaciones de un pintor o un músico mediante el estudio de su material; compenetrarse con los valores de una cultura o averiguar las intenciones de un publicista o propagandista (como las campañas nazis de Hitler y Goebbels durante la Segunda Guerra Mundial en todos los medios de comunicación colectiva de la época).
Usos del análisis de contenido Riffe, Lacy y Fico (2014); Weber (1990) y Berelson (1971) señalan varios usos del análisis de contenido, entre los que se destacan: 1. Describir tendencias y características del contenido de la comunicación. 2. Develar diferencias en el contenido de la comunicación (entre personas, grupos, instituciones, países,
medios informativos, etcétera). 3. 4. 5. 6. 7. 8. 9. 10. 11.
Comparar mensajes, niveles y medios de comunicación. Intentar predecir los posibles efectos del contenido de la comunicación en la audiencia destinataria. Auditar el contenido de la comunicación y compararlo con estándares u objetivos. Construir y aplicar estándares de comunicación (políticas, normas, etcétera). Exponer técnicas publicitarias y de propaganda. Medir la claridad de los mensajes. Descubrir estilos de comunicación. Identificar intenciones, apelaciones y características de comunicadores. Descifrar mensajes ocultos y otras aplicaciones a la inteligencia militar y a la seguridad política.
12. Revelar “centros” de interésy atención de una persona, un grupo, un medio informativo o una comu-
nidad.
13. Determinar el estado psicológico de personas o grupos. 14. Obtener indicios del desarrollo verbal (por ejemplo, en la escuela, como resultado de la enseñanza, el
aprendizaje de conceptos). 15. Anticipar respuestas a comunicaciones.
27
28
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
16. Reflejar actitudes, valores y creencias de personas, grupos o comunidades. 17. Cerrar preguntas abiertas.
Asimismo, puede resultar útil para examinar redes sociales (quiénes se comunican con quiénes —perfiles—, para qué —propósitos—, con qué frecuencia, etc.). Por ejemplo, podría estudiarse una red de jóvenes inscritos en facebook, twitter, whatsApp, Hi5 o mySpace mediante el análisis de sus páginas (mensajes escritos y visuales).
¿Cómo se realiza el análisis de contenido? El análisis de contenido se efectúa por medio de la codificación, es decir, el proceso en virtud del cual las características relevantes del contenido de un mensaje se trans-forman en unidades que permitan su clasificación o categorización precisa. Lo importante del mensaje se convierte en algo susceptible de describir y analizar. Para codificar es necesario definir eluniverso, las unidades de análisis y las categorías de análisis (Krippendorff y Bock, 2008).
Universo El universo podría ser la obra completa de Paulo Coelho o J. K. Rowling; las emisiones de un noticiario o informativo en televisión durante un mes; los editoriales publicados en un día por cuatro diarios (por ejemplo, en España, El Mundo, El País, ABC y La Vanguardia); todos los capítulos de tres telenovelas; las canciones completas de un grupo musical o solista (U2, Joan Manuel Serrat, Shakira, Coldplay, La Oreja de Van Gogh, Motel, etc.); los escritos de un conjunto de estudiantes durante un ciclo escolar; los discursos pronunciados por varios contendientes políticos en el mes previo a la elección; los mensajes de un círculo de amigos intercambiados en una red social en internet durante una semana vacacional; los escritos de un grupo de pacientes en psicoterapia en un periodo específico; las conversaciones grabadas de 15 parejas que participan en un experimento sobre conflictos maritales; los escritos de una secta terrorista, etc. El universo, como en cualquier investigación cuantitativa, debe delimitarse con precisión. Algunos autores, como Sánchez Aranda (2005), se refieren al universo como el contexto de la unidad, el cuerpo más largo del contenido que puede examinarse al caracterizar una o más unidades de registro.
Unidades de análisis Las unidades de análisis o registro constituyen segmentos del contenido de los mensajes que son caracterizados para ubicarlos dentro de las categorías. Se predeterminan de acuerdo al planteamiento del problema, a diferencia de las unidades en el análisis cualitativo, las cuales surgen de manera emergente. Sánchez-Aranda (2005, p. 221), las define como “El cuerpo de contenido más pequeño en que se cuenta la aparición de una referencia, ya sean palabras o afirmaciones que nos interesa localizar”. Riffe, Lacy y Fico (2014) y Berelson (1971) mencionan cinco unidades importantes de análisis: 1. La palabra. Es la unidad de análisis más simple, aunque, como señalan Franzosi (2009) y Kerlinger y
Lee (2002), puede haber unidades más pequeñas, como letras, fonemas o símbolos. Así, se puede medir cuántas veces aparece una palabra en un mensaje (por ejemplo, número de veces que en los informativos o noticiarios televisivos de fin de año se menciona al presidente de la República o el número de alusiones de un grupo psiquiátrico al término “depresión”). 2. El tema. Se define a menudo como un enunciado respecto de algo. Los temas suelen ser más o menos generales.12 Kerlinger y Lee (2002) utilizan un excelente ejemplo para ello: “Las cartas de adolescentes o sería estudiantes deextenso, colegiospero superiores puedenlos sertemas estudiadas sus expresiones autorreferencia”. Este un tema se definirían como en cualesquiera de las de oraciones que usen “yo”, “mí” y otros términos que indiquen referencia al yo” “ del escritor. Así, se analizaría qué tanta autorreferencia contienen las cartas. 12 El significado del término “temas” en el análisis cuantitativo del contenido se refiere a tópicos y es distinto al significado de “temas emergentes” en el análisis cualitativo.
Metodología de la investigación
Si los temas son complejos, el análisis del contenido es más difícil, en especial si se complica al incluirse más de una oración simple. 3. El ítem. Es una unidad de registro muy utilizada y puede definirse como la unidad total empleada por los productores del material simbólico (Stan, 2009 y Weber, 1990). Ejemplos de ítems son un libro, un editorial, una emisión de un programa de radio o televisión, un discurso, una ley, una fotografía, una carta amorosa, una conversación telefónica, un mensaje en una red social de internet, una canción o la respuesta a una pregunta abierta. En este caso, lo que se analiza es el material simbólico total. 4. El personaje. Se trata de un individuo. Por ejemplo, un paciente, un héroe o heroína de una serie televisiva, un líder histórico, un profesor, un avatar, un joven que publica una página en facebook, etc. Aquí lo que se analiza es el personaje. 5. Medidas de espacio-tiempo. Son unidades físicas, como el centímetro-columna (por ejemplo, en la
prensa), la línea (en escrito), el minuto (en una conversación o en radio), el mensaje (enviado por celulares o móviles), el periodo de 20 minutos (en una interacción), el cuadro (en televisión), cada vez que se haga una pausa (en un discurso, una entrevista o una interacción entre individuos), una página (red social en la web), etc. Krippendorff y Bock (2008) y Sánchez-Aranda (2005) lo denominan unidad de enumeración. En este caso, la unidad física (por ejemplo, cada minuto) es ubicado en categorías (si tenemos 10 minutos de grabación, se colocan diez unidades en las categorías).
Algunos contenidos típicos de herramientas cualitativas de recolección de datos (como las grabaciones o transcripciones de grupos de enfoque) pueden evaluarse mediante análisis cuantitativo del contenido. Las unidades se insertan, colocan o caracterizan en categorías y/o subcategorías, lo cual podría represenFigura 7.4 Agrupación de unidades de análisis en categorías.
tarse tal como se muestra en la figura 7. 4. En cuanto a qué unidad debe seleccionarse, ello depende de los objetivos y las preguntas de investigación. Sin embargo, Krippendorff (2013) y Berelson (1971) sugieren lo siguiente: a) En un solo estudio es posible utilizar más de una unidad de análisis. b) Los cálculos de palabras y las unidades amplias, como el ítem y las medidas de espacio-tiempo,
son más adecuados en los análisis que dan mayor importancia a los asuntos definidos. c) Las unidades amplias y las más definidas son válidas para aceptar o rechazar una categoría. d) Por lo general, las unidades amplias requieren de menos tiempo para su codificación que las uni-
dades pequeñas que se refieren a las mismas categorías y materias. e) Debido a que los temas o las oraciones agregan otra dimensión al asunto, la mayoría de las veces
son más difíciles de analizar que las palabras y las unidades amplias.
f) El tema es adecuado para el análisis de significados y las relaciones entre estos.
Categorías Las categorías son los niveles donde se caracterizan las unidades de análisis. Como menciona Holsti (1969), son las “casillas o cajones” en las cuales se clasifican las unidades de análisis. ambién se pre-
29
30
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
determinan de acuerdo con el planteamiento del problema. Prasad (2008), Sánchez Aranda (2005) y Weber (1990) las definen como características o aspectos que presenta la comunicación con la que trabajamos (en cuanto a referencias). Por ejemplo, un discurso podría clasificarse como optimista o pesimista, como liberal o conservador. Un personaje de una caricatura se catalogaría como bueno, neutral o malo. En ambos casos, la unidad de análisis se categoriza. Veamos esquemáticamente la categorización en la figura 7. 5. Figura 7.5 Ejemplos de unidades de análisis y su clasificación en categorías. Subcategorías Optimismo
Discurso A
Pesimismo
Categoría 1
Conservadurismo
Discurso A
Categoría 2 Liberalismo
Optimismo
Discurso B
Categoría 1
Pesimismo
Conservadurismo
Categoría 2 Liberalismo
Discurso K
Categoría 1
Categoría 2
Es decir, cada unidad de análisis se incluye o encasilla en uno o más sistemas de categorías. Por ejemplo, en un estudio citado por Krippendorff (1980) se analizaron 2 430 actos de violencia televisada. En cada acto, el personaje principal (unidad de análisis) se categorizó como: • •
Bueno, neutral o malo (sistema 1). Asociado con hacer cumplir la ley, no relacionado con el cumplimiento de la ley o como un delincuente o criminal (sistema 2).
En este caso, la unidad de análisis o registro es el comportamiento del personaje durante el acto televisivo. Esto podría representarse como se muestra en la figura 7. 6. Figura 7.6 Ejemplo con dos categorías y seis subcategorías.
Metodología de la investigación
Como ya se comentó, la selección de categorías depende del planteamiento del problema.
Tipos de categorías Krippendorff (2013) señala cinco tipos básicos de categorías: 1. De asunto o tópico. Se refieren a cuál es el asunto, la materia o la temática tratada en el contenido (¿de
qué trata el mensaje o la comunicación?).
Ejemplo Analizar las problemáticas que más preocupan a los ciudadanos detectadas en los mensajes enviados por correo electrónico al alcalde o presidente municipal durante el último mes. Categoría: Subcategorías:
Categoría: Subcategorías:
Inseguridad Asaltos/robos al transitar o caminar en las calles o lugares públicos abiertos, como parques Asaltos/robos al transitar en automóviles Asaltos/robos al viajar en transporte público Asaltos/robos a los hogares Asaltos/robos en lugares públicos cerrados, como restaurantes, cines, etcétera Secuestros Violaciones Etcétera Deficiencias en los servicios públicos que presta el municipio El servicio de recolección de la b asura no o curre todos los días El servicio de recolección de la basura no se realiza más o menos a la misma hora todos los días, es decir, es irregular Suspensión por más de un día del servicio de suministro del agua Cortes frecuentes en el suministro de agua Etcétera
Imaginemos que pretendemos investigar el grado en que una determinada telenovela presenta consumo de alcohol entre sus personajes y las situaciones y contextos en los cuales ocurre, así como su finalidad (reducir estrés,análisis, induciroalpodría romance, socializar, etc.). Cada periodo de 10 minutos de la telenovela se va a considerar la unidad de ser todo el capítulo. Unidad 1 10mm
2 10
Categoría: Subcategorías: Categoría: Subcategorías:
3
4
10 m
10 m
5 10 m
6 10 m m
7
k
1010 m
Relación del personaje con el consumo de alcohol El personaje consume bebida alcohólica El personaje no consume bebida alcohólica Finalidad de consumir alcohol Reducir estrés o relajarse Socializar con otros personajes Transformar su carácter en uno más asertivo, violento o agresivo Transformar su carácter en uno más bondadoso o simpático Inducir al romance a otro personaje Etcétera
2. De
dirección. Estas categorías se refieren a cómo es tratado el asunto (¿positiva o negativamente?, ¿favorable o desfavorablemente?, ¿nacionalista o no nacionalista?, etcétera).
Ejemplo Comparar la manera en que dos noticiarios televisivos comentan sobre el presidente de Estados Unidos.
31
32
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
Categoría: Subcategorías:
Tono en el tratamiento respecto del presidente de Estados Unidos Favorable Neutral Desfavorable
3. De valores. Este tipo de categorías indican qué valores, intereses, metas, deseos o creencias se revelan.
Ejemplo Al estudiar la compatibilidad ideológica de matrimonios, se podría analizar la ideología de cada cónyuge, pidiéndoles un escrito sobre temas que puedan reflejar valores (sexo, actitud hacia la pareja, significado del matrimonio). Categoría: Subcategorías:
Ideología del esposo Muy tradicional Más bien tradicional Neutral Más bien liberal Muy liberal
4. De receptores. Estas categorías se relacionan con el destinatario de la comunicación (¿a quién van diri-
gidos los mensajes?)
Ejemplo Analizar a quiénes encauza más sus críticas el rector o director general de la universidad en los discursos del último año dirigidos a toda la comunidad estudiantil. Categoría: Subcategorías:
Receptores a quienes se dirigen las críticas del rector o director Profesores de tiempo completo Profesores que no están de tiempo completo (de asignaturas, por honorarios o tiempo parcial) Alumnos en general Alumnos de últimos semestres Alumnos de semestres intermedios Alumnos de primeros semestres Directivos Empleados administrativos Padres de familia A toda la comunidad
5. Físicas. Son categorías para ubicar la posición y duración o extensión de una unidad de análisis. De
posición son, por ejemplo, la sección, página y cuadrante (en prensa escrita o electrónica), y el horario (en televisión y radio); de duración, los minutos (en una interacción, un comercial televisivo, un programa de radio, un discurso), los centímetros/columna (en prensa), los cuadros o escenas en una película, etc. No se deben confundir las unidades de espacio-tiempo con las categorías físicas. Las primeras son unidades de análisis y las segundas constituyen categorías. Veámoslo en la figura 7.7 con un ejemplo simple. Un sexto tipo de categorías es la “intensidad”, que indica más allá de la dirección, grados de fuerza de la categoría. Por ejemplo, diversos gabinetes, despachos o departamentos de comunicación social de organismos públicos (como sería el caso de ministerios o secretarías), examinan diariamente las críticas que hacen los editorialistas de periódicos al titular de la dependencia (ministro o secretario), y determinan si la crítica es “muy severa”, “severa” y “no severa”.
Requisitos de las categorías Cuando se lleva a cabo un análisis de contenido se suelen determinar varias categorías, que deben cumplir los siguientes requisitos: 1. Las categorías y subcategorías deben ser exhaustivas, es decir, abarcar todas las posibles subcategorías
Metodología de la investigación
Figura 7.7 Ejemplo del tiempo como unidad de análisis y como categoría.
de lo que se va a codificar. Por ejemplo, la categoría “ideología del esposo” no podría prescindir de la subcategoría “neutral”. 2. De preferencia, las subcategorías deben ser mutuamente excluyentes, de tal manera que una unidad de análisis clasifique en una y sólo una de las subcategorías de cada categoría. Por ejemplo, un personaje de una serie televisiva no puede ser “bueno” y “malo” a la vez. Si ejerciera ambos roles, habría que generar la categoría “en momentos malo y en otros bueno”. 3. Obviamente, una unidad de registro puede encajar en una subcategoría de una categoría y en otras subcategorías de otras categorías. Por ejemplo, al analizar comerciales televisivos podríamos tener, entre otras categorías, las siguientes:
33
34
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
Una unidad de análisis (un comercial) puede ubicarse en una subcategoría de “presencia de color” y en otra subcategoría de la categoría “necesidad fisiológica a que se apela” (por ejemplo: color y sed), pero no puede situarse en dos subcategorías de la misma categoría, como “hambre” y “sed” (porque la categoría es la necesidad a que se apela principalmente ), a menos que generáramos la subcategoría “hambre y sed”. En ciertos casos especiales, al analista le llega a interesar una categoría donde las subcategorías no sean mutuamente excluyentes. al sería el caso de que la categoría fuera “apelaciones del comercial” (estatus socioeconómico, salud, juventud, belleza, amor romántico, etcétera). Un comercial podría utilizar más de una apelación (salud y belleza, por ejemplo). 4. Las categorías y subcategorías deben derivarse del marco teórico y de una profunda evaluación de la
situación.
Ejemplo Análisis de contenido de series televisivas Para ejemplificar el análisis de contenido y específicamente la generación a priori de categorías, se acudirá a un estudio de Greenberg et al. (1980). La investigación consistió en un análisis de contenido de las series televisadas por las tres grandes cadenas de Estados Unidos: ABC, CBS y NBC. Se evaluaron diversos programas durante tres periodos de 1975 a 1978, para determinar el grado en que la televisión estadounidense mostraba actos prosociales y antisociales como medida de la violencia televisada. Las categorías y subcategorías que se utilizaron son las que se muestran en la figura 7. 8. Figura 7.8 Ejemplo de sistema de categorías. Altruismo
Actos prosociales
(Definido como un acto en el cual humanos o animales comparten, se ayudan y cooperan, siempre y cuando no participen en un acto ilícito)
Mostrar afecto
(Referido a ofrecer o exhibir abiertamente emociones positivas hacia humanos y animales)
Explicación de los sentimientos de uno mismo
(Consiste en afirmaciones verbales que explican sentimientos, pensamientos o acciones de uno mismo –yo–, y que tienen como propósito lograr un resultado positivo)
Explicación de los sentimientos de otros
(Consiste en afirmaciones verbales que explican sentimientos, pensamientos o acciones de los demás y que tienen como propósito lograr un resultado positivo)
Agresión física (referida a cualquier conducta manifiesta cuya intención es dañar, asustar, lesionar o injuriar a uno mismo o a otro individuo, animal o propiedad) Agresión verbal (el envío de mensajes nocivos tales como rechazos, amenazas verbales, insultos o frases hostiles)
Actos antisociales
Robo (la acción de tomar intencional y deliberadamente una propiedad que pertenece a otra persona o institución, sin derecho o permiso)
Engaño (mentira intencional de alguien con el propósito de provocar algo malo en detrimento de un individuo, un grupo o una institución; por ejemplo: fraude, mentiras, asumir la identidad de otros)
Asalto con algún objeto (un arma, un libro, un lápiz, etcétera) Asalto sin un objeto (por ejemplo, utilizando las manos) Amenaza física (poner en peligro el bienestar, la salud o la integridad de alguien) Disparar a alguien con un arma de fuego
Metodología de la investigación
El estudio consideró como unidad de análisis la conducta (cada vez que se presentaba un comportamiento de los personajes era codificado). Cuando se crean las categorías, estas deben definirse con precisión y es necesario explicitar qué van a comprender en cada caso y qué se excluirá. El análisis de contenido consiste en asignar cada unidad a una o más categorías. En realidad, el producto de la codificación son frecuencias de categorías. Mediante el programa de análisis estadístico, se cuenta cuántas veces se repite cada categoría o subcategoría (cuántas unidades de análisis se clasificaron en cada una de las categorías). Por ejemplo, Greenberg et al. (1980, p. 113) encontraron los resultados que se muestran en la tabla 7. 9. Tabla 7.9 Ejemplo de los resultados de la codificación del estudio de acuerdo con la estudio de Greenberg et al. (1980). Incidencia de actos antisociales en los tres periodos Año 1* Año 2* Año 3* % % f f
f
%
I. Agresión física A. Asalto con un objeto B. Asalto sin un objeto C. Amenaza física D. Disparar E. Otras
466 111 180 106 128
(15.7) (3.7) (6.1) (3.6) (4.3)
248 159 233 75 171
(10.8) (6.9) (10.1) (3.2) (7.4)
370 177 135 74 130
(13.6) (6.5) (5.0) (2.7) (4.8)
II. Agresividad verbal III. Robo IV. Engaño Total Horas analizadas
1 629 61 283 2 964 (68.5)
(55.0) (2.1) (9.5) (100.0)
1 099 72 251 2 308 (58)
(47.6) (3.1) (10.9) (100.0)
1 464 44 319 2 713 (63)
(54.0) (1.6) (11.8) (100.0)
*Año 1 incluyó de octubre de 1975 hasta que se grabó un episodio de cada una de las series existentes (1976), año 2 igual, pero en 1976-1977, y año 3 igual, pero de 1977-1978. f = número de casos o unidades. % = porcentajes.
A continuación mostramos un ejemplo de análisis de contenido, a manera de ejercicio, que se hace cotidianamente en la mayoría de los países para clasificar las películas y regular el ingreso (por el factor edad) a las salas cinematográficas.
Ejercicio Imagine el lector que le asignan la tarea de clasificar películas u obras cinematográficas para evaluar si son adecuadas para el público de todas las edades, si sólo son apropiadas para adolescentes y adultos, o únicamente son aptas para adultos (mayores de 18 años). Por supuesto, la unidad de análisis es el filme o cinta, pero: ¿qué categorías podrían utilizarse para clasificar las unidades? Algunas de las categorías para clasificar las películas, cintas o filmes podrían ser:
Contenido de sexo. Contenido de violencia. Contenido de lenguaje ofensivo, soez o procaz (insultos, groserías, majaderías). Contenido sobre adicciones y drogas ilegales. Contenido de horror (no terror sino, por ejemplo, escenas de muertos —un holocausto que muestre cadáveres— o la filmación de la muerte de una persona). Cabrían al menos tres preguntas sobre estas categorías: ¿son demasiado generales?, ¿qué significa cada una de ellas?, ¿son suficientes o podrían establecerse otros criterios? Las respuestas podrían ir en varios sentidos. La primera es indudable: “sí”, tales categorías son demasiado generales. Por ello, su significado es poco preciso. Y alguien podría agregar otra categoría: contenido de discriminación, y aun otras categorías. • • • • •
35
36
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
La categoría “contenido de sexo” podría englobar las siguientes subcategorías primarias: a) desnudos, b) presentación de actos sexuales, c) degradación de valores mediante el sexo, y otros conceptos. En la subcategoría desnudos, podrían agruparse otras subcategorías (secundarias), por ejemplo: 1) eróticos ligados al acto sexual (uno o varios actores y actrices desnudos, comprometidos en acciones sexuales), 2) eróticos no ligados al acto sexual (uno o varios actores y actrices simplemente desnudos), 3) no eróticos ni ligados a una acción sexual (por ejemplo, una escena donde aparezca alguna escultura desnuda, como el David, de Miguel Ángel, o un bebé desnudo). La presentación de actos sexuales podría abarcar las siguientes subcategorías secundarias: 1) sexo sugerido (escenas donde los actores insinúan que habrá un acto sexual, pero no se ve ninguna acción; por ejemplo, entran a una recámara, sonríen, se miran entre sí, cierran la puerta…), 2) sexo implícito (escenas de conducta sexual manifiesta, en la que se observa una acción pero esta no es clara ni precisa; por ejemplo, una pareja que está en una cama, entre las sábanas y supuestamente tiene una relación sexual) y 3) sexo explícito (conducta sexual manifiesta y escenificada, en la cual los actores se encuentran desnudos y se observa con claridad y precisión la acción sexual). La degradación de valores podría clasificarse en (subcategorías secundarias): 1) el sexo se presenta como una forma de entrega y amor de la pareja para el desarrollo armónico de la relación y el crecimiento humano de sus integrantes, 2) el sexo se presenta como una pulsión instintiva, 3) el sexo se presenta como una forma de degradación humana o humillación. La violencia podría ser de distintos tipos (subcategorías primarias): a) física, b) verbal o c) psicológica. En el caso de la violencia física, esta podría llevarse a cabo con armas o sin ellas (subcategorías secundarias). La violencia física podría provocar ciertos efectos: 1) ningún efecto, 2) heridas reversibles que no requieren hospitalización, 3) heridas reversibles que requieren hospitalización, 4) heridas irreversibles que requieren hospitalización y 5) muerte (subcategorías secundarias). La violencia también podría: asociarse al consumo de drogas o no y al contenido sexual o no (subcategorías secundarias). El contenido sobre adicciones y/o drogas podría abarcar las subcategorías primarias: a) producción, b) distribución y c) consumo. Esta última podría subdividirse en subcategorías secundarias: 1) consumo de alcohol, 2) tabaco, 3) estupefacientes de daño significativo pero menor (por ejemplo, marihuana) y 4) estupefacientes de daño severo a todo el organismo (por ejemplo, cocaína, heroína, entre otras). Asimismo, otras subcategorías secundarias del consumo podrían estar relacionadas con sus consecuencias: 1) daños reversibles a los sistemas del organismo, 2) daños irreversibles y 3) fallecimiento. Y así, las demás categorías. De esta forma, cada película se clasificaría en las categorías y subcategorías. Podríamos señalar que la presencia de ciertas subcategorías secundarias otorga un estatus u otro a la cinta en cuestión, por ejemplo:
•
•
•
•
Películas aptas para todo público Sólo se permiten desnudos no eróticos; si alguna escena presenta desnudos eróticos (ya sea que estén o no ligados al acto sexual), el filme se clasificará, según sea el caso, como “apto para adolescentes jóvenes (12-15 años)”, o “apto para adolescentes mayores (16 y 17 años) y adultos”. Únicamente se permite sexo sugerido; si alguna escena presenta sexo implícito o sexo explícito, el filme será clasificado según sea el caso. Imposible vincular el sexo con valores, mucho menos presentarlo como una pulsión instintiva y menos aún como una forma de degradación humana o humillación (subcategorías secundarias). La violencia únicamente puede presentarse en un contexto fantástico caricaturizado.
No se permite ningún contenido sobre adicciones y/o drogas. Así, con cada grupo de edad: apta para adolescentes jóvenes (12-15 años); apta para adolescentes mayores (16 y 17 años) y adultos; y apta solamente para adultos o mayores de edad. Este proceso de categorización podría representarse gráficamente de la forma como se muestra en la figura 7.9, de la página siguiente •
Metodología de la investigación
Figura 7.9 Ejemplo de un proceso de categorización de películas. Contenido de sexo
Unidad 1: El hobbit, Historia de una ida y una vuelta !
Desnudos § Eróticos ligados al acto sexual § Eróticos no ligados a una acción
Unidad 2: Frozen Unidad 3: 12 años de esclavitud
Unidad 4: Rápidos y furiosos 7 Unidad 5: X-Men, días del futuro pasado
sexual Presentación de actos sexuales § Sexo sugerido § Sexo implícito § Sexo explícito Degradación de valores § Presentación del sexo como forma de entrega y amor § Presentación del sexo como una pulsión § Presentación del sexo como una forma de degradación
Contenido de violencia
Unidad 6: Gravity
Física § Uso de armas ¨ Sí
¨ No
§ Efectos o consecuencias:
Unidad 7: La película mexicana…
Unidad 8: La película peruana…
Clasificación: Apta para todo público. Apta para adolescentes jóvenes (12-15 años), adolescentes mayores (16 y 17 años) y adultos. Apta para adolescentes mayores (16 y 17 años) y adultos. Apta solo para adultos. • •
¨ Ninguno ¨ Heridas reversibles que no requieren hospitalización ¨ Heridas reversibles que sí requieren hospitalización ¨ Heridas irreversibles que requieren hopitalización ¨ Mortales Verbal Psicológica Asociada: § Consumo de drogas § Sexo Contenido de adicciones y drogas
•
•
Otras categorías y subcategorías
Para complementar el ejercicio le sugerimos que, junto con otros compañeros, lo termine y genere un sistema para clasificar películas (simplemente mostramos algunas categorías por las cuales puede comenzar; desde luego, podría no estar de acuerdo con ellas o con las subcategorías mencionadas, o con los criterios para otorgar un estatus u otro a la cinta). Una vez que desarrolle el sistema, vaya al cine, analice algunos filmes de estreno y otórgueles su propia clasificación de acuerdo con sus criterios.
¿Cuáles son los pasos para llevar a cabo el análisis de contenido? Ya hemos mencionado tres: 1. Definir con precisión el universo y extraer una muestra representativa. 2. Establecer y definir las unidades de análisis. 3. Establecer y definir las categorías y subcategorías que representan las variables de la investigación.
Los demás pasos son:
4. Seleccionar los codificadores. Los codificadores son las personas que deben asignar las unidades de
análisis a las categorías. Deben tener un nivel educativo profesional (estudiantes de licenciatura, como mínimo). 5. Elaborar las hojas de codificación . Estas hojas contienen las categorías y subcategorías, y los codificadores anotan en ellas cada vez que una unidad entra en una subcategoría. En la figura 7. 10 se mues-
37
38
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
Figura 7.10 Elementos de una hoja o registro de codificación. Indicador de quien codificó: número, iniciales o letras Fecha en que se codificó el material
Frecuencias (veces que se repite cada categoría)
MATERIAL A ANALIZAR:
CODIFICADOR: 1 FECHA: 29-11-2014
DURACIÓN: 60 MINUTOS FRECUENCIAS
CATEGORÍAS
Categorías y subcategorías
) (1 S E L IA C O S O R P S O T C A
CAPÍTULO DE LA SERIE “La teoría del Big Bang” TOTALES
ALTRUISMO (1.1)
2
MOSTRAR AFECTO (1.2)
5
EXPLICACIÓN DE LOS PROPIOS SENTIMIENTOS (1.3)
3
EXPLICACIÓN DE LOS SENTIMIENTOS DE OTROS (1.4)
0
AGRESIÓN FÍSICA (2.1)
) (2 S E L IA C O S I T N A S O T C A
Descripción del material que se analizará (discurso, nota periodística, sesión terapéutica, etcétera)
Asalto con objeto (2.1.1)
0
Asalto sin objeto (2.1.2)
0
Amenaza física (2.1.3)
0
Disparar (2.1.4)
0
Otros (2.1.5)
Suma de frecuencias en cada categoría o subcategoría
0
AGRESIÓN VERBAL (2.2)
3
ROBO (2.3)
0
ENGAÑO (2.4)
1 TOTAL
14
Total de frecuencias o unidades
Pueden agregarse páginas para comentarios del codificador
tran los elementos de una hoja o registro de codificación, que puede estar impresa en papel o elaborada en un programa para cualquier dispositivo electrónico (PC o tableta, por ejemplo). Incluso puede ser una hoja en Excel.
o registrospara de analizar codificación Las hojas pueden incluir elementos precisos para describir el material. Por ejemplo, artículos de periódicos: nombremás del periódico, fecha de publicación, género periodístico (reportaje, entrevista, editorial, artículo de fondo, carta, inserción pagada, artículo general), signatario del texto, sección donde se publicó, página, volumen de publicación (año, número o equivalente), ubicación en los cuadrantes de páginas,
Metodología de la investigación
X
tamaño (en centímetros/columna), nombre del codificador, día de codificación, etc. Una hoja puede servir para una o varias unidades, según nos interese o no tener datos específicos de cada unidad (normalmente se prefiere tener la información por unidad). Asimismo, las categorías y subcategorías deben codificarse con sus respectivos valores numéricos. En la hoja de codificación de la figura 7.10, 1 (uno) significa acto prosocial y 2 (dos) acto antisocial (así,
1.1 es “altruismo”, afecto”, etc.). Recordemos que puede haber categorías secundarias y terciarias o sistemas1.2 aún“mostrar más desglosados. 6. Entrenar a los codificadores. Esta capacitación incluye que los codificadores se familiaricen y compe-
netren con las variables, comprendan las categorías y subcategorías, así como las definiciones de ambas. Además, debe entrenárseles en la manera de codificar, y discutir ampliamente con ellos las diferentes condiciones en que puede manifestarse o estar presente cada categoría y subcategoría. Asimismo, tienen que entender en forma cabal en qué consiste la unidad de análisis. Parte del entrenamiento implica realizar una prueba piloto con el sistema de categorías y subcategorías, es decir, realizar un análisis de contenido en una muestra representativa del universo del material de estudio (por ejemplo, unos programas de las series televisivas que se analizarán, segmentos de los libros de un autor —capítulos de cada obra—, partes de los discursos de oradores —páginas de cada discurso—. Como se puede apreciar, en este caso, en lugar de muestrear con individuos, se realiza con unidades de significado). Así, podemos descubrir categorías y/o subcategorías no contempladas previamente. La prueba piloto también nos sirve para evaluar el nivel de confiabilidad de los codificadores, lo que nos conduce a la siguiente etapa. 7. Determinar la confiabilidad de los codificadores. odos los codificadores realizan análisis de contenido
provisional de una parte representativa del material (este debe ser el mismo para todos los codificadores), con la finalidad de determinar el grado de acuerdo o consenso entre ellos. Si no hay consenso, no puede efectuarse una evaluación confiable de la muestra o universo de contenido. Para llevar a cabo la evaluación se calcula la confiabilidad de cada codificador (individual) y la confiabilidad entre codificadores. El cálculo de la confiabilidad individual de los codificadores depende de que sean uno o varios. a) Si se dispone de un solo codificador (porque el material es reducido) se observan las diferencias de la
codificación del mismo mensaje hecha por el codificador en dos tiempos diferentes. Si las diferencias son muy pequeñas, el codificador es individualmente confiable. Este tipo de confiabilidad se llama confiabilidad intracodificador, la cual mide la estabilidad de la prueba y reprueba de un codificador a través del tiempo. Otro método consistiría en que el codificador trabaje una parte representativa del material y después, un experto externo y el investigador, revisen su trabajo y apliquen a su codificación (resultados) la siguiente fórmula: Número de unidades de análisis catalogadas
Confiabilidad individual=
correctamente por el codificador Número total de unidades de análisis
Por ejemplo, un !mensaje que conste de 20 unidades y se logren correctamente las 20, la con$ fiabilidad será de 1 # 20 & , que es el máximo de confiabilidad. Si el codificador sólo pudo codificar =
" 20 %
en forma correcta 15 de las 20, la confiabilidad sería de
0.75
=
! 15 $ # & " 20 %
.
b) Si se dispone de varios codificadores, la confiabilidad individual puede determinarse así: se solicita
a todos los codificadores que codifiquen el mismo material, se toman los resultados de todos
39
40
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
menos los de uno y se compara la codificación de este con la del resto. Así se procede con cada codificador. ambién puede aplicarse a todos los codificadores la fórmula para calcular la confiabilidad individual: quien se distancie del resto se considera un caso poco confiable. Si varios muestran valores bajos, se practica con otro material hasta alcanzar índices mínimos de .90 (para la individual).
Ejemplo Codificador A 0.89
Codificador B 0.93
Codificador C 0.92
Codificador D 0.67
El codificador D tiene baja confiabilidad.
El cálculo de la confiabilidad intercodificadores se realiza por pares de codificadores (parejas). Se pide a cada pareja que codifique el material, se comparan los resultados obtenidos por las parejas, se cuenta el número de acuerdos entre ellas, se determina el número de unidades de análisis y se aplica la siguiente fórmula: Confiabilidad entre parejas=
Número total de acuerdos entre dos parejas Número total de unidades de análisis codificadas
Después se suman los resultados de esta fórmula y se divide entre el número de comparaciones, que depende del número de parejas. Veámoslo con un ejemplo:
Ejemplo Las parejas codifican el material: Codificador A Codificador B
Pareja 1 à
Codificación de material = Resultado 1
Codificador C Pareja 2 à
Codificación de material = Resultado 2
Pareja 3à
Codificación de material = Resultado 3
Codificador D Codificador E Codificador F
Se determina el número de acuerdos entre las parejas (un acuerdo consiste en que dos parejas codifican en la misma categoría/subcategoría a una misma unidad de análisis). Pareja
Número de u nidades de análisis codificadas
Número de acuerdos entre parejas
1
18
Entre parejas 17 =2y1
2
18
Entre parejas 16 =3y1
3
17
Entre parejas 16 =3y2
Metodología de la investigación
Se aplica la fórmula de confiabilidad entre parejas: C1 y 2
C1 y 3
C2 y 3
17 =
18
=
16 =
18
=
0.94
0.89
16 =
18
=
0.89
Debe observarse que no hubo consenso total entre cuántas unidades de análisis podían distinguirse en el material (la pareja 3 distinguióentre 17 unidades, parejas 1 y 2 distinguieron En estedecaso, para aplicar la fórmula de confiabilidad parejas, yselas toma en cuenta el máximo de18). unidades análisis codificadas por alguna de ellas. Pareja
A B
Número de u nidades de a nálisis codificadas por alguna de las parejas. Si fuera:
25
Número de acuerdos entre parejas
21 Se toma el máximo
22
En este caso, la fórmula de confiabilidad sería: C AB
21 =
25
=
0.84
Se obtiene la confiablidad total (que es la suma de las confiabilidades entre parejas sobre el número de comparaciones). En nuestro ejemplo sería:
No es conveniente tolerar una confiabilidad menor de 0.85 (ni total, ni entre dos parejas) y de ser posible debe superar el 0.89. Al igual que con otros instrumentos de medición, la confiabilidad oscila entre cero (0 = nula confiabilidad) y uno (1 = confiabilidad total). En el análisis de contenido, una confiabilidad baja puede deberse a que las categorías o unidades de análisis no se definieron con claridad y precisión, a un deficiente entrenamiento o a la inhabilidad de los codificadores. Cuando se obtiene una baja confiabilidad tiene que detectarse y corregirse el problema. Asimismo, es conveniente calcular la confiabilidad a la mitad de la codificación (con 50% del material codificado) y al completar esta. 8. Llevar a acabo la codificación. Esta fase implica asignar las unidades al sistema de categorías y contar
las frecuencias de repetición de las unidades en las categorías (número de unidades que corresponden a cada categoría). 9. Vaciar los datos de las hojas o registros de codificación y obtener totales de cada categoría. Este vaciado puede ser de las hojas o registros a la matriz de SPSS, Minitab o programa equivalente, o bien, mediante el empleo de dispositivos ópticos. 10. Realizar los análisis estadísticos apropiados. Se calculan estadísticas dependiendo del nivel de medición de las categorías (frecuentemente no paramétricas).
41
42
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
El análisis de contenido transforma sistemáticamente material verbal, textual o visual en datos cuantitativos, mediante un conjunto de códigos y reglas previamente establecidos (Stark y R oberts, 2005). Una de sus aplicaciones más socorridas es la evaluación de los mensajes transmitidos a través de los medios de comunicación colectiva. Por ejemplo, aylor (2009) lo implementó para determinar cómo son retratadas las víctimas de feminicidio y susperpetradores en los periódicos de Florida (durante un periodo decinco años). Huhn, Oettler y Peetz (2009) exploraron los tópicos que son tratados por la prensa de Costa Rica, El Salvador y Nicaragua al referirse a la violencia. Asimismo, Stein (2009) investigó la forma en que las organizaciones sociales de Estados Unidos utilizan internet (mediante una encuesta entre usuarios y análisis de contenido de páginas web de 86 organizaciones durante un periodo de cuatro meses en 2006). Auster y Michaud (2013) analizaron el contenido de la mercadotecnia de los parques temáticos de Disney en internet. El análisis de contenido también puede aplicarse creativamente a una enorme variedad de investigaciones. Por ejemplo, DeCicco (2007) estudió el contenido de los sueños de un grupo de mujeres y demostró su relación significativa con el descubrimiento de sí mismas. ian (2009) inspeccionó las apelaciones publicitarias utilizadas y los valores culturales reflejados en los anuncios en los periódicos y la televisión de China. Smith (2008) desarrolló un libro sobre múltiples aplicaciones del análisis de contenido para efectuar inferencias sobre la personalidad y la motivación de las personas, así como respecto a características y experiencias de grupos. Por su parte, Harpster, Adams y Jarvis (2009), del FBI, y un departamento de policía, examinaron los indicadores verbales de denuncias hechas sobre homicidios a través del teléfono de urgencias 911, para determinar la inocencia o culpabilidad de la persona que llama. Entre sus resultados descubrieron seis dimensiones lingüísticas que pueden ser útiles para analizar las llamadas telefónicas sobre homicidios y apoyar las investigaciones. Algunos ejemplos adicionales se muestran en la tabla 7. 10. Finalmente, hemos de señalar que con el desarrollo de las nuevas tecnologías de comunicación, el análisis de contenido se mantiene vigente y en expansión. 13
OBSERVACIÓN ¿Qué es y para qué sirve la observación cuantitativa? Esta técnica de recolección de datos consiste en registrar de manera sistemática, válida y confiable los comportamientos o conductas que se manifiestan, de acuerdo a un conjunto de reglas y procedimientos predeterminados derivados del planteamiento del problema de investigación (Yoder, 2013 y McKechnie, 2008). Puede utilizarse como instrumento de medición en muy diversas circunstancias. Polster y Collins (2007) y Haynes (1978) mencionan que es el método que más utilizan quienes se orientan conductualmente. Por ejemplo, es útil para determinar la eficacia de diferentes estilos de liderazgo de los profesores en la enseñanza, así como para analizar conflictos familiares, eventos masivos (como la violencia en los estadios de fútbol o el rechazo a algún gobierno en manifestaciones públicas), la aceptación de un producto en un supermercado, el comportamiento de personas con capacidades mentales distintas, el efecto de ciertas conductas de atención y cuidado con los pacientes por parte de las enfermeras sobre el apego al tratamiento médico prescrito, los riesgos en el trabajo, la adaptación de un equipo humano al uso de cierta maquinaria, etcétera. Desde luego, la observación no es adecuada como instrumento de recolección en todos los estudios. al sería el caso de los procesos cognitivos o cuestiones internas de los individuos (McKechnie, 2008). La observación cuantitativa, como método para recolectar Observación cuantitativa Registro sisdatos, es similar al análisis de contenido. Por ello, en este apartado temáco, válido y conable de comalgunos conceptos sólo se mencionarán, pero no se profundizará en portamiento maniesto. Serecolecta ellos, pues se trataron en el apartado sobre análisis de contenido. información sobre la conducta másque Un aspecto importante que se debe destacar es que en la obserde percepciones. vación el instrumento de recolección de datos es una o varias perso13 Para revisar técnicas específicas de análisis de contenido aplicadas a los medios de comunicación masiva actuales, recomendamos a Divakaran (2009), y respecto de la investigación turística a Stepchenkova, Kirilenko y Morrison (2009).
Metodología de la investigación
Tabla 7.10 Ejemplos adicionales de análisis de contenido. Título de la investigación
Referencia
Brevesíntesis
Análisis de contenido de la cobertura en las noticias de las atletas asiáticas
Yu (2009)
El propósito del estudio fue entender cómo los diarios impresos y electrónicos cubrían en las noticias a las deportistas asiáticas que habían ganado medallas en las olimpiadas de Sydney, Atenas y Beijing y si enfatizaban sus características femeninas y qué expectativas y estereotipos señalaban sobre ellas. Se analizaron 266 artículos noticiosos entre el 1 de enero de 2000 y el 31 de agosto de 2008. Uno de los descubrimientos es que la mayoría se refería a buceo y maratón, a pesar de que las atletas son también competitivas en otros deportes. Los artículos provenían de periódicos de China, Canadá, Estados Unidos, Inglaterra, Japón, Francia, India y Malasia, principalmente.
Los prejuicios asociados con la edad y que generan discriminación en los procesos de reclutamiento en las empresas
Álvarez y Hernández-Sampieri (2014)
Como parte de un proyecto de investigación mixta más amplio, en una primera etapa los investigadores analizaron el contenido de ofertas de empleo publicadas durante 2013 en Celaya, Guanajuato, México, en dos muestras probabilísticas (una extraída de una bolsa de trabajo en línea y la otra seleccionada de los dos principales periódicos locales (n1=368 y n2=337), con el fin de detectar si había o no discriminación por edad y género en el caso de diferentes empleos que no tuvieran limitaciones físicas. Descubrieron que en tales anuncios se presentaba discriminación en ambas variables demográficas. La segunda fase, cualitativa y en proceso, implica entrevistar en profundidad a una muestra de ejecutivos y empleados para descubrir las razones de tal discriminación.
Un análisis de contenido de las evaluaciones-intervenciones de la violencia entre parejas íntimas
Hays y Emelianchik (2009)
Aproximadamente 30% de los individuos de diferentes culturas son víctimas de violencia por parte de su pareja, a lo largo de sus vidas. Las investigadoras efectuaron un análisis de contenido de 38 evaluaciones e intervenciones de tal violencia, descubriendo de manera inductiva siete temas (y sus respectivas limitaciones): contexto de la relación, formas de abuso, indicadores inmediatos de riesgo, dinámica familiar, grado de apoyo, estructura de evaluación e información psicométrica. Posteriormente, los temas fueron considerados como categorías y desplegados en subcategorías para analizar su frecuencia y evaluar el contenido de todas las valoraciones-asesorías. Por ejemplo, la categoría “forma de abuso” se dividió en las siguientes subcategorías (categorías secundarias): emocional, físico, sexual y conflicto en la relación. A su vez, cada una, se desplegó en categorías más específicas o terciarias (abuso emocional: verbal, maltrato, falta de respeto, control, miedo, celos, acoso y acecho). Los resultados sirvieron para analizar la naturaleza de la evaluación-intervención de la violencia en la pareja y sus limitaciones, así como recomendar mejores prácticas cuando se trabaja con esta.
¿La voz de quienes carecen de ella? : Un análisis de contenido cuantitativo del canal satelital insignia de noticias en inglés AlJazeera
Figenschou (2010)
Al-Jazeera es el primer canal satelital que transmite noticias en inglés desde Medio Oriente con el propósito de equilibrar el flujo de noticias occidentales y proporcionar otra visión sobre el acontecer global (la perspectiva de los países árabes). La investigación consideró 60 noticieros y definió a la unidad de análisis como la noticia (n=1 324). Entre otras categoría se incluyeron: la región (global o internacional, Asia, África, Norteamérica, Sudamérica, Europa, Oceanía, Medio Oriente), el formato (noticia breve, análisis, entrevista fuera del estudio, entrevista en el estudio, otras), región general (sur o países no desarrollados y norte o países desarrollados), fuente de la noticia (establecida, élites independientes, personas ordinarias o generales, empleados y miembros del staff, otros), género de la fuente y temáticas. Se calcularon coeficientes de confiabilidad intercodificadores por categoría. Los resultados dan un panorama claro de cómo el canal maneja la información noticiosa.
43
44
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
Tabla 7.10 Ejemplos adicionales de análisis de contenido (continuación). Título de la investigación Misoginia en la música rapera: un análisis de contenido sobre la prevalencia y significados
Referencia
Weitzer y Kubrin (2009)
Brevesíntesis
Esta investigación se llevó a cabo para evaluar la manera en que se representa a las mujeres en una muestra de 403 canciones de rap y si se manifiesta misoginia en ellas. Una categoría fue la forma como se refieren al género femenino en las melodías; en ella, las subcategorías consideradas fueron: nombrar y avergonzar a la mujer (49% de frecuencia), tratar a la mujer como “objeto sexual” (67%), desconfiar de la mujer (47%), legitimar la violencia contra ella (18%) y prostitución y proxenetismo (20%). Un requisito para que las canciones se incluyeran en la muestra fue que formaran parte de un álbum con certificación de platino (al menos un millón de copias vendidas), debido a que así se aseguraba que hubieran sido escuchadas por un segmento sustancial de la población (se consideraron 130 álbumes producidos entre 1992 y 2000). La confiabilidad entre codificadores fue de 73.4% para la categoría misoginia.
Imágenes de guerra: Un análisis de contenido de la cobertura fotográfica en la guerra en Kosovo
Nikolaev (2009)
De acuerdo con documentos oficiales estadounidenses e internacionales, el conflicto de Kosovo fue una guerra civil entre la población serbia respaldada por el gobierno de Yugoslavia y la Organización Terrorista Albanesa (KLA). De esta versión partió el trabajo con una pregunta de investigación sencilla pero muy significativa: ¿los medios impresos estadounidenses contaron esta historia correctamente? La hipótesis general afirmaba que la cobertura fotográfica de la guerra había sido desequilibrada con un sesgo evidente contra los serbios. Se consideraron todas las 365 fotografías (unidades de análisis) dedicadas a la guerra de Kosovo por las revistas Newsweek, Time y U. S. News & World Report en un periodo de cinco meses de 1999. La confiabilidad entre codificadores fue sumamente significativa (0.97). Al final, los resultados estadísticos apoyaron la hipótesis.
El contenido de de los las definiciones niños: la distinción oral-escrita
Marinellie (2009)
El estudio se por propuso las definiciones de infantes palabras(cuyo proporcionadas niños,investigar tanto en el el contenido modo oralde como escrito. Treinta promedio de edad era de nueve años y dos meses) definieron sustantivos comunes en ambos modos. Las definiciones fueron codificadas por el uso de términos categóricos (por ejemplo, manzana: fruta; autobús: vehículo) y atributos (por ejemplo, manzana: roja). Los resultados indicaron que los niños muestran diferentes tipos de conocimiento de las palabras en los dos modos, pero que la forma escrita es más útil para producir términos categóricos (para encajar los sustantivos en categorías). Las definiciones orales tienden a ser más extensas. Los resultados sirven para planear mejor la enseñanza de conceptos en niños de educación básica.
nas, porque los equipos (de filmación, para captar movimientos, etc.) solo registran lo que los sentidos humanos van a percibir (Bentzen, 2008 y Anastas, 2005). En la observación cuantitativa, a diferencia de la cualitativa, las variables que se observan son especificadas y definidas antes de comenzar la recolección de los datos. Se enfoca en información que pueda ser evaluada por medio de los sentidos (datos visuales, auditivos, producto del tacto y el olfato, etc.). Asimismo, los observadores registran lo que perciben de acuerdo con un sistema y reglas que se aplican invariablemente, las cuales les ayudan a minimizar su efecto sobre los registros e interacciones con los participantes observados. Esta circunstancia es particularmente crítica porque los seres humanos somos selectivos en nuestras observaciones e inducimos cierto grado de variación (Ratcliff y Lassiter, 2007).
Pasos para construir un sistema de observación Los pasos para construir un sistema de observación son: 1. Definir con precisión el universo de aspectos, eventos, conductas o variables que se observarán. ¿Qué y
Metodología de la investigación
quién o quiénes se van a observar y por cuánto tiempo? Por ejemplo, si nuestro interés es conocer los recursos con que cuentan las escuelas de un distrito escolar, debemos precisar lo que consideramos como “recurso escolar”. Un universo de aspectos a observar podría ser el comportamiento verbal y no verbal de un grupo de alumnos durante un semestre en una asignatura. Otro universo lo podrían constituir las conductas de un grupo de trabajadores durante sus sesiones en círculos de calidad o equipos para la calidad, en el periodo de un año. O bien, las conductas agresivas de un grupo de esquizofrénicos en sesiones terapéuticas en cierto periodo. El universo obviamente depende de las variables que conformen el planteamiento del problema. 2. Especificar las circunstancias de la observación . ¿Dónde y cuándo se conducirán las observaciones? (lugar y ubicación temporal). Por ejemplo, el aula en la clase de economía durante este semestre desde el inicio y hasta que concluyade el ciclo, antes del exámenes; todas normalmente; las sesiones de las los próximas grupos para calidad del departamento producción, enperiodo el lugardedonde se reúnen 10lasesiones 4 terapéuticas de ciertos pacientes en una cámara Gesell.1 ales circunstanciasdependen del planteamiento del problema y la situación. Los lugares pueden ser muy variados: una sala de emergencias, un consultorio médico, una tienda, un aula escolar, un sitio de una comunidad, etc. Resulta obvio que vamos a observar en lugares adecuados y evitar los que son inapropiados (por ejemplo, intentar registrar conductas criminales en un desfile familiar no sería lo común, lo lógico). A veces se arregla o adapta un ambiente, de tal modo que sea lo suficientemente estable y se pueda aprovechar para realizar comparaciones entre conductas por medio de observaciones repetidas (tanto en el tiempo como entre individuos). Además, es indispensable definir si la observación se realizará “en vivo” (mientras ocurren las conductas, aspectos o eventos) o posteriormente (se filmarán los comportamientos y hechos que después se analizarán). Asimismo, se debe especificar el tipo de equipo necesario para efectuar las tareas de observación (si observamos células cancerosas, requeriremos de un potente microscopio; si se trata de planetas, un telescopio de muy largo alcance; el policía que observa a un grupo de pandilleros requerirá de binoculares y un micrófono especial que pueda registrar las conversaciones; con tiburones podría necesitarse un equipo que nos logre aislar de los escualos, etcétera). Un caso maravilloso de observación por equipo altamente especializado lo ofrece el proyecto “Impacto de la Administración Nacional Aeronáutica y Espacial sus siglas empel (NASA, 1 (lo cualpor inglés). LaProfundo” misión envió una nave espacial para colisionar al cometa implicó una en investigación sumamente avanzada, el diseño de tecnología nunca antes vista, complejos cálculos matemáticos y proyecciones). Entre algunos de los objetivos del proyecto, podemos citar los siguientes: analizar la composición de los cometas y meteoros similares e indagar más sobre los orígenes del universo. La colisión calculada se produjo el 4 de julio de 2005 a 23 000 mph (NASA, 2005). La observación se realizó mediante cámaras fotográficas y de video que se ubicaron en la propia nave Deep Impact (nave de colisión) y en la nave Flyby, así como mediante algunos de los telescopios más desarrollados del mundo. Un proyecto ideal para la observación del espacio. Además, ahora los seres humanos sabemos que somos capaces de impactar cualquier meteorito o cometa que amenace nuestro planeta. Conocer la composición de estos objetos permitirá diseñar el proyectil adecuado. Otro caso es la observación permanente de la superficie de Marte mediante la unidad robot rodante Curiosity con el fin de estudiar al planeta y sus cambios ambientales, que nos ayudará, entre otras cuestiones, a evaluar la posibilidad de habitarlo y generar teoría sobre nuestro propio cambio climático global (NASA, 2014). 3. Incluir todo el universo o extraer una muestra representativa de aspectos, eventos o conductas a observar.
Un repertorio que sea suficiente para observar las conductas, eventos o cuestiones sobre las variables de interés.
4. Establecer y definir las unidades de observación. Las unidades deben ser captadas por los sentidos. Por
ejemplo, observar cada vez que se presenta una conducta agresiva de un determinado paciente; ana14 Este recinto, donde los participantes son colocados para observación, cuenta con dos secciones separadas por un cristal de una sola vista o unidireccional (que permite ver de una sección a la otra, pero no de esta hacia la primera). Una sección es regularmente una sala o mesa de trabajo (desde donde el cristal parece ser un espejo o un vidrio opaco) y la otra, la zona de observación, integrada por butacas, sillas o un aula escolar, en la cual se ve y se escucha todo lo que ocurre en la sala o mesa de trabajo (además, se filma la acción).
45
46
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
lizar cada minuto si el alumno está o no atento a la clase de economía (la materia se imparte dos veces a la semana, dos horas cada clase, de 7:00 a 9:00 horas), etc. El concepto de unidad de análisis es el mismo que en la recopilación y el análisis de contenido, sólo que en la observación cuantitativa se Tabla 7.11 Algunos ejemplos de unidades de análisis o registro. Estudio
Unidadesdeobservación/medición
Evaluar si un programa de televisión con contenido violento genera conductas agresivas en los niños.
Agresiones físicas de los niños (cada vez que se manifiesta una agresión, como golpear a otro niño, empujarlo intencionalmente, etcétera).
Determinar la conducta de compra en una tienda de ropa por parte de cierto tipo de clientes.
Episodio de compra: en el caso de cada cliente, desde que ingresa a la tienda y hasta que sale de ella: ¿qué prendas o accesorios compró?, ¿de qué colores, texturas?, ¿cuál es su perfil?, etcétera.
Analizar la atención que se presta al tablero de avisos de la compañía.
pisodio de interacción: cada vez que un empleado pasa junto al tablero de avisos, se detiene o no a verlo, cuánto tiempo lo observa y qué información capta más su atención.
Evaluar el efecto del consumo de alcohol en el comportamiento agresivo de los jóvenes.
stancia en un bar o cervecería: número de copas o tragos que consumen y número de comportamientos agresivos y sus características (registro progresivo de todo el tiempo de permanencia en el lugar).
Inferir actitudes de fervor religioso en la iglesia .
Cada periodo de tres minutos: registrar conductas que reflejen el fervor religioso (persignarse, arrodillarse, etcétera).
Deducir conductas de aprobación por parte de los pacientes sobre el trato que reciben de las enfermeras.
Manifestaciones de aprobación (cada vez que el enfermo sonríe a la enfermera, la mira afectuosamente, asiente favorablemente, etcétera).
Determinar el apego de los pacientes a ciertas prescripciones de los tratamientos (medicación y ejercicio), mediante filmación.
Conductas de apego (cada vez que el paciente consume el medicamento a la hora prescrita y el número de minutos que se ejercita de acuerdo a lo que el médico le solicitó).
Analizar explosiones solares: magnitud, duración y naturaleza.
La observación mediante diferentes equipos resulta permanente y la unidad es cada explosión (todo su ciclo).
trata de conductas, eventos o aspectos manifiestos. Algunos ejemplos se presentan en la tabla 7.11. 5. Establecer y definir las categorías y subcategorías de observación. Estas categorías son similares a las
puntualizadas para el análisis de contenido. La observación también consiste en asignar unidades a categorías y subcategorías de observación. En esta, como en las demás técnicas de medición, se asume que las variables (representadas por las categorías y subcategorías) han sido definidas conceptual y operacionalmente de forma adecuada, para que el observador realice correctamente las tareas de discriminación, que es su función central. En la tabla 7.12 se muestran ejemplos. Tabla 7.12 Ejemplos de definiciones de categorías. Variable Conducta agresiva hacia los demás
Categorías 0 a k conductas agresivas
Definición Comportamientos que se manifiesten con la intención aparente de injuriar o dañar a otra persona, ya sea mediante insultos verbales o signos no verbales y acciones físicas.
Conducta de compra (ropa)
0 a k artículos adquiridos
Compra de artículos a crédito o al contado.
Metodología de la investigación
Tabla 7.12 Ejemplos de definiciones de categorías (continuación). Variable Amabilidad en el servicio cuando el cliente tiene alguna necesidad
Categorías • Amable • Neutral • Grosero
Definición Amable: atender al cliente sonriéndole y haciendo contacto visual con él. Preguntarle por sus necesidades, resolver sus inquietu-des, no interrumpirlo cuando esté hablando, dar solución a las necesidades pertinentes, mantenerse con él hasta que la solución solicitada se implemente, preguntar si requiere algo más e inquirirle si está satisfecho. Neutral: no sonreír al cliente, hacer contacto visual solo una vez o no mantener tal contacto. No demostrarle que se le está escuchando, no permanecer con él hasta que la solución se haya implementado y no verificar su satisfacción con esa solución. Grosero: no sonreír al cliente, mostrarse molesto por sus peticiones, no establecer contacto visual, no preguntarle por sus necesidades, no resolver sus inquietudes, interrumpirlo cuando habla, no solucionar las necesidades pertinentes, no mantenerse con él hasta que la solución solicitada se haya implementado, no preguntar si requiere algo más ni inquirirle si está satisfecho.
Oportunidad en la atención al cliente (en una sucursal bancaria, en una taquilla en el cine, puesto de venta de boletos en un estadio de fútbol)
0 a k minutos y segundos
Tiempo que el cliente espera en fila (línea o cola).
Ejemplo De unidades y categorías En el caso del experimento citado en el capítulo 7 (al hablar de la manipulación de variables independientes en experimentos) para probar la hipótesis “A mayor grado de información sobre la deficiencia mental que el sujeto normal maneje, mostrará menor evitación en la interacción con el deficiente mental” (Naves y Poplawsky, 1984). Las unidades de análisis eran lapsos de 10 segundos. La interacción entre la persona normal y el actor que hacía el papel de “deficiente mental” (individuo con capacidad mental distinta) duraba tres minutos. La variable dependiente fue “evitación de la interacción” y las categorías fueron cuatro (Naves y Poplawsky, 1984, pp. 107-109): 1. Distancia física: se refiere a si el participante experimental aumenta o disminuye su distancia hacia el interlocutor a partir de la distancia que inicialmente ocuparía; esta distancia inicial estuvo delimitada por los asientos que el actor y el sujeto debían ocupar y, según la teoría, es la distancia en la que dos extraños en una situación de comunicación pueden interactuar de manera cómoda. Las dimensiones o subcategorías que este indicador adquiere son: acercarse (afiliación) con valor de “2”, mantenerse estático, con valor de “1”; y alejarse (evitación) del actor (deficiente mental), con valor de “0”; mediante inclinaciones corporales, o bien, al modificar por completo su distancia. 2. Movimientos corporales que denotan tensión: esta categoría intenta captar los movimientos que el sujeto realiza: si efectuaba movimientos que indicaran tensión (evitación) el valor era de “0”; ningún movimiento con valor de “1”; y movimientos que señalan que se experimenta relajación (afiliación), con valor de “2”. En este indicador específicamente se analizan si los movimientos de pies y piernas están a un ritmo acelerado, si hay ademanes con brazos y manos (como rascarse, sentir picor, etc.) y la postura en general del participante. 3. Conducta visual del sujeto: según se estipula en esa investigación, este factor adquiere dos dimensiones o subcategorías: a) Dirigida hacia el interlocutor (afiliación) con valor de “1”. b) Dirigida hacia cualquier otra parte (evitación) con valor de “0”. 4. Conducta verbal: este indicador está compuesto por el contenido verbal del discurso del sujeto hacia el deficiente y se orienta primordialmente a la forma del discurso; incluye dos modalidades:
47
48
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
a) Frases u oraciones completas (afiliación), con valor de “1”. b) Frases dicotómicas y silencios (evitación), con valor de “0”. La modalidad de frases dicotómicas incluye respuestas monosilábicas (sí, no), murmullos, sonidos guturales; los silencios que se interpretan como respuestas dicótomas (de evitación) son aquellos no naturales en el discurso, cuando expresamente el individuo se queda en silencio. La conducta verbal se mide a través del diálogo que sostenga la persona con el deficiente mental; es decir, en respuesta al guión que el actor interpreta ante cada sujeto (que es idéntico para todos) y en las intervenciones que el mismo individuo realice. En este caso, además de medir la conducta verbal en cuanto a su forma, convendría medirla también en cuanto a su contenido; es decir, determinar si las frases emitidas por el participante en respuesta a lo expresado por el deficiente revelan un contenido positivo o negativo.
Los periodos de observación, las unidades y categorías varían de acuerdo con el planteamiento del problema e hipótesis.
Las subcategorías pueden ser escalas de actitudes Las subcategorías pueden ser tratadas como escalas del tipo Likert, Guttman o diferencial semántico.
Ejemplo Categoría
Subcategoría
Atención del alumno
Elevada (3) Meida (2) Baja (1) Nula (0)
Disciplina del alumno
Completa (3) Aceptable (2) Media (1) Indisciplina (0)
O bien, agresividad del niño
Muy alta (5) Alta (4) Regular (3) Baja (2) Inexistente (1)
O, al hablar del desempeño laboral observado en coordinadores de escuelas o asociaciones: Productividad
Actitud de servicio
:
::
(5)
(4)
:
::
(5)
(4)
: (3)
: (2)
: (3)
: ( 1)
: (2)
(0)
Improductividad
: ( 1)
(0)
Actitud de no servicio
Cumplimiento-incumplimiento Etcétera
6. Diseñar la manera 15 de registrar las observaciones (mediante un formulario, hoja de codificación o guía de observación). Este instrumento, en el cual se ingresan o anotan los datos, está prediseñado sobre
la base de la revisión de la literatura o construido especialmente para el estudio. Su formato es similar al que se presentó en el apartado sobre análisis de contenido. Anastas (2005) indica que en ocasiones se utilizan sistemas de observación probados debido a: a) los costos (desarrollar uno requiere tiempo, varias pruebas y recursos), b) existen diversos instrumentos válidos y confiables para un amplio reper15 Recordemos: en papel o como documento de PC, puede ser una hoja de Excel.
Metodología de la investigación
torio de conductas, y c) se facilita la comparación con los estudios que utilizaron el mismo sistema de observación (se comparte un marco interpretativo). En ocasiones, los instrumentos son aparatos que registran las observaciones (pistola láser de lectura de velocidad, scanner, sistema de video, telescopio, microscopio, etc.). En el caso de Naves y Poplawsky (1984), el formato de codificación es el que se muestra en la figura 7.11; asimismo, se agrega otro ejemplo en la figura 7.12. El ejemplo de la figura 7.12 es un formato para registrar conductas inapropiadas en la clase y ’ 3 ” 0 5 ” 0 4 l: ta n e irm e p x e n ó i ic d n o C
” 0 3 ” 0 2 ” 0 1 ’ 2 ” 0 5 ” 0 4 ” 0 3 ” 0 2 ” 0 1
. n ó ci a ci fi d o c o ro sti g re e d to a m r fo n u e d lo p m je e r e im r P 1 1 . 7 a r u g i F
: e t n a p i c tri a p l e d re b m o N
’ 1 ” 0 5 ” 0 4 : a h c e F
” 0 3 ” 0 2 ” 0 1 ’ 0
: a r o H
:r o d a c fi i d o C
íra o g e t a c b u S a rí o g e t a C
) 0 ( o t n e i m ja lo A a i c n a ts i D
) 2 ( o t n ie m a c r e c A
a c síi f
) 1 ( o c ti á st E
) 0 ( n ó si n e T s to n e i m i v o
) 2 ( n ó i c ja a l e R
s le a r o rp o Mc
) 1 ( o n u g in N
) 0 ( te r a p ra t o A
) 1 ( o t e j u ls A a t c u d n o C
l a su i v
) 1 ( s a t le p m o .c F a t c u d n o C
) (0 s a m to ó ic .d F
l a b r e v
) 0 ( s o s io c n ile S
49
50
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
Figura 7.12 Formato de registro de conductas inapropiadas. CONDUCTAS INAPROPIADAS EN EL SALÓN DE CLASE O AULA FECHA:
HORA:
CLASE:
PROFESOR:
NÚMERODEESTUDIANTES:
GRADO:
Conductasinapropiadas(CI):
Númerodeestudiantesinvolucrados(N):
Agresión física Ofensa verbal
1-Individuo Diada -2
Insultonoverbal(señas)
3-Grupopequeño(3a5)
Hablarenclase
Grupo 4- grande(6a15)
Ruido provocado
Toda -5 la clase
Desobediencia No enfocado en la clase (distraído) 1 - Otra
Estudiantes Núm.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
CI N Núm. CI N Núm. CI N Núm. CI N
analizar cuáles son las que se presentan con mayor frecuencia y el número de estudiantes involucrados (Creswell, 2005). Los números (columnas) representan episodios de conducta inapropiada en la clase (cada vez que ocurre). En la fila “CI” (conducta inapropiada) se coloca la letra inicial de la conducta (ejemplo: A, agresión física, O, ofensa verbal; H, hablar en clase…), y “1” si son otras. Asimismo, en la fila “N” se indica el número de estudiantes involucrados en el episodio. La hoja de codificación, formato o guía debe ser acompañada de las instrucciones para su llenado y los registros, así como la mención de las unidades de observación y el tiempo que durará esta. Debe evitarse un instrumento que sea tan complejo que sea difícil de codificar y utilizarse en la realidad. 7. Determinar el papel de los observadores. ¿Qué tan cercanos deben estar el observador y los observados?
Metodología de la investigación
A este respecto mucho se ha escrito y los papeles varían desde una distancia prudentemente lejana hasta una cercanía completa (McCurdy y Uldam, 2014). Williams (2008), Polster y Collins (2007) y Anastas (2005) plantean dos roles fundamentales de la relación observador-observados: a) participante (donde hay relación entre el observador y las personas observadas) y b) no participante (la relación es mínima —simplemente por el hecho de que los individuos saben que están siendo observados— o puede ser nula, si los individuos no lo saben). La ética de la investigación marca que siempre que va a observarse a un ser humano, se debe obtener su consentimiento; asimismo, no se deben invadir sus esferas privadas (baños, recámaras, despachos, etc.). Anastas (2005) está de acuerdo con este principio, aunque marca una excepción: cuando se observan conductas inocuas que pudieran ocurrir de manera natural en situaciones públicas y cuando las personas observadas no son identificadas o afectadas por los observadores. En última instancia, si el investigador trata de evitar la “reactividad” en el proceso (que la presencia de los observadores provoque reacciones poco o nada naturales en los participantes), una vez que se efectúan las observaciones debe solicitársele a cada sujeto su autorización, mantener su nombre en el anonimato, nunca mostrar las filmaciones o registros y respetar su negativa, si es el caso. Jorgensen (1989) sugiere tres actuaciones: a) participante activo: el observador interactúa plenamente con los observados, tiene un papel de miembro, es uno más de ellos (por ejemplo, si se trata de observar el compromiso de trabajadores en los grupos de calidad, el observador es un miembro del grupo con funciones específicas), b) participante privilegiado: no es un miembro del grupo, pero tiene acceso a información amplia y privada; los observados lo conocen y le tienen confianza; y c) observador limitado; no tiene más que el papel de observador externo. Rogers y Bouey (2005) los clasifican en el siguiente continuo: Participante completo: total interacción; su rol primario es participar y generar la interacción
Participante observador: su rol primario es participar, pero casi a la par observa
Observador participante: su rol primario es observar, aunque tiene ciertas participaciones
Observador completo: nula participación; se limita a observar
McKechnie (2008) y Patton (2001) sugieren que el observador debe ubicarse en varios continuos para establecer su papel (que es una ubicación aproximada y no exacta):
51
52
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
Sin que de ninguna manera sea una norma, cuando la observación cuantitativa trabaja con personas, regularmente es no participante, encubierta o intermedia, de corta estancia y enfocada, mientras que la observación cualitativa es participante, abierta, prolongada y general. 8. Seleccionar a los observadores-codificadores. Puesto que son las personas que codificarán la conducta, deben conocer las variables, categorías y subcategorías. Las habilidades más importantes de un buen observador son: • • •
Selectividad para registrar lo que observa, de acuerdo con reglas. Uso de todos los sentidos, particularmente ante lo que no se esperaba encontrar. Capacidad para aplicar el sistema de registro que involucra el procesamiento de información.
9.
Entrenar a observadores-codificadores las sobre variables, categorías,maneras subcategorías, de análisis yuna el procedimiento para codificar, así (en como las diferentes en queunidades puede manifestarse categoría o subcategoría de conducta). Debido a que, en algún grado, la observación involucra hacer juicios, el entrenamiento debe apoyar la estandarización de procedimientos y, por ende, la objetividad. 10. Efectuar la prueba piloto y calcular la confiabilidad de los observadores (intraobservador e interobservadores). En la prueba piloto se evalúa todo lo relativo al proceso de observación. Desde la iluminación ambiental (ejemplo, cámara Gesell), el sonido y los equipos de filmación, hasta el lugar donde se coloquen los observadores, las instrucciones y la guía de observación o registro. Gracias a la prueba piloto podemos detectar problemas potenciales y corregirlos (por ejemplo, si vamos a observar conductas agresivas de niños y nada más hemos trabajado con adultos, nos percataremos de que la agresión no se manifiesta igual en ambos casos. De este modo, durante la prueba piloto podemos registrar comportamientos agresivos no contemplados, que se agregarán como subcategorías en el instrumento de observación definitivo). Esto se hace con una muestra del repertorio de conductas o actos que se considerarán. Con respecto a la confiabilidad, recordemos que debe demostrarse y no simplemente asumirse, y se determina para evaluar si los observadores catalogan o clasifican coherentemente (confiabilidad individual) y si registran entre sí de manera similar los mismos eventos o conductas (confiabilidad interobservadores). Los procedimientos y las fórmulas pueden ser las mismas que las vistas en el apartado sobre el análisis de contenido; lo único que cambia es la palabra “codificadores”, “codificación”, “codificadas”, por “observadores”, “observación”, “observadas”. Por ejemplo:
Confiabilidad entre parejas=
Número total de acuerdos entre dos parejas Número total de unidades de análisis codificadas
Haynes (1978, p. 160) proporciona otra fórmula para calcular la confiabilidad entre observadores o el grado de acuerdo interobservadores (Ao).
donde Ia es el número total de acuerdos e Id es el número total de desacuerdos entre observadores, respectivamente. Un “acuerdo” se define como la codificación de una unidad de análisis en una misma categoría/subcategoría por distintos observadores. Se interpreta como cualquier coeficiente de confiabilidad (0 a l). Cuando se trata de establecer la confiabilidad es muy importante evitar que los observadores “copien” o vean el trabajo de sus compañeros, ya que esto puede ocurrir. Bakeman y Quera (2011); Grinnell, Williams y Unrau (2009), así como Anastas (2005) consideran como una confiabilidad interobservadores mínima aceptable un puntaje de 0.85 u 85%. Si se elige
Metodología de la investigación
un instrumento ya desarrollado, al igual que en otros métodos de medición, debe demostrarse que en los estudios donde se aplicó resultó válido y confiable, y adaptarse a las condiciones de nuestra investigación. Para establecer la validez de contenido se analiza el dominio de nuestras categorías y subcategorías en contraste con el universo de posibles conductas que pueden manifestarse. Muchas veces, la validez de criterio se establece usando otra técnica (por ejemplo, la “hostilidad”, que se infiere de observar actos agresivos, puede validarse mediante una escala que mida tal variable). 1. Llevar a cabo la codificación por observación. 2. Vaciar los datos de las hojas o formatos de codificación y obtener los totales de cada categoría. 3. Realizar los análisis apropiados.
La observación es una excelente herramienta de recolección de los datos en ciertas poblaciones, como los niños y las personas con capacidades distintas. Por ejemplo, Rapport et al. (2009) utilizaron la observación para analizar los procesos y patrones de atención en el aula por parte de niños con trastorno por déficit de atención con hiperactividad (DAH). Sutherland et al. (2013) desarrollaron un sistema de observación directa de la interacción del profesor con sus alumnos infantes para evaluar la eficacia del primero y estudiar los patrones de vinculación, así como analizar conductas problemáticas. Asimismo, la observación se utiliza como un método para recolectar datos sobre el comportamiento de los pacientes (desde su conducta social hasta las reacciones ante los tratamientos y sus expresiones). Por ejemplo, Mendez et al. (2013) generaron e implementaron un inventario para observar las conductas de enfermos de Alzheimer y demencia frontotemporal. et al. (2009) observaron duranambién puede ser una herramienta en estudios longitudinales. Mejia te un periodo de poco más de dos años para comprender qué factores inciden en la conducta grupal de un equipo de trabajo comunitario dedicado a la prevención del VIH. Grabaron en video 18 sesiones del grupo.
CODIFICACIÓN ENdatos EL del ANÁLISIS DE CONTENIDO Y LAtodos OBSERVACIÓN Una vez recolectados los análisis de contenido o la observación, deben codificarse, es decir, asignar códigos (generalmente numéricos) a las categorías y/o subcategorías. Por ejemplo, en el caso del estudio de Naves y Poplawsky (1984), la codificación es la que se muestra en la tabla 7.13 (que corresponde al primer ejemplo de un formato de registro o codificación, figura 7. 11). Además, la matriz de SPSS o equivalente sería la de la tabla 7.14 (desde luego, solo se incluyen 10 casos a manera de ejemplo).
RECOPILACIÓN Y ANÁLISIS DE DATOS SECUNDARIOS La recopilación y análisis de datos secundarios se fundamenta en información disponible recolectada por otros analistas distintos del investigador. Esta técnica para recabar los datos puede subdividirse en: a) datos estadísticos provenientes de fuentes oficiales y b) datos para metaanálisis. En ambos casos se acude a bases de información que pueden encontrarse en una o varias fuentes y que son útiles para los propósitos del estudio (Schmidt y Hunter, 2014 y Vartanian, 2010). La diferencia entre estos dos tipos estriba en que los primeros recogen estadísticas como datos para analizar (por ejemplo, tasas de defunción o mortalidad y nacimiento, número de hectáreas de riego, cifras de egreso en los distintos niveles del sistema escolar, número camasbruto, de los número hospitales pacientes atendidos, de en monumentos históricos por tipo, productodeinterno de yinstalaciones deportivasnúmero y tamaño metros cuadrados, extensión de la red de alcantarillado, índice de inflación, monto de la deuda externa pública y privada, unidades producidas por una o varias fábricas, digamos de autos, etc.); en cambio, el metaanálisis recopila datos de estudios efectuados por otros sobre el planteamiento del problema, los evalúa y puede volver a analizarlos e integrarlos en una base mayor de información; o bien, sumarlos y compararlos (Ringquist, 2013) . Krysik (2005) considera tres tipos de datos secundarios: datos obtenidos del nivel “micro”, datos
53
54
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
Tabla 7.13 Ejemplo de codificación en el caso del estudio de Naves y Poplawsky (continuación). Variable – Tratamiento experimental –Conducta
Categorías
–Distanciafísica
–Alejamiento – Acercamiento – Estático
– Movimientos corporales
–Codificador
Subcategorías
– Grupo cultural – Grupo sociopsicológico
Códigos
Columnas
1 2
1
0 2 1
2
– Tensión
0
– Relajación – Ninguno
2 1
3
–Conductavisual
–Alsujeto – A otra parte
1 0
4
– Conducta verbal
– Frases completas – Frases dicótomas o silencios
1 0
5
1 2 3
6
–LRE – MRM – APY
Desde luego, Naves y Poplawsky (1984) para las categorías de “conducta de evitación” obtenían esta codificación cada 10 segundos (cada unidad de análisis), y sumaban el número de 2 (dos) y 1 (uno) y lo transformaban en porcentaje. Aquí suponemos que toda la interacción con el supuesto deficiente mental puede categorizarse y subcategorizarse. Recordemos que eran 30 participantes.
Tabla 7.14 Matriz o vista de los datos para la codificación de la tabla 7.13 (Naves y Poplawsky). Columna 1 Tratamiento experimental S1
100001
S2
100001
S3
220112
S4
110002
S5
222112
S6
101103
S7
222113
S8
222113
S9
212011
S10
121002
Columna 2 Distancia física
Columna 3 Movimientos corporales
Columna 4 Conducta visual
Columna 5 Conducta verbal
Columna 6 Codificador
agregados y datos cualitativos micro. a) Datos obtenidos del nivel “micro”.Son derivados de unidades de análisis individuales como personas,
organizaciones u hogares (número de habitantes por vivienda, número de trabajadores de la empresa, preferencias de votantes por partidos políticos y candidatos en un distrito electoral, satisfacción laboral de los trabajadores, etc.). La mayoría de las veces los datos se recolectan por medio de encuestas. Por ejemplo, los censos económicos (vistos en el capítulo de encuestas o surveys de este centro de recursos en línea) generan esta clase de datos, al igual que los de población.
Metodología de la investigación
La encuesta nacional de adicciones de estudiantes (implementada anualmente en varios países latinoamericanos) es otro caso y recolecta —entre otros datos— los siguientes:16 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.
Personas económicamente activas en el sistema familiar. Distribución del tiempo libre del estudiante. Convivencia del alumno en el hogar (padres y otros parientes). Estructura del sistema matrimonial de los tutores del estudiante (padres casados, divorciados, separados, etcétera). Ocupación de las personas económicamente activas del hogar. Personas con quienes los estudiantes se comunican más dentro del hogar. Actividades deportivas del estudiante (tipos y periodicidad de cada actividad deportiva, tiempos de dedicación, entre otros). Conducta de fumar (inicio, frecuencia de la conducta de fumar, consumo diario de cigarrillos). Ingesta de alcohol (inicio, periodicidad, consumo semanal). Percepción proyectiva del consumo de estupefacientes o drogas ilegales (se responde a la pregunta: ¿A
cuántos de tus compañeros de escuela has visto consumir droga?, ¿a cuántos de tus amigos, fuera de la escuela?). 11. Conocimiento del tipo de droga que se consume (cuestionamiento: Señala la droga que sabes consumen en este plantel… Señala la droga que sabes se consume en tu vecindario… ). 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30.
Preferencia de consumo en el entorno inmediato por tipo de estupefaciente (fuera de la escuela). Percepción del encuestado respecto de si es un problema general el consumo de estupefacientes. Percepción respecto de si se pueden conseguir drogas o estupefacientes dentro de la escuela. Percepción respecto de si se consume droga o sustancias ilegales dentro de la escuela. Percepción respecto de si el consumo de estupefacientes es un problema en su entorno. Preferencia de consumo en la escuela por tipo de estupefaciente. Actitud ante el consumo de estupefacientes por una amistad. Manifestación de haber consumido algún estupefaciente. Edad de inicio de consumo. Figura o tipo de persona que invitó a experimentar el consumo (amigo, tutor, etcétera). ipo de estupefaciente o droga consumida por primera vez. Consumo de diferentes clases de estupefacientes. Preferencia individual de consumo por tipo de estupefaciente. Periodicidad del consumo. Motivos del consumo. Acciones recomendadas por los encuestados para reducir el consumo, evitarlo o prevenirlo. Conciencia del consumo de estupefacientes. Fuente más impactante de conocimiento del problema social que implica el consumo de estupefacientes. Comentarios abiertos (cualitativo).
El investigador, aunque no generó estos datos, tiene acceso directo a ellos (a la información individual srcinal; a los cuestionarios, registros, matriz de datos, etc.) y, por lo tanto, los puede volver a analizar (incluso a veces puede identificar a los encuestados o sus perfiles). Por ética, regularmente sólo debe proporcionarse la matriz de datos y respetar el principio de confidencialidad. b) Datos agregados. Consisten en datos individuales que ya se han procesado y reunido con otros en cifras estadísticas, tablas o cuadros. En estos, lasrecibe características de las no pueden identificadas (por ejemplo: el investigador el dato sobre el unidades promediode de análisis satisfacción laboral ser en una escala o la tasa de desempleo y obviamente no puede reanalizar los datos, sólo utilizarlos para los fines que convengan).
16 Por ejemplo, en México la publica periódicamente el Consejo Nacional Contra las Adicciones (CONADIC).
55
56
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
Estos datos se pueden obtener de: 1. Oficinas y agencias gubernamentales y oficiales (Ministerio de Educación de Argentina; Ministerio
de Educación, Cultura y Deporte de España; Dirección de Impuestos y Aduanas Nacionales de Colombia; Instituto Nacional de Estadística de Bolivia; Ministerio de Desarrollo e Inclusión Social del Perú; Banco Central de Venezuela; Consejo Nacional de Ciencia y ecnología de México, etcétera). 2. Organizaciones privadas (Cámara de Comercio de Santiago de Chile, Consejo de Fundaciones Privadas de Guatemala, Fundación Cultural Española para el Fomento de la Artesanía, Centro de Estudios Económicos del Sector Privado en México, Fundación Ford, entre otras). Algunas bases de datos privadas contienen archivos periodísticos, como por ejemplo: U.S. News Archives on the Web (periódicos de Estados Unidos), Reuters y Europrensa (Universidad Complutense de Madrid), International News Archives on the Web (varios países, incluidos diarios latinoamericanos), etc. Los periódicos más importantes del mundo poseen su propia base de datos. 3. Organizaciones no gubernamentales (Agencia de Cooperación en Ingeniería Ambiental o ACIA, Pro Amazonia “Selva Para la Vida”, Alianza Cívica en México, Asociación Bienestar y Desarrollo en España, Asilo de Ancianos de Celaya y otras). 4. Organizaciones internacionales (Comisión Económica para América Latina y el Caribe; Organización de las Naciones Unidas para la Educación, la Ciencia y la Cultura, UNESCO; Organización Mundial de la Salud, OMS; Fondo de las Naciones Unidas para la Infancia, UNICEF; Fondo Monetario Internacional, etcétera). Las primeras tres fuentes genéricas varían en cada país, por lo que resultaría poco práctico intentar mencionarlas. Por ello, cada estudiante o profesor debe tener en mente cuáles son y qué tipo de información pueden proporcionar.17 De los datos resulta fundamental conocer:18 • •
• •
•
El nombre y la filiación institucional de quien los recolectó. El periodo de recopilación. La muestra (método de selección, tamaño, características…). El método de recolección, incluyendo el instrumento, procedimiento, confiabilidad y validez, etcétera. Localización (disponibilidad). Y de ser posible:
• • •
Procedimientos de codificación. Análisis practicados. Sugerencias para el análisis.
c) Datos cualitativos micro. Son producidos por una persona y recabados por otra. Al investigador le
llega el dato (cartas recopiladas por otros, transcripciones de entrevistas hechas por psicólogos, grabaciones de las llamadas de los pasajeros que iban en los aviones secuestrados por terroristas en los atentados a las torres gemelas del World rade Center en Nueva York en 2001, etc.). ales datos pueden ser reanalizados por el investigador. Las ventajas de los datos secundarios residen en que su costo es generalmente el más barato de todos los métodos de recolección y a veces son la única opción para el investigador (Smith, 2008; Sieppert, McMurtry y McClelland, 2005 y Encyclopedia of Evaluation, 2004); además, pueden replicarse estudios con base en ellos. Granen cantidad de datos secundarios localiza internet. Sus desventajas potenciales consisten que a veces no son accesibles,seno están mediante estandarizados, 17 Para el caso de España recomendamos a Berganza y García (2005) y a Corbetta (2003) y desde luego una búsqueda en los disparadores genéricos de internet. Para las organizaciones no gubernamentales latinoamericanas, por ejemplo, en el caso del medio ambiente, la siguiente dirección en internet incluye una gran cantidad de ellas: http://www.ecoportal.net/content/view/full/158. 18 Se aplica también a los datos “micro”.
Metodología de la investigación
pueden haberse omitido variables importantes para nuestro estudio y es factible que den una falsa impresión de ciertos subgrupos (los promedios de ingreso nacional per cápita, por ejemplo, suelen resultar engañosos). Corti (2008) presenta las siguientes dificultades y retos cuando se deben reutilizar y compartir datos secundarios: 1. 2. 3. 4. 5. 6. 7.
Consideraciones y limitaciones que impone la necesaria ética al reportar datos. Cobertura y representación de los datos y su contexto. Desconocimiento de los métodos usados para recolectarlos. Falta de tiempo para familiarizarse con los datos generados. Falta de infraestructura de interés. Interpretación incorrectapara del acceder sentido adeloslosdatos datos. Violación de los derechos de autor y propiedad intelectual. El proceso para utilizar datos secundarios en una investigación se resume en la figura 7.13.19 Figura 7.13 Proceso esencial para utilizar datos secundarios. ! Analizar la relación entre el
planteamiento del problema y los datos secundarios: • ¿Son per tinentes para el estudio? • ¿Representan adecuadamente una operacionalización de nuestras variables?
Preparar los datos para su análisis
Evaluar la calidad de los datos: • Muestr a • Confiabilidad • Validez • Método de recolección • Fuente de srcen
En el caso de datos estadísticos, verificarlos preferentemente en al menos dos fuentes confiables (validación cruzada).
Para el manejo de archivos se recomienda consultar a Webb, Campbell y Schwartz (2000).
El metaanálisis Esta clase de procedimiento de recolección y análisis de datos implica sintetizar resultados de investigación por medio de varios estudios que consideran el mismo planteamiento y variables (Schmidt y Hunter, 2014 y Wiersma y Jurs, 2008). El término metaanálisis fue acuñado en 1976 por el estadístico norteamericano Gene V. Glass, mientras era profesor de la Universidad de Colorado en Boulder (Encyclopedia of Health Services Research, 2009). Los pasos de un metaanálisis son muy similares a los de otros tipos de indagación, con la salvedad de que la unidad de análisis ya no es el participante, evento o caso, sino el estudio realizado por otros investigadores. El reto es resumir los datos a partir de los diferentes estudios de manera muy bien estructurada, que evite errores y facilite su ulterior análisis. Cabe señalar que el metaanálisis será más preciso entre más homogéneos sean los estudios que se consideran, en cuanto a la preguntas de investigación, variables, método, instrumentos de medición y análisis estadístico. Por lo tanto, el primer paso consiste en ponderar si es posible combinarlos (nos referimos solo a estudios cuantitativos). al consideración nos puede llevar a un sinfín de opciones, desde 19 Adaptado de Corti (2008), Sieppert et al. (2005) y Krysik (2005).
57
58
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
descubrir que hay varias investigaciones que son totalmente compatibles y pueden mezclarse, hasta encontrar que algunas solo tienen un ítem en sus cuestionarios o un indicador cuyos resultados nos sean de utilidad. Existen diferentes propuestas para homogeneizar estadísticamente los resultados de distintos estudios, entre las que se destacan tres, que se conocen con el nombre de modelo de efectos fijos, modelo de efectos aleatorios y, por último, el modelo bayesiano (Molinero, 2003). En el modelo de efectos fijos, los estudios se combinan y se asume que no existe heterogeneidad entre ellos; por lo tanto, todos constituyen estimaciones de un efecto real cuya magnitud se desea conocer. Así pues, las inferencias realizadas se condicionan a las investigaciones incluidas. En el modelo de efectos aleatorios las inferencias se fundamentan en suponer que los estudios seleccionados para el análisis constituyen una muestra aleatoria del universo de estudios posibles, y sus resultados son más conservadores pues tienen en cuenta una fuente extra de variación, ya que se incluyen dos fuentes potenciales: la existente dentro de los estudios y la variación entre ellos (Molinero, 2003, p. 3). La utilización de modelos bayesianos requiere de modelos estadísticos complejos de varianza. El metaanálisis constituye un intento de resolver contradicciones entre los resultados de diferentes investigaciones y evaluar patrones comunes en distintos estudios. Es un método sumamente importante para generar teoría. Como todo método inferencial, tiene sus dificultades y limitaciones. Uno de los principales retos es que al ser un enfoque que generalmente se ejecuta de forma retrospectiva, tiene una posibilidad mayor de introducir sesgos (error sistemático). Otros desafíos son los que se derivan del procedimiento de combinar datos de múltiples estudios, entre los cuales puede haber diferencias en cuanto a método y muestreo (Card, 2011 y Smith, 2008). El procedimiento general de un metaanálisis es similar al de los datos secundarios, pero se agregan algunos elementos como el análisis mismo (figura 7.14). Figura 7.14 Proceso esencial del metaanálisis.
Evaluar si el metaanálisis puede responder al planteamiento del problema
Preparar los datos para su análisis (crear matrices u otras bases de datos que permitan estadísticas agregadas y contrastes, etcétera)
Definir los criterios de selección de los estudios que deben ser incluidos en el análisis (criterios de inclusión y exclusión)
Seleccionar los estudios que se incluirán
Analizar la relación entre el planteamiento del problema y los estudios: • ¿Son per tinentes los estudios para la investigación planteada? • ¿Qué tan homogéneos o heterogéneos resultan y en qué sí pueden conjuntarse y en qué no?
a) Elegir los aspectos, ítems o indicadores, dimensiones y variables en las cuales van a conjuntarse o compararse. b) Evaluar la calidad de los estudios: • Muestra. • Confiabilidad. • Validez. •• Método desrcen. recolección. Fuente de
Analizar los datos
Reportar inferencias
Ot ros parámetros: vea el capítulo 10 de este centro de recursos en línea
Metodología de la investigación
Algunas recomendaciones para el metaanálisis las proporcionan Schmidt y Hunter (2014), Harpe (2009) y Céspedes (1995): 1. Realizar una cuidadosa revisión de la literatura de los estudios que son adecuados potencialmente
para integrarse como unidades de análisis. 2. Generar parámetros precisos de inclusión y exclusión de estudios, con índices de calidad para que los
estudios elegidos sean los apropiados. 3. Seleccionar investigadores independientes que revisen cuidadosamente, clasifiquen, codifiquen,
cuantifiquen y finalmente evalúen y elijan el grupo de estudios que será incluido en el metaanálisis (MA). Primero, cada investigador valora de manera autónoma, mientras que la selección final se hace en equipo. 4. Evaluar minuciosamente la homogeneidad-heterogeneidad de las unidades o investigaciones a consi-
derar.
5. Elaborar una guía de los datos de los estudios escogidos que deben ser considerados para ser procesa-
dos mediante el metaanálisis. 6. Combinar los resultados obtenidos y asegurar la calidad de los datos y su procesamiento estadístico
adecuado (puede ser en matrices, procedimientos estadísticos, bases de datos comparativas, etcétera). 7. Preferentemente utilizar datos provenientes de muestras aleatorias.
El análisis estadístico general del modelo de efectos fijos ( no existe heterogeneidad, hay homogeneidad o las investigaciones que se estiman muestran un efecto uniforme, debido al uso de un mismo tratamiento), utiliza el método de Mantel-Haentzel-Peto. Si los estudios son heterogéneos al mostrar el efecto ante un tratamiento (modelo de efectos aleatorios), se utiliza el método de Cochran-Dersimonian-Laird (Céspedes, 1995). En general, se obtiene para las estadísticas calculadas, el tamaño del efecto (Nugent, 2009; Wiersma y Jurs, 2008 y Glass, 1976), el cual se revisó en el capítulo 10 del libro impreso. Recordamos que es una medida de la “fuerza” de la diferencia de las medias u otros valores considerados (Creswell, 2013a). Resulta ser una medida en unidades de desviación estándar. Su cálculo fue ejemplificado con la prueba t. Existen diversos programas computacionales para el metaanálisis, entre los cuales se encuentran los siguientes: •
• • • • •
RevMan®: Te Cochrane Collaboration’s Review Manager. Te Cochrane Collaboration (tiene versión en español). BUGS y WinBUGS. SAS® (programa ya comentado, en su página existe un subprograma para metaanálisis). SAA ®. SPSS®, entre otras aplicaciones del programa SPSS MACRO. MetaWin. Y otros muchos que puede buscar vía disparador (o motor de búsqueda) en internet.
EJEMPLOS DE ESTUDIOS BASADOS EN DATOS SECUNDARIOS Shu-li et al. (2008) efectuaron una investigación para desarrollar un modelo que predijera la permanencia de personas ancianas en su hogar (en lugar de acudir a asilos, por ejemplo), utilizando datos secundarios de 9 879 individuos de la base de información pública de Estados Unidos: “Te National Home and Hospice Care Survey 2000 (NHHCS 2000)”. Descubrieron que el principal predictor de la permanencia es que para la persona familiares. Smith (2009) se fundamentó darios evaluarviva las con inequidades enAsimismo, la educación británica entre escuelas. en análisis de datos secunHernández-Sampieri et al. (2008) realizaron un estudio de mercado utilizando datos secundarios con la finalidad de indagar sobre la conveniencia de abrir clínicas de cirugía estética y plástica en México. Mediante búsquedas en diversas fuentes de internet, medios impresos (revistas y diarios de circulación nacional) y bases de datos, lograron ubicar a las principales clínicas que operaban a nivel nacional y en las regiones y ciudades más pobladas del país (Ciudad de México, Monterrey, Guadalajara, ijuana y Puebla),
59
60
Capítulo 7 Recolección de datos cuantitativos. Segunda parte
establecer los precios de sus servicios, determinar el mercado potencial y sus características (por ejemplo, número de cirugías que se practicaron durante el último año, interés por practicarse una cirugía plástica, preocupación por la estética personal…), evaluar las apelaciones de su publicidad y otras cuestiones. Una encuesta hubiera arrojado resultados más precisos, pero también hubiese sido más cara, de tal modo que se hizo una investigación de acuerdo con el presupuesto del inversionista español. Incluso, los autores le proporcionaron un análisis del marco jurídico mexicano para abrir y operar tales clínicas. En derecho, el análisis de datos secundarios es muy importante, porque se consideran resoluciones judiciales o juicios previos y la indagación va mucho más allá de una simple revisión de antecedentes. El metaanálisis es muy socorrido en todos los campos. al es el caso de las ciencias de la salud. En epidemiología, por ejemplo, la proliferación de estudios con resultados contradictorios puede afrontarse con metaanálisis, como ocurre con los informes conflictivos sobre el efecto de la de dieta el riesgo del cáncer de mama (Tacker y Stroup, 2007). Asimismo, para determinar la eficacia un en procedimiento quirúrgico o contrastar resultados discordantes de experimentos clínicos (Davis, Li y Leucht, 2009). Lo y Lo (2013) implementaron un metaanálisis que incluía a 24 estudios para determinar la eficacia de la enseñanza a través del idioma inglés como método de instrucción. Por su parte, Lin, Niddam y Hsu (2014), a partir de considerar que la resonancia magnética funcional ha sido ampliamente usada para investigar la representación del cerebro asociada con el dolor dental evocado por la estimulación pulpal eléctrica y que los estudios experimentales han sido heterogéneos y con muestras pequeñas, además de que la representación común del cerebro sobre el dolor dental sigue siendo esquiva, efectuaron un metaanálisis sobre seis investigaciones relacionadas con el dolor dental (n = 87) y sometieron a prueba tres hipótesis: 1) el dolor dental está asociado a la red del “núcleo” relacionado con el dolor; 2) la activación cerebral vinculada con el dolor es organizada somatotípicamente en la corteza somatosensorial; y 3) el dolor dental se encuentra asociado con la red cognitiva-afectiva relacionada con el dolor. Sofi et al. (2014) llevaron a cabo un metaanálisis sobre la correlación entre el insomnio y los padecimientos cardiovasculares, incluyendo en su muestra a 13 estudios (n= 122 501 individuos). Dos de los colaboradores de esta edición, Roberto Hernández-Sampieri y Sergio Méndez Valencia se encuentran en proceso de realización de un metaanálisis sobre estudios que vinculan empíricamente el climaediciones laboral y la organizacional, a partir. de investigaciones usadas como ejemplos en la quinta y Metodología de la investigación sexta decultura Para profundizar en el metaanálisis en la sociología se recomienda a Roelfs et al. (2013) y un ejemplo en turismo puede leerse en Castro-Nuño, Molina-oucedo y Pablo-Romero (2013). Asimismo, para detallar los aspectos de muestreo en el metaanálisis se sugiere a Valentine, Pigott y Rothstein (2010), y para errores de muestreo a Marín-Martínez y Sánchez-Meca (2010).
Estudio para el diagnóstico municipal En las anteriores ediciones de esta obra se integraba un ejemplo para diagnosticar y caracterizar a un municipio con el fin de elaborar su plan de desarrollo. Regularmente, estos diagnósticos son estudios mixtos, pero una parte muy importante de sus insumos lo constituyen los datos secundarios, que se generan con base en indicadores, los cuales han sido desarrollados por diferentes organizaciones dedicadas a la investigación municipal (por ejemplo: el Instituto Vasco de Estadística; el Centro de Investigación y Desarrollo Económico de México (CIDE); el Instituto de Estadística de la Comunidad de Madrid; el Sistema Nacional de Indicadores Municipales (SINIM) de la Unidad de Información Municipal del Gobierno de Chile; el Instituto Nacional de Estadística, Geografía e Informática en México (INEGI); el Instituto Brasileiro de Geografía y Estadística; el Sistema Nacional de Información Municipal, CEDEMUN, de la SecretaríadedeEstadística Gobernación de México; la Federación Nacional de Departamentos de Colombia; el Departamento del Ayuntamiento de Barcelona; etcétera). Algunos indicadores se aplican a cualquier municipio y son relevantes para todas las entidades poblacionales (número de habitantes, ingreso per cápita, ingresos totales del municipio, gasto total del municipio, inversión total, etc.), mientras que otros indicadores resultan importantes sólo para ciertos municipios (por ejemplo, los indicadores relativos a la producción agrícola son irrelevantes para un municipio completamente urbano). Por ello, en cada diagnóstico municipal deben elegirse los indicadores (datos secun-
Metodología de la investigación
darios) significativos para la entidad en cuestión. ambién, cada provincia, departamento, región o estado genera indicadores a su nivel, lo mismo que las naciones. En este centro de recursos en línea: Material complementario ® Documentos ® Documento 3: “Indicadores”, se incluyen ejemplos de indicadores secundarios municipales que pudieran recolectarse para realizar un diagnóstico de un municipio, con el fin de que los estudiantes que apenas comienzan en estos menesteres de la metodología de la investigación los puedan comprender sin mayores complicaciones (se cubren unas cuantas áreas, no su totalidad ni mucho menos). ampoco son los únicos, ya que hay miles de ellos. Están agrupados por áreas generales (las cuales también pueden fluctuar según el autor u otros criterios). Determinados indicadores pueden formar parte de dos o más áreas. Sin polemizar (porque cuando se sopesan pueden generar severas), se presentan en elSería documento mencionado fueron en particular desarrollados para discusiones un municipio del Estado de México. interesante como ejer-y cicio que en cada institución se propusieran los que serían los más adecuados para su municipio.
Errores en las mediciones Esta parte se escribe porque es una pregunta que se nos ha hecho constantemente sobre los tipos de errores en la medición. Cualquier instrumento de medición tiene un grado de error (recordemos lo señalado en el capítulo 9 del libro y al inicio de este capítulo). Imaginemos que realizamos la evaluación de la autoestima en un grupo de estudiantes. Si la mido un día y la vuelvo a medir al día siguiente, y posteriormente a la semana, podemos esperar que las puntuaciones sean las mismas en las tres mediciones. La autoestima como otros atributos no varían a través del tiempo, a menos que “algo” los haga variar (un estímulo, la maduración de la persona, un suceso de vida, entre otros). Es decir, si los estudiantes obtuvieron puntuaciones estadísticamente diferentes en las pruebas, su desempeño y resultados se debieron a la influencia de otro motivo distinto a su propia autoestima. Estas otras razones provocan error. El grado en que un instrumento se encuentra libre de error indica su confiabilidad. Entre más fiable resulta un instrumento, el investigador puede acercarse a una verdadera estimación del atributo considerado. al “exactitud” se obtiene al minimizar las fuentes de error en la medida de lo posible y con la estimación del grado de error que permanece. Pues bien, hay dos tipos de errores que pueden ocurrir: sistemáticos y no sistemáticos. Los primeros maximizan o minimizan el desempeño de un instrumento y afectan la confiabilidad y la validez (Mertens, 2010). En el ejemplo de la autoestima, un método para desarrollarla o fortalecerla (por ejemplo, motivacional o terapéutico) puede ser visto como una influencia sistemática en la variable o atributo. El efecto del error sistemático en las respuestas es constante y puede predecirse. Pero los errores no sistemáticos (que conciernen a los investigadores) varían de situación en situación (aplicaciones distintas) y en consecuencia no pueden predecirse (o es sumamente complejo), pero sí prevenirse. Estos errores pueden caer en tres categorías: a) personales (dependen de cada individuo, como el estrés, el cansancio o la motivación), b) condiciones de administración del instrumento (instrucciones distintas a quienes responden, temperatura ambiental, lenguaje, etc.) y c) modificaciones en los instrumentos o tareas (por ejemplo, cambios en ítems o las conductas a observar). Normalmente, la confiabilidad es calculada mediante una estadística que compara el desempeño de los mismos individuos en tiempos diferentes o partes distintas del instrumento y que oscila entre cero y uno, su fin es precisamente ayudar al investigador a identificar el grado de error que se presenta en la medición, en su consistencia interna; mediante la fiabilidad y un análisis del investigador se deben hacer transparentes las fuentes de error.
61
capítulo
8
Análisis estadístico. Segunda parte
INTRODUCCIÓN Con este capítulo se complementa el 10 de Metodología de la investigación, 6ª edición, además de que se actualizó su contenido. Se presentan primero las hipótesis estadísticas, las puntuaciones z, cálculos inferenciales o estimaciones de parámetros y luego el cálculo del coeficiente alfa-Cronbach y el sustento del análisis de varianza unidireccional. Asimismo, los análisis multivariados y algunas fórmulas para prueba t y chi cuadrada, así como una secuencia de análisis en Minitab y otra en SPSS. Finalmente, se profundiza en el concepto de significancia. Desde luego, se asume que se revisó previamente el capítulo en cuestión.1
HIPÓTESIS ESTADÍSTICAS En el capítulo 10 se señaló que cada prueba estadística obedece a un tipo de hipótesis de investigación e hipótesis estadística distinta. Las hipótesis estadísticas son la transformación de las hipótesis de investigación, nulas y alternativas en símbolos estadísticos. Algunas revistas académicas solicitan que se incluyan estas hipótesis y nos ayudan a conceptualizar ciertas pruebas que se revisaron en el capítulo 10 del texto impreso. En ocasiones, el investigador traduce su hipótesis de investigación y nula (y cuando se formulan hipótesis alternativas, también estas) en términos estadísticos. Básicamente hay tres tipos de hipótesis estadísticas, que corresponden a clasificaciones de las hipótesis de investigación y nula: 1) de estimación, 2) de correlación y 3) de diferencias de medias (Murphy, Myors y Wolach, 2014; Castro-Rea, 2009; Kalaian y Kasim, 2008). A continuación mencionaremos y daremos ejemplos de cada una de ellas.
Hipótesis estadísticas de estimación Estas herramientas heurísticas corresponden a las que, al hablar de hipótesis de investigación, se les denomina hipótesis descriptivas de un dato que se pronostica . Sirven para evaluar la suposición de un investigador de población. alguna característica o variableeneninformación una muestraprevia. de individuos, otros que, seres basándose vivos, sucesos urespecto objetos,dely valor en una Se fundamentan Supongamos en ciertos datos, un investigador plantea la siguiente hipótesis: “El promedio mensual de casos de trastorno 1 A lo largo del capítulo se muestran ejemplos sencillos de aplicación o uso de los métodos estadísticos tratados, buscando simplificarlos. El objetivo de incluirlos es únicamente didáctico para estudiantes no expertos en estadística o en las áreas de conocimiento a las que se refieren. Si el lector es una eminencia en el campo, le solicitamos que recuerde esta nota y sea comprensible. Además, si puede contribuir a mejorarlos, le pediríamos amablemente que vía un representante de McGraw-Hill Interamericana nos haga llegar sus recomendaciones para considerarlas, recordando que el enfoque del libro no es al cálculo o desarrollo de fórmulas respecto de cada método, sino a su utilización e interpretación de resultados.
2
Capítulo 8Análi sis estadístico. Segunda parte
Metodología de la investigación
psiconeurótico caracterizados por reacción asténica que serán atendidos en los hospitales de la ciudad de Linderbuck durante el próximo año resultará mayor a 20”. Además, desea transformar esta hipótesis de investigación en una hipótesis estadística. Lo primero que debe hacer es analizar cuál es la esta dística a la que su hipótesis hace referencia (en el ejemplo se trata de un promedio o media mensual de casos atendidos). El segundo paso consiste en encontrar cómo se simboliza esa estadística (promedio se simboliza como X ). El tercer paso consiste en transformar la hipótesis de investigación en una forma estadística: Hi:
X>
20 (“el promedio mensual de casos atendidos durante el próximo año será mayor a 20”).
Hipótesis estadísticas de la diferencia de medias u otros valores En estas hipótesis se compara una estadística entre dos o más grupos. Supongamos que un investigador plantea la siguiente pregunta de estudio: ¿Difieren los periódicos Télex y Noticias en cuanto al promedio de editoriales mensuales que dedicaron, durante el último año, al tema del terrorismo internacional?2 Su hipótesis de investigación podría ser: “Existe una diferencia entre el promedio de editoriales mensuales que dedicó, durante el último año, al tema del terrorismo internacional el diario Télex, y el que dedicó el diario Noticias”. La estadística que se compara entre los grupos (editoriales de Télex, un grupo, y editoriales de Noticias, otro grupo) es el promedio mensual ( X ). La hipótesis estadística se formularía así:
La hipótesis estadística nula sería la n egación de la hipótesis anterior: Ho:
X
es diferente
< 20 (“el promedio mensual de casos atendidos durante el próximo año será menor a 20”).
Hi:
X1
≠ X2 (el promedio del grupo 2: editoriales de Noticias)
Y la hipótesis alternativa podría ser: Ha:
X
(promedio del grupo uno: editoriales de Télex)
= 20 (“el promedio mensual de casos atendidos durante el próximo año será igual a 20”).
La hipótesis nula:
Después, el investigador debe comparar el promedio estimado por la hipótesis con el promedio actual de la muestra que seleccionó. La exactitud de su estimación se evalúa con esta comparación. Además, como señalan Black y Champion (1976), algunos investigadores consideran las hipótesis estadísticas de estimación como hipótesis de diferencia, pues en última instancia lo que se evalúa es la diferencia entre un valor planteado en la hipótesis y un valor observado en una muestra. La estimación de estas hipótesis no se limita a promedios, ya que puede incluirse cualquier estadística: porcentajes, medianas, modas, etc. (Crosby et al., 2006). Su valor radica en que sirven para perfecionar pronósticos con respecto a las variables a las que se refieren.
Hipótesis estadísticas de correlación
r
x
y
≠ 0
La correlación entre dos variables (cohesión y eficacia)
(“No hay diferencia entre los promedios de los dos grupos de editoriales”).
Con otra estadística (porcentaje) y tres grupos, se obtendrían hipótesis estadísticas como las siguientes: Hi: %1 ≠ %2 ≠ %3 (“Los porcentajes de los tres grupos son distintos”). Ho: %1 = %2 = %3 (“No hay diferencias”). Nota: los grupos pueden ser métodos de producción y la variable de contraste puede ser la productivi-
Estas hipótesis tienen por objetivo traducir en términos estadísticos una correlación entre dos o más variables. El símbolo de una correlación entre dos variables es “r” (minúscula), y entre más de dos variables “R” (mayúscula). La hipótesis “a mayor cohesión en un grupo, mayor eficacia en el logro de sus metas primarias”, se traduciría tal como se muestra en el esquema. Hi:
Ho:
(no es igual a cero o, lo que es lo mismo, ambas variables están correlacionadas)
La hipótesis nula se traduciría: Ho: r xy = 0 (Las dos variables no están correlacionadas; su correlación es cero). Otro ejemplo: Hi: Rxyz ≠ 0 (La correlación entre las variables autonomía en el trabajo, variedad de las tareas desempeñadas y motivación intrínseca no es igual a cero. Es decir, las tres variables “x”, “y”, “z” están asociadas). Ho: Rxyz = 0 (No hay correlación) Nota: si usted está estudiando métodos de investigación, sustituya las variables anteriores por otras de su
propio campo o área (presión arterial, peso corporal, aceleración, masa, inteligencia emocional, autoestima, aprendizaje, etcétera).
dad; o bien, grupos a los que se les administran distintos medicamentos y la variable a comparar, la reducción de los niveles de ácido úrico; métodos de enseñanza y aprendizaje, etcétera.
PUNTUACIONESz Las puntuaciones z son transformaciones que se pueden hacer a los valores o las puntuaciones obtenidas con el propósito de analizar su distancia respecto de la media, en unidades de desviación estándar. Una puntuación z nos indica la dirección y el Puntuaciónz Medida que indica la direcgrado en que un valor individual obtenido se aleja de la media, en una ción y el grado en que un valor individual se aleja de la media, en una escala de escala de unidades de desviación estándar (Shapiro, 2008 y acq, 2003). unidades de desviación estándar. Como mencionan Nie et al. (1975), las puntuaciones z son el método que más se utiliza para estandarizar la escala de una variable medida en un nivel por intervalos. Su fórmula es:
z
X =
−X s
donde X es la puntuación o el valor que se desea transformar, X es la media de la distribución y s, la desviación estándar de esta. El resultado z es la puntuación transformada en unidades de desviación estándar. Supongamos que en una distribución de frecuencias obtuvimos una media de 60 y una desviación estándar de 10, y deseamos comparar una puntuación de “50” con el resto de la distribución. Para ello, 2 Nombres completamente ficticios.
3
4
Capítulo 8Análi sis estadístico. Segunda parte
Metodología de la investigación
transformamos esta puntuación o tal valor en una puntuación z. enemos que: X = 50 X = 60 s = 10 La puntuación z correspondiente a un valor de “50” en esa distribución de frecuencias es: z
=
50 − 60 10
=
−1.00
Podemos decir que el valor “50” se localiza a una desviación estándar por debajo de la media de la distribución (el valor “30” está a tres desviaciones está ndar por debajo de la media). Estandarizar los valores permite comparar puntuaciones de dos distribuciones diferentes(la forma de medición es la misma, aunque se trata de distribuciones distintas). Por ejemplo, podemos contrastar una distribución obtenida en una preprueba con otra obtenida en una posprueba (en un contexto experimental). Supongamos que se trata de un estímulo que incrementa la productividad. En la preprueba un trabajador mostró una productividad de 130 (la media del grupo fue de 122.5 y la desviación estándar de 10). En la posprueba obtuvo 135 (la media del grupo fue de 140 y la desviación estándar de 9.8). ¿Mejoró la productividad del trabajador? En apariencia, la mejoría no es considerable. Si no transformamos las dos calificaciones en puntuaciones z no es posible asegurarlo porque los valores no pertenecen a la misma distribución. Por ello, transformamos ambos valores a puntuaciones z y los convertimos a una escala común donde la comparación es válida. El valor de 130 en productividad en términos de unidades de desviación estándar es igual a: z=
130 − 122.5 10.0
=
0.75
Por su parte, el valor de 135 corresponde a una puntuación z de: z=
135 − 140 9.8
=
−0.51
Como observamos, términos absolutos 135 es una mejor puntuación que 130, pero no en términos relativos (en relaciónencon sus respectivas distribuciones). La distribución de puntuaciones z no cambia la forma de la distribución srcinal, pero sí modifica las unidades srcinales a las que convierte en “unidades de desviación estándar” (Babbie, 2014; aylor, 2007; Wright, 1979). La distribución de puntuaciones z tiene una media de 0 (cero) y una desviación estándar de 1 (uno). La figura 8.1 muestra la distribución de puntuaciones z.
comparan) (Delbaere et al., 2007). No debe olvidarse que, específicamente, los elementos de la fórmula son la media y la desviación estándar que corresponden al valor que se desea transformar (de su misma distribución). ambién, las puntuaciones z sirven para analizar distancias entre puntuaciones de una misma distribución y áreas de la curva que abarcan tales distancia s, o para evaluar el desempeño de un grupo de participantes en varias pruebas. Las puntuaciones z son un elemento descriptivo adicional que se agrega para analizar nuestros datos (Babbie, 2014).
ESTIMACIÓN DE PARÁMETROS: UN EJEMPLO CON LA MEDIA POBLACIONAL En el capítulo 10 del texto impreso se mencionó que una de las funciones de la estadística inferencial es estimar parámetros; pues bien, cuando se calcula la media de una muestra y no estamos muy seguros de su representatividad podemos seguir un procedimiento para comprobar si n uestra hipótesis respecto de la media poblacional es aceptada o rechazada. 3 Lo anterior es para responder a la siguiente pregunta: ¿qué hacemos para ver si nuestra hipótesis sobre la media poblacional es aceptada o rechazada? Pero antes de estudiar el procedimiento, es necesario hacer las siguientes consideraciones: a) La distribución muestral es una distribución normal de puntuaciones z, es decir, la base de la curva está conformada por unidades de desviación estándar. b) Las puntuaciones z son distancias que indican áreas bajo la distribución normal. En este caso, áreas de probabilidad. c) El área de riesgo es tomada como el área de rechazo de la hipótesis; por el contrario, el área de confianza, como el área de aceptación de la hipótesis. d) Se habla de una hipótesis acerca del parámetro (en este caso, media poblacional). Si partimos de estas consideraciones, el procedimiento es: 1. Sobre bases firmes (revisión de la literatura e información disponible), establecer una hipótesis acerca del parámetro poblacional. Por ejemplo: el promedio de horas diarias que se exponen los niños de la 2. 3. 4.
ciudad de Valladolid a la televisión fin de semana de 3.0 horas (media poblacional hipotética). Definir el nivel de significancia. Porenejemplo, 0 .05 oes5%. Recolectar los datos en una muestra representativa. Vamos a suponer que obtuvimos una media de 2.9 horas y una desviación estándar de 1.2 horas; la muestra incluyó 312 niños. Estimar la desviación estándar de la distribución muestral de la media utilizando la siguiente fórmula: Para
Figura 8.1 Distribución de puntuaciones z.
X
:
en la cual Sx es la desviación estándar de la distribución muestral de la media, s representa la desviación estándar de la muestra y n es el tamaño de la muestra. En el ejemplo
5. -3z
-2z
-1z
0
+1z
+2z
+3z
Las puntuaciones z también sirven para comparar mediciones de distintas pruebas o escalas aplicadas a los mismos participantes (los valores obtenidos en cada escala se transforman en puntuaciones z y se
ransformar la media de la muestra en una puntuación z, en el contexto de la distribución muestral, con una variación de la fórmula ya conocida para obtener puntuaciones z:
3 En este ejemplo se utiliza la media, tal vez el caso más conocido, pero puede ser cualquier otro parámetro poblacional.
5
6
Capítulo 8Análi sis estadístico. Segunda parte
Metodología de la investigación
donde X es la media de la muestra (recordemos que la distribución muestral es de medias y no de puntuaciones), X es la media hipotética de la distribución muestral (parámetro poblacional), Sx es la desviación estándar de la distribución muestral de medias. Así, tenemos: z
6.
=
2.9 − 3.0 0.0679
=
−1.47
En la tabla de áreas bajo la curva normal(ver apéndice 4, tabla 1, de este centro de recursos en línea o en SAS®), buscar aquella puntuación z que deje a 25% por encima de ella, que es 1.96. En la tabla del apéndice 4 se presenta la distribución de puntuaciones z, sólo la mitad, pues debemos recordar que es una distribución simétrica y se aplica igual a ambos lados de la media. Así se i ncluye en los textos de estadística. Se busca 2.5%, porque la ta bla sólo abarca la mitad de la distribución y el riesgo que afrontamos es de 5% (2.5% del extremo de cada lado). La tabla mencionada contiene cuatro columnas: la primera indica puntuaciones z; la segunda expresa la distancia de la puntuación z a la media; la tercera, el área que está por debajo de esa puntuación desde el comienzo de la distribución, como se muestra en la gráfica:
Z
Por su parte, la cuarta señala el área que está por encima de esa puntuación:
Sx
=
7
0.0246
z = 40.65 La media está situada a más de 40 desviaciones estándares de la media; se localiza en la zona crítica (más allá de 1.96 desviaciones estándares): rechazar la hipótesis.
¿POR QUÉ ES IMPORTANTE OTRO CONCEPTO PARA ESTIMAR PARÁMETROS: EL INTERVALO DE CONFIANZA? Se ha hablado de la distribución muestral por lo que respecta a la prueba de hipótesis, pero otro procedimiento de la estadística inferencial es construir un intervalo donde se localiza un parámetro (Healey, 2014; Vaish, 2008 y Wiersma y Jurs, 2008). Por ejemplo, en lugar de pretender probar una hipótesis acerca de la media poblacional, puede buscarse un intervalo donde se ubique dicha media. Esta tarea requiere un nivel de confianza, al igual que en la prueba de hipótesis inferenciales. El nivel de confianza es al intervalo de confianza lo que el nivel de significancia es a la prueba de hipótesis. Es decir, se trata de una probabilidad definida de que un parámetro se va a ubicar en un determinado intervalo. Recordemos que los niveles de confianza —expresados en porcentajes— más comunes en la investigación son 0.95 y 0.99 (.05 y .01). Su sentido es similar al ya comentado: si es de 0.95 quiere decir que tenemos 95% en favor de que el parámetro se localice en el intervalo estimado, contra 5% de que se ubique en un intervalo equivocado. El nivel de 0.99 señala 99% de probabilidad de seleccionar el intervalo adecuado. ales niveles de confianza se expresan en unidades de desviación estándar. Una vez más se acude a la distribución muestral, concretamente a la tabla de áreas bajo la curva normal (apéndice 4, tabla 1 de este centro de recursos en línea o en SAS® “Áreas bajo la curva normal”), y se eli ge la puntuación z correspondiente al nivel de confianza seleccionado. Una vez hecho esto, se a plica la siguiente fórmula:
(
)(
)
Intervalo de confianza estadígrafo+ Puntuación z que expresa el nivel de confianza Desviación estándar de l a distribución muestal correspondiente =
Z
7.
Las áreas se expresan en proporciones. Lo que buscamos es una puntuación z que deje por encima un área de 0.0250 o 2.5% (la encontramos en la cuarta columna de la tabla); esta puntuación z es de 1.96. Siempre que nuestro nivel de significancia sea 0.05, tomamos la puntuación z de 1.96. Comparar la media de la muestra transformada a puntuación z con el valor 1.96; si es menor, aceptar la hipótesis; si es mayor, rechazarla. Veamos el ejemplo: Media de la muestra transformada za 1.47
Nivel de significancia del 0.05 ±1.96
Decisión: aceptar la hipótesis a un nivel de significancia de 0.05 (95% a favor y 5% de riesgo de come-
ter un error). Si la media obtenida al transformarse en z hubiera sido: 3.25, 7.46 o un valor mayor → rechazar la hipótesis. Veamos un ejemplo de rechazo de la hipótesis: Media de la muestra = 2.0 Desviación estándar de la muestra = 0.65 n = 700
En la fórmula, el estadígrafo es la estadística calculada en la muestra, la puntuación z es 1.96 con un nivel de 0.95 y 2.58 con un nivel de 0.99, en tanto que el error estándar depende del estadígrafo en cuestión. Veámoslo con el ejemplo de la media en el caso de la exposición diaria a la televisión (en fin de semana) de los niños de Valladolid: Media = 2.9 horas s = 1.2 horas Sx 0.0679 (desviación estándar de la distribución muestral de la media). Nivel de confianza = 0.95 (z = 1.96) Intervalo de confianza = 2.9 ± (1.96) (0.0679) Intervalo de confianza = 2.9 ± (0.133) Intervalo de confianza: la media poblacional está entre 2.767 y 3.033 horas , con 95% de probabilidades de no cometer error. =
CÁLCULO DEL COEFICIENTE DE CONFIABILIDAD (FIABILIDAD) ALFACRONBACH En los capítulos 9 y 10 se definió el coeficiente alfa de Cronbach ( ∝), así como sus usos e interpretación. Los programas de análisis estadístico como SPSS, Minitab, SAS y otros, lo incluyen y calculan instantáneamente. Sin embargo, para quienes no tienen acceso a estos programas, presentamos la forma de obtenerlos. De acuerdo con Carmines y Zeller (1988, pp. 44 y 45), así como Barchard (2006) y Corbetta (2003), existen tres procedimientos para determinar el coeficiente “∝” o alfa: 1. Sobre la base de la varianza de los ítems, con la aplicación de la siguiente fórmula:
8
Capítulo 8Análi sis estadístico. Segunda parte
Metodología de la investigación
α=
k ⎡ k ⎤ ⎡⎢ ∑ i ⎢ ⎥ 1− St ⎣ k − 1 ⎦ ⎢⎣
1
=
2
Si
2
⎤ ⎥ ⎥ ⎦
α=
en la cual:
1.98 α=
k = número de ítems de la escala S
S
2 i
2
t
4(0.494) 1 + 0.494(4− 1)
= suma de la varianza de los ítems = varianza total
α
α=
O bien con la fórmula: 3.
=
2.48 0.798
0.80 (al cerrar la cifra)
Este es un coeficiente aceptable, pero debemos recordar que todos los ítems de la escala deben estar medidos en intervalos o razón. Mediante otra fórmula que se basa en la correlación promedio (Corbetta, 2003, p. 238). nr Se usa la siguiente fórmula: α= 1 + r(n − 1)
En donde N representa el número de ítems de la escala, “∑s2 (Y1)”es igual a la sumatoria de las varianzas de los ítems y “ s2x” equivale a la varianza de toda la escala. 2. Sobre la base de la matriz de correlación de los ítems. El procedimiento sería: a) Aplicar la escala. b) Obtener los resultados. c) Calcular los coeficientes de correlación bivariados r de Pearson entre todos los ítems (todos contra todos de par en par). d) Elaborar la matriz de correlación con los coeficientes obtenidos. Por ejemplo: Ítems 1234
1
e)
—
2
ya fue calculado
3
yafuecalculado
4
yafuecalculado
0.451
0.399
—
0.489
yafuecalculado
—
yafuecalculado
yafuecalculado
0.585 0.501 0.541 —
Los coeficientes que se mencionan como “ya fue calculado” se ubican en la parte inferior de las líneas horizontales (guiones). Es decir, cada coeficiente se incluye una sola vez y se excluyen los coeficientes que vinculan al ítem o puntuación consigo misma (1 con 1, 2 con 2, 3 con 3 y 4 con 4). Se calcula p (promedio de las correlaciones). p
∑P =
NP
∑ P es la sumatoria de los valores de las correlaciones y NP el número de correlaciones no repetidas o no excluidas. p= p
f)
=
0.451+ 0.399+ 0.585+ 0.489+ 0.541+ 0.501 6 0.494
Se aplica la fórmula siguiente: α=
Donde N es el número de ítems y En el ejemplo:
p
Np
1 + p(N − 1)
el promedio de las correlaciones entre ítems.
en la cual n representa el número de ítems o elementos de la escala y r es su correlación promedio.
RUTA DEL ANÁLISIS MULTIVARIADO al como se señaló en la obra impresa, particularmente en el capítulo 10, el análisis de los datos cuantitativos es un proceso de toma de decisiones respecto a qué métodos concretos y técnicas específicas se utilizarán para responder a las preguntas y cumplir con los objeti vos de investigación que incluye: determinar la confiabilidad y validez del in strumento de medición (o instrumentos, si son varios); eliminar reactivos, valores o indicadores que generan error o afectan la confiabilidad y validez de la medición (de cada instrumento); analizar la relación entre los ítems, valores o indicadores que integran cada instrumento de medición; explorar los datos a través del análisis descriptivo de las variables y evaluar las hipótesis planteadas mediante la revisión minuciosa de los resultados del análisis estadístico inferencial de los datos. Así, se realizan tres clases de análisis estadístico básico: Análisis exploratorios. Análisis descriptivos. Análisis inferenciales. Por lo regular, los análisis exploratorios y descriptivos anteceden a los inferenciales. Lo primero que se debe hacer es verificar que las mediciones hayan sido válidas y confiables, porque si no lo fueron, todo lo demás no tiene sentido debido a que estaríamos analizando información sobre una base errónea o con datos inconsistentes e inválidos, contaminados de error. En este caso, determinamos la confiabilidad mediante una técnica apropiada, generalmente la obtención de un coeficiente, el cual depende del nivel de medición de la variable analizada4 (por ejemplo, si los datos son de intervalo o razón, el coeficiente alfa de Cronbach). Asimismo, consideramos toda la evidencia disponible sobre la validez (por ejemplo, para la validez concurrente, un coeficiente de correlación entre la variable medida y el criterio externo; y para la validez de constructo, si los datos son de intervalos o razón, les aplicamos el análisis de factores por componentes principales y/o escalamiento multidimensional). Con ello, exploramos la naturaleza y estructura de nuestros datos, elimina mos ítems o reactivos que producen error (es decir, no consideramos sus datos para los análisis descriptivos e inferenciales). Los análisis estadísticos exploratorios nos señalan cómo se agrupan o dispersan determinados datos, constructos, variables, dimensiones y categorías, pero también los relacionan. Constituyen técnicas que pueden ser aplicadas a datos que representan conglomerados, factores, dimensiones o agrupamientos, involucran básicamente las tareas de clasificar datos en grupos (donde cada grupo representa unidades —casos, observaciones, dimensiones, categorías o variables— que son relativamente similares entre sí y diferentes de las unidades de otro u otros grupos) y evaluar la naturaleza de las relaciones entre tales grupos a) b) c)
4 Recordemos que todos los análisis estadísticos dependen del nivel de medición de la variable o variables involucradas.
9
10
Capítulo 8Anál isis estadístico. Segunda parte
en términos de independencia. Estos análisis no distinguen entre las variables independientes y dependientes, sino que más bien analizan simultáneamente el conjunto completo de relaciones interdependientes (valoran la similitud entre grupos examinando todos los vínculos). Los análisis descriptivos nos proporcionan información sobre el comportamiento de la muestra en las variables medidas: valores numéricos que las representan (distribuciones de frecuencias, medidas de tendencia central y de la variabilidad). Nos sirven para organizar y resumir los datos con la finalidad de profundizar en el entendimiento de una o más variables y los casos estudiados. Mientras que los análisis de estadística descriptiva generan propiedades numéricas o valores en la muestra, los análisis inferenciales estiman parámetros (valores de la población o universo) a partir de estadísticas calculadas en la muestra. Es decir, nos sirven para generalizar los resultados al universo o población (predicción de parámetros) y probar hipótesis. Para someter a escrutinio empírico cada hipótesis, se selecciona una o varias pruebas o métodos estadísticos que dependen de varios factores, entre ellos —como ya se señaló— el nivel de medición de las variables (análisis paramétricos y no paramétricos) y el número de variables involucradas (univariados o multivariados). Recordemos que los análisis paramétricos se basan en ciertas premisas o supuestos: 1. La variable dependiente debe tender hacia una distribución normal. 2. Las mediciones de las variables deben ser independientes entre sí. 3. Las poblaciones o universos involucrados en los análisis deben poseer una varianza igual o muy similar. 4. Las variables consideradas deben estar medidas en un nivel por intervalos o razón. Con frecuencia, en ciencias sociales no se cubren completamente tales criterios (por ejemplo, las mediciones sobre percepciones y las escalas de actitudes se asumen como de intervalo cuando en realidad son ordinales), por lo cual los números son relativos y más bien indican tendencias hacia ciertos sectores de las mediciones. Asimismo, en determinadas ocasiones se recurre a la estadística no paramétrica que no necesita cumplir con tales requisitos (por ejemplo, no requiere que la distribución sea normal). Muchos investigadores prefieren “considerar” sus mediciones como de intervalos porque las pruebas paramétricas son estadísticamente más “poderosas” (por ejemplo, detectan con mayor precisión las diferencias entre grupos o relaciones entre variables cuando ambas realmente existen) (Onwuegbuzie y Combs, 2010). Este camino o secuencia, que se muestra en la figura 8.2, implica, como ya se señaló, ir tomando decisiones a medida que se desarrollan los análisis y se obtienen resultados. La estadística inferencial paramétrica puede dividirse en univariada o multivariada y casi todas las pruebas o técnicas, con la excepción del análisis discriminante predictivo, son parte de un modelo lineal general (GLM por sus siglas en inglés). En consecuencia, todas implican correlación (Onwuegbuzie y Combs, 2010 y Henson, 2000) y relaciones de variación (varianzas), es decir, diversos métodos estadísticos paramétricos parten de analizar las relaciones entre las varianzas de los constructos o variables que integran o conforman las hipótesis (cómo fluctúa o se “mueve” una variable en función de otra u otras). Con el fin de examinar correlaciones o relaciones causales existen varias pruebas aglutinadas en la denominada “familia” del modelo lineal general de análisis (ver figura 8.3). Algunas fueron revisadas en el capítulo 10 de la obra impresa, en particular las univariadas y bivariadas, y ahora en el presente capítulo presentaremos algunos de los métodos multivariados. 5 De acuerdo a la figura 8 .3, podemos apreciar —por ejemplo— que los análisis de correlación son una derivación o parte de la regresión, la cual, a su vez, es un tipo especial de correlación canónica, que en realidad resulta una clase de análisis de vías. Ahora bien, no necesariamente cuando ejecutamos un análisis de correlación implica que vamos a efectuar el de regresión, pero a la inversa esto no ocurre, es decir, cuando se lleva a cabo un análisis de regresión, estimamos las correlaciones pertinentes. De manera similar, un análisis canónico puede usarse para llevar a cabo un análisis de regresión o aun un análisis de correlación; por su parte, un análisis de vías o rutas puede utilizarse para uno canónico y así sucesivamente. Una característica de varios de los métodos que integran el modelo lineal general de análisis es que involucran una o más variables independientes (predictores) y una o más variables dependientes (crite5 No se muestran todos y los que se presentan se centran en su utilidad e i nterpretación general.
Metodología de la investigación
Figura 8.2 Ruta del análisis cuantitativo (toma de decisiones).
Fuente: Roberto Hernández-Sampieri
Figura 8.3 Familia del modelo lineal general de análisis.
ente: Roberto Hernández-Sampieri
rios). Así, si asumimos que se cumplen las premisas de la estadística paramétrica y conocemos el número de variables independientes y dependientes y sus niveles de medición, podemos seleccionar el análisis más apropiado de acuerdo al planteamiento del problema y las hipótesis establecidas.
11
12
Capítulo 8Anál isis estadístico. Segunda parte
Metodología de la investigación
SUSTENTO DEL ANÁLISIS DE VARIANZA UNIDIRECCIONAL En el capítulo 10 del texto impreso se explicó que el ANOVA unidireccional produce un valor F, el cual se basa en una distribución muestral, conocida como distribución F, valor que compara las variaciones en las puntuaciones debidas a dos diferentes fuentes: variaciones entre los grupos que se contrastan y variaciones dentro de los grupos. Si los grupos difieren realmente entre sí, sus puntuaciones variarán más de lo que puedan variar las puntuaciones entre los casos o integrantes de un mismo grupo. Veámoslo con un ejemplo cotidiano. enemos tres familias A, B y C. La familia A está integrada por Felipe, Angélica, Elena y José Luis. La familia B está compuesta por Chester, Pilar, Íñigo, Alonso y Carlos. Y la familia C está integrada por Rodrigo, Laura y Roberto. ¿Qué esperamos? Pues que los integrantes de una familia se parezcan más entre sí que a los miembros de otra familia. Esta conclusión se graficaría como en la figura 8.4. Figura 8.4 Ejemplo de las variaciones de los grupos comparados.
eleva al cuadrado cada una de estas desviaciones, y luego se suman. Finalmente se sopesa el número de individuos en cada grupo y la media cuadrática se obtiene con base en los grados de libertad intergrupales (no se determina con base en el número de puntuaciones de toda la muestra). Para determinar la media cuadrática dentro de los grupos primero se calcula la desviación de cada puntuación respecto de la media de su grupo; posteriormente, esta fuente de variación se suma y se combina para obtener una media de la varianza intragrupal de todas las observaciones, con base en los grados de libertad totales (Martin y Bridgmon, 2012; Te SAGE Glossary of the Social and Behavioral Sciences, 2009w; Doncaster y Davey, 2007; Field, 2006 y Wright, 1979). Las fórmulas de la media cuadrática son: Mediacuadrática entregrupos
=
Suma de cuadrados entre grupos Grados de libertad entregrupos
Los grados de libertad entre grupos = K-1 (donde K es el número de grupos). Suma de cuadrados intragrupos
Mediacuadrát icadentro de losgrupos
=
Grados de libertad intragrupos
Los grados de libertad intragrupos = n - K (n es el tamaño de la muestra, la suma de los casos o individuos de todos los grupos, y K, recordemos, es el número de grupos). Pues bien, cuando F resulta significativa, quiere decir que los grupos difieren “significativamente” entre sí (en términos estadísticos), es decir, se acepta la hipótesis de investigación y se rechaza la hipótesis nula. Cuando se efectúa el análisis de varianza por medio de un programa computacional estadístico, se genera una tabla de resultados básicamente con los elementos de la tabla 8.1. Tabla 8.1 Elementos para interpretar un análisis de varianza unidireccional realizado en SPSS. Fuente de variación (Source)
Sumas de cuadrados (Sums of squares)
Es decir, esperamos homogeneidad intrafamilias y heterogeneidadinterfamilias. ¿Qué sucedería si los miembros de las familias se parecieran más a los integrantes de las otras familias que a los de la suya propia? Que no hay diferencia entre los grupos (en el ejemplo, familias). Esta misma lógica se aplica a la razón F, la cual nos indica si las diferencias entre los grupos son mayores que las diferencias intragrupos (dentro de estos). Estas diferencias se miden en términos de varianza. La varianza es una medida de dispersión o variabilidad alrededor de la media y se calcula en términos de desviaciones elevadas al cuadrado. Recuerde que la desviación estándar es un promedio de desviaciones respecto de la media ( X − X ) y la varianza es un promedio de desviaciones respecto de la media elevadas al cuadrado. Por eso, la varianza se simboliza como s2 y su f órmula es:
∑( X − X )2 n
En consecuencia, la razón F, que es una razón de varianzas, se expresa así: F
Media cuadrática entre los grupos =
Media cuadrática dentro de los grupos
En esta expresión la media cuadrática implica un promedio de varianzas elevadas al cuadrado. La media cuadrática entre los grupos se obtiene al calcular la media de las puntuaciones de todos los grupos (media total), después se obtiene la desviación de la media de cada grupo respecto de la media total y se
Entre grupos (between groups)
SS entre
Intragrupos (within groups)
SS intra
Grados de libertad Medias cuadráticas (Degrees of (Mean squares)
Razón F (F-ratio)
Significancia de F (F prob.)
freedom)
gl e ntre
SS entre/gl entre
MC entre
∝
MC intra
glin tra
SSintra/gl intra
SS entre gl entre + SS intra gl intra En Minitab se dan los siguientes elementos: Fuente GL (grados SC (suma de MC (media de libertad) cuadrados) cuadrática) Total
F (valor) P (significancia)
Una vez más, el valor alfa o probabilidad a elegir es 0.05 o 0.01. Si es menor que 0.05 es significativo en este nivel, y si es menor que 0.01 también es significativo en este nivel. Cuando el programa o paquete estadístico no incluye la significancia se acude a la tabla 3 del apéndice 4 (tabla de la distribución Fo en SAS® a “Valores de F“ ” con un nivel de confianza de 0.05 y 0.01”). Esta tabla contiene una lista de razones significativas (razones F) que debemos obtener para aceptar la hipótesis de investigación en los niveles de confianza de 0.05 y 0.01. Al igual que en el caso de la razón t, el valor exacto de F que debemos obtener depende de sus grados de libertad asociados. Por lo tanto, la utilización de la tabla se inicia al buscar los dos valores gl, los grados de libertad entre los grupos y los grados de libertad intragrupos. Los grados de libertad entre grupos se indican en la parte superior de la tabla, mientras que los grados de libertad
13
14
Capítulo 8Anál isis estadístico. Segunda parte
Metodología de la investigación
intragrupos se han colocado al lado izquierdo. El cuerpo de la tabla de la distribución F presenta razones F significativas en los niveles de confianza de 0.05 y 0.01.
Responde a esquemas como el que se muestra en la figura 8.6. Figura 8.6 Esquema de un análisis factorial de varianza.
Si F = 1.12 glentre = 2 gl intra = 60
x1
Este valor F se compara con el valor que aparece en la tabla de la distribución F que es 3.15, pero como el valor F calculado es menor al de dicha tabla, deberíamos rechazar la hipótesis de in vestigación y aceptar la hipótesis nula. Para que el valor F calculado sea significativo debe ser igual o mayor al de la tabla.
x2
Y
xk
ANÁLISIS MULTIVARIADO En el capítulo 10 del libro, cuando analizamos los principales métodos estadísti cos paramétricos, concretamente después de revisar el ANOVA unidireccional, nos preguntábamos qué ocurre cuando tenemos diversas variables independientes y una dependiente, varias independientes y dependientes. tal como observamos en diagramas como el que se muestra en la figura 8.5. Figura 8.5 Ejemplo con cuatro variables independientes y una dependiente.
Esta herramienta constituye una extensión del análisis de varianza unidireccional, solo que incluye más de una variable i ndependiente. Evalúa los efectos por separado de cada variable independiente y los efectos conjuntos de dos o más variables independientes. Variables: dos o más variables independientes y una dependiente. Nivel de medición de las variables: la variable dependiente (denominada criterio) debe estar medida en
un nivel por intervalos o razón, y las variables independientes (denominadas factores) pueden estar en cualquier nivel de medición, pero expresadas de manera categórica.
Autoestima de la persona
Interpretación y ejemplo Edad
Hi: “La similitud en valores, la atracción física y la realimentación positiva son variables que inciden en
Sentido de vida de la persona
la satisfacción sobre la relación en parejas de novios”.
Género
Categorías de las variables: similitud (valores similares-valores no similares), atracción física (alta,
media y baja) y realimentación (positiva-negativa).
Contexto: muestra de parejas de adultos jóvenes (23-29 años) de Santiago de Chile, pertenecientes a
Religión
estratos económicos altos (n = 400).
La respuesta era obvia: requerimos de otros métodos estadísticos. Estos son los que revisaremos a continuación y una vez más, sobre la base de que existen computadoras y programas como el SPSS, del mismo modo centrándonos en los elementos fundamentales de interpretación.
¿Qué son los métodos de análisis multivariados? Los métodos de análisis multivariado son aquellos en que se analiza la relación entre diversas variables independientes y al menos una dependiente (Johnson y Wichern, 2013 y Abdi, 2003). Son métodos más complejos que requieren del uso de computadoras para efectuar los cálculos necesarios. Su elección también depende del tipo de hipótesis sometida a prueba (el modelo conceptual de relaciones entre variables implicado en el planteamiento del problema), el objetivo de análisis (resultados pretendidos) y el número de variables involucradas y su nivel de medición (Kleinbaum, Kupper, Nizam y Rosenberg, 2013; Cunnings, 2012; Godby, 2007; Abdi, 2003). Primero revisaremos algunos, y al final incluiremos una tabla que resume los más utilizados.
¿Qué es el análisis factorial de varianza? ANOVA (análisis de varianza de k direcciones o varios factores) Definición: Es una prueba estadística para evaluar el efecto de dos o más variables independientes sobre
una variable dependiente.
El ANOVA efectuado mediante un paquete estadístico computacional como SPSS produjo los siguientes elementos básicos: Fuente de la variación (source of variation). Es el factor que srcina variación en la dependiente. Si una fuente no srcina variación en l a dependiente, no tiene efectos. Efectos principales (main effects). Es el efecto de cada variable independiente por separado; no está contaminado del efecto de otras variables independientes ni de error. Suele proporcionarse la suma de todos los efectos principales. Interacciones de dos direcciones (2-way interactions). Representa el efecto conjunto de dos variables independientes, aislado de los demás posibles efectos de las variables independientes (individuales o en conjunto). Suele proporcionarse la suma de los efectos de todas estas interacciones. Interacciones de tres direcciones (3-way interactions). Constituye el efecto conjunto de tres variables independientes, aislado de otros efectos. Suele proporcionarse la suma de los efectos de todas estas interacciones. Puede haber efecto de K direcciones, lo cual depende del número de variables independientes. •
•
•
•
•
En nuestro ejemplo, tenemos los resultados que se muestran en la tabla 8.2.
15
16
Capítulo 8Anál isis estadístico. Segunda parte
Metodología de la investigación
trolada es una característica antecedente que puede variar entre los grupos o influir en los resultados y afectar la claridad de las interpretaciones (Babbie, 2014; Spencer, 2013 y Mertens, 2010).
Tabla 8.2 Ejemplo de resultados en el ANOVA. VARIABLE DEPENDIENTE: SATISFACCIÓN EN LA RELACIÓN Fuente de variación (SOURCE OF VARIATION)
Efectos principales ( main effects) Similitud
Suma de cuadrados (SUMS OF SQUARES)
— —
Grados de libertad (DEGREES OF FREEDOM)
— —
Medias cuadráticas (MEAN SQUARES)
— —
Razón
22.51 31.18
Si gni fi c ancia de F O P (p)
0.001**
—
—
—
21.02
0.001**
Realimentación
—
—
—
11.84
0.004**
Interacción de dos direcciones (2-way interactions)
—
—
—
7.65
0.010*
Similitud
—
—
—
—
—
—
—
—
—
—
—
—
Similitud Realimentación Atracción Realimentación Interacción de tres direcciones ( 3-way interaction)
en que el interés del investigador se centra en las diferencias observadas en la variable dependiente a través de las categorías de la variable independiente (o variables independientes). El experimentador asume que hay otras variables independientes cuantitativas que contaminan la relación y cuya influencia debe ser controlada (figura 8.7).
0.001**
Atracción
Atracción
Perspectivas o usos: Wildt y Ahtola (1978, pp. 8-9) destacan tres perspectivas del análisis de covarianza: A. Perspectiva experimental. Se aplica a aquellas situaciones
4.32
0.040*
2.18
0.110
Figura 8.7 Ejemplo de variables independientes que afectan a una dependiente. X
1
Variables independientes categóricas
X
2
Xk
Y 1
1.56
0.190
8.01
0.020*
Variables independientes cuantitativas continuas
Z
2
Zk
Similitud Atracción
—
—
—
Realimentación —Residual
—
—
—
—Total
—
—
—
Variable dependiente
Z
Nota: A los estudiantes que se inician en el ANOVA normalmente les interesa saber si las razones “F” resultaron o no significativas; por lo tanto, sólo se incluyen estos valores. Por ello, los autores les recomiendan concentrarse en dichos valores y evitar confusiones. Desde luego, el investigador experimentado acostumbra estudiar todos los valores. ** Razón “F” significativa al nivel del 0.01 (p < 0.01) * Razón “F” significativa al nivel del 0.05 (p < 0.05)
Además, el investigador solo se interesa por conocer la relación entre las variables independientes categóricas (Xs) y la variable dependiente (Y). Desea al mismo tiempo remover y controlar el efecto de las variables independientes cuantitativas no categóricas (continuas) (Zs). Es decir, desea tener un esquema como el de la figura 8.8. Figura 8.8 Ejemplo de control de variables independientes no categóricas. X1
Como podemos ver en la tabla 8.2, la similitud, la atracción y la realimentación tienen un efecto significativo sobre la satisfacción en la relación. Respecto de los efectos de dos variables independientes conjuntas, solo la similitud y la atracción tienen un efecto, hay un efecto conjunto de las tres variables independientes (interacción). La hipótesis de investigación se acepta y la nula se rechaza. Asimismo, se recuerda al lector que en el capítulo 5 del presente centro de recursos en línea —Diseños experimentales: segunda parte—, en series cronológicas, factoriales y cuasiexperimentos (en el apartado sobre diseños factoriales) se explica la noción de interacción entre variables independientes. Cabe agregar que el ANOVA es un método estadístico propio de los diseños experimentales factoriales.
Categóricas
¿Qué es el análisis de covarianza?
Continuas
Definición: es un método estadístico que analiza la relación entre dos o más variables independientes y una
variable dependiente, mediante el cual se elimina o controla el efecto de al menos una de las independientes. Similar al ANOVA, excepto que permite tal control. Con frecuencia la variable independiente con-
X2
Xk
Y Z1
Z
2
Zk
R co em nt o o ro ve la r r
Variable dependiente
17
18
Capítulo 8Anál isis estadístico. Segunda parte
El objetivo es “purificar la relación entre las independientes categóricas y la dependiente, mediante el control del efecto de las independientes no categóricas o continuas”. Recordemos algunos ejemplos de variables independientes categóricas: género (masculino, femenino), inteligencia (agrupada: alta, media, baja), ingreso (en categorías: menos de un salario mínimo, dos a cuatro salarios mínimos, cinco a 10 salarios mínimos, 11 o más salarios mínimos), tipo de combustible en una aeronave (combustible 1, combustible 2), medicamento administrado(medicamento A, medicamento B, medicamento C), presencia-ausencia de un tratamiento experimental, etc. Los niveles de medición nominal y ordinal son categóricos en sí mismos, mientras que los niveles de intervalos y razón deben transformarse en categorías más discretas. Estos últimos son en sí cuantitativos, continuos y de categorías múltiples. Por ejemplo, el ingreso en su “estado natural” (pesos, dólares, euros, etc.) varía de la categoría cero hasta la categoría (K)k, ya que puede haber millones de categorías.
Metodología de la investigación
La variable independiente es el tipo de método con tres categorías o niveles (método nuevo, método tradicional y ausencia de método) y la dependiente es el aprendizaje en computación (medida por una prueba estandarizada a nivel de intervalos). Se tiene un esquema como el de la figura 8.9. Figura 8.9 Esquematización de la relación causal entre las variables del ejemplo. Tipo de método (X)
Aprendizaje (
Figura 8.10 Representación a la varianza del aprendizaje debido al tipo de método y a otros factores.
Variable categórica: unas cuantas categorías o un rango medio. : muchas categorías (a veces una infinidad). Variable continua
A las mencionadas variables independientes cuantitativas continuas, cuya influencia se controla, se les denomina “covariables”. Una covariable se incluye en el análisis para remover su efecto sobre la variable dependiente e incrementar el conocimiento de la relación entre las variables independientes categóricas de interés y la dependiente, lo cual aumenta la precisión del análisis (Van Breukelen, 2010; Doncaster y Davey, 2007). Desde esta perspectiva, el análisis de covarianza puede ser concebido primero como un ajuste en la variable dependiente respecto de diferencias en la covariable o las covariables y, posteriormente, como una evaluación de la relación entre las variables independientes categóricas y los valores ajustados de la variable dependiente (Weisberg, 2014; Wildt y Ahtola, 1978). En términos de Creswell (2005): el procedimiento “ajusta” las puntuaciones en la dependiente para dar cuenta de la covarianza [por decirlo en términos sencillos: “hace equivalentes a los grupos en la(s) covariable(s)” y controla influen-
Y)
El investigador sabe que el aprendizaje (su varianza) se puede deber a muchas razones, además del método. Es decir, el aprendizaje varía por diversos motivos, lo cual se representa en forma de conjuntos en la figura 8.10.
Variable independiente: método ( X)
Variable dependiente: aprendizaje (Y)
Varianza del aprendizaje no explicada (que no se debe al método sino a otros factores)
Varianza en común entre método y aprendizaje
Por medio del experimento el investigador desea conocer la varianza en común entremétodo y aprendi→
cias potenciales que pueden afectar a la. Esta variable dependiente]. B. Perspectiva perspectiva se ejemplifica de interés por la covariable
con aquellas instancias en las cuales la intención principal se centra en analizar la relación entre la variable dependiente y la covariable (variable cuantitativa continua) o las covariables. En este caso el enfoque es distinto; la influencia que se remueve es la de las variables independientes categóricas. Primero se controla el efecto (en este caso “contaminante”) de estas variables y después se analiza el efecto “purificado” de las covariables. C. Perspectiva de regresión. En esta tercera perspectiva, tanto las variables independientes categóricas como las covariables resultan de interés para el investigador, quien puede desear examinar el efecto de cada variable independiente (todas las covariables y no covariables) y después ajustar o corregir los efectos de las demás variables independientes. En cualquier caso, el análisis de covarianza elimina influencias no deseadas sobre la variable dependiente. Se puede utilizar en contextos experimentales y no experimentales. La mayoría de las veces la función del ANCOVA es “remover” la varianza compartida entre una o más covariables y la dependiente, para así valorar en su justa dimensión la relación causal entre la(s) variable(s) independiente(s) de interés y la dependiente (Sharma, Durvasula Ployhart, 2012; Creswell, 2005). Veámoslo conceptualmente pero de forma gráfica con un ejemplo si mple.
zaje X Yel(“pura”). (cuantificarla), la relación Si los niños son asignados al azar grupos del que experimento y estos son de tamaño aceptable, diseño mismo remueve la influencia de alasloscovariables pudieran afectar. Pero si no es factible hacerlo y tiene un diseño cuasiexperimental (grupos intactos), debe remover tal influencia con el análisis de covarianza (eliminar al mínimo posible la varianza del aprendizaje no explicada), para evitar que las covariables impidan ver con claridad la relación X → Y. Por ejemplo, el nivel educativo tecnológico de los padres puede influir (hace variar al aprendizaje), efecto que debe ser controlado introduciéndolo como covariable. Esto se ilustra una vez más en forma de conjuntos en la figura 8.11.
Figura 8.11 Representación de la varianza del aprendizaje debida tanto a la variable independiente como a la covariable introducida.
Variable independiente método (X)
Variable dependiente aprendizaje (Y)
Nivel educativo de los padres (covariable)
Ejemplo Estudio: al investigador le interesa analizar el efecto de un nuevo método de enseñanza de computación para
niños sobre el aprendizaje de esta. La hipótesis es: “El nuevo método de enseñanza de la computación (MARHS) provocará un mayor aprendizaje en los niños que un método tradicional”. Entonces, implementa el siguiente experimento: a un grupo de infantes lo expone al nuevo método de enseñanza de computación (MA-RHS); el segundo grupo aprende con un método tradicional; finalmente, un tercer grupo, de control, no recibe ningún tipo de enseñanza en computación.
Varianza en común: entre método y aprendizaje
Varianza compartida entre el nivel educativo de los padres y el aprendizaje (la cual se controla con el ANCOVA)
19
20
Capítulo 8Anál isis estadístico. Segunda parte
Metodología de la investigación
Entre más covariables se controlen, más se explicará sobre la varianza común entre el método y el aprendizaje. Lo que el investigador desea también se puede expresar gráficamente en forma causal como en l a figura 8.12.
Interpretación: depende de cada caso específico, pero el análisis de covarianza efectuado mediante un
programa estadístico computacional produce un cuadro de resultados muy parecido al del análisis de varianza. Los elementos más comunes pueden observarse en la tabla 8. 3. Tabla 8.3 Ejemplo de elementos comunes de un análisis de covarianza.
Figura 8.12 Representación del control de la influencia de la covariable. Aprendizaje
Tipo de método
Nivel educativo tecnológico de los padres(covariable)
Fuente de variación (Source of variation)
Sumas de cuadrados y productos cruzados (Sum of squares and cross products)
ANCOVA Controlar influencias de la covariable
Otro ejemplo donde puede interesarnos controlar el efecto de la covariable sería: probar si un nuevo combustible es más eficaz para propulsar una aeronave específica que el que se ha utilizado previamente, controlando la masa del avión (figura 8.13).
Sumas de cuadrados ajustadas (Adjusted sum of squares)
Grados de libertad (Degrees of freedom)
Medias cuadráticas
Razón F (F) Significancia de F (Sig.)
La razón F es, igual que en el análisis de varianza, una razón de varianzas. El razonamiento estadístico es el mismo y F se interpreta igual, incluso se utiliza el mismo cuadro de la distribución F (tabla 3, apéndice 4 o en Stats®, a “Valores de F al nivel de confianza de 0.05 y 0.01). Solamente que las inferencias y conclusiones se hacen al considerar que las medias de la variable dependiente, a t ravés de las categorías de las variables independientes, se han ajustado, lo cual elimina el efecto de la covariable o covariables.
Figura 8.13 Un segundo ejemplo ilustrado del control de la influencia de una covariable.
Ejemplo
Variable independiente: tipo de combustible utilizado [tipo 1 (nuevo), tipo 2 (previamente utilizado)
Variable dependiente: propulsión
Covariable: masa
R co em nt ov r o er lar o
Diseño de investigación que utiliza el análisis de covarianza Hi: “Los trabajadores que reciban realimentación verbal sobre el desempeño de parte de su supervisor mantendrán un nivel mayor de productividad que los trabajadores que reciban realimentación sobre el desempeño por escrito, y más aún que los trabajadores que no reciban ningún tipo de realimentación”.
Hi:
O bien, analizar el efecto de dos clases de medicamentos sobre la disminución de la presión arterial, controlando el peso del individuo (figura 8.14). Figura 8.14 Ejemplo adicional que ilustra el control de la influencia de la covariable.
Variable independiente: tipo de medicamento (A y B)
X1
>
(verbal)
(ausencia)
El investigador plantea un diseño experimental para intentar probar su hipótesis. Sin embargo, no puede asignar aleatoriamente a los trabajadores a los tres grupos del experimento (pertenecen a equipos prestablecidos por la empresa). El diseño sería con grupos intactos (cuasiexperimental) y se esquematizaría así:
Re co mo nt ve ro r o lar
G1
X1
G2
X2
G3
3.
X3
>
Variable dependiente: presión arterial
Covariable: peso
1. 2.
X2
(por escrito)
Wildt y Ahtola (1978, p. 13) definen algunos usos del análisis de covarianza: Incrementar la precisión en experimentos con asignación al azar. Eliminar influencias extrañas o contaminantes que pueden resultar cuando las pruebas o los individuos no son asignados al azar a las diferentes condiciones experimentales (grupos de un experimento). Eliminar efectos de variables que confundan o distorsionen la interpretación de resultados en estudios no experimentales.
X1 X
2
X3
Asimismo, el investigador presupone que hay un factor que puede contaminar los resultados (actuar como fuente de invalidación interna): la motivación. Diferencias iniciales en motivación pueden invalidar el estudio. Como la asignación al azar está ausente, no se sabe si los resultados son influidos por dicho factor. Entonces, el experimentador decide eliminar o controlar el efecto de la motivación sobre la productividad para conocer los efectos de la variable independiente tipo de realimentación. La motivación se convierte en covariable. El esquema es el que se muestra en la figura 8.15.
21
22
Capítulo 8Anál isis estadístico. Segunda parte
Metodología de la investigación
¿Qué es el análisis de factores por componentes principales (AFC)?
Figura 8.15 Ejemplo en que la motivación es covariable. Realimentación (variable independiente categórica de interés)
Productividad (variable dependiente)
ANCOVA Motivación (covariable)
control
Cabe destacar que, para introducir una covariableen el análisis, de preferencia debe medirse antes del inicio del experimento. El análisis de covarianza “quita” a la variabilidad de la dependiente lo que se debe a la covariable. , pues se basa en la covariaAjusta la varianza de la variable dependiente en las categorías de la independiente ble. En el ejemplo, ajusta la varianza de la productividad debida a la motivación, en las categorías experimentales (tratamientos o grupos). El ajuste se realiza sobre la base de la correlación entre la covariable y la dependiente (en el ejemplo: la correlación entre la calificación en motivación y las puntuaciones en productividad es la base para el ajuste). Esto se muestra esquemáticamente en la tabla 8.4 . Una vez realizado el análisis de covarianza, se evalúa si F es o no significativa. Cuando F resulta significativa se acepta la hipótesis de investigación . Si el resultado fuera: G1 = 36 G2 = 36 G3 = 38 Gl entre = K – 1 = 3 – 1 = 2 Gl intra = N – K = 107 F = 1.70 Comparamos con el valor de la tabla respectiva: en el nivel de 0.05 es igual a 3.07, y nuestra razón F a 1.70 menor este valor. Por lo tanto, entre rechazamos la hipótesis y aceptamos la hipótesis nulaes(“No haya diferencia significativa los grupos, el tipode deinvestigación realimentación no tuvo efecto en la productividad”). Esta conclusión se contrasta y profundiza con las medias ajustadas de los grupos que proporcione el análisis de covarianza (no las medias que se obtuvieron en el experimento por cada grupo, sino las ajustadas con base en la covariable). Recordemos que SPSS® y Minitab® nos proporcionan automáticamente la significancia de F. Tabla 8.4 Ejemplo de un diseño de investigación que utiliza el análisis de covarianza como herramienta para ajustar diferencias en motivación entre los grupos.
Grupos
Covariable Calificación en motivación
Variable independiente Tipo de realimentación
Variable dependiente Puntuaciones en productividad ajustadas, tomando en cuenta la covariable
G1
0
X1
0
G2
0
X2
0
G3
0
—
0
A grandes rasgos, el AFC es un método estadístico multivariado que se utiliza para determinar el número y la naturaleza de un grupo de constructos subyacentes en un conjunto de mediciones. Un constructo es un atributo para explicar un fenómeno (Wiersma y Jurs, 2008). En este análisis se generan “variables artificiales” (denominadas factores) que representan constructos. Los factores se obtienen de las variables srcinales y deben ser interpretados de acuerdo con estas. Como menciona Naghi (1984), es una técnica para explicar un fenómeno complejo en función de unas cuantas variables. Es muy útil para la validez de constructo. Este es el uso más común para los estudiantes a nivel licenciatura. Las variables deben estar medidas en un nivel por intervalos o razón. Si hablamos con un poco de mayor profundidad, el análisis por componentes principales ( Factor o PCA, en inglés) o análisis exploratorio para fines de conocer la validez de constructo de una medición o instrumento tiene tres propósitos centrales:6 •
Analizar la estructura de una matriz o tabla de datos resultante, referida a una medición sobre
una variable hecha en una muestra, para analiza r qué factores o dimensiones (vectores) integran la medición (uno, dos o más). Es decir, determinar la unidimensionalidad-multidimensionalidad de los datos obtenidos por un instrumento de medición (que supuestamente mide la variable de interés). • Analizar la pertenencia de un conjunto de reactivos, ítems o valores a la dimensión o dimensiones (o factores) que componen la medición de la variable de interés. •
Descomponer una tabla o matriz de datos con mediciones correlacionadas en una nueva serie de
variables no correlacionadas (i. e., ortogonales). Estas variables son llamadas, de acuerdo con el contexto, componentes, factores, eigenvectores, vectores singulares o cargas principales. Cada unidad es también asignada a un conjunto de puntuaciones que corresponden a su proyección sobre los componentes. El nivel de medición de las variables involucradas es de intervalos o razón. Se realiza un análisis de factores por cada medición o variable. A menudo se presentan los resultados del análisis con diagramas gráficos que trazan las proyecciones de las unidades sobre los componentes y las cargas de las variables (el llamado " círculo de correlaciones") (Abdi, 2003). La importancia de cada componente se expresa por la varianza (es decir, valor propio) de sus proyecciones o la proporción de la varianza explicada. En este contexto, el AFC se interpreta como una descomposición ortogonal de la varianza (también llamada inercia) de una tabla o matriz de datos. Veamos varios ejemplos del empleo de esta técnica en su propósito de analizar la pertenencia de un conjunto de reactivos a la dimensión o dimensiones (o factores) que componen la medición de la variable de interés.7
Primer ejemplo: relación vendedor-comprador8 El estudio pretendió analizar los factores que determinan la relación entre los vendedores y los compradores industriales de grandes empresas mexicanas (la muestra incluyó a 124 organizaciones de las tres principales ciudades de México —Distrito Federal, Guadalajara y Monterrey, así como sus zonas conurbadas— y otra urbes). A través de diversos ítems e indicadores de un instrumento se midieron distint as variables entre las que se destacan: coordinación (coord.), conflicto (confl.), frecuencia de la relación comprador-vendedor (frec.), reciprocidad económica en la relación (RF2), reciprocidad en el manejo de consideraciones administrativas (RF1) e importancia de la relación (monto de las operaciones) (impor.). Los datos se integraron en una matriz o tabla de datos y se efectuó un AFC. Los resultados se muestran en la tabla 8.5.
6 Ho (2013), 7 En
Tabachnick y Fidell (2012), Abdi y Valentin (2006), Abdi (2003) y Kerlinger y Pedhazur (1997).
los ejemplos, no se incluyen todos los análisis, con el fin de no complicar su entendimiento para estudiantes que revisan esta técnica por primera vez. Paniagua (1985 y 1980). 8
23
24
Capítulo 8Anál isis estadístico. Segunda parte
Metodología de la investigación
Tabla 8.5 Ejemplo de algunos resultados en el análisis de factores de la relación vendedor-comprador. MATRIZ DE PATRÓN FACTORIAL ELEGIDA SUBMUESTRA “COMPRAS” VARIABLE O OMPONENTE ESCALONADO
Coord.
Confl.
ÍTEM
COMUNALIDAD
FI
FII
FIII
FIV
FV
FVI
.84392
–.00895
–.11828
–.03405
.06502
–.27645
24
.46446
.71642
–.05609
–.01958
.07106
.00043
–.07127
25
.59113
.67853
–.11175
.02581
–.09507
–.02857
.14978
26
.63988
.74737
.04695
.13472
–.04837
.07117
.02225
47
.55724
–.05110
.62553
–.20945
–.05248
–.27963
–.06387
48
.59072
.06230
.65163
.17884
–.10916
.31061
.04245
49
.35530
–.05665
.55503
–.11163
–.12946
–.07981
–.17370
50
.54716
–.07908
.61007
.08675
.20431
–.24058
.14142
15
.46081
–.14748
–.06276
.63660
–.12476
–.06299
.13488
16
.44245
.03606
.08501
.62797
.00401
.11692
–.03968
18
.50307
–05359
–.02787
.71169
.03786
–.10795
–.06775
19
.71311
.06664
.02881
.84213
.07161
–.16806
–.11058
42
.46781
–.01380
–.18030
.09416
.63133
.17716
.06309
43
.50097
.10175
–.07970
–.16207
.64202
–.02808
–.18530
40
.72202
.01579
–.03548
.04181
–.18914
.77312
.14292
41
.48405
.15684
–.18489
–.06425
.01958
.58187
.19379
53
.31524
.02822
.02945
–.10069
.08605
.01579
.55431
.44550
–.04376
.08383
.01731
–.18396
.13956
.58137
.53236
.26836
–.05219
.10026
–.11741
–.02893
.55080
EIGENVALUE
5.36433
2.53081
2.47621
1.55248
1.23464
1.06932
% VARIANZA EXPLICADA DELTA =.00
37.7%
17.8%
17.4%
10.9%
8.7%
7.5%
Frec.
RF2 RFI Impor.
FACTOR EN QUE CARGA
23
.66997
54 58
FI
FII
FIII
FIV FV FVI
Segundo ejemplo: escala del clima organizacional10 Para validar el instrumento sobre el clima organizacional citado a lo largo de la parte impresa y en otros capítulos del centro de recursos en línea, se consideraron varias muestras independientes. Entre estas, un laboratorio químico farmacéutico y una institución educativa. El primero de 500 trabajadores, dos subunidades o centros de trabajo, con la inclusión de una planta y oficinas; 19 áreas funcionales y una antigüedad de más de 76 años. Se trata de una organización de alta tecnología y parte de un grupo corporativo internacional. El tamaño de muestra final fue de 421 c asos válidos ( n), 216 hombres y 186 mujeres (19 personas no especificaron). Noventa por ciento de los integrantes tienen de 18 a 40 años (63% menores a 33), mientras que solo 2% fue de nivel gerencial o mayor. El instrumento pretendió medir las siguientes dimensiones: moral, apoyo de la dirección, innovación, percepción de la empresa-identidad-identificación, comunicación, percepción del desempeño, motivación intrínseca, autonomía, satisfacción general, liderazgo, visióny recompensas o retribución. Recordemos
que lo que se evalúa son las percepciones sobre tales atributos organizacionales. Constó de 73 ítems con frases de la escala tipo Likert y 23 preguntas (cuyas respuestas se escalaron también tipo Likert), 96 reactivos en total. Primero, se realizó un análisis por componentes principales sin rotar los factores (solución inicial o simple, sin consideraciones específicas). Los resultados completos de la rotación inicial se muestran en el apéndice respectivo, que produce 19 factores, pero debe hacerse notar que prácticamente los ítems “cargan” de manera significativa en un solo factor. El resto de los factores no muestra reactivos con “cargas” o “pesos” significativos. Posteriormente, los factores fueron “rotados” para visualizar posibles cambios (con los métodosvarimax, equamax y quartimax). Los resultados prácticamente no variaron. Esta solución de un único factor significativo y 18 factores sin pesos importantes, nos indica que la escala del clima organizacional es un constructo básicamente homogéneo, al menos en esta muestra. La solución factorial se presenta parcialmente en la tabla 8.6 (no se incluye toda, pues como ya se comentó solo un factor fue significativo, se presenta hasta el quinto factor). Tabla 8.6 Cargas de factores en el ejemplo de la escala para medir el clima organizacional (laboratorio químico-farmacéutico. Í t em Frases con opciones tipo Likert
T= 100%
FI = Coordinación (explica 37.7% de la varianza) FII = Conflicto (explica 17.8% de la varianza) FIII = Frecuencia (explica 17.4% de la varianza) Y así sucesivamente. Al final se explica el 100% (total)
El autovalor o eigenvalue representa la cantidad de varianza con que contribuye cada factor. Observe que debajo de las columnas FI a FVI aparecen coeficientes que corresponden a los ítems de una escala. Si estos coeficientes son medios o elevados, se dice que los ítems cargan o forman parte del factor correspondiente.9 Por ejemplo, los ítems 23, 24, 25 y 26 cargan en el primer factor (obtienen valores de 0.84392, 0.71642, 0.67853 y 0.74737, respectivamente) y no pesan o cargan en otros factores (tienen valores bajos). Así, descubrimos una estructura de seis factores (F) en 19 ítems. Los factoresreciben un nombre para saber qué constructos se encuentran subyacentes (el cual debe reflejar al factor y generalmente se extrae de la teoría; en el ejemplo los factores son las seis variables involucradas). El análisis de factores también proporciona la varianza explicada y puede diagramarse en forma gráfica en las coordenadas X y Y. 9 Algunos autores consideran significativas cargas superiores a .50 y otros son más flexibles y aceptan cargas por encima de .40, pero el primer criterio es más común.
F a c t oocr om pon en t e F a c t or 1
F1
.352
F2 F3
F a c t or2
F a c t or3
Fa ct o r4
F a c t or 5
.286
-.276
-.160
.508
.382
-7.527E-03
-1.853E-02
.511
.211
.304
.153
.365
F4
.555
.359
-1.285E-02
-4.903E-02
F5
.631
. 325
-.120
-.137
4.398E-02
F6
.586
.312
-.121
-.287
-4.812E-02
F7
.615
-.224
.162
-.262
-6.974E-02
F8
.595
-.165
.125
-.330
4.410E-02
F9
.609
-.272
.325
-.296
-5.500E-03
F10
.655
-.235
.294
-.293
-2.404E-02
F11
.659
8.963E-02
.140
3.780E-02
F12
.589
. 152
-.161
-5.420E-02
F13
.591
-.217
.189
.231
5.625E-02
F14
.636
-.198
.113
.237
3.174E-02
.245 .153 .247
-.167 -.107
continúa tabla... 10 Este ejemplo fue tomado de una aplicación del instrumento de la Universidad de Celaya para medir el clima laboral (Hernández Sampieri, 2005).
25
26
Capítulo 8Anál isis estadístico. Segunda parte
Metodología de la investigación
Tabla 8.6 Cargas de factores en el ejemplo de la escala para medir el clima organizacional (laboratorio químico-farmacéutico (continuación). Ít e m Frases con opciones tipo Likert
F a c t oocr om pon e n t e F a c t or 1
F a ct or2
F a c t or3
Ít e m F a c t or4
Fa ct o r5
27
Tabla 8.6 Cargas de factores en el ejemplo de la escala para medir el clima organizacional (laboratorio químico-farmacéutico (continuación).
Frases con opciones tipo Likert
F a c t oocr om pon e n t e F a ct or1
F a c t or2
F15
.675
-.217
5.034E-02
-7.586E-02
4.885E-02
F54
.542
F16
.646
-.166
.243
-.215
3.701E-02
F55
.509
F17
.651
.164
.213
-7.052E-02
-8.041E-03
F56
.467
F18
.534
.328
.269
.276
-7.664E-02
F57
.528
.393
F19
.690
-3.630E-02
-9.095E-05
-6.007E-02
7.306E-02
F58
.617
7.204E-02
F20
.590
-9.375E-02
-6.703E-02
.359
3.371E-02
F59
.737
F21
.727
-.150
-.404
5.516E-02
-8.518E-03
F60
.584
F22
.765
-.213
-.389
2.251E-02
-5.801E-03
F61
.395
F23
.649
-.211
2.260E-02
.141
3.218E-02
.656
.335
.128
F a c t or3
Fa ct or4
Fa ct or5
.117
6.809E-02
-.115
.344
.233
.333
-.101
1.753E-02
-.273
.343
-.132
5.363E-02
.321
-6.305E-02
-.184
7.046E-02
-.114
-.448
-8.039E-04
-.138
.181
1.196E-03
.341
-3.219E-02
-2.439E-02
-1.207E-02
.330
-3.374E-02
-.256
F62NEG
.424
-.241
-.308
6.336E-02
-8.049E-02
-1.521E-02
.211
F63
.684
-.138
.132
-1.317E-02
3.409E-02
.534
-9.697E-03
.342
7.291E-02
-.135
F64
.565
-.142
.235
2.183E-02
-3.918E-02
-2.383E-02
3.496E-02
.124
.187
.280
F65
.540
-6.075E-02
.154
.189
-6.796E-02
F27
.592
-.257
4.450E-02
.410
-3.095E-02
F66
.746
-.171
-.341
-6.588E-02
-6.952E-02
F28
.593
.231
.216
.384
-.123
F67
.742
4.266E-02
-.249
-9.802E-02
-2.049E-02
F29
.398
.103
-8.613E-02
.326
-.170
F68
.469
-.167
.267
.180
-.137
F30
.677
-8.654E-02
-.223
-5.095E-02
-3.149E-02
F69
.400
6.046E-02
9.498E-02
.430
-.135
F31NEG
.236
.210
.114
.102
.333
F70NOUNI
.488
-.284
.297
-.115
F32
.673
.317
5.273E-02
-3.608E-02
.204
F71NOUNN
4.747E-02
-.153
.129
.113
.324
F33
.657
-.276
.226
-.277
-8.926E-02
F72NOUNI
.272
-.132
7.687E-02
-8.865E-02
-.108
F34 F35
.604 .547
.397 .417
3.055E-02 3.127E-02
-1.101E-02 -2.232E-04
1.358E-02 -3.890E-02
F73NOUNI .555 Preguntas con opciones tipo Likert
-.205
.275
-6.823E-02
6.611E-03
F36
.669
-.256
-9.381E-02
.296
4.097E-04
P1
.588
4.995E-02
.345
4.504E-02
7.539E-02
F37NEG
.163
-.144
-.254
.161
.367
P2
.482
.396
-.230
-.122
F38NEG
.555
-.176
-.255
1.392E-02
.226
P3
.576
.397
2.461E-02
-.124
.272
F39
.701
.312
-9.353E-02
-.209
.184
P4
.738
-.208
.202
-.266
-7.068E-02
F40
.643
.412
-.144
-.149
.130
P5
.729
-.236
.180
-.239
3.344E-02
F41
.730
-.210
2.546E-02
P6
.651
-5.214E-02
.152
.169
F42NOUNI
.518
-.336
.161
-.167
.255
P7
.687
-.203
.334
-1.692E-02
-3.240E-03
F43
.229
6.211E-02
-3.422E-03
-2.360E-02
9.347E-02
P8
.714
5.413E-03
.424
4.213E-03
-5.577E-02
F44NEG F45NEG
F24 F25 F26NEG
-.269
.235
.213
.221
.336
9.607E-02
.246
-.223
-.105
.263
.292
P9
.700
.375
9.235E-03
-9.991E-02
.100
8.139E-02
-.207
-.170
7.145E-02
.404
P10
.485
.403
4.916E-03
-4.660E-02
2.116E-03
F46
.642
-.141
-.339
3.685E-02
-.175
P11
.564
.275
9.553E-02
-3.650E-02
-.135
F47
.764
-.155
-.338
-5.616E-02
2.326E-02
P12
.708
-.123
.161
-.104
6.737E-02
F48
.612
-.186
-.359
-.192
-8.310E-02
P13
.668
-.143
-.133
-9.723E-02
.102
F49
.720
-.148
-.339
-.105
-.117
P14
.653
-.367
5.745E-02
.311
7.085E-02
F50NOUNI
.505
-.339
.191
-9.964E-02
.260
P15
.767
-.225
-.405
6.120E-02
-.112
F51
.676
.389
-2.925E-02
-5.744E-02
.226
P16
.759
-.188
-.431
3.359E-02
-.118
F52NEG
.376
-.164
-6.835E-02
.239
.363
P17
.792
-.196
-.408
-2.678E-03
-.106
F53NEG
.156
-.214
.187
.336
.244
continúa tabla...
continúa tabla...
28
Capítulo 8Anál isis estadístico. Segunda parte
Metodología de la investigación
Tabla 8.6 Cargas de factores en el ejemplo de la escala para medir el clima organizacional (laboratorio químico-farmacéutico (continuación). Ítem
F a c t oocr om pon e n t e
Frases con opciones tipo Likert
F a c t or1
F a c t or2
Fa ct o r3
F a ct or4
F a c t or5
P18
.727
5.139E-02
-3.487E-03
-1.964E-02
-.170
P19
.718
.117
-1.238E-02
-2.477E-02
-.237
P20
.702
6.121E-02
2.808E-03
-4.372E-02
-.282
P21
.653
.246
8.018E-02
-.169
-.265
P22
.661
.284
4.514E-02
-.102
-.224
P23
.660
.117
2.673E-02
-5.360E-02
-.267
En tablas o cuadros como el a nterior resulta muy fácil “perderse en un mundo de cifras”. Por ello es necesario concentrarse en lo relevante: • La tabla es una matriz de correlaciones de cada ítem con los factores (estructura completa de ítems o reactivos). • Las cargas factoriales (valores en las celdas) son una especie de coeficientes de correlación y en consecuencia se interpretan como tales. • El análisis de factores también proporciona la varianza explicada por cada factor de la estructura, así como otros valores que omitimos deliberadamente para no complicar la interpretación al est udiante a nivel de licenciatura. • El factor 1 (sombreado) es el único que realmente emergió de la administración de la escala del clima organizacional11 (observe los valores para cada ítem del factor 1 comparados con los valores de estos mismos ítems en los demás factores o columnas). Un ejemplo (pregunta 17): Ítem
Factor 1
P17
0.792
Demás factores 0.196
0.408
2 .678E-03
0 .106
El hecho de que el análisis de factores haya revelado un único factor significativo en la muestra, nos lleva a la conclusión provisional de que el clima organizacional es un constructo “molar”, en el cual se “funden” distintas percepciones sobre aspectos centrales del ambiente de trabajo. Por lo anterior, podemos decir que los resultados respaldan la noción de Parker et al. (2003) respecto de que, detrás de las dimensiones laborales del clima, se encuentra presente un “proceso de juicio común”, el cual se refleja en las distintas mediciones de la percepción del entorno de trabajo. Es un “proceso subyacente” que se expresa de diversas maneras. Asimismo, el análisis de factores y la matriz de correlación entre dimensiones apoyan el modelo de dos niveles postulado principalmente por L. A. James, L. R. James y C. P. Parker. La confiabilidad alfa de la escala fue 0.9747, que aumenta a 0.98 si se eliminan los ítems que no cargan en algún fact or.
Tercer ejemplo: Validación de un instrumento para medir el espíritu empresarial en estudiantes12 Objetivo del estudio: validar un instrumento que evalúa el espíritu empresarial en una muestra de estudiantes mexicanos. Instrumento desarrollado en 2003 por Leslie Borjas Parra, Universidad Metropolitana de Venezuela. Confiabilidad total (alfa): 0.925. A partir del análisis de factores por componentes principales, se puede observar en la tabla 8.7 una carga mayor a 0.50 de 24 ítems (preguntas) hacia el factor 1 (F1, denominado “espíritu empresarial”), lo que proporciona confianza respecto de que el instrumento realmente mide lo que pretende y es bastante unidimensional (validez de constructo). El factor 2 solo tiene dos preguntas con cargas significativas (no constituye propiamente una escala), el factor 3 únicamente un reactivo y el resto, ninguno. En la primera columna de la tabla se presenta el número de pregunta que contiene el instrumento (un cuestionario) y la dimensión que teóricamente mide, y luego, en las siguientes columnas, los factores; y en las celdas (intersección de ítems y factor), las cargas de cada reactivo. Tabla 8.7 Ejemplo de un análisis de factores para validar un instrumento que mide el espíritu empresarial en estudiantes. NÚMERO DE PREGUNTA Y DIMENSIÓN QUE TEÓRICAMENTE CONSIDERA
Carga factorial alta
Cargas factoriales bajas
• Los ítems con cargas bajas en t odos los factores deben desecharse de la escala, pues no miden realmen-
te lo que nos interesa: los componentes o dimensiones del clima organizacional (afectan la validez del instrumento). Por ejemplo, el ítem 53 (frase): Ítem F53NEG
Factor 1 0.156
Carga factorial baja
Demás factores 0.214
0.187
0.336
0.244
Cargas factoriales bajas
29
• En este caso, la conclusión principal del resultado sería:
F1
F2
F3
F4
F5
P9_CREATIVIDAD
0.60
-0.40
0.26
0.19
0.02
-0.22
-0.03
0.12
P8_GRUPO
0.53
-0.23
-0.24
0.09
0.24
0.01
-0.39
-0.31
P7_CREATIVIDAD
0.63
0.27
-0.18
0.29
P6_RIESGOS
0.63
-0.06 -0.43
0.02
-0.14
- 0.04
-0.19
-0.19
-0.14
P5_RIESGOS
0.54
-0.44
-0.15
-0.11
0.06
0.17
-0.13
0.10
P 4_EVENTOSC
0.57
0.00
0 .31
P 32_GRUPO
0.59
-0.43
-0.24
0.07
-0.12
0.01
-0.12
P 31_EVENTOS
0.48
0.46
0.30
-0.25
0.00
0.04
0.26
-0.17
0.02
P30_HONESTIDAD
0.54
0.05
0.31
0.35
P3_CREATIVIDAD
0.55
-0.15
0.21
-0.09
-0.49
P29_EVENTOS
0.48
00.57
0.25
0.35
0.05
P28_AUTODETERMINACIÓN
0.52
0.29
-0.01
0.46
-0.38
0.01
F6
-0.15
0.27
0.02 0.02 -0.09 -0.22
F7
-0.17
-0.07
0.17 0.08
F8
-0.22
0.39 0.24 -0.04 0.26 -0.06
-0.08
-0.06
-0.03
0.23
continúa tabla... 11 Da cuenta del 39% de la varianza total (los tres primeros factores generan el 60%). Al factor se le denominó: Proceso de juicio común para evaluar las percepciones del entorno laboral.
12 Mendoza (2010)
30
Capítulo 8Anál isis estadístico. Segunda parte
Metodología de la investigación
Tabla 8.7 Ejemplo de un análisis de factores para validar un instrumento que mide el espíritu empresarial en estudiantes (continuación). NÚMERO DE PREGUNTA Y DIMENSIÓN QUE TEÓRICAMENTE CONSIDERA
F1
F2
F3
0.32
-0.02
F4
F5
F6
P27_SOCIAL
0.39
P26_AUTODETERMINACIÓN
0.64
P25_AUTODETERMINACIÓN
0.68
0.08
0.28
-0.04
-0.22
-0.08
P24_GRUPO
0.60
0.21
-0.12
-0.33
-0.01
-0.23
F7
F8 Instrumento de medición
0.06
0.16
0.21 0.06
0.12 -0.28
0.00
-0.23
0.08 -0.12 0.13
0.06 -0.10
0.59
0.06
-0.26
0.25
-0.31
0.04
0.32
0.60
-0.05
-0.43
0.04
-0.26
0.08
0.26
-0.20
P21_HONESTIDAD
0.41
0.08
-0.17
-0.07
0.46
-0.26
0.47
-0.15
P20_SOCIAL
0.53
0.20
-0.38
P2_CREATIVIDAD
0.64
0.04
-0.26
0.27
0.24
0.20
-0.01
0.07
P19_SOCIAL
0.49
0.40
-0.37
-0.32
0.06
-0.05
-0.03
0.37
P18_CAMBIO
0.70
0.07
-0.17
P17_SOCIAL
0.64
0.42
-0.21
P16_GRUPO
0.68
0.19
P15_CAMBIO
0.56
-0.15
-0.40
P14_RIESGOS
0.58
-0.21
0.36
P13_RIESGOS
0.57
0.17
-0.27
0.28
0.19
-0.17
-0.26
-0.22
-0.05
-0.11
-0.25
-0.13
-0.17
-0.26
0.19
-0.15
0.31
-0.23
0.04
0.39
-0.04
0.21
-0.42
0.09
0.05
-0.01
P11_EVENTOS
0.36
0.59
0.14
-0.12
0.14
P10_AUTODETERMINACIÓN
0.31
-0.48
0.31
0.14
P1_HONESTIDAD
0.45
-0.26
-0.33
0.11
0.04 0.41
-0.19
-0.02 0.16
0.35 -0.08 0.32 0.12 0.17
0.07 0.02 0.00 0.20 0.08 0.02 -0.23 -0.35 0.37 0.15
Recolección de datos
Dimensiones con 2 o más ítems o indicadores con cargas significativas (y que logran una confiabilidad aceptable: se integran a los análisis (son los factores)
Análisisestadísticos descriptivos e inferenciales (de los cuales se excluyen factores e ítems con cargas no significativas)
-0.15
P22_HONESTIDAD
0.72
-0.16
0.38
0.61
P23_CAMBIO
P12_CAMBIO
Figura 8.16 Proceso para seleccionar ítems, reactivos o indicadores válidos de una medición a través del análisis de factores por componentes principales.
-0.03
-0.10 -0.07 -0.06 -0.03 -0.13 -0.06 -0.12 0.03 -0.12 0.25
Como recapitulación y simplificación podemos decir que el análisis de factores por componentes principales es útil para descubrir empíricamente qué dimensiones o factores integran la medición (variable) de interés, qué ítems o indicadores miden verdaderamente cada dimensión y cuáles no (los que no integran la dimensión y en consecuencia, la variable). Estos últimos son descartados de análisis subsecuentes (generan error porque no miden la variable, atentan contra la validez de la medición) y nada más incluimos a los que cargan de manera significativa en una dimensión o factor y son parte de la variable. 13 Este proceso de selección se representa en la figura 8.16 y permite obtener datos de ítems o indica dores que miden la dimensión y, consecuentemente, la variable de interés. Por decirlo de alguna manera, “se purifica” el instrumento (realmente es la matriz o los datos considerados lo que se ha “depurado”) de ítems que no miden verdaderamente la variable (al menos en la muestra del estudio). Por ello, el análisis de factores por componentes principales es una especie de “filtro” del error de medición y una herramienta para analizar y mejorar la validez de constructo. Los factores (dimensiones) que permanecen (a veces uno, lo que implica unidimensionalidad, y otras veces dos o más, multidimensionalidad) son correlaccionados para ver si se pueden integrar en un constructo, valorando también la confiabilidad (análisis complementario); y así, finalmente se integran para realizar los análisis estadísticos pertinentes, descriptivos e inferenciales. Los factores emergentes del análisis por componentes principales sustituyen, por así señalarlo, a las dimensiones srcinales para el resto de los análisis. Regularmente, el AFC se aplica a los datos de la prueba piloto (a la matriz resultante) y con base en sus resultados, se eliminan ítems o indicadores inválidos, que no se correlacionan con otros y/o que dete13 Todo lo anterior solamente lo podemos afirmar respecto de nuestra muestra, y si es representativa de la población, también de esta última.
Matriz de datos
Análisis de factores por componentes principales
Ítems o indicadores con cargas significativas (0.50 o mayores): se integran a los análisis estadísticos posteriores
Ítems o indicadores con cargas no significativas (menores de 0.50): se eliminan para los análisis posteriores (desechados)
rioran la confiabilidad de la medición, y se reestructura el instrumento. Posteriormente, en la muestra definitiva se aplica la versión mejorada de este, se obtienen los datos y se vuelve a aplicar el análisis por componentes principales, antes de los análisis subsecuentes.
Variantes del análisis de factores por componentes principales y análisis asociados Dentro de la gama de los métodos multivariados existen variantes del AFC para otros niveles de medición: el análisis de correspondencia (AC) (correspondence analysis) y el análisis de correspondencia múltiple (ACM). El AC es una generalización del análisis de componentes principales para tablas de contingencia (es decir, cuando la variable o variables sometidas a análisis tienen un nivel de medición nominal u ordinal). Los factores del análisis proporcionan una descomposición ortogonal de la chi cuadrada asociada a la tabla. Las filas y columnas de ella desempeñan un papel simétrico y pueden ser representadas en el mismo diagrama o plot. Cuando se analizan diversas variables nominales, el AC es generalizado como análisis de correspondencia múltiple (Blasius y Greenacre, 2014). El AC es también conocido como escalamiento dual u óptimo o promedio recíproco. Para quienes trabajan las escalas tipo Likert como ordinales, este método es el apropiado y sigue la misma lógica del análisis de factores por componentes principales. ambién brevemente mencionamos otras tres técnicas asociadas: escalamiento multidimensional (EMD), análisis aditivo de árbol y análisis de conglomerados . Estas técnicas se aplican cuando las filas y las columnas de la matriz o tabla de datos representan las mismas unidades y cuando la medición es una distancia o una similitud. El objetivo del análisis es representar gráficamente estas distancias o semejanzas (Abdi y Valentin, 2006). El EMD se utiliza para representar las unidades como puntos en un mapa de tal manera que sus distancias euclidianas en este se aproximen a las similitudes srcinales. El EMD clásico, que es equivalente al análisis de componentes principales, se usa para las distancias y el EMD no métrico se emplea para las similitudes. Asimismo, el escalamiento multidimensional sirve para diseñar escalas que midan a los sujetos en diversas variables y los ubiquen simultáneamente en los ejes de la s distintas variables, así como para conocer la estructura de las variables entre sí. Por su parte, el análisis de conglomerados o clusters es una técnica para agrupar los casos o elementos
31
32
Capítulo 8Anál isis estadístico. Segunda parte
Metodología de la investigación
de una muestra en grupos con base en una o más variables (Spencer, 2013). El análisis aditivo de árbol y el de conglomerados son usados para representar a las unidades como “hojas” de un árbol y que sus distancias en este se aproximen a las distancias o similitudes srcinales. Ahora bien, ¿en qué consisten las distancias euclidianas? Son medidas para analizar “distancias” entre constructos (agrupamiento: cercanía o lejanía). En el programa SPSS se pueden obtener básicamente dos valores opuestos: distancia euclidiana o de disimilitud y distancia de proximidad o similitud. Entre mayor sea el valor de una distancia euclidiana, más “alejadas” se encuentran las variables; y entre más alto sea el valor de proximidad, “más cercanas y relacionadas” están las variables (este último valor se proporciona en unidades de correlación de Pearson). Por ejemplo, Hernández-Sampieri (2009) midió el clima organizacional en función del Modelo de los Valores en Competencia (MVC) de Kim S. Cameron y Robert E. Quinn.14 Consideró cuatro dimensiones del clima organizacional en relación con la cultura organizacional (denominados cuadrantes en el MVC) que a su vez contienen diversas variables: 1. Cuadrante de organización familiar o clan (relaciones humanas), constituido por las siguientes variables: bienestar de los empleados, autonomía, comunicación, hincapié en el entrenamiento, integración y soporte del superior inmediato. 2. Cuadrante de organización jerárquica (proceso interno): formalización y tradición. 3. Cuadrante de organización adhocrática (sistemas): flexibili dad/innovación, enfoque externo y reflexividad. 4. Cuadrante que corresponde a la organización de mercado (metas racionales): claridad de metas organizacionales, esfuerzo, eficiencia, calidad, presión para producir y realimentación del desempeño. Con la finalidad de analizar la proximidad de tales dimensiones o cuadrantes realizó un análisis de disimilitudes y otro de similitudes, los cuales se presentan en las tablas 8.8 y 8.9. En las tablas podemos observar que “relaciones humanas”, “sistemas” y “metas” son dimensiones o cuadrantes “cercanos y asociados”. “Proceso interno” es una dimensión “lejana” al resto de los cuaTabla 8.8 Matriz de disimilitudes (distancias euclidianas). Re la c ione shum an as Relaciones humanas
Para quien desee compenetrarse con el análisis por componentes principales y sus derivaciones y pruebas asociadas, además de la literatura más reciente citada, recomendamos consultar a clásicos como: Harman (1976), Gorsuch (1983), Nie et al. (1975), Kim y Mueller (1978a y 1978b), así como Hunter (1980). Del mismo modo, para aplicarlos se sugiere revisar a Nie et al. (1975), Cooper y Curtis (1976) y en español a Padua (2004).
¿Qué es la regresión lineal múltiple? (RLM) Esta herramienta es un método estadístico para analizar el efecto de dos o más variables independientes sobre una dependiente (Weisberg, 2014; Šmilauer y Lepš, 2014; Babbie, 2012; Nimon y Reio, 2011; Kerlinger y Pedhazur, 1997). Asimismo, constituye una extensión de la regresión lineal sólo que con un mayor número de variables independientes. Es decir, sirve para predecir el valor de una variable dependiente o efecto cuando se conoce el valor y la influencia de las variables independientes o causas incluidas en el análisis (denominadas factores). Dicho de otro modo, se estima el peso de dos o más variables independientes sobre una dependiente (efectos individuales de cada variable independiente y conjuntos). Si queremos conocer el efecto que ejercen las variables: a) satisfacción sobre los ingresos percibidos, b) antigüedad en la empresa, c) motivación intrínseca en el trabajo y d) percepción del crecimiento y desarrollo personal en el trabajo sobre la variable “permanencia en la empresa” (duración o estancia), el modelo de regresión múltiple es el adecuado para aplicarlo a los datos obtenidos. Lo mismo, si tenemos las variables independientes “coeficiente de penetración”, “coeficiente de resistencia”, “superficie de las alas”, “masa de la aeronave”, “densidad del aire”, “velocidad del viento relativo” y “ángulo de ataque” y la variable dependiente “sustentación creada por el ala” la RM es apropiada. O bien, si la variable dependiente es “presión arterial” y las independientes son “peso del individuo”, “edad”, “consumo de sodio”, “ingesta de alcohol” y “horas de ejercicio”, también este modelo es útil. Un ejemplo adicional sería el de la figura 8.17. Diversas variables independientes son usadas para predecir una variable dependiente con una aproximación de mínimos cuadrados. Si las variables independientes son ortogonales, el problema se reduce a Figura 8.17Esquema modelo conestas una variable dependiente y varias independientes, en las que se pretende conocer el efectodedeuncada una de y los efectos conjuntos.
Proce soin te rno
Si ste ma s
Me tas
.000
24.149
10.710
13.097
Proceso interno
24.149
.000
23.727
17.413
Sistemas
10.710
23.727
.000
11.819
Metas
13.097
17.413
11.819
.000
VARIABLES INDEPENDIENTES
VARIABLE DEPENDIENTE
Grado de cooperación entre los maestros para la enseñanza en las clases
Tabla 8.9 Matriz de proximidad o similitudes (en unidades de correlación de Pearson). Correlaciones entre vectores Re la c ione shum an as Relaciones humanas Proceso interno
1.000
Proce soin te rno
Si ste ma s
-0.164
0.796 -0.133
Grado de utilización de la tecnología computacional en el aula
Me tas 0.666
-0.164
1.000
Sistemas
0.796
-0.133
1.000
0.739
Metas
0.666
0.062
0.739
1.000
Desempeño escolar de los alumnos
0.062
drantes. Las distancias euclidianas y las de proximidad las podemos obtener del subprograma de escalamiento multidimensional o la propia opción para ello. 14 Este trabajo sentó las bases de un ejemplo de protocolo y de reporte (artículo), incluidos en la sección de ejemplos del centro de recursos en línea.
Grado de involucramiento de los padres en las estrategias de enseñanza
Grado de cooperación y trabajo en equipo por parte de los alumnos para realizar las tareas
33
34
Capítulo 8Anál isis estadístico. Segunda parte
un conjunto de regresiones bivariadas. Cuando se correlacionan las variables independientes, su importancia se estima desde el coeficiente de correlación parcial. Cuando una de las variables independientes puede ser predicha por las demás, surge una problemática porque ya no se pueden realizar los cálculos requeridos por la RLM, y a esto se le denomina como multicolinealidad perfecta (Abdi, 2003). Más adelante se comentan algunas posibles soluciones a este problema. Es decir, el modelo de regresión múltiple nos i ndica: • La relación entre cada variable independiente y la única dependiente (cómo cambios en la independiente respectiva se vinculan con cambios en la dependiente). • La relación entre todas las variables independientes (en conjunto y agrupadas) y la dependiente (cómo cambios en las independientes se vinculan con cambios en la dependiente). • La predicción de la dependiente a partir de las independientes. • La correlación entre las variables independientes (colinealidad). Las variables independientes se denominan factores o “predictores”15 y anteceden temporalmente a la variable dependiente o criterio. La información básica que proporciona la regresión múltiple es el coeficiente de correlación múltiple (R) y la ecuación de regresión. Coeficiente de correlación múltiple (R). Señala correlación la entre la variable dependiente y todas las variables independientes tomadas en conjunto (Bryman y Cramer, 2011; Abdi, 2006a y 2006b; Aiken, 2003). El coeficiente puede variar de cero a uno; cuanto más alto sea su valor, las variables independientes estarán más correlacionadas con la variable dependiente y explicarán en mayor medida sus fluctuaciones (varianza); en consecuencia, son factores más eficaces para predecir el comportamiento de esta última. En el capítulo 10 del libro se comentó el coeficiente de correlación de Pearson y se mencionó que cuando el coeficiente r se eleva al cuadrado (r 2), se obtiene el coeficiente de determinación y el resultado indica la varianza de factores comunes, esto es, el porcentaje de la variación de una variable debido a la variación de la otra y viceversa (o cuánto explica o determina una variable la fluctuación de la otra). Pues bien, algo similar ocurre con el coeficiente de correlación múltiple, solo que tenemos que considerar más variables. Cuando el coeficiente R se eleva al cuadrado (R2), se produce el llamado coeficiente de determinación o correlación parcial, que nos señala la varianza explicada de la variable dependiente por todas las independientes (dicho de otra forma, el porcentaje de variación en la dependiente debido a las independientes consideradas) (vom Hofe, 2010). Esto se ve gráficamente en la figura 8.18 con dos independientes y una dependiente, a fin de que resulte menos complejo de entender. Este coeficiente (R2) resulta útil también para determinar la cantidad de varianza que una variable interviniente explica tanto de la variable independiente como de la dependiente. De este modo se puede Figura 8.18Esquema de un coeficiente de determinación o correlación parcial.
Metodología de la investigación
remover la varianza compartida de la interviniente con la variable independiente o la dependiente (Weisberg, 2014; Sengupta, 2008 y Creswell, 2005), que es algo similar a lo que se efectúa con el análisis de covarianza. al sería el caso de una relación del tipo que se muestra en la figura 8.19. Si resumimos lo que explicamos en el capítulo 10 del libro sobre correlación y regresión lineal y lo expuesto hasta aquí, tenemos los coeficientes que se resumen en la tabla 8.10. Figura 8.19Ejemplo de una relación en la que el coeficiente de determinación (correlación parcial) puede ser útil en la interpretación. !
Autoestimadel estudiante (independiente)
relación negativa
Reforzamiento de los valores del estudiante por parte de sus tutores (interviniente)
Consumo de estupefacientes (dependiente)
relación negativa
Otra información relevante que produce el análisi s de regresión múltiple son los valores “ beta” (b o b), que indican el peso, fuerza o influencia que tiene cada variable independiente sobre la dependiente, al Tabla 8.10 Resumen de los coeficientes de correlación bivariada y múltiple. Coef ic i en te
Sí m b o l o
I n fo r m a c i ó n p ro d u c i d a
Pearson
r
Grado de asociación entre dos variables (oscila entre 0 y 1).
Coeficiente de determinación
r2
Varianza de factores comunes (porcentaje de la
(bivariado)
variación una variable debidoFluctúa a la variación de la otra de variable y viceversa). entre 0 y 100%.
Correlación múltiple
R
Correlación entre la variable dependiente y todas las variables independientes tomadas en conjunto. Oscila entre 0 y 1.
Determinación (correlación parcial)
R2
Varianza explicada de la dependiente por todas las independientes. Fluctúa entre 0 y 100%.
controlar la varianza de todas las demás independientes. Cada peso beta es un coeficiente de regresión que señala la magnitud de la predicción de una variable independiente (factor) para la variable dependiente (criterio), después de remover los efectos de todas las demás independientes. Los valores beta están estandarizados, es decir, no importa que cada variable predictora esté medida en una escala diferente (como ocurría con las puntuaciones z) y se interpretan como el coeficiente de Pearson, de – 1.00 a + 1.00 (Cunnings, 2012; Creswell, 2005 y Menard, 2003). ambién el análisis proporciona coeficientes de correlación bivariados entre la dependiente y cada independiente (Šmilauer y Lepš, 2014 y Shaw, 2009). Para predecir valores de la variable dependiente se aplica la ecuación de regresión múltiple:16 y = a + b1X1 + b2X2 + b3X3 + ... bkXk 15 Término anglosajón.
16 Healey (2014); Weisberg (2014); vom Hofe (2010); Abdi (2006a y 2006b); Aiken (2003) y Kerlinger y Pedhazur (1997).
35
36
Capítulo 8Anál isis estadístico. Segunda parte
Metodología de la investigación
37
Tabla 8.11 Variables introducidas en el ejemplo de regresión múltiple (continuación).
donde a es una constante de regresión del conjunto de puntuaciones obtenidas (denominada en inglés intercept), b1, b2, b3, …bk son los pesos “beta” de las variables independientes. Mientras que X1, X2, X3 y …Xk son valores de las variables independientes que fija el investigador para hacer la predicción. La variable dependiente debe estar medida en un nivel por intervalos o de razón. Las independientes, en cualquier nivel de medición (el modelo estandariza mediciones). Cuando se utilizan variables categóricas (nominales u ordinales como género, grupo étnico, nivel jerárquico, etc.) se transforman en variables “dummy” y se int roducen al modelo como predictores. Los códigos dummy son series de números asignados para indicar la pertenencia a un grupo en cualquier categoría exhaustiva y mutuamente excluyente. De acuerdo con Mertens (2010), la cantidad de varianza que cada variable independiente aporta a la variable dependiente, puede tener cambios con diferentes órdenes de entrada de las variables independientes. Al respecto no hay reglas, por lo cual el investigador debe recurrir a la lógica o a criterios como los siguientes: • Ingresar las variables de acuerdo con la fuerza de su correlación con la variable dependiente, de la más alta a la más baja. • Seguir el orden en que se han introducido en estudios previos. • Proceder de acuerdo con la teoría. • Orden cronológico (tiempo en que se introducen las variables en un experimento o al medirse, si es que su medición fue por etapas, de la primera a la última). Los resultados más relevantes que produce SPSS® sobre la regresión múltiple se muestran en las tablas 8.11 y 8.12, así como en la figura 8.20, que corresponden a un estudio para predecir el clima laboral (criterio o dependiente) sobre la base de las siguientes variables independientes (Hernández-Sampieri, 2005):17 1. Normalización (formalización de políticas en documentos). 2. Avance del proceso de cali dad en el departamento (un nuevo esquema de trabajo introducido en 2004). 3. Innovación departamental. 4. Identificación del trabajo individual en los resultados generales de la organización. 5. Comunicación (percepción del grado en que la información relevante de la empresa es transmitida a los empleados). 6. Desempeño (índice de productividad del empleado). 7. Motivación general. 8. Antigüedad en la empresa (en meses). 9. Satisfacción general en el trabajo. 10. Liderazgo (percepción del superior inmediato como líder). 11. Cultura (arraigo de la cultura organizacional definida por la dirección de la empresa). 12. Pago (salario).
Variables introducidas / eliminadas Modelo RLM
Variables independientes Variables independientes introducidas a( ) eliminadas
Variable dependiente introducida (b)
Proceso de calidad Innovación Identificación Comunicación Desempeño Motivación Antigüedad Satisfacción Liderazgo Cultura Pago a. Todas las variables solicitadas introducidas b. Variable dependiente: clima organizacional
Tabla 8.12 Ejemplo de resultados básicos de la regresión múltiple. Coeficientesa Modelo
Coeficie ntes Coeficiente no estandarizaestandarizados dos B
1(Constante)
Errortip.
1.02E010
Beta
.000
Orden0
Innovación
.083
.000
Identificación
.083
.000
.103
.083
.000
Proceso de calidad
.083
.000
Parcial
Semiparcial
Tolerancia
FIV
Pesosbeta .106 detallado izquierda Correla.135 ciones detallado .060 derecha
Normalización
.783
1.000
0.63
.352
.831
1.000
.0009
.305
1.045 1.378
.747
1.000
.059
.429
1.334
.812
1.000
.056
.197
1.355
Comunicación
.083
.000
.104
.858
1.000
.052
.253
1.080
Desempeño
.083
.000
.084
.005
1.000
.052
.201
1.320
Motivación
.083
.000
.078
.785
1.000
.044
.320
3.042
Antigüedad
.083
.000
.100
.713
1.000
.070
.488
1.048
Primero. SPSS presenta las variables introducidas en el modelo de regresión (tabla 8.11). Segundo. Se presentan resultados de varianzas (ANOVA), los cuales omitimos, y los coeficientes beta y
Satisfacción
.083
.000
.105
.854
1.000
.054
.260
1.049
estadísticas de colinealidad (tabla 8.12).
Liderazgo
.083
.000
.135
.855
1.000
.055
.274
1.047
Cultura
.083
.000
.043
.827
1.000
.055
.357
1.805
Pago
.083
.000
.126
.718
1.000
.092
.534
1.872
Tabla 8.11 Variables introducidas en el ejemplo de regresión múltiple. Variables introducidas / eliminadas Modelo RLM
Variables independientes Variables independientes introducidas a( ) eliminadas Normalización
—
Variable dependiente introducida b()
Clima ... continúa
17 El estudio ha sido citado y recordemos que incluyó a varias empresas, entre ellas a un laboratorio químico farmacéutico y una institución educativa.
a. Variable dependiente: clima
Tercero. Se muestran los valores estadísticos sobre los residuos (residuales). Cuarto. Se realiza una regresión lineal de cada variable independiente sobre la dependiente (se tendrán tantas gráficas como variables predictoras). Mostramos el ejemplo de la variable cultura en
la figura 8.20.
38
Capítulo 8Anál isis estadístico. Segunda parte
Metodología de la investigación
Figura 8.21Diagrama de dispersión del clima organizacional: laboratorio.
Figura 8.20Gráfica de una variable en el ejemplo de regresión múltiple.
Variable dependiente: clima total
0.10
1.00 0.05
0.75 a0.00 im l C
0.50
-0.05
0.25 -0.10
0.00 -0.15
-2.00
-1.50
-1.00
-0.05
0.00
0.50
1.00
Cultura
A continuación mostramos un ejemplo de interpretación del coeficiente R2 de la referencia citada previamente de Hernández-Sampieri (2005), en el cual la variable dependiente es el clima organizacional total (medido por la escala de la Universidad de Celaya o ECOUNI). Por su parte, las independientes son: moral, apoyo de la dirección, innovación, percepción de la empresa, comunicación, percepción del desempeño, motivación intrínseca, autonomía, satisfacción general, liderazgo, visión y recompensas o retribución. Las variables independientes fueron evaluadas a través de diferentes mediciones no incluidas en la ECOUNI.18
Ejemplo Para el laboratorio químico-farmacéutico (empresa), la R2 fue de 0.989 (0.988 corregida). Todos los pesos beta tuvieron una significancia menor a 0.01 (excepto recompensas, la cual fue de 0.175). Una vez más, esta variable parece no ser “predictora” del clima organizacional. La tendencia resultante es tan contundente que poco puede comentarse al respecto, tal como lo muestra el diagrama respectivo. En el caso de la institución educativa, el coeficiente R2 fue de prácticamente 0.80. No tuvieron pesos beta significativos: desempeño, motivación intrínseca y liderazgo. Autonomía se encuentra en la frontera de la significancia (0.078). Por lo tanto, estas cuatro dimensiones no pueden considerarse —en la muestra— predictoras de la escala de clima organizacional total. La tendencia se presenta en el diagrama correspondiente.
0.25
18 Mediciones “clásicas” de srcen distinto a las de la ECOUNI. Por ejemplo, para la variable visión se usó la escala de Anderson y West (1998), para satisfacción el Job Satisfaction Survey, versión en español (Spector, 1997), para motivación la escala de Wang y Guthrie (2004), etcétera.
0.75
1.00
Tabla 8.13 Métodos adicionales de regresión múltiple.19 Método
Breves comentarios
Regresión con varios predictores o variables independientes y más de una dependiente: mínimos cuadrados parciales (MCP) ( partial least squares) y regresión con mínimos cuadrados parciales (RMCP) (partial least square regression)
RMCP aborda el problema de la multicolinealidad computando vectores latentes (semejante a los componentes del análisis de componentes principales), que explican tanto a las variables independientes como a las dependientes. Se trata de un método muy versátil que se utiliza cuando el propósito es predecir más de una dependiente. Combina las características del análisis de componentes principales y la regresión lineal múltiple: la puntuación de las unidades, así como las cargas de las variables se pueden representar en diagramas como en el análisis de componentes, y pueden estimarse las variables dependientes (con un intervalo de confianza) como en la regresión múltiple.
Regresión por componentes principales(RCP) (principal components regression)
En este método, primero las variables independientes son sometidas a un análisis por componentes principales y posteriormente las puntuaciones de las unidades son usadas como predictores en una regresión lineal múltiple estándar.
Regresión de cresta(RC). El término srcinal es ridge regression
Resuelve el problema de la multicolinealidad mediante la adición de una pequeña constante (la cresta) a la diagonal de la matriz de correlación. Esto hace posible el cálculo de las estimaciones de la regresión múltiple.
Análisis de redundancia (AR) (también conocido en inglés como reduced rank regression)
En este modelo, las variables dependientes se someten primero a un análisis de componentes principales y luego se utilizan las puntuaciones de las unidades en una serie de regresiones lineales múltiples, en la cual las variables independientes srcinales se usan como predictores (similar a la regresión por componentes principales pero a la inversa).
Quinto. Se presenta el diagrama de dispersión de la regresión de todo el modelo que explica a la variable
dependiente (recta) (figura 8.21). Un ejemplo del uso de la regresión lineal múltiple la presentan Azen y Budescu (2009, p. 18), quienes la aplicaron para predecir la satisfacción global respecto de la propia vida (criterio o variable dependiente) sobre la base de variables específicas de la satisfacción hacia la vida: salud, finanzas, familia, nación, vivienda, uno mismo y la comida (predictores o independientes). Posteriormente, probaron si la adición de variables que miden valores de los dominios de la satisfacción en la vida (dinero, humildad, amor, felicidad) o variables que medían afecto (frecuencia e intensidad de experimentar afecto positivo y negativo) contribuían de manera significativa al modelo.
0.50
Previamente, se había señalado el reto que implica la multicolinealidad perfecta (cuando una de las variables independientes puede ser predicha por las otras). Para lidiar con este problema se utiliza la regresión con varios predictores o variables independientes y más de una dependiente: mínimos cuadrados parciales . Este y otros análisis derivados de la regresión múltiple se incluyen en la tabla 8.13.
¿Qué es el análisis multivariado de varianza (MANOVA)? Es un modelo para analizar la relación entre una o más variables independientes y dos o más variables dependientes (Ho, 2013; Härdle y Simar, 2012; Godby, 2007). Es decir, es útil para estructuras causales del tipo: 19 No se profundiza en ellos, simplemente se comenta su esencia, porque insistimos, no es el foco del libro. Para ampliar su conocimiento, se recomienda consultar las referencias incluidas en esta sección.
39
40
Capítulo 8Anál isis estadístico. Segunda parte
Metodología de la investigación
Figura 8.22Ejemplos de planteamientos gráficos o modelos en los que el modelo de análisis pertinente es el MANOVA (continuación). X1 Y1 X2
Y2
Yk
Xk
La técnica puede ser utilizada con diversos objetivos, entre los que se destacan: • Evaluar diferencias entre grupos a través de múltiples variables dependientes(medidas por intervalos o
• • • •
razón). La(s) variable(s) independiente(s) es(son) ca tegórica(s) (no métricas). iene el poder de evaluar no solo las diferencias totales, sino diferencias entre las combinaciones de las dependientes. En este sentido representa una extensión del análisis de varianza (ANOVA) para cubrir casos donde hay más de una variable dependiente y/o cuando las variables dependientes simplemente no pueden ser combinadas. En otras palabras, reconoce si los cambios en la(s) variable(s) independiente(s) tienen un efecto significativo en las dependientes. Señala qué grupos difieren en una variable y en el conjunto de variables dependientes. Identificar las interacciones entre las variables independientes y la asociación entre las dependientes. Las tres clases principales del MANOVA son: Hotelling's . Es parecida a la prueba t (dos grupos) pero con más dependientes: una variable independiente dicotómica y varias dependientes. MANOVA unidireccional. Análogo al ANOVA de una sola vía, pero con más dependientes: una variable independiente multicategórica y varias dependientes. MANOVA factorial. Similar al ANOVA factorial, pero con dos o más dependientes: varias in dependientes categóricas y diversas dependientes. En la figura 8. 22, se muestran esquemas de ejemplos donde podría implementarse el MANOVA. Figura 8.22Ejemplos de planteamientos gráficos en los que el modelo de análisis pertinente es el MANOVA. Variable independiente 1: tipo de medicamento (A y B)
Variable dependiente 1: presión arterial
Variable independiente 2: dosis de administración del medicamento (dosis 1, dosis 2 y dosis 3)
Variable dependiente 2: nivel de glucosa
Variable independiente 3: tipo de dieta (dieta 1, dieta 2 y dieta 3)
Variable dependiente 3: nivel de ácido úrico
Variable independiente 1: diseño de las alas de la aeronave (diseño 1 y diseño 2)
Variable independiente 2: diseño de la cola de la aeronave (diseño 1 y diseño 2)
Variable independiente 3: material de fabricación de la aeronave (A y B)
Variable dependiente 1: velocidad máxima
Variable dependiente 2: aceleración
Variable dependiente 3: resistencia al viento
Los modelos del MANOVA tienen en común que forman combinaciones lineales de las dependientes que discriminan mejor entre los grupos en un experimento o una situación no experimental. Es una prueba de significancia de las diferencias entre los grupos en un espacio multidimensional donde cada dimensión está definida por combinaciones lineales del conjunto de variables dependientes. Una pregunta que suele hacer el estudiante al revisar el MANOVA es por qué no hacemos ANOVAS separados, uno para cada dependiente. La respuesta es que las dependientes están correlacionadas muy frecuentemente, por lo cual los resultados de varios ANOVA pueden ser redundantes y difíciles de integrar. He aquí una síntesis de la explicación de Wiersma y Jurs (2008) sobre este tipo de análisis: Al incluir dos o más variables dependientes simultáneamente no se consideran las diferencias entre las medias en cada variable, si no las diferencias en variables canónicas. El i nterés no sólo es saber si los grupos definidos por las variables independientes difieren en las variables canónicas, sino conocer la naturaleza de estas. Una variable canónica es una variable artificial generada a partir de los datos. Representa constructos y se compone de variables reales, las cuales deben ser descritas en términos de variables dependientes. Lo anterior se efectúa por medio de la s cargas de los coeficientes de correlación entre una variable dependiente y una variable canónica. Si una carga entre la variable canónica y la dependiente es positiva y elevada, significa que altos valores en la dependiente se asocian con altos valores en la canónica. Por ejemplo, si una variable dependiente consiste en puntuaciones a una prueba sobre innovación, y dichas puntuaciones se correlacionan en forma considerable con una variable canónica, inferimos que la variable canónica representa un constructo que involucra esencialmente a la innovación. En los cálculos que se hacen en el MANOVA se generan variables canónicas hasta que se encuentra que no hay una diferencia estadística significativa entre las categorías o los grupos de las variables independientes; o bien, hasta que se agotan los grados de libertad de las variables independientes (lo que ocurra primero). El número de variables canónicas no puede exceder el número de variables dependientes, pero es común que el número de estas sea mayor que el de variables canónicas estadísticamente significativas o los grados de libertad. La hipótesis general de investigación en el MANOVA postula que las medias de los grupos o las categorías de la(s) variable(s) independiente(s) difieren entre sí en las variables canónicas. La hipótesis nula postula que dichas medias serán iguales. Se calculan diversas estadísticas para evaluar ambas hipótesis, entre las que se destacan: F (total, toma en cuenta el modelo completo), la prueba Hotelling's T-Square, T2 (cuando hay dos grupos formados por las variables independientes), Wilks' lambda, U (cuando hay más de dos grupos formados por las variables independientes), y Pillai-Bartlett (cuando
41
42
Capítulo 8Anál isis estadístico. Segunda parte
Metodología de la investigación
hay coeficientes canónicos);20 y si resultan significativas en un nivel de confianza, se acepta la hipótesis de investigación de diferencia de medias. Esto i ndica que hay, por lo menos, una variable canónica significativa (pero puede haber varias). Si diversas variables canónicas son significativas, esto muestra que se presentan diferencias en las variables canónicas en cuestión, entre los grupos o categorías de las independientes. Los paquetes estadísticos que contiene el MANOVA suelen posicionar a los grupos de las variables independientes por puntuaciones discriminantes; estas son calculadas con una función discriminante, que es una ecuación de regresión para un compuesto de variables dependientes. A cada grupo se le asigna una puntuación discriminante en cada variable canónica. Las puntuaciones discriminantes de una variable independiente pueden ser cero o tener un valor positivo o negativo. Una puntuación discriminante positiva y elevada para un grupo indica que este se coloca por encima de los demás en la respectiva variable canónica. Además, deben considerarse las cargas, las cuales son positivas o negativas. Las puntuaciones discriminantes se usan para interpretar las separaciones de los grupos en las variables canónicas, en tanto que las cargas se usan para evaluar y ligar los resultados de las variables dependientes (Wiersma y Jurs, 2008). Un ejemplo de las cargas de los coeficientes de correlación entre las variables dependientes y las variables canónicas se muestra en la tabla 8.14, mientras que un ejemplo de las puntuaciones discriminantes se observa en la tabla 8.15. Tabla 8.14Cargas de los coeficientes de correlación entre las variables dependientes y las variables canónicas. VARIABLE DEPENDIENTE
VARIABLES CANÓNICAS I (MOTIVACIÓN INTRÍNSECA)
Motivación intrínseca (escala intrínseca del inventario de características del trabajo)
0.90
Atribuciones internas Sentimientosdeéxitoeneltrabajo Atribuciones externas Productividad
II (ATRIBUCIÓN DE CAUSALIDAD EXTERNA)
III (DESEMPEÑO LABORAL)
0.05
0.86
0.07
–0.07
0.70
0.80 0.03
–0.09 0.00
0.61
0.12
-0.12
0.07
0.74
Eficiencia
0.18
–0.04
0.48
Calidad
0.19
0.13
0.57
Tabla 8.15Puntuaciones discriminantes con cuatro grupos en tres variables canónicas. GR U P O
VA RIABLESCA NÓNICA S I
II
III
Ejecutivos
1.97
0.95
-1.69
Secretarias
-0.19
1.18
1.25
Empleados
1.40
-1.01
-0.49
Obreros
-3.18
-1.12
0.93
Como observamos en la tabla 8.14, se obtuvieron tres constructos subyacentes en las puntuaciones recolectadas de la muestra: motivación intrínseca, atribución de causalidad externa y desempeño laboral. En la tabla 8.15 vemos que los grupos (niveles en la empresa) están separados en las tres variables canónicas (los grupos difieren), particularmente en la primera variable canónica (motivación intrínseca) y los obreros ocupan la posición más baja. Las variables dependientes enmarcadas en un recuadro en la pri20 Además, para comparaciones específicas están las pruebas post hoc del ANOVA, ya revisadas en el capítulo 10 del libro.
mera variable canónica se cargan en ella (tabla 8.14); en consecuencia, los ejecutivos tienen las puntuaciones más altas en motivación intrínseca medida por la escala mencionada. Así se interpretan todas las variables canónicas y dependientes. En el MANOVA se incluyen razones F y análisis de varianza. Algunos paquetes estadísticos agregan una prueba denominada correlación canónica, que es muy similar al MANOVA. Esta es la máxima correlación que llega a obtenerse entre los conjuntos de puntuaciones y las relaciones entre las variables independientes, entre las variables dependientes y entre los conjuntos de ambas (dependientes e independientes) (Kerlinger, 1979). Las variables en el MANOVA y la correlación canónica asumen que las variables dependientes están medidas en un nivel de intervalos o razón. al correlación se interpreta como otras, pero el contexto de interpretación varía de acuerdo con el número de variables involucradas. Para profundizar en la técnica, se recomienda a Capraro (2006).
¿Hay otros métodos multivariados? En la actualidad, disponemos de una gran cantidad de métodos multivariados de análisis, los cuales se desarrollaron con la evolución de la computadora. Los investigadores disponen del análisis discriminante, asociado al MANOVA, pero cuando las variables in dependientes se miden por intervalos o razón y la dependiente es c ategórica. al análisis sirve para predecir la pertenencia de un ca so a una de las categorías de la variable dependiente, sobre la base de varias independientes (dos o más). Se utiliza una ecuación de regresión llamada función discriminante. Por ejemplo, si queremos predecir los votos que obtuvieron dos partidos contendientes (variable dependiente nominal con dos categorías) sobre la base de cuatro variables independientes, aplicaremos el análisis discriminante para resolver una ecuación de regresión; así se obtienen las predicciones individuales. En el ejemplo, hay dos categorías (votar por A o votar por B); por lo tanto, los valores a predecir son 0 y 1 (A y B, respectivamente). Si el sujeto obtiene una puntuación más cercana a cero, se predice que pertenece al grupo que votará por A; si logra una puntuación más cercana a 1, se predice que pertenece al grupo que votará por B. Además, se consigue una medida del grado de discriminación del modelo. Asimismo, se cuenta con el análisis de series cronológicas o de tiempo(para determinar la evolución de los casos en una o más variables a través del tiempo y predecir el comportamiento de las variables o sucesos), la elaboración de mapas multidimensionales(donde establecemos distancias entre casos, basándonos en mediciones múltiples de varias dimensiones o variables) y las ecuaciones estructurales (para predecir relaciones causales y series de tiempos), para los cuales se requieren bases sólidas en materia de estadística y en matemáticas avanzadas. Sugerimos a Härdle y Simar (2012), Abu-Bader (2010), Loehlin (2009), Sengupta (2009), Shaw (2009), Ferrán (2001) y Lehamn et al. (2005) para una revisión de tales pruebas y modelos. ambién se publica una revista fundamental en la materia para ciencias sociales: Multivariate Behavioral Research.
RESUMEN DE LA PRINCIPALES PRUEBAS ESTADÍSTICAS DEL MODELO LINEAL GENERAL Y OTRAS UNIVARIADAS Para terminar lo referente a la estadística multivariada, se presenta la tabla 8.16 que nos muestra las pruebas o técnicas más comunes del modelo lineal general y los elementos que necesitamos considerar para elegir el análisis más apropiado (se incluyen regresión lineal y prueba t). Tabla 8.16Elementos para elegir el análisis más apropiado del modelo lineal general. Pru eba o m étodo
Núme ro de variables dependientes
Regresiónlineal
1
Número de Nivel(es) de medición Nivel(es) de medición variables de la(s) variable(s) de la(s) variable(s) independientes dependiente(s) independiente(s) 1
Intervalosorazón
Intervalosorazón ...continúa
43
44
Capítulo 8Anál isis estadístico. Segunda parte
Metodología de la investigación
Tabla 8.16Elementos para elegir el análisis más apropiado del modelo lineal general (continuación). Prueba o m étodo
Número d e Número de Nivel(es) de medición Nivel(es) de medición variables variables de la(s) variable(s) de la(s) variable(s) dependientes independientes dependiente(s) independiente(s)
Prueba t para muestras independientes
1
Análisisdevarianza
Análisisdecovarianza
Análisis discriminante
Regresiónmúltiple
Análisis multivariado/ múltiple de varianza
1
1
Intervalosorazón
1
Intervalosorazón
Nominaluordinal (intervalos o razón expresados en rangos o categorías discretas: categórica)
1a
Intervalos o razón
Nominal u o rdinal (intervalos o razón expresados en rangos o categorías discretas)
1
Nominaluordinal (intervalos o razón expresados en rangos o categorías discretas)
≥
2
Intervaloso razón
Intervalosorazón (categóricas transformadas en variables dummy)
≥
1
Intervalosorazón
Nominaluordinal (intervalos o razón expresados en rangos o categorías discretas)
1
Intervalos o razón
Nominal u o rdinal (intervalos o razón expresados en rangos o categorías discretas)
2
Intervalosorazón
Nominaluordinal (intervalos o razón expresados en rangos o categorías discretas)
1
Categórica / intervalos o razón
≥
≥
1
1
≥
2
Dicotómica
gl = (n1 + n2) – 2
Intervalos o razón
≥ a
≥
Análisis múltiple de covarianza
1 ≥
2
Correlación canónica
≥
2
≥
Análisis de vías (path)
≥
1
≥ b
Categórica / intervalos o razón
a = Incluye una o más covariables. b = Incluye una o más variables moderadoras/intervinientes/mediatizadoras. Fuente: Roberto Hernández-Sampieri
−
2
s1
n1
Ejemplo Hi: “los varones le atribuyen mayor importancia al atractivo físico en sus relaciones heterosexuales que las mujeres”. Ho: “los varones no le atribuyen más importancia al atractivo físico en sus relaciones heterosexuales que las mujeres”. La variable atractivo físico fue medida a través de una prueba estandarizada y el nivel de medición es por intervalos. La escala varía de 0 a 18. La hipótesis se somete a prueba con los estudiantes de clase media de dos universidades de la ciudad de Monterrey. n1 (hombres) = 128 n2 (mujeres) = 119 Resultados: (hombres) = 15 (mujeres) = 12 s1 (hombres) = 4 s2 (mujeres) = 3 t=
15 − 12
(4) 2 128
+
(3)2 119
Al acudir a la tabla de la distribución t de Student (tabla 2, apéndice 4, incluido en este Centro de recursos en línea), buscamos los grados de libertad correspondientes y elegimos en la columna degl, el renglón ∝, que se selecciona siempre que se tienen más de 200 grados de libertad. La tabla contiene los siguientes valores:
El valor t se obtiene en muestras grandes mediante la fórmula: X1
Una vez calculados el valor t y los grados de libertad, se elige el nivel de significancia y se compara el valor obtenido contra el valor que le correspondería, en la tabla 2 del apéndice 4 de este Centro de recursos en línea anexo ( tabla de la distribución t de Student) o en SAS® Distribución t de Student. Si el valor calculado es igual o mayor al que aparece en la tabla, se acepta la hipótesis de investigación. Pero si es menor, se acepta la hipótesis nula. En la tabla se busca el valor con el cual vamos a comparar el que hemos calculado, con base en el nivel de confianza elegido (0.05 o 0.01) y los grados de libertad. La tabla contiene los niveles de confianza como columnas y los grados de libertad como renglones. Los niveles de confianza adquieren el significado del que se ha hablado (el 0.05 implica 95% de que los grupos en realidad difieran significativamente entre sí y 5% de posibilidad de error). Cuanto mayor sea el valor t calculado respecto al valor de la tabla y menor sea la posibilidad de error, mayor será la certeza en los resultados.
t = 6.698 Gl = (128 + 119) -2 Gl = 245
t CON FÓRMULAS Y TABLAS CÁLCULO DE LA PRUEBA t=
desviación estándar del segundo grupo elevada al cuadrado y n2 es el tamaño del segundo grupo. En realidad, el denominador es el error estándar de la distribución muestral de la diferencia entre medias. Para saber si el valor t es significativo, se aplica la fórmula y se calculan los grados de libertad. Recordemos que los grados de libertad se calculan así:
X2
gl
2
+
s2
∝
n2
En donde es la media del primer grupo, la media del segundo grupo, desviación estándar del primero elevada al cuadrado, n1 es el tamaño del primer grupo,
representa la simboliza la
(mayor de 200)
0.05
0.01
1.645
2.326
Nuestro valor calculado de t es 6.698 y resulta superior al valor de la tabla en un nivel de confianza de 0.05 (6.698 > 1.645). Entonces, la conclusión es que aceptamos la hipótesis de investigación y rechazamos la nula. Incluso, el valor t calculado es superior en un nivel de confianza del 0.01 (6.698 > 2.326).
45
46
Capítulo 8Anál isis estadístico. Segunda parte
Metodología de la investigación
Comentario:efectivamente, en el contexto de la investigación, los varones le atribuyen más importancia al atractivo físico en sus relaciones de pareja que las mujeres.
Masculino
Si tuviéramos 60 grados de libertad y un valor t igual a 1.27, al comparar este valor con los de la tabla obtendríamos:
0.05 1.6707
gl
60
0.01 2.390
El valor t calculado es menor a los valores de la tabla. Se rechaza la hipótesis de investigación y se acepta la hipótesis nula .
CHI CUADRADA MEDIANTE STATS® Y EJEMPLO DE TABLA DE CONTINGENCIA PRODUCIDA POR SPSS CON OTROS ELEMENTOS Para calcular la chi cuadrada en SAS®, primero se elige la opción correspondiente en el menú principal. Después, en cuadrícula colocamos los datos que se nos requiere (número de categorías de cada variable, las de la primera variable que representa a las filas y las de la otra variable que representa las columnas). Supongamos que tenemos las dos variables del ejemplo del capítulo 10, Intención del voto (candidata A Guadalupe orres y candidata B Liz Almanza) y género (masculino y femenino). enemos dos categorías en cada variable, por lo tanto, la Cuadrícula se llenaría así: Filas Columnas
2 2
Damos clic en Aceptar. SAS® abre la tabla y nosotros colocamos las frecuencias observadas o contadas: 40 32
58 130
En el siguiente paso, SAS® nos pide que seleccionemos si los valores esperados están capturados o no. enemos dos opciones: marcar que no (los valores esperados no están calculados) o calcularlos. Si elegimos la primera, simplemente damos clic en Calcular y se nos proporcionan los siguientes resultados: chi-cuadrada y grados de libertad, pero no la significancia. enemos que acudir a la tabla de chi-cuadrada (apéndice 4, tabla 4 de este Centro de recursos en línea o a la de SAS –Valores de x2 a los niveles de confianza de 0.05 y 0.01–). Vemos nuestros grados de libertad y elegimos el nivel. Si es igual o superior al valor de la tabla, implica que chi cuadrada fue significativa dependiendo del nivel seleccionado (de nuevo, 0.05 o 0.01). Si nuestra opción es: calcular los valores esperados están calculados, los obtenemos siguiendo este procedimiento: La frecuencia esperada de cada celda, casilla o recuadro, se calcula mediante la siguiente fórmula aplicada a la tabla de frecuencias observadas. fe
=
(Total o marginal de renglón) (total o marginal de columna) n
En donde n es el número total de frecuencias observadas. Para la primera celda (candidata A y género masculino), la frecuencia esperada sería: fe
Veamos de dónde salieron los números:
=
(98)(72) 27.13 260 =
Total
Género Femenino
98
Intención del voto
Total
72
260
Para este ejemplo, la tabla de frecuencias esperadas sería la tabla 8.17. Tabla 8.17Cuadro de frecuencias esperadas para el ejemplo. Total
Género Masculino Intención del voto
Femenino
Candidata A Guadalupe Torres
27.1
70.9
98
Candidata B Liz Almanza
44.9
117.1
162
72
188. 0
26 0
Total
Se colocan los datos en el SAS® y damos clic en calcular, obteniendo el valor de chi-cuadrada, los grados de libertad y la probabilidad de que los valores observados y esperados sean distintos en porcentaje (si es mayor a 95% es significativo en este nivel, si es mayor a 99% resulta más significativa; recordemos que SAS® proporciona la significancia en términos del porcentaje en nuestro favor). Si se hiciera manualmente, aplicaríamos la fórmula de chi cuadrada: χ
2
=
∑
(0 −
E)
2
E
donde S significa sumatoria. 0 es la frecuencia observada en cada c elda. E es la frecuencia esperada en cada celda. Es decir, se calcula para cada celda la diferencia entre la frecuencia observada y la esperada; esta diferencia se eleva al cuadrado y se divide entre la frecuencia esperada. Finalmente, se suman tales resultados y la sumatoria es el valor de x2 obtenida. Obtenemos el valor de chi cuadrada y los grados de libertad: gl = (r – 1) (c – 1)
En donde r es el número de renglones del cuadro de contingencia y c el número de columnas; en nuestro caso: 1. Y acudimos con los grados de libertad que corresponden a la tabla 4 del apéndice 4 de este Centro de recursos en línea (Distribución de chi cuadrada) o SAS® en “Valores de x2 a los niveles de confianza de 0.05 y 0.01”, eligiendo nuestro ni vel de confianza (0.05 o 0.01). Si nuestro valor calculado de x2 es igual o superior al de la tabla, decimos que las variables están relacionadas (x2 fue significativa). Cabe señalar que en SPSS es más rápido, y en segundo lugar con SAS® y la opción “los valores esperados no están calculados” (porque solamente vemos en la tabla con nuestros grados de libertad si igualamos o superamos el valor). En el capítulo 10 del libro, señalamos que SPSS produce un resumen de los casos válidos y perdidos para cada variable y una tabla de contingencia sencilla, o bien una tabla más compleja con diversos resultados por celda. al es el caso de la tabla 8.18, con el ejemplo de la intenci ón de voto por Guadalupe o Liz y el género (el programa genera aún más, pero hemos reproducido solamente los que son más útiles para el lector en la interpretación de la tabla).
47
48
Capítulo 8Anál isis estadístico. Segunda parte
Metodología de la investigación
Tabla 8.18Ejemplo de la tabla de contingencia producida por SPSS (resumida).
Figura 8.23Secuencia de análisis con Minitab.
Intención de voto por candidato * Género del votante Género del votante Masculino Intención del voto
Candidata A Guadalupe Torres
58
98
Frecuencia esperada
27.1
70.9
98
% dentro de intención de voto % dentro del género del votante % del total
40.8%
59.2%
100.0%
55.6%
30.9%
37.7%
15.4%
22.3%
Frecuenciaesperada
32
130
44.9
117.1
% dentro de intención de voto
19.8%
80.2%
% dentro del género del votante
44.4%
69.1%
%deltotal
Total
Total
40
Frecuencia
Candidata B Liz Almanza
Femenino
Frecuencia
12.3% Frecuencia
Frecuenciaesperada %dentrodeintencióndevoto % dentro del género del votante %deltotal
72 72.0 27.7
50.0% 188 188.0 72.3%
100.0% 27.7%
100.0% 72.3%
37.7% 162 162 100.0% 62.3% 62.3% 260 260 100.0% 100.0%
EJEMPLOS DE SECUENCIAS DE ANÁLISIS EN MINITAB Y SPSS Para completar este capítulo del Centro de recursos en línea y el 10 del texto impreso, incluimos dos ejemplos de secuencias de análisis de los datos.
Secuencia en Minitab Esta secuencia corresponde al ejemplo desarrollado en el texto impreso sobre la televisión y el niño. La secuencia se presenta en la figura 8.23.
• Análisis descriptivo de las columnas o ítems (distribuciones, estadísticas) • Análisis de discriminación de los ítems
Pruebas de tablas de contingencia para correlacionar datos nominales y ordinales; por ejemplo: chi cuadrada y phi entre género y condición de exposición a la televisión (solo/acompañado); coeficiente de contingencia para bloque preferido de horario (nominal) y autonomía en la elección de los programas (ordinal). Biserial puntual (género y tiempo de exposición a la televisión). Prueba t de diferencia de medias por género entre los promedios de tiempo que se dedican a ver televisión diariamente (en horas); entre otros análisis.
100.0%
count): número de casos o frecuencias observadas en cada celda. Frecuencia (esperada Frecuencia ( expected count): número de casos en cada celda que se esperarían, si no hubiera relación entre variables. Porcentajes dentro de cada celda que representan las frecuencias observadas (en relación con una variable, con la otra y con el total). Por ejemplo, la primera celda (intención por candidato A y género masculino = 40), representa 40.8% dentro de la intención del voto del candidato A (marginal horizontal o de su fila = 98), implica 55.6% de los hombres (marginal de su columna = 72), y 15.4% respecto al total (muestra = 260).21 En este caso, el valor de chi cuadrada es significativo al nivel del 0.01, es decir, existe relación entre las variables género e intención de voto por los diferentes candidatos, se acepta la hipótesis de investigación (Liz Almanza gana, pero sobre todo por el voto femenino). Con la tabla se hacen algunas conclusiones, como las que se presentaron en el apartado: ¿Qué otra aplicación tienen las tablas de contingencia?
21 Los valores son redondeados por el programa.
Muestraexploratoria (adicional a la de la prueba piloto para diseñar el cuestionario).
Muestra definitiva (n = 2 112)
Análisis descriptivo de las variables: uso de medios de comunicación colectiva, tiempo de exposición a la televisión, preferencia de contenidos televisivos (programas), bloques de horarios de exposición a la televisión (mañana, media tarde , tarde avanzada y/o noche), personajes favoritos (cuáles y motivos), comparación de la televisión con otras fuentes de entretenimiento, actividades que realiza mientras observa la televisión, condiciones de exposición a la televisión (solo/acompañado), autonomía en la elección de los programas , control de los padres sobre la ac tividad de ver televisión, usos y gratificaciones de la televisión, datos demográficos (géner o, edad, escolaridad, nivel de ingresos familiar, tipo de escuela y estado civil de los padres).
Secuencia en SPSS La secuencia corresponde al estudio respecto al clima organizacional citado en el libro impreso (Hernández-Sampieri, 2005). Objetivo central: • Validar un instrumento para medir el clima organizacional en el ámbito laboral mexicano.
Pregunta de investigación: • ¿Cuáles son las variables o dimensiones más pertinentes que deben incluirse para medir el clima laboral
de una manera válida y confiable? Comentarios sobre los análisis: Los análisis del estudio se llevaron a cabo de manera independiente para cada muestra, debido a la naturaleza contingente del clima organizacional. Cada empresa tiene su propia historia, procesos de producción, estructura, orientación, filosofía y otros factores situacionales que la hacen única. Sin embargo, la validación en diferentes muestras va consolidando y robusteciendo al instrumento de medición. A continuación se presenta la secuencia de análisis y algunos resultados obtenidos en una de las muestras (una institución de educación superior). En la figura 8.24 veremos la secuencia de análisis con el SPSS.
49
50
Capítulo 8Anál isis estadístico. Segunda parte
Figura 8.24Secuencia de análisis con el SPSS.
Metodología de la investigación
Tabla 8.19Los coeficientes alfa para las dimensiones del clima organizacional. D i me n s i ó n
n
Al fa
Moral
176
0.898
Dirección
176
0.928
Innovación
177
0.788
Identificación
175
0.823
Comunicación
179
Percepcióndeldesempeño Motivaciónintrínseca Autonomía
0.827
174
0.709
178
0.792
179
0.827
Satisfacción
179
0.865
Liderazgo
177
0.947
Visión
176
0.902
Tabla 8.20Estadística descriptiva de la muestra para la escala completa del clima organizacional. Estadí st ic a Media Mediana Moda Desviaciónestándar Varianza
Va lor 3.7 3.8 3.96 0.62 0.38
Asimetría
–0.442
Curtosis
–0.116
Mínimo
1.84
Máximo
4.92
Figura 8.25Histograma de toda la escala del clima organizacional en una institución educativa.
La confiabilidad (alfa) del instrumento fue de 0.98 (muy elevada, n = 163). El análisis de factores reveló una dimensión única y después de efectuarlo, se eliminaron tres ítems. Los coeficientes alfa para las dimensiones, fueron los que se muestran en la tabla 8.19. Estadística descriptiva en el nivel de toda la escala: en la tabla 8.20, se presentan las principales estadísticas de los resultados a toda la escala del clima organizacional. El promedio (3.7) y la mediana (3.8) son bastante favorables e indican que esta organización posee un clima organizacional positivo. La respectiva normalización, se presenta en la gráfica de la figura 8.25. Las correlaciones entre los componentes del clima organizacional para esta segunda muestra, se presentan en la tabla 8.21 (matriz de correlaciones de Pearson). La mayoría se encuentra entre rangos que oscilan entre 0.55 y 0.69, es decir, correlaciones medias y considerables. Destacan las correlaciones entre comunicación y dirección (0.800), satisfacción y li derazgo (0.772), satisfacción y visión (0.721), identificación y motivación intrínseca (0.716); así como, moral y liderazgo (0.698). Llama la atención la correlación entre autonomía y motivación intrínseca (0.613), que respalda la tradicional vinculación entre ambos conceptos, propuesta por los modelos sobre características del trabajo. Identificación y liderazgo es de las pocas correlaciones bajas (0.425).
51
52
Capítulo 8Anál isis estadístico. Segunda parte
Metodología de la investigación
Tabla 8.21Matriz de correlaciones de Pearson entre variables del clima organizacional.
4.
para los participantes o la situación). Por ejemplo, en psicología en qué formas un tipo de terapia ayuda a que las personas recuperen su autoestima o procesen mejor un duelo por la pérdida de un ser querido; cómo un nuevo medicamento contribuye a disminuir la tasa de mortalidad de cierta enfermedad crónica o ciertas medidas epidemiológicas preventivas combaten efectivamente la dispersión de un virus; o bien, en ingeniería civil o arquitectura cómo al agregar un nuevo material base, se logra un cambio significativo en la resistencia y flexibilidad de un material de construcción, etcétera. Significancia económica: el valor económico de la intervención o el conocimiento producido (por ejemplo, los estudios sobre los terremotos han ayudado a que se edifiquen construcciones más resistentes a los sismos y se eviten pérdidas humanas —las más lamentables— y el derrumbe de edificios, casas e infraestructura en general).
Los tres primeros tienen una considerable tradición, mientras que el cuarto tipo es poco utilizado en las ciencias sociales (no así en disciplinas vinculadas a la ingeniería y la economía). De acuerdo con Onwuegbuzie y Combs (2010) la significancia económica parte de un índice que abarca el costoefectividad (información acerca de la efectividad de una intervención por nivel de costo), costosbeneficios (contraste), costo-utilidad (proveer información acerca del costo de la intervención versus la utilidad estimada de los resultados y/o productos observables), costo-viabilidad (evaluar si el costo de una intervención se encuentra dentro de las posibilidades presupuestales y los recursos disponibles) y costo-incertidumbre (seguridad de que el costo es menor a la efectividad, beneficios y utilidad, y que tenemos alta certeza de que es viable la intervención). odo calculado en unidades monetarias.
Y FINALMENTE, SE IMPLEMENTAN LOS ANÁLISIS Y SE OBTIENEN LOS RESULTADO: ¿Y AHORA…? Los análisis producen diversas tablas, matrices, números, y a veces el estudiante se pierde entre un “mar” de cifras y valores. Lo más importante, como he insistido en todo el libro, es interpretar los coeficientes y su significancia estadística (¿qué me dicen o señalan respecto de mis hipótesis?). Si una correlación es significativa implica que las variables están vinculadas, si un valor F tiene un nivel estadísticamente significativo, ello implica que los grupos difieren, etc., ¿y esto qué aporta? (responder en el contexto del planteamiento). Pero la significancia estadística no es el único tipo de significancia. Diversos autores [por ejemplo, Onwuegbuzie y Combs (2010) y Hernández-Sampieri y Mendoza (2008)] consideran cuatro tipos de significancia al interpretar los resultados cuantitativos: 1. Significancia estadística: probabilidad de que los valores observados (descubrimientos estadísticos) aporten evidencia en favor de la hipótesis nula o de investigación). 2. Significancia práctica: magnitud del valor observado (una media, una diferencia, una relación, etc.: un promedio alto indica…, un coeficiente bajo señala…). 3. Significancia clínica o de intervención (grado en que la intervención constituye una real diferencia
53
capítulo
9
Elaboración de propuestas cuantitativas, cualitativas y mixtas
¿EN QUÉ CONSISTE LA PROPUESTADE INVESTIGACIÓN? La propuesta, proyecto o protocolo de investigación consiste en un documento que incluye un plan completo para realizar un estudio, en el cual se identifican y articulan las necesidades, estrategias y actividades para llevarlo a buen término. Describe las acciones de investigación que deben ser implementadas y su redacción es en tiempo presente y sobre todo, futuro (se revisará…, se entrevistará a…, se medirá… mediante…, la muestra será…, se pretende analizar…, se contempla efectuar…), con la excepción de la breve revisión de la literatura incluida.
• • •
Las intenciones esenciales de una propuesta
• • •
•
•
Afinar el planteamiento del problema de investigación. Ayudar al investigador a pensar en todos los aspectos del estudio y anticipar retos a resolver. Obtener la aprobación de los usuarios o revisores para realizar el estudio, desde un comité evaluador de tesis hasta un grupo de directivos de una empresa o institución que puede contratar la investigación o un superior que deba autorizarla. Esclarecer las intenciones del estudio (aclarar el panorama). Conseguir recursos o fondos para efectuar el estudio (financiamiento o patrocinio). Lograr permisos para realizar la investigación (acceso a sitios, archivos, documentos y casos; consentimiento de participantes o tutores, etcétera). Demostrar que el investigador o equipo de investigadores se encuentra capacitado para llevar a cabo el estudio. Recibir realimentación de otros investigadores (colegas o pares) para mejorar el proyecto.
¿QUÉ CUESTIONES DEBEMOS TOMAR EN CUENTA CUANDO ELABORAMOS UNA PROPUESTA? Antes de escribir una propuesta o protocolo de investigación es necesario determinar quién o quiénes la leerán o revisarán, esto es, debemos definir con precisión a los usuarios o evaluadores (perfiles, características —edad, nivel académico, profesión, líneas de investigación, etc.—; conocimientos en investigación, su orientación —académica, práctica, comercial—, entre otros elementos) y comprender sus expectativas sobre el estudio. Asimismo, tenemos que establecer por qué este puede ser relevante para ellos. Esta etapa tiene la finalidad de adaptar la propuesta a sus necesidades y requerimientos, ya que ellos serán quienes aprueben si el estudio procede o no (si se acepta como tesis, si se contrata la investigación, si se le asignan fondos, si se admite como tarea del estudiante en un semestre o como parte del trabajo de un profesor, si se autoriza como una de las actividades laborales de un
2
Capítulo 9 Elaboración de propuestas cuantitativas, cualitativas y mixtas
individuo en su organización, si obtiene un premio o reconocimiento, etc.). Por lo general, quienes examinan los protocolos son personas muy ocupadas, con distintas actividades y que deben considerar varias propuestas, por lo que estas tienen que ser claras, sencillas y breves, pero sustanciales. En ocasiones, para presentar el proyecto es necesario completar formatos, formularios o solicitudes (por ejemplo, entesis, en estudios querequieren fondos, en premios, etc.), por lo cual deben seguirse las instrucciones cuidadosamente y cumplirse todos los requisitos (y por supuesto, adjuntar la propuesta). Cualquier propuesta, sea cuantitativa, cualitativa o mixta, debe responder al mismo investigador o investigadora y a los lectores las siguientes preguntas: • • • •
• • • • •
Qué va a ser investigado? (planteamiento del problema: objetivos y preguntas). ¿Por qué y para qué debe investigarse? (planteamiento del problema: justificación). ¿Dónde y cuándo debe investigarse? (contexto). ¿Cómo va a estudiarse? (¿Qué estrategias y métodos se utilizarán para recolectar y analizar los datos? ¿Qué tipo de datos o información queremos recabar?) (método). ¿Qué resultados se pretende obtener? (resultados). ¿De qué manera se validarán los resultados? ¿Cuánto tiempo consumirá la investigación? (calendario o programación de tiempos). ¿Cuánto costará? (presupuesto). ¿Cuál es el valor y las aportaciones concretas del estudio? (planteamiento del problema: justificación).
Para elaborar la propuesta, es recomendable que el investigador o investigadora reflexione respecto de los siguientes tópicos (Creswell, 2013a y Julien, 2008): • • • • •
•
¿Qué necesitan los lectores o evaluadores para entender mejor nuestro tema y planteamiento? ¿Qué tanto conocen los lectores sobre nuestro tema y planteamiento? (a veces es insuficiente). ¿Por qué motivos proponemos el estudio? ¿Por qué ese tema y planteamiento? ¿Cuál y cómo es el contexto de la investigación? ¿Quiénes son las personas que se incluirán en el estudio? (o bien: ¿qué fenómenos, casos o eventos se investigan?). ¿Qué aspectos éticos debemos tomar en cuenta?
¿QUÉ ESTRUCTURA Y CONTENIDOS DEBE TENER UNA PROPUESTA? Lo más lógico es que la estructura y contenidos del protocolo se desarrollen en el mismo orden en que se va a efectuar el estudio (William, utty y Grinnell, 2005). Desde luego, cada institución educativa, empresa, fundación, agencia gubernamental u organización en general tiene sus propios lineamientos, los que deben seguirse para elaborar la propuesta. Sin embargo, expondremos los formatos o esquemas más frecuentes de acuerdo con diversos autores y asociaciones internacionales.
¿QUÉ ESTRUCTURA Y CONTENIDOS DEBE TENER UNA PROPUESTA? Lo más lógico es que la estructura y contenidos del protocolo se desarrollen en el mismo orden en que se va a efectuar el estudio (William, utty y Grinnell, 2005). Desde luego, cada institución educativa, empresa, fundación, agencia gubernamental u organización en general tiene sus propios lineamientos, los que deben seguirse para elaborar la propuesta. Sin embargo, expondremos los formatos o esquemas más frecuentes de acuerdo con diversos autores y asociaciones internacionales.1
1 Los criterios fueron tomados de aspectos comunes de distintas fuentes: National Science
Metodología de la investigación
PROPUESTAS CUANTITATIVAS Para propuestas de estudios cuantitativos se sugiere la estructura general que se muestra en la tabla 9.1. Tabla 9.1 Estructura para propuestas de investigación cuantitativa. Portada Resumen o sumario (a veces en español e inglés) Índice de contenidos Índice de tablas (si aplica) Índice de figuras (si aplica) •
• • • • •
Introducción: Planteamiento del problema de investigación: Objetivos Preguntas Justificación Viabilidad Perspectiva general (enfoque y disciplina desde la cual se aborda el estudio) Perspectiva teórica (enunciarla y comentarla muy brevemente) Hipótesis y variables Definición de términos centrales (conceptuales y operacionales)2 Implicaciones, alcances y limitaciones Antecedentes o revisión de la literatura (marco teórico preliminar)3
•
•
•
•
•
•
•
•
•
Método: Diseño de investigación específico (en el caso de experimentos se describe el tratamiento) Muestra (universo, tamaño de muestra, perfil de participantes o características de casos, unidades o fenómenos, tipo de muestra y técnica de selección) Procedimientos Instrumento(s) y materiales de recolección de los datos Contexto y proceso de recolección de los datos (paso por paso, fechas y lugares) Confiabilidad. Validez. Análisis de los datos (cómo se piensa efectuar y qué pruebas básicas se utilizarán) 4 y resultados preliminares o de pruebas piloto (si se dispone de estos y/o estas) Aspectos éticos que puedan anticiparse Programación de tiempos (calendarización), recursos materiales y presupuesto Equipo de investigación (personas, semblanza muy breve, roles y funciones) Estructura tentativa del reporte (por ejemplo: capítulos de la tesis) Referencias (bibliografía) Apéndices (entre éstos el currículo de los investigadores o semblanza más detallada)
Algunos autores, como Creswell (2013a), consideran que las hipótesis y las preguntas deben ir en el mismo apartado, mientras que otros colocan a la muestra como parte del diseño. Desde luego, ciertas investigaciones no cubrirán todos los elementos o apartados, particularmente las comerciales (en un contexto no académico). Veamos algunos de estos elementos con mayor detalle. 2 Las definiciones operacionales de manera solamente enunciativa (por ejemplo: se utilizará un cuestionario estandarizado que mide…). 3 Para la propuesta o proyecto, la revisión de la literatura es menos intensiva que la del estudio definitivo, por tanto se trata de un marco teórico preliminar o básico. 4 Como se comentará más adelante, el análisis de los datos es concebido por algunos autores como un apartado en sí mismo.
3
4
Capítulo 9 Elaboración de propuestas cuantitativas, cualitativas y mixtas
Además, al igual que con el reporte de investigación (capítulos 11 y 16 del texto impreso), cuando elaboramos la propuesta, aunque nos concentremos en la redacción de un apartado, es indispensable tener en mente el resto de las secciones y asegurar que haya vinculación entre ellas. Para lograr este objetivo, se sugiere a los alumnos que comienzan con sus primeros protocolos que desarrollen una matriz o esquema de congruencia entre las partes del documento antes de presentar la propuesta, a manera de índice (sólo los puntos más relevantes). En particular, deben vincular la introducción, los antecedentes o revisión de la literatura y el método, tarea que se ilustra en la tabla 9.2 y la figura 9.1. Tabla 9.2 Matriz de congruencia entre apartados de la propuesta. Introducción
Planteamiento del problema: Objetivos Preguntas Justificación Perspectiva general (enfoque). Perspectiva teórica. Hipótesis y variables. Definición de términos centrales (conceptuales y operacionales). Implicaciones, alcances y limitaciones. •
•
• •
•
Antecedentes o revisión de la literatura
Revisión de la literatura: ¿quién hizo qué y cómo? (hipótesis y variables presentes en el índice y contenido. Los estudios incluidos deben referirse a ellas). Epistemología (paradigma que sustenta el enfoque). Conexión entre la teoría y el abordaje y método en general. •
•
•
El alcance del estudio debe vincularse con el estado del conocimiento sobre el problema de investigación que revela la literatura
Planeación
Repaso (vinculación entre Recursos materiales. planteamiento, revisión de la Recursos financieros literatura y el enfoque: (presupuesto). cuantitativo, cualitativo o Programación de tiempos mixto). (calendarización). Diseño. Muestra Equipo de trabajo: Procedimientos: personas y funciones. Contexto y proceso de recolección. Instrumento(s) de recolección. Análisis de los datos Fortalezas y retos. •
•
•
•
•
•
•
•
•
•
Los términos incluidos en los objetivos y preguntas deben ser las variables de las hipótesis y tienen que estar definidas.
Método
•
Los términos del planteamiento, que son las variables de las hipótesis, deben estar presentes en el índice y el contenido o desarrollo de la revisión de la literatura; las hipótesis también. Las referencias consultadas deben ser principalmente del enfoque seleccionado.
Las unidades de la muestra deben coincidir con las del planteamiento. El instrumento debe medir las variables de las hipótesis y la revisión de la literatura. El diseño de investigación debe coincidir con el planteamiento y enfoque (no podríamos elegir un experimento si el enfoque es cualitativo, por ejemplo). Los análisis deben ser congruentes con el planteamiento (si éste es cuantitativo correlacional, los análisis deben ser correlaciónales).
Las habilidades del equipo deben coincidir con el enfoque. El presupuesto no debe superar las cuestiones que se plantean en la introducción y el método
Metodología de la investigación
Figura 9.1 Esquema que ejemplifica la congruencia entre los contenidos de la propuesta. Introducción
Planteamiento del problema Objetivo: Determinar el efecto de X1 y X2 sobre Y. Pregunta: ¿X1 y X2 tendrán un efecto sobre Y? Enfoque: cuantitativo. Hipótesis: “X1 y X2 tienen un efecto sobre Y”
Antecedentes
Revisión de la literatura: 1. X1 2. X2 3. Y 4. Efecto de X1 y X2 sobre Y.
Método
Diseño (uno que sea útil para probar el efecto de X1 y X2 sobre Y, por ejemplo un experimento o un diseño no experimental causal)
Planeación
Los investigadores deben tener conocimientos del campo donde se inserta el planteamiento y de estadística.
Muestra: Epistemología: dependiendo del diseño. postpositivista (cuantitativa). Se incluyen referencias de estudios causales sobre la relación entre X1 y X2 y Y.
Instrumento(s) de recolección: cuantitativo…. Análisis de los datos: causal (regresión múltiple).
Variables: X1 X2 Y
Suele ocurrir que un alumno incluye en el planteamiento ciertas variables, como satisfacción laboral, motivación y productividad, pero luego, en la revisión de la literatura integra otros términos, por ejemplo, cultura organizacional. Este enfoque es incongruente. Si el planteamiento no incluye a la cultura organizacional, no debe figurar en los antecedentes. O bien, si el planteamiento menciona el peso, la edad, el estrés y la presión arterial, y en la revisión de la literatura no se encuentra esta última variable sino la diabetes, estamos ante una inconsistencia. odo debe coincidir, estar vinculado. Cuando hay incongruencia, se debe ajustar el planteamiento o la revisión de la literatura. Recordemos que toda la propuesta (o elyestudio) siempre alinea con el planteamiento del problema (fundamentalmente con los objetivos las preguntas dese investigación).
Portada Este elemento incluye, como mínimo, el título de la investigación (en ocasiones es tentativo), el nombre del autor o los autores (investigadores e investigadoras) y su afiliación institucional, así como la fecha en que se elaboró o se presenta la propuesta. Los diseños de las portadas varían de acuerdo con los lineamientos establecidos por el comité u organismo revisor de la autoridad pública o la institución de educación superior correspondiente (en trabajos, tesis y disertaciones), de la empresa o agencia gubernamental (en estudios comerciales o no estrictamente académicos), de la fundación o equivalente (en estudios que solicitan financiamiento), etc., lo cual, en definitiva, depende del contexto en el cual se exponga el proyecto. Es recomendable que tales lineamientos se revisen cuidadosamente antes de iniciar la elaboración de la propuesta. Betkerur (2008) aconseja que el título del proyecto debe ser breve pero informativo, y evitar términos “sensacionalistas” (por ejemplo, el título “Consecuencias psicológicas de la violación en jóvenes adolescentes” es crudo, sensacionalista e indica una nula sensibilidad ante una situación muy delicada). Asimismo, el título no debe ser ni muy corto ni muy largo, y tiene que ser informativo y claro. Por ejemplo, los siguientes títulos son breves pero imprecisos: “Estudio del embarazo ectópico”, “La dinámica de la electricidad”, “El clima organizacional en las empresas peruanas”, “Las preferencias de los consumidores de Montevideo”. Por su parte, “Análisis de la autonomía laboral, la satisfacción en el trabajo, la motivación intrínseca, el compromiso con la empresa, el involucramiento en el trabajo, la cooperación dentro de los departamentos y otros elementos del clima organizacional en cuatro empre-
5
6
Capítulo 9 Elaboración de propuestas cuantitativas, cualitativas y mixtas
sas del giro de la construcción de tamaño mediano ubicadas en el municipio de León, Guanajuato, y su relación con la productividad, la innovación y el trabajo en equipo” es demasiado extenso:. Regularmente en el título no se incluyen nombres de instituciones ni el número de casos que se estudiarán, pero la hipótesis central sí puede ser parte de este (Betkerur, 2008). Le recordamos al lector revisar de nuevo las recomendaciones que se presentaron en los capítulos 11 y 16 del texto impreso.
Resumen El resumen o sumario es muy importante, ya que a veces es la única parte que examinan algunas personas (sea por tiempo, ocupación u otras circunstancias). Por ello, esta sección “debe comunicar por sí mismo la esencia del proyecto de investigación”. Se trata de un apunte conciso de lo que será el estudio. Un buen resumen, que permite al lector entender el proyecto con una “sola mirada” o una revisión rápida, por lo regular contiene el objetivo o la pregunta de investigación central, la justificación abreviada (fundamentalmente en un párrafo), el método o procedimientos y los resultados esperados (de forma sucinta). Betkerur (2008), Tackrey (2005) y Reid (2001) sugieren que esta parte debe contener alrededor de 200 palabras. Otros parámetros para resúmenes en general fueron revisados en el capítulo 11 de la obra (“El reporte de resultados del proceso cuantitativo”).
Índice del reporte o tabla de contenidos Esta sección incluye apartados y subapartados (numerados o diferenciados por tamaño y características de la tipografía). A veces, si resulta pertinente, se agrega un índice de tablas y otro de figuras.
Introducción La introducción y otros elementos, al igual que en los reportes de resultados, varían de acuerdo con el contexto en que se presenta la propuesta, por ejemplo, si es académico o no. En el segundo caso, los protocolos suelen ser más breves y puntuales (por ejemplo, el planteamiento muchas veces se limita a uno o dos párrafos en los que se abarca únicamente el tema específico del estudio y el propósito, objetivo y/o pregunta de investigación primaria, así como la justificación). Solo debemos incluir varios objetivos cuando resulta esencial. Un defecto de diversas propuestas es que contienen seis, siete o más objetivos, lo cual, normalmente, refleja un planteamiento desubicado. La justificación debe responder varias preguntas, entre ellas, ¿por qué es importante el problema de investigación?, ¿por qué debe investigarse? y ¿quién o quiénes beneficiarán los resultados? (Creswell, 2013a). Debemos recordar que la justificación puede apoyarse en motivos teóricos o de conocimiento, metodológicos, sociales o prácticos. Por lo general, se aplican los criterios considerados en el capítulo 3 del texto impreso. ambién, es muy conveniente sustentar el planteamiento con datos, cifras y testimonios. Grinnell, Williams y Unrau (2009) destacan que la justificación debe vincularse con los intereses de los revisores de la propuesta y tiene que atraer su atención. Incluso si sabemos quiénes son, podemos analizar a fondo sus motivaciones y plasmarlas en el protocolo.
Ejemplo Contextoacadémico Objetivo: determinar las causas del incremento en la violencia dentro de las escuelas de educación media en la ciudad.
Contextonoacadémico Objetivo:establecer las razones de la disminución en este año del monto de compras por parte de los clientes con crédito. Otra redacción: conocer las razones de la disminución durante el presente año de las ventas a los clientes que tienen crédito.
Metodología de la investigación
Pregunta de investigación: ¿cuáles son las causas del incremento de la violencia dentro de las escuelas de educación media de la ciudad?
Objetivo:establecer las razones de la disminución en este año del monto de compras por parte de los clientes con crédito. Otra redacción: conocer las razones de la disminución durante el presente año de las ventas a los clientes que tienen crédito.
Justificación: los actos de violencia física en las escuelas de educación media de esta población aumentaron 15% en los últimos cinco años (riñas, asaltos con armas blancas o punzocortantes, asaltos con armas de fuego, agresiones sexuales, asesinatos y otros crímenes). Las instituciones educativas de dicho nivel necesitan reducir la violencia por varios motivos, entre los que pueden destacarse: 1) La integridad y seguridad de los propios adolescentes. 2) El hecho de que la violencia distrae a los alumnos de su actividad esencial: el estudio (la violencia evita que puedan concentrarse en su aprendizaje). 3) El clima de violencia propicia un aumento de otras cuestiones negativas y áreas delictivas, como el tráfico de estupefacientes y el bullying, sólo por mencionar algunas. De acuerdo con diversos estudios (por ejemplo: Lowry et al., 1999; Luengo et al., 1999; Abramovay, 2005; Cowie, Hutson, Jennifer y Myers, 2008; Ramos, 2008; Davidson-Arad, Benbenishty y Golan, 2009; Ramos, 2010; Bonanno y Levenson, 2014), la encuesta “Conducta de riesgo entre la juventud de Utah: 1991, 1993 y 1995”, así como la Encuesta Nacional de Adicciones 2011 (Instituto Nacional de Psiquiatría Ramón de la Fuente Muñiz y Secretaría de Salud, 2012), la violencia
Justificación: la empresa, respecto del año pasado, ha disminuido sus ventas 18% entre los clientes que compran a crédito; incluso, se detectó que participan 20% menos en las promociones y la décima parte de ellos cancelaron su crédito. Es necesario investigar los motivos que han provocado tal descenso. Los clientes que compran a crédito representan la mitad de las operaciones, por lo que, de mantenerse esta caída, la empresa podría enfrentar serios problemas financieros. Resulta indispensable realizar el estudio.
en la escuela está vinculada con disponibilidad consumo de estupefacientes, aunlaen jóvenes que ynoel consumen drogas. Otra investigación de… señala… además… Es necesario desarrollar planes para lidiar adecuadamente con la escalada de violencia en las escuelas de educación media, pero para ello deben conocerse primero las causas… Asimismo, el estudio esclarecerá la relación entre la violencia y el tráfico y consumo de drogas…
Beneficiarios del estudio: las escuelas (profesores, estudiantes, autoridades y padres de familia), los investigadores que analizan la violencia en las escuelas y la drogadicción, y cualquier persona interesada en el tema.
Beneficiarios: es muy obvio, se omite.
La viabilidad en cuanto a conocimientos y habilidades del investigador, tiempo, lugar y presupuesto debe ser explícita. De no ser así, no vale la pena presentar el protocolo, pues constituiría “un suicidio académico, laboral o profesional”. ambién puede ser necesario explicar la perspectiva (enfoque —por ejemplo, experimental— y disciplina desde la cual se aborda el estudio) si el proyecto se presenta en un contexto académico y no resulta obvia. En ámbitos comerciales es común prescindir de ella. Por su parte, las hipótesis son muy relevantes siempre y cuando el proyecto sea correlacional o causal (o se establezca un pronóstico). En todos los casos resulta indispensable explicitar las variables.
7
8
Capítulo 9 Elaboración de propuestas cuantitativas, cualitativas y mixtas
Es ineludible definir conceptual y operacionalmente los principales términos, que generalmente son las variables esbozadas en el planteamiento y contenidas en las hipótesis. Sin embargo, la mención sobre la forma de operacionalizar las variables es muy breve, como ya se mencionó. Por ejemplo: “Para medir la inteligencia se utilizará la escala de Wechsler (WAIS)”; “Con el fin de evaluar el grado de amor romántico se administrará la prueba PM2015”, “La presión arterial se medirá utilizando un esfigmomanómetro (tensiómetro) y aplicando el siguiente procedimiento:….”, “La tensión del cable será valorada mediante el medidor de tensiones digital HCM”, etcétera. Finalmente, como parte de la introducción y con el propósito de dar credibilidad a la propuesta se requiere fijar los alcances y reconocer las limitaciones del estudio. Es muy importante no generar falsas expectativas en los revisores; si las creamos, a largo plazo lo único que provocaremos es nuestro propio descrédito. enemos que ser optimistas, pero a la vez, realistas. la mayoría de las veces los revisores son personas experimentadas y subestimarlos suele ser unaAdemás, de las peores estrategias. Hernández-Sampieri et al. (2013) y Dahlberg, Wittink y Gallo (2010) sugieren que los elementos de la introducción deben tener la siguiente extensión: •
• • •
• • •
Contexto (uno o dos párrafos). Planteamiento (un párrafo para preguntas y otros para objetivos). Enfoque (un párrafo). Justificación (dos o tres párrafos). Incluir argumentos de innovación, importancia y trascendencia. Viabilidad (un párrafo). Implicaciones y próximos pasos (un párrafo). Es decir, una página o máximo página y media para la introducción.
Revisión de la literatura o antecedentes De acuerdo con Grinnell, Williams y Unrau (2009), la revisión de la literatura en una propuesta o protocolo cumple con cinco funciones básicas: a) Asegurar que los revisores o evaluadores entiendan completamente los asuntos o tópicos vincula-
b) c)
d)
e)
dos con el problema de investigación. Dahlberg, Wittink y Gallo (2010) señalan un error común que suele “colarse” en las propuestas: asumir que los lectores están familiarizados con la importancia del problema. Por ello, para no cometer esta equivocación, debemos explicitar su relevancia, sentido y/o necesidad. Indicar las diferencias y similitudes del estudio con otros realizados previamente (diferenciación). Ubicar a la investigación dentro del conocimiento actual en un campo determinado (en este sentido, la revisión de la literatura o antecedentes debe mostrar cómo embona el planteamiento en un área del saber o de la práctica profesional). Describir cómo los resultados contribuirán al campo de conocimiento y/o práctica en la cual se inserta el proyecto (qué dudas resolverá, qué controversias ayudará a esclarecer, cómo avanzará el conocimiento o la tecnología, etcétera). Introducir y conceptuar las variables que serán consideradas en el estudio (e idealmente mostrar relaciones potenciales entre las variables).
Por su parte, Betkerur (2008) señala que la revisión de la literatura permite a los lectores familiarizarse con el problema que se estudiará, describe el trabajo que hicieron algunos colegas tanto a nivel local como internacional en torno al planteamiento del problema y otros planteamientos similares, y ayuda al investigador a comprender las dificultades que enfrentaron tales colegas para poder anticiparlas. Una revisión de la literatura adecuada (enfocada en el planteamiento e hipótesis, y con referencias actuales y útiles) es un buen indicador de que el investigador domina el estado del conocimiento existente sobre su planteamiento. La revisión de la literatura no consiste en una lista de referencias ni resúmenes de estas, ni es una compilación de fuentes que vagamente se refieren al proble ma del estudio, sino que representa la integración de referencias escogidas de manera selectiva para cumplir con las funciones
Metodología de la investigación
señaladas previamente. Es decir, en unas pocas páginas debe comentarse qué estudios se han hecho previamente respecto del problema que se investigará y sus principales hallazgos. Cuando redactamos esta sección tenemos que ser muy directos y breves, evitando dar definiciones largas de conceptos. Se insiste: solo debemos incluir investigaciones previas que han tratado específicamente el problema de interés. Colocar demasiadas referencias (más aún cuando no se vinculan directamente con el planteamiento) puede aburrir al lector y dejar a un lado referencias importantes, además que puede implicar falta de conocimiento sobre un problema o fenómeno (Tackrey, 2005; Williams, utty y Grinnell, 2005). Desde luego, los antecedentes o revisión de la literatura de un protocolo son mucho más breves que los del reporte de resultados y contienen menos referencias. Su tamaño varía de acuerdo a las exigencias de la institución donde se presenta, pero para un trabajo académico estándar o tesis algunos autores sugieren entre Por dos otro y treslado, páginas (porsección ejemplo, et al., es 2013 y Dahlberg, Gallo, 2010). en esta (enHernández-Sampieri la parte de epistemología) importante citarWittink los enfo-y ques alternativos y la razón por la cual se eligió el propuesto sobre otros posibles. Asimismo, resulta vital mencionar las cuestiones epistemológicas, más aún si se trata de un protocolo cualitativo o mixto. Además, se debe señalar por qué resulta una propuesta innovadora. Finalmente (en la parte de conexión entre la teoría y nuestro abordaje) tienen que quedar claros los vínculos entre las preguntas y objetivos, la teoría y los métodos elegidos. Si bien aquí no se presenta todo lo relativo al método (para eso está la siguiente sección), sí debemos incluir uno o dos párrafos que conecten la teoría con nuestro método al final de los antecedentes, lo cual también nos sirve para hilvanar este apartado con el siguiente. ales párrafos no deben ser técnicos, sino descriptivos y generales, pues su propósito es mostrar lo que se va a hacer metodológicamente de acuerdo a la teoría. Dahlberg, Wittink y Gallo (2010) recomiendan incluir un modelo conceptual que muestre cómo nuestra aproximación y planteamiento enmarcan y se relacionan con nuestro diseño, muestra, instrumentos de recolección y análisis de los datos, así como con las maneras como esperamos obtener los resultados e inferencias, y esto (poseer un marco conceptual o modelo) no es algo inconsistente con algún enfoque, ni con el inductivo. Incluso bajo la aproximación cualitativa los usuarios esperan que les proveamos de algún tipo de predicción sobre lo que podemos descubrir o lo que puede emerger. de5 la redacción inicial para párrafos de los antecedentes son los que se muestran en elAlgunos siguienteejemplos recuadro.
“En la literatura referente (vinculada, relacionada, previa…) a nuestro planteamiento se ha encontrado que…. (referencias) y … (referencia)”. “Estudios previos (referencias) han concluido que…” “Los antecedentes nos señalan que… …. (referencias)”… “Investigaciones han dejado en claro… (referencias) …” “Por otro lado, también se ha descubierto (demostrado, destacado, indicado…)… (referencias).” “Además, se ha concluido que…. (referencias)”… “El abordaje (aproximación , enfoque, método…) más utilizado ha sido…” “Nuestro abordaje es diferente en …, … y …” “Regularmente en este tipo de estudios se utiliza un muestreo … (referencias), pero también se ha utilizado un muestreo … (referencias) (como el que se propone en este protocolo)…” “Justificamos nuestra aproximación señalando (destacando, apuntando, comentando) …” “Se propone el uso de … (muestra…, instrumento…, etc.), que ha sido también utilizado por (referencias)…” “El estudio propuesto es consistente con (referencias)…”, “se diferencia en…”
5 Algunos de estos ejemplos ya se mencionaron en el texto impreso.
9
10
Capítulo 9 Elaboración de propuestas cuantitativas, cualitativas y mixtas
Método Creswell (2013a), Mertens (2010), Dahlberg, Wittink y Gallo (2010), además de Williams, utty y Grinnell (2005), coinciden respecto de que en el método se describen con precisión el diseño (cuál y por qué lo elegimos), la muestra (población y sus características principales, unidad de muestreo y/o análisis y su justificación, tipo de muestra y técnica de selección de los casos, así como tamaño) y los procedimientos (instrumento(s) para recabar los datos y materiales, así como cuándo, cómo, dónde y por quién van a ser implementados —periodo, proceso y lugar de recolección—; además, la forma en que se apor6 tará evidencia para la confiabilidad y validez de ellos, incluso si se tienecontemplada una prueba piloto; la manera como se capacitará a quienes levanten datos y se codificará; asimismo, debe argumentarse cómo se asegura el acceso a la información pertinente). En este sentido, los revisores esperan leer detalles sobre el método a fin de evaluar la calidad de las inferencias que se obtendrán del estudio. Creswell (2013a y 2009) agrega en esta sección el análisis de los datos y los resultados preliminares 7 (si es que se efectuó un sondeo previo o estudio exploratorio). Mertens (2010), así como Williams, utty y Grinnell (2005) consideran que el análisis es un rubro o apartado distinto. Pero, finalmente la decisión de cada estudiante respecto de dónde incluirlo se relaciona más con los criterios de su propia institución. Si se trata de diseños experimentales, en los procedimientos debe explicarse con precisión en qué va a consistir el(los) tratamiento(s) (niveles de la variable independiente), el número de grupos involucrados, la manera en que se asignarán los participantes o casos a los grupos, el papel del investigador en el experimento, el tiempo que transcurrirá entre la preprueba, el tratamiento y la posprueba en cada grupo, la forma en que se monitorearán los grupos y el lugar donde se llevará a cabo. En cada rama o disciplina se siguen procedimientos específicos de acuerdo con el planteamiento elegido. En torno al análisis de los datos, Mertens (2010) y Williams, utty y Grinnell (2005) incluyen: •
Plan para procesar los datos: codificación, programa estadístico y pruebas estadísticas que se efectuarán (para cada hipótesis o variable; si no hay hipótesis, para cada pregunta de investigación y variable).
•
La forma (no en que análisis o los vincularán consino el planteamiento del problema y las hipótesis bastaelmencionar las análisis pruebas se que se aplicarán, establecer la relación y el tipo de resultados visualizados). Dahlberg, Wittink y Gallo (2010) recomiendan agregar hacia el final del método un párrafo que explique las fortalezas y retos de la investigación, que incluya una descripción de los métodos alternativos que pueden considerarse y por qué el método elegido representa la mejor aproximación al planteamiento del problema, o bien, cómo serán enfrentadas las amenazas potenciales al proyecto y a la capacidad de llevarlo a cabo. Este fragmento les demuestra a los usuarios o revisores que hemos anticipado problemas, obstáculos y cuestionamientos. Asimismo, se deben mencionar con honestidad las limitaciones del estudio, lo cual es muy valorado por todo investigador.
Aspectos éticos que puedan anticiparse Es necesario exponer de manera clara una actitud de respeto a los aspectos éticos implicados en el estudio (por ejemplo, confidencialidad, anonimato y todos los que se trataron en el capítulo 2 de este centro de recursos en línea). 8 En algunos casos se requerirá presentar la autorización de algún comité de ética y el consentimiento de cierto grupo o institución (por ejemplo, asociación de padres de familia de una escuela, departamento de salud municipal, sindicato, etcétera). 6 Por ejemplo: “se utilizará el coeficiente alfa-Cronbach para evaluar la confiabilidad de la escala”. “La validez de contenido se establecerá mediante un muestreo aleatorio del universo de dimensiones respecto a la variable de interés que ha sido considerado por los autores más relevantes durante los últimos 10 años”, “la validez de criterio se analizará midiendo la construcción ‘______’, que, de acuerdo con la teoría, está sumamente relacionada con la variable que nos incumbe”. “La validez de constructo se revisará a través del análisis de factores”… 7 En ocasiones se presentan proyectos de varias etapas, de las cuales alguna ya fue desarrollada y se dispone de datos iniciales. 8 Recordemos las palabras de Roberto Hernández Sampieri: “La investigación sin ética carece de sentido. El conocimiento no debe construirse nunca sobre el perjuicio de alguien”.
Metodología de la investigación
Programación de tiempos (calendarización) y presupuesto Este apartado debe contener una tabla de tiempos, calendarización o programación detallada de las acciones que se prevé realizar, tal como se ejemplificó en el capítulo 6 de este centro de recursos en línea: “Encuestas”.9 Por un lado, se colocan las acciones y, por el otro, los periodos. Se recomienda que al enunciar las tareas, se busque un balance entre lo general y lo exageradamente específico. Por ejemplo, una programación que incluya rubros demasiado globales como: • • • • •
Revisión de la literatura. Método. Recolección de los datos. Análisis de los datos. Elaboración del reporte resulta poco práctico, así como lo es detallar en exceso, por ejemplo:10
1. Revisión de la literatura. 1.1. Consultar en internet las bases de datos.
1.1.1. Consultar ERIC. 1.1.2. Consultar Psychological Abstracts. 1.1.3. Consultar Sociological Abstracts. 1.2. Consultar en la biblioteca de la universidad. 1.2.1. Buscar a través de la red interna. 1.2.2. Buscar en los estantes. 1.3. Localizar las referencias. 1.4. Obtener las referencias. 1.5. Revisar cada referencia. 1.5.1. Revisar el resumen. 1.5.2. Revisar el método. 1.5.3. Revisar los resultados. 1.6. Seleccionar las referencias apropiadas (recientes y vinculadas al planteamiento). 1.7. Acudir con profesores expertos en el tema. 1.7.1. Profesores del departamento. 1.7.2. Profesores de otros departamentos. 2. Método. 2.1. Enfoque.
2.1.1. Reflexionar cuál es el enfoque más apropiado para el estudio. 2.1.2. Decidir el enfoque más apropiado. 2.2. Contextualizar la investigación…
Este enfoque también es inadecuado.
9 Desde luego, en tal capítulo el ejemplo se refiere a las etapas que se llevan a cabo en una encuesta. 10 Perdón si parece exagerado, pero hemos visto ejemplos de este tipo.
11
12
Capítulo 9 Elaboración de propuestas cuantitativas, cualitativas y mixtas
Así, los periodos pueden ser días (si la investigación insume menos de un mes), semanas (si la duración del proyecto es de dos o más meses), meses (si se emplearán años para completar el estudio). Por ejemplo: PERIODOS ACCIONES
Semana 1
S em a n a2
S em …
S em …
Se m … S
em…
Semana K
Acción 1 Acción 2 Acción … Acción … Acción K
Lo importante de una tabla de tiempos es saber cuándo se inicia cada etapa y cuándo concluye (Tackrey, 2005). Asimismo, debe ser realista. Con respecto al presupuesto, este es necesario cuando se solicitan fondos para la investigación o se trata de un estudio comercial (en tesis o trabajos no financiados es muy raro que se agregue). Se puede presentar primero el monto total y luego el desglose de los rubros más importantes, para agregar en un apéndice una separación detallada. O bien, primero el desglose de los rubros y posteriormente el total. A veces los recursos son en unidades monetarias (euros, pesos, dólares, colones, soles, quetzales, bolívares, etc.), otras veces en especie (computadoras, programas de análisis, oficinas, entre otros) o en ayudas concretas (alumnos que contribuyan, permisos, etc.). Lo más adecuado para presentar el presupuesto es informarse sobre la manera en que lo solicita el comité revisor en cuestión. De acuerdo con Te National Science Foundation (2014), algunos conceptos que pueden integrar el presupuesto son: •
•
Costos directos (relacionados con el proyecto en sí como salarios, equipo permanente, viáticos, mantenimiento del equipo, servicios subcontratados, cargos de publicaciones, etcétera). Costos indirectos (que no repercuten directamente en el proyecto: contabilidad, mantenimiento de edificios, administración del proyecto, etcétera).
Para proyectos complejos recomendamos acudir a National Science Foundation (2014) y realizar 11 consultas en la página de Banco Mundial (http://www.bancomundial.org/).
Otros rubros Al final del protocolo o propuesta se debe incluir: a) El índice tentativo de lo que sería el reporte final de resultados (la tesis, disertación o informe), el cual
regularmente se excluye en el caso de protocolos comerciales. b) Las referencias o bibliografía, de acuerdo con los criterios que se comentaron en los capítulos 4, 11 y
16 del libro impreso, siguiendo un estilo editorial de publicaciones [ver también en este mismo centro de recursos en línea —sección “Manuales auxiliares”— los manuales APA, AMA y Vancouver y el documento “Indicaciones para la elaboración de un manuscrito srcinal” (sobre investigación académica-científica)]. Además, recuerde la herramienta que para ello representa el programa SISI®, incluido en el apartado “Software”
c) Los apéndices, que varían en función del tipo de proyecto de que se trate (entre estos, el que resulta
ineludible en la mayoría de los casos es la hoja de vida o el resumen curricular del investigador o investigadores —cuando mucho media cuartilla, en el que se destaquen conocimientos y habilidades 11 Banco Mundial publica frecuentemente guías para diferentes clases de proyectos, entre ellos de investigación (buscar por palabras clave como “guía”, “proyectos de investigación” y “términos de referencia”.
Metodología de la investigación
asociadas al estudio— y, en ocasiones también la estructura funcional del equipo de trabajo). Entre los apéndices pueden incluirse mapas del lugar donde se realizará una encuesta, un instrumento de medición ya validado al medio en que se va a aplicar, una fotografía del lugar en el cual se efectuará el experimento, una figura donde se presenta el equipo de medición, etc. Estos elementos se agregan solo si son requeridos o anticipamos que su presentación tendrá un efecto favorable. Te National Science Foundation (2014) recomienda que de cada investigador se incluyan: grados académicos, logros en el campo de la propuesta (publicaciones, productos, desarrollos tecnológicos, etc.), proyectos previos e historia laboral o de investigación resumida. Finalmente, la propuesta debe convencer los revisoresdelque podemos llevar alos cabo el estudio de manera exitosa. Por ello es necesario destacar laaexperiencia equipo, mencionar trabajos previos que fueron culminados adecuadamente por este y que la relación entre los miembros es cordial. Si han colaborado en proyectos previos de manera conjunta mencionar qué proyectos y los resultados (un párrafo por publicación, trabajo o colaboración). No es necesario mencionar proyectos de hace más de cinco años, sino solo aquellos que hayan culminado en una publicación o hayan sido reconocidos. Idealmente, en cada párrafo se debe incluir una oración que explique cómo cada trabajo preliminar soporta nuestra actual propuesta (Dahlberg, Wittink y Gallo, 2010).
¿QUÉ SUGERENCIAS PUEDEN HACERSE PARA ELABORAR UNA PROPUESTA? Algunas recomendaciones para elaborar una propuesta o protocolo son las siguientes: •
•
•
•
•
•
Siempre se debe tener en mente quiénes son los receptores, usuarios, evaluadores, revisores o lectores de la propuesta o estudio: ¿de qué campos o disciplinas provienen?, ¿qué trabajos han rechazado y por qué? (Dahlberg, Wittink y Gallo, 2010). Por ello, el documento debe adecuarse a su definición y características. Por ejemplo, si los revisores tienen una formación básicamente cualitativa y nuestra propuesta es cuantitativa, pensemos si debemos incluir algo cualitativo que facilite su evaluación positiva. Si presentamos un estudio organizacional a antropólogos, consideremos incluir algunos antecedentes antropológicos del estudio de las organizaciones. Si el protocolo debe presentarse ante un comité académico, la revisión de la literatura es más extensa que si se tuviera que exponer ante un comité de una organización que puede otorgar fondos o un comité de adquisiciones de una empresa. Revisar otras propuestas que hayan sido autorizadas por el mismo comité ante el cual vamos a presentar la nuestra y analizar los elementos que incluyeron, incluso, de ser posible, conversar con sus autores (Creswell, 2013a). El mismo tratamiento debe darse a propuestas que fueron desechadas. enemos que determinar los criterios reales de aceptación-rechazo. Diversos metodólogos, como Grinnell, Williams y Unrau (2009), sugieren redactar en tercera persona, aunque la American Psychological Association (2002, p. 34) recomienda que, cuando nos referimos a nosotros mismos, seamos directos. Por ejemplo, si en la frase “El experimentador instruirá a los participantes” el sujeto “el experimentador” se refiere a usted mismo, la confusión es obvia y podría interpretarse como que usted no tomará parte en su propio estudio. En lugar de ello, utilice un pronombre personal (yo) o escriba el verbo conjugado en primera persona del singular: “Instruiré a los participantes”. En las propuestas cuantitativas la redacción es más formal que en las cualitativas, puesto que en estas últimas los sentimientos y pensamientos del investigador son un componente importante. Utilice el mismo lenguaje y formato que usa el organismo, agencia, universidad o institución en la cual va a presentar la propuesta (por ejemplo, algunos hablan de objetivos generales y específicos, mientras que otros piden nada más objetivos o les denominan propósitos). La propuesta debe ser inteligible por sí misma, sin que requiera presentación, pues a veces se entre-
13
14
Capítulo 9 Elaboración de propuestas cuantitativas, cualitativas y mixtas
•
•
• • •
•
ga simplemente a revisión o no hay tiempo para explicarla. Las ideas claves deben ser resaltadas (para evitar que los revisores tengan que buscarlas en un texto denso y largo). Grinnell, Williams y Unrau (2009) aconsejan no incluir anécdotas respecto de los motivos de nuestro interés por el estudio, a menos que sean importantes, llamativas e inusuales (por supuesto, es necesario mencionar los motivos o las razones para elegir el planteamiento). Resulta muy importante señalar los límites geográficos, poblacionales y temporales del proyecto. Anticipar críticas y respuestas hostiles. Como ya se comentó, la propuesta debe mantener una característica a lo largo de todas sus secciones: congruencia. Aunque varias personas contribuyan a elaborarla, al final, una debe revisar el estilo y unificarlo, además de asegurar que todas las partes detalles sí (y correspondan entre secciones). Cada página debe ser revisada y ytodas las encajen seccionesentre o apartados deben incluir un párrafo introductorio y otro de cierre que vincule las secciones entre sí (estos párrafos que concluyen los apartados deben contener mucho significado o contundencia). Como señalan Dahlberg, Wittink y Gallo (2010, p. 796), “debemos ver el bosque, pero también cada árbol”. Revise visualmente la propuesta de varias maneras: vista de varias páginas, vista 50%, vista 100% de zoom, vea en paralelo las secciones. Ligue ideas entre párrafos de cada apartado. De acuerdo con Te National Science Foundation (2014) y Tackrey (2005), las principales razones por las que se rechazan las propuestas (en particular cuando se solicita financiamiento) son: El problema de estudio no es lo suficientemente importante o no proporciona información novedosa o útil. El problema es sumamente local y con pocas aplicaciones. El planteamiento es muy general. La propuesta abarca demasiados elementos, resulta muy complicada y poco operativa. O bien, no es realista. La propuesta es ambigua, lo cual impide comprenderla. La propuesta parece hecha con rapidez o premura (apresuradamente), sin reflexión. El protocolo está incompleto. La justificación no es sólida. El proyecto contiene errores (por ejemplo, se señalan procedimientos estadísticos inapropiados para las hipótesis). El investigador es percibido como inexperto o digno de poca confianza. Los resultados, beneficios y efectos son vagos o imprecisos. Las referencias son obsoletas. En el documento se cometen diversos errores de ortografía. No se respetan los lineamientos solicitados por el comité para un protocolo.
•
Obtener realimentación de colegas, profesores y tutores es esencial antes de presentar el proyecto. Pero ella debe ser específica: en lugar de comentarios generales que no nos ayudan mucho, debemos buscar que nos revisen la claridad del planteamiento, la solidez de los argumentos y si el enfoque es el adecuado.
PROPUESTAS CUALITATIVAS Las propuestas para estudios cualitativos comparten la mayoría de los elementos o apartados de las propuestas cuantitativas, por lo que nos centraremos más bien en sus diferencias. Desde luego, el formato cualitativo posee una estructura menos estandarizada y su desarrollo suele implicar mayor flexibilidad. Creswell (2013a), Mertens (2010) y Grinnell, Williams y Unrau (2009) sugieren los rubros que se muestran en la tabla 9.3.
Metodología de la investigación
Tabla 9.3 Estructura de propuestas de investigación cualitativa. Portada Resumen o sumario (a veces en español e inglés) Índice de contenidos Índice de tablas (si corresponde) Índice de figuras (si corresponde) •
• • •
• •
Introducción: Planteamiento del problema de investigación: Objetivos Preguntas Justificación Viabilidad Perspectiva general (enfoque y disciplina desde la cual se aborda el estudio) Perspectiva teórica (enunciarla y comentarla muy brevemente) Encuadre o marco de referencia: feminista, fenomenológica, investigación-acción, etc. (enunciarlo y comentarlo muy brevemente; debe ser consistente con el diseño principal) Conceptos/términos centrales (variables promisorias) que se pretenden analizar Implicaciones, alcances y limitaciones Antecedentes o revisión de la literatura (marco teórico preliminar)
• • • • •
• • • •
• • •
Método o procedimientos: Principales premisas de la investigación cualitativa (breve) Diseño principal. Contexto (ambiente, sitio, evento, hecho) Periodo aproximado que tomará el estudio (aunque sabemos que es tentativo) Muestra inicial y perfilar una muestra final (unidad de muestreo y/o análisis —descripción y perfil—, procedimiento de selección de participantes o casos —objetos, documentos, observaciones, etcétera—) Procedimientos de recolección de los datos Proceso de recolección de los datos (pasos) Instrumento(s) y una brevecredibilidad, descripción)transferencia, fundamentación, aproximación, capacidad de Estrategias para(mención lograr dependencia, otorgar significado, representatividad de voces y confirmación Equipo de trabajo: número y estructura funcional (roles) Papel o rol del investigador “Coreografía” del análisis de los datos Aspectos éticos que puedan anticiparse Programación de tiempos (calendarización), recursos materiales y presupuesto Equipo de investigación (personas, semblanza muy breve, roles y funciones) Estructura tentativa del reporte (por ejemplo: capítulos de la tesis) Referencias (bibliografía) Apéndices (entre éstos el currículo de los investigadores o semblanza más detallada)
Con respecto a la portada, el resumen y el índice, no hay nada nuevo para agregar, pues las propuestas cualitativas suelen sujetarse a los mismos lineamientos que las cuantitativas. En la introducción ya sabemos que los objetivos y preguntas regularmente son más generales, pero deben redactarse con claridad. La justificación debe responder también ciertas preguntas: ¿por qué es importante el problema de investigación? (su significancia), ¿por qué debe investigarse? y ¿quién o quiénes se benefician con los resultados? Además, de nuevo, apoyarnos en datos o cifras y testimonios resulta muy adecuado. Hay autores que hasta incluyen alguna breve historia de vida para ilustrar la magnitud de un problema (por ejemplo, en el caso de un estudio como el de Morrow y Smith, 1995, sobre el abuso sexual, puede ayudar un testimonio verdadero).
15
16
Capítulo 9 Elaboración de propuestas cuantitativas, cualitativas y mixtas
Sandelowski y Barroso (2003) sugieren la siguiente estructura de los objetivos del estudio: objetivo inmediato, importancia de este, objetivos y resultados a largo plazo y relevancia de ellos. La viabilidad del planteamiento en cuanto a experticia y habilidades del investigador, así como tiempo, lugar y presupuesto también debe ser explícita. Asimismo, al igual que los protocolos cuantitativos, la perspectiva puede ser necesaria si el proyecto se presenta en un contexto académico y no es obvia. En este caso es aconsejable comentar si el encua12 dre es feminista, etnográfico, fenomenológico, hermenéutico, interaccionista simbólico, etcétera. La revisión de la literatura también juega un papel vital en la propuesta cualitativa, pero es necesario consultar referencias realmente significativas y vinculadas de manera directa al planteamiento del problema y de índole cualitativa. Grinnell, Williams y Unrau (2009) señalan que vale agregar, además 13
de la revisión de la literatura, un marco conceptual que abarque: a) Hipótesis (si es que pueden elaborarse, pues debemos recordar que gran parte de los estudios cualitativos no prueban hipótesis sino que las generan y otros las esbozan en términos más amplios). b) Variables o conceptos (tentativos, ya que en las investigaciones cualitativas normalmente no preestablecemos todas las variables o conceptos de interés, sino que más bien emergen de los datos. En diversas ocasiones ni siquiera se han conceptualizado, pues lo que se tiene en mente son áreas de exploración). c) Definición de términos centrales o claves (que más bien son descripciones generales y están sujetas a la experiencia en el campo. Por ejemplo, podemos definir para un estudio etnográfico el concepto de cultura y sus componentes, pero al introducirse en una cultura específica pueden florecer otros elementos). Recordemos que son los participantes quienes nos proporcionan las definiciones. El apartado de método o procedimientos comprende, desde luego: •
• • •
•
• •
•
El diseño o abordaje básico, el cual va ligado al marco interpretativo (etnográfico, fenomenológico, teoría fundamentada, investigación-acción, etcétera). El contexto inicial (ampliamente descrito y con la debida explicación de por qué fue elegido). El periodo aproximado de recolección de los datos (como sabemos es relativo). La muestra inicial (principalmente los participantes o casos –descritos ampliamente–, el método de muestreo, una estimación tentativa de la muestra final, un tamaño aproximado, elemento que, sabemos, puede variar). El método o los métodos de recolección de los datos (entrevistas, grupos de enfoque, etc.). Este subapartado abarca los medios de registro de los datos (videograbación, audiograbación, notas, bitácora). Equipo de trabajo (personas y funciones). Los modos en que se pretende incrementar la dependencia, credibilidad, transferencia, fundamentación, aproximación, capacidad de otorgar significado, representatividad de voces y confirmabilidad (por ejemplo, si se va a efectuar triangulación de datos, si se consultará con colegas alguna cuestión, si se efectuarán análisis exhaustivo de datos negativos, si se obtendrá realimentación de participantes, entre otros). En el caso de transferencia puede especularse sobre los contextos o situaciones a los cuales les serán útiles los resultados. “Coreografía” del análisis de los datos (la forma en que se analizarán, quién o quiénes harán las transcripciones y de qué manera, qué programa de análisis computacional se utilizará como apoyo —Atlas.ti, NVivo, etc.—, cómo se llevará la bitácora de análisis, etcétera).
12 Para considerar los principales marcos interpretativos cualitativos ver Savin-Baden y Major (2013); Lichtman (2013); Merriam (2009); Álvarez Gayou (2003) y Sandín (2003); pero sobre todo las siguientes enciclopedias: The Sage Encyclopedia of Qualitative Research Methods 2008 y Encyclopedia of Case Study Research 2009 (ambas publicadas por SAGE). 13 Algunos autores incluyen este marco en la introducción y otros en la revisión de la literatura. Lo importante es agregarlo si resulta pertinent 14 Un ejemplo lo sería un arqueólogo, ¿puede saber cuándo descubrirá ciertos vestigios que está decidido a encontrar?, ¿acaso Howard Carter pudo predecirle a Lord George Carnarvon (quien financiaba su trabajo) cuánto tiempo le tomaría encontrar una tumba de un faraón del antiguo Egipto y a quién pertenecería?, ¿podía saber que sería la tumba del rey Tutankhamen o Tutankamón? Desde luego, en ciertos casos es más fácil de prestablecer. En estudios con financiamiento se solicitan fechas precisas y entonces debemos ajustarnos a ellas.
Metodología de la investigación
El resto de los apartados es similar a las propuestas cuantitativas, pero en los protocolos cualitativos se resalta en todo el documento el papel del investigador (Creswell, 2013a; Marshall y Rossman, 2011; Merriam, 2009 y Wiersma y Jurs, 2008). La calendarización es un elemento importante, aunque sabemos que debe ser flexible o que se requiere de un gran esfuerzo para cumplir con los tiempos. A continuación mostramos un ejemplo parcial de una programación de un estudio cualitativo (sólo lo referente a la recolección y análisis de datos, por cuestiones de espacio, pero lo importante es que se comprenda su utilidad). Figura 9.2 Ejemplo parcial de una tabla de tiempos o cronograma. Tabla de tiempos o cronograma Actividades
Semana 1
Semana 2
S e m a na 3
S e m a na 4
S e m a na 5
Se m a na 6
Desarrollo de la guía de tópicos y prueba piloto Reclutamiento de los participantes en sesiones Realización de los grupos de enfoque Transcripción de 18 sesiones Análisis de los datos Elaboración de reportes
PROPUESTAS PARA INVESTIGACIONES MIXTAS15 Aún no hay un acuerdo entre los autores sobre cómo debe integrarse una propuesta o protocolo correspondiente a un estudio mixto. Sin embargo, con base en consideraciones a este respecto de Creswell (2013a); Johnson y Christensen (2012); Hernández Sampieri y Mendoza (2012 y 2008) y Creswell y Plano Clark (2007), se propone la estructura que se presenta en la tabla 9.4. Tabla 9.4 Estructura para propuestas de investigación mixta. Portada Resumen o sumario (a veces en español e inglés) Índice de contenidos Índice de tablas (si corresponde) Índice de figuras (si corresponde) •
• •
• •
Introducción: Los métodos mixtos (breve explicación: definición general, premisas fundamentales, sus bondades o ventajas principales y perspectiva general) Los métodos mixtos y ____________ (el problema o tópico abordado) Planteamiento del problema de investigación: Objetivos: cuantitativos, cualitativos y mixtos Preguntas: cuantitativas, cualitativas y mixtas Justificación del planteamiento y del uso de métodos mixtos Viabilidad Perspectiva general (disciplina desde la cual se enfoca el estudio) Implicaciones, alcances y limitaciones
15 Antes de leer este apartado se recomienda la revisión del capítulo 17 del texto impreso: “Los métodos mixtos” y de ser posible, también el capítulo 12 de este centro de recursos en línea.
17
18
Capítulo 9 Elaboración de propuestas cuantitativas, cualitativas y mixtas
Antecedentes o revisión de la literatura (marco teórico preliminar) • • •
•
•
•
Método o procedimientos: Diseño mixto (DEXPLOS, DEXPLIS, DITRAS, etcétera) Contexto (ambiente, sitio, evento, hecho) Rama, fase o aproximación cuantitativa: Diseño específico (por ejemplo, experimento, encuesta, etcétera) Muestra (universo, tamaño de muestra, perfil de participantes o unidades, tipo de muestra y técnica de selección) Recolección de los datos: pasos e instrumentos Confiabilidad y validez Análisis de los datos (incluyendo software) Rama, fase o aproximación cualitativa: Diseño específico principal (por ejemplo, teoría fundamentada, investigación, acción…) Muestra (inicial y perfilar una muestra final): unidades, participantes o casos de análisis (descripción y perfil), procedimiento(s) de selección de participantes o casos Recolección de los datos: pasos e instrumentos Dependencia, credibilidad, transferencia, fundamentación, aproximación, capacidad de otorgar significado, representatividad de voces y confirmabilidad Análisis de los datos (incluyendo software) Aproximación mixta: Tipo de integración en la recolección y análisis de los datos (conversión, mezcla, integración en una misma base de datos, análisis por separado y comparación posterior, etcétera) Productos de la integración (matrices, bases de datos, esquemas, etcétera) Análisis mixtos Programas de cómputo que se utilizarán para la integración Papel o rol del investigador en ambas fases o aproximaciones Aspectos éticos que puedan anticiparse Programación de tiempos (calendarización), recursos materiales y presupuesto Equipo de investigación (personas, semblanza muy breve, roles y funciones) Estructura tentativa del reporte (por ejemplo: capítulos de la tesis) Referencias (bibliografía) Apéndices (entre éstos el currículo de los investigadores o semblanza más detallada)
Desde luego, se trata de un esquema general, puesto que no es lo mismo un diseño de conversión completa (donde se cuantifican datos cualitativos y simultáneamente se cualifican datos cuantitativos, y además se integran bases de datos cuya fuente es tanto cuantitativa como cualitativa) que un diseño incrustado básicamente cuantitativo con un componente menor cualitativo (por ejemplo, un experimento en el cual se les administra a los participantes una “batería” de pruebas estandarizadas y se les entrevista en profundidad). En este segundo caso, el protocolo podría ser el de la tabla 9.5. Tabla 9.5 Ejemplo de la estructura de una propuesta de investigación mixta de un diseño anidado concurrente de modelo dominante (DIAC). Portada Resumen o sumario (a veces en español e inglés) Índice de contenidos Índice de tablas (si corresponde)
• • •
Índice de figuras (si corresponde) Introducción: Los métodos mixtos Los métodos mixtos y ____________ (el problema o tópico abordado) Planteamiento del problema Objetivos y preguntas de la investigación: Del estudio general
Metodología de la investigación
Del experimento De la recolección y análisis de datos cualitativos Justificación del planteamiento y del uso de métodos mixtos Viabilidad Perspectiva general (disciplina desde la cual se enfoca el estudio) Implicaciones, alcances y limitacione • •
Antecedentes o revisión de la literatura (marco teórico preliminar) • •
• • • •
• •
• •
Método: Diseño incrustado concurrente de modelo dominante (DIAC) Diseño experimental (grupos, participantes –perfil y selección–, tratamiento, método de asignación de los participantes a los grupos) Contexto (ambiente, sitio,pasos evento, hecho) Recolección de los datos: e instrumentos (cuantitativos y cualitativo) Confiabilidad y validez de los datos cuantitativos Dependencia, credibilidad, transferencia, fundamentación, aproximación, capacidad de otorgar significado, representatividad de voces y confirmabilidad de los datos cualitativos Análisis de los datos (cuantitativos y cualitativos) Aproximación mixta (comparación de datos CUAN y CUAL, triangulación de datos, análisis de casos extremos) Uso de SPSS, Atlas.ti, NVivo y STATS® Papel o rol del investigador en ambas fases o aproximaciones (como experimentadores, los investigadores solo observarán y…., …. los investigadores realizarán entrevistas en profundidad buscando…) Aspectos éticos que puedan anticiparse Programación de tiempos (calendarización), recursos materiales y presupuesto Equipo de investigación (personas, semblanza muy breve, roles y funciones) Estructura tentativa del reporte (por ejemplo: capítulos de la tesis) Referencias (bibliografía) Apéndices (entre éstos el currículo de los investigadores o semblanza más detallada)
Algo fundamental de una propuesta para un estudio mixto es que en la introducción (de manera muy breve, dos o tres párrafos) y en la revisión de la literatura (con mayor amplitud) se explique cómo ha sido abordado el planteamiento del problema por investigaciones mixtas previas. En las propuestas mixtas correspondientes a diseños secuenciales, concurrentes y anidados se describen de manera individual el método cuantitativo y el cualitativo, pero debemos señalar en que forma(s) la fase o parte cuantitativa se relaciona con la cualitativa (específicamente en los primeros: cómo los resultados de una etapa informarán a la otra etapa subsecuente —por ejemplo, si primero implementamos grupos de enfoque y luego una encuesta, habremos de indicar la forma en que las categorías y teoría fundamentada emergentes servirán de base para el diseño del cuestionario y los análisis estadísticos, además cómo el muestreo cualitativo se aprovechará para la estrategia de muestreo cuantitativo—).
PROPUESTAS PARA ESTUDIOS DE CASO Yin (2013) sugiere que los protocolos de estudios de caso deben tener la estructura que se presenta en la tabla 9.6, la cual no requiere mayor explicación, pues la mayoría de los conceptos ya fueron comentados al hablar de las propuestas cuantitativas y cualitativas. Tabla 9.5 Estructura para propuestas de estudios de caso. Portada Resumen o sumario (a veces en español e inglés) Índice de contenidos Índice de tablas (si corresponde) Índice de figuras (si corresponde)
19
20
Capítulo 9 Elaboración de propuestas cuantitativas, cualitativas y mixtas
•
• • •
• •
Introducción: Planteamiento del problema de investigación: Objetivos Preguntas Definición del caso (descripción del caso, ubicación en términos del lugar y tiempo, y descripción del contexto en las dimensiones que interesan, ya sea política, social, económica, laboral, empresarial, médica, etcétera) Justificación Viabilidad Perspectiva general (enfoque y disciplina desde la cual se aborda el estudio) Perspectiva teórica (enunciarla y comentarla muy brevemente) Hipótesis y variables Definición de términos centrales (conceptuales y operacionales) Implicaciones, alcances y limitaciones Antecedentes o revisión de la literatura (marco teórico preliminar)
• •
• • •
• •
Antecedentes del caso: Origen Historia del caso (generalmente de forma cronológica) Método o procedimientos: Diseño (de un solo caso o múltiples casos, cuando se trata de experimentos se describe el tratamiento) Acceso al caso (personas que deben localizarse y contactarse) Procedimientos de recolección de los datos Instrumento(s) Proceso de recolección de los datos Confiabilidad (o sus correspondientes cualitativos) Validez (o sus correspondientes cualitativos) Análisis de los datos (cómo se piensa efectuar y qué pruebas básicas se utilizarán) 16 Resultados preliminares (si se dispone de estos). Aspectos éticos que puedan anticiparse Programación de tiempos (calendarización), recursos materiales y presupuesto Equipo de investigación (personas, semblanza muy breve, roles y funciones) Estructura tentativa del reporte (por ejemplo: capítulos de la tesis) Referencias (bibliografía) Apéndices (entre éstos el currículo de los investigadores o semblanza más detallada)
DIFÍCILMENTE HAY PROPUESTAS PERFECTAS Después de haber revisado este capítulo, muchos estudiantes y profesores seguramente pensarán que elaborar una propuesta con todos los apartados, los elementos y las características presentadas resulta algo muy complejo. En parte tienen razón. Hemos tratado de mostrar el ideal de una propuesta según los autores más destacados. Pero no todas las propuestas contienen todos los apartados, pues cada quien elegirá los que requiera, de acuerdo con los lineamientos que solicite el comité o individuo de su institución o empresa, cliente u organización, al cual se presentará el proyecto. Ahora bien, cuando uno desarrolla una propuesta es necesario esforzarse al máximo y cubrir esos aspectos. Sin embargo, muy difícilmente una propuesta es “perfecta”, de inicio porque los evaluadores o revisores son seres humanos y, por lo tanto, sus percepciones varían (lo que a unos les puede resultar “genial”, a otros les puede parecer una “simplicidad”); además, siempre tendremos el factor tiempo en nuestra contra. Asimismo, al terminar una propuesta invariablemente nos quedará la sensación de que falta “algo”, lo que es normal. 16 Como se comentó, el análisis de los datos es concebido por algunos autores como un apartado en sí mismo.
Metodología de la investigación
De igual forma, los requerimientos y las exigencias de un protocolo de una disertación doctoral son mayores que los que exige un protocolo a nivel de maestría, y estos se encuentran por encima de los que se solicitan a nivel de licenciatura o para un trabajo de una materia o asignatura.
Extensión de la propuesta La extensión de cada sección de la propuesta depende del planteamiento del problema y las características propias del estudio, así como de los lineamientos de la institución que la solicita y el contexto (académico-no académico). Diversas agencias y universidades solicitan entre 10 y 15 páginas. Los institutos de salud de Estados Unidos, por ejemplo, piden 12 páginas (Dahlberg, Wittink y Gallo, 2010). Algunos autores consideran que cada sección debe tener, aproximadamente, las siguientes extensiones: 17 Introducción: 1-2 páginas. Antecedentes: 5-6 páginas. Método: 2-3 páginas. Planeación: 3-4 páginas. • • • •
Desde luego, no es una regla ni mucho menos. Nos ha tocado trabajar propuestas para organismo internacionales en las que se solicita sean de hasta 100 páginas por la cantidad de rubros que deben incluirse. En Iberoamérica, a nivel de licenciatura, entre 8 y 10 páginas es un estándar bastante común.
Pendiente de la obra impresa Finalmente y para concluir, en el capítulo 11 del libro, por cuestiones de espacio, no se incluyó el índice del trabajo de Meza y Hernández-Sampieri (2005), ejemplo que se desarrolló durante la segunda parte. Ahora se reproduce junto con el índice de tablas (sin páginas, por supuesto, para simplificarlo).
EL ABUSO SEXUAL INFANTIL Índice 1. INTRODUCCIÓN 1.1 DESCRIPCIÓN DEL PROBLEMA 1.2 REVISIÓN DE LA LITERATURA 1.3 ORGANIZACIÓN DEL DOCUMENTO 2. DESCRIPCIÓN DEL MÉTODO DE INVESTIGACIÓN 2.1 PARTICIPANTES 2.2 PROCEDIMIENTO 3. ESCALA COGNITIVA 3.1 DESARROLLO 3.2 RESULTADO DE LAS MEDIDAS PSICOMÉTRICAS 3.2.1 Confiabilidad 3.2.2 Análisis de sensibilidad al cambio
17 Por ejemplo, Hernández Sampieri et al. (2013), Dahlberg, Wittink y Gallo (2010).
21
22
Capítulo 9 Elaboración de propuestas cuantitativas, cualitativas y mixtas
4. ESCALA CONDUCTUAL 4.1 DESARROLLO 4.2 RESULTADO DE LAS MEDIDAS PSICOMÉTRICAS 4.2.1 Confiabilidad 4.2.2 Validez convergente 4.2.3 Análisis de sensibilidad 4.2.4 Análisis por grupo de edad 5. RESULTADOS DE CORRELACIONES ENTRE ESCALAS 6. DISCUSIÓN REFERENCIAS BIBLIOGRÁFICAS APÉNDICES
A. PROGRAMAS DE PREVENCIÓN DEL ABUSO SEXUAL INFANTIL: MÉTODOS, ALCANCES Y CONTENIDO B. CKAQ-R C. WHAT IF SITUATION TEST (WIST) D. ROLE PLAY PROTOCOL (RPP) E. TALKING ABOUT TOUCHING EVALUATION PROGRAM F. CKAQ-ESPAÑOL G. RP-MÉXICO H. EVALUACIÓN DE LA PREVENCIÓN DEL ABUSO (EPA) ÍNDICE DE TABLAS
Tabla 1. Incidencia del abuso sexual infantil. Tabla 2. Definición operacional y conceptual de las variables involucradas en la hipótesis. Tabla 3. Descripción de los grupos experimentales. Tabla 4. Semejanza de distribución de CKAQ-Español en test-retest por ítem. Tabla 5. Estadística descriptiva en el test y retest de instrumentos conductuales. Tabla 6. Correlación test-retest de instrumentos conductuales. Tabla 7. Descriptivos Wilcoxon en test-retest de instrumentos conductuales. Tabla 8. Confiabilidad interna para los instrumentos conductuales. Tabla 9. Estadística descriptiva en instrumentos conductuales. Tabla 10. Promedio de rangos en instrumentos conductuales. Tabla 11. Frecuencias relativas al promedio general en instrumentos conductuales. Tabla 12. Porcentajes de rangos relativos con respecto al grupo que termina un PPASI. Tabla 13. Promedios de rangos por grupo experimental “Al terminar un PPASI” y “Control” en instrumentos conductuales. Tabla 14. Resumen descriptivo de puntajes por escala y grupo experimental. Tabla 15. Razón de proporcionalidad con respecto al grupo que termina un PPASI. Tabla 16. Razón de proporcionalidad de grupo experimental a su correspondiente de CKAQ-Español.
Metodología de la investigación
23
capítulo
10
Parámetros, criterios, indicadores y/o cuestionamientos para evaluar la calidad de una investigación
INTRODUCCIÓN Tal como lo señalamos a lo largo de toda la obra impresa y otros capítulos de este centro de recursos en línea: no existe la investigación perfecta, como tampoco hay un ser humano perfecto (la perfección constituye un estándar ideal). Por tanto, en cualquier estudio siempre tendremos limitaciones. En la realidad es lo común y resulta imposible evitarlas cien por ciento. Sin embargo, ¿hasta dónde podemos decir que un estudio es razonablemente digno de ser considerado?, ¿qué elementos debemos tomar en cuenta para evaluar una investigación? Las respuestas son complejas y se han generado varios criterios para analizar la calidad de un estudio, aunque cabe enfatizar que actualmente existedeben un consenso general ni un acuerdo definitivo entre los autores de metodología sobrenocuáles contemplarse. Pero lo anterior no debe “paralizarnos” y, por ello nos atrevemos (con el riesgo que esto implica) a presentar una propuesta de estudios cuantitativos, cualitativos y mixtos, que ha sido revisada y ampliada por diversos metodólogos, investigadores y docentes de distintas disciplinas (desde humanidades hasta campos administrativos y sociales, ciencias de la salud, ingenierías, etcétera) de prácticamente todo Iberoamérica. En primer término se expone un marco de referencia para los tres enfoques a la investigación. Posteriormente, se muestran cinco listados de criterios agrupados por rubros que representan las fases del proceso investigativo. El primero aplica fundamentalmente a investigaciones cuantitativas y se generó durante el periodo comprendido entre 1995 y 2012 por profesores que enseñan metodología de la investigación en diferentes universidades iberoamericanas, y algunos de sus criterios se han incluido en la página web o manuales del instructor en ediciones anteriores a esta obra (Metodología de la investigación, 6ª edición). El segundo, también básicamente para estudios cuantitativos, fue una adecuación sobre el trabajo de Fischer (2005) y con elementos de Gerring (2011). El tercero, más bien para indagaciones cuantitativas, constituye una adaptación de diferentes autores en la materia. El cuarto se fundamenta en Hernández Sampieri y Mendoza (2012) para investigaciones cualitativas y es producto de las investigaciones aportaciones demixtas diversos metodólogos. quinto esy una propuesta para evaluar y se cimienta enFinalmente, Hernández elSampieri Mendoza (2012) y los principales autores de métodos mixtos como Creswell (2014 y 2013a); O’Cathain (2010); Onwuegbuzie y Johnson (2008) y Tashakkori y Teddlie (2008b). Los listados pueden servir a manera de sistema de verificación (checklist) o rúbricas. Incluso, cada lector podrá elegir de los distintos listados los criterios que considera apliquen a su estudio.
2
Capítulo 10 Parámetros, criterios, indicadores y/o cuestionamientos para evaluar la calidad de la investigación
¿Por qué establecer criterios para evaluar un estudio? Esta pregunta parecería muy obvia, los profesores y tutores necesitan parámetros o indicadores para evaluar los trabajos regulares de investigación que les presentan sus alumnos y revisar tesis; quienes otorgan financiamiento para estudios o los contratan, también los precisan, al igual que los usuarios. Pero además de ello, hemos de señalar que los criterios de evaluación proporcionan una guía a los investigadores sobre la manera de proceder, un lenguaje común y dirección para el desarrollo de cualquier indagación (O’Cathain, 2010). Asimismo, el propio investigador requiere de mecanismos de autoevaluación antes de presentar el estudio efectuado. Los criterios tienen cierto grado de subjetividad, ya que, como se ha señalado, la objetividad total no existe; pero al menos nos conducen a revisar de manera reflexiva cualquier estudio.
Un marco de referencia para los criterios de evaluación de estudios cuantitativos, cualitativos y mixtos En los capítulos de la obra impresa y los del centro de recursos en línea se trataron diferentes temas y realmente de ellos podríamos extraer los criterios para evaluar cualquier clase de investigación y encuadrarlos en un marco de referencia que nos oriente sobre cuáles son los principales que han sido considerados por los metodólogos más leídos en los últimos cincuenta años. Pero esta labor ya la hicieron Leech, Dellinger, Brannagan y Tanaka (2010), quienes desarrollaron un esquema al cual llaman “elementos de la validación de constructo” y que los incluye. Este diagrama se presenta en la figura 10.1, de la página 3, y ha sido simplificado y adaptado, pensando en los estudiantes que se introducen en la investigación. Como se ve en la figura 10.1, el marco de referencia inicia en la revisación básica de la literatura y los elementos fundamentales del planteamiento y concluye en las consecuencias del estudio. A continuación se presentan los listados.
INVESTIGACIÓN CUANTITATIVA 10.1 1 oFigura enfoque.
Marco de referencia con los principales criterios para evaluar una investigación por aproximación
La tabla 10.1 aplica principalmente a estudios cuantitativos y cabe señalar que cada elemento de cualquier rubro se califica del cero al diez, donde 0 implicaría el valor más bajo y 10 el más alto. La escala es perceptual y ciertamente tiene un grado de subjetividad debido a los matices (no son valores absolutos sino muy relativos). Para estudiantes que comienzan con sus estudios iniciales o docentes que imparten una materia de investigación por primera vez, recomendamos valores dicotómicos o binarios: 1=sí cumple, logra o está presente, sí se demuestra, etc.; 0=no cumple, no logra, no está presente (o sus equivalentes).
Rubro: planteamiento del problema Rango: máximo 90, mínimo cero (con dicotomías 9 y 0 respectivamente) Elemento,indicadorofactor 1.
Comprensión del propósito de la investigación
2.
Comprensión de la redacción de los objetivos de investigación
3.
Comprensión de la redacción de las preguntas de investigación
4.
Precisión de objetivos
5.
Delimitación del problema de investigación
6.
Concordancia entre objetivos y preguntas de investigación
Escala
2
1 Este listado fue producto de presentaciones que los autores han realizado en más de 25 países y por cuestiones de espacio resultaría sumamente difícil incluir a todos los docentes e investigadores que han aportado factores o elementos. Se utilizan ficando cali cada uno en una escala del cero al 10. 2
Recordemos: del cero al 10, donde cero implicaría el valor más bajo y 10 el más alto.
Metodología de la investigación
Figura 10.1 Marco de referencia con los principales criterios para evaluar una investigación por aproximación o enfoque (continuación) Elemento,indicadorofactor
Escala
7.
Justificación de la investigación por al menos dos razones (desarrollo de conocimiento, aportaciones a teorías, solución de situaciones prácticas o problemáticas sociales, resolución de controversias, aportaciones metodológicas, etcétera)
8.
Inclusión de datos estadísticos válidos y actuales, así como de testimonios de expertos confiables que contribuyan a enmarcar el problema y justificarlo
9.
Relevancia del producto de la investigación (reporte, desarrollo tecnológico,
2
invento, etc.)
Figura 10.1 Marco de referencia con los principales criterios para evaluar una investigación por aproximación o enfoque. Fundamentos (elementos vitales) ¿Qué preconcepciones, sesgos, conocimiento previo y/o teorías pasan inadvertidas al investigador (tácitas) relacionadas con el significado de los datos? ¿La revisión de la literatura y la perspectiva teórica son apropiadas al planteamiento del problema de investigación? ¿La revisión de la literatura se considera adecuada y de calidad? ¿La evaluación y síntesis de la literatura es comprensible, adecuada, relevante, reflexiva, etcétera? ¿La literatura nos ayuda a construir el propósito, el método (diseño, muestra y procedimientos), los análisis y las inferencias?
Elementos tradicionales cuant itativ os
!
Elementos mixtos de evaluación de
evaluación Relacionados c on el mé t odo Validez interna Validez externa Generalización a la población Realismo (validez ecológica) Rela ciona dos c on la me dición Validez de contenido Validez de rostro Validez de criterio (concurrente y predictivo) Validez de constructo (estructura interna) Rela cionado c on las in f er e ncias Validez inferencial (estadística)
Calida d de l dise ño (transparencia, idoneidad, adecuación, fidelidad) Calidad de la muest ra (adecuación) L egitimidad (en la integración de la muestra, minimización de debilidades, la secuencia de las fases, la conversión de los datos, el balance o proporcionalidad entre las ramas, las múltiples fuentes de datos; así como legitimidad interna-externa, paradigmática y política Ri g or inter pr et ativ o (consistencia teórica e interpretativa, acuerdo interpretativo, interpretación distintiva y eficacia en la integración)
Consistencia inter
Elementos tradicionales cualitativos de evaluación Criterios primarios (dependencia, credibilidad, transferencia y confirmación, fundamentación, aproximación, representatividad de voces y capacidad de otorgar significado)
Otros elementos y términos utilizados (consistecia, autenticidad, integridad, congruencia, sensibilidad, reflexividad, creatividad...)
Técnicas para lograr la calidad de los datos, su análisis y establecer inferencias (triangulación, auditoría de pares, chequeo de participantes, estancia prolongada en el campo...)
na
¿Las inferencias son consistentes con la teoría y experiencias, la revisión de la literatura, el planteamiento, el diseño, el método y los análisis y los vínculos entre estos elementos? ¿En qué medida el enfoque metodológico elegido maximiza la información disponible necesaria para responder al planteamiento del problema? ¿Hay un enfoque más apropiado para abordar el planteamiento?
Utili zación
¿Con qué frecuencia, profundidad y amplitud pueden utilizarse los resultados y productos del estudio? ¿Quiénes pueden usarlos?
Consecuencias
¿Cuáles son las consecuencias sociales, políticas y de conocimiento de los resultados y productos de la investigación? ¿Tales resultados y productos aportan al conocimiento y el desarrollo de la teoría? ¿Qué tan adecuados son éstos para lo sociedad?
3
4
Capítulo 10 Parámetros, criterios, indicadores y/o cuestionamientos para evaluar la calidad de la investigación
Rubro: revisión de la literatura o marco teórico Rango: máximo 80, mínimo cero Elemento,indicadorofactor 1.
Revisión de autores destacados en el campo o campos de conocimiento en los cuales se inserta el problema de investigación
2.
Inclusión de una o más revisiones del estado del arte y/o metaanálisis en dicho campo o campos
3.
Utilización de bancos de datos o bibliográficos más importantes en las áreas de conocimiento abarcadas por el problema de investigación (por lo menos uno y de
4.
Escala
ser posible los tres más importantes) Inserción de referencias recientes (tres o menos años)
5.
Presentación de estudios que apoyan las hipótesis de investigación y de los que las refutan (si es el caso)
6.
Vinculación lograda entre el planteamiento y la revisión de la literatura o marco teórico
7.
Ubicación en la literatura de las deficiencias o huecos de conocimiento respecto al planteamiento del problema
8.
Revisión del planteamiento del problema a raíz de la revisión de la literatura
Rubro: alcance(s) de la investigación Rango: máximo 30, mínimo cero Elemento,indicadorofactor 1.
Identificación del alcance inicial del estudio (exploratorio, descriptivo, correlacional y/o explicativo)
2.
Congruencia entre el alcance inicial y el planteamiento del problema revisado a la luz de la revisión de la literatura
3.
Pertinencia del alcance para el planteamiento del problema
Escala
Rubro: hipótesis Rango: máximo 100, mínimo cero Elemento,indicadorofactor 1.
Grado en que la(s) hipótesis sea(n) comprensible(s) para otros colegas o lectores
2.
Grado en que la relación planteada entre las variables sea lógica
3.
Grado en que la relación planteada entre las variables sea consistente (o congruente)
4.
Precisión de las definiciones conceptuales
5.
Grado en que las definiciones conceptuales son comprensibles para otros colegas o lectores
6.
Precisión de las definiciones operacionales
7.
Grado en que las definiciones operacionales son comprensibles para otros colegas o lectores
8.
Congruencia de las hipótesis con los objetivos y preguntas de investigación
9.
Identificación de variables susceptibles de medir, evaluar, diagnosticar y/o analizar
10.
Congruencia entre las hipótesis (si hay más de una)
Escala
Metodología de la investigación
Rubro: diseño de investigación Rango: máximo 80, mínimo cero Elemento,indicadorofactor 1.
Descripción completa del diseño y sus componentes
2.
Adecuación del diseño de investigación al planteamiento del problema
3.
Adecuación del diseño de investigación a la realidad y contexto
4.
Congruencia del diseño con la(s) hipótesis
5.
Congruencia del diseño con el alcance inicial
6. 7.
Factibilidad de aplicación del diseño Resolución de obstáculos que plantee el diseño
8.
Control de las fuentes que puedan invalidar la aplicación del diseño
Escala
Rubro: muestra Rango: máximo 80, mínimo cero Elemento,indicadorofactor 1.
Precisión con que se delimite el universo de estudio
2.
Claridad y precisión con las cuales se defina la unidad de muestreo
3.
Claridad y precisión con las cuales se defina la unidad de análisis (si es diferente a la de muestreo)
4.
Claridad y precisión con que se defina la muestra
5.
Grado en que la muestra es adecuada al enfoque del estudio
6.
Grado en que se conoce la probabilidad de los elementos del universo para formar parte de la muestra
7.
Grado en que la muestra es representativa del universo (tamaño y nivel de
8.
Escala
confianza-error) Grado de semejanza entre las estadísticas descriptivas (y distribuciones) de las variables demográficas de la muestra y las del universo (género, edad, ocupación, estado civil, nivel socioeconómico, etcétera) Aplica sólo si se dispone de tales estadísticas del universo o población
Rubro: recolección de los datos Rango: máximo 150, mínimo cero Elemento,indicadorofactor 1.
Elección apropiada del lugar de recolección de los datos u obtención de información
2.
Elección apropiada del momento de recolección de los datos u obtención de información
3.
Capacidad del investigador para adaptarse al momento de recolección de los datos u obtención de información
4.
Capacidad del investigador para adaptarse al lugar de recolección de los datos u obtención de información
5. 6.
Explicación del contexto en que ocurrió la recolección Capacitación adecuada del personal que obtuvo los datos o la inf ormación
7.
Grado de supervisión por parte del investigador en la recolección de los datos o información
8.
Poder de medición o evaluación (en gran medida determinado por la utilización de distintas formas o métodos de evaluación o medición)
Escala
5
6
Capítulo 10 Parámetros, criterios, indicadores y/o cuestionamientos para evaluar la calidad de la investigación
Elemento,indicadorofactor 9.
Confiabilidaddelinstrumentooinstrumentos
10.
Evidencia sobre la validez de contenido del i nstrumento o instrumentos (muestreo de dimensiones)
11.
Evidencia sobre la validez de “rostro” o “de cara” del instrumento (face validity) (revisión de expertos)
12.
Evidencia sobre la validez de criterio (ya sea concurrente o predictiva)
13. 14.
Evidencia sobre la validez de constructo Evidencia sobre la validez convergente-discriminante (que se vincula con la validez de constructo)
15.
Elaboración de una bitácora del proceso de recolección de la información (opcional y muy vinculado al quinto elemento o criterio: explicación del contexto en que ocurrió la recolección)
Escala Unpuntoporcada10 décimas del coeficiente de confiabilidad o correlación
Rubro: preparación de los datos o información para su análisis Rango: máximo 50, mínimo cero Elemento,indicadorofactor 1.
Revisión con respecto a si están completas y de acuerdo con lo programado: las respuestas, mediciones, ejemplares del instrumento de medición o equivalentes de la investigación
2.
Número de errores en la codificación (hoy en día debe ser nulo o no superar 1%, ya que al analizar los datos podemos identificarlos)
3.
Existencia de un respaldo para los datos codificados en la matriz
4. 5.
Preparación adecuada de la información para su análisis o evaluación Posibilidad de que la información o los datos sean analizados o evaluados por otros investigadores
Escala
Rubro: análisis de los datos Rango: máximo 90, mínimo cero Elemento,indicadorofactor 1.
Congruencia de los análisis elegidos con los objetivos y preguntas de la investigación
2.
Congruencia de los análisis elegidos con las hipótesis de la investigación
3.
Congruencia de los análisis con el diseño de investigación
4.
Aplicación completa de los análisis requeridos para los datos
5.
Utilización de un paquete o programa computacional confiable para los análisis o evaluaciones
6.
Descripción de las razones por las cuales se llevaron a cabo los análisis o las evaluaciones practicadas
7. 8.
Interpretación adecuada de las e stadísticas descriptivas Interpretación adecuada de los análisis para la prueba de hipótesis (resultados de las pruebas, valores y significancia estadística)
9.
Integración adecuada entre distintos análisis (coherencia y vinculación entre resultados)
Escala
Metodología de la investigación
Rubro: veracidad en la interpretación de resultados Rango: máximo 60, mínimo cero Elemento,indicadorofactor 1.
Presentación de los resultados obtenidos tal como se dieron (evitar ocultar información y no distorsionar los datos ni presentar parcialmente los resultados)
2.
Grado en que se distinguen con claridad cuáles fueron las interpretaciones e inferencias del investigador
3.
Grado en que los resultados están apoyados por la evidencia de los datos y análisis
4.
Medida en que se pueden generalizar a la población los resultados obtenidos en la muestra
5.
Grado en que la información y los datos son suficientes para considerar que las inferencias resultan sólidas.
6.
Grado en que se respetaron las premisas o requisitos de cada prueba o método estadístico
Escala
Rubro: discusión Rango: máximo 120, mínimo cero Elemento,indicadorofactor 1.
Inclusión de un resumen de los resultados generales como un “todo” (holísticamente)
2.
Consistencia de las inferencias finales con el planteamiento
3.
Consistencia de las inferencias finales con la experiencia
4.
Consistencia de las inferencias finales con la teoría
5.
Consistencia entre las inferencias finales
6.
Inclusión de c onclusiones
7.
Inclusión de sugerencias y recomendaciones
8.
Inclusión de aportaciones, alcances y fortalezas del estudio
9.
Ubicación final de la investigación dentro del ámbito del estudio del planteamiento del problema
10.
Inclusión de las limitaciones de la i ndagación
11.
Inclusión de nuevos rumbos y directrices que deben tomarse o seguirse respecto a la investigación sobre el problema e hipótesis planteadas
12.
Sugerencia de nuevas líneas de investigación
Escala
Rubro: redacción del documento final o reporte de resultados Rango: máximo 110, mínimo cero Elemento,indicadorofactor 1.
Grado en que los resultados y descubrimientos respondieron al planteamiento del problema
2.
Grado en que las conclusiones están soportadas en los datos
3.
Grado en que la discusión al final del trabajo es congruente con los resultados y descubrimientos
4.
Ortografía
5.
Sintaxis
Escala
7
8
Capítulo 10 Parámetros, criterios, indicadores y/o cuestionamientos para evaluar la calidad de la investigación
Elemento,indicadorofactor 6.
Claridad en la redacción
7.
Coherencia interna del documento
8.
Inclusión de índices o tablas de contenidos
9.
Inclusión de resumen
10.
Elaboración adecuada de citas y referencias en el texto (siguiendo un estilo aceptado de publicación, por ejemplo: APA, Vancouver, AMA…)
11.
Elaboración adecuada de citas y referencias en la bibliografía o listado de referencias (siguiendo un estilo aceptado de publicación)
Escala
Rubro: diseño gráfico del reporte (elementos deseables) Rango: máximo 80, mínimo cero Elemento,indicadorofactor 1.
Selección e inclusión apropiada de tablas, esquemas, gráficos, dibujos e imágenes
2.
Inclusión de tablas, cuadros y figuras de acuerdo con un estilo aceptado de publicación (por ejemplo: APA, Vancouver…)
3.
Legibilidad de esquemas, gráficos, dibujos e imágenes
4.
Diseño gráfico de esquemas, tablas, dibujos e imágenes (combinación de tonos o colores, calidad de visión, que estén dentro del formato, etcétera)
5.
Tamaño apropiado de esquemas, tablas, dibujos e imágenes
6.
Diseño de la portada de acuerdo con lineamientos institucionales
7.
Diferenciación clara entre apartados
8.
Calidad de impresión de acuerdo con los lineamientos solicitados por la institución en que se presenta el reporte (papel, encuadernación, entre otros)
Escala
Un rubro adicional que tal vez no se aplique a todos los estudios, pero que han solicitado instituciones educativas en Puerto Rico, Panamá y Bolivia, es el siguiente. Rubro: inclusión o desarrollo de modelos y patrones Rango: máximo 30, mínimo cero Elemento,indicadorofactor 1.
Utilización de un modelo, patrón, teoría o enfoque a lo largo de la investigación
2.
Generación de uno o varios modelos, patrones, enfoques o teorías como producto de la investigación
3.
Comparación del modelo, patrón o teoría con otros(as) desarrollados(as) por distintos investigadores
Escala
Rubro: utilización y productos de la investigación Rango: máximo 70, mínimo cero Elemento,indicadorofactor 1.
Amplitud de la difusión de resultados (número de productos escritos: reportes, artículos, capítulos, libros, papeles o documentos para ponencias, posters, etcétera).
2.
Número de desarrollos tecnológicos, productos, aplicaciones, inventos, etc., emanados de la investigación
Escala
Metodología de la investigación
Elemento,indicadorofactor
Escala
3.
Pertinencia de los desarrollos tecnológicos, productos, aplicaciones, inventos, etc., emanados de la investigación
4.
Profundidad del aporte a comunidades académicas
5.
Profundidad del aporte a comunidades profesionales/práctica profesional/organizaciones
6.
Número de beneficiarios de los resultados y productos del estudio
7.
Aportes al desarrollo de la sociedad
3
Tabla 10.2 Segundo listado de rubros y factores para evaluar una investigación cuantitativa. 4 Cada elemento de cualquier rubro de este listado se califica al estilo Likert del cero al cuatro (Fischer, 2005), pero lo hemos adaptado del uno al cinco (el valor más bajo es el uno y el más alto el cinco), aunque podría también considerarse del cero al cinco o del cero al 10 e inclusodicotomías. Insistimos en que algunos elementos o criterios pueden ser similares o los mismos del primer listado.
Criterios relativos al planteamiento del problema y revisión de la literatura Número
Criterio
Escala5
1.
Adecuacióndelarevisióndelaliteratura
1
2
2.
Claridad idea lade
3.
Claridaddelplanteamientodelproblema(objetivos)
1
2
3
4
5
4.
Claridaddelplanteamientodelproblema(preguntas)
1
2
3
4
5
5.
Claridaddelplanteamientodelproblema(justificación)
6.
Claridadenlaformulacióndehipótesis
1
7.
Claridadenlaespecificacióndelasvariables
1
8.
Claridadenlasdefinicionesconceptualesdelasvariables
1
2
3
4
9.
Claridadenlasdefinicionesoperacionalesdelasvariables
1
2
3
4
10.
Sensatezenlasuposiciónderelacionesentrelasvariables
11.
Inclusión de todas las variables pertinentes de acuerdo con el planteamiento del problema
12.
Transparenciaenlospatrociniosdelainvestigación
1
2
3
4
5
13.
Sensatezdelassuposicionesypremisasdelinvestigador
1
2
3
4
5
14.
Claridadenlaorientacióndelinvestigador
1
2
3
4
5
1
3
2
4
3
1
2 2
1
5
3 3
2
5
4
4 4
3
4
2
3
1
23
5 5 5 5 5
4
5 45
En experimentos y estudios causales, cabría agregar los dos siguientes criterios: 15.
Claridad en la especificación de la(s) variable(s) independiente(s) y dependiente(s)
16.
Claridadenelestablecimientodelasrelacionescausales
17.
Claridadenlaformulacióndehipótesisrivales
12345
1 1
2 2
3
4
3
5
4
5
Criterios relativos al método Número 1.
Criterio Transparenciadelmétodoyprocedimientos
Escala 1
2
3
4
5
3 El investigador puede establecer rangos de acuerdo con algún criterio lógico o realizar una estimación, porque depende del tipo de beneficiarios. Desde luego, hay subjetividad. Adaptado de Fischer (2005, p. 387-398). Se agregaron diversos elementos a la lista srcinal, particularmente después de una visita a la Universidad Católica de Costa Rica, la Universidad César Vallejo del Perú y a la Facultad de Pedagogía de la Universidad Veracruzana. Recordar: el valor más bajo es el uno y el más alto el cinco.
9
10
Capítulo 10 Parámetros, criterios, indicadores y/o cuestionamientos para evaluar la calidad de la investigación
Número
Criterio
Escala
2.
Conveniencia de las mediciones en relación con el planteamiento del problema
12345
3.
Conveniencia de las mediciones en relación con los objetos, personas, casos o equivalentes de la investigación
12345
4.
Gradodeconfiabilidaddelasmediciones
2
5.
Cantidad de evidencia sobre la validez de contenido de las mediciones realizadas
6.
Gradodevalidez“encarada”(facevalidity)
7.
Cantidad de evidencia sobre la validez de criterio de las mediciones realizadas Cantidad de evidencia sobre la validez de constructo de las mediciones realizadas
12345
9.
Grado de utilización de diferentes instrumentos para recolectar datos
12345
10.
Claridadacercadecómoserecolectaronlosdatos
11.
Claridadrespectodequiénoquiénesrecolectaronlosdatos
12.
Gradoenqueseevitaronerroresenlarecoleccióndelosdatos
13.
Claridadenelplanteamientodeldiseñodeinvestigación
1
2
3
4
5
14.
Adecuacióndeldiseñoalplanteamiento
1
2
3
4
5
15.
Gradoenqueeldiseñopuedereplicarse
1
2
3
4
5
16.
Grado en que el diseño se encuentra estandarizado con otros estudios similares (mismo planteamiento)
12345
17.
En estudios causales: grado en que el diseño constituye una prueba apropiada para las inferencias o atribuciones causales
12345
18.
Precisiónenladefinicióndeluniverso
19. 20.
Adecuacióndeltamañodemuestraalplanteamiento 1 Grado de conocimiento de la probabilidad que tienen los casos del universo o población de ser seleccionados para conformar la muestra (procedimiento de muestreo)
21.
Representatividad de la muestra
22.
Grado en que las estadísticas demográficas de la muestra se parecen a las del universo o población
23.
Gradodeconfiabilidadenlacodificación
24.
Gradodeconfiabilidadenlarevisióndelamatrizdelosdatos
25.
En cuestionarios-escalas-pruebas estandarizadas y equivalentes: claridad de instrucciones
12345
26.
En cuestionarios-escalas-pruebas estandarizadas y equivalentes: claridad del formato
12345
27.
Enanálisisdelcontenido:claridaddelsistemadecodificación
8.
1
3
4
5
12345
1
2
3
4
5
12345
1
2 1
1
3 2
2
1
4 3
3
2
4
3
2
5 5
4
2 3 12345
1
5 4
5 4
5
4
5
3
12345 1
2
1
3
2
4
3
5
4
5
1
2
3
4
5
En experimentos e intervenciones, cabría agregar: 28.
Claridadenlaespecificacióndeloscambiosdeseados
1
2
3
4
5
29 30.
Gradodecontroldelasfuentesdeinvalidacióninterna Gradodecontroldelasfuentesdeinvalidaciónexterna
1 1
2 2
3 3
4 4
5 5
31.
Conveniencia del método de asignación de los participantes a los grupos
32.
Inclusión de grupo(s) de control
3
4
5
1
12345 2
11
Metodología de la investigación
Número
Criterio
Escala
33.
Conveniencia del(los) tratamiento(s) experimental(es): operacionalización
34.
Uniformidaddeltratamientoointervención
35.
Inclusióndechequeosdemanipulación
36.
Gradodecontroldelosefectosdeinteracción
37.
Seguimientoomonitoreodelos grupos
1 1
2
2
1
3
2
1
5
4
3
5
4
5
Criterios relativos a los análisis y resultados Número
Criterio
Escala
1.
Conveniencia de los análisis seleccionados y realizados de acuerdo con el planteamiento e hipótesis
12345
2.
Conveniencia de los análisis seleccionados y realizados de acuerdo con el nivel de medición de las variables
12345
3.
Claridadenlapresentacióndeestadísticasdescriptivas
1
2
3
4
4.
Claridadenlapresentacióndeestadísticasparapruebadehipótesis
1
2
3
4
5.
Claridad en la presentación de tablas
1
2
3
4
5
6.
Claridaden lapresentación decuadros
1
2
3
4
5
7.
Claridadenlapresentacióndediagramas
1
2
3
4
5
8.
Claridadenelordendepresentaciónderesultados
1
2
3
4
5
9.
Convenienciadelastablaspresentadas
1
2
3
4
5
10.
Convenienciadeloscuadrospresentados
1
2
3
4
5
11.
Convenienciadelosdiagramaspresentados
1
2
3
4
12.
Uniformidadenlastablas,cuadrosydiagramas
1
2
3
5 5
5
4
5
Criterios relativos a la discusión Número
Criterio
Escala
1.
Grado de claridad que los datos ofrecen acerca de la(s) prueba(s) de hipótesis (ya sea que las apoyen o refuten)
12345
2.
Gradodecoherenciadelasconclusionesconrespectoalosdatos
2
3.
Grado de exclusión de deseos y tendencias personales del investigador o investigadores
4.
Claridadenelsignificadodelosresultados
5.
Adecuación de la discusión a los resultados y descubrimientos de estudios previos (marco teórico)
6.
Gradoenqueelestudiocumplióconsusobjetivos
7.
Gradoenqueelestudiorespondióalaspreguntasdeinvestigación
8.
Convenienciadelasopinionessobrelasimplicacionesdelestudio
1
2
3
4
5
9.
Convenienciaparageneralizarlosresultados
1
2
3
4
5
10.
Grado en el cual se someten a discusión hipótesis rivales o alternativas
12345
11.
Adecuaciónenelmanejodesituacionesnoesperadas
1
2
3
4
5
12.
Adecuaciónenelmanejoderesultadosnoesperados
1
2
3
4
5
13.
Grado de relevancia práctica
1
2
3
4
5
14.
Grado de relevancia teórica
1
2
3
4
5
1
3
4
5
12345
1
2
3
4
5
12345 1
2 1
3 2
4 3
5 4
5 5
4
3
2
4
4
3
2
1
3
5
12
Capítulo 10 Parámetros, criterios, indicadores y/o cuestionamientos para evaluar la calidad de la investigación
Número
Criterio
Escala
15.
Claridadde las recomendaciones
1
16.
Grado en que las recomendaciones direccionan futuros estudios dentro del área o campo de conocimiento donde se inserta la investigación
2
3
4
5
12345
Criterios relativos al documento y difusión Número
Criterio
Escala
1.
Númerodeespaciosdondesedifundióelestudio
1
2
3
4
2.
Grado de elaboración del reporte de acuerdo con las normas aceptadas por la comunidad científica-académica del área donde se insertó la investigación
5
3.
Calidad en la redacción del reporte
1
2
3
4
5
4.
Calidadeneldiseñográficodelreporte
1
2
3
4
5
12345
Los máximos y mínimos para cada rubro dependerán de la escala utilizada. Tabla 10.3 Tercer listado de rubros y factores para evaluar una investigación cuantitativa. Esta lista está basada en Kerlinger y Lee (2002); Corbetta (2003); Bostwick y Kyte (2005); Wiersma y Jurs (2008); Neuman (2009); Mertens (2010); Creswell (2013a); Durbarry (2014); Babbie (2012 y 2014) y varios autores ya citados de The SAGE glossary of the social and behavioral sciences(2009) y SAGE encyclopedia of research design (2010). En esta edición el formato es a modo de pregunta y la respuesta puede ser positiva o negativa. En la mayoría de los casos la respuesta positiva ( sí) es más conveniente, pero en algunos cuestionamientos es al contrario“no” ( resulta más adecuado). Cada respuesta adecuada podría calificarse con uno (1) y cada contestación inadecuada tendría un valor de cero (0).
Rubro: título
1. ¿El título refleja el planteamiento final? 2. ¿El título refleja el trabajo completo o investigación realizada? 3. ¿Se adecua a las normas de publicación solicitadas por el estilo elegido? Rubro: resumen
1. ¿El resumen incluye los elementos mínimos? (planteamiento, método básico, resultados principales, conclusiones e inferencias más significativas) 2. ¿Refleja el trabajo completo o investigación realizada? 3. ¿Se adecua a las normas de publicación solicitadas por el estilo utilizado? Rubro: planteamiento del problema
1. ¿Posee claridad? 2. ¿Está redactado el planteamiento de tal manera que el lector puede comprender el estudio? 3. ¿Es completo el planteamiento? 4. ¿Es exacto el planteamiento? 5. ¿Posee valor teórico? 6. ¿Posee valor práctico? 7. ¿Posee valor metodológico? 8. ¿El planteamiento incluye a las hipótesis y variables centrales? Nota: observe que las preguntas están planteadas para una respuesta dicotómica, pero podrían elaborarse para una respuesta ordinal. Por ejemplo:
Metodología de la investigación
¿Qué tanta claridad posee el planteamiento? 5
Bastanteclaridad
4
Claridad
2
Pocaclaridad
1
Muypocaclaridad
(O agregar un punto intermedio: mediana claridad). Rubro: revisión de la literatura
1. ¿Se utilizó la literatura para documentar la importancia del planteamiento? 2. ¿La estructura de la revisión de la literatura es clara? 3. ¿Se identificó una teoría o se integraron varias teorías? (si no, ¿se explicó por qué?) 4. ¿Se identificaron hipótesis potenciales por medio de la revisión de la literatura? 5. ¿Mediante la revisión de la literatura se ubicó el planteamiento dentro del campo de conocimiento en que está inserto? 6. ¿Por medio de la revisión de la literatura se identificaron variables claves para el planteamiento? 7. ¿Las conclusiones de la revisión de la literatura son claras? 8. ¿Se eligieron fuentes relevantes que demuestren conocimiento del planteamiento por parte del investigador? 9. ¿Se vincularon la referencias con el planteamiento del problema? (relación de la literatura con el estudio, tanto conceptual como metodológicamente) 10. ¿Las referencias son de actualidad? (recientes) 11. ¿Las referencias están basadas en estudios que obtuvieron datos empíricos? 12. ¿Las referencias se citan apropiadamente? Rubro: hipótesis y variables
1. ¿Se identificaron las variables de manera apropiada? (dependiente, independiente, de control, interviniente, etcétera) 2. ¿Las definiciones conceptuales son exactas y precisas? 3. ¿Las definiciones conceptuales son claras? 4. ¿Las definiciones operacionales son precisas y exactas? 5. ¿Las definiciones operacionales son claras? 6. En experimentos: ¿se controlaron las variables independientes? (¿las de interés y las que se pretende controlar su influencia?) 6 7. ¿Constituye(n) la(s) hipótesis una respuesta(s) tentativa(s) a la(s) pregunta(s) de investigación? (relación de la o las hipótesis con el planteamiento) 8. ¿La hipótesis sirve como guía para establecer el diseño de investigación? 9. ¿Existe claridad en la relación o relaciones entre las variables establecidas por la(s) hipótesis? Rubro: diseño
1. ¿Se identificó el diseño? (¿se señaló y especificó?) 2. ¿El diseño es consistente con el enfoque? 3. ¿El diseño es apropiado de acuerdo con el planteamiento e hipótesis? 4. ¿El diseño es apropiado de acuerdo con la revisión de la literatura?
6 Este criterio podría ser incluido en el rubro de diseño en experimentos.
13
14
Capítulo 10 Parámetros, criterios, indicadores y/o cuestionamientos para evaluar la calidad de la investigación
5. ¿Todos los procedimientos del diseño se especificaron con claridad? 6. ¿Los procedimientos corresponden al diseño? ¿Son congruentes? 7. ¿El diseño se implementó rigurosamente? (de acuerdo a los requerimientos) Rubro: diseño en experimentos
1. ¿El estímulo fue implementado en un lugar apropiado? 2. ¿El estímulo o tratamiento fue administrado adecuadamente? 3. ¿El experimentador indicó los cambios que ocurrieron en la(s) variable(s) dependiente(s) como resultado de la manipulación o introducción de la(s) independiente(s)? (además: ¿explicó cómo ocurrieron tales cambios?) 4. ¿Los grupos eran inicialmente equiparables? (procedimiento de asignación de los participantes a los grupos) 5. ¿Durante el desarrollo del experimento se mantuvo la equivalencia inicial de los grupos? 6. Si no pudieron asignarse al azar, ¿se emparejaron?, ¿en cuáles variables se basó el emparejamiento? En el caso de grupos intactos, ¿los grupos pueden equipararse? 7. Si hubo preprueba, ¿se presentaron los resultados? 8. ¿El tiempo transcurrido entre la preprueba y la posprueba fue el adecuado? (para que se manifestaran los cambios en la dependiente o dependientes) 9. ¿Se incluyeron controles para evitar sesgos de las personas que manejaron los grupos en el experimento? Hemos agregado algunos criterios que aplican exclusivamente a experimentos con individuos y en particular al control de las fuentes internas y externas, están basados en los conceptos de Campbell y Stanley (1966), Campbell (1975) y Mertens (2010). A diferencia de los rubros y criterios anteriores (en los cuales las respuestas adecuadas deben ser positivas: “sí”), en los siguientes que se refieren a la validez interna, entre más respuestas negativas (no), la evaluación es más favorable. En los que tienen que ver con la validez externa, la evaluación favorable varía en cada caso. Validez interna
1. Historia: ¿ocurrieron eventos que pudieron afectar los resultados? (además de la variable independiente o el tratamiento o tratamientos) 2. Maduración: ¿se presentaron cambios biológicos o psicológicos en los sujetos participantes que pudieran afectar los resultados? (diferentes a aquellos asociados con la variable independiente o al tratamiento o tratamientos) 3. Administración de pruebas: ¿la preprueba pudo influir en forma significativa las respuestas a la posprueba y confundido los resultados reales? 4. Instrumentación: ¿hay diferencias entre la(s) preprueba(s) y la(s) posprueba(s)? (obviamente no en las respuestas, sino en los instrumentos) 5. Regresión: ¿se utilizaron grupos extremos? 6. Selección: ¿los grupos difieren aparte de la(s) variable(s) independiente(s) o tratamiento(s)? 7. Mortalidad experimental: ¿varios participantes abandonaron el experimento? 8. Selección-maduración: ¿estuvieron la selección y asignación de participantes a los grupos basadas en características biológicas o psicológicas de la muestra? 9. Difusión de tratamientos experimentales: ¿participantes de distintos grupos pudieron haber comentado sobre las condiciones experimentales? 10. Rivalidad-desmoralización-compensación: ¿alguno de los grupos realizó esfuerzos adicionales para lograr mejores resultados? ¿Alguno de los grupos mostró desmoralización durante el experimento? ¿Se le proporcionaron recursos o beneficios adicionales a algún grupo que pudieran ser conocidos por miembros de otros grupos?
Metodología de la investigación
Validez externa
1. ¿El tratamiento experimental fue descrito de manera detallada y específica? Respuesta adecuada o correcta: sí. 2. ¿Se utilizaron diferentes tratamientos múltiples? ¿Interfirieron entre sí? ¿La secuencia de tratamientos provocó efectos que son identificados y se puede saber cómo afectó a cada tratamiento? Las respuestas adecuadas a las dos primeras preguntas pueden ser “sí” o “no”, dependiendo de la naturaleza del experimento. A veces una opción será la adecuada y otras no. Pero la respuesta correcta a la tercera pregunta es “sí”. 3. ¿Operó el efecto Hawthorne? Respuesta adecuada o correcta: no. 4. ¿Los resultados pudieron haber sido influidos por ser novedoso(s) el(los) tratamiento(s) experimental(es) o por interrumpir la actividad normal de los participantes? Respuesta correcta: no. 5. ¿El experimentador influyó de manera significativa en los participantes y sus respuestas? ¿Su papel fue más allá de lo planeado? Respuestas correctas: no. 6. ¿Se presentó una sensibilización notoria o significativa en los participantes por efectos de prepruebas y pospruebas en sus respuestas? Respuesta adecuada: no. 7. ¿Se presentó alguna interacción entre los efectos del tratamiento y otros factores que pudieran impactar los resultados del estudio y su aplicación a situaciones no experimentales? Respuesta correcta: no. 8. ¿Los resultados del experimento se alteran dependiendo del tipo de instrumento de medición utilizado? Respuesta correcta: no. 9. ¿Influye el periodo comprendido entre el tratamiento y la posprueba en los resultados? La respuesta adecuada depende de si se planteó la hipótesis de un efecto a corto, mediano o largo plazo; así como si el periodo es una variable independiente de interés. 10. ¿Se administró el (los) tratamiento(s) de acuerdo con lo planeado? Respuesta correcta: sí. A partir de este rubro, la mayoría de las respuestas a las preguntas debe ser afirmativa (“sí”). Rubro: muestra
¿Todos los procedimientos del muestreo se especificaron con claridad? ¿La unidad de muestreo es adecuada? ¿Existe congruencia entre el enfoque y la muestra? ¿Existe congruencia entre el planteamiento y la muestra? ¿Existe congruencia entre el diseño y la muestra? ¿El método de muestreo es riguroso? ¿El procedimiento de selección de los casos o unidades fue adecuado? ¿Se justificó? (rigor del método de muestreo) 7. ¿El tamaño de muestra es el adecuado? 7 (el cual depende del nivel de confianza al calcular el tamaño de muestra, 95% como mínimo) 8. ¿La muestra representa a la población? (representatividad de la muestra: grado de error, comparación de variables demográficas de la muestra con las de la población; la muestra debe tener una distribución similar a la población en variables como género, edad, ocupación, nivel socioeconómico, entre otras) 9. ¿Se detectaron los casos de interés de acuerdo con el planteamiento? 10. ¿La muestra tiene fortalezas? ¿Cuáles? (número de fortalezas de la muestra) 11. ¿La muestra tiene debilidades? ¿Cuáles? (número de debilidades de la muestra) (la respuesta debe ser negativa, un “sí” sería desfavorable) 12. ¿Se evitaron errores de selección? 13. ¿Hubo casos o personas que fueron seleccionados(as) en la muestra y no participaron en el estudio? (pregunta cuyo “sí” es desfavorable). Cuando la respuesta resulta desfavorable debe justificarse: ¿por qué no participaron en la investigación?
1. 2. 3. 4. 5. 6.
7 Recordemos que entre mayor es el tamaño de muestra los resultados tienen mayor probabilidad de ser estadísticamente significativos.
15
16
Capítulo 10 Parámetros, criterios, indicadores y/o cuestionamientos para evaluar la calidad de la investigación
14. ¿Hubo casos o participantes que abandonaron el estudio? (pregunta cuyo “sí” es desfavorable). Cuando la respuesta resulta desfavorable debe justificarse: ¿por qué abandonaron la investigación? Rubro: procedimientos (incluyendo recolección de los datos)
1. ¿Todos los procedimientos de recolección de los datos se especificaron con claridad? 2. ¿Se solicitaron los permisos o autorizaciones necesarias para recolectar los datos? (si se requerían) 3. ¿Se especificó con profundidad quién o quiénes recolectaron los datos, cómo los recabaron, dónde y cuándo fueron obtenidos? 4. ¿Se incluyeron controles para evitar sesgos de quienes recolectaron los datos? 5. ¿Se evitaron sesgos provocados por el investigador? Rubro: instrumento(s)
1. ¿El instrumento o instrumentos son apropiados para los propósitos del estudio? 2. ¿El instrumento o instrumentos son apropiados para el tipo de datos e información que se requiere para el estudio? (¿Son la mejor manera de obtener la información necesaria?) 3. ¿El instrumento o instrumentos son apropiados de acuerdo con las características de los participantes? (por ejemplo, se debió tomar en cuenta si eran analfabetos o alfabetos, mujeres u hombres, o de ambos géneros, edad, nivel socioeconómico, etcétera) 4. ¿Se efectuó una prueba piloto? ¿Fue satisfactoria? 5. ¿Se determinó evidencia sobre la confiabilidad? ¿Fue satisfactoria? 6. ¿Se determinó evidencia sobre la validez de contenido? ¿Fue satisfactoria? 7. ¿El dominio de contenido de las variables medidas se especificó? 8. ¿El dominio de contenido de las variables medidas resulta claro? 9. ¿La elección de los ítems, indicadores o equivalentes es lógica? 10. ¿Se determinó evidencia sobre la validez de criterio concurrente? ¿Fue satisfactoria? (¿se compararon los datos obtenidos o resultados contra un criterio externo actual?) 11. ¿Se determinó evidencia sobre la validez de criterio predictivo? ¿Fue satisfactoria? (¿se compararon los datos obtenidos o resultados contra un criterio externo futuro?) 12. ¿Se hizo análisis convergente-discriminante? ¿Fue satisfactoria? 13. ¿Se determinó evidencia sobre la validez de constructo? ¿Fue satisfactoria? (¿se efectuó análisis de factores o método equivalente de acuerdo al nivel de medición?) 14. ¿El instrumento demostró consistencia interna? 15. ¿Las personas que recolectaron los datos se encontraban calificadas para tal tarea? 16. ¿El grado de estandarización del instrumento o instrumentos para recabar los datos fue elevado? 17. ¿El investigador utilizó diversos instrumentos para medir las variables? (triangulación de métodos de recolección o “multimétodos”) Rubro: análisis
1. ¿Los análisis son pertinentes o apropiados para el planteamiento e hipótesis desarrolladas? 2. ¿Los análisis son pertinentes o apropiados para el nivel de medición de las variables involucradas? 3. ¿Los análisis son pertinentes o apropiados al diseño? ¿La unidad de análisis es adecuada? ¿Los análisis son suficientes o los que se requerían? (cantidad y calidad) ¿Se cubrieron diferentes ángulos del análisis? ¿Se presentaron los análisis completos de todas las hipótesis? (que no aplicaría a reportes breves como artículos de revistas, en cuyo caso podría cuestionarse: ¿se presentaron los análisis más relevantes vinculados con el planteamiento e hipótesis?) 8. ¿Se evitaron errores en el tratamiento de los datos?
4. 5. 6. 7.
Metodología de la investigación
Rubro: resultados
1. ¿Se presentaron todos los resultados apropiados? (de acuerdo con el planteamiento, descriptivos, correlaciónales, causales) 2. ¿Se encontró significancia estadística en la(s) prueba(s) de hipótesis? (¿en qué niveles?). De no resultar significativos los valores de las pruebas estadísticas, ¿se explicaron razones?, ¿se justificó el hecho? 3. ¿Se interpretaron correctamente las pruebas de significancia? 4. ¿Los resultados están adecuadamente representados en tablas y figuras? 5. ¿Los resultados responden al planteamiento del problema e hipótesis? Rubro: discusión
1. ¿Los resultados, descubrimientos e inferencias aportan a alguna teoría o conceptualización? 2. ¿Los resultados, descubrimientos e inferencias ayudan a resolver un problema? 3. ¿Los resultados, descubrimientos e inferencias aportan metodológicamente algo? 4. ¿Los resultados, descubrimientos e inferencias son congruentes entre sí? 5. ¿Las interpretaciones son razonablemente lógicas? 6. ¿Las implicaciones están definidas? 7. ¿Las implicaciones resultan claras? 8. ¿La discusión es convincente para los usuarios? 9. ¿Se hicieron predicciones en el estudio? 10. ¿Fueron exactas tales predicciones? 11. ¿Por medio de los resultados se eliminaron posibles explicaciones rivales? 12. ¿Las conclusiones se encuentran vinculadas al planteamiento, revisión de la literatura (marco teórico) e hipótesis? 13. ¿Se reconocieron las limitaciones del estudio? 14. ¿Es posible replicar el estudio? 15. ¿Hay productos fructíferos o significativos del estudio además del reporte? (desarrollos tecnológicos, innovaciones, productos, etcétera) Rubro: reporte en general
1. ¿Se documenta cómo se minimizaron los sesgos y preconcepciones de los investigadores? (objetividad) 2. ¿Los investigadores demuestran honestidad? 3. A lo largo de todo el documento, ¿se citaron adecuadamente las referencias? 4. ¿El texto es legible? 5. ¿El texto es ameno? 6. ¿La ortografía es aceptable? 7. ¿El tono es el apropiado? (no emotivo) 8. ¿Hay progresión en las ideas? 9. ¿Son congruentes entre sí los capítulos o apartados del reporte? (introducción, revisión de la literatura, método, resultados y discusión) 10. ¿Se respondió satisfactoriamente al planteamiento? Rubro: difusión
1. ¿El estudio se difundió en varios foros? (congresos, publicaciones, etcétera) 2. ¿Se generaron varios subproductos?
17
18
Capítulo 10 Parámetros, criterios, indicadores y/o cuestionamientos para evaluar la calidad de la investigación
3. ¿Los resultados se utilizaron para promover el bien común? ¿Los resultados se utilizaron para generar conocimiento? ¿Los resultados se utilizaron para resolver un problema? (alguna respuesta debería ser positiva) Rubro: financiamiento de la investigación
1. ¿Es legal el financiamiento? 2. ¿Los resultados se encuentran sujetos al financiamiento? (¿si se obtenían ciertos resultados el financiamiento no operaría?) (Una respuesta positiva es inconveniente para la credibilidad del estudio) Rubro: ética en la investigación
1. ¿Se respetaron u observaron todos los principios éticos que se marcan para el tipo de estudio realizado? 2. ¿El estudio fue sometido a la revisión de pares? 3. ¿Se estableció una declaración de no conflicto de intereses?
INVESTIGACIÓN CUALITATIVA Para la investigación cualitativa se consideraron a Miles y Huberman (1994); Álvarez Gayou (2003); Henwood (2004); Franklin y Ballau (2005); Tashakkori y Teddlie (2008b); Neuman (2009); Mertens (2010); Daymon (2010); Creswell (2013a) y Savin-Baden y Major (2013), así como diversos autores citados a lo largo de la obra impresa de Te SAGE encyclopedia of qualitative research methods. Figura 10.4 Cuarto listado de rubros y factores para evaluar una investigación cualitativa. El presente listado se respondería dicotómicamente: “sí” o “no”, satisfactorio/insatisfactorio. Más que una calificación, se considerarían debilidades. Rubro: título
1. ¿El título refleja el planteamiento final? 2. ¿El título refleja el trabajo completo o investigación realizada? 3. ¿Se adecua a las normas de publicación solicitadas por el estilo elegido? Rubros generales
1. ¿Se especificó cómo fueron minimizados los sesgos y preconcepciones del investigador durante toda la investigación? 2. ¿El investigador manifiesta honestidad? 3. ¿Los participantes demuestran o manifiestan honestidad a lo largo del estudio? 4. ¿El investigador demuestra autenticidad? 5. ¿Los participantes demuestran o manifiestan autenticidad a lo largo del estudio? 6. ¿El estudio agrega información novedosa? (por ejemplo, llenar huecos de conocimiento u obtener perspectivas internas “frescas”) ¿La investigación fundamentación? (grado enque queinforma la investigación posee bases teóricas y 7. filosóficas sólidas tiene y provee de un marco referencial al estudio) 8. ¿La investigación posee aproximación? (contundencia en los juicios y lógica del estudio) 9. ¿La investigación demuestra capacidad de otorgar significado? (grado en que se presentan nuevos descubrimientos y entendimientos del problema de investigación a través de los datos y el método utilizado)
Metodología de la investigación
Rubro: resumen
1. ¿El resumen incluye los elementos mínimos? (planteamiento, método básico, resultados principales, conclusiones e inferencias más significativas) 2. ¿Refleja el trabajo completo o investigación realizada? 3. ¿Se adecua a las normas de publicación solicitadas por el estilo utilizado? Rubro: planteamiento del problema
1. ¿Los objetivos y preguntas de investigación son claras? 2. ¿La justificación y viabilidad son claras? 3. ¿Las preguntas de investigación son congruentes con las características del diseño o abordaje principal de la investigación? (o mezcla de diseños) 4. ¿Se especificó con claridad el paradigma básico que guía a la investigación? 5. ¿Se especificó con claridad el marco interpretativo que guía a la investigación? (feminismo, etnografía clásica, etcétera) 6. ¿Se demostró que el planteamiento es significativo o importante desde alguna o varias perspectivas? (teórica, metodológica, práctica, etcétera) Rubro: papel del investigador
1. ¿Se especificó el papel del investigador en todo el estudio? 2. ¿El investigador conoció su papel como observador? (¿estuvo consciente?) Rubro: relación investigador-participantes
3. ¿Se especificaron las relaciones entre el investigador y los participantes?, y ¿cómo afectaron el estudio? 4. 5. 6. 7. 8. 9.
¿El empatía lostal participantes? ¿El investigador investigador logró demuestra quecon logró empatía? (autoevaluación) ¿El investigador se ganó la confianza de los participantes? (autoevaluación) ¿El investigador demuestra que se ganó la confianza de los participantes? ¿El investigador demuestra que fue sensible y respetuoso ante los participantes? ¿Se agradeció a los participantes por su colaboración en el estudio?
Rubro: revisión de la literatura
1. ¿Se utilizó la literatura para documentar la importancia del planteamiento? 2. ¿La estructura de la revisión de la literatura es clara? 3. ¿Mediante la revisión de la literatura se ubicó el planteamiento dentro del campo de conocimiento en que está inserto? 4. ¿Por medio de la revisión de la literatura se identificaron conceptos claves para el planteamiento? 5. ¿Las conclusiones de la revisión de la literatura son claras? 6. ¿Se eligieron fuentes relevantes que demuestren conocimiento del planteamiento por parte del investigador? ¿Se vincularon las referencias con el planteamiento del problema? (relación de la literatura con el 7. estudio, tanto conceptual como metodológicamente) 8. ¿La literatura fue contrastada con los resultados del estudio? 9. ¿Las referencias son de actualidad? (recientes) 10. ¿Las referencias están basadas en estudios que obtuvieron datos empíricos? 11. ¿Las referencias se citaron apropiadamente?
19
20
Capítulo 10 Parámetros, criterios, indicadores y/o cuestionamientos para evaluar la calidad de la investigación
Rubro: inmersión general en el ambiente (proceso completo)
1. ¿El investigador obtuvo permiso para ingresar al ambiente y estudiarlo? 2. ¿Se reportó cómo se tuvo acceso al ambiente? 3. ¿Se tuvo acceso completo al ambiente? 4. ¿Se describió detalladamente el ambiente? 5. ¿El acceso al ambiente fue lo más meticuloso y sigiloso posible? 6. ¿El acceso al ambiente fue lo menos obstrusivo o invasivo posible?
Rubro: inmersión inicial 1. ¿La inmersión inicial logró que el investigador se enfocara en los conceptos fundamentales del planteamiento? 2. ¿La inmersión inicial contribuyó a mejorar el planteamiento srcinal? Rubro: diseño
1. 2. 3. 4. 5.
¿Se señaló y especificó el diseño? ¿El diseño o abordaje principal o mezcla de diseños es consistente con el enfoque? ¿El diseño o abordaje principal o mezcla de diseños es consistente con el planteamiento? ¿El diseño o abordaje principal o mezcla de diseños está completamente justificado? ¿El diseño o abordaje principal o mezcla de diseños es adecuado de acuerdo con la inmersión en el ambiente? 6. ¿El diseño o abordaje principal o mezcla de diseños es adecuado de acuerdo con la evolución del trabajo de campo? 7. ¿Todos los procedimientos del diseño o abordaje principal o mezcla de diseños se especificaron con claridad?
8. ¿El diseño o abordaje principal o mezcla de diseños es la mejor alternativa para el estudio? Rubro: muestra
¿Se detectaron los casos de interés de acuerdo con el planteamiento? ¿El tipo de muestra es congruente (acorde) con el planteamiento y el enfoque elegido? ¿Todos los procedimientos del muestreo se especificaron con claridad? ¿La unidad de muestreo es adecuada? ¿La muestra tiene fortalezas? (¿cuáles?) ¿La muestra tiene debilidades? (¿cuáles?) (negativa, un “sí” es desfavorable), ¿cómo se superaron? ¿Hubo casos o personas que habían sido seleccionados(as) en la muestra y no participaron en el estudio? (pregunta cuyo “sí” es desfavorable). Cuando la respuesta resulta desfavorable debe justificarse: ¿por qué no participaron en la investigación? 8. ¿Hubo casos o participantes que abandonaron el estudio? (pregunta cuyo “sí” es negativo, implica desfavorable). Cuando la respuesta resulta desfavorable debe justificarse: ¿por qué abandonaron la investigación? 9. ¿El o los perfiles de la muestra están descritos con suficientes detalles? (género, edad, estado civil, ingresos, nivel educativo, entre otros) 10. ¿El perfil de los participantes es el que se había concebido? ¿Por qué? 11. ¿Se encuentran representadas todas las voces? (Recordemos la premisa de evitar “silenciar” voces) 12. ¿Se excluyeron mujeres u hombres de la investigación? ¿Se marginó a algún grupo? ¿Es justificable su exclusión? Una respuesta injustificada resulta desfavorable 13. ¿Se obtuvo la diversidad de casos requerida? 14. ¿Se saturaron las categorías relativas al planteamiento del problema?
1. 2. 3. 4. 5. 6. 7.
Metodología de la investigación
Rubro: recolección en general
1. ¿El instrumento o instrumentos son apropiados para el tipo de datos e información que se requiere para el estudio? 2. ¿El instrumento o instrumentos estaban diseñados de acuerdo con las características de los participantes? (por ejemplo, tomar en cuenta si eran analfabetos o alfabetos, mujeres u hombres, o de ambos géneros, nivel socioeconómico, entre otros) 3. ¿El instrumento o instrumentos son apropiados para el diseño o abordaje principal o mezcla de diseños? 4. ¿Los participantes pudieron expresarse libremente? 5. ¿Hubo rigor en la recolección de los datos? (sistematización) 6. ¿Se tuvieron diferentes fuentes de datos? (¿múltiples?, ¿triangulación?) 7. ¿Los datos son vívidos, profundos y completos? (narrativas, artefactos, etcétera) 8. ¿El periodo fue lo suficientemente largo para recolectar los datos necesarios de acuerdo con el planteamiento? 9. ¿Resultan abundantes y significativas las descripciones del proceso de recolección de los datos? 10. ¿Las fases de la recolección fueron las adecuadas de acuerdo con el planteamiento y ambiente? 11. ¿Se cuenta con evidencia directa de actores? (¿evidencia de testigos directos?) 12. ¿Se encontraron significados? ¿Cuáles? 13. ¿Coinciden entre sí las diversas fuentes en cuanto a la cronología de hechos? 14. ¿Coinciden entre sí las diversas fuentes en cuanto a las descripciones de los hechos? 15. ¿Coinciden entre sí las diversas fuentes en cuanto a las causas y consecuencias de los hechos? (particularmente en lo referente al planteamiento del problema) Rubro: notas (anotaciones)
1. ¿Se elaboraron notas completas? 2. ¿Las notas fueron profundas? ¿Captaron las emociones, vivencias y creencias de los participantes? 3. ¿Las notas incluyeron los conceptos esenciales del planteamiento? 4. ¿Se codificaron las notas? 5. ¿Se alcanzó la saturación de categorías en las anotaciones? Rubro: análisis de los datos
1. 2. 3. 4. 5. 6. 7. 8.
¿Se tuvieron múltiples niveles de análisis? ¿Son abundantes y significativas las descripciones de los procesos de análisis de los datos? ¿Las fases del análisis fueron las adecuadas de acuerdo con el planteamiento y el ambiente? ¿Cada categoría, tema y/o patrón está apoyada(o) en los datos? ¿Las categorías, temas y/o patrones son vívidas y auténticas? ¿Las categorías, temas y/o patrones son congruentes entre sí? (de no ser así: explicar) ¿El fenómeno o planteamiento se analizó desde diversas perspectivas? Si se efectuó codificación: ¿se encuentran vinculadas la codificación abierta, axial y selectiva?
Rubro: dependencia (confiabilidad)
Recordatorio de la definición: grado en que diferentes investigadores que recolecten datos similares en el campo y efectúen los mismos análisis, generan resultados equivalentes.
1. ¿Se implantaron diversas estrategias para generar dependencia? 2. ¿Se describió explícitamente el papel y estatus del investigador dentro del ambiente o contexto? 3. ¿Los resultados y descubrimientos muestran un paralelismo significativo entre fuentes de datos? (¿los resultados son congruentes al compararlos entre diversas fuentes?)
21
22
Capítulo 10 Parámetros, criterios, indicadores y/o cuestionamientos para evaluar la calidad de la investigación
¿Las categorías y los temas fueron inducidas(os) apropiadamente por los participantes? ¿Las categorías y los temas se encuentran claramente especificadas(os)? ¿Las estructuras de categorías son lógicas? (en caso negativo: ¿está justificado que sean ilógicas?) ¿Las decisiones sobre la codificación y categorización están justificadas? (¿se explican y demuestran?) 8. ¿Las reglas de codificación se aplicaron coherentemente (entre unidades e investigadores, si es el caso)? 9. ¿Los datos fueron recolectados por medio de un rango completo de ambientes, tiempos y participantes apropiados de acuerdo con el planteamiento? 10. ¿Se involucraron varios investigadores en el campo? (triangulación entre investigadores); y si
4. 5. 6. 7.
así fue: ¿siguieron el mismo protocolo e instrucciones para recolectar los datos (incluyendo el instrumento o instrumentos)? 11. ¿Se efectuaron chequeos de codificación entre investigadores? ¿Mostraron un alto de nivel de acuerdo o concordancia en unidades, categorías y temas? 12. ¿Los resultados fueron validados por distintos investigadores?, y más riguroso: ¿los resultados fueron validados por distintos investigadores de diferentes edades, género y otras características que pudieran introducir sesgos? 13. ¿Se hicieron verificaciones sobre la calidad de los datos? (¿cuáles?) 14. ¿Los investigadores convergieron en lugares, tiempos e instancias donde se esperaba que estuvieran? 15. En el campo, ¿se hicieron revisiones de pares o colegas? 16. ¿Los significados generados son creíbles para los participantes? 17. ¿El entendimiento generado resulta creíble para los participantes? 18. ¿Los resultados se encuentran fundamentados en los datos? 19. ¿Las inferencias son lógicas? 20. ¿Las decisiones respecto a la recolección y el análisis están justificadas? (justificación metodológica) 21. En el análisis, ¿se hicieron auditorías de pares? Rubro: credibilidad (validez interna)
Recordatorio de la definición: se refiere a si el investigador ha captado el significado completo y profundo de las experiencias de los participantes, particularmente de aquellas vinculadas con el planteamiento del problema. ¿Se utilizaron o desarrollaron estrategias para generar credibilidad? ¿Los datos de diferentes fuentes fueron recolectados en el mismo contexto o ambiente? ¿En todos los casos de la muestra se obtuvo la información completa y detallada requerida? ¿Se registraron todos los datos? ¿Se pidió a todos los participantes o a la mayoría que proporcionaran realimentación sobre el estudio? 6. ¿El investigador autoevaluó el efecto de su presencia en el ambiente? 7. ¿El investigador autoevaluó si sus sesgos y tendencias influyeron o no los resultados? 8. ¿El investigador autoevaluó sus bitácoras y notas? 9. ¿Se capturaron o registraron los cambios en el ambiente? 10. ¿Se reconocieron los sesgos o tendencias del investigador?, ¿se explicaron tales sesgos?, ¿se justificaron? 11. ¿Los resultados se encuentran fundamentados en los datos? (este criterio ya se había mencionado, afecta la dependencia y la credibilidad). 12. ¿Coinciden los resultados con la documentación existente y estudios previos? (en caso negativo, ¿es justificable?) 13. ¿Existe correspondencia entre la manera como los participantes perciben los conceptos sociales y la manera como el investigador capta, retrata y describe sus puntos de vista?
1. 2. 3. 4. 5.
Metodología de la investigación
14. ¿Se incrementó la credibilidad mediante una estancia sustancial y prolongada en el campo? 15. ¿Se incrementó la credibilidad mediante una observación persistente y sistemática? 16. ¿Se incrementó la credibilidad con la recolección de datos por pares? (por ejemplo, en una entrevista al estar presentes dos investigadores) 17. ¿Se incrementó la credibilidad al analizar casos negativos? 18. ¿Se incrementó la credibilidad por medio de subjetividad progresiva? 19. ¿Se incrementó con la evaluación de resultados particulares con los participantes? (chequeo con participantes) 20. ¿Se incrementó triangulando datos? 21. ¿Se aumentó la credibilidad triangulando métodos? 22. ¿Son abundantes (completas) y significativas las descripciones del ambiente? 23. ¿Son abundantes (completas) y significativas las descripciones de los sucesos o hechos? 24. ¿Son abundantes (completas) y significativas las descripciones de los participantes? 25. ¿Los resultados tienen sentido o se muestran convincentes para los participantes? 26. Si hubo triangulación entre métodos de recolección de datos o fuentes de datos: ¿la triangulación o comparación entre métodos complementarios o fuentes de datos generalmente produce conclusiones convergentes? 27. ¿Los resultados mantienen coherencia interna? 28. ¿Se identificaron las áreas de incertidumbre? 29. ¿Los datos presentados se encuentran vinculados a categorías de otros estudios similares o teoría emergente? 30. ¿Se buscó evidencia negativa o contraria a los resultados? 31. ¿Se consideraron activamente explicaciones rivales? 32. ¿Los resultados y descubrimientos han recibido réplicas en diferentes elementos de la base de datos? 33. ¿Las conclusiones fueron consideradas precisas y verdaderas por los participantes y/o informantes srcinales? Rubro: transferencia o validez externa
1. ¿Los datos presentados se encuentran vinculados a categorías de otros estudios similares o teoría emergente? (este criterio fue considerado también en la credibilidad) 2. ¿Los resultados presentados son congruentes o están conectados a otros estudios previos y a la teoría generada por estos? 3. ¿Los resultados han recibido réplicas en otros estudios para robustecer su transferencia? 4. ¿Los procedimientos y resultados descritos en las conclusiones e inferencias son lo suficientemente genéricos para aplicarse en ambientes similares? 5. ¿Las características de la muestra srcinal de personas, contextos y/o procesos se han descrito completamente para permitir comparaciones con otras muestras? 6. ¿Se examinaron obstáculos y amenazas posibles para poder comparar los resultados con otras muestras? 7. ¿La muestra es lo suficientemente diversa para encontrar una aplicabilidad mayor? 8. ¿Se definieron las fronteras del alcance y aplicabilidad del estudio? 9. ¿Los resultados incluyen descripciones completas y suficientes para que el lector pueda valorar la posibilidad de transferirlos o adecuarlos a su propio contexto u otros ambientes? 10. ¿Se logró un balance entre las perspectivas interna y externa del investigador? 11. ¿Las secuencias narrativas son transparentes y claras? 12. ¿Lectores del reporte con perfiles similares a los participantes considerarían que los resultados son congruentes con sus experiencias? (verificación ulterior) 13. ¿Los lectores (principalmente otros investigadores) pueden reconstruir el análisis?
23
24
Capítulo 10 Parámetros, criterios, indicadores y/o cuestionamientos para evaluar la calidad de la investigación
14. ¿El investigador señala de manera específica la secuencia que se siguió en la investigación y los razonamientos que la condujeron? 15. ¿Es posible replicar el estudio? Rubro: historias orales
1. ¿Las historias orales de los participantes son creíbles? 2. ¿Las historias orales de los participantes son equilibradas? 3. ¿Las historias orales de los participantes son completas? Rubro: entrevistas
1. ¿Las condiciones de las entrevistas permitieron a los participantes explayarse libremente? 2. ¿Las condiciones de las entrevistas permitieron a los participantes concentrarse en sus respuestas? Rubro: grupos de enfoque
1. ¿Las condiciones de los grupos de enfoque permitieron a los participantes explayarse libremente? 2. ¿Las condiciones de los grupos de enfoque permitieron a los participantes concentrarse en sus respuestas? Rubro: artefactos
1. ¿Los artefactos recolectados aportaron la información que se buscaba de ellos? 2. ¿Se demostró la autenticidad de los artefactos? Rubro: resultados
1. 2. 3. 4.
¿Se expresó la realidad construida por los participantes? ¿Los resultados son realistas? ¿Los resultados son aceptables? ¿Los descubrimientos están enraizados o ligados con los datos? (este criterio ha sido expresado en diferentes rubros, pero se encuentra vinculado a todo el proceso cualitativo)
5. ¿Los resultados son comprensibles o claros para el lector? 6. ¿Los métodos particulares utilizados son coherentes con una estrategia más amplia? 7. ¿Se tomaron en cuenta varias perspectivas para justificar las interpretaciones? Rubro: discusión
1. ¿Las premisas del estudio son coherentes con el enfoque? 2. ¿Se demostró mediante la discusión que el planteamiento fue significativo o importante? 3. ¿Las conclusiones son prematuras o cuentan con elementos sólidos para su desarrollo? (La respuesta debe ser: sí cuentan con elementos sólidos) 4. ¿Las conclusiones están fundamentadas en los datos? 5. ¿Las conclusiones están fundamentadas en los resultados? 6. ¿Mediante los resultados se eliminaron posibles explicaciones rivales? 7. ¿Las interpretaciones se derivaron de manera analítica? 8. ¿Se demostró que se reconstruyó cada caso para ser analizado? 9. ¿Se tuvieron múltiples perspectivas?
Metodología de la investigación
10. ¿Las conclusiones se encuentran vinculadas al planteamiento y revisión de la literatura (marco teórico)? 11. ¿Se reconocieron las limitaciones del estudio? Rubro: reporte
1. ¿Existe una relación evidente entre las categorías y los datos? (unidades o fragmentos). ¿Emergieron las categorías de los datos? 2. ¿Se logró vincular conceptualmente a las categorías en temas? 3. ¿La teoría producida funciona? ¿La teoría emergente permite un entendimiento del fenómeno estudiado? 4. ¿Se requieren más datos o fueron suficientes para generar teoría? (La respuesta favorable es: sí, fueron suficientes los datos) 5. ¿Se desarrolló un modelo para conceptualizar el planteamiento? 6. A lo largo de todo el documento, ¿se citaron adecuadamente las referencias? 7. ¿El texto es legible? 8. ¿El texto es ameno? 9. ¿La ortografía es aceptable? 10. ¿El tono es el apropiado? (emotivo) 11. ¿Hay progresión en las ideas? 12. ¿Son congruentes entre sí los capítulos o apartados del reporte? (introducción, revisión de la literatura, método, resultados y discusión) 13. ¿Se respondió satisfactoriamente al planteamiento? Rubro: difusión
1. ¿El estudio se difundió en varios foros? (congresos, publicaciones, etcétera) 2. ¿Se generaron varios subproductos? 3. ¿Los resultados se utilizaron para promover el bien común? ¿Los resultados se utilizaron para generar conocimiento? ¿Los resultados se utilizaron para resolver un problema? (alguna respuesta debería ser positiva) Rubro: financiamiento de la investigación
1. ¿Es legal el financiamiento? 2. ¿Los resultados se encuentran sujetos al financiamiento? (¿si se obtenían ciertos resultados el financiamiento no operaría?) (Una respuesta positiva es inconveniente para la credibilidad del estudio) Rubro: ética en la investigación
1. ¿Se respetaron u observaron todos los principios éticos que se marcan para el tipo de estudio realizado? 2. ¿El estudio fue sometido a la revisión de pares? 3. ¿Se estableció una declaración de no conflicto de intereses? (Los siguientes criterios serían propios de cada diseño y se agregarían a los anteriores). Rubro: diseños etnográficos
1. ¿Se identificó al grupo o cultura? ¿Se definió y especificó? 2. ¿Se detectaron patrones de la cultura, grupo o evento analizada(o)? 3. ¿Se comprendieron los patrones culturales?
25
26
Capítulo 10 Parámetros, criterios, indicadores y/o cuestionamientos para evaluar la calidad de la investigación
4. 5. 6. 7.
¿El estudio contribuyó a conocer más al grupo o cultura analizado(a)? ¿El investigador refleja en el reporte su papel como agente cultural en el estudio? ¿En la interpretación se describen las categorías y temas? ¿Se ilustraron las categorías más importantes con segmentos de los datos?
Rubro: diseños narrativos
1. ¿Se concentró el estudio en experiencias individuales? 2. ¿Las narrativas individuales fueron integradas en una narrativa general? 3. ¿Se respetaron las voces de las fuentes creíbles? 4. 5. 6. 7.
¿Se triangularon datos? ¿Se exploró el pasado, presente y futuro? ¿Se describió el contexto ampliamente? ¿Se ilustraron las categorías más importantes con segmentos de los datos?
Rubro: diseños de investigación-acción
¿Se detectó al menos una problemática? ¿Se abordó la problemática en el entorno de los participantes? ¿Se realizó un diagnóstico completo de la problemática? ¿Se involucró en todo el estudio a los participantes? (grupo, organización o comunidad). ¿La interacción entre el investigador y los participantes fue constante? ¿La interacción entre el investigador y los participantes fue fructífera? ¿El investigador y los participantes interactuaron constantemente con los datos? ¿Participaron activamente las personas del grupo, organización o comunidad involucradas en el estudio? 9. ¿Se formuló un plan o programa para resolver el problema o introducir el cambio? 10. ¿Se implementó el plan o programa? 11. ¿Se evaluaron los resultados? 12. ¿Se obtuvo realimentación sobre los resultados preliminares? 13. ¿Se obtuvo realimentación sobre los resultados finales? 14. ¿Se transformó positivamente la realidad de los participantes? 15. ¿Se resolvió al menos un problema o se mejoró al menos una práctica?
1. 2. 3. 4. 5. 6. 7. 8.
Rubro: diseños de teoría fundamentada (diseño sistemático)
1. 2. 3. 4. 5. 6.
¿Se produjo una teoría fundamentada? ¿De los datos obtenidos surgieron hipótesis o proposiciones teóricas? ¿El modelo producido incluye condiciones causales? ¿El modelo generado abarca acciones e interacciones? ¿El modelo emergente contiene consecuencias? ¿El modelo producido incluye estrategias?
7. ¿El modelo generado contiene condiciones contextuales? 8. ¿El modelo emergente abarca condiciones intervinientes? 9. ¿La categoría central es la más importante? (¿Todas o la mayoría de las demás categorías se vinculan a ella?) 10. ¿Las categorías del modelo o teoría son las que aparecen con mayor frecuencia en los datos? 11. ¿La teoría capta la esencia del planteamiento?
Metodología de la investigación
INVESTIGACIÓN MIXTA8 Tal como se ha comentado en el libro impreso, los métodos mixtos se encuentran en pleno desarrollo. Sin embargo, en la década actual ya se han identificado diferentes criterios para evaluar un estudio mixto. A continuación se propone un conjunto de estos que se irá afinando conforme distintos investigadores iberoamericanos los sometan a escrutinio y los revisen críticamente y sugieran otros adicionales. La propuesta parte del trabajo de Hernández-Sampieri y Mendoza (2012) y de diversos autores en el campo (fundamentalmente: Creswell, 2014 y 2013a; Ivankova, 2014; O’Brien, 2013; Morgan, 2013; Johnson y Christensen, 2012; Creswell y Plano Clark, 2011; Plowright, 2011; O’Cathain, 2010; Leech et al., 2010; Teddlie y Tashakkori, 2009; Onwuegbuzie y Johnson, 2008; Tashakkori y Teddlie, 2008a; Bryman, Becker y Sempik, 2008; Dellinger y Leech, 2007; y Caracelli y Riggin, 1994).
¿Cómo podemos juzgar que una investigación mixta ha sido bien hecha? Dos enfoques principales han surgido para evaluar a las investigaciones mixtas. El primero, que ha sido denominado como el de separación de criterios, sugiere que cada componente (cualitativo y cuantitativo) debe ser valorado de acuerdo con los elementos que le corresponden (por ejemplo, el cuantitativo a través de la objetividad, validez, confiabilidad, posibilidad de réplica y generalización; mientras que el cualitativo mediante la confirmación, dependencia, credibilidad, transferencia, fundamentación, aproximación, representatividad de voces y capacidad de otorgar significado). El segundo enfoque, referido por Bryman (2006) como evaluación a la medida, ha pretendido desarrollar criterios que se centran en el estudio mixto como un “todo”. Al habla de cómo juzgar un estudio mixto, surge un primer problema: ¿cuál resulta el término más apropiado para definir la calidad de un estudio mixto? A este respecto emergen diferentes concepciones y posturas. El concepto de validez ha sido propuesto por algunos autores como Creswell (2013a), pero otros metodólogos lo rechazan porque lo consideran asociado a un enfoque fundamentalmente cuantitativo y señalan que se ha convertido en rutinario (O’Cathain, 2010). Teddlie y Tashakkori inferencias, mientras que Onwuegbuzie y Johnson (2008) el (2009) han preferido el de calidad deylas de legitimidad . Hernández-Sampieri Mendoza (2008) postularon el de rigor, pero hay quienes no se sienten cómodos con el concepto (por ejemplo, Giddings y Grant, 2009). Asimismo, O’Cathain (2010) propone el propio término “calidad” por ser tal vez el más consistente con un lenguaje común y comprendido por una audiencia mayor. Este es el vocablo que se adoptará en la presente edición porque en cierta medida es más incluyente y abarca a los demás. Por otra parte, al hablar de calidad en una investigación mixta, diversos autores consideran distintas perspectivas dependiendo del paradigma concebido (por ejemplo, Giddings y Grant, 2009; Bryman, 2008a) y otros, con base el diseño específico (O’Cathain, 2010; Bryman, 2006a y 2006b; Creswell y Plano Clark, 2006); pero en este capítulo se propone que hay un mínimo de criterios comunes a todo estudio mixto y que la perspectiva al evaluar un estudio mixto debe ser holística. Entonces, lo primero es evaluar cada rama o enfoque del estudio, debido a que se recolectan, analizan e interpretan datos de ambos tipos. Es decir, aplicar los respectivos criterios o parámetros vistos en este capítulo para la parte cuantitativa y cualitativa. Tenemos que asegurarnos de que se respetaron rigurosamente los principios de las dos aproximaciones, en especial porque los datos, resultados e inferencias mixtas se fundamentan en ellas. Posteriormente se aplican los criterios mixtos (Hernández Sampieri y Mendoza, 2012; O’Cathain, 2010; Teddlie y Tashakkori, 2009; Tashakkori y
Teddlie, 2008a). Esto se representa en la figura 10.2.
8 Antes de leer este apartado se recomienda revisar los capítulos 17 del libro y 12 de este centro de recursos en línea: “Ampliación y fundamentación de los métodos mixtos”.
27
28
Capítulo 10 Parámetros, criterios, indicadores y/o cuestionamientos para evaluar la calidad de la investigación
Figura 10.2 Esquema de evaluación de un estudio mixto.
Criterios cuantitativos para la vertiente cualitativa Criterios mixtos para la
+
vertiente híbrida
Calidad del estudio
Criterios cuantitativos para la vertiente cuantitativa
Criterios de calidad para evaluar un estudio mixto (criterios mixtos para la vertiente híbrida) Los autores más destacados de los métodos mixtos (mencionados previamente) han identificado cinco dominios en los cuales se agrupan los criterios de calidad para evaluar un estudio híbrido: a) planeación y dirección, b) implementación (método, recolección y análisis de los datos), c) interpretación de resultados, d) elaboración del reporte y difusión de resultados y e) aplicación al “mundo real”. Veamos cada uno resumido en una tabla. Hernández-Sampieri y Mendoza (2012) sugieren que los criterios se evalúen dicotómicamente o de manera binaria, dado que los métodos mixtos se encuentran en evolución (el estudio aprueba o no el criterio), y más que obtener una sumatoria de aprobaciones, es importante reflexionar cuando no se aprueba, ¿qué podría haberse mejorado? Y en futuras investigaciones evitar errores, soluciones incompletas y criterios no alcanzados. Planeación y dirección
Resulta mucho más adecuado que los estudios mixtos se planeen desde el inicio como tales, de lo contrario pueden no entregar verdaderos resultados mixtos. El planteamiento debe ser claramente mixto, puede incluir preguntas cuantitativas, cualitativas y mixtas, o solamente estas últimas, pero siempre su naturaleza tiene que implicar la recolección y análisis de datos tanto cuantitativos como cualitativos y la mezcla (conversión o integración) de estos. Asimismo, debe haber respeto por la unidad teórica (dirección del paradigma y la teoría) (Morse, 2010). Esta nos orienta a lo largo de todo el proceso y nos recuerda el sentido de la investigación (inductivo en estudios cualitativos y deductivo en los cuantitativos). Es necesario que el investigador mantenga tal unidad en cada etapa del proceso mixto, lo que implica respetar los principios de la inducción en la parte cualitativa y los de la deducción, en la parte cuantitativa. Si uno de los componentes predomina, la aproximación será básicamente del tipo principal, pero para la parte complementaria se mantiene el enfoque correspondiente. Por ejemplo, si mi proyecto es esencialmente cuantitativo pero incorpora algún elemento cualitativo, el proceso se conducirá con base en los principios deductivos, y cuando se trabaje lo cualitativo, se aplicarán los principios de la inducción. Si efectúo una encuesta en una muestra probabilística utilizando un instrumento estandarizado (CUAN), pero incluyo preguntas abiertas (CUAL), al analizar los datos resultantes de estas, procedo generando categorías y aplicando los respectivos principios. Los criterios que integran este dominio se muestran en la tabla 10.5 .
Metodología de la investigación
Tabla 10.5 Criterios para evaluar la calidad de investigaciones mixtas en su dimensión de planeación y dirección.
Dominio o dimensión de calidad Planteamiento mixto
Criterios dentro del dominio (indicadores de calidad) Naturaleza verdaderamente mixta del planteamiento
Necesidad de un planteamiento mixto
Funciones mixtas que cubre el planteamiento
Transparencia racional al justificar el estudio
Unidad paradigmática y teórica Legitimidad paradigmática o validez paradigmática
Calidad en la planeación
Revisión crítica y comprensible de la literatura
Planeación de la transparencia Viabilidad
Definición del criterio
El planteamiento debe reflejar una naturaleza mixta más allá de las ramas cuantitativa y cualitativa. Es necesario que desde los objetivos y preguntas de investigación se explicite la mezcla entre ambas aproximaciones (la forma como interactuarán los dos enfoques en la práctica: conversión de datos, consolidación de información, integración de datos, etc.). Tiene que generarse cuando menos un objetivo y una pregunta mixta. En un estudio mixto es ineludible demostrar que el planteamiento requiere de una solución mixta, más allá de cualquiera de los enfoques puramente cuantitativo o cualitativo. No se aplican los métodos mixtos simplemente por implementarlos, sino cuando una perspectiva híbrida ofrece un mayor potencial de entendimiento del fenómeno abordado (Leech et al., 2010; Newman y Benz, 1998). El planteamiento tiene que cubrir al menos una función o justificación mixta al integrar datos y análisis cuantitativos y cualitativos (triangulación, incremento de la validez, compensación, complementación, etc.). Justificar de manera clara el uso de una aproximación mixta. En la justificación es importante señalar el valor intrínseco que tiene un enfoque mixto para el planteamiento del problema que se abordará. Si la justificación no es adecuada, puede rechazarse una rama del estudio. Desde el planteamiento resulta vital clarificar que se respetarán los principios para las ramas cuantitativa y cualitativa, lo cual habrá de mantenerse a lo largo de todo el estudio. The SAGE Glossary of the Social and Behavioral Sciences(2009x) y Onwuegbuzie y Johnson (2008) han propuesto este criterio que se refiere al grado en que el investigador documenta y justifica el paradigma que orienta el estudio desde la propuesta. Está vinculado a un criterio situado en la elaboración del reporte: legitimidad de la mezcla paradigmática. De hecho, ambos podrían incluirse aquí o en el informe de resultados. Realizar una revisión completa, crítica y comprensible de la literatura. Ello con el propósito de contextualizar al estudio y formular el planteamiento, así como enmarcar y situar los resultados y descubrimientos, a fin de que estos se fundamenten en un sólido rigor interpretativo. La revisión abarcará investigaciones cuantitativas, cualitativas y mixtas relevantes vinculadas con el planteamiento del problema. Hesse-Biber (2010a) y Dellinger y Leech (2007) argumentan que el entendimiento previo de un fenómeno obtenido a partir de la revisión analítica de la literatura perfila el estudio y los descubrimientos e interpretación. Proveer de detalles sobre el paradigma utilizado, el diseño, la recolección y análisis de los datos y la forma como se reportarán ambas ramas y la integración de estas. Justificar la viabilidad del estudio y sus componentes (diseño, muestra, recolección y análisis de los datos), en términos de recursos económicos, tiempo y personal (incluyendo la experticia). Por ejemplo, si el tiempo es corto, difícilmente podemos implementar un diseño secuencial.
29
30
Capítulo 10 Parámetros, criterios, indicadores y/o cuestionamientos para evaluar la calidad de la investigación
Implementación (método, recolección y análisis de los datos)
La implementación abarca el método mixto (diseño, muestra y manejo de los datos) y el análisis. A lo largo de ésta, el investigador debe respetar los procesos y tiempos de las vertientes cuantitativa y cualitativa, no se debe “saltarse” etapas en aras de tener los resultados “rápidamente” (Morse, Niehaus, Wolfe y Wilkins, 2006). Por ejemplo, los estudios secuenciales requieren que se culmine a plenitud una fase antes de iniciar la otra. Cuando agregamos un componente debemos tomar en cuenta esta premisa. Por ejemplo, si tenemos un estudio básicamente CUAL con un componente cuantitativo, y decidimos agregar otro componente (cuan o cual), esto obviamente implicará mayores recursos y tiempo. Debemos implementar únicamente el proceso necesario para responder al planteamiento de investigación. Cuando se aplican los puntos de interfase o integración entre las ramas cuantitativa y cualitativa se deben respetar los respectivos principios de análisis y mezcla. Por ejemplo, si se conjuntan datos de las dos aproximaciones en una matriz con el propósito de efectuar un análisis mixto, el tamaño de muestra debe ser igual para ambas ramas. Asimismo, no es conveniente incorporar datos cualitativos a análisis que requieren que todas las variables tengan un nivel de medición por intervalos o razón. De igual modo, al incluir inferencias cuantitativas y cualitativas debe haber congruencia entre estas y cuando los resultados de ambas aproximaciones no coincidan es indispensable explicar satisfactoriamente por qué no se presentan las coincidencias. En modelos donde una vertiente es dominante, los resultados de la rama principal normalmente son complementados por los resultados de la parte suplementaria (Morris y Burkett, 2011 y Morse, 2010). Tabla 10.6 Criterios para evaluar la calidad de investigaciones mixtas en su dimensión de implementación. Dominio o dimensión de calidad
Criterios dentro del dominio (indicadores de calidad)
Transparencia del diseño
Definición del criterio
Describir el diseño utilizado a partir de una clasificación conocida o sus elementos claves si las tipologías actuales no lo puntualizan. Las descripciones incluyen el peso dado a cada enfoque, el propósito de combinar métodos y la etapa en que se efectúa la integración. Se recomienda visualizar el diseño y la mezcla (gráficamente). Esto se ejemplifica en el capítulo 12 de este centro de recursos en línea.
Idoneidad del diseño
Calidad del diseño Fortaleza del diseño
Rigor del diseño
Consistencia interna del diseño
Fundamentar de manera crítica y sólida los motivos por las cuales el diseño resulta apropiado para el planteamiento y es consistente con la razón para combinar métodos, así como con el paradigma establecido (esto último es parte de la mencionada legitimidad paradigmática). Además, cada enfoque por sí mismo debe ser adecuado para el planteamiento. Identificar las fortalezas y debilidades de cada método y la mezcla o integración. Aquellos diseños y estudios en general que optimizan la amplitud (asociada con la investigación cuantitativa) y la profundidad (vinculada a la investigación cualitativa) consideran racionalmente cómo las debilidades de un método son compensadas por las fortalezas del otro [lo cual es denominado porThe SAGE Glossary of the Social and Behavioral Sciences(2009x) y Onwuegbuzie y Johnson (2008) como legitimidad de minimización de debilidades ], y así se eligen diseños para disminuir tanto los sesgos de cada vertiente como los comunes. Las indagaciones que usan propósitos complementarios logran un sentido más integral y comprehensivo. Seleccionar y aplicar los(elegir métodos técnicas adecuadas de acuerdo con el planteamiento los oprocedimientos para cumplir con los objetivos y responder a las preguntas de investigación). Por ejemplo, el rigor del diseño es comprometido si se pretende triangular y los métodos no son aplicados de manera concurrente e independiente. Durante la ejecución del estudio, lograr que los componentes del diseño embonen entre sí de una manera cohesiva y congruente.
Metodología de la investigación
Tabla 10.6 Criterios para evaluar la calidad de investigaciones mixtas en su dimensión de implementación (continuación). Dominio o dimensión de calidad
Criterios dentro del dominio (indicadores de calidad)
Fidelidad del diseño
Calidad diseñodel
Parsimonia
Legitimidad de la secuencia de las fases del estudio
Calidad de la muestra
Adecuación de la muestra general al planteamiento
Transparencia de los datos
Rigor en los datos
Calidad de los datos Legitimidad de múltiples fuentes de validez
Legitimidad del balance entre los puntos de vista de los participantes y el investigador
Adecuación analítica
Definición del criterio
Implementar todos los procedimientos planeados acorde con el diseño (apegarse a este). En ocasiones, por falta de recursos o tiempo, se realizan ciertos procedimientos de manera incompleta, comprometiendo la fidelidad del diseño (por ejemplo, en la parte cuantitativa aplicar menos encuestas por premura, o bien, si efectuamos solamente un grupo de enfoque porque se nos acabaron los recursos). Respetar los procesos y tiempos de las vertientes cuantitativa y cualitativa, así como la integración de estas en la implementación del diseño, la recolección de los datos y su análisis. Abordar correctamente los efectos resultantes del orden en que se implementan las fases cuantitativa y cualitativa The ( SAGE Glossary of the Social and Behavioral Sciences, 2009x). La secuencia se basa en el planteamiento del problema. Extraer las muestras apropiadas de acuerdo con el planteamiento y el diseño. Las estrategias y técnicas de selección y los tamaños de muestra deben ser adecuadas para ambas ramas del estudio. Lo anterior también resulta importante paraotros dominios como elrigor interpretativo y la transferencia de las inferenciasporque es necesario cubrir la legitimidad en la integración de la muestra total , lo cual impacta la calidad de las metainferencias. El investigador puede efectuar generalizaciones incorrectas por no haber puesto suficiente atención al tipo y tamaño de muestra requerido para cada aproximación o la relación entre las muestras cuantitativa y cualitativa. Para algunos autoresla vinculación entre el muestreo cuantitativo y cualitativo debe producir metainferencias. Describir detalladamente cada uno de los métodos y sus instrumentos para recabar los datos, incluyendo su rol dentro del estudio (fundamentalmente en las etapas de recolección, muestreo y análisis). Implementar los instrumentos y, en general, la recolección de los datos con rigor y de acuerdo con lo planeado en el propio protocolo y el diseño. Esto implica aplicar los respectivos criterios de rigor para los datos cuantitativos y cualitativos, así como en la reconversión y conjunción de estos. Cuando convertimos datoscualitativos en cuantitativos (cuantificación) y los vamos a conjuntar con datos cuantitativos (por ejemplo, en una matriz), Morse (2010) señala un requisito fundamental: los datos cualitativos deben tener una "n" equivalente a los cuantitativos (es decir, mismo número de casos en ambas ramas). Abordar y resolver apropiadamente las cuestiones relativas a los tipos de validez cuantitativay cualitativa en el estudio mixto , además de lograr que los datos conjuntados puedan mezclarse The ( SAGE Glossary of the Social and Behavioral Sciences, 2009x). O'Cathain (2010) precisa que entre las amenazas a la validez mixta resalta la transformación inadecuada de los datos. Otros autores comoTeddlie y Tashakkori (2009) señalan que esta clase de legitimidad implica que las diversas técnicas utilizadas para validar losprocedimientos, análisis e inferencias tanto cuantitativas como cualitativas son pertinentes y rigurosas. Comprender, utilizar y presentar el punto de vista interno y subjetivo de los participantes y la visión externa y más objetiva del investigador, logrando un balance o equilibrio entre ambas perspectivas (Morgan, 2013, Leech et al., 2010; The SAGE Glossary of the Social and Behavioral Sciences, 2009x). Teddlie y Tashakkori (2009) se refieren a este criterio comolegitimidad interna-externa. Aplicar las técnicas apropiadas de análisis cuantitativo, cualitativo y mixto a los datos de acuerdo con el planteamiento del problema, cumpliendo los presupuestos que exige cada una de las ramas.
31
32
Capítulo 10 Parámetros, criterios, indicadores y/o cuestionamientos para evaluar la calidad de la investigación
Tabla 10.6 Criterios para evaluar la calidad de investigaciones mixtas en su dimensión de implementación (continuación). Dominio o dimensión de calidad
Calidad de los datos
Criterios dentro del dominio (indicadores de calidad)
Definición del criterio
Lograr robustez en la conjunción de los datos cuantitativos y cualitativos y su análisis. Al efectuar los análisis el investigador debe argumentar su solidez. Esto se aplica a la conversión de datos Rigor en la integración analítica (cuantificación o cualificación) y al uso de los descubrimientos de un componente para guiar la recolección y análisis del otro. Por ejemplo, debe explicarse y justificarse la conversión de datos. Leech et al. (2010) le denominan eficacia en la integraciónde ambas vertientes.
Interpretación de resultados
La mayoría de las veces en los métodos mixtos los descubrimientos van emergiendo gradualmente y debemos analizar cada uno de manera reflexiva. No tenemos el panorama completo hasta que disponemos de todos los resultados. En ocasiones, si los recursos lo permiten, debemos regresar a recolectar más datos para entender el fenómeno en estudio y responder satisfactoriamente al planteamiento del problema. Por otro lado, la calidad de las inferencias resulta muy importante para los usuarios de una investigación, quienes deben certificarlas como creíbles, auténticas, precisas y confiables. Esta no es solamente un producto sino también un proceso, por lo cual resulta vital considerar cómo se generaron las inferencias y se integraron en metainferencias. Dos grandes dominios aportan a tal calidad: el rigor interpretativo (que las conclusiones se basen en los resultados y descubrimientos) y la transferencia del conocimiento aportado (que abarca la generalización de resultados y la validez externa propias de la investigación cuantitativa, así como la transferencia característica de la investigación cualitativa. Es decir, dónde pueden aplicarse las inferencias y metainferencias, en qué contextos y poblaciones). Tabla 10.7
Criterios para evaluar la calidad de investigaciones mixtas en su dimensión de interpretación.
Dominio o dimensión de calidad
Criterios dentro del dominio (indicadores de calidad) Transparencia interpretativa (denominada también claridad en el establecimiento de inferencias)
Consistencia interpretativa
Correspondencia interpretativa
Rigor interpretativo
Consistencia teórica
Consistencia entre las inferencias y el método
Definición del criterio Tener claridad respecto a qué resultados y descubrimientos emergen de qué métodos (distinguir de qué vertiente proviene cada inferencia: cuantitativa o cualitativa, y cómo se construyeron las inferencias mixtas o metainferencias). Si se carece de tal claridad, no pueden conectarse la calidad de los datos y las inferencias. Congruencia entre las inferencias y los resultados y descubrimientos en los cuales se basan las primeras. Asimismo, las inferencias tienen que ser consistentes entre sí. Alinear las inferencias y el planteamiento. Las conclusiones, descubrimientos e inferencias deben corresponder con los objetivos y preguntas de investigación. Finalmente, en cualquier estudio resulta crucial valorar el grado en que se respondieron las preguntas de investigación y se cumplieron los objetivos. Congruencia de las inferencias con el conocimiento y la teoría disponibles (en relación a estudios previos). Cuando no hay tal consistencia debe explicarse cuidadosamente por qué no se presenta. Coherencia y congruencia lógica entre las inferencias y los elementos del método (diseño, muestreo y muestras, instrumentos de recolección de los datos y procedimientos). Hernández-Sampieri y Mendoza (2012) lo denominan consistencia metodológica. Este criterio resulta vital para otorgar significado a los datos.
Metodología de la investigación
Tabla 10.7 Criterios para evaluar la calidad de investigaciones mixtas en su dimensión de interpretación (continuación). Dominio o dimensión de calidad
Criterios dentro del dominio (indicadores de calidad)
Acuerdo interpretativo entre investigadores
Interpretación distintiva
Eficacia interpretativa
Rigor interpretativo
(denominada también legitimidad política)
Reducción de sesgos interpretativos
Validez incremental
Legitimidad de secuencia
Legitimidad de conversión
Transferencia de conclusiones, inferencias, metainferencias y descubrimientos
Transferencia ecológica
Transferencia poblacional
Definición del criterio Congruencia entre las interpretaciones de diferentes investigadores. Es decir, debe haber un alto nivel de acuerdo entre investigadores respecto a las conclusiones sobre la base de los descubrimientos presentados (que los miembros del equipo de investigación, auditores externos, pares, los participantes u otros investigadores lleguen a conclusiones similares al analizar los resultados). Creswell (2014); O’Cathain (2010) y Lieber y Weisner (2010) hablan de legitimidad políticacuando otros colegas una vez que revisan el trabajo coinciden con las metainferencias emanadas de todo el proceso investigativo. Este criterio podría incluirse también en la difusión de resultados. Credibilidad de las conclusiones e inferencias frente a explicaciones rivales potenciales. Como en todo estudio, el investigador debe descartar otras posibles interpretaciones (ello puede lograrse con ciertas estrategias, por ejemplo: incluir casos negativos o extremos para la parte cualitativa y controlar las variables en la vertiente cuantitativa). Incorporar adecuadamente los descubrimientos e inferencias cuantitativas y cualitativas a las metainferencias (de toda la investigación). Es necesario incluir las inferencias de ambas ramas e integrarse. El investigador tiene que fundamentar su discusión en las dos vertientes y la mezcla, evitando minimizar a alguna de estas. La interpretación general será inclusiva y balanceada. Este elemento implica también un equilibrio entre las muestras cuantitativa y cualitativa, yentre saturación de categorías y análisis de tendencias. Hernández- Sampieri y Mendoza (2012) y Tashakkori (2009) le denominan integración eficazy Teddlie de inferencias . Incluir explicaciones completa, profundas e ilustrativas para las inconsistencias entre los descubrimientos e inferencias (cuando estas se presentan), particularmente si los resultados cuantitativos y cualitativos son contradictorios o incongruentes. En el momento en que se interpretan datos recolectados por diferentes métodos, deben considerarse los sesgos potenciales de cada uno y los que se puedan producirse por las conversiones y mezclas de los datos. Este elemento, cuyo srcen proviene de la tradición cualitativa, nos señala que un investigador no puede anticipar completamente los resultados y descubrimientos, por lo que para establecerlos debe contar con todos los datos y análisis pertinentes. Cada resultado debe ser reflexionado en profundidad y va aumentando la validez general del estudio. En el caso de diseños secuenciales, evaluar si invirtiendo la secuencia de las fases se hubieran tenido inferencias y metainferencias similares o no. Cuando hay conversión de datos es necesario considerar si la cuantificación y/o cualificación producen metainferencias claras y coherentes. Posibilidad de transferir los resultados, inferencias y descubrimientos a otros contextos o ambientes.
Factibilidad de transferir los resultados, inferencias y descubrimientos a otros grupos, individuos o entidades.
33
34
Capítulo 10 Parámetros, criterios, indicadores y/o cuestionamientos para evaluar la calidad de la investigación
Tabla 10.7 Criterios para evaluar la calidad de investigaciones mixtas en su dimensión de interpretación (continuación). Dominio o dimensión de calidad
Criterios dentro del dominio (indicadores de calidad)
Transferencia operacional
Posibilidad de transferir los resultados, inferencias y descubrimientos a otros periodos (frecuentemente al futuro) Factibilidad de transferir los resultados, inferencias y descubrimientos a otros métodos con los cuales puede estudiarse el planteamiento o fenómeno.
Transferencia teórica
Posibilidad de transferir los resultados, inferencias y descubrimientos a otras teorías distintas a la utilizada para abordar el planteamiento.
Transferencia temporal
Transferencia de conclusiones, inferencias, metainferencias y descubrimientos
Definición del criterio
Transferencia interdisciplinar
Posibilidad de transferir los resultados, inferencias y descubrimientos a otras disciplinas o campos (por ejemplo, un descubrimiento en psicología transpersonal transferirlo a la comunicación interpersonal).
Elaboración del reporte y difusión de resultados
Como en toda investigación, el producto final es el reporte y debe corresponder al planteamiento (reflejarlo). Los reportes de estudios mixtos deben cumplir con las especificaciones de diseño y procedimientos, ser claros y transparentes, además de completos, abarcando las partes cuantitativa, cualitativa y de integración. Tabla 10.8 Criterios para evaluar la calidad de investigaciones mixtas en su dimensión de elaboración del reporte y difusión de resultados. Dominio o dimensión de calidad
Criterios dentro del dominio (indicadores de calidad)
Cumplimiento en el uso de recursos
Cumplimiento de especificaciones en el estudio Cumplimiento de los estándares de calidad en todo el proceso investigativo
Definición del criterio
Culminar el estudio apegándose a los recursos que fueron asignados (en tiempo, personal y dinero). Este criterio lo juzgan quienes encargaron el estudio o los usuarios principales. Asimismo, las investigaciones que se demoran más allá de lo planteado pueden ya no ser útiles cuando se concluyen, ya sea porque sus resultados no aplican, han sido superados por otros estudios o el contexto se modificó sustancialmente. Las investigaciones deben ser oportunas. Señalar la manera como se cubrieron las normas de calidad cuantitativas (validez interna y externa, confiabilidad, representatividad, etc.) y cualitativas (credibilidad, confirmación, transferencia, representación de todas las voces, etc.), así como las mixtas (incluidas en estas páginas).
Metodología de la investigación
Tabla 10.8 Criterios para evaluar la calidad de investigaciones mixtas en su dimensión de elaboración del reporte y difusión de resultados (continuación). Dominio o dimensión de calidad
Cumplimiento de especificaciones en el
Criterios dentro del dominio (indicadores de calidad)
Legitimidad de la mezcla paradigmática
No confundir con legitimidad paradigmática, aunque ambos criterios se encuentran sumamente vinculados. La legitimidad de la mezcla se refiere a si las creencias epistemológicas, ontológicas, axiológicas y metodológicas del investigador que se derivan de las aproximaciones cuantitativas y cualitativas son combinadas exitosamente y las diferencias se explican y sustentan en el reporte. Teddlie y Tashakkori (2009) consideran otro concepto similar:legitimidad de la compatibilidad entre visiones: analizar si las metainferencias resultantes reflejan una visión del mundo mixta (holística y gestaltista) que implican cambio e integración.
estudio
Calidad del reporte de investigación
Definición del criterio
Disponibilidad del reporte
Acceso al reporte (vinculado a su publicación en varios medios como revistas académicas, páginas web de universidades y organismos, etcétera).
Disponibilidad de los datos
Acceso a los datos en caso de auditoría de pares o metaanálisis. Los usuarios deben tener total acceso, respetando cuestiones de confidencialidad y otros aspectos éticos.
Transparencia de procedimientos
Mostrar claridad de los procedimientos y cómo se derivaron las inferencias. Los aspectos claves deben ser reportados de manera explícita, solamente así se puede evaluar la calidad de la investigación.
Transparencia de los retos afrontados
Señalar con precisión cuáles fueron los retos afrontados por la naturaleza mixta del estudio y cómo fueron resueltos (O'Cathain, 2010 y Creswell y Plano Clark, 2006). Fortalezas y debilidades de la investigación para las vertientes cuantitativa y cualitativa, así como al integrarlas.
Cumplimiento de especificaciones en la redacción del reporte
Rendimiento
Apegarse a las normas de publicación acorde con un estilo aceptado por la comunidad científica (APA, Vancouver, etcétera). Grado en que el "todo" (investigación mixta) es más que las sumas de sus partes (cuantitativa y cualitativa). Un estudio mixto debe proporcionar más conocimiento que uno cuantitativo y cualitativo efectuados de manera independiente. En ello, la integración de componentes es fundamental.
Aplicación
La aplicación de los resultados, conclusiones, descubrimientos e inferencias posee también dos dimensiones: una cuantitativa que tiene que ver con un mayor número de aportaciones, conocimientos, soluciones e impactos; y otra cualitativa, ligada a la profundidad de estos. Tabla 10.9
Criterios para evaluar la calidad de investigaciones mixtas en su dimensión de aplicación.
Dominio o dimensión de calidad
Criterios dentro del dominio (indicadores de calidad)
Utilidad práctica
Utilidad Utilidad social
Definición del criterio La medida en que los resultados, conclusiones, descubrimientos e inferencias sirven a los usuarios y a quienes toman decisiones para resolver problemas y generar nuevos desarrollos tecnológicos (cantidad y cualidad). El grado en que los resultados, conclusiones, descubrimientos e inferencias sirven para mejorar nuestro entorno y favorecer a la sociedad (cuantitativa y cualitativamente).
35
36
Capítulo 10 Parámetros, criterios, indicadores y/o cuestionamientos para evaluar la calidad de la investigación
Tabla 10.9 Criterios para evaluar la calidad de investigaciones mixtas en su dimensión de aplicación (continuación). Dominio o dimensión de calidad
Criterios dentro del dominio (indicadores de calidad)
Definición del criterio
Utilidad teórica y de conocimiento
La medida en que los resultados, conclusiones, descubrimientos e inferencias aportan al conocimiento y entendimiento de un planteamiento o fenómeno (cuantitativa y cualitativamente) y a la generación de et oría.
Utilidad académica
El grado en que los resultados, conclusiones, descubrimientos e inferencias detonan nuevos estudios y líneas de investigación, pueden integrarse en meta-análisis, son sintetizados y referidos o citados por una comunidad académica (impacto cuantitativo y cualitativo).
Utilidad
Al final de un estudio el mejor criterio para evaluarlo es que se haya enfrentado y respondido satisfactoriamente al planteamiento del problema de investigación.
capítulo
11
El inicio de una investigación El presente capítulo contiene algunas recomendaciones prácticas para los lectores que realizan por vez primera una investigación completa, como una tesis o disertación. Se basa en algunos documentos elaborados en la Universidad de Celaya por Roberto Hernández-Sampieri y los profesores Sergio Méndez Valencia y Ana Cuevas Romo. Los ejemplos provienen de trabajos realizados por estudiantes de educación superior —desde licenciatura hasta doctorado—, de varias instituciones latinoamericanas. Desde luego, el capítulo no pretende ser exhaustivo sino mostrar los traspiés más comunes que podemos cometer en el proceso de investigación, particularmente al inicio.
ANTES QUE NADA, ¡NO TE PREOCUPES NI TE ANGUSTIES! Dice un proverbio Zen: “Muévete y el camino aparecerá”. Ana, Sergio y Roberto pensamos lo mismo en torno a la investigación. ¡Para aprender investigación, investigación!, sin miedo equivocarse, pues si al emprender nuestro estudio nos diéramos cuentahay de que que hacer algo no está bien, estaríamos deacualquier forma aprendiendo y ese debe ser siempre nuestro objetivo. La investigación para presentar un trabajo universitario o una tesis, así como cualquier estudio que tengas que llevar a cabo cuando seas profesional, implica un esfuerzo que demostrará tu tenacidad y capacidad para integrar el conocimiento que se relaciona con el campo profesional que hayas elegido. El “secreto” para desarrollar una investigación de calidad es muy simple: destina un tiempo específico diario o semanal para ello y agrégale constancia. Pero, sobre todo: ¡nunca entres en un estado de pánico o temor, ni te deprimas! Sigue trabajando y rápidamente podrás ver los frutos de tu perseverancia. Sé paciente. Ten siempre en mente tus cursos sobre métodos de investigación. Además, la bibliografía, o las referencias que consultaste, serán de gran ayuda en todo el proceso. Asimismo, a lo largo de tus estudios has ido obteniendo conocimientos que ahora debes incorporar. Busca a los expertos, pues ¡eso también es parte de la investigación! La investigación no solo es saber buscar en los libros o en la red, sino también ubicar y acercarse a quienes tienen más tiempo en el camino de la indagación. Platica con ellos, hazles muchas preguntas sobre el tema de estudio, resuelve todas tus dudas. Normalmente, los investigadores son personas abiertas a compartir los resultados de sus estudios, lo mismo que todos los aprendizajes generados a partir de estos. ¡Anímate! no tengas miedo, son personas como cualquiera; total, si alguno te dice que no, o no está dispuesto a compartir lo que sabe, hay muchos que te recibirán con los brazos abiertos y estarán gustosos de apoyarte. Busca a tus partners , compañeros o amigos, pues hacer investigación en grupo es lo de hoy y créeme, funciona. Realizar indagación en equipo es mucho más fácil, nunca una persona sola va a poder conseguir lo que varias, así que forma tu equipo de investigación, que al igual que cuando vamos acompañados al gimnasio, no solo nos ayudarán con las labores del estudio, sino que nos impulsarán a dar nuestro máximo esfuerzo.
2
Capítulo 11 El inicio de una investigación
La investigación se debe compartir. Imagínate: después del esfuerzo realizado y que todo quede guardado, sería inaceptable. Por eso comparte tus aprendizajes y por supuesto tus resultados, acude a congresos de investigación, ¡publica! Créenos, hay espacio para todo tipo de estudios, la comunidad académica está esperando que más gente se interese en la investigación. Además, es una buena forma de enriquecer tus conocimientos y competencias a través de los comentarios que expertos en el tema hagan en las mesas de trabajo o a través de su arbitraje. Mantente abierto(a) y humilde. La investigación requiere apertura y humildad para seguir aprendiendo, así que si alguna persona te ofrece su punto de vista, escúchala, toma lo que de su aportación sirva para mejorar tu preparación y sigue adelante. Recuerda que “varios pares de ojos, siempre verán más y mejor que uno solo”. ¡Disfruta! Quizá el mejor consejo que padecer. se le pueda dar aque quien estáestás haciendo una indagación es este. La investigación se debe disfrutar y nunca Piensa lo que haciendo llevará a conseguir nuevo conocimiento, resolver una problemática, generar una mejor tecnología u optimizar el modo de vida de ciertas personas, por lo cual debe ser emocionante, provocar pasión, nunca estrés, aburrimiento o desesperación. El primer paso consiste en elaborar tu proyecto de investigación o tesis. Selecciona un tema o una idea de un área que te interese, y en la que, además, te desenvuelvas con facilidad, conozcas bien, te motive o inquiete. Elabora una lista de tales temas y platícalos con tus compañeros, tu familia, profesores y asesores de tu institución. Analiza el que te parezca más conveniente, para disminuir el temor que la mayoría siente con la elaboración de un trabajo de investigación o tesis. Normalmente, la elección del tema te llevará a alguna idea general, la cual debes ir acotando. Acotar el tema o la idea significa ir precisando el área de su objeto de estudio. Por ejemplo, si estudias la licenciatura en derecho fiscal y estás interesado en las reformas tributarias más recientes, es decir, pretendes que la investigación o tesis se centre en este tema, debes mencionar qué es en específico lo que te importa. Podría ser que te motive la valoración de los efectos de las últimas modificaciones al Impuesto Sobre la Renta ( ). De este modo estás particularizando más el tema o lareforma idea. Sinalembargo, es necesariosegmento ahondar ydeprecisar más, por ejemplo: el efecto de la reciente en determinado contribuyentes, digamos,“Evaluar los médicos de cierta ciudad”. Aún debes acotar más el tema: ¿el efecto en cuanto a qué? A lo mejor, lo referente al nivel de recaudación fiscal. En este caso tu estudio se debería centrar en el análisis de tal reforma y el efecto en los niveles de recaudación entre médicos que laboran por su cuenta (profesionales independientes que trabajan en sus consultorios y que emiten recibos o facturas por sus servicios). Ahora sí, ya llegaste a un tema o una idea más concreta que, como recordarás, se traduce en un planteamiento. Al final de la investigación, nos dirás si la reforma aumentó, redujo o no afectó el monto total de lo recaudado en ese sector de dicha población de contribuyentes y las razones (explicación de las causas de ello). Lo anterior implicaría no sólo comparar las estadísticas de recaudación previas y posteriores a la reforma, sino entrevistar a una muestra de médicos de la ciudad donde se desarrolla el estudio. Si cursas la maestría en desarrollo humano, con especialidad en organización y te interesan los temas amplios como sentido de vida y los trabajadores, en principio podríamos decir que esos objetivos son muy generales y abarcan demasiado. Es necesario delimitarlos. ¿Sentido de vida?, ¿desde qué óptica? Podrías decir: me interesa estudiar qué niveles de sentido de vida tiene cierto perfil de trabajadores (digamos, los obreros de la industria del calzado en determinada ciudad) y cómo se relaciona el sentido de vida con el compromiso organizacional, desde la perspectiva de la logoterapia. En este caso, tu trabajo debería consistir en una evaluación del compromiso organizacional con una escala apropiada para ello y del sentido de vida, utilizando un instrumento como el Phil o el de Núñez (2001), en fábricas de calzado de León, Guanajuato, México (por ejemplo), a las cuales tengas acceso; y luego usar métodos adecuados para establecer si hay o no relación entre ambas variables. Imagínate que estás por concluir la carrera de comercio internacional y el tema que tienes en mente para tu tesina o tesis es “Los tratados internacionales de México y la producción agroindustrial”.
Metodología de la investigación
Como ves que es muy extenso, puedes acotarlo y especificar qué tratado (por ejemplo: el Tratado de Libre Comercio con Chile o el Tratado de Libre Comercio con Estados Unidos y Canadá), en qué sentido o área de la producción agroindustrial (por ejemplo, el aumento del flujo del comercio entre los firmantes del acuerdo en determinada producción agroindustrial, digamos, las legumbres). O bien, analizar el efecto del acuerdo en los indicadores de producción del sector agrícola en un rubro concreto. 1 Si estudias medicina y has decidido investigar sobre el embarazo ectópico, debes delimitar tu tema y ubicarlo en un contexto concreto, por ejemplo, sus complicaciones. Y entonces puedes efectuar un estudio de caso (o casos múltiples, digamos cinco, que se hayan presentado en hospitales de tu ciudad). El tema, idea o tópico debe transformarse en un planteamiento de tesis o investigación a desarrollar, lo que quiere decir que un asunto muy general se convierte en una cuestión más específica. Recuerda formaestudio de tratar el tema sea puede ser cuantitativa, cualitativa o mixta. Te recomendamos que si esque tu tu primer completo, cuantitativo o cualitativo. Las investigaciones mixtas son más bien para quienes tienen experiencia en ambos tipos de estudio. Sin embargo, a la larga debes conocer los métodos mixtos porque son el futuro de la investigación (en los países más desarrollados representa ya el presente). También recuerda que los planteamientos cuantitativos suelen requerir de una delimitación más precisa que los cualitativos, pero en cualquier caso tu planteamiento no puede ser general, vago ni impreciso. Las investigaciones cualitativas deben contextualizarse y los conceptos concretarse. No olvides que el srcen de tu planteamiento puede provenir de muy distintas y variadas fuentes: libros, revistas científicas y de divulgación popular, videos, conferencias, foros y páginas en internet (académicas y de redes sociales, por ejemplo), líneas de investigación de tu escuela o facultad, pláticas con tus profesores o investigadores y de la lectura de tesis de compañeros que te precedieron, tus reflexiones acerca de una materia que estudiaste, un trabajo que desarrollaste, etc. Si se te dificulta elegir un tema o plantear uno, acuérdate de las materias que más te gustaron y los contenidos que te provocaron mayor interés. También busca a tus profesores favoritos o a los que imparten metodología de la investigación para que te ayuden. Una vez delimitado el tema o idea: ¡relájate! Ya estás listo paraToma el segundo paso: formalizar tuoplanteamiento de investigación. Heideas aquí algunas sugerencias. un cuaderno, una tableta una computadora de escritorio ¿Cómo? y anota tus respecto del planteamiento sobre el que vas a investigar, desarrollar, inquirir, analizar y/o estudiar. Escribe varias ideas, aunque en el momento no te parezcan relevantes. Por ejemplo, si escogiste investigar sobre los niveles de sentido de vida que tienen los trabajadores de las empresas productoras de calzado de León y su vínculo con el compromiso organizacional, desde la perspectiva de la logoterapia, pregúntate: •
•
•
•
• • • • •
¿Qué es el sentido de vida? ¿Qué es la logoterapia? ¿Qué es el compromiso organizacional? ¿Cómo se definen estos conceptos o variables? ¿Quiénes son los autores más relevantes sobre el sentido de vida y la logoterapia, así como el compromiso organizacional? ¿Cuáles son los enfoques, las teorías y las escuelas de la psicología y otras disciplinas que han tratado el sentido de vida y la logoterapia? ¿Cómo ha sido evaluado o medido el sentido de vida en el ámbito de la logoterapia? ¿Cómo el compromiso organizacional? ¿Por qué son importantes el sentido de vida y el compromiso organizacional? ¿Cómo es la vida de los trabajadores? ¿Cómo es la vida de los trabajadores del calzado? ¿Qué sentido de vida pueden tener? ¿Qué compromiso con su empresa? ¿Cómo funciona una fábrica de calzado?
1 El embarazo ectópico es cuando el embrión se implanta fuera del útero, ya sea en una de las trompas de Falopio, en el ovario, en el canal cervical o en la cavidad pélvica o abdominal, y comienza a crecer allí.
3
4
Capítulo 11 El inicio de una investigación
“Creo que el sentido de vida de los trabajadores es bajo”. Si te surge este pensamiento, analiza: ¿por qué? El sentido de vida puede medirse cuantitativamente y profundizarse cualitativamente. ¿Cuál acercamiento te convence más? En el caso de las modificaciones al ISR, puedes cuestionar los motivos de quienes impulsaron ese cambio, esbozar el efecto general y también los particulares. Asimismo, podrías plantearte ciertas preguntas: ¿en qué beneficia a los médicos y en qué les perjudica?, ¿cómo son los médicos como contribuyentes? Luego de contestarlas podrías expresar algunas ideas al respecto. Si elegiste un tratado comercial, puedes inquirir sobre el significado de este tipo de acuerdos, sus beneficios, amenazas e implicaciones, y reflexionar sobre tus propias ideas en torno a ello. •
¿Cómo es el sector agroindustrial en Chile?
•
¿Cómo es en México?
¿Cómo se han vinculado ambos países comercialmente? ¿Cómo se han vinculado ambas naciones en dicho sector? Formula todas las ideas y las preguntas que consideres respecto de tu tema. Después ordénalas y transfórmalas en un problema para investigar o estudiar, analizar y llegar a conclusiones. Para ello: •
• • • • • • • •
•
•
Selecciona las ideas y preguntas más importantes. Reúne o agrupa ideas o preguntas que sean repetitivas. Especifica y clarifica conceptos vagos. Es necesario que delimites su acepción. Continúa agregando ideas, inquietudes y preguntas. Analiza el enfoque que vas a seguir para elaborar su estudio. Define sus términos y conceptos. Precisa, ejemplifica y delimita. Haz una pausa cuando te canses, tome aire fresco, regresa y sigue perseverando. En la Universidad de Celaya nos funciona “irnos a tomar un buen café capuchino, caliente o frappé, relajarnos y regresar”. A veces, incluso el investigador más experimentado siente que su planteamiento es poco importante, que carece de sentido. Evita este sentimiento, nada más asegúrate de que no trata algo demasiado obvioque o impreciso. Hay profesores son pedantes, presumidos y con un “ego” inmenso, que suelen desestimar los trabajos de los alumnos. No dejes que te desanimen, busca a otros profesores. Recuerda que “nadie lo sabe todo y no hay vacas sagradas”. El verdadero investigador siempre debe ayudar a los demás y recuerda la frase de Hernández-Sampieri: “No hay investigación perfecta”. También, aléjate de los pesimistas, los que dicen “no vas a poder”, porque la realidad es que con actitud y decisión sí vas a poder.
A continuación te sugerimos un esquema visual sobre cómo transitar de la idea al planteamiento del problema (figuras 11.1 y 11.2), lo cual es una secuencia lógica de pensamientos. Figura 11.1 Flujo de pensamientos en el planteamiento del problema. Plantamiento básico del problema
Idea, tópico o tema • • • •
•
Una preocupación Un asunto Algo que requiere solución Algo que te interesa
Escríbela en una frase o párrafo (dos o tres líneas o renglones)
• •
Verbo Frase concreta
Contexto • • •
•
•
Revisar la literatura y ver cómo plantearon tu problema otros investigadores Precisar la frase y agregarle un verbo al inicio
•
•
•
Lugar Tiempo Casos
¿Dónde? ¿Cuándo? ¿Con quiénes o con qué fenómeno?
Metodología de la investigación
Figura 11.2 Ejemplo del flujo de pensamientos en el planteamiento del problema Estudiar cierto tipo de organizaciones públicas Tema más acotado
Estudiar fiscalías o procuradurías nacionales
Plantamiento básico del problema
Contexto Fiscalías o procuradurías nacionales de Argentina, Chile Venezuela, Costa Rica, Uruguay, Perú, México, Guatemala, República Dominicana, Bolivia, Brasil, Paraguay, Honduras, Nicaragua, El Salvador y Colombia
¡Nunca te desanimes!
Determinar qué clases de estructuras organizacionales de diferentes países latinoamericanos propician un mayor número de casos federales resueltos •
Cuáles son los tipos de estructuras organizacionales de las procuradurías nacionales que propician un mayor número de casos federales resueltos en América Latina? •
RECORDATORIO: ALGUNOS EJEMPLOS DE DIFICULTADES COMUNES EN EL PLANTEAMIENTO DEL PROBLEMA A continuación recordaremos y ampliaremos ejemplos de dificultades que pueden presentarse cuando se debe elaborar el planteamiento, los cuales fueron revisados en el capítulo tres de la obra impresa. No olvides que, en ocasiones, con la finalidad de no extender demasiado las explicaciones, sólo se menciona el objetivo del estudio y otras veces únicamente la pregunta de investigación, y no ambos elementos. Además, un ejercicio que recomendamos para los estudiantes es que cuando se muestra el objetivo, se redacte la pregunta y viceversa.
Términos generales, poco específicos •
•
•
Ejemplos de objetivos o preguntas generales, vagas y sin enfocarse:
Evaluar la pobreza en las comunidades de Barranquilla, Colombia. ¿Qué significado tiene “evaluar”? Es muy indefinido en este contexto. Además, ¿qué significa el concepto de “pobreza”? Y finalmente, ¿medir el grado de pobreza por medirlo?, ¿para qué? Debe haber un objetivo más preciso vinculado a conocer las causas de la pobreza en ciertas comunidades específicas y atacarlas para elevar el nivel de vida de sus habitantes (justificación). Incrementar la productividad de las empresas fabricantes de aviones.No es un objetivo de investigación, sino un producto o consecuencia de ella. Además, “productividad” tiene que definirse por sus componentes, y “fabricantes de aviones” es también general, ¿de qué tipo?, algunas aeronaves no son fabricadas sino armadas y sus piezas son producidas en distintas factorías, incluso, empresas. ¿Qué efectos tiene la insulina en el cuerpo humano? ¿Efectos de qué clase?, ¿el cuerpo humano en general? ¿En niños, adolescentes, adultos, adultos mayores de todo tipo? ¿Sanos, enfermos de qué? Muy difuso, muy vago, inaceptable. Esta pregunta tiene que acotarse y desplegarse.
Objetivos o preguntas dirigidas a una etapa del proceso investigativo Planteamientos Objetivo: •
Revisar modelos del clima organizacional. ¿Qué modelos? ¿Qué variables del clima organizacional? ¿En qué contexto? ¿Para qué? Además de ser un objetivo increíblemente vago, la detección, evaluación y comparación de modelos teóricos en una investigación es parte de la revisión de la literatura, nunca un objetivo en sí mismo (salvo un trabajo solicitado por un profesor a sus alum-
5
6
Capítulo 11 El inicio de una investigación
nos para que conozcan los principales modelos del clima organizacional, pero no se trata de una investigación científica —empírica, sistemática y crítica con todos sus elementos, en la cual se aplica todo el proceso—, sino de una monografía). En cambio, en un estudio cuyo objetivo podría ser determinar el efecto del clima laboral positivo sobre el compromiso organizacional en embotelladoras de refrescos (gaseosas) mexicanas, la revisión de la literatura debería abarcar la inclusión, análisis y comparación de modelos de dicho clima. Es una parte de la investigación, no un objetivo del estudio. Pregunta: •
Cómo se mide la presión arterial no es una pregunta de investigación científica, sino de cultura médica general, tal vez para una monografía, pero nada más. Desde luego, en una investigación que involucre a la presión arterial, en la parte de definición operacional de las variables este aspecto debe precisarse, pero no podemos hablar de una investigación cuyo objetivo sea medir la presión arterial.
Lo mismo sucede con objetivos tales como calcular un determinado índice, aplicar un algoritmo, seleccionar un contexto apropiado para un estudio etnográfico, etcétera.
Objetivos o preguntas dirigidas a una consecuencia, producto o entregable de la investigación Planteamientos Objetivos: •
• •
Desarrollar un programa de capacitación en liderazgo asertivo en el aula para los docentes de secundaria de instituciones públicas de Santa Cruz, Bolivia. Producir ganado bovino de mayor peso a través de procedimientos de ingeniería genética. Generar un programa de cómputo para las pequeñas empresas que calcule más rápidamente el impuesto sobre la renta en determinado régimen fiscal.
Como se comentó en el capítulo tres de la obra impresa, objetivos de esta clase se refieren a productos, logros o entregables derivados de un estudio, no a los objetivos de investigación y se incluyen como tales dentro de la justificación, en el planteamiento del problema.
Objetivos o preguntas que no implican una investigación completa (el proceso) sino la obtención de un dato o cierta información Planteamiento Objetivos o preguntas: •
•
Determinar el número de enfermos atendidos por artritis reumatoide durante el presente año en un hospital. ¿Cuántos mexicanos, colombianos y costarricenses ingresaron a Brasil durante el mundial de fútbol de 2014?
•
•
¿Cuántos 2aviones Learjet armaron dos plantas de la empresa Eugemotors durante el último semestre? Calcular el monto que han pagado en concepto de determinado impuesto las empresas mexicanas fabricantes de cemento en el último año fiscal.
Son datos que pueden ser útiles dentro de una investigación, pero no objetivos de ella. 2 Nombre ficticio.
Metodología de la investigación
Preguntas de un cuestionario que se confunden con las preguntas de investigación Algunos alumnos han llegado a confundir las preguntas de un cuestionario, una guía de entrevista o una guía de tópicos de un grupo de enfoque, con las preguntas de investigación, que son asuntos diferentes, aunque estas pueden derivar en preguntas del instrumento para recolectar los datos.
Planteamiento Por ejemplo, en una investigación de mercados efectuada por la empresa Comunicometría para una tarjeta de descuentos en servicios integrales de salud, como rebajas en laboratorios, hospitales, consultas, asesoría médica, entre otros, uno de los objetivos de investigación fue: Ubicar el posicionamiento de una tarjeta de descuentos integrales en salud en la mente de los clientes actuales y potenciales de las principales ciudades de México donde se comercializa.3 •
Además, algunas preguntas de investigación: •
• •
¿Cuál es el grado de conocimiento que tienen los clientes actuales y potenciales sobre el producto o servicio de tarjeta de descuentos integrales en salud? ¿Qué marcas de tarjetas de descuentos integrales en saludconocen los clientes actuales ypotenciales? ¿Qué marca de tarjeta de descuentos integrales en salud recuerdan en primer lugar los clientes actuales y potenciales? ¿Cuál en segundo y tercer lugares?, etcétera.
El término posicionamiento (James, 2014; Ries y Trout, 2005) comprende varios conceptos y para cumplir con dicho objetivo se incluyeron, después de la prueba piloto, entre otras, las siguientes preguntas en el cuestionario: • • •
•
Para usted, ¡¿qué es una tarjeta de descuentos en servicios integrales de salud? ¿Conoce alguna tarjeta médica de descuentos y consultas por teléfono? Si es así, ¿qué tarjetas médicas conoce o ha oído nombrar aunque no tenga contratados sus servicios? De las siguientes marcas de tarjetas médicas que le voy a leer, dígame si conoce o ha oído nombrar alguna, aunque no tenga contratados sus servicios.
Para quienes sí conocen alguna: •
•
Desde su punto de vista, ¿cuál de las tarjetas médicas de descuentos y consultas por teléfono le ofrece mayores beneficios? ¿Por qué? ¿Cuenta con alguna tarjeta médica de descuentos y consultas por teléfono? ¿Cuál?
Para quienes sí cuentan con una tarjeta médica: •
¿Cuál fue la razón principal por la que decidió adquirir su tarjeta médica?
Para quienes no cuentan con una tarjeta médica: • •
¿Por qué no cuenta con una tarjeta médica? ¿Alguna vez tuvo una tarjeta médica de descuentos y consultas por teléfono? ¿Cuál?
Y otras preguntas, las cuales son preguntas del cuestionario, pero no del planteamiento del problema.
3 Por supuesto, el nombre comercial de la tarjeta y el de la empresa se omiten. Cabe señalar que la tarjeta está dirigida a personas de nivel socioeconómico medio en todos sus subniveles. El estudio se llevó a cabo en la ciudad de México, León, Monterrey, Guadalajara, Veracruz, Jalapa y Celaya, entre una población abierta (clientes y no clientes). Es una típica encuesta por muestreo, el cuestionario fue administrado por entrevista.
7
8
Capítulo 11 El inicio de una investigación
Objetivos o preguntas que plantean estudios dispersos (en varias direcciones) Como se mencionó en el capítulo tres del texto impreso, a veces se plantean varios objetivos o preguntas que nos conducen a distintas investigaciones y nos llevan en varias direcciones, lo cual es inadecuado, a menos que las separemos según corresponda y efectuemos varios estudios. Tal es el caso del siguiente planteamiento.
Planteamiento Objetivos: •
•
•
• • •
Determinar el efecto que tiene la satisfacción laboral sobre el involucramiento en el trabajo en empresas mineras productoras de plata en Guanajuato. Analizar la relación entre el clima organizacional favorable, el ausentismo laboral y la remuneración en empresas mineras productoras de plata en Guanajuato. Determinar el grado de sentido de vida de los trabajadores de las empresas mineras productoras de plata en Guanajuato. Conocer el nivel de autoestima de dichos trabajadores. Profundizar en las problemáticas personales de esos trabajadores que inciden en su desempeño. Conocer y profundizar en los valores que tienen tales trabajadores.
Todo esto, simplemente, es difuso y confuso. A veces queremos abarcar tantos aspectos que nos perdemos en demasiados objetivos y preguntas, y lo peor, que en ocasiones se refieren a distintos problemas de investigación. Otros ejemplos: •
• • •
Determinar el efecto del diclofenaco sobre el funcionamiento de los riñones de pacientes con ataques agudos de gota. Analizar el vínculo entre altos niveles de glucosa y artritis reumatoide en adultos mayores de 60 años. Evaluar si la obesidad está asociada con la diabetes y la artritis reumatoide. Analizar el concepto que tienen de sí mismos los adultos mayores de 60 años que padecen artritis reumatoide.
Además de ser objetivos poco precisos e incorrectamente planteados, se refieren a distintas cuestiones. Una vez más, el enfoque es sumamente difuso.
Datos imprecisos o sin fuente en la justificación En ocasiones, los estudiantes incluyen en el planteamiento del problema (en objetivos, preguntas y sobre todo, en la justificación) apreciaciones, valoraciones, información o datos que son inexactos o que no están respaldados por fuentes confiables, lo cual mina la credibilidad de un estudio. Por ejemplo: • •
• • •
•
El robo a casas habitación es cada vez más frecuente (¿qué es frecuente?). El aumento en los salarios de los trabajadores de la mina Laura Franco fue considerable (¿qué es considerable?). Hay mucho descontento entre los empresarios por la falta de crédito. El número de casos de cáncer pulmonar en este año resultó demasiado. La popularidad del Gobierno ha decrecido enormemente (en este caso además del concepto impreciso “enormemente”, ¿a qué se refiere con Gobierno? Puede ser desde la Cámara Federal de Diputados hasta la Presidencia Municipal o un ministerio nacional). Noventa por ciento de los casos de abuso sexual los comete un conocido de la víctima (y no mencionamos la fuente o referencia).
Estas observaciones pueden hacerse como parte de una charla informal en una cafetería o cervecería, pero nunca en una investigación.
Metodología de la investigación
Ejercicio: ejemplos de planteamientos deficientes A continuación mostramos algunos objetivos y preguntas que requieren urgentemente ser revisados y modificados (tanto su redacción como su direccionamiento investigativo), lo cual podrían hacer junto con su profesor o compañeros: Medir el grado de nacionalismo de los políticos regiomontanos o potosinos. Explorar sobre el uso de tarjetas de crédito que realizan las familias sanlorencinas de clase media en la actualidad. ¿Cuál es la estructura y las estrategias que una imprenta offset ubicada en La Paz, Bolivia, en el rango de micro y pequeñas empresas, debe desarrollar para migrar a la era digital? Evaluar cómo se siente el personal con respecto al trato recibido por parte de sus superiores por el hecho de pertenecer a una organización familiar. Diagnosticar el efecto de la administración de la cadena de abastecimiento en las fábricas de automóviles más destacadas de San José en Costa Rica. ¿Cuáles son las perspectivas que los jóvenes santiagueños tienen sobre el tema del aborto? ¿Cuál es el grado en el que un programa de desarrollo humano eleva la autoestima de las mujeres internadas en un reclusorio de la ciudad de Irapuato, México? Evaluar el efecto del uso excesivo de los teléfonos celulares o móviles en los adolescentes limeños. Determinar las causas de mortalidad en Medellín, Colombia. ¿En qué grado los habitantes de San Pedro Sula, Honduras, conocen a las instituciones prestadoras de servicios financieros y las razones de sus preferencias? Conocer y entender la vida cotidiana de los niños de San Salvador que viven en la calle. Obtener información acerca de las personas que son voluntarios en la Cruz Roja de Maracaibo, Venezuela. ¿Qué características debe tener una nueva universidad que se instale en David, Panamá? • •
•
•
•
• •
• • •
• •
•
VISUALIZA GRÁFICAMENTE TU PLANTEAMIENTO DEL PROBLEMA DESPUÉS DE REVISAR LA LITERATURA Y PERFILAR EL ALCANCE DEL ESTUDIO Debemos recordar que después de la revisión de la literatura, el planteamiento del problema puede permanecer sin cambios, modificarse radicalmente o experimentar algunos ajustes. Lo mismo ocurre una vez que hemos definido el alcance o los alcances de nuestra investigación. En esta etapa del estudio te recomendamos que el planteamiento sea visualizado gráficamente de acuerdo con su alcance. Este ejercicio les ha servido a una gran cantidad de estudiantes de diferentes países iberoamericanos para ordenar sus ideas y reevaluar sus planteamientos. Veamos diferentes ejemplos. En el caso del alcance exploratorio, podemos visualizar el planteamiento si escribimos los conceptos o variables claves (ya incluidos en los objetivos y preguntas de investigación), como se muestra en la figura 11.3. Figura 11.3 Conceptos claves en una investigación exploratoria
9
10
Capítulo 11 El inicio de una investigación
Los conceptos son tentativos, puesto que estamos trabajando en un tema o área no estudiada o con antecedentes mínimos. Por ejemplo, supongamos que pretendemos efectuar una investigación cuyo objetivo es “conocer los miedos y angustias que experimentan los niños pequeños (de cuatro a ocho años), de una comunidad indígena chamula en Chiapas durante las cuatro semanas previas a su adopción”. (Pregunta: ¿cuáles son los miedos y angustias que experimentan dichos infantes durante tal periodo?). Hay muy pocos estudios con antecedentes de este tipo específico de infantes, aunque sí se ha generado una considerable cantidad de literatura sobre el estrés de los niños que van a ser adoptados (decenas de artículos en revistas académicas en el área pediátrica, psicológica, sociológica; libros; foros en internet; reportes gubernamentales y de organizaciones no gubernamentales), e incluso existen modelos teóricos sobre el tema. Es posible encontrar todo un mundo de información, pero la mayoría se refiere a países desarrollados, aunque, por supuesto, hay fuentes primarias de países latinoamericanos. Sin embargo, los niños chamulas de esa comunidad tienen su propia lengua y forma de practicar su religión, presentan altos niveles de desnutrición y, en ocasiones, alcoholismo. Por ello, se trata de un estudio de alcance exploratorio. De acuerdo con el planteamiento, los conceptos claves serían los que se muestran en la figura 11.4. Figura 11.4 Conceptos claves en un ejemplo de investigación exploratoria
Lo primero que se debe considerar es si los conceptos reflejan el problema específico que deseas investigar. Si la respuesta es positiva, confirma tu planteamiento y abócate a explorar tales conceptos. Si es negativa, cambia tus conceptos claves, hasta encontrar aquellos que reflejen realmente lo que quieres estudiar. Por ejemplo, puedes decidir (a raíz de la revisión de la literatura y de tus propias reflexiones), que los conceptos claves serán además de miedos y angustias de los infantes, su estrés (ver figura 11.5). Figura 11.5 Modificación de los conceptos claves después de su revisión
Entonces, estos son los conceptos que vas a comenzar a explorar y, en consecuencia, tu planteamiento se modificará o ajustará según sea el caso. Objetivo: conocer los miedos, angustias y losindígena niveles de estrés en queChiapas experimentan pequeños (de cuatro a ocho años) delasuna comunidad chamula durantelos las niños semanas previas a su adopción. (Preguntas: ¿cuáles son los miedos y las angustias que experimentan dichos infantes?, ¿cuál su nivel de estrés?). Desde luego, puedo limitar mi exploración a tales conceptos o agregar otros como percepciones del
Metodología de la investigación
infante respecto de los nuevos padres y familia, su autoestima y cosmopolitismo, y reformular el planteamiento. Así, tengo mayor claridad sobre el inicio de mi exploración y trato de evitar un planteamiento difuso. Con estudios descriptivos, la visualización sería como se presenta en la figura 11.6. Figura 11.6 Variables claves en una investigación descriptiva
Por ejemplo, en el caso de un estudio de mercado cuyo fin es conocer la “lealtad” de los clientes a una tienda departamental o almacén que vende ropa para mujeres en relación a sus empresas competidoras, las variables claves podrían ser las que se señalan en la figura 11.7. Figura 11.7 Variables claves en un ejemplo de investigación descriptiva
Así, visualizo las variables que pretendo describir y continúo con mi estudio. En planteamientos correlacionales el esquema que se debe visualizar podría ser semjante a la siguiente figura: Figura 11.8 Variables claves en un ejemplo de investigación descriptiva
11
12
Capítulo 11 El inicio de una investigación
Ejemplificando en la figura 11.9 tenemos varios casos de variables que mediremos y relacionaremos (dos ejemplos bivariados y uno con tres variables). Figura 11.9 Variables en ejemplos de investigaciones correlacionales
Con planteamientos cuyo alcance es explicativo, la configuración visual podría ser similar a la correlacional, pero se requiere agregar una o más flechas que indiquen la dirección de antecedenteconsecuente o causa-efecto (ver figura 11.10). Figura 11.10 Variables en una investigación explicativa
Concepto
Concepto
o variable
o variable
Metodología de la investigación
Para ilustrar una relación causal te recomendamos que recurras a cualquiera de los ejemplos de estudios explicativos que se presentan en la obra impresa. Una ventaja de la visualización es que podemos prefigurar las hipótesis o variables del estudio. A algunas personas tal vez podrá parecerles que esta forma de esquematizar visualmente es algo “simple”, pero la experiencia nos ha demostrado que es muy útil para los jóvenes que se inician en la investigación.
ALGUNAS RECOMENDACIONES EXTRAS
•
•
•
Localiza las bibliotecas más importantes a tu alcance, entre estas la de tu universidad, conócela y entiende la forma como están clasificados los libros, periódicos y revistas. Para todos los temas hay una gran variedad de bibliotecas: Gobierno Federal, Suprema Corte de Justicia, Gobierno Estatal, Gobierno Municipal, cámaras, institutos, asociaciones, otras universidades, solo por mencionar algunas. Piensa cuáles te pueden ser de utilidad. Busca autores relevantes sobre tu planteamiento del problema. Detecta los tópicos que se relacionan con él, primero por área y luego temáticamente. Pide a los profesores que te hayan impartido materias relacionadas con tu planteamiento que te proporcionen referencias al respecto. Recuerda usar internet para localizar bibliografía apropiada. Pero ten en mente que:
1. Internet no es como una biblioteca, pues su lógica es diferente. Es muy fácil perderse en sitios que no tienen 2.
3.
4. 5. 6. 7. 8.
referencias útiles para tu planteamiento (no se trata de encontrar “algo”, sino de localizar referencias que te sirvan verdaderamente). Los directorios web que clasifican temáticamente (by subject) pueden señalarte las fuentes principales de enlaces (links) para materiales y documentos que te sean de utilidad para tu planteamiento. Además, varias bibliotecas o librerías públicas y de corte académico, como la Internet Public Library, pueden colocar juntas listas de vínculos en sitios web, categorizados por tema. El reto estriba en detectar aquellos sitios que contengan el mismo tipo de contenido sustantivo que puedes encontrar en una biblioteca con miles de títulos y bien organizada. En internet se puede obtener software que te ayude a localizar listas de páginas web que contengan frases o términos para búsquedas automáticas de índices; estas son bases de datos con algunas o todas las palabras que aparecen en dichas páginas, con las cuales se han construido índices. El software envía un programa denominado “spider”, “crawler” o “robot”. La “araña” sigue hipervínculos de página a página a través de la web, y trae información de regreso al sistema de búsqueda para ser colocado en un índice. La mayoría de los índices contienen palabras “claves” para guiar la búsqueda de referencias por medio de internet. Por su parte, los directorios son temáticos y los índices se fundamentan en dichos términos “claves”. Yahoo, BUBL y Galaxy son catálogos temáticos. Magellan, Lycos e InterNIC son directorios. Argus y WWW Virtual Library son guías de índices. Existen tutoriales de búsqueda de referencias para Netscape y otros servidores. Asegúrate que en tu servidor puedas usar la instrucción “Go” list, “History” list, el botón “Back” y la caja “Location” donde la url pueda ser tecleada. Recuerda que puedes guardar e imprimir las referencias que encuentres y después volverlas a abrir con “abrir archivo” u “open file”. También, que puedes mantener abiertas las páginas web mientras trabajas en tu procesador de textos. Existen cientos de bancos de datos para cada ciencia, especialidad y materia; algunos ejemplos se ofrecen en los libros sobre metodología que usas como textos en clase. En el apéndice 2 de este mismo centro de recursos en línea encontrarás varios de ellos. •
Así, entre las referencias que obtengas en bibliotecas, más las que te proporcionen los profesores, agregadas a las que localices vía internet y de tus consultas a expertos (mediante foros, correo electrónico o especialistas a los que tengas acceso), tendrás un panorama claro. Además, observa qué autores son los más citados en las
•
•
referencias que has consultado y busca documentos escritos por ellos. En todo el proceso, toma notas, resume, agrega más ideas; pero nunca pierdas el enfoque de tu planteamiento: recuerda que tu búsqueda de información debe ser precisa y centrada en él. Asimismo, acuérdate una vez más que las referencias pueden ser muy variadas: libros, CD, videos, artículos en páginas web, artículos en revistas y periódicos, ponencias en congresos, entrevistas con expertos, etcétera.
13
14
Capítulo 11 El inicio de una investigación
Lo más importante: no te apartes del planteamiento. Incluso puedes descubrir por accidente referencias que no habías pensado recolectar (serendipity). Mantén tu mente abierta para aprender sobre el tópico específico que elegiste. Desarrolla tu investigación o tesis, siempre consulta a tu director o asesor, genera un esquema de trabajo para presentarle el material o avances y cumple con fechas de entrega de acuerdo con la calendarización establecida. En el proceso: fija tu posición respecto del planteamiento de investigación y el contenido de las referencias que vayas incorporando, piensa en cómo organizar el material analizado y ve estableciendo paulatinamente conclusiones. Contrasta puntos de vista. Mantén el desarrollo de tu investigación o tesis. Elimina información irrelevante. Si se trata de una revisión muy novedosa, localiza las investigaciones sobre tu planteamiento a la brevedad posible. Si es una investigación empírica, integra antecedentes y tu marco teórico, además de planear y llevar a cabo tu estudio. Si estamos hablando de un proyecto, modelo, sistema o equivalente comienza a desarrollarlo por etapas que fijes de manera secuencial. Avanza, no te detengas, dedica siempre tiempo para que puedas apreciar tu propio progreso. Recuerda que la investigación sólo se aprende, como todo en la vida, haciéndola. Por último, recuerda los principios de Hernández-Sampieri para terminar la investigación:
1. Ten fe en ti mismo, usa tu instinto. 2. Que tu investigación no sea un viacrucis, un calvario; diviértete al hacerla, disfruta el aprendizaje que te proporciona. 3. La investigación en equipo es más productiva, eficaz y agradable (hasta te puede servir para comenzar una relación amistosa e incluso, romántica, pues se han dado casos). 4. No te frenes, sigue pedaleando, pues de lo contrario “te puedes caer como de una bicicleta”. 5. No te preocupes, no existe la investigación perfecta. 6. Hazlo, simplemente, hazlo. 7. Si crees, como yo, en Dios, el investigador supremo, consúltalo. De una u otra forma te iluminará. Y recuerda, esta edición de Metodología de la investigación te brinda una obra impresa, capítulos adicionales, ejemplos, diversos manuales y programas, apéndices, documentos y otros recursos que te pueden apoyar; úsalos, fueron hechos pensando en ti y tus maestros. Revisa su contenido. ¡ADELANTE!
capítulo
12
Ampliación y fundamentación de los métodos mixtos
Los métodos mixtos no nos proveen de soluciones perfectas; sin embargo, hasta hoy, son la mejor alternativa para indagar científicamente cualquier problema de investigación. Conjuntan información cuantitativa y cualitativa, y la convierten en conocimiento sustantivo y profundo. ROBERTO HERNÁNDEZ-SAMPIERI
INTRODUCCIÓN En el presente capítulo se amplían los contenidos del capítulo 17 del libro: “Los métodos mixtos”. El lector encontrará más definiciones de dichos métodos, posiciones respecto de la perspectiva mixta, una profundización del sustento filosófico del enfoque híbrido —el pragmatismo—, así como comentarios en torno a las barreras que pueden surgir cuando se intenta integrar la investigación cuantitativa y cualitativa. ambién se agregan los siguientes temas: otras tipologías sobre los diseños mixtos, consideraciones adicionales respecto del muestreo en estudios mixtos, los tipos de triangulación, el análisis mixto, el rigor (validez) de los métodos mixtos y la identificación de diseños mixtos. Por último, se incluyen más ejemplos de estudios híbridos. Algunas partes pueden resultar demasiado conceptuales o complejas para quien se inicia en el tema de la investigación, con excepción de los ejemplos adicionales, por lo que sugerimos se revise este capítulo después de leer el referido de la edición impresa.
DEFINICIONES ADICIONALES DE LOS MÉTODOS MIXTOS al como se comentó en el capítulo 17 del libro impreso, los métodos mixtos han recibido varias denominaciones. Una de ellas sería la de Van y Cole (2004), quienes los nombran como “metodología sintética interpretativa”. Estos autores comentan que los enfoques cuantitativo y cualitativo son métodos y que el mixto es una metodología. Stenner y Stainton (2004) lo llamaron “cuali-cuantilogía”. En realidad, es un enfoque que, en la práctica, se utilizaba ya desde las primeras décadas del siglo xx en diversos campos del conocimiento. Por ejemplo, en el trabajo arqueológico y criminológico, ya que la labor(como investigativa se basabay laeninducción datos cuantitativos (por del ejemplo, análisis químicos) y datos cualitativos la observación en el escenario crimen). Para Creswell y Plano-Clark (2011), los métodos mixtos son una estrategia de investigación o metodología con la cual el investigador recolecta, analiza y mezcla (integra o conecta) datos cuantitativos y cualitativos en un único estudio o un programa multifases de indagación. Curry y NunezSmith (2014), Ivankova (2014), así como ashakkori y eddlie (2009 y 2003), señalan que los
2
Capítulo 12 Ampliación y fundamentación de los métodos mixtos
métodos mixtos constituyen una clase de diseños de investigación que emplean las aproximaciones cuantitativa y cualitativa para elegir tipo de preguntas, métodos de investigación, recolección de datos, procedimientos de análisis e inferencias.
¿ES POSIBLE FUSIONAR LOS ENFOQUES CUANTITATIVO Y CUALITATIVO? POSTURAS ANTE LOS MÉTODOS MIXTOS Ante la posibilidad de fusionar ambos enfoques, ya Grinnell (1997) se formulaba una serie de cuestionamientos: ¿las lógicas inductiva y deductiva deben estar vinculadas con enfoques específicos? Por ejemplo, si en un estudio empleamos un esquema inductivo fundamentado en una postura cualitativa, ¿esto significa también debamos utilizarDe procedimientos de recolección de datos queenconuna frecuencia se asociany con que investigaciones cualitativas? manera alternativa, ¿un estudio basado lógica deductiva guiado por una teoría producto de investigación cuantitativa siempre tendrá que vincularse con procedimientos de recolección de datos y diseños ligados a tal tipo de investigación, como los experimentos y las encuestas? Las respuestas son complejas, pero han dado pie a varias posturas en torno a la posibilidad de emplear los enfoques cuantitativo y cualitativo en una misma investigación. ales posiciones son básicamente las siguientes: a) “Los fundamentalistas”. Son investigadores que defienden uno de los dos enfoques y desdeñan al otro. Ya sea que hayan adoptado el cuantitativo y subestiman al cualitativo, al cual definen como “pseudociencia” (subjetivo, sin poder de medición, etc.), o que han adoptado el cualitativo y desprecian el cuantitativo por considerarlo “reduccionista” e “impersonal” (incapaz de capturar el verdadero significado de la experiencia humana, etc.). A estos extremistas —de ambos enfoques— que sólo aceptan una perspectiva para investigar y, desde luego, rechazan el enfoque mixto, les denominamos “fundamentalistas metodológicos”. Los radicales cualitativos sostienen que la idea de combinar métodos es “ingenua” y resulta incompatible con el constructivismo, que no acepta que exista una versión correcta de la realidad, sino que sólo se tienen distintas versiones competitivas, y si no hay una correcta, consecuentemente el enfoque mixto es “inútil”. Por su parte, los radicales cuantitativos consideran la imposibilidad de mezclar datos que no son comparables. Otro argumento que extremistas de ambos enfoques esgrimen es que los métodos cuantitativo y cualitativo se emplean para generar diferentes preguntas y puede ser muy complicado utilizarlos para estudiar el mismo problema. En resumen, como señala Green (2008) respecto de los radicales: parten de la premisa de que ambas visiones son incompatibles. Cada uno representa una perspectiva coherente que debe ser respetada y preservada, por lo que, según ellos, no se pueden mezclar o combinar en un mismo estudio. b) “Los separatistas”. Se trata de investigadores que consideran que ambos enfoques son opuestos (antitéticos), aunque les otorgan el mismo estatus (los respetan por igual), y regularmente muestran preferencia por alguno de los dos, además de que pueden emplear ambos, pero en estudios diferentes. De acuerdo con Greene (2008) y Grinnell (1997), los “separatistas” no consideran que las aproximaciones sean incompatibles, pero piensan que son distintas en aspectos importantes y que estas diferencias son valiosas y deben resguardarse para mantener la integridad metodológica al expandir el alcance del estudio, razón por la cual los métodos cuantitativo y cualitativo deben mantenerse apartados uno del otro. c) “Los integradores”. Entre quienes sostienen este enfoque existen matices, desde quienes opinan que las premisas que sustentan los métodos cuantitativo y cualitativo son distintas, pero que resultan en sí mismas construcciones sociales e históricas que no son “inviolables o sacrosantas” (Greene, 2008, p. 7), por lo cual los métodos pueden tener cierto grado de integración y al hacerlo, es posible “cosechar” nuevos conocimientos, hasta autores que consideran que las incompatibilidades entre paradigmas son reconciliables mediante nuevos marcos de referencia como el pragmatismo, el realismo científico y la transformación-emancipación, lo que permite integrarlos. odos ellos aceptan el enfoque mixto.
Metodología de la investigación
“Los pragmáticos”. Son investigadores que brindan el mismo estatus a los enfoques cuantitativo, cualitativo y mixto. Admiten cualquier posibilidad. Asimismo, señalan que es el planteamiento del problema y las circunstancias las que “dictan” el método (Creswell, 2014; Morse y Niehaus, 2010 y eddlie y ashakkori, 2009). En este sentido, el matrimonio cuantitativo-cualitativo es conveniente en un mismo estudio sólo si es el enfoque que mejor puede ayudarnos a responder las preguntas de investigación establecidas. Mertens (2010) denomina a estas posiciones: incompatibilidad de enfoques (fundamentalistas y separatistas), complementariedad (integradores) y pragmática (pragmáticos). Creswell (2013a) comenta que la contraposición de enfoques y la posibilidad de mezclarlos se ha centrado en la compatibilidad-incompatibilidad entre la visión epistemológica y los métodos. d)
Henwood (2004) llama “democratizadora” a la postura pragmática, e indica que la insistencia en las diferencias entre los enfoques cuantitativo y cualitativo no nos llevan a ninguna parte. Asimismo, señala que la polarización es hipercrítica, restringe el quehacer del investigador y bloquea nuevos caminos para incluir, extender, revisar y reinventar las formas de conocimiento; por tal motivo, el enfoque mixto es la posición que promueve de mejor manera la innovación en las ciencias. Es una ruta que al menos vale la pena explorar. Lo que resulta indudable es que la investigación mixta aumenta la posibilidad de ampliar las dimensiones de nuestro proyecto de investigación, y el sentido de entendimiento del fenómeno de estudio es mayor y más profundo (Ivankova, 2014; Creswell, 2013a; Plowright, 2011; Mertens, 2010; Morse y Niehaus, 2010; Newman, 2009; Hernández-Sampieri y Mendoza, 2008; Ridenour y Newman, 2008). Desde una perspectiva práctica, poseer diferentes tipos de evidencia incrementa nuestra capacidad para describir, entender y comunicar descubrimientos a un rango mayor de audiencias (Wheeldon, 2010). Desde luego, esta ventaja conlleva un reto: identificar e implementar de forma apropiada, eficiente y efectiva los métodos que producirán resultados significativos y claros. En las ciencias sociales, particularmente las enfocadas en el comportamiento humano, no podemos decir que hay evidencia contundente que indique que un tipo particular de datos (cuantitativos o cualitativos) representan mejor las conductas o los ambientes (Lieber y Weisner, 2010), ni que una clase de ellos Way, puedan 2008). analizarse solo de una manera (Johnson y Christensen, 2012; Yoshikawa, Weisner, Kalil y Por ejemplo, diversos institutos nacionales de salud fueron formados en distintos países, entre otras cuestiones, con la finalidad de diseñar e implementar programas preventivos para evitar la transmisión de distintas enfermedades como el VIH. Algunos de sus estudios han utilizado de manera combinada un diseño etnográfico y un cuasiexperimento (diferentes condiciones médicas), recolectando datos cuantitativos (biológicos) y datos cualitativos (experiencias, preguntas clínicas) de los participantes. Estos últimos han servido como base para adaptar la intervención al contexto cultural de cada nación. Asimismo, se han comparado los resultados cuantitativos de diversos países, pero el marco interpretativo incluyó la información etnográfica específica de cada contexto. En realidad, es posible que el investigador proceda desde el principio con base en lo cuantitativo y lo cualitativo, mezclando todo en un solo proceso y bajo cualquier aproximación inducción y deducción, o en paralelo. Por ejemplo, puedo comenzar deductivamente y al recolectar y analizar datos, utilizar elementos cualitativos, o iniciar inductivamente y al recolectar y para analizar la información emplear herramientas cuantitativas. Aceptar esta perspectiva implica tener en mente los métodos mixtos en cada momento y usar todas las posibilidades cuando se crea conveniente. En realidad, los pasos comunes son la idea, el planteamiento y laesrevisión de laa literatura. A partir de ahí puedo tomar componentes de ambos enfoques. Lo importante responder las preguntas de investigación. En resumen, los métodos mixtos significan mayor amplitud, profundidad, diversidad, riqueza interpretativa y sentido de comprensión.
3
4
Capítulo 12 Ampliación y fundamentación de los métodos mixtos
PRAGMATISMO En el capítulo 17 del texto impreso se asentó que la visión filosófica y metodológica que da sustento a los métodos mixtos es el pragmatismo (Creswell, 2014 y 2013a; Morgan, 2013; Johnson y Christensen, 2012; Morris y Burkett, 2011; Morse y Niehaus, 2010; Feilzer, 2010; ashakkori y eddlie, 2008a y 2008b; Hernández-Sampieri y Mendoza, 2008; Johnson y Onwuegbuzie, 2004 y Greene, 2004). 1 El pragmatismo (término que tiene su srcen etimológico griego en la palabra “pragma”, acción, hecho), 2 que integra diversas ideas principalmente de John Dewey, William James, Charles S. Peirce y Karl Popper, sostiene que para los investigadores la importancia debe encontrarse en las aplicaciones, lo que funciona, lo que resuelve y aporta respuestas a las preguntas de investigación (Creswell et al., 2008). Cuando se adopta una postura pragmática se acepta la posibilidad de “colocar” múltiples paradigmas en un solo estudio (aunque uno pueda ser el predominante) y estar abierto a todas las posibilidades en cuanto a diseños, estrategias de muestreo, instrumentos de recolección de datos y métodos de análisis. Por ejemplo, si el diseño seleccionado es el explicativo secuencial y se otorga mayor importancia a la dimensión cuantitativa, el paradigma predominante puede ser el pospositivista, pero si el diseño elegido es el exploratorio secuencial con más importancia en lo cualitativo, el paradigma esencial que guíe al estudio puede ser el interpretativo-naturalista. Sin embargo, lo anterior no implica “abandonar” a los demás paradigmas y sus postulados. El pragmatismo rechaza que debe escogerse una de las categorías de la dicotomía cualitativa-cuantitativa sobre el contexto. Es más, la impugna, ya que considera que se trata de un continuo cuantitativocualitativo, cuyos extremos son relativos. Asimismo, va en contra tanto de que los resultados sean únicamente específicos de un ambiente en particular (enfoque cualitativo), como de que los resultados sean sólo una instancia de algún conjunto de principios generalizados (enfoque cuantitativo). Esta corriente se orienta hacia un “realismo ontológico”, que abarca al realismo subjetivo, al realismo objetivo y al realismo intersubjetivo. El pragmatismo proporciona un conjunto de premisas sobre el conocimiento y la búsqueda que apuntala el enfoque de los métodos mixtos y lo distingue de la aproximación puramente cuantitativa basada en la filosofía (pos)positivista, y de la aproximación puramente cualitativa fundada en la filosofía constructivista o interpretativa (Johnson y Onwuegbuzie, 2004). Esta visión o paradigma adopta un enfoque explícitamente orientado por las contingencias y los valores frente a la investigación. Rechaza el principio de la incompatibilidad de los paradigmas y una visión única para efectuar estudios en cualquier campo del conocimiento (Hernández-Sampieri y Mendoza, 2008). Refuerza el pluralismo y la sinergia. En términos de Johnson y Onwuegbuzie (2004), el pragmatismo traducido a la investigación mediante métodos mixtos implica elegir la combinación o mezcla de métodos y procedimientos que funcionan mejor para responder las preguntas de investigación. Ante el relevante cuestionamiento de Mertens (2012): ¿qué es primero? ¿El paradigma o la aproximación? La secuencia de acuerdo con Roberto Hernández-Sampieri es: primero, el planteamiento, luego el enfoque y el paradigma. Pero es una simple opinión más. Cada lector tendrá la suya y resulta muy respetable. El pragmatismo constituye una postura que ha sido perfeccionada en nuevas direcciones (los neopragmáticos), como las que proponen Rorty (2014, 2000 y 1991)3 y Rescher (2009 y 2005). Johnson y Onwuegbuzie (2004) sostienen que es como una filosofía que puede ayudar a tender puentes entre aproximaciones investigativas, por lo que presentan algunas deficiencias potenciales del pragmatismo (oportunidades o retos, diría Christian Paulina Mendoza, términos más adecuados desde nuestro punto de vista), las cuales se muestran más adelante enfocadas en la investigación mixta y deben ser consideradas por quienes lleven a cabo estudios híbridos y apliquen este paradigma. Los filósofos y los investigadores inclinados hacia el pragmatismo también sugieren que podemos alcanzar cierto acuerdo sobre la importancia de diversos valores y deseos finales derivados culturalmente, 1 La mayoría de los autores coinciden en que el pragmatismo es el fundamento de los métodos mixtos, aunque también la teoría crítica, el paradigma transformativo y el posmodernismo. Nos centraremos en el primero para no complicarles a los alumnos que revisan por primera vez los métodos mixtos, el panorama filosófico que los contextualiza. 2 Visnovsky (2005). 3 Leach y Tartaglia (2014), editores de textos de Richard Rorty.
Metodología de la investigación
como prevenir la deserción escolar, reducir el uso de drogas ilícitas por parte de menores de edad, enseñar más eficazmente a estudiantes de todas las edades y niveles, diseñar medios de transporte menos contaminantes, generar materiales de construcción más flexibles y al mismo tiempo resistentes, ayudar a las mujeres y hombres que tienen baja autoestima, motivar a diferentes grupos para que estén más satisfechos con sus estilos de vida, facilitar que las personas mejoren su salud, evitar la discriminación, reducir las incapacidades mentales, crear un hábitat más adecuado para todos los seres humanos, incrementar el empleo, confrontar crisis económicas globales y epidemias, y muchos otros más. Los métodos mixtos representan un intento por legitimar la utilización de múltiples enfoques para resolver los planteamientos de problemas de investigación, más que restringir las elecciones de los investigadores. Rechazan el dogmatismo y las visiones unilaterales. Son una forma creativa, expansiva, plural, complementaria y ecléctica de elegir la forma depor indagar y conducir estudios. El planteamiento es lo más importante dentro del proceso investigativo, lo cual el método debe seguirlo de manera que se responda a las interrogantes propuestas de la manera más útil, profunda y completa. Para efectuar un estudio debemos considerar todas las características relevantes de la investigación cuantitativa y cualitativa. A continuación se exponen las características generales del pragmatismo y sus retos potenciales enfocados en la investigación mixta.
Características generales del pragmatismo El pragmatismo posee algunas características distintivas que han sido consideradas por autores como Mertens (2012); eddlie y ashakkori (2012); Creswell y Plano Clark (2011); Biesta (2010); Johnson y Onwuegbuzie (2004); Greene (2004); Rorty (2000 y 1991) y Rescher (2009 y 2005), las cuales resumimos a continuación:4 a) La idea del pragmatismo ha sido encontrar un “área” intermedia entre los dogmatismos filosóficos-epistemológicos y el escepticismo, y proponer una solución trabajable y realista, que se aleje de dualismos metodológicos respecto de los cuales históricamente no se han podido establecer acuerdos. b) Esta corriente rechaza las dicotomías tradicionales (por ejemplo, racionalismo versus empirismo, realismo opuesto al antirrealismo, determinismo en contraposición al total liberalismo, subjetivismo versus objetivismo) y por lo general prefiere versiones más moderadas y de sentido común de los marcos filosóficos basadas en su capacidad para resolver adecuadamente ciertos problemas (de conocimiento, prácticos, etcétera). c) Reconoce la existencia e importancia del mundo físico o natural, así como del mundo social y psicológico emergente que incluye el lenguaje, la cultura, las instituciones humanas y los pensamientos subjetivos. d) Visualiza una realidad intersubjetiva, niega que existan la “objetividad” y “subjetividad” totales. e) Al evaluar fenómenos sociales, para la interpretación de la realidad le otorga un alto valor e influencia al mundo interior y a la experiencia humana. f) El conocimiento es visto como construido, pero también fundamentado en la “realidad” del mundo que experimentamos y en el cual vivimos. g) Reemplaza a la históricamente popular distinción epistémica entre el sujeto y el objeto externo que mantiene una visión puramente naturalista y los considera como independientes, tomando en cuenta los procesos y las transacciones entre el organismo y su medio ambiente, así como la interdependencia sujeto-objeto. h) Endosa al falibilismo,5 la idea de que la búsqueda del conocimiento es “falible, no exenta de posibilidad de error” (las creencias actuales, los paradigmas y las conclusiones no son vistas como 4 La mayoría se encuentran sumamente vinculadas y en ocasiones parecerían redundantes, pero preferimos correr el riesgo de destacar que el de obviar. 5 “Por falibilismo entiendo aquí la idea, o la aceptación del hecho, de que podemos equivocarnos, y de que la búsqueda de la certeza (e incluso la búsqueda de una alta probabilidad) es una búsqueda equivocada. Pero esto no implica que la búsqueda de la verdad sea una equivocación. Por el contrario, la idea de error implica la de verdad como el patrón que puede no ser alcanzado. Implica que, si bien podemos buscar la verdad, e incluso podemos encontrarla (como me parece que lo hacemos en muchos casos), nunca podemos estar bien seguros de haberla encontrado” (Popper, 1961, pp. 375-376).
5
6
Capítulo 12 Ampliación y fundamentación de los métodos mixtos
i)
j)
perfectas, totalmente ciertas, definitivas o absolutas); también valida el eclecticismo y el pluralismo (por ejemplo, diferentes teorías y perspectivas pueden ser útiles, aun cuando resulten conflictivas; y la observación, la experiencia y los experimentos son formas de indagación del mundo físico y social igualmente útiles y válidas). Las teorías son consideradas como instrumentales (se convierten en verdaderas y son auténticas en diferentes grados, de acuerdo con lo bien que puedan funcionar, explicar los fenómenos y trabajarse); al respecto, los criterios más importantes para evaluar teorías son la capacidad predictiva y la aplicabilidad. La indagación humana cotidiana (nuestra interacción diaria con el medio ambiente físico y social) es tan importante (análoga) como la indagación científica y experimental.
k)
Los investigadores deben basarse en cuestiones (por ejemplo, funcionen, trabajen ayuden a entender con mayor profundidad el universo, nuestrométodos) mundo yque entorno, mejoren nuestray calidad de vida y nos permitan sobrevivir como especie. Obtenemos evidencia que nos provee de respuestas que en última instancia son tentativas. Por ejemplo, la indagación científica suministra las mejores respuestas que podemos generar, pero en el largo plazo, el uso de una epistemología evolutiva como el pragmatismo nos conduce a verdades más amplias y profundas, y con mayores aplicaciones. La reciente sugerencia de que puede existir más de un universo (universos paralelos) es la mejor muestra de ello (Hernández-Sampieri y Mendoza, 2008). l) El pragmatismo favorece fuertemente un empirismo práctico, como el patrón que determina lo que funciona, lo que trabaja. m) Las perspectivas sobre la verdad, el significado y el conocimiento son tentativas y pueden cambiar con el tiempo. Lo que obtenemos cotidianamente a través de la investigación debe ser visto como “verdades provisionales”. n) Si creemos en Dios, la “verdad absoluta” sólo la posee Él; por el momento únicamente se logran “verdades temporales o parciales e instrumentales” por medio de la experiencia y la experimentación. o) El contexto de los fenómenos o problemas de investigación, ya sean físicos, biológicos o sociales, es relativo. Por ejemplo, el transcurso del tiempo no es el mismo en nuestro planeta que si viajáramos fueraverdades de este en una nave espacial a una velocidad cercana a la de la luz. Las instrumentales son un asunto de grado (algunas estimaciones son más verdaderas que otras) y no se “estancan”. q) El pragmatismo se orienta hacia la acción y el filosofar debe ir acompañado de diversas acciones. Hernández-Sampieri y Mendoza (2008) sostienen que el pragmatismo implica una filosofía de la ciencia, pero con un sentido concreto. Sin embargo, algunos autores son mucho más drásticos y señalan que el pragmatismo es, en cierto sentido, “antifilosofía” (Johnson y Onwuegbuzie, 2004). r) Adopta una aproximación hacia la investigación de forma explícita que se deriva de los valores culturales, e ideológicamente endosa de forma específica los valores compartidos como la libertad, la democracia, la equidad, el progreso y un sentido altamente humano. s) Para el pragmatismo la teoría debe ser práctica y eficaz. t) Los organismos están en constante evolución (Charles Darwin ha nutrido al enfoque pragmático), adaptándose a nuevas situaciones y ambientes. El pensamiento sigue un proceso dinámico y homeostático de creencia, duda, indagación, modificación de la creencia, nueva creencia, nueva búsqueda…, de manera prácticamente infinita, donde el investigador y la comunidad académica intentan de forma constante mejorar el conocimiento sobre la base de entendimientos pasados y de manera que encaje y trabaje adecuadamente en el mundo donde opera. El presente siempre es un nuevo punto de partida. u) Rechaza en general el reduccionismo (por ejemplo, reducir la cultura, los pensamientos y las creencias a sólo procesos neurobiológicos). v) Ofrece los métodos mixtos para resolver los tradicionales dualismos filosóficos, así como para hacer elecciones metodológicas. w) Elimina la noción “uno a uno” entre paradigma, enfoque y método. p)
Metodología de la investigación
Los dos principales retos del pragmatismo han sido comentados por Johnson y Onwuegbuzie (2004): a) los autores que se guían por el marco interpretativo transformativo-emancipatorio han sugerido que los investigadores pragmáticos algunas veces no pueden contestar para quién es útil una solución pragmática, y b) el significado de utilidad y lo que es “trabajable” puede ser vago a menos que los investigadores lo expliciten al generar sus teorías. Denscombe (2008) discierne cuatro facetas de la forma en que el pragmatismo subyace a la práctica de los métodos mixtos, las cuales se superponen (no son mutuamente excluyentes). Las tres primeras constituyen visiones académicas sobre este y la cuarta representa el uso común del término: a) La primer faceta está representada por algunos postulantes de esta filosofía que buscan la compatibilidad entre las filosofías clásicas que guían la investigación, un “terreno en común” (por ejemplo, b)
c)
d)
ashakkori y eddlie, 2008a y 1998). La segunda ha sido propuesta por otros metodólogos que consideran que el pragmatismo y los métodos mixtos son una tercera alternativa, especialmente cuando los investigadores deciden que ni el enfoque cuantitativo ni el cualitativo por sí solos generan descubrimientos adecuados para una parte de la investigación que tienen en mente (ashakkori y Creswell, 2007). La tercera es representrada por autores que tratan al pragmatismo como una nueva “ortodoxia o dogma” construida sobre la creencia de que no sólo es permitido mezclar métodos de diferentes paradigmas, sino que es deseable hacerlo porque la investigación profunda inevitablemente requiere de las aproximaciones cuantitativa y cualitativa para responder adecuadamente a los planteamientos (Greene, 2004). La cuarta faceta no constituye una visión académica, sino su uso común, es utilizar el “concepto” de pragmatismo como lo que según cierto investigador debe hacerse para responder a un planteamiento (“cualquier cosa es válida, con tal de salir del problema”, aunque haya que romper con principios y postulados filosóficos). Por ejemplo, efectuar una encuesta y grupos de enfoque sobre el mismo tema, pero sin razonarlo, sin una justificación lógica y coherente, simplemente levantar datos y analizar. Esta faceta no constituye el significado filosófico del pragmatismo y no debe asociarse con el paradigma mixto. al como Denscombe (2008) sugiere, hay un “peligro” en esta concepción. odo método
mixto debe obedecer a un planteamiento estructurado y a un conjunto de argumentos racionales para implementarlo (Hernández-Sampieri y Mendoza, 2008). Por otra parte, los autores que han analizado y adoptado el pragmatismo6 señalan desde la perspectiva de este paradigma las fortalezas y los retos de la aproximación mixta que un metodólogo debe considerar.
Fortalezas y retos potenciales de la investigación mixta Fortalezas •
•
• • •
•
Las palabras, los materiales audiovisuales y otros elementos narrativos pueden ser usados para agregar significado a los números. Los valores numéricos pueden ser utilizados para agregar precisión a las palabras, materiales audiovisuales y otros elementos narrativos. Los números, las percepciones y las narrativas siempre se analizan en contexto. La indagación mixta se nutre de las fortalezas de la investigación cuantitativa y cualitativa. Mediante los estudios mixtosuna es posible generar y validar teorías un enfoque con datos de la otra aproximación (por ejemplo, teoría fundamentada puede ser de consolidada mediante investigaciones cuantitativas). La perspectiva mixta puede contestar un espectro más amplio y completo de preguntas de investigación.
6 Creswell (2013a); Teddlie y Tashakkori (2009); Hernández-Sampieri y Mendoza (2008); Greene (2008 y 2007) y Johnson y Onwuegbuzie (2004).
7
8
Capítulo 12 Ampliación y fundamentación de los métodos mixtos
•
• •
• • •
• • •
•
El abordaje mixto cubre más de una función investigativa (por ejemplo, no se limita a validar datos de un tipo). Los investigadores pueden usar las fortalezas de un método para cubrir lasdebilidades potenciales del otro. Por lo general, una aproximación mixta produce evidencia más contundente para soportar las conclusiones a través de la convergencia y corroboración de descubrimientos. Debido a que siempre considera el contexto, sus explicaciones son más extensas y profundas. Es posible agregar mayor perspicacia y más elementos para entender el fenómeno estudiado. Resulta más difícil que el investigador o la investigadora pasen por alto cuestiones relevantes sobre el fenómeno de interés. Incrementa la posibilidad de generalizar los resultados. Producesrcinar un conocimiento más completo,estructural holístico eyintegral para informar a ladeteoría la práctica. Puede un cambio fundamental, revolucionario, además uno yincremental, siempre y cuando los métodos se implementen con rigor. Este enfoque promueve ante todo este último, pero no niega ni se contrapone al cambio total de paradigmas en el sentido de omas Kuhn (Hernández-Sampieri y Mendoza, 2008). Privilegia tanto la investigación básica como la investigación aplicada (al igual que el pragmatismo). Como señalan Hernández-Sampieri y Mendoza (2008), la primera puede generar gran cantidad de la segunda y productos útiles para los seres humanos, solo es cuestión de que los investigadores de ambas ramas (básica y aplicada) se comuniquen eficientemente y logren desarrollar en conjunto conocimientos aplicables.
Retos potenciales •
•
•
•
En ocasiones puede ser difícil conducir una investigación cuantitativa y cualitativa en el mismo proyecto, ya sea por falta de recursos, experticia, tiempo, desconocimiento de usuarios, etc. Por lo general se requiere de un equipo de investigación que colabore “mano a mano”, estrechamente, como los “muéganos”. Los investigadores necesitan no sóloeficaz saberloscómo efectuar cuantitativos y cualitativos, sino cómo integrar o mezclar de manera resultados deestudios ambas aproximaciones. El investigador debe confrontar a los “fundamentalistas” o puristas de ambas aproximaciones (CUAN y CUAL). Al proponerla se tiene que justificar la aproximación cuantitativa, cualitativa y mixta, así como explicar problemas paradigmáticos.
¿QUÉ BARRERAS PUEDEN PRESENTARSE CUANDO SE INTEGRA LA INVESTIGACIÓN CUANTITATIVA Y LA CUALITATIVA? Un prerrequisito fundamental de un estudio mixto es que recolecte, analice, interprete y reporte datos cuantitativos y cualitativos, pero de tal manera que las aproximaciones sean “mutuamente iluminadoras”; además, resulta necesario inteEstudio mixto El producto fnal ene que grarlas para alcanzar los objetivos y responder a las preguntas de ser más que la suma de sus componeninvestigación. Se requiere una “auténtica o genuina integración”, lo tes cuantavo o cualitavo. cual significa que ambas ramas se encuentren relacionadas de forma significativa. Bazeley (2010) considera que ello ocurre en el grado en que diferentes elementos de los datos y sus estrategias de análisis son mezclados y combinados en un mismo estudio de modo que se convierten en factores interdependientes para lograr una meta teórica o de investigación común, y producir descubrimientos que son más que la suma de las partes. Desde luego, el vínculo CUAL/CUAN puede ser mayor o menor, pero es necesario que existan al menos algunos análisis de contraste y la perspectiva mixta se presente en el apartado de discusión del reporte (descubrimientos e inferencias).
Metodología de la investigación
La integración en los métodos mixtos reconoce que hay varios tipos de realidades y que estas pueden ser capturadas por distintas clases de enfoques; además, la información cuantitativa puede ser representada cualitativamente y viceversa (Bazeley, 2010; Bergman, 2008). Como señalan Hernández-Sampieri y Mendoza (2012), en última instancia toda recolección de datos es analizada “cualitativamente” (el análisis es una interpretación, por lo cual posee una base perceptual selectiva). Los enfoques cuantitativos y cualitativos pueden integrarse si son considerados como polos de un continuo metodológico multidimensional más que como entidades distintas. De acuerdo con Bryman (2007b), se pueden presentar diversos factores que impidan tal integración y deben tomarse en cuenta al efectuar un estudio mixto. Estos son:
1) Ritmos y tiempos
La investigación CUAN y la CUAL tienen ritmos y tiempos distintos. En la cuantitativa podemos planear con un alto grado de estructura y anticipar tiempos (por ejemplo, señalar cuántos días emplearemos para recolectar y codificar los datos de acuerdo con los recursos disponibles, como el número de encuestadores). Pero en la cualitativa es más difícil tal planeación, porque sabemos que no podemos dejar de recolectar datos hasta que se saturen las categorías y tengamos un sentido de entendimiento del problema de estudio. Asimismo, los estudios cualitativos, al menos en nuestra experiencia, por lo regular insumen más tiempo para terminarse. Este factor se puede presentar básicamente en los diseños concurrentes (Hernández-Sampieri y Mendoza, 2008). En una genuina indagación mixta, los descubrimientos cuantitativos y cualitativos deben ser mutuamente informativos, “hablarse entre sí” (como una conversación o debate) (Bazeley, 2010; Bryman, 2007b), y al final tienen que proporcionar una descripción conjunta del fenómeno. A veces se refuerzan los resultados en ambos sentidos, pero otras veces estos son irreconciliables. Los métodos mixtos no necesariamente tratan de ser un ejercicio para probar los resultados de un método con respecto a los del otro método. En lugar de ello, se intenta efectuar una estimación conjunta “negociada” de resultados y descubrimientos. En consecuencia, la integración tiene que adecuarse a los tiempos y ritmos de cada rama.
2) Audiencias distintas Cuando se elabora un reporte mixto, debemos tomar en cuenta que parte de los lectores o usuarios estarán acostumbrados a leer reportes cuantitativos, otra parte habrá leído cualitativos, un tercer segmento habrá revisado ambos tipos de reportes y una minoría, al menos hoy por hoy, estará bien capacitada para revisar investigaciones mixtas. Por eso, los reportes mixtos comienzan con una breve explicación del enfoque en que se basan y luego, en el apartado de método, se precisa en qué etapas y de qué manera se conectaron las aproximaciones CUAN y CUAL, así como los resultados e inferencias propias de cada una y los resultados conjuntos o meta-inferencias (Hernández-Sampieri y Mendoza, 2008). La integración debe hacerse de tal manera que la comprenda cualquier usuario o lector.
3) Preferencias metodológicas Cuando realizan estudios mixtos, algunos investigadores pueden tener preferencias por el método cuantitativo y otros por el cualitativo y, conscientemente o no, otorgarle mayor significado e importancia al enfoque predilecto. Si este es el caso, en el reporte se debe explicitar y justificar, y es necesario que en la integración se aclare en qué puntos pesó más cierta aproximación (Hernández-Sampieri y Mendoza, 2008). Lo mismo ocurre cuando los investigadores le otorgan, en principio, el mismo estatus a ambos métodos, pero una vez concluido el estudio consideran que una rama fue más relevante que la otra.
4) Necesidad de entrenamiento, conocimientos y habilidades en ambos enfoques y los métodos mixtos Algunos investigadores no usan los métodos mixtos ni efectúan integración más bien porque su conocimiento y experiencia con alguna de las dos aproximaciones es limitada (Creswell, 2013a; O’Brien, 2013
9
10
Capítulo 12 Ampliación y fundamentación de los métodos mixtos
y Bazeley, 2010). Por ejemplo, ciertos investigadores cuantitativos cuyo entendimiento de las técnicas cualitativas es bajo, solo se circunscriben a identificar descriptivamente temas o usarlos como “marcadores” para ilustrar sus resultados estadísticos. ambién, se da el caso de investigadores cualitativos que no utilizan los análisis estadísticos inferenciales multivariados, simplemente porque desconocen todas sus posibilidades. Quienes realizan un estudio mixto deben poseer competencias para desarrollar investigación cuantitativa, cualitativa y mixta, en particular, en lo que a integración de resultados e inferencias se refiere. Por ello, para quienes se inician en la investigación, Hernández-Sampieri y Mendoza (2008) no recomiendan que comiencen con una experiencia que mezcle ambos enfoques, sino que lo hagan con un estudio cuantitativo o cualitativo.
UN RECORDATORIO SOBRE PREGUNTAS Y OBJETIVOS DE INVESTIGACIÓN MIXTOS Respecto de los objetivos y preguntas mixtas, recordemos que hay de tres tipos: preconcebidas, emergentes y derivadas (Hernández-Sampieri y Mendoza, 2012). Las primeras se plantean para cada rama de la indagación, en el orden en que se llevarán a cabo ambas aproximaciones o por su importancia. Si primero es la fase cuantitativa, obviamente las preguntas y objetivos de esta etapa van en primer lugar y luego las correspondientes a la fase cualitativa. Sin embargo, en las modalidades secuenciales son muy tentativas, porque la segunda etapa se construye sobre la fase que le antecede. En diseños concurrentes y anidados, si a alguno de los enfoques se le otorga mayor peso o importancia, los correspondientes objetivos o preguntas se incluyen primero. Asimismo, se presentan objetivos y preguntas mixtas que se direccionan a la mezcla o conexión de ambas vertientes (Hernández-Sampieri y Mendoza, 2012), aunque también durante el proceso y en particular en la etapa cuando se efectúa la integración pueden surgir otras preguntas mixtas (emergentes y derivadas).
DISEÑOS MIXTOS
Diversos autores han desarrollado sus tipologías, además de las que hemos incluido en las ediciones anteriores de este libro y la que señalamos en el capítulo 17 del libro impreso [extraídas de HernándezSampieri y Mendoza (2008], las cuales se presentarán a continuación. Estas clasificaciones son necesarias porque: a) nos ayudan a decidir cómo proceder para conducir nuestro estudio, b) establecen un lenguaje común entre investigadores dentro de un campo o disciplina, c) auxilian a organizar la labor de campo y ver qué recursos necesitamos para realizar la investigación (que incluye el equipo de trabajo), d) otorgan legitimidad a un área determinada del conocimiento y e) constituyen una valiosa herramienta de enseñanza (eddlie y ashakkori, 2006). Veamos algunas de tales tipologías. 1. Patton (1990) consideró los siguientes diseños mixtos: a) diseño experimental, datos cualitativos y análisis de contenido cuantitativo y cualitativo; b) diseño experimental, datos cualitativos y análisis estadístico; c) indagación naturalista (cualitativa), datos cualitativos y análisis estadístico, y d) indagación naturalista, datos cuantitativos y análisis estadístico. 2. Morse (1991), como consecuencia de sus estudios en enfermería, describió los diseños de triangulación simultánea (CUAN + CUAL o CUAL + CUAN) y los diseños de triangulación secuencial (CUAN ® CUAL o CUAL ® CUAN). 3.
4.
al. (1992) propusieron cuatro modelos: modelo 1 (métodos cualitativos para desarrollar Steckler medidas etcuantitativas), modelo 2 (métodos cuantitativos para reforzar descubrimientos cualitativos), modelo 3 (métodos cualitativos para explicar descubrimientos cuantitativos) y modelo 4 (métodos cuantitativos y cualitativos para ser usados por igual en paralelo). De manera más reciente, los mismos autores presentaron una tipología mediante una matriz que incluyó “cuatro familias” de diseños mixtos: secuencial, concurrente, conversión e integración total
Metodología de la investigación
5.
(eddlie y ashakkori, 2006). Asimismo, se refieren a diseños “cuasimixtos”, con los que se recolectaron datos cuantitativos y cualitativos, pero no hubo una verdadera integración de descubrimientos o metainferencias para el estudio completo. Creswell (2013a) considera seis diseños principales, los cuales incluimos en la clasificación del capítulo 17 del libro: 1) diseño exploratorio secuencial, 2) diseño explicativo secuencial, 3) diseño transformativo secuencial, 4) diseño de triangulación concurrente, 5) diseño anidado o incrustado concurrente de modelo dominante y 6) diseño anidado concurrente de varios niveles.
Elección del diseño general (estrategia) y desarrollo del diseño específico En su propuesta o protocolo su estudio mixto, el investigador debe seleccionar el diseño general(sique considere más apropiado de sobre acuerdo con el planteamiento del problema y las hipótesis y variables es que pudieron establecerse, particularmente para la dimensión cuantitativa), así como desarrollar sus procedimientos específicos en cuanto a muestreo, recolección y análisis de los datos, aunque de acuerdo al contexto y circunstancias puede modificarlos. Asimismo, diversos autores como Creswell (2014) y Hernández-Sampieri y Mendoza (2008) sugieren visualizar los diseños como se ha hecho en el capítulo 17 del libro y proporcionar una definición del diseño, así como una breve explicación de este concepto. Supongamos un caso en que un investigador médico quiere someter a prueba en su ciudad (por ejemplo, Santiago de Querétaro, México o Rosario, Argentina) un reciente tratamiento para disminuir la obesidad de niños entre los 10 y los 12 años, que implica administrar un nuevo medicamento (que ya ha sido autorizado)7 y utilizar la intervención psicológica (denominaremos al tratamiento PMCP). En consecuencia, plantea un experimento con dos grupos y preprueba y posprueba (fase CUAN). Un grupo recibe el tratamiento y el otro no, que es de control (sin embargo, se asegura que la dieta y el número de calorías diarias que consuman todos los niños sea los mismos, al igual que la cantidad, nivel y tipo de ejercicio). Cada grupo está conformado por 25 infantes. De acuerdo con la notación de los diseños (capítulo 7), en este caso tendríamos: RG
0
1
RG2
X
0
0
1
0
1
2
4
El experimento está planteado a seis meses. La preprueba y la posprueba consisten en una medición del peso mediante una báscula perfectamente calibrada y una medición electrónica (escaneo) del cuerpo (para tener una imagen de todas sus partes y ver la masa corporal de todo el organismo). Asimismo, durante el experimento entrevista a los niños para conocer sus experiencias respecto del tratamiento, su autoestima, sus percepciones acerca de si están o no bajando de peso y lo que ello implica y significa, mediante preguntas abiertas (recolección de datos cualitativos: cual). Lo realiza a los dos y cuatro meses después de que se inició el tratamiento, así como al final (seis meses). Por otra parte, durante el desarrollo del experimento entrevista a profundidad a otros 30 infantes que ya se han sometido al tratamiento previamente (entre seis y ocho meses posteriores a este), en una ciudad cercana (fase CUAL). El diseño podría esquematizarse como se muestra en la figura 12.1. En términos específicos, una mezcla de un diseño anidado (lo cualitativo dentro de lo cuantitativo: CUAN/cual) y de un diseño concurrente (CUAN/CUAL). Asimismo, resulta necesario diagramar o graficar la secuencia de recolección, análisis e interpretación de los datos (ver la figura 12.2).
7 Desde luego, se asume que se observaron todas las condiciones éticas para poder realizar el estudio.
11
12
Capítulo 12 Ampliación y fundamentación de los métodos mixtos
Figura 12.1 Ejemplo de la visualización de un diseño mixto. CUAN R O1 R O3 1
X (PMCP) 2
3
O2 O4
4
Inicio
5
6
Meses
cual
2
4
6
Entrevistas a los niños del experimento
CUAL Entrevistas en profundidad (n = 30) a otros niños
Figura 12.1 Ejemplo de la visualización de la recolección, análisis e interpretaciones en un estudio mixto. DISEÑO CONCURRENTE Fase del proceso (diseño anidado) CUAN / cual
Procedimientos
Fase del proceso CUAL
Procedimientos
Recolección de datos CUAN / cual
Muestra no probabilística de grupos asignados al azar (R)
Recolección de datos CUAL
Muestra homogénea de voluntarios
Mediciones de peso y masa corporal
Entrevistas individuales en profundidad
Entrevistas SPSS: Análisis descriptivos de peso y masa
Análisis de datos CUAN / cual
Análisis de datos CUAL
Atlas.ti: Categorías
Pruebas “t” de diferencias entre grupos y por género
Temas y patrones Modelo de taoría fundamentada
Atlas.ti: categorías, temas y patrones y modelo de teoría fundamentada Producto
Producto
Reporte de resultados con tablas y gráficas, así como categorías narrativas
Reporte narrativo de experiencias y resultados
Interpretación: Resultados del experimento (CUAN / cual) Experiencias y resultados perceptuales de PMCP (CUAL) Inferencias CUAN y CUAL Explicación: Metainferencias
Metodología de la investigación
Veamos otro ejemplo de visualización con un diseño secuencial a largo plazo.
Ejemplo Idea: estudiantes universitarios que súbitamente pierden algunas capacidad física (una parte del cuerpo, quedan paralíticos, con sordera, etc.) por motivo de algún accidente por manejar en estado de ebriedad. Objetivo: comprender el proceso de adaptación familiar ante tal eventualidad. Preguntas iniciales de investigación (predeterminadas): ¿cómo afecta el suceso la vida familiar? ¿De qué manera se modifican las interacciones entre los miembros de la familia? ¿Cómo puede caracterizarse la dinámica familiar a raíz del evento? ¿Qué intervenciones deben efectuarse para lidiar con el nuevo contexto familiar? (por ejemplo, programas educativos especiales, intervenciones terapéuticas, etc.). ¿Cómo afectarán talesPrimera intervenciones el futuro desarrollo de losdeuniversitarios? fase (CUAL): identificar patrones ajuste de la familia mediante observación de las interacciones que se producen en ella y entrevistas en profundidad con todos sus miembros, así como generar categorías que se considerarán variables cuantitativas para las etapas subsecuentes. Segunda fase (CUAN/cual): desarrollar instrumentos estandarizados que midan las variables cuantitativas que emergieron de la fase previa, así como mediciones clínicas (de laboratorio) y entrevistas en profundidad. Tercera fase: implementar intervenciones apropiadas de acuerdo a los diagnósticos cuantitativos y cualitativos. Cuarta fase: (CUAN + CUAL): valorar el progreso de la familia (mediante pruebas estandarizadas sobre las variables) y evaluar clínicamente a los participantes en tres momentos: 1) después de tales implementaciones (un mes), 2) a los cuatro meses y 3) finalmente al año. El proceso se podría diagramar como en la figura 12.3. Figura 12.3 Otro ejemplo de presentación gráfica de la secuencia de un diseño.
RecolecciónCUAL
AnálisisCUAL
RecoleccióninicialCUAN/ CUAL (antes de intervenciones)
Observación
Analizar el contexto familiar
Entrevistas
Diagnosticar el efecto inicial del suceso en cada miembro de la familia
Medición de variables significativas (instrumentos estandarizados) con los miembros de la familia (CUAN)
Detectar qué variables resulta significativo estudiar (sentido de vida, estrés, depresión, etcétera)
Mediciones clínicas (CUAN) Entrevistas clínicas (CUAL)
Análisis CUAN, CUAL y mixto
Intervenciones (tratamientos, programas, soluciones)
Mediciones y recolección de datos cualitativos al mes
Propuesta de un programa para ayudar a familias con eventualidades similares Nuevas intervenciones y otras soluciones
Repetir mediciones y recolección de datos al año
Repetir mediciones y recolección de datos a los 4 meses
13
14
Capítulo 12 Ampliación y fundamentación de los métodos mixtos
MUESTREO PARA ESTUDIOS MIXTOS (AMPLIACIÓN DE CONCEPTOS) En la actualidad disponemos de varias tipologías, marcos de referencia y guías para el muestreo mixto. Desde luego, ninguna clasificación es exhaustiva, pero en conjunto nos ayudan a elegir una muestra más confiable y válida. Las decisiones respecto del muestreo no inciden solo sobre los procedimientos, pues se encuentran íntimamente ligadas con el diseño y afectan a otras etapas del proceso, principalmente a la recolección y al análisis de los datos. Asimismo, reflejan los valores del investigador y sus premisas respecto de lo que constituye una base de datos creíble, confiable y válida. Es decir, se ven influidas por el modelo mental del investigador, sus creencias y los enfoques que considera pertinentes para abordar el planteamiento del problema. Para seleccionar la muestra, tradicionalmente los investigadores han empleado diferentes estrategias de muestreo, como la probabilística o la no probabilística (guiada por uno o varios propósitos). El marco de muestreo (en muestras probabilísticas) y los límites de muestreo (en muestras orientadas por uno o más propósitos) comprenden las unidades o casos del estudio (individuos, grupos, comunidades, organizaciones, contextos, procesos, objetos, observaciones, eventos, artefactos y/o actividades) que proporcionan la información o datos que se analizarán en una investigación monometódica (un método), ya sea cuantitativa o cualitativa; además, constituyen las fuentes de información o datos para las fases cuantitativa y cualitativa en una investigación mixta. El diseño de la muestra en un estudio mixto constituye un marco que abarca los esquemas muestrales y el tamaño de muestra de dos o más ramas, al menos una cuantitativa y otra cualitativa; asimismo, tal como se señaló en el capítulo 17 del texto impreso, tradicionalmente las estrategias para elegir las muestras se han asociado con determinado enfoque (el muestreo probabilístico con la aproximación cuantitativa y el muestreo guiado por razones con la aproximación cualitativa), pero tales vínculos no siempre reflejan la práctica empírica (Collins, 2010; Guest, Bunce y Johnson, 2006). En la investigación mixta se han dado casos en que para el componente cualitativo se seleccionan muestras aleatorias y otros en los cuales se eligen muestras no probabilísticas, incluso orientadas por un propósito, para la fase cuantitativa. an solo por mencionar algunos ejemplos, E. W. Chiznik y A. W. Chiznik en un estudio mixto efectuado en 2002 (citado por Collins, 2010) examinaron las concepciones de universitarios respecto de los términos privilegio y opresión, utilizando una muestra de individuos enrolados en 10 secciones seleccionadas aleatoriamente de un curso de educación multicultural. El componente cualitativo incluyó una muestra de respuestas a un cuestionario con preguntas abiertas elegidas aleatoriamente. Por su parte, M. Lopez y A. ashakkori, en una investigación realizada en 2006 (Collins, 2010), en la cual se evaluó el efecto de dos programas educativos bilingües y los niveles de logro académico de estudiantes de quinto grado, seleccionaron una muestra aleatoria de entrevistas para la fase cualitativa de su estudio mixto. Castrejón (2012), en una indagación mixta cuyo objetivo era identificar los principales obstáculos que enfrenta la comercialización de productos de los centros de investigación tecnológica en un estado de la región central de México, seleccionó una muestra aleatoria de investigadores con la finalidad de entrevistarlos en profundidad (vertiente cualitativa) y aplicarles un cuestionario estandarizado (vertiente cuantitativa). Asimismo, en los experimentos (diseños cuantitativos) suelen usarse muestras orientadas por una o varias razones, y aunque en los experimentos “verdaderos” los casos se asignan al azar a las condiciones o tratamientos, con frecuencia la muestra general no es probabilística, porque lo que se intenta no es tanto generalizar sino analizar relaciones entre variables en condiciones de mayor control. Finalmente, en la realidad, el planteamiento, los recursos disponibles y las condiciones y contexto del estudio nos señalan cuál es la muestra apropiada. Desde luego, las opciones de utilizar una muestra probabilística y una conducida por uno o varios motivos en las fases cuantitativa y cualitativa incrementan el número de esquemas de muestreo disponibles para el investigador, lo cual destaca la diversidad de los diseños mixtos (Collins, 2010).
Metodología de la investigación
Tipos de esquemas muestrales Los esquemas de muestreo probabilístico se usan para elegir de manera aleatoria las unidades o casos de la muestra, de manera que representen al universo o población de interés. Antes de recolectar los datos, el investigador establece un marco muestral y predetermina el número de casos o unidades, basándose en una fórmula o un programa que la implementa (como SAS®). Así, con base en el muestreo aleatorio o alguna de sus derivaciones (estratificado, por conglomerados, sistemático o multietapas) selecciona tales unidades, lo cual permite que cada elemento de la población tenga inicialmente la misma oportunidad de ser elegido y minimiza la posibilidad de error y de resultados no auténticos. ípicamente, los datos recolectados son numéricos y los análisis son estadísticos y se orientan a las variables (Collins, 2010). Desde luego, en los diseños mixtos los datos numéricos pueden ser transformados en datos narrativos y de este modo pueden analizarse mediante técnicas cualitativas orientadas al caso. Cuando se implementan estrategias probabilísticas, el objetivo del investigador es realizar generalizaciones estadísticas externas (hacia la población). Onwuegbuzie, Slate, Leech y Collins (2010) y Collins (2010) identifican 24 esquemas de muestreo que pueden usarse en los enfoques cuantitativo, cualitativo y mixto, algunos de los cuales ya fueron comentados en el libro (cinco probabilísticos y 19 guiados por propósitos), los cuales se presentan en la tabla 12.1. Tabla 12.1 Principales esquemas de muestreo a utilizar en los métodos mixtos para ambas aproximaciones.8 Tipo
Esquema
Descripción
1. Aleatorio simple (MAS)
Cada unidad o caso de la población tiene la misma e independiente probabilidad u oportunidad de ser elegido para la muestra
2. Estratificado
La población o universo es dividido en segmentos o subgrupos, cuyos casos son relativamente homogéneos con respecto a una o más características y diferentes de los casos de los otros segmentos. De cada subgrupo o estrato se extrae una muestra aleatoria, ya sea de manera proporcional o no proporcional
3. Por conglomerados
De forma aleatoria se seleccionan agrupaciones completas de unidades o casos en diferentes etapas, más que ir eligiendo directamente los casos. Una vez que se llega a la última etapa, se recolecta información de todos los grupos y sus unidades
4. Sistemático
Selección de unidades de una lista sobre la base de un intervalo constante (k), el cual tipifica a la población dividida entre el tamaño requerido de muestra 5. Selección al azar por etapas múltiples
5. Selección al azar por etapas múltiples
Elección de la muestra final utilizando una combinación de los esquemas probabilísticos previos
6. De máxima variación
Seleccionar casos, grupos, contextos, eventos, procesos… (unidades) con el fin de ampliar el rango de perspectivas investigadas en el estudio
7. Homogéneo
Escoger unidades con determinadas características similares
8. De casos críticos
Elección de casos sobre la base de características específicas, cuya inclusión proporciona al investigador de información significativa y una perspectiva convincente respecto del problema de investigación o fenómeno de interés
9. Teórico (fundamentado o
Selección de las unidades debido a que su inclusión ayuda a desa-
encauzado por una teoría) 10. Confirmatorio/disconfirmatorio
rrollar una teoría o modelo Agregar casos a la muestra inicial con la finalidad de verificar, contradecir, profundizar o aclarar los resultados encontrados en los análisis previos
8 Adaptado de Collins (2010, p. 358-359).
15
16
Capítulo 12 Ampliación y fundamentación de los métodos mixtos
Tipo
Esquema
Descripción
11. En cadena o “bola de nieve”
Elección de casos derivados de las unidades iniciales (por ejemplo, recomendados por los participantes de la muestra inicial)
12. De casos extremos
Escoger unidades alejadas de los valores centrales (puntuaciones o características extremas) con fines de comparación o contraste
13. De casos típicos
Seleccionar casos promedio, homogéneos, normales o estándares (cercanos a los valores centrales)
14. Intensivo
Escoger unidades cuyas características (por ejemplo, en ciencias sociales, experiencias) se encuentran sumamente vinculadas con el problema o fenómeno de interés, sin ser extremas
15. De expertos (denominados también “políticamente importantes” por algunos autores)
Elección individuos o(oestán sus expresiones) queeste conocen fondo el problemadeinvestigado conectados con (por aejemplo, en un estudio sobre las causas de un accidente aéreo, expertos en diseño de aviones, investigadores de accidentes, etc.; en un estudio sobre la cultura organizacional, especialistas en recursos humanos, directores generales, etc.)
16. Inicialmente aleatorio y después elección por propósito
Seleccionar una muestra aleatoria de la población o universo y posteriormente de esta, elegir casos también al azar hasta que se genere un sentido de entendimiento del problema o fenómeno (pudiendo no completar toda la muestra). Por ejemplo, n es de 300 casos y elegimos al azar uno por uno y al llegar al caso 50 se saturan categorías o se responde satisfactoriamente al planteamiento y terminamos la recolección de datos
17. Estratificado guiado por propósito
El universo es segmentado en estratos o subgrupos y de cada uno seleccionamos casos guiados por uno o más propósitos (muestras guiadas por teoría, por ejemplo)
18. De criterios
Elección de unidades porque representan o cubren uno o más criterios derivados del planteamiento
19. Por oportunidad
Selección de casos porque se presenta una coyuntura que nos proporciona acceso a estos
20. De estrategias distintas elegidas por diferentes propósitos
Escoger más de una estrategia de muestreo y comparar sus resultados (contraste entre muestras seleccionadas por diferentes esquemas)
21. Por conveniencia
Elegir los casos porque se encuentran disponibles (en esencia, similar a la de oportunidad)
22. Por cuotas
El investigador identifica ciertas características deseables de las unidades o casos y establece un número que se seleccionará de estos
23. De varias fases (multietapas o multiniveles)
Elegir la muestra combinando diversas estrategias probabilísticas y no probabilísticas (por ejemplo, aleatorio a un nivel, por propósito en otro nivel, de expertos en un tercer nivel…)
24. De varias fases guiadas por un propósito
Seleccionar la muestra en diversas etapas, cada una de ellas guiada por uno o más propósitos
Metodología de la investigación
En indagaciones donde se utilizan muestras guiadas por uno o más propósitos, la meta es generar nuevos conocimientos o teoría a través de obtener información o perspectivas novedosas sobre el planteamiento del problema o fenómeno de interés. Muchas veces se emplean estas muestras para escoger casos estratégicos o informantes claves que proporcionen información amplia y profunda sobre el problema bajo estudio (Collins, 2010). Como hemos visto, en la investigación mixta puede tenerse una muestra orientada por propósitos vinculados al planteamiento, pero los casos o unidades e informantes relevantes son elegidos al azar con la finalidad de minimizar el riesgo de no poder desarrollar transferencia. Otras veces se establece un perfil o criterio predeterminado de unidades, pero la selección es aleatoria. Por otro lado, podemos basar la investigación en una muestra al azar para lograr representatividad estadística, pero, además, es necesario incluir casos que cubran ciertos requisitos (por ejemplo, edad, género, ciertos niveles en variables vinculadas con el planteamiento, etc.) con el objetivo de alcanzar “representatividad informativa” (Collins, 2010; Sandelowski, 2000). Por lo general, en las muestras por propósito el investigador especifica parámetros o demarcaciones para delimitar casos específicos o características de informantes que serán consideradas, observadas o evaluadas, e identificar lo que examinará en ciertos términos (por ejemplo, artefactos ambientales o cuestiones individuales). ales límites o parámetros se acompañan de un marco muestral que es determinado por el planteamiento y la teoría, así como por el diseño de investigación. De manera típica, cuando se usa una técnica de muestreo dentro de los casos, las unidades son vistas de forma individual y se recolectan y analizan múltiples datos de cada caso (Collins, 2010). Miles y Huberman (1994) exponen tres características del muestreo dentro de los casos. Primero, las unidades son vistas como anidadas dentro de un contexto mayor. Segundo, el proceso de elección de unidades se fundamenta en una teoría preseleccionada o emergente. ercero, posee una cualidad iterativa o progresiva de acuerdo a la evolución del estudio. En pocas palabras: se escogen casos de acuerdo con la teoría que son necesarios para ir esclareciendo el panorama y respondiendo a las preguntas de investigación. Cuando se usa muestreo de casos múltiples, lo que el investigador efectúa primero es establecer un marco de muestreo detallado sobre la base del planteamiento del problema y la revisión de la literatura. Así, seleccionaquecasos convergentes y divergentes que Elsean de interés para posteriormente las conclusiones se derivan del análisis de cada uno. muestreo orientado por razones conexplicar múltiples casos conduce a la réplica y agrega varios niveles analíticos. Asimismo, incrementa la confianza en la interpretación de los resultados. En contraste con las muestras probabilísticas, el muestreo guiado por razones puede ocurrir antes de que se comiencen a recolectar datos y/o durante toda la implementación del estudio. El muestreo por conglomerados se usa en situaciones donde la localización de los casos o unidades es compleja o cuando la población es demasiado extensa y/o dispersa en diferentes lugares (Collins, 2010). Si se utilizan muestras orientadas por propósito, el investigador puede formular generalizaciones internas derivadas del análisis de datos obtenidos de una submuestra o subconjunto de la muestra (por ejemplo, de informantes claves). Sin embargo, estas no son generalizaciones estadísticas, sino analíticas, de transferencia caso-caso o de información (Collins, 2010). Se toman decisiones sobre la evidencia de los datos, generalmente cualitativa. Estas clases de generalizaciones se aplican a una teoría más extensa sobre la base de la forma en que las unidades seleccionadas encajan en constructos amplios; en realidad, es la teoría la que las soporta (Yin, 2009). Como vimos en el capítulo 13 del texto impreso, los determinantes del tamaño de muestra en las et al., 2006). muestras guiadas es pornecesario propósito son al la punto saturación y elcasos entendimiento 2010; Guest información Para alcanzarlos, llegar en que adicionales(Collins no aportan ninguna novedosa a la que nos proporcionó la recolección y el análisis de las unidades iniciales. Por ejemplo, el caso uno arroja cierta información, el segundo, tercero y cuarto aportan nueva información y así sucesivamente, pero llega un momento en el cual un caso (supongamos el 18) ya no genera algo diferente, por lo cual comenzamos a pensar en la saturación; recolectamos datos de otros casos (19, 20, 21 y 22) y
17
18
Capítulo 12 Ampliación y fundamentación de los métodos mixtos
tampoco encontramos información novedosa, lo que significa que hemos alcanzado la “saturación”. Las nuevas unidades proporcionan datos redundantes (Collins, 2010). La saturación no puede determinarse a priori, porque depende de diversos factores, como la naturaleza del problema de investigación, la homogeneidad de la muestra, la calidad de los datos, la complejidad del estudio y los recursos disponibles. Por ejemplo, si la población es heterogénea, necesitaremos de un mayor número de unidades para alcanzarla. Desde luego, una investigación que usa muestreo por propósitos debe lograr tal saturación; de lo contrario, no podemos confiar en los resultados, ni en la transferencia de las conclusiones. Ahora bien, los planteamientos que buscan profundidad en los datos utilizando una aproximación orientada por caso pueden perder su “foco” si la muestra es muy grande (Collins, 2010). Difícilmente se consiguen recursos (lo que incluye un gran número de investigadores) para efectuar estudios cualitativos en muestras de gran tamaño y heterogéneas, planteamientos complejos y de alcances un diversos. et al. (2006),con Guest como parte de su investigación, efectuaron análisis cualitativo (temático) de datos obtenidos mediante 60 entrevistas en profundidad y los casos fueron seleccionados mediante muestreo no probabilístico. Los participantes eran individuos con alto riesgo de contraer VIH (se buscaban candidatos para evaluar un programa de prevención del SIDA) y fueron reclutados porque su trabajo era de índole sexual. La saturación se alcanzó en las primeras 12 entrevistas. Desde luego, la muestra era relativamente homogénea en cuanto a edad y ocupación, lo cual facilita la saturación. Pero en muestras heterogéneas (en particular cuando intencionalmente se busca la heterogeneidad, por ejemplo, muestras de máxima variación), lograr la saturación regularmente requiere de más casos (Collins, 2010). Respecto del tamaño de las muestras probabilísticas, ya se abundó en el texto impreso, por lo cual no “saturaremos al lector” con este tema.
Tipologías del muestreo en los métodos mixtos La investigación mixta implica elegir muestras para los componentes cuantitativo y cualitativo del estudio. Con frecuencia, tales selecciones requieren utilizar una combinación de una muestra probabilística y una guiada por propósitos, por lo cual resulta muy útil al investigador recurrir a las tipologías de muestreo que consideran las características distintivas de los diseños mixtos y los procedimientos de recolección de los datos. En 2003, A. E. Kemper, S. Stringfield y C. eddlie (citados por Collins, 2010) desarrollaron una matriz que relaciona la técnica de muestreo (probabilística, guiada por propósitos y mixta) con el tipo de datos producidos (solo cuantitativos, únicamente cualitativos o una combinación de ambos). Cada celda de la matriz indica un nivel de frecuencia que mide el grado en que un tipo de muestreo (por ejemplo, probabilístico) produce una clase de datos (por ejemplo, cuantitativos). La clasificación alerta al investigador mixto sobre la vinculación de los tipos de datos generados y la diversidad de datos que pueden ser recolectados (rango) al combinar las estrategias de muestreo probabilística y por propósitos en un mismo estudio. eddlie y Yu (2007) propusieron una tipología basada en la matriz de Kemper et al. (2003). Para ello delinearon cinco clases de técnicas de muestreo mixto aplicables a los diseños mixtos: 1) muestras mixtas básicas, 2) muestras mixtas para diseños secuenciales, 3) muestras mixtas para diseños concurrentes o en paralelo, 4) muestras mixtas multiniveles (para diseños anidados) y 5) una combinación de varias estrategias de muestreo mixto. Un término clave que subyace en la estructura de esta tipología es la relación de dependencia entre la selección de la muestra por fase y el “hilo conductor” del diseño de investigación. El “hilo conductor”, definido por eddlie y ashakkori (2009), es el componente que abarca las principales fases de un estudio: conceptual, la experiencia y la inferencial. Por lo general, los hilos conductores son cuantitativos, cualitativos o ambos. Recordemos que los diseños concurrentes son aquellos en los cuales los componentes cuantitativo y cualitativo se implementan simultáneamente o casi al mismo tiempo y se mantienen independientes en términos de recolección y análisis. La interdependencia ocurre cuando se contrastan y mezclan los resultados e inferencias de ambas aproximaciones. Por su parte, en los diseños secuenciales hay una relación de dependencia entre ambos componentes, porque los resultados de una fase influyen en las decisiones de la etapa subsecuente.
Metodología de la investigación
A continuación se hacen algunas observaciones sobre tales técnicas de muestreo. Muestreo básico para métodos mixtos
En esta estrategia se destaca la muestra estratificada guiada por propósito(s). Implica segmentar el grupo objetivo (la población) en estratos (que constituye una acción probabilística) y luego seleccionar en cada subgrupo un número ilustrativo de casos para estudiarlos de manera intensiva (mediante un muestreo guiado por un propósito: diversidad de casos, unidades típicas, etc.). Un ejemplo de este muestreo se trató en el capítulo 17 de la obra impresa. Muestreo secuencial de métodos mixtos
Implica primero un muestreo probabilístico y luego uno guiado por la teoría o un propósito para las fases cuantitativa y cualitativa respectivamente o viceversa (CUAN-CUAL o CUAL-CUAN). Por ejemplo, Hernández-Sampieri (2010) realizó un trabajo para evaluar la satisfacción con el servicio de los clientes de un hospital y determinar los factores que inciden sobre ella. Primero, para la etapa CUAN, seleccionó una muestra probabilística de los clientes que habían sido atendidos durante 2009 (muestreo aleatorio simple), la n fue de 402 casos, y se administró un cuestionario estandarizado que midió el nivel de satisfacción y sus determinantes (con preguntas cerradas y algunas abiertas sobre recomendaciones y sugerencias). Posteriormente, para la fase CUAL, se eligieron los 10 casos con mayores índices de insatisfacción detectados en el cuestionario y los 10 con mayor satisfacción; a estos 20 individuos se les hizo una entrevista a profundidad; incluso, se efectuó un grupo de enfoque con ocho personas que habían estado internadas en el centro médico por más de tres días. Este muestreo corresponde a un diseño secuencial CUAN-CUAL. Un ejemplo CUAL-CUAN sería el siguiente: en el supuesto que pretendiéramos conocer las características que deben poseer las viviendas de una comunidad de un nivel socioeconómico desfavorecido, primero podríamos elegir una muestra no probabilística de adultos de tal comunidad que incluyera una variedad de casos (matrimonios de adultos jóvenes de 18 a 28 años recién casados —un año a lo sumo— ,de 29 a 36 hacecasados, 12 meses 37 odemás años parejasde de matrimonio; 28 a 36 años con más deaños una casados década de de o37menos, o másdeaños edad conrecién más casados; de una década adultos jóvenes solteros y solteras de 18 a 28 años, y solteros de 29 o más años. Se trata de abarcar profesionales —que serían más difíciles de encontrar— y no profesionales con distintas ocupaciones —choferes, plomeros, meseras, etc.—. Asimismo, deberíamos considerar matrimonios en que ambos trabajen y otros en que sólo uno de los cónyuges lo haga). Con estos casos se podrían efectuar grupos de enfoque para entender los factores que inciden en la compra de una vivienda en una comunidad determinada; las características que debe tener el inmueble, el precio que podrían pagar y las condiciones crediticias adecuadas. Estamos hablando de cerca de 70 a 80 casos. Con la información obtenida, se podría diseñar una encuesta para una muestra representativa de toda la comunidad que contenga variables extraídas de las principales categorías emergentes de los grupos y los ítems necesarios para reflejarlas.9 La comunidad tiene más de 400 000 habitantes de niveles económicos medio y medio bajo de un gran municipio de México. Muestreo concurrente para métodos mixtos
La estrategia más común de este tipo de muestreo implica utilizar muestras paralelas (se selecciona una muestra probabilística para la vertiente CUAN y una guiada por propósito para la vertiente CUAL, ambas independientes). Supongamos una investigación que intenta establecer las razones por las cuales los jóvenes de una ciudad decidieron su carrera (licenciatura o equivalente) y los motivos por losque prefirieron cierta universidad. Podría conducirse un estudio mixto en paralelo con dos muestras, tal como se ilustra en la figura 12.4. 9 Este estudio se efectuó, pero los contratantes solicitaron total confidencialidad.
19
20
Capítulo 12 Ampliación y fundamentación de los métodos mixtos
Asimismo, es posible que se presenten otras circunstancias: ya sea una sola muestra, parte de la cual es elegida por procedimientos probabilísticos y la otra por una razón de interés para el investigador o investigadora; o bien, dos muestras independientes de diferentes poblaciones o del mismo universo pero con selección por procedimientos distintos) (eddlie y Yu, 2007). Figura 12.4 Ejemplo de muestreo concurrente.
Estudio CUAN:
Estudio CUAL:
Encuesta por muestreo
Entrevistas en profundidad a
usando un instrumento estandarizado aplicado a alumnos de diferentes universidades, carreras y semestres. Los alumnos se eligen al azar con base en cuotas por carrera. Por ejemplo, una n de 1 000 estudiantes de cuatro instituciones (250 cuestionarios aplicados en cada una).
100 alumnos de diferentes universidades, carreras y semestres. Dos grupos de enfoque con ocho estudiantes cada uno (un grupo de jóvenes de distintas carreras de una universidad pública y otro grupo con alumnos de diferentes carreras de una universidad privada).
Supongamos un estudio con los mismos fines que los el ejemplo anterior. El tamaño de la muestra es de 1 000 casos, de los cuales 800 son seleccionados al azar en cuatro universidades, 200 estudiantes de cada una. A todos ellos eseirregulares, les administra el cuestionario. Los restantes 200 se eligen variados (alumnos regulares deportistas y no deportistas, que participan en buscando actividadescasos culturales versus los que nunca participan, pendencieros, etc.). A estos se les hace una entrevista a profundidad mediante una guía semiestructurada. Se recolectarían y generarían al mismo tiempo datos cuantitativos y cualitativos. En cambio, sería una muestra estratificada guiada por propósito si la población de universitarios fuera segmentada en tres estratos: promedios excelentes y buenos, regulares, malos; y luego se procediera a elegir unos cuantos casos (digamos 40) de cada subgrupo y entrevistarlos en profundidad. Muestreo por multiniveles para métodos mixtos
Esta estrategia implica que diferentes unidades de análisis son “anidadas” dentro de otras, con lo cual se generan diversos procesos de selección por nivel. Supongamos que en el caso de la investigación para establecer las razones por las cuales los jóvenes eligieron la carrera que cursan y los motivos por los que prefirieron cierta institución, el universo fuera un estado o provincia con varios municipios (departamentos o equivalentes) y ciudades. Primero (nivel uno) podríamos elegir a las ciudades o municipios que tuvieran universidades (autoselección por un criterio); después (nivel dos) seleccionar en cada ciudad a la universidad pública y a la privada más importantes (elegidas por matrícula o población de alumnos, o por la calidad educativa — con base en sus acreditaciones por organismos gubernamentales y de la sociedad en general—). Hasta aquí el muestreo se ha guiado por razones y no probabilísticamente. En un tercer nivel, podríamos estratificar a los centros educativos por carrera o licenciatura y obtener una muestra al azar de alumnos de cada una (probabilística); o bien, efectuar una selección probabilística por racimos en cada institución. Después, encuestar a los estudiantes
Metodología de la investigación
que conformen la muestra final (instrumento estandarizado). ambién podríamos elegir a los 30 mejores promedios de cada universidad y a los 30 peores (de diferentes carreras), y a estos entrevistarlos en profundidad (nivel cuatro). Muestreo basado en diversas estrategias para métodos mixtos Implica diferentes muestras en distintas etapas. Por ejemplo, en el estudio sobre la moda y la mujer mexicana que se trató en el capítulo 17 del texto impreso, primero se observó de manera abierta (las mujeres cuyo comportamiento en las tiendas era observado fue casual, no probabilístico). Después, se hicieron entrevistas semiestructuradas en la tienda y en sus viviendas a aquellas cuya selección fue también fortuita (de manera no probabilística). En una tercera etapa se efectuó una encuesta a mujeres cuyos hogares estuvieran ubicados en colonias cercanas a cada establecimiento de lamanzanas, cadena (los cuales fuerony seseleccionados muestreo probabilístico —por conglomerados: colonias, calles y casas— buscaba que por hubiera mujeres adultas compradoras y jóvenes de 15 a 17 años, a las que se les administró un cuestionario estandarizado). Mientras se realizaba la encuesta en varias ciudades, se organizaron grupos de enfoque (cuatro por cada metrópoli en el caso de mujeres adultas y uno de adolescentes), en las sesiones participaron de ocho a 10 personas. La elección de las participantes se efectuó con base en un propósito: que tuvieran cierto perfil socioeconómico, de distintas edades y que fueran compradoras frecuentes (una cantidad mínima). Una cuarta etapa (no reportada en el ejemplo del libro impreso) involucró una encuesta en una muestra no probabilística por cuotas (entre clientas que habían comprado en las tiendas de tres ciudades), con fines de validación y ampliación. Finalmente, con base en los resultados de todas las fases previas, se rediseñó una tienda y se llevó a cabo un grupo de enfoque con mujeres y otro con jóvenes, para evaluar las remodelaciones (muestra no probabilística).10 Collins (2010) propone cinco criterios para tomar decisiones sobre la muestra, los cuales en conjunto les denomina “tipología integradora”. Criterio 1. La unidad de muestreo seleccionada para cada fase debe reflejar la relación interdependiente entre las muestras elegidas para ambas ramas. Criterio 2.temporal La unidadentre de muestreo determinada para cada etapa debe reflejar la relación u orientación las dos vertientes (concurrente-secuencial). Criterio 3. La unidad de muestreo seleccionada para cada fase debe reflejar la relación entre la combinación específica de los esquemas de muestreo (probabilístico-por propósito) y el tipo de generalización que se efectuará. Criterio 4. La unidad de muestreo elegida para cada fase tiene que reflejar un mínimo de un tipo de datos recolectados (únicamente cuantitativos, solo cualitativos) o una combinación de ambas clases de datos; de este modo, cuando se formula una relación entre ellos, se optimiza la diversidad de información para analizar en respuesta al planteamiento del problema. Criterio 5. El investigador identifica la vinculación entre la relevancia de la aproximación (dominante, ligeramente dominante, igual) y la formulación de metainferencias y generalizaciones apropiadas, derivadas de los datos recabados en las dos fases del estudio. Este proceso es influido por la dinámica de intercambio que se da entre el requerimiento de generalizaciones externas versus la necesidad de transferencia. Si considera estos cinco criterios el investigador puede determinar el tipo y tamaño de muestra adecuados para cada fase. Además de los criterios, Collins (2010) considera tres componentes. El primero se fundamenta en las actuales tipologías de muestreo a fin de proveer una estructura y un léxico sobre muestreo que comprende los cinco factores ya comentados y que se obtuvieron de un análisis de contenido de las clasificaciones actuales. El segundo componente hace hincapié en el grado en que las decisiones sobre el muestreo afectan a otras etapas del proceso de investigación. Para ello, Collins (2010) sugiere tener en mente para cada fase: 10 Esta parte tampoco fue incluida en el ejemplo del libro impreso, porque se implementó después de que se agregara en la tercera edición.
21
22
Capítulo 12 Ampliación y fundamentación de los métodos mixtos
el planteamiento del problema (formulación de objetivos y preguntas de investigación), la justificación (propósito de la mezcla o integración, función), el diseño mixto, las estrategias de muestreo y la manera de seleccionar los casos o unidades, así como el tamaño de la muestra. ales consideraciones identifican el tipo o tipos de información requerida, así como la clase de generalización interna y externa que se pretende (estadística, analítica, transferencia, naturalista, etc.). La determinación del tipo de generalización establece el tamaño de muestra necesario en cada rama de la investigación. La función o propósito de la integración influye también en las estrategias de muestreo.orP ejemplo, si la finalidad es triangular datos, pueden seleccionarse muestras idénticas para ambas fases (mismos casos), o bien, muestras distintas pero paralelas (características similares) elegidas de la misma población. Los datos resultantes de las dos muestras pueden analizarse para evaluar convergencia de los resultados. la función es de complementación e iniciación, investigadorelpuede elegir un esquema deincluir muestreo Si secuencial o concurrente. Si se pretende desarrolloely expansión, investigador debe tratar de una muestra elegida singularmente o usando varias combinaciones que pueden ser en paralelo, anidada o multiniveles/de varias etapas. Asimismo, las estrategias de muestreo afectan otros propósitos comunes en la investigación mixta como el enriquecimiento de la variedad de casos en la muestra, desarrollo de instrumentos de recolección de los datos, mayor integridad de tratamientos (fidelidad en las intervenciones) y el incremento de la significancia (más capacidad de argumentación e interpretación). Alinear el marco de muestreo (vertiente cuantitativa) y los límites de la muestra (vertiente cualitativa) con el planteamiento del problema nos ayuda a asegurarnos que la unidad muestral o caso es útil para generarnos suficientes datos adecuados a fin de que podamos formular interpretaciones y conclusiones en cada rama o etapa del estudio, las cuales se integran en meta-inferencias. Un elemento clave de los diseños mixtos es la dirección temporal de las fases. Consecuentemente, las decisiones sobre la estrategia o esquema de muestreo deben reflejar la relación de dependencia entre tales decisiones y la orientación temporal en la implementación de los componentes. Ellas determinan la argumentación y racionalidad en que se basa el muestreo, los tipos de muestras que se implementarán y el tamaño de la muestra, en ambas vertientes. muestreo de concurrente supone conducir laslaetapas o componentes de manera independiente, los datosElobtenidos las unidades que conforman muestra son recolectados al mismo tiempo o conyalta proximidad. El muestreo secuencial involucra seleccionar casos para la primera etapa mediante muestreo orientado por uno o varios propósitos, aleatorio o una combinación de estos; además, con base a los resultados, determinar criterios para elegir los casos o unidades de la muestra para la segunda fase. Asimismo, cuando se especifica la importancia o estatus que se le otorgará a cada etapa al determinar la estrategia de muestreo y el tamaño de la muestra, conduce al investigador a tomar decisiones informadas que se relacionan con la calidad de la elaboración de las meta-inferencias y generalizaciones apropiadas. La tabla 12.2 presenta siete cuestiones claves del proceso de la investigación mixta sugeridas por Collins (2010), acompañadas de preguntas que nos pueden guiar en el momento de tomar decisiones sobre el muestreo. No son exhaustivas, pero nos ayudan a reflexionar en torno al efecto que tienen las decisiones de muestreo sobre el proceso general. El tercer componente presenta cuestiones vinculadas con temas específicos de muestreo mixto pertinentes para la implementación de las estrategias de muestreo, entre las cuales se incluyen esquemas que emplean muestras múltiples y combinaciones de diferentes clases (por ejemplo, muestras por propósito de varias fases, muestras que combinan selección al azar y muestreo por propósitos, etcétera). Cuando se elige la muestra total o las muestras en un estudio mixto, el investigador enfrenta varios retos, entreuna estosmuestra el de representación, integración y laalcuestión se selecciona probabilística, legitimización, la representatividad se refiere grado en“política-académica”. que la muestra reflejaSilas características y composición de la población o universo. Desde luego, las inferencias estadísticas pueden ser débiles o no significativas —en términos de Collins (2010), “comprometerse o ser riesgosas”— si nuestro “poder estadístico” se basa en muestras muy pequeñas y/o que se usen estrategias que limitan la validez externa (Tompson, 2012). Cuando se trabaja con textos o material narrativo y números, la representación se refiere a la habilidad del investigador para extraer la información adecuada de acuerdo al
Metodología de la investigación
Tabla 12.2 Cuestiones vinculadas con el direccionamiento de cada etapa del proceso de muestreo. 11 Propósito general del estudio
¿Cuál es la meta final o a largo plazo del estudio? ¿Quiénes son los usuarios del estudio? ¿De qué manera los afectarán los resultados? ¿Qué características de la muestra posibilitan que se alcance el propósito del estudio? (con personas, por ejemplo: edad, nivel socioeconómico, género, nivel educativo, cultura; con objetos, por ejemplo: propiedades, antigüedad, nivel de desgaste; con procesos: duración, complejidad, etc.)
Objetivo(s) del estudio
¿Qué nivel de generalización se pretende obtener sobre la base de las interpretaciones y conclusiones derivadas de ambas ramas del estudio? ¿Qué nivel de importancia, peso o prioridad se desea otorgar a los descubrimientos de cada fase del estudio? qué formas se piensa que la importancia concedida a cada etapa¿De afectará a las generalizaciones?
Pregunta(s) del estudio
¿En qué grado y con qué profundidad las muestras de las fases cuantitativa y cualitativa generarán datos creíbles y suficientes de tal manera que se puedan responder satisfactoriamente las preguntas de investigación?
Propósito de la mezcla (función)
¿En qué medida se piensa que las características de las muestras afectarán el propósito de la mezcla? (triangulación, desarrollo, complementación, etc.) Diseño de investigación
Diseño de investigación
¿En qué grado y con qué profundidad las estrategias de muestreo pueden cumplir óptimamente los parámetros del diseño en términos de la secuencia temporal y la importancia otorgada a cada fase?
Diseño de la muestra
¿En qué medida y con qué profundidad se han proporcionado argumentos racionales para seleccionar las estrategias de muestreo y los tamaños de muestra para ambas vertientes del estudio?
Selección de la estrategia o esquema de muestreo
¿En qué grado se combinan estrategias de muestreo probabilístico y orientada por propósitos en el estudio?
Determinación del tamaño de muestra
¿En qué medida los tamaños de las muestras reflejan poder inferencial (cuantitativo) y capacidad de generar datos ricos, abundantes, significativos, amplios y profundos (cualitativa), que conduzcan a la formulación de inferencias de calidad en ambas ramas y de metainferencias?
planteamiento y significado subyacente en el texto. En términos de Denzin y Lincoln (2005), el reto de representación se refiere a poder “encapsular” (categorizar) el significado de las experiencias, eventos, sucesos y procesos, así como de sus contextos. Collins (2010) clasifica este desafío como problemas de muestreo que afectan el proceso de muestreo cuantitativo y cualitativo, y al implementar ambos enfoques en un mismo estudio el reto es aún mayor. El desafío de representación puede afectar también la legitimidad de la investigación mixta, específicamente en el momento de la integración de las muestras (el grado en que la relación entre las estrategias de muestreo de ambas fases le permite al investigador generar metainferencias). En ocasiones, puede lograrse representatividad estadística pero no representatividad informativa (de naturaleza cualitativa) o viceversa. El investigador mixto debe poder integrar las inferencias cuantitativas y cualitativas en meta-inferencias que sean teoréticamente consistentes (Collins, 2010), lo que eddlie y ashakkori (2009) denominan “eficacia en la integración” y otros autores como “consistencia interpretativa”. Lo ideal es tener muestras que en su conjunto garanticen validez externa, poder de generalización estadística y representatividad informacional, saturación Sin embargo, no siempre es posible debido a las limitaciones quelogrando normalmente tienendelascategorías. investigaciones (recursos ello económicos, tiempo, grupo de investigadores disponible, etc.). A veces, es necesario “negociar” entre el potencial inferencial y la saturación, entre la generalización externa y la transferencia, es decir, otorgar mayor importancia y recursos a un esquema de muestreo (cuantitativo o cualitativo). 11 Adaptado de Collins (2010, p. 371).
23
24
Capítulo 12 Ampliación y fundamentación de los métodos mixtos
La “cuestión política-académica” se relaciona con las creencias, valores y premisas de los investigadores. Esto es, habrá algunos que prefieren destacar la vertiente cuantitativa por su entrenamiento previo, por la comunidad académica a la cual pertenecen o por sus inclinaciones personales, mientras que otros pueden privilegiar a la aproximación cualitativa. O bien, que tal inclinación se vea afectada por las asunciones de quienes financian o solicitan el estudio en cuestión. al cuestión refleja el grado en que el investigador presenta los resultados de ambas fases de una manera equilibrada y la medida en que los usuarios consideran que los resultados y descubrimientos pueden aplicarse a otros contextos (Collins, 2010). La tabla 12.3 presenta los retos de representación, legitimidad, integración y político-académico, acompañados de preguntas a manera de ejemplos para guiar al investigador en la toma de decisiones sobre muestreo de cada fase de su estudio,12 las cuales no son exhaustivas pero pueden ser útiles al reflexionar respecto del efecto que tiene las decisiones en torno al muestreo en todo el proceso de la investigación mixta. Tabla 12.3 Cuestionamientos potenciales relacionados con las decisiones sobre muestreo y los retos afrontados en los estudios mixtos. 13 Reto
Fasecuantitativa
Fasecualitativa
Representación
¿En qué grado podemos identificar y consecuentemente seleccionar una muestra que tenga el suficiente poder para detectar relaciones estadísticamente significativas entre las variables y/o diferencias entre grupos para la etapa cuantitativa?
¿Qué tipos de técnicas podemos utilizar para asegurarnos que todas las facetas o construcciones (con fenómenos, eventos y procesos) o “voces” o grupos (con individuos o colectividades) estén incluidas(os) en la muestra? (variedad y profundidad). ¿En qué medida tales facetas, construcciones, voces o grupos pueden presentarse con claridad y sin sesgos? ¿En qué grado las estrategias de muestreo pueden alcanzar validez teorética en términos de transparencia?
Legitimidad
¿En qué medida las estrategias de muestreo pueden lograr que se alcance el objetivo del estudio en términos de generalización?
¿En qué grado las estrategias de muestreo pueden lograr que se alcance el objetivo del estudio en términos de transferencia?
Integración
¿En qué grado el tamaño de la muestra cuantitativa se encuentra en equilibrio respecto de los objetivos del estudio? ¿En qué medida el tamaño de la muestra cuantitativa se encuentra en balance respecto del tamaño de la muestra cualitativa? ¿Hasta qué grado el esquema de muestreo o combinación de estrategias seleccionada para la fase cuantitativa se encuentra alineado con el planteamiento del problema (preguntas, objetivos, propósito de la mezcla) y direccionado por este?
¿En qué grado el tamaño de la muestra cualitativa se encuentra en equilibrio respecto de los objetivos del estudio? ¿En qué medida el tamaño de la muestra cualitativa se encuentra en balance respecto del tamaño de la muestra cuantitativa? ¿Hasta qué grado el esquema de muestreo o combinación de estrategias seleccionada para la fase cualitativa se encuentra alineado con el planteamiento del problema (preguntas, objetivos, propósito de la mezcla) y direccionado por éste?
Político
¿En qué medida los resultados y descubrimientos cuantitativos se presentan de una manera clara y balanceada respecto al planteamiento del problema?
¿En qué medida y profundidad los resultados y descubrimientos cualitativos se presentan de una manera clara y balanceada respecto del planteamiento del problema?
12 Pueden redactarse en futuro si se trata del proyecto o protocolo, en presente al tomar decisiones de muestreo o en pasado para evaluar la calidad de las estrategias de muestreo implementadas en el estudio mixto. Desde luego, estos cuestionamientos es mejor hacerlos al planear el proyecto. Como siempre, “más vale prevenir que lamentar”. 13 Adaptada de Collins (2010, p. 373).
Metodología de la investigación
Ejemplos de estudios con esquemas de muestreo mixtos Educación
Black, Little, McCoach, Purcell y Siegle (2008), mediante un diseño mixto concurrente evaluaron un programa académico de intervención con estudiantes de nivel medio. Las muestras consistieron en dos cohortes diferentes (51 casos en cada uno) de alumnos de sexto grado inscritos en dos escuelas donde se llevaría a cabo la intervención (nuevo currículum) y que fueron elegidas al azar. La muestra de comparación consistía de 22 estudiantes de una tercera escuela cuya enseñanza se basaría en el currículum estándar. Los datos cuantitativos se obtuvieron mediante un cuestionario estandarizado diseñado para medir los efectos del currículum sobre el aprendizaje, así como a través de la libreta o boletín de calificaciones y puntuaciones de pruebas también estandarizadas como evidencia de los niveles de desempeño escolar. Los datos cualitativos se obtuvieron de entrevistas y grupos de enfoque con profesores de los alumnos, coordinadores y directivos. La función o finalidad del estudio era la complementación. Debe recalcarse que las escuelas fueron seleccionadas al azar, pero los participantes se eligieron en varias etapas (multietapas), en cada una de las cuales se consideraba un propósito y luego se seleccionaba al azar a los alumnos que lo cubrieran, lo que Collins (2010) denomina como “muestra aleatoria por propósito”. Black et al. (2008) destacaron los datos cuantitativos en términos de la formulación de interpretaciones y conclusiones. Bibliotecología
Diedrich, Dzbor y Maynard (2007) realizaron un estudio mixto secuencial —función o fines de expansión y desarrollo— con el propósito de examinar un programa diseñado para dar soporte a los sistemas de librerías digitales, en particular a las tecnologías semánticas web. En la primera etapa, se administró un cuestionario a todos los usuarios registrados (n = 240) asociados con 10 instituciones (muestra orientada por propósito, autoselección) del programa de apoyo. En la segunda fase, una muestra de voluntarios relacionados con cuatro instituciones (n = 35) completó una serie de tareas vinculadas con la aplicación del programa. muestras fueron integradas y comparadas con losdigitales. archivos de registro y con los resultados de laAmbas evaluación concernientes a otros sistemas de bibliotecas Ciencias de la salud
Morgan y Konrad (2008) llevaron a cabo un diseño concurrente con la finalidad de evaluar un programa en desarrollo sobre “fuerza de trabajo” dirigido a asistentes de enfermería, para fines de triangulación y complementación. Los datos fueron recolectados a través de entrevistas semiestructuradas longitudinales (cualitativos) y encuestas (cuantitativos) en muestras multiniveles. Ocho lugares donde se había aplicado el programa (muestra por propósito, que cumplieran el criterio de implementación) fueron comparados con 10 sitios donde no se había implantado el programa. Los primeros incluyeron 68 supervisores y 77 asistentes. De los lugares de no aplicación del programa se obtuvo una muestra de 85 supervisores seleccionados al azar. Se transcribieron 84 entrevistas con informantes claves en lugares de implementación y no implementación (casos críticos o relevantes). Sargeant, Valli, Ferrier y MacLeod (2008) ejecutaron un diseño secuencial (CUAN/cual) para evaluar el efecto que tiene un taller de asesoría en estilos de vida sobre las actitudes, comunicación y habilidades de asesoramiento del personal de atención primaria en unidades sanitarias (fines de complementación). Los datos cuantitativos consistieron en respuestas a un cuestionario por parte de 43 sujetos que participaron voluntariamente en el taller (muestra por propósito, autoselección). El instrumento fue administrado al final de este y se les preguntaba para que identificaran cambios que consideraban habían tenido como consecuencia del ejercicio de capacitación y las barreras potenciales para implementar esos cambios. Los resultados indicaron que 41 participantes tenían la intención de hacer cambios en sus patrones de atención y prácticas. res meses después, los que respondieron (41) fueron contactados telefónicamente (fase cualitativa) a fin de evaluar cambios específicos realizados e identificar los factores que habían
25
26
Capítulo 12 Ampliación y fundamentación de los métodos mixtos
influido en ellos. Doce aceptaron la entrevista (muestra por conveniencia). Los dos tipos de datos fueron analizados (estadística y análisis de contenido temático). Salud pública
Groleau, Pluye y Nadeau (2007) condujeron un diseño secuencial para evaluar el estatus sanitario de una comunidad e identificar las conductas de salud de sus integrantes, usando una muestra multietapas por propósito pero con selección aleatoria. Se pretendía que la muestra representara a los principales grupos de inmigrantes que vivieran en la comunidad. La función esencial del diseño mixto fue desarrollo. La primera fase (cuantitativa) consistió de una muestra de 2 400 residentes elegidos al azar, los cuales fueron encuestados vía telefónica sobre la utilización de los servicios de salud y las razones por las cuales los había usado o no. Asimismo, completaron un cuestionario diseñado con el objetivo de medir los niveles de estrés. Los resultados de esta etapa sirvieron para seleccionar las muestras para la segunda fase (cualitativa), las cuales fueron conformadas con el fin de indagar el grado en que los factores sociales y contextuales tenían efectos sobre las conductas vinculadas con la salud. Para esta vertiente cualitativa se consideraron dos grupos (muestras), la primera conformada por inmigrantes vietnamitas (n = 18) y la segunda por inmigrantes hindúes ( n = 15), ambas por propósito o criterio (condición de inmigrantes). A cada participante se le aplicó una simulación: que experimentaran estrés sobre un padecimiento o un síntoma inexplicable (ahora, muestras de casos críticos) y se les efectuó una entrevista mediante una guía de tópicos semiestructurada. Desde luego, estas muestras fueron extraídas de la muestra mayor (muestra anidada). Como podemos ver, se combinaron criterios probabilísticos y cualitativos para elegir a la muestra total del estudio. Petros (2014) utilizó una aproximación mixta para investigar las necesidades de apoyo de adultos mayores que atienden a niños (varios sus propios nietos) infectados o afectados por el VIH/SIDA. La muestra consistió en 305 personas de áreas rurales y urbanas, elegidas por propósito, a las cuales se les aplicó un instrumento estandarizado. A 10 de ellas se les efectuó una entrevista de seguimiento bajo el esquema de estudio de caso cualitativo. Además, se entrevistó en profundidad a nueve informantes claves de organizaciones gubernamentales y no gubernamentales. Ciencias de la salud/Trabajo social
Waldrop (2007) implementó un estudio mixto concurrente y con el mismo estatus para ambas aproximaciones, utilizando muestras idénticas escogidas por propósito, con el objetivo de explorar la atención integral a personas en su etapa terminal considerando su contexto familiar. La función mixta era triangulación . Los datos cuantitativos consistieron en respuestas a cuestionarios aplicados a 40 asistentes de los enfermos (cuidadores), los cuales fueron contactados por los investigadores para que participaran en la investigación (muestra por propósito). Los cuestionarios se administraron en dos momentos: durante el periodo de asistencia al paciente (tiempo 1) y 12 meses después del deceso del enfermo. Los datos cualitativos estaban conformados por respuestas a una entrevista en profundidad sobre la experiencia completa del participante. Sociología
Anderson, Goe y Weng (2007) mediante un diseño secuencial y una muestra por propósito de varias etapas analizaron el cambio, sus condiciones y efecto en trabajadores pobres de la población de la región central del norte de Estados Unidos. Para la vertiente cuantitativa realizaron un análisis lineal tipo panel para identificar condados atípicos (n = 1 055) (muestreo de casos extremos). Posteriormente, para la cualitativa efectuaron estudios de caso de 112 condados elegidos. El propósito de la mezcla mixta era “desarrollo”. Se recabaron y evaluaron múltiples datos cuantitativos y cualitativos.
Metodología de la investigación
Algunas consideraciones sobre la estrategia de muestreo en los métodos mixtos14 1.
2.
3.
4.
5.
6.
7.
Como en cualquier estudio, la estrategia de muestreo debe provenir lógicamente de la pregunta de investigación e hipótesis planteadas. La mayoría de las veces el esquema abarca técnicas probabilísticas, así como guiadas por uno o varios propósitos; pero, en algunos casos el método más adecuado será puramente probabilístico u orientado por una o varias razones de investigación (eddlie y Yu, 2008). Una de las preguntas centrales que debemos contestar es si la estrategia de muestreo encauzará a seleccionar las unidades o casos pertinentes relativos al planteamiento del problema. Los investigadores deben asegurarse de que se respetan las premisas de cada enfoque y la estrategia utilizada, ya sea del método cuantitativo y el muestreo probabilístico o el método cualitativo y el muestreo guiado por una o varias razones. Si esto no ocurre, la certidumbre, confiabilidad y validez del estudio estarán en duda. No debemos olvidar los principios que sustentan a cada tipo de muestreo, pues no se trata de elegir una muestra que nos resulte “cómoda”, sino una muestra conveniente para el planteamiento del problema. La estrategia general de muestreo debe generar bases de datos cuantitativas y cualitativas rigurosas sobre las variables o las cuestiones del estudio derivadas del planteamiento del problema. Lo conveniente, en términos científicos es que sean representativas y saturen las categorías. Es necesario que el investigador se pregunte si la estrategia general de muestreo está lo suficientemente enfocada de tal manera que permite recolectar los datos necesarios para responder al planteamiento del problema. La estrategia de muestreo debe permitir a los investigadores extraer inferencias claras y completas tanto de los datos cuantitativos como cualitativos. Si esto no es posible, las inferencias pueden resultar inadecuadas o poco transparentes (en Celaya les decimos paulinianas). Desde la perspectiva cuantitativa hablamos de validez interna y confiabilidad, desde la cualitativa nos referimos a credibilidad de la indagación. Un aspecto pragmático es que la estrategia general de muestreo debe ser viable y eficaz. Es decir, el investigador o investigadora debe asegurarse de que dispone de los suficientes recursos y tiempo para completar la estrategia de muestreo, así como cerciorarse de que tiene acceso a todas las fuentes de datos necesarias. Asimismo, esta deberá ser acorde con las habilidades y conocimientos del investigador. Si no es seguro que posee los recursos, tiempo y competencias suficientes, será mejor que replantee sus objetivos y preguntas de investigación, que acote más su alcance o reduzca sus pretensiones Lograr la transferencia y generalización de los resultados y conclusiones del estudio a otros individuos, grupos o contextos es un imperativo de la estrategia de muestreo. Recordemos que desde el enfoque cualitativo hablamos de transferencia, mientras que desde la perspectiva cuantitativa nos referimos a la validez externa y a la generalización. En sus reportes de resultados, los investigadores deben describir amplia y detalladamente las estrategias de muestreo, de tal manera que otros científicos puedan comprender sus procedimientos y poder replicarlos en el futuro, además para reforzar la confianza en las conclusiones de tales documentos.
La creatividad y la flexibilidad en el diseño de las estrategias de muestreo de los métodos mixtos son cruciales para el éxito de la investigación.
LOS MÉTODOS MIXTOS SE FUNDAMENTAN EN EL CONCEPTO DE TRIANGULACIÓN Ya se señaló en el capítulo 17 del libro y en el primero de este Centro de recursos que el concepto de triangulación ha sido esencial para los métodos mixtos. Sin embargo, esta noción se extendió más allá de
la comparación e integración de datos cuantitativos y cualitativos, por lo que podemos hablar de diversos tipos de triangulación (Creswell, 2013a; Onwuegbuzie et al., 2010; Nagy Hesse-Biber, 2010; Mertens, 14 Las siguientes observaciones están basadas en algunas fuentes de la respectiva literatura como Hernández-Sampieri y Mendoza (2012 y 2008) y Teddlie y Yu (2008).
27
28
Capítulo 12 Ampliación y fundamentación de los métodos mixtos
2010; Hernández-Sampieri y Mendoza, 2008; Greene, 2007; odd, Nerlich y McKeown, 2004; Denzin y Lincoln, 2000). riangulación de datos: De distinta naturaleza (cuantitativos-cualitativos). b) De diferentes fuentes (archivos, cuestionarios estandarizados, observación, etcétera). c) De distintos tiempos (preprueba/posprueba, series de tiempos, experimentos cronológicos; inducción enfocada paulatinamente). d) De bases de datos (conversión de una clase de datos a otra y viceversa). 2. riangulación de métodos: a) Dentro de cada método. b) Entre métodos (cuantitativo y cualitativo): Diseños concurrentes. Diseños secuenciales. Diseños de conversión. Diseños de integración. 3. riangulación de investigadores: a) Mismo método (auditoría). b) Distintos métodos (colaboración en equipo). 4. riangulación de teorías: a) Construir una nueva teoría que aglutine principios de otras. b) Desarrollar una perspectiva teórica para una investigación en particular. c) Concurrencia de varias teorías y modelos para consolidar y ampliar el entendimiento de un fenómeno o problema de estudio.
1.
a)
• • • •
5.
riangulación de ciencias o disciplinas:
Enfocar el problema desde varias ciencias o disciplinas. Convocar conocimiento y técnicas desde distintas ciencias o disciplinas. odd, Nerlich y McKeown (2004) señalan que la triangulación de métodos sólo se aplica cuando estos son complementarios. Si poseen los mismos riesgos, no resulta una verdadera triangulación. Si diversas investigaciones monometódicas (cuantitativas o cualitativas) no producen los resultados esperados o estos no son convincentes, puede ser favorable el empleo de un diseño mixto. Cuando se logra la triangulación total, la riqueza es máxima, pero el riesgo de que la investigación se disperse y se convierta en una especie de “torre de Babel”, también aumenta si no se procede con rigor (Hernández-Sampieri y Mendoza, 2008). Rodríguez (2005) nos presenta las ventajas y retos de la triangulación, que reproducimos en la tabla 12.4. Sin embargo, como resaltan Hernández-Sampieri y Mendoza (2008), si se procede con rigor con cada rama y la integración es cuidadosa (sistemática y fundamentada en bases de datos ordenadas y depuradas), y además, se trabaja en equipo —varios investigadores aportan e intercambian sus conocimientos y experticia—, la triangulación proporciona una visión holística, múltiple y sumamente enriquecedora. La utilización de diversos métodos permite desarrollar un programa de investigación persistente. Cada una de las aproximaciones debe generar un estudio completo en sí mismo. A su vez, debe indicar la naturaleza y dirección del siguiente. Los resultados obtenidos serán validados y extendidos en cada aplicación alumbrando un entendimiento global del fenómeno de estudio (Morse y Chung, 2003). a) b)
Metodología de la investigación
Tabla 12.4 Ventajas y retos potenciales de la triangulación. Ventajas
Retos
Mayor confianza y validez de los resultados
Acumulación de gran cantidad de datos sin efectuar un análisis exhaustivo y completo
Más creatividad en el abordaje del estudio
Dificultad de organización de los materiales en un marco coherente y congruente
Más flexibilidad interpretativa
Mayor complicación para controlar los sesgos que provienen de muy diversas fuentes y con distintas características
Mayor productividad en la recolección y el análisis de los datos
Complejidad derivada de la multidimensionalidad de los casos estudiados
Más sensibilidad a los grados de variación no perceptibles con un solo método.
Carencia de directrices para determinar la convergencia de resultados
Posibilidad de descubrir fenómenos atípicos y casos extremos
Costos elevados para implementar el estudio (ya mencionados como un obstáculo de los diseños mixtos)
Cercanía del investigador al fenómeno de estudio Posibilidad de innovación en los marcos conceptuales y metodológicos
Dificultad de réplica del estudio El enfoque global puede “monopolizar” los resultados de la teorización y hacer a un lado la teorización de cada método
CONVERSIÓN DE DATOS Y SU ANÁLISIS De acuerdo con Creswell (2014); Bazeley (2010) y Hernández-Sampieri y Mendoza (2008), los estudios mixtos pueden recolectar: 1. Solo datos cuantitativos, pero estos deben cualificarse para tener datos de ambas aproximaciones. 2. Solo datos cualitativos, pero estos deben cuantificarse para tener datos de las dos ramas. Sin embargo, la mayoría recaba datos cuantitativos y cualitativos que pueden provenir de la misma o de distintas fuentes. El tiempo de recolección y la capacidad para emparejar las fuentes tienen implicaciones para el grado en el cual los componentes del análisis global pueden ser integrados. Las respuestas obtenidas a través de encuestas muchas veces comprenden preguntas abiertas y cerradas (de la misma fuente, una muestra) y los datos son relativamente fáciles de integrar. La integración de encuestas (cuestionarios estandarizados) y entrevistas abiertas o semiestructuradas u otras fuentes distintas o separadas resulta un poco más compleja, y con frecuencia ocurre hasta que se ha completado el análisis de cada una de las fuentes (por ejemplo, en el diagnóstico clínico, donde se interpretan valores de pruebas de laboratorio de distintas escalas y datos narrativos, o una indagación de las causas de un accidente aéreo, como se ilustró en la obra impresa). Uno de los propósitos más importantes de diversos estudios mixtos es la transformación de datos para su análisis combinado. En términos de eddlie y ashakkori (2009), esto implica que un tipo de datos es convertido en otro (cualificar datos cuantitativos o cuantificar datos cualitativos) y luego se consideran ambos conjuntos de datos bajo análisis tanto CUAN como CUAL o se reúnen (por ejemplo, en matrices). Este mecanismo da pie a la clase de diseños denominados “de conversión”, vistos en el capítulo 17 del texto.
Cuantificación Esta actividad implica transformar datos cualitativos en cuantitativos, es decir, asignar valores numéricos (nominales u ordinales, incluyendo valores dicotómicos binarios) a datos concebidos srcinalmente como no numéricos o cualitativos (segmentos de texto, anotaciones, observaciones, imágenes, videos,
Cuantificación Ocurre cuando a las categorías cualitativas se les asignan valores numéricos, no solo como etiquetas sino con las propiedades del nivel de medición asignado.
29
30
Figura 7.5 Ejemplos de unidades de análisis y su clasificación en categorías. Capítulo 12 Ampliación y fundamentación de los métodos mixtos
grabaciones de audio, etc.), de tal manera que puedan analizarse estadísticamente. El propósito reside en facilitar el reconocimiento de patrones o regularidades y peculiaridades, contabilizar todos los datos, evaluar si diferentes análisis con distintas perspectivas coinciden y consolidan la extracción de significado. Asimismo, es útil para manejar la confusión de significados y contribuir a proporcionarles mayor estructura a los datos cualitativos, además de poder compararlos y mezclarlos con los datos cuantitativos (análisis mixto). No se trata solo de yuxtaponerlos sino fusionarlos a fin de contar con un análisis más enriquecedor (Driscoll, Appiah-Yeboah, Salib y Rupert, 2007). Resulta una posibilidad bastante aceptada y utilizada (O'Brien, 2013; Ayiro y Mibey, 2012; Hesse-Biber, 2010a; Sandelowski, Voils y Knafl, 2009; Hernández-Sampieri y Mendoza, 2008). Un material cualitativo puede codificarse de diversos modos: a)
Por comparación constante, análisis de contenido o de dominio de los datos o unidades para generar categorías emergentes (codificación puramente cualitativa) Cuantitativamente, usando códigos predeterminados por estudios previos y luego ver cómo los datos encajan en las categorías. c) Comparar las categorías emergentes con las categorías predeterminadas (coincidencia). d) Recodificar cuantitativamente el material utilizando una combinación de ambos códigos. Estas codificaciones pueden estructurarse de diversas formas, siendo las más sencillas las siguientes: 1. Conteo de frecuencias de las categorías. El conteo de frecuencias y los porcentajes de las categorías nos puede proporcionar ciertas estadísticas descriptivas sobre los datos cualitativos y analizar tendencias en estos. La acción responde a la pregunta: ¿cuáles fueron las categorías y temas más frecuentes en los datos? Desde luego, la frecuencia no implica necesariamente que esas categorías fueron las más importantes, pues todo depende del contexto. Es decir, puede ser un indicador, aunque debe interpretarse dentro del significado general de los datos. Sobre ello, volveremos posteriormente. 2. Puntuaciones jerarquizadas (rangos). Crear puntuaciones con rangos es particularmente útil si el investigador ha estructurado sus datos de b)
3.
tal manera que puedan categorizarse dentro entre casosdeindividuales (por ejemplo, en entrevistas). Hesse-Biber (2010) recomienda pensar en layestructura casos específicos en el componente cualitativo, de tal manera que más adelante se puedan cuantificar los datos. Específicamente debemos cuestionarnos: ¿la recolección de los datos cualitativos nos permite estructurar casos específicos?, ¿en la recolección cualitativa se indagaron cuestiones que pueden categorizarse en categorías descriptivas? (por ejemplo, aspectos demográficos en entrevistas, intensidad de opiniones, etcétera). Asimismo, desde el instrumento podemos recabar datos cualitativos pero pidiéndole a los participantes cierta cuantificación. Por ejemplo: ¿cuál es la principal razón por la que su empresa ha implementado programas de responsabilidad social? (abierta), y preguntar: ¿qué tan exitosa consideraría esta participación? (Sumamente exitosa, más bien exitosa, medianamente exitosa, poco exitosa, muy poco exitosa). Otra alternativa sería que, una vez que tenemos las categorías producto del análisis cualitativo, al regresar con los participantes para verificar que hayamos reflejado sus puntos de vista, les pidamos que cuantifiquen mediante rangos tales categorías (ordenen preferencias, percepciones, experiencias). ransformaciones más complejas. Creación de tipologías a partir de datos cualitativos. Este tema lo explicaremos a partir de un ejemplo. 15
En de 1996, un estudio sobre alos de alimentación e imagen corporal mujeres Hesee-Biber universitariasdesarrolló de raza blanca. Entrevistó 55hábitos participantes (muestra por propósito) y les administró un cuestionario exploratorio. Su planteamiento incluía, entre otras preguntas, la siguiente: ¿existe una relación entre las críticas de los familiares y amigos y el desarrollo de síntomas 15 Hesee-Biber (2010).
Metodología de la investigación
de trastornos alimentarios entre las mujeres? La autora generó “una tipología alimentaria” basada en datos cuantificados (cualitativos transformados en cuantitativos), la cual condujo a la creación de categorías cuantitativas que incrementaban la capacidad de generalizar los resultados. Los descubrimientos mostraron que algunos amigos y familiares apoyaban el peso y la autopercepción de los participantes, mientras que otros eran muy críticos. Algunos ejemplos de citas extraídas que fueron tomadas de las entrevistas son las siguientes: Participante 1 cuya madre apoya su imagen corporal: “odo lo que desea mi madre es verme feliz. Puedo pesar 500 libras mientras que sea feliz. Su enfoque siempre se ha centrado en mi salud, no tanto en mi apariencia. De tal manera que sus comentarios han sido siempre hacia un apoyo positivo. Muy rara vez recuerdo que me haya hecho comentarios negativos sobre cómo me veo. Me alienta la mayoría de las veces. Mi madre dice cuestiones como: ‘ienes un rostro hermoso, manos bonitas’. Se centra en mis cualidades individuales”. Por otro lado, otras mujeres han recibido críticas negativas de parte de su familia. Participante 2: “Mis hermanas y hermanos caminan a mi alrededor haciendo sonidos propios de los puercos, y mi padre me dice: ‘Necesitas perder peso’. He tratado y he tenido éxito”. Participante 3: “Mis hermanos han mencionado la cuestión a mi madre, y ella dijo: ‘Rob piensa que estás engordando; tal vez debas dejar de comer tanto’. Mi padre ha comentado mucho. Nunca de mala manera, siempre bien. Él dijo: ‘e ves bien, has perdido peso’. Siempre está comentando sobre muchachas jóvenes bonitas. Sé que es importante para él que yo me vea también bien. Quiero que vea que puedo ser tan bonita como las chicas sobre las cuales habla. Deseo que esté orgulloso de mí como sé que antes estaba”. Resulta muy complicado establecer cualquier tipo de relación causal en una muestra de 55 personas. Lo mismo que responder a una pregunta correlacional con datos cualitativos (vincular las conductas críticastransformarse con la presencia un desorden alimentario). mediante la cuantificación, los códigos pueden en de datos cuantitativos. Los pasosPero, a seguir que sugiere Hesee-Biber (2010), ilustrados mediante el estudio comentado de 1996, son los siguientes: 1.
2.
Codificar el texto o narrativas de otro tipo (en este caso, las transcripciones de las entrevistas), mediante un programa de análisis. Ello permite descubrir patrones mediante la organización y reducción de los datos, a través de las categorías. ambién, encontrando los temas (agrupando categorías), y mediante la comparación constante, localizar significados amplios vinculados al planteamiento del problema. Por ejemplo, un tema que agrupó a varias unidades fue “críticas de parte de padres o hermanos (familiares)” (CF). Convertir códigos en variables o sus categorías (información cualitativa a cuantitativa). Los códigos cualitativos relevantes fueron transformados en categorías binarias de variables (1 = presencia, 0 = ausencia). En el ejemplo, 16 de las 55 mujeres reportaron que un familiar criticó sus cuerpos (CRC). Se les asignó el valor de uno (1= presencia de la categoría o “sí”). A las restantes 39 mujeres, que no recibieron realimentación o críticas negativas de sus parientes, se les asignó el valor de cero (0, “no” o ausencia). El mismo proceso se efectuó para obtener una variable binaria por la presencia de algún desorden o trastorno alimentario (A). La matriz resultante (sin datos) fue la que se ilustra en la tabla 12.5.
31
32
Capítulo 12 Ampliación y fundamentación de los métodos mixtos
Tabla 12.5 Cuantificación de variables: transformación de códigos en valores binarios de variables.16 Variable
Númerodeentrevista 1
2
3
4
56
7
k
CRC (0 = no, 1 = sí) TA (0 = no, 1 = sí)
3.
Analizar los datos. El programa cualitativo exporta los datos (variables cuantificadas) como matriz a un programa de análisis cuantitativo o lo podemos hacer en el mismo programa si tiene esta opción. Así, es factible efectuar el análisis estadístico pertinente de acuerdo con nuestro interés y tomando en cuenta los respectivos principios como el nivel de medición. La autora analizó la relación entre las variables binarias y construyó la siguiente tabla que muestra cierta asociación entre las críticas de familiares y síntomas de desorden alimentario como bulimia y anorexia. Tabla 12.6 Relación entre las críticas de familiares y la presencia de un trastorno alimentatio (datos cuantificados).16 Trastorno alimentario
Sí
Críticas de familiares
No
Sí
(12.8%) 5
(56.3%) 9
No
(87.2% 34 )
Total
39 (100%)
(43.8%) 7 16 (100%)
Hesee-Biber también validó esta correlación al observar otras variables cuantificadas que podían soportar variable alguno de sobrepeso y eran agregó críticos una los padreselodescubrimiento. ambos padecíanConcretamente, con tercera el cuerpo de supara hija.considerar Descubriósique las críticas de los padres que no tenían sobrepeso fueron asociadas con el trastorno alimentario de la hija, mientras que las críticas de un padre o madre con sobrepeso no, lo cual sugiere que las palabras críticas de un progenitor obeso tienen menor influencia en los desórdenes alimentarios de las hijas. Las tablas 12.7 y 12.8 muestran estas tendencias. Tabla 12.7
Vinculación entre datos cuantificados en la categoría "padres sin sobrepeso" .
Trastorno alimentario
Críticas de familiares
No
Sí
Sí
(7.1%) 2
No
(92.9%) 26
Total
28 (100%)
Tabla 12.8
Total
(33.3%) 4 12 (100%)
Vinculación entre datos cuantificados en la categoría "al menos un padre con sobrepeso" .
Trastorno alimentario
Sí No
(66.7%) 8
Críticas de familiares
No (27.3%) 3 (72.7%) 8 11 (100%)
Sí (25.0%) 1 (75.0%) 3 4 (100%)
16 Adaptado de Hesse-Biber (2010, p. 95). No llenamos el ejemplo con los 55 casos por cuestiones de espacio y debido a que lo interesante es la concepción de la cuantificación. Fuente srcinal: Hesee-Biber, Sh. (1996). Am I thin enough yet? The cult of thinness and the commercialization of identity. New York, NY, Estados Unidos, Oxford University Press.
Metodología de la investigación
Cuando cuantificó, la autora pudo obtener correlaciones que, desde luego, no pueden generalizarse a una población más amplia, pero sí aportan al conocimiento del vínculo que tienen las críticas de los familiares y amigos con el desarrollo de trastornos alimentarios como la bulimia y la anorexia, al considerar tanto la evidencia cualitativa como cuantitativa. Si a estos resultados le agregamos un modelo de teoría fundamentada, la explicación puede ser bastante completa y enriquecedora. La cuantificación parte de la base de que los datos pueden ser caracterizados principalmente como cuantitativos o cualitativos, pero no en términos absolutos. De cualquier forma, los datos constituyen “representaciones abstractas” de un fenómeno, ya sea números o palabras, lenguaje visual y/o auditivo. Cuando los recolectamos nos basamos en escalas creadas por los investigadores, experiencias sensoriales y procesos de pensamiento. De acuerdo con Sandelowski et al. (2009) una función de la cuantificación es responder preguntas de investigación o probar hipótesis clarificando las relaciones entre una o más variables independientes y una o más dependientes, construidas sobre la base de datos cuantitativos y cualitativos. Incluso, considerando el efecto de una variable generada mediante cuantificación o indirectamente tratándola como covariable, interviniente o moderadora del efecto sobre otra variable. Por ejemplo, con la pregunta de investigación: ¿el tipo de narrativa respecto a una enfermedad (con tipos construidos mediante entrevistas y asignándoles los valores de 1= aceptación, 2 = distanciamiento o abstracción, 3 = negación) predice el funcionamiento físico y la salud mental (altas puntuaciones en actividades físicas cotidianas y en escalas de felicidad y salud mental, respectivamente)?, y la hipótesis: “Las narrativas que aceptan la enfermedad producen mejor funcionamiento físico y salud mental en comparación con narrativas que niegan la enfermedad o que demuestran abstracción o hacerla a un lado, olvidarse”. En este tipo de estudio, los datos cualitativos (narrativas sobre la enfermedad) han sido transformados en una variable categórica para responder a la pregunta y probar la hipótesis. Desde luego, no se trata de eliminar del análisis a las narrativas de los enfermos, ni la riqueza interpretativa que proporciona esta información, sino de sumar otros elementos para fortalecer las inferencias y enriquecer la interpretación. Como dice el Dr. Roberto Hernández Galicia: “En la ciencia, no es en lugar de…, sino además de…”.
El conteo Con frecuencia, la conversión de datos cualitativos en cuantitativos se hace para que sean estadísticamente asimilados y puedan vincularse con datos srcinalmente cuantitativos. En realidad, asignar números a palabras no es ajeno a la investigación cuantitativa en ciencias sociales. En las escalas (por ejemplo, Likert) se colocan “anclas verbales” a los valores numéricos (0 = nunca, 1 = muy pocas veces, 2 = algunas veces, 3 = la mayoría de las veces, 4 = siempre). Estos números no son un “ancla objetiva”, sino que dependen de cómo se conceptualizó el problema bajo estudio en un instrumento para recolectar los datos (Edwards, Dattilio y Bromley, 2004). Los valores dependen de decisiones con una fuerte carga subjetiva por parte de los investigadores que diseñan el instrumento. Además, las categorías son interpretadas de manera relativa por quienes responden. Por ejemplo, si hablamos de la frase “mi pareja me apoya”, el “siempre” o “4” puede implicar que en la última semana lo ha hecho 30 veces o 25 veces u otra frecuencia elevada. No es una categoría exacta. Las respuestas se encuentran influidas por el marco de referencia de cada individuo. Por ello, esta acción —tradicionalmente cuantitativa— no es en extremo distinta de asignar valores numéricos a categorías cualitativas. Como se ha implicado en toda la obra, en un estudio cualitativo puede solicitarse a los participantes et alsido un numérico” ., 2009). Por ejemplo, en el caso de unadeinvestigación para conocer “anclaje las experiencias de (Sandelowski mujeres que han asaltadas violentamente, además analizar sus narrativas, podemos pedirles que califiquen su experiencia en una escala numérica (por ejemplo, del 0 al 5 en términos de qué tan terrorífica fue, el grado en que sintieron que su vida corría peligro, etc.). Sin embargo, en ambos casos estamos trabajando básicamente con datos cualitativos. Incluso, en el caso de los valores de una prueba de laboratorio, los números derivan su significado de un contexto específico: un valor de la glucosa en la sangre en ayunas de 100 mg/dl, y su lectura como alta
33
34
Capítulo 12 Ampliación y fundamentación de los métodos mixtos
o baja, normal o anormal, depende de la edad, género, progresión de una enfermedad u otras circunstancia de la persona medida, además de la aceptación de su medición en términos de miligramos por decilitro. Se requiere de mucho trabajo previo interpretativo y revisión de la literatura para asignar un valor numérico a una “entidad”. El conteo implica hacer juicios sobre identidad y diferencia, inclusión y exclusión (qué se parece y qué es distinto). Como ya se señaló, la cuantificación puede hacerse a escalas nominales u ordinales. Cuando es nominal, solo pueden utilizarse tomando en cuenta las propiedades de este nivel de medición. Es decir, utilizarse para analizar frecuencias y calcular la moda. En otras pruebas estadísticas, las variables cuantificadas deben usarse sólo como predictores tratadas como factores en el análisis de varianza o como productos en los análisis de regresión logística. Desde luego, en la cuantificación nominal u ordinal puede utilizarse et al. (2009). estadística paramétrica. Veamos ejemplo de Sandelowski En un no estudio que utilizó comounforma de recolección entrevistas con mujeres que dieron positivo en VIH, el investigador observó que: 1. Algunas reportaron que la ignorancia sobre el VIH les provocaba temor. 2. Ciertas participantes describieron al VIH como una infección que no difiere de otras. 3. Otras expresaron sentir que se les juzgaba con mayor severidad que a los hombres positivos en VIH. 4. Algunas de ellas expresaron su enojo por los comentarios de los demás respecto de que no tienen hijos. 5. Las mujeres afroamericanas se sintieron juzgadas más severamente que las mujeres blancas. 6. Las mujeres de clase media se concibieron diferentes del estereotipo social de las personas con VIH. 7. Algunas mantuvieron en secreto su condición de VIH.
Estas expresiones parecen referirse a tópicos diferentes y un analista podría continuar tratándolas como temáticamente distintas. Por su parte, otro analista puede verlas como que se refieren a tópicos diferentes pero del mismo tema. Un primer análisis de similitud puede considerar a todas estas expresiones como indicadores de las reacciones negativas de los demás a la infección por VIH. Un segundo análisis puede interpretar todas las expresiones como indicadores empíricos de un estigma sobre el VIH. Un tercer análisis enfocar todas las expresiones como relacionadas un estigma el VIH pero también comopuede intentos de minimizarlo. En un cuarto análisis se puedecon concluir que lassobre mujeres manejan el VIH como un estigma a través de: a) señalar aspectos negativos de otras personas (racismo, discriminación, ignorancia), b) desautorizar las opiniones de los demás por ser cero positivos (no VIH), c) señalar que el VIH es como cualquier otra enfermedad. Los incisos “a” y “c” sugieren la noción (tema) de que no hay nada de malo en padecer VIH. El “b” incorpora un sentimiento de que el VIH solamente puede ser comprendido por quien lo padece. Si deseamos realizar análisis estadísticos con estos resultados cualitativos, a cada una de estas tres estrategias le podríamos asignar un valor numérico para indicar diferentes maneras de lograr la misma meta, tal vez, determinar cuál de ellas predice una mayor minimización del estigma y, especialmente, si la aceptación o el rechazo de las ideas prevalecientes sobre el VIH lleva a mejores resultados para las pacientes (por ejemplo, bienestar psicológico, apego a los tratamientos médicos). O a las estrategias debe asignárseles el mismo valor numérico para indicar su propósito común (minimizar el estigma), a fin de determinar las relaciones entre ellas para minimizar el estigma con otras variables. Es decir, dependiendo del planteamiento del problema y qué diferencias o similitudes se resaltarán, se determina la manera en que se cuantificará la información cualitativa y los análisis cuantitativos que son pertinentes. Asimismo, influye la manera de apreciar los datos, por ejemplo, si las transcripciones de entrevistas son consideradas como índices relativamente variableso ocomo información de interés para eldeplanteamiento problema (lo que piensan y fidedignos manifiestandelaslasmujeres) testimonios y evidencia estas variables.del Los datos cualitativos en ciencias sociales o donde intervengan percepciones y comportamientos humanos pueden verse como fuentes testimoniales sobre los eventos del mundo social, autoanálisis de informantes, evidencia sobre las orientaciones de las personas o fuentes de información de la forma en que las personas construyen percepciones.
Metodología de la investigación
Por ejemplo, a las mujeres se les puede preguntar: En esta etapa de su vida, a esta edad, ¿qué tan satisfecha está con su vida? (pregunta abierta). Escala (muy satisfecha = 4, más bien satisfecha = 3, más bien insatisfecha = 2, 1 = muy insatisfecha). Mujer 1: “Hmmm…Pienso que estoy muy satisfecha…desde luego, es complicado decirlo. No lo había pensado así. Pero ya pensándolo, sí estoy satisfecha, realmente me siento muy feliz”. Podría codificarse en una escala tipo Likert como “4 = muy satisfecha”. Mujer 2: “Qué, caray…déjeme pensarlo…Mmmm…la verdad no estoy satisfecha”. Se le asignaría un “2”. Mujer 3: “Nada, nada satisfecha…no estoy nada satisfecha con mi vida. Absolutamente no”. Un “1”. Las respuestas también podrían categorizarse por su “indecisión ante la pregunta” como: 1 = dificultad para responder la pregunta, 2 = jamás lo había reflexionado, 3 = indecisión, 4 = responde con decisión. La narrativa refleja el intercambio entre el entrevistador y el entrevistado y no solo lo que “pasa por la cabeza” de la mujer. La asignación de un código con su respectivo número a su respuesta no captura toda la experiencia de la participante. Para ello sería necesario adicionar varias preguntas (por ejemplo, ¿me podría decir por qué lo considera así?, ¿qué es importante para estar satisfecho o insatisfecho con la vida?) y un cuestionario sobre satisfacción en la vida. Además, el investigador debe cerciorarse de que la pregunta realmente sea capaz de generar respuestas profundas y que se capturen las experiencias y sus significados. Efectúa la primera entrevista, analiza si las preguntas provocan tales respuestas, y si es necesario realiza cambios en las preguntas, hasta lograr obtener la información requerida. En ocasiones las preguntas abiertas (cualitativas) inducen las respuestas, lo cual debe evitarse. Muchas veces, a través de una pregunta obtenemos respuestas sobre varios tópicos, ya que al entrevistado le pueden significar más de una cuestión. Cuando cuantificamos debemos decidir qué lecturas serán objeto de conversión y con qué propósito. Y como en el ejemplo de la pregunta anterior, las respuestas pueden codificarse en dos dimensiones (grado de satisfacción con la propia vida e indecisión ante la pregunta) y obtener valores numéricos de dos factores que podrían utilizarse en un análisis de varianza, evaluando su efecto individual y combinado sobre otra variable (dependiente).
Presencia-ausencia La presencia-ausencia puede implicar diferentes cuestiones en los datos cualitativos. La presencia puede significar, entre otras opciones, que el “algo o categoría”: a) surgió espontáneamente en la narrativa u observación, b) que se dirigió la recolección para que emergiera (en una pregunta, un aspecto a observar), c) fue percibido por el analista “entre líneas” o de manera subyacente y d) verdaderamente constituye una dimensión de la experiencia. La ausencia puede implicar básicamente que ese “algo o categoría”: a) no surgió, b) no fue percibida por el analista, c) no es considerada por el participante como un factor o categoría, d) fue pensada o tomada en cuenta por el participante pero no requiere expresarse, e) constituye un factor o categoría, pero el participante no quería “traerla a colación” por alguna razón, f) no emergió porque la narrativa se desvió hacia otras categorías y g) no era verdaderamente una categoría de la experiencia. Así, el “1” y “0” pueden emerger en diversas circunstancias. Por ello, cuando codificamos con presencia-ausencia, debemos definir a qué nos referimos. Desde luego, varias condiciones de ausencia y presencia manifiesta pueden codificarse, no así las “latentes”, porque no podemos introducirnos dentro de los pensamientos de los participantes. A veces podemos preguntar por qué no surgió esto o aquello y hacerlo manifiesto. La ventaja de cuantificar dicotómicamente es que resulta relativamente más fácil que cuando existen más niveles. La desventaja es que se pierde la variabilidad de los conceptos y sus diferentes matices. Cuando se crean variables nominales con varias categorías, se pueden establecer las modalidades en que se manifestaron. Si se cuantifican en un nivel ordinal se minimiza tal pérdida y se preservan las variaciones de un concepto y sus significados. Por ejemplo, en lugar de señalar si una categoría está presente o ausente en una unidad de análisis (por ejemplo, una línea de una transcripción), los investigadores pueden indicar el grado en que estuvo presente a través de la frecuencia de mención, el espacio o tiempo que se le
35
36
Capítulo 12 Ampliación y fundamentación de los métodos mixtos
otorgó en la narrativa o los datos visuales. Con valores numéricos secuenciales (1,2,3,4), conteo de frecuencias y rangos (0 menciones, 1-3 menciones = 1, 4-6 menciones = 2, o en sí la frecuencia), o 1, 2, 4 y 8 para indicar un incremento exponencial de espacio o tiempo. Y desde luego, pueden trabajarse en análisis estadísticos inferenciales, respetando las premisas de cada método.
Datos cuantitativos como marcadores de posición para cuantificar Un enfoque común para cuantificar es utilizar los resultados de estudios cuantitativos previos como marco para la conversión de datos, el cual proporciona las reglas para decidir la forma de categorizar (una especie de análisis de contenido estandarizado). Se utilizan las categorías de tales investigaciones para codificar un conjunto de datos cualitativos (Bazeley, 2010). Las categorías pueden haber sido establecidas, por ejemplo, mediante codificación cuantitativa de respuestas a preguntas abiertas de un cuestionario o mediante análisis de contenido cuantitativo. Asimismo, puede efectuarse un análisis de contenido de cierto material utilizando tanto una aproximación cuantitativa como cualitativa. El material es simultáneamente analizado por dos individuos o equipos, uno mediante una aproximación cuantitativa (fijando a priori las categorías) y el otro utilizando comparación constante para producir categorías emergentes y luego comparar las categorías que surgieron (para fines de validación y triangulación). Además, se debe contrastar la fiabilidad intercodificadores cuantitativa con la confiabilidad cualitativa. Otra alternativa es, en el mismo instrumento, recolectar datos cuantitativos (por ejemplo, en un cuestionario usar escalas) y cualitativos (preguntas abiertas referentes a las mismas variables de las escalas). Después, cuantificar estos últimos y correlacionar ambos conjuntos de datos. Si la correspondencia es alta, podemos asumir que hemos medido los conceptos centrales y enriquecer nuestra interpretación.
Análisis estadísticos potenciales de datos cuantificados Cuando se codifica cualitativamente, antes de comenzar el análisis, es importante demostrar niveles de acuerdo entre los codificadores. Deben incluirse definiciones de los códigos que hayan sido discutidas por los codificadores, pues todo el proceso debe basarse en acuerdos. Asimismo, se recomienda calcular el coeficiente Kappa de Cohen (consenso entre codificadores sobre datos categóricos) y asegurarse de que en una muestra del material analizado (transcripciones, audio, video, etc.) emerjan las mismas categorías y temas. El desarrollo de dimensiones de datos cuantificados que pueden ser integrados de manera coherente con datos cuantitativos comienza con una exploración y análisis de extractos codificados. Por ejemplo, en un estudio sobre la alfabetización de los niños en el hogar (Lieber, Davis y Weisner, 2009), a los padres se les entrevistó respecto de las actividades que realizan con sus hijos para tal fin. Una categoría emergente fue el de “Habilidades para el reconocimiento de letras en palabras”, la cual se codificó y aplicó al resto del material analizado. Se calculó la fiabilidad entre codificadores y se estableció una definición de lo que incluía esta categoría. Después de analizar más transcripciones, emergieron diversas actividades que los padres implementan para alfabetizar a sus hijos. Luego, el equipo cuantificó estos datos de la siguiente manera: los codificadores debían clasificar el material en la categoría por el nivel de importancia que los padres otorgaban al reconocimiento de letras en palabras: alto, medio o bajo. Cada codificador tenía que definir sus criterios para asignar a la unidad o extracto en cada nivel (determinar qué consideraban alto, medio o bajo). Después se acordó una definición común y se volvió a codificar. ambién podría haberse codificado el número de actividades (0 a k), con un indicador por intervalos, además de la evaluación ordinal. En circunstancias donde puede identificarse una distribución (ordinal o de intervalos) de una categoría o tema cualitativo, el primer paso puede ser más sencillo. Por ejemplo, si las familias no reportan alguna actividad o es muy poca, resulta claro que se categorizan como de “bajo” nivel. Si lo hacen regularmente, como de nivel “alto”. El siguiente paso es revisar el grado de acuerdo (los codificadores analizan el mismo material): si no es significativo ni tampoco evidente, vuelven a discutir definiciones, y de nuevo codifican otros segmentos (pero todos los mismos), hasta lograr un nivel aceptable de confiabilidad.
Metodología de la investigación
La cuantificación de dimensiones debe ser cuidadosa y mantener sus raíces en los datos cualitativos. Es un proceso sistemático, riguroso y en el cual se establecen parámetros de fiabilidad. Como señalan Lieber y Weisner (2010), tiene una doble función: sigue siendo una representación de los datos cualitativos que la fundamentan y puede homogeneizarse con ciertos datos cuantitativos para realizar un análisis más amplio y completo. No reemplaza a los datos narrativos y a las observaciones, ya que estas siguen disponibles para el análisis temático y discursivo. Cuando los análisis de datos cuantitativos y los de datos cuantificados revelan relaciones entre variables o diferencias entre grupos (por ejemplo, a través de coeficientes paramétricos, no paramétricos y multivariados), el investigador puede regresar a los datos cualitativos srcinales para ahondar en las interpretaciones, guiado por los descubrimientos cuantitativos; o bien realizar tres clases de análisis: 1) cualitativo inicial (interpretativo), 2) cualitativo por comparación constante paracualitativos desarrollarsiguiendo categorías,loscuantificarlas y combinarlas con variables cuantitativas y 3) examen de los datos resultados cuantitativos. Algunos análisis estadísticos que pueden realizarse con matrices que combinan datos son: análisis de consenso, coeficientes de similitud y no disimilitud, análisis de correspondencia, conteos y escalamiento multidimensional (Lieber y Weisner, 2010), además de análisis no paramétricos.
Cualificación Cualificar implica asignar significado a los números (Sandelowski, Voils y Knafl, 2009). La cualificación es útil para: 1) incrementar el conocimiento de los datos cuantitativos colocándolos en un contexto cualitativo, lo que permite realizar un análisis híbrido, y 2) proveer a los investigadores de un conjunto de variables que puedan clasificar sus datos cualitativos en categorías cuantitativas para aumentar la generalización de sus descubrimientos (Hesse-Biber, 2010a). La cualificación significa interpretar los datos cuantitativos en un contexto cualitativo. Por ejemplo, Hesse-Biber le agregó a su estudio de 1996 —en el cual utilizó entrevistas— un seguimiento de las participantes mediante la aplicación de un cuestionario autoadministrado respecto de las actitudes hacia el comer, así como escalas sobre trastornos alimentarios. Los datos extraídos de las entrevistas y las mediciones fueron conectados para cada persona que respondía. Así, generó una “tipología sobre la alimentación” basada en datos cuantitativos. datos cualitativos producto de lasesta entrevistas proporcionaron una fundamentación más detallada delLos significado de la tipología. Además, le suministró categorías cuantitativas con las que diferenció a su muestra cualitativa y le permitió mejorar su generalización de resultados sobre los patrones de alimentación de las mujeres. ambién utilizó descubrimientos cuantitativos para hacer inferencias sobre los datos cualitativos. Algunos pasos para la cualificación que Hesse-Biber (2010a) contempla son: 1. Recolectar datos. En el proceso de cualificación cabe preguntarse de qué forma se recolectarán los datos cuantitativos. Conjuntamente o simultáneamente con los datos cualitativos (en la misma investigación o en un diseño concurrente) o en diferentes estudios o etapas (secuencialmente). Incluso, recolectar ambos tipos de datos en diferentes puntos (momentos múltiples). El tiempo es una dimensión que define la forma de recolección. Asimismo, debemos considerar si ambos tipos de datos son o no igualmente importantes. 2. Determinar cómo se integrarán las variables cuantitativas en el estudio cualitativo. Hay varias maneras de hacerlo. La cualificación involucra disponer las variables cuantitativas en interacción con datos cualitativos (por lo general en la forma de códigos cualitativos). Algunas razones para hacerlo son la triangulación y la clarificación de los conceptos del estudio. Debemos preguntarnos: ¿deseamos utilizar los datos cuantitativos para informar a los datos cualitativos o viceversa? Estas dos aproximaciones generan diferentes maneras de cualificar. La primera se relaciona con el empleo de variables cuantitativas dentro de un estudio cualitativo para informar o proporcionar una comprensión más profunda sobre el significado de los códigos cualitativos. En el ejemplo de Hesse-Biber de 1996, la autora tomó en cuenta puntuaciones sobre la Prueba de Actitudes hacia la Alimentación (EA) y el Inventario de rastornos Alimentarios (EDI) para crear una variable dicotómica cuantitativa que denominó “Desórdenes Alimentarios” (ED), con dos categorías: “sí” y “no”. Pretendía comprender el
37
38
Capítulo 12 Ampliación y fundamentación de los métodos mixtos
grado en el cual esta variable cuantitativa correspondía a una medida similar que había derivado de sus datos cualitativos sobre los trastornos alimentarios, una categoría inductiva denominada EADIS (desórdenes alimentarios). ¿Dónde se presentaba el acuerdo (triangulación del concepto) o desacuerdo? La respuesta ayudaba a clarificar el significado del código cualitativo. La cuestión de desacuerdo involucra el significado de una variable cuantitativa en un contexto cualitativo. ¿Qué implica y significa que quien responde obtenga puntuaciones altas en la variable desórdenes alimentarios (ED)? Podemos usar esta variable para clasificar a las participantes por un número de códigos cualitativos sobre la imagen corporal con el fin de obtener un entendimiento más profundo del contexto en el cual los individuos hablan sobre sus cuestiones alimentarias por las categorías de la variable ED. Contextualizando nuestra variable cuantitativa, estamos en posibilidad de lograr mayor claridad del significado fundamentar esta variable en un para contexto sociala los específico. Sede pueden usar variables cuantitativas clasificar códigos cualitativos. Hesse-Biber utilizó sus variables cuantitativas para efectuar algunas generalizaciones sobre sus resultados cualitativos, por ejemplo, usó la variable ED para ver qué códigos cualitativos podían estar relacionados.
APUNTES ADICIONALES SOBRE EL ANÁLISIS EN LOS MÉTODOS MIXTOS Los análisis de datos cuantificados pueden servir para fines de validez concurrente de los datos cuantitativos, así como para confirmar o expandir los análisis de estos últimos. Por ejemplo, en el estudio sobre habilidades para el reconocimiento de letras en palabras (Lieber et al., 2009), los niveles de énfasis (alto, medio o bajo) fueron relacionados con el idioma primario que se maneja en el hogar (variable nominal), mediciones de la habilidad de lectura de los padres (variable de intervalos) y su nivel educativo (también intervalar), así como otras codificaciones cualitativas. Ello cual ayudó a lograr una comprensión más profunda del problema bajo estudio y permitió un segundo análisis de los datos cualitativos tomando en cuenta tales asociaciones. Por ejemplo, se encontró que las familias bilingües reportaban un mayor número de prácticas de reconocimiento de letras con respecto de aquellas que solo hablan un idioma, ya sea inglés o español, lo que a su vez condujo a los investigadores a regresar a los datos srcinales para lograr un mayor sentido de entendimiento respecto de los patrones y mecanismos que explican variaciones en el apoyo a la alfabetización como una función del idioma que se maneja en el hogar. Los análisis comparativos pueden extenderse para examinar los patrones que emergen cuando se contrastan los datos cuantificados con los datos cualitativos. Como se señaló en el capítulo 17 del texto impreso, el análisis mixto requiere de programas computacionales que puedan administrar bases de datos relacionales, usados de tal modo que minimicen la influencia de la herramienta en sí misma en el proceso analítico y los resultados. Asimismo, las matrices o tablas generadas deben ser sencillas y fáciles de entender, lo cual permite flexibilidad y eficiencia. Lieber y Weisner (2010) esquematizan en la figura 12.5 las fuentes de datos primarios en los métodos mixtos, las cuales constituyen bases de información. Cada base de datos puede estar capturada en una tabla, una hoja de cálculo o una matriz; y a través de una red amplia y variada de relaciones y variables claves, los archivos pueden mantenerse relativamente sencillos y trabajar conjuntamente como un sistema complejo. En el diagrama, los cuatro archivos o bases de datos son: 1. Recursos/documentos: son los archivos que contienen toda la información necesaria sobre los datos
2. 3.
cualitativosdeparticulares recolectados dónde y cuándo fueron recabados, sobre el contexto, losenprocedimientos recolección, anotaciones(tipo, y reflexiones sobre estos e información los datos sí). Unidades (extractos): las piezas de información cualitativa con significado que han sido identificadas en los datos cualitativos y se han etiquetado a través de códigos. Descriptores: datos cuantitativos y datos sociodemográficos que identifican a los casos o participantes, los ambientes, diadas, redes y todo aquello que debamos saber respecto de la
Metodología de la investigación
Figura 12.5 Ejemplos de resultados en series cronológicas de un solo grupo. Recursos / Documentos
Descriptores
Campos primarios • • •
• • •
Campos primarios
Fecha/hora Título Entrevistador/observador/ colaborador de campo Resumen Memo Texto/audio/video
Datos cualitativos (unidades) Campos primarios Códigos (numéricos, símbolos o identificadores de categorías) Peso o valor del código (opcional) Unidad: pasaje o extracto transcrito, de tiempo, etcétera Memo •
•
• • • •
•
•
•
Identificación del participante (siglas, número, etc.) Edad Género Otros datos demográficos Sitio o lugar de la investigación Datos cuantitativos (ejemplo: escalas de actitudes)
•
Árbol o familia de códigos Campos primarios • •
• • • •
4.
Nombre del código Peso (valor en una escala) (opcional) Definición Descripción Criterios de aplicación Datos que ejemplifiquen (por ejemplo, unidades ilustradoras)
Familia de códigos: el sistema de codificación (etiquetación de las categorías, las reglas de codificación, definiciones, aplicación de criterios, ejemplos de unidades que representan a las categorías y peso o valoración de estas, incluyendo frecuencias) y la agrupación de categorías en temas, así como vínculos entre categorías.
Las flechas representan los vínculos entre las bases o archivos, los cuales pueden variar desde una relación hasta diversas (por ejemplo, en términos simples, podemos tener distintas entrevistas por participante; o bien, pueden haber varias unidades para cada recurso). Preparar una base de datos mixta requiere establecer tres áreas. Los descriptores y los recursos de los datos deben crearse y el árbol o familia de códigos tiene que especificarse. Luego, antes del análisis, los recursos deben examinarse, las unidades identificarse y los códigos asignarse a estas. Además del análisis puramente cuantitativo que puede efectuarse con los datos descriptores, deben analizarse las unidades cualitativas, las notas de campo y otras fuentes de datos. La operación subsecuente utilizando la base de datos capitalizará las relaciones entre los archivos. Debido a la enorme cantidad de información y a que todas las piezas están conectadas, debemos tener muy claro qué es lo que buscamos. En el ejemplo de las habilidades de reconocimiento de letras, podemos consultar las transcripciones de participantes de cierto grupo de ingresos, comparar por género, presentar datos desagregados por grupo étnico, etc., ya que el sistema puede organizar y filtrar la información que necesitemos de acuerdo a nuestro planteamiento del problema. Para quien realiza un análisis mixto por vez primera, algunos análisis de ambas ramas que pueden contrastarse se muestran en la tabla 12.9.17 17 Por cuestiones de espacio y del nivel introductorio-intermedio de la obra no se presentan ejemplos de desarrollo completo, pero quienes se interesen pueden acudir a dos de ellos en sus fuentes srcinales: Contreras y Hernández-Sampieri (2011), Cuevas, Hernández-Sampieri y Méndez (2010).
39
40
Capítulo 12 Ampliación y fundamentación de los métodos mixtos
Tabla 12.9 Ejemplos de análisis cuantitaticos y cualitativos cuyos resultados pueden contrastarse. Análisiscuantitativos Distribución de frecuencias Regresión múltiple Análisis de vías (path) Análisis de factores Análisisdefactores Correlación Mapeoenejescartesianos
Análisiscualitativos Jerarquización de categorías por conteo e importancia Redes semánticas Modelo de teoría fundamentada
Jerarquizacióndecategorías(frecuenciaeimportancia) Conexiónentrecategorías Mapeodecategorías
EL RIGOR EN LOS MÉTODOS MIXTOS La investigación mixta, a pesar de que posee mayores fortalezas, también enfrenta el reto de la validez. Onwuegbuzie y Johnson (2008) señalan tres problemas fundamentales que enfrentan los diseños híbridos, que Hernández-Sampieri y Mendoza (2012 y 2008) los denominan “retos”: 1. El reto de la representación, que se refiere a la dificultad para “capturar” las experiencias vívidas y realistas de los participantes mediante un texto en general y en particular con palabras y números. 2. El reto de la legitimización, que implica la dificultad de obtener descubrimientos, resultados e inferencias que sean creíbles, confiables, transferibles y con posibilidad de confirmación. En realidad, en algunas instancias, tales retos son exacerbados en la investigación mixta porque tanto el componente cuantitativo como el cualitativo de un estudio introducen sus propios problemas de representatividad y legitimidad. 3. El reto de la integración, que involucra la dificultad de combinar datos cuantitativos y cualitativos, ya sea de manera secuencial o en paralelo. A veces resulta muy difícil su reunión en una misma base de datos y en ocasiones se contradicen. Alrededor de este problema se encuentra el grado en que la combinación de enfoques puede lograr los propósitos básicos de los métodos mixtos: triangulación (convergencia o corroboración de resultados), complementación (elaboración, ilustración, mejora y clarificación de inferencias), desarrollo (usar los resultados de un método para informar al otro), iniciación (descubrir paradojas y contradicciones que nos lleven a reformular ciertas cuestiones de un estudio, incluso replantear el problema de investigación) y expansión (rango y amplitud de la indagación). Asimismo, el reto se refiere a la profundidad con la cual un estudio mixto puede conseguir lo que Onwuegbuzie et al. (2010) mencionan como argumentos racionales de los métodos mixtos: a) enriquecimiento de la muestra (optimizar la variedad de los casos considerados y el tamaño de muestra, para asegurar así que cada unidad o participante es apropiada para ser incluida); b) fidelidad de los instrumentos de recolección de datos (evaluar lo adecuado y útil que son los instrumentos existentes, así como crear nuevas herramientas más completas, válidas y confiables); c) integridad de los tratamientos (consolidar la fiabilidad de la intervención), y d) incremento de la significancia general (extensión y riqueza de los datos, así como capacidad de interpretación o, como se dice en México, “sacar más jugo” a los descubrimientos). Algunas preguntas pertinentes relativas a este reto son: ¿resulta erróneo triangular, consolidar o comparar e inferencias cuantitativas provenientes de unapequeña muestray aleatoria grande obtenida de unadescubrimientos población con datos cualitativos generados de otra muestra guiada por un propósito proveniente de la misma población? ¿Qué tanto peso debe asignársele a los datos cuantitativos comparados con los datos cualitativos? ¿Los descubrimientos cualitativos confirmados por otro método son más relevantes que los resultados que emergieron de un estudio puramente cualitativo? Cuando las inferencias CUAN y CUAL s0e contradicen o están en conflicto, ¿qué podemos concluir?
Metodología de la investigación
En cada estudio mixto, los investigadores deben lidiar con problemas de representación, legitimidad e integración, cuestiones metodológicas que continúan debatiéndose porque la investigación híbrida se encuentra en su “reciente matrimonio”. Ante tales retos, los autores pragmáticos comienzan a establecer algunos elementos, los cuales se enunciarán brevemente a continuación, primero porque el tema sigue evolucionando y, segundo, el espacio es limitado. res cuestiones se encuentran en debate sobre la validez de los métodos mixtos y aún no se resuelven completamente (Creswell, 2013a; Hernández-Sampieri y Mendoza, 2012): 1. Los criterios para evaluar a los estudios mixtos. 2. La conceptualización de la legitimidad en las investigaciones híbridas. 3. La identificación de más tipos de legitimidad. Respecto de la primera, en el capítulo 10 de este centro de recursos en línea (CRL) (“Parámetros, criterios, indicadores y/o cuestionamientos para evaluar la calidad de una investigación”) se armonizó una propuesta proveniente de diversos autores contemporáneos de los métodos mixtos, la cual puede servir de punto de partida para esclarecer el panorama. Por su parte, la validez mixta es compleja. En la investigación cuantitativa este término es de uso común y se relaciona con el grado en que la teoría refleja la “realidad”; sin embargo, en la investigación cualitativa algunos autores rechazan el concepto porque consideran que al no haber una realidad, sino múltiples realidades, la “verdad” es en algún sentido arbitraria, de acuerdo con lo que el individuo percibe en su interacción con el mundo. Desde luego, otros investigadores opinan que ciertas evidencias de validez son útiles, aunque la noción es relativa a un contexto, situación, lenguaje y/o visión del mundo. Estos últimos utilizan el término “contextualización” para hablar del término que nos ocupa y que representa el conjunto de estándares de una comunidad en un tiempo y lugar específicos (Onwuegbuzie y Johnson, 2008); además, que consideran que la “validez” implica una perspectiva posmoderna desacreditada que busca racionalidad, reglas, orden y lógica en el universo y los fenómenos estudiados. Pensando en ellos, emplear el término “validez” en los estudios mixtos sería contraproducente. Por tal razón, Onwuegbuzie et al. (2010) y ashakkori y eddlie (2008b) proponen utilizar un término que tenga un potencial mayor de aceptación entre investigadores de todas las formas de pensamiento: la legitimidad, que no implica abandonar el uso del concepto de validez (para los cuantitativos) ni los de credibilidad, confirmación o dependencia (para los cualitativos). La legitimidad es un resultado y un proceso (Hernández-Sampieri y Mendoza, 2012) y debe considerarse y evaluarse en cada etapa del proceso investigativo (Onwuegbuzie y Johnson, 2008). Se relaciona con la calidad del diseño, la calidad de las inferencias, el rigor interpretativo y la transferencia de conclusiones (Hernández-Sampieri y Mendoza, 2012; Onwuegbuzie et al., 2010). En torno a la calidad del diseño, Hernández-Sampieri y Mendoza (2008) lo conciben como el grado en el cual los investigadores han utilizado los procedimientos más apropiados para responder al planteamiento del problema y los han implementado de manera eficaz. Morris y Burkett (2011); Morse (2010) y eddlie y ashakkori (2009) contemplan los siguientes factores sobre tal calidad: 1. Consistencia interna del diseño: que los componentes embonen de una manera cohesiva y congruente. 2. Adecuación del diseño: en qué medida es apropiado para responder a las interrogantes de investigación, la primera de ellas, si es consistente con el planteamiento del problema. 3. Fidelidad del diseño: si los procedimientos —muestreo, recolección de datos, etc.— son implementados de acuerdo con el diseño mismo y con rigor, y si los métodos son capaces de capturar significa4.
dos, asociaciones y/o efectos. Adecuación analítica: si las técnicas de análisis son apropiadas de acuerdo con el planteamiento.
Además de otros que se definieron en el citado capítulo de este CRL: legitimidad de la secuencia de las fases del estudio, parsimonia, rigor, transparencia, idoneidad y fortaleza del diseño. En lo referente a la calidad de las inferencias, eddlie y ashakkori (2009 y 2006) incluyen: 1. Consistencia entre recolección de los datos y diseño.
41
42
Capítulo 12 Ampliación y fundamentación de los métodos mixtos
2. 3. 4. 5.
Consistencia conceptual (grado en el cual las inferencias son congruentes entre sí). Consistencia teórica (grado en el que las inferencias son consistentes respecto del conocimiento y teoría existente). Acuerdo interpretativo entre investigadores (producto de la triangulación dentro del equipo de trabajo y los auditores externos). Interpretación distintiva (grado en el cual las inferencias son diferentes de otras posibles interpretaciones de los resultados y explicaciones rivales).
Además, hay que agregar los elementos revisados en el capítulo 10 del CRL. A su vez, el rigor interpretativo se integra por factores que ya fueron mencionados en otros rubros y en el capítulo 10: 1) consistencia interpretativa (congruencia entre las distintas inferencias, y entre estas y los resultados del análisis de los datos), 2) acuerdo interpretativo, 3) interpretación distintiva), 4) consistencia interpretativa (si las inferencias siguen a los descubrimientos relevantes en términos de tipo, intensidad y alcance, así como que las múltiples inferencias sean coherentes entre sí), 5) consistencia teórica, 6) transparencia interpretativa, 7) correspondencia interpretativa, 8) reducción de sesgos interpretativos, 9) validez incremental, 10) legitimidad de la secuencia y de la conversión (cuando se presenta) y 11) eficacia interpretativa (si las metainferencias incorporan adecuadamente las inferencias cuantitativas y cualitativas) (ashakkori y eddlie, 2008b). Este último criterio es exclusivo de los métodos mixtos y se alcanza cuando los investigadores integran adecuadamente los descubrimientos, conclusiones y recomendaciones obtenidas mediante ambos enfoques. eddlie y ashakkori (2009) sugieren el términotransferencia de inferencias para denotar la generalización de los descubrimientos, tanto cuantitativos como cualitativos que comprende, a su vez, varios conceptos: ransferencia de población (a otros individuos, grupos o entidades). ransferencia ecológica (a otros ambientes o contextos). ransferencia temporal (a otras épocas). ransferencia operacional (a otros métodos de recolección de los datos). ransferencia teórica (a otras teorías). ransferencia interdisciplinar (a otros campos del conocimiento). Como podemos ver, algunos factores contribuyen a más de un aspecto de la legitimidad. Por otra parte, Onwuegbuzie y Johnson (2008), hablan de varios tipos de legitimidad: 1. Legitimidad de la integración de la muestra (legitimización muestral): grado en el cual la relación entre el muestreo cuantitativo y cualitativo produce metainferencias. 2. Legitimidad interna-externa: medida con base en la cual el o los investigadores presentan con exactitud y profundidad la visión interna de los participantes y la visión externa del propio investigador para fines de descripción y explicación. 3. Legitimidad dirigida a minimizar las debilidades potenciales: grado que las debilidades de un método son compensadas por las fortalezas del otro. 4. Legitimidad de secuencia (para diseños secuenciales): pertinencia con la que el investigador reduce el riesgo de que las metainferencias pudieran ser afectadas al invertir la secuencia de las fases cuantitativa y cualitativa. 5. Legitimidad de conversión (para diseños de conversión): grado y profundidad con que la cuantificación o la cualificación producen metainferencias de calidad. 6. Legitimidad de la mezcla paradigmática: grado en el cual las creencias epistemológicas, ontológicas, • • • • • •
7.
axiológicas metodológicas del investigador, que se derivan las aproximaciones cuantitativas cualitativas,yson combinadas exitosamente y mezcladas en “un de paquete” que pueda utilizarse adecua-y damente. Legitimidad de la compatibilidad entre visiones: la profundidad y el grado en que las metainferencias resultantes reflejan una visión del mundo mixta basada en procesos cognitivos holísticos y de la gestalt que implican cambio e integración.
Metodología de la investigación
8. 9.
10.
Legitimidad por múltiples validaciones: pertinencia y grado en que se utilizan diversas técnicas para validar los procedimientos, análisis e inferencias tanto cuantitativas como cualitativas. Legitimidad entre investigadores: grado de consenso o acuerdo entre los investigadores y sus equipos respecto de las inferencias CUAN y CUAL, y las metainferencias, así como la pertinencia de estas de acuerdo con el planteamiento del problema (Hernández-Sampieri y Mendoza, 2008). Legitimidad “política”: grado y profundidad por las cuales los investigadores y usuarios del estudio mixto valúan las inferencias de los componentes cuantitativo y cualitativo del estudio, así como las metainferencias.
Otros criterios ya fueron tratados en el capítulo 10, pero seguiré afinando la propuesta para evaluar la calidad, validez y/o rigor de un estudio mixto, tomando los desarrollos de diversos autores.
EJEMPLOS ADICIONALES DE ESTUDIOS MIXTOS Estudio de las actitudes de aprendices de inglés o alemán odd y Lobeck (2004) utilizaron diferentes métodos para enfrentar su problema de investigación. Su objetivo era analizar los efectos de adquirir un segundo idioma sobre las actitudes y los estereotipos respecto de los nativos del país donde este se srcinó, específicamente con británicos que habían aprendido alemán y germanos que habían aprendido inglés. El estudio cuantitativo
Se llevó a cabo una encuesta con 146 adultos (59 británicos y 87 germanos), que nacieron después de la Segunda Guerra Mundial (para que no hubiera experiencias previas de conflicto) y que aprendieron el idioma en la otra nación, de ambos géneros (79 mujeres y 67 hombres). El instrumento consistió en un cuestionario con versiones equivalentes en inglés y alemán (se hicieron traducciones cruzadas), que constaba de tres partes: •
Parte I: detalles personalesque y adquisición del segundo idioma (con la inclusión de preguntas sobre la motivación y la ansiedad les causó aprender el nuevo lenguaje). Parte II: tópicos interculturales. Cultura, proceso de integración y actitudes hacia el país anfitrión y sus habitantes (30 adjetivos que se evaluaban bajo el escalamiento Likert de cinco opciones). Parte III: actitudes hacia su propio país (basadas en “adjetivos” producto de la revisión de la literatura y preguntas abiertas cuantificadas). Algunos de los adjetivos con los que se referían al “prototipo del ciudadano del otro país” fueron: agresivo, competitivo, conservador, democrático, dominante, con poder económico y político, ecológico, egoísta, amistoso, emotivo, divertido, honesto, equitativo, pro europeo, religioso, rico, inteligente, científico, orgulloso, ordenado, limpio y xenofóbico. De los resultados se desprendieron cinco factores (vea el tema “Análisis de factores” en el capítulo 8 de este centro de recursos en línea): nación, dominación, cortesía, emoción e intelecto. Otros resultados fueron: Los alemanes perciben a los británicos como más bajos en el factor “nación”, que incluye los siguientes adjetivos: poderoso económica y políticamente, próspero, pro europeo, industrializado, progresivo, igualdad de género, limpio y ordenado, ecológico, democrático, rico. Los ingleses consideran a los alemanes más altos en este factor. Los cinco factores se combinaron para formar una variable dependiente. Se realizó un análisis causal (regresión múltiple): las variables independientes fueron “duración de la visita más larga al otro país”, “allá ahora”, “nivel de contacto con los nativos de la otra nación”, “estándar de la habilidad del lenguaje” y “país de srcen”. Variable dependiente: las calificaciones a la otra nación. Sólo el “país de srcen” fue una variable realmente predictora de la dependiente. •
•
•
• •
43
44
Capítulo 12 Ampliación y fundamentación de los métodos mixtos
El estudio cualitativo
Se efectuó una sesión de enfoque con 10 participantes de la encuesta (muestra anidada, seis germanos y cuatro ingleses), quienes fueron seleccionados porque dominaban el segundo idioma y conocían muy bien el otro país. La amplia sesión fue grabada en audio y video. Los siguientes elementos fueron algunos de la guía de tópicos. A partir de la experiencia de aprender un idioma foráneo en el otro país (los alemanes, inglés en Gran Bretaña; los ingleses, germano en Alemania): ¿cómo esta experiencia influyó en el cambio de sus actitudes y opiniones hacia el otro país y sus habitantes? El tema central emergente de la sesión fue que “vivir en el otro país y aprender su lengua sí cambia las actitudes y las opiniones” (“es la gran diferencia”, “tú no puedes realmente conocer a un país hasta que has vivido ahí”, etcétera). Triangulación de datos
Los datos cuantitativos y los cualitativos se contradijeron. El estudio cuantitativo no encontró efectos del grado de dominio del otro lenguaje o el tiempo que vivieron en el otro país sobre sus actitudes y opiniones hacia esa nación y su gente. Gráficamente, este resultado se muestra en la figura 12.6. Tabla 12.6 Resultados cuantitativos expresados gráficamente. Grado de dominio del lenguaje Tiempo que vivieron en el otro país
Actitudes y opiniones hacia esa nación y sus habitantes (estereotipos)
“No relación causal”
El estudio cualitativo reveló que los participantes experimentaron el sentimiento (y muy arraigado) de que aprender el lenguaje y visitar el otro país había tenido un fuerte efecto en sus creencias y actitudes sobre esa nación y sus habitantes. Es más, con la experiencia se hicieron “más abiertos y sensibilizados” en términos culturales, no sólo hacia el país en el cual habían estado y aprendido su idioma, sino en general hacia cualquier nación. ¿Cómo explicaron odd y Lobeck (2004) la “no coincidencia de resultados”? Primera explicación: la encuesta o 0 capturó una amplia variedad de habilidades del lenguaje, mientras que sólo aquellos que mostraron una gran experiencia y conocimientos del otro idioma y cultura fueron elegidos también para el grupo de enfoque. Es posible que este grupo de “experimentados” hubiera cambiado sus opiniones a través del tiempo, que se tratara de personas inusuales (poco comunes) y no sea este el caso de la mayoría de quienes aprenden un idioma extranjero. Sin embargo, los participantes del grupo pasaron un tiempo estándar razonable y normal, por lo que odd y Lobeck (2004) descartaron esta explicación. Segunda explicación: los participantes del grupo de enfoque comenzaron con visiones positivas o muy positivas del resto de la sociedad. La descartan porque las personas “comunes” que aprenden un idioma tienen visiones regularmente “positivas”; de no ser así, ¿para qué aprenden una lengua de un país sobre el cual sus actitudes son negativas? ercera explicación: mediciones “muy crudas” en el cuantitativo. La descartan pues el instrumento había sido validado en múltiples ocasiones. Cuarta explicación: un método es preferible al otro. El cuestionario inducía más “honestidad” en las respuestas, porque los participantes lo contestaban en privado y sus opiniones eran anónimas. En cambio, en el cualitativo, durante la sesión, sus respuestas eran hechas frente a otras personas y algunas de estas
Metodología de la investigación
pertenecían a la otra nacionalidad; por tanto, sus contestaciones fueron “políticas”. Pero también la descartaron, porque durante la sesión los participantes se explayaron y a veces fueron “poco políticos”; además no se ejerció presión sobre ellos. Quinta explicación: los individuos responden de manera diferente al cuestionario que a un grupo focal. La encuesta incluía preguntas más globales (sentido general) y en el grupo se comentaron cuestiones muy específicas (aunque se habló de lo general, los participantes se centraron en ejemplos particulares y personas concretas, pensaron en sus experiencias y las ligaron con su visión). Finalmente, esta fue la conclusión más satisfactoria. Cuando pensamos en términos más globales, tendemos a seguir ideas culturales y estereotipos (nos basamos en ellos), algo que no sucede cuando pensamos en términos concretos. En el grupo se discutieron tópicos generales, se identificaron tales ysobre se diferenciaron las experiencias personales. En el cuestionario hubopero menos tiempo para como reflexionar sus propiasdeexperiencias o recordar instancias específicas. En el grupo tuvieron que explicar y justificar sus opiniones; en el cuestionario, no. La sugerencia para futuros estudios es que los grupos de enfoque sirvan para desarrollar un cuestionario, más que para centrarse en atributos generales de las dos naciones, y para concentrarse en experiencias personales de aprendizaje del idioma y la estancia en el otro país. Cuando hay incongruencias entre los procesos cuantitativo y cualitativo se deben analizar muy a fondo los resultados, como lo hicieron odd y Lobeck (2004). Esta investigación es un ejemplo de un diseño explicativo secuencial (DEXPLIS). Comunidad religiosa18
Antecedentes Una congregación religiosa se planteó como objetivos determinar el perfil ideal de sus hermanas y, con base en ello, generar un sistema de evaluación para realimentarlas respecto de sus tareas y prácticas cotidianas. Primero, abordó el problema de investigación de manera cualitativa (¿cuáles deben ser los principios generales que deben regir a cada una de las integrantes?, ¿qué cualidades son importantes para vivir el “espíritu” de la comunidad?). Asimismo, el perfil debería considerar desde la madre superiora general hasta las religiosas de reciente ingreso (llamadas “junioras”). Posteriormente, el problema fue enfocado de manera cuantitativa mediante el desarrollo del sistema, que además valoraría el grado en que las distintas hermanas cubrían el perfil y las cualidades deseadas (una forma de autoevaluación con fines de mejora continua). Primera etapa: fase cualitativa En consecuencia, se decidió organizar reuniones focales (más de 100) y realizar entrevistas (internas con todas las religiosas y externas con personas vinculadas a la hermandad —sacerdotes, jerarcas de la Iglesia, miembros de las poblaciones donde brindan asistencia, además de padres de familia y profesores de sus escuelas, esto es, más de mil entrevistas—), además de revisar documentos de la congregación y su historia. Un ejercicio cualitativo altamente enriquecedor. El equipo de investigación comenzó de manera completamente inductiva (abierta y con visiones generales), sin categorías predeterminadas, a fin de obtener los puntos de vista internos (de manera profunda) de todas las monjas (algunas con más de 50 años en la congregación, otras de muy reciente ingreso, de todas las edades, algunas con altos niveles académicos, otras sin preparación formal, etc.). Cabe resaltar que esta etapa tomó más de dos años y un grupo de la hermandad con experiencia en investigación
condujo el estudio. fue muy voluminosa, y la codificación generó diferentes temas y categorías, algunos La información de los cuales se muestran en la tabla 12. 10. 18 El nombre de la congregación se omite por cuestiones éticas; solo se mencionará que tiene presencia en varios países latinoamericanos y su misión es proporcionar ayuda a comunidades marginadas, mantiene varias instituciones educativas, incluso una universidad. El estudio fue supervisado por Roberto Hernández-Sampieri entre 2005 y 2008.
45
46
Capítulo 12 Ampliación y fundamentación de los métodos mixtos
Tabla 12.10 Temas y categorías emergentes.19 Temas Vivencia del “espíritu” de la comunidad
Categorías • Humildad • Sencillez • Abnegación • Fortaleza • Prudencia • Fraternidad
Servicio a la comunidad religiosa y a la comunidad externa
• Alegría
Atención a las demás monjas ( una especie de
• Amabilidad • Voluntad de diálogo
“cooperación” como elemento del clima organizacional )
• Aceptación de hermanas • Valoración de hermanas (tomadas en cuenta) • Atención a necesidades físicas • Atención a necesidades espirituales • Atención psicológica
Delegación de responsabilidades
• En las monjas colaboradoras (que en la jerarquía deben
apoyar) • En las monjas superioras • En las monjas al mismo nivel “jerárquico”
Apoyo efectivo a las actividades de la pastoral vocacional
Sin categorías, más bien se consideró que era una categoría tan fundamental que la concibieron como tema.
Presentación de los carismas dados a la Iglesia20
Sin categorías, más bien se consideró que era una categoría tan fundamental que la concibieron como tema.
Valoración del ministerio como verdadero apostolado a nivel general, provincial y local
Sin categorías, más bien se consideró que era una categoría tan fundamental que la concibieron como tema.
Desempeño de sus tareas laborales
• Cumplimiento de encomiendas • Dedicación a la comunidad • Preparación espiritual • Capacitación • Llevar a cabo actos y obras de misericordia
Apoyo logrado de parte de la comunidad
• Alegría a partir de la comunidad • Recepción por parte de la comunidad • Apoyo a la promotora vocacional • Involucramiento en la pastoral vocacional
Motivación para llevar a la práctica el proyecto de vida espiritual personal
• Motivación intrínseca
Fidelidad a la oración
Sin categorías, más bien se consideró que era una categoría tan fundamental que la concibieron como tema.
Actitudes positivas
Actitudes de:
• Motivación espiritual
• Escucha • Respeto • Servicio • Perdón • Caridad • Fortaleza • Finos modales 20 En síntesis, los carismas son los principios generales: seguir a Cristo Jesús, hijo del Todopoderoso (Dios), a ejemplo de la Virgen Santísima, y siguiendo un apostolado como forma de vida.
Metodología de la investigación
Tabla 12.10 Temas y categorías emergentes (continuación). Temas
Categorías
Actitudes positivas
• Silencio y recogimiento • Ternura hacia los pobres • Perdón y misericordia • Aceptación en paz de carencias • Vivencia del don de consagrada • Gozo de la palabra de Dios
Confianza (platicar sus alegrías y tristezas)
Sin categorías, más bien se consideró que era una categoría tan fundamental que la concibieron como tema.
Además, se incluyeron otros muchos códigos. Una vez detectados los temas y las categorías, se procedió a cuantificar los datos (producto de las sesiones y entrevistas). En específico se consideró a las códigos más mencionados (frecuencias) y se estableció una jerarquía de temas y categorías. Segunda etapa: fase cuantitativa Se generó un sistema de indicadores para cada categoría, que sería poco práctico detallar, pues insumiría demasiado espacio. Lo importante es que se comprenda cómo se condujo esta etapa. El esquema para encontrar indicadores de cada categoría se realizó mediante una serie de sesiones en las cuales participaron las madres superioras de todos los ministerios de la congregación (por ejemplo: Ministerio de Formación Inicial —algo así como reclutamiento y selección—, Ministerio de Educación, etc.) y el equipo de investigación completo (12 monjas) y otras religiosas cuya participación se consideró importante. Se establecieron los indicadores (todos de naturaleza cuantitativa, aunque algunos más bien perceptuales y actitudinales). En la tabla 12.11 mostramos un par de ejemplos. Una vez desarrollado el sistema, los instrumentos se administraron en una muestra y fueron validados, de acuerdo con su naturaleza y características. Recordemos que se trata de una evaluación de la superiora, de monjas al mismo nivel jerárquico y religiosas colaboradoras (en puestos con funciones de mando). Tabla 12.11 Algunos indicadores resultantes del estudio. Tema(variable) Vivencia del “espíritu” de comunidad
Indicadores • Humildad • Sencillez • Abnegación • Fortaleza • Prudencia • Fraternidad
Medición Escala de actitudes (a veces con cinco opciones de respuesta; en otras, asignación de un valor de uno a 10 y algunas dicotómicas). Uno o dos ítems por cada indicador. Un ejemplo de ítem: 1. Del uno al 10, ¿en qué medida la madre supervisora vive las virtudes características de… humildad? sencillez? abnegación? fortaleza? prudencia? fraternidad?
47
48
Capítulo 12 Ampliación y fundamentación de los métodos mixtos
Tabla 12.11 Algunos indicadores resultantes del estudio (continuación). Tema(variable) Desempeño de sus tareas laborales
Indicadores
Medición
• Cumplimiento de encomien -
• Cuestionarios aplicados a la superiora, dos
das
• Capacitación
o tres subordinadas y dos o tres monjas del mismo nivel; se valoró el cumplimiento de encomiendas y la calidad en el trabajo.21 También se incluyó un cuestionario de autoevaluación
• Llevar a cabo actos y obras de
• Número de encomiendas terminadas a
• Dedicación a la comunidad • Preparación espiritual
misericordia
juicio del usuario o usuarios • Número de horas dedicadas a la comu-
nidad • Encuesta de satisfacción de la comuni-
dad con el servicio recibido, al medir los siguientes componentes: a) Recepción por parte de la comunidad b) Satisfacción con la organización c) Calidad de servicios específicos (orientación vocacional, etcétera) c) Valoración de la comunidad • Número de horas dedicadas a la oración y
preparación espiritual. • Número de horas dedicadas a la capacita -
ción (por rubro y total). • Número de cursos, seminarios y otros
actos académicos en los cuales participó. • Número de actos y obras de misericordia.
Posteriormente, el sistema se aplicó en dos ciudades “piloto” (para probar todo el sistema), se hicieron los ajustes y en 2008 se implantó en toda la congregación. En 2009 se valoró el funcionamiento del sistema por medio de grupos de enfoque (28 en total, uno por ciudad donde se había instrumentado) y una encuesta en una muestra representativa de toda la hermandad, sobre motivación, satisfacción con el sistema, satisfacción laboral y otras variables típicas del clima organizacional. En en su primera parte, este estudio fue un caso de un diseño exploratorio secuencial (DEXPLOS): CUAL → CUAN, y en su segunda parte (valoración de la implantación del sistema) fue un diseño de triangulación concurrente (DIRIAC): CUAL + CUAN. Cultura organizacional Estudio cuantitativo
De la Garza, Hernández-Sampieri y Fernández (2005) efectuaron un estudio cuantitativo para determinar el tipo de cultura fundamental que domina en las empresas de la región central de México. Los autores se basaron en Cameron y Quinn (1999 y 2006), quienes desarrollaron un marco para contextualizar la cultura organizacional apoyado en un esquema teórico denominado Modelo de los Valores en Competencia (MVC), que trata de indagar si la organización tiene un enfoque principal interno o externo, y si estimula la flexibilidad e individualidad, o la estabilidad y el control. características El marcomando de referencia se fundamenta seis dimensiones de la cultura dominantes, o gobierno de la empresa,endirección de los empleados, unión organizacional y cohesión de la (organización, énfasis estratégicos —desarrollo humano, adquisición de nuevos recursos y desafíos, competitividad y ganancia en los mercados, eficiencia, permanencia y estabilidad—, así como criterios de éxito considerados) y cuatro tipos dominantes de cultura (clan, adhocracia, mercado y jerarquía).
Además del modelo, Kim Cameron y Robert Quinn diseñaron el Instrumento de Asesoramiento de Cultura Organizacional (OCAI), que se utiliza para identificar el perfil de cultura organizacional actual
Metodología de la investigación
(real) e ideal fundamentado en valores esenciales, suposiciones, interpretaciones y aproximaciones que caracterizan a la organización. Es decir, con base en las seis dimensiones del MVC, la herramienta ubica a la organización en el Modelo de Valores en Competencia, específicamente señalando la mezcla de valores que posee de los cuatro dominios, tal como se muestra en la figura 12.7. La investigación solo consideró el perfil real o manifiesto y no el ideal Tabla 12.7 Marcos de Referencia de los Valores en Competencia.22
a)
b)
c)
De acuerdo con el modelo de Cameron y Quinn (2006 y 1999), existen cuatro tipos de cultura: La cultura tipo clan, que en un sentido figurativo resulta ser como una “familia”, donde el fundamento es el trabajo en equipo, el compromiso organizacional y el involucramiento del empleado. Las recompensas son otorgadas con base en el desempeño del grupo, no de manera individual, para fomentar la participación, el compromiso y la lealtad. El tipo de liderazgo característico en la cultura de clan es el de facilitador, mentor o “padre”. En general, este tipo de organización tiene un sentido marcado por la cohesión con metas compartidas. La cultura adhocrática. El tipo de empresas con esta cultura se caracteriza por la apertura al cambio, el desarrollo de nuevos productos, las actitudes emprendedoras y la creatividad. El liderazgo es innovador y visionario. En esta cultura, los administradores basan la eficacia de sus organizaciones en “estar en la punta o la vanguardia”. Ellos valoran la creatividad y el crecimiento de la organización. La suposición fundamental reside en la creencia de que la innovación promueve nuevos recursos. Las organizaciones con cultura adhocrática se orientan a las características del mundo externo y por lo general no existen organigramas rígidos, porque las funciones cambian constantemente de acuerdo con las necesidades. La cultura organizacional tipo jerarquía se caracteriza por altos niveles de formalización y estructuración. En general, los procedimientos gobiernan el proceder de los empleados. En este tipo de cultura, el estilo de liderazgo es el de un coordinador, monitor y organizador. Se valora la eficiencia, existen fechas límites para el desarrollo del trabajo y se procura que todo ocurra armoniosamente dentro de
22 Tomado de Cameron y Quinn (1999, p. 32).
49
50
Capítulo 12 Ampliación y fundamentación de los métodos mixtos
la entidad. El administrador asume que el control lleva a la eficiencia organizacional. La cultura de mercado opera por medio de mecanismos económicos, especialmente el monetario. El enfoque se centra en conducir transacciones con otras organizaciones del entorno (proveedores, clientes, sindicatos, etc.) para crear ventajas competitivas. El objetivo principal es la utilidad, los resultados, las fortalezas en los nichos de mercado, la competitividad y la productividad. En esta cultura el liderazgo impone un control de mando “duro”, un administrador competitivo y productivo. Los administradores juzgan la eficacia en términos de participación en el mercado, logro de metas y en abatir a sus rivales. La suposición administrativa es que la competencia conduce a la productividad. Cameron y Quinn (2006 y 1999), hicieron notar que los cuadrantes no fueron seleccionados de manera aleatoria. Ellos los tomaron de la literatura que explica cómo con el tiempo diferentes valores organizacionales han sido asociados a diferentes estructuras. Concluyen que los cuadrantes representan suposiciones básicas de orientación y de valores, y que estos son comprendidos por una cultura organizacional. Como ya se dijo, en los cuadrantes subyacen dos dimensiones básicas. La primera diferencia —el criterio de eficacia— se basa en la flexibilidad, discreción y dinamismo del criterio que se fundamenta en la estabilidad, el orden y el control. Es decir, algunas organizaciones se perciben como eficaces si cambian constantemente y son adaptables (orgánicas); o bien, son vistas como eficaces si son estables, predictivas y mecanicistas. La segunda dimensión diferencia el criterio de eficacia interna —basado en el control, la integración y la unidad— del criterio de orientación externa —fundamentado en la diferenciación y la rivalidad—. Las dos dimensiones forman los cuadrantes de los tipos de cultura característicos. En el estudio se encuestaron a 216 ejecutivos (líderes) de empresas de manufactura, comercios y servicios de la región central de México (Distrito Federal, Estado de México, Jalisco, Guanajuato y Querétaro). Algunos resultados fueron los siguientes: Las empresas no pueden encasillarse en un solo cuadrante, pues, en mayor o menor medida poseen valores de todos ellos, aunque pueden “acercarse más a uno de estos” (cultura predominante). El tipo de cultura organizacional dominante en las empresas de manufactura es la de mercado, seguida por la adhocrática y la de jerarquía y, finalmente, la de clan. En cuanto a las empresas comerciales, la cultura de mercado es la más importante, seguida por la jerarquía. Las culturas adhocrática y de clan no presentaron contrastes significativos entre ellas y ocupan un lugar menos relevante dentro de las características organizacionales. Los resultados estadísticos mostraron que existen diferencias significativas entre las culturas de las organizaciones comerciales y las de manufactura. d)
•
•
•
Estudio cualitativo De la investigación cuantitativa se ha derivado una serie de estudios de caso cualitativos. Se están eligiendo empresas “supuestamente” de cada tipo de cultura (clan, adhocrática, jerarquía y mercado).23 La organización en sí es el caso y el ambiente o contexto, y se procede en cada una con todo el proceso cualitativo (inmersión en el escenario, observación enfocada, entrevistas con participantes que ocupan distintas posiciones y actores claves, revisión de documentos —desde la misión y los valores corporativos, hasta los planes y todo tipo de mensajes—, grupos de enfoque para profundizar en las prácticas culturales y ritos, así como análisis de los datos —los temas y categorías se refieren a aspectos de la cultura empresarial—). La finalidad es saber si la mezcla cultural identificada por el OCAI (Cameron y Quinn, 2006) corresponde con los resultados arrojados por el estudio de caso cualitativo (empresa por empresa). Se trata de un diseño transformativo secuencial (CUAN → CUAL) y la amplia perspectiva teórica (teorización) que guía el estudio es el Modelo de los Valores en Competencia. 23 “Supuestamente” porque el estudio en cuestión es para verificar si en efecto poseen una cultura dominante y corresponde a la que se hipotetizó.
Metodología de la investigación
CRECIMIENTO DE LOS ESTUDIOS MIXTOS Cada año se efectúan más estudios mixtos en todas las disciplinas. A partir de enero de 2007 se publica una revista interdisciplinaria dedicada exclusivamente a los métodos mixtos en áreas como ciencias del comportamiento humano, la salud, administrativas y sociales, que cubre también aspectos filosóficos y metodológicos: Te Journal of Mixed Methods Research (JMMR). En ella se presentan investigaciones tan variadas como las siguientes: Jang, McDougall, Pollon, Herbert y Russell (2008) aplicaron un estudio mixto para analizar cómo las escuelas urbanas pueden mejorar la calidad de sus servicios educativos y afrontar los retos que se les presentan. Por su parte, Ames, Duke, Moore y Cunradi (2009), efectuaron una investigación mixta para evaluar la forma en que la cultura de trabajo y las normas referentes beberenafectan los patrones de un fuerte consumo de alcohol en los adultos durante sus tres primerosa años la Armada de Estados Unidos.
IDENTIFICACIÓN DE DISEÑOS MIXTOS Antes de efectuar estudios mixtos es recomendable que el estudiante o el investigador revise previamente algunas investigaciones que se enmarquen en esta categoría. Creswell (2005, p. 513) nos brinda una guía para identificarlos: 1. Buscar evidencia en el título. Analizar si se emplean palabras como método mixto, enfoque mixto, cuantitativo(a) y cualitativo(a) (simultáneamente), triangulación, métodos híbridos y equivalentes (“mixing”, “qualiquantology”, etcétera). 2. En el apartado de “método” o “procedimientos” se menciona que se recolectaron y analizaron datos cuantitativos y cualitativos. 3. En el planteamiento o planteamientos se comenta que se recolectaron y analizaron datos cuantitativos y cualitativos o se combinaron procesos. Una vez identificados los puntos anteriores, es conveniente evaluar: a) b) c) d) e)
tanto pesoseosiguió prioridad le asignóyaanalizar la recolección cada tipo de datos?o secuen¿Qué secuencia paraserecolectar los datosy análisis de ambasdeclases? (simultánea cial). ¿Se combinaron datos cuantitativos y cualitativos en el análisis o se efectuaron los mismos por separado? ¿Se incluyó una visualización, diagrama o esquema del diseño mixto? ¿Los resultados cuantitativos y cualitativos se reportaron conjuntamente o se mezclaron? De esta forma es más fácil identificar el proceso completo del estudio.
51
capítulo
13
Profundización en temáticas de la investigación cualitativa
INTRODUCCIÓN El presente capítulo complementa y amplía algunos de los conceptos que se explicaron en los capítulos 12 a 16 de Metodología de la investigación, 6ª edición, relacionados con los métodos de recolección de datos, sobre todo más ejemplos, y las biografías o historias de vida, técnicas de análisis cualitativo, visualización de resultados del análisis cualitativo dentro y entre los casos, rigor de la indagación cualitativa, análisis de narrativas individuales y diseños etnográficos y de teoría fundamentada.
AMPLIACIÓN DE LOS MÉTODOS DE RECOLECCIÓN DE DATOS CUALITATIVOS En el capítulo 14 del libro se expusieron las principales herramientas de recolección de datos cualitativos, algunas de las cuales se presentaron en dicho capítulo y otras, por cuestiones de espacio, se reservaron para este. Asimismo, agregaremos ciertos comentarios sobre las que se describieron previamente.
Observación Debemos recordar que la observación cualitativa implica “palpar en carne propia” el contexto y las situaciones que se presentan dentro de este, de acuerdo con el planteamiento del problema. No es un asunto de unidades y categorías completamente predeterminadas (donde al establecerlas, como en la observación cuantitativa, se definen y todos los observadores-codificadores entienden de un modo estándar la manera de asignar unidades a categorías), sino de crear el esquema de observación adecuado para cada investigación y ambiente (las unidades y categorías surgirán de las observaciones, que se enfocan paulatinamente). Las historias, hábitos, deseos, vivencias, idiosincrasias, relaciones, etc., son únicas en cada contexto (en tiempo y lugar). Asimismo, cuando se recurre a la observación cuantitativa se pretende evitar toda reactividad (efectos se deanaliza, la presencia conductas en la cualitativa no es así (el efecto reactivo puesylos cambiosdel queobservador), provoca el pero observador también constituyen datos). Como se señaló en la obra impresa, hay ocasiones en las que el observador cualitativo incluso vive o juega un papel en el ambiente (profesor, trabajador social, médico, voluntario, etc.). El rol del investigador debe adecuarse a situaciones humanas que no pueden ser “capturadas” a distancia.
2
Capítulo 13 Profundización de temáticas de la investigación cualitativa
Jorgensen (1989) recomienda asumir un papel más participante cuando: Se sabe poco de la situación o contexto (por ejemplo, etnias desconocidas, pandillas, etcétera). Existen diferencias importantes entre las percepciones de distintos grupos del ambiente (por ejemplo, inmigrantes de diversas culturas). c) Los fenómenos abordados son complejos (por ejemplo, adicciones, prostitución de jóvenes, consecuencias de un desastre natural, etcétera). También debemos tener en mente que cuando se observa, se tiene que realizar un registro completo de lo que sucede en la comunidad o contexto (bitácora con anotaciones, registros visuales y formatos de observación). Además de los ejemplos de formatos de observación que se revisaron en el capítulo 14 del libro, un ejemplo adicional es el siguiente. a) b)
Ejemplo EJEMPLO ADICIONAL DE GUÍA DE0 OBSERVACIÓN Estudio sobre los obstáculos para la puesta en marcha de la tecnología en el ámbito escolar Esta investigación tuvo por objetivo analizar los obstáculos en la implementación de la tecnología en el ámbito escolar, en la cual se observaron varios episodios para entender las resistencias. El formato fue el siguiente: Episodio o situación: Reunión de comunidad educativa Fecha: 25 de abril de 2014 Hora: 18:00 p.m. Participantes: Docentes y directivos Lugar: Primaria Pública General Simón Bolívar 1. Temas principales. Impresiones (del investigador) . Resumen de lo que sucede en el evento, episodio, etcétera.
El director no apoya las mociones del Ministerio de Educación para integrar la tecnología al ámbito escolar mediante el impulso de centros tecnológicos en las instalaciones de la escuela. Piensa que el cambio obstaculizará la labor de los docentes, en vez de apoyarla. Desconfía de pasadas intervenciones del ministerio, donde prometen muchas innovaciones y recursos, y después “no sucede nada”. Los profesores jóvenes están entusiasmados con la idea de centros tecnológicos, pues suponen que ayudarán a mejorar la calidad educativa y la preparación de los jóvenes. Tema recurrente: se mejorarán oportunidades futuras para el estudiante. Se integrarán a un mundo más global. Director: piensa en otros gastos. 2. Explicaciones o especulaciones, hipótesis de lo que sucede en el lugar.
El director está a pocos años del retiro, no en una época de búsqueda. Quiere terminar su periodo con tranquilidad; literalmente, dijo, “sin hacer olas”. Piensa que el proyecto del ministerio puede ser algo potencialmente peligroso y no deseable. Que el programa no se reflejará en su desempeño, sino que le creará más problemas. Proposición o hipótesis: la edad del director y su antigüedad en el puesto tendrán un efecto negativo en su grado de innovación o actitud hacia programas tecnológicos. 3. Explicaciones alternativas. Reportes de otros que viven la situación.
Algunos docentes informan que el director tuvo una experiencia negativa con innovaciones tecnológicas en otra institución, proyecto que fue saboteado por los docentes. Su aparente “experiencia” bloquea la incorporación de la escuela a un mundo global. Segmentos de jóvenes docentes muestran insatisfacción. Están temerosos de que su institución se vea rezagada. 4. Siguientes pasos en la recolección de datos. Considerando lo anterior, qué otras preguntas o indagaciones hay
que hacer. Entrevista con el director para confirmar percepciones. Indagar con colegas si la propuesta es válida. Entrevista profunda con directivos. Grupo de enfoque con docentes.
Metodología de la investigación
Acción: discutir bondades y amenazas de la tecnología. Propiciar tormenta (lluvia) de ideas sobre la percepción de otras necesidades de la institución. Analizar situaciones similares en la literatura sobre tecnologías emergentes. 5. Revisión, actualización. Implicaciones de las conclusiones.
Considerar si las fuerzas jóvenes de las instituciones pueden contrarrestar los efectos estabilizadores de los directivos. Tomar en cuenta enlaces en las fases de implementación-análisis de las nuevas tecnologías en el ámbito escolar. Implicar dinámicas de grupo para cambio de actitudes.
EJERCICIO Ya sea de manera individual o preferentemente en equipo, piense en cuál es la mayor problemática en su escuela o facultad. Con base en tal identificación: ¿quiénes son los grupos que se encuentran involucrados en la problemática? Elija a uno de ellos se relaciona el grupo cony elabore ella?). un formato para observar los vínculos entre la problemática y ese grupo (¿Cómo Determine un periodo de observación (no muy largo, de un día a lo sumo). Observe a miembros característicos del grupo, en especial al líder o líderes. Implemente el formato y registre lo que observe. Asimismo, poco a poco “púlalo” o especifique tópicos o áreas de observación. Al final, el producto debe ser una guía de observación que incluya los puntos más relevantes a detectar que permitan conocer la manera en que se vincula cualquier grupo de la escuela a la problemática.
Grupos de enfoque Los grupos de enfoque se explicaron en el capítulo 14 del libro, en el cual se promete que en este se incluirían más ejemplos de su uso, así como una guía de tópicos. Pues bien, es tiempo de cumplir la promesa. Supongamos que ideamos una investigación para examinar en profundidad el fenómeno de la adopción. El trabajo tiene los siguientes objetivos: a) explorar el significado de la paternidad-maternidad en parejas que no pudieron tener hijos biológicos y decidieron adoptar, b) indagar sobre sus razones profundas para tomar la decisión de adoptar y c) conocer los sentimientos y las emociones que experimentaron antes de la adopción, durante el proceso y después de que concluyó este. 1 Para recolectar los datos pertinentes podríamos efectuar entrevistas con parejas que adoptan porque no tenían la opción biológica, sobre todo si deseamos conocer los sentimientos íntimos y personales (entrevistas previas a la diferentes adopción, parejas, durante seestadiscuta y posteriores). En cambio, si pretendemos que se contrasten puntos de vista entre colectivamente el significado de la adopción y se compartan experiencias respecto del proceso, tal vez lo más apropiado sea instrumentar grupos de enfoque. En consecuencia, podríamos tener, como mínimo, dos grupos, cada uno integrado por tres o cuatro parejas que hayan adoptado al menos un hijo y organizar múltiples sesiones hasta alcanzar la saturación de categorías y comprender el fenómeno. Con un único grupo correríamos el riesgo de no contar con un referente para fines de comparación. Desde luego, dado lo delicado de la temática, sería necesario conducir las sesiones con suma sensibilidad y lograr un considerable entendimiento ( rapport). Ahora bien, si se desea obtener un mayor espectro de opiniones, sentimientos, contextos y situaciones, además de disponer de amplios recursos y tiempo, se podría eliminar el veto a los padres biológicos y organizar varios grupos (muestra variada): Matrimonios sin hijos anteriores que adoptan un niño o niña. Matrimonios sin hijos anteriores que adoptan dos o tres niños. Matrimonios con al menos un hijo biológico que adoptan un niño o niña. Matrimonios con al menos un hijo biológico que adoptan dos o tres niños o niñas. En ocasiones, los grupos de enfoque son útiles cuando el tiempo apremia y se requiere información rápida sobre un tema puntual (por ejemplo, opinión sobre un comercial televisivo), pero se pierde la esencia inductiva del proceso cualitativo. Así como se insta a no utilizar los grupos de enfoque cuando se buscan narrativas individuales y, por tanto, sería más adecuada la entrevista cualitativa, también se recomienda no utilizarlos en exceso y evitar altas expectativas respecto de la transferencia de los resultados (Barbour, 2007). • • • •
Este estudio se convertiría en mixto si agregáramos variables medibles como el sentido de vida, la percepción de sí mismos y la 1 satisfacción en su relación de pareja, antes y después de la adopción.
3
4
Capítulo 13 Profundización de temáticas de la investigación cualitativa
Mostramos un ejemplo adicional de guía de tópicos de una primera sesión con jóvenes con problemas de adicción a estupefacientes (ocho jóvenes: cuatro mujeres y cuatro hombres de 18 a 21 años). La guía de tópicos es más bien abierta.
Ejemplo EJEMPLO ADICIONAL DE GUÍA DE TÓPICOS ABIERTA SOBRE ADICCIONES 1. ¿Qué tipo de drogas (estupefacienes, sustancias) consumen los jóvenes de este barrio? 2. ¿Se consumen más en soledad o en grupo? 3. ¿Quiénes las proporcionan?, ¿se venden? 4. ¿Cuánta cantidad consume un(a) joven cada vez que lo hace? 5. ¿Por qué las consumen? (razones, motivos) 6. ¿Qué tipo de sensaciones y experiencias tienen cuando se drogan? 7. ¿Cómo se sienten al día siguiente de que consumen la droga? 8. ¿Cómo definen la drogadicción? 9. ¿Qué cosas buenas y malas obtienen del consumo? 10. ¿Cómo es su vida actualmente? 11. ¿Qué esperan del futuro? 12. ¿Cómo se ven dentro de cinco años? ¿Dentro de diez?
Documentos, registros, materiales y artefactos Ampliemos el uso de los principales documentos, registros, materiales y artefactos como datos cualitativos, lo cual quedó pendiente en el capítulo 14 de la obra: “Recolección y análisis de los datos cualitativos”. Recordemos que ellos pueden ser de diversa naturaleza.
Individuales Los documentos individuales suelen subdividirse en varias clases: 1. Documentos escritos personales.
2.
3.
4.
Los documentos personales se pueden agrupar en tres categorías: a) documentos o registros preparados por razones oficiales tales como certificados de nacimiento o de matrimonio, licencias de manejo, cédulas profesionales, escrituras de propiedades, estados de cuenta bancarios, etc. (varios de ellos son del dominio público); b) documentos preparados por razones personales, a veces íntimas, por ejemplo: cartas, diarios, manuscritos y notas; y c) documentos preparados por razones profesionales (reportes, libros, artículos periodísticos, correos electrónicos, etc.), cuya difusión es generalmente pública. Materiales audiovisuales. Consisten en imágenes (fotografías, dibujos, tatuajes, pinturas y otros), así como grabaciones de audio o video generadas por un individuo con un propósito definido. Su difusión puede ser desde personal hasta masiva. Artefactos individuales. Artículos creados o utilizados con ciertos fines por una persona: vasijas, ropa, herramientas, mobiliario, juguetes, armas, computadoras, etc. Algunos autores como Esterberg (2002) colocan en esta categoría a las pinturas. Archivos personales. Colecciones o registros privados de un individuo.
Grupales Son producto de la interacción entre distintos individuos, como: 1. Documentos grupales. Instrumentos generados con cierta finalidad oficial por un grupo de personas (como el acta constitutiva de una empresa para cubrir un requisito gubernamental), profesional (una ponencia para un congreso), ideológica (una declaración de independencia) u otros motivos (una amenaza de un grupo terrorista o un manifiesto de un grupo pacifista). 2. Materiales audiovisuales grupales. Imágenes, graffitis, cintas de audio o video, páginas web, etc., pro-
Metodología de la investigación
ducidas por un grupo con objetivos oficiales, profesionales u otras razones. 3. Artefactos y construcciones grupales o comunitarias. Creados por un grupo para determinados propósi-
tos (desde una tumba egipcia, hasta una pirámide, un castillo, una escultura colectiva, unas oficinas corporativas). Documentos y materiales organizacionales. Memos, reportes, planes, evaluaciones, cartas, mensajes en los medios de comunicación colectiva (comunicados de prensa, anuncios y otros), fotografías, publicaciones internas (boletines, revistas, etc.), avisos y otros. Aunque algunos son producidos por una persona, incumben o afectan a toda la institución. Por ejemplo, en una escuela se pueden mencionar los registros de asistencia y reportes de disciplina, archivos de los estudiantes, actas de calificaciones, actas académicas, minutas de reuniones, currículum, planes educativos, entre otros documentos.
4.
5. Registros en archivos públicos. En estos ficheros podemos encontrar muchos de los documentos, mate-
riales y artefactos mencionados en las otras categorías y otros generados para fines públicos (catastros, registros de la propiedad intelectual…). Los archivos pueden ser gubernamentales (nacionales o locales) o privados (por ejemplo, de fundaciones). Huellas, rastros, vestigios, medidas de erosión o desgaste y de acumulación . Huellas digitales o de cualquier otro tipo, rastros o vestigios (de la presencia de un ser vivo, civilización, etc.), medidas de desgaste (de un subsuelo, de los colmillos de un animal, de objetos como automóviles, etc.), medidas de acumulación o crecimiento (por ejemplo, de la basura).
6.
Obtención de los datos provenientes de documentos, registros, materiales, artefactos y otras fuentes similares Los diferentes tipos de materiales, documentos, registros y objetos pueden ser considerados fuentes de datos en tres circunstancias que comentaremos a continuación: a) Solicitar a los participantes de un estudio que proporcionen muestras de tales elementos. Por ejemplo, en un estudio sobre la violencia intrafamiliar (esposos que agreden físicamente a su familia), pedirles fotografías de las heridas o hematomas provocados por las agresiones. O bien, en una investigación sobre la sobre culturala organizacional de unarequerir empresa,a solicitar videos deuna reuniones En una indagación depresión posparto, las participantes prendadedetrabajo. vestir que evoque sus mejores recuerdos durante el embarazo y otra que traiga remembranzas negativas. Desde luego, los participantes deben explicar los motivos por los cuales seleccionaron esas muestras. Solicitar a los participantes que los elaboren a propósito del estudio. En ocasiones se les puede pedir que elaboren escritos (una autodescripción, cómo se ven dentro de determinado número de años, un recuerdo muy agradable, las 10 cuestiones que más les molestan en momentos depresivos, etc.); que tomen fotografías (de los familiares que les ayudan más en su depresión, del compañero o compañera de trabajo con quien mejor colaboran, de un sitio que les agrada y los relaja) o que desarrollen videos, dibujen una imagen que represente cierta etapa de su vida, etc. Asimismo, deben exponer por qué elaboraron ese material en particular y sus significados. Obtener los elementos sin solicitarlos directamente a los participantes (datos no obstructivos o invasivos). Este caso resulta frecuente en la investigación histórica, pero también en otros campos. Algunos ejemplos, además de los mencionados en la obra impresa son:
b)
c)
•
•
•
En un cementerio, es posible investigar los apellidos inscritos en las tumbas para analizar el fenómeno de la migración. Si realizamos una investigación sobre la violencia en las escuelas, los videos del sistema de seguridad pueden ser un elemento fundamental, además de observaciones y entrevistas. Muchos investigadores analizan la basura para encontrar armas involucradas en delitos u obtener el ADN de sospechosos.
5
6
Capítulo 13 Profundización de temáticas de la investigación cualitativa
¿Qué hacer con los documentos, registros, materiales y artefactos? En gran medida, la respuesta depende de cada estudio en particular y, como siempre, del planteamiento del problema. Sin embargo, hay cuestiones ineludibles. Lo primero es registrar la información de cada documento, artefacto, material u objeto (fecha y lugar de obtención, tipo de elemento, aparente uso que se le dará en el estudio, quién o quiénes lo produjeron, si hay forma de saberlo). También integrarlo al material que se analizará —si es esto posible— o bien fotografiarlo o escanearlo, además de tomar notas sobre él. Por otro lado es necesario responder cómo se vincula el material o elemento con el planteamiento del problema. Asimismo, en el caso de documentos, se tiene que preguntar: ¿Quién fue el autor? ¿Qué intereses y tendencias posee?, ¿es equilibrada su historia? ¿Qué tan directa es su vinculación con los hechos? (actor clave, actor secundario, testigo, hijo de un superviviente o el papel que haya desempeñado). ¿Sus fuentes son confiables? En materiales u objetos: ¿Quién o quiénes los elaboraron? ¿Cómo, cuándo y dónde fueron producidos? ¿Por qué razones los produjeron? o ¿con qué finalidad? ¿Qué características, tendencias y/o ideología poseían o poseen los autores de los materiales? ¿Qué usos tuvieron, tienen y/o tendrán? ¿Cuál es su significado en sí y para los productores? ¿Cómo era el contexto social, cultural, organizacional, familiar y/o interpersonal en el que fueron realizados? ¿Quién o quiénes los guardaron?, ¿por qué los preservaron?, ¿cómo fueron clasificados? Además, es fundamental examinar en qué forma(s) el registro, documento o material “encaja” en el esquema de recolección de datos. Cuando los participantes proporcionan o elaboran directamente los elementos es necesario efectuarles entrevistas profundas sobre estos para entender la relación y experien• • •
• • • • • • • • •
•
cias del con cada objeto Si seindividuo trata de artefactos o fósileso material. con valor histórico o paleontológico, también es conveniente considerar qué otros elementos similares se han descubierto, y en el caso de artefactos qué otros objetos se usaban para los mismos fines, cómo ha evolucionado el uso de los elementos, etc. En estos casos el investigador se sumerge en la cultura, sociedad o periodo correspondientes. Incluso, Esterberg (2002) sugiere evaluar qué teorías y estudios previos son útiles para entender el contexto. Por otra parte, vale la pena preguntar a expertos que conozcan los artefactos sobre la historia de estos. Independientemente de cuál sea la forma de obtenerlos, tales elementos tienen la ventaja de que fueron producidos por los participantes del estudio, se encuentran en su “lenguaje” y por lo general son importantes para ellos. La desventaja es que a veces resulta complejo obtenerlos. Pero son fuentes ricas en datos. Para conseguir algunos de los materiales, es común que el investigador solicite autorización formal y tenga que atenerse a la legislación —de uso, de acceso a la información y privacidad— de cada región o país. Además, como es lógico, muchas veces no se tiene la posibilidad de interactuar con los individuos que los produjeron (porque fallecieron, no están dispuestos a hacerlo, se encuentran en un sitio distante, etcétera). La selección de tales elementos debe ser cuidadosa, es decir, solo se deben elegir aquellos que sean reveladores y proporcionen información útil para el planteamiento del problema. En ocasiones son la fuente principal de los datos del estudio y en otras, material complementario.
Un método de creciente uso para recolectar datos cualitativos y de carácter interactivo: la fotografía participativa Las herramientas visuales y los métodos participativos se utilizan cada vez con mayor frecuencia para: 1) desarrollar una comprensión profunda y enriquecedora de individuos y grupos, sus creencias, culturas,
Metodología de la investigación
tradiciones y relaciones sociales; 2) proporcionar “voz” a los participantes y conocer lo que piensan sobre el problema bajo investigación; 3) enriquecer y complementar los datos obtenidos por otras técnicas (por ejemplo, entrevistas semiestructuradas, encuestas cuantitativas) y 4) compartir y contrastar las historias sobre imágenes reveladoras entre los miembros de un grupo o comunidad (Wang y Pies, 2004). Las imágenes (por ejemplo, las fotografías) se han usado de diversas maneras en la investigación (ilustración, documentación o como herramientas de indagación). En los primeros años del siglo XX se usaron fotografías “como un vehículo influyente para la crítica social”. Sin embargo, esta crítica la realizaba el investigador, no los participantes. Gotschi, Delve y Freyer (2009) realizaron un estudio en el distrito de Búzi, Mozambique, utilizando la fotografía participativa para estimular a los agricultores a debatir sobre su pertenencia al grupo y evaluar lo que que esta la significaba para ellos como fotos, individuos, familias, grupos o comunidad. Los ainvestigadores esperaban combinación de evaluar analizar procesos de grupo y entrevistar los agricultores les permitiría conocer dimensiones cualitativas del capital social de los grupos, entre ellas la dinámica comunitaria, el comportamiento solidario y la acción colectiva. Además, trataban de comprender el punto de vista de los agricultores (por qué ser miembro de sus grupos tiene un efecto en sus vidas) y conocer su visión de su mundo. Específicamente, estaban enfocados en cómo se construye y expresa el capital social dentro de un grupo, más allá de la evaluación de este para lograr objetivos comunes (por ejemplo, aumentar el volumen de ventas de los productos cosechados y construir espacios comunes para almacenar sus cosechas). También resultaban de interés las percepciones individuales respecto de la confianza, la cohesión de grupo y las redes sociales. Se analizaron colectivamente las dinámicas de grupo y las problemáticas que se srcinan en ellas, el poder y la solidaridad entre los miembros del grupo, a través de discusiones grupales y entrevistas con los agricultores para evaluar el proceso, así como por medio de imágenes. Se escogieron deliberadamente tres grupos de agricultores (de entre 11 y 35 miembros cada uno) que habían sido estudiados en 2004 y 2005. El ciclo consistió de tres “periodos de fotografía” con cada uno de estos grupos, pidiéndoles que tomaran fotos con cámaras desechables (27 por grupo) para analizar colectivamente su pertenencia al grupo, las inversiones que consideraban necesarias para su trabajo, las problemáticas las estrategias para y los beneficios de colaborar conhabían el grupo. Implementar esta faseenfrentadas, requirió un proceso gradual deresolverlas aprendizaje, porque muchos de ellos no tomado fotografías y no estaban acostumbrados a pensar en sí mismos y sus funciones como miembros de grupos. Al final, se obtuvieron múltiples categorías y temas. El proceso incluyó las siguientes visitas de campo: Visita 1: presentar el proyecto de investigación, lograr la participación voluntaria, discutir aspectos éticos y entrenarlos en el uso de las cámaras. Visita 2: elegir a los participantes y solicitarles que tomaran fotos en parejas y de manera individual (sobre sus actividades, los beneficios y problemáticas que desean discutir de sus tareas laborales y cómo mejorarlas, las implicaciones de trabajar colaborativamente y formar parte de un grupo). El periodo para capturar las fotografías fue de 14 días. Visita 3: discusión grupal de las fotografías. Visita 4: entrevista individual para analizar las fotos. Visita 5: discusión grupal sobre las fotos. Luego se les solicitó que con ellas elaboraran una presentación en carteles (narrativa visual). Además, se llevó a cabo una sesión final de un día con los representantes de todos los grupos y la comunidad para discutir sobre sí mismos e intercambiar experiencias con funcionarios y tomadores de decisiones. Los niveles de análisis se muestran en la tabla 13.1. •
•
• • •
7
8
Capítulo 13 Profundización de temáticas de la investigación cualitativa
Tabla 13.1 Diferentes niveles de análisis de la fotografía participativa. Foco d el a nálisis
Proceso
Contexto y contenido
Interpretaciones de los agricultores / presentaciones a otros grupos y a agentes externos (funcionarios gubernamentales, ONG, etc.)
Valoración de diferencias por parte del investigador
Cuestionamiento a considerar en la indagación ¿Quién o quiénes toman las fotografías? ¿Quién o quiénes guardan la cámara? ¿Quién o quiénes comentan e interpretan las fotos? ¿Qué tipo de fotos? ¿Qué se representa en las fotos?
¿Cuáles son las historias o narrativas detrás de las imágenes?
¿Existen diferencias entre la toma de fotos y sus interpretaciones por los diferentes grupos?
Relevancia para el estudio en términos del capital social y las dinámicas grupales Estudiar las redes, distribución del poder dentro del grupo, participación en el proceso, inclusión y exclusión de miembros del grupo y conflictos potenciales
Visualizar el contexto: a) la gente (a nivel de familia, grupo, comunidad), b) agricultura (cultivos, cosechas, ganadería), c) infraestructura (viviendas, mercado, vías de transporte, tecnología, etc.) Interpretaciones (significados) tanto individuales como grupales; experiencias, impacto del grupo en el sustento familiar y comunitario, actividades, conflictos, beneficios, relaciones con el grupo, liderazgo, membresía, implicaciones de género y de grupos de edad (jóvenes, mayores, personas de edad avanzada) Diferencias en la percepción de la importancia del grupo por género, nivel educativo, estado de salud, edad, posición dentro del grupo y entre grupos de agricultores
El uso de imágenes puede servir para estimular respuestas e interpretaciones, así como para generar significados en entrevistas, grupos de enfoque y desarrollo de historias y otras narrativas (Wang, 2010; Gotschi et al., 2009; Stanczak, 2004). Cuando se utiliza de manera participativa, se hace hincapié en el rol activo de los individuos para generar e interpretar las imágenes (por ejemplo, fotografías). Se pueden proporcionar cámaras a los participantes para que tomen fotos sobre hechos o aspectos que ellos consideren relevantes, con el propósito de obtener datos y estimular la autoreflexión e interacciones con otras personas. O bien, el investigador toma las fotografías y las presenta a los participantes para que las analicen. Pueden usarse para dar a los participantes “voz” o para proporcionar un registro de un hecho, un componente u objeto relevante del ambiente o la experiencia de los sujetos. De esta forma es posible capturar diferentes puntos de vista cuando la primera reacción del participante se enfrenta con imágenes de su propia realidad. Como señalan Gotschi et al. (2009), mediante imágenes generadas por los participantes pueden verse los fenómenos desde su perspectiva, captarse sus patrones de vida y la forma en la cual estructuran sus realidades. Solicitarles a los individuos que tomen fotografías sobre un tema de investigación determinado devuelve “cierto poder a los sujetos” pues pueden utilizarlas como un medio para “contar sus propias historias”, y las diferencias entre el punto de vista “externo” del investigador y el “interno” de los participantes se hacen visibles (Stanczak, 2004). Constituyen narrativas visuales (Gotschi et al., 2009). En los diseños de investigación-acción se han utilizado las imágenes como apoyo para que un grupo o comunidad se defina a sí mismo, visualizar problemáticas y proponer soluciones (Wang, 2010). Además, como ya se mencionó, es factible que se trate de fotos, audios o videograbaciones. Incluso, los seres humanos revelamos a través de las imágenes y videos contenidos en nuestras páginas personales en redes sociales en internet, una gran cantidad de información sobre nosotros mismos, nuestros esquemas mentales, emociones, maneras de construir la realidad y percepciones del mundo, entre otras cuestiones.
Metodología de la investigación
Biografías e historias de vida Las biografías o historias de vida son narrativas de: a) la vida de un individuo, b) pasajes o épocas de su existencia o c) uno o varios episodios, experiencias o situaciones de las personas, vinculadas con el planteamiento del problema. Implican no solo la recopilación de datos sobre un ser humano, sino también interpretarlos para crear una representación o “retrato” de determinados aspectos de su vida en un tiempo determinado. Pueden ser individuales (desde un líder hasta una persona común) o colectivas (por ejemplo, una familia, un grupo de participantes que vivieron durante un periodo y que compartieron rasgos y experiencias). Consisten pues, en relatos de los individuos que son analizados en contexto y de manera sistemática (Miller, 2008 y Chaitin, 2008). En la tabla 13. 2 vemos algunos ejemplos en los que este método podría ser útil. Tabla 13.2 Ejemplo de biografía e historias de vida. Individuales Investigación para determinar los factores que llevaron al poder a un líder, como Alejandro Magno, o al éxito a un empresario.
Estudio para documentar las experiencias vividas por una persona a raíz de la pérdida de un hijo en un terremoto (pueden integrarse varias historias de vida individuales). Indagación sobre el papel que desempeñó algún sacerdote en la guerra cristera. Indagación de las razones por las cuales un joven ganó una medalla de oro en un determinado deporte.
Análisis de cómo un investigador resolvió una serie de algoritmos.
Colectivas Un estudio de cómo el cártel de Cali, de los hermanos Rodríguez Orejuela, dedicado a la comercialización de droga ilegal fue desmantelado por el general Rosso José Serrano y su equipo de colaboradores en la década de 1990. Investigación sobre las experiencias de los cristeros combatientes de la población de Apaseo el Alto, Guanajuato. Estudio sobre cómo una familia enfrentó la violencia provocada por el padre. Análisis de las razones por las cuales un equipo latinoamericano tuvo una destacada actuación en el último campeonato mundial de futbol en Brasil 2014 (por ejemplo, Costa Rica, Argentina o Colombia). Análisis de cómo un grupo de investigadores logró determinada reacción química.
Algunas cuestiones que son importantes sobre esta forma de recolección de datos son las siguientes: Las historias o biografías se construyen por lo regular mediante: a) La de documentos, registros, materiales y artefactos comentados antes (en cualquiera de sus modalidades: solicitud de muestras, petición de su elaboración u obtención por cuenta del investigador). b) Por medio de entrevistas, en las cuales se pide a uno o varios participantes que narren sus experiencias de manera cronológica, en términos generales o sobre uno o más aspectos específicos (laboral, educativo, sexual, de relación marital, etc.). Obviamente, este segundo caso sólo es pertinente cuando vive el protagonista de la biografía o historia y las personas que estuvieron a su alrededor o que lo conocieron en los aspectos de interés para el estudio (Cuevas, 2009). En las biografías y las historias de vida, el investigador debe obtener datos completos y profundos sobre cómo perciben los individuos los acontecimientos de sus vidas y a sí mismos. Resulta esencial tener fuentes múltiples de datos (entre más, mejor). Por ejemplo, si se trata de recolectar datos sobre la experiencia de mujeres con depresión posparto, desde luego que entrevistar a las participantes constituye el “corazón” del estudio, pero obtener el punto de vista de su pareja, sus hijos y amigas enriquece enormemente la investigación. En el caso de Iskandar et al. (1996), la técnica que ellos
•
•
•
Rashomon denominan es simple, ya quevecinos, solo implica incluir varias fuentes de datos (en promedio seis testigos de las emergencias: familiares, funcionarios municipales, asistentes tradicionales de partos y personal de atención de la salud). El entrevistador solicita al participante una reflexión retrospectiva sobre sus experiencias en torno a un tema o aspecto (o varios). Durante la narración se le pide que se explaye sobre los significados, las vivencias, los sentimientos y las emociones que percibió y vivió en cada experiencia; asimismo, se le
9
10
Capítulo 13 Profundización de temáticas de la investigación cualitativa
•
•
•
• •
•
•
•
• •
• • •
• •
•
requiere que realice un análisis personal de las consecuencias, las secuelas, los efectos o las situaciones que siguieron a dichas experiencias. El entrevistador —de acuerdo con su criterio— solicita detalles y circunstancias de las experiencias, para vincularlas con la vida del sujeto. Las influencias, interrelaciones con otras personas y el contexto de cada experiencia ofrecen una gran riqueza de información. Este método requiere que el entrevistador sea un hábil conversador y que sepa llegar a los aspectos más profundos de las personas. Los conceptos vertidos sobre la entrevista se aplican a este método. El investigador pone atención al lenguaje y estructura de cada historia y la analiza tanto de manera holística (como un “todo”) como por partes. Asimismo, se considera lo que permanece del pasado (secuelas y alcance actual de la historia). Es importante los hechos que ocurrieron y entender a las personas que los vivieron, así como los contextos endescribir que estuvieron inmersas. Si la historia está vinculada con un hecho específico (una guerra, una catástrofe, un triunfo), entre “más cerca” haya estado el participante de los eventos, más información aportará sobre estos. En relación con el punto anterior, debemos tratar de establecer cuánto tiempo pasó entre el evento o suceso descrito y el momento de rememoración o recreación, o bien, cuándo lo escribió. El investigador debe tener cuidado con algo que suele ocurrir en las historias: los participantes tienden a magnificar sus papeles en ciertos sucesos. También tiene que distinguir lo que es ficción de lo que fue real (Stuart, 2005). El significado de cada vivencia o experiencia resulta central. Recordar que la historia puede ser de vida (las experiencias cruciales de una persona a lo largo de su existencia, por ejemplo: la vida completa de un sacerdote cristero hasta su fusilamiento o de una mujer exitosa en un campo profesional) o de experiencia (uno o varios episodios, por ejemplo: la desesperación vivida por una o varias víctimas de secuestro o la experiencia de una profesora que ha trabajado con diferentes sistemas educativos). Obtener la cronología de sucesos. Las historias son los datos y se les denomina “textos de campo” (Creswell, 2005). En entrevistas biográficas, el brevedad investigador tiene que serque particularmente sensible a los tiempo tiempospara del participante (algunos quieren y otros prefieren la entrevista tome suficiente que puedan expresar todo lo que desean decir). Las biografías siempre se analizan en el contexto social e histórico de los individuos. Las historias son contadas por el participante, pero la estructuración y narración final corresponden al investigador. Algunas preguntas que suelen hacerse en las entrevistas de historias de vida se muestran en la tabla 13.3. Tabla 13.3 Preguntas comunes que suelen hacerse en entrevistas de historias de vida. Tipo de pregunta
Ejemplos
De acontecimientos
¿Qué eventos o acontecimientos fueron los más importantes en su vida?, ¿cuáles lo fueron en determinada etapa o periodo?, ¿qué eventos resultaron los más importantes en relación con cierto hecho?
De lazos
¿Qué personas fueron las más importantes en su vida? O bien, respecto de una etapa o suceso, ¿quiénes estuvieron ligados con…? ¿Quiénes conocieron tales hechos?
De orientación sobre acontecimientos
¿Qué ocurrió?, ¿dónde?, ¿cuándo?, ¿cómo?, ¿en qué contexto?
De razones
¿Por qué ocurrió tal hecho?, ¿por qué se involucró en…?, ¿qué lo motivó a…?
Metodología de la investigación
Tabla 13.3 Preguntas comunes que suelen hacerse en entrevistas de historias de vida (continuación). Tipo de pregunta
Ejemplos
De evaluación
¿Por qué fue (es) importante este hecho?, ¿cuál es su opinión del hecho?, ¿cómo calificaría al suceso?
Del papel realizado
¿Qué papel desempeñó usted en el hecho?
De resultados
¿Qué sucedió al final?, ¿cuáles fueron las consecuencias…?, ¿cómo terminó?
De omisiones
¿Qué detalles ha omitido?, ¿agregaría algo más?
Mertens (2010) sugiere una técnica de entrevista histórica para obtener respuestas del participante en cierto modo proyectivas. Un tipo de formulación como: si usted escribiera sobre… (mencionar el hecho investigado), ¿qué incluiría?, ¿qué consideraría importante?, ¿a quién entrevistaría? (proyección de actores destacados). Otras recomendaciones útiles cuando se utilizan biografías o historias de vida son: Es muy necesario que el investigador vaya más allá de lo anecdótico. Cuando se revisan documentos traducidos o transcritos resulta fundamental evaluar quién realizó tal labor. Cualquier tipo de comunicación es material útil para el análisis cualitativo. Los datos de hemerotecas y archivos son frecuentemente invaluables. La tarea final en la recolección de datos por medio de las historias y biografías implica “ensamblar” los datos provenientes de diferentes fuentes. Para construir tal ensamblaje un esquema puede ser el que se muestra en la figura 13.1. • •
•
•
Figura 13.3 Ensamble de los datos provenientes de diferentes fuentes. Contexto
Secuencia de hechos
Actores
Causas
Consecuencias
Conclusiones y aprendizajes
Una limitante es que a veces la muestra se centra en sobrevivientes y como dice Mertens (2010), se excluye a los más vulnerables (por ejemplo, los que perecieron en una guerra o catástrofe).
COMENTARIOS ADICIONALES DEL ANÁLISIS CUALITATIVO En el texto impreso se pretendió introducir al lector en el amplio mar del análisis cualitativo. Ahora complementaremos algunos puntos que por cuestiones de espacio no pudieron incluirse en él. Como sabemos, el análisis cualitativo involucra diferentes tipos de datos interpretativos (en texto, imágenes, audio y video) que provienen de diferentes fuentes (entrevistas interpersonales, cuestionarios —preguntas abiertas—, observaciones, documentos personales o de otra clase —por ejemplo: diarios, anotaciones—, registros, reuniones grupales —como grupos de enfoque o entrevistas colectivas—, fotografías, grabaciones en audio y video, internet —páginas web, por ejemplo: facebook, twitter, youtube, itunes, etc. la —,actividad libros, revistas otros medios de comunicación colectiva, porEsmencionar Representa de darley sentido, interpretación y teorización a talessolo datos. un examenalgunos). sistemático de algo que determina sus partes y las relaciones entre estas. Como señala Creswell (2013a), el análisis cualitativo (AC) implica preparar y organizar datos en forma de textos, imágenes y elementos visuales para su análisis, reducirlos y desglosarlos en temas por medio de la codificación y condensación de códigos, y finalmente representarlos en figuras, tablas, narraciones y una discusión.
11
12
Capítulo 13 Profundización de temáticas de la investigación cualitativa
La mayoría de los libros sobre metodología cualitativa tienden a centrarse en una técnica de análisis principal (por ejemplo, el análisis del discurso) o en unas cuantas. En la mayor parte del siglo XX no se generó un modelo holístico del análisis cualitativo. Por el contrario, en la primera década del presente siglo se integraron diversos modelos. Aquí se presenta —humildemente— uno, producto de Creswell (2013a), Teddlie y Tashakkori (2009), así como de Hernández-Sampieri y Mendoza (2008), y particularmente, Onwuegbuzie y Combs (2010). La figura 13.2 muestra tal modelo, enfocándose en las estrategias de análisis cualitativo, el cual, desde luego, por cuestiones de espacio, no incluye a todas las técnicas específicas, pero el lector puede agregar las que considere pertinentes en el recuadro que corresponda. En realidad, el modelo es un mapa que presenta las decisiones centrales que el investigador debe tomar durante análisis cualitativo. Recordemos que este se repitela en los datosdevarias veces (los primeros datos el—iniciales—, datos posteriores y datos que proceso han alcanzado saturación categorías). Figura 13.2 Modelo de las estrategias de análisis cualitativo.2
Una vez que los datos se encuentran preparados para el análisis (es decir, transcritos y/o en un archivo de imagen, audio o video) y de acuerdo con el planteamiento del problema, el investigador elige si va a efectuar análisis dentro de los casos o entre casos, o bien, ambos (Onwuegbuzie y Combs, 2010; Ayres, Kavanaugh y Knafl, 2003). Los primeros son aquellos en los cuales los datos son analizados caso por caso (uno a la vez). Los segundos involucran el análisis simultáneo de datos provenientes de múltiples casos (al menos dos). Después, decide qué técnicas concretas va a utilizar (por ejemplo, comparación constante y categorización) y de qué formas piensa visualizar sus resultados, para finalmente generar sus inferencias. Por lo regular, estas son producto tanto de los propios análisis como de las visualizaciones. En algunas ocasiones, 2 Idea basada en Onwuegbuzie y Combs (2010, p. 405).
Metodología de la investigación
la visualización puede efectuarse directamente desde los mismos datos. También pueden someterse a una o más técnicas de análisis. Las principales técnicas de análisis cualitativo se resumen en la tabla 13.4. Tabla 13.4 Tipos de análisis cualitativos más comunes.3 Técnica(tipodeanálisis) Comparación constante de unidades y categorías
Brevedescripción Comparar unidades para generar categorías y así reducir sistemáticamente los datos a códigos, después contrastar categorías o códigos para desarrollar temas y vincularlos con el fin de producir teoría (emergente) Elaborar listas de las categorías o códigos que surgieron del análisis y contar el
Análisis de frecuencias de códigos
Análisis de dominio
número de veces que aparece cada uno en los datos (determinar su frecuencia) Identificar los términos claves o conceptos centrales presentes en los datos y analizar las palabras que los “circunscriben” (asociadas, que se refieren a ellos, etc.) para comprender su significado subyacente Determinar el número de veces que aparece en los datos cado uno de los términos claves o conceptos centrales, particularmente aquellos vinculados con el planteamiento del problema Utilizar las relaciones o vínculos entre los símbolos y referentes para identificar dominios
Análisis de la conversación (conversacional)
Analizar el lenguaje verbal y no verbal de los participantes, a fin de describir los métodos y estrategias que utilizan para generar interacción social y el significado de sus comunicaciones (se considera el contenido de las conversaciones)
Análisis de términos en contexto
Conteo de palabras o conceptos
Análisis taxonómico
Análisis componencial o de contraste
Análisis del discurso
Análisis de la comunicación no verbal
Análisis de datos complementarios
Análisis de contenido cuantitativo
en un diagrama de flujo o esquema que ayude al investigador a comprender las relaciones entre ellos. Un dominio representa un conjunto de elementos o componentes vinculados entre sí que explican o generan un sentido de entendimiento respecto de un fenómeno o problema de estudio Desarrollar un sistema de clasificación para inventariar los dominios Utilizar matrices y/o tablas para descubrir similitudes y diferencias entre los componentes de los dominios Seleccionar segmentos representativos, ilustrativos o únicos del uso del lenguaje (por ejemplo, pasajes de narrativas o líneas transcritas de una entrevista) y examinarlos en detalle para comprender su organización o estructura retórica, apelaciones, variabilidad, importancia y posicionamiento Analizar elementos no verbales en interacciones para descubrir su significado: Gestos (muecas, fruncir el ceño, sonreír, etc.), miradas y contacto visual. Lenguaje corporal (movimientos del cuerpo como inclinarse, alejarse, señales con la mano, abrazos, tomar de la mano, etc.). Proxémica (distancias entre personas). Paralingüística (gruñidos, tono de voz, silencios, etc.) Manejo del tiempo (llegar tarde, tomar las cosas con mucha calma, etc.) Analizar datos provenientes de otras fuentes vinculados con los datos objeto de análisis para ampliar nuestra comprensión del problema investigado (por ejemplo, si analizamos historias de vida de los participantes, agregar el análisis de artefactos vinculados con ellos). Una variante implica examinar datos que no fueron recolectados como parte de la investigación sino que fueron evaluados en estudios previos e incorporarlos al análisis Aplicar el análisis del contenido manifiesto y latente cuantitativo a los datos cualitativos, e idealmente comparar sus resultados con el análisis por comparación constante (nos lleva a un análisis mixto)
3 Adaptada de Onwuegbuzie y Combs (2010, p. 405) y Leech y Onwuegbuzie (2008).
13
14
Capítulo 13 Profundización de temáticas de la investigación cualitativa
Tabla 13.4 Tipos de análisis cualitativos más comunes (continuación). Técnica(tipodeanálisis)
Brevedescripción
Análisis de membresía
Evaluar el significado de que los participantes pertenezcan a determinadas categorías o membresías vinculadas entre sí (por ejemplo, qué significa ejercer el rol de madre —categoría— y ser parte de la familia —membresía—). También, agrupar categorías similares en membresías más generales (bebé, hermana, tío, madre, padre = familia) y describirlas, así como analizar los roles que desempeñan las interpretaciones al desarrollar las descripciones y las implicaciones de elegir cada concepto o categoría general Evaluar el lenguaje como un sistema de signos bajo la premisa de que no se pue-
Análisis semiótico
de asignar un único significado a un término y no se deben aislar los conceptos Análisis cualitativo comparativo
Analizar sistemáticamente similitudes y diferencias entre casos o unidades, utilizando una aproximación de construcción de teoría, para conectar entre sí a las categorías emergentes y también desarrollar y probar nuevas categorías
Análisis narrativo
Integrar una narrativa general o común mediante el análisis de narrativas individuales
Minería de textos
Reorganizar textos en categorías, secuencias, historias, significados, etc., para fines de análisis desde ópticas diferentes
Análisis de interlocución
Análisis basado en la teoría funda-
Vincular interlocutores o participantes a cuestionamientos, categorías y temas, así como roles (por ejemplo, en grupos de enfoque, analizar quiénes responden a ciertas preguntas, el orden en que contestan, quién es el líder, qué características tienen las respuestas de los participantes, etc.) Análisis que encaja los datos en un sistema explicativo de categorías, temas y/o
mentada
patrones (antecedentes, consecuentes, elementos mediatizadores, etc.)
De acuerdo con el modelo de las estrategias de análisis cualitativo (figura 13.2), hay que señalar que algunas de las visualizaciones de resultados típicas dentro de los casos y entre casos fueron desarrolladas por Miles y Huberman (1994) y han sido enriquecidas por otros autores como Onwuegbuzie y Combs (2010), las cuales se muestran en las tablas 13.5 y 13.6 (dentro de los casos y entre casos respectivamente), por la manera que se organizan u ordenan en el reporte de resultados. Tabla 13.5 Visualizaciones dentro de los casos. Tipo de visualización
Manera de organizarla (ordenarla)
Breve descripción
Narrativa o poema
Por partes
Una composición en verso que representa a los datos
Mapa conceptual
Por partes
Matriz de lista de verificación
Por partes
Redes que mapean (forma gráfica) las relaciones entre conceptos, categorías, temas, individuos, grupos y roles que contextualizan la conducta individual Una manera de analizar/visualizar un concepto mayor, dominio, tema o categoría, que incluye diversos componen-
Mapas de subordinación de conceptos Secuencia de eventos
Por partes
Temporal
tes que no estaban ordenados Mapa que presenta la subordinación de conceptos particulares a un concepto general (categorías que son parte de un tema, por ejemplo) Matriz o diagrama de flujo que organiza una serie de eventos concretos de manera cronológica (por periodos), y además los puede clasificar en múltiples categorías
Metodología de la investigación
Tabla 13.5 Visualizaciones dentro de los casos (continuación). Tipo de visualización
Manera de organizarla (ordenarla)
Gráfica de incidentes críticos
Temporal
Red del estado de eventos
Temporal
Record o registro de actividades Diagrama de flujo de decisiones (modelamiento)
Temporal
Redgradiente
Temporal
Matrizdetiempos Matriz de roles
Temporal Por rol o papel
Matriz o mapa de roles temporales o cronológicos Matriz temática conceptual
Temporal
Por rol o papel Conceptual
Breve descripción Mapa o diagrama de flujo con los eventos críticos más importantes Mapa que presenta elementos, conceptos, categorías o similares que moderan o mediatizan la relación entre eventos específicos de interés Esquema que muestra una actividad recurrente específica que está estrechamente limitada por el tiempo y el espacio Diagrama de flujo o mapa que incluye puntos de vista, planes y decisiones implementadas durante una actividad que se vincula con condiciones específicas Redquemapeaeventosquesonconceptualizadoscomo vinculados a una variable, categoría o tema que cambia a través del tiempo Mapeocronológicode unfenómenoparticular Mapea los roles de cada caso o participante, vinculándolos en una matriz con datos que reflejan sus puntos de vista, creencias, expectativas y conductas Mapea o diagrama los roles del caso pero preserva el orden cronológico Matriz (columnas y filas) que vincula temas y categorías entre sí y puede darles un orden Tabla o matriz de texto con columnas y filas colocadas o dispuestas por ítems agrupados que están relacionados teóricamente, temáticamente o empíricamente
Matriz agrupada conceptualmente (similar a la anterior, pero con agrupación por ítems) Taxonomía
Conceptual
Conceptual
Esquemaodiagramaenformadeárbolquevisualizacómo una persona o el investigador clasifica conceptos, categorías
Mapacognitivo
Conceptual
Matriz de causas y consecuencias Matriz de las dinámicas del caso
Conceptual
Redcausal
Conceptual
o fenómenos Mapa que muestra la representación de una persona de conceptos que pertenecen a un dominio particular Matriz que dispone o coloca causas en columnas y sus consecuencias o resultados en filas, o viceversa Visualiza un conjunto de elementos para el cambio y los procesos que son necesarios para efectuarlo, así como los resultados (generalmente para ofrecer una explicación inicial) Esquemasodiagramasquemuestranvínculoscausales entre conceptos (causas y efectos). Son relaciones conceptuales, no estadísticas y se refieren a un caso
Conceptual
Tabla 13.6 Visualizaciones entre casos. Tipo de visualización Metamatrices ordenadas por partes Metamatrices descriptivas ordenadas por caso y con una variable, tema, concepto o categoría Metamatrices descriptivas ordenadas por caso y con dos variables, temas, categorías o conceptos
Manera de organizarla (ordenarla) Por partes
Breve descripción Matriz que presenta datos descriptivos de varios casos (simultáneamente). Los datos pueden ser las columnas y los casos las filas, o viceversa
Por caso
Contiene datos descriptivos de los casos, pero estos se ordenan por el tema, categoría, concepto o variable de interés principales
Por caso
Similar a la anterior; presenta datos descriptivos de todos los casos, pero estos son ordenados por dos temas, categorías, conceptos o variables centrales de interés
15
16
Capítulo 13 Profundización de temáticas de la investigación cualitativa
Tabla 13.6 Visualizaciones entre casos (continuación). Tipo de visualización Tabla de contraste
Manera de organizarla (ordenarla) Por caso
Gráfico (diagrama) de relación entre casos
Por caso
Matriz de consecuencias/ efectos cualitativos
Por caso
Matriz de resultados y sus causas
Por caso
Matriz ordenada cronológicamente
Temporal
Gráfico (diagrama) de tiempo
Secuencia compuesta de historias
Temporal
Temporal
Breve descripción abla que muestra los casos más representativos y característicos (cualitativamente) en los cuales el tema, categoría, concepto o variable centrales ocurre con mayor y menor profundidad, y contrasta a estos casos extremos en diversos atributos de dicho tema, concepto o variable Coloca a los casos en dos o más ejes (que representan temas, categorías, conceptos o variables cualitativas) para visualizar la relación entre los casos y los temas, categorías, conceptos y/o variables (especie de diagrama de dispersión pero en el que los casos no se ubican por puntuaciones sino por valoraciones del investigador o los propios participantes) Coloca a los casos por el grado o profundidad con que un tema, evento, categoría, concepto o variable tiene consecuencias en ellos. Una vez más, de acuerdo a las valoraciones del investigador y/o participantes Ubica los casos con respecto a un resultado y proporciona información para cada caso respecto de qué causas, cuestiones o antecedentes intervinieron o provocaron tal resultado Tabla en la cual las columnas se organizan secuencialmente de manera cronológica (cada una representa un periodo de tiempo) y las filas son casos (los recuadros o celdas representan sucesos, eventos o categorías emergentes que se manifestaron en un periodo en un caso); o bien, las filas constituyen temas, categorías, conceptos o variables y los recuadros o celdas casos que se ubican en un periodo donde se presentaron los respectivos temas, categorías o variables Coloca a los casos en un eje que representa el tiempo (está segmentado en periodos cronológicos) y el otro eje representa un tema, categoría, concepto o variable (puede haber más de un eje o tema, categoría, etc.) Presenta una historia común a varios casos (compartida) de forma secuencial
Matriz de roles
Por rol o papel
Tabla resumen de contenido analítico
Conceptual
Una tabla donde se muestran y comparan entre sí dos o más temas, categorías, conceptos, eventos, historias o variables (en columnas y/o renglones)
Gráfica de estructura y subestructuras
Conceptual
Presenta a un evento, tema, suceso, categoría, concepto o variable y las partes, elementos o dimensiones que lo conforman
Árbol de decisiones (modelo)
Conceptual
Vincula roles de los casos o participantes con sus puntos de vista, creencias, emociones, experiencias, expectativas y conductas, o bien, categorías (por ejemplo, las columnas pueden ser papeles, las filas casos y las celdas categorías o creencias)
Un esquema o diagrama en forma de árbol que visualiza las decisiones y/o acciones que involucraron a varios casos
Metodología de la investigación
Tabla 13.6 Visualizaciones entre casos (continuación). Tipo de visualización Matriz cruzada de temas, categorías, conceptos y/o variables Diagramas conceptuales causales
Manera de organizarla (ordenarla) Conceptual
Conceptual
Breve descripción Una tabla donde las columnas y filas o renglones representan temas, categorías, conceptos y/o variables; y las celdas representan los casos. Se ubican éstos en función de las(los) anteriores Red o esquema de temas, categorías, conceptos y/o variables con conexiones causales entre ellas, con la finalidad de generar un sentido de entendimiento de sus relaciones eclásica). hipótesis (es un producto de la teoría fundamentada Involucran causas, consecuencias y elementos mediatizadores
Matriz de antecedentes
Conceptual
Tabla que es ordenada por temas, categorías, conceptos o variables que representa resultados y muestra los principales temas, categorías, conceptos y/o variables que incidieron en ellos (por ejemplo, columnas: antecedentes, filas: consecuentes). Puede ser también un diagrama
El lector debe observar que en algunos elementos de las tablas previas se usa el término variable, recordando que después del análisis pueden producirse variables cualitativas o cuantificadas (categóricas).
COMPLEMENTO A LAS TÉCNICAS SUGERIDAS PARA DESCUBRIR CATEGORÍAS En la obra impresa se comentaron algunas técnicas para generar categorías. Por su parte, Ryan y Bernard (2003, p. 102) sugieren un árbol o proceso para decidir qué técnicas podemos utilizar para descubrir categorías y temas (ver la figura 13.3).4
RECOMENDACIONES ADICIONALES PARA EL ANÁLISIS CUALITATIVO A continuación se presentan algunos conceptos y recomendaciones básicas para quien se inicia en el análisis cualitativo. Para nombrar a las categorías se aconseja utilizar las palabras que más las representen, prefiriendo que las etiquetas sean cortas pero indicativas. No olvidar el lenguaje natural de los participantes para formar los códigos y nombrar categorías. Con el fin de vincular categorías debemos encontrar en los segmentos o unidades de análisis que las ilustran frases que las conecten. La literatura juega un rol importante en el análisis. Debemos comparar nuestra lista de códigos con los códigos (categorías) obtenidos en estudios previos similares, no porque sea necesario llegar a las mismas categorías, pues cada muestra o grupo de participantes es distinto, sino para ayudarnos a nombrarlas y vincularlas. •
• •
•
4 Ver páginas 436-441 de la 6a. edición de Metodología de la investigación.
17
18
Capítulo 13 Profundización de temáticas de la investigación cualitativa
Figura 13.3 Árbol de decisiones sobre la selección de técnicas sugeridas para descubrir categorías. ¿Datos en texto? No
Sí
¿Datos litera les? (transcripciones)
¿Narrativas abunda ntes y ricas en contenido?
Técnicas más sencillas Repeticiones Similitudes y diferencias Cortar y clasificar Transiciones Técnicas más complejas Datos perdidos Material vinculado a la teoría Tipologías locales Metáforas y analogías Conectores lingüísticos Listas de palabras y PCC Coocurrencia de palabras
•
Repeticiones Similitudes y diferencias Cortar y clasificar
No (ejempl o : notas de campo)
Sí
Sí
Técnicas más sencillas
Técnicas más sencillas Repeticiones Similitudes y diferencias Cortar y clasificar
No
¿Descripcio
nes breves?
Sí
Técnicas más complejas Datos perdidos Material vinculado a la teoría Metacodificación
(1-2 párrafos) No
Técnicas más sencillas
Técnicas más sencillas
Repeticiones Similitudes y diferencias Cortar y clasificar Técnicas más complejas
Repeticiones Similitudes y diferencias Cortar y clasificar Técnicas más complejas Listas de palabras y PCC Coocurrencia de palabras
Tipologías Metáforas locales Datos perdidos Material vinculado a la teoría Listas de palabras y PCC Coocurrencia de palabras Metacodificación
Para el análisis se debe agrupar el material que pertenezca a una categoría (unidades, anotaciones, fotografías, dibujos, etc.). Por ejemplo: Violencia verbal: Unidad 1 que cae en la categoría. Unidad 2. Unidad 3. Unidad 4. Unidad k. Anotación 1 del investigador. Anotación 2. Audio 1, etc. Violencia física: Unidad 1 que cae en la categoría.
Metodología de la investigación
Unidad 2. Unidad 3. Unidad 4. Unidad k. Anotación 3 del investigador. Anotación 4. Fotografía 1 de las consecuencias de la violencia hacia una víctima (de hematomas, por ejemplo). Video 1, etcétera. •
•
•
•
•
•
El proceso anterior similar a juntar evidencia unahomicida/evidencia investigación sobredel un lugar crimen. Se agrupan las categorías que lesescorresponde (evidencia del en arma preciso dondeen se cometió el crimen/evidencia del móvil o razones del crimen/evidencia de los testigos, etcétera). Es recomendable utilizar el proceso de codificación no solo para construir las categorías y temas, sino también para generar una descripción del ambiente y los participantes. Esta descripción involucra una representación y visualización detallada de información sobre objetos, personas, lugares o eventos del ambiente. Los investigadores pueden producir códigos para ello. El análisis resulta útil a fin de elaborar “retratos del contexto” en estudios de caso, etnografías y estudios narrativos. Luego, se puede usar la codificación para generar determinadas categorías, sumamente vinculadas con el planteamiento del problema, las cuales aparecerán como los descubrimientos más importantes de la investigación y se pueden utilizar como los encabezados de los apartados en la sección o capítulo de resultados. Cada uno debe mostrar diversas perspectivas de los participantes y respaldarse mediante la presentación de unidades o citas representativas y evidencia específica. Debemos tener presente que más allá de identificar categorías y temas durante la codificación, es posible construir diferentes niveles de análisis. Por ejemplo, vincular los temas en una historia o una secuencia narrativa o desarrollar un modelo (teoría fundamentada). Asimismo, se deben analizar categorías de cada individuo o caso y entre casos (como en los estudios de caso) o pueden estructurarse ode integrarse una descripción general como las investigaciones Antes elaborar en el reporte final, recordemos que esenimportante prefigurarfenomenológicas. cómo se representarán en la narrativa la descripción y las categorías. Una aproximación frecuente es utilizar un pasaje narrativo para comunicar los resultados, el cual puede ser una discusión que menciona la cronología de eventos, una discusión detallada de categorías (con subcategorías, ilustraciones específicas, múltiples perspectivas de los participantes y citas o pasajes) y/o una discusión del vínculo entre las categorías o temas, con uso de figuras, tablas, modelos, etc. (como elementos adjuntos a la discusión). También se puede presentar un modelo, una descripción de los lugares investigados que forman parte del ambiente e información descriptiva de cada caso o participante, incluso integrada en una tabla. Para presentar los resultados es muy conveniente incluir de cada categoría: 1) nombre o código, 2) descripción y significado para los participantes o fuentes primarias (cómo la definen), 3) ilustradores (ejemplos de unidades, citas o segmentos), 4) términos o palabras descriptoras, 5) dimensiones cuantitativas (frecuencia, ubicación en algún continuo, por ejemplo, positiva, neutral y negativa), 6) interpretación del investigador (definición e implicaciones para el planteamiento) e, idealmente, 7) evidencia de otro tipo que la soporte (documento, artefacto, imagen). El paso final del análisis involucra interpretar el significado de los datos. Creswell (2009) sugiere preguntar qué lecciones se aprendieron. Estas pueden constituir la interpretación personal del investigador desde su perspectiva cultural e histórica, así como su experiencia. También puede tratarse del significado derivado de comparar los resultados con la información extraída de la literatura o de teorías. De esta forma, es factible señalar si los resultados o descubrimientos confirman o no la información previa (marco teórico). Asimismo, se pueden sugerir nuevas preguntas para responder en futuros estudios, las cuales emergieron durante la investigación y no habían sido planteadas al inicio. Además, se pueden proponer acciones y reformas para solventar una o varias problemáticas.
19
20
Capítulo 13 Profundización de temáticas de la investigación cualitativa
•
•
Con la finalidad de redactar los resultados es importante utilizar citas o segmentos tanto cortos como largos e intercalar citas de los participantes con interpretaciones del investigador. Los estudios cualitativos de caso y etnográficos comúnmente contienen: a) una descripción de los ambientes en los que viven los participantes y b) categorías y temas emergentes. Los estudios fenomenológicos incluyen: a) una descripción del fenómeno estudiado, b) frases u oraciones que lo representan e ilustran y c) unidades sobre ellos con un significado profundo generadas por los participantes. Por lo general, las investigaciones narrativas muestran historias contadas por los participantes (algunas, vueltas a narrar por el investigador, encadenadas entre sí),que incluyen el contexto, la trama, actividades, clímax y desenlace.
EXIGENCIAS MÍNIMA S EN UN ESTUDIO CUALITATIVO Varios alumnos y profesores piensan que “a veces pareciera que el rigor en una investigación cualitativa es algo muy complicado”. Por ello, es necesario señalar cuáles serían las exigencias mínimas. Esta sección intenta responder a tal inquietud e incluimos lo que diversos autores clásicos en materia de indagación cualitativa han señalado y con lo cual coincidimos. Tres elementos resultan claves para lograr dicho rigor: confiabilidad, validez y transferencia, los cuales se muestran en la tabla 13.7, en relación a su contraparte cuantitativa para tener un punto de referencia. Tabla 13.7 Elemento básicos del rigor en estudios cuantitativos y cualitativos. Rigorcuantitativo
Rigorcualitativo
Confiabilidad: examinar la consistencia o estabilidad de las mediciones entre sí (por ejemplo, respuestas a una escala, que sean congruentes entre ellas, valores correlacionados) Validez: verificar que las mediciones se refieran a lo mismo (midan las mismas cuestiones o dimensiones del fenómeno o variable de interés)
Confiabilidad: consistencia de los resultados entre diferentes fuentes e investigadores
Generalización: validez externa a otros contextos, personas o muestras, particularmente a la población
desean expresar Transferencia: aplicación de los resultados a otros contextos, muestras o personas
Validez: exactitud de los resultados y descubrimientos empleando ciertos procedimientos. Por exactitud se implica que capturemos realmente lo que los participantes
En los estudios cualitativos la validación se realiza durante todo el análisis. Primero, cuando se verifica la exactitud de los datos, la cual se confirma a través de diversas fuentes. El investigador debe documentar sus procedimientos de recolección y análisis de datos, paso a paso, entre los cuales se destacan: Revisar las transcripciones para asegurar que no haya errores de captura o falte información. Evaluar las definiciones de los códigos para evitar que exista duplicidad, confusión e incongruencias entre ellas, ni que se presenten desviaciones de las definiciones srcinales. Organizar reuniones periódicas entre los investigadores que codifican para unificar criterios de análisis. Cruzar codificaciones entre investigadores, a fin de verificar que los criterios de análisis son similares y los resultados son equivalentes cuando el mismo material es codificado por varios analistas de manera independiente. Incluso, Creswell (2009) sugiere aplicar técnicas estadísticas de confiabilidad entre codificadores (ver análisis de contenido en el capítulo 7 de este centro de recursos en línea). Suele aceptarse un mínimo de 80% de acuerdo (Creswell, 2009; Miles y Huberman, 1994). La credibilidad o autenticidad implica determinar el grado en que se puede confiar que los resultados reflejan los significados que pretenden comunicar tanto los participantes como el investigador. Este objetivo se alcanza mediante ciertas acciones como las siguientes: Triangular diferentes fuentes de información para examinar la evidencia proveniente de estas. Por ejemplo, verificar que las categorías hayan sido establecidas a través de distintas fuentes (participantes, documentos, hechos, etcétera). • •
•
•
•
Metodología de la investigación
•
•
•
Describir con amplitud y de manera detallada el ambiente, los participantes y los resultados, de tal forma que el lector o usuario revise los descubrimientos en el contexto en que se recolectó y analizó la información. Clarificar los sesgos que puede introducir el investigador (su papel en el estudio, sus sentimientos sobre el fenómeno analizado, cómo puede haber influido en sus interpretaciones su género, cultura, historia y estatus socioeconómico). Es conveniente que el investigador comente en el reporte estas cuestiones. Presentar evidencia confirmatoria y discrepante sobre las categorías, así como diversas perspectivas sobre ellas y sus vínculos, ya que en la vida real siempre hay diversidad entre los puntos de vista de los individuos. Es necesario presentar y discutir evidencia favorable y desfavorable (realismo).
•
Efectuar estancias prolongadas en el contexto, ambiente o campo, con el propósito de desarrollar un entendimiento profundo del fenómeno bajo estudio. Genera credibilidad a las narrativas. Entre más contacto y experiencias se tengan con los participantes, los descubrimientos serán más auténticos (Creswell, 2013b). Utilizar auditoría de pares y externa a fin de fortalecer la fiabilidad y validez general. Al menos debe existir un revisor externo que pregunte sobre todo el proceso, revise la codificación y el análisis completo. El valor de la investigación cualitativa se centra en la profundidad de las descripciones y las categorías desarrolladas en un contexto específico, más que en la generalización. Esta puede alcanzarse y conducirnos a una teoría más general mediante varios estudios y múltiples casos (Creswell, 2013a; Yin, 2009). •
AMPLIACIÓN DEL ANÁLISIS DE NARRATIVAS En el capítulo 15 del texto impreso (“Diseños del proceso de investigación cualitativa”) se presentaron los diseños narrativos. Allí puntualizamos que se fundamentan en el análisis de narrativas para construir una historia común. En este apartado ampliaremos el análisis y desarrollo de narrativas individuales, que puede aplicarse no solo a tales diseños sino a otras aproximaciones cualitativas. Recordemos que la secuencia es: recolección de las narrativas o historias de los participantes o personajes → su análisis por parte del investigador → volver a narrarlas o reconstruirlas → ensamblarlas en una narrativa general o común. Para realizar un análisis narrativo confiable, lo primero es interpretar cada pieza de evidencia individualmente (identificar la historia “contada” en cada objeto, grabación, entrevista, evento observado o sesión: el tipo de historia, su dirección, su vínculo con el planteamiento del problema, si es coherente o tiene contradicciones, qué temas básicos y cuestiones más específicas trata), con el fin de descubrir categorías y la esencia temática. 5 En entrevistas y documentos, algunos participantes pueden narrar historias que parecen sumamente ensayadas, casi “perfectas”; en otras ocasiones, pueden tratar de describir acontecimientos y experiencias que nunca habían contado y por ello parecen desarticuladas. El reto es separar los segmentos que realmente poseen significado y se encuentran vinculados al planteamiento del problema, de aquellos no relevantes ni relacionados con este, así como identificar las categorías pertinentes. A veces es difícil pues algunas personas narran sin seguir una secuencia cronológica, mezclan ideas y tiempos. Una manera de ayudarnos en esta tarea es identificar las ideas o temas centrales y las escenas o pasajes de las narrativas en que se desarrolla una trama. Además, en entrevistas, solicitarles a los participantes que nos indiquen la secuencia temporal (qué fue primero y qué después) y buscar tal secuencia en materiales o documentos. Fraser (2004) sugiere hacerse las siguientes preguntas que auxilian al investigador a interpretar cada pieza evidencia y construir la historia (narrativa): ¿cuáles oson los temas y recurrentes ende cada transcripción, imagen, objeto,individual grabación?, ¿qué conceptos palabras soncentrales las más repetitivas?, ¿qué significados tienen estos conceptos o palabras? Además, en entrevistas: ¿es congruente lo que se dice con los gestos no verbales? (y si surgen contradicciones, ¿cuáles son y cómo se interpretan?), ¿se presentan 5 Debemos recordar que las historias de vida cuando se obtienen por entrevista, son narradas en primera persona.
21
22
Capítulo 13 Profundización de temáticas de la investigación cualitativa
silencios, pausas y “lagunas” marcadas y prolongadas? (si es así, ¿qué sugieren? Por ejemplo, desacuerdo, aburrimiento, angustia) y, ¿cómo pueden separarse o desagregarse las historias, pasajes y segmentos? Por otro lado, resulta importante analizar las narrativas en sus contextos sociales e incluir categorías como la condición socioeconómica de los participantes, su ocupación y otras variables demográficas que puedan ayudar a responder al planteamiento del problema, así como examinar las consideraciones históricas (por ejemplo, el momento en que se recolectan los datos). Es indudable que resulta muy diferente un estudio sobre la violencia doméstica en Irán que en España, Japón o cualquier nación latinoamericana; lo mismo sucede con una investigación que recolecta datos de abuso sexual infantil en el presente con una hecha ahora pero referida a experiencias de tres décadas atrás (una indagación actual con participantes que tienen entre 35 y 45 años, pero que se analizan sus experiencias del pasado remoto). Las normas culturales han cambiado. También resulta fundamental señalar los criterios de inclusión de las narrativas, los cuales deben estar vinculados con el planteamiento. Por ejemplo, , cuando analiza historias extraídas de entrevistas hechas a mujeres que habían sido objeto de violencia en relaciones interpersonales, Fraser (2003) eligió narrativas que ilustraran cómo las mujeres violentadas interactuaban en episodios en los cuales sentían amor romántico; demostraran cómo las convenciones sexuales fueron reproducidas y/o transgredidas; subrayaran algunas de las conexiones entre el amor y el abuso; y ejemplificaran los discursos feministas asociados con las mujeres, el amor y la sexualidad. Identificar los dominios o aspectos de cada narrativa resulta útil para analizar el tipo de experiencia detrás de esta. Es decir, si se trata de una narrativa intrapersonal (interna, por ejemplo: sentimientos y emociones), o interpersonal (que involucra relaciones con otras personas) o cultural (referida a amplios grupos sociales, por ejemplo, un objeto nos puede indicar que se trata de determinada época o una entrevista puede mostrar que se hace mención de determinada convención social o grupo —por ejemplo, los hinchas de un equipo de fútbol, los miembros de una fraternidad—). El tipo de experiencia debe estar vinculado al planteamiento. Para analizar una narrativa, McCormack (2000a) sugiere: 1. Que el investigador se sumerja en la narrativa, leyéndola completa en voz alta (escuchar activamente).
2.
3.
Con tal finalidad podemos cuestionarnos: ¿quiénesproductor son los personajes? (enetc.), especial, quién el participante, ya sea el entrevistado, narrador, escritor, del material, ¿cuáles soneslos principales acontecimientos?, ¿dónde y cuándo ocurrieron? Además, en narrativas producto de entrevistas: en mi rol de investigador y entrevistador, ¿cómo estoy situado en relación con el participante? y ¿cómo ambos respondemos intelectual y emocionalmente? Identificar los procesos narrativos y el tipo de lenguaje utilizado. Es importante detectar los diferentes procesos narrativos que emplea el participante: historias, descripción, argumentación, énfasis y teorización. Ello comienza ubicando las historias, las cuales poseen límites reconocibles como el principio y final, y dentro de estos, podemos encontrar una serie de acciones o eventos (la trama), que a su vez responde a la pregunta: entonces, ¿qué sucedió? Todos estos elementos reunidos proporcionan a la narrativa un propósito y una coherencia que puede ser identificada. Despues, el investigador detecta los aspectos de cada historia que constituyen la base para la interpretación: el resumen, la evaluación (cuál es el propósito de la narrativa, los puntos más importantes de ella), la orientación (quiénes, qué, dónde, cuándo), la serie de sucesos (lo ocurrido) y el final de la historia (cierre). El resumen y la evaluación son útiles para responder otra importante pregunta: ¿por qué la historia fue contada? La respuesta puede constituir el título de ella. En cuanto al lenguaje, resulta necesario analizar sus características: lo que se dice, cómo se dice y lo que “no se dice”. Lo incluye: palabras o frases indican b) la palabras relación odel participante planteamiento delprimero problema (por ejea) mplo: “rechazo eso”,que la guerra), expresiones que con utili-el za con mayor frecuencia, c) términos o frases que asumen visiones comunes (“como usted sabe”, “estaremos de acuerdo”…), d) expresiones dereflexión (¡uy!, ¡uhm!), e) palabras y expresiones típicas del grupo al que pertenece el participante o autor (incluyendo términos especializados) y f) palabras y expresiones que hablan del participante o autor (para referirse a sí mismo), sus relaciones y el contexto.
Metodología de la investigación
4.
5.
6.
a) b)
c) d)
e) f)
Lo segundo (cómo se dice) abarca: a) uso de voz activa/pasiva, b) las funciones del discurso o narrativa (preguntas, peticiones, demandas, declaraciones, exclamaciones), c) los pasajes donde se usan los pronombres personales (yo, tú, nosotros), particularmente en relación a las preguntas y el planteamiento del estudio; d) la manera en que se presenta el participante sobre lo dicho y e) el uso de repeticiones, metáforas, símiles, analogías y otros tipos de imágenes. Respecto a lo “que no se dice”, debemos cuestionarnos las razones de ello. Reconocer el contexto en que se relató. Para ello, se recomienda preguntar respecto a la narrativa: ¿cuál es el contexto?, ¿qué elementos del contexto toma en cuenta el participante para construir la narrativa?, ¿qué influencias atribuye al contexto?, ¿qué me demuestran las reacciones del participante respecto del contexto? Evaluar el estado del participante (relajado, tenso, deprimido, contento, eufórico, honesto, etc.). Algunas preguntas que pueden hacerse para clarificar este punto son: ¿qué me indica la narrativa del participante sobre su estado y condición? En textos solo pueden interpretarse los escritos, pero en entrevistas individuales o grupales, así como en grabaciones, es posible ayudarse a interpretar a través de preguntas como: ¿cuáles son las reacciones verbales y no verbales del participante? (¿qué puedo aprender de ello?), ¿cómo son respondidas las preguntas? (¿de manera breve o con respuestas largas?, ¿de forma sencilla o compleja?, ¿tarda o no en dar sus respuestas?, ¿responde con preguntas o hace preguntas y de qué tipo?, ¿cómo es la interacción?, ¿interrumpe, con qué frecuencia?, ¿hay preguntas que no contesta?; y además las “razones” de cada cuestionamiento). Identificar los pasajes donde ocurre algo inesperado o cambios en la narración. McCormack (2000a) también les denomina “momentos”, los cuales pueden estar indicados por palabras claves o frases, descripciones de eventos o historias u otras formas de discurso. En entrevistas, a veces son recuerdos vueltos a contar y en otras ocasiones se producen espontáneamente durante la conversación. Algunos, aunque no todos, pueden ser momentos “radicales”, como enojarse severamente, gritar o cambios abruptos en la conversación. Otros son más comunes. Pueden resultar inesperados (de sorpresa, de extrañeza, completamente desconcertantes) o reflejar estados de ánimo (alegría, serenidad o tristeza) o una actitud crítica. Hay momentos de reflexión personal, contradictorios o de confusión e incertidumbre. De cada uno debe analizarse su significado. Asimismo, para desarrollar narrativas o historias individuales, McCormack (2000b) recomienda: Resumir las ideas. Construir una historia interpretativa de la narrativa según el planteamiento del problema (se deben tomar en cuenta los elementos del análisis: resultado de la inmersión en la narrativa, procesos y lenguaje, contexto, estado del participante y pasajes donde hay cambios). Tal como se ha mencionado, normalmente la historia sigue una secuencia casi siempre cronológica. Algunos autores elaboran primero un índice con títulos para las partes principales de la narrativa y luego construyen la trama. Asimismo, no olvidar incluir las pausas, silencios y gestos. Presentar la historia al participante y revisarla de manera conjunta (desde luego, esto solo cuando este se encuentre disponible y acepte). Interpretar las reacciones del participante ante la historia y reflexionar. Para auxiliarnos en esta tarea, McCormack (2000b) sugiere que podemos hacer preguntas como: ¿tiene una historia alternativa o la historia presentada refleja lo que usted quiso señalar o pensaba?, ¿esta historia tiene sentido para usted?, ¿cómo se compara la historia con su experiencia?, ¿se han omitido algunos aspectos de su experiencia? (¿cuáles?, ¿en qué parte de la historia se deben incluir?), ¿qué preguntas y respuestas faltan para queasegurarse la historia sobre reflejelamás su punto de vista?,y¿qué se puede agregar? En esta investigador debe certeza, honestidad claridad del participante (quefase se el encuentre “seguro” de sus respuestas e historia). Modificar la historia o realizar los cambios necesarios para reflejar la perspectiva del participante. Asegurarse de distinguir la historia (hechos narrados) de las interpretaciones del participante y del investigador (diferenciar cuándo se presenta cada una). Por ejemplo: “la historia es…”, “después de leer la historia el participante consideró que esto significa…”, “mi opinión es…”, “la teorización que
23
24
Capítulo 13 Profundización de temáticas de la investigación cualitativa
puede obtenerse es…” Junto con el participante, titular la historia. Elaborar la versión final para reunirla con otras narrativas. Una vez analizada cada narrativa o pieza de evidencia, debemos encontrar cuestiones en común y diferencias entre las diversas narrativas y/o piezas de evidencia. Se debe comparar el contenido, estilo y tono de las narrativas y detectarse las categorías y temas recurrentes. Por ejemplo, Fraser (2003) descubrió que muchas de las mujeres objeto de violencia mostraban una “risa nerviosa” al expresar su rechazo y molestia hacia los abusadores. Pero cuando preguntó sobre la vergüenza, la culpa y el impacto, hubo notables diferencias entre las participantes. En esta labor comparativa de las narrativas, debemos analizar la forma en que las historias se alinean con nuestro planteamiento y comenzar a establecer hipótesis. Las narrativas pueden llevarnos a conclusiones lógicas y consistentes con otros estudios, pero es posible que también generen resultados sorprendentes y que se aplican solo a cierto contexto (Fraser, 2004; Worthington, 1996). Fraser (2004) recomienda las siguientes preguntas que nos pueden ayudar en la tarea de contrastar narrativas: ¿cuáles son las categorías, temas y patrones que emergen a través de las distintas narrativas?, ¿cómo se revelan tales categorías, temas y/o patrones comunes?, ¿qué secuencias poseen las narrativas y si siguen o no una misma cronología?, ¿qué temas se evitan y por qué?, ¿las diferentes historias comienzan, se desarrollan y concluyen del mismo modo o hay diferencias? (¿cuáles?) y ¿las categorías emergentes son las que se podrían esperar? Después de comparar las narrativas y extraer los elementos en común, se ensamblan o entretejen entre sí para llegar a la historia o narrativa conjunta (Creswell, 2013b). La construcción narrativa es interpretativa (Coulter, 2009). Resulta importante tener en mente que lo que realmente hacemos en esta etapa es integrar diversos lenguajes (orales, visuales, escritos) en un lenguaje escrito. Asimismo, que existen múltiples posibilidades para representar historias. Por ello, la validación con participantes es fundamental, tanto de sus narrativas individuales como de la narrativa general. El proceso de ensamblado de narrativas se comentó y representó en la página 489 del capítulo 15 del libro. g) h)
COMPLEMENTO DE LOS DISEÑOS ETNOGRÁFICOS En el texto impreso se hizo la siguiente promesa: “Otra clasificación de los diseños etnográficos la podrá encontrar el lector en el capítulo 13, Profundización en temáticas de la investigación cualitativa”. Joyceen Boyle (en Álvarez-Gayou, 2003), nos proporciona una tipología de los diseños etnográficos, la cual se basa en el tipo de unidad social estudiada: Etnografías procesales: describen ciertos elementos de los procesos sociales, los cuales pueden ser analizados funcionalmente, si se explica cómo ciertas partes de la cultura o de los sistemas sociales se interrelacionan en determinado tiempo. Asimismo, utilizan el análisis diacrónico cuando se pretende explicar la ocurrencia de sucesos o procesos actuales como resultado de hechos históricos. Etnografía holística o clásica: abarca grupos amplios. Se considera toda la cultura del grupo, y por lo general se obtienen grandes volúmenes de datos, por lo que se presentan en libros. Por ejemplo, Tzintzuntzan, de Foster (1987), que analiza este pueblo “mágico” de Michoacán. Etnografía particularista: es la aplicación de la metodología holística a grupos particulares o a una unidad social. Ejemplo de esta clase de estudios son el Erving Goffman (1961), quien realizó trabajo de campo con pacientes de hospitales psiquiátricos; y el de Janice Morse (1999), investigadora que •
•
•
•
•
analizó las estrategias de confortación por parte de libro). enfermeras al tratar con pacientes que arriban a la sala de urgencias en estado crítico (tratado en este Etnografía de “corte transversal”: se realizan estudios en un momento determinado de los grupos que se investigan y no procesos interaccionales o procesos a través del tiempo. Etnografía etnohistórica: implica el recuento de la realidad cultural actual como producto de sucesos históricos del pasado. Un ejemplo de este tipo de estudio es el de Villarruel y Ortiz de Montellano
Metodología de la investigación
(1992), en el que se exploran las creencias relacionadas con la experiencia del dolor en la antigua Mesoamérica (Álvarez-Gayou, 2003, p. 78). Asimismo, para agregar más ejemplos de estudios etnográficos a la tabla 15.6 del capítulo 15 de la obra impresa (p. 487), incluimos dos en la tabla 13.8. Tabla 13.8 Ejemplos adicionales de investigación etnográficas. Referencia Pruitt-Mentle (2005) Ruhleder (2000)
Esenciadelainvestigación El estudio consideró el significado que la tecnología educativa tiene en la vida de jóvenes inmigrantes centroamericanos que viven en Estados Unidos El autor analizó un programa de maestría en línea en bibliotecología y ciencias de la información ofrecida por la Universidad de Illinois (evaluó el aprendizaje mediante internet y las formas de interacción entre los usuarios)
COMPLEMENTO DE LOS DISEÑOS DE TEORÍA FUNDAMENTADA En el mismo capítulo 15 se indicó que algunas cuestiones relativas a la teoría fundamentada serían profundizadas en el centro de recursos en línea. Ahora retomaremos el tema, asumiendo que se leyó dicho capítulo. Las directrices analíticas que componen la teoría fundamentada (TF) son sus principios, que incluyen: (a) método comparativo constante, (b) codificación teórica, (c) muestreo teórico, (d) saturación teórica y (e) sensibilidad teórica. Desde una perspectiva epistemológica, es la naturaleza de estos principios y la interacción entre ellos lo que permite el desarrollo de la teoría. Estas cualidades hacen de la teoría fundamentada un método único. Actualmente no hay un solo procedimiento para implementar la teoría fundamentada. Como señala Charmaz (2008), se trata de una “constelación de métodos” más que de un enfoque unitario, pero algunos procedimientos distinguen a la mayoría de los estudios que la mencionan como diseño base de la investigación: 1. Por lo general, el muestreo que se utiliza es secuencial: primero, selectivo (se eligen casos apropiados de acuerdo al planteamiento) y después es teórico (en el momento que comienzan a emerger las categorías). Es el investigador quien decide cuándo cambia de un muestreo a otro (Draucker, Martsolf, Ross y Rusk, 2007). 2. Se requiere determinar una unidad de análisis de los datos recolectados. Las unidades de análisis son indicadores empíricos de ellos (se obtienen de acciones y eventos observados o grabados, textos escritos en documentos, transcripciones, etcétera). 3. Las unidades se comparan para detectar similitudes y diferencias, y el investigador identifica las uniformidades subyacentes (comparación constante) (O’Reilly, Paper y Marx, 2012; Milliken, 2010). Cada vez que se encuentra una uniformidad o cuestión similar entre unidades, se produce un concepto o categoría, a la cual se le asigna un código. Desde luego, las categorías deben estar vinculadas con el planteamiento del problema (que se refieran a las preguntas de investigación). Recordemos que esta es la codificación abierta. 4. Las categorías o conceptos se comparan nuevamente con los datos (unidades o indicadores) para perfeccionar su definición y describir sus propiedades (O’Reilly et al., 2012; Glaser y Strauss, 1967). 5. Se identifica la categoría o concepto central. 6. A partir de la categoría central se vinculan las demás categorías o conceptos en hipótesis emergentes. 7. Se relacionan las hipótesis y/o todas las categorías y se produce la teoría (fundamentada en los datos empíricos). 8. El muestreo y la recolección de los datos concluyen cuando se alcanza la saturación teórica (O’Reilly et al., 2012). 9. A medida que se generan categorías y se agrupan en temas y el proceso empieza a clarificarse, se comienzan a interrelacionar las categorías y ordenarse en torno a la categoría central, según su papel: causas, condiciones contextuales e intervinientes, consecuencias y estrategias. Finalmente, se genera
25
26
Capítulo 13 Profundización de temáticas de la investigación cualitativa
un modelo visual (un “retrato” del planteamiento o fenómeno estudiado), así como hipótesis y una discusión que vincula las categorías en el modelo (narrativa general). Además de los criterios ya señalados sobre la calidad y rigor de la investigación cualitativa, Milliken (2010) sugiere los siguientes para el caso de los diseños de teoría fundamentada: 1. Correspondencia o ajuste: las categorías deben generarse a partir de los datos, en lugar de “forzar” los datos para que embonen o se ajusten a categorías predeterminadas. El investigador debe demostrar cuál es su srcen en los datos. Este objetivo se logra mediante la documentación e ilustración de cada categoría con citas o unidades. 2. Entendimiento: la teoría debe explicar qué ocurrió con el planteamiento del problema o fenómeno
3. 4.
5.
6.
estudiado en suentrevistas, contexto yetc.) cómo variar.laEste objetivo se consigue agregando datosdesde (casos, observaciones, y/opuede mostrando teoría a los participantes para verificar su perspectiva con qué precisión representa y explica el fenómeno o planteamiento (verificación con miembros). Trascendencia: este principio, vinculado con el anterior, se refiere al grado en que la teoría producida es relevante y central para el planteamiento (es útil para explicar lo medular del fenómeno). Adaptación: después de que el estudio se concluyó y la teoría es aplicada es importante que tengan capacidad para modificarse. No se puede esperar que una teoría fundamentada explique completamente circunstancias cambiantes (otros contextos o en el futuro). A través del tiempo, pueden descubrirse nuevas condiciones y variaciones relacionadas con la teoría, pero si esta es sólida puede extenderse y calificar apropiadamente para dar cabida a nuevos datos y variantes. Asimismo, se agregarían otros: Sensibilidad teórica (O’Reilly et al., 2012): es la habilidad demostrada por parte del investigador para otorgar significado a los datos, así como la capacidad de reconocer datos que son pertinentes para la teoría emergente y desechar los que no lo son, lo cual se facilita con una adecuada revisión de la literatura y un estudio detallado del contexto, pero también con la mente abierta. Claridad: la teoría tiene que representar las experiencias de los participantes. Ellos deben reconocerla como reflejo de sus vivencias, emociones, vivido circunstancias similares deben poderpercepciones, identificarla. etc. También, otros participantes que han
Cuando se presenta una teoría fundamentada, esta debe poder resumirse brevemente. Presentamos dos ejemplos de ello. O’Reilly et al. (2012) presentaron un estudio para entender los procedimientos que podrían utilizar las empresas para mejorar los vínculos con organizaciones clientes, el cual se basó en las experiencias profesionales de los participantes y la administración cimentada en la relación con los clientes (en inglés customer relationship management o CRM). Los autores construyeron el siguiente esquema de teoría fundamentada mediante entrevistas con 18 clientes, el cual se presenta en forma de matriz en la tabla 13.9. Tabla 13.9 Esquema breve de teoría fundamentada. Categorías (con sus dimensiones entre paréntesis)
Categoría central
Déficits de conocimiento (entrenamiento, sistemas y motivación) Autoridad (control, acceso y posesión)
Servicio de la empresa
Barreras para el servicio (ubicación, procesos y procedimientos)
Por su parte, Barber (2012) presentó una teoría para integrar el aprendizaje a nivel universitario, producto del análisis de 194 entrevistas a estudiantes de pregrado. Entre otros objetivos pretendió comprender la forma en que los alumnos reúnen conocimientos y experiencias (la manera en que integran el aprendizaje). Tres tipos de tal integración surgieron de los datos: a)conexión (descubrimiento de similitudes entre ideas que por sí mismas parecían aisladas), b)aplicación (utilización de conocimiento de un contexto en otros contextos distintos) y c)síntesis (creación de nuevos conocimientos mediante la combinación de ideas).
Metodología de la investigación
COMPLEMENTO DEL EJEMPLO SOBRE NIÑOS CON DISCAPACIDAD VISUAL En el capítulo 12 de la obra impresa “El inicio del proceso cualitativo” (en ejemplos, pp. 380-381) se presentaron los objetivos y preguntas de investigación de un estudio sobre los niños con discapacidad visual (Khadka, Ryan, Margrain, y Woodhouse, 2012), pero faltó la justificación y el índice general del marco teórico, que ahora se incluye, recordando los primeros elementos del planteamiento.6 Objetivos: a) identificar las actividades educativas, sociales y de ocio, así como los temas que más les interesan a los niños y jóvenes con discapacidad visual y b) determinar si existen diferencias entre las áreas de interés entre ellos y quienes gozan por completo del sentido de la vista. Preguntas de investigación: ¿cuáles son las actividades educativas, sociales y de ocio, así como los temas que más les interesan a los niños y jóvenes con discapacidad visual? ¿Existen diferencias en las áreas de interés entre ellos y quienes gozan por completo del sentido de la vista? Justificación De acuerdo con Corn, Wall, Jose, Wilcox y Perez (2002), la discapacidad visual que se presenta a edad temprana tiene profundas implicaciones en términos de los reducidos resultados educativos, actividades recreativas (Koenig y Holbrook, 1995) y experiencias sociales (Lifshitz, Hen y Weisser, 2007) de quienes la padecen. La visión juega un papel muy importante en la educación y el aprendizaje de los niños y jóvenes. Existen estudios que reportan que 80% del aprendizaje ocurre a través de la visión (Koutantos, 2000; Koenig y Holbrook, 1995). La demanda del sentido de la vista se incrementa significativamente a medida que los niños avanzan en su nivel escolar, lo cual se debe a que aumenta el trabajo y además las piezas visuales de los libros y hojas de trabajo disminuyen de tamaño. Lo anterior significa un esfuerzo extra para los chicos con discapacidad visual que cursan algún programa escolar. Otro aspecto con el que está relacionada la discapacidad visual son las desventajas sociales que produce, como bajos niveles de socialización (Cochrane, Lamoureux, y Keeffe, 2008) y menores oportunidades para desarrollar habilidades interpersonales (Huurre y Aro, 2000). Son muchas y muy diversas las desventajas que produce la discapacidad visual, pero aún no son bien entendidas. Para apoyar de la mejor manera posible a niños y jóvenes con discapacidad visual, lo primero es comprender su propia percepción acerca de sus habilidades y aquellas actividades que ellos encuentran desafiantes. Por ello, resulta importante el desarrollo del presente proyecto de investigación. Sus “voces tienen que ser escuchadas” Índice general del marco teórico 1. Introducción 2. El sentido de la vista 3. Discapacidad visual 3.1. Problemas que se presentan ante esta discapacidad 3.1.1. Educativos 3.1.2. Recreativos 3.1.3. Sociales 4. Estudios cualitativos con niños y jóvenes que poseen discapacidad visual.
EJERCICIOS EXTRAS También en el capítulo 13 del libro escrito se prometieron ejercicios breves adicionales, que ahora incluimos. El primero con una respuesta sugerida al final.
6 Adaptado de Khadka et al. (2012). Como siempre, las referencias del ejemplo no aparecen en la bibliografía final de esta sexta edición, porque no fueron consultadas en sus fuentes srcinales.
27
28
Capítulo 13 Profundización de temáticas de la investigación cualitativa
Ejercicio 1 Una institución quiere lanzar por televisión mensajes para prevenir el uso de sustancias dañinas (estupefacientes) dirigidos a estudiantes universitarios. Los productores no saben el grado de realismo que deban contener estos mensajes ni su tono, es decir, si deben apelar al miedo, a la salud o a los problemas morales que se desencadenan en las familias. Se tiene certeza de que es necesario realizar esta campaña, pero no se tiene idea clara de la forma de estructurar los mensajes para que sean más eficaces. En resumen, para conceptualizar y poner en imágenes dichos mensajes, se requiere información previa sobre la relación participante-sustancia. ¿Qué se aconsejaría aquí? ¿Qué tipo de muestra se necesitaría para recabar dicha información? Respuesta Podría ser una muestra de casos-tipos (universitarios), pero dentro del segmento de estudiantes universitarios se debería buscar una muestra de variación máxima, con casos de diferentes características (carreras o licenciaturas, edades comprendidas entre los 17 y 24 años, ambos géneros, de universidades públicas y privadas).
Ejercicio 2 Mediante el enfoque cualitativo un investigador desea analizar los motivos que obligaron a un grupo de jóvenes (hombres y mujeres) a integrarse a una pandilla que roba automóviles como medio de supervivencia. ¿Cómo plantearía su estudio? ¿Qué unidades de análisis compondrían su muestra inicial? ¿Qué tipo de muestra cualitativa no probabilística sería adecuada para su investigación?