POBLACIÓN Y MUESTRA Una vez definido el problema a investigar, formulados los objetivos y delimitadas las variables se hace necesario determinar los elementos o individuos con quienes se va a llevar a cabo el estudio o investigación. Esta consideración nos conduce a delimitar el ámbito de la investigación definiendo una población y seleccionando seleccionando la muestra. Se define tradicionalmente la población como “el conjunto de todos los individuos (objetos, personas, eventos, etc.) en los que se desea estudiar el fenómeno. Éstos deben reunir las características de lo que es objeto de estudio” (Latorre, (Latorre, Rincón y Arnal, 2003). El individuo, individuo, en esta acepción, hace referencia a cada uno de los elementos de los que se obtiene la información. Los individuos pueden ser personas, objetos o acontecimientos. Hoy se prefiere hablar de “unidad de observación” o “elemento” para referirse al objeto sobre el cual se realiza una medición. En los estudios con poblaciones humanas, con frecuencia ocurre que la unidad de observación son los individuos.
Población y universo: El diccionario de la RAE (2001) define la población, en su acepción sociológica, como “Conjunto de los individuos o cosas sometido a una evaluación estadística mediante muestreo”. En cualquier invest investiga igació ción, n, el primer primer proble problema ma que aparec aparece, e, relac relacion ionado ado con con este este pun punto, to, es la frecue frecuente nte imposibilidad de recoger datos de todos los sujetos o elementos que interesen a la misma. Los manuales clásicos de epistemología suelen definir la población como el conjunto de todas las medidas o personas de un cierto tipo, y la hacen sinónima del concepto más antiguo de universo (Jiménez Fernández, 1983; Sierra Bravo, 1988; Gil Pascual, 2004). Otros autores distinguen entre universo y población (Fox, 1981; Marín Ibáñez, 1985; Buendía, Colás y Hernández, 1998; Latorre, Rincón y Arnal, 2003). Estos autores consideran que el investigador casi nunca, o nunca, tiene acceso a todas las posibles medidas, elementos o personas y, por tanto, utilizan el término universo para designar “esa entidad que lo incluye todo” , reservando el concepto de población a la parte del universo de la que se selecciona la muestra y sobre la l a que deseamos hacer inferencia o aplicación de las generalizaciones que obtengamos de la investigación. Entonces: “El término universo designa a todos los posibles sujetos o medidas de un cierto tipo... La parte del universo a la que el investigador tiene acceso se denomina población” . (Fox, 1981: 368)
Puede ser: Finito: cuando está constituido por el número limitado de las unidades. Infinito: cuando está formado por una cantidad ilimitada ili mitada de elemento. “Población es un conjunto definido, limitado y accesible del universo que forma el referente para la elección de la muestra. Es el grupo al que se intenta generalizar los resultados”. (Buendía, Colás y Hernández, 1998: 28)
Definir Definir la población población es una parte importante importante,, y con frecuencia frecuencia difícil, difícil, del estudio. estudio. Lohr, (1999) (1999) advierte: “Por ejemplo, en una encuesta política, ¿la población objetivo deberían ser todos los adultos que pueden votar? ¿Todos ¿Todos los votantes votantes registrados? registrados? ¿Todas ¿Todas las personas que votaron en la última última elecció elección?” n?” . En cual cualqu quie ierr caso caso,, la elec elecci ción ón de esta esta ‘pob ‘pobla laci ción ón obje objeti tivo vo’’ afec afecta tará rá
profundamente al resultado de la investigación.
La muestra: El Diccionario de la Lengua Española (RAE, 2001) define la muestra, en su segunda acepción, como “parte o porción extraída de un conjunto por métodos que permiten considerarla como representativa de él” . En el terreno epistemológico, Jiménez Fernández (1983) destaca la condición de representatividad que ha de tener la muestra: “... es una parte o subconjunto de una población normalmente seleccionada de tal modo que ponga de manifiesto las propiedades de la población. Su característica más importante es la representatividad, es decir, que sea una parte típica de la población en la o las características que son relevantes para la investigación” . Sierra Bravo (1984), hace hincapié en la generalización de resultados: “... una parte representativa de un conjunto o población debidamente elegida, que se somete a observación científica en representación del conjunto, con el propósito de obtener resultados válidos, también para el universo total investigado” . (Figura N° 1) Latorre, Rincón y Arnal (2003), ponen especial énfasis en la metodología del muestreo: “Conjunto de casos extraídos de una población, seleccionados por algún método de muestreo” . Entonces: La muestra es una parte o subconjunto de la población con la que se llevará a cabo la investigación, de acuerdo con ciertos criterios de la misma.
Figura N° 1
¡¡¡Importante!!! Las muestras tienen un fundamento matemático estadístico. Éste consiste en que obtenidos unos determinados resultados, de una muestra elegida correctamente y en proporción adecuada, se puede hacer la inferencia o generalización fundada matemáticamente de que dichos resultados son válidos para la población de la que se ha extraído la muestra, dentro de unos limites de error y probabilidad, que se pueden determinar estadísticamente en cada caso. Las muestras presentan evidentes ventajas, respecto del estudio de poblaciones. Con una muestra
relativamente reducida en relación a la población, se pueden encuestar grandes poblaciones y núcleos humanos, que de otra manera sería muy difícil o prácticamente imposible investigar. Suponen una gran economía en las encuestas y la posibilidad de mayor rapidez en su ejecución. A veces, “... una muestra puede ofrecer resultados más precisos que una encuesta total, aunque esté afectada del error que resulta de limitar el todo a una parte” . (Sierra Bravo, 1988)
Diferenciando: La selección correcta de la muestra implica crear una que represente a la población con la mayor fidelidad posible. Esto conlleva utilizar unas técnicas específicas de selección de la muestra, así como la necesidad de determinar su tamaño óptimo. En este proceso de selección hemos de distinguir entre elemento muestral , unidad de muestreo y marco de muestreo .
El elemento o individuo (muestral) es un objeto en el cual se toman las mediciones, la unidad más pequeña en que podemos descomponer la muestra. La unidad de muestreo hace referencia a la unidad donde realizamos la muestra, está constituida por grupos excluyentes de elementos de la población que completan la misma. Por ejemplo, podríamos desear estudiar a un grupo de personas (una ciudad, una barriada, un grupo de estudiantes de un determinado nivel educativo, los trabajadores de un sector de producción, etc.), pero no tenemos una lista de todos los individuos que pertenecen a la población. En su lugar las familias, los centros educativos o las empresas podrían servir como unidades de muestreo. Las unidades de observación o elementos muestrales serían los individuos que viven en una familia o que trabajan en una determinada empresa. El marco muestral esta constituido por la lista de las unidades de muestreo (familias, centros educativos, empresas, etc.)
Muestreo: Se conoce con el nombre de muestreo al proceso de extracción de una muestra a partir de la población. El proceso esencial del muestreo consiste en identificar la población que estará representada en el estudio.
Ventajas e inconvenientes: Entrer las ventajas tenemos: el ahorro de tiempo en la realización de la investigación, la reducción de costos y la posibilidad de mayor profundidad y exactitud en los resultados. Los inconvenientes más comunes suelen ser: dificultad de utilización de la técnica de muestreo, una muestra mal seleccionada o sesgada distorsiona los resultados, las limitaciones propias del tipo de muestreo y tener que extraer una muestra de poblaciones que poseen pocos individuos con la característica que hay que estudiar. (Latorre, Rincón y Arnal, 2003).
¡¡¡Importancia!!! La importancia del muestreo radica en que no es necesario trabajar con los “ N” elementos de una población para comprender con un nivel “razonable” de exactitud la naturaleza del fenómeno estudiado. Este conocimiento se puede obtener a partir de una muestra que se considere representativa de aquella población. Como bien lo define Fox: “Aunque la razón esencial por la que se muestrea es la imposibilidad de estudiar todos los sujetos, es un proceso lógico, porque en la práctica no es necesario obtener datos de todos los posibles sujetos para comprender con exactitud la naturaleza del fenómeno que se estudia, sino que, en general, se puede alcanzar esa comprensión con una parte de los sujetos. Debido a esto, se pueden aprovechar las ventajas del muestreo, que son la reducción del coste de la investigación en tiempo y en dinero... El ahorro de tiempo o dinero mediante el muestreo sólo es
lógico cuando se puede justificar el hecho de que los datos obtenidos a partir de la muestra proporcionarán una base firme para determinar con exactitud las características del fenómeno que se estudia”. (Fox, 1981)
Etapas: 1. Definición o selección del universo o especificación de los posibles sujetos o elementos de un determinado tipo; 2. Determinación de la población o parte de ella a la que el investigador tiene acceso; 3. Selección de la muestra invitada o conjunto de elementos de la población a los que se pide que participen en la investigación; 4. Muestra aceptante o parte de la muestra invitada que acepta participar; 5. Muestra productora de datos; la parte que aceptó y que realmente produce datos.
Condiciones que debe cumplir la muestra: 1. Que comprendan parte del universo y no la totalidad de éste. 2. Que su amplitud sea estadísticamente proporcionada a la magnitud del universo. Esta condición se halla en relación con el punto práctico de determinación del tamaño de la muestra y sirve para decidir si, según las unidades que comprende respecto al universo, una muestra es o no admisible. 3. La ausencia de distorsión en la elección de los elementos de la muestra. Si esta elección presenta alguna anomalía, la muestra resultará por este mismo hecho viciada. 4. Que sea representativa o reflejo fiel del universo, de tal modo que reproduzca sus características básicas en orden a la investigación. Esto quiere decir que si hay sectores diferenciados en la población que se supone ofrecen características especiales, a efectos de los objetivos de la investigación, la muestra también deberá comprenderlos y precisamente en la misma proporción, es decir, deberá estar estratificada como el universo.
Tipos o técnicas de muestreo: 1. Muestreo probabilístico; Conocido también como muestreo de selección aleatoria , utiliza el azar como instrumento de selección, pudiéndose calcular de antemano la probabilidad de que cada elemento sea incluido en la muestra. Este tipo de muestreo es el que alcanza mayor rigor científico, y se caracteriza porque se cumple el principio de la equiprobabilidad, según el cual todos los elementos de la población tienen la misma probabilidad de salir elegidos en una muestra. El muestreo probabilístico presenta varias modalidades: Muestreo aleatorio simple; es la modalidad de muestreo más conocida y que alcanza mayor rigor científico. Garantiza la equiprobabilidad de elección de cualquier elemento y la independencia de selección de cualquier otro. En este procedimiento se extraen al azar un número determinado de elementos “n” del conjunto mayor “N” o población, procediendo según la siguiente secuencia: a) Definir la población, confeccionar una lista de todos los elementos, asignándoles números consecutivos desde 1 hasta “n”. b) La unidad de base de la muestra debe ser la misma. c) Definir el tamaño de la muestra. d) Extraer al azar los elementos. La muestra quedará formada por los “n” elementos obtenidos mediante sorteo de la población. Los procedimientos más comunes de extracción de los elementos en este tipo de muestreo son: las tablas de números aleatorios, incluidas en los manuales de estadística; los clásicos sistemas de lotería y otros procedimientos de extracción al azar, incluidos las aplicaciones informáticas. Muestreo aleatorio sistemático; el empleo de muestras sistemáticas consiste en una variante del anterior tipo de muestreo. Primero se calcula “I” (frecuencia de los casos) mediante la fórmula:
I= N/n. Después se elige un número menor o igual que “I”, es decir, que cumpla la condición: 1aI. Por último se seleccionan los números en la tabla de número aleatorios, que serán: a, a+I, a+2I, a +3I, etc. Ejemplo: Si tenemos la población a estudiar, previamente inscrita en unas listas numeradas, obtenida la frecuencia de los casos iremos eligiendo saltando los números que indique la frecuencia. Si queremos obtener una muestra de 20 sobre una población de 100 (I = 100/20 = 5) , podríamos partir el muestreo del nº 5, el 10, el 15 ; o el 3, 8, 13... El primer elemento “a” suele elegirse al azar usando las tablas de probabilidad y, a continuación, se le suma la frecuencia. Si el azar hizo que se partiera de un elemento de la lista mayor que “ I”, al llegar a “N”, se vuelve al principio de la lista hasta completar “n” casos.
Cuando se trata de poblaciones numerosas, por ejemplo la guía telefónica o los censos electorales, se seleccionan el primer y/o el último nombre de cada página o columna. Aunque es un procedimiento más rudimentario, por razón de economía y tiempo suele utilizarse. La elección sistemática partiendo de listas es válida si el orden no ha sido establecido teniendo en cuenta la característica que estudiamos. No pueden servir, por ejemplo, listas en orden de calificaciones académicas si ésta es una de las variables de investigación. Este procedimiento es más rápido que el anterior, sobre todo si la población es numerosa y está previamente ordenada. Es muy utilizado en los sondeos de opinión y de “puerta a puerta”. A los entrevistadores se les indica que paren a cada ‘I’ personas o llamen a cada ‘I’ puertas. Muestreo estratificado; este muestreo se utiliza cuando la población esta constituida en estratos o conjuntos de la población homogéneos con respecto a la característica que se estudia. Dentro de cada estrato se puede aplicar el muestreo aleatorio o sistemático. Consiste en subdividir la población en subgrupos o estratos con arreglo a la(s) característica(s) que se consideren y en elegir la muestra de modo que estén representados los diferentes estratos. Para la obtención de la muestra estratificada se siguen los siguientes pasos: a) Se divide la población en estratos. b) De cada estrato se extrae una muestra por algún procedimiento de muestreo. c) El número de individuos de cada estrato se puede decidir por paridad o proporcionalidad. d) La suma de las muestras de cada estrato forman la muestra total “n”.
Dentro del muestreo estratificado suele distinguirse: Muestreo estratificado constante. En este caso, también conocido como afijación simple, la muestra se obtiene seleccionando un número igual de individuos de cada estrato en que se ha dividido la población, con independencia del tamaño y variabilidad de los mismos dentro de la población. Muestreo estratificado proporcional. En este caso se selecciona de cada estrato un número de elementos proporcional a su tamaño en el conjunto de la población ( afijación proporcional). Se considera también como criterio para fijar la proporción de la muestra a la variabilidad de los estratos en la característica que interesa ( afijación óptima). Si sus varianzas son aproximadamente homogéneas, el muestreo estratificado proporcional es el aconsejado; si por el contrario difieren mucho entre sí, debe tomarse un porcentaje mayor de elementos de los estratos que mayor varianza experimentan . Ejemplo: Para estudiar las actitudes hacia la política de los universitarios de la ULADECH podemos dividir el total de alumnos en estratos para asegurarnos que estarán representadas las características que nos interesan. Posibles estratos podrían ser facultades, carrera profesional
cursada, curso, etc. Suponiendo que se estratifica la población por carreras profesionales, si del total de alumnos matriculados en las facultades de la ULADECH seleccionamos a cincuenta de cada carrera profesional, el muestreo ha sido estratificado constante . Para esa muestra seleccionamos el mismo número, pero de forma proporcional al número de alumnos matriculados en cada titulación, estamos ante una muestra estratificada proporcional. Muestreo por conglomerado (Clusters) o grupos; el muestreo individual resulta muchas veces inaplicable y hay que recurrir no a los elementos, sino a seleccionar por el sistema del azar determinados colectivos. Podríamos hacer una encuesta, por ejemplo, mediante el sistema de muestreo aleatorio simple, a todos los alumnos de educación secundaria de una determinada ciudad. Las complicaciones y dificultades serían mucho menores estableciendo una muestra al azar que tomara como unidades base del muestreo las aulas. La muestra de grupos o racimos también se denomina conglomerados o clusters, en terminología sajona. Este tipo de muestreo se utiliza cuando los individuos de la población constituyen grupos naturales o conglomerados (distrito, centros escolares, aulas, empresas, etc.) En el muestreo por grupos el proceso sigue estos pasos: a) La población se divide previamente en grupos o conglomerados que contienen diversos elementos. b) Se seleccionan aleatoriamente el número de conglomerados y se trabaja con el total de elementos pertenecientes a los conglomerados elegidos.
La unidad muestral es el conglomerado (cluster) o grupo y el proceso de selección aleatoria se aplica a la selección de éstos y no a los elementos menores que componen el conglomerado. ¡¡¡Importante!!! Una ventaja de esta técnica de muestreo radica en que no es necesario identificar ni tener un listado de todos los elementos de la población para seleccionarlos aleatoriamente, sino que después de seleccionados los conglomerados, se procede a elaborar dicho listado sólo para los elementos que componen los conglomerados elegidos.
Figura N° 2
2. Muestreo probabilístico; en estas técnicas no se utiliza el muestreo al azar sino que la muestra se obtiene atendiendo al criterio o criterios del investigador o bien por razones de economía, comodidad, etc. Consecuentemente, estas técnicas no utilizan el criterio de equiprobabilidad, sino que siguen otros criterios, procurando que la muestra obtenida sea lo más representativa posible. Estas muestras, al no utilizar el muestreo al azar, no tienen la garantía de las muestras probabilísticas, pero en la práctica son a menudo necesarias e inevitables, en opinión de Kerlinger (1975). Dentro de este tipo de muestreo podemos distinguir: el muestreo intencional o por conveniencia y el muestreo por cuotas. Muestreo por conveniencia; en esta técnica, el investigador selecciona de modo directo los elementos de la muestra que desea participen en su estudio. Se eligen los individuos o elementos que se estima que son representativos o típicos de la población. Se sigue un criterio establecido por el experto o investigador. Se suelen seleccionar los sujetos que se estima que pueden facilitar la información necesaria.
Este método, que Jiménez Fernández (1983) califica de “deliberado”, se justifica cuando se quieren estudiar elementos excepcionales de cierta población, ya que la forma de asegurarse de que se incluirán en dicho estudio, es elegirlos intencionalmente. No dudando de su utilidad, se presta a críticas porque las muestras obtenidas resultan inevitablemente sesgadas en el sentido del criterio que se ha usado para seleccionarla. En estas muestras también denominadas “opináticas” (Latorre, Rincón y Arnal; 2003), buscamos deliberadamente los elementos de la muestra porque nos parece que pueden facilitarnos una información más válida. Si queremos datos sobre la población delincuente será interesante recurrir a los servicios policiales, a los centros penitenciarios o de rehabilitación social o a los propios reclusos, que no son naturalmente toda la población delincuente. Hay muestras intencionadas que parten de “elementos típicos” o “representativos” a los que ya públicamente se les ha reconocido tal rango. En España, en las Elecciones Generales se sabe que el escrutinio de apenas ocho decenas de mesas electorales, ya determinadas, tienen un valor extrapolable al resultado global de las citadas elecciones. Este tipo de muestras han sido ampliamente divulgado por los medios de comunicación: “En la película Magic Town, el investigador de opinión pública interpretado por James Stwart, descubrió un pueblo que tenía exactamente las mismas características que todo Estados Unidos. Grandview poseía exactamente la misma proporción de personas que votaban por los republicanos, la misma proporción de personas bajo la línea de la pobreza, igual proporción de mecánicos automotrices, etcétera, que Estados Unidos visto como un todo. El personaje de Stewart sólo tenía que entrevistar a las personas de Grandview para saber cuál era la opinión pública en la Unión Americana” . (Lohr, 1999) Muestreo por cuotas; consiste en fijar unas “cuotas” , donde cada cuota consiste en un número de elementos que reúnen unas determinadas condiciones. La selección de las “cuotas” suele hacerse mediante “rutas” o “itinerarios”. En este procedimiento se parte de una muestra estratificada cuyas proporciones debe conservar el investigador, pero cada uno de los casos queda a su arbitrio elegirlos. Ejemplo: Supongamos que queremos averiguar el nivel cultural de unos determinados profesionales de un área geográfica o de un sector productivo. Como el sexo, la edad y el lugar de residencia, parecen factores condicionantes, deberemos establecer que haya un 50% de varones y de mujeres, un tanto por ciento aproximado por grupos de edad correspondientes a la población
real y así mismo procuraremos que haya el mismo tanto por ciento en la muestra que en la realidad de quienes viven en poblaciones de menos de 2.000 habitantes, de 2.001 a 5.000 habitantes, etc. El investigador ha fijado “n” para la muestra y elige libremente los individuos hasta alcanzar esa cifra. El riesgo radica en que seleccione a personas a quienes resulta más fácil, por razones de localización. De hecho, cuando se trabaja con entrevistas, hay una resistencia a consultar a población dispersa en caseríos distantes o a la que está en pisos elevados sin ascensor. Por último, debemos señalar un riesgo muy generalizado, común al muestreo probabilístico y no probabilístico, y es el del rechazo a participar en la investigación. En este caso no hay más remedio que sustituir la población que no desea colaborar o a la que no tenemos acceso por otra de condiciones similares, pero hay que tener mucho cuidado para evitar el sesgo de la muestra, porque puede ocurrir que precisamente la población no participante tenga alguna característica por la que no desee contestar, con lo cual queda excluida de la muestra y comprensiblemente mantendrá su rechazo en los nuevos casos que los sustituyan.
Referencias Bibliográficas: 1. Canales F, Alvarado E, Pineda E. Metodología de la Investigación: Manual para el desarrollo del personal de salud. Serie PALTEX N° 35 Washinton. OPS/OMS; 2004. 2. Hernández R, Fernández C, Baptista P. Metodología de la Investigación. 4° Ed. México: McGrawHill; 2006.