Cultura Estadística para la Investigación 2014-I
GUIA TEÓRICA N°03 POBLACIÓN, MUESTRA Y MUESTREO I.
DEFINICIONES BÁSICAS: 1. Población: Denominamos población al universo o total de elementos (personas, objetos, etc.) que tienen uno o más características observables de naturaleza cualitativa o cuantitativa. Las características observables en la población definen una variable estadística cuyo valor numérico o no numérico, es precisamente denominada una observación o medición. Si la variable estadística en estudio es una sola, entonces cada elemento de la población se puede asociar con una medición. En este sentido se denomina población al conjunto de todas las observaciones posibles de la variable en estudio. Si la variable estadística estadística es de carácter cuantitativa esta viene viene a ser una variable aleatoria, donde los elementos de la población son definidos a través de un proceso aleatorio. En este caso, la distribución de la población es la distribución de la variable aleatoria. Por tanto se define que la media y la varianza de una variable aleatoria vienen a ser la media y la varianza de la población. Por lo general el tamaño de la población puede ser finita de tamaño N o infinita.
2. Parámetros: Se denomina parámetro a las medidas descriptivas definidas en una población. Los parámetros, denotados por letras griegas, vienen a ser valores numéricos que generalmente se desconocen. Media ( ) Varianza ( 2 ) Proporción ( o P) Desviación estándar ( )
1
Cultura Estadística para la Investigación 2014-I
3. Muestra aleatoria: Viene a ser un subconjunto de elementos seleccionados de la población. El objetivo es que esta sea representativa de la población. El proceso de selección de la muestra de la población se denomina muestreo. El proceso que consiste en inferir resultados de la población aplicando la información obtenida de la muestra inferencia estadística. La confiabilidad de las inferencias concernientes a una población depende si las muestras se han escogido apropiadamente de manera que represente a la población. Se utilizan diversas técnicas de muestreo para que las muestras obtenidas de una población sean representativas y confiables.
4. Muestreo: El propósito de la teoría de muestreo es hacer muestreo eficientemente, es decir es el desarrollo de métodos de selección de muestras y métodos de
estimación
de
parámetros
que
proporcionen
estimadores
lo
suficientemente precisos al menor costo. De esta forma el muestreo es definido como un proceso científico que permite describir aspectos de un grupo de objetos sobre la base de la información recolectada de un subgrupo de ellos, de modo que brinde un nivel de confiabilidad aceptable y compatible con los objetivos del estudio y con los recursos técnicos y económicos posibles.
a) Ventajas del muestreo:
Menor costo: Debido a que los datos se obtienen de una pequeña muestra fracción de la población total y por tanto los gastos incurridos serán menores que aquellos que se esperarían cuando se lleva a cabo un estudio global (Censo).
Mayor rapidez: Fundamentalmente por la menor cantidad de información que se tiene por procesar.
2
Cultura Estadística para la Investigación 2014-I
Mayor exactitud: Por la mejor capacitación del personal, la mejor supervisión del trabajo de campo y el mejor control de calidad en los resultados.
Mayor alcance: Porque su uso es factible aun en situaciones de las que requiera de personal altamente especializado para recolectar información.
b) Conceptos básicos de muestreo
Unidad de información: Es el elemento individual de la población de la que se va a recolectar los datos deseados. En el caso de encuestas por muestreo, por lo general se llena un cuestionario para cada unidad de información.
Unidad de muestreo: Viene a ser el resultante de la división de una población en estudio y que puede ser correctamente identificado durante el proceso de selección. Es decir que la unidad de muestreo es cada unidad de la población que puede ser elegida aleatoriamente para formar una muestra.
Marco de muestreo: Es la lista de todas las unidades de muestreo que conforman una población.
Población en estudio: Es la población que realmente de muestrea y es definida por el marco de muestreo que se usa.
Población objetivo: Es la población que sería deseable estudiar si se dispone de todas las facilidades financieras, técnicas y prácticas.
Error de cobertura: Se presenta cuando se tiene unidades de información omitidas en un marco de muestreo.
Error de respuesta:
3
Cultura Estadística para la Investigación 2014-I
Se presenta cuando los datos correspondientes a una unidad de información no son exactos.
c) Etapas de una encuesta por muestreo: La diferencia entre la teoría de encuestas por muestreo y la teoría de muestreo clásica es que las poblaciones investigadas por encuestas por muestreo tienen un número finito de unidad. En la práctica, esta diferencia rara vez es importante y los resultados de muestreos de poblaciones infinitas pueden ser aplicados en poblaciones finitas. Las principales etapas vienen son:
Determinación de los objetivos de la encuesta Se debe tener en cuenta los siguientes aspectos: -
Las definiciones y los conceptos a estudiar
-
El plan de tabulación requerido de la información básica
-
La coordinación permanente con el grupo de usuarios de la información resultante
Determinación de la población bajo muestreo En esta etapa se debe definir con claridad la población sobre el cual se desea hacer inferencia. Los aspectos a tener en cuenta son: -
La determinación del alcance y la cobertura del estudio sobre la base de los objetivos planteados.
-
La determinación de la población objetivo sobre la cual se hará inferencias.
-
La determinación de la población a ser muestreada.
Datos que deben ser recopilados En esta etapa se debe verificar que todo los datos que se deben obtener sean relevantes para los propósitos de la encuesta, para lo cual se debe analizar: -
El diseño del cuestionario para la encuesta
4
Cultura Estadística para la Investigación 2014-I
-
La introducción de preguntas de control y verificación.
Se debe tener en cuenta que un cuestionario demasiado largo baja la calidad de las respuestas, debido a que el error de entrevistado tiende a aumentar.
Nivel de precisión deseado Los resultados de encuestas por muestreo siempre están sujetos a cierta incertidumbre debido a que se investiga solo una parte de la población
y
a
causa
de
los
errores
de
medición.
Esta
incertidumbre puede ser reducida si se toma en cuenta: -
La coordinación con el grupo de usuarios
-
La determinación del nivel de precisión deseado para cada uno de los parámetros relevantes que se va a estimar
-
El hacer compatible el nivel de precisión deseado con los recursos disponibles
-
La recopilación de experiencias anteriores y similares con el propósito de capturar información complementaria
-
La determinación del tamaño de la muestra adecuado para alcanzar el nivel de precisión deseado
Métodos de medición En esta etapa se debe escoger el método de medición e inspección de la población, para lo cual se debe tener en cuenta lo siguiente: -
La elaboración de las instrucciones sobre el formulario con el objetivo de homogenizar la forma de captura de la información.
-
La determinación de las unidades de medida
-
El establecimiento de la mecánica de control de respuestas, para contrarrestar el efecto del entrevistador y de la persona que da la respuesta.
5
Cultura Estadística para la Investigación 2014-I
Marco de muestreo En esta parte se divide a la población en partes llamadas, unidades de muestreo, de las cuales deben cubrir la totalidad de la población y no deben sobreponerse; es decir todo elemento de la población debe pertenecer a una sola unidad de muestreo, en esta etapa se debe tener en cuenta lo siguiente: -
La definición de la unidad de muestreo
-
La identificación de la unidad informante.
-
La definición de la unidad estadística, para lo cual se recoge la información.
-
La construcción del marco de muestreo, es decir la elaboración de un directorio de todas las unidades de muestreo.
-
El control de calidad del marco (inexistencia de duplicidad u omisión).
Selección de la muestra Aspectos a considerar: -
Determinación definitiva del tamaño de la muestra
-
La determinación de la muestra de acuerdo con el método de muestreo elegido como el más adecuado para el desarrollo de la investigación y según los criterios de representatividad de la población y el costo resultante de acuerdo a los recursos.
Encuesta piloto En esta etapa: -
Se debe levantar una encuesta experimental, en pequeña escala con la finalidad de probar el instrumento, sus instrucciones y la mecánica de trabajo de campo.
-
Se debe determinar las medidas correctivas necesarias.
6
Cultura Estadística para la Investigación 2014-I
Organización del trabajo de campo En esta etapa se tiene en cuenta lo siguiente: -
Capacitación y orientación de la persona responsable del recojo de información
-
Asignación de responsabilidad funciones
-
Distribución de material de ubicación de las unidades de muestreo.
-
Plan de supervisión
-
Aplicación de mecánica de recojo de información
Resumen y análisis de información -
Realizar el consolidado del material de recolección de información
-
Realizar la codificación de la información y corregir los errores.
-
Procesar la información de campo, según el plan de tabulación.
-
Analizar la información y presentación del informe final.
d) Principales métodos de selección de muestra d.1. Muestreo Probabilístico Cuando se obtiene una muestra probabilística, uno de los puntos más importantes es el procedimiento de selección que se utiliza, ya que la forma y las características de los estimadores dependerán del procesamiento de selección. Los principales métodos de selección de una muestra de tamaño n de una población N son:
1. Muestreo aleatorio simple: Es la forma más común de obtener una muestra en la selección al azar, es decir, cada uno de los individuos de una población tiene la misma posibilidad de ser elegido. Si no se cumple este requisito, se dice que la muestra es viciada. Para tener la 7
Cultura Estadística para la Investigación 2014-I
seguridad de que la muestra aleatoria no es viciada, debe emplearse para su constitución una tabla de números aleatorios. Es el método de muestreo que asegura que cada una de las unidades de análisis tiene igual probabilidad de ser incluidos en la muestra.
Procedimiento:
Elabore el marco de muestreo.
Determine el tamaño de la muestra
Seleccione “n” números aleatorios de la tabla de números
aleatorios. Recopile la información de cada una de las unidades de
análisis seleccionadas.
Ejemplo 1: Se tiene una población de 200 personas, determinar si se trabaja con toda la población o muestra; y si se trabaja con una muestra determinar el tamaño y escoger la muestra.
2. Muestreo Aleatorio Sistemático: Es una técnica de muestreo que requiere de una selección aleatoria inicial de observaciones seguida de otra selección de observaciones obtenida usando algún sistema o regla. El método sistemático comprende a la selección aleatoria de una unidad de muestreo inicial, a partir de la cual, las restantes unidades quedan sistemáticamente seleccionadas de acuerdo al lugar que ocupa en la población.
Procedimiento:
Elabore el marco de muestreo. Determine el tamaño de la muestra
Hallar el intervalo de selección sistemática k
N n
8
Cultura Estadística para la Investigación 2014-I
Se elige un número aleatorio “i”, (1 i k) Posteriormente la muestra estará dado de la siguiente manera:
y i , y i k , y i 2k , y i 3k , y i 4k , y i 5k ,...
Ejemplo 2: Se tiene una población de 400 personas, determinar si se trabaja con toda la población o muestra; y si se trabaja con una muestra determinar el tamaño escoger la muestra por muestro aleatorio sistemático .
3. Muestreo Aleatorio Estratificado: Una muestra es estratificada cuando los elementos de la muestra son proporcionales a su presencia en la población . La presencia de un elemento en un estrato excluye su presencia en otro. Para este tipo de muestreo, se divide a la población en varios grupos o estratos con el fin de dar representatividad a los distintos factores que integran el universo de estudio. Para la selección de los elementos o unidades representantes, se utiliza el método de muestreo aleatorio. En síntesis, requiere de separar a la población según grupos llamados estratos, y de elegir después una muestra aleatoria simple en cada estrato. La información de las muestras aleatorias simples de cada estrato constituiría entonces una muestra global. El procedimiento consiste en dividir a la población en estratos. Dentro de cada estrato los elementos deben ser los más homogéneos posibles con respecto a las características de la variable en estudio.
Procedimiento:
Elabore el marco de muestreo. Determine el tamaño de la muestra “n”. Se clasifica la población en “L” estratos. El tamaño de muestra “n” lo dividimos en “L” muestras n1, n2, n3, ….., nL 9
Cultura Estadística para la Investigación 2014-I
Seleccionamos sub muestras de cada estrato.
Ejemplo 3 Para realizar un control de calidad para determinar en qué estado viene la caña se realiza un muestreo aleatorio simple, puesto que la caña puede provenir de tres tipos de proveedores.
Proveedor tipo A (estrato 1) la caña proviene de lotes de la misma finca.
Proveedor tipo B (estrato 2) la caña proviene de fincas de particulares en donde el ingenio ha prestado servicios
Proveedor tipo C (estrato 3) la caña proviene de fincas de particulares en donde el ingenio no ha tenido ningún servicio
DATOS: ESTRATO
Ni
1
560
2
190
3
250
4. Muestreo Aleatorio por Área o Conglomerado: Requiere de elegir una muestra aleatoria simple de unidades heterogéneas entre sí de la población llamadas conglomerados. Cada elemento de la población pertenece exactamente a un conglomerado, y los elementos dentro de cada conglomerado son usualmente heterogéneos o disímiles.
Ejemplo 4: En el muestreo por conglomerados, éstos se forman para representar, tan fielmente como sea posible, a toda la población; entonces se usa una muestra aleatoria simple de conglomerados para estudiarla. Los estudios de instituciones sociales como iglesias,
hospitales,
escuelas
y
prisiones
se
realizan,
generalmente, con base en el muestreo por conglomerados. 10
Cultura Estadística para la Investigación 2014-I
El procedimiento consiste en hacer una selección de grupos o conglomerados, que son agrupaciones de elementos que deben ser los más heterogéneos posibles, pero homogéneos entre sí. La muestra general está formado por todas o por una sub muestra de la unidades en cada conglomerado. A este muestreo también se le denomina Muestreo Unietápico de Conglomerados
Procedimiento:
Elabore el marco de muestreo. Determine el tamaño de la muestra “n”. Se divide el área total (población) en áreas más pequeñas (subdivisiones) Se selecciona al azar algunas de estas subdivisiones. Finalmente mediante un muestreo adecuado se selecciona el tamaño de muestra de las subdivisiones elegidas
Ejemplo 5: Para un estudio que se realiza en un AA.HH el cual está formado por 20 manzanas escoger una muestra mediante muestreo aleatorio simple.
NUMERO NUMERO NUMERO NUMERO NUMERO NUMERO NUMERO NUMERO MANZANA DE LOTE MANZANA DE LOTE MANZANA DE LOTE MANZANA DE LOTE 1 2 3 4 5
20 25 30 10 15
6 7 8 9 10
10 25 20 30 40
11 12 13 14 15
25 20 30 10 15
16 17 18 19 20
20 20 25 30 10
d.2. Muestreo no Probabilístico A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar generalizaciones (estimaciones inferenciales sobre la 11
Cultura Estadística para la Investigación 2014-I
población), pues no se tiene certeza de que la muestra extraída sea representativa, ya que no todos los sujetos de la población tienen la misma probabilidad de ser elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios procurando, en la medida de lo posible, que la muestra sea representativa.
Entre los métodos de muestreo no probabilísticos más utilizados en investigación encontramos:
1. Muestreo por cuotas: También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen conocimiento de los estratos
de
la
población
y/o
de
los
individuos
más
"representativos" o "adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél.
En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en el distrito de San Borja. Una vez determinada la cuota se eligen los primeros que se encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de opinión.
2. Muestreo intencional o de conveniencia: Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto.
12
Cultura Estadística para la Investigación 2014-I
También puede ser que el investigador seleccione directa e intencionadamente los individuos de la población. El caso más frecuente de este procedimiento es utilizar como muestra los individuos a los que se tiene fácil acceso (por ejemplo profesores de universidades
que emplean con mucha frecuencia a sus
propios alumnos).
3. Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.
4. Muestreo Discrecional · A criterio del investigador los elementos son elegidos sobre lo que él cree que pueden aportar al estudio.
II.
Fórmulas para determinar el tamaño de muestra
Para población finita cuando se quiere estimar la proporción 2
NZ P (1 − P ) n
=
( N − 1) E
2
+ Z 2 P (1 − P )
Para población finita cuando se quiere estimar la media NZ
2
σ2
(N − 1)E
2
n=
+Z
σ 2
Para población infinita cuando se quiere estimar la proporción P (1 − P ) Z n
2
=
E
2
2
Para población infinita cuando se quiere estimar la media σ 2 Z 2 n
=
E
2
13
Cultura Estadística para la Investigación 2014-I
ANEXO TABLA DE NÚMEROS ALEATORIOS
14