Materia solemne: sesión 8-12 Sesión 8: Investigación Causal Causalidad: El estudio del impacto de una variable sobre otra. •
•
Para inferir causalidad se deben cumplir tres condiciones: 1. variación concomitante : X e Y deben variar conjuntamente (correlación o asociación entre X e Y). 2. orden de tiempo de ocurrencia : X debe preceder a Y (a l menos en un nanosegundo). 3. eliminación de otros posibles factores causales : explicaciones alternativas deben ser descartadas. Los Experimentos proporcionan la más convincente evidencia para verificar las tres condiciones.
Experimento: Procedimiento mediante el cual se manipula una o más variables independientes (precio, anuncio, espacio en la góndola) y se recoge datos sobre las variables dependientes (actitud hacia la marca, intención de compra, ventas de la tienda) mientras se controlan otras variables que pueden influir en la variable dependiente. Variables Externas Historia: eventos externos Maduración: cambios en las características de las unidades de prueba Instrumentación: cambios en el instrumento de medición Sesgo de selección: grupos difieren en características Mortalidad: unidades de prueba abandonan Regresión a la media: cuando las unidades de prueba con puntuaciones extremas regresan a la puntuación promedio • • • • • •
•
durante el experimento Efectos de la prueba: causados por el proceso de experimentación Efecto principal de la prueba: la medición previa afecta la medición posterior Efecto interacción de la prueba: la medición previa afecta la respuesta a la variable independiente (e.g., anuncio) – –
Variables Externas: Control
Hay cuatro maneras de controlar las variables extrañas: Aleatoriedad: se refiere a la asignación aleatoria de las unidades de prueba a los grupos experimentales y de control mediante el uso de números aleatorios. Emparejamiento de las unidades de prueba : Las unidades de prueba se emparejan en base a las va riables extrañas antes de asignarlas a los grupos experimentales y de control. Control estadístico : implica la medición de las variables extrañas y ajustar sus efectos a través de análisis estadístico. Control del diseño : implica el uso de experimentos diseñados para manipular o eliminar las variables extrañas (experimentos en laboratorio). •
•
• •
Clasificación de los diseños experimentales
Experimentos de laboratorio frente a experimentos de campo
Experimentos: Limitaciones Tiempo •
–
–
•
Costo –
•
Los experimentos consumen tiempo, en particular si el investigador está interesado en medir los efectos a largo plazo del tratamiento, como la eficacia de una campaña de publicidad. Los experimentos deben durar lo suficiente como para que las mediciones posteriores al tratamiento incluyan la mayoría o la totalidad de los efectos de las variables independientes. Los experimentos suelen ser costosos. Los requisitos de grupo experimental, grupo de control y múltiples mediciones aumentan significativamente el costo de la investigación.
Administración – –
–
–
La administración de los experimentos puede ser difícil. Quizá resulte imposible controlar los efectos de las variables extrañas, sobre todo en un ambiente de campo. Los experimentos de campo a menudo interfieren con las operaciones en curso de una empresa, por lo que tal vez sea complicado obtener la cooperación c ooperación de detallistas, mayoristas y otros implicados. Por último, los competidores pueden contaminar deliberadamente los resultados de un experimento de campo.
Experimentos de laboratorio frente a experimentos de campo
Experimentos: Limitaciones Tiempo •
–
–
•
Costo –
•
Los experimentos consumen tiempo, en particular si el investigador está interesado en medir los efectos a largo plazo del tratamiento, como la eficacia de una campaña de publicidad. Los experimentos deben durar lo suficiente como para que las mediciones posteriores al tratamiento incluyan la mayoría o la totalidad de los efectos de las variables independientes. Los experimentos suelen ser costosos. Los requisitos de grupo experimental, grupo de control y múltiples mediciones aumentan significativamente el costo de la investigación.
Administración – –
–
–
La administración de los experimentos puede ser difícil. Quizá resulte imposible controlar los efectos de las variables extrañas, sobre todo en un ambiente de campo. Los experimentos de campo a menudo interfieren con las operaciones en curso de una empresa, por lo que tal vez sea complicado obtener la cooperación c ooperación de detallistas, mayoristas y otros implicados. Por último, los competidores pueden contaminar deliberadamente los resultados de un experimento de campo.
Sesión 9 Usos Investigación Cuantitativa
1. 2. 3. 4. 5. 6.
Identificar características Demográficas, Socioeconómicas o Psicográficas. Conocer Actitudes, Opiniones, Percepciones y Preferencias Medir el nivel de Conocimiento y Recordación de Marcas Estimar la Intención de Uso o Compra Reconocer los motivos o razones de compra o uso. Determinar el hábito de Compra, Uso y Recompra ; y el nivel de Lealtad de Marca.
Muestreo Muestreo y estadística:
Nociones básicas
1.
Población o Universo – – –
Conjunto de todos los casos que concuerdan con determinadas especificaciones (Selltiz, 1980) Cualquier grupo completo de entidades que comparten un conjunto de características comunes. Deben contener parámetros muestrales o límites: situarse claramente en torno a sus características de contenido, lugar y tiempo
Población vs muestra •
La Población es el conjunto de elementos sobre el cual estamos interesados en obtener conocimiento. Generalmente es grande. Casi-Imposible de abarcar en su totalidad (Censo). Una muestra es un sub-conjunto de la población sobre el que se llevan a cabo las observaciones. Debe ser representativo (compartir características de la población). Ley de los grandes números y el supuesto de normalidad (teorema central del límite) permiten extrapolar resultados de la muestra a la población. Homogeneidad/Heterogeneidad de la Población, afecta la decisión de tamaño y selección de muestra. • •
•
•
•
•
Definiciones relevantes Población Objetivo: La recopilación de elementos u objetos que poseen la información buscada por el investigador •
•
• •
y acerca de la cual se harán las deducciones. (ej.: mujeres 18+) (Elementos, Unidades, Alcance y Tiempo) Elemento: Objetos que poseen la información buscada por el investigador y acerca de la cual se harán las deducciones. Unidad de muestreo: Unidad básica que contiene los elementos de población que serán muestreados. (ej.: hogares) Marco de muestreo: Lista de elementos disponibles de la población objetivo. Consiste en una lista o conjunto de instrucciones donde es posible identificar a elementos de la población objetivo (ej.: lista de mujeres 18+) –
Unidad de análisis •
Unidad de análisis corresponde al nivel en el que una variable es medible Satisfacción del Consumidor Rentabilidad Industria Firma Unidad de negocios Por empleado individual Típicamente los datos son mejor recolectados al menor nivel Pueden ser luego agregados (resumidos) a niveles más altos • • • •
•
Ejemplo: “Autos vendidos en cada distribuidor individual” puede s er agregado a “Autos vendidos en la región / pais XYZ” ¿Qué es una Muestra? Una colección de partes de una población mayor que se obtiene de algún modo. •
2.
Es un subgrupo de la población del cual se recolectan los datos. Subgrupo de elementos de la poblaci o n ́ seleccionado para participar en el estudio
Confiabilidad y Validez •
Modelo de “Valor Verdadero”
XO = XT + eS + eR XO = el valor observado XT = el valor “verdadero” eS = componente de error sistemático eR = componente de error aleatoreo • •
Validez se refiere a si estamos midiendo lo que queremos medir (e S=0) Confiabilidad es el grado por el cual lo que se mide está libre de error aletóreo (e R=0)
Errores en la medición Validez: Una medición es válida si está libre tanto de error sistemático como error aleatorio. Confiabilidad: Una medición es confiable si está libre de error aleatorio. Tiene que ver con la consistencia, precisión
y capacidad predictiva de los resultados de la investigación.
Errores y Tamaño de la Muestra Error Muestral: Se genera al usar una muestra y no la población en un estudio. Es medible. Error No Muestral: Se genera por procedimientos incorrectos en la toma y procesamiento de los datos. (No • •
respuesta, respuesta, interpretación, respuesta inducida, codificación). No es medible. Error Total = Error Muestral + Error No Muestral –
–
A medida que aumenta el tamaño de la muestra, tiende a crecer el error no muestral y decrece el error muestral. OJO: Error Muestral (de muestra total) distinto en segmentos de análisis.
Errores de Medición
Errores en la investigación de mercado Errores Muestrales •
Muestra es usada para inferir valores de la población Características: Es medible Disminuye con el aumento del tamaño muestral Errores No Muestrales: Sesgan resultados en dirección y magnitud desconocida Error de No Respuesta Error de Respuesta Mala definición del problema, población y marco muestral Error de medición Mal diseño del cuestionario Artefactos de demanda y aceptabilidad social Error de Codificación y Procesamiento – –
• •
•
– –
• •
– –
–
Error Muestral: Fórmulas
Error Muestral: Fórmulas con c.p.f
Tamaños Muestrales: Fórmulas sin c.p.f.
Errores e intervalos de Confianza • •
•
•
El cálculo del error muestral permite estimar Intervalos de Confianza . Valor = 52% con error del 6% permite aseverar que la observación real se encuentra en un intervalo, es decir, entre 46% y 58% Empate Técnico: Se habla de empate técnico cuando los intervalos de confianza de dos alternativas de una variable se interceptan. A = 52%; B = 48% con margen de error del 3%
Intervalos de Confianza para la media poblacional • •
Supongamos que tenemos una muestra de n observaciones procedentes de una distribución con media . Sean X la media muestral observada y S x la desviación típica. Entonces, si n es grande (>30), una buena aproximación de un intervalo de confianza del 100 (1 - ) % para viene dado por
Si n > 30 esta aproximación seguirá siendo adecuada incluso cuando la distribución de la población no es normal (Teorema central del límite). La distribución normal
Distribución en el Muestreo de una Proporción Muestral Sea p x la proporción de éxitos (preferencias) en una muestra aleatoria de n observaciones. • •
•
Entonces: (i) La distribución muestral de p x tiene media p (ii) La distribución muestral de p x tiene desviación típica Note que la varianza máxima ocurre cuando p = 0.5, con lo cual se evita el problema de estimar la desviación típica (Supuesto de varianza máxima)
Tamaños de muestra requeridos dado el margen de error deseado y el nivel de confianza (para proporciones)
Medición y Escalas •
•
Medición: El proceso de asignar números (numerales y otros símbolos) a propiedades empíricas, conceptos o variables (características de objetos) de acuerdo a Reglas. Tres Elementos: Variables, Conceptos o Propiedades (características) que se desean medir. Uso de números o numerales para representar dichos eventos. Un conjunto de reglas para asignar dichos números o numerales a las variables, conceptos o propiedades (reglas de correspondencia). – – –
• •
•
La medición utilizada refleja el tipo de concepto o constructo que representa. Algunas mediciones realizan distinciones superficiales o crudas respecto de las entidades medidas. Otras operan a un nivel más elevado o más refinado. Una primera distinción la podemos realizar entre variables continuas y variables discretas. • •
Las variables discretas pueden ser medidas en el nivel Nominal u Ordinal. Las variables continuas pueden ser medidas en como Intervalos o Razones.
Escalas de medición Nominal •
• •
Etiqueta la presencia / ausencia de alguna característica (color del auto: azul = 1, rojo = 2, etcétera)
Ordinal •
Rankea orden de objetos, consumidores, etcétera ( no-usuarios = 0, light user = 1 y heavy user = 2)
•
Intervalo
•
Ratio / Razón
•
•
•
Género, Marca, Tipo de Tienda, Comuna, Profesión. Porcentaje, Moda, Chi Cuadrado. Ordinal: orden (jerarquización, posición relativa). GSE, Tipo Escolaridad, Orden de Preferencia, Intervalos de Ingresos. Percentil, Mediana, Correlación Jerárquica. Intervalo: cuantificación (cero arbitrario). Temperatura, Percepciones, Notas. Rango, Media (Desviación Estándar), Correlación (ANOVA, otros). Ratio / Razón : cuantificación (cero absoluto). Longitud, Peso, Ingresos, Edad, Participación de Mercado. Anteriores + (Media Geométrica, Coeficiente de Variación). –
– –
•
– –
•
Precisa las diferencias entre puntos de una escala, pero con un origen natural o punto cero no-arbitrario (ventas en USD)
Nominal: nombres (identificación y clasificación). –
•
Precisa las diferencias entre puntos de una escala (temperatura en Celsius/Fahrenheit)
– –
Ejemplos de escalas
Sesión 10 Relación entre tamaño muestral y error
Tamaño muestral •
•
Corresponde al número mínimo necesario realizar estimaciones, asumiendo restricciones de carácter subjetivo y objetivo. Las restricciones subjetivas las impone el investigador. En particular, el error máximo admisible y el nivel de confianza asociado a la estimación. Factores objetivos a considerar son –
•
– – – –
recursos económicos, heterogeneidad de la población procedimientos de análisis a utilizar (tamaño de la población).
Error máximo admisible y nivel de confianza
En principio resulta lógico elegir el mínimo error asociado a la estimación. ¿Por qu e no se hace siempre de este ́ modo? Porque el error est a asociado al tamaño de la muestra. ́
Puede parecer sorprendente que muestras relativamente pequeñas pueden ser increíblemente pr ecisas . La fortaleza de las muestras proviene en parte de la manera en que es seleccionada (método de muestreo) Tamaño Muestral: Recursos Económicos El presupuesto puede condicionar el método de muestreo y el diseño muestral a utilizar. La existencia de presupuesto limitado puede restringir fuertemente el alcance de una muestra mayor. • • • •
•
Debe considerarse el factor presupuestario a la hora de determinar cuánta muestra es necesaria para el estudio. Muestras más grandes pueden mejorar la precisión de la investigación, pero pueden ser mucho más caras de recolectar. Usualmente desde cierto punto la ganancia de precisión es marginal. ¿Eficiencia de la inversión en Investigación? •
Tamaño Muestral: Heterogeneidad de la P oblación El tamaño de la muestra es especialmente sensible a la heterogeneidad de la población. • •
•
En poblaciones heterogéneas se requiere de mayor número de casos para estimar el parámetro poblacional que en poblaciones con valores homogéneos. Un indicador de heterogeneidad es la varianza, por lo que poblaciones con varianzas grandes requieren muestras mayores que poblaciones con varianzas pequeñas, para inferencias de igual precisión.
Tamaño Muestral: Procedimientos de análisis a utilizar •
Distintas técnicas tienen exigencias diferentes Análisis Univariados : No tienen grandes exigencias en cantidad de casos. Análisis Bivariados : al menos 30 casos. Análisis Mutivariados : exigencias específicas para cada técnica También es posible que las muestras sean a veces muy grandes, haciendo que toda posible pequeña o marginal diferencia se vuelva estadísticamente significativa. – – –
•
Tamaño Muestral: Tamaño de la P oblación •
Contra lo que dice el sentido común, el tamaño de la muestra no se ve sustantivamente influenciado por el tamaño de la población de origen. En poblaciones superiores a 100.000 casos la influencia del tamaño de la muestra es ínfima en el cálculo del tamaño de la muestra. En poblaciones de tamaño medio la influencia es moderada. En poblaciones inferiores a 5.000 casos , el tamaño de la muestra si se ve influenciado por el tamaño de la población. –
– –
Maneras para determinar el tamaño de la muestra Conjetura - “Al ojo” (Blind Guess) •
•
Presupuesto disponible Reglas Empíricas Grupo principal n > 100 Subgrupos 20 < n < 100 Tamaño estándar para estudios comparables
•
Enfoque Estadístico
• •
– –
Enfoque estadístico para determinar el tamaño final de la muestra
Errores y Tamaño de la Muestra Paso 1: Especificar el nivel de precisión deseado. El nivel de precisión deseado (e o D) es la diferencia máxima permitida entre la media (proporción) muestral y la media
(proporción) poblacional. Media: = ̅ − (± 10 dólares en la disposición a pagar por un TV Sony de 40 pulgadas) Proporción: = − (± 5% en el % de hogares que prefieren comprar el TV Sony de 40 pulgadas) • •
Paso 2: Especificar el nivel de confianza deseado El nivel de confianza es la probabilidad de que un intervalo de confianza incluirá la media o proporción de la población. Media: ̅ − ≤ ≤ ̅ + Proporción: − ≤ π ≤ + • •
Los niveles de confianza más usados son 95%, 99% y 90. Paso 3: Obtener el valor de Z asociado al nivel de confianza. Z sigue una distribución normal estandarizada (media = 0 y desviación estándar = 1).
Nivel de confianza = 1-α
Al interior de la tabla se debe buscar el α. Los extremos de la tabla dirán el Z asociado a ese α. Por ejemplo, si el nivel de confianza es 95%, el α es 5%. En este caso, el Z es 1,96. Los valores Z asociados a los niveles de confianza de 90%, 95% y 99% son 1,645, 1,960 y 2,575, respectivamente.
Paso 4: Determinar la desviación estándar de la población (σ)
Esta puede ser conocida por datos secundarios estimada sobre la base del juicio del investigador. Para el caso de las medias, el investigador puede obtener la desviación estándar de la población dividiendo el rango (valor máximo - valor mínimo) por 6 , debido a que el rango de una variable distribuida normalmente es aproximadamente igual a 6 desviaciones estándar. Para el caso de las proporciones, el investigador puede suponer varianza máxima, la cual ocurre – –
•
•
cuando π = 50%. Paso 5: Determinar el tamaño de la m uestra usando la fórmula para el error estándar.
•
El tamaño final de la muestra se incrementa si el investigador requiere mayor nivel de precisión (i.e., menor D ó e), requiere mayor nivel de confianza (i.e., mayor Z) o – – –
se enfrenta a una gran varianza o heterogeneidad de la población (i.e., mayor σ 2).
Paso 6: Verificar si el tamaño de la muestra calculado es igual o mayor al 10% del tamaño de la población. •
• •
Si el tamaño de la muestra calculado es igual o mayor al 10% del tamaño de la población ( n ≥ 10%*N), se debe aplicar la corrección de población finita . De lo contrario, se va a sobreestimar el error estándar si la población es finita. El tamaño final de la muestra corregido se obtiene mediante la siguiente fórmula:
Ejemplo 1: Suponga un investigador que estudia el gasto en comésticos (lápiz labial). El está trabajando con un 95% de confianza, y un rango de error de menos de $2.00. La desviación estándar estimada es $29.00
Ejemplo 2: Suponga en el mismo ejemplo anterior, que el rango de error es ahora aceptable por un valor de $4.00. Cuanto se reduce el tamaño muestral?
Algunos problemas prácticos
1.
Las empresas de Investigación de Mercados a veces presionan a sus clientes a aceptar muestras má s grandes. Servicio (ganancia/utilidad del proyecto) tiende a depender de la cantidad de casos investigados. Ciertos métodos de muestreo (estratificado) generan grupos para realizar comparaciones. Estas comparaciones deben tener una base de casos importante. Si 150 casos son necesarios para determinar algún efecto en un grupo, hay que multiplicar estas observaciones en caso que sea requerido realizar comparaciones. Siempre los análisis se realizan con Tamaños Muestrales Netos. Debido a la no-respuesta es necesario un tamaño inicial superior para controlar las pérdidas de casos. Antes de recolectar los datos, se debería tener una idea de –
2.
–
3.
–
4.
– –
5.
Tasa de Incidencia Tasa de Cumplimiento
Ambas tasas influyen en determinar el tamaño inicial de la muestra que permite lograr el tamaño final deseado
Determinación del tamaño inicial de la muestra La tasa de incidencia es el porcentaje de personas elegibles (útiles para la investigación) sobre personas contactadas. La tasa de cumplimiento es el porcentaje de personas elegibles que completan la entrevista. • •
Tamaño inicial =
Tamaño final Tasa de incidencia
Tasa de cumplimiento
Ejemplo 3: Si se desean lograr 100 encuestas útiles, y Si se espera alcanzar un 80% de respondientes identificables. Si es probable que el 25% de ellos colabore en un estudio Si es posible que sólo el 75% de los que colaboran puedan completar un cuestionario correctamente. Entonces solo el 15% (0,80 x 0,25 x 0,75) de los respondientes identificables es probable que entregue una respuesta utilizable. Así se requeriría realizar 100/0,15 = 667 encuestas •
– – –
•
•
Reducir el error de no respuesta
1. 2. 3. 4. 5.
Notificar previamente al potencial participante Entregar incentivos monetarios y/o no monetarios Personalización Efectuar una adecuada administración y elaboración del cuestionario Volver a contactar a quienes no han respondido (hasta 3 o 4 veces)
Corregir el error de no respuesta Submuestra de quienes no responden •
– •
Es importante, dado que pueden tener características muy distintas de quienes s i participan.
Reemplazo y/o Sustitución –
Por otros no-encuestados anteriores, o por otros elementos
•
Estimaciones Subjetivas
•
Análisis de tendencia
–
–
•
Se examina la tendencia en las respuestas de quienes participan en el primer, segundo, tercer y cuarto contacto.
Ponderación –
•
Pueden existir problemas de validez.
Se asignan pesos diferentes para los grupos respondientes
Imputación –
Usando las correlaciones obtenidas en la muestra de quienes responden (e.g., edad y satisfacción), se asignan las respuestas que deberían tener quienes no responden (e.g., por la edad de ellos).
•
Estimar los parámetros poblacionales solo con los respondientes puede inducir a error
̅ = ̅ + ̅
• • •
y corresponden a la tasa de respuesta y no respuesta.
La única manera en que la estimación es confiable, es haciendo que la tasa de no respuesta sea muy pequeña. Esto, en el entendido que el perfil de los que no responden es diferente al de los que sí responden.
Sesión 11 Tipos de Muestra
•
Probabilísticas (Aleatorias) –
Difíciles de Conseguir. Permiten asumir condición probabilística.
–
Permiten calcular error muestral.
–
–
•
Potencialmente deben permitir que cualquier individuo de la población sea elegido en la muestra de estudio.
No Probabilísticas (No aleatorias) – – – –
Más fáciles de conseguir. Mayoría de las muestras de estudios convencionales. No permiten calcular error. No todos los individuos de la población pueden ser elegidos en la muestra de estudio.
Clasificación Técnicas de Muestreo
Muestreo No Probabilístico •
• • •
Cada elemento del marco muestral no tiene una probabilidad distinta de cero de ser seleccionado. (Hay algunos que podrían no ser seleccionados) La selección de un elemento de la población se basa hasta cierto punto en el criterio del investigador . La precisión estadística o margen de error muestral no puede ser calculada . (Imposible conocer Error Muestral) Sin embargo, no existe garantía alguna de que los resultados obtenidos bajo este tipo de muestreo sean menos exactos que aquellos obtenidos con una muestra probabilística .
No Probabilístico : existe elementos sin posibilidad de ser elegidos, solo criterio del investigador, no se puede estimar error
muestral. •
Por Conveniencia:
Elementos se seleccionan por facilidad de acceso. Autoselección, Amigos, Intercepción en mall. Por Juicio: Elementos se seleccionan por juicio de experto. Consumidores clave, Entrevistas a expertos, canasta IPC. Por Cuotas: Elementos se seleccionan por cuotas fijadas por el investigador. Cuotas deben ser acorde a características de la población. – –
•
–
–
•
– –
•
Bola de Nieve: –
Importancia práctica, en muestras de difícil acceso. Demanda tiempo
Muestra de conveniencia –
Los elementos de la muestra se seleccionan pues son convenientes/fáciles de acceder por parte del investigador o bien se autoseleccionan: Intercepción en centros comerciales, muestras de estudiantes, familiares o amigos La persona elige participar (ej. Llamar o entregar opinión) Encuestas de sugerencias o reclamos • • • • •
Entrevistas de “gente en la calle”
Ejemplo: El grupo D se reunió en un momento y lugar convenientes, por lo que se seleccionó a todos sus elementos. La muestra resultante consta de los elementos 16, 17, 18, 19 y 20. Advierta que no se seleccionó ningún elemento de los grupos A, B, C y E
Muestra de juicio
Los elementos de la muestra son seleccionados en base al juicio de un experto, quien estima la contribución que pueden tener dichos elementos para el estudio (su conocimiento del tema estudiado o representatividad)
–
• •
•
•
una muestra de consumidores “clave” o “representativos”
una muestra de analistas de la industria para determinar futuras tendencias mercados de prueba seleccionados para determinar el potencial de un nuevo producto Ingenieros de compra seleccionados en la investigación de marketing industrial considerados representativos
Ejemplo: El investigador considera que los grupos B, C y E son típicos y convenientes, por lo que se se leccionan uno o dos elementos de cada uno de estos grupos, según su tipicidad y conveniencia. La muestra resultante está conformada por los elementos 8, 10, 11, 13 y 24. Advierta que no se seleccionó ningún elemento de los grupos A y D
Muestra por cuotas o prorrateo : los elementos de la muestra son seleccionados en base a cuotas prefijadas por el
investigador. Su elección no es hecha a través de un método aleatorio. Se usan para buscar que la muestra sea similar a la población en algunas características de control. Especificar una lista de características de control relevantes, (sexo, edad, GSE, etc) Conocer la distribución de estas características en la población de interés Problemas del muestreo por cuotas: Deben seleccionarse las características de control “apropiadas” Al permitir que el entrevistador seleccione al encuestado se introduce un sesgo La proporción de encuestados asignada a cada celda debe ser exacta y actualizada – –
•
– – –
Ejemplo: Se impone una cuota de un elemento de cada grupo, del A al E. Dentro de cada grupo, se selecciona (no aleatoriamente) un elemento con base en un juicio o conveniencia. La muestra resultante está formada por los elementos 3, 6, 13, 20 y 22. Advierta que se seleccionó un elemento de cada columna o grupo
Muestra de Bola de Nieve : –
–
Su objetivo es identificar casos de interés a través de personas (elementos) que participan previamente en la investigación y que éstos conocen. Así, permite ubicar a elementos de la muestra, de difícil acceso o imposible de recolectar a no ser que sea por recomendación. Ejemplos: Indigentes, Gerentes y Directivos o cualquier población de difícil acceso para el investigador. Gran importancia práctica, especialmente en muestras difíciles. Los primero elementos de la muestra permiten ubicar a los próximos elementos de la muestra. Sin embargo, demanda gran cantidad de tiempo. •
• •
•
Ejemplo: Se seleccionan al azar los elementos 2 y 9 de los grupos A y B. El elemento 2 refiere a los elementos 12 y 13. El elemento 9 refiere al elemento 18. La muestra resultante está formada por los elementos 2, 9, 12, 13 y 18. Advierta que no se seleccionó ningún elemento del grupo E
Fortalezas y debilidades
Muestreo Probabiístico •
•
Selección aleatoria de los elementos de la muestra de modo que cada miembro del marco muestral tiene una probabilidad distinta de cero de ser incluido en la muestra . Previo al muestreo es posible identificar todas las muestras de un determinado tamaño posible de ser seleccionadas, y la posibilidad de selección de cada uno.
Probabilístico: selección aleatoria de individuos, todos los individuos tienen probabilidad de elección distinta de cero. Aleatorio Simple: •
Todos los elementos tienen la misma prob. de ser elegidos. Se conoce a todos los individuos y se seleccionan de manera directa con un procedimiento al azar. Sistemático: Los elementos son seleccionados de acuerdo a su posición en la lista. Se requiere tamaño del marco muestral y tamaño de la muestra. Estratificado: Antes de elegir subdivido la pob. en grupos y atribuyo cuotas. Puede ser proporcionada o desproporcionada. Por Conglomerados : Divido la población en grupos heterogéneos y elijo individuos. Puede ser Sistemático o por Áreas (en etapas). –
–
•
– –
•
– –
•
– –
Fortalezas y debilidades
Muestra Aleatoria Simple : –
–
–
Todas las muestras posibles de un tamaño n tienen la misma probabilidad de ser seleccionadas. Todos los sujetos en el marco muestral tienen la misma probabilidad de ser seleccionados ( n/N, en que n = tamaño de la muestra y N = tamaño del marco muestral) Procedimiento: asignar un número de 1 a N a todos los elementos del marco muestral y seleccionar aleatoriamente n números para conformar la muestra.
Ejemplo: Seleccione cinco números aleatorios del 1 al 25. La muestra resultante consta de los elementos de la población 3, 7, 9, 16 y 24. Note que no hay elementos del grupo C.
Muestreo Sistemático – – – –
Los elementos en el marco muestral son seleccionados de acuerdo a su posición en la lista Ejemplo: Marco muestral es de 1000 y la muestra deseada es de 100, entonces: Se divide el marco muestral por el tamaño = 1000/100= 10, y se divide el marco muestral en grupos de a 10 Después se selecciona aleatoriamente un número del 1 al 10 (por ej. 3) y se seleccionan todos los elementos en la posición 3 de los grupos antes formados (el 3, el 13, el 23, etc.) i=N/n i = 12 / 4 i=3
Ejemplo: Elija un número aleatorio entre 1 y i (5) , digamos 2 (arranque aleatorio) . Salto Sistemático: i = 25 / 5 = 5 La muestra resultante consta de la población en la segunda posición. Note que todos los elementos terminan siendo seleccionados desde una sola fila.
Muestra Estratificada : implica dividir a los elementos de la población en
subpoblaciones en base a una variable clasificatoria para luego seleccionar independientemente elementos (normalmente una muestra aleatoria simple) de cada una de esas subpoblaciones (o estratos) Muestra Estratificada Proporcionada: cada subpoblación de interés está representado en la misma proporción al tamaño de dicho subgrupo en la población. Representatividad Estimadores más (o no menos) precisos –
• • •
–
Es “autoponderado”
Muestra Estratificada Desproporcionada: algunas subpoblaciones están sobre o sub-representados en la muestra en relación a su participación en la población. Generalmente se busca un tamaño de muestra por estrato óptimo que co nsidera: La importancia relativo del subgrupo en la población la variabilidad (S) de la variable analizada entre los elementos de dicho estrato (a mayor S mayor el tamaño del estrato en la muestra) Requiere el cálculo de coeficientes de ponderación •
– –
–
Ejemplo: Seleccione al azar un número del 1 al 5 de cada estrato, A a E. La muestra resultante consta de los elementos de la población 4, 7, 13, 19 y 21. Advierta que se tomó un elemento de cada columna
Muestra por Conglomerados : –
– –
Primero se divide la muestra en grupos mutuamente excluyentes y colectivamente exhaustivos. Pero a diferencia del método por estratos, se busca formar grupos heterogéneos. Después se selecciona una muestra aleatoria de dichos g rupos Potencialmente es un procedimiento de mayor eficiencia global (S / $) Muestreo por áreas Representa una solución al problema de no contar con una lista completa y exacta de los elementos de la población Puede tener múltiples etapas •
–
–
Ejemplo: Seleccione al azar tres conglomerados, B, D y E. Dentro de cada conglomerado seleccionado, elija al azar uno o dos elementos. La muestra resultante consta de los elementos de la población 7, 18, 20, 21 y 23. Note que finalmente no se seleccionó ningún elemento de los conglomerados A y C
Otros temas relevantes Cuánto asignar a cada entrevistador? •
A cada entrevistador no se le debe asignar una cuota grande de elementos. Si este no opera aleatoriamente, generar a un sesgo en la muestra. ́ Las cuotas se forman proporcionales a la distribución de las variables en la muestra.
Ponderación
• –
–
Una muestra es autoponderada cuando todos los elementos tienen la misma probabilidad de pertenecer a la muestra. Siempre cuando esta condición no se cumple, o cuando no hay certeza, se debe realizar un procedimiento de Ponderación.
–
Para ponderar se calcula el Peso Muestral de cada elemento de la muestra •
–
O mejor dicho “a cuantas unidades de la población representa”
Se requieren ponderadores para devolver a cada estrato su proporcionalidad real.
Si N = 2.000.000 y n = 1.000 N/n = 2.000.000 / 1.000 = 2.000 Por lo tanto, cada elemento de la muestra representa a 2.000 elementos de la población •
De esta manera, hay elementos que pueden estar subrepresentados o sobrerepresentados, respecto a su distribución relativa en la población.
Ayudantía pre-solemne 1.
Escalas básicas de medición
a.
Nominal
Esquema de etiquetado (o rotulado) figurado, en el cual los números sólo sirven como etiquetas para identificar o clasificar objetos. Ejemplos: Género, marca, rut. b.
Ordinal
Una escala ordinal es una escala de clasificación donde se asignan números a objetos para indicar la magnitud relativa en la cual éstos poseen una característica. La clave es el orden (jerarquización, posición relativa). Ejemplos: GSE, escolaridad, orden de preferencia, intervalos de ingreso. c.
De Intervalo Precisa las diferencias entre puntos de una escala. Aquí lo clave es que las variables son cuantificadas, pero existe un cero arbitrario (la respuesta “0” o neutral no implica ausencia del atributo)
Ejemplos: Notas, Temperatura (el 0 no es igual en °C que En Fahrenheit) d.
De razón/Ratio Precisa las diferencias entre puntos de una escala, pero con un cero absoluto (la respuesta “0” o neutral
significa ausencia del atributo Ejemplos: Ingresos, Participación de Mercado, Edad, Estatura. 2.
Técnicas de Escalamiento
a.
Escalas Comparativas
Son aquellas que hacen una comparación directa entre objetos. Pueden ser: - Comparación pareada: presentación de pares de objetos y se debe elegir uno de ellos en base a algún criterio específico. - Orden de clasificación: presentación de varios objetos y se pide que los ordenen o clasifiquen, de acuerdo a algún criterio o característica. - Suma Constante: asignar unas cantidades de unidades (moneda, puntos, etc.) entre un grupo de objetos, de acuerdo a algún criterio o característica. b.
Escalas No Comparativas
No hacen comparación directa sino que evaluación particular. - Escala de Clasificación continua: cundo las personas evalúan objetos haciendo una marca en una línea continua, la cual tiene en sus polos extremos las características que se están evaluando. - Escala de clasificación por ítem: se presenta una escala que tiene una descripción breve o un número o símbolo en cada categoría y se les pide que seleccionen la categoría que mejor describe al objeto. *Pueden ser: Likert, Diferencial Semántico o Stapel. Escala de Likert: escala numérica de 5 o 7 puntos que indican el nivel de acuerdo o desacuerdo con cierta afirmación. Escala de Diferencial Semántico: escala numérica de 7 puntos de -3 a +3, delimitada en los extremos por adjetivos bipolares. Escala de Stapel: escala numérica unipolar de 10 puntos, va desde -5 a +5, sin punto neutral. Suele presentarse de manera vertical. •
•
•
Decisiones clave a considerar en ls escalas de clasificación por ítem: •
•
•
•
•
•
•
N° de categorías de la escala Esalas balanceadas vs no balanceadas N° par o impar de categorías Escalas forzadas vs no forzadas Naturaleza y grado de las descripciones de las categorías Forma física y configuración Exactitud de la medición
Evaluación de una escala Error de la medición: variación en la información buscada por el investigador y la nformación generada por
el proceso de medición empleado. Modelo de clasificación verdadera:
XO = XT + eS + eR XO = el valor observado XT = el valor “verdadero” eS = componente de error sistemático eR = componente de error aleatoreo -
-
Error sistemático: representa factores estables que afectan la clasificación observada de la misma
manera cada vez que se hace la medición. Error aleatorio: representa factores transitorios que afectan de diferentes maneras la clasificación observada cada vez que se haca la medición. Confiabilidad: grado en que la escala produce resultados consistentes si se hacen mediciones repetidas. Libre de error aleatorio . Puede ser: confiabilidad test-retest, confiabilidad de formas alternativas, confiabilidad de consistencia interna. Validez: grado en que las diferencias en las puntuaciones obtenidas refleja diferencias verdaderas entre los objetos en la carecterística medida, en lugar de error sistemático o aleatorio. ¿Estoy midiendo lo que realmente quiero medir? Libre de ambos errores. Puede ser: validez de contenido, validez de criterio, val idez de constructo.
3.
Diseño de cuestionario •
•
Un buen cuestionario debe ayudar a extraer la mejor información posible de los respondientes. Ahora, se deben considerar ciertos aspectos en el diseño de cuestionarios.
En cuanto al orden: I. II. III.
Información básica (filtro básico que vaya en línea con el problema de investigación). Infomación de clasificación (características de las personas a responder). Información de identificación .
Importante: Superar la incapacidad a responder: •
•
•
i. ii. iii.
cuando en realidad fue hace meses). ¿El encuestado puede expresarse? Alternativa: brindar fotografías, mapas y/o descripciones que los ayuden a responder. El cuestionario debe ir de lo general a lo particular o específico. El cuestionario debe ser corto. Eliminar las preguntas innecesarias para el objetivo de la investigación. Se debe utilizar palabras simples : no usar palabras confusas, no usar palabras con diferente significado o interpretación. No hacer preguntas tendenciosas o sesgadas. No se debe guiar a una respuesta determinada. No hacer preguntas dobles. Por ejemplo: “¿Usted cree que los cereales son sabrosos y demasiado dulces? Preguntas sobre datos personales o sobre temas difíciles o sensibles, deben ir al final del cuestionario. Evitar supuestos implícitos o estimaciones en las preguntas.
iv. v. vi. vii. 4.
¿El encuestado esá informado? Preguntas filtro aseguran que cumplen los requisitos de la muestra. ¿El encuestado puede recordar? Es común que existan fenómenos como la abreviación ( “El otro día vi a …”
Muestreo Muestreo: diseño y procedimientos •
Algunas definiciones: - Población meta: conjunto de elementos u objetos que poseen la información buscada por el investigador y acerca de la cual se harán inferencias. - Muestra: subconjunto de la población sobre el cual se llevan a cabo las observaciones. Debe ser representativa. - Elemento: objeto sobre el cual se desea información. En una investigación por encuesta, el elemento suele ser el entrevistado. - Unidad de muestreo: unidad básica que contiene los elementos de la población sobre la que se tomará la muestra. - Extensión: límites geográficos y factor tiempo (período considerado).
Técnicas: a. Muestreo no probabilístico •
•
•
•
Por conveniencia: selección de elementos se deja al entrevistador. “Lugar y momento adecuado” Por juicio: los elementos se seleccionan de forma deliberada (luego de haberlo pensado)
con base en el juicio del investigador. Por cuotas: se desarrollan categorías de control (cuotas) de elementos de la población. Luego, se seleccionan los elementos de la muestra en base a conveniencia o juicio. Ejemplo: si el criterio de control es sexo, además en la población el 52% son mujeres y el 48% hombres y se quiere entrevistar a 1000 personas, entonces se entrevistan a 520 mujeres y 480 hombres. Por bola de nieve: se selecciona un grupo inicial y posteriormente se selecciona de acuerdo a las referencias de los primeros.
b.
Muestre probabilístico • •
•
•
•
Aleatorio simple: cada elemento tiene la misma probabilidad de selección. Sistemático: punto de inicio aleatorio, y luego se elige cada “n” elementos en sucesión
del marco de muestreo. Estratificado: la población se divide en subpoblaciones o estratos y luego se seleccionan los elementos de cada estrato, generalmente con MAS (Muestreo Aleatorio Simple). En el muestreo estratificado proporcionado, el tamaño de la muestra que se toma de cada estrato es relativo de ese estrato en la población total. En el no proporcionado se ajusta por la desviación estándar. Por conglomerados: se forman conglomerados (heterogéneos entre sí, homogéneos con los demás) y luego se selecciona una muestra aleatoria de conglomerados.
Muestreo: determinación del tamaño inicial y final de la muestra
Tips: ¿Cuándo usar media o proporción?
-
-
Media: se utiliza cuando hay un número al que se quiere llegar.
Ejemplo: la administración de un restaurante quiere determinar el promedio mensual gastado p or los hogares de Santiago en restaurantes. Algunos hogares en el mercado objetivo no gastan nada en absoluto, en tanto que otros hogares gastan hasta $150000 al mes. La administración quiere tener una confianza de 95% de los resultados y no quiere que el error exceda de más o menos $2500. Proporción: se utiliza cuando hay %, proporción o grado de satisfacción Ejemplo: se le pide a usted realizar una investigación de mercado para determinar el porcentaje de los clientes que estarían dispuestos a pagar por el servicio X. La empresa cuenta con 10000 clientes y posee la dirección de contacto de todos sus clientes. ¿Qué tamaño muestral utilizaría para obtener estimaciones con un margen de error muestral +/-3% y nivel de confianza de 99%?
Tips: Símbolos y Fórmulas
i.
Especificar el nivel de precisión deseado Nivel de precisión deseado (D): máxima diferencia permitida entre la media (o
proporción) muestral y la media (o proporción) poblacional. •
Media:
Proporción: Especificar el nivel de confianza deseado Nivel de confianza: probabilidad de que un intervalo de confianza incluya la media (o •
ii.
proporción) de la población. •
Media:
Proporción: Obtener el valor Z asociado al nivel de confianza •
iii.
Z sigue una distribución normal estandarizada (Media=0 y desviación estándar=1)
¿Cómo encontrar el valor Z?: Al interior de la tabla se debe buscar el alfa. Los extremos
de la tabla dirán el Z asociado a ese alfa.
iv.
¿Cuál es el alfa asociado a los niveles de confianza de 92% y 96%? ¿Cuál es el Z asociado a los alfa? Determinar la desviación estándar de la población (o)
Puede conocerse por: a. Datos secundarios b. Estimaciones en base al juicio del investigado
•
Media:
Proporción: Determinar el tamaño de la muestra usando fórmula para el error estándar •
v.
Con la desviación estándar calculada en el paso 4 se puede determinar ahora el tamaño de la muestra
vi.
Verificar si el tamaño de la muestra calculado es igual o mayor al 10% del tamaño de la población Si n=>10% de N , se debe aplicar la corrección de pobación finita. De no corregirse, •
•
se estaría sobreestimando el error estándar. Para corregir la población finita se debe aplicar la siguiente fórmula:
5.
Ejercicios