“Año del buen servicio al ciudadano”
UNIVERSIDAD NACIONAL DEL ALTIPLANO
FACULTAD DE CIENCIAS CONTABLES Y ADMINISTRATIVAS: ESCUELA PROFESIONAL DE ADMINISTRACION:
ASIGNATURA: Investigación de Mercados DOCENTE: Lic. Manuel Anchapuri Quispe TRABAJO ENCARGADO: Muestreo: Determinación del Tamaño final e inicial de la muestra INTEGRANTES:
Escobar Mamani Ronald
Sandoval Chambilla Fredy Juan
Tinta Mamani Mary Soledad SEMESTRE: “V”
GRUPO: “A”
2017
1
Contenido
OBJETIVOS DEL TEMA................................................. TEMA.................................................................................................................... ................................................................... 4 Contenido: ..................................................................................................................................... ..................................................................................................................................... 4 DEFINICIONES Y SIMBOLOS .............................................................. ........................................................................................................... ............................................. 4 Parámetro: ............................................................. ................................................................................................................................ ................................................................... 4 Estadístico: ............................................................. ................................................................................................................................ ................................................................... 4 Corrección de la población finita: ............................................................................................. 5 Nivel de precisión: ......................................................................... ..................................................................................................................... ............................................ 5 Intervalo de confianza: .................................................................. .............................................................................................................. ............................................ 5 Nivel de confianza: .................................................................................................................... .................................................................................................................... 5 DISTRIBUCIÓN DEL MUESTREO ............................................................................... ..................................................................................................... ...................... 5 PROCEDIMIENTO ESTADÍSTICO PARA DETERMINAR EL TAMAÑO DE LA MUESTRA .................... 8 ENFOQUE DEL INTERVALO DE CONFIANZA ............................................................. ................................................................................... ...................... 8 DETERMINACIÓN DEL TAMAÑO DE LA L A MUESTRA: MEDIAS ................................................... 10 DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA: PROPORCIONES PROPOR CIONES ...................................... 12 CARACTERÍSTICAS Y PARÁMETROS MÚLTIPLES .......................................................................... .......................................................................... 15 OTRAS TÉCNICAS DE MUESTREO PROBABILÍSTICO ............................................................ ..................................................................... ......... 15 AJUSTE DEL TAMAÑO DE LA MUESTRA DETERMINADO DE FORMA ESTADÍSTICA..................... 15 La tasa de incidencia. .............................................................................................................. 15 La tasa de terminación. ........................................................................................................... ........................................................................................................... 16 TEMAS DE FALTA DE RESPUESTA EN EL MUESTREO .......................................................... ................................................................... ......... 16 Mejorar las tasas de respuesta ............................................................................................... ............................................................................................... 16 Negativas. ............................................................................................................................ ............................................................................................................................ 1 6 Nadie está en casa......................................................... .............................................................................................................. ...................................................... 17 Ajustes por la falta de respuesta.............................................................. ............................................................................................ ............................... 18 Submuestreo de quienes no respondieron................................................................ ........................................................................ ......... 18 Reemplazo. .......................................................................................................................... .......................................................................................................................... 18 Sustitución. .......................................................................................................................... .......................................................................................................................... 18 Estimaciones subjetivas. .......................................................... ..................................................................................................... ........................................... 18 Análisis de tendencias. .................................................................................... ........................................................................................................ .................... 19 Ponderación. ....................................................................................................................... 19 Imputación. ......................................................................................................................... 19 Bibliografía .................................................................. .................................................................................................................................. ................................................................ 20
2
GUÍA DE ESTUDIO: MUESTREO: DETERMINACIÓN DEL TAMAÑO FINAL E INICIAL DE LA MUESTRA
3
OBJETIVOS DEL TEMA (según naresh malhotra)
1. Definir los principales símbolos y conceptos que conciernen al muestreo. 2. Entender los conceptos de la distribución del muestreo, inferencia estadística y error estándar. 3. Analizar el procedimiento estadístico para determinar el tamaño de la muestra que se basa en el muestreo aleatorio simple y la construcción de intervalos de confianza. 4. Derivar las fórmulas para la determinación estadística del tamaño de la muestra al estimar las medias y las proporciones. 5. Analizar los problemas por falta de respuesta en el muestreo y los procedimientos para mejorar la tasa de respuesta, y solucionar la falta de respuesta.
Contenido: DEFINICIONES Y SIMBOLOS En la siguiente lista se definen los intervalos de confianza y otros conceptos estadísticos, que juegan un papel fundamental en la determinación del tamaño de la muestra.
Parámetro: un parámetro es la descripción resumida de una característica o medida fija de una población meta. Un parámetro denota el valor real que se obtendría si se realizara un censo en vez de trabajar en una muestra.
Estadístico: un estadístico es una descripción resumida de una característica o medida de la muestra. El estadístico de la muestra se utiliza como una estimación del parámetro de la población.
4
Corrección de la población finita: la corrección de la población finita (cpf) es la corrección de la sobreestimación de la varianza del parámetro de la población, por ejemplo, una media o una proporción, cuando el tamaño de la muestra es 10 por ciento o más del tamaño de la población.
Nivel de precisión: cuando se calcula el parámetro de la población usando el estadístico de la muestra, el nivel de precisión es el tamaño deseado del intervalo que se estima. Es decir, la máxima diferencia permitida entre el estadístico de la muestra y el parámetro de la población.
Intervalo de confianza: el intervalo de confianza es el rango dentro del que caerá el verdadero parámetro de la población, suponiendo un determinado nivel de confianza.
Nivel de confianza: el nivel de confianza es la probabilidad de que un intervalo de confianza incluya el parámetro de la población.
Símbolos para estadísticos de la población y de la muestra
DISTRIBUCIÓN DEL MUESTREO La distribución del muestreo es la distribución de los valores de una muestra estadística, que se calculan para cada posible muestra que pueda extraerse de la población meta dado un plan de muestreo específico. 5
Una tarea importante en la investigación de mercados es el cálculo de estadísticos, como la media y la proporción de la muestra, para usarlas luego en la estimación de los correspondientes valores verdaderos de la población. Se conoce como inferencia estadística al proceso de generalizar los resultados de la muestra para los resultados de la población. En la práctica, se selecciona una sola muestra de un tamaño predeterminado y se calculan sus estadísticos (como la media y la proporción). En teoría, para calcular el parámetro de la población a partir del estadístico de la muestra, Debería examinarse cada posible muestra que pudiera haberse extraído. Si en realidad se obtuvieran todas las muestras posibles, la distribución de los estadísticos sería la distribución del muestreo. Aunque en la práctica sólo se extrae una muestra, el concepto de la distribución del muestreo sigue siendo importante. Nos permite usar la teoría de la probabilidad para hacer inferencias sobre los valores de la población. Las propiedades importantes de la distribución del muestreo de la media y las que corresponden a la proporción, para muestras grandes (30 o más), son las siguientes: 1. La distribución del muestreo de la media es una apéndice
distri bución normal
(véase el
12A).
Estrictamente hablando, la distribución del muestreo de una proporción es binomial. Sin embargo, para muestras grandes ( n _ 30 o más), la distribución normal se le puede aproximar.
2. La media de la distribución del muestreo de la media
o de la
proporción ( p) es igual al valor del parámetro de la población correspondiente, _ o _, respectivamente. 3. La desviación estándar se denomina
error estándar
de la media o de la
proporción, para indicar que se refiere a la distribución del muestreo de la media o de la proporción, y no a una muestra o población. Las fórmulas son:
6
4. A menudo se desconoce la desviación estándar de la población,
. En tales
casos, puede calcularse a partir de la muestra utilizando la siguiente fórmula:
En los casos donde _ se calcula a partir de s, el error estándar de la media se convierte en
Si se supone que no hay error de medición, es posible evaluar la confiabilidad de la estimación del parámetro de la población en términos de su error estándar. 5. De la misma manera, puede calcularse el error estándar de la proporción, utilizando la proporción de la muestra p como un estimador de la proporción de la población, _, como:
6. Es posible calcular el área bajo la distribución de muestreo entre dos puntos cualesquiera en términos de
valores z . El
valor z para un punto es el número de
errores estándar a que se encuentra ese punto de la media. Los valores z se calculan de la siguiente manera:
7
Por ejemplo, las áreas bajo un lugar de la curva entre la media y los puntos que tienen valores z de 1.0, 2.0 y 3.0 son, respectivamente, 0.3413, 0.4772 y 0.4986. (Véase la tabla 2 en el apéndice de tablas estadísticas). El cálculo de los valores z es similar en el caso de la proporción. 7. Cuando el tamaño de la muestra es 10 por ciento o más del tamaño de la población, las fórmulas del error estándar sobreestimarán la desviación estándar de la media o proporción de la población. Por lo tanto, debe ajustarse mediante el factor de corrección de población finita definida por:
PROCEDIMIENTO ESTADÍSTICO PARA DETERMINAR EL TAMAÑO DE LA MUESTRA El tamaño de la muestra determinado en forma estadística es el tamaño final o neto de la muestra: la muestra resultante después de eliminar a encuestados potenciales que no reúnen las condiciones o que no concluyen la entrevista. Dependiendo de las tasas de incidencia y terminación, es posible que el tamaño inicial de la muestra deba ser mucho mayor. En la investigación de mercados comercial, las limitaciones de los recursos de tiempo, dinero y experiencia llegan a ejercer una influencia primordial en la determinación del tamaño de la muestra. En el proyecto de la tienda departamental, el tamaño de la muestra se determinó con base en tales consideraciones.
ENFOQUE DEL INTERVALO DE CONFIANZA El enfoque de intervalo de confianza para determinar el tamaño de la muestra se basa en la construcción de intervalos de confianza alrededor de medias o proporciones de la muestra, utilizando la fórmula del error estándar. 8
Ahora podemos establecer un intervalo de confianza del 95 por ciento alrededor de la media de la muestra de $182. Como primer paso, calculamos el error estándar de la media:
En la tabla 2 del apéndice de tablas estadísticas, vemos que el 95 por ciento central de la distribución normal cae dentro de los valores z +- 1.96. El intervalo de confianza del 95 por ciento está dado por
9
Así, el intervalo de confianza del 95 por ciento fluctúa entre $175.77 y $188.23. La probabilidad de encontrar la verdadera media de la población entre $175.77 y $188.23 es del 95 por ciento.
DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA: MEDIAS Es posible adaptar el enfoque que se utilizó en la construcción de un intervalo de confianza, para determinar el tamaño de la muestra que resultará en un intervalo de confianza deseado.4 Suponga que el investigador desea calcular con mayor precisión los gastos mensuales de los hogares en compras en tiendas departamentales de manera que el estimado esté dentro de +-$5.00 del verdadero valor de la población.
de la población. ¿Cuál debería ser el tamaño de la muestra? Los siguientes pasos, resumidos en el cuadro conducirán a la respuesta.
1. Especifique el nivel de precisión. Éste es la diferencia máxima permitida ( D) entre la media de la muestra y la media de la población. En nuestro ejemplo, D _ $5.00. 10
2. Especifique el nivel de confianza. Suponga que se desea un nivel de confianza del 95%.
3. Determine el valor z asociado con el nivel de confianza usando la tabla 2 del apéndice de tablas estadísticas. Para un nivel de confianza del 95 por ciento, la probabilidad de que la media de la población caiga fuera de uno de los extremos del intervalo es 0.025(0.05/2). El valor z asociado es 1.96.
4. Determine la desviación estándar de la población, la cual puede obtenerse de fuentes secundarias o calcularse usando estudio piloto. Otra alternativa es calcularla a partir del juicio del investigador. Por ejemplo, el rango de una variable distribuida normalmente es aproximadamente igual a más o menos tres desviaciones estándar, por lo que es posible entonces calcular la desviación estándar dividiendo el rango entre 6. A menudo el investigador puede calcular el rango a partir de su conocimiento del fenómeno.
5. Determine el tamaño de la muestra usando la fórmula para el error estándar de la media.
La fórmula para el tamaño de la muestra permite ver que ese tamaño crece al aumentar la Variabilidad de la población, el grado de confianza y el nivel de precisión requeridos por el cálculo. Como el tamaño de la muestra es directamente proporcional a _2, a mayor variabilidad de la población, más grande será el tamaño de la muestra. De igual
11
manera, un mayor grado de confianza implica un mayor valor de z y, por ende, un mayor tamaño de la muestra. Tanto _2 como z aparecen en el numerador. Una mayor precisión significa un menor valor de D y, por lo tanto, un mayor tamaño de la muestra porque D aparece en el denominador.
6. Si el tamaño de la muestra resultante representa el 10 por ciento o más de la población, debe aplicarse la corrección de la población finita (cpf).5 El tamaño requerido de la muestra debe entonces calcularse con la fórmula:
7. Si se desconoce la desviación estándar de la población, _, y se usa una estimación, debe volver a calcularse una vez que la muestra se haya obtenido. La desviación estándar de la muestra, s, se usa como una estimación de. Luego debe calcularse un intervalo de confianza revisado, para determinar el nivel de precisión que en realidad se obtuvo. Suponga que el valor de 55.00 usado para _ fue una estimación porque se desconocía el valor real. Se obtiene una muestra de n _ 465 y estas observaciones generan una media X
de 180.00 y una desviación estándar de la muestra s de 50.00. En ese caso, el
intervalo de confianza revisado es
DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA: PROPORCIONES Para Naresh Malhotra deben seguirse los siguientes pasos. 1. Especifique el nivel de precisión. Suponga que la precisión deseada es tal que el intervalo permitido se establece como D=p-π = +/-0.05. 2. Especifique el nivel de confianza. Suponga que se desea un nivel de confianza de, 95 por ciento.
12
3. Determine el valor z asociado con el nivel de confianza. Como se explicó en el caso de la estimación de la media, éste será z= 1.96. 4. Calcule la proporción de la población π. Como se explicó antes, la proporción de la
población puede calcularse a partir de fuentes secundarias, usando un estudio piloto o a partir del juicio del investigador. Suponga que, con base en datos secundarios, el investigador calcula que el 64 por ciento de los hogares en la población meta posee una tarjeta de crédito de una tienda departamental. Por lo tanto,
π= 0.64.
5. Determine el tamaño de la muestra usando la fórmula para el error estándar de la proporción
n=354.04 Redondeando n=355
6. Si el tamaño de la muestra resultante representa el 10 por ciento o más de la población, debe aplicarse la corrección de la población finita (cpf). Entonces, el tamaño requerido de la muestra tiene que calcularse con la fórmula:
Donde n = tamaño de muestra sin cpf nc = tamaño de muestra con cpf 7. Si el cálculo de π es inadecuado, el intervalo de confianza será más o menos preciso
de lo deseado. Suponga que después de obtener la muestra, se calcula que la proporción p tiene un valor de 0.55. Por lo que el intervalo de confianza vuelve a calcularse empleando sp para estimar 13
El σp desconocido como
El intervalo de confianza es, entonces, =0.55 +- 1.96 (0.0264) =0.55 +- .052 El cual es más grande de lo especificado. Esto puede atribuirse al hecho de que la desviación estándar de la muestra basada en p=0.55 fue mayor que el cálculo de la desviación estándar de la población basada en
π=0.64.
Si un intervalo más grande de lo especificado es inaceptable, puede determinarse el tamaño de la muestra para que refleje la máxima variación posible en la población. Esto ocurre cuando el producto π(1 – π) es el mayor, lo que sucede cuando π se establece en
0.5. Este resultado también se considera de manera intuitiva. Como una mitad de la población tiene un valor de la característica y la otra mitad tiene el otro valor, se necesita más evidencia para obtener una inferencia válida, que si la situación fuera más clara y la mayoría tuviera un valor específico. En nuestro ejemplo, esto da lugar a un tamaño de muestra de
= 385 redondeado al número entero 8. En ocasiones, la precisión se especifica en términos relativos más que absolutos. En otras palabras, puede especificarse que el estimado esté dentro de más o menos R puntos porcentuales de la proporción de la población.
14
CARACTERÍSTICAS Y PARÁMETROS MÚLTIPLES Al investigador se le pide que calcule varios parámetros, no sólo uno. En esos casos, el cálculo del tamaño de la muestra debe basarse en la consideración de todos los parámetros que hay que estimar.
OTRAS TÉCNICAS DE MUESTREO PROBABILÍSTICO La determinación del tamaño de la muestra para otras técnicas de muestreo probabilístico se basa en los mismos principios subyacentes. El investigador debe especificar el nivel de precisión y el grado de confianza, y calcular la distribución de muestreo de la prueba estadística.
AJUSTE DEL TAMAÑO DE LA MUESTRA DETERMINADO DE FORMA ESTADÍSTICA El tamaño de la muestra determinado de forma estadística representa el tamaño final o neto de la muestra que debe obtenerse para asegurar que los parámetros se calculen con el grado de precisión deseado y con el nivel de confianza dado. En las encuestas, esto representa el número de entrevistas que deben completarse. Para obtener ese tamaño final de la muestra, debe hacerse contacto con un número mayor de encuestados potenciales. En otras palabras, el tamaño inicial de la muestra tiene que ser mucho más grande porque comúnmente las tasas de incidencia y de terminación son menores al 100 por ciento.
La tasa de incidencia. se refiere a la tasa de ocurrencia o al porcentaje de personas elegibles para participar en el estudio.
15
La tasa de terminación. denota el porcentaje de encuestados calificados que concluyen la entrevista.
TEMAS DE FALTA DE RESPUESTA EN EL MUESTREO El error por falta de respuesta surge cuando algunos de los encuestados potenciales que se incluyeron en la muestra no responden lo cual constituye uno de los problemas más importantes en la investigación por encuestas. Los participantes que no responden difieren de los que sí lo hacen en términos de variables demográficas, pictográficas, de personalidad, de actitud, así como de motivación y comportamiento. En general, las tasas más altas de respuesta implican tasas menores de sesgo por falta de respuesta, aunque la tasa de respuesta quizá no sea un indicador adecuado del sesgo por falta de respuesta. Las tasas de respuestas por sí solas no indican si los encuestados son representativos de la muestra original.
Mejorar las tasas de respuesta Las causas principales de las bajas tasas de respuesta son las negativas (rechazos) y los casos donde “nadie está en casa”.
Negativas. Las negativas (rechazos), que resultan de la falta de disposición o de la incapacidad de las personas incluidas para participar en la muestra, dan como resultado tasas de respuesta más bajas y una mayor posibilidad de sesgo por falta de respuesta. Dadas las diferencias demostradas en este estudio entre quienes responden y los que no lo hacen, los investigadores deben tratar de reducir las tasas de negativas. Paria lograrlo se recomiendan notificación previa, motivación de los encuestados, incentivos, buen diseño y aplicación del cuestionario, +seguimiento y otros facilitadores.
Notificación previa. En la notificación previa, se envía una carta a los encuestados potenciales donde se les informa de la inminente encuesta postal, telefónica, personal o por Internet. La notificación previa incrementa las tasas de respuesta en muestras del
16
público general, porque reduce la sorpresa y la incertidumbre, y fomenta un ambiente de mayor cooperación.
Motivar a los encuestados. Es posible motivar a los encuestados potenciales para que participen en la encuesta al incrementar su interés y compromiso. Dos maneras de lograrlo son las estrategias del pie en la puerta y de la puerta en la cara. Ambas estrategias buscan obtener la participación mediante el uso de peticiones en secuencia.
Incentivos. Las tasas de respuesta pueden incrementarse gracias al ofrecimiento de incentivos monetarios y no monetarios a los encuestados potenciales. Los incentivos monetarios pueden pagarse de inmediato o entregarse después.
Diseño y aplicación del cuestionario. Un cuestionario bien diseñado puede reducir la tasa general de negativas, así como el rechazo a preguntas específicas. Asimismo, la destreza en la aplicación del cuestionario en entrevistas personales y telefónicas incrementaría la tasa de respuesta.
Seguimiento. El seguimiento, o hacer contactos periódicos con quienes no respondieron después del contacto inicial, es muy eficaz para reducir las negativas en encuestas por correo. El investigador debe enviar una postal o una carta para recordar a quienes no han respondido que completen y devuelvan el cuestionario.
Otros facilitadores. La personalización, o enviar correspondencia dirigida a un individuo específico, resulta eficaz para incrementar las tasas de respuesta. Nadie está en casa. La segunda causa importante de las tasas bajas de respuesta es el hecho de no encontrar gente en casa. En las entrevistas telefónicas y las entrevistas personales en casa, pueden obtenerse tasas bajas de respuesta si los encuestados potenciales no se encuentran en casa cuando se intenta el contacto. El porcentaje de “nadie está en casa” se reduce en forma significativa mediante
el uso
de una serie de repetición de llamadas o de intentos periódicos de seguimiento, para establecer contacto con quienes no hayan respondido. La decisión acerca del número de llamadas repetidas debe evaluar el beneficio de reducir el sesgo por falta de respuesta, comparándolo con los costos adicionales.
17
Ajustes por la falta de respuesta. Las altas tasas de respuesta disminuyen la probabilidad de que el sesgo por falta de respuesta sea importante. Siempre deben reportarse las tasas de falta de respuesta y, cuando sea posible, deben calcularse sus efectos. Esto puede hacerse mediante la vinculación de la tasa de falta de respuesta con las diferencias estimadas entre quienes responden y quienes no lo hacen. La información sobre las diferencias entre los dos grupos puede obtenerse de la misma muestra. Submuestreo de quienes no respondieron. El submuestreo de quienes no respondieron, en particular en el caso de las encuestas por correo, puede hacer ajustes eficaces para la falta de respuesta. En esta técnica, el investigador establece contacto con una submuestra de personas que no respondieron, por lo regular mediante entrevistas personales y telefónicas. Con frecuencia esto da como resultado una alta tasa de respuesta dentro de esa submuestra. Los valores obtenidos de la submuestra se extrapolan luego a todos los que no respondieron y los resultados de la encuesta se ajustan para tener en cuenta la falta de respuesta. Este método puede estimar el efecto de la falta de respuesta en la característica de interés. Reemplazo. En el reemplazo, quienes no respondieron en una encuesta actual se sustituyen con personas que no respondieron en una encuesta anterior similar. El investigador trata de localizar a quienes no respondieron en una encuesta anterior y de aplicarles el cuestionario de la encuesta actual, tal vez mediante el ofrecimiento de un incentivo adecuado. Es importante que la naturaleza de la falta de respuesta en la encuesta actual sea similar a la de la encuesta anterior. Las dos encuestas deberían usar tipos similares de participantes y el intervalo entre ellas tiene que ser corto. Sustitución. En la sustitución el investigador sustituye a quienes no responden por otros elementos del marco de muestreo que se espera que sí respondan. Estimaciones subjetivas. Cuando ya no es factible incrementar la tasa de respuesta por medio del submuestreo, el reemplazo o la sustitución, es factible hacer estimaciones subjetivas de la naturaleza y efecto del sesgo por falta de respuesta. Esto implica evaluar los probables efectos de la falta de respuesta, a partir de la experiencia y la información disponible.
18
Análisis de tendencias. El análisis de tendencias es un intento por discernir la tendencia entre los primeros y los últimos encuestados. Estas tendencias se extrapolan a quienes no respondieron para estimar su posición en la característica de interés. Ponderación. La ponderación intenta tomar en cuenta la falta de respuesta mediante la asignación de valores diferenciales a los datos según las tasas de respuesta. Imputación. La imputación implica atribuir o asignar la característica de interés a quienes no respondieron, con base en la similitud de las variables disponibles tanto para quienes no respondieron como para los que sí lo hicieron.
19
Bibliografía Malhotra, N. K. (2008). En investigacion de mercados (quinta ed., pág. 920). mexico: pearson. Triola, M. F. (2004). En Estadistica (novena ed., pág. 872). mexico: Pearson.
20