MUESTREO Y DISTRIBUCIONES DE MUESTREO 1. Utilizar una muestra de una población para describir la población. 2. Seleccionar muestras “representativas” de la población de donde provienen. 3. Fijar el concepto de distribuciones de muestreo. 4.Relacionar el costo de muestras grandes con la precisión obtenida y su costo. 5. Manejar diseños experimentales.
Muestreo POBLACIÓN POBLACIÓN
Medición Muestra
Datos
Se supone una DISTRIBUCIÓN NORMAL
Cálculos Estadística Inferencia Estadística Tablas de Distribución de Probabilidad
Muestreo POBLACIÓN POBLACIÓN
Medición Muestra
Datos
Se supone una DISTRIBUCIÓN NORMAL
Cálculos Estadística Inferencia Estadística Tablas de Distribución de Probabilidad
Población - Mue Muestra - Estadísticas y Parámetros Tipos de Muestreo
POBLACIÓN: Conjunto de personas o cosas
que se seleccionan para un estudio. MUESTRA: Una porción escogida de la población. ESTADÍSTICAS : Una estadística es una carac racterís rística de una mue muestra. PARÁMETROS: Es una característica de una Población. TIPOS DE MUESTREO: La selección de muestras se hace mediante el Muestreo NO Aleatorio o de Juicio y el Muestreo Aleatorio o de Probabilidad
DIFERENCIAS ENTRE PO POBLACI N Y MUESTRA Población Definición
Conjunto de elementos para estudio
Característica Parámetros Símbolos Tamaño : N Media : μ Desviación Estándar: σ
Muestra Porción o parte de la población seleccionada para estudio Estadísticas Tamaño : n Media : x Desviación Estándar : s
TIPOS DE MUESTREO PROBABILISTICO DISEÑO DE MUESTREO
Introducción • En estadística se conoce como muestreo a la técnica para la selección de una muestra a partir de una población. • Al elegir una muestra se espera conseguir que sus propiedades sean extrapolables a la población. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos a los que se alcanzarían si se realizase un estudio de toda la población.
Muestreo probabilístico • Procedimiento por el cual a cada persona o elemento una posibilidad igual de ser seleccionada en la muestra. • Este conjunto de técnicas de muestreo es el más aconsejable
MUESTREO AL AZAR (RANDOM)
Tipos de muestreo • ALEATORIO SIMPLE • SISTEMATICO • ESTRATIFICADO • CONGLOMERADO
Muestreo Aleatorio
Aleatorio Simple
Sistemático
Estratificado
Conglomerado
Cada Muestra tiene Tiene igual probabilidad De ser elegida y cada Elemento de la Población también
Cada muestra se obtiene de la población dentro de un intervalo que se mide respecto al tiempo, orden o espacio
Se divide la población En grupos homogéneos (estratos) y luego se Selecciona en forma Aleatoria la proporción De elementos que formarán La muestra
Se divide la población en grupos y luego se selecciona la muestra
Se utiliza el MUESTREO ESTRATIFICADO cuando hay una GRAN DIFERENCIA entre los estratos o grupos pero dentro de cada grupo la variación es pequeña.
Se utiliza el MUESTREO POR CONGLOMERADO cuando hay una VARIACION CONSIDERABLE dentro de los grupos, pero los distintos grupos son similares entre sí
Aleatorio simple •
Elegido
el tamaño n de la muestra, los elementos que la compongan se han de elegir aleatoriamente entre los N de la población. Con calculadora: se utilizan los números aleatorios.
Aleatorio sistematizado • Se ordenan previamente los individuos de la población; después se elige uno de ellos al azar, a continuación, a intervalos constantes, se eligen todos los demás hasta completar la muestra.
MUESTREO SISTEMATICO
EJEMPLO. • En un colegio se tiene 120 alumnos de bachillerato, se quiere extraer una muestra de 30 alumnos. Explica como se obtiene la muestra: 1. Mediante muestreo aleatorio simple 2. Mediante muestreo aleatorio sistematizado
1. Aleatorio simple • Se enumeran los alumnos del 1 al 120 • Se sortean 30 números de entre los 120 • La muestra está formado por los 30 alumnos a quienes les corresponden los números obtenidos.
2. Aleatorio sistematizado • Se enumeran los alumnos del 1 al 120 • Se calcula el intervalo constante entre cada individuo. N(población)/n(muestra)= 120/30=4 • Sorteamos un numero del 1 al 4, supongamos que salió el 3. los siguientes alumnos se obtendrán sumando 3 hasta obtener los 30. • 3,6,9,12,15…..
Aleatorio estratificado
• Se divide la población total en clases homogéneas, llamadas estratos; por ejemplo, por grupos de edades, por sexo. Hecho esto la muestra se escoge aleatoriamente en número proporcional al de los componentes de cada clase o estrato.
Muestreo estratificado • El muestreo estratificado es un diseño de muestreo probabilístico en el que dividimos a la población en subgrupos o estratos. • La estratificación puede basarse en una amplia variedad de atributos o características de la población como edad, género, nivel socio económico, ocupación, etc.
MUESTREO ESTRATIFICADO
Pasos para muestreo estratificado • Establecer en base a que atributo vamos a estratificar • Definir cuantas variables de ese atributo se dan en la población y, por tanto, en cuantos estratos dividimos a la población • Tomamos una muestra de forma aleatoria de cada uno de los estratos que tenemos.
Muestreos no probabilísticos • Los diseños de muestreo no probabilísticas son aquellos en los que las unidades de análisis se recogen utilizando métodos en los que no interviene el azar, de modo que no es posible estimar la probabilidad que tiene cada elemento de ser incluido en la muestra y no todos los elementos tienen posibilidad de ser incluidos.
Muestreos no probabilísticos • Muestreo consecutivo • Muestreo de conveniencia • Muestreo a criterio
Muestreo consecutivo • Es el muestreo no probabilístico más utilizado • Si se realiza de manera adecuada, la representatividad de la muestra que se obtiene puede ser semejante a la obtenida con un muestreo probabilístico. • El diseño de muestreo consecutivo consiste en reclutar a todos los individuos de la población accesible que cumplan con los criterios de selección durante el periodo de reclutamiento fijado para el estudio.
EJEMPLO Si deseamos hacer un estudio para conocer las horas de sueño diarias de los niños recién nacidos, podríamos realizar un muestreo consecutivo tomando a todos los recién nacidos que acudan al centro de salud "x" durante un año.
Muestreo de conveniencia • El muestreo de conveniencia es un diseño de muestreo en el que se seleccionan aquellos sujetos más fácilmente accesibles, que en ocasiones pueden ser voluntarios. • El muestreo de conveniencia se trata de una de las técnicas menos sólidas
EJEMPLO Si deseáramos conocer la opinión de los individuos sobre los servicios sanitarios, podríamos optar por situarnos en una calle determinada y realizar el cuestionario elaborado a personas que paseen por esa calle, en este caso realizaríamos un muestreo de conveniencia.
Muestreo a criterio • Tipo de muestreo donde es el propio investigador el que selecciona a aquellos sujetos que considere más apropiados para formar la muestra. • Se aplica a menudo cuando se desea tomar una muestra de expertos
DISEÑO DE EXPERIMENTOS Para obtener resultados significativos y confiables estadísticamente, no solo debe hacerse una buena selección de la muestra, mediante los métodos vistos anteriormente, sino también conducir experimentos estadísticos válidos.
FASES DEL DISEÑO EXPERIMENTAL 1. ESTABLECER OBJETIVOS 2. SELECCIONAR LA VARIABLE DE RESPUESTA (lo que se medirá) 3. DEFINIR EL TAMAÑO DE LA MUESTRA 4. CONDUCCIÓN DEL EXPERIMENTO 5. ANALISIS DE DATOS
DISEÑO EXPERIMENTAL CASO: “MARCHAMOTOR” “Marcha motor” afirma que su batería MM
pondrá mejor en marcha un automóvil que la batería XX de la competencia. La empresa desea diseñar un experimento estadístico para probar esta afirmación. 1. OBJETIVO: Las dos baterías podrían compararse en cuanto al tiempo de vida, costo, poder de arranque, etc. La empresa ha decidido que desea probar el poder de arranque, que será el objetivo de su experimento.
2. SELECCIÓN DE LA VARIABLE DE RESPUESTA: El poder de arranque podría medirse teniendo en cuenta: a) El tiempo total que gasta en agotarse la batería mientras enciende el motor; b) El número de meses que dura la batería; c) El número total de arranques de motor antes de agotarse la batería. La empresa ha seleccionado el literal a) como variable de respuesta para este experimento estadístico.
3. DEFINIR EL TAMAÑO DE LA MUESTRA: Marcha Motor desea seleccionar una muestra lo suficientemente grande para que los resultados del experimentos sean contundentes. Pero sabe que en la medida en que crece la muestra el costo será mayor. Por lo tanto seleccionan un tamaño de muestra que no sea muy costoso. Deciden utilizar 10 baterías MM y 10 baterías de la competencia.
4. CONDUCCIÓN DEL EXPERIMENTO: El experimento debe realizarse en condiciones controladas. Ello significa que debe medir el PODER DE ARRANQUE y no otra cosa. También significa que debe mantener constantes las otras variables tales como edad del motor, temperatura, estado general de los cables de batería, etc. Para asegurar esto, la empresa Marcha Motor utilizará automóviles nuevos tanto propios como de la competencia y obviamente con baterías nuevas cada uno de ellos.
5. ANÁLISIS DE DATOS : La empresa Marcha Motor está interesada en evaluar si existen diferencias significativas entre el poder de arranque de su batería MM y la de la competencia. Para ello utiliza la teoría de “Prueba de Hipótesis: Prueba de dos muestras”. Después de efectuar los cálculos apropiados llega a la conclusión de que SI existe una diferencia significativa a favor de las baterías MM y decide utilizar esta información en la publicidad de la empresa.
TEORIA DEL MUESTREO: EL TAMAÑO DE LA MUESTRA El número de unidades a incluir en la muestra constituye una de las decisiones preliminares en cualquier diseño muestral. En esta decisión participan los siguientes factores: • El tiempo y los recursos disponibles para llevar a cabo la investigación: Económicos, materiales y humanos. • La modalidad de muestreo seleccionada en orden a alcanzar los objetivos esenciales de la investigación: el tamaño de la muestra varía según la modalidad elegida para la extracción de la muestra. • La diversidad de los análisis de datos prevista: Si se aplicará una o varias técnicas estadísticas multivariables se debe tener un número elevado de casos. Esto contribuye a la reducción de los errores de predicción y al aumento del poder predictivo del modelo obtenido. • La varianza o heterogeneidad poblacional.: Cuanto más heterogénea sea la población, mayor será su varianza poblacional. En consecuencia necesitará un mayor tamaño muestral para que la variedad de sus componentes se halle representado en la muestra. Las exigencias de tamaño muestral se reducen en universos homogéneos caracterizados por una baja varianza poblacional.
TEORIA DEL MUESTREO: EL TAMAÑO DE LA MUESTRA
•
El margen de error máximo admisible para la estimación de los parámetros poblacionales: los incrementos en el tamaño de la muestra repercuten en una mayor precisión en al estimación de los parámetros poblacionales, con la consiguiente reducción del error muestral. El error muestral interviene en al decisión sobre el tamaño de la muestra siempre que el diseño muestral sea probabilístico. Los errores comprendidos entre el 2,5% y 2% son los más frecuentes.
•
El nivel de confianza de la estimación muestral: El nivel de confianza expresa el grado de “confianza” o de “probabilidad” que el investigador tiene en que su estimación se ajuste a la realidad.
TEORIA DEL MUESTREO: EL ERROR MUESTRAL •
•
•
• •
Cuando se diseña una muestra, el objetivo primordial es conseguir un elevado nivel de adecuación en la selección de la muestra, respecto de la población a la que pertenece. Ello contribuye a que la investigación adquiera validez externa. Por muy perfecta que sea la muestra, como únicamente se analiza una parte de la población (y esa muestra sólo representa una de todas las posibles muestras que pueden extraerse de una misma población), siempre habrá alguna divergencia entre los valores obtenidos de la muestra (estimaciones) y los valores correspondientes en la población (parámetros). Esa disparidad se denomina error muestral y es el grado de inadecuación existente entre las estimaciones muestrales y los parámetros poblacionales. Como todos los resultados muestrales se halan sujetos a errores de muestreo, cuando se analizan datos muestrales, debería comprobarse la representatividad de la muestra e identificar (si los hubiese) los sesgos existentes. Si la extracción de la muestra se ha llevado a cabo de forma aleatoria podrá calcularse el error muestral con la ayuda de la teoría de la probabilidad. Una de las ventajas de los diseños muestrales probabilísticos es la capacidad de determinar la precisión de las estimaciones muestrales.
TEORIA DEL MUESTREO: CALCULO DEL TAMAÑO DE LA MUESTRA
La fórmula genérica para una muestra aleatoria (simple o sistemática) es la siguiente, cuando el universo o población estuviese compuesto por más de 100.000 unidades.
n=Z²S²/E² n = [Z² P² (1-P)] / E² “Z” representa
las unidades de desviación típica correspondientes al nivel de confianza elegido (2 o 3 sigma, fundamentalmente) “S” es el valor de la varianza poblacional. Equivale al producto de las proporciones P y Q siendo Q= 1-P “E” es el error máximo permitido que el investigador establece a priori.
TEORIA DEL MUESTREO: EJERCIOS CALCULO DEL TAMAÑO DE LA MUESTRA
Se desea conocer el tamaño de la muestra necesario para una encuesta a la población mayor de 18 años con objeto de medir el voto en las próximas elecciones municipales. El error máximo permitido será +- 2,5% Si la encuesta se efectúa en Madrid capital sin información previa sobre el porcentaje de voto. Para un nivel de confianza de 95,5% (2 sigma), el tamaño muestral necesario sería:
n = Z²PQ = 2²x 50 x 50 = 1.600 unidades E² 2,5² En cambio para un nivel de confianza de 99,7% (3 sigma), el tamaño muestral sería más del doble:
n = Z²PQ = 3²x 50 x 50 = 3.600 unidades E² 2,5²