VARIABILIDAD DE LA MUESTRA ISTRIB RIBUCI UCIONE ONESS MUE MUESTR STRALE ALESS DIST Métodos Cuantitativos Avanzados Avanzados Nincen Figueroa Carrera de Ciencia Política Universidad Diego Portales
[email protected]
2015
POBLACIÓN Y MUESTRA TÉCNICAS DE MUESTREO Bibliografía Bibliogra fía para esta sesión: • • • •
Weis eiss, s, N.A. (201 (2011). 1). Elem Elementa entary ry Stat Statist istics ics (8t (8thh ed.) ed.).. Pea Pearso rson. n. Blalo Bl alock ck,, H. M. (1 (1978 978). ). Est Estadí adíst stic icaa so soci cial. al. Mé Méxi xico co:: Fo Fondo ndo de Cu Cult ltur uraa Ec Econó onómic mica. a. Johnson, R., & Romo Muñoz, J. H. (2008). Estadística elemental: lo esencial. México: Cengage Learning. Tri riol ola, a, M., Pi Pine neda da Aya yala la,, L. E. E.,, & He Hern rnán ánde dezz Ra Ramí mírrez ez,, R. (2 (200 009) 9).. Es Esta tadí díst stic ica. a. Na Nauc ucal alpá pánn de Ju Juár árez ez:: Pe Pear arso sonn Educación.
RECORDATORIO : ¿QUÉ ES LA ESTADÍSTICA?
Para Ritchey et al (2002) el campo de la estadística “es un conjunto de procedimientos para reunir, medir, clasificar, codificar, computar, analizar y resumir información numérica adquirida sistemáticamente” (1)
“La estadística implica aprender una nueva manera de ver las cosas, adquirir una visión de la realidad basada en el análisis cuidado de hechos, en lugar de reacciones emocionales ante experiencias aisladas” (2)
RECORDATORIO : ¿QUÉ ES LA ESTADÍSTICA? DOS CAMPOS DE ACCIÓN ESTADÍSTICA • Descriptiva: Nos informa la cantidad de observaciones registradas y la frecuencia en las que ocurre un fenómeno social determinado que presenta variabilidad. Nos permite sistematizar, recoger, ordenar y presentar datos para así poder descubrir o describir las posibles regularidades que se presentan. Datos muestrales. • Inferencial: Nos permite extraer conclusiones sobre las relaciones matemáticas entre las características de un grupo de personas u objetos. Posibilita mostrar relaciones de causa-efecto, así como probar hipótesis y teorías científicas. Inferir, significa sacar conclusiones sobre algo (Ritchey et al, 2002). Conclusiones sobre la población
POBLACIÓN Y MUESTRA: DEFINICIÓN
Población o universo (N) X X X X X X X XX X X X X X
“Subgrupo pequeño de la población, la
X X X X X X X X X X XX X X X X X X X X X
muestra se observa y se mide y después se utiliza para obtener conclusiones sobre la población ” (Ritchey et al, 2002)
“Grupo grande de personas de interés particular que deseamos estudiar entender ” (Ritchey et al, 2002)
y
X X X X X X X X X X X X X XX X Muestra (n)
POBLACIÓN Y MUESTRA: TIPOS DE MUESTRA
Como se señaló, la muestra es un subconjunto de la población que sirve para representarla. En ese sentido, es una parte de la población que nos suministra información sobre esta, lo anterior porque en ocasiones el tamaño de la población es demasiado grande para abarcarlo por lo que se recurre a muestrear. MUESTRA REPRESENTATIVA: Muestra en la que todos los segmentos de la población están incluidos en la muestra en sus proporciones correctas respecto a la población (Ritchey et al, 2002) MUESTRA NO REPRESENTATIVA: Muestra en la que algunos segmentos de la población están representados en exceso o con defecto en la muestra (Ritchey et al, 2002)
MUESTRA Y MARCO MUESTRAL: DEFINICIONES MARCO MUESTRAL Refiere a la lista de lo elementos que conforman a la población de la que posteriormente se obtiene la muestra. MUESTREO PROBABILÍSTICO Son muestras en que los elementos a seleccionar se obtienen con base a la probabilidad de ser elegido, es decir, cada elemento tiene una determinada probabilidad de ser elegido. MUESTREO ALEATORIO Es uno de los métodos más comunes de las muestras probabilística. Todos los elementos de la población tienen la misma probabilidad de ser elegidos. MUESTREO INTENCIONAL Las muestras son elegidas con base en el hecho de que son “típicas”
MUESTRA Y MARCO MUESTRAL: TIPOS DE MUESTREO PROBABILÍSTICO
Muestra aleatoria simple
Muestra sistemática
• Es uno de los métodos más comunes de las muestras probabilística. Todos los elementos de la población o del marco muestral tienen la misma probabilidad de ser elegidos para su inclusión en la muestra. El procedimiento consiste en enumerar los elementos y seleccionarlos aleatoriamente mediante una tabla de números al azar o con números aleatorios generados por computador.
• Las muestras sistemáticas determinan las unidades seleccionadas de la muestra mediante la aplicación de un intervalo de selección en las unidades que configurar el marco muestra. El intervalo (K) se determina según el número de casos de la población (N) y de la población (n) mediante la fórmula K=N/n.
MUESTRA Y MARCO MUESTRAL: TIPOS DE MUESTREO PROBABILÍSTICO
Muestra estratificada proporcional
Muestra por conglomerados
• Este tipo de muestreo se aplica cuando las unidades de la población se distribuyen según ciertos factores (estratos) que pueden influir en nuestro estudio y que queremos asegurar un número mínimo de individuos de cada tipo. • En cada estrato se elige una muestra al al azar siguiendo el mismo procedimiento que se utiliza en el m.a.s.
• El muestreo por conglomerados es aquella muestra en la cual las unidades de muestreo se presentan en grupos de forma natural. • Este tipo de muestra se selecciona con el procedimiento usado en la muestra aleatoria simple o mediante la aplicación de un intervalo, como en la muestra sistemática
POBLACIÓN Y MUESTRA: EL ERROR ESTADÍSTICO
ERROR
ESTADÍSTICO: Es el grado de imprecisión de los procedimientos que utilizamos para recolectar y procesar la información.
ERROR DE
MUESTREO: Es la imprecisión o variación que resulta por no observar a todos los sujetos de la población y hacerlo a través de una muestra.
ERROR DE MEDICIÓN: Inexactitud debido a inconsistencias o problemas en los instrumentos de medición.
VARIABILIDAD DE LA MUESTRA DISTRIBUCIONES MUESTRALES Bibliografía para esta sesión: • • • •
Weiss, N.A. (2011). Elementary Statistics (8th ed.). Pearson. Blalock, H. M. (1978). Estadística social. México: Fondo de Cultura Económica. Johnson, R., & Romo Muñoz, J. H. (2008). Estadística elemental: lo esencial. México: Cengage Learning. Triola, M., Pineda Ayala, L. E., & Hernández Ramírez, R. (2009). Estadística. Naucalpán de Juárez: Pearson Educación.
RECORDANDO POBLACIÓN Y MUESTRA: PARÁMETRO Y ESTADÍSTICO
PARÁMETRO • Valor o cálculo numérico que resume mediciones o datos de todos los sujetos de una población. • Ejemplo: Número de hijos nacidos vivos del CENSO 2002 ESTADÍSTICO O ESTADÍGRAFO • Valor o cálculo numérico que resume mediciones o datos de todos los sujetos de una muestra. • Ejemplo: Número de hijos nacidos vivos de la CASEN 2009
RECORDANDO VARIABLES Y VARIABILIDAD
Al realizar investigación, siempre se espera que haya variación del fenómeno estudiado. Por ejemplo, si se mide la edad está irá cambiando a lo largo de la población, nos encontraremos con personas que tienen 5, 18 o años. El análisis estadístico tiene por objetivo medir la variabilidad de los datos.
Variable (o variable de respuesta)
Es una característica o propiedad de interés con cada elemento individual de una población o muestra.
Es una característica observable que varía entre los diferentes individuos o elementos de una población.
Dato
Valor de la Variable asociado a un elemento de una población o muestra.
ESTADÍSTICA INFERENCIAL: ESTIMACIÓN
Un estimador es una cantidad numérica calculada sobre una muestra y que esperamos que sea una buena aproximación de cierta cantidad con el mismo significado en la población (parámetro).
Hemos trabajado con estimadores cada vez que utilizamos datos provenientes de muestras extrai ́das de una poblacio ́n
Los estimadores son importantes porque desde estos se realiza inferencia estadística. En específico, interesa saber cuál es la distribución muestral del estimador, es decir, la distribución de los valores de un estadístico obtenidos de muestras repetidas, extraídas de la misma población y de mismo tamaño.
DISTRIBUCIÓN MUESTRAL DE UN ESTADÍSTICO MUESTRAL
E JEMPLO DISTRIBUCIÓN MUESTRAL DE LA MEDIA
Una empresa que realiza consultorías política registra el número de entrevistas cara a cara que realizan sus cinco encuestadores diariamente. Con la intención de analizar el número de entrevistas diaria se selecciona una muestra aleatoria de tamaño n=2, sin reemplazo.
Los datos para la población se encuentran representados por una media de valor 7 y una desviación estándar de 2.82 Encuestador
A
B
C
D
E
Nº de encuestas
3
5
7
9
11
E JEMPLO DISTRIBUCIÓN MUESTRAL DE LA MEDIA Si se toma una muestra aleatoria de tamaño 2, hay posibilidades de tener muestras distintas En este caso 10 maneras. N 5
10 n 2
Cada muestra de tamaño 2 tiene una probabilidad 1/10 de ser elegida.
Si se calcula la media de las muestras el valor da igual a la media total (7).
E JEMPLO DISTRIBUCIÓN MUESTRAL DE LA MEDIA
Se puede escribir como una distribución de frecuencia: Nº de muestra 1 2 3 4 5 6 7 8 9 10
Muestra
Caso Nº1
A,B 3 A,C 3 A,D 3 A,E 3 B,C 5 B,D 5 B,E 5 C,D 7 C,E 7 D,E 9 Promedio muestras
Caso Nº2 5 7 9 11 7 9 11 9 11 11
Media de la muestra 4 5 6 7 6 7 8 8 9 10 7
El mejor estimador de la media corresponde al promedio de valores de la muestra.
DISTRIBUCIÓN MUESTRAL DE UN ESTADÍSTICO MUESTRAL
ERROR ESTÁNDAR DE LA MEDIA
No obstante que el mejor estimador de la media corresponde al promedio de valores de la muestra, este tiene asociado un error al cual se le denomina error estándar de la media, es el error debido a la estimación de la media poblacional a partir de las medias muestrales. Se representa como la desviación estándar de todas las posibles muestras (de un tamaño dado) escogidos de esa población x
=
n
Sin embargo, si la población o universal es infinita (o sin reemplazo) o muy grande, la aproximación es muy cercana a la realidad. Si la muestra es finita se debe calcular un factor de corrección.
TEOREMA CENTRAL DEL LÍMITE (TCL)
El teorema del límite central nos señala que la distribución muestral de la media se aproxima a una distribución normal a medida que aumenta el tamaño de la muestra. Esto permite utilizar la distribución normal como aproximación de algunas otras funciones de distribución de variables continuas.
Es decir, dada una variable aleatoria cualquiera, si extraemos muestras de tamaño n y calculamos los promedios muestrales, sucederá que:
Los promedios tienen una distribución aproximadamente normal La media de los promedios muestrales es la misma que la variable original La desviación típica de los promedios disminuye en un factor raíz de n (error estándar)
En general, cuando se promedia sobre una muestra grande (número de casos mayor que 30), la distribución que se presentará será una distribución normal.
TEOREMA CENTRAL DEL LÍMITE (TCL)
SOCIOLOGÍA E INVESTIGACIÓN SOCIAL: EN RESUMEN