Universidad Nacional Abierta y a Distancia UNAD Escue Escuela la de Cienci Ciencias as de la Salud Salud Progr Programa ama:: Admini Administr straci ación ón en Salud Curso: Bioestadística Código: 11!!" #$ABA%& C&'AB&$A#()& C&'AB&$A#()& "* Conce+tos de ,uestreo y An-lisis de Datos* (ntroducción
En Investigación en Salud generalmente se utilizan muestras a partir de la cuales se inferen características de una población. Sin embargo es importante conocer las características que hacen que una muestra sea realmente representativa de la población de la que procede y que por tanto reeje a la población estudiada. El propósito de este trabajo es revisar los conceptos bsicos de muestreo y conceptos bsicos de estadística in!erencial. Cuestionario
". .u/ se entiende +or muestra* .u/ di0erencia una muestra +robabilística de una muestra no +robabilística*
#uestra$ En estadística% una muestra es un subconjunto de casos o individuos de una población. El muestreo probabilístico se da cuando se cumplen estas dos condiciones$ &"' (odos (odos los elementos de la población tienen una probabilidad probabilidad mayor de cero de ser seleccionados en la muestra. &)' *onozco de !orma precisa dicha probabilidad para cada elemento% lo que se conoce como probabilidad de inclusión. El cumplimiento de ambos criterios es el que hace posible obtener resultados no sesgados cuando se estudia la muestra. En ocasiones% estos resultados no sesgad ses gados os requi requier eren en usar usar t+cnic t+cnicas as de ponde pondera ració ción n &,eigh &,eightin ting'% g'% pero pero esta esta ponderación es posible precisamente porque conozco qu+ probabilidad tengo de que cada individuo sea seleccionado en mi muestra. -a defnición anterior nos lleva a concluir que sólo podemos hacer muestreo probabilístico si dispongo de un marco muestral. El censo de un país% el conjunto de direcciones de hogares en una población o la lista de clientes de una empresa% son ejemplos de marcos muestrales que hacen posible un muestreo probabilístico. En cada uno de estos casos% el universo a estudiar es di!erente$ habitantes de un país% hogares de una población y clientes de una empresa% respectivamente. En cambio el muestreo no probabilístico se característica por no cumplir con los requisitos impuestos por el muestreo probabilístico$ &"' isponer de un marco muestral es algo relativamente poco habitual en estudios de mercado. &)' -ograr que todos los individuos de la población tengan una probabilidad no nula de ser seleccionados es un requisito igualmente e/igente% ms a0n conocer la probabilidad de inclusión e/acta de cada unidad muestral. (odos los
Universidad Nacional Abierta y a Distancia UNAD Escuela de Ciencias de la Salud Programa: Administración en Salud Curso: Bioestadística Código: 11!!"
individuos que no pueden ser seleccionados en una muestra se suelen re!erir como unidades !uera de cobertura.
En investigación social se pueden utilizar dos tipos de muestreo$ el muestro probabilístico y el muestreo no probabilístico. -as principales características de ambos son las siguientes$
Probabilístico
No probabilístico
Cuantitativo Todos los casos tienen la misma probabilidad de ser seleccionados
Cualitativo Todos los casos no tienen la misma probabilidad de ser seleccionados El investigador elige los casos que Es ciego a la hora de seleccionar más le interesan (más ricos los casos en información) No requiere un conocimiento de la Requiere un conocimiento más levado población a estudiar de la población Persigue la inferencia estadstica Persigue la inferencia lógica Requiere una muestra con ma!or Requiere una muestra con menos n"mero de casos casos
). Enumere y describa brevemente los ti+os de muestra +robabilística*
1"2 #3ES(4E5 6-E6(54I5 SI#7-E Es el prototipo de muestro probabilístico% y en re!erencia al cual se llevan a cabo las !órmulas bsicas del error muestral y el tama8o muestral. 6 cada unidad del marco muestral se le asigna un n0mero y se les elige de !orma aleatoria hasta completar la muestra. Se necesita un listado de n0meros aleatorios. 1)2 #3ES(4E5 6-E6(54I5 SIS(E#9(I*5 Es una derivación del #uestreo 6leatorio Simple. Se calcula el coefciente de elevación &:'% que se calcula dividiendo el tama8o del universo &;' por el tama8o de la muestra &n'$ :<;=n En el universo &;' se elige el primer elemento al azar% con la condición de que el n0mero escogido sea in!erior al coefciente de elevación. -uego los dems se escogen cada cierto intervalo &:'% hasta completar el tama8o muestral &n'. 1>2 #3ES(4E5 6-E6(54I5 ES(46(I?I*65 @usca asegurar la representación de la heterogeneidad de la población dentro
Universidad Nacional Abierta y a Distancia UNAD Escuela de Ciencias de la Salud Programa: Administración en Salud Curso: Bioestadística Código: 11!!"
de una muestra% agrupando a las unidades por estratos homog+neos internamente y heterog+neos entre sí. 7ara la defnición de cada estrato se requiere elegir por parte del investigador el tipo de afjación% esto es% cómo se distribuyen los sujetos encada estrato. -os principales tipos de afjación son los siguientes$ Simple$ se asigna el mismo tama8o de la muestra a cada estrato. 7roporcional$ el tama8o de la muestra asignado est en !unción del peso relativo de cada estrato en el conjunto de la población. Aptima$ 6l peso relativo de cada estrato se a8ade la varianza del estrato respecto a la variable considerada en la estratifcación. 7rocedimiento en el muestreo aleatorio estratifcado$ Se establecen las variables para !ormar los estratos Se divide a la población en estratos e/clusivos. Selección de la muestra a trav+s del m.a.s. 1B2 #3ES(E45 6-E6(54I5 754 *5;C-5#E465S -a unidad muestral ya no son los individuos% sino un conjunto de individuos que bajo determinados aspectos% se considera que !orman una unidad. @usca% al contrario que el estratifcado% heterogeneidad dentro de los estratos y homogeneidad entre estratos. En peque8a escala% cada conglomerado es una representación del universo. 1D2 #3ES(4E5 75-IE(97I*5 754 *5;C-5#E465S Es un submuestreo del conglomerado. Se utiliza cuando el n0mero de conglomerados es elevado. Selecciona los individuos por etapas% confgurando sucesivamente grupos &estratos o conglomerados' y subgrupos denominados 3nidades de #uestreo primarias% secundarias% terciarias% etc. >. Enumere y describa brevemente los ti+os de muestra no +robabilística*
1"2 #3ES(4E5 754 *5;E;IE;*I6 El muestreo por conveniencia es probablemente la t+cnica de muestreo ms com0n. En el muestreo por conveniencia% las muestras son seleccionadas porque son accesibles para el investigador. -os sujetos son elegidos simplemente porque son !ciles de reclutar. Esta t+cnica es considerada la ms !cil% la ms barata y la que menos tiempo lleva. 1)2 #3ES(4E5 *5;SE*3(I5 El muestreo consecutivo es muy similar al muestreo por conveniencia% e/cepto que intenta incluir a (55S los sujetos accesibles como parte de la muestra. Esta t+cnica de muestreo no probabilístico puede ser considerada la mejor muestra no probabilística% ya que incluye a todos los sujetos que estn disponibles% lo que hace que la muestra represente mejor a toda la población. 1>2 #3ES(4E5 754 *35(6S El muestreo por cuotas es una t+cnica de muestreo no probabilístico en donde el investigador asegura una representación equitativa y proporcionada de los sujetos% en !unción de qu+ rasgo es considerado base de la cuota.
Universidad Nacional Abierta y a Distancia UNAD Escuela de Ciencias de la Salud Programa: Administración en Salud Curso: Bioestadística Código: 11!!"
7or ejemplo% si la base de la cuota es de nivel de a8o en la universidad y el investigador necesita una representación igual% con un tama8o de muestra de "FF% debe seleccionar )D estudiantes de "G a8o% )D de )H a8o% )D de >G a8o y )D de BG a8o. -as bases de la cuota generalmente son la edad% el g+nero% la educación% la etnia% la religión y el nivel socioeconómico. 1B2 #3ES(4E5 IS*4E*I5;6El muestreo discrecional es ms com0nmente conocido como muestreo intencional. En este tipo de toma de muestras% los sujetos son elegidos para !ormar parte de la muestra con un objetivo específco. *on el muestreo discrecional% el investigador cree que algunos sujetos son ms adecuados para la investigación que otros. 7or esta razón% aquellos son elegidos deliberadamente como sujetos. 1D2 #3ES(4E5 E @5-6 E ;IEE El muestreo de bola de nieve se lleva a cabo generalmente cuando hay una población muy peque8a. En este tipo de muestreo% el investigador le pide al primer sujeto que identifque a otro sujeto potencial que tambi+n cumpla con los criterios de la investigación. -a desventaja de usar una muestra de bola de nieve es que di!ícilmente sea representativa de la población. B. .u/ ti+o de muestra es la adecuada +ara acer in0erencias a una +oblación* E2+li3ue*
El tipo de muestra ms conveniente para hacer una in!erencia a una población es el muestreo probabilístico% porque cada uno de los individuos tiene una probabilidad de ser estudiado% y se puede hacer una in!erencia estadística. 6 veces puede ser un poco costo realizar este tipo de muestreo pero es muy 0til para realizar generalizaciones &estimaciones in!erenciales sobre la población'. (odo esto es posible siempre y cuando se disponga del marco muestral. D. 4.u/ ti+o de muestra es la corres+ondiente a las +ersonas de su gru+o colaborativo5 si se toma como +oblación el gru+o total de estudiantes de bioestadística de este semestre6 #enga en cuenta 3ue +ara la con0ormación de los gru+os se tuvo en cuenta la cercanía geogr-7ca de los +artici+antes*
En este caso se utilizó un muestreo no probabilístico% la razón es muy simple$ los estudiantes no !ueron agrupados aleatoriamente debido a que se tuvo en cuenta la variable cercanía geográfca % esto hizo que alguien de la costa tuviera cero de probabilidad en estar en mi grupo que est en los llanos orientales. 7or tanto% el muestreo que aplica en esta situación es el muestreo intencional o de conveniencia. . 8aga una gr-7ca de la distribución de 9auss normal; y se
istribución de las edades de un grupo de BJ personas ?4E*3E; IS(4I@3*IA; E6ES *I6 ;54#6") > F%FFKJL"JK "> " F%F")>DF"D
Universidad Nacional Abierta y a Distancia UNAD Escuela de Ciencias de la Salud Programa: Administración en Salud Curso: Bioestadística Código: 11!!"
"B "D " "L "K "J )F )" )) )> )B )D ) )L )K )J >F >" >) >> >B >D (5(6745#EI5 ESI6*IA; ES(6;64
F " " > F ) > " " D > ) > D > " F " F ) ) BJ
F%F"D)K"F) F%F)"D"D"> F%F)L)B"KJ F%F>>DDF>L F%FBF"J"DJ> F%FBK>"LLB F%FD>FLK)J F%FDKD"BDKJ F%F)LBDB> F%FDBBB)B F%F>JBBF" F%FDD"K)K F%F)KKLBJD F%FDKL">>K> F%FD>>"KKDJ F%FBLFJL)BL F%FBFBD"BL F%F>>K"L) F%F)LBKJ>J F%F)"L>D"J) F%F"L"F"L F%F")DFBJ> )B%F)FBF K) %FFK>K J"
Universidad Nacional Abierta y a Distancia UNAD Escuela de Ciencias de la Salud Programa: Administración en Salud Curso: Bioestadística Código: 11!!"
7unto de ine/ión
7unto de ine/ión #edi
N esv. Est
Q esv.
*646*(E4MS(I*6S N Es sim+trica respecto a su media aritm+tica N -a mediana y la moda son iguales a la media N -os puntos de ine/ión de la curva se dan por encima y por debajo de la media tantas unidades como indique la desviación estandar. N 7ermite establecer intervalos de confanza a trav+s de la distribución de probabilidad. L. 4.u/ son los intervalos de con7an=a6 Se llama intervalo de confanza a un par o varios pares de n0meros entre los cuales se estima que estar cierto valor desconocido con una determinada probabilidad de acierto. ?ormalmente% estos n0meros determinan un intervalo% que se calcula a partir de datos de una muestra% y el valor desconocido es un parmetro poblacional. ebido a su naturaleza aleatoria% es poco probable que dos muestras de una población en particular generen intervalos de confanza id+nticos. Sin embargo% si usted repitiera muchas veces su muestra% un determinado porcentaje de los intervalos de confanza resultantes incluiría el parmetro de población desconocido. K. 4.u/ 3uiere decir 3ue la Presión arterial de un gru+o de +acientes se encuentra entre 11! y 1> con un intervalo de con7an=a del ?@6
Ouiere decir que al tomar un grupo de pacientes ms amplio o ms peque8o y se le mide su presión arterial a cada uno% dar un resultado entre ""F y ")D con una probabilidad de acertar el JDP en cada caso con este rango.
Universidad Nacional Abierta y a Distancia UNAD Escuela de Ciencias de la Salud Programa: Administración en Salud Curso: Bioestadística Código: 11!!"
El taller es para desarrollar en los grupos colaborativos ya establecidos% uno por grupo. Sin embargo la participación y aportes individuales sern valorados al momento de la evaluación. El trabajo se debe desarrollar con base en la @ibliogra!ía requerida de la unidad >.