Bioestadístic Herramienta de la Ivestigación
Eddy Pueas López Jesús Urbina M. E/vira 8/anck Daisy Granado Marita 8/anchard 8/anchard José Antonio García Pedro Vargas Ana Chiquio
Consejo de Desarrollo Cientfi, Humanísti H umanísti y Tecnológi - CC-UC Valeia 1998
Títlo:
Bioestadsica, Heamiena de la Invesigación
Auores: Eddy Pueas López, Jesús Ubina M. M Elvira Blanck, Blanck, Daisy Granadillo, Maritza Blanchard, osé Antonio Garca, Pedro Vargas V, An Chiquito
S.BN 980-233-188-0 Editado por: DCHT- Valencia Venezuela
Diseño Diseño Editorial Compugáfca C.A - Valencia Edo. Carabobo Carabobo Diagramación Orlando Zabalea Diseño de Porada: Orlando abale/Copugráfca A mpreso en Venezuela rined in Venezuela
4
PRÓLOGO Este libro e diseñado especialmente para los alumnos de Cienias Cienias de la Salud que se inician en el estudio y uso de la Estadística como heramien heramienta ta auxiliar en el camp de la investigación científca. En él, hemos buscado la rma de hacerles comprender compre nder a nuestr nuestros os educandos, de d e la manera más sencilla posible, el manejo de los datos, datos, los procedimientos en los cálulos de los l os diversos estadísticos, así como sus interpre taciones. Por lo tanto, el lenguae empleado en su redacción redacción responde a este propósito Es un lenguae lenguae llano, sencillo y conciso, conciso, donde, de manera direc ta vamos a la esenca del concepto o del pocedimiento que queremos queremos ense ñar, despojándolo de todo adoo o retóricas ret óricas explicaciones, las cuales ha rían más má s complea su aprehensión. apreh ensión. Para teorías más elaboradas elabo radas y conoci mientos de mayor prondidad, será necesario consultar otas de las muchas publicaciones que abundan en esta disciplina. La experiencia de más de veinte años año s de docencia en el área de las las Ciencias de la Salud nos ha enseñado que nuestros alumnos alum nos están más motivados por el aprendizae de aquellas asignaturas directamente reacionadas con los procesos de saludenermedad saludenermedad;; más que con cualquier otra materia. Están ávidos de esos concimientos, por lo tanto, lo demás lo perciben como innecesario o distractor de su obetivo ndamental. Consciente de esta sitación, sita ción, al escribir este libro hemos omitido intencionalmente extensas explicaciones teóricas, demostraciones, despees de rmulas rmul as matemáticas, así como compleas compl eas técnicas de análisis estadístico, estadístico, en paticular del capo de la Estadística Inerencia! Por lo tanto, no no es un exhaustivo tratado de Estadístca Es ndamentalmente, ndamentalmente, un libr libro o de texto básico, básico , muy didácto didáct o y sencillo sencil lo de comprender compre nder por quienes quiene s lo consulten, consulten, y aún cuando está elborado para alumnos de pregrado de las Escuelas de Medicina, Bioanálisis Bioanálisis y Enemería, prevemos que también será de utilidad en otros niveles dode se utilice la metodología estadística como un auxiliar de la investigación Esta obra es producto de una extensa revisión bi bliográfca y de nuestra experiencia docente, por largo larg o años acisolada en las aulas de d e clase de esta Universi Universidad dad Eddy Puertas López
Profesora Titular de la Facultad de de Ciencias de la Sald de la Uiversidad de Carabobo
CAPÍTULO/ Uso de la Estadística en el campo de la Salud Algunas deniciones básicas en estadística Estadística Estadística descriptiva. Estadística inferencia/ Variables Variable s Escalas de medición escalas nominales, nominales, ordinales, de nales, de interalo y de razón. Parámetros Paráme tros y estadísticos estadísti cos Bioestadís Bioestadísticas ticas EpideEp idemiología miol ogía Estadística Esta dísticass de de la salud. salud . Estadístic Esta dísticas as vitales Uso de de la Estadística en el campo de campo de la salud. La Estadística en la Administración sanitaria Aplicación de la la Estadística en la investigación Etapa de plancación de una investigación Elaboración de boración de un plan o proyecto Planteamiento Plantea miento del problema: enunciado enunciado del pro blema; importancia del problema y justcación de su estudio; formulación del problema; control del problema Objetivos de la investigación investigación Marco Marco teórico marco histórico marco conceptual, sistema teórico deniciones de términos. Marco metodológico metodológico Tipos de diseños de investigación Niveles y tios de investi gación estudios descriptivos correlacionales correlaci onales comparativos comparati vos experimentales experimentales cuasiexperimentales estudios transversales retrospectivos prospectivos Marco administrativo Elaboración de las referencias bibliográcas Bibliograa.
7
l. DEFINICIOES BÁSICAS Estadística.- Cuando se intenta defnir el término Estadística,
se encuen tran diversas opiniones que incuyen su ubicación como ciencia método técnca y aún como arte Sin embargo, como denominador común se encuentra e criterio de que es una rama de la matemática utilizada para e manejo de masas de datos numéricos y por consiguiente, para estudiar a variación de dierentes nómenos. También puede defnirse omo el méto do empeado para a recopilación, presentación, análisis e interpretación de datos numéricos G Utni Juli, a de ne como a ciencia que trata de la recolección, clasif cación y presentación de os hechos sujetos a una apreciación numérica como base a a expliación, descripción y comparación de un nómeno Srenko y Esmakv a denen como la ciencia socia que estdia l as pecto cuantitativo de los enómenos sociales en masa en reación indisolu be con sus particulaidades cualitativas. Shell Heánde habla de la Estadística como el conjunto metódico de os hechos, de os individuos o de as cosas que suelen contarse o medirse, de sus ecuencias, y de la ordenación y signifcación analítica de las cias obtenidas. Gini la defne como una técnica especia, apta para el anáisis de los nómenos de masa o olectivos entendiendo por tales aquellos enómenos natrales, económicos, sociales, etc., cuya medición requiere de la observación de una masa de enómenos más simples llamados individuaes o particuares.
Para Ledezma la Estadística es e arte y a ciencia de manejar os núme ros cuando expresan los valores cuantitativos de hechos similares Serviría, por o tanto, para valorar observaciones o experimentos cuando éstos se ex presan cuantitativaente es decir mediante números Para Chao a Esadística es un conjunto de teorías y métodos que han sido desarrollados para tratar a recoección el anáisis y a descrpción de datos muestrales con e fn de extraer conclusiones útiles.. es deir, que la Estadística modea abarca a estadística descriptiva y la inrenia. Kaplan sostiene que la Estadística, en su sentido más amplio, consise en las maneras de trata con una multipicidad de datos para deteminar qué
9
conclusiones apoyan y cuánto apoyo es proporcionan. Desde este punto de vista, la estadística suele ser caracterizada hoy en día como disciplina que trata de razonamiento empeado cuando se toman decisiones ente a la incertidumbre. De acuerdo con los niveles de conocimientos que puede proporcionar e estudio de una variabe desde el punto de vista estadístico, a estadística puede dividirse en dos partes: Estadística Descriptiva, tiende a condensar o resumir un conjunto de da tos o características de una serie de valores, describiendo ciertas caracterís ticas de conjunto examinado. Por ejemplo, al medir la inteligencia, la ten sión arterial, la hemogobina de un grupo de sujetos, se pueden agrpar los valores obtenidos en distribuciones de ecuencias, construir tablas, gráf cas, calcular promedios, percentiles, etc. Estadística Inferencia/ Se refere a los métodos estadísticos donde a partir del estudio de una muestra (parte de la población tota), se busca esti mar o generaizar sus conclusiones a la totalidad de la pobación. Se ocupa específcamente de hacer inducciones, generalizando al universo los halazgos logrados en as muestras. Utiliza métodos y técnicas adecuadas para ese proceso inductivo. Variable estadística: Es una característica o propiedad que puede variar (adquirir diversos vaores) de un sujeto a otro, o en un mismo sujeto en di versas oportunidades; siendo esta variación susceptible de medición Ejem pos: diagnóstico, síntomas, motivación intrínseca, sexo (son variables cualitativas. Se referen a un atributo) peso, tala, edad, temperatra (son variables cuantitativas Se referen a magnitudes.
El procesamiento de estas variables da origen a las escalas de medición nominaes, ordinaes, de intervao y de razón. Escalas de medición Los valores de medición de cualqier variabe, para ser procesados y luego anaizados, deben presentarse de manera resu mida en clases estadsticas, cuyo número depende de as divisiones que ad mita la variable El conjunto ordenado de clases constituye lo que se deno mina escala Según a naturaleza de a variabe que la origina, ésta puede ser nomina, ordina, de intervao, o de razón Escalas Nominales o Categóricas Existe un tipo de variabe cuya medición consiste simpemente en indicar si la característica está presente o
10
no en cada sujeto de estudio o en incluir determinados elementos dentro de las categorías que les corresondan
A través de algunos ejempos puede aclararse meor el concepto. Al tra bajar con la variable "sexo en un grpo de suetos, se le asigna a unos la condición de masculinos y a otros la de menino, en otras palabras, se ubican a los sujetos en na de las dos categorías que puede admitir la variable masculino o menino. La vaiable ansiedad se distribuye en una escala no minal cuando se ubican a las personas en las "clases de ansiosas o no ansiosas. Del mismo modo, si se dice que unas cepas de un parásito son inc tantes y otras no lo son. La variable "inctante está medida en una escala nominal con dos posibilidades SI o NO En resumen, la ecala de medición nominal indica la resencia o ausencia de un atributo en los sujetos de estudio ero no ermite cuantfcar la magnitud del atributo.
En la siguiente lista se oecen otos ejemplos de escalas nominales de uso ecuente en Ciencias de la Salud, y los valores o categorías en las cuales pueden clasifcarse: VRB Diagnóstico Causas de muerte Tipo de reacción Causas de Admisión
RÍ ermatitis, Sarampión, áncer, Gastroente ritis, eumonía Accidentes, eumonías, áncer, Envenena miento Positivo, Negativa eshidratación, Herida, Paro, Intoicación, Traumatsmos
: Una variable se expresa en una escala ordinal, cuando los valores que asume se jerarquizan en un orden de rango o magnitu La variable "estado nutricional comúnmente se presenta en escala ordi nal con sus clases Desnutrición Grado 1 Grado 2 y Grado 3 ada una
de estas categoras es algo más que nominal, sin llegar realmente a lo numé rico La variable "Quemadura cuando se expresa en la misma rma, es una escala ordinal Cuando a la variable "Ingresos económicos se le asig nan los valores "ALTO MEDIO BAJO también se está expresando en una escala ordinal, entendiendo que el valor "ALTO, numéricamente es supeior al "IO; pero no se indica cuanto es la dierencia
11
En ocasiones las escalas ordinales son difciles de manejar por cuanto ni son nominales ni son numéricas y requieren ser tratadas con técnicas estadísticas adecuadas No es fecuente encontrar variables que se midan rigurosamente de ma nera ordina. Con fecuencia ocure que variabes de naturaleza numéricas, por raones prácticas se expresan en escaas ordinales Por ejemplo, cuando se habla de dosis atas, medias o baja, originalmente las dosis eron medi das en escaa numérica: 1 c, 2 c, 3 c, . .. , pero pueden manejarse como bajas dosis inriores a 1,5 c Medias dosis entre 1,5 y 3 c. Altas dosis superiores a 3 c De esta manera una variabe numérica se expresa en una escala ordinal =
=
=
Las otras dos escalas de medición De interalo y De razón corresponden a variables numéicas o cuantitativas, en las cuales se asigna un vaor numérico para expesar la magnitud de la caracerística en estudio Escalas de intervalos. - Se caracterizan
porque en ellas la presencia del valor "CERO no signca la ausencia de la característica que se está mi diendo sólo es un punto de referencia. Las cfas asignadas en esta escala no indican exactamente una magnitud Ejemplo Si al aplicar una prueba de Bioquímica a un alumno de Medici na, y éste obtiene una caifcación de cero puntos no signifca, necesaria mente, que el alumno carezca totalmente de conocimientos en esa asignatu ra, sino que no supo responder adecuadamente a las preguntas frmuadas en ese momento Así mismo, si otro alumno obtiene, en la misma prueba 16 puntos, no signifca que él posee exactamente el doble de conocimientos de otro que obtuvo sóo 8 puntos En Ciencias de la Saud, suee utilizarse este tipo de escala especialmen te en e campo de a Psicología, donde muchas variabes se miden a través de Tests. Ej Test de ansiedad, de depresión, de Locus de Control, de Inteigencia, de Motivación Intrnseca, de Razonamiento Abstracto, etc. Por su pate, las escalas de razón sí están referidas a un CERO ABSOL UTO donde su presencia signca la ausencia de la característica medida; y las cras numéricas realmente indican una magnitu Por ejem po, un niño de 60 cm de estatua, mide la mitad de otro cuya taa es de 120 cm. U otro de 10 kilos pesa el doble de lo que pesa otro de 5 Kilos O un jo ven de 21 años de edad ha vivido exacamente tres veces e tiempo vivido
12
por un niño de 7 años. A estdiar as variabes numéricas o cuantitativas es necesario desarro lar otros aspectos importantes con reación a os valores que pueden tomar dentro de as escaas Al gnas escalas sólo admiten valores enteros es decir no pueden expresarse mediante fracciones o decimales; por ejempo el número de hijos de na fmiia el número de embarazos de una mujer ha bitantes por viviendas glóbulos roos, etc. En taes casos se es denominan variabes discretas. Cuando la variable puede asumir cualquier valor, incluso decimal, se dice que varía de manera continua. Como ejemplos se pueden citar: el peso la taa os valores de hemogobina. Tanto las variabes de intervalos como as de razón pueden variar de manera continua o discreta. Algunas va riables que teóricamente son de naturaleza coninua como por ejemplo a edad son comúnmente expresadas en fra discreta En casi todos los ca sos a edad se expresa en números enteros. V La aplicación de a Estadística en diversas áreas de las Ciencias de a Salud, viene dada por a naturaeza variable de muchos de los fnómenos que se estudian en esa área: la natalidad a morbiidad y la mortaidad por ejempo, son hechos vitales afctados por ctores biolgicos y sociales en frma vaiabe no sóo dentro de grpos humanos drentes, sino también dentro de los mismos individuos Esa característca básica que está presente en los hechos investigados y en base a a cual son difentes o toman vaores dierentes es o que se conoce como variabiidad En odo f nómeno donde la varabiidad esté presente a Estadística tiene aplicación. P Conjunto completo de individuos objetos o unidades que poseen alguna caacterística común observable. Ejemplo la población en edad de votar. M: Un subconjunto o pare de a población o de unverso que re feja las características del mismo Pá Es a medida de resumen (o valor representaivo) de cualquier característica medibe en una población. Ejempo a tasa de mortai dad genera para una población e porcentaje de desnutridos en una pobación; e peso promedio de os niños a nacer E Es a medida de una característica estudiada o calcuada en una muestra de acedo con deterinados procedimientos específcos Co
13
múnmente, se usa un estadístco para estmar el parámetro correspondente de una pobacón Por ejemplo, la meda artmétca de una muestra permte estmar la meda artmétca para a pobacón de a cua se obtuvo. Serie estadística: Es un conjunto de datos rerdos a una variabe cual tatva o cuanttatva. Estos datos pueden estar ordenados o no. Iguamente pueden estar agrpados en cases (seres agrpadas) o presentados en un stado de datos conocdos como datos directos. Bioestadística Es la rama de la estadstca aplcada al estudo de los e nómenos varables en los seres vvos. Epidemiología Es el estdo de la dstrbucón de una enermedad o condcón sológca en poblacones humanas, y de los ctores que nu yen en esa dstrbucón. Estadística Vtal Se refere a estdo de los hechos relaconados con el comenzo y fn de la vda y lo cambos de estado cvl que ocuen durante ela. Para Swaroop, el térmno estadísticas vitales se usa para denotar hechos regstrados sstemátcamente y reundos en rma numérca que se re laconan o dervan de regstros de eventos vtales, a saber: nacdos vvos, muertes, muertes etales, matrmonos, dvorcos, adopcones, egtmaco nes, etc. De hecho, las estadístcas vitales se derivan de eventos regstrados legalmente sn ncur os datos de poblacón o las caracterstcas de morbldad. Estadísticas de salud Conunto de datos rerdos a a stuacón de saud de una comundad. Incluye todo lo relaconado con natadad, morbldad y mortaldad. 11. USO DE LA ESTADÍSTICA EN EL CAMPO DE LA SALUD
En los últmos años, y gracas a desarrollo de tecnologías que así o han· permtdo, la Estadístca se ha convertdo en un auxar poderoso de muchas actvdades humanas, pues, su campo de aplcacón abarca las más dsmles actvdades, tanto centícas como de otra naturaeza. En el área de as Cencas de la Salud esta metodología tene una ampla hstora, sendo ndamenta en el estdo de una en partcular como es la Salud Públca
14
Una revsión de la lteratura sobre la Estadística en el campo e las Cencas de la Salud permite establecer una base de sustentacón fre para la justifcacón de la mportancia que tene la aplcacón de la Metdología Estadística en este campo del conocmiento. En relacón con las Estadístcas de Salud, Fayad Camel, uno de los auto res más consultado en Venezuela, señala que éstas son ndispensables para la planfcación, eecucón y evaluacón de los programas de salud, ya que permten e dagnóstco de comundad (descripcón de la stuación de salud en una comunda), y cltan la aplcacón de técncas apropadas para medr hasta que punto se ha lograd el cumplimento de los programas de salud. En el sector salud, la Estadística permite: a) Descrbr el nvel de salud de la comundad b) Dagnosticar las enermedades de la cmunidad c) Encontrar solucones a los problemas de salud y hallar las claves para la accón admnstratva d) Determnar proridades para los programas de salud. e) Drgr y mantener el control durante la ejecucón de os uestreos, etc f Promver la legslacón en salud g) Crear estándares admnstratvos de actvdades de salud. h) Determnar el alcance y restrccones de las activdades de salud. ) Dndr infrmacón confable sobre la situación de salud y los pr gramas de salud g) Determnar el éxto o facaso de los programas específcos de salud. k) Pedr ayuda pblica para el trabajo de salud. Bancrof expresa que de manera cotdana, el médco utlza la Estadístca al tener presente las varacones entre los ndivduos y cuand tales va racones son normales o no Igualmente cuando hace el dagnóstico de un pacente y el pronóstco, según su enermedad (probabldad de curar o de orr). Al msm tempo, la ntroduccón de nuevos trataments debe r acompañada de un análiss crítco, no sólo acerca de su superiordad de los
15
antiguos tratamientos, sino además, tener claramente establecido todo lo re frente al control de los experimentos la similitud del grpo control con el grpo experimental y si la dierencia obtenida es atribuible o no al azar Mainland
señala, por su parte, que el método estadístico es usado por el laboratorista al promediar dos lecturas de una pipeta, o por el clnico cuan do determina si es o no normal la tensión arterial de un paciente o cuando se recomienda un tratamiento ndado en el hecho de que es meor que otro Del mismo modo Hill ndamenta la importancia y necesidad de la in rmación estadística, tanto en la medicina clínica como en salud pública, al indicar que, en el primer caso es esencial precisamente debido a la varia bilidad humana Por otro lado, la reacción fvorable de un caso de una enfrmedad a un nuevo tratamiento puede considerarse signifcativa cuando la experiencia anterior ha demostrado, luego de la obseración de muchísi mos casos, que esas reacciones no son variables. Así mismo, Hll añade que sin el uso de la estadística no puede ndamentarse el mayor o menor valor de un determinado tratamiento o si una droga poderosa tiene más ectivi dad que otra en condiciones pariculares Otros elementos que valorizan la estadística en su aplicación a la clínica médica, son su utilización en la determinación de la variación de una enfr medad de un paciente a otro, o si está asociada a determinadas característi cas como edad, sexo u otra en e seguimiento de pacientes; en la defnición de normalidad o la exactitd de procedimientos de laboratorio. En el caso de la salud pública, la aplicación es muy amplia, refriéndose, por eemplo, a la comprobación de la efcacia de medidas preventivas tales como una vacunación. En resumen, para Hill, la infrmación estadística en salud pú blica está orientada hacia dos propósitos principales: por una parte, ser utili zada como el indicador del estado de salud de una comunidad y por la otra, para deteinar las razones ndamentales de las difrencias entre las fr mas como los indicadores se presentan en diversos sectores de la sociedad. Otro elemento teórico que destaca la necesidad de la infrmación esta dística, lo encontramos en trabajos de MorichauBeauChant, quien reco noce lo indispensable de conocimientos sufcientemente precisos de la si tuación sanitaria, para la planifcación en salud, al igual que para la evaluación de sus resultados. Indic que en general, la mortalidad es mal conocida, lo mismo que la morbilidad Sin embargo, cuando no es posible disponer de infrmación precisa, aquella que puda obtenerse mediante un
16
sondeo, puede proxmr mu ben l reldd, los procedentos técncs pr l relzcón nálss de los sondeos son de tpo dmentlmente estdístco. S se enc l mportnc de l estdístc desde otro punto de vst, el de l nvestgcón en Cencs de l Slud, tnto socl como propmente bológc epdemológc, se pueden encontrr sufcentes eleentos de tpo conceptul y de procedmento que reveln el ppel ndmentl de l Estdístc en ese campo de l nvestgcón. Snedecor l nlr l defncón de Estdístc destc l mportnc de ést, tnto pr quen rel z ctvmente nvestgcón de tpo cuntttvo como pr quenes vn hcer crrer en ls Cencs Socles L nvestgcón epdeológc tendrí sers lmtcones sn un decudo ndmento estdístco. En la nvestgcón bológc y socl plcd l slud l Estadístc jueg un ppel de prmer orden l proveer de sufcentes procedmentos técncs de nálss pr ls pruebs de hpótess, lo cul consttuye el plr ndmentl de l nvestgcón expermentl, prte, nturlmente, de los elementos de nálss que provee pra los estudos de tpo descriptvo Beltrán resume con bstante clrdd el porte de l estdístc en l plccón del método centíco tnto en lo reerente l plnfccón de l nestg cón, como en l plccón de los procedmentos metodológcos en el nálss de los resultdos. Ferrero, l rerrse l mgntud complejdd de servcos que ho
mnej l dmnstracón sntr (tencón médc, segurdd socl, etc.), h plntedo la necesdd de dsponer de nrmcón estdístc de rm permnente sstemátc, que no bstn lgunos dtos, sno que es necesra sufcene nrmcón pr hcer nrencs y predccones sobre el comportmento de los enómenos en estudo. L presenc de l vrbldd como crcterístc de los nómenos objeto de estudo, tnto por l medcn como por l slud públc, determnn l necesdd del uso de l Estdístc en ess áres del conocmento, lo msmo es váldo pr el cmpo de a nvestgcón clínc que trbj con nómenos emnente mente vrbles, l gul que todo el cmpo de l bologí.. " (1 97 1 , Pg. 1 19. En síntess los uores mencondos muchos más, Armtge ñedo, le trbuen l Estdístc un mportnc de primer orden en los dver sos spectos de l ctvdd médc en prtculr de slud en generl.
17
Es necesario, sin embargo, idicar que la apicación de los métodos estadísticos en cada una de esas áreas, se da de manera dirente atendiendo a los procedimientos y objetivos propios de la planifcación, la administra ción la evaluación y la investigación en salud También, es necesario destacar que, como sostiene Kaplan toda medición contiene un elemento de error La más exacta descripción o predicción que puede hacerse es siempre aproximada; tanto en e sentido del constante cambio o transrmación de la reaidad, como en el sentido mismo de la realidad, la cua es una cons trucción teórica, y a ella se suan las dierencias provocadas de los procedimientos y circunstancias de la medición Si una medición particular era totalmente exacta y ibre de errores, las repeticiones de la medición, dicilmente proporcionarían medidas idénticas, ya sean, de un mismo observador, en ocasiones sucesivas, o de obser vadores direntes, porque no verán exactamente del mismo modo lo que puede llamarse la "misma situación APLICACIÓN DE LA ESTADÍSTICA EN LA ADMNSTRACIÓN SANITARIA.
Administrar es un término generalmente utilizado para defnir a frma en que una persona o institución dispone de sus recursos (tiempo, dinero, personal), para lograr una meta. En el área de la salud existe una rama deno minada Administración Sanitaria Esta especialidad es úti tanto para médi cos, enrmeras, bioanalistas, economistas o cualquier otro profsional que tenga que ver con la salud de un grpo o población. Puede defnirse como:
El conocimiento utiliado para guiar a individuos y/o instituciones a satisfacer el objetivo de mejorar de manera permanente el estado de salud de una persona o población mediante el uso racional y ecaz de los recursos disponibles a tal n (Ferrero, 1971). En ese sentido la administración sanitaria puede empearse tanto en un ambulatorio rra como en el más modeo hospital Al logarse una más justa distribución de os recursos para atender las necesidades de salud (en el área preventiva y curativa) de una comunidad o de una gran ciudad, se elevará el grado de desarrolo social y económico, y con ello, a población tendrá mayor capacidad para estdiar y trabajar; crecer y eproducirse y garantizar a sus descendientes una mejor calidad de vida, asegurar su iden
18
tidad como nación, además de disminuir la dependencia de otros países La administración sanitaria no puede verse, entonces, sólo coo un ins trmento gerencial, es, además, una herramienta efcaz para el crecimiento y desarrollo de un pas Así, el uso racional y creativo de la administración por quienes tengan esa responsabilidad a su cargo, puede contribuir a un mayor grado de bienestar social. Los planteamientos anteriores sirven de marco para entender e uso de la Estadstica en el campo de la salud Es evidente que se necesita manejar in rmación acerca del estado de salud de una población Esta inrmación surge de los estdios epidemiológicos. Si se cuenta con el diagnóstico de la comunidad en lo rerente a salud, y con inrmación adicional pertinente, el administrador, Jef de un Distrito Sanitario, por ejemplo, estará en capacidad de hacer una PLANIFICACIÓN de sus actividades para atender las necesidades de salud diagnoscadas. En la planifcación es importante, no sólo ar los objetivos del plan, sino también hacer una evaluación de los recursos disponibles y considerar los ltante, a n de elaborar un presupuesto Es en este momento cuando el administrador y su equipo, debe procesar gran cantidad y variabilidad de datos Tendrá que analizar inrmes, resumir y clasifcar datos, elaborar proyecciones y tendencias Denirá prioridades basándose en tasas e ndi ces sobre natalidad, frtilidad, morbilidad y mortalidad y asignará ecursos en nción de los ismos. En el caso de la administración de un servicio de salud público o privado, se requiere una revisión exhaustiva de todos los parámetros disponibles para conocer la demanda de servicios, y a la vez saber con qu ecursos cuenta para satisfcer los requerimientos En el proceso de planicación buscará equilibrar la demanda con la ofrta, tratando de optimizar los recursos que posee, generalmente escasos, por lo menos en la administración pú blica Nuevamente entrarán en juego los datos e inrmación que deberán ser analiados estadsticamete. Como puede verse, la Estadstica está presente en todas las etapas del proceso de administación en salud Constituye una herramienta etodológica para que el administrador de salud diagnostique, planique, ejecute y evalúe las acciones necesarias, a fn de lograr que cada individuo y cada co unidad tengan el nivel de salud adecuado, y puedan llevar a cabo sus acti
19
vidades normales. APLICACIÓN DE LA ESTADÍSTICA EN LA INVESTIGACIÓN.
En el trabao de investigación, la estadística tiene una nción decisiva Las Ciencias Biológicas en sus aspectos relacionados con la salud, y las Ciencias Sociales que han venido desarollando un gan aporte al campo de la salud, emplean métodos estadísticos no sólo con mayor fecuencia, sino cada vez más compleos y sofsticados en la investigación. La posibilidad de establecer relaciones entre la multiplicidad de variables que actan al fnómeno salud, requiere de la utilización sistemática y adecuada de métodos estadísticos. Hoy en día, con el uso de las computadoras se abren posi bilidades inmensas a la estadística en el campo de la investigación, es más, gracias a ellas, es posible la aplicación de esos métodos complejos. El trabao de investigación científca requiere de la utilización del méto do científco para su desaollo. Este método combina el proceso de inducción para obtener el conocimiento cientíco, más confable que la tradición y la experiencia o vivencia de las personas. El método cientíco implica un conjunto de procedimientos ordenados sistemáticamente para obtener un conocimiento cierto, veraz. La realización de un trabajo científco sigue una serie de etapas: Planifcación de a Investigación. Recolección de la infrmación. Procesamiento y Presentación de los datos Análisis e interpretación de los esutados. Elaboración del infrme fnal.
11. ETAPA DE PLANIFICACIÓN La búsqueda del conocimiento científco no puede ser una taea anárqui ca, guiada por la improvisación o por el azar, debe ser un rabao cuidadosa mente planifcado, donde se fen previamente os obtivos, los recursos y los procedimientos a emplearse durante la ejecución del mismo Fayad Ca mel plantea que plancar es esencial no sólo para calcular el tiempo de
20
duración de la investigación, el personal requerido y el presupuesto nece sario sino con eln de realizar el estudio con metas perfectamente eni das, evitando improvisaciones que puedan introducir errores, capaces de invalidar o desmeritar la investigación (Camel 1 979. p 1 7) La planicación de un trabajo cientfco es una tarea ardua y se estima que consume aproximadamente a mitad (e 50 % ) del tiempo total necesa rio para toda a inestigación Contiene una serie de subetapas as cuaes se inician a concebir la idea de inestigar sobre un tema en particular Al inicio e área de inestigación puede ser muy ampia o cua obiga a anai zar direntes aspectos que aden a eauar a coneniencia de centrar el estudio en alguna de las múltiples cetas del tema posibles de investigar. Para ayudar a denir el punto especíco a estudiar se recomiendan dos técnicas sencilas; la primera se lama diluio de ideas" y consiste en escri bir todas as ideas que surgen espontáneamente para luego ir ltrando cada una de ellas hasta quedarse con aquelas que sean más ctibles de reaizar. La segunda técnica sugiere discusiones sistemáticas del equipo de trabao acerca de os probemas apremiantes por resover en un área determinada as como la ctibilidad de realizar esas investigaciones. La idea de ambas técnicas posibes de combinar es promover e análisis de la ctibilidad de un tema de inestigación Cubierta esta etapa es recomendable elaborar un plan o proyecto de in vestigación donde se exprese anticipadamente y en rma escrita lo que se espera reaizar. A escribir el investigador se obliga a organizar sus pensa mientos en cuanto a problema a considerar De esta manera podrá darse cuenta si e estudio es ctibe si e diseño metodológico es consistente con os objetivos si cuenta con los recursos y e tiempo necesario para reaizarlo. Este plan contiene los detaes reacionados con las etapas posteriores de la inestigación como son: la recoección de la inrmación la presentación de os datos y el análisis de los resultados obtenidos. Legar a resumir en un pan escrito todos los aspectos a considerar en a investigación requiere de muchas horas de trabajo consumidas en reunio nes con e equipo de trabajo con persona de instituciones púbicas o pria das que puedan participar en el estudio (bien con el aporte de recursos hu manos o materiaes, o cilitando a muestra o a inrmación necesaria o el nanciamiento para la investigación) en entrevistas con expetos en el área de conocimiento del nómeno o probema que se estudia en la búsqueda y
21
revisión de la bibliograa sobre e tema en cuestión, en reuniones con los asesores y en muchas gestiones más. Una vez seleccionado e tema, se describe de a manera más exacta posi be el problema especfco a investigar. Esta tarea suee ser uno de los as pectos más dicies de concretar, especiamente para os nuevos investiga dores, quienes tienen tendencia a divagar en sus enunciados iniciaes, su mergiéndose en generalidades que originan consión y pérdida en a dirección de proyecto Ante esta sitación es conveniente disponer de un esquema sencillo, que oriente a investigador en la rmulación de plantea miento de probema, considerado e primer aspecto del proyecto. PLANTEAMIETO DEL PROBLEMA
Los especialistas en investigación entizan en la importancia de este as pecto dentro de proceso de a investigación, sin embargo, no hay homoge neidad entre eos sobre os elementos que o conrman A fn de ciitar esta tarea, se sugieren de manera esquematizada los pasos o los elementos que conrman e planteamiento del problema. ENUNCIADO DELPROBLEMA Una vez realizado e análisis de la siación considerada problemática, el investigador está en capacidad de enunciar el probema a investigar En este caso, enunciar es expresar concretamente QUE se va investigar y describir e probema de estudio Resu taría dici estabecer las etapas posteriores del proyecto si antes no se ha deimitado clara y concretamente el problema que se pretende investiga Por ejempo, el estdio "La Nutrición en el Estado Carabobo, puede resu tar muy ampio y general para una investigación especfca, aún cuando pueda ser adecuado para un proyecto de investigación más compejo. Es prerible afnar o precisar más y señalar un aspecto particuar de ese tema que se estudiará en una determnada zona del estado, por eemplo, "Nutrición en Menores de año, de Barrio Oeste de Naguanagua o "Nutrición en Ancianos del Barrio La Cidra de Naguanagua o "Problemas Nutricio naes en las Embarazadas que acuden a la Consuta Prenata de Ambulato rio de La Isabelica o "Nutrición en las Cárcees de Estado Carabobo o "Malnutrición en Escolares del Distrito Vaencia o "Relación Entre Obesidad y Tensión Arterial en Pacientes Atendidos en la Consulta de Cardiología del Hospita "Ange Larralde, de 990 a 1997 y aún cuaquiera de es tos tópicos puede delimitarse más si se quiere especifcar con mayor preci
22
sión lo que interesa estudiar. JUSTIFCACIÓN E IMPORTANCIA DEL PROBLEMA No todos los problemas enunciados tienen sufciente importancia como para justif car su estudio Existen problemas poco relevantes y carecen de valor cientfco. Se trata de presentar argumentos sólidos sobre la validez viabilidad, interés y signifcado del problema a investigar. Implica ello la necesidad de señalar el PORQUÉ se desea realizare dicho estudio pudiendo esto deter minarse entre otras frmas por la cuantifcación de individuos actados por el fnómeno o problema escrito (magnitud) por las consecuencias que dicho problema traera a la población si no es atendido (trascendencia) y por las posibilidades disponibles para resolverlo (vulnerabilidad). ORMULACIÓN DEL PROBLEM Aun cuando algunos textos utilizan indistintamente los términos planteamiento" y fmulación" del problema es prioritario aclarar que se trata de conceptos difrente La fr mulación del problema busca explicar con claridad los diversos elementos que lo confrman y las relaciones que éstos guardan entre s Este aspecto contempla además la descripión de como se realizará la investigación del problema inicialmente enunciado. En la frmulación se sintetizan y refejan los aspectos más signifcativos el planteamiento del problema. La frmu lación rma parte de este proceso. COMPROBACIÓN Y CONTROL DEL PROBLEMA. Una vez fr mulado el problema a estudiar es recomendable plantearse agunas pregun tas, con el propósito de compobar la claridad y precisión del problema descrito su viabilidad investigaiva y la pertinencia de todo lo dicho durante las difrentes subetapas el planteamiento. En síntesis, en el PLANTEAMIENTO DEL PROBLE se incluye: Enunciado del problema Imporancia del problema y ustifcación del estudio. Formulación del problema. Control del problema OBJETIVOS DE LA INVESTIGACIÓN
Al tener claro el planteamiento del problema, es posible defnirse los objetivos mediatos o inmediatos (PARA QUÉ), que se pretenden alcanzar
23
con la investigación. Este punto es crcial en todo trabajo, alededo del mismo giaán las etapas posteioes de la investigación Los objetivos constityen la meta hacia donde se oienta la investigación La edacción de estos debe se claa y concisa, siendo necesaio cuida la selección de los vebos que desciban la acción que se petende loga po ejemplo: descibi, calcula, detemina, establece, elaciona, compaa, evalua, diagnostica, etc La ecolección de los datos se haá en nción de los objetivos, a tavés de un instmento elaboado al eecto o seleccionado paa tal fn La elabo ación y pesentación de la inmación se oientaá hacia el logo de los objetivos y el análisis y las conclusiones estaán en nción de las inteogantes planteadas en los objetivos. Dada la impotancia de este punto, es vital la mulación de objetivos pecisos y ctibles de loga. No es conveniente plantease popósitos inalcanzables o ieales No deben mulase objetivos que equiean inmación muy dicil de obtene (confdencial) o cuya ente no sea accesible; o bien cuando el logo de los objetivos no dependa del equipo de investigación sino de pesonas ajenas a ésta. La defnición o especifcación de un poblema va unido a la ealización de una evisión bibliogáfca lo más detallada posible aceca del tema en cuestión El popósito es miliaizase con el mismo, amplia y pondi za el conocimiento de las vaiables elacionadas con éste, indaga aceca de la ma como ha sido abodado el poblema po otros investigadoes así como los esultados obtenidos y si existen coincidencias o contadiccio nes entre ellos En esmen la idea es pecisa cuanto se conoce en elación con el poblema de inteés. La investgación es un proceso que va de lo conocido a lo desconocido.
Son vaiadas las entes de donde se nute el investigado paa miliai zase con el poblema. Estas entes pueden inclui expertos en el tema, e vistas científcas, textos datos estadísticos, etc, las cuales deben se confables y evisadas con sentido cítico La inmación obtenida de ellas confgua el sopote teóico de la investigación, y es lo que en la liteata especializada se denomina "Marco Teórico .
24
MARCO TEÓRICO
Una vez que el investigado ha leído, evauado, esumido y clasifcado e mateial bibliogáco petinente, está en capacidad de conma un maco teóico de eeencia, que e pemita ubica a nómeno en estdio dento de un contexto teóico o conceptual. Sólo dento de ese contexto os esuta dos obtenidos pueden contbui a conocimiento, pues los datos aisados tienen poca utilidad o apicabidad. Una buena investigación no existe en el vacío Requiee de una exhausti va evisión de a liteatua paa conma a base de donde sugián nuevos conocimientos. Ta evisión debe se cítica y objetiva, tomando en cuenta no sóo los tabajos que apoyen as hipótesis de estdio, si no también aquelos que as contadigan. Sin embago, el maco teóico no puede se una see de citas de dientes autoes. Las ideas panteadas en él deben te ne coheencia y desaolo lógico. Es necesaio paaasea o esumi con enguaje popio o expesado en la liteatua consutada, y establece a elación ente os apoes de esas entes y el pobema en estudio, así como los aspectos que ya han sido aclaados y las interogantes aún pendientes. El marco teórico a niveles más especcos y concretos compren de la ubicación del problema en una determinada situación históri cosocial sus relaciones con otros fenómenos, las relaciones de los resultados por alcanzar con otros ya logrados como también eni ciones de nuevos conceptos reeniciones de otros, clascaciones tipologías por usar etc (Briones. 1981 44)
Son múltiples as nciones que cumple el maco teóico, de alí que esté conmado po vaos subsistemas, os cuales le popocionan sus caacte ísticas y asgos ndamentaes. La liteata especiaizada en e áea, co múnmente menciona dento de este aspecto, divesos subsistemas, siendo os más ecuentes: Maco históco. Maco conceptua. Sistema teóico. Defniciones de téminos. MARCO HISTÓRICO Reeido po algunos autoes como Antecedentes del pobema o Puesta al día de tema" Su popósito ndamental
25
es hacer un recuento histórico del fnómeno o del problema, desde sus orí genes hasta e momento de la investigación, a nive inteacional, naciona y regiona. E conjunto de trabajos anteriores reridos a probema, constituye los antecedentes de mismo, y permite determinar hasta donde ese problema ha sido investigado. Además servirá de marco, para el análisis de los resultados al comparar los propios hallazgos con los obtenidos en los anteriores trabajos, siendo esto lo que hace posible el avance del conocimiento. Las entes bibliográfcas con as cuaes se ha confrmado el marco de ben mencionarse en el mismo, a fn de dare crédito a sus autores, en cuyo caso se menciona entre paréntesis, e apelido del autor de la obra y e año de su publicación. MARCO CONCEPTUAL o bases teóricas Cada ciencia posee su pro pio cuerpo de conocimientos, con sus principios, sus leyes, sus teorías, don de se explica e porqué de los hechos Es justamente parte de ese cuerpo de conocimientos donde se apoya toda investigación, sirviendo de base o n damentos teóricos para edifcar sobre elos nuevos conocimientos, lo cual constituye e propósito básico de la investigación. Las distintas disciplinas del saber oecen mútipes ejempos sobre este aspecto. En el campo de a psicología, por ejemplo, pueden aplicarse diver sas teorías a estdiar un probema. La teoría de las motivaciones de Maslow; o las del aprendizaje social de Rotter; o teorías de a personalidad o de la disonancia cognoscitiva de Festinger, son de utilidad para enfcar pro blemas de actitudes hacia la saud. Estas bases teóricas permiten, en los diseños experimentaes, frmular hipótesis de trabajo, pues establecen rela ciones entre variabes claramente defnidas como independientes y dependientes. SISTEMA TEÓRICO el cual está confrmado por las variabes relacio nadas con el fnómeno y las hipótesis de la investigación. Las variables son características de os sujetos, las cuaes pueden tomar valores difrentes en cada uno de ellos; por ejempo el peso, tensión arterial, edad, sexo, valores de hemogobina, vaores de colesterol, estado de salud, hábitos aimenta rios, hábitos de mar, etc. Para Cerda (1991) las variables son conceptos clasifcatorios, que permiten ubicar a los individuos en categorías y cases, siendo susceptibes de identifcación y de medición
26
Estas variables, según el caso, pueden nconar como varables depen dentes o independentes. Se consderan variables independientes aquellas que NO son aectadas por otras variables; ellas "causan, "actan o "nuyen en otras variables. Al cambar las prmeras producen variaciones en las segundas, denominándose a estas últimas variables dependientes Ellas resultan "aectadas o "inuenciadas por otras. Sin embargo, la relacón de implicacón entre ellas no siempre es de tipo causal; pudiendo existr otras relaciones dierentes, por lo cual también se habla de relaciones multcausales. La condicón de independente o dependente es, en algunos casos, de carácter relatvo o metodológco Por ejemplo, en el proyecto de investigación "Uso de la medicina homeopática en el control de la obesidad, como varables asociadas a este problema de reducción de peso se menciona: la edad, el sexo, la estatra, la actividad sca, los hábitos alimentaros, el estado de salud y el tatamiento homeopático ( esta última como variable en estudio). En este proyecto, el peso se consdera dependiente y las demás ndependentes Sn embargo, en un estudo sobre "Hipertensión arterial , las variables: hábtos de almentacón, peso, hábtos de mar, stress, etc, nuyen sobre el problema en estudio. En este caso la variable peso es manejada como una variable independente Las varables son un recurso metodológico utlizados por el nvestigador para medir y manejar iertas características de su nterés. Muchas investigaciones buscan establecer relaciones entre las varables. Cuando esas relaciones se consderan nconales y se sustentan teórica mente se expresan a tavés de hipótesis, siendo éstas defnidas cmo la plcación temporal o tentava de la relación entre variables. La rmulacón de las hipótesis, al menos en ciertos tipos de nvestigacón, sugere la posbldad de medr las variables y los mecansmos para esa medción. Un ejemplo de este tpo de hipótesis puede ser: Hi:
"Los niños nacidos de madresfumadoras tienen menor peso que los nacidos de madres no fumadoras
En otras oportunidades, las hipótess se enuncan en nción a valores esperados, denominándose hipótess operacionales Ejemplo: Hi
"Con el nuevo medicamento el porcentaje de curación será mayor del 30% considerado normal para esa población
27
En el momento de redactar las hipótesis, es conveniente recordar los cri terios establecidos para su adecuada elaboración: as hipótesis deben ser redactadas en términos claros y sencillos Deben ser especfcas. Deben r mularse como afrmaciones, evitando los juicios. No deben comenzar con verbos, ni presentarse en rma interrogativa. Deben ser congrentes con los hechos confrmados Estas proposiciones tentativas sobre las posibles relaciones entre dos o más variables se denominan hipótesis de trabajo o hipótesis de investigación; y se simbolizan como Hi: Para la verifcación estadstica de las hipótesis de trabajo, el investigador se vale de la hipótesis Nula, la cual afrma que no existe relación entre las variables independientes y dependientes. Son el reverso de las hipótesis de investigación. Se simbolizan como Ho: as hipótesis nulas correspondientes a los dos ejemplos anteriores pueden ser: Ho:
Los hos nacidos de mujeres fumadoras tienen el mismo peso al nacer, que los nacidos de mujeres no fumadors
Ho
Con el nueo medicamento el porcentaje de curación será igual al 30%, considerado normal para esa población ".
Este tipo de hipótesis no suele presentarse de manera explcita en el plan de trabajo, sin embargo, en el momento de eectuar las prebas estadísticas para vericar las hipótesis de la investigación, se da por entendida su exis tencia También existen las llamadas Hipótesis estadísticas que son la transfor mación de las hipótesis de investigación y nulas en símbolos estadísticos. os dos ejemplos de hipótesis de trabajo y sus respectivas hipótesis nulas rmuladas anteriormente al expresarse como hipótesis estadsticas, quedaran de l siguiente manera: Hi µ1 < µ2 Hi: 1 >3 % ;
Hoµ 1 = µ Ho: 1 = 3 %
Las variables además de ser defnidas como independienes o epen · dientes, también pueden describirse de manera nominal y operacional En la defnición nominal de una variable se oece la interpretación de su signi
28
fcado a fn de evitar consiones o ambigüedades en la comprensión del término o de la variabe Por su parte la defnición operacional se refere a a enumeración de los indicadores que conrman dicha variable. En las investigaciones a nivel descriptivo este aspecto del "sistea teóri co puede obviarse. No así en una investigación a nive experimental o cuasi experimenta DEFINICIONES DE TÉRINOS o glosario Cuando en un proyecto se utilizan térinos que pueden ser interpretados de diversas maneras es indispensable establecer claramente el signifcado bao el cual será empleado dicho término en la investigación Esto tiene como propósto nifcar criterios en cuanto a su uso De alí a necesidad de elaborar este listado sólo cuando realmente se ustifquen su uso. MARCO METODOLÓGICO Una vez conrmado el marco teórico se constrye e marco eodológico u operacional es decir se defne COMO se realizará a investigación. Esta separación es sólo con fnes didácticos pues en la práctica el inestigador piensa simutáneamente en varias cosas a la vez. Al defnir os objeti vos, ya tiene una idea de como lograrlos a defnir las variables ya piensa en como medirlas e incuso puede tener ciertas expectativas en cuanto a os posibes resultados. Sin embargo para fnes de presentar el proyecto o redactar e inrme f nal y dado el carácter sistemático del método científco es conveniente tra bajar siguiendo un esquema básico de investigación El marco metodológico tiene como propósito describir en detalle la ma-
nera como se realizará la investigación: como se hará la recolección de los datos, como se procesará y presentará la información y como se realizará el proceso de análisis estadístico.
Cada una de esas etapas (recoección procesamiento y anáisis) requiere de técnicas y procedimientos particuares dependiendo de tipo de nvesti gación a reaizar Niveles y Tipos de nvestigación La literatura revisada sobre este aspecto presenta dierentes crterios de clasifcaciones de los niveles de investigación; aun cuando muchos autores
29
tienden a dividiros en: etudio decriptio comprtivo correlcion /e, experimentle y cui-experimentle. E Estos permiten tener un conocimieno de como se presenta un problema en una población (o pare de ea), a ecuencia con que ocurre (cuánto) y quiéne presentan determinadas caractersticas. Los estudios descriptivos buscan especifcar las propiedades encontradas en a pobación Miden o evaúan diversos aspectos. Con eos se describe un nómeno en la población en nción de porcentajes, tasas y promedios Los diagnósticos de comunidad pueden ser un buen ejemplo de los estudios descriptivos
Los etudio decriptivo se caracterizan porque resumen las caracters ticas encontradas en a pobación Presentan a magnitud del problema pre vaencia, incidencia). Describen os hechos o enómenos pero no os expica No requieren de hipótesis centraes expícitas. Representan el primer ni ve de investigación, aún cuando agunos autores consideran que puede existir un nivel previo a descriptivo como o es e nive exploratorio, donde se busca simpemente indagar sobre un tema o problema poco estudiado con anterioridad. Su propósito es miliarizarse con e probema cuando existe escasa inrmacón sobre éste. Los aa buscan conocer la asociación o relación entre dos o más variabes estudiadas en os mismos sujetos, de una muestra. Su utiidad radica en que permiten conocer e comporamiento de una variable, en nción de otra variable a ea asociada Los etudio correlcion/es se distinguen de os decriptivo nda mentamente en que, estos últimos buscan medir as variabes encontradas en a pobación, mientras que os correlacionaes pretenden conocer e grado de reación entre dos o más variabes estudiadas en una pobación. Los aa se referen a estabecimiento de dierencias entre dos o más grupos de interés, un ejempo puede ser la necesidad de ve ricar si dos comunidades presentan una determinada morbiidad con a misma ecuencia, o si e porcentaje de curación de las mismas enermeda des, entre dos hospitaes es dirente o no Requieren que os grupos sean comparabes a fn de que e estudio tenga sentido, y sus concusiones sean váidas.
30
Los estudios comparativos, también denominados analíticos o explicativos tienen como propóio conocer si existen direncias estadísticamente signicativas entre los gpos comparados. Este tipo de estdio requiere el uso de hipótesis de trabajo, tendientes a vericar las relaciones explicativas causales. Es un nivel de investigación más avanzado que el descritivo. Los estudios experimentales se caracterizan por la intoducción o ma nipulación" de una variable causal o ctor de riesgo, para luego conocer su ecto. Un experimento cientco se caracteriza por presentar tres propie dades: Manipulación de un ctor (también llamado tratamiento experi menta que el investigador administra a un gpo pero no al otro. Control por pare del investigador sobre una o más situaciones expeimenales. La introducción del gpo testigo o control permite garantizar esta propiedad. Distribución aleatoria de los sujetos asignados al gpo control y al gupo experimental. Para poder evaluar el efecto del factor causal es imprescindible conocer las características de ambos gpos antes de iniciar el experimento y medir posteriormente, de acuerdo al tiempo fado, el cambio o eecto roducido en el gpo de estudio. En muchas oportunidades no es posible realizar este tipo de estdio, en todas las ciencias En Ciencias de la Salud, en algunas áreas y por razones éticas, se diculta la experimentación de manera rigurosa. En la iencias Sociales, además de razones éticas en algunos casos, la complejidad de las variables y su dicultad para manipularlas y/o controlarlas, también limitan la investigación experimental. En los estudios eperimentales y cuasi-erimentales s intenta deter minar la inuencia de una o varias variables independientes sobre una va riable dependiente. a direncia estriba ndamentalmente en qe en los estudios experimentales el investigador manipula a su conveniencia la o las variables independientes y además asigna por azar, los sujetos a cada gpo En los cuasierimentales esto último no es posible (Poit, 1 99 1 ) En el caso de la investigación en salud muchas veces es más dcil iden tifcar un agene etiológico, que producir la medicina para combatrlo. Las investigaciones en cáncer son un ejemplo de lo que ha costado identifcar ctores cancerígenos. En oportunidades, un mismo equipo de nvestiga ción, con proyectos bien denidos, trabaja un problema a dierenes nive
31
les, pues un hallazgo conlleva a un nuevo problema y así de manera pea nente. Según e tipo de investigación, e estudio puede desarolarse de manera transversa longitudina retrospectiva o prospectiva dependiendo del mo mento de recopiación o registro de la inrmación sobre e nómeno estudiado. En os estudios transversales se miden una soa vez las variabes invoucradas; mientras que en los estudios longitudinales se miden en varias oca siones as variables con el propósito de conocer la evoución de as mis mas Implica seguimiento a través del tiempo. Los estudios retrospectivos permiten indagar sobre hechos ocurridos en e pasado empeando para elo inrmación registrada con anterioridad a a investigación; o buscando del pasado inrmación sobre el origen de mani staciones actuales como consecuencia de un hecho ocurrido tiempo atrás. Por ejemplo las exposiciones a ctores de riesgo en el pasado, próxi mo o remoto pueden provoca en la actuaidad manistaciones de sus ectos; o cual hace necesario indagar en los antecedentes el origen o la causa del enómeno que en la actuaidad se ha disgnosticado Por su parte, para os estudios prospectivos toda la inrmación se reco gerá con fnes propios de la investigación, siguiendo los criterios establecidos en e plan Agunos autores mencionan los estudios retro-rospectivos, donde se utiliza inrmación sobre hechos ocurridos anteriormente y el registro continúa una vez diseñado el estdio. El marco metodológico incluye también la descripción del Universo y de la Muestra, donde se reaizará la investigacón.
Población o Universo: Es la totalidad de sujetos o unidades de estdio que poseen determinadas características observables. Ej todos os habitan tes del estado Carabobo, o todos los niños menores de 1 año de Dtto Valencia o las mueres embarazadas atendidas en el Hospital Central de Vaencia en el lapso 1 990 1 997, o todos los pacientes con hiperensión arterial atendidos en la consua de cardiología del HCV durante el año pasado Muestra Pocas veces es necesario o posibe estdiar a toda la pobación, a menos que sea muy pequeña. Generamente se estdia sóo una pare de ea, la cua se denomina muestra, y se espera que esa parte o subconun to posea las mismas características del universo
32
En el proyecto de investigación o pan de trabajo se incluye e e e í e e con e propósito de asegurar que as concusiones obtenidas en los grpos de estudio (muestra) puedan inerirse a resto de la pobación En este diseño se describe: 1 E Marco mustra/ que es el marco de rerencia o sitio donde están ocaizadas todas as unidades de estdio de la pobación Este puede ser todos los elementos o unidades que conrman a población un archivo de historias, un mapa sico o plano donde estén incluidos todas as unidades de muestreo De la estrctura del marco muestral, de pende en gran parte, e tipo de muestra que se utiice, y as técnicas de recolección de datos 2 Unidad última d mustro se refere a cada uno de los elementos que será obeto de estdio en la pobación De cada unidad de muestreo se toma inrmación sobre las variables. Pueden ser individuos miias, obetos, radiograas, historias clínicas, etc 3 El tipo d mustra a utiizar, a cua puede ser probabiística (aleatoria simple estratifcada de congomerado, poietápica) o no probabiística (opináticas, errático y de vountarios) En caso de utiizar muestras probabilísticas, es conveniente mencionar también e procedimiento de azar mediante e cual se seleccionan as unidades de muestreo. 4 El tamaño d la mustra y la proporción que ésta representa de uni verso Es necesario que la muestra sea representativa de la pobación no sóo en calidad, sino también en cantidad. E marco metodológico incuye además, la dscripción dl instrumnto d rcolcción d datos así como las técnicas empeadas para al n. Los instrmentos debidamente elaborados o seleccionados para obtener la inrmación de manera completa y organizada. Su elaboración puede resultar dicil dependiendo de la cantidad de variabes a estudiar, por o cual deben estar en nción de os objetivos del trabajo En algunos casos puede ser necesario utilizar más de un instrmento Cuando se trata de hacer mediciones precisas de algunas variabes a través de cieros instrmentos, es conveniente conocer su cofabiidady vali dz, la primera se refere a a capacidad de instrmento para dar los mismos vaores cuando se aplica en diversas ocasiones, y la segunda a la capacidad de medir o que reamente se quiere medir.
33
Cuando la inmación es recogida por otas personas distintas al inves tigador es necesario aseguarse que conocen y manejan debidamente el instmento y la técnica de recolección a utilizar. En tal caso, deben recibir entrenamiento previo El uso de computadoras para procesar la información requiere de datos debidamente codifcados, lo cual debe considerarse en el momento de elaborar el instrumento. Antes de su aplicación denitiva es recomendable ectar una prueba piloto a objeto de determinar su n cionalidad. El otro aspecto imporante de la metodología es establecer claramente las técnicas de análiss a utilizar. Estas dependen del tipo de investigación de los objetivos y de las variables en estudio MARCO ADMINISTATIVO
Todo trabajo de investigación necesita recursos de diversa naturaleza según el tipo. Estos recursos deben ser previstos en el plan de trabajo y ga rantizar la disponibilidad de ellos Estos suelen ser: nanciamiento, perso nal equipos, bibliograa etc. además del tiempo en cuyo caso es conve niente la elaboración de un cronograma o ruta crítica para distribuir los pe ríodos en los cuales se realizarán cada una de las etapas subetapas de todo el trabajo de investigación Siendo pariculamente necesario cuando el tiempo pueda alterar los resultados del estudio Por lo tanto, en el marco administrativo se elabora un listado de los Recursos Humanos (nombre de los investigadores, asesores y colaboradores directos) Institucionales (patrocinantes o participantes) y Materiales (equipos reactivos tratamientos, materiales de ofcina etc.) necesarios para la investigación. REFEENCIAS BIBLIOGRÁFICAS.
Oto elemento de presentación imprescindible en todo proyecto de in vestigación o inrme nal es la bibliograa o rerencias bibliográfcas de las obras citadas en el marco teórico, o en cualquiera de sus paes lo cual pemite conocer las entes documentales que dan sopoe a a investgación. Por regla general, la rerencia comprende cinco elementos ndamentales a) autor o autores b) echa de la publicación; c) título de la obra; d) lu
34
gar de la edición; e) editorial Sin embargo, pueden requerirse otros ele mentos, dependiendo de los documentos citados. Las rerencias se orde nan alfbéticamente, según el apellido del autor. Tan importante es la presentación de la bibliograa como la rma en que ésta se ectúa. De allí la conveniencia de establecer normas para su co rrecta organización. La A.P.A Americam Psychological Asociation) pro puso unicar un estlo inteacional donde se consideran cada uno de los posibles casos Libros:
Comprende: Apellido del autor, coma, inicial o iniciales del nombre, punto, echa entre paréntesis punto, título subrayado o en lea cursiva, punto ciudad donde e editada dos puntos, nombre de la casa editora. Ejemplos: a) Si es un solo autor: Cerda H. 1991). Los elementos de la investigación. Bogotá El Búho. Gilbert, N 1981). Estadística México: Interamericana. b) Cuando son varios los autores todos deben indicarse separados por co mas, excepto el último quien va precedido de la conjunción y". Calello, H y Neuhaus S. 1990). La investigación en las ciencias humanas. Caracas: Fondo Editorial Tropykos. Scheaer, R., Mendehall, W y Ott, L.1987). Elementos de muestreo. México, D.F.: Grupo Editorial Iberoamérica. Nota: En el momento de citar estas obras en el texto, allí sólo se incluye el apellido del primer autor seguido de la expresión et al y el año. Por ejemplo: Scheaer et al 1987). Pero en la bibliograa todos los autores deben nombrarse como se mencionó anteriormente. c) Cuando el apellido del autor es muy corriente suelen incluirse los dos apellidos manteniéndose igual los demás elementos. Igualmente en caso de que el autor sea popularmente conocido con sus dos apellidos. Ejemplos: Heández Sampieri R. Feández C. y Baptista P. (1991) Metodolo gía de la investigación Bogotá: McGrawHill.
35
Prieto Figueroa L. B. (1985). Principios generales de la educación Ca racas: Monte Avila Editores d) Cuando se cita el autor de un capítulo de un libro, el cua es una compila ción; en la refrencia primeramente sea menciona al auor de capítulo año y títuo. Luego la preposición "En y seguidamente Iniciales y apelido del compilador del editor o del director; mencionando enre parén tesis esa condición: (Comp), (Eds ) o (Dtor). Título de a obra; luego, entre paréntesis núero de las páginas de capítulo consutado y por ú timo lugar de edición y editorial al igual que en la refrencia de cual quier libro. Ejemplos: Bartolomé, M. ( 987) Estudio de las variabes en la investigación en educación En J. Aau (Dtor.) Métodos de investigación en las Ciencias Humanas. (pp 0338). Barcelona España: Omega Sheter, M. (1997). Partidos intea y exteamene moviliados En J Preciado (Comp.) Auge y caída de las maquinarias polticas venezolanas. (pp 5 58). Valencia, Venezuela: Fuente Altea Nota En cuaquier rerencia donde la obra ha sido editada en un ugar poco conocido o en ciudades cuyo nombre se repite en otros países, en la refrencia se incluye también el nombre del estado o del país. e) Cuando exisen varias ediciones de la obra, el número de a edición consultada se menciona después de título Ejemplos: Méndez, , Guerrero, D, Moreno, L y Sosa, C ( 987). El protocolo de investigación. Segunda edición. México, DF: Trilas Polit D y Hungler B. P. ( 99 ). Investigación Cientca en Ciencias de la Salu Tercera edición. México, D.F.: nteramericana Cuando el autor es un Organismo o nstitución: Organización Panamericana de la Salud. ( 99) Manual de organiza ción y procedimientos hospitalarios. Sao Paulo Brasil: OP.S. Conseo Nacional de la Cultura (199 ) Presencia y luz de Armando Re verán. Caracas: Arte Artículos de revistas :
Además de los elementos contenidos en las refrencias antes mencionadas en el caso de las revistas se le agregan otros datos, tales como: Título
36
del artículo; número de a publicación volumen (si o tienen); número(s) de a(s) página(s) ocupada(s) por el artículo, y separados por guiones. Apelido del autor e inicial del nombre. Año de publicación (entre parén tesis). Título del artículo. Nombre de la revista (subrayado o en letra cur siva). Número de a revisa Volumen. Números de las páginas donde aparece e artícuo. Ejemplos Guzmán, C. (1997). Hablando de los libros. Revista Ciencias de la Educación 14, 261264 Moreno J., E. (1990). Sociedad y Ecología Nueva Socieda 107, 2126. Ruiz B., C (1996). La competencia tutorial. Planiuc, 22, 93118. Otros documentos:
a) Si a obra no ha sido aún pubicada, pero se conoce su prona pubicación, en lugar de la fecha, se escribe la expresión "(en prensa). Ejempo Puertas, E. (en prensa). Dversos enfoque de Educación para la Salu b) Si e documento no ha sido publicado y se desconoce su posible publicación, se indica con la palabra "(paper). Ejemplos: Blanck, E. (1987). Un modelo para plancar y desarrollar programas de Educación para la Sau Valencia: Universidad de Carabobo (pa per). Puertas, E., Barret, . y Piñate, A (1993). La revolución de los para digmas cientícos y la educación andragógica Vaencia, Venezuela: Instituto Inteacional de Andragogía (paper) c) Cuando se trata de ponencias presentadas en Congresos, Seminarios, Simposiums, Conferencias, etc. Se especica autor, año título, nombre del evento, ugar, mes y la expresión "paper. Ejemplo: Melet, N. (1991) Locus de control y rendimiento académico. XXIII Congreso Interamericano de Psicología San osé, Costa Rica 712 de julio. (paper). Puertas, E. ( 1 989).Locus de control y programas de reducción de peso Primer seminario inteacional de Psicología de a salud. La Habana,
37
Cuba. 14 de noviembre. (paper). Orden alfbético
a) La bibliografa debe ordenarse abéticamente según e apelido de au tor, o primer autor, en caso de que sean varios os autores b) Si se citan varias obras de un mismo autor, éstas se ordenan cronoógica mente: según el año de la publicación o si tiene varias publicaciones en un mismo año, después de año se cooca la etra "a, "b, "c, etc., según los meses en os cuaes eron presentadas. c) Si un autor además es cautor de otras obras, donde él fgura en primer ugar, éstas se colocan posterior a as obras individuales de dicho autor, ordenadas según e apeido del segundo autor; independientemente del año de la publicación. Ejemplos Romero García, O. (980). Locus de control, inteigencia, estats so cioeconómico y rendimiento académico. Laboratorio de Psicologa 1, oda. Romero García, O. (1981 a). Necesidad de logro, locus de control y rendimiento académico. Laboratorio de Psicología 19, oda Romero García, O (198 b). Motivación intrínseca, motivación de logro y valor incentivo de los estudios superiores. Laboratorio de Psicología 27, toda Romero García, O. (199 ). Motivaciones sociales y crecimiento psicoló gico. Mérida, Venezela ROGYA, C.A. Romero García, O y Pérez de Madonado, . ( 985) Escaa Levenson de ocus de control Análisis fctorial en Venezuea. Laboratorio de Psicología ULA 51, Toda. Romero García, O. y Salón de Bustamante, C. (1990). Poder, afliación, estrés y estado genera de salud. Memorias E VEMO, 3 , 444449. Por último, en el proyecto se incluyen los anexos, pudiendo ser de diversos tipos. Los instrmentos de recolección de la infrmación sueen incuirse en este aparte. En resumen e j contiene los siguientes aspectos, en frma general
38
tulo del trabajo. -
Planteamiento del problema Enunciado del problema Justcación de la investigación e importancia del problema. Formulación del problema. Comprobación y control del problema -
-
-
-
Objetivos de la investigación Generales y Especcs
Marco teórico Marco histórico o Antecedentes o Puesta al día del tema Marco conceptual o Bases teóricas. Sistema teórico: Denición de variables e Hipótesis de Trabajo (si las requiere) Defnición de Términos (si las requiere) -
-
-
Marco metodológico Nivel y tipo de investigación Descripción de la Población y muestra Diseño muestra!. Descripción de técnicas e instrumentos de recolección de datos Descripción de las tcnicas para el análisis estadístico. Marco administrativo: Cronograma de actividades o ruta crítica. Recursos humanos Recursos institucionales Recursos materiales.
-
-
-
-
Bibliograa Anexos
Un esquema similar se sigue para la elaboración del informe nal, una vez concluida la investigación. En tal caso es necesario incluir tres aspectos adicionales Resultados obtenidos Análisis e interpretación de esos resul tados (discusión), y por último las Conclusiones del trabajo y como aporte adicional, las Recomendaciones propuestas por el investigador en fnción de las conclusiones obtenidas En resumen el
Infrme Final
contiene los siguientes aspectos
Título del trabajo. Planteamiento del problema:
39
Enunciado del problema. Justcación de la investigación e importancia del problema. Formulación del problema. Comprobación y control del problema
Obetivos de la investigación Generales y Especcs. Marco teórico: - Marco histórico o Antecedentes o Puesta al día del tema - Marco conceptual o Bases teóricas. - Sistema teórico Denición de variables e Hipótesis de Trabajo - Defnición de Términos (si las requiere). Marco metodológico: Nivel y tipo de investigación Descripción de la Población y muestra Diseño muestra! Descripción de técnicas e ins trumentos de recolección e datos Descripción de las técnicas para el análisis estadístico. Resultados del estudio Cuadros estadísticos - Grácos estadísticos (cuando sean necesarios) - Análisis e interpretación de los resultados (Discusión de los resulta dos) - Conclusiones y Recomendaciones Marco administrativo - Cronograma de actividades o ruta crítica. - Recursos humanos - Recursos institucionales - Recursos materiales. Bibliograa Anexos
BIBLOGRAFÍA Briones, G. (19 8 ). étodos y técnicas de investigación para las ciencias sociales Bogotá: Uniandes.
40
Camel V., Fayad. (1979). Estadística Médica y de Salud Pública Cuara edición. Mérida, Venezela Talleres Gráfcos Universiarios. Canales, F., Alvaado, E L. y Pineda, E. B. (1989). Metodología de la in vestigación. Segunda edición Colombia: Carvaal, S.A. Cañedo D., Luis (1987). Investigación Clínica. México, D F. Neva Edi torial nterameicana. Cerda, H. (1991). Los elementos de la investigación Bogoá: El Búho. Ferero, C. (1971) Estadística, Medicina Sanitaria y Administración de Salud. Buenos Aires: El Aeneo. Heández Sampieri, R., Feández, C. y Baptista, P. (1991). Metodología de la Investigación Bogotá: McGrawHill. Hill, B. (1965). Principios de Estadística Médica. Tercera edición. Buenos Aires: El Aeneo. Mainlan, D. (1963). Estadística Médica Segunda edición México, D.F In teramericana, S.A. Méndez, ., Guerero, D., Moreno, L y Sosa C. ( 1987). El protocolo de investigación Segunda edición. México, D.F.: Trillas MoichauBeachaunt,J. (1971) La Salud en el Mundo. Barcelona, España: OikosTau S.A. Ediciones. Polit, D., Hungler, B. (1991) Investigación Cientca en Ciencias de la Salu Tercera edición. México, D.F. Interamericana. Seijas, (1981). Investigación por muestreo Caracas División de publicaciones de la U.C.V.
41
CAPÍTULO 1 Muestreo Universos o Poblaciones. Uniersos nitos o infnitos. Poblaciones cautivas. Muestras. Ventajas y desventajas de las muestras. os de muestras: Probabilsticas y No probabilsticas. Muestras Probabilsticas: Muestras aleatorias simples. Muestras estratcadas. Muestras de conglomerados. Muestras combinadas. Muestras polietápicas. Técnicas de azar Azar simple. Azar sistemático Tabla de números aleatorios. Muestras No probabilsticas Muestras opinticas. Muestras erráticas. Muestras de voluntarios. Características de una buena muestra. Tama ño de la muestra. Ejercicios.
43
l. UNIVERSO Y POBLACIÓN Desde el punto de vista estadstico se entiende por vo o o ó, a un cnjunt de sujets en ls cuales está presente una arias características bserables y que sn bjet de estudi. Defniro de esta ma nera tan genera pemite pensar en una gran variedad de universos: nume rosos escasos simples, compeos fnitos infnitos etc Sin ebargo, en todo caso o impoante es que el universo de interés debe ser deliitado para hacerlo maneable desde e punto de vista estadístico La delimitación de un universo de estudio, se da básicamente, bicándolo en e espacio y en el tiempo Es decir, e conunto de suetos de interés está constituido por aquelos cuyas características se estabecen en un mo mento y en un lugar especco. U Los universos pueden ser defnidos con relación a su extensión en nitos e infnitos Los primeros son imitados en cuanto a número de elementos. Siendo posibe enumerar a todas sus unidades. Por eempo os pacientes hospitalizados en una Clínica, os estudiantes de a Escuea de Medicina, os poductos macéuticos producidos por una empresa del ramo os cen tros asistenciales en un área del país, etc. Otras pobaciones conmadas por cantidades ilimitadas de nidades no pemiten ni siquiera rmarse una idea aproximada de cuantos elemen tos a integran por o cual se conocen con el nombre pblacines infnitas Algunos universos hablando estadísticamente son nitos y cativos. Es decir, se conoce e número de elementos que lo constityen y adeás se encuentran circunscritos en un espacio determinado Por o tanto pueden ser contactados cimente haciendo menos laboriosa a recolección de los da tos. Por ejemplo, os pacientes recuidos en un hospital, os ancianos residentes en una unidad geriátrica los escolares inscritos en un Centro de Enseñanza etc Este tipo de poblaciones audan a reaizar estdios ás com petos y precisos pero amentablemente, tienen la desventaja, de constiuirse en pobaciones con caractersticas muy imitadas por sus pro
45
pias condiciones, proporcioado muesas representativas sólo para el conglomerado de donde han sido extradas Este tipo de universos preseta la cilidad de oecer, casi de maera in mediata la lista de unidades que lo confrman, constityedo el marco muestra/, siendo éste idispesable para la selección de la muestra. De o existir el marco muestral, es acosejable construirlo ates de iniciar el proceso de muestreo
11. MUESTRAS
Indepedientemente del tamaño o complejidad del uiverso de iterés, lo usual e la ivestigación, es tabajar con una parte del universo que lo re presente, es decir, con un subconjunto del mismo en el cual estén presentes sus características de interés. Dicho subcojunto recibe el ombre de MESTR. Co ua muestra se busca que, estdiado ua porció reducida del uni verso se puedan obteer coclusioes similares a las que se tedran si se analizara la totalidad del universo. Aún cuando las muestras permiten eec tar este tipo de geeralizaciones siempre existe cierto margen de error, por lo cual, tales geeralizaciones o pueden ser absolutas. Si embargo, el margen de error, al cual está sometido todo estudio reali zado mediate muestras, puede ser controlado y reducido, de manera tal que no distorsioe los resultados obteidos en la muestra, con respecto a los del universo. Dicho e otros términos: no se produzca un sesgo en los estimados calculados en la muestra.
(sesgo: tendencia del estimado a desviarse del parámetro real.) (estimado Valor de una característica en el universo, pero calculado a parir de una muestra) Así mismo, el margen de eor, puede resultar mayor o meor, dependiedo del tipo de muestreo que se utilice Para Pardiñas (1979), el muestreo consste e seguir un método un procedimiento tal que al escoger un gruo pequeño de la oblación se pueda tener un grado de probabilidad de que ese pequeño grupo efectivamente posee las características del universo que se está estudiano (p 79). Se estima que so más representativas de la
46
población, as muestras obtenidas mediante procedimientos aeatorios, que aqueas seeccionadas a través de oos procedimientos. Ventajas de las muesas: Las razones por as cuales se utilizan mues
tras en lugar de todo e universo son, entre otras: 1) Periten ahorrar tiempo, recursos y trabajo 2) Con elas se puede obtener inrmación de mejor calidad, ás verás, con menos eores, dado que es menor el número de suetos a est diar, por o tanto, disminuyen as probabiidades de equivocación Permiten centar la atención en menor número de casos 3) Permiten la obtención de datos que de otra rma seías iposibe o grar, especialmente cuando por razones de análisis, os eleentos so metidos a estdio o a preba deben ser destridos en ese proceso Ej una muestra de sangre para efectuar un examen de hematoogía co peta 4) Cuando el universo es innito o muy extenso, la única rma de reali zar estudio en é, es ediante el uso de muestras A pesar de todas estas ventajas de las uestras, también se le atribuyen agunas desventajas o imitaciones Desventajas de las muestras
- En algunas investigaciones, cuando en e universo es muy pequeña la proporción de sujetos que presentan determinada característica, en a muestra ésta suele aparecer aterada, resultando ci evidenciar esa desproporción, por o cua, e uso de muestras puede parecer de poca credibilidad, especiaente para aquelas personas con escasos cono cimientos de uestreo E uso de muestras siempre genera un eror denominado error de muestreo, el ca representa la direncia que puede existir entre e estimado y e prámetro. Artunadaente, a magnitud de este eror puede ser caculado mediante as rmuas de error estándar, y redu cido a vountad, al aumentar e tamaño de la muestra Adeás, exis ten procedimientos estadísticos que permiten deteinar e tamaño adecuado de l muestra, utiizando las ulas de eor estándar
47
En esencia, a través de las uestras se pretende obtener estiados lo ás cercanos posibe a los vaores de universo o pobación. En este sentido es conveniente distinguir entre a exactitd y la precisión del estiado, al eecto, de un estiado se refere al grado en el cual éste se aproxima al parámetro. ó ide el grado en el cual un estadístico representa a su parámetro Por esta razón se hace rerencia a la precisión de los estiados uestraes ás que a su exactitud (Bisqueda, 1 989). TIPOS DE MUESTR: Probabilsticas y no Probabilísticas.
Teniendo en cuenta la estrctra y los procediientos de seección pueden distinguirse dos tipos de uestras, y dentro de cada uno de eas, direntes cases, as cuales reciben el nobre del étodo de uestreo que las produce, por o cual se habla indistintaente de tipos de muestras o de tipos de muestreo E prier tipo, denoinado Muestras aleatorias o Probabilsticas está basado en la Ley de los grandes núeros" y en el Cácuo de probabiidades" De estas dos eyes ndaentales para la Estadística se inferen aque las que sirven de base ás directaente a uestreo, a saber: Ley de regularidad estadística, según la cua un conunto de n" unidades toadas a azar, de un conjunto ayor N, endrá la probabilidad de po seer las características del conjunto ayor. Ley de la inercia de los grandes números estabece que en la ayoría de los nóenos, cuando una parte del conunto vara en una dirección, existe la probabiidad que otra parte, de igua taaño, varíe en dirección opuesta ey de la permanencia de los números pequeños a cua plantea que si una uestra, sufcienteente grande es representativa de la pobación, una segunda uestra de igual agnitd deberá ser seejante a la priera y si en la priera uesta se encuentran pocos individuos con características poco ecuentes, es de esperarse encontrar igual proporción en a segunda uestra e igualente en uestas sucesivas
Basándose en estas leyes, se estia que as muestras aleatorias, son ás representativas de universo de donde han sido eegidas; y sólo con ellas los resultados obtenidos pueden ser inridos y establecer concusiones váidas para el universo Adeás, periten ar, por adeantado, el grado de precisión deseado o error máxio peritido para los estiados" qe serán ob
48
tenidos en a muestra Solamente as muestas pobabilísticas son suscepti bes de tatamientos estadísticos, cuando se busca conocer a signifcancia de os resultados. En la conrmación de las muestras probabilísticas todos los elementos del universo tienen una probabilidad conocida derente de cero de pertenecer a la muestra y será el azar el que determine quienes la conformarán; además las unidades se seleccionan independientemente unas de otrs. TIPOS DE MUESTRAS PROBABILÍSTICAS.La literatura especializada en esta área reporta dierentes tipos de muestas probabilísticas, sin embargo en este capítulo se hará rerencia sólo a as utilizadas con mayor ecuencia. Muestras aleatorias simples- Se conrman al eegir por azar a n elmentos de una población de tamaño N, de manea que cada eemento dl universo tenga la misma pobabilidad de ser seeccionado para mar pate de a muestra.
E muestreo aeatorio simple es el método más sencillo, aunque no necesariamente más ácil, ya que requiere de un istado de todos os elementos de a pobación, o cua en opotunidades resulta aboioso en especia cuando se trata de universos aplios o dispersos. En este istado o arco muestra/ se enumeran los elementos de a N y luego, mediante procedimientos aeatorios se extraen separadamente los n elementos de a muesta. Se utiiza en pobaciones muy homogéneas, con vaianzas próximas a cero (con poca variabiidad). Los eementos que conrmarán la muesta pueden ser seleccionados del marco muestra! bajo dos modaidades: a) Con reempazaiento, donde cada uno de los eementos ya seleccio nados retoa nuevamente al conunto o universo, conrmando de esta manera pobaciones infnitas, en cuyo caso las unidades muestraes pueden rmar pate de la muestra varias veces b) Sin reemplazamiento, donde las unidades pueden ser seecionadas sólo una vez, y a serlo quedan excluidas del marco muestra! En este caso e muestreo recibe e nombre de irrestrictamente aleatorio.
49
Muestras aleatoias estratcadas. Para este tipo de muesreo se clsi fcan primero los elemenos de a población en clases o estratos (si es ue previo a la investigción no están casifcados) y luego se seeccionan de cada estrao, una muesta simple al azar En cada estrato esán agupado elementos similares, de manera que la varianza es pequeña y el grupo resul ta homogéneo También se busca que los estratos sean direntes entre sí que entre elos exista sufciene variación.
En el muesreo estratifcado no es necesario que odos los elementos en gan a misma probabilidad de selección, es sufciente con que engan algu na probabilidad de pertenecer a la muesra La frma en que se eligen los elementos n de la muestra en los esratos e denominada aación y puede realizarse de dos maneras: fación po porcional cuando se elige de cada estrato a misma proporció o porcentaje de eementos, esto produce n muestreo proporcional, siendo éste e má comúnmente utilizado. Según este procedimieno, aun cuando se utiliza el mismo porcentaje en cada esrato, el número de elementos en a muestra va ra de un estrato a otro dependiendo del tamaño del esrato en la población Aación óptima, donde se busca que la cantidad de cada estrao sea propor cional al número de elemenos y a la desviación estándar de la variable a medir Ese tipo de muestreo produce el menor error muestral. Muestras de conglomerado- En las muestras antes menionadas, as unidades de muestreo (sujeos u objeos elegidos para la muesra) coinciden con las unidades de estudio de análisis o de observación (sujetos u objeos en quienes se obsevarán las variabes de interés). En as muestras de conglomerados no se presenta es situación. En ellas se eligen al azar conjun tos o conglomerados de individuos en este caso no se seleccionan sujetos individuales sino más bien countos de individuos. Las unidades de mues treo son conglomerados, los uales deben ser inteamene lo más heerogéneos posibles en cuanto a las variables en estudio pero o más homogé neo posibe entre elos; esto es, que as variaciones inteas entre los ele mentos sean grandes, y entre los conglomerados las dieencias sean peqeñas
Es importante esablecer las dierencias entre estratos y conglomerados. Los elemenos dentro de cada estrato deben ser lo más homogéneos posi bles mientras que los de cada congomerado deben ser intemente hete rogéneos. Asimismo, los estratos entre s deben ser heterogéneos (un estra
50
to dirente a oo estrato, y os congloerados entre sí hoogéneos (un congloerado siilar a otro. Adeás, existe el uestreo de congloerado con estratifcación, tam bién denominado Muestras combinadas o mtas. La escogencia de los s jetos a estdiar se realiza toando de cada estrato del niverso n deteri nado núero de conglomerados. De esta anera se utilizan las ventajas de abos procediientos. Se recoge la infración en grpos y se antiene la representatividad de cada estrato del universo en la uestra. Muestras poletápicas- En grandes poblaciones, por su estrctura, las investigaciones selen resultar coplejas, lo cual difculta el diseño de técnicas de estreo sencillas. En estas circunstancias es conveniente realizar un ueseo por etapas, donde se van confrando estras sucesivas, con técnicas direntes, según sea el caso.
El procediiento indica qe lo priero es dividir el universo en áreas, siendo cada una de estas áreas defnidas coo unidades primarias de muestreo". De ellas se elige una priera estra Los eleentos que confran esta uestra se consideran unidades secundarias de muestreo ", de las cuales se efctúa una segunda elección, para confrar la segunda uestra En cuyo caso, sus eleentos reciben el nobre de unidades terciarias de muestreo " de donde nuevaente pede efctuarse ora selección, y así sucesivamente hasta llegar a las unidades últimas de muestreo " o unidades muestrales los cales confrarán la esa defnitiva para la investigación. Cada selección hecha sirve de base para ora selección ás peqeña. Por ejeplo, el universo de estdio puede ser un distrito, el cual se divide en áreas (unidades primarias de muestreo de donde se eligen al gnas que confrarán la priera uestra Luego estas áreas se dividen en sectores (unidades secundarias de uestreo) y de ellas se selecciona la segnda muestra, confrada en este caso, por algunos sectores. Estos sectores están distri buidos en anzanas o cuadras (unidades terciarias de uestreo y de ellas se elige otra estra refrida a las cuadras En estas cadras se encuentran ubicadas las viviendas ( unidades últias de estreo de las cuaes se eli gen algunas que confrarán la muestra de estdio. Distrito � Areas � Sectores � Cuadras � Vviendas
51
Si el propósito de la investigación es obtener inrmación sobe las ca racteísticas de las viviendas (tipo, mateiales de constcción, comodidades, servicios, etc.), ellas seán las unidades de estdio además de unidades últimas de muestreo. Peo si el popósito de la investigación es conoce ca acteísticas de los moradores ( edad, ocupación, grado de instucción, ingesos, morbilidad, etc.) de estas viviendas, ellas serán las unidades últimas de muestreo y sus ocupantes, las unidades de estudio. En resumen, las muestas polietápicas son muestras sucesivas, elegdas con técnicas dientes, puesto que las distintas muestas se obtienen sobre acciones o conglomerados vaiables del universo total En un estudio para conocer la mobilidad en menoes de 15 años en la ciudad de Valencia, dado lo complejo del universo es necesario pecisar el proceso de muesteo hasta llegar a las unidades de estudio, siendo en este caso los menoes de 5 años. En un muesteo po etapas puede pocederse de la manera siguiente a) Dividir a la ciudad en zonas de acuedo a las caacterísticas socioeconó micas de las mismas. b) Escoger de manera aleatoria dentro de cada zona, las áreas esidenciales en las cuales se ubican las unidades de muesteo: barrios, urbanizacio nes, etc. c) Una vez deteminados las áreas residenciales, se escogen al azar calles de cada una de los barios o urbanizaciones seleccionados. d) Una vez escogidas las calles, de nuevo, con un proceso aleatoio se escogen las viviendas (unidades últimas de muestreo) en las cuales se aplica rá la encuesta de morbilidad. e) En cada vivienda se determina si existen personas menores de 5 años (unidad de estudio) y se hace el estudio de morbilidad respectivo. En caso de no habe pesonas que satisgan las condiciones del univeso, se sustituye la vivienda por ota a fn de no disminuir innecesaiamente el tamaño de la muesta. TÉCNICAS DE AZAR:
En las muestras pobabilísticas, las unidades de muestreo son elegidas mediante procedimientos o técnicas de azar, como por eemplo: azar sim
52
ple, azar sistemático y la tabla de números aleatorios o números aleatorios generados por computadoras Azar simple: Esta técnica consiste en elaborar una lista con todas las uni dades que confguran el universo (marco muestral), numerando cada una de ellas; luego por soreo (loterías, bingo, papelitos, etc.) se van obeniendo los números que corresponden a las unidades de muestreo hasta completar el tamaño de la muestra deseado. Azar Sistemático: Se pare también de una lista completa de las unidades que integran el universo y se continúan los siguientes pasos:
a) Se calcula una constante, denominada K, la cual se obtiene de dividir "N (total de unidades en el universo) entre "n (número de unidades en la muesta. N K =n
b) Una vez calculada "K, se ectúa un sorteo para escoger un número igual o menor que K, ese número coesponde al primer sueto de la muestra. Para obtener los restantes suetos se le suma a ese primer nú mero el valor de K, luego al resultante se le suma K nuevamente y así de manera sucesiva hasta completar el tamaño deseado para la mues ra. Este método es práctico cuando el universo es numeroso Tabla de Númeos A leatoios: Se recomienda generalmente para mues tras pequeñas, consiste en el uso de una tabla constituida por fas y colum nas de números distribuidos completamente al azar. Existen varias versio nes de esta tabla, siendo las más utilizadas las preparadas por L. N. Tippett, Fishcer, Y stes, Kendall, entre otras, y cualquiera de ellas pueden conseguirse en los diversos textos de estadstica. También, en la actualidad se pueden generar números aleatorios por medio de la computadora usando los dif rentes paquetes estadísticos que se encuentan a disposición en el mercado (SPSS, STAGRAF STATPC, MYSAT, SIGMA, etc) MUESTRAS NO PROBAILÍSTICAS
Se caracterizan éstas porque a selección de los elementos no depende de la probabilidad, sino de otros ctores difrentes al azar La selección es subjetiva. Aquí el procedimiento no es mecánico, ni basado en frmulas de
53
probabilidades, éste depende de la toma de decisones de una o varas personas, o de otras circunstancas. Por esta causa, las muestras no probabilísticas pueden ser: opnátcas o ntenconales, circunstancales o errátcas y de voluntaros o de autoselección La muera pna requeren cierto conocmiento prevo de la po blación, por tal otvo el nvestigador está en capacdad de ndicar cuales elementos del unverso serán objeto de estudo, por considerar los "tíicos o representatvos del problema nvestgado. En s es el nvestgador, quen según su opnón y los objetvos del estdio, elige a los sujetos que conrmarán la muestra La muera runanae erráa se rman con los casos o elementos que el nvestgador tene a su alcance. Están consttidas por grupos de personas que en determnado lapso de tiempo acuden o transitan por un lugar especíco. Son muestras rmadas por sujetos errantes, para eecto del encuestador La muera de vlunar se conrman con los sujetos que deciden, por voluntad propia partcpar en la nvestgacón, una vez que conocen sus propósitos.
Utlzar una muestra probablística o una no probabilstca depende de los objetvos del estudio, del esquema de nvestgacón y de la contrbucón cientfca que dará dcho estdio Exsten oporunidades en las cuales se justfca el uso de muestras no probablstica, aún cuando éstas generalmente producen resultados sesgados y son poco representativas del unverso. CARACTERÍSTICAS DE UNA BUENA MUESTRA
Las condcones para que una muestra sea considerada buena es que sea adecuada en calidad y en cantidad La primera condcón vene dada por la representatvdad, la cual es más segura conseguir cuando la muestra se obtiene medante procedimientos aleatorios La segunda condcón se satsce mediante procedmentos matemátcos. Tamaño de la muestra
El tamaño de la muestra está en nción del tamaño del universo. Se dice que debe ser proporconal a éste Sn embargo, cuando el unverso es muy extenso, no es indspensable que la muestra sea tan numerosa como él; es
54
cuestión de determinar cual es la cantidad apropiada, a fn de que el error muestra! no acte los resulados y a su vez, no se derrochen recursos, al utilizar una muestra de mayor amao que la requerida. Existen rmulas que permiten calcular el tamao adecuado de una muestra cuando se espera una determinada precisión en los resutados. Las rmulas a utilizar dependen de la inrmación disponible. 1) Cuando se conoce el tamao del universo (N), se puede aplicar la siguiente rmula: n =
l + ( P2 )
donde n = tamao de la muestra. N = número total de suetos en el universo = precisión (error máximo permitido entre el parámetro y el estadístico), expresado en proporción. 2) Cuando se quiere estimar el promedio de una población y se conoce la desviación estándar de la población: 2
s n z
x
2
p2
donde n = tamaño de la muestra Z = 1,96 constante. Expresa el nivel de conanza. s = desviación estándar (conocida o estimada) de la población = es la precisión. 3) Cuando se conoce la proporción o porcenta e de la población que tiene la caracterstica de interés: n
p
x
p
q
donde n tamao de la muesra Z = l ,96 constante Expresa el nivel de conanza p = porcentaje de a población que tiene la característica de inte rés
55
q porcentaje de a población que NO tiene a característica de interés (q 1 p) P precisin. E.JERCICIOS
1 ) Se desea saber el porcentae de miias interesadas en os servicios de vacunación que oecen os servicios de saud de la zona. Se estima que e área de inuencia de dichos servicios abarcará unas 20.000 milias Se decide tomar una muestra en la cua e error máximo permitido en los resutados no sea mayor de un 5%. Se pregunta ¿Cuántas miias deben incuirse en la muestra? N 20.000 milias P 5% (005 expresado en proporción) N? N 20.000 = 392 n = --- l ( ) 1 + [20.000(0,5 )] =
2
2
Por lo tanto, la muestra requerida debe ser aproximadamente de 393 f milias 2) Un investigador tiene interés en conocer el vaor promedio de glucosa en sangre venosa de los pacientes que asisten a hospital donde él trabaa En la iteratura revisada encuentra que e vaor promedio de gucosa en sangre es de 83 mg/100 ml, con una desviación estándar de 5 mg/100 m, determinado con un método dierente al que é utilizará Está dis puesto a toerar 2 mg/100 m. como error máximo entre el vaor de uni verso y el de la muestra. Se pegunta: ¿Cuántos pacientes deben conr mar la muestra? S 5 mg/100 ml P 2 mg/100 ml Z 196 n ? 196 5 ____ 2401 2 La muestra debe estar conrmada aproximadamente por 24 pacientes. =
2
n
56
X
2
2
3 ) Se desea realizar una investigación sobre teniasis en una pobación donde, por trabajos anteriores, se ha estimado que la positividad a este parásito es de un 20% Se desea saber cuantas milias deben constitir la muesta, si el índice buscado no vare en más de un 6% con respecto al del universo. p q P Z n
=
=
20% (10020) 80% 6% 196 ? 2 X X 16 196 p
2
X
20 X 80 =
62
1 70'73
La muestra debe estar rmada aproximadamente por 1 7 1 milias. 4) Determine cuántas personas debe estudiar un investigador, para demos trar la existencia de una endemia de bocio, cuando se ha estimado, por trabajos anteriores, que la prevalencia de la enermedad es del 1 0%. Es pera que los resultados obtenidos en la muestra no varíen en más de un 2% con respecto a los valores reales del universo. (R: n 864 personas)
5) Se sabe que el valor promedio de glicemia es de 90 mg/100 c con una desviación estándar de 1 0 mg/ 1 00 c. Se desea realizar una investigación en la cual la muestra dé una media de glicemia no mayor del valor real en más de 0,50 mg/1 00 c. ¿Cuántas personas deben incluirse en la muestra? (R: n 1 5 37 personas).
6) Se desea realizar una investigación sobre enterovirs veiculares, en una población compuesta por 2000 milias. ¿Cuántas milias deben incluirse en la muestra, si se espera que el error máximo permitido no sea mayor del 6%? (R: n 244 milias) =
7) En una comunidad, los pogramas de planifcación miliar son aceptados por 8 personas de cada 1 0 encuestados. ¿Cuántas personas deben incluirse en una muestra paa determinar los conocimientos que tiene la población sobre estos programas, si el error máximo permitido es de 5%? (R n 246 personas) =
8) En una baiada constitida por 1 1 46 milias se desea realizar un diag nóstico de comunidad, para lo cual se tomará una muestra representativa
57
que admita un error máximo de un 5%. ¿Cuántas milias deben constitir la muestra? (R n = 297 milias) 9) En un estudio realizado sobe Incciones oportnistas y neoplasias de mayor ecuencia en pacientes con sida, en tres hospitales de Valencia, entre 990 y 1 996 se encontró un total de 88 pacientes, distribuidos de la siguiente manera HOSPITA
Paciente
HE.T GNZÁEZ PAZA HUA. TA
4 3 6 88
-
El estudio se realizó en los tres hospitales utilizando una muestra aleato ria equivalente al 75% del universo descrito, en cuyo caso para que dicha muestra haya sido representativa, indique que tipo de muestra se utilizó, y cómo quedó cuantitativamente constituida 1 O) En una edifcación escolar ubicada en la rb. La Isabelica, ncionan paralelamente dos escuelas: una en el to de la mañana (A) y la otra en la tarde (B). La del primer to tiene una matrícula de 840 alumnos, distribuidos en 20 secciones. a escuela de la tarde tiene 756 alumnos e 18 secciones. Ambas son de etapa básica de l º a 6 grado, con escolares en edades de 7 a 2 años; distribuidos de la siguiente manera º
Número de eccione en: GRADOS
Escuela A
ro
5 4 4 3 2 2 20
2do 3ro 4to to 6to TOTAL
58
Ecuela B
4 4 3 3 2 2
8
Se desea realizar el diagnóstico de saud de los niños de 7 a 12 años de esa zona, por lo tanto, se resovió ectuaro en una escuea alí ubicada. Para ecto de la investigacón se eegirá por azar una de as dos escuelas antes descritas, de a cual se estudiará e 50% de su población escoar. En espera de que a muestra sea representativa en cuanto a los grados, como quedará ésta constituida y que tipo de muestra se debe utilizar. 1 1 ) En un estudio donde se busca conocer a ecuencia y características de a incción por VPH y el uso del DIU, en mujeres que acuden a as consutas ginecoógicas en a ateidad de la Ciudad Hospitaaria Dr. Enrique ejera, durante el año 1 997, donde eron atendidas 3070 mujeres, distribuidas de la siguiente anera: USO DE DIU
PACIENTES SIN VPH
PACIENTES CON VPH
TOTAL
1.368 1432 2.800
207 63 270
1.75 1.49 3.070
SÍ N TOTAL
De esta pobación de estudio se confrmará una muestra aleatora del 25 % de las historias cínicas de estas mujeres atendidas Se pregunta que tipo de muestra se debe utiizar y como quedara constituida dicha mues tra, para que sea representatva, en cuanto a las dos variabes estudiadas. 12) A continuación se suministra infrmación sobre cien hospitaes del pas, distribuidos en nción de núero de servicios que prestan. N de servicios º
2 3 4 6 TTAL
N de hospitales
20 30 14 16 20 100
Se desea conocer los costos para la atención hospitaaria. Se espera fr mar una muestra aleatora de 1O %, por o tanto se pregunta que tipo de muestra se debe utiizar, y como quedara ésta constituida para que sea
59
representativa de la población. 1) Se planifca un estudio sobe el tiempo utilizado por el equipo de salud en la atención a los pacientes recluidos en cuatro hospitales de Carab bo. En la tabla sigiente se oece inrmación sobre el número de camas por tipos de sevicios, en los cuao centros. Número de camas en los hospitales:
ervicios Obstetricia Meicina Cirgía ediatría TOTAL
A 80 0 30 40 00
B 0 30 0
e
D
80 0
55
o
0 0
3 30 0 130
OAL 8 60 90 95
630
¿Qué tipo de muestra aleatoria debe utilizarse para que todos los hospitales, con sus respectivos servicios sean incluidos para conrmar una muestra de 2 camas? Numéricamente, ¿cómo estará rmada dicha muestra?
BBLIOGRAFÍA Aorin, F ( 1 970). Curso de muestreo y aplicaciones. Segunda edición. Ca racas: Dirección de Publicaiones. UCV. Bancro, H ( 1 90) Introducción a la Bioestadística Buenos Aires Editorial Universitaria. Bisqueda, R. ( 989). Métodos de investigación educativa Barcelona, España: Ediciones EAC. Camel, F. ( 1 979). Esadística Médica y de Salud Pública Cuarta Edición. Mérida, Venezuela: Talleres Gráfcos Universitarios. Universidad de los Andes Cochran, W ( 1 985). Técnicas de Muestreo México, D.F.: Continental. Daniel, W., W. ( 197 ) Bioestadística: Bases para el estudio en las Ciencias de la Salu éxico DF.: Lemusa.
60
Gómez, F. (1976) Estadística aplicada Caracas: División de publicacio nes de la Universidad Cenral de Venezela. Gonzalvo, G. (1978). Diccioario de Metodología Estadística Madrid: Morata. Heández Sampieri, R, Feández C. y Bapisa, P. ( 991) Metodología de la Ivestigació Bogotá: McGrawHill. Pardiñas, F. (979). Metodología y Técicas de Ivestigación e Ciecias Sociales. México, DF.: Siglo XXI Editores. Polit, D. y Hungler B (199 ). Ivestigació cietca en Ciencias de la Salu Tercera Edición. México, D.F.: Interamericana. Runyon, R y Haber A. (987). Estadística para las Ciecias Sociales. Cuarta edición. México, DF: AddisonWesley Iberoameicana. Scheafer R. y Mendenhall, W. (989). Elementos de Muestreo. México: Grpo Editorial Ieroamérca. Seijas Z , F. ( 981) Ivestigació por Muestreo. Caracas: División de Pu blicaciones de la U.C.V. Slonim M, J. ( 960) Samplig. N ew York Editado por S imon y Schaufer.
61
CAPÍTULO 1 Recolección de información El proceso de recolección de los datos. Escalas de medición. Fuentes de informa ción Fuentes primarias y fuentes secundarias Instrumentos de recolección de datos Tipos de instrumentos Validez y Coabilida Técnicas de reclección de datos: Observación. nterrogatrio Revisión documental. Ventajas y desventajas de cada una de ellas
63
l. EL PROCESO DE RECOLECCIÓN DE LOS DATOS La Etapa de recolección de los datos involucra una serie de actividades estrechamente vinculadas al éxito de la investigación, el cual depende de la: 1 Elección adecuada de la ente de inrmación. 2 Elaboración o selección del instrmento de recolección de datos, el cual debe ser acorde con los objetivos de la investigación y las varia bles en estdio 3 Administración del instrmento de recolección. Al plantearse un problema en el área de las ciencias de la salud, es nece sario pensar en el tipo de inrmación requerida para resolverlo se tipo de inrmación debe defnirse en nción de los objetivos del trabajo a realizar y de la posibilidad de tener acceso a las entes donde se encuentra dicha inrmación El proceso planicado y sistemático por el cual se obtiene la in rmación para resolver el problema, se conoce con el nombre de RECOLECCIÓN y su objetivo es compilar los datos de la investigación. Para entender con mayor claridad los elementos ndamentales de la re colección, es indispensable denir algunos conceptos básicos. as unidades de estudio, de donde se obtendrá la inrmación pueden ser tejidos bacterias, parásitos, muestras de sangre, animales de laboratoro u hom bres; o historias médicas, expedientes, inrmes, etc. Cada unidad de obser vación permite tener parte de toda la inrmación requerida en la investigación, y al ser debidamente registrada constitye lo que se denomina DATO o conjunto de datos Los datos estadísticos en muchos casos constituyen una MEDICIÓ, la cual puede defnirse como la asignación de un valor numérico a una deter minada observación o la expresión numérica de una observación. Al reali zar observaciones es cil notar que aún en grpos homogéneos, no todos los sujetos de estudio aportan iguales mediciones sobre el mismo nóme no. Por ejemplo, si se determina el número de colonias de bacterias en varias siembras, es ecuente observar que no todas las siembras tienen el mis mo número de bacterias. Del mismo modo, al revisar un grpo de historias clínicas en un hospital, no todos los pacientes han ingresado con el mismo diagnóstico Esto indica que existe una variabilidad entre los sujetos u obje tos bajo estudio y que las características que se buscan conocer en ese un
65
verso, son variables. Cuando una caracerísica oma valores derenes en las diversas uni dades de esudio, se defne como una variable. En ra ás precisa una variable es un recurso meodológico que permie la conversión de un con cepo absraco en uno observable (Sorokin Lazarsld y oro 1 977) Des de el puno de visa esadísico lo ndaenal es edir las variables de la anera ás precisa posibles, así coo sus relaciones entre ellas. Si se piensa en odas las caracerísicas posibles de medir en una uesra se eniende que no odas pueden ser edidas de igual rma, pues no poseen la misa natraleza. Para resolver ese problea se han creado las escalas de edición, donde las variables de nauraleza direne puedan ser expresadas en diversas escalas: nominales, ordinales, de inealo y de ra zón visas en el primer capítlo.
1. FUENTES DE INFORMACIÓN Al hablar del proceso de recolección de los daos se ha encionado la necesidad de defnir con claridad la uesra de donde se obendrá la inr ación es decir cual es la ene que la posee y que la proveerá dado que esa ene puede ser pimaria o secundaria. En rabaos de obsevación o experienación en el área clínica, las uni dades de obseración pueden ser los propios pacienes, o uesras de eji do órganos culivos ec. en cuyo caso el invesigador iene a su disposi ción la fuene original de los daos. En esas siuaciones obiene la informa ción direcamene de quien la produce Uiliza así una t Las enes primarias son convenienes cuando se necesia una inrma ción de priera ano, sin elemenos que pudieran disorsionarla o odif carla. Cuando el invesigador quiere garanizar la calidad de la inración recue al uso de ese ipo de ene.
Ft S: Aún cuando en la ayoría de las invesigaciones es recoendable obener la inración direcaene de la ene de orgen en ocasiones suele aprovecharse la información previamene regisrada por oras personas cn propósos adminisraivos de servicio o de oras invesigaciones Los estdios rerospecivos, sólo pueden eecuarse con la inación regisrada en una ene secundaria.
66
Ejempos tpicos de entes secundarias ecuentemente utiizados en Ciencias de a Salud son las historias médicas archivadas en os dirente servicios de saud; o os Anuarios de Epidemiología y Estadísticas Vtales pubicados por e Ministerio de Sanidad y Asistencia Socia Sin embargo, estas entes, al igual que muchas otras del mismo tipo, presentan grandes imitaciones, en cuanto a a caldadde la información que poseen No siem pre es totalmente confabe a veracidad de a inrmación alí registrada (puede haber error en e diagnóstico, por ejempo), o son incompletas a no poseer toda la inrmación requerida, lo cual es muy ecuente que ocurra O a inrmación sobre las variabes de interés puede haber sido registradas en escaas de medición dierentes a la prevista, imitándose as as técnicas de anáisis estadstico a apicar O bien, la inrmación recopilada en esas entes no está actualizada (no es oportuna), como es el caso de los Anua rios, os cuales generalmente se publican con tres, cuatro o más años de atraso. La inrmación recopilada en as entes secundarias ha podido ser registrada de manera continua, periódica u ocasiona. El registro continuo es aquel que se eectúa diariamente, en a medida en que e enómeno ocurre. Requiere de una organización permanente y contiene inrmación rerida a un argo período de tiempo. Ejempo: Archivos de Historias clínicas en ta caso, el marco muestra está constitido por las historias médicas corres pondientes a perodo de tiempo estdiado.
El registro periódco se eectúa cada cierto período de tiempo fo. Por ejempo, cada 1 años se recopia la inrmación de los Censos de Población. Por su parte, la inrmacón ocasional es aquela registrada esporádicamente, sin ninguna periodicidad y por coros períodos de tiempo Gene ramente los datos otenidos para ectos de investigaciones son registrados bajo esta modaliad Un eemento importante a evaluar en e momento de eegir a ente de inrmación es su calidad; donde se consideran dos criterios básicos La accesibilidad, y la buena inrmación.
La accesibilidad se reere a la posibiidad de disponer de la inrmación en e momento requerido, de acuerdo al cronograma elabora do para la in vestigación Una ente accesibe es aquella que para su consulta no presen ta mayores difcultades de tipo administrativo, egal o ético, por supuesto que, conservando a confdenciaidad y discreción que todo caso amerita.
67
Esto en lo relacionado a la accesibilidad administrativa; dado que es igualmente conveniente considerar la accesibilidad geográfca de la ente. Cuan distante se encuentra del sitio de trabajo o ue tan dispersa está o si el lugar donde se halla resulta peligroso" para el investigador. De la evaluación de estos elementos, e investigador puede orientarse ara elegir la ente de inrmación en nción de las características de su universo de estudio Para que una inrmación sea considerada de buena calad, ésta debe ser f dedigna (cierta, real, apegada a la verdad de los hechos), completa (que aporte inrmación sobre todas las variables de interés) oportuna (que sea una inrmación actualizada, vigente) y por último que sea pertinente (los datos deben guardar relación con las variables en estudio) La escogencia adecuada de la ente de inrmación es ndamental para que la inrmación recogida resulte de buena calidad y permita llegar a con clusiones válidas
1. NSTRUMENTOS DE RECOLECCION DE DATOS
l proceso de recolección de la inrmación debe realizarse en rma sis temática y organizada Los insrmentos se elaboran en nción de los obje tivos y de las variables a medir, y deben incluir ítems rerentes a todos los datos necesarios para el trabajo. Para su constrcción no exste una rmula claramente denida, y esta tarea puede resultar más o menos complea dependiendo de la naturaleza de las variables en estdio Sin embargo, la literatura especializada en el área, menciona una sere de recomendaciones a seguir en este proceso de cons trcción de instrumentos de recolección; entre ellas se tiene: 1 Las preguntas deben ser claras y concisas, de manera ue resulten á ciles de comprender or las personas a quienes van dirigidas No de ben dar lugar a intereaciones dudosas o lsas, ni exigir excesivo trabajo a uienes han de responderlas 2 Las preguntas eben dar lugar a una sola interpretación, inequívoca e inmediata 3 Las preguntas no deben sugerir las respuestas
68
4 Cada pregunta debe contener una sola dea y reerrse a un sólo suje to, de otro modo se core el resgo de consón. 5 Debe cudarse el númeo de preguntas Se ha comprobado que el exceso de preguntas dsmnuye la caldad de las respuestas y aumentan el porcentaje de abstencón por cuanto produce tga o cansanco en el nterrogado 6. Deben nclurse solamente preguntas que tengan relacón drecta con el problema en s y con los objetvos de la nvestgacón 7 Sempre que sea posble deben elaborarse preguntas cerradas (Sí o No) o de abanco (con varas alteatvas), en lugar de preguntas abertas donde el nterrogado responde con sus propas palabras. Es tas últmas resultan dcles de computar 8 . Sempre que sea posble, deben evtarse las preguntas sobre temas muy personales o prvados 9 Igualmente debe cudarse el orden en que se presenten las preguntas ya que un tem colocado en un lugar nadecuado puede nur en las respuestas de otros En la elaboracón de un nstrmento de recoleccón de datos tambén es mporante la presentacón del msmo de allí la necesdad de segur algunas sugerencas: 1 . Debe contene una nota de presentacón: En ella se pueden nclur los sguentes aspectos: Explcacón de la fnaldad de la encuesta, de los benefcos que los resultados de la nvestgacón pueden aportar a la comundad así como del uso que se le dará a la nrmacón obtenda Solctud de colaboracón a los encuestados y sncerdad en sus respuestas para lograr el éxto de la nvestgacón Esto tambén puede hacerse a través de una carta personal. Nombre de la entdad o nsttcón que realza la investgacón lo cual le da seriedad y responsabldad a quen ectúa la nvestgacón. 2 Instuctvo para contestar: Todo rmularo debe r acompañado de un nstrctvo en el cual se explque la rma en que debe ser responddo
69
3 Aspectos materiales y estéticos: La hoja o lleto debe tener un tamaño conveniente que cilie su manipulación Cada pregunta debe tener sufciente espacio para las respuestas Es conveniente también que los mularios se constryan ya codifcados para cilitar su posterior procesamiento y análisis, cuando se tiene previsto realizar éste a través de computadoras. El rmulario debe ser exhaustivo, pero perinente, es decir, contener la inrmación requerida para el tra bajo, evitando la inación superua. En opotunidades, el investigador puede utilizar instentos de reco lección ya elaborados con anterioridad para abajos similares, en especial Escalas para medir vaables, generalmente de tipo Psicosocial, tales como la "Escala de ntealida-Extealidad , de Levenson, para medir la va riable Locus de Contol, o la "Escala de Gaad , para medir siuación socioeconómica o el Inventario Multásico de la Pesonalidad de Min nesota ", para estudiar algunas psicopatologías; y muchas otras escalas o tests de usos ecuentes En todo caso, bien sea que el investigador diseñe sus propios instrmentos de recolección de datos, o utilice uno elaborado anteriormente, es con veniente conocer la Validez y Confabilidad de éste, de tal manera que los resultados obtenidos merezcan confanza, al existir mayor segudad de haber medido realmene la variable que se esperaba medir. La alidez y la Conabilidad son dos requisitos esenciales que debe reunir todo instrmento de medición o de recolección de datos.
V La validez de un instumento de medición representa un critero ndamental para evaluar su calidad y adecuación, y denota el gado con el cual el instumento mide la vaiable que con él se desea medi Por ejemplo, quien elabora un instmento para medi las actitudes de los médicos hacia los enf emos de SIDA. ¿Cómo puede estar seguro de que las puntaciones obtenidas con ese instmento, reejan realmente o de manera válida tales actitdes, y no otra vaiable, como podría ser, conocimiento sobre esa enrmedad? El problea de la validez se centra alrededor de este planteamiento. El investigador está midiendo realmente el atributo que en su opi nión intenta medir?
70
Un insumeno válido permie hacer un diagnósico real de la siuación o caracerísica estudiada. Paa deeminar la validez de un insmeno es necesario analizar su Sensibilidad y Especicidad.
La sensibilidad se reere a la capacidad de un insrumeno de dar un resulado posiivo, cuando el sueo analiado iene realmene la variable en esudio El debe pemiir idenicar o diagnosicar a quienes poseen la ca raceísica que se busca medir Por eemplo, en una encuesa epidemiológica la sensibilidad se reere a su capacidad de idenifcar correcaene a los enrmos que rman pare de la población La especcidad se reere a la capacidad del insumeno de dar un resulado negaivo cuando el sueo analizado no iene la variable en esudio. Ese insrumeno debe permiir idenicar a quienes no poseen la caracerís ica que se busca medir En el ejemplo de la encuesa epidemológica, la es pecicidad se reere a su capacidad para idenicar corecamene en la población, a las personas que no ienen la enrmedad esudiada (Cañedo, 1987) Es de esperarse que un insrumeno posea una elevada sensibilidad y es pecicidad simuláneamene con el n de reducir el númeo de casos lsos posiivos y de lsos negaivos, así como idenicar adecuadamene los verdaderos posiivos y verdaderos negaivos. También es conveniene buscar la validez en oda écnica o éodo de diagnósico. La lieratura especializada menciona cuaro ipos de validez: de conenido, de crierio y de consruco y prediciva. Cada una de ellas se deermina mediane procedimienos direnes Además de la validez, odo insrmeno debe ener precisión o conabi lidad Confabilad
La cofabilidad es el oro crierio para evaluar la calidad de un insru meno, y esá rerida al grado en el cual su aplicación repetida produce iguales resultados, en la misma unidad de observación. Por ejemplo, si con un es de ineligencia, un invesigador mide ese consruco en una persona, y obiene un punaje de 115 punos en una primera aplicación; uego, dos días después, en una segunda aplicación el puna e de esa persona baa a 60
71
puntos, y en un ercer intento, pasados dos meses, obiene 1 30 puntos. En tal caso, ¿cómo se puede tener confanza en esas puntuaciones an cambian tes? Evidentemente que ese insmento no es confable (su aplicación re petida produce resulados distinos) sus resultados no son consistenes en el tiempo. Con un instumento confable, se espera la menor variación, en medicio nes repeidas, sobre el mismo enómeno. Para el cálculo de esa propiedad, existen diversos procedimientos, entre ellos: las pruebas repetidas o test retests la técnicas de las dos mitades o división por mitad; y las pruebas paralelas; el Coefciente aa de Cronbach y el Coefciente -20 de Küder-Richardson Estos dos úlimos procedimientos, generalmente son utilizados paa me dir Consistencia intea, que es oto elemento de la coabilidad Esá rerida a la homogeneidad de los tems con respecto al constcto a medir. Cuano mide cada ítem, por separado, la variable que mide todo el instr meno La validez y la confabilidad de un instmento no son caactersicas independientes una de ota Se afma, que un instrumento que no sea coa ble posiblemente tampoco sea álido. Cuando es el propio investigdor quien diseña el instumento de recolección, o uiliza uno creado por otros invesigadores, debe cerciorarse de su validez para medir realmente la caracterstica a medir. Es necesaio que el instumento haya sido validado para la población donde se realizará la in vestigación. Un instrmento uilizado paa medir las vaiables psicosociológicas, validado para una población, generalmente no posee la misma validez para oras poblaciones, con culturas, valores y costumbres direnes TIPOS DE INSTR UMENTOS:
Al hablar de rmularios o instrmenos de recolección de datos, es opotuno señalar las diversas modalidades que de estos existen os Cuestionarios: Son mularios para ser llenados por los mismos sujeos interogados, sin la intervención directa del encuestador. Exis ten dos variedades de cuesionario los posales y los de auo adminis tración. Estos últimos se aplican a gupos de personas que en ma colectiva, y con la presencia próxima del encuesador, responden el
72
instrmento Tienen la ventaa de garantizar el aprovechamiento máximo del tiempo, y permiten al investigador aclarar cualquier duda que pueda surgir, por parte de los interrogados Por su parte, los cuestionarios postales, son enviados, por cualquier medio, a la muestra, y ésta responde según interprete las preguntas frmuladas. No hay quien aclare las dudas, y generalmente, es muy bajo el número de cuestionarios devueltos debidamente respondidos Por lo tanto, se piensa que cuando sólo una pequeña pare de la muestra de infrmantes develve los frmularios llenos, resulta dicil suponer que estos constityan un segmento ico de la población. En tal situación, es inadecuado generalizar los resultados de los estdios a toda la población, dado que se ha utilizado na muestra sesgada. L t: Se conoce con este nombre genérico a los instrmentos de recolección utilizados para recoger infrmación, mediante la técnica del interogatorio directo (entrevista estructrada). Lt Ct Gí Ov: Sirven para registrar anotaciones producto de la observación y no de un interrogatorio Consta de un listado de características o comportamientos, presentadas en co lumna, y al lado de cada una de ellas, un espacio en blanco para indicar la presencia o ausencia de la caracterstica obserada en cada sujeto, o la ecuencia y duración conque ésta se produce A este tipo de insrumento también se la denomina isa de regisro L : Son instumentos utilizados para medir en rma cuantitativa, el grado en que un individuo posee la característica en estdio. Polit ( 1 99 1 ) dene a las Escalas como un insrumeno diseñado para asignar un pune numérico que coloque a los sujeos en un coninuo respeco al aribuo que se medirá (p 249). El propósito de estos instrmentos es distinguir cuantitativamente a las personas, según el grado en que poseen determinada caracterstica Por ejemplo, así como la escala de n termómetro permite establecer la dierencia entre la temperatura de dos personas una Escala que mida ocus de onrol puede detectar a los sujetos de orienación inea " de aquellos de orienación exea ". Dentro de esta categora de Escalas también pueden incluirse los Tess, por cuano su maneo" es similar. Se utilizan para medir actitu
73
des y variables psicosociales. Todos los insrmenos anes menconados se ulizan cuando el nvesgador obiene la inrmacón de una ene primaria.
Son insrmenos ulzados para omar una nrmación ya regsrada, con anerioridad a la nvesigacón, bien sea en un archvo de hisorias clncas, o un libro de registro de casos, o de ingresos a la emergencia de un hospial, o los daos de Anuarios, o cualquer ora ene secundara. Fichas:
Las fchas conienen un lisado de variables o nrmacón a buscar, y sus respecivos espacos en blanco, que serán llenados por el inves gador con nrmación conenida en los documenos consultados, se gún las variables en estudio.
IV. TÉCNICAS DE RECOLECCIÓN DE DATOS En una invesigación las écnicas de recoleccón de daos a uilzar esán en nción del ipo de ene de donde se obendrá la inrmación Cuando la nrmación no esá regisrada, es necesario acudir a su ene de orgen para obenerla, en cuyo caso se ilizan como écncas de recoleccón la ob servación de campo y de laboraorio, y el inerrogaorio. Cuando se uilza una ene secundaria la écnica de recolección de daos empleada es la re visión documenal. Ese méodo consise en obener daos o inrmación mediane los senidos, iene carácer cienífco cuando cumpla con los s guenes requisos: La obseración:
a) Sirve a un objeivo de nvesigación ya rmulado b) Es planifcada y controlada ssemácamene. c) Esá sujea a cmprobación y a conroles de valdez y de confabldad. Las observacones cienífcas requeren de examen, selección y regsro sisemáico de las varables o conducas, además de las siaciones ambienales donde ésas se desarrollan y que pudieran estar relacionadas con el problema nvesgad
74
Como técnica de recoección de datos, puede variar desde la no estrct rada hasta a estrcrada, siendo esta útima la más recomendabe, por cuanto la observación ha de reaizarse para a búsqueda de la inrmación requerida en e frmulario eaborado. Ventajas de la Observación
1 .Permite obtener a infrmación de manera directa sin interediarios y en e momento en que ocurre; con eo se evitan las defrmaciones produ cidas por el recuerdo o a memoria, o por as limitaciones de a expresión verba. 2 En ocasiones, no es necesario contar con la coaboración expresa del infrmante para aportar la infrmación requerida. 3. Permite obtener infrmación de sujetos que no estén en condiciones sicas o mentales de suministrara. 4 Los nómenos se anaizan con carácter de totaidad y aunque no es posibe aprender os resultados de todas as interrelaciones y otros aspectos, se ata de un procedimiento que aborda globamente a una problemática. Los nómenos pueden observarse en el mismo contexto donde se desarroan Desventajas de la Observación
1 . Sóo permite obtener infrmación de hechos presenes y de conduc tas obserabes, quedando excluidos os hechos pasados y os aspectos sub jetivos y opiniones de los individuos 2 No es adecuado su uso en muestras grandes y dispersas, pues resulta ría muy costoso 3 También, es necesario destacar que a obseracón requiere de aprendizaje y ejercicio Se puede mirar todo y no obserar nada. ¿Qué se quiere ver?, ¿qué es signcativo, esencial y qué no?. Son pregntas que el investigador debe hacerse constantemente si quiere que sus datos sean úties para responderse las preguntas previamente frmuladas El Interrogatori: Con este método se obtiene infrmación ediante
una serie de preguntas frmuadas a interrogado. Puede utilizarse en dos modaidades: El interrogatorio ora o entrevista y e escrito o cuestionario.
75
Ventajas del Interrogatorio:
Mediante esta técnica puede obtenerse inrmación reeria a hechos ocurridos en el pasado y a variables biológicas y psicosociales (opiniones, actitudes, expectativas, eseos), los cuales, por su misma naturaleza son casi imposible conocer dese aera Nadie mejor que la misma persona in volucraa para expresar lo que piensa, siente y ha vivido. Desventajas del interrogatorio
Para obtener la inrmación es indispensable contar con la colaboración y buena intención del interrogao, y de su buena memoria. La calidad de la inrmación está sujeta al recuerdo el hecho y a la disposición de compar tirla. La entrevista o inteogatorio oral, defnio por AnderEgg como una conversación cuyo propósito va más allá del simple placer de la plática En ella se presentan una serie e preguntas y respuestas por parte el entrevis tao y del entrevistaor, respectivamente. El entrevistador tiene como tarea conducir la conversación hacia la búsqueda de la inrmación deseada. Debe propiciar un clima de tranquilidad y natalidad, de tal manera que e entrevistado se sienta cómoo, y pueda ex presar sus opiniones honestamente y con la seguriad e que la inrmación por él suministrada será utilizaa de manera confdencial. El entrevistador ebe ar una imagen imparcial y crear un ambiente exible que estimule la espontaneida en las respuestas. Todas las opiniones del entrevistado eben aceptarse con naturalidad. El entrevistaor no debe manistar soresa censura y ni siquiera aprobación sobre la inrmación aporada por el interrogado. Para esto el entrevistador debe ser una persona que comprenda el valor y la importancia e caa dato aportado además de tener la capacida para oír y respetar en cada momento al enrevistado La preparación del investigaor junto a la veracida de las respuestas del entrevistado, el tiepo requerido y los costos, constiuyen las limitaciones más ecuentemente mencionaas de la técnica de la entrevista Ander Egg ( 1 972) señala las siguientes ventajas del interrogatorio irec to (entrevista) sobre el indirecto (cuestionarios postales):
76
Posibilidad de obtener mayor porcentaje de respuesta dado que es más ácil no responder una cara que rechazar un enrevisador Posibilidad de obtener una inrmación más precisa, po cuano en ciertas circunstancias pueden comprobarse de inmediao las "discor dancias en la inrmación suminisrada, o controlar la veracidad de las respuesas Posibilidad de captar el sabor de las respuestas; reacciones, adema nes, gestos, movimientos, tonos de voz, énsis, ec. En ese aspecto la superioridad de la enrevisa es evidene al permiir añadir muchas ob seraciones que consityen "la circunstancia de lo registrado Puede obtenerse inrmación de analbetas, o de personas que no es tén en condiciones sicas para escribir. Oece mayor exibilidad El encuestador puede aclarar y repetir las preguntas y adaparse más cilmente a las personas entrevistadas y a circunstancias concreas. Con respecto al interrogatorio indirecto o cuestionarios postales enre sus ventajas se menciona que al utilizar el correo como vehículo no requie re la presencia del investigador, y por lo tano, el coso de la recolección de los daos es meno y su cobeura geográca puede ser mayor. Además, la posibilidad de mantener el anonimao, cilia la sinceridad del interrogado al momento de oecer sus respuestas En cuano a las desventaja de los cuestionarios postales, se mencionan: 1 - El riesgo de recibir un elevado porcentaje de cuestionarios sin res puestas. 2- La exclusión de la muesra, a quienes no saben leer o escribir. 3 - La imposibilidad de aydar al inrmane cuando no comprenda las instrucciones o las preguntas. 4 - La difculad para vericar la inrmación recolectada. Como se ve, las venajas del cuestionario postal, son las desventajas de la entrevista y viceversa
77
La Revisión Documental
Cando la infmación está egistrada en na ente secndaia, se tiliza la revisión documental como técnica paa obtene los datos necesaios paa la investigación. En estos casos, no se tata de ecta n análisis de contenido de divesas obas, sino de obtene infmación de na seie de docmentos (histoias clínicas, infmes, expedientes, etc) donde se ha e copilado infmación peviamente, y con n popósito diente a la investigación planicada. A avés de esta técnica peden se contestados los planteamientos esta blecidos y expesados en n plan En los docmentos se analizan las ecencias en qe los hechos ocen. Po ejemplo, en los Anaios de Epide miología y Estadística Vital se buscan datos sobe mobilidad, motalidad y natalidad qe pemitan calcla tasas, tanto egionales como nacionales Datos paa se pocesados según los objetivos establecidos. Esto mismo pede aplicase cando se evisan infrmes de otras investigaciones ya ealizadas, o de docmentos pesonales.
BI BLIOGRAFÍA RECOMENDADA AndeEgg, E. ( 1 972). Introducción a las técnicas de Investigación Social Tecea Edición Benos Aies Editoial Hmanitas. Goode, W y Hatt, P. ( 1 970). Métodos de investigación Social México Tillas, S.A. Heández Sampieri, R., Feández, C y Baptista, P ( 1 99 1 ). Metodología de la investigación. Bogotá: McGawHill. Polit, D. y Hngle, . (1991). nvestigación Cientca en Ciencias de la Salu Tecea edición México, DF Inteameicana. Sabino, C. ( 1 98 6). Metodología de Investigación. Una introducción teórico práctica 2da edición. Caacas: Lagos
78
CAPÍTULO /V Procesamiento y Presentación de los datos El proceso de elaboración de los datos Subetapas Frecuencias absolutas Ran go Intervalo de clase Límite inferior y límite superior de una clase estadística. Centros de clase Elaboración de cuaros estadísticos. Partes de un cuaro Cua dros de distribución derecuencias, de asociación y de series cronológicas Grácos Tipos de grácos: Barras simples Diagrama circular. Histograma. Polígono de frecuencia. Curva integra Barras múltiles Barras proorcionadas. Líneas de tendencia Números índice.
79
ETAPA DE ELABORACIÓN O PROCESAMIENTO DE DATOS La elaboración de los datos consiste en resumirlos en cuadros o tablas, y en gráfcos esadísticos de acuerdos a los criterios u objetivos defnidos con anticipación Esta etapa se cumple en cuatro subetapas: Revisión de los datos; Ordenación y casifcación de estos; Computación de los mismos, y Presentación de la infrmacón. 1 La revisión de la infrmación en los rmuarios donde e recolec tada, tiene como fnalidad verifcar si ésta permite cumplir con los objetivos rmuados previamente. En caso de presentar alguna lla (recuérdese as cuatro caractersticas de una buena infrmación) susceptible de corrección, se procede a hacerlo en este momento, evitando as e procesamiento de es tos errores que conducirán a conclusiones erradas o flsas. 2Seguidamente, a fn de manejar con mayor ciidad a clasifcación y categorización de cada variable, los datos pueden ordenarse en las frmas más conveniente para e cómputo de las fecuencias, aun cuando este paso no es indispensable Si se trata de magnitudes éstas pueden ordenarse en sentido creciente o decreciente. Por su parte, la casifcación peite la confrmación de grpos de datos más homogéneos, colocándoos en estratos o cases estadísticas El procedimiento para la confrmación de as clases depende de tipo de variable en estudio, pudiendo ser éstas numéricas (discretas o continuas) o categóricas.
81
TABLA MAESR # 1
INFORMACION OBTENIDA DE LA CONSULTA EXTENA DEL AMBULATORIO RURAL DE LA AGUADITA, ESTADO COJEDES. 1997
SEXO EDAD M 4A M 6m 7m lA M 0m M !A A 9A 7A 2A 2A M 4A M 5A lA M 3A 4A 3A 8A 5A 5A M 8A M llm M 6A 9A 6A M 9A M A 3A M 7A 2A F F
F F F F F
F
F
F F
F
F
F
F
F
F
O. PESO 1 TALLA NURI 8 kg 84cm D Grve 66cm Normal 8 kg 68cm Normal 22 kg 26cm D Lee 8 kg 76cm Normal 2 kg 78cm Normal kg 78cm Normal 39 kg 54cm Sor 2kg 0cm D Moderd 5kg 88 cm Normal 4kg 87 cm Normal 9kg 4cm Sor 8kg 2cm Normal 8 kg 74cm D Lee 8kg 98cm Normal 9kg 02 cm Normal 7kg 95 cm Normal 3 kg 00cm D Moderd 22 kg 4 cm Noral 2 kg 0cm Normal 27 kg 30cm Normal 68 cm D Lee 2 kg 20cm Noral 26 kg 30 cm Normal 23 kg 6cm oma 33 kg 34cm oma 5 kg 88cm S/No 4 kg 97 cm Noma 24 kg 24cm Noma 2kg 89cm om_ ·-
7 kg
7 kg
EDO SEXO EDAD SO ALLA NC A 7 kg 22 cm D Moderd 7A 23 kg 28 cm Norl ! A kg 96 cm S/Norm 3 A 8 kg 77 cm D Grve M 5 A 6 kg 00cm D Leve M 8A 27 kg 26 cm Norml 8A 28 kg 24 cm Norml 5 A 3 kg 0 cm D Leve 4A kg 9 cm D Moded 9A 35 kg 38 cm Norml M 2A 0kg 82 cm Lee M 2A 9 kg 80 cm D Moderd M lA 36 kg 38 cm Norm M A 25 kg 30 cm D Leve lA 40 kg 40 cm Norml 4A 3kg 93 cm D Leve 77 cm Norm F lm M 3 A 0kg 84 cm D. Moderd 3 A 2kg 86cm D Leve l A 42 kg 8 cm Norml M 7m 9 kg 72 cm Norml 2A 7 kg 70cm D Grve 6A 5kg 06 cm D Leve 6A 0kg 95 cm D Gre M 7A 34 kg 6cm S/Nor M ! A kg 8 cm on Leve F l ! Am 97 kgkg ¡ 677 cmcm DD Leve M A 1 8 kg 68 cm D Moderda -
F F F F
F F F F
F F
9 kg
F
F
F F F
- F-�_l A 27 D. M oderad
Infrmación obtenida de las Hstorias Clínicas de Achvo de Amuaoro Rral La Aguada. Cojedes.
La elaboración de escalas nminales y ordinales resulta muy sencillo po cuanto se frman tantas clases como divisiones admie la vaiable en estu dio. Por ejemplo la variable cualitativa sexo contenida en a tabla maestra # 1 , sólo admite dos clases: masculino y femenino, acompañadas de sus res pectivas fecuencias absolutas
82
�
F
emenino Mascuino Total
36 24 60
El térmno frecuencias absolutas se reere a la cantidad de sujetos que poseen una característica específca y por lo tanto pertenecen a una categoría o clase detemnada. Se obtenen mediante el conteo o computacón de los datos En las escalas nomnales las clases se ordenan en rma decreciente to mando en cuenta las ecuencias, con la nalidad de dar mayor énss a la categoría más ecuente. Por su parte en las escalas ordnales las clases se ordenan en ncón de la j eraquía de cada categoría, y no de las ecuencias de éstas. Igualmente estas escalas se conrman con tantas clases como di visones admte la varable. Por ejemplo la variable Estado nutricional contenda en la tabla maestra # 1 , puede dstrburse en cico clase: Sobre la norma, Normal Desnutrición leve Desnutrición moderada Desnutrición grave con sus respecti vas ecuencas: Sobe la noma Nomal Desntrición lee Desnutrción moderada Desnutición grae Total
( 5 31
2
-
6 "·-
4
60
Por su pare la rmación de clases de las variables numéricas requere de un proceso más elaborado en el cual es necesario el cálculo de Rango (R) Intervalo de clase Límites de clase: Inferior (Li) y Superior Ls). El rango (R) es el recorrido de la arable desde su valor máxmo hasta su valor mínmo Se obtene mediante la direncia de estos dos valores exremos. Tambén se conoce con el nombre de Recorrido de la ariable o Campo de variación
83
R = X (ma.) - X min
Donde: XmJ = Valor máximo de la serie X(m = Vaor mínimo de la serie La taba maestra # 1 , también contiene inrmación sobre la variabe nu mérica Peso. Para a distribución de esa serie estadística en cases se buscan los valores extremos para calcuar e rango y luego el intervalo de clase Vaor máximo = 42 Kg. Valor mínimo = 7 Kg R 42 Kg 7 Kg 35Kg E ntr (le) se defne como el número de unidades de medidas a incuir en cada clase
Se obtiene mediante a división del rango entre el número de clases esco gido para frmar a escala. Este número de clases lo fa el investigador a conveniencia, siguiendo a recomendación de que es prdente rmar entre 5 y 20 clases ambos nclusive Rago J N de clases º
Para el ejemplo de a variable peso presentada en a taba maestra # podría distribuirse en seis clases: Rango = 35 Kgs Número de cases = 6 35 Kg = = J 5 '8 Kg 6
Dado que la serie sóo contiene vaores enteros e intervalo de clase caculado puede redondearse, aproximándoo a 6 Kgs. = 6 Kgs., lo cua indica que en cada case estadística se inclurán 6 pesos direntes comenzando por el menor vaor de a serie, el cua se considera e ímite infrior de la primera clase A este vaor se le suma el intervao de case caculado y se obtiene e ímite inrior de la segunda clase A éste de manera consecutiva se le suma el y se obtienen los límites ineriores (Li) de las cases restantes
84
Menor valor de la serie = Kgs. gs Interalo de clase = 6 K Peso en Kg. Li
7 3 9 25 3
-
--
�·
37
Una vez obtenidos todos los límites infriores (Li = valor menor de cada clase) de la escala se calculan los límites superiores de cada clase El límite superior (Ls) es el valor mayor incluido en una clase estadística Dado que en una buena escala sus clases deben ser mutuamente xclu yentes (los valores contenidos en una clase no se repiten en la sigiente), el límite superior de la primera clase debe ser una unidad ( o una décima o cen tésima, etc, en caso de utilizar valores decimales) menor que e límite infrior de la segunda case En el presente ejemplo, el límite infrior de la segunda clase es 1 3 , por lo tanto el límie superior de la primera clase es 1 2. Una vez obtenido el límite superior de la primea clase, los demás se obtienen mediante la suma conse cutiva del intervalo de clase tilizado en el ejemplo mencionado se tienen: 1 2 + 6 = 1 8; 1 8 + 6. y así de manera sucesiva Peso en Kg. Li -Ls
7 a 2 3 a 8 1 9 a 24 25 a 30 3 a 36 37 a 42
-
85
Es conveniente aclarar que en escalas numéricas continuas existen dos tipos de límites superiores: Límie superior aparente y Lmite superior rea. El primero es e que se escribe en la escala, mientras que el real es tácito. En e ejemplo utilizado, el límite superior aparente de a primera clase es 12; sin embargo, esta clase realmente llega hasta 12 kios y 999 gramos, es de cir, 0,001 gr antes de egar a 13 kios. Por ta motivo y para fnes prácticos, se considera que el lmite superir rea de cada case es igual a ímite in rior de a clase siguiente. Tal criterio es convencional y puede variar de un autor a otro. En cada clase de a escaa utiizada en e ejemplo quedan incluidos seis pesos direntes ( = 6) En a primera case, por ejemplo, se ubicarán a los niños de 7; 8; 9; 10; 11 y 12 kgs En la última clase estarán los de 37; 38; 39; 40; 41 y 42 kgs. Una vez rmada la escaa se computa cuantos sujetos corresponden a cada case, es decir, se obtiene la frecuencia absoluta de cada case Peso en Kg.
ecuencia absoluta (f
7 a 12 13 a 18 19 a 24 25 a 30 31 a 36 37 a 42 Total
25 14 9 5 4 3 60
También la variabe edad, incuida en la taba maestra # 1 puede ser dis tribuida en una escaa de razón. X(J = 11 años X( = O años os niños de meses de edad se consideran con cero años para trabajar con una sola unidad de medida) Número de clases = 5 Rango 11 años O años 11 años 2 años # de case 5 5
86
22 puede redondease a 2 años. Al hacer esta apoximación por defcto se pierden acciones impotantes del interalo po lo cual seá necesaio ma una clase más de lo pevisto Edad en años
�·
Oa 2a3 4a5 6a7 8a9 0 a 1 1 ota
f
16 12 10 8 8 6 60
Puede obserase que en luga de 5 clases e necesario frma 6 clases utilizando el mismo intevalo () calculado. Tal situación se pesenta siem pre que el intealo de clase se aproxima por defcto o el es producto de una división exacta. Po ejemplo, en la variable peso de la tabla maesta # donde el rango es 3 5 kg si se calcula el con 7 clases en la escala seá necesaio rea real mente 8 clases, paa que la escala sea exhaustiva.
=
Rango 35Kg = S Kg 7 # de clases Peso en Kg
7 11 1 2 16 17 21 22 26 27 31 32 36 37 41 42 46 otal
f
21 4 8 7 3 4 2 1 60
-
-
87
Una buena escala, además de ener clases muamente excluyenes am bién debe ser exhaustiva, lo cual signifca que debe disponer de las clases necesarias para que todos los valores o daos de la serie esadísica puedan ser ubicados en su clase respeciva Ningún valor debe quedar sin ubicación. Por tal moivo en el ejemplo anerior hubo necesidad de agregar la clase de 42 a 46 kgs, dado que e límie superior de la sépima clase e 4 1 dejando era al niño de 42 kgs. y en tal caso la escala no sería exhaustiva Para que esto no ocurra se adicionan las clases necesarias sin hacer modifcaciones a los cálculos realizados aneriormente. Cuando los sujeos son ubicados en sus respecivas clases, pierden el ca rácer individual que tenían en la serie original por lo cual es necesario buscar para cada clase un valor que represene a todos los valores contenidos en ellas Ese valor representaivo de los valores de cada clase se conoce con el nombre de cnt d c o puno medio o marca de clase Es el valor cen ral de cada clase por lo cual la divide en dos partes iguales Se simbolizan como Xm o C y se calculan mediane la rmula: Li + Ls ( real) = Xm 2 Xm = Punto medio o Centro de clase Li = límie inrior de la clase Ls (real) = límie superior real de la clase. (Recuerde que el límite supe rior real de una clase es el mismo límie inerior de la clase si guiene cuando la variable es coninua). Ejemplo: 1 2 3 4 5 6
88
K 7 a 12 13 a 18 19 a 24 25 a 30 3 1 a 36 37 a 42 Total
10 16 22 28 34
40
(t 25 14 9 5 4 3 60
7 + 1 3 20 = - O Kgs X m(]) 2
2
13+19 < = 1 6 Kgs . X m 2
X m 6)
2
=
37 + 43 2
= 40Kgs
Se calculan tantos centros de clase como clases tenga la escala. Cada uno de ellos representa el promedio de su clase. Por ejemplo, los 25 niños de la primera clase tienen un peso promedio de 1 O kgs Los centros de clase (m) NO se redondean. Peso en Kg
711 12 1 6 1 7 21 22 26 27 3 1 32 36 37 41 42 46
X 9,5 14,6 19,5 24,5 29,5 34,5 395 445
Frecuentemente es necesario distribuir los datos en nción de dos varia bles simultáneamente En tal caso, la rmación de las clases de cada varia ble se realiza de manera individual, siguiendo los procedimientos antes descritos para cada tipo de escala (nominal ordinal o numéricas). Luego las clases en que e dividida la variable principal s colocan en la primera columna, y las de la variable secundaria en la primera fla. Posteriormente la ubicación de cada dato (computación) debe responder a las dos características que cada sujeto posee. Por ejemplo, en la tabla maestra # 1 , el sujeto # 6 es un niño de 1 año y de sexo masculino, por lo cual debe ubicarse en la clase de O a 1 año y en la columna de masculino
89
Edad en años
Oa 2a3 4a5 6a7 8a9 10 a 1 1 Total
SEX Masculino Femenno
8 8 6 5 5 4 36
8 4 4 3 3 2 24
otal
16 2 10 8 8 6 60
A proceso de rmar las clases y acompañarlas de sus respectivas ecuencias algunos autores lo denominan "tabulación de los datos , lo cua no debe conndirse con un cuadro estadístico, aun cuando o origina 4. La cuarta subetapa de a elaboración o procesamiento de los datos es la Presentación. Esta puede hacerse en Cuadros estadísticos o en gráfcos, dependiendo de su propósito. Tiene como fnaidad resumir a inrmación y oecera de manera completa para ciitar su anáisis. Pueden construir se básicamente tres tipos de cuadros: De Distribución de ecuencias, de Asociación y de Series cronológicas, os cuaes serán explicados más ade lante.
CUADROS ESTADÍSTICOS En os Cuadros estadísticos la inrmación se presenta de manera precisa y detalada, lo cual permite e análisis minucioso de los datos. Para cumpir con este propósito el cuadro debe ser competo, con sus cuao partes y no sóo a tabulación de los datos. PARTES DE UN UADRO ESTADÍSTICO
Encabezamiento (número y íulo), matriz o mode cueo y pie (ente y notas explicativas) Ejemplo
90
Cuadro # 1 Evaluación nutrici nutr icional onal de de paciente paci entess menores de 12 1 2 años distribu str ibuid idos os segn sexo. sexo . Ambulator Ambu latorio io Rural JI JI, La Ag adita Edo. Cojedes. Mazo 1997.
Sx Femenino Mascuino Toal
f
F . R
36 24 60
60 % 0 % 00 00 %
Fuente: Fuente: Archvo de Hstora Médas del Ambulatorio Rural I, La L a Aguadta, Edo. Cojedes
A Encabeamiento Colocado en la pae supeior del cuado. En é se in cluye e número del cuado y el ttulo ttulo de éste. éste. EL ttulo se refere a aspecto o poblema que e estudiado Debe especifca como se distibuye distibuyen n los sujetos según a variable presentada presentada en el cuadro cuadro así como el lugar luga r donde se realizó el estudio estudio y la cha c ha cuando se obtuvo la inmación En el cuadro cuadro # 1 se observa que el esudio se se refere a la evaluación evaluación nutri cional de los menores de 12 años. Los sujetos eron distibuidos en as clases en que e dividida la vaiable sexo. El estdio se realizó en La inr mación ón e recopilada en ma Aguadita Aguad ita estado esta do Cojedes, y a inrmaci mao o de 1997 B La matriz matriz o molde: Constitida por la primera coumna (denominada "columna mati matiz, z, donde se coloca el e l nombre nombre de la variable principal y sus cases) y pimera fla donde se coloca a identifcación de las otras columnas y las clases de una segunda escala si el cuado cuado o reuiere. En el cuado cuado # a matri matrizz es: Sx Femenino Masculino Tota
f
F . R.
C Cuerpo Esta pate pate o constityen e cuce cuce de counas couna s con fas fa s Es el sitio donde se colocan coloc an las coumnas corespond corespondiente ientess a frecuencias frecuencias ab solutas yecuencias totales de cada columna columna y de ecuencias relativas. Y las cias totales
91
cada fla, si s i esta útima o requiere ambién pueden colocarse otras otras counas reridas a cálcuos adicionaes que permitan procedimientos o lasecuenanáisis posteriores, como por ejemplo los centros de clase y lasecuencias acumuladas, acumuladas, entre otras. D El pie. En la parte nrior del cuadro cuadro se coloca lafuente de donde donde se obo b tuvo tuvo la inrmación inrma ción presentada Cuando sea necesario necesa rio pueden pueden anexarse notas explicativas que ciliten la comprensión de d e a inrmación mos trada en e cuadro Estas Esta s notas se coocan después de a ente
TIPOS E CUADROS ESTADÍSTICOS Además Además de as tablas maestras, maestras, donde d onde se transcribe toda la inrmación inrmación contenida en os rmuarios utilizados para la recolección de los datos, pueden construirse construirse (con os datos de a taba maestra) tres tipos de cuadros: cuadros: De Distribución de ecuencias ecuencias de Asociación y de Series cronoógicas. Los cuadros de distribución de frecuencias. Donde Donde se describe a e-
cuencia con que se presenta e enómeno de interés Se eaboran sore la base bas e de una soa variabe, varia be, bien sea numérica numérica o no. ambién amb ién incluyen incluyen las e relativas indican la rela cuencias reativas, y un gran total Las frecuencias relativas ción entre cada ecuencia absouta y el e l total; expresadas generamente generamente en porcentae. Cuadro # 2 Evaluación nutricional de pacientes menores de 12 años distribuidos seún seún Estad Estado o nutricional Ambulatorio Rural Rural I La Aguadita. Edo. Cojedes Mao, 1997 Estado nutricional
Sobre a nora Norma orma Desnutriión Desnutriión leve leve Desnutriió Desnutriión n oderada Desnutriión rave Tota
f
F. R.
5 31 12 8 4 60
8% 52 % 20 % 13 % 7% 100 100 %
Fuente: Archivo Ar chivo de de Hitorias Médicas Médi cas Ambulaorio Rural II La Aguadita Aguadita,, Edo Cojedes.
92
Cuadro # 3
Evaluación Evaluación nutricional de paciente pacientess menores de 1 2 años distribuidos distribuidos según eda Ambulatorio Ambulatorio Rural La Aguadita Ag uadita Edo Coedes Mazo, Mazo, 1 9 9 7 Edad en años
f
F. R
O 23 45 67
6 2 8 8 6 6
27 % 2 % 7 % 3 % 3 % % %
8 - 9
Tal
Fuene: Achio de Hstoias Médicas Médi cas Amblaorio Rura II a Aguadita Aguadita Edo Edo Coedes Cuadro # 4
Evaluación nutricional de pacientes pacientes menores menores de 1 2 años distribuidos segn peso. Ambulatorio Ambulatorio Rural / La Aguadita, Agu adita, Edo Cojedes Cojedes Maz Mazo o 1 9 9 7. Peso en Kgs
f
F R
7 2 3 8 9 24 25 3 3 1 36 37 42 tal
25 4 9 5 4 3 6
42 % 23 % 5 % 8% 7% 5% 0%
Fuente Archivo Archivo de Histoias Médicas Méd icas Amblat Amblatorio orio Rura Rura I, I , La L a Agadita Agadita,, Edo. CoCo jedes
Ests tres cuadrs cuadr s sn de distribución distribución de fecuencias. E # 2 presenta presenta una escala esca la rdinal rdinal El # 3 y # 4 están refrids a variabe variabess numéricas y c nfor man escalas de razó
93
Los Lo s cuadros de Asociació As ociación n se construye para estud estudiar iar la posible reaión
entre dos o más variables. Por o tanto incuyen inc uyen a menos dos variabes variabes de manera simultánea y regularente re gularente varios subtotaes y un gran g ran total. U n ejemp ejempo o típic típico o d e este tipo d e cuadro e s aquel donde s e muestra muestra a dist distri ribubución de un grupo de sujetos por edad y sexo al mismo tiempo Los cuadros de asociación también incuyen las ecuencias relativas las cuaes pueden ser calculadas de diversas maneras de acuerdo a los objeti vos panteados Cuad Cuadro ro # 5
Evaluación nutricional de pacientes menores de 12 años distribuidos distribuidos según edad y sexo sexo.. Ambulatorio Rural Rural J La Agua Ag uaita ita Edo Ed o Cojedes Mar Marzo, 1 99 7.
SEXO Femenino
Edad en años O 1 2-3 45 67 8-9 10 - 1 1 Total
Masculino
Toal
f
F.R
f
F R
8 8 6 5 5 4
(22 %) (22 %) ( 1 7 %) ( 1 4 %) ( 14 %) ( 1 1 %)
8 4 4 3 3 2
(33 %) ( 1 7 %) ( 1 7 %) ( 1 2.5 %) %) ( 12 5 %)
(8 %)
16 12 10 8 8 6
36
( 1 00 %)
24
( 1 00 %)
60
Fuente: Fuent e: Archivo A rchivo de Historias Historias Médicas. édicas. Ambu Am bulatorio latorio Rural Rura l JI JI La Aguadita, Aguadita, Edo. Edo. Cojedes.
Este cuadro (n 5 ) muestra la distribución de os sujetos según las las varia bles cuantitati cuantitativa va (edad, en la esala esa la principal) principal) y cualitativa cualitativ a (sexo, en a esescaa secundaria) º
E cuadro n 6 está refrido re frido a dos variabes cualitativas: estado nutric nutricio io na y sexo sexo º
94
Cuad Cuadro ro # 6 Evaluación Evaluación nutricional nutric ional de pacientes pacient es menores de 12 1 2 años a ños distribuidos segn estado nutricional y so. Ambulatorio Rural La Agadita, Edo. Cojedes. Mazo, 1997.
SEXO Estado Nutricional
Sobre la norma Normal Desnutrición leve Desnutrición moderada _esnutrición grav Total
Masculino
Femenino
Total
f
F R
f
F R
2 18 8 5 3
(6 %) (50 %) (22 %) (1 4 %) (8 %)
3 3 4 3
( 12. 5 %) %) (54 %) (1 7 %) ( 12 5 %) %) (4 %)
5 31 12 8 4
36
( 1 00 %)
24
( 1 00 %) %)
60
Fuente Fue nte:: Arch Ar chivo ivo d Historias Historias Média Médias. s. Ambu Am bulatorio latorio Rura Ru rall J La L a Aguadi Agua dita, ta, Edo Edo Cojedes
Cuadros de Seres Seres cronológicas. cronológicas. En las ciencias de la sald en mchas
ocasiones ocasione s es necesario estudiar n nómeno na enermedad enermeda d por ejemplo a lo largo de varios periodos días semanas meses o años) años ) a fn de conocer s evolución en el tiempo. En estos casos la inrmación se present presentaa en n cadro de series crnológicas, donde sólo se pretende mostrar la variación de n nómeno de una época a otra omitiendo los totales lo cual lógica mente impide el cálclo de porcentajes. porcentajes. Generalmente Generalmente estos cuadros cuadros constan de dos columnas. L columna matriz destinada para la escala e scala del tiempo y la segnda para indicar el número de veces qe ocrió el nómeno estudiado (ecuencias absolutas). Sin embargo cuando se describen las variaciones de na población es conveniente disponer de una tercera columna de tasas (ecencias relativas) donde se relaciona as veces que ocurrió ocurrió el enómeno con con respecto a 1.0 1 .000 00 10000 ó 1000 100 000 00 sjetos de de la población susceptible; susceptible; con c on lo cual se se cilitan las comparacioes Cando es posible puede incluirse en el cadro la población población sscepti ssceptible ble en cada período estudiado. estudiado. Los cadros 7 8 y 9 corespon coresponden den a esta categoría.
95
Cuadro # 7
Tuberculosis. Morbilidad y tasas por 1 OO 000 habitantes Estado Carabobo 19921996
Aos
Casos notifcados
Población
1 992 1993 1994 1995 1996
220 267 261 307 329
1 .225 740 1388461 1437246 1.486682 1562323
Tasa de morbilidad por 100.000 hab. 1 79 192 182 207 21,1
Fuente: Hojas de notifcación de tberculosis del M.S.A.S. Comisionaduía de Salud de Edo Caabobo Cuadro # 8
Mortalidad general diagnosticada y no diagnosticada Venezuela, 1992-1996
Año 1992 1993 1994 1995 1996
DIAGNOSTICADA Muertes 70.760 71.635 73.288 77245 78591
Porcentaje 85.8 85.6 844 855 85.8
NO DIAGNOSTICAD Mueres 1 1 .7 10 12.050 13.546 13100 13.007
Porcentae 14.2 14.4 156 14.5 14.2
Fuente: M.S A. S. Memoia y Cuenta 1 992 1 .996. Venezuela.
96
Total 82.470 83685 86834 90345 91.598
Cuadro # 9
Dengue hemorrágico. Morbilidad y mortalida Veneuea Septiembre 1996-Maz 1997
C
Septiembre
3
o
Octbre
5
3
27
5
Diciembre
1.656
19
Enero
7.265
33
Febrero
2.788
12
276
1
Noviembre
� -
Maro
Fente: Trabajo de invesigación "Dengue hemorrágico en Venezuela Casillo, E y otos. 1 997.
Es necesario precisar que las series cronológicas no son cuadros de dis tribución de ecuencias ni de asociación, pues .
GRÁFICOS ESTADÍSTICOS En ocasiones, es conveniente presentar la inrmación de manera gene ral, sin los detalles de los cadros estadísticos Normalmente, cuando la idea es trasmitir la inrmación a un público no especializado, o simple mente destacar la variación importante de un enómeno suelen utilizarse los grácos estadísticos, por su ventaja de presentar cilmente los mensa jes que se desean transmitir Para su constrcción exise una serie de recomendaciones que cilitan su concción; entre ellas: 1 Todo gráco debe ser completo Deben contener Encabezamiento, grá fco propiamente dicho y ente.
97
El encabezamiento ubicao en la parte superior el gráfco. Coniene Número y Ttulo el cual requiere los mismos elementos que los títulos e los cuaros. El gráfco propiamente icho generalmente se constrye sobre un sis tema e coorenaas, one en la abscisa (eje horizontal) se colocan las clases en que ha sio iviia la variable y en la orenaa ( eje verical) se colocan las ecuencias generalmente relativas. En la pare inrior el gráfco se coloca el pie en el cual se menciona la ente e done se obvo la inrmación y notas explicativas cuano el gráfco las amerita. 2 Se recomienda que exista relación enre la longi e la abscisa y e la ordenaa, con el propósito e mantener la proporción el gráfco. Se es tima que por cada centímetro e longiud de la orenaa se dé entre uno y os cenmetros a la abscisa. Pora hablarse e un promeio de 1,5 aproximadamente 3 La abscisa se ivie en tantas pares como clases se eban presenar. l número e partes en que se ivie la orenaa quea a criterio de quien elabora el gráfco; tenieno cuiao e que oos los segmentos sean e igual tamaño y auenten con un mismo ineralo por ejemplo e 1 en 10: 10 20 30 0. Otro puee ser e 5 en 5: 5 10 5 20 25 etc. La orenada siempre comienza en cero y termina en la mayor e cuencia (generalmene relaiva) a presentar o en un valor próximo a ésta. 4. Cuano la ecuencia menor a representar en el gráfco esá muy aleada e cero se aconseja realizar un core en el inicio e la orenaa por encima e cero y colocar por encima el corte la ecuencia menor. Este core sugiere que se ha esechao el segmento sin uso en la ordenaa. De esta manera se maniene la proporción el gráfco 5 Dao que existen irenes grácos estos se eligen según el propósito y el ipo e cuaro que lo origina; así como la escala e meicin e la va riable a represenar Para ellos puee utilizarse como guía el siguiente esquema
98
TIPO DE CUADRO
Distribución de Frecuencias
ESCALA DE EDICIÓN DE LA VARIABLE
TIPO DE GICO
Barras Simpes y DiagraNomina, ordina Y Numé ma Sectoria o Gráco de ricas Discretas Torta Numéricas Continuas
Histogramas y Pogonos de ecuencias. demás, Curva Integra
Numérica y nomina o nu Pogono de ecuencias mérica y ordina Cuadrosde sociación
Ambas Nominaes o Am Barras mútipes y Barras bas ordinaes o Nomina y Proporcionadas ordina Ambas Numéricas
Series Cronoógicas
Diagrama de puntos
Tiempo (años meses, se- nea de tendencia, Núme manas, das, etc ros Indices y Barras
RÁFICOS DE BARRAS SIMPLS:
Con a inrmación contenida en e cuadro # se puede constrir un grá fco de barras simples. Este gráfco consiste en una serie de rectánguos se parados unos de otros Cada rectángulo representa a una clase estadística. Su constrcción se inicia con e encabezamiento (# y tto) de gráfco. Seguidamente se traza la ordenada y a abscisa, manteniendo a proporción aproximada de 1: 15 ; como se indicó en a segunda de las recomendaciones señaadas iniciamente. Luego, se divide el eje horizontal en tantas partes como cases se deban presentar. Para a eaboración de gráfco correspondiente al cuadro # 1, puede constrirse una abscisa de 12 cm. de ongitd, y dividira en dos segmentos de 6 cm. cada una (uno para cada sexo). En cada segmento se marca un espacio de aproximadamente 1/4 de su ongitud; es pacio que se dea ibre para separar as barras entre s. Luego se divide el eje vertica en partes iguaes Para representar gráfca mente e cuadro # 1 a ordenada puede ser de unos 8 cms aproximadamen te, y dividira en cuatro segmentos de 2 cms cada uno La escaa de identif
99
cación de esta ordenada puede ir aumentando de 15 en 5 pariendo de ce hasa legar a 60 %, siendo ésta la ecuencia reaiva máxima mosrada en el cuadro Una vez divididas las coordenadas, se construyen os rectánguos o ba rras de igual base y a a alura que lo indiquen las ecuencias relativas a re presentar. Luego se idenifca a variable levada a la abscisa y las ecuen cias evadas a la ordenada. Por último, en a pare inerior de gráfco se indica a ente de donde se obtuvo la inrmación, y si se requiere s escriben las notas explicativas pertinentes. Cuadro # 1
Evaluación nutricional de pacientes menores de 12 años, distribuidos según sexo. Ambulatorio Rural JI, La Aguadita. Edo. Cojedes Marzo 19 97
S Feenino Mascuino Tota
f
F. R.
3 24
% 4 % %
Fente: Arhivo de Hitoias Médcas del Ambulatorio Rual II, 'La Aguadta Edo. Cojedes Como este cuadro es de distribución de ecuencias de escaa categórica se representa mediane un gráfco de Barras simples o de diagrama secto ria.
100
Gráfco # 1 Evaluación nutricional de pacientes menores de 12 años, distribuidos según sexo Frecuencias expresadas en porcentajes Ambulatorio Rural J La Aguadita Edo Cojedes. Mazo 1997. 7
60 p
5
o e
40
n
a
j
20
L
1
Sxo
Fuente: Archivo de Hitorias Médica del mbulatorio Rural I La guadita, Edo. Cojede.
GRÁFICO CIRCULAR O DIAGRAMA SECTORIAL
Otra manera de representar la misma inrmación es a través de lamado diagrama sectoria o gráco circuar Este se consuye en un círculo cuya área se distribuye de manera proporciona enre as ecuencias relativas a representar. Los 3 60 grados del círcuo representan la ecuencia total, y cada ecuencia reativa una pare de ese tota es decir se dvide el círcuo en tantos sectores como clases tenga a disibución correspondindoe a cada uno un área determinada epresada en grados de circunrencia. Para el cuadro # 1 a la clase def emenino e corresponden 2 1 6 grados y a la clase de masculino 1 44 grados (360 x 40% / 1 00) Tambin a inrmación contenida en e cuadro # 2, rerido a evaluación nutricional de un grupo de pacientes puede ser presentada gráfca mente en un diagrama sectoria. En este caso, el círcuo se divide en 5 pares y se cacuan los grados correspondientes a os ánguos de cada clase según os porcentajes previamente obtenidos.
01
Cuadro # 2 Evaluación nutricional de pacientes menores de 12 años distribuidos según Estado nutricional Ambulatorio Rural / La Agadita Edo Cojedes. Mazo 1997 Estado nutricional
f
Sobre la norma Normal Desnutrcón leve Desnutrición moderada Desnutrción gave Toal
F. R.
Grads de circunferencia
8%
29
31
52 %
87
12
20 %
72
8
3 %
47
4
7%
2
60
00 %
360
5
Fuente Archivo de Historias Médicas. Ambulatorio Rural JLa A gadita Edo. Cojedes
Gráfco # 2 Evaluación nutricioal de pacientes menores de 12 años, distribuidos según Estado nutricional Ambulatorio Rural La Agaita Edo Cojedes Mao, 1997.
Desnutición leve 20%
Sobre a nrma 8%
Desntrición grave 7%
Fuente: Archivo de Historias Mdicas. Ambulatorio Rural JLa A gadita. Edo. C jedes
102
HISTOGRAMA Y POLÍGONO DE FRECUENCIAS El , al gual que las baas también se constrye sobe un sstema de ejes de coodenadas. Está conmado po un conjunto de ec tángulos, cuyas bases tenen una longitud popoconal al ntealo de la clase que epesentan y la altua es popoconal a la ecuencia elatva de cada clase A denca de las baas smples, los ectángulos del histoga ma están undos po sus lados, es dec, no hay sepaacón ente ellos. La nmación contenda en los cuados # 3 y 4 puede pesentase gá camente en un hstogama o en un polígono de ecuencias dado que se ta ta de cuados de dstbuciones de ecuencias de escalas numécas ( de a zón). Paa const histogamas se ecomenda se gilos siguentes pasos: 1 - En la pate supeo escbi el númeo y título del gáfco. Luego taza la odenada y la abscsa mantenendo popocón en sus longudes ( 1 : 1 ,5 apoxmadamente) 2- Dvdi el eje hozontal en tantas pates como clases se deban pesenta, ndcando en cada segmento el límte inio de cada clase. En caso de consti un histogama con la inmación del cuado # 3, seá necesa io dvid la abscisa en seis pates guales, indcando en cada divsón el límite no de cada clase. 3- Igualmente, divid el eje vetcal en pates gales Identfca la escala desde ceo hasta su valo máximo coespondente a la mayo ecuenca elativa a epesenta En el cuado # 3 el mayo pocenae es 27 %, po lo tanto, la odenada puede divdse en 3 paes i gales y aumenta de 9 en 9 hasta llega a 27 ; o puede llevase hasta 30 %, e igualmente divdila en 3 pae y aumenta de 1 0 en 10 4- Luego se consye cada ectánglo con bases popocionales a cada n tealo de clase y a la altra que lo indiquen las ecuencias elatvas. Se dentca la vaiable llevada a la abscisa y las ecuencias colocadas en la odenada 5- Po último, en la pate ineo se indica la ente de donde se obtuvo la inmacón y las notas explcativas si son necesaas.
103
Cuadro # 3 Evaluación nutricional de pacientes menores de 1 2 años distribuidos segn eda Ambulatorio Rural JI La Agaita, Edo. Cojedes Mazo, 1 99 7 f
F R.
O - 1
16
27 %
2-3
12
20 %
3
45
10
17 %
5
67
8
13 %
7
8-9
8
13 %
9
10 - 1 1
6
10 %
1
Edad en años
Total
Xm
1 00 %
60
Fuente Archio de Historias Médicas A mbulatorio Rural /, La Aguadita, Edo. Cojedes.
Gráfco # 3 Evaluación nutricional de pacientes menores de 1 2 años distribuidos segn eda expresada en porcentaje Ambulatorio Rural La Agadita Edo Cojedes Mazo 1997.
25 p
o
0
e
15
n t
a
10
0-
2-3
6-7
45
Años
89
0-11
Fuente: Archivo de Historias Médicas Ambulatorio Rural J La Aguadita Edo. Cojedes
104
Por s pare el poígono d frnia es n gráfco lineal construido por na serie de pnos nidos por líneas rectas, en n sistema de ejes de coordenadas. Para s elaboración se sigen prácticamente los mismos pasos del histograma. Sólo vara el carto paso donde, na ve indicados los lites in riores de cada clase, en cada no de los segmentos en qe ha sido dividida la abscisa se señalan además, los centros de clase (Xm) Lego se levantan los pntos sobre los centros de clase a na altura proporcional a la ecencia de la misma, y segidamente, se nen dichos pntos con trazos rectos El resto de los pasos también son similares al del histograma Gráo 3 - B Evaluación nutricional de pacientes menores de 12 años distribuidos según eda expresada en porcentaje. Ambulatorio Rural , La Aguaita, Edo Cojedes Mazo, 1997 30 27
25
p o
20
e
5 13
n
a
0
1
0-
2
89
67
45
0
Años --
--
-
-
---
Fuente: Archivo de Historias Médicas. Ambulatorio Rural J La Aguadita, Edo. Cojedes. CURV INTEGRAL O DIGRM DE FRECUEN CS CUMULDS.
La misma inrmación del cadro # 3 también pede representarse en rma dirente a través del gráfco de ecencias acmladas o cra integral. Para este fn, se calclan las frnia amada (FA), a cules
105
se obtienen mediante la suma consecutiva de lasfrecuencias absolutas de cada clase.
El gráco permite saber cuántos sujetos hay hasta un determinado valor o a partir de éste. Del mismo modo pueden expresarse las ecuencias relativas en rma acumuladas. Este gráfco también se consrye sobre el sistema de ejes de coordena das. Cada clase se representa por un punto colocado en el límite superior de cada clase a la alra indicado por l ecuencia acumulada. Para su consrcción igualmente se siguen casi todos los pasos del polígono de ecuencias una vez acumuladas las ecuencias. a dierencia básica radica en que no requiere de los centros de clase. Además, en la abscisa se indican los lmites superiores de cada clase y cada punto se marca sobre cada uno de estos a la alra indicada por la ecuencia acumulada correspondiente a cada clase uego se unen los puntos mediante rectas. La curva producto de la unión de estos puntos siempre tiene una sola dirección ge neralmente en sentido ascendente. Los cuadros # 3 y 4 también pueden representarse mediante este gráfco. Como ejemplo se tomará la inrmación del cuadro # 4 para lo cual es necesario calcular las ecuencias acumuladas de cada clase. Cuadro # 4
Evaluación nutricional de pacientes menores de 12 años, dstribuidos segn peso. Ambulatorio Rural La Auaita do. Cojedes Mazo 1997
K 7 12 1 3 18 1 9 24 25 30 3 1 36 37 2 Total
f
F R
25 1 9 5 3 60
2 % 23 % 15 % 8% 7% 5% 1 00 %
F. A .
25 39
8 53
57 60
Fuente: Archivo de Hstoria Méda Ambuatoro Rural 11, La Aguadita Edo Cojede.
106
Gráfco # 4 Evaluación nutricional de acientes menores de 12 años, distibuidos seún peso exresada en feuencias acumuladas Ambulatorio Rural I La Aguadita, Edo Cojedes Mazo 1997. F
e
70
60
u e
50
n
1
40
a
A
30
u m
20
u 1 a
0
d a 72
1 3-18
19-24
230
31 36
3-42
Kgs.
Fuente: Achvo de Hstoras Médcas. Ambulatoo Rural I La Aguadita, E Cojedes
POLÍGONO DE FRECUENCIA PARA CUADROS DE ASOCIACIÓN CON VARIABLE NUMÉRICA COMO VARIABLE PRINCIPAL. E cuadro # 5 muestra inrmación rerente a a edad y sexo de grupo estudiado, puede ser representado gráfcamente por poígonos de ecuencias; en este caso, se constryen sobre el mismo eje coordenado dos polígo nos, uno para e sexo mascuino y oo para e menino, como si eran dos distribuciones de ecuencias, pues, ambos tienen as mismas clases con os mismos intervalos y centros de cases, por lo cua, se siguen as mismas recomendaciones rmuladas en a constrcción de poígonos par cuadros de distribución de ecuencias.
107
Cuadro # 5 Ealuación nutricional de pacientes menores de 12 años, distribuidos según edad y sexo. Ambulatorio ural / La Aguadita, Edo. Cojedes. Mazo 1997 SEX Masculino
Femenino
Edad en años
F R.
f
O- 1 2-3 4-5 6-7 8-9 10 - 1 1 Total
Total
F. R.
f
4
(22 %) (22 %) ( 1 7 %) ( 4 %) ( 4 %) ( 1 1 %)
8 4 4 3 3 2
(33 %) ( 1 7 %) ( 1 7 %) ( 12 5 %) ( 12 5 %) (8 %)
16 12 10 8 8 6
36
( 1 00 %)
24
( 1 00 %)
60
8 8 6 5 5
Fuente: A rchivo de Historias Médicas Ambulatorio Rural 1. La Aguadita Edo Cojedes
Gráfco # 5 Evaluación nutricional de pacientes menores de 12 años, distribuidos según edad y sexo expresados en porcentajes. Ambulatorio Rural I a Aguadita Edo. Cojedes. Mazo, 1997. 30
p e n t
25 20 Fmio " w• w � Masclio 15
.'•
'•, 10
.
L-
, .
0
3
67
4-5
89
0.11
Añ
Fuente: Archivo de Hstorias Médicas Ambulatorio Rural JI. La Aguadita, Edo Cojedes.
108
BARRAS PROPORCIONADAS
Se utiizan para mostrar a varacón variabee con varacón proporconal proporc onal de una variab respecto a a otra. Por o tanto, es indispensabe indispe nsabe cacuar porcentaes. porcentaes. Cada sub-tota (de coumnas coumnas o de fas f as,, según s egún sea e caso) se iguaa iguaa a 00, y en nción de eo se obtienen os porcentajes respectivos, por consiguiente, todas as baras tendrán ten drán a misma aura (100). (100) . Se constryen con a inración presentada en cuadros de asociación con dos escaas nominaes u ordinaes, o nomina y ordina E cuadro cuadro # 6 corresponde a este tipo, en é se s e tiene una escaa nomina nomina y a otra ordina. Para represenaro gráfcamente se puede constrir de dos maneras direntes, según o que se desee mosrar Si intersa mostrar mostrar a e stados nutricionaes en cada uno de os sexos, proporción de os diversos estados se constryen barras proporcionadas, como as mostradas a continuación Se eaboran dos barras, barras, y cada una representa e 100% de cada sexo sexo En este caso, cada barra se divide en cinco segmentos, correspondiente a os os cinco estados nutricionaes nutricionaes mostrados en e cuadro # 6. E E área corespondiente corespondiente a cada segmento es proporciona a a fecuencia reativa a reprsentar Todas as demás indicaciones para su eaboración eaboración son s on simiares a as utiizadas utiizadas en a construcción de barras simpes. Cuad Cu adro ro # 6
Evaluación Evaluación nutricional de pacientes menores de 12 años, distribuidos distribuidos según estado nutricional y sexo Ambulatorio Ambulatorio Rural, La Agadita, Edo Cojedes. Mazo 1997.
SEXO Estado Nutricional
Sobre Sob re la norma norma Noma Desnuticin lv Desnutricin moderada Desnutc Desnutcin in r ra� a� Total
Femenino f F. R. 2 18 8 5 3 36
(6 %) (50 (50 %) (22 %) (1 4 %) (8 %) ( 100 %)
Masculino Masculino f F. R. 3 4 3
( 1 2 5 %) . (5 4 %) (1 7 %) ( 1 25 %)
24
( 1 00 %)
3
(4 %)
Tota 5 31 12 8 4 60
Fuent: Achvo Achvo de Hisorias H isorias Médicas. Médicas . Ambulatori Ambulatorio o Rura Rurall 11, La Aguaa Aguaa Edo Cojedes.
109
Gráfco # 6 Evaluación Evalua ción nutricional nutrici onal de pacientes pacien tes menores de de 12 años distribui stri buido doss según segú n estad estado o nutricio nu tricional nal y sexo sexo.. Ambulatorio Ambulator io Rural, Rura l, La Aguadita, Edo Cojed Cojedes es Mao, Mao, 1 99 997 7
90% 8%
p
70%
o r so%
1 D � •
e 50%
n t ª
40% 30%
snutrción grave grave esnutrción merada esnutción v Normal Sobre a norma
e 20% 10%
Femenino
Sexo
Masculin
Fuente ue nte:: Archi Arc hivo vo de Historias Médicas Médicas Amb A mbulato ulatorio rio Rural /, La Agadita Edo. Cojedes
GRFICO DE BAAS MULTIPLES. MULTIPLES.
Otra rma de presentar a inrmación inrmac ión de un cuadro de asociación asociac ión con dos escaas nominales nom inales u ordinaes es mediante el diagrama de barra barrass mútipe En ta caso, se calcuan las ecuencias reativas sobre la base del gran total indicado en el cuadro. cua dro. Este Es te gráfco se constrye siguiendo siguie ndo las las mismas recomendacio recom endaciones nes dadas para a elaboración de diagrama de barras barras simpes. La direncia radica en que en as barras mútiples se rman conuntos de barra barras s correspondientes a as clases en que ha sido dividida una variabe Estos conjuntos se separan unos un os de otros, en nción de una de as variabes. variabes. Según el número de barras que conrman cada grpo se denominan barrs dobles dobles barr barra a triple tri ple,, etc.
1 10
Cuadro # 6 Evaluación nutricinal nutricinal de pacientes menres de 1 2 añs distribu distribuidos idos según según estado nutricinal nutricinal y sex. sex. Ambulatr Amb ulatri i Rural Rural La Aguadit Aguadita a d. d. Cjedes. Maz 1997. SEXO Estado Nutriciona Nutriciona
Femenino
f
Sobre l a norm normaa Normal Desnutricón Desnutricón leve Desnutricón moderada Desnutricón gave gave Total
2 18 8 5 3 36
F. R.
(33 %) (30 %) ( 13.5 %) (8 %) (3 %) (60 %)
Masculino
f
Total
F R
3 13
(5 %) (21.6 %) (6.6 %) (5 %) (2 %) (40 )
4
3 24
5 31
12 8 4
60
Fuente: Archivo de d e Historias Historias Médi Médicas. cas. Ambu Am bulato latorio rio Rural J La A gadita Edo. Cojedes.
Gráfco # 6 - B Evaluación nutricinal de pacientes menres de 12 añs distribuidos propor proporcinalmente cinalmente según según estado nutricinal nutricinal cada sex. Ambulat Am bulatri rio o Rural, La Aguadita, Ed. Cojedes. Maz 1997.
30
P o e
25
20
O Sbre la noa B N � scó ev suricó mrd I Dscó g
n
1
10
Femenino
Masulino
Sexo
Fuente Fuent e Archivo Archi vo de Historias Historias Médicas Médicas Amb A mbulatori ulatorio o Rural , La A gadita Edo Cojedes
111
DIAGRAMA DE DISPERSIÓN PARA CUADROS DE ASOCIACIÓN CON DOS ESCALAS NUMÉRICAS: DISCRETAS O CONTINUAS. El Diagrama de Dispesió o de putos es gráfco utilizado u tilizado para mos tra la asoci asociaci ació ó existete ete dos vaiabes vaiabes uméicas de itervalo itervalo o ra zó cotiuas o disceas. Se costye tilizado e eje de coodeadas coocando en la abscisa a vaiable cosideada idepediete (X) y en la ordenada ordenada la variable depediene depedie ne (Y). Paa cada vaor X, hay un vao Y.
GFICO DE LÍNEAS DE TENDENCIA. La representació representació gáfca de d e ua seie cronoógica cronoógica es a tavés de u grá LÍNEA DE TEN TENDENCI ENCIA A el cual se costuye tambié fco iea lamado LÍ sobe u ee coodenado. E la abscisa se coloca las clases corespodie tes a la la variable tiempo, tiempo, y e e a odenada las las ecuecias ecuecias elativas, elativas, tal como como se muesa muesa a cotiuació cotiuació co la la irmaci irmació ó de cuado # 7. Cuad Cuadro ro #
Tuberculosis. Morbildad y tasas por 1 OO. 000 habitantes. habitantes. Estad Aragua. 1992-1996.
Años
Casos notifcados
Población
Tasa de morbilidad por 100.000 hab
1992
220
1225.740
17,9
1993
267
1388461
19,2
1994
261
1437.246
18,2
1995
307
1486682
20,7
1996
329
1562323
21,1
Fuente: Hojas de ntfcación de tuberculosis del MA.S.
1 12
Gráfco #
7
Tuberculosis. Tubercu losis. Morblidad Morb lidad y tasas tasas por 1 OO. 000 habtantes. habtantes. Estado Estado Aragua. Aragua. 1992-1 199 2-1 996.
21 .5 T 0 a S , a s 18 18
1
1 3
194 Alos
15
6
Fuen Fuene: e: Hoja Hoja de notifcació notifcación n e ubercu uberculosis losis de M . S. A .S
GFICO DE NÚMEROS ÍNDICES PARA CUADROS DE SERIE CRONOLÓGICA.
Existe un tipo de gráfco utilizado para mostrar a variación porcena de un enómeno con respecto re specto a s mismo a través del tiempo Este gráfco, aun cuando es muy pecido al de nea de tendencia, se direncia básica mente, en que las aturas atur as de os puntos (que se unen para rmar una nea) representan repre sentan una variación variac ión proporcional en términos porcentaes, o cua se denomina NMEROS ÍDICES; mientras que en e gráfco de línea de tendencia se represen repr esentan tan (genera (gen erament mente) e) las variaciones absout absoutas as de nó meno de estudio. estudio. Los números índices son vaores reacionados a un val a igual a cien. Se cacuan tomando el valor que tenga como manistacin e enó meno men o ocurrid ocurridoo en un año o perodo per odo de tiempo, tiem po, a cua se e denoina base Debe ser un período en e n donde se considera que e enómeno se ha presentado dentro de lo esperado, es decir, que no constituya un valor valor excepciona excepciona L a decisión decisión de tomar un ño o período bse depende del investigador investigador o prop rosi s iona, y a veces es una decisión dici, pues, casi nunca se puede tener segur se guridad idad de que que es o norma, y mucho menos cuando a varia variabe be tiempo
1 13
inuye en el nómeno. Una vez decidido e l año o perído base, su ecuencia relativa se igala a cien, siendo éste el primer número índice. El segundo y los demás números índie se calculan haciendo una simple regla de tres Con la inrmación del cuadro # 8 pueden calcularse estos valores. En ese cuadro, para la columna de muertes diagnosticadas puede tomarse como perído base el año 1992, en el cual se iguala a 1 00 su ecuencia relativa de 85,8 . Para los años restantes, los demás números índices se calculan por simples reglas de tres. Para 1993 se tiene: 85,8 % 1 0 0 x 85, 6 % X X 85•6 l 00 99,8 (segundo # índice) 85,8 Para el año 1994 : 85,8 % 1 00 84• 4 x IOO 98,4 (tercer # índice) 84 ,4 % - X , X 85,8 y así sucesivamente para los años siguientes. Para la col umna correspondiente a muertes no diagnosticadas la e cuencia relativa del año 1992 se toma como perído base por lo cual, es equivalente a 1 0 0, y en nción de esto se plantean las reglas de tres. · Para el año 1993 se tiene: 1 4,2 % 1 00 4 •4 x lOO 0 1,4 (segundo # índice) = 1 4,4 % X X 1 4 Para el año 1994: 4 ,2 % 1 0 0 x 15, 6 % X , X 156 l 00 = 1 09 (tercer # índice) 1 4,2 Una vez obtenidos estos va lores se elabora el gráco de números índices. Para ello, se procede como se indicó en el gráco de líneas de tenden cia, con la única direncia que en el eje de la ordenada se ubican los valores de los números índices calculados El gráfco siguiente es la representación
1 14
de un gráfco de números de índices con os valores correspondientes a cuadro # 8. Cuadro # 8 Mortalidad general diagnosticada y no diagnosticada. Venezuela, 19921996 DAGNOSTICADA
ñ 1992 1993 1994 995 996
ueres
Pcetaje
70.760 71.65 73.288 77245 78591
85.8 856 84.4 85.5 85.8
NO DIAGNOSTCADA
Númers uetes Ídces 00.0 .71 0 99.8 2.050 98.4 .546 997 1300 1 00.5 1 3.007
Prct 42 144 15.6 14.5 14.2
úms Ídcs 1000 1014 1099 02. 97.2
Ta 8470 8685 86.834 90.345 91.598
Fuente: .S.A .S. emoia y Cuea .99- .996. Venezuela.
Gráfco # 8 Mortalidad general diagnsticada y no diagnosticada, expresada en Números índices Venezuela 1992-1996. 115
110
n
.
105
- Diagnostcada
. . •·
e
· • N da nosticaa
100
95
90 1992
1993
1994
1995
1996
Años
uene: . S.AS . Memoia y Cuenta .99 .996. Venezuea.
1 15
I FI Una vez completado el proceso de elaboración de la inrmación, el siguiente paso es el análisis de los datos. Antes de iniciar ese punto, es conve niente ectuar algunas revisiones importantes Es necesario, en primer lugar, una revisión de los cuadros y gráfcos a n de verifcar y entender que tipo de inrmación contienen Es decir examinar detenidamente el ttulo para ver de QUE se trata, COMO está distribuida la inrmación, DONDE Y CUANDO e recogida 2 La segunda recomendación es revisar el contenido, vericar si las clases están apropiadamente construidas, si las cias son las correctas y otros detalles (entes notas explicativas, etc ) que permitan alcanzar conclusiones válidas. 3. ericar si hay correspondencia entre los objetivos del trabajo y la inrmación presentada. Esto permite evaluar la pertinencia de los datos 4 Comprobar que las rmas de presentación se ajustan al tipo de análisis que se realizará JI ) En un estudio sobre Ruptura Prematura de Membranas (RPM), realizado en la mateidad de la Ciudad Hospitalaria Dr. Enrique Tejera", en Vaencia, en el año 1 997. De las historias clínicas se obtuvo inrmación de las variables: Peso y Sexo; conrmando las siguientes series estadísti cas K
X
K
X
250 00 ,50 2,860 2,50 550 ,900 ,000
F
2500 ,00 ,950 2,350 2770 3,600 250 3,50
F
116
F F M M M F M
F M M F M F M
2,500 2,800 3,250 2,980 3,950 ,900 2,980
3,290 2,000 3,500 3,800 2,500 3,30 3,000
F F F
F
F
F
A) Distribuya la infrmación de la variable cuantitativa en: cinco clases, siete y die. B) Presente esa infrmación en tres cuadros de distribución de fecuen cias de escala cuantitativa. C) Elabore un cuadro de distribución de fecuencias con la variable cua litativa. D) Elabore un cuadro de asociación, donde relacione las dos variables. E) Constrya los gráfcos correspondientes a cada uno de los cuadros es tadsticos elaborados. 2) Valores de hemoglobina de un grpo de niños menores de años aten didos en el Centro Mateo Inntil "San Bas, en Valencia; durante el mes de enero de 998 Hemoglobina expresada gramos por 100 c de sangre: 0,8 , 9,3
4,3 5,0 12,
,3 3,5 0,2 ,8 9,9 06
2, 4,6 4,0 ,4 2,3 3,0
2,2 8,6 0,4 ,3 0,4 2,5
A) Distribuya esta infrmación en: cinco clases, seis y ocho cases B) Presente la infrmación en un cuadro de distribución de fecuencias. C) Constrya e gráco adecuado a la variable y tipo de cadro 3 ) En un estdio sobre morbilidad pediátrica, realizado en el HUAL en 997, se obtvo de las historias clínicas, la siguiente inrmación
1 17
EDD 1 a a 7 . a 5 a 4 a 8 a 2 a 3 8 a a 3 a 4 a a 8
DIGNÓTCO gastroeteritis sarapió bronquitis aigdalitis otitis rbeola sarapió gastroeteritis gastroenteritis aigdalitis bronquitis broquitis otitis saapión
EDD a 4 a 2 a a 1 a a 9 1 a 10 . 7 a 2 a 1 a 4 a 5 a a 2 a
�·
DGNÓTCO rbeola varicela sarapió otitis aigdalitis broquitis varicea sarapión broquitis rbeola sarapió euona sarapió aigdaitis
1
A) Distribuya la infació e la variable cuantitativa e cinco y diez clases. B) Presete esa infación e dos cuaos de disibución de ecuencias de escala cuatitativa. C) Elabore u cuao e istibución de ecuencia co la variable cualitativa. D) Elabore un cuao e asocación, dode relacioe las dos variables E) Constrya los gácos corresponientes a cada uno de los cuaros es tadísticos elaborados. 4) Obseve la siguiente infrmación tomaa e 30 historias éicas del H.U.L. en julio el 996, para ua investigación sobre HEPATIIS VIRAL B. Para ello se obtuvo infrmación sobre las variables: Ead (en años). Resultados el Inmuoensayo enzimático y Factoes de riesgo.
1 18
TABLA MAESRA N 2 º
EDAD
RESULTADOS
27
Postvo Negavo Negatvo Negatvo Postvo Negatvo Negatvo Negavo Postvo Negatvo Postvo Negavo Negatvo Negatvo Negatvo Negatvo Postvo Negatvo Negatvo Postvo Postvo Postvo Negatvo Postvo Negatvo Negatvo Negatvo Postvo Negatvo Negatvo
18 38 35 30 22 30 25
33 48 37 41 20 29 25 29
39 40 23 34
32 29 36 24 45 42 31 38 43
23
1
FACORES DE RIESGO
Relacones sexuales promscuas Conactos con enfrmos de hepats Transsones de sangre o uso de drogas nyecbes Enfrmedades venéreas prevas Contactos con enfrmos de hepatts Contactos con enfrmos de hepatts Transsiones de sangre o uso de drogas nyectbles Relacones sexuales promscuas Contacos con enfrmos de hepatts Enfrmedades venéreas prevas Transsones de sangre o uso de drogas nyectables Reacones sexuales promscuas Transsones de sangre o uso de drogas nyectbles Contactos con enfrmos de hepatts Contacos con enfrmos de hepatts Relacones sexuales promscuas Transsones de sangre o uso de drogas nyectables Conactos con enfrmos de hepatts Contactos con enfrmos de hepatts Transsiones de sangre o uso de drogas nyectbles Reacones sexuales promscuas Transsones de sangre o uso de drogas nyectbes Relacones sexuaes promscuas Contactos con enfrmos de hepatts Enfrmedades venéreas prevas Contactos con enrmos de hepatts Contactos con enfrmos de hepats Contactos con enrmos de hepatts Enfrmedades venéreas prevas Transsones de sangre o uso de drogas nyectbles
Con la inrmación pesenada en esta tabla maestra: A) Tabule, en 5 clases la inmación refrente a la variable CUANTITATVA y
1 19
B) Preséntela en n CUADO DE DISTIBUCIÓN DE FRECUECIAS. C) Elabore el gáco adecado al cadro de Distibción de ecencias anteiomente constuido D) Presente en n cadro asociado la inrmación rerente a las dos va riables CUALITATIVAS. E) Elabore n gáfco donde se mestre la elación de las dos variabls calitativas. F) Elabore n GÁFICO qe mestre la VAIACIÓN POPOCIO NAL de los ctoes de iesgo para cada no de los esltados inm noensayo G) Elaboe n gráfco qe mestre la VAIACIÓN POPOCIONAL de los esltados del inmnoensayo paa cada no de los ctoes de riesgo. H) Elaboe n cadro de asociación donde se relacione la EDAD y LOS RESULTADOS del inmnoensayo ) Elabore n cadro de asociación donde se relacione la EDAD y LOS FACTOES de iesgo G) Elabore los gácos adecados paa pesenta la inrmación de los dos cadros anterioes. BBLIOGRAFÍA CONSULTADA
Camel, F. (1979) Estadística Médica y de Salud Pública. Carta edición. Mérida, Venezela: Tallees Gácos Univesitaios. Heández Sampieri Feández C. y Baptista P. (1991). Metodología de la Investigación Bogotá McGawHill.
120
CAPÍTULO V Técnicas de Análisis Univariado Etapa de análisis estadístico Medidas de tendencia central: Media Aritmética Mediana. Moda. Media ponderada Medidas de posición: Cuartiles, Deciles y Per centiles. Medidas de dispersión: Desviación media. Desviación estándar. Varian za. Coeciente de ariación Interalo intercurtil. Rango. Indice endémico Frecuencias relativas. Tasas Generales: de mortalida, de fecundida de natali da Tasas de morbilidad por una causa especca Tasas de incidencia Tasas de prevalencia. Tasas especcas de mortalidad para un gruo de edad o causa especca Tasa de letalida Tasas de mortalidad iantil, neonatal perinatal fetal temprana temprana propiamente dicha. Tasa de mortalidad matea Tasas de mortalidad proporcionada por una causa o a una edad especca Indice de Swaroop Medidas de riesgo: riesgo absoluto, relativo y atribuible
121
EL PROCESO DE ANÁLISIS ESTADÍSTO La etapa de anáisis estadstico involucra a aplcación de técnicas estadsticas a una seie de datos obseacones, con a nadad de descbros, analizarlos, nterpretarlos y hasta iner resutados, segú sea el caso: de estadsticas descrptvas o estadstica nrencia!, en ncón de los objetvos de a nvestgación En el presente captuo se tatará sólo lo reaconado con as técncas de anáss descrptvas para varabes cualtatvas y cuanttativas. Durante el proceso de eaboación se apreca como e carácter indvidual de las observacones es sstitdo por el nterés de conocer os valores re ridos a los grpos es decr, el carácter colectvo de éstas. Esos valores reidos a grpo, se expresan a través de medidas estadstcas que se tansfr man en vaores tpcos o representativos del conjunto de atos. Eos dan nfrmación sobre la manera en que los valores de conjunto se agpan o se dispersan en una disrbución. De acerdo a tpo de nfrmación requerida peden cacuarse: Meddas de tendenca cental Meddas de posicón Meddas de dispersión. Existen además, otras meddas que dan infacón acerca de la frma de a dstribucón como el caso de a "smeta y a "cutoss. Sin embar go, en esta oporundad sóo se revsará o conceente a las tres primeras mencionadas. Medidas de Tendenci a Central
Los grácos estadístcos muestan a fma en que se dstrbuyen las ecuencias de una vaable estudiada. Pero en ocasones es necesaio además, conocer n vaor numéco que represente a conjunto de datos Este vaor numérico es conocido con el nombre de medda de tendenca centra, el cual puede expresarse a través de la Media Aritmética, La Mediana y l Moda o valr modal.
123
La Media Aritmética
La media aritmética es un valor intemedio, que oscila ente el menor y el mayor de los números incluidos en una seie estadística. Es la medida de concentración o de tendencia central más estable y posee mayores propie dades matemáticas que la Mediana y el Modo. Se simboliza como Esta medida de tendencia central (X) es muy representativa de la serie si ésta es simética o ligeramente asimética. En su cálculo intervienen tods los valores de la serie estadística, por lo cual no debe utilizarse cuando alg no de los valores extemos presenta una gan direncia con respecto a ls demás valores. Así mismo, no puede calcularse cuando se desconoce el valor máximo o el mínimo de la distibución. La media aitmética de un conjunto de n valores (x) se dene como el cociente de la sumatoria de todos los valores de la seie dividida entre el núme total de ellos La expresión matemática es:
¿ X = X l + X 2 + X 3. . . Xn = X n n donde: _ = Sumatoria x = cada valor que ha tomado la variable en los sujetos estdiados n el número total de casos u obseaciones. El cálculo se ilustra a través del siguiente ejemplo 5 1 . Los valores de la presión sistólica de 5 pacientes atendidos en un hospital son los siguientes:
XI 11 mm de Hg X 116 mm de Hg X 11O mm de Hg X4 99 mm de Hg X5 11 mm de Hg. =
=
=
Aplicando la fmula la media aitmética de estos cinco valores es:
124
X
=
13 1 + 116 + 11O + 99 + 121
=
57 7 5
5
= 115 '4 m m d e H g
Cuando los datos están agrpados en clases de interalo uo, se muli plica cada valor por la ecuencia absolua de la clase respeciva; en este caso el valor de la media se calcula con la siguiene rmula:
¿ (Xi ·) Xi f l X2 · f 2 +. . . + Xnfn = X =
n
/ / 3 . f
Donde: ¿ = Sumatoria
Xi = Vaores de la variable en cada clase f ecuencia absoluta de cada clase n ecuencia toal Ejemplo 52: Presión arerial Sistólica en 1O pacientes Presión Sistólica mm de Hg
f
Xi .
393 3 330 99 11 10 1.175 31 x 3 ) 116 x 2) (1 l O 3) + 99) + 121) X 10 = 1175 X - 117 � mm de Hg 10 La media se obiene mediante la sumatoria de los productos de los valo res por su ecuencia, dividida entre el número total de datos, y se intereta como el valor representativo de esos valores, es decir, el valor de la media resume a todos los valores de la serie 131 116 110 99 11 n
3 3
125
Cuando e rango de a variable es amplio os datos pueden agrparse n cases para cilitar su anejo, aun cuando hoy en día, con el auxiio de ls computadoras, en realidad este proceso tiende a obviarse, a menos que co venga expresamente a agrpación en cases. A agrpar os datos en cases se asume que os valores en cada una se distribuyen de manera igual a o argo de ela perdiendo su carácter individual por o cual pasan a ser reprsentados por os centros de case o puntos medios. La media as caculada s una aproximación a la media de los datos no agrpados, pues al hacer la agrpación se pierde prcisión. En este caso a media de la distribución es igual a la sumatoria de las cuencias mutiplicadas por el centro de cada clase, y dividido luego entre total de la ecuencia.
Xm - f) ( ¿ X= n
Donde:
L Sumatoria Xm = Puntos medios o centros de case. f ecuencias absoutas de cada case n = total de as ecuencias. Ejemplo 5 3: Distribución de 71 pacientes de acuerdo a s u edad
126
Edad
f
Xm.f
20 24 25 29 3 0 34 35 39 40 44 45 49 50 54 Total
5 6 12 1 8 15 14 71
225 275 325 375 425
1 1 2,5 1650 390,0 412,5 3400 7125 735,0 8675
47,5
525
¿ (X m · j) = 2·867� 409años = X n La media aritmética es el valor alrededor del cual tienden a agrparse los valores del conunto de observaciones. Podría decirse que si no existiera variación, todos los suetos habrían tomado el mismo valor de la media en esa serie Por lo tanto, en el ejemplo anterior, todos los valores tienden a agrparse al rededor de 40,39 años La Mediana
Es una medida descriptiva ubicada en el centro de la distribución, por lo cual, divide a la serie en dos partes iguales Indica el punto por debajo del cual se encuentra el 50% de los casos, de tal frma que la mitad de los datos toman valores menores a la mediana y la otra mitad, valores superiores a ésta. Se simboliza como . Cálculo de la Meiana en series no agrupadas Eemplo 54: Se tiene la siguiente serie:
J O 11 12 8 años de eda
Se ordenan los valores en frma creciente o decreciente:
8 J O 11 12 2. Se busca la posición o lugar de la mediana Lugar de Md + l 5 + 6 3 = - =
n
2
2
3 . En la Serie, se busca el valor de la observación que está en el lugar de la mediana En este ejemplo, en el tercer lugar se encuentra el valor 1 0. Por lo tanto, la Md = 0 años. Nótese en este caso, que el número de obseraciones es impar (n 5), por lo tanto, la mediana es el valor observado en el centro de la serie, luego de ordenados los datos. Eemplo 5.5: Si el número de datos era par: 8 la mediana sería:
8 1O, 11 1y 15 años; la posición de
127
3,5 Al esta odenados los datos la posi c i ó n 35 es un luga i n temedi o entre elte3o.los dsy elvaloes 4to., enqueconsecuenci a , el valo de la medi a na es el pomedi o enocupan esos lugaes centales, es deci ente 1 O y 2 2 0,5 se Cuando los datos están agpados en clases estadísti c as la Medi a na calcula mediante la siguiente mula: +{[ ( ; ) _] �} Donde: Li límite inio de la clase donde está la mediana F .Adonde Fecuenci a acumulada hasta la clase antei o a aquella se encuenta la mediana. f = ecuencia absoluta de la clase donde está la mediana. Intevalo de la clase donde está la mediana. n ecuencia total, o total de datos Ejemplo 56: A tavés del sigui e nte ejemplo se i l ustaá el cálculo de la medi a na paa los dato agpados n +l
6 1
7
n
2
2
.
O 1 1
2
l
Distribucón de 1 00 estdiantes de acuerdo a la edad
128
Edad en
f
años
4 7 8 0 1 1 13 26 4 16 4 7 9 4 20 22 9 Total 101 1 . Determinación del lgar de la mediana + l 02 Lugar = = - = 5 1 5 - 7
FA
4 11 37
78 92 01
n
2
2
2 Obtener las Frecuencias acmuladas Al examinar la colmna de las FRECUENCIAS ACUMULAAS, se aprecia que la obseración número 5 está contenida enre las 78 e cencias acumladas hasa la carta clase por lo tano en ella se encuentra la mediana. Nótese qe hasta la tercera clase sólo hay 37 obser aciones, por o anto, all no pede enconrarse la obseración número 51. La mediana se encenra en la clase de 1 4 a 6 años (4a clase, por lo tano Li 14 f = 41 = 3, o sea 17 14 3 (resa de dos límites infriores consectivo F.A= 37 (Frecuencia acumulada hasta la 3ra clase. 2. Cálclo de la Md: Md 4(537 4 Md 4 (4 x 0,07) l4 1 02 Md 15,2 años. 129
Lo cua signifca que 1502 años es la edad por debao de a cua est l 50% de os estudiantes en otras paabras que a mitad de los estudiats tienen una edad igual o irior a 1502 años. La Moda o Vaor moda (Mo)
Es una medida de tendecia centra ácilmente obtenile. Se de como el valor más repetido en un conjunto de datos. Es conveniente si embargo hacer agunas consideraciones: 1. - Cuando os vaores de una serie tieen la misma ecuencia se dice no hay valor moda, ejemplo: 1 4 2 8 1, 4, 8 2, 9, 6, 6, todos os valores se repiten el mismo nú ro de veces 2 - Cuando dos vaores adyacentes tienen la misma ecuencia y esta cuencia común es la mayo, la moda es e promedio de esos dos vaos adyacentes así por eempo 2 3 3 4 4 4 5 5 5 6. 5+4 Mo = - = 4,
2 3. - Si en un grupo de vaores ay dos que no son adyacentes y tiene la mis ma ecuencia y esta ecuncia común es la mayor existen dos modas, es decir la distribución es bimodal. Conjuntos muy numerosos se de minan bimodaes cuando presenta un polígono con dos picos aún cua do la ecuencia en los dos picos no sean exactamente iguales. Cuad os datos están agrupados en una distribució de ecuencias la moda s toma como e punto medio o centro de la clase que tenga a mayor cueca Consideraciones en e uso de as medidas de tendencia central:
1 - La media es a medida de tendencia central que se emplea con mayo ecuencia, cuando las distibuciones son visibemente simtricas. Es u estadístico que perite el cácuo de otros estadísticos coo, por eje po la desviación típica y tiene una amplia aplicació en diversos tipos de anáisis estadístico. Es, además, la medida de tendencia central más estable o confabe 2 - Cuando la di�ibución es uy asimétrica se usa la mediana como la me dida más adecda así como cuando se necesita conocer con exactitu 130
el punto medio de la distibución. Del mismo modo, es útil cuando se tie nen series abiertas o vaores muy altos o muy bajos en os extremos de la see. 3 La moda se utiliza cuando se desea una estimación aproximada y rápida de a tendencia central En grpos pequeños la moda puede ser comple tamente inestabe.
El Promedio poderado o Media combiada o Media poderada () Se aplica cuando se requiere conocer a media de varias medias, es decir, si se tienen dos o más medias correspondientes a otras tantas muestras y se desea conocer la media general de todas as observaciones como si se trata ra de un sólo grpo La media ponderada de un conunto de observaciones, se defne como la sumatoria de los productos de cada una de estas observaciones por su co rrespondiente ponderación (p) dividida entre a suma de as ponderaciones.
( Xi · ni) ¿ � - = X p nI + n2+ . nn
Donde: Xi Media aritmética de cada grpo ni = número de sujetos que conrman cada grpo
Ejemplo 5. 7: Promedio de días de hospitaización de . paientes, distrbuidos por servicios. "Ciudad Hospitalaria Enrique Tejera CHE Valencia 1997 "
- �
Servicios
X de días
n
# 1
60
1 00
#2
50
600
#3
40
300
Tota X
1 .000
(60 x 00) + ( 5 0 x 600) + ( 40 x 300) 00 600 300
=
48000 000
= 4S
31
48 das fe el promedio de hospitalización de estos 1 000 pacientes MEDIDAS DE DISPERSIÓN O VARIABILIDAD. Ejemplo: 5.8 Observe la sigiente inrmación Peso de 7 lactantes sanos: Grupo A 6 6 7 8 9 10
1
Grupo B 6 7 . -· 7 8 9 9 1
Grupo C 6 7 8 8 8 9 1
Estas tres series reeridas a na misma variable presenta varias caracte rísticas comnes: Todas contienen la misma cantidad de datos,
n
Todas tienen extremos comnes por lo tanto, el mismo rango JO -
6 = 4 kgs.
· . ( n 1) ( 7 1) 8 medna: ; Todas tenen 1a msma 2
En el 4 lgar se encentra el valor 8. Md °
. . Todas tenen 1a msma meda atmetca: ' X
2
2
8 kgs. ¿X
=
--
n
=
4
56
7
=
8 K g
Sin embargo las tres series no son similares en canto a s rma de ds tribción. En la primera serie (grupo A) los valores tienden a agruparse en los extremos mientras qe en la última (grupo C) los valores tienden a agruparse en el centr de la distribción. An cando tienen tantos elemen tos comnes tienen na gran dierencia: la dispersión o variación de ss valores
1 32
Paa descibi o analiza una distibución de datos en ma competa, se necesita conoce la variación de sus valoes con eación a su medida de tendencia centa. La necesiad de calcula e interpeta as medidas de dis pesión viene ada po el hecho de que al constui una distibución y calcula las medidas de tendencia cental, aún cuando son os valoes representa tivos que esumen e conjuno, no todos os datos e a seie coiniden con elas, sino que se desvan. sta esviación se expresa con as medidas e dispesión. De allí a necesiad de conoce también las medida e dispesión o de vaiabilia. nte estas medias se tiene: el Rango, la Desviación Media, a Desviación stána, a Vaianza y el ntevao Inteuati. Rango o Campo de Variación:
Es a distancia ecoida ente e vao mayo y el menor de la seie Se refee a a dieencia ente os vaoes extemos de as obsaciones. Como medida de dispesión, e ngo tiene un uso muy imitado, por cuanto sólo toma en cuena a dos valoes de la distibución, os extemos La Desviación Media (DM).
s la suma e los vaoes absoutos (sin tomar en cuenta signo) de las desviaciones con especto a la media, dividida ente n; epesen a ispersión pomeio de as obsevaciones con especto a a media. Se entiene po desviación eia, a diencia ente caa valo y a media de la istri bución. Paa datos no agupados, se calcula mediante la siguiene rmula
n
Donde x valor de cada obsevación. X Meia aitmtica de la seie n núeo total e datos x X = diencia ente caa valo y la Media, ignoado signos emplo 5.9: Peso de los niños del grupo A: 6 6 7 8 9 10 - 10 kgs. =
133
1.-Se cacua a media: = = 8kgs X= 2.- Cácuo de a desviación media 6 + 6 7 8 9 + 0 10 7
X
n
56 7
Ii - X
X-
6
6 8 =-2
2
6
6 - 8
=
-2
2
7
7 - 8
=
- 1
8
8 8=O
o
9
9 -8
1
1
10
10 - 8 =2
2
10
10 - 8
2
=
=
=
2
7
=
3 Apicando a fórmua DM
=
lO 7
=
10
kgs
1,43
Desviación estándar
Es a medida de variación ecuentemente utilizada para mostrar a dispersión de os valores individuaes alrededor de a media en una distribución La desviación estándar es e promedio de desviaciones de as puntuacones con respecto a a media. Cuanto mayor es la dispersión de los datos mayor es a desviación estándar. Se simboiza como s" (en minúscula), o a letra griega sigma ( ). Para su cáculo se utilizan as siguientes rmuas: Para datos no agrpados o datos directos:
= s PXn X) s IL (XX) nl o
Se defne como a raíz cuadrada de la sumatoria de as desviaciones de cada puntación con respecto a a media, eevadas al cuadrado y dividida entre e número total e datos; o entre e tota de datos menos uno (n 1 ) cuando se tienen menos de 30 observaciones (muestra pequeña) y los datos no han sido agrupados en clases.
134
Ejemplo 5. 10:
6 6 7 +8+ 9 1010 56 7 7 2.Cálculo de la deviacione media Xi6 X (Xi) 68= 4 4 6 88 == 6 8 8 88 O 0= 4 00 4 0 8 = n = 8 18 s � 71 �6{ En erie agrupada, para calcular la deviación eándar o deiación tí pica, e uiliza la i iente rmula s ( ) Donde: = Deviación eándar f = ecuencia aboluta de cada clae Xm = Centro de cada clae X = Media aritméica n = total de dato Peso de los niños del gruo A: 6 6
9 - J O J O kgs
1 - Se calcula la media aritmética de la serie X=
8 kgs
o
�-
L
3.- Aplicando la fórmula,
s
1 7 kgs g
2
135
Ejemplo 5. 1 Disribución de 248 pacienes aendidos por intoxicación alimenaria. HUAL. 1997.
Edad e años 10 1 12 1 3 4 - 17 8 - 19 20 - 25 Tota
f
36 6 80 46 30 248
Xm 3 6 9 23
. Xm 396 728 280 874 690 L =3.968
Para cacular a esviación estándar (s): X m · J 368 . . L _ 6 anos A- Se cacu a a me atmetca X n 28 X = 16 años B- Se obtienen os esvíos meios, restando a mea a caa centro de case [Dm = (Xm - }. C- Cada desvo meio se eleva al cuarado. D- Caa desvo meio al c uadrado se multipca por la ecuecia absouta e la respectiva case. E- Se suman los prouctos e estas multiplicaciones [f(Xm - )]. F- Se dive e tota e la sumatoria entre e tota e a ecuencia Este re sultado se enomia varianza G- Se extrae la raíz cuadraa e a varanza.
136
(D) dad en años Xm Xm-) Xm-) .(Xm-X) 10 - 11 36 11 16 -5 25 900 12 - 13 56 1 13-163 9 504 14 17 80 16 16 - 16 O 18 - 19 46 19 19-16=3 9 414 20 -25 30 23 23 16 = 7 49 1470 248 Tota 3.968 ) 3288 � 1380 (F) = G) 3, 6 4 años, val o r que indic la frma como se dispersan las obseraciones lrededor de la media (B)
(C)
2
2
11
o
o
(Varianza)
s
3, 64 años
Varanza (2)
s a desviación estándar elevada a cuadrado, y se simboiza omo "S scuantiuntativas, conceptosin embargo, estdísticopramuynesimportante, especialmente en prebas descriptivos se utiliza preriblemen te la desviación estándar. 2
".
El Coefcente de Variación.
n opornidades es necesrio comparar a vriabilidad de diverss se enkgs, ries estadísticas, expresados en direntes unidades de medida, por ejempo cms, años, pulsaciones por minuto, etc. n tal caso, no es posibe existe utilizarmenor directamente la desviación estándr para determinar en cal de elas o mayor variación. n su ugar, se utiiz e coeciente de va rción. iación,s eunacualmedida mide dela varición variación relativa, porcently sedeexpresa los valores en a distribu en porcentje. El coeciente de varición se dene como el cociente entre la desviación estándar y l medi, multiplicado por 100 s
Cv = x lOO
137
A mao coeciente de vaiación más heteogéneo es e gpo ha ma o dispesión e gpo está menos concentado. A meno coeciente hay más homogeneidad en a seie mao concentación de os vaoes a me dia es más epesentativa de os vaoes que confman a see Eemplo 5 1 2: ¿Cuá de estas dos seies es más heteogénea? s
Talla Peso
75 Mts 60 kg
008 mts. ,5 kg
08 Cv (taa) = ' x 1 00 45 % 15 Cv (peso)
5 x 1 0 25 % 6
E mao coeciente de vaiación es e de a vaiabe taa 46%). Po o tanto este grpo de vaoes es más heterogéneo; su media es a menos e pesentativa de a seie. En a taa se apecia mao vaiación ente sus datos MEDIDAS DE POSICIÓN
Las medidas de posición se eeen a os ugaes donde se ubican dete minados vaoes de a distibución. Son medidas de posición: Los cuaties Q) Los decies D) Los pecenties (P) Cuartiles.
Son aqueas medidas que divden una seie de datos en cuato pociones iguaes en téminos de a popoción de obsevaciones en cada una de eas Q vao po debajo de cua está e 25% de as obseaciones ( + ) Para cacua e uga: Luga 4
138
Q2= valor por debao del cual está el 50% de las observaciones. 2 ( + l) Para calcular el lugar: Lugar = 4 Q3 valor por debao del cual está el 75% de las observaciones. 3 (n 1) Para calcular el lugar Luar = 4
Ejemplo 5 3 Como ilustración, se calculará el tercer cuatil (Q3 ) en la distribución siguiente Edad (Xi)
t
20 años 21 años 22 años 23 años 24 años 25 años 26 años 27 años 28 años 29 años
2 3 6 12 5 9 8 13 11 80
Total
F
2 3 6 22 34 39 48 56 69 80�-
Procedimiento
3 ( n l) 3 x 8 243 Posición del Q= 60,75 es el lugar) 4 4 4 Al observar la columna de ecuencias acumuladas, se nota qu el lugar 60,75 está incluido en la clase # 9 ; por lo tanto, el Q3 tiene un vaor de 28 años, dado que el intervalo de la distribución es igual a es decir, el 75 % de los sujetos de la distibución son menores de 28 años. Si los datos están agrpados en clases con intervalos de 2 o más, una vez ubicada la clase donde se encuentra el cuaril buscado se siguen lo mismos pasos utilizados anteiormente para calcular la mediana, según la frmula:
139
d {[ d d - lej} Donde
Q buscao) Cuartil buscao el cual puee ser 1; 2 ó 3 Li límite ierior e la clase one está el Q busao A Frecuencia aumulaa hta la clase anterior a aquell one está el Q busao j fecuencia absoluta e la clase one está el Q buscao. J Intervalo e la lase one está el uartil busao n fecuencia total, o total e atos. =
=
=
=
=
=
Son los valores o puntos de la serie que la dviden en 1 O pares guales. E primer decil o D 1 , es el valor por debajo del cual esá el 0% de los casos d la disibución. ara calcular, por ejemplo el D4 en la serie aneror, se pro cede de la manera sguiente: 4(n + 1) = 4 x 8 1 = 324 = 32,4 Lugar = 10 10 0 El decl 4 esá en el lugar 3 2,4 Ese lugar corresponde a la clase # 5 don de se encuentran los sujeos de 24 años; por lo cual, el decil 4 corresponde un valor de 24 años. El 40% de los sujeos tenen una edad igual o menor d 24 años. Si los daos están agrpados en clases con intervalos de 2 o más, una ve ubcada la clase donde se encuentra el Decl buscado, se sguen los mismo paso utlzados anteriormene para calcular la medana, según la frmula:
D d d D d - le P Son punos o valres que dviden la sere en 1 00 pares guales Es decir por debajo de un deermnado percenl se encuenra un cero porcenae d casos, por ejemplo, el percenti 60 es el puno por debajo del cual se encuen ra el 60% de los sueos ara lusrar se calculará el percenl 25 (25), en la sere anerior
140
El lugar del P25 =
25 x 8 100
2º25 100
205
En esa disbuón la posición 20,25 está ubicado en la cuarta clase donde están las personas de 23 años Luego el percentil 25 es de 23 años, lo cual indica que el 25 % de los sujetos tienen edades iguales o inrres a 23 años. Si los datos están agrpados en clases con intervalos de 2 o más una vez ubicada la clase dode se encuentra el Percentl buscado, se siguen los mismos pasos uilzados anterormente para calcular la mediana, según la frmula:
+ {[ J lcf} Donde:
P buscado P ercentil buscado (el cual puede ser cualuier va lor entre 1 y 100) Li límite inferior de la clase donde está el P ercentil buscado A Frecuencia acumulada hasta la clase anterior a aquella donde está el P ercentil buscado. frecencia absoluta de la clase donde está el P ercentil buscad Intervalo de la clase donde está el P ercentil buscado. n frecencia total, o total de datos =
=
141
Ejemplo 514: Edad de 104 pacientes hipertensos. Consulta de medicina intea CHET Valencia, 1997
7 8 24 36 3 4 2 04
dad 43 47 48 52 53 57 58 62 63 67 68 72 73 77 Tota
A 7 25 49 85 98 02 04
Calclar Percentil 75 l . - Lu ar de/ P5
75( n + l) = 75(104 ) = 75 x 105 = 7.875 78 75
100
100
100
100
'
Lgar del Percentil 75 = 78, 5 2. Segú la colmna de recencias acmladas el percentil 75 está con tenido en la carta clase, correspondiente a las edades de 58 a 62 años.
3- P 15 = Li
+
uga del P) - FA]J}
Límite inrior de la 4ta clase = 58 años. Lgar del Percentil 75 en la serie = 78,75 Intervalo de clase de la 4ta l.
=
5 años.
ecencia absolta de la 4ta l = 36 pacientes. Frecencia Acmulada hasta la 3ra l = 49 15 = 58 = 58
+
+
{[78, 75 49 5/6
{29, 75 x 0, 14 = 58
+
4,13
15 = 62, 13 años. Lo cal signifca qe el 75 % de esos pacientes tienen na edad igal o inrior a 62, 13 años
142
Intervalo ntercuartil
Se eplea con el n de superar la liitación del rango coo medida de dispersión Su ayor utilidad radica que entre sus líites se encuentra el 50 % de las obseraciones centrales de la distribución, que no son actadas por los valores extreos de la serie El intervalo intercuartil, tabién denoinado intervalo seiintercuar til ide la dispersión de los valores de la serie, pues, ienas ás próxi os son sus líites, existe ayor concentración de las obseraciones alrededor de la ediana. Es igual a la itad de la distancia entre el Priero y el Tercer cuartil Q=
QJ - Q1
ps - P2s
2
2
EL ÍNDICE EN DÉMICO
Un problea ndaental en el capo de la salud pública, es conocer el coportaiento de las enredades, es decir, su evolución y cambios tan to en su capacidad para producir daños, coo en la ecuencia con que se presentan. En este últio aspecto, el trabajador de la salud cuenta on un indicador u iportante, que provee inración para decidi si el núero de casos de una enermedad representa una sitación noral en una cou nidad en un oento deterinado o si se está en presencia de una epide ia. El índice endéico uestra tal sitación. Para elaborar el índice endéico se procede de la aner sigiente: 1 Averiguar la orbilidad de la eneredad estudiada en los últios 5 ó 7 años, especifcada por eses o seanas. No se debe usar enos de 5 años debido a las uctaciones que se presentan de un año a otro ni ás de 7 por cuanto en largos períodos las condiciones de la counidad pueden cabiar notoriaente. La especicación por seanas o eses se hará de acuerdo con el núero de habitantes de la región y con la e cuencia de la enrmedad estdiada 2. Se ordenan los casos por eses (o por seanas) independienteente de los años.
143
3 . - Se calcula la media aritmética y la desviación estándar en las series co rrespondientes a cada mes a media me dia indca el e l promedio d casos ese rados por mes siendo consderado el índic endémco a media más una desviación desviación y menos una desviación desviación (Mx (Mx y 1 s) serán serán las mdidas mdidas de las fuctaciones d un ao a otro Ejem Ej empl plo o 5 1 5 a g gs s a a aaa aaa 1 9901 990 1 996 Años 1990 1991 1992 199 1994 1995 1996
Ta ana 62 65 11 154 172 120 104
Mss d ao E
F
M
A
M
J
A
s
o
N
8
2
4
6
5
8
6
7
5
5
5
4
2
7
5
4
6
6
18
3
4
5
2
8
4
7
6
13
18
13
7
1
2
2
13
14
8
10
18
15
22
20
2
7
5
0
15
21
10
16
26
2
10
7
20
4
14
8
6
6
4
10
9
13
1
10
6
20
10
5
6
13
18
9
6
16
9
6
7
6
6
2
D
Fuen Fuente: te: anua anuar ro o de Epid. y Estad Estad/V /Vtal tal,, M.S. M. S.A. A.S, S, Venezea, Venezea, 990- 990 - 996 996
Calcul Calcular ar la mdia mdi a y la dsviación estánda est ándarr para par a cada cada mes y los valores d X - s y X + s: X
ENERO FEBERO MAO ABRI MAYO JUNIO ULIO AGOSTO SEPTIEMBRE OCTUBRE NOVIEMBE DICIEMBRE
144
77 7 7 1 94 700 928 10,71 1285 1171 985 157 800 657 614
s
4,7 6,41 526 11 7,55 5,11 5,62 476 5,1 5,45 ,84 ,75
-s 3,33
,08 174 6,17 ,16 7,74 609 509 826 2,55 27 2,9
1209 15,90 1226 129 1826 1796 17,7 14,61 18,88 1,45 10,41 989
Con la columna Xs, se consrye la primera cura; con los prome promedios dios la segunda y con los valores valores de X + s la ercera, ercera, mosrando mosrando así as í las l as 4 zonas de la curva endémica: Zona de éxio, zona de segurida segu ridad, d, zona de alaa y zona de epidemia 18
ZA DE EPIM 16 14
e
12
S
0
o
S
8 6 4
ZONA DE EX
N
FB
MAR
AR
MAY
JU
L
AG AG
S S
CT
NV
Meses
Cuando las ecencias de los casos por mes se disribuyen de manera muy asimérica, se sugiere el uso la mediana, del primer cuartil y ercer cuaril, para elaborar la curva endémica. TÉCNICAS DE ANÁLISIS DESCRIPTIVO PARA VARIABLES CUALITATIVAS.
Las Frecuencias Relaivas, sean ésas Proporciones, Porcentaes o Ta sas, sas , se emplean coúnmene coúnmene para para analizar analizar la inrmación inrmación obeida de vava riables cualiaivas Frecuencia Frecue ncia Relaiva Relaiv a de un deerminado deerminado aribuo aribu o es la relación que exise enre el número número de individuos indiv iduos que presenan presenan ese atrbuo, atrbuo , en una muesra muesra o población, y la olidad de los individuos que la conrman. E érminos genera generales, les, se calculan calcula n dividiendo el núme número ro de sujeos que que posee posee la la caraccaracerísica enre el oal de d e sueos sueos que podra poseerla. El produco de esa di visión visió n será será una proporción, la cual puede magnifcarse por cien par para expre
145
n
saa en pocenaje; pocenaje; y paa las asas muipicaas po (a n" puede pued e o ma ma el val valo o de 00 1 . 000 0.000 0.0 00 o más según según a asa asa que que se se calcu calcue). e). La impoancia de las ecuencias eativas como medida de esumen adica en que 1 Pemiten Pemiten compa compaa a vaia vaiass muesas aún cuando cuando sean de amaños amaños die die enes. 2 En cierto modo envelven la noción de pobabiidades o de riesgo de la existencia del eeid eeido o atibuo en los individuos de la pobación. Ciencias de la la Saud e e uso us o de as tasas es muy ecuene cuando se En Ciencias busca anaiza los fnómenos de mobilidad mobilidad mo moaidad aidad o naalidad en una pobación. Ellas indican e iesgo o pobabilidad de que esos acontecimienos ocua ocuan n en esa pobación pobaci ón en un peíodo deerminado. deerminado. La expesión maemática maemática genéica es: es : Tasa
Númeo de veces que ocure ocure un nóm nómeno eno en un lugar lug ar y tiempo detemna detemnad d
X IO"
=
Tota de veces ue ese nómen pudo ocurrir, en ese lugar y tiempo deteminado
TASAS GENERALES GENERALES BRUTAS: Tasa General de Mortalid Mortalidad, ad, Tasa General de Fecundidad, Tasa de d e Natalidad. Natalidad. Tasa General de Mrtalidad: T.G.M. T.G.M. =
Númeo total e muertes ocurridas durante un perodo en un lugar determinado
X
Poblcón Poblcón total del luga, para el 1 º de jul ju lo o del año en estudio estudio
1 .000 .000
Indica e iesgo ies go o pobabilidad pobabili dad que vo vo esa población pobl ación de moi moi po cuacua quie causa en e período p eríodo estdiado Tasa Tasa General de Fecundidad: T .G .G .F .F . =
Nacime Naci mento ntoss vios ocuido dura durante nte un perodo en un lugar lu gar determinad determinad
-----
� ----
oblación fmenina fmenina de de 5 a 49 años del lugar pa para ra e 1 de ulio ul io del ao ao en estdio
J000
Indica la pobabiidad pobabiid ad que iene la población de que en ella ocuran nacimiento vivos, po cada mil muee mueess en edades fcundanes en e n el peíodo esdiado.
146
Tasa Tasa de Nataidad T ..N N. =
--
Nacimientos Nacimi entos vivos vi vos ocurrdos durant durantee un peíodo, en un lugar determinado . Pobaón otal del luga paa el 1 ° de juio del año en esudio
X
1 .000
Indica Indica la pobabildad que tiene tiene la población de que en ella ocuran ocuran naci naci mieno mieno vivos, vivos, en el peíodo peíodo esdiado es diado d e mobilidad po causa Tasas Tasas Especícas Especíca s por causa caus a o por edad: Tasa de especfca, tasa de incidencia, Tasa de pevalencia, Tasa Tas a de Letalidad, Tasa de moalidad po causa especíca, ca, Tasa de mortalidad inntil Tasa de motalidad tempan temp ana, a, Tasa de motalidad tempana temp ana propiamente propiamente dicha, dich a, Tasa de motalidad tal, Tasa de motalidad peinaal, Tasa de moralidad matea matea Tasa de motalidad popocionada po causa específca o po edad.
TASA TASA DE MORBILIDAD POR CAUSA CAUSA ESPECÍFIC ESPEC ÍFICA A deenos eno deerminad deerminada u n luga s por a causa ocuridos en un y perodo deeminado -- x J OOO TME = · · · Pobación Pobación oal oal del lugar lugar para e 1 ° de juio del año en esudio º
Indica el iesgo o pobabilidad que tiene la población susceptible a una enmedad enmedad específca, esp ecífca, a enema po esa causa, en e n un luga y peíod peíodo o de teminado.
Tasa Tasa de Incidencia Incidenci a _ de casos nuvos de deerminada enrmedad en un ugar y período deteminado jul io del año año en esudio Población oa del ugar para el 1 de julio
TI.
X
]0"
Indica el iesgo o pobabilidad pobabilida d que tiene una población de que en ellas se pesenten pesente n nuevos casos de una un a enmedad específca po cada 1 habi tantes, en e n ese peodo pe odo deteminado n
Tasa de Prevalencia T P P
oal de enfemo po deteminada casa eistenes en un ugar y perodo demado 1 O" Poblacón oa oa del gar para l 1 de julio jul io del d el año en esudio º
Indica el iesgo o poba pobabilida bilidad d que tiene la población de que en ella exis ta una cantidad de d e csos de una enredad específca po cada 1 habi antes, en un luga y peíodo pe íodo deteminado n
147
TASAS DE MORTALIDAD ESPECÍFICAS, POR CAUSA O POR EDAD. N de mus mus ocuidas por dminada causa, caus a, en u luga lu ga y peíodo detemiado º
T.M.E. T.M.E. =
jul o del año en estudio Población toal del luga paa el I de julo º
X O
Indica e riesgo o probabiidad que tiene la pobación susceptible a una enermedad enermedad específca, especí fca, de morir por esa causa en un ugar y período deter minado. minado.
Tasa de Letalidad N d mut mut ocrridas ocrridas po dminada caua cau a n n luga lu ga y peíodo dmado dmado
TL =
Toal d nfmos po esa causa en ese luga y píodo dteminado
X 100
Indica Indica el riesgo o a probabilidad que tienen os enrmos de determinada causa de morir a consecuenca de a enrmedad que padecen, padecen, en e n ese ugar y período estudiado
Tasa de Mortalidad Infnti N de Muetes en menos menos d n año, añ o, ocuidas en un luga luga y podo p odo detemiad detemiado o 1 . 000 � Naciminos vivo ocidos ocidos duant duant l año, año , e l luga sdiado sdiado
T.Ml
Indica e riesgo que tienen os niños menores de un año, de morir antes de haber cumpido su primer año de edad, en ese ugar y período en estudio. Además de esta tasa de mortaidad inntil, también pueden cacuarse as Tasas de: Mortaidad Precoz (Incuye sóo as a s denciones de niños menores menores de de 7 a) Mortaidad días) b) Moralida Moralidad d Neonata Neonata (Denciones de niños menores menores de 28 días d ías)) Residua (Denciones de niños niño s de 28 días dí as a 11 meses) c) Moraidad Residua Para e e cálculo de d e estas tres tasas, e denominador es igua al de mortai dad inntil, o sea, nacimientos vios ocurridos durante durante e año; y e numera dor dependerá dependerá de la tasa a calcuar.
148
Tasa de Mortalidad Temprana: N de Metes en menoes de 5 os ocidas en n ga y perodo deteminado
T.M.T =
�
oblación menor de 5 años de edad de ese ga y peodo en estdio
x 000
Indica el riesgo que tienen os niños menores de 5 años, de morir antes de haber cumplido 5 años de edad, en ese ugar y período en estudio. Tasa de Mortalidad Temprana Propiamente dicha: N de Meres en niños de I a 4 años ocidas en n gar y período deteminado º
T.M.T.P
X
Pobación de niños de I a años de edad de ese ga y período en estdio
.000
Indica e riesgo que tienen los niños de 1 a 4 años de edad, de morir en ese lapso, en ese ugar y período en estudio Tasa de Mortalidad Fetal: N_de Mertes taes oc. das dnte e o en n ga determinado añ x OOO Nacimientos vivos ocidos dante e año en ese ga esdiado º
T.M.F
Tasa de Mortalidad Perinatal: TM.T.Pn
Metes faes de más d 2 8 semanas + Moaidad pecoz en ga y tiempo det X
Nacimientos vivos ocrridos drante e año, en ese ga
000
Tasa de Mortaidad Materna: Motaidad matea ocrridas dante e año e n n lga deteminado
T.MM. =
Nacimientos vivos ocridos en ese gar drante e año en estdio
x 000
Indica e riesgo que tienen las mujeres embarazadas, parturienas y puér peras, de morir por causas asociadas a embarazo, a parto o a pueerio, en ese lugar y período en estdo. Tasa de Mortaldad Proporcionada por causa especíca: N de mees ocidas drte e año po determinada casa, en n ga específco
TM.Pc.e
x 100
Tota de meres ocuridas dane e año en e lga estdado
Indica la probabiidad de que por cada 1 00 muertes ocurridas en ese u gar por cualquier (todas) causa, determinada cantidad haya sucedido por una causa específa, durante e período estudiado
149
Tasa de Mortalidad Proporcionada por edades: N de mueres ocurridas a determinada edad duante e año en n lgar específco º
T.M.Pe. =
oa de mertes ocurridas drante e año en e lugar estdiado
X
100
Indica la probabidad de que por cada 100 muertes ocurridas en ese lu gar por cuaquier causa, determinada cantdad haya sucedido a una edad es pecíca durante el perodo estudado Indicador o Tasa de Mortalidad Proporcionada, para 50 años o más (ndice de Swaroop) N de denciones de esonas e 5 0 ó más años en n uga y eodo especco
TMP
--
-- x 00
Tota de muees ocridas durante e año, en e uga estdiado
Indica la probablidad de que por cada 100 muertes ocurridas en ese lugar por cuaquer (todas) causa, determinada cantidad haya suceddo en personas que ya han cumpldo 50 o más años de vda durante el período es tudiado Medidas de riesgo La incidencia además
de reejar a veocdad con que aparecen nuevos casos de una enrmedad también sre para cacular el resgo reativo de contraer la enermedad; sendo gualmente út para conocer a etologa de una enrmedad Por su parte la Prevalencia mde la totaldad de casos exstentes de una enermedad en la pobación durante un determnado período La prevalencia se ve actada por tres ctores: Incdencia (Casos nuevos que se suman.) Duracón de la enfrmedad (agudas o cróncas). Moradad (casos que se restan). Sn embargo cuando una poblacón ha estado expuesta a u ctor que puede ser considerado de resgo, es necesaro estmar a probabiidad que tene esa pobación de que en elas aparezcan o no los ectos producdos por ese ctor En este caso, se estman tres medidas Resgo Absouto Resgo Reativo, Riesgo atrbuible las cuaes no indican que todas aquellas personas expuestas a ctor de resgo desarrollarán a enermedad, sino que
150
tienen mayor probabilidad que los no expuestos. Riesgo Absoluto. Es similar a la incidencia, y se utiliza para calcular
los otros dos valores. Para ello se calcula la tasa de incidencia de la enr medad en el grpo de individuos expuestos al riesgo y en la de los no ex puestos (Cañedo, 1987). Riesgo Relativo - Expresa la incidencia de la enemedad en el grpo de
expuestos al ctor, con respecto al grpo de los no expuestos.
Riesgo relativo
Incidencia en el gruo expuesto al riesgo Incidencia de los no expuestos
Un riesgo relativo alto sugiere que el ctor puede ser el causante de la enrmedad (por lo tanto la conveniencia de eliminar o controlar ese ctor de riesgo) Riesgo Atribuible Expresa la cantidad de casos nuevos atribuibles a
un ctor en paricular. Se calcula mediante la difrencia ente el grpo de los expuestos y los no expuestos
R.A Incidencia en gruo expuesto Incidencia en gruo NO expuesto Eemplo 5 . 6 : E n una intoxicación alimentaria ocurrida en una escuela de Caracas, se supo que los escolares habían consumido panquecas con jamón, el cual se sospechaba estaba en mal estado. Para el esudio epidemiológico de la siación, la población se distribuyó de la manera siguiente: Escolares
Intoxicados
Expuestos al fcor de iesgo (consumieron panq. con jamón) NO expuesos a fco d r (NO consumieron pan con .)
TOTAL
NO intoxicados
Total
540
380
20
70
110
180
610
40
1.100
Calculando los iesgos absolutos relativos y atribuibles se tiene N e enfermos 00 asa de Incdenc1a = Población Toal º
15
540 R absoluto (grupo expuesto) = 100 58,69 % 9 20 70 R absouto (grupo NO expuesto) 100 38,8 9 % 180 58,69 % 1 Resgo reatvo = 38,8 9 % Riesgo atribuibe = 58, 6 9 % 38,89 % 19 ,8 % Adicionamente, en estos estudios epidemioógicos se utiiza la preba de Chi cuadrado (X2) para estmar si existe asociación entre el fctor de riesgo y la aparición de a enermedad Los datos se presentan en tablas de contingencia de 2 x 2 de a siguiente manera
Apación de la en rmedad Ttal S N
SI NO
Cómo calcuar e interetar e chi cuadrado se expicará en el capítulo VII. EJERCICIOS PARA RESOLVER:
1) Obsere la siguiente inrmación: º
Cuadro N 1
Paete te dd dad aea 1 Edad en año 30 - 40 41 50 51 60 61 - 0 71 - 85 TTA
Nº de pacientes 10 62 9 59 22 250
Fuente Archivo de consulta pvada: CEMET y CMGM. 1 993- 1 998.
152
Con esta inrmación calcule A) Media aritmética (X y esviación estándar (s) Interetacin. B) Mediana (Md) Percentil 25 y 75. nterete los resultados. C) Los intervalos de clase y los centros de clase de cada una. ndique su sigifcado. 2) Obsere la siguiente inrmación: V, eún e H.. Venc. 99 199. EDD en añ 20 33 34 44 45 52 53 60 6 68 69 76 77 84 85 y má TOTL
Frecuenca abouta 5 1 8 4 16 10 2 6 52
Fuente: Archivo cenal de C.H E. T.
CALCUL: A) La medida de tendencia central adecuada para esta ditribución. In terprete el resltado. B) La medida de dispersión apropiada a esta serie. xprese su sigifcado. C) Los intervalo de clase y lo centros de clase de cada una. 3) Obsere la siguiente nrmación
153
r frmdd if-i, diriuid pr ñ d d u Bái Cr" Vi, 1998 �.
EDAD años 8 años años 0 años 1 años 2 años
N de escoares º
14
16 16 24 20
De esta serie calcule: A) Media aritmética (X) y desviación estándar. B) Mediana (Md) e Interalo intercuartil. C) Moda (Mo). D) Interprete los resultados de cada una de ellas. 4) Calcule la medida de tendencia central y de dispersión apropiada para los cuadros de distribución de ecuencias elaborados como eercicios en el capítulo IV (Ejercicios 1 , 2 y 3 ).
BIBLIOGRAFÍA Camel, F. (979). Estaístca Méca y e Sal Públca Cuarta edición. Mérida, Venezuela: Talleres Gráfcos Universitarios. Cañedo D. , Luis. ( 1 99). Investgacón clínca México, D.F Nueva Edito rial Interamericana. Escotet, M. A ( 1 973) Estaístca Pscoecatva México, D.F.: Editorial rillas. Heández Sampieri R., Feández, C. y Batista, P. (991). Metoología e la Investgacón. Bogotá McGrawHill.
154
CAPÍTULO VI Probabilidades y Curva Normal Teoría de las probabilidades. Propiedades de las probabiliades Principios Probabilidades simples. Probabildades de eventos mutuamente excluyentes Probabilidades de eventos no excluyentes Probabilidades de eventos independientes Probabilidades de eventos dependientes. Probabilidades condicionales Distribu ción de probabilidades Distribución Binomial Distribución Normal abla de áreas de la curva normal Problemas
155
PROBABILDADES, DISTRIBUCIONES DE PROBABILDADES. CURVA NORMAL EORÍA DE LA PROBABILIDAD La teoría de probabiidades representa e ndamento de la inrencia es tadística. El primer concepto manejado sobre as probabilidades es e conocido como probabilidad clásica o apriori atribuido a los matemticos Pas cal y F ermat De acuerdo a este concepto, la probabiidad de un evento se conoce antes de reaizar e experimento. Posteriormente aparece un nuevo concepto propuesto por Beouli y se ndamenta en a ecuencia relativa. Según este autor, a reaizar un expe rimento un elevado número de veces la ecuencia reativa se aproxima a su probabilidad A este tipo de probabiidad se le conoce como probbilidades a posteriori. En estas se encuentran incuidas as tasas. E concepto más reciente, es el llamado personaista o subjetivo según el cual a probabiidad es una medida de confanza personal acerca de una pro posición particular. La base axiomática de a probabiidad e presentada por el ruso Andres Kolmogorov, dándoe así e carácter teórico a la isma. Estos diversos enques o conceptos de probabilidades no son incompa tibes entre s, siendo de utiidad en diversas disciplinas Denición: Probabilidad es una medida matemática de la psibilidad de que se produzca un acontecimiento o un hecho en una serie de ensaos repetidos en condiciones similares y con determinada frecuencia (Weintraub 1985, 61) En términos matemáticos, la probabilidad de que un evento vorabe" ocurra, viene dado por la razón geomtrica entre e número de casos espe rados o vorabes" (a") y la totaidad de casos, posibes" (n"); uponien do igualdad de condiciones y posibilidades de ocurrencia, para todos os elementos de un espacio muestra dado P(A)
_
Número de resultados favorables al evento A a n Número total de casos posibles
-
-
157
PROPIEDADES DE LAS PROBABILIDADES
Cuando se caculan las pobabidades de que ocua un determinado evento, su esultado sempe seá: 1 Un alo de signo positivo, y 2 Un valo que oscia ente cero y uno ( P 1 ) (e "ceo coesponde a la imposbildad de ocuencia, y e "uno a a ceteza absoua de la pobabiad de dicha ocuencia) Además la suma de as pobablidades de ocuencia de un eveno "f voable más las probabiidades de os "no fvoabes es igua a la totaidad (a + Smbolizándose gualmente como "p los casos fvoables y "q los no fvoables (p + q 1 Cuadro # 1
Intoxicaciones en menores de 6 años. 150 casos distribuidos segn edady sexo Valencia, 1998 Edad
SEXO
Masculno
O- 1
20
Femenno 15
TOTAL 35 -�
2-3
55
22
77
45
30
8
38
45
150
�-
TOTAL
105
Fuente: Historias Médicas.
De espacio muesta descrto en el cuado # 1 CALCULAR: A La pobabilidad e que a extae una Histoa Médica de eta muesta, coesponda a un ño meno de 6 años. 150 = = � l P n 150
B La pobabilidad de que al extae una Histoia Médica de eta muesta coresponda a un iño mayo de 6 años = � = _ = n 150
158
C. La probabilidad de que al extraer una Historia Médica de esta muestra, corresponda a una niña. 45 = P a- = 0,0 n 150 D. La probabiidad de que al extraer una Historia Médica de esta muestra, NO coesponda a una niña P ! = 05 = 0,70 n 50 E. La probabilidad de que al extraer una Historia Médica de esta muestra, corresponda a una niña o a un niño 5 150 _ a b 45 _ + p n n 150 50 150 Ya se ha dicho que a probabilidad de que un evento ocurra vara entre y , por lo tanto e resutado siempre será un número positivo y faccionado (a excepción de la imposibilidad y de certeza absoluta), el cal puede ser mutiplicado por cien para maejaro en porcentaje, y fcilitar su iterpreta ción. PRINCIPIO DE LAS PROBABILIDADES
Cuando se tiene un espacio muestras denido, son múltiples las probabilidades de os eventos aleatorios que en ese espacio muestra! pueden ocu rrir En tal sentido, se cacuarán as probabiidades de eventos simples, mu tuamente excluyentes, o no excluyentes, eventos independientes, depen dientes y condicionados Para a mejor comprensión de estos conceptos, se utiizará como ejem plo a inrmación reerida a espacio muestra! presentado e e siguiente cuadro estadístico:
159
Cuadro # 2
Partos prematuros. 200 casos distribuidos sen Tipo de parto y lugar de atención Valencia, 1997 CENTRO HOITALARIO
Tipo de pato
úbico
65 15 "80
aginal esáea TOAL
Cínica ivada
IVSS
38 3 70
40 0 50
TOTAL
43 57 00
Fuente: Historias clínicas.
1- Probabilidades Simples.-
e reere a la probabilidad de que ocurra sólo un evento en un solo expe rimento i "A es un evento cualquiera en un espacio muestral "n, entonces la probabilidad de "A es iual a:
p A
=
a -
n
Ejemplo 6.1 De la infrmación presentada en el cuadro # 2, Calcular: A) a probabilidad de que una mujer de esa muestra haya tenido un parto por vía vaginal. a 143 P
(A)
=-=072 n 00 '
Esta probabilidad también puede expresarse en rma de porcentaje, por lo tanto, existe un 72 % de probabilidades de que al extraer por azar una his toria médica de esa muestra, corresponda a una muer que haya tenido un parto por vía vaginal. B) La probabilidad de que una mujer de esa muestra haya sido atendida en un hospital público. P
()
160
! = n
80 = O 4 ó 40 % 00 ,
2.- Probabilidades de eventos mutuamente excluyentes
Denominada también probabilidades completas o totales. Se entiende por eventos muamente excluyentes aquellos donde al ocurir un evento determinado, impide que ocurra simultáneamente su complemento, en un solo experimento. En tal caso, cuando se busca como aciero, un evento "a entre varios resultados que son muuamente excluyentes, la probabilidad de ese aciero es i gal a la suma de las probabilidades de cada evento por separado. Se utiliza la regla de suma o de adición de las probabilidades
p(AoB) =P(A) +P(B) Eemplo 62 De la infrmación presentada en el cuadro # 2, Calcular A) La probabilidad de que una mujer de esa muestra haya sido atendida en un hospital público o en el . S
p(A oB) = p( )
+
p(B)
50 b 80 P(A oB) = + = + 0 4, 0 + 0 5 = 0 , 5 200 200
B) Calcule la probabilidad de que una mujer de esa muestra haya tenido un parto por vía vaginal o por cesárea. 3.- Probabilidad de eventos N O excluyentes.-
Existe una variante en la suma de probabilidades, en la cual los eventos se superponen o se intersectan Cuando se busca la probabilidad de que ocu rra el evento A o el evento B o ambos eventos conuntamente, se suman al gebraicamente los eventos posibles; por lo tanto, las probabilidades del aciero es igal ala suma de las probabilidades separadas, menos el intersec to de los dos eventos.
p(A oB) = P(A) + P(B) - P(A yB) Ejemplo 6 3. De la infrmación presentada en el cuadro # 2 , Calcular: A ) La probabilidad de que una mujer de esa muestra haya sido atendida en el VSS o tenio un parto por vía vaginal
p(A oB P(A) + P(B) - P(A B)
16
p(A B º
50 143 40 = + - 05 + 072 0,20 0,77 200 200 200
B. ) Calcule la probabilidad de que a una mujer de esa muestra se le haya practicado una cesárea o fuese atendida en una clínica privada. 4.- Probabilidad de eentos independientes
Tambin denominada probabilidades compuestas. Si el evento A no de pende del evento B y B no depende de A entonces A y B son independien tes es decir la ocurrencia de uno no inuye sobre la probabilidad de ocu rrencia del otro. Cuando se busca conocer la probabilidad de que ocurran si multáneamente dos o más eventos donde uno NO depende del otro esa probabilidad es igual a la multiplicación de las probabilidades separadas
pA yB) =(A) p(B X
Ejemplo 64 De la inrmación presentada en el cuadro # 2 Calcular
A) La probabilidad de ue de dos mujeres de esa muestra, una haya sido atendida en un hospital público y la otra haya tenido un parto por vía vaginal.
p(A B PA p(B X
80
43 =
p( A · B) X - 0,40 x 0,715 = 0,286 200
200
B) Calcule la probabilidad de ue al extraer simultáneamente tres histo rias clínicas de esa muestra, una de las historias corresponda a una mu jer ue fue atendida en el J VS.S. tra en una clínica y a la última se le haya practicado una cesárea. 5.- Probabilidad de eventos dependentes
En una situación donde los experimentos no ocurren simultáneamente realizan sin reposición, también se aplica la regla de multiplicación o de probabilidades compuestas para conocer la probabilidad de que ocurra un evento cuando previamente ha ocrrido otro que le afcta En tal caso la ocurrencia del evento va reduciendo el espacio muestral. Eemplo 6.5 De la inrmación presentada en el cuadro # 2 Calcular:
162
A La probabilidad de que al extraer tres historias (una a una y sin reposi ción, la primera corresponda a una mujer que tuvo un parto por vía va ginal, la segunda sea de una mujer atendida en una clínica, y la ercera también
pA y B yC = p(A) X pB X p(C) pA B yC)
= 143 X 70 X 69 0715 X 035 X 0,348 0,087 200 199 198
B Calcule la probabilidad de que al extraer cuatro historias una a una y sin reposición todas correspondan a mujeres que fueron sometidas a cesáreas 5.- Probabilidades condicionales
Cuando se busca la probabilidad de que un evento ocurra, dependiendo de una condición específca previamente establecida, el espacio muestral se limita exclusivamente al sub-total de los posibles resultados del evento, que presentan dicha condición específca. Se trabaja con un subconunto del conunto general En tal caso, se busca la probabilidad de que ocurra A dado que se cumple B ". Se simboliza coo: P (A/B) y se calcula ediante la expresión
pAyB) pAIB) p (B)
P(A y J es la probabilidad conjunta de los eventos A y B.
Eemplo 66 De la infrmación presentada en el cuadro # 2 Calcular:
A. a probabilidad de que a una mujer de esa muestra se le haya ractica do una cesárea dado que fue atendida en una clínica privada. (# cesárea en clínica) / n (Cesara!ltmc) . ) n z as en c/'zcas aten d d
p( A IB)
= p( A yB ) p
B
3 2 / 200
70 / 200
=
32
70
= 0 46
'
163
B.) La probabilidad de que una mujer de esa muestra haya tenido un part
por vía vaginal, dado quefue atendida en una clínica privada. DISTRIBUCIONES DE PROBABILIDADES
Uno de los obetivos del cálculo de probabilidades es determinar distri buciones que puedan servir de modelos a los variados nómenos aleatorios que se presentan en las ciencias experimentales y sociales. Existen dos tipos de distribuciones que son importantes en las aplicacio nes prácticas las discretas y las continuas Una distribución Discreta surge al contar (el número de hijos, de partos de caries accidentes etc.) una con tinua aparece cuando se mide la temperatura, los valores de glicemia, úre�, hemoglobina, hematocrito, etc Se tratará, por ahora de las distribuciones unidimensionales. Se estudiará la binomial como distribución discreta y la normal como distribución continua siendo ésta última una de las más aplicadas en el campo de la salud. Todas estas distribuciones tienen sus probabilidades cal culadas por lo cual se consideran distribuciones teóricas o modelos mate máticos. Esas probabilidades suelen compararse con las obtenidas de frma em prica según el tipo de variable, y de esta manera puede determinarse el tipo de distribución teórica que sigue un conunto de datos empíricos, a lo cual se les denomina auste; así una variables discreta de acuerdo a su probabili dad y al número de repeticiones del experimento, se puede austar al mode lo binomial o al normal. Distribución Binomial
Propiedades:
µ = np ;
2 = npq ;
Condiciones para las aplicaciones Si n es grande la dstribución binomial tiende hacia la normal y la proba bilidad del evento se puede obtener tipifcando la variable mediante la ex presión: z X -µ /
164
Si la probabilidad del evento es muy pequeña, (P < O , 1, y np < 5), las ci as decimales resultan muy agas, y al redondear se cometen errores signicativos, por o cual se recomienda ajustar la binomial a otro modelo. Un eemplo de distribución binomial se muestra a continuación: X
p
o
11
1 1 /1 8 3
1
134
1 34/1 83
2
22
22/183
3
11
11/183
4
3
3/183
5
2
2/1 83
1 83
1 ,00
Es de hacer notar que todos los vaores de p, son probabiidades empíri cas Para calcular as probabidades teóricas en una distribución binomiales necesario desarrollar e Binomio de Newton. Eemplo 6.7. Se tiene una muestra frmada por mujeres, que son madres de 5 hios cada una. Se busca conocer a probabiidad de que a elegir una por azar, ésta sea madre de: a) 3 varones y 2 hembras. b) por o menos 3 varones. c) entre 2 y 5 varones d) que no tenga varones. La probabiidad de que sea varón es igual a la de que sea hembra, en este caso, 50 % para cada uno p probabilidad de que sea varón; q probabilidad de que sea hembra 5 ( p + q ) 5 = p 5 5 p 4 q +10p 3 q 2 +10 p 2 q 3 + 5 pq 4 + q
(00) 5 +5(00) 4 (00) + 10(00) 3 (00)2 + 10(00)2 (00) 3 4 +5(00) + (00)5 =
= (0.0315) + 5 (00625)(00) + 10(0125)(05) +10(05)(0125) + 5 (00)(1.0625) + (003125) = 0.03 125 + 0.15625 + 0.3125 + 0.3125 015625 0.03125 1
165
a) Se busca la probabiidad de elegir por azar una mujer con 3 varones 3 2 3 p ó p ) y 2 hembras (2 ó ) = p , lo cual corresponde al tercer tér mino de a ecuación, por lo tanto, esa probabiidad es de 0,3125, o d 31,25 % b) Por o menos 3 varones 0,03125 + O, 15625 + 0,3125 = 0,5 c) Entre 2 y 5 varones: 0,3125 + 0,3125 + 0,15625 + 0,03125 = 0,812 d) Que no tenga varones: 003125 Eemplo 68Se sabe que a 36% de los pacientes con urolitiasis, vistos por primer ve en la consulta de uroogía infntil de Hospital Universitario Ange Laralde", en el transcurso del año se les realizó exámenes de creatinina. Si se toma una muestra de 5 pacientes, calcue: a) la probabilidad ue a ninguno se le haya realizado dicho examen b) la probabiidad ue se le haya practicado e examen a entre 2 y 3 pa cientes, ambos inclusive c) la probabilidad que se le haya reaizado e examen a más de 3 pacien es Para encontrar el valor de dcha probabilidades se desarrola el Binomi de Newton Si se designa por p", la condición de paciente con examen de creatinina y por q" los paciente sin ese examen, se tiene que e binomio toma la fr ma
( p + q Y = ( p + q) s p 5 + 5 p 4 q + 10 p 3 q 10 p 2 q + 5 pq q En este caso, la probabilidad de p y no son iguales; el eempo pantea ue p
=
36 %
=
100 36
64 % . Expresado en proporción, se tiene
p = 0,36 y q = 0,64 Sustituyendo p" y q" por su vaor (0,36)5 + 5(0,36)4 (0,64) + 10(0,36)3 (0,64) + 10(0,36)2 (0,64)3 +
5 5 (0,36)(0,64)4 (0,64
= 0,006 0,054 0,1911
+
0,3397 0,30 0,107 = 1,00
a) La primera pregunta rmulada se refere a la probabilidad de que a ninguno de los pacientes se le haya practicado examen de ceatinina, lo cual coesponde a q 5 por lo tanto, la probabilidad = 0,107. ,
b) 0,1911
0,3 397 0,5308
c 0,1 9 1 1 + 0,054 + 0,006 0,25 1 1 Ejemplo 6.9 Se sabe que al 3 8% de los pacientes con urolitiasis, vistos por vez prime ra en la consulta de urología inntil del HUAL, en el trimestre anterior, se les practicó examen de glicemia Si se toma una muestra aleatoria de 6 pa cientes. Calcule: a) la probabilidad que se le haya realizado el examen a más de 2. b) la probabilidad que se le haya practicado a menos de 5 c) la proba bilidad de que entre 3 y 5 pacientes, ambos inclusive, hayan sido examinados. Ejemplo 6. 1 0 Si al 29% de los pacientes del ejemplo anterior se le ha practicado el examen de sro sérico, y se toma una muestra de7 de ellos, cuál es la proba bilidad de que a) 2 se les hya realizado dicha prueba?. b entre 2 y 5 hayan sido examinados?. Ejemplo 6. 1 1. En una muestr aleatoria de 1 O pacientes, al 45% de ellos se le practicó urocultivos, calcule la probabilidad que: a a 3 se le haya realizado dicho examen b) entre 3 y 7 hayan sido examinados. c) a más de 4 personas se les haya practicado el examen d) hayan sido examinados menos de 7. Distribución normal
Cuando n" es grande y p" se aproxima a 0,50, el modelo de a distribución binomial se aproxima a otro modelo teórico denominado dstribución normal. La importancia de esta distribución es que muchos enómenos tienden a seguir este modelo, el cual presenta sus propias caractersticas, tales como:
167
- La distribución normal es simétrica y a gracarla tiene rma de campana, originando así la curva norma.
2- La media, a mediana y a moda, coinciden en su centro y a dividen en dos partes iguaes 3.- Es asintótica con respecto al abscisa, teóricamente se extiende desde hasta + 4 La media es cero y la desviación estándar es l 5 - Se simboia mediante a expresión N(O,l). El área total comrendida bao a curva norma y e eje horizontal es igual a 1 (unidad cuadrada), y representa a totaidad ( 00 %) de las proba biidades de ocencia de un fnómeno determinado Debido a la simetría de esta curva, al trazar una ordenada en su centro, que toque a parte más alta de ela, a divide en dos partes, donde e 5 0 % de área queda a a dere cha y e 5 0 % restante hacia la iquierda A esta ordenada se e conoce como ordenada máxima Si paraea a la ordenada máxima se traza otra ordenada en cualquier punto de la abscisa y bajo la curva, uede cacularse e área comprendida entre ambas ordenadas, sin embargo, taes cácuos no son necesarios dado que elos han sido obtenidos y presentados en la tabla de áreas de la curva norma
Para aplicar una distribución norma a una distribución emírica se tipica a variable en estudio (x), mediante e cambio a a variabe z. = ( - X)ls. En una distribución normal típica, z indica a dirección y grado en que un vaor individua (x) se aleja de promedio Si e valor de x es mayor a a me-
168
dia, z es de signo postivo, y se encuentra en e ado derecho de a cura nor ma. Si por e contrario, x es u vaor inrior a a media, z es de signo nega tivo y se ubica en el área izquerda. Tabla de áreas de la curva normal.
Es una taba de dobe entrada, donde la primera coumna contiene as desviaciones sigmas (o vaores z) En ea aparecen estas desviaciones des de 0,0 hasta 3,0. En a primera fla está el compemento de dichas desviacio nes, de ta manera que puedan manejarse con dos acciones decimaes. E cuerpo de la taba contiene e área de a curva correspondiente a las desviaciones sigmas desde 0,00 hasta 3,09. Dado que a curva es simétrica, en a taba sóo se muestra a mita de área (0,5000 ó 50 %), es decir, un soo lado, entendiénose que a otra mitad es igua Estas áreas pueden demarcarse a partir de la ordenada áxima (ugar done se encuentra la media aritmética de a distrbución) asta cuaquier oa orenada que se trace pa raela a ésta, dependieno de cuantas desviaciones sigmas se aeja la segunda ordenada con respecto a a ordenada máxima Eemplo 6 1 2. Dada una distribución norma, encontrar e área de la curva norma, comprendida entre: a) La µ y 1 , 54 sigmas
O
1 ,54
Se busca directaente en a tabla de áreas de a curva norma, abordándoa por 1 ,54, y se ocaliza en e cuerpo de a taba e área buscada; en este caso, e área que e coespone es de 0,4382; el cual puede ser expresado en porcentae, y se tine un 43,82 % es el área comprendida entre a µ y ,54 sgmas.
169
b) La µ y -1 ,73 sigmas
1
L ·
- 1 ,73
o
Area izquierda, dado que z es negativa En la tabla, 1 ,73 sigmas corresponde un área de 0,4582 Igual a 45,82 %.
•�
c) Entre -1 ,3 2 y 1 , 1 5 sigmas.
-,32
-
115
o
En la tabla se obtiene: para 1 ,32 � 0,4066 para 1 , 1 5 � 0,3749 Se suman las dos áreas, dad que limitan a ambos lados la ordenada má xima 0,4066 + 0,3 749 0,78 1 5 En porcentaje 78, 1 5 % Entre -1 ,3 2 1 , 1 5 sigmas se encuentra el 78, 1 5 % del área central de una curva normal =
=
d) Entre 0,66 y 1 ,78 sigmas. -
1
O
En la tabla se obtiene
1 70
0,66
,78
para 1, 78 � 0,4625 para 0,66 � 0,2454 Estas áreas corresponden a la zona que va desde la ordenaa máxima hasta 1, 78 sigmas y desde a ordenada máxima hasta 0,66 sigmas Dado que e área buscada no imita a ordenada máxima, debe descartase la ona comprendida entre ésta y 0,66 sigmas, de ta manera que sóo quee e área comprendida entre 0,66 y 1, 78 sigmas 0,4625 0,2454 = 0,217 . Expresado en porcentaje se tiene que entre 0,66 y 1,78 sigmas se encuen tra e 21, 71 % del área de a cura norma. e) Por encima de 2,00 sigmas
o
2,00
En la taba, 2,00 � 0,4772, e cual es el área desde a ordenaa máxima hasta 2,00 sigmas. Dado que se busca el extremo de a cuva, se resta de 0,5000 e área obtenido en a taba 0,5000 04772 = 0,0228. En porcentaje: 2,28 % Por encima de 2,00 sigmas se encuentra e 2,28 % de área e la curva norma. 6.13) Determinar a cuantas desviaciones sigmas se encuentra e percen til 77 -,
O
0,74
171
Hasta la mitad de la curva hay un área de 50 %, por lo cual, sóo habrá que buscar en e cueo de a taba a cuantas sigmas se aeja la ordenada que imita el 27 % (50 + 27 = 77) por encima de la ordenada máxima. A buscar 0,2700 en el cuerpo de la tabla, este valor no aparece, por lo cual, se toma el valor más próximo a é, siendo 0,2704, correspondiéndole O, 74 sigmas. E percenti 77 se encuentra a 0,74 sigmas 6. 4) ¿A cuántas sigmas se encuentra e percenti 20?
30%
-0,84
O
20 % es el área correspondiente a a cola izquierda de a curva normal No limia a a ordenada máxima, por o tanto, debe restarse de 50 (ó 0,5000 - 0,2000) para conseguir a zona que sí la limita, y uego buscar la difrencia (0,3000 o un valor próximo a éste) en la tabla Como 0,3000 no aparece en ela se utliza 0,2995, correspondéndole 0,84 sigmas. Dado que se busca un área de a izquierda, sgma es de signo negativo El percentil 20 se encuentra a 0,84 sigmas en una cura normal 6. 1 5) ¿A cuántas sigmas se evantan las ordenadas que imtan el 70 % centra de una cura normal?
1 ,04
o
1 ,04
En virud de que el 70 % es cenal se divide este valor entre 2 para luego buscar esa área en el cuerpo de la tabla Esta división es necesaria dado que la tabla sóo contiene a mitad de la curva.
172
El 35 % ó 0,3500 se extiende hasta 1,04 sigmas; por lo tanto, el 75 % central se encuentra entre 104 y 1,04 sigmas Así mismo estas caractersticas de la curva normal pueden ser aplicadas a una variable empírica medante el cambio de esa variable a z, utilizado la rmula: (X X )
z = -
Ejemplo 6.16. En una investigación acerca del estado nutricional de los escolares de 1 ro a 3er grado en las escuelas de la Vivienda Rural de Bárbula, se encontró que los niveles de hemoglobina se distribuyeron siguiendo una curva nor ma, con una media aritmética de 12,39 gr/100cc y una desviación tpica de 3,22 gr/100 c. Si el tamaño de muestra e de 64 escolares, se desea saber: a) la probabilidad d qu al slccionar un scolar ést prsnt un valor
d hmoglobina igual o mnor qu JO gr./1 c
P(X
0 �
z
=
12,39 -
10129 = 0,74 sgma 32
En la tabla, 0,74 sigma corresponde a un área de 0,2704, pero al ser una zona extrema, perteneciente a una cola, se resta de 0,5000. 0,5000 0,2704 = 0,2296 ó 22,96 % Existe 22,96 % de probabilidades de seleccionar por azar un niño con va lores de hemoglobina igual o infrior a 1O, mg/100 c. en la muestra de escolares estudiados b) probabilidad d ncontrar scolars qu prsntn valors de hmoglobina ntr 11 5 y 12
173
P ( l 1 , 5 < X < 2 7)
1 239
1,5
z ,5 2 9 -08 sigma 32
z
1
270
(0 1 10 3 en a abla)
1 2• 7 - 2 9 O J O sigma (0,0398 en taba) 32
0,1 103 0,0398 = 01 501 ó 1 5,01 %
que al seleccionar un estudiante, en forma aleatoria presente niveles de hemoglobina iguales o mayores que 12
) probabilidad de
P(X < 2)
2
239
·
z 1 2 1 2 9 -OJ2 sigma 32
--
(0,04 7 8 en a taba)
0,047 8 + 05000 = 0,5478 ó 547 8 % d) probabilidad de que
un estudiante seleccionado al azar presente valores de hemoglobina entre 9, 6 y 11 6.
¡- P(96 < X < l l 6) 1
1 96 � - 1 74
6
239
=
9,6 29 32
0 '87 . l l, 129 = 05 · 3,22
En la tabla a 0,87 sigmas le coesponde y a 0 ,25 le coresponde �
0 ,3 0 78; 0,0987
Debido a que están del msmo lado de la curva se restan 0 ,3 078
0, 0987 = 0,2091; o 20,9 %.
d) ¿ A cuántas sigmas se encuentran los niños que tienen 11, 39 gr/100 c de hemoglobina?
1239
1 1 ,39
z=
9 129 = ,00 0 l sigma 32 32
e) ¿ cuantas sigmas se encuentra el 20 de los escolares que tienen los menores valores de hemoglobina?
30% o
Como el 20 % es un área extrema de la curva, se resta de 5 0 %, y la di rencia se busca en el cueo de la tabla, para conocer a cuantas sigmas se encuentra 50% 20% 30%, se busca en la tabla, 0,3000, o un valor aproximado En este caso, el valor más próximo es 0,2995, al cual le coresponde sig ma = 0,84 Se utiliza con signo negativo por cuanto se refere a un área de la
175
izquierda de la curva Existe un 20 % de probabilidades de que quienes ienen menores valores de hemoglobina esén a 0,84 sgmas ¿ Qué valores de hemoglobina tiene el 20 de los niños que presentan menores valores de hemoglobina?
Por el resulado del ejercicio anterior se sabe que el 20 % de los niños con menores valores de hemoglobina se encuenran a 0,84 z. Como z es un valor conocido se puede despejar X ( valor buscado) de la frmula: X -X
z = s
X X +( · )
Por lo tanto, susiyendo en la frmula se iene: X = 12,39 ( 0,84 3.22) = 1 2,39 270 X = 9,69 gr/100 c g) ¿A cuantas sigmas se encuentra l 40 de los escolares que tienen los valores mayores de hemoglobina?
o
50% 40% 1 0%, se busca en el cueo de la abla O, 1 000, al cual le corresponde 0,25 sigmas Existe la probabilidad de que el 40 % de los escolares con altos valores de hemoglobina se encuentren a 0,25 sigmas, con respecto a h) ¿ Qué valores de emoglobina tienen los escolares que se encuentran a
1,25 sigmas?
176
1 25
X = X + (z · s) X = 12,39 + (1 ,25 3,22) = 1 2,39 + 4.03 X = 1 6,42 gr/100 c i) ¿ Qué valors de hemoglobna tienen los escolares que se enuentran a
-1, 50 sigmas?
-1 ,50
.J
X = X + z s) X 12,39 + ( 1 50 x 322) 12,39 483 X = 756 gr/l OOcc
j) Qu é valores de hemoglobina le corresponde al percentil 80
¡ - El percentil 80 se encuenta a 0,84 sigmas Se buscó en la tala el área 0,3000 (direncia de 80 % 50 % = 30 %, y uego transfrmado en proporción).
X = X + (z · s)
1239 + (0,84 322) 1 2,39 + 2,70 X = 15,09 gr/ OO cc. X
=
k) ¿ Qué porcentaje de escolares
tiene valores de hemoglobina entre 9 y
13,5 g100 c. ?
9
13,50
. 3 9 1,05 sgma z 901239 (0.353 1 en la tabla) ' 32 32 13012,39 = 11 0 4 sgma (0. 133 1 en la tabla) = 32 32 Se suman estas dos áreas, ddo que están a ambos lados de la cura: 0.3531 0.1331 0.4862. Expresado en porcentaje indica que existe la probabilidad de que el 48,62 % de estos niños tengan valores de hemoglobi na entre 9 y 1 3,5 gr/1 00cc. 1
2
1) Qué porcentaje de escolares tiene más de 13,5 g/100 c?
1350 L _
�
_
1301239 = 034sgma (0.1 331 en la tabla. Igual a 1 3,3 1 %) 32 Como se busca un área extrema se resta de 50 % z
178
5 0 % - 1,1 % 6,69 % Existe a probabdad que e 6,69 % de esos escolares tengan valores de hemoglobina speriores a 1,5 0 gr/ OOcc. m) Qu é porcente de escolres tiene más de 1139 gr/100 c
1 1 3 9
z
3 9 - 239 - ,OO = 2
,22
-031 (0 .1 217 e n la ta ba)
12,17 % + 5 0 % = 62.17 % Al porcentaje (1217%) encontrado en a taba se e ha smado 50% dado que quenes tenen vaores de hemoglobna superores al promedio también son parte de la respesta a probema panteado. n) ¿Qué porcentaje de escolares tiene menos de 10 39 g/100 c?
10,39
z
·-
1039 2,39
2,0 = = -
2
3,22
0.5 00 0
�
-O'62 (0.23 24 e n la ta bla)
- 0.2324 = 02676 X 100 = 26.76 %
Exste la probabdad que el 26,76 % de estos niños tengan valores de hemogobina nferiores a 10,9 gr/ OO cc o) Cuántos escolares tiene menos de 10,39 g/100 c
179
Por el ejercicio anterior se sabe que el 26, 76 de os escolares tienen va lores de hemogobia infriores a 10.39 gr/lOOcc Asimismo, los dato aportados en el probema indica que se utiizó una muestra de 64 escoa res Por lo tanto, puede cacuarse cuántos niños representan ese 26, 7 6 % d 64 escolares (26,76 X 64) / 100 = 716 Existe la probabiidad de que 7 escoares tengan vaores de hg. infriore a 10.39 gr/100 c. 617 Ejemplo: Se sabe que los valores de hemoglobina en un grpo de 71O años, de es coares de l ro a 3 er grado, de la ivienda Rural sigue una curva normal co una media aritmétic de 9,72 mg/ OOcc. y una desviación estándar de 2,3 mg/100cc. El úmero de estudiates de dicha escuela es de 720. Se requier saber la probabiidad de que al seleccionar un estdiante, éste presente va ores de hemoglobia: a) Igual o menor que 9. b) Mayor o igual a 11 c) Entre 8 y 13 . d) Igual a 10 f ¿Qué valores de hemogobina e correspondió como máximo a 20 de los estudiates que presentaron los nivees más bajos? g) ¿Qué vaores de hemoglobina e correspondió como mínimo, al 30 de los estudiates que presentaron los niveles más altos? h) ¿Qué vaor de Hemoglobia le correspodió a los perceties 27; 60 y 75? i) ¿Cuántos estudiantes presentaron los niveles de hemoglobina igual o menor de 13? Ejempo 6.17: Se sabe que los vaores de hemoglobina e 64 escoares, seleccionados al azar, en e Ciclo Básico "M. V. Romero Garca, se distribuye norma mente con una media de 14,04mg/100cc y una desviación estándar de 1,8 mg/ l OOcc. Se requiere saber la probabilidad de que a seeccionar un est-
180
81
b) Entre 20 y 49 años c) Igual a 30 años d) gual o menor a 15 15 años e) ¿ Cuál es es la edad máxima del d el 20% de los pacientes más jóvenes? f ¿Qué ¿Qu é edad le corresponde a los los percentles percentles 40 58 y 76
BIBLIOGRAFÍA Danel W. (1977) Bioestadística México México D.F. D. F.:: Limusa Bio métrica y Sanitaria. SeRemngto Remngton n R y Scork Scork A (1977) (1977 ) Estadística Biométrica gunda edcón. Méxco, D.F.: Prentice/Hall Inteaconal.
Weintraub, Weintraub, J., Douglas, Ch y Gllngs, Gllngs, D. (1985) (1 985).. Bioestadstica en Salud bucodental Carolna Carolna del del Norte. U.S U .SA A.:.: Publica Publicación ción de OPS OPS
182
Aeas de a cua noral z
.00 .00
01
02
03
04
05
06
07
08
09
.O
.0000
.0040
.0080
0120
0160
099
.0239
.0279
.039
.0359
.
.0398
.0438
.0478
.057
.0557
.0596
.0636
.0675
.074
.0753
.2
0793
.0832
.0871
.090
0948
.0987
. 1 026
. 064
. 103
.141
.3
79
127
.255
. 2 93 93
33
. 3 68 68
. 1406 1406
.443
.480
.57
.4
554
1591
.628
.664
700
736
.1772
.808
.84
.879
.5
915
.950
.1985
.209
.2054
.2088
.223
.2157
.2 190
.2224 .2224
6
.2257
.2291
.2324
.2357
.2389
.2422
.2454
.2486
.257
2549
.7
.2580
.26
.2642
.2673
.2704
.2734
.2764
2794
283
.2852
.8
288
290
.2939
.2967
.2995
.3023
.305
.3078
.3106
.333
.9
.3159
3186
.322
.3238
.3264
.3289
.335
3340
.3365
.3389
.0
343
3438
.346
.3485
3508
.353
.3 5 5 4
.3577
.3599
.3621
.
.364 .3643 3
.3665
3686
3708
.3729
.3749
3770
.3790
.380
.3830
2
.3849
.3869
3888
3907
.3925
.3944
3962
.3980
.3997
.4015
.3
.4032
.4049
4066
.4082
.409 .4099 9
.4 5
.43
.4147
.4162
.41 .41 77
.4
.4192
.4207
4222
4236
.45
.4265
.4279
.4292
.4306
4319
1 .5
.4332 .4332
.4345
.4357
4370
.4382
4394
.4406
.448
.4429
.444
1.6
.4452
4463
.4474
4484
4495
4505
.4515
4525
.4535
.4545
1.7
4554
4564
.4573
.4582
459
.4599
.4608
466
.4625
.4633
1.8
464
.4649
.4656
.4664
462
.4678
.4686
4693
.4699
.4706
.9
.473
.479
.4726
.4732
.4738
.4744
.4750
.4756
.4761
.4767
2.0
.4772
.4778
4783
.4788
.4793
.4798
4803
.4808
.482
.4817
2.1
.482
.4826
.4830
.4834
.4838
.4842
4846
.4850
.4854
4857
2.2
.486
4864
.4868
.4871
.4875
.4878
4881
.4884
4887
.4890
2.3
.4893
4896
.4898
490
.4904
.4906
.4909
.49 .49
493
496
2.4
498
4920
.4922
4925
.4927
4929
.493 .493 1
.4932
4934
4936
2.5
.4938
.4940
.4941
4943
.4945
4946
.4948
4949
.495
.4952
2.6
.4953
.4955
.4956
4957
.4959
.4960
.496
4962
.4963
.4964
2.7
.4965
.4966
.4967
4968
4969
4970
497
.4972
.4973
.4974
2.8
4974
4975
.4976
.4977
4977
.4978
97 9 .4979
.4979
4980
.498
2.9
.498
4982
.4982
.4983
4984
.4984
4985
.4985
4986
4986
3.0
.4987
.4987
.4987
.4988
.4988
.4989
4989
.4989
4890
4890
183
CAPÍTULO V Estadística Inferencia/ Iferencia erenc ia estadísti esta dística ca Distr Di stribu ibució ción n muestra! muest ra! Distrib Dis tribuci ución ón de la Media de la muestra Error estándar Estimación de los parámetros. Estimación por puntos. Estimación Estimac ión de intervalos. intervalo s. Estimac Est imación ión de la Media Media oblaciona oblac iona Estimación de una proporción proporción poblaciona poblaciona Prueba de hipótesis Nivel de signcación Selección de estadísticos a prueba Regla de decisión de cisión Pruebas Pr uebas de Hipótesis para una media de población población Para un porcentaje de población Para ferencia entre dos Medias de Población. Población . Dferenca erenc a entre dos Proporciones Proporcion es poblacionale pobl acionales s t de Student tudent Ejercicios
185
1 8 6
ESTADÍSTICA INFERENCIAL El presente capítlo trata de los procedmentos nrencales necesaros para llegar a conclusones valederas sobre poblacones, tomando como base, la nrmacón obtenda en una muestra. La ncón prmordal de la nrenca estadístca es apoyar el razonamento para llegar a decsones sóldas a pesar de la lta de un conocmento verdadero del unverso, y realmente es tan mportante esta ncón que se suele hablar de la estadístca como el estdo de decsones ante la ncertdumbre". La nrenca puede ser deductva o nductva La primera es un juco o generalzacón basado en axomas o premsas, de las cuales se deriva una conclusón medante un razonamento daléct co, a pror. La nerenca ndctva por su parte, es un juco o generalzacón dervado de obseracones empírcas o expermentales, y la conclusón se obtene de un procedmento a posteror. La nrenca estadístca es por tanto nductva y llega a generalzacones sobre las caacterístcas de una poblacón basándose en observacones empírcas realzadas en muestras aleatorias. Es ecuente que las meddas obtendas en una muestra (estadstcos) sean drentes al parámetro de la poblacón. A la drenca entre estas dos meddas se le denomna error. Determnar el tamaño de ese error sólo sería posble s se conocera el parámetro de la poblacón, pero éste, por lo general, se desconoce. La únca rma de conocer dcho valor sera realzando todas las observacones posbles de todo el unverso, lo cual es sumamente dcl e mpráctco en ncón del costo y tempo. De esta dfcultad surge la nrenca estadístca la cual permte presumr las caracterstcas del unverso a partr de las muestras. De la meda de una muestra se hacen nrencas sobre la meda de la po blacón, por supuesto no se sabe la drenca entre esas dos medas, que como se do anterormente, la últma es desconocda en la mayora de los casos; lo que se conoce es la probabldad de que esta drenca no sea mayor, por ejemplo de tres o dos errores típcos. El valor obtendo en una muestra (estadstco) puede consderarse como un estmador del parámetro de la poblacón. Un estmador es una ncón de las puntacones de la muestra que da lugar a un valor, el cual sumnstra nracón sobre el parámetro. Un estadístco que se calcula partendo de
187
una muestra al azar es una variable aleatoria y por consiguiente, tiene una distribución de probabilidades propias, la cual es conocida como distribu ción muestral de un estadístico Así puede tenerse una disibución muestra! de medias, cuando el estadístico es la media aritmética; distribución mues tral de proporciones, cuando el estadístico es una proporción o porcentae, y así sucesivamente.
DSTRBUCIÓN MUESTRAL Una distribución muestral es una distribución de probabilidades de un estadístico calculado a patir de todas las muestras posibles de tamaño n elgidas al azar en una población deteminada. Si de una población se selec cionan sucesivas muestras de tamaño n y a cada una de esas muestras se les calcula un estadístico distribuido en frma nomal, se tendrán distribucio nes de ecuencias de los valores promedios de esa variable en cada una de las muestras Al representar gráfcamente esos valores muesrales (Media aritmética por ejemplo), se encontrará que también siguen una frma de cura normal. DISTRIBUCIÓN DE LA MEDIA DE LA MESTR
Todo estadístico de una variabl· continua tiene una distribución mues tral donde: 1 . La media de las medias de las muestras es igual a la media de la po blación 2 La varianza de as medias de las muestras es igual a la varianza de la población, dividida entre el tamaño de las muestras (n) 3 . La distribución de las medias muestales tiene frma de curva nor mal. Se tiene el siguiente emplo De un universo hipotético rmado por cinco (5) suetos, cuyas edades son: 1 O 1 2 1 4 1 6 - 1 8 años, con una media poblacional de 4 años y una varianza poblacional de 8 años (2 = 8 años) se tomaron todas las muestras posibles (con reemplazo) de tamaño 2 (n 2) obteniéndose los siguientes resultados
188
10
10 10 + 10 (X 1 0) (S2 O)
12 1 0 + 12 (X 1 1) (S2 1 )
14 1 0 + 14 ( = 1 2) (S2 4)
16 10 + 16 (X = 1 3) (S2 = 9)
18 10 + 18 (X 14) (S = 16)
12
1 2 + 10 (X = 1 1) (S2 = 1 )
12 + 12 (X 1 2) (S2 = O)
1 2 + 14 ( 1 3) (S2 = 1)
12 + 16 (X 14) (S2 = 4)
12 + 18 (X = 15) ( S 9)
14
14 + 10 (X = 12) (S2 = 4)
14 + 1 2 (X = 1 3) (S2 = 1 )
14 + 14 (X = 14) (S2 = O)
14 + 1 6 (X = 1 5) (S2 1 )
14 + 18 (X 1 6) (S = 4)
16
16 + 1 0 (X = 13 ) (S2 9)
16 + 12 (X = 1 4) (S2 = 4)
16 + 14 (X = 15) (S2 1)
16 16 (X = 1 6) (S2 = O)
1 6 + 18 (X 1 7) (S = 1)
18
18 10 (X = 1 4) (S = 1 6)
18 + 12 (X = 1 5) (S 9
18 14 (X = 1 6) (S = 4)
18 + 16 ( 1 7) (S = 1 )
18 + 18 (X = 1 8) (S = O)
Distribución mustral de esas medias:
j
x
# de Muestras 1 _ I 2 3 4 5 4 3 2 1
- -
10 11 12 13 14
15 16 17 18 Total
1
25
� ¡I
14 13 14 1 5 12 13 14 15 16 1 2 1 3 14 15 1 6 17 1 0 11 1 2 1 3 14 15 16 1 7 18
X= 14
ji 189
¿ ( Xi · ) 380 = 14 anos _ X n 25 En esta distribución muestra} de 25 muestras posibles, de tamaño dos la media aritmética es igua a 14 años, (X = 14 años) y a varianza es de 4 años (S 4 años). ( m . ) [ J L años s n �2 Lo cual confrma a teoría de que en una población distribuida en rma normal a X de las medias µ de la población (X 14 años y µ 14 años) y que la varianza de as medias de a muestra (S = 4 años) es igual a a varian za de la población dividida entre el tamaño de las muestras ( 2 8; 8/2 = 4 años). Sin embargo estas condiciones no se cumplen cuando las muestras se rman sin reemplazo o la población no está distribuida normalmente en cuyo caso, se aplica un teorema matemático conocido como T d Lí C el cual contempa que: Daa una población con una meia µ y varianz anita , la istribución muestra/ e calculaa a partir e muestras e tamaño e esa población, está istribuia aproximaamente en forma nor mal con meia µ arianz a n, cuano el tamaño e la muestra es grane. " Cuando la población es fnita y las muestras se toman sin reposición, y n < 30, es necesario utiizar el ctor de corrección �( N - n) / ( N -1); por lo cua a expresión es N n NI El teorema del límite centra permite tomar muestras de poblaciones no distribuidas normamente, con a garantía de que los resultados obtenidos serán aproximadamente los mismos que se obtendrían si la población se distribuyera en rma normal sempre que se utilice una muestra grande = -
2
=
2
=
=
=
=
=
2
=
2
2
190
- n
-
ERROR ESTÁNDAR
Teóricamente en una distribución muestal las medias se distrbuyen en rma normal alrededor del promedio, de la misma manera como se distribuyen los valores individuales en una distribución de ecuencias. Allí, la medida de dispersión es la desviación estándar, y en la distribucón mues tra! es el error estándar, el cual no es más que el promedio de ls errores muestrales. Ello signifca que las distintas medias de la distribución mues tra! contienen una acción de error en sus estimaciones con respecto a la media poblacional. El error estándar puede denirse como la dierencia que existe ente el valor estimado en la muestra (estadístico) y el verdadero valor representati vo de la población (parámetro), por lo tanto, mientras menor sea el error es tándar mayor será la aproximación del estadístico al parámeto. Al error estándar también se le conoce como error por muestre y está en nción del tamaño de la muesta. Mientras mayor sea la muestra, menor es la magnitud del error estándar. En teoría pueden existir distribuciones muestrales para los dierentes es tadísticos conocidos: media aritmética, desviación típica, mediana, porcen tajes, etc por lo cual es posible calcular el error estándar para cada uno de estos estadísticos obtenidos en las muestras Cálculo del error estádar
Dado que el error estándar es una desviación estándar en una distribu ción muestral se simboliza como S " acompañado del símbolo del estadís tico respectivo; por ejemplo: S ; S rpJ , para el error estándar de edia y de proporción respectivamente Para calcular el error estándar de la media se utiliza la rmula =_ SX ¡
(1)
Donde: = Desviación estándar de la muestra. n
= Tamaño de la muesta.
S x = Eror estándar
191
Para calcular el eror estándar de una proporción o porcentaje:
� S (P) = �-
(2 Donde: p
= porcenaje de sujetos con la caracerísica en estdio
q = ( 00 p) porcenta e de sujetos sin la característica en estudio n = tamaño de la muestra utilizada
Para calcular el eror estándar direncial: (3) del error estándar.En nción de la defnición del error estándar y de las propiedades de la distribución muestral, es posible: a Estimar los valores representativos de una población b. Tomar decisones en nción de prebas de hipótesis c - Calcular el tamaño de una muesta, cuando se espera una determinada precisión entre el estadístico y el parámetro ESTIMACIÓN
En páginas anteriores se ha dicho que la inerencia estadística pemie hacer generalizaciones hacia el universo a partir de la inmación obtenida en una muestra En este sentido, mediante la inducción, es posible obener un valor representativo de la población, el cual se conoce con el nombre de estimador Para que resulte de mayor utilidad, un buen estimador debe tener: Con sistencia, ausencia de sesgo y efciencia 1 . Cosistecia: Un estimador consistente es aquel que tiende a aproxi marse al valor del parámetro de la población, en la medida que el tamaño de la muestra crece 2.- Ausecia de sesgo Se dice que un estimador es insesgado s la media de la distribución de medias de as muestras, es igual al valor del parámetro
192
estimado. La media X es un estimado insesgado de µ. 3 Efciencia: Se refere a a precisión con a cua taes medidas pueden es timar un parámetro. Es más efciente aquel estimador que tega meor error típico. es un proceso mediante el cual, en una muesa se obtiee un determiado vaor, denominada estadístico, para luego, e nción de él, cacuar (estimar) su vaor e la pobació correspondiente Este vaor po blacional recibe el nombre de parámetro. La estimación puede eectuarse por puntos o por interao. Estimación por puntos
La estimación por puntos pantea un soo valor numérico como paráme tro de universo, estimado a partir de una muestra. Es probable que a considerar un solo puto como estimador de un parámetro se cometa un error, ya que, la muestra no es más que na pequeña parte de conjuto mucho más grande, por lo tanto, es aventrado afrmar que e vaor correspondiente a la población sea e mismo vaor calculado para a muestra. Pero si el número de obseraciones es sufcienemente grande, se obtendrá una medida muy similar a la de parámetro. Sin embargo, a menudo hay limitaciones en cuanto a recursos y tiempo, por lo cua es necesario decidir sóo sobre la base de algunas obseracioes, y determiar cuanta probabiidad existe de que el valor estimado e la muestra coincida con e valor de parámetro. En este caso, no se estará utilizado el método de estimación punta sino de interalo. Estimación de intervalo
Cosiste en estimar dos valores numéricos extremos, los cuales cor man un interao, entre cuyos ímites se considera está incluido el paráme tro, según el nivel de confanza o de aciero, previamente estabecido. Una estimación de intervao de un parámetro, es un segmeno en el con tinuo de la escala de números, dode en algún punto del cua se supone se halla e valor del parámetro considerado. Es decir, en lugar de tener un soo punto como estimación de un parmetro, se tiene ahora todo un cojunto de puntos adyacentes, esto es, u interalo entre cuyos puntos probablemente alguno coincida co e valor de parámetro, co nivel de probabilidades de acierto conocido. Fijado de esta manera lo que se denomina ntervalo de
193
coanza; e cua se obiene mediane a rmula general:
Estimador ± (valor crítico x Error estándar) Anes de coninuar es necesario recordar que e vaor críico o desviación sigma ta como se vio en la unidad anterior es un vaor que indica a disancia (en sigmas) que existe desde la ordenada principal haa cuaquier ora ordenada paralea, en una curva norma Dichos vaores se encuentran en as tabas de áreas de a curva normal y permiten conocer a probabiidad de que un evento ocurra por azar ESTIMACIÓN DE LA MEDIA DEL UNIVERSO Para esimar este parámero se requiere conocer la media aritmética de a muestra así como su desviación estándar y ar el nive de conanza, el cual indica la probabiidad de que e vaor de parámetro se encuentre dentro de los límites del ineralo establecido La expresión maemática queda de a siguiene manera: s X - Z < -
s Z
F
µ
o de manera más sencila: X
Siendo
±
(Z . Es)
=
interalo de confanza,
s Es =
De donde: X= media aritmética de la muestra Z = Vaor críico o valor sigma. Se busca en a taba de áreas de la cura normal, según el nivel de confanza establecido Es = Error esándar s = desviación estándar de la muestra amaño de la muestra Ejemplo: 7.1) En una investigación acerca del estado nutricional de los escolares de primero a tercer rado se encontró que los niveles de hemoglobina en ayunas, se distribuyen en forma normal con una media aritmética de
194
1238 gr y una desvi a cón estándar de 087 gr Se desea onocer, co 95 de coanza el al o r proedio de hemoglobina para esa población de escolares de dnde se extrajo la muestra aleatoria de 144 ni ños. DATOS: X=12, 3 g% s n 0,1447 niños g% nvel de confanza 95 % ( 0,05), el cual equvale a 1,96 gma (). Aplicando la mula X (Z · F ) Intervalo de confanza 12 % 16 · 0• M gr% 12 % ±(1,96 · 0,0 ) (como límte supeio) 12, 5 2% 12 % ±0,14 {124% (como mite neio) Conclusón: En esa población de escolaes, la meda aitmética de hemoglobina no debe se meno de 12, 2 4 g%, n mayo de 12, 5 2 g%. Se hace tal afmación con 95 de pobablidades de esta en lo certo, (nivel de confanza) o con un 5% de esgo de no aceta o de equvocacón Nvel de sg nifcacón) 8
8
=
=
8
8
87
7
8
ESTIMACIÓN DE UNA PROPORCIÓN POBLACIONAL
Con ecuenca se necest a estma la popocón de sujetos que en una do población poseen deerminadas caactesticas Po ejemplo, a un plnfca le inteesara conoce la popoción o pocentaje de nños menoes de uva,n año, o menoes de 5 años, o el pocentaje de mujees en edad epoducti de esa poblacón Un nut c onista necesitaía conoce el pocentaje de estiman niñosdesnutdos en la poblacón en la cual tabaja, etc En ales casos, se esos pocentajes del unveso a pati de muestas aleaoas, tal como se pocedó en el caso anteo, paa estma la meda del unveso. 195
Paa estima una popoción o pocentaje pobaciona, se extae del uni veso de inteés, una muesta aleatoia, en la cua se cacua el pocentaje de sujetos con la caactestica en estdio, y luego se apica la mua genea paa estima inteao de conanza: Estimado± (vao cítico x Ero estánda) En el caso especfco paa estima una popoción o pocentaje, pobla ciona, a mua expesa: n p -Z �{ -- < P< p + Z · �
o de manea más sencia: p � Siendo q De donde: = Ero estánda p = pocentaje de sujetos con la caacteística en estdio = (100 p) pocentaje de sujetos SI a caacte s tica en estu dio n = tamaño de a muesta. • valo cítico o vao sigma (), según el nive de conanza Ejempo: 72) Del mismo trabajo de donde se extrajeron los datos del ejemplo 71, el investigador encontró que en esa muestra de 144 niños, el 7 %de ellos presentaba algún grado de desnutrición Se desea conocer con 99 de (Z. )
Interalo de confanza
Es
Es
q
Z
confanza, cuál es el porcentaje de niños desnutridos en esa población de escolares.
DATOS n 144 niños q (100 -p) 93 % nivel de confanza 99 %, e cual equivae a 2,58 sigmas ()
p=7%
196
7% ± (2,8 · t;�3 ) � Intervao de confanza 7% ± (2.s-
7% 28 = como mite superior 20% = 7% 50 { 150% como ímite inrior Concusión: En esa pobación de escoares e pocentaje de niños desnu thridos no debe se menor de 150 % ni mayor de 2 5 0 % Ta afración se ace con un 99 % de confanza de estar en o cierto o con % de iesgo de equivocación. 7.3Eempo para esover: o nFn Maa aaéaa on o aeeaann a i al X
23)
Cuadro N 1 º
En una clínica (n = 50)
En e hogar (n
Peo 06 Kg ±1, Kgs 813 Kg ± 19 Kg Fecenia caaca (atio p/minuo) 23 l/m ± .6 l/m 829 /m ± l .9 1/m An e ceent e mil a 348 ±4.1 % 41 %± 68 es potivos Para cada una de as variabes pesentadas en e cuadro estime os es pconfanza ectivos parámetos de taes variabes en a pobación. Utiice nivees de de 95 % y 99 %. Variables
PRUEBA DE HI PÓTESIS O CONTRASTE DE HIPÓTSIS
Otroaspecto de a inrencia estadstica es a preba de hipótesi o Doci masia de hipótesis a cua se basa en os conceptos de probabiidad y distri 197
bución muestral y hace posible la toma de decisiones acerca de una pobla ción, según la inrmación obtenida en una muestra. Por lo general, en el campo e la salu, el investigador busca conocer si un determinado cor (variable) es o no la causa de un ecto Podría pen sarse que con sólo observar y comparar la ecuencia de aparición de tal ecto, en un grpo expuesto a riesgo y en otro no expuesto, sería más que sufciente. Sin embargo, el rigor cientíco exige la comprobación de que las direncias observadas entre los os grpos no se deben al azar, dado que las muestras utilizadas están conrmadas por sujetos con tales caracte rísticas. Es necesario demostrar que esas direncias son estadísticamente signifcativas, con lo cual podría atribuírsele la direncia al ctor en estu dio, y no al azar. Normalmente as hipótesis tratan de explicar esas diren cas. Una hipótesis se dene como una afrmación que está sujeta a verica
ción o comprobación o una cojetura sobre la posible relacón entre variables (Kerlinger. 985: 8); o como la dene McGuigan (977: 5 3) una armación comprobable de una relación potencial entre dos o más variables. Para Van Dalen y Meyer ( 98 ), una hipótesis es una explicación po sible o provisional que tiene en cuenta los factores, sucesos o condiciones que el investigador procura comprender Todas estas deniciones presentan a las hipótesis como una armación o suposición y no un hecho establecio. Tales suposiciones o posibles relaciones entre las variables se eominan hipótesis de trabao o hipótesis de investigación; las cuales puede ser descriptivas correlacionales, de di rencias entre grpos, de causalidad Se simbolizan como Hi. Dado que las hipótesis de investigación no pueden ser sometidas a pre bas estadísticas, el investigador se vale de las hipótesis nulas para la com probación empírica e las primeras. La Hipótesis nula niega la relación ente las variables dependiente y la independiente por lo cual, se considera el reverso de las hipótesis de inves tigación. Una hipótesis nula es simplemente un planteamiento de "ninguna dierencia. Se simboliza como Ho.
1
PROCEDIMIENTO METODOLÓGICO PARA A PRUEBA DE HIPÓTESIS En la comprobacón o preba de hpótess se sguen los siguentes pasos metodológicos 1 . Planteamento de las hipótesis H y Ho 2 Fjación del nvel de signifcación o del nivel de confanza. 3 Selección del Estadístico a Preba. 4 Regla de decisión para rechazar Ho. 5. Cálculos del estadístico a preba 6 Decsión Estadístca 7 Conclusones PLANTEAMIENTO DE LAS HIPÓTESIS La hpótess de nvestigación e hipótess nula suelen expresarse median te símbolos estadsticos En tal caso se les denomna hipótesis estadísticas. Según la intención de la nvestgación pueden pantearse de drentes ma neras A)
H: µ un valor dado
o Hi µ 1 µ2
o H: P l P2
Ho µ * un valor dado
o Ho: µ 1 = µ2
o Ho: P I
=
=
P2
En este caso, el interés es determinar s existe o no drenca sgnfctva entre ambos parámetros. La hpótesis no plantea direccón de la dren ca. Por lo tanto, la preba es blateral:
A.
Cuando se establecen hpótesis donde uno de los valores es menor, menos efcaz, o inror que otro; o el caso contrario, uno de los valores es mayor, más efcaz, o superor; las prebas son unilaterales, y por lo tanto las hpótesis se plantean de la sguente manera
199
B)
Hi µ < a un vaor,
o Hi: P < P2,
o Hi µ 1 < µ 2.
C)
Hi µ > a un vaor,
o Hi: P > P2
o Hi: µ 1 > µ2.
Ho µ a un vaor,
o Ho: P = P2,
o Hi: µ 1 µ2
En estos casos las prebas son unilateraes o de una soa cola
B . (oa e a uea
(oa e a eeca
Puede notarse que os símboos empeados en e panteamiento de las hi pótesis estadísticas son símboos paramétricos, o cual se debe a interés de investigador de egar a concusiones sobre las poblaciones y no sobre las muestras Por ejempo, en el estudio donde se utiizó una muestra para pro bar a ectividad de a vacuna de Sak contra a poiomielitis, no se buscaba conocer si a vacuna protega o no a os niños de a muestra, sino si protegía a todos los niños de a pobación. Es ésta a esencia de a inrencia estads tica, llegar a conclusiones váidas para la población. NIVEL DE SIGNIFICACIÓN
El nivel de signicación o de signicancia es a probabiidad de equivocarse (riesgo de equivocacón) ue tiene el investigador a tomar la decisión de rechazar o no una hipótesis nula. Dado e carácter aleatorio de las observaciones muestraes, es posibe que el estadístico pueda desviarse tanto de lo esperado, que se decida descartar a hipótesis de nuidad (aun siendo cierta). Es deseable que sea pequeña esa probabiidad de descartar una hipótesis nua que es cierta De alí que os investigadores utiicen con mayor fecuencia os niveles de signicación de 0,05 ó 0,0. En e nivel de signicación d e 0,05 el investigador tiene un 5 % de resgo de equivocación, mientras que cuenta con un 95 % de seguridad (nive de conana) de egar a una concusión correcta. De igua manera, e nive de signicancia de 0,01 mpica un 99 % e pbabiidad e estar tomdo una concusión correcta sóo un 1 % de resgo de error, a rmuar esa concu
200
sión Aún cuando el uso de estos niveles son arbitrarios (0, 01 y 0,05), puede decirse que están basados en la experiencia y en e razonamiento lógico de investigador A la magnitud de la probabilidad del riesgo de equivocación se e deno mina nivel de signifcancia o de signifcación E compemento al nive de signifcación es el nive de confanza, por lo cua, según esta óptica, el área de a curva normal queda dividida en dos partes: una zona de NO rechazo de a Ho, y una (o dos) zona de rechazo de Ho La ubicación de la zona de rechazo, depende de lo expresado en la hipótesis de trabajo (Hi. Si ésta no indica la dirección de a direncia, la zona de rechazo estará ubicada en abos extremos de a curva (preba biateral o de dos colas).
zona de r
o de Ho
zona No rechazo Ho
zoa de
hzo de Ho
o a = 0,05/2 0025
Si la hipótesis de trabajo plantea la dirección de la dierencia (enor que o mayor que), la zona de rechazo estará en un soo extremo de a crva (a la izquierda o a la derecha según el caso), y a preba será uniatera o de una soa coa zona de aceptación de o
=
zona de aceptacón de Ho
00
E término signicancia se refere a que a dierencia entre el valor hipo tético y e resutado muestra! se considera importante, es decir, demasiado grande para abuírsee a azar (es deci, a simpe hecho de que por azar se haya utiiado esa muestra y no oa, con vaores direntes).
201
SELECCIÓN DEL ESTADÍSTICO A PRUEBA Un estadstico a preba es un valor numérico que se calcula a partir de los datos de una muestra y es utilizado para tomar la decisión de rechazar o no una hipótesis nula Los estadísticos de prueba utilizados dependen del tamaño de la muestra y de si se conoce o no la varianza de la población. Si los datos provienen de una población distribuida normalmente con va riaza conocida, se utiliza como estadstico la pueba Z. X-
µ Z = - Es
Cuando el muestreo se hace de una población normalmente distibuida y se desconoce su vaianza, el estadstico de preba a utilizar para compro bar la media poblacional es =
X µ Es
Cuando n es grande, la distribución t se aproxima a la distibución nor mal y se puede utilizar como estadístico de preba Z aún cuando se desco nozca la varianza de la población.
REGLA DE DECISIÓN Para establecer la regla de decisión es necesario conocer el valor crtico o valor en unidades sigmas donde se levanta la ordenada que limita las zo nas de rechazo y aceptación, dependiendo del nivel de signicación, en las curvas de probabilidades. Reglas de Decisin, refriéndose a la distribución normal: Se rechaza Ho si, Zc > Z > Zc, (para prebas bilaterales). Se rechaza Ho si, quierda).
Zc > Z (para preba unilateral de cola iz
Se rechaza Ho si, cha)
Z > +Zc (para preba unilateral de cola dere-
Los valores crticos (Z) se hallan en las tablas de áreas de la cura nor mal Zc es el valor de Z calculado mediante la frmula planteada en el punto
202
anteio. Compaa os esltados obtenios en a peba estadística y a egla de decisión pemite echaza o no a hipótesis na. Al toma ta decisión se plantean cato posiilidades
a) Rechazar una hipótesis que esf alsa (decisión correcta) b) Aceptar una hipótesis que es cierta (decisión correcta c) Rechazar una hipótesis que es cierta (error tio I) d) Aceptar una hipótesis que es f alsa (error tio 1 l sigiente cado esme as sitaciones anteioes Ho es :
Acepta
ierta
No hay ero
Ero tipo (
Fasa
Ero tipo I (B
No hay erro
Rechaza
Po o tanto, al echaza o no na hipótesis na, se coe e iesgo de co mete agno e los dos eoes: o . s pdente qe en na sitacin de teminada se tate de minimiza la pobabilidad de comete el eo más se io. n mchas áeas de investigación esta dici evaa la seiedad de cada no de eos; po o cal se selecciona n vao peqeño paa ( = 000 ; 0,0 ; 0,05 ó 0, 0). La elección de eeja la opinión de investigado sobe la seiedad de comete el eo tipo . Mientas más seias se consideen as consecencias de éste, meno seá el vao de . s evidente qe tan sóo a expeiencia y n sólido conocimiento teóico del tema investigado, oienta a cientíco en la selección del nive de signicación. CÁLCULOS Y CNCLUSIONES
Utiizano as mlas de eo estánda (mas 1; 2 ó 3 seún sea el caso) y de estadístico de pea, se detemina si e eo de mesteo es tan gande como paa concli que "las derencias NO son estaísticamente signcativas, po o ca se NO se rechaza la hipótesis nula. O ese eo es tan peqeño qe O afcta los esltados, y se pede conci qe "las derencias son estadísticamente signcativas , po tanto, se "rchaza la hipótesis nula , y se tienen elementos paa considea como váida la hipó-
203
tesis de trabajo. Resumiendo, en el proceso de comprobación de hipótesis se si gen los sigientes pasos: 1 - Formulación de hipótesis 2- Establecer el nivel de signifcación 3- Selección del estadístico a preba 4- Establecer la regla de decisión 5- Realizar los cálculos necesarios 6- Decisión estadística. Interetación. 7- Conclusiones En la práctica, se utilizan en las sigientes si tuaciones:
I) DIFERENCI ENTRE UN PARÁMETRO Y UN ESTDÍSTICO: Cuando de una población se toma una muesa, es de esperar que ésta sea representativa de la población, por lo tanto, al medi en ella una va riable, ese valor (estadístico debe ser similar al valor considerado como normal en esa población (paráetro; o en todo caso, estar dentro de los lí mites de confanza estimados para el parámetro De no ser así, cabe la posi bilidad que esa muestra posea algún elemento o ctor particular, al cual pueda atribuírsele el valor atípico del estadístico calculado. Cualquier estadístico puede ser sometido a una preba de hipótesis, sin embargo, en este capíulo sólo se tratará la comparación de medias y de pro porciones o porcentajes:
1) Ctast d hótss d a da blacaL -2) Ctast d hótss d a có blaca. ) DIFERENCI ENTR DOS ESTADÍSTICOS Mucas investigaciones realizadas en el campo de la salud en especial aquellas donde se busca conocer la efciencias de un ratamient sobre otro, requiere de la conrmación de dos grpos, los cuales deben ser totalmente similares en todas las variables independientes Al grpo al cua se le administra la vriable en estudio se le denomina "Grupo experimen
204
tal, y e otro, donde está ausente dicha variabe, se considera Gruo on trol.
En este caso, se trata de conocer los vaores represenativos (esadísticos) obtenidos en ambos grpos, y a compararos determinar si existe die rencia signifcativa entre los dos estadsticos. Si a direncia resula sigifcativa, ela puede ser consecuencia de a variable en estudio, en cuyo caso se rechaza a hipótesis nua. Pero, si a direncia no es signifcativa, se e atribuye a proceso de azar, al ca eron sometidos os sujetos al momento de eegirlos para rmar las muesras. Con este propósio se apican pruebas de hipótesis para comparar las medias de dos muestras, y las proporciones o porcenta es de dos mestras in dependientes. 1) C hó 2) C hó c
odos estos planteamienos pueden comprenderse mejor a resolver el siguiente ejercicio, donde se someten a peba cada una de as cuatro modaidades de contraste mencionadas. Ejemplos: 74 En un estudio realizado en el Hospital Universitario Angel Larra/ de " para onoer las medidas antrométrias de los reién naidos durante los últimos años se enontraron los siguientes dato:
VARONES n 256 = s HEMBRAS n 225 X s µ
ESO (kgs
ESTATURA (cs)
4,300 Kgs. 0550 Kgs. 3500 Kgs.
55 cms 2,5 cs 51 cms
3,900 Kgs. 0500 Kgs. 3,000 Kgs.
53 cs 2,2 cms 50 cms
=
=
=
=
=
=
=
205
De acerdo con estos datos se qiere probar qe a) as niñas nacidas en ese centro tienen na estatura signicativamente sperior a 50 cms, considrados como normal para esa población. i vel de confanza 99 %. b) La direncia en el peso promedio de los varones es estadísticamente signifcativa con respect a s promedio normal. ivel de signifca ción 001 . c) En ese centro hospitalario el porcentaje de nacimintos de hembras es menor al porcentaje esperado (50%) Nivel de conanza 95 %. d)La estatura promedio de los varones es signifcativamente sperior a la de las hembras nacidas en ese centro. Nivel de signicación 1 O % e) Estadísticamente es signicativa la direncia entre el porcentaje de nacimiento de varones con respecto al porcentae de nacimiento de hembras en ese centro. PRUB IPÓI U MI PBCI En este caso se compara la media aritmética de la población con la media aritmética obtenida n na mestra El planteamiento a" del problema 7.4 corresponde a este tipo de prueba de hipótesis. a) Las niñas nacidas en ese entro tienen una estatura signcativamente superior a 50 ms, considerados como normal para esa población.
DATS: X 53 cms. S = 22 cms. µ 50 cms. N = 225 niñas ivel de conanza 99 % 1 Hipótesis a prueba: Hi µ > 50 cms. Ho µ < 5 cms 2- Nivel de signifcación: = 001. La prueba es nilateral dado qe el interés del investigador es conocer si la dierencia observada entre las dos medias es signicativamente mayor
206
Por lo tanto, la zona de rechazo se ubica en la cola derecha de la cua; en un área de 0,0 1 Para saber a que alor cítico coresponde esta zona se recurre a la tabla de áreas de la cura normal Como esta tabla sólo pesenta la mi tad de la curva (0,5000) se resta de ella el área crítica 05000 001 0,4900 En el cueo de la tabla se busca el 0,4900 (o el más próximo a él) para saber a cuantas desviaciones sigmas () corresponde y con elo ar poste riormente la regla de decisión. 3 Estadístico a preba: Z. (Aun cuando se desconoce la varianza de la población, puede utilizarse Z", dado que la muestra es grande. X -µ = s/4 Regla de decisión Se rechaza Ho si Z calculada es mayor a 233 (Zc < 2,33 5 Cálculos del estadístico a preba: 3 _ 3 2 0 4 1 X µ = 5350 = s/- 2;/ J 2/15 0)47 '
zona de No rechazo de Ho o
2,33
6 Decisión: Dado que la Z calculada (20,41 es mayor a 233 se rechaza la hipótesis nula. La difrenca encontrada no podría ser explicada por el azar. Tal difrencia es estadísticamente signicativa Por lo cual se tienen sucientes evidencias para considerar la posibilidad de que sea cierta la hipótesis de trabajo, con más de 99 % de conanza 7Conclusión
207
Las niñas nacidas en los últimos años en el Hosital Universitario An gel Larra/de ", tienen una estatura romedio suerior a lo considerad como normal ara esa oblación. El planteamiento "b del problema 7.4 también compara la media arit mética de una muestra con la edia de la población.
b) La dferencia en el peso romedio de los varones es estadísticamente signcativa con resecto a su romedio normal. DATOS X 4,300 Kgs s 0,550 Kgs. n 256 niños µ= 3,500 Kgs. Nivel de confanza = 99 % =
=
1- Hipótesis Hi: * Ho = µ 2 Nivel de signifcación
=
0.01
El planteamiento de la hipótesis de esta investigación no indica direc ción en la direncia; sólo se abla de una direncia signifcativa, por lo tanto, se trata de una prueba bilateral, en cuyo caso, la región crítica o la zona de rechazo de la hipótesis nula, ocupa los dos extremos de la curva. En este caso el área de signifcación (región de rechazo de la hipótesis ula) se divide entre dos: 0,01: 2 0,005 Indicando este valor que en ambas colas de la cura, la zona de rechazo de Ho corresponde a 0,005. Para saber a que valor crítico corresponde esta zona, se recurre a la tabla de áreas de la curva normal. Pero como esta tabla sólo presenta la mitad de la curva (0,5000), se resta de ella el área crítica: 0,5000 - 0005 0,4950 En el cueo de l a tabla se busca el 0,4950 (o el más próximo a él) para saber a cuantas desviaciones sigmas () corresponde, y con ello jar la re gla de decisión.
208
3 Estadístico a prueba: Z 4 Regla de decisión: Se rechaza Ho s Z calculada es menor a 2575, o mayor a 2575. (2,575 < Zc < 2,575). 5 Cálculos del estadístico a peba: X µ z 4 00 3 00 = 0,800 235 0 550/ 0 5 016 0,0344 zona de No rechazo de Ho
-2,575
o
2575
6 Decisión: Dado que la Z calculada (23.25) es mayor a 2,575 se rechaza la hipótesis nula, con más de 99 % de probabilidades de certeza. La direncia observa da no podría ser atibuida al azar; es estadísticamente signicativa, por lo tanto hay evidencias paa considerar que lo planteado en la hipótess de tra bao pueda ser cieto. 7 Conclusiones Es signifcativa a direncia observada entre la estatura de los varones nacidos en el Hospital Universitario Angel Larralde, en los últimos años, con respecto al promedio considerado como normal para esa población. 1.2. PRUEBA DE HIPÓTESIS DE UNA PROPORCIÓN DE LA POBLACIÓN
En este caso se compara la Proporción o el porcentaje de la población con la proporción o el porcentae obtenido en una muestra. El planteamien to c" del problema 74 corresponde a este tipo de preba de hipótesis. c) En ese centro hospitalario, el porcentaje de nacimientos de hembras es menor al porcenaje esperado (50%).
209
DATOS Total de nacimientos 481 Nacimiento de niñas 225 nñas =
de hembras p nacimiento Total de nacimientos
x 1
255 x 1 4 ?% 481
P 50 % (porcentaje normal del universo) 50 % Nivel de conanza 95 %. =
1- Hipótesis a pruea: Hi: P < 50 % Ho: P
50 %
2 Nivel de signifcancia: = 0.05 Preba unilateral de cola izquierda, por lo tanto 0,5000 0,05
0,4500
3- Estadístico a preba: Z P - p Z=-
Es Es = �(PQ ) 4- Regla de decisión: Se rechaza Ho si Z calculada es menor de -1,645 (-1,645 < Z) 5- Cálculos del estadístico a preba: Z; Pero antes es conveniente calcular el error estándar.
Es �(Pn· Es 3,33 Es
Q ) (50% x 50%) . 225
z
2 10
p - P 47% 50% 3% 0 0 3,33 3,33
zona No rechazo Ho 0
-1 ,645 090
6 Decisión Dado que el vaor Z cacuado (Z= 090) es mayor a vaor crtico esta becido (1,645), no se rechaa a hipótesis nua. Con una confanza de 95 % se puede afrmar que a direncia no es estadísticamente signicativa. Esta direncia pudo ser por aar; podría ser por a muestra utiizada 7 Concusión: La proporción de niñas nacidas en os úimos die años en e Hospita Universitario Angel Larralde no e menor a o norma. 11. . - PRUEBA DE HIPÓTESIS DE LA DIFENCIA ENTE DOS MEDIAS.
En este caso se compara la media aritmética de una muestra con a media aritmética de la otra muestra buscando la dierencia entre dos esadísticos de muestras independientes. E planteamieno "d de problema 7. corres ponde a este tipo de preba de hipótesis d) La estatura promedio de los varones es signfcativamente sperior la de las hembras, naidas en ese centro.
DATOS: X 1 = 55 cms. s 1 = 2,5 cms. n 1 = 256 niños
X2 = 53 cms. s = 2,2 cms n2 = 225 niñas
Nive de signifcancia = 10 % (nive de confana = 90) 1 Hipótesis a pruea Hi µ 1 > Ho: µ 1 = µ 2 Nivel de signifcancia = 010
La Peba es unilateal, hacia la cola deecha: 0,5000 - O, O 0,4000 3- Estadístico a preba: ; 4- Regla de decisión Se echaza Ho si calculada es mayo de 1,28. (c > 28) 5- Cálculos del estadístico a peba: peo antes conviene calcula el ero estánda de la difencia Z = µ µ2 Es
si Es1 - F
s Es2 = -2
.
2, 2 ==05625 Es = = 0,4666 Es m Í Aplicando la mula del Ero estánda de la difencia, se tiene: Es(dfl = �(0,5625 +(0,4666 Esdil = 0,0244 40,2509 = 0,0 4592 Es(dil = 02 Z = 55 cms 53 cms = 2 cms =9523 0 02 l
2
2
zona de aceptación de Ho o
1 28
9,523
6- Decisión: Dado que el valo de calculada es mayo (9,523 al valo cí tico (1,28, se puede ama con más de 90 % de conanza, que la die ecia ente las dos medias compaadas, es estadísticamente signicati va. Se echaza la ipótesis nula 2 12
7 Conclusón: Se tenen evdencias para pensar que los nños (varones) nacdos en el HUAL. durante los últmos años, tenen una estatra superior a las niñas nacidas en ese centro 11.2.- PRUEBA DE HIPÓTESIS DE LA DIFENCIA ENTRE DOS PROPORCIONES
En este caso se compara el porcentaje o la proporción de una muestra con el porcentaje o la proporción de la otra muestra, buscando la dferenca entre dos estadísticos de muestras ndependientes El planteamiento "e del problema 7.4 corresponde a este tipo de preba de hipótesis
e) Estadísticamente es signfcativa la erencia entre el porentaje de nacimiento de varones con respecto al porcentaje de nacimiento de hembras, en ese centro. DATOS Total de nacimentos Nacmento de varones (n 1 ) 25 p(varones) x 00 48
481 = 256 niños = 53 %
Nacmento de hembras (n2) 225 niñas 225 p(hembras) = x 100 47 % 41 En el unverso, la probabiidad de nacmentos de varones es gual a la probabldad del naimento de hembras (50% para cada sexo) P = 5 0 % Q 50 % Nvel de conanza 95 % 1 Hpótesis a pruea: H: P l P2 Ho: P l P2 2 Nvel sgnicacn: = 0,05 (prueba bilateral) 0,05: 2 0,025 ; 05000 0,025 0,475 3 Estadístco a preba: Z
213
4Regla de decisión: Se echaza Ho si Z calculada es meno a 1,96 o mayo a 1,96 5Cálculos del estadístico a peba Peo antes es conveniente obtene el ero estánda diencial: = �( · Q) En est a frmula paa calcula el eo estánda se utilizan los pocentajes de la población (paámetros). _ (50%256X 50%) = (50%225X 50%) = 9 656 = lllll En este caso, no es necesaio esolve la a z cuadada de estos eroes estándaes, dado que la frmula del ero estánda de la diencia los eleva al cuadado nuevamente. = 9, 65 + (,I1111 = 20 = 4569 % % = l3 53%4 4,569 4569 n2
1
2
7
1
2
7
6
8 767
(dil
7
6
zona de No rechazo de Ho
na de �!-:azo de Ho -1 ,96
o
1,31
1 96
6Decisión: Como el valo calculado de Z (1, 3 1) es un valo infio a 1, 9 6 no se echaza la Ho Se tienen evidencias paa cee que la difencia obsevada 2 14
ente los pocentajes no es estadísticamente signifcativa, con 95 % de confanza 7 Conclusión En el HU.A.L en la última década no ha habido diencia signifcativa ente la popoción de nacimiento de vaones y de hembas. E poeso Fayad Camel ( 1 979) señala que paa calcula el eo están da de la diencia, algunos textos utilizan los pocentajes de la pimea muesta paa obtene su erro estánda, y os pocentajes de la segunda muesta paa conoce el ero estánda de ésta; y aun cuando puedan da vaoes muy cecanos a los obtenidos con la mula coecta, no debe caese en ese ero, dado que en ocasiones, especialmente cuando el tamaño de las dos muestras es mu erente puede darse el caso que laórmula correcta señale derencias estadísticamente signfcativas, y que laormula comentada indique alta de signfcancia en los resultados (p 244). En a mua coecta se utilizan los pocentajes (P, Q) de la población, y no los obtenidos en las muestas. Oto ejempo de diencia de dos popociones poblacionales 7.5 En un estudio sobe una dematitis se sometieon a investigación 200 pacientes actados po este pobema Paa eectos del estudio se dis tibuyeon aleatoiamente en dos gpos con caactesticas similaes E pime grpo quedó conmado po 1 04 pacientes, quienes ecibieon un nuevo medicamento, ogando en un mes a cuación de 82 pacientes. El segundo gpo, de 96 pacientes, e tatado con un medicamento ya conoci do, logándose en e mismo tiempo la cuación de 72 pacientes. Los investigadoes se peguntan si estos esultados indican que e nuevo medicamento es mejo que el tadicional Desean una confanza de 99 % al ealiza sus conclusiones. Datos: Grpos xpeimental Control
n
curados
04 96
82 72
porcentaje
78,8 % 7,00 %
Desaolo en ma metodológica:
2 15
1.-Hipóesis: Ho: P P2 Hi: P > P2 2. - Nive de signifcancia: 3 . - Estadísico a peba: Z
001 (pueba uniateal) =
1
2
Es
4. - Regla de decisión: Se ehaza Ho si calcuada es mayo a 2,3 3 5. - Cáuo del esadístico a peba: Z
�(Es
2 ) 1
+(Es
) 2
Anes se debe obene el Ero Esánda de la difencia (Es).
Como se dijo anteiormente, paa la aplicación de esta mua del ero esánda de a difenia de poenaes, es necesaio uiiza los pocenta jes de a población (P y Q). Cuando éstos no se conocen se estiman median te las dos muestas (gpos) exaídas de esa población. Grpos Expeimenta Conro TOTAL (N)
n
curados
104
82
96
72
200
12
152 P = 100 77% 200
Q = 100 ; Q 100 77; Q 23%
2 16
J17,288 y +8,4479y 35,4767 = 5:65 78,85% 75% = 3,85 = 045
z
5:65
5:65
'
zona de N o rechazo de Ho o
2,33
6. Decisión: Dado que e valor de Z calculado 0,64) es menor qe Z de a taba, NO se rechaza la Hipótesis nula. 7. Conclusión Estadísticamente no se puede afrmar que el nuevo trata miento sometido a preba sea mejor que e tradicionalmente utiizado contra la dermatitis. PRUEBA PARA MUESTRAS PEQUEÑAS Y PARA MUESTRAS RELACIONADAS.
Los conceptos desarrolados en los puntos anteriores son aplicabes cuando se dispone de inrmación obtenida en muestras grandes (mayores de 30 suetos), dado que os vaores de sus desviaciones reativas se distribuyen aproximadamente en una cura normal; no sucediendo a misma dis tribución en muestras menores de 0 datos. En eas e cáculo de la desviación estándar se ve actado por e reducido número de datos cuantitativos que interienen en s obtención. La preba t toma en cuenta esta imitación. La distribución de as muestras pequeñas también posee rma imétrica, simiar a a curva normal, direnciándose de ésta en as colas, donde po see un área mayor Sin embargo, en a medida en que aumenta el tamaño de la muestra, el área de sus extremos se reduce, aproximándose a a curva nor ma. Por tal motivo, en un estudio donde se desconozca a varianza de la población, pero se utilicen muestras grandes, puede emplearse la prueba Z, en ugar de a prueba como correspondería. En cuyo caso, siendo la muestra grande, la distribución coincide con la distribución norma. t,
t
217
Este planteamiento hace entender la existencia de una milia de curvas de distribuciones t, dado que existe una curva dirente para cada tamaño de muestra o posibes grados de libertad Como modeo matemático la distribución t está cacuado en una taba donde se presenta su vaor, según os grados de ibertad (n1) y el nive de signifcación. Dicho modelo es producto de trabajo realizado por W Gosset, bajo e seudónimo de "Student . Se calcula con valores correspon dientes a variables cuantitivas, mediante a rmula: X µ
t = - Es
APLICACIONES PRINCIPALES DE LA DISTRIBUCIÓN
De manera reiterada se ha mencionado que cuando e tamaño de la muestra es inrior a 30 sujetos y se desconoce a varianza de la población se utiza a distribución t para a A- Estimación de a media poblaciona. B.- Comparación de dos medias aritméticas, en muestras independientes C.- Comparación de medias ariméticas de muesras reacionadas ESTIMACIÓN E LA MEDIA POBLACIONAL, en muestras pe-
queñas: En páginas anteriores se describió el procedimiento para estimar pará metros, utilizando muestras grandes. En cuyo caso se destaca la necesida de conocer a media aritmética (estadstico) de la muesra y el error están dar, para constrir e interao o mites de confanza, entre los cuaes puede encontrarse el vaor del parámero, según e nive de confanza utiizado en el cáculo. Con muesras pequeñas e procedimiento es similar. La direncia radic en que en éstas se sustiuye el vaor crítico de Z por el vaor crtico de t, que dando la expresión atemática X ± ( t ·E) = Intervao de confanza
Ejemplo76:
2 18
Un i n vesti g ador está i n teresado en obtener una esti m aci ó n del ni v el promedi o de ni t rógeno excretado en muestras de ori n a de 24 horas de paci e ntes que han reci b i d o yodo radi a cti v o como terapi a . Para ello tomó la i n rmaci grsónporde1001 paci e ntes sometidos al tratami e nto, y obtvo una edi a de , 8 7 c, y una desvi a ci ó n estándar de 1, g r. Establezca el i n tervalo de confanza para µ, con sólo % de riesgo de equivocación. Datos Xs 1,,8 g grs.rs. nNi=vel1 depaciconanza: entes. 9 %, el cual equivale a un 0,0 Dado que la curva es bi l ateral, se divi d e al entre dos, y se ti e ne un ri e s dego didestriequibucivocaci ó n de 0, 0 2 a abos lados de la curva Se busca en la tabla ó n b ajo la coluna 0, 0 2 (ó 0, 9 ) en la la de 1 g l (grados de 2,131. libertad n 1; en este caso, 1 1 = 1 gl), donde se encuentra un valor Seaplica la rula para calcular el intervalo de conanza: X ± ( ·Es) Intervalo de conanza Antes de susti t i r los térmi n os por sus valores, es conveni e nte calcular el error estándar. Es=_= 1, 1, O 413 Í 4 ' Sustityendo los términos en la rmula, se tiene ,8 ± (2,131 0,4 13) Intervalo de conanza 8 ,8 ±0,88{ ' Conclusi ó n: El n v el promedi o de ni t rógeno excretado en ori n a de 24 horas,,99para los paci e ntes que reci b i e ron este tratami e nto no debe ser menor de grs ni mayor de 8, g rs por 100 c de ori n a, con % de ri e sgo de equivocación 6
7
65
5
=7 7 65 6
5
5
5
5
t,
6
75
5
5
t
t
65
65
,
7
7
7
7
75
6;9 grs
6
75
5
219
B- CMPARACIÓN DE DOS MEDAS, en muestras pequeñas inde pendentes. En el contraste de hipótesis de muestras pequeñas se sigue la misma me todología empleada para muesras grandes, direnciándose de ésta sola mente en el estadístico a preba utilizado, en cuyo caso se calcula la preba t.
Igualmente pueden plantearse pruebas de hipótesis unilaterales o bilate rales, dependiendo de si en la hipótesis de investigación se estima o no la di rección de la dierencia. Prueba de hipótesis de una media poblacional Ejemplo 7.7 En un grpo de O personas ayores de 65 años se realizó un estdio con el propósito de conocer el promedio de una enzima en la población de ancianos En esta muesra se obtuvo un valor promedio de la enzima igual a 22, con una desviación estándar de 6, 71. Con este hallazgo, ¿el investigador podría concluir que el nivel promedio de esta enzima en los ancianos es di rente de 25, considerado como normal para la población adulta?. Al 0,05 1. Hipótesis a prueba Hi: µ 25 Ho: µ = 25
2. Nivel de sigifcación: = 0,05. Pero siendo la prueba bilateral, se tiene 0,05 2 = 0,025 . X-M 3 . Estadstco a pre ba t s
4. Regla de decisión Se rechaza Ho si la t calculada es menor de 2,262 o mayor de 2,262 (valor buscado en la tabla de distribución t, en la colum na 0025 (ó 0.975) preba biateral, con la 9 gl) 22 25 5. Cálculos de t Es
220
= � = 67 1 67 1 =2J2 � . 3J6 -3 1 41 5 2J2 6. Decisión: No se rechaza la Ho, dado que la t calculada (1 4 1 5 es mayor a 2262 (t de la aba) 7. Conclusión: El investigador no tiene base estadstica para afrar que el valor promedio de a enzima en estdio es dierente signicativamente en esa población de ancianos
C.- COMPARACIÓN DE D OS MEDIAS, en muestras relacionadas.
Cuando se usan muestras pequeñas ecuentemente e grpo experi mental puede ser su propio control. En estos estdios as muestras no son independientes ya ue están constituidas por los mismos individuo lo cual hace presumir la existencia de cierto grado de dependencia o de crreación entre las dos medias Se trata de esudios donde se busca una dierencia entre as mediciones de un nómeno ANTES Y DESPUÉS de determinado evento. Para cacuar t en este caso se determinan as direncias entre los valores anteriores y posteriores considerándolas siempre en a misma dirección Se obtiene así e valor medio de las direncias a cual se smete a prueba para determinar si es signifcativamente dierente de cero. Est pro cedimiento conduce a estabecer a desviación estándar de las direncias y luego error estándar. Ejemplo 7.8: En un estudio sobre artross emoropatear se probó una nueva técnica de intervención a n de mejorar la moviidad de miembro esionado. E propósito de la intervención e reducir e ángulo Q. Se estudiaron 1 1 casos, de quienes se obvo la siguiente inrmación:
22 1
Grados de ánguo
valores de las dferencia entre e Pre y Post operatorio
ANTES DESPUÉS 20 4 16 18 4 14 22 6 16 22 15 7 4 13 17 24 16 8 15 4 11 8 3 5 14 4 10 20 14 6 16 5 11 Media del ánguo anes de la intervención: - 1 96 = X = - 1 7 2 grados 11 Media de ánguo después de a intervención: 141 X 1 2 '2 grados 11 La Desviación estándar se obtiene a partir de las difrencias encontradas entre los valores de "Antes y después. (d)
4 4 6 7 4 8 4 3 4 6 5
16 16 36 49 16 64 16 9 16 36 25 299
r
222
2
(d)
=
Desviación estándar en datos directos: =() = � 299 J 9$ = 54 5 grados. Una vez obtenidos l o s promedios y l a desviación estándar ya se dispone de la inrmación necesaria para realizar la preba de hipótesis. .Hipótesis a preba: > µ 2.Nivel de signicación: 005. (preba unilateral) 3 . Estad'stco a pre ba: 4.Regla de decisión: Se rechaza si la calculada es mayor de 1,8 25 5 acuos l l d 1 ,8212 5 = 5 15 = _ . 3, 2 ' 5 6.D81ecisión: Se recaza la dado que la calculada (3 0 3) es mayor a 5 de l a tabl a ). La dierencia encontrada es estadísticamente signi fcativa .Concl u sión: Según los resultados obtenidos se puede conclui r que la in lteervención resul t a ectiva para mejorar l a movil i dad de l o s miembros sionados 2
1 -
n
s
7
47
Hi: µ1 Ho:
µ2
1
2
=
=
t
XA
-
XD
Ho
7
e t = --
e,
47
t
8
47
5
t = 3 03 '
Ho,
t
(t
7
EJ ERCICIOS PARA RESOLVER :
1) Se00sabemg/00 que elmlsero haptaglobina tiene un valor medio aproximado de n la población normal con una desviación estándar de 223
40 mg/ 1 00 ml. En una muestra de 1 2 1 pacientes con cáncer se encontr un valor promedio de haptaglobina de 1 55 mg/ 1 00 ml. ¿Este hallazgo haría pensar que en los pacientes con cáncer hay ua concentración ma yor de haptaglobina? 2) El valor promedio normal de protombina es aproximadamente de 2 mg/1 00 de plasma. En una muestra de 400 pacientes con defciencia de vitamina K, quienes presentaron un valor promedio de protombina de 1 mg/1 00 ml; con una varianza de 1 6 mg/100 ml. ¿Estos resultados podría sugerir que la carencia de Vitamina K reduce los niveles de protombin en plasma? 3) Se sabe que el valor normal de hematocrito en lactantes es de 34 % apro ximadamente con una desviación estándar de 3 .08. ¿Cuál es la probabi lidad de que al tomar una muestra de 25 lactantes la media sea igual o mayor de 3 1 %? 4) En una muestra de 557 adolescentes de 1 4 años se calculó una media de tensión arteral de 85 1 0 mm de g y una desviación estándar de 1 1 09 mm de Hg. Determine el intervalo de confanza para la media de la población con una probabilidad de 99 % 5) Un investigador desea estimar el valor promedio de hemoglobina de los estudiantes del CB M V. Romero". Para ellos seleccione a una muestra aleatoria de 64 estudiantes encontrando una media de 1 404 gr/1 00cc y una desviación estándar de 1 8 gr/ l OOcc. Con una confanza de 95 % se quiere saber cuáles son los lmites de confanza para la media de la po blación. 6) Se quiere estimar el porcentae de niños desnutridos que asisten al sericio de pediatría del H.UA.L. en 1 994 para ellos se tomó una muestra aleatoria de 48 histrias médicas y se encontró que a 9 de se les diagnos ticó desnutrción grados Con 95 % de confanza determine el porcen taje de niños desnutridos que asisten a ese sericio 7) En una muestra de 400 personas se encontró que el peso promedio era de 67 Kgs con una desviación estándar de 25 kgs Calcule los límites entre los cuales se encuentra al peso verdadero con un nivel de confanza de 9546 % 8) De los ingresos a un hospital en el transcurso de este año se tomó una muestra de 1 00 historias encontrándose un porcentae de curación de 20
224
% Estime el porcentaje de curación en dicho hospital, con 95,46 % de conanza 9) Un grupo de odontóogos ha diseñado una nueva técnica para tratamien to de conducto con la cua éste se realiza en un tiempo promedio de 3 0 minutos, con una desviación estándar de 5 minutos, en una uestra de 44 pacientes. ¿Este equipo de odontólogos podría concuir que su nue va técnica reduce de manera signicativa e tiempo de trabajo, con res pecto a la técnica habitualmente empeada en estos caso, la cua requiere de un promedio de 60 minutos por paciente? O) Un odontólogo evauó el estado de salud bucal de los ancianos residen tes de dos geriátricos de Valencia Diagnosticó un índice periodontal por paciente ta como se presenta en el siguiente cuadro: Residencia "A n = 6 ancianos Xa = 1,7 Sb = 0,6
Residencia "B (n = 49 anianos Xb ,5 Sb ,
Según estos resutados, ¿se puede armar que existe una dierencia sig nicativa enre el índice periodontal promedio de os dos grupos geriá tricos? Nive de p 0,05 11 En un inteado para señoritas, un grupo de 140 jóvenes participaron en una investigación para probar dos nuevas vacunas anticaries. De és tas, 70 recibieron a vacuna denominada "Cariestal, y a as 70 restantes se es administró la vacuna "Carident. Un año después, a examinar a estas inteas, 7 presentaban caries, de donde 7 habían sido vacunadas con "Cariesta, y 1O con "Carident Dado que a reaizar la vacunación ninguno de las jóvenes tenían caries, y habían mantenido hábitos higiénicos simiares, ¿podra concluirse con 99 % de confanza que la vacuna "Cariestal da mayor protección contra la caries? 2. En unas joadas de trabajo de campo sobre saud buca, en una pobación costeña se pudo detectar que de 80 personas examinadas, e 62% presentó caries, lo cual hace pensar que en esa comunidad a prevaencia de caries es inerior a 73% reportado por diversos investigadores, como el porcentaje euentemente diagnosticado en la población Trabaje con una p = 0,01 para probar esta hipótesis.
225
3 En una muesra de 64 niños de una escuela pública se encontró un pro medo de índice de tártaro simplifcado de 0,35 y un error estándar de 0,02. Así msmo, en una muestra de 8 1 nños de un colegio privado, se encontró un índce de tártaro promedo de 0,3 y una desviación están dar de 0,05 Estos hallazgos indican que el índce promedo de tártaro es menor en los nños de las escuelas privadas que en los de las públicas. Prebe esta hpótess con 99% de confanza. 4. En una investgación realizada en una comunidad sobre niveles de pro teínas totales en la sangre, se tomó una muestra de 5 ndvduos, eleg dos al azar de esa comunidad, cuyos resultados eron: X = 564
s 0,72
¿Cuál será el verdadero promedio de proteínas totales en la sangre para la población de donde e extraída esa muestra? Nveles: 95% y 99% de confanza. 15.En una nvestgacón realzada en dos grpos de indvduos normales, del mismo sexo, edades smlares y condicones socoeconómicas sm lares, se tomaron los datos relatvos de la actvidad de la colinesterasa en el suero, obtenéndose los siguientes resultados: Grupo A
Grupo B
2,29 2,67 ,09 2,65 2,52 1,75 2,12 1,59 1,94 1,82
1,59 1,09 2,02 2,26 2,60 1,16 2,76 2,14 2,76 2,00
Procedendo en rma metodológca, se desea saber si la direncia ob servada ene los rpos (aprecada por su medda central) tene signifcacón estadística o es razonablemente explicable por el azar.
226
16. En un estudio reaizado sobre niveles de inmunoglobuina se conoció que en un grupo de 28 niños entre 2 y 72 meses de edad, de bajas condiciones socioeconómicas, a inmunogobulina A tenía los siguienes va ores: X = 77 mg/100 ml y s 54,26 mg/100 m Se quiere saber si este vaor diere signicaivamene de vaor 108 mg/ 00 ml, considerado como normal para este grupo etario Proceda meodoógicamene 17 Se determina a hemoglobina corpuscular media, caculada en micro gramos para dos grpos de lacanes de diez meses de edad Los grupos eran comparables respecto a todos los ctores conocidos que podrían conducir a una deciencia de hierro En un grpo, los cordo nes umbiicaes feron ligados uego que la placenta comenzó a descen der a la vagina, y en el otro os cordones umbiicales feron ligados in mediaamene después del nacimieno. Los resutados en ambos grupos feron: Hemogobina corpuscular media en microgramos en lacantes de diez meses de edad Iiiuos 2 3 4 5 6 7 8 9 0 2 3 4 15
Lactantes cuyos cordones feon Lactantes cyos cordones feron igados despés qe la pacenta coigados despés de nacimento menzó a descender a la vaina
7, 25,6 3 , 7,3 8, 20,9 22,2 5,8 29,8 22,0 23,9 27,8 7,3 7,9 20,0
3,5 20,3 26,5 23,3 27, 2, 30,5 26,3 36,1 30,0 24,0 25,0 28,7
227
Se pregunta: ¿Hay direnca signifcativa entre la hemogobina cous cuar media de ambos grupos? Nivees 95% y 99% de confanza Proceda metodológicamente 1 8. - En un estudio realzado sobre los tiempos de supervencia en ratas sin alimentos, se encontró que algunas de eas moran en 4 das mentras que otras sobrevivían 26 días o más Tratando de descubrr qué condciones contrbuyen a esta variación se consderó el ecto de a temperatura ambente para o cua se dejó morr de hambre a 1 4 ratas a una temperatra constante de 30 ºc, mentras que a otras 7 se dejaron morr de hambre a una temperatura que uctuaba alre dedor de los 20 ºc. Los resutados eron: Das de suerivencia a 0 c 4 0 1 4 6 6
Días de sueivencia a 0 ºc 4 8 8
0 0
26 26 26
30
Se desea saber s a bajar a temperatra ambiente desciende signfcat vamente e tempo promedo de supevenca Nvees: 95% y 99% Proceda metodológicamente 9.- A un grpo de mueres embarazadas (prmer trmestre) se les ha dete mnado la albúmina crculane En la prmera determnación los valores resultaron patológicos y eron sometdos a un tratamento durante un
228
lapso de iepo Luego se les pacicó un nuevo exaen. Esas deeinaciones se dan a coninuación: Individuo Nmeo 1 2 3 4 5 6 7 8
Albúmina Toal Ciulane (gamos) Después del traaieno Anes del traamieno 119 189 133 193 121 198 186 129 136 195 138 199 143 194 187 123
Deermina si la diencia obsevada en e l gpo es signifcaiva o no. ¿Resuló eecivo el raaieno aplicado? Proceda eodológicaene. Niveles: 95% y 9% 20. En un experieno paa coprobar si la ingesión de alienos iene algún eco sobe la velocidad con que el hígado eliina sulbroaleina inyecada en la coriene sanguínea, obeniéndose los siguienes resulados n ayunas 16,2 16,7 16,3 18,5 15,9 16,1 16,5 15,9 17,5 16,4
Alimendos 9,5
11,3 9,5
13,5 8,8 9,3
10,4 11,7 10,8 9,8
229
Se desea saber si a dierenca entre os resutados(representada por su valores promedios) es signicativa Niveles: 95% y 99% Proceda metodológicamente 21 Se ha reaizado una investigación para determinar 1 Los ectos de la distensión abdomina por ascitis sobre la capacidad de ventilación pulmonar 2 - Los mecanismos por os cuaes la distensión abdomina produce dis nea 3. Establecer sin el alivio producido por a reducción en la distensión está acompañado por un cambio medibe en la nción pmonar; o pacientes eron estdiados antes del tratamiento y despus de una acentuada reducción de ascitis durante un rgimen de dieta pobre en sodio y ditpticos mercuriales por un período de diez día Se dan a continuación los datos para un grpo de 7 pacientes con en rmedad cardíaca reumática y artericaótica en reación con su máxi ma capacidad respiratoria Pacientes
Capacdad respratora Despés de tataiento Antes del tratamento
102
134
2
89
118 -�
3
32
50
4
82
82
5
36
61
6
56
64
7
79
92
¿Indican estos datos que e cambio en la máxima capacidad respiratori que acompaña a a disminucón de la ascitis como consecuencia del tra tamiento, es signifcativo? Nivees 95% y 9% Proceda metodológicamente
230
22. En una investigación realzada en una comunidad sobre niveles de cal cio en e suero de individuo adultos normaes, se tomaron dos uestras cuyos resutados eron los siguientes: s
N
Grpo A Gpo B
2 5
8,5 grs/00 c 10,3 mgs/ 00 c
1 ,23 gs/00 c ,5 mgrs/00 c
Se desea saber a 98% de confanza si a direncia obsevada entre los promedios de ambos grpos es signifcativa estadísticamente o es expli cabe por azar. Proceda metodoógicamente 23. En un preparado alimenticio inntil se especifca que según anáisis garantizado, el contenido mnimo de proteínas es de 42%. Para compro bar o mencionado se tomó una muestra de O preparados, los cuales e ron analizados encontrándose un romedio de protenas de 40%, y una desviación estándar de 3,5%. Con estos datos, ¿se puede sostener lo es pecifcado, para un al de 0,05, suponiendo normalidad en la distribución de la variabe contenido proteico? 24. A 0 pacientes que suen incapacidad sica, se es pidió que realiza ran determinada tarea, computándose e tiempo empeado para realizara E tiempo promedio consumido e de 7 minutos con una desviación estándar de 2 minutos. Suponiéndose normalidad, constrya los intervalos de confanza al 90, 95 y 99%, para tiempo promedio verdadero para que este tipo de pacientes ealice esta tarea. 25. En una muesta de 6 individuos normales se enconó un promedio de protenas totaes en la sangre = 6,2 grs, con una desviación estándar de 0,80 grs. ¿Cuá será el parámetro de esa variable en a pobación de donde se extrajo la muestra? Niveles de confanza: 95%.
23 1
Tabla Percentiles de a distribuió t
g.l 2 3 4 5 6 7 8 9 0 11 12 13 4 15 6 7 18 19 20 2 22 23 24 25 26 27
28 29 30 35
40 45 50
60 70 80 90 100 120 140 60 80 200 0
232
f90
f95
f975
3.078 1.886 1 638 533 476 440 45 397 1383 1372 1363 356 350 1.345 1341 1337 333 .330 328 325 1 323 1321 .39 1.38 36 35 34 1.313 .3 1.310 13062 303 1 3007 12987 1 2959 1 2938 1 2922 2910 12901 12887 1.2876 1.2869 1.2863 1 2858
63138 29200 2.3534 238 20150 19432 18946 1 8595 18331 1.825 1.7959 1.7823 7709 763 7530 17459 7396 17341 17291 1.7247 1 .7207 1.771 1.739 1709 17081 7056 .7033 1701 16991 1 693 1 6896 1 .6839 1.6794 .6759 .6707 .6669 .664 16620 16602 16577 16558 16545 16534 1 6525
12706 43027 31825 27764 2.5706 2.4469 23646 23060 22622 22281 2.200 2.1788 21604 21448 21315 2 . 1 99 2.098 2.1009 20930 20860 20796 2.0739 20687 20639 20595 2.0555 2.058 2.0484 2.0452 20423 20301 20211 2041 20086 2.0003 1 .9945 .990 .9867 19840 9799 19771 19749 19733 19719
1282
645
196
f99 3821 6965 4541 3.747 3.365 3.43 2.998 2896 2821 2764 2.78 2.68 2.650 2624 2602 2.583 2.567 2.552 2539 2528 2.58 2508 2.500 2.492 2485 2.479 2.473 2467 2.462 2457 2438 2423 2412 2403 2390 2.381 2374 2368 2364 2358 2353 2350 2347 2345 2326
[995 63657 99248 58409 4.6041 40321 3.7074 3.4995 3.3554 3.2498 31693 3058 30545 3023 2.9768 2.9467 29208 28982 28784 28609 2.8453 28314 2888 28073 2.7969 2.7874 27787 27707 27633 27564 27500 2.7239 2.7045 26896 26778 26603 26480 2.6388 2.6316 26260 26175 26114 26070 2.6035 2.6006 2576
BIBLIOGRAFÍA Bancro, H (1979). Introducción a la Bioestadística. Buenos Aires: Eude ba. Camel Fayad. (1979). Estadística Médica y de Salud Pública. Cuarta edición. Mérida, Venezuela aeres gráfcos Universitarios Cañedo D., L. (1987) Investigación clínica. México, D.F: Interaericana. Daniel, W. (1981) stadística con aplicaciones a las Ciencias Socialesy a la Educación. Bgotá: Editoria McGrawHi Haber, A. y Runyon R. (1973) Estadística general México DF Fondo Educativo Interaericano. Heández Sampieri, R, Feández, C. y Baptista, P. (1991) Metodología de la Investigacin. Bogotá: McGrawHi Poit, D. y Hunger, B. (1987) Investigación Cientca en Ciencias de la Salu Tercera edición. México, D.F: Interamericana Scheer, W (1981) Bioestadística. México, D.F Fondo Educativo Intra mericano.
233
CAPÍTULO VI Ténica de Análsis Bivariado Medidas de asociación Coefciente de correlación de Pearson. Coefcinte de de terminación Coefciente de correlación de Spearman Chi cuadrado Su uso en Prueba de independencia, de bondad de ajuste, de homogeneida Pruebas no paramétricas Ejercicio Tbla de chi cuadrado. Bibliograa.
235
MEDIDAS DE ASOCIACIÓN Cuando se plantean estudos correlacionaes es ndspensabe contar con pruebas estadístcas apropadas para conocer s exste reacón o ndependencia entre dos varables que podran estar asociadas. Taes pruebas están dentro de rengón de as pruebas paramétrcas (E Coefcente de correlación de Pearson) o de as NO paramétrcas (Coefcente de correlacón de Spearman, Coefcente de correación de Kendal, Chi cuadrado, etc.).
COEFCENTE DE CORRELACIÓN DE PEARSON. Cuando se busca analizar a relación entre dos varabes meddas en escaas de nterao o de razón es adecuado el uso del coefciente de Pearson para conocer ta reacón, sn que ello _mplica causadad. Características de este coefcente de correlacón: 1 Se utiza cuando se dspone de dos seres de datos numéricos tomados de los mismos suetos u obetos de estudo, o en pares de indviduos que tengan agna rma de reación. 2. Los coefcientes de correación tom valores con un rango coprendido entre 1 y + 1 ; indcando estos extremos una correlación perecta entre las dos varabes. El valor cero ndca la ausenca de reación, a ausencia de relacón inea entre las variabes. 3 Un vaor alto y de sgno positvo del coefcente sgnfca que quenes obtienen valores atos en a varable X tambén ogran vaores atos en a variabe Y; o quienes obtienen valores baos en una variable, logran tam bién valores bajos en la otra varabe. A este resutado se la conoe como correación directa A mayor X mayor Y; o a menor X menor Y. 4. Un vaor alto y de signo negativo de coefciente signifca que aquelos ndivduos que ograron valores altos en una varabe, obtuveron valo res bajos en la otra variabe. Es una correlación nversa A mayor X menor Y o a menor X mayor Y. A manera de orientación para a interpretación de coefcente y sólo como una reerencia se puede utlizar a si giente tabla:
237
- ,00
coelación negaiva pefecta coelación negaiva muy ete
+ ,00 + 090
coelación positiva pefecta
coelación positiva muy ee 090 075 coeación positiva consideale 075 coelación negaiva consideable + 050 coelación positiva media 050 coelación negaiva media + 0 10 coelación positiva déil 0 , 1 0 coelación negaiva déil 0,00 no existe corelación ente las vaiales o de existi ésa no es lineal. (Heández Sampie 1 991 , p 384)
os programas de análisis estadísticos, mediante computadoras, repor tan si el coefciente es o no signifcativo, de la manera siguiente: 0.8462 valor del coeciente.
s = 0001 signifcanca
Si s es menor de 0.05 se entiende que el coeciente es signicativo a u nivel de 95% de conanza (95 % de probabilidades de que la correlació sea verdadera y 5 % de probabilidades error). La interpretación de los resultados, no puede ser absoluta y total. Es má prdente la interpretación del valor del coefciente obtenido, en nción de conocimiento teórico sobre el tema en estdio y la trascendencia de las va riables que se relacionan Cálculo del coefciente de Pearson r:
La literatra especializada en esta área oece direntes rmulas para obtener este estadstico. En este capítulo se utilizará el método de desvia ciones medias para su cálculo, por considerar que es una de las rmula más cil de emplear
¿(X - X)(Y -) �¿mX · ¿DmY )
r = - 2
En donde: X media aritmética de la variable X. X cada uno de los valores de la variable X. Y media aritmética de la variable Y. Y cada uno de los valores de la variable Y. DmX Desvos medios de X = (X X).
238
Dm Desvos medios de Y = (X) Ejemplo 8 1 Los siguientes datos corresponden a las edades y presión sisólica de 1 O muJeres Edad en años (X)
Presión sist. (Y)
42
130 115 148 158 156 158 155 170 150 130
46
42 76 80 72 64 75 55
48 Hi: A myor edad, mayor presión
Se aplica la rmula del coeciente de Pearson para probar la hipótesis de trabajo 1 - Calcular las medias aritméticas de las variables X y 1470 = 600 _ _ Y = 174anos X 60anos 10 10 2- Calcular los desvos medios de la variable X y de la variable , teniendo especial cuidado en los signos de estas operaciones ( + o ) Desvo me dio es igual a la diferencia de cada valor menos la media (X - X) y )
3- Se multiplica cada desvo medio de X por el respectivo desvío medio de Teniendo especial cuidado con los signos negativos y positivos, pro ducto de estas operaciones 4. Se suman ALGEBRAICAMENTE los productos de estas multiplicacio nes de los desvos medios Esta sumatoria representa el numerador en la rmula, y el signo de éste determina el signo del resultado nal del coe ciente
239
5.- Luego se elevan al cuadad cada uno de los desvíos medios de X. 6.- Iguamente se eevan al cuadado cada uno de los desvíos medios de Y. 7 Se suman todos os desvíos medios cacuados. Tanto os de X como lo de Y. 8- Se mutipican ente sí los esultados de estas ds sumatoias Este vao epesenta el denominado en a ómula. 9.- Se extae a aíz cadada del poducto de esta multiplicación Este e sutado es el denominado en a mua. 10.- Se divide el esultado de a sumatoia algebaica de los desvíos medio de X po o de Y ( obtenidos en el paso 4) ente e esutado de la aíz cua da, obtenida en el paso 9. X
Dm = (X-)
y
Dm (Y_ - )
(Dm X . Dm Y)
(X)2 (Y - }
42
-18
130
17
306
324
289
46
14
1 15
-32
448
196
024
42
-8
148
-18
324
76
6
158
1
76
256
12
80
20
56
9
80
400
8
72
12
58
1
32
44
21
64
4
55
8
32
6
64
15
70
23
345
225
529
55
-5
50
3
-5
25
9
48
2
30
-17
204
1 44
289 -
1 790
2.054
_?µ
.470
600
r=
¿ (Dm X DmY) �¿ Dmx ¿ DmY ) 2
2
2528
.790 .790 212 �2.054 228 �5.9 =
X
1.790 0 7855 r = 278,71 Según este esutado se acepta la hipótesis de tabajo consideando que existe una coeación positiva consideabe ente a edad y pesión sistóli ca. Coefciente de deerminación.- Al eeva al cuadado el vao del coef ciente de Peason se puede conoce e pocentaje de a variación de una va
240
riable debido a la variación de la ota. A este estadístico se le cooce como Coefciete de deteminación: En el ejemplo aterior, el coefciente de correlació es 0.7855, por lo cual, el coefciente de determinación es (0,7855)2 0,617. Siica esto que la variación de la edad cotribuye a explicar casi el 62 % de a variació de presión. Coefciente de corelación por rango de SPEARAN
Cuado se extrae una muestra al azar de n pates de una población biva riada, donde por lo meos una de las mediciones está hecha en escala ordi al, el grado de correlación o puede calcularse mediante la preba vista ateriormente. Si una de las variables se mide en escala ordinal y la otra en otra escala umérica, ésta última debe convertirse en rango. Para ello se le asina el orden 1 a la observación de menor valor, y los demás se va asi nando a partir de éste. Si se repiten algunos de los valores, se proedian los luares que ocuparían tales valores Ua vez que ambas variables están expresadas en rano, se obtienen las dierencias entre los pares de ano para cada sujeto. Lueo cada uo de las direncias se elevan al cuadrado y se aplica la sigiente rmula:
rho
=
6 · " D
2
L �_ 1 - -= n(n2
Dode 6 es constante. D
= Dierencia ente los pares de rango para cada sujeto
n = úmero de observacioes o de sujetos observados.
Ejemplo 82: En u estudio dode se busca conocer la relación entre irritaiidad de las persoas y número de ciarrillos consumidos diariamente. La variable irritabilidad e meida mediate u test validado para medir esta variable, e u rao creciente de 1 a 1 O idicando éste último el mayor grado de irritabilidad. Los resultados son los sigientes
241
N de cigarrillos diarios
Nivel de irrtabilidad
4
2
6
2
20
8
8
5
-�
15
3
40
8
20
6
40
10
º
1
Hi: A mayo númeo de cigarllos mados po día, mayo nivel de iitabiidad. El nive de iitabilidad es una vaiabe medida en escala odina o de ango mientas que a vaiabe númeo de cigaillos mados po día está medida en una escala de azón, o lo tanto, ésta útima debe tansfmase en una escala de ango. Po ello se pocede a asignae un oden jeáquico a los valoes de esta última escala.
N de cigarios diaios º
Nivel de Dencia ene Difrencias Tansfrmacó dos escalas (D) a cuadado a Ecala de ango irtabiidad �-
4
1
2
1
6
2
2
o
5,5
8
2,5
20
18
.
1 o
6,25 -
4
-1
1
-
3
o
o
5
15
3
40
7,5
8
0 5
20
5,5
6
0,5
40
7,5
10
2,5
· -
�-_ 0,25
6,25 15,00
r ho = l -
242
6 " D 2
= 6 x l 5 1 - 90 1 - 0 7 8 5 = 0 8 5 504 ' 8 (64 - 1) n ( n 2 - 1) ºL
!
Se puede concluir que existe una correlación positiva considerable entre el número de cigarrillos y los niveles de irritabilidad. Se acepta la hipótesis de trabajo: a mayor número de cigarrillos mados por día, mayor irritabili dad DISTRIBUCIÓN CHI CUADRADO
En el campo de la salud existen variables que se clasican en categorías, como es el estado nuricional, sexo, síntomas, antecedentes miliares, gr pos sanguíneos, etc donde tal clasifcación, en la mayoría de los casos, es más cualitativa que cuantitativa En tal sentido, las comparacones y las inrencias estadísticas se ectúan sobre la base de las proporciones de las categorías antes mencionadas, en cuyo caso, la preba estadística más apro piada para tal n es a denomiada distribución chi cuadrado, la cual se ca racteriza porque su valor depede de los grados de libertad y el nivel de sig nicación. Esta distribución s basa en las llamadas probabilidades condi cionales, y constituye en sí misma una milia de distribuciones, pues toma valores direntes, según los grados de libertad, por lo tanto, es una variable aleatoria Un investigador en el área de la salud puede estar interesado en conocer si existe relación entre el consumo de SD y la aparición de células anor males en los individos de una población, y rmula la hipótesis que existe tal relación. Si ambas variables se miden en escalas nominales, entonces la prueba de Chi cuadradro permite determinar, con cierta probabilidad, la existencia o no de dcha asociación. Antes de entrar en la aplicación de Chi cuadrado, es necesario denir algunos términos de uso muy ecuente en este campo Grados de libertd (g) se reere a los cambios que deben hacerse, de manera arbitraria, en los valores de un conjunto de datos, sin que varíe algu no o algunos de los estadísticos calculados para esos datos Ejemplo: Suponiendo que se tienen los siguientes datos a 1 , b 6, c = 4, d = 5 La media aritmética de esta serie es igual a 4, es decir: (1 + + 4 5) / 4. Tres de estos valores pueden cambiar arbitrariamente, sin que se modique la media ya calculaa; por ejemplo: a 7, b = 2, c = 2, entonces, necesaria mente el valor d debe ser 5, para que la media siga siendo 4, es decir, pueden variar tres valores ero el otro está predeterminado, indicando esto que se =
=
243
tienen tres grados de libertad Al haber calculado 1 estadístico en un con junto de datos se tienen n 1 grados de libertad Niveles de signfcación.- De este térino ya se ha hablado en los capít los anteriores Las conclusiones que se establecen en nción a un análisi estadístico, se frmulan en térinos de probabilidades. Esto iplica la pro babilidad de equivocarse, de coeter errores Así coo se ide la probabi lidad de acertar tabién se ide la de equivocarse. En las prebas de hip tesis existen dos probabilidades de equivocación: una es rechaar la hipóte sis nula, cuando es realente cierta; y la otra es aceptar la hipótesis nula cuando es lsa El prier error se denoina error tipo I", y la probabii dad de coeterlo se conoce coo nivel de signifcación, y se designa con la letra griega al () Cuando se dice que 0,05, se coe el riesgo de co eter un error tipo I en cinco de cada cien oportnidades. El otro error, e Tipo II se refere a la probabilidad de aceptar una hipótesis nula siendo l sa, y se designa coo beta (). El nivel de signifcación sire coo reren cia para rechazar o aceptar una hipótesis. =
Condiciones para el uso de Chi cuadrado
Aún cuando es una preba de fcil cálculo, es conveniente utilizarla con cautela, porque presenta algunas liitaciones que deben toarse en cuenta en el oento de su uso - El taaño de la uestra debe ser ayor de 20 casos. Si es infrior, se debe eplear la Preba de Fisher. 2.- Si !auestra tiene entre 20 y 40 casos distribuidoss en tablas de 2 x 2, puede usarse el chi cuadrado si todas las ecuencias esperadas son a yores que 5. Si esta condición no se cuple, se recoienda utilizar en su lugar la Preba de Fischer 3.- Ninguna de las fecuencias esperadas puede ser enor de , y no ás del 20 % de ellas, debe ser infrior de 5, en tablas con ás de grado de li bertad. 4 - No debe utilizarse esta preba cuando alguna de las casillas está vacía. Aplicación del Chi cuadrado (2 )
Al igual que las prebas estadísticas vistas en el capítulo anterior, el X2 se utiliza coo preba de hipótesis, aun cuando ésta debe se rulada de
244
manea diente según la inmación que se desea obtene. n este sentido, el chi cuadado puede se utilizado como peba de independencia como preba de homogeneidad o de popociones o como peba de bon dad de ajuste. En cada caso, la hipótesis de tabajo debe evidenci el uso dado a la pueba PASOS METODLÓGICS PARA LA APLICACIÓN DE X2
1. Planteamiento de las hipótesis Ha y Hi. 2 Detemina el nivel de signifcación () 3 stablece la egla de decisión, en nción de los gados de libetad (g.l. ). 4. Calcula el valo del chi cuadado. 5. Decisión de echaza o no Ha, en nción del valo obtenido y lo establecido en la egla del paso númeo 3 . 6 Conclusión, en nción del paso anteio y lo establecido en las hipótesis planteadas en el paso 1 lementos geneales a considea en cada uno de los pasos anteioes l planteamiento de las hipótesis depende especícamente del uso que se le dé a la pueba. Cuando se emplea como peba de independencia en témins genea les, la esencia de las hipótesis seán Hi:
Las vaiables están asociadas
Ha:
Las vaiables son independientes.
Cuando se utiliza como peba de homogeneidad: Hi Las poblaciones no
son homogéneas, en cuanto a la vaiable en est-
dio Ha Las poblaciones son homogéneas en cuanto a la vaiable en estdio
Cuando se aplica como peba de bondad de ajuste: La muesta tilizada no poviene de una distibución teórica deteminada Hi
245
Ho: La mesta tilizada proviene de na distribción teórica determinada (normal, binomial o de Poisson). Como regla de decisión se puede tilizar la expresión de Rechaar Ho si X2 calclado es mayor al X2 tablado según nivel de sig nifcación y grados de libetad Los grados de liberad (gl) se obtienen de manera dierente, según cada sitación. En prebas de bondad de ajste a na distribción teórica, para calclar los grados de libertad se tiliza la expresión / k - 1 donde
k
es el número de categorías de la variable o de clase en qe ésta se encentra dividida
En cadros de asociación empleados para la presentación de los datos para prebas de independencia o prebas de homogeniedad se tiliza la ti liza la expresión:
g.l. = 1 1, donde
es el número de colmnas de ecencias observadas del cadro, y es el número de flas del cadro
Para calclar el chi cadrado como estadístico a preba se emplea la si giente rmla: x2
= (o ) f
2
donde: son las ecencias absoltas obseadas en el cadro, son las ecencias teóricas o esperadas las cales deben calclarse Dado qe chi cadrado se calcla para variables discretas pede aplicársele el ctor de corrección de Y ates, cando se tienen cadros de contin gencia de 2 x 2, En tal caso la rmla se modifca a x2
( o ) 0 )
2
o es el valo absolto de la direncia.
246
in embargo, algunos autores consideran que en muestras grandes el uso de esta corrección no tiene eecto. Y otros aún más drásticos estn en con tra de su uso. Wayne Daniel ( 1 977 p. 347) señala: En general s ha convenido en que no se neceita corección al guna para tablas de contingencia más grandes Aunque la orrec ción de Yate ha sido uada con amplitud en el paado, inetigadres reciente pr ejempl Grizzle Lancaste Peason y Plackett han cuestinado su uso El trbajo de Grizzle, en particla ha refoado el cas contra el u de la corrección basándoe n que con demaiadaecuencia, coduce a una prueba muy conservadora e decir el uo de l corecin, con demaiadafrecuencia conuce al no rechaz de l h ótei nula. Como reultad al gno mdico, por ejemplo Remington y Schrk están en contra de u uso Apaetmente ésta es una recomendación que es raznable aceptar" uego de calcular el valor de chi cuadrado se confonta éste con la regla de decisión para determinar si se acepta o se rechaza la H Chi cuadrado como Prueba de independencia.-
Uno de los usos más fecuentes de este estadístico es como preba de in dependencia e aplica cuando se tiene una sola muestra y se desea probar si dos criterios de clasifcación son independientes. a hipótesis nula plantea que existe independencia entre los dos criterios es decir, las varables son independientes en la población de estdio. Ejemplo 8.3. Cuadro 8.1
P rr r r M H.. V J A 1 Caua PARTO VAGINAL ABORTO CESÁRA TOTAL
Paintes ue reciberon antibiotera SI NO 23 655 144 3 57 82 119 881 1
TOTAL 678 183 139 1000
247
1 Hipótesis Hi las variables están asociadas. Ho: las variables son independientes
2 Nivel de signicación: = 0,05 3 Regla de decisión: Rechazar Ho si X2 calculado es mayor a 5,991 2 o ) ( e 4 Cálculo de la estadística a prueba X fe
2
Para aplicar la rmula anterior, es necesario calcular las ecuencias es peradas de cada casilla; las cuales se obtienen multiplicando los subtotales de las las por los subtotales de las columnas respectivas, y luego dividiendo este producto entre el gran total. Por ejemplo, para conocer la ecuencia esperada de la primera casilla, frmada por la intersección de la primera co lumna por la primera la, se mltiplica el subtotal de la primera columna por el subtotal de la primera a el producto se divide entre el gran total. En el cuadro Nº 8 1, para buscar las ecuencias esperadas de la primera coluna, se tiene: Subtotal de l ra. columna por subtotal l ra. a entre gran total 119 x 678 = 80.682 : 1.000 80,682, luego subtotal de l ra coluna por subtotal 2da a entre gran total 119 x 183 = 21777 : 1.000 21,777, y así sucesivamente 119 X 139 = 16.541 : 1.000 16,541. Para la segunda columna será: 881 X 678 597. 3 18 : 1.000 881 X 183 = 161223 : 1.000 881 X 139 122459 1000
248
e = 597318 161,223 122,459
asa PARTO VAGINA ABORTO ESÁREA TOTA
Pacientes e ecberon antbioteaa SI TOTA NO i (e) (f) 678 655 23 (8068 (59732) 144 39 2178 16122 183 82 122,46) 139 57 1654 119 1 19 00 881 (88 1 00 1000
Aplicando la mla ( f f) X = f =
2 (23 80 8) (39 21,78) (57 1 6,4) (655 59732) = 164 80,68 21,78 597,32
2
2
(14416122) (8212246) + 1612 122,46 x = 4 137 1 3,61 4 9872 55 69 1,839 13367 = 17498 2
2
2
Decisión: Dado qe el X calclado es mayo al X tablado, se echaza H Conclsión Las aiables no son independientes ay asociación ente el tipo de inteención y el so de la antibioteapia. Ejemplo 8.4 En el mes de agosto del pesente año, n gupo de 30 niños paticipantes en n campamento vacacional, seron na intoxicación alimentaia lego de habe ingeido el almezo pepaado paa esa ocasión. Al ectua n estudio epidemiológico de la stación se obtuo la sigiente inación onsmeon en salada con atún SI NO Total
INTOIADOS NO SI 11 5 8 6 13 17
Tota 16 14
30
249
Se sospecha que a ensaada con aún fe e aimento que podujo la intoxicación 1 Hipótesis: Hi Las variables están asociadas Ho: Las vaiables son independienes.
2 Nive de signicación: = 0,05 3. Regla de decisión: Rechaza Ho si X cacuada es mayo a X2 abular (0,05. 1 g..) 3,8 1 1 4. alcua X Se puede utiiza a mula con cto de coección de Y ates X
2
2 o e ) (1 l / =
fe
alcuando as ecuencias espeadas (e): Paa la primea casia: 1 7 x 1 6 = 272: 30 9 La teoía de chi cuadado esablece que a suma de as ecuencias espe adas es igua a la suma de as ecuencias obsevadas Patiendo de esta pemisa, e subtoal de la pimea columna ( de ecuen cia espeada) debe se 1 7. Si se esta a este subtotal (17) la ecuencia espe ada ya conocida (9) se pueden obene as otas ecuencias espeadas. 17 9 8 16 9 7 148 6 Conseon ensalada on atún
INTOXICADOS �-
SI NO Total ( 1 1 9 0,5) 2 X = 9 2
250
SI
Total
NO
( )
( )
6
(9)
(8)
17
(17)
( 5 7 0,5) 2 + 7
() 5 8 13
(68 0,5) 2 + 8
() (7) (6) (13)
16 14
30
( 8 �0,5) 2 - 6
x
2
= 025 + 20 + 0,375 = 125
Decisión. Dado que e valor del X2 calculado (1 227) es menor al X2 ta buado (3,8 1 1 ) no se rechaza Ho. Conclusión. No hay asociación enre el consumo de ensalada y la intoxicación aimentaria. Son independientes. Prueba de bondad de ajuste.-
E uso de chi cuadrado como prueba de bondad de ajuste es una prueba de concordancia entre una disribución empírica y una distribución hipoté tica. Resulta apropiada cuando se desea conocer si una distribución de ecuencias observadas se ajusta a un modeo teórico, taes como ditribución binomia norma o de Poisson. Ejemplo 85: Prueba de bondad de ajuste a la binomial. Este tipo de pruea es de uso ecuente en e área de la genética, de donde tomamos e siguiente ejempo. En un laboratorio de cruce de ratones heterocigotos negros (B) y pardos (b) han nacido 26 ratones pardos y 1 4 ratones negros. De acuerdo con as e yes de la genética este cruce producirá descendientes de a siguiente mane ra
.•1· nero
Por o tanto, de cada 4 ratones que nazcan es de esperarse una razón de fnotipo de 3 ratones pardos y 1 negro (3: 1 ) lo cual indica que de los 40 ra tones nacidos en el aboratorio, teóricamente deberían nacer 30 ratones pardos (3/4 x 40) y 1 O ratones negros ( 1/4 x 40) lo cua representa una difren cia con respecto a o ocurrido e laboratorio, por lo tanto ¿podra pensarse que esa dierencia es signicativa? 95 % de conanza.
251
aoes
. obsevadas
. espeadas
ardos
26
30
Negos
4
10
Toal
40
40
Hpóess:
H: La dsrbucón observada no se ajusa a la dsrbucón bnomal. Ho La dsrbucón obsevada se ajusa a a dsribucón bnomal. Nve de sgncacón: a = 0,05 Regla de decsón: Rechazar Ho siX2 calcuada es mayor a 3, 811 (X2 a buado, 0,05. g1)
x z = ( fo - fe) fe
(2630) 2 (14 10)2 0,33 + 1 233 + 30 10
Decsón: E1 X2 caculado (213 3) es menor a1 X2 abulado (3 , 8 1), por lo ano, no se rechaza Ho. Conclusón No es sgncava la drenca enre las ecuencas obser vadas y las esperadas La dsbucón se ajusa a a dsrbucón bnoma.
Prueba de homogeneidad. As como en as prebas de ndependenca se busca conocer s son nde pendenes os dos creos de casfcacón de los sujeos de a muesra, en as prebas de homogenedad se desea probar s as muesras exraídas pro venen de pobacones que son homogéneas con respeco a agún crero de cascacón. En ese caso, a hpóess nua panea que as muesras pro venen de a msma pobacón; por o ano, las muesas son homogéneas, en cuano a a varabe en esudo. El procedmeno, para esa preba es smar a os pasos paneados en las prebas de ndepndenca.
PRUEBAS NO PARAMÉTRICAS. En as prebas paramércas, es necesaro suponer que en la pobacón, a varable en estdo ne una dsrbucón noma Por ser normal, puede es
252
timrse el error que se comete l relizr deducciones o inrencis sobre l poblción, en nción de los dtos muestrles. Cundo l poblción no si e un distribución norml, el error puede ser grnde y no es posible esti mrlo Est sitción plnte l necesidd de contr con prebs estdísti cas, en ls cules no se necesrio prtir de un suposición erte cerc de l distribución de l poblción. A ests prebs se les denomin Pruebas no paramétricas. Ls prebs no prmétrics cumplen con los siguientes requisitos: 1 . - No es necesrio suponer que en l poblción, l vrible en estdio tiene un distribución norml, ni ningun otr suposición erte cerc de l distribución de l poblción. Por este motivo, este tipo de preb tm bién se les denomin prebs libres de distribución". 2. - Se utilizn con dtos correspondientes escls nominles (ctegórics) y ordinles u ordends por rngo Entre ls prebs no prmétrics más conocids están: Chi cuadrado. Coefciente de correlación de rango de Spe arman. Prueba McNemar. Se utiliz pr conocer si existe independenci entre dos vribles ctegórics provenientes de dos muestrs depen dientes o conocer si hy cmbios signifctivos entre nte" y des pués" de un trtmiento Requisitos pr su uso: Vribles nominles y dicotómics Prueba de signos. Se utiliz pr medir l dirección de los cmbios, sin importr ls mgnitudes en los experimentos de ntes y des pués". Est prueb no está sujet ls restricciones de l preb t de Student. En ell se clcul l medin y no l medi Requisito: Escl de rngo dicotomizd Wilcoxon. Puede utilizrse pr medir dirección y mgnitd de los cmbios en un vrible estudid en muestrs dependientes bien sen grndes o pequeñs. Requisitos: Vrible medid en escl ordi nl. Prueba de Man Whiney. Se utiliz cundo se quiere comprr si dos muestrs ndependientes provienen de un mism poblción. Re quisitos: Vribles en escl ordinl.
253
Prueba de Kolmogorov-Smirnov Se utiliza como preba de bondad de auste Requisitos: Escala ordinal. Prueba de KruskalWalis Se utiliza para análisis de varianza, con un solo criterio de clasifcación por rangos. Sustitye al análisis de va rianza al comparar dos o ás grpos independientes resumidos a par tir de la mediana. Coefciente de correlacin de Kendall. Para escalas ordinales. EJERCICIOS PARA RESOLVER:
1.- A continuación se presenta la inrmación de l O primigestas, sobre las variables EDAD de las pacientes y SEMANA DE GESTACIÓN cuando acudió a la primera consulta prenatal. La inrmación e tomada de una investigación sobre La importancia de la consulta prenatal." dad en años
emana de gestación
28
6
20
14
17
18
24
10
25
0
22
15
29
9
20
3
23
12
20
15
-
La hipótesis de la investigación plantea que las mueres primigestas de mayor edad acuden a su primera consulta prenatal en las primeras sema nas de embarazo, con respecto a las primigestas de menor edad. ¿Puede aceptarse esta hipótesis? 2.- En una investigación interesada en medir la velocidad de reacción (me diante una preba válida para ello) en sujetos que en tres horas habían consumido x cantidad de tragos de un determinado licor se plantea la hi pótesis de que a mayor cantidad de tragos, menor velocidad de reacción.
254
Los datos obtenidos en la investigación se muestran a continuación
N de tagos º
velocidad de reacción
7 8 9 11 14
2 3 7 16 8 11 12
15
10
16 1
12
10
13
¿Permiten estos datos aceptar la hipótesis de la investigación? 3 Se planifcó un estdio para investigar si existe relación entre peso y presión sanguínea diastólica de hombres adultos cuyas edades oscilan entre 1 9 y 50 años.
PESO
PRESIÓN SANGUÍNEA
EDAD
78
76 8 76
56
74
6 55
8 9
28 4 3 2 42 46
59
74
43
6 83 7
7 9
19 37
63 56
76
Prebe esa relación entre las ariables: peso y presión; y entre edad y presión. 4 Los ectos del tabaco sobre el desarrollo del to e el propósito de un estdio realizado en una muestra de 262 mujeres en el C.H.E T , en el
255
cua se tvo como hpótess de trabajo que es más ecuente e nacmien to de nños prematuros de mujeres madoras que en as no madoras La investgación arrojó os sguentes resutados Nacimiento de niños
Mujeres fumadoras
Mujeres No fumadoras
Tota
61 69 13
139 123 262
rematuros No prema!ros _ TTA
54
132
Según estos datos, ¿se puede aceptar a hipótesis de trabajo, a un nvel de 95 % de conanza? 5 De una investigación sobre stepoross y acturas espontáneas, se to maron os siguientes dats: Pacientes
No Sedentarios
Sedentarios
Tota
10 6 26
19 16 35
29 32 61
Con factras Sn acturas TTA
Según estos datos es posbe asociar e sedentarismo con a aparcón de acturas espontáneas en pacientes con osteosporosis? Nivel de conan za: 95 %. 6 En un estudo acerca de lo nfrmado que están los hpertensos sobre os resgos de saud a os cuales están sometdos a sur esta enermedad, se logró la siguiente inrmación de un grupo de 228 pacentes con esta ca racterstica con conocimientos
Pacientes
·
controlado no controlados TTA
Total
sin conocimientos
5 68 143
56 29 85
31 97
228
¿Podría pensarse que exste asciacón entre el hecho de poseer conoc mentos sobre os resgos de la hipertensión y el control que tenen o pacientes sbre su situacón? 7- Obsere a sguente nracón:
256
Cuadro N 6 º
Eluió uriol de piees meores de ños disribudos segú esdo uriio y seo. Ambuoro Rur L Agudi Edo. Cojedes Mrzo 1997. Estado Nutricional
Femenino
Mascuino
f
-
Sobre l norma Normal Desnutrición leve Desnutrición moera Desnutrición g� r ae___ Toal
Tota
2 18 8 5 3 36
3 13 4 3
5 31 2 8 4
24
60
Fuene: Achvo de Hstoas Médicas. Ambulatoo Rural I, La Aguadia, Edo Caraoo
Sen eta nacón, ¿oría afare que exte aocacó entre el etao nutrconal el exo?
257
N V
Esquema de Coefciente de Correlación seg ún tipo de Variable
Variables o Escalas
Coefcientes
Dos Cuantitativas (Intervalo o de Razón)
Coefciente de Correlación de Pearson
Cuantitativas y Ordinal o Dos Ordinales
Coefciente de Correlación de Speaan
Dos Nominales o Nominal y Cuantitativa
Coefciente de Contingencia
Cuantitativa y Cuantitativa con dicotomía arifcial
Coefciente de Correlación "Biserial
Cuantitativa y Cualitativa con dicotomía auténtica
Coefciente de Correlación Punto Biserial
Dos Nominales de dicotomía auténtica
Coefciente f
Dos de Dicotomía Artifcial (Con n mayor de 100)
Correlación Tetracónica
Tabla 4
Valores d X2 a lo nivees d Confanza de 0.05 y .1 Grados d e ibertad (gl)
.05
.01
3.8
6635
2
5.99
920
3
7 8 5
.345
4
9 88
3.277
5
.00
5086
6
2592
6.82
7
4067
8475
8
5.507
20.090
9
6.99
2 66
0
8.307
23.209
9.675
24725
2
2026
26.27
3
22.362
27688
14
23685
294
5
24.996
30.578
6
26.296
32000
7
27587
33409
8
28869
34.805
9
3044
369
20
340
37.566
2
3267
38.932
22
33924
40.289
23
35172
4638
24
3645
42.980
25
37652
44.3 4
26
38885
38932
27
40 3
46.963
28
4337
48278
29
42557
49.588
30
43773
50892
35
49802
57342
40
55758
6369
45
6.656
69957
50
67505
7654
60
79.082
88.379
70
90.53
00.25
80
0 879
2.329
90
3.5
24 . 6
00
24342
3 5.807
259
BIBLIOGRAFÍA Camel, F. (1979) Estadística Médica y de Salud Pública. Cuarta edición Mérida, Venezuela Taleres Gráfcos Universitarios. Cañedo L. (1987) Investigación clínica. México, D.F. Nueva Editorial Interamericana. Escotet, M A (1 973) Estadística Psicoeducativa. México, D F.: Editorial Trillas. Heández Sampieri, R., Feádez, C. y Baptista P (1 .99 1 ) Metodología de la Investigación. Bogotá McGraw-Hill.
260
ÍNDICE
PRÓLOGO . . . CAPÍTULO I Uso de la Estadística en el campo de a Salud DEFNICIONES BÁSICAS . . . . . . . . . . USO DE LA ESTADÍSTICA EN EL CAMPO DE LA SALUD APLICACIÓN DE L A ESTADÍSTICA EN L A ADMISTRACIÓN SANIT . . APLCACIÓN DE LA ESTADÍSTICA EN LA INVES TIGACÓ . . II ETAPA DE PLANFCACIÓN . . . PLANTEAMENTO DEL PROBLEMA MARCO TEÓRICO . MARCO METODOLÓGCO . MARCO ADMINSTRATVO BIBLIOGRAFÍA
5 7 9 4 18 20 20 22 25 29 34 40
CAPÍTULO I Muestreo 43 45 UNIVERSO Y POBLACIÓN 45 Unversos ftos e infntos 45 Poblacones cautvas 46 MUESTAS . . 4 Desventajas de las muestras TIPOS DE MUESTRA: Probablístcas y no Probablístcas. 48 TIPOS DE UESTRAS PROBABLÍSTICAS 49 TÉCNICAS DE AZAR: . . . . . 52 MUESTRS NO PROBABILÍSTCAS . . . 53 CACTEÍSTCAS DE NA BUENA MUESTRA 54
261
CAPTULO 111 Recolección de infrmación I. EL PROCESO DE RECOLECCIÓN DE LOS DATOS . . FUENTES DE INFOMACIÓN . . . . . . . . . . III INSTRUMENTOS DE COLECCON DE DATOS V. TÉCNICAS DE RECOLECCIÓN DE DATOS BIBLIOGRAFÍA
65 66
68 74 78
CAPTULO IV Procesamiento y Presentación de los datos . . . . . . . . . . . . . ETAPA DE ELABOACIÓN O PROCESAMIENTO DE DATOS CUADROS ESTADÍSTICOS . . Partes de u Cuadro Estadístico Tipos de Cuadros Estadísticos . GRÁFICOS ESTADÍSTICOS . . . Gráfcos de Barras Simples . Gráfco Circular o Diagrama Sectorial . Histograma y Polígoo de Frecuecias. Curva Itegra o Diagrama de Frecuecias Acumuladas Polígono de Frecuecia para Cuadros de Asociación co Va riable Numérica como Variable Principal Barras Proporcioadas . . . . . Gráfco de Líneas de Tedecia Recomedacioes Fiales . EJERCCIOS . BIBLIOGAFÍA
107 109 112 116 116 120
CAPÍTULO V Técnicas de Análisis Univarido EL PROCESO DE ANÁLISIS ESTADÍSTICO
2 123
262
79
81 90 90 92 97 99 1 1 103 105
- Medidas de Tendencia Central . . . . . - Medidas de Dispersión o Variabilidad . - Medidas de Posición . . . . . . . . EL NDICE ENDÉMICO. . . . . . . . TÉCNICAS E ANÁLISIS DESCRIPTIVO PARA VARABLES CUALTATIVAS . . . . . . . . . . . . . . . . . . - Tasas Generales Brutas: Tasa Genera de Mortalidad, Tasa Genera de Fecundidad, Tasa de Natalidad . EJERCICIOS . BIBLOGRAFA
123 12 138 143 145 146 152 154
CAPÍTULO VI Probabilidades y Cuva Nomal . . . . . . . . . . . . . . . . . . . 155 157 TEORÍA DE LA PROBABLIDAD . . . . . . 158 - PROPIEDDES DE LAS PROBABILIDADES 159 - PRNCIPIO DE LAS PROBABLIDADES DISTRIBUCIONES DE PROBABILIDADES 1 64 164 Distribución binomia 167 - Distribución norma 1 80 EJERCCOS . . . . . . 182 BBLOGRAFÍA . . . . . 1 83 TABLA DEÁREAS DELA CURVANORMAL CAPÍTULO VII Estadística Inferencial ESTAÍSTICA INFERENCAL . . . . . . . DISTRIBUCIÓN MUESTRAL . . . . . . . . DSTRBUCIÓN DE LA MEDIA DE LA MUEST. - Error Estándar . . . . . . ESTMACN. . . . . . . . . - Estimación de a Media de Universo
185 187 1 88 188
191 192 194
263
- Estimación de a Proporción Pobaciona . . . . . PRUEBA DE HIPÓTESIS O CONTRASTE DE HIPÓTESIS . - Procedimiento Metodoógico para a Preba de Hipóesis - Prueba de Hipótesis o de una Media Pobacional . . . Prueba de Hipótesis de una Proporción de a Pobación - Preba de Hipótesis de la Difrencia entre dos Medias - Preba de Hipótesis de la Difrencia enre dos Proporciones PRUEBA t PARA MUESTRAS PEQUEÑAS Y PARA MUES TRAS RELACIONADAS . . . . . EJERCICIOS . . . . . TABLA DE PERCENTILES DE LA DISTRIBUCIÓN t BIBLIOGRAFA . . . . CAPÍTULO VIII Técnica de Análisis Bivariado
MEDIDAS DE ASCIACIÓN . . . COEFICIENTE DE CORRELACIÓN DE PEARSON . . - Cácuo de coefciente de Pearson (r) . . . . . COEFICIENTE DE CORRELACIÓN POR RANGO DE SPEAR MAN . . . . . . . . . . . . . DISTRIBUCIÓN CHI CUADRADO. PRUEBAS NO PARAMÉTRICAS EJERCICIOS . TABLA VALORES DEX BIBLIOGRAFÍA 2
.
ÍNDICE . . . . .
264
95 97 99 206 209 211 213 217 223 232 233 235
237 23 7 238 241 243 252 254 259 260 261
Boesdísic Herrment de la Invesgción de Eddy Puerts López Jesús Ubin M. , M. E Blnck Dsy Gndio Mtz Blnchd osé Anono Gc, Pedo Vgs . y An Cquo se ermnó de mpmi en myo de 1998 en Compugáfc (tl 234765-245256-23553) en su pme edción de 500 ejempes uilándose ppel Bond 20 y fentes Times New Romn en su composcón.